JP2021519479A - 遺伝子検査とゲノム検査を識別するための人工知能と機械学習プラットフォーム - Google Patents

遺伝子検査とゲノム検査を識別するための人工知能と機械学習プラットフォーム Download PDF

Info

Publication number
JP2021519479A
JP2021519479A JP2021500783A JP2021500783A JP2021519479A JP 2021519479 A JP2021519479 A JP 2021519479A JP 2021500783 A JP2021500783 A JP 2021500783A JP 2021500783 A JP2021500783 A JP 2021500783A JP 2021519479 A JP2021519479 A JP 2021519479A
Authority
JP
Japan
Prior art keywords
input
genetic
rules
health
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021500783A
Other languages
English (en)
Inventor
ヴァンダナ サンジェイ サテ
ヴァンダナ サンジェイ サテ
サンジェイ シュリクリシュナ サテ
サンジェイ シュリクリシュナ サテ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ambry Genetics Corp
Original Assignee
Ambry Genetics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ambry Genetics Corp filed Critical Ambry Genetics Corp
Publication of JP2021519479A publication Critical patent/JP2021519479A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Bioethics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

遺伝子検査の識別性の改善は、健康関連変数の複数の異なる組み合わせを考慮した推奨遺伝子検査を含む第1の入力と、利用可能な遺伝子検査に関連する情報を含む第2の入力とを受け取る方法およびそれに付随するシステムを用いてなされる。これに基づいて、健康関連変数の異なる組み合わせと利用可能な遺伝子検査との間の複数のマッピングを含むルールのセットを生成する。ルールのセットを訓練データとして使用して分類器を訓練する。健康関連変数の第1の組み合わせ(健康関連変数の第1の組み合わせは、健康関連変数の複数の異なる組み合わせには含まれない)を含む第3の入力を受け取り、健康関連変数の第1の組み合わせを分類器への入力として提供し、分類器への入力に基づき、分類器からの出力として、利用可能な遺伝子検査から1種以上の推奨される遺伝子検査を受け取る。【選択図】 図3

Description

本願は、2018年3月19日出願の米国仮特許出願第62/644,833号の優先権およびその利益を主張するものであり、この仮出願の全内容を本明細書の一部を構成するものとしてここに援用する。
本開示は、一般には人工知能と機械学習技術に関し、より詳細には、知的な健康関連データ処理と学習技術を利用して個人の遺伝子検査とゲノム検査の識別性を改善するためのコンピュータ実行方法とそれに付随するシステムに関する。
遺伝カウンセラーは医療従事者であり、通常は上級学位を取得し、遺伝性病態や疾患を理解した専門家である。今日、何百万人もの人々が遺伝カウンセラーにアクセスできないため、遺伝性障害のリスクを容易に評価することができない。例えば、現在の米国の医療制度では、症状がない限り医師は患者を遺伝カウンセラーに紹介せず、時には紹介が非常に遅れることがある。伝統的に、患者は、本人が持つ可能性のある健康リスクを患者自身ではなく、医師に識別してもらうことを期待している。人々はますます健康を意識するようになっており、健康に関する意思決定に対して積極的になり、参加したいと望んでいる。遺伝子検査における消費者直販型(DTC)ビジネスの急増に伴い、遺伝的素因を理解することへの関心が高まっている。癌等の遺伝性疾患が早期に発見されれば、生存率も大幅に変化する。早期発見は医療効果に良い影響を及ぼす。
我々は各々6〜8個の劣性遺伝子変異を有しており、パートナーの同様の遺伝子変異と組み合わされたとき、遺伝性障害を引き起こす可能性がある。7000種以上の異なる希少疾患が存在し、約80%は欠陥遺伝子に起因する。出生時における全ての単一遺伝子疾患の有病率は約1/100である。癌は遺伝子に対する特定の変化に起因する遺伝性疾患である。更に「遺伝性の遺伝子変異」は、全ての癌の約5〜10%で大きな役割を果たしている。米国では推計で100万人(男性を含む)がBRCA遺伝子の変異の1種を保有しているが、その保有に気付いている人は約10%に過ぎない。
遺伝子検査とゲノム検査は、癌、慢性疾患及び遺伝性障害を含む医学の全領域で応用されており、科学技術の進歩に伴い、新しい検査が臨床診療に急速に導入されている。例えば、癌の場合、遺伝子検査とゲノム検査はスクリーニング、診断、予後、及びモニタリングと治療の選択に用いられている。しかし、消費者に焦点を当てた遺伝子教育と検査の資源は不足している。今日、何千もの遺伝子検査が存在し、各々が特定の遺伝性障害に対処することを目的としている。検査を選択すること困難である。インターネットでの通常の検索では、不正確で信頼性の低いデータに導かれる可能性がある。利用可能な検査情報は非常に複雑であり、患者に焦点を当てているのではなく、研究や医療の専門家に焦点を当てている。
遺伝子検査と分子検査の現在の情報源は包括的ではなく、患者や臨床医にとって使い易い方法では内容が整理されていない。多くの商業的な臨床検査室(ARUP、QUEST、MAYO CLINIC、GENEDx)、スタンフォード大学、エモリー大学、ベイラー医科大学の医療遺伝学研究所の学術臨床検査室、及びAmbry Genetics社、Genomic Health社、Pharmgkb.org社等の企業では分子検査の豊富なメニューが提供されている。Genetic Testing Registry等の政府のウェブサイトやAMP(Association Molecular Pathology)等の専門機関では検査ディレクトリが提供されているが、新しい検査に関する情報は提供されておらず、遺伝学的背景のない人にとってはナビゲートするのは容易ではない。患者を遺伝カウンセラーに紹介しても問題は解決しない。カウンセラーは今後の事態に対処できない可能性がある。全国には約4000人の遺伝カウンセラーが存在する。更に、今日では77000種以上の遺伝子検査が存在し、毎週10種の新しい検査が市場に導入されている。
一様相では、遺伝子検査の識別性を改善するための方法は、健康関連変数の複数の異なる組み合わせを考慮した推奨遺伝子検査を含む第1の入力を受け取ることと、利用可能な遺伝子検査に関する情報を含む第2の入力を受け取ることと、第1の入力と第2の入力とに基づいてルールのセット(ルールのセットは、健康関連変数の異なる組み合わせと利用可能な遺伝子検査との間の複数のマッピングを含む)を生成することと、ルールのセットを訓練データとして使用して分類器を訓練することと、健康関連変数の第1の組み合わせ(健康関連変数の第1の組み合わせは、健康関連変数の複数の異なる組み合わせには含まれない)を含む第3の入力を受け取ることと、健康関連変数の第1の組み合わせを分類器への入力として提供することと、分類器への入力に基づき、分類器からの出力として、利用可能な遺伝子検査から1種以上の推奨される遺伝子検査を受け取ることを含む。更なる様相は、対応するシステムと、コンピュータ実行可能命令を保存する非一時的なコンピュータ可読媒体とを含む。
上述の様々な実施形態は、以下の特徴の内の1種以上を含むことができる。健康関連変数の特定の組み合わせは、年齢、民族性、性別、個人の病歴及び家族の病歴を含む。第1の入力は複数の遺伝カウンセラーから受け取る。第1の入力を構造化して、各々が特定の遺伝子検査の推奨につながる一般的なパスを含む構造化第1入力を構築するが、ルールのセットを生成することは、構造化第1入力をルール生成ツールへの入力として提供することと、出力としてルールのセットを受け取ることを含む。第2の入力を構造化して、遺伝子/遺伝子パネルと異なる遺伝性病態との間の複数の相関関係を含む構造化第2入力を構築するが、ルールのセットを生成することは、構造化第2入力をルール生成ツールへの入力として提供することと、出力としてルールのセットを受け取ることを含む。遺伝子検査は、遺伝性癌を特定するための遺伝子検査及び/又は生殖遺伝学に関連する検査を含む。
一実施形態では、1種以上の医療ガイドラインのセットを含む第4の入力を受け取り、1種以上の医療ガイドラインのセットに適用される健康関連変数の異なる組み合わせに基づいて複数のシナリオを特定するが、ルールのセットを生成することは、複数のシナリオの各シナリオについてルールのサブセットを生成することを含む。
他の実施形態では、ルールのセットを使用して分類器を訓練することは、決定木分類器への入力としてルールのセットを提供することと、ランダムフォレストアルゴリズムを利用することを含む。
更に他の実施形態では、複数の質問をユーザーに提示して、ユーザーから健康関連変数の第1の組み合わせを収集するように構成されたユーザーインターフェースを提供する。ユーザーインターフェースは、1種以上の推奨される遺伝子検査をユーザーに提示するように構成することができる。
本明細書に記載の発明の対象の1種以上の実施形態の詳細については、添付の図面と以下の説明に記載されている。発明の対象の他の特徴、様相及び利点は、以下の説明、図面及び特許請求の範囲から明らかになるであろう。
図面では、同様の参照文字は通常、異なる図面を通じて同じ部品を指す。また、図面は必ずしも縮尺通りではなく、通常は実施形態の原則を説明することに重点が置かれている。以下の説明では、次の図面を参照しつつ様々な実施形態について記載する。
図1は、関連する遺伝子検査を特定するためのルールエンジンの一実施形態に入出力するデータの例を示す。 図2は、性別、民族性及び年齢の組み合わせの例を示す。 図3は、実施形態に従って関連する遺伝子検査を特定するためのシステムの高レベルのアーキテクチャを示す。 図4は、決定木の例を示す。 図5は、遺伝子検査特定プラットフォームの一実施形態におけるユーザーインターフェース画面の例を示す。 図6は、遺伝子検査特定プラットフォームの一実施形態におけるユーザーインターフェース画面の例を示す。 図7は、遺伝子検査特定プラットフォームの一実施形態におけるユーザーインターフェース画面の例を示す。 図8は、遺伝子検査特定プラットフォームの一実施形態におけるユーザーインターフェース画面の例を示す。 図9は、推奨する遺伝子検査を特定するためのルールの例を示す。 図10は、推奨する遺伝子検査を特定するためのルールの例を示す。 図10の続きである。 図11は、推奨する遺伝子検査を特定するためのルールの例を示す。 図11の続きである。 図11の続きである。 図11の続きである。 図11の続きである。 図11の続きである。
ここでは、個人のプロファイルに基づいて個人を適切な遺伝子検査に導くための推奨・マッチングエンジンを実行する方法と付随するシステムについて説明する。ユーザーについての個人の病歴、家族の病歴、民族性及び年齢を用いて、システムでは、可能な組み合わせに基づいて多数の変数を生成する(例えば、年齢については80個、民族性については8個、個人の病歴と家族歴については他の変数)。変数はシステムへの(一実施形態では、機械学習アルゴリズムへの)入力として提供し、ユーザーに対して実施する必要のある遺伝子検査とゲノム検査を出力として提供する。この出力を生成する際に、システムは、NCCN(全米総合癌情報ネットワーク)、ACMG(米国臨床遺伝学会)、ACOG(米国産科婦人科学会)、ASRM(米国生殖医学会議)及びSMFM(母体胎児医学会議)等の機関からの国内医療ガイドラインも考慮する。ユーザー用に特定された検査は、有用性と有効性について臨床的に承認されているインターネットから利用可能な全ての検査等、利用可能なゲノム検査及び遺伝子検査のコレクションから選択することができる。
上述のことを実行するため、本開示は、個人が(例えば、ウェブサイト、モバイルアプリケーション、又は他のユーザーインターフェースを介して)検査特定プラットフォームを開始するプロセスを検討し、簡単な評価に関する情報(例えば、終了までに約7分かかるアンケート)を入力し、評価が完了すると、推奨される検査を伴うレポートを即座に受け取ることができる包括的なプラットフォームについて記載する。遺伝的リスク評価に関連し得る家族及び個人の病歴に関する情報を個人が記憶し特定することの困難さに対処するため、プラットフォームには、個人病歴に関する医師と個人の間の情報フローを可能にするモジュールが含まれていると共に、家族病歴に関する未回答の質問を全て保存し、個人に返送して確認とアップロードを行う方法が含まれている。これは、正しい結果を得るために正確な情報を入力する重要な部分である。
プラットフォームの基礎となる知能は、個人による特定の入力セットに対して推奨される検査が何であるか特定する実際の遺伝カウンセラーに関連付けられた訓練データを使用して強化される。このような入力と推奨される検査のデータセットは、機械学習アルゴリズムがそのような入力の各セットで何を考慮することが重要であるか否かを学習するのに役立つ。得られたプラットフォームの出力は各個人についての評価レポートであり、通常は7分間の評価(一連の質問)の後に実質的に即座に作成される。幾つかの実施形態では、レポートに含まれるものは(1)提案された関連型の検査、(2)検査の結果の読み方に関する情報の簡素化、(3)検査についての賛否を含む関連研究所のリスト、(4)推定コスト、(5)損害保険の補償基準、(6)遺伝子検査自体に関する情報、遺伝子検査を行うことの利点と制限に関する情報、及び(7)人々が自分の家族や生活における遺伝学の役割と影響を理解するのに役立つ教育的洞察である。
一実施形態では、プラットフォームは一般的な種類の遺伝性癌、例えば、脳癌、乳癌、結腸直腸癌、腎臓癌、胃癌、甲状腺癌、卵巣癌、膵臓癌、前立腺癌、黒色腫及び子宮癌等を特定するための遺伝子検査を提案することができる。他の実施形態では、プラットフォームは、自然妊娠したカップル又は生殖補助医療を利用しているカップル、及び生殖能力の問題を抱えている他のカップルに対して生殖遺伝学に関連する遺伝子検査、例えば、保因者検査、受胎能検査、再発性妊娠損失検査、着床前遺伝子検査、出生前検査及び新生児検査等を提案することができる。更なる実施形態では、プラットフォームは、薬理遺伝学的検査の洞察、腫瘍ケア検査の洞察、心臓健康検査の洞察、希少疾患検査の洞察、神経学/精神医学検査の洞察、及びマイクロバイオームの何れか1種以上を提供する。
セクションI:遺伝子検査マッチングプラットフォーム
一実施形態では、プラットフォームは、人工知能/機械学習(AI/ML)ベースの「患者にとって最も適切な遺伝子検査を見つけるマッチングプラットフォーム」であり、これによって、健康志向の個人又は患者からの特定のガイド付き入力に基づいて、特定の遺伝子検査を行う必要があり、関連性があって、タイムリーで具体的且つ実用的な洞察が提供され、予防又は治療に関する情報に基づいた決定を下すことができる。プラットフォームの特徴と利点は以下の通りである。
(a)個人の臨床情報と個人情報とを入力として受け取り、関連する遺伝子検査を識別するAIプラットフォームであり、これによって「患者に焦点を合わせて」カスタマイズされ、関連性があって信頼できる遺伝子検査情報の中立的な情報源が得られる。このような中立的な側面が特に重要である理由は、現在77000種以上の検査が市場に出回っていて、毎週10種の検査が導入されており、多くの企業が検査を市場に出し、医療機関は何れかの企業と提携して検査を促進しているためである。個人の利益を考えている主要な中立的情報源は存在しない。
(b)患者への複雑さを軽減:遺伝子検査自体は非常に複雑であり、何千もの遺伝子検査を各個人のパーソナルプロファイルにマッチさせ、各個人に適切な検査を数秒間でもたらすマッチングアルゴリズムを提供することは、このような検査の意味、保険の補償範囲等の詳細を提供することは言うまでもなく、非常に複雑な作業である。この機能は、個人がインターネット対応のコンピュータを使用してできることではなく、同じ屋根の下で一緒に座っている遺伝カウンセラーのチームでさえできない。
(c)市販の検査に関連性があって信頼できるデータソースの継続的な特定、及びこのような検査の利用に関して専門機関によって発行された絶えず変化するガイドライン、及び保険会社からの払い戻しに関する追加の関連データ。
(d)継続的にキュレートされた遺伝子検査関連のコンテキストとコンテンツのオントロジーを用いて非常に複雑なデータセットを構築する。
(e)検査に関連する補助情報に関する追加の補足的な絶えず変化するデータもキュレートされる。
(f)ロジック/ルールエンジンを使用して、提示する遺伝子検査と提示しない遺伝子検査を識別するAI/MLに基づく「自己学習」ロジック。遺伝医学及び国の医療ガイドラインの理解と様々な医療分野へのゲノム検査と遺伝子検査の応用(例えば、データを継続的に集約し、個人にとっての適切な検査が何であるかについての特定の一連の質問に基づいて情報を解釈し、医療専門家の支援を受けて情報に基づいた決定を下すように患者を教育すること)に基づいて、個別プロファイル(関連する個人の病歴、家族の病歴、民族性及び年齢を含む)を遺伝子検査データベースにマッチさせるAI/MLマッチングアルゴリズム。
(g)遺伝性癌や遺伝性障害等の様々な疾患への適用性。
(h)結果の理解と適切な医療管理を向上させる患者教育の促進。
(i)患者が情報に基づいて決定を下すための市場で入手可能な全ての検査に対する深く幅広い洞察(例えば、利用可能な様々な選択肢から検査を選択する際に考慮する必要のある微妙なニュアンスや因子の説明)。
(j)患者に対して識別された臨床検査関連情報を含む簡略化された出力。
(k)拡張性:プラットフォームを拡張して非常に短期間で数千人ものユーザーに影響を及ぼすことができる。
(l)遺伝子検査の意識を高めるために、簡素化された理解し易い方法によって豊富で関連性のある教育コンテンツを提供する。
(m)オンデマンドの遺伝カウンセリングサービスの機会を創出する。
(n)一流の医師/研究者が各々主導する深い研究によって、各種の癌及び他の疾患の遺伝子検査を中心としたコミュニティの構築を提供する。
(o)個人/患者に関する独自のデータとその入力情報を経時的に全体として観察し、分析と洞察を促進する。
(p)グローバル展開の可能性
好都合なことに、本開示は、関連情報をキュレートし、市販の選択肢から遺伝子検査とゲノム検査の使い易いプラットフォームを構築し、独自のAI/MLベースのマッチングアルゴリズムを使用して、患者の詳細に基づき、患者又は個人の臨床的必要性に応じて最も関連性の高い検査の選択を絞り込むための包括的な技術を提供する。
作成されたレポートに基づき、特定の病態にかかりやすいかどうかを知りたい患者又は他の個人は、医療専門家(例えば、医師、遺伝カウンセラー又は腫瘍学者)と、より知識に基づいた会話をして、検査の解釈、保険の補償範囲、検査を行う研究所、及び検査の臨床的有用性についてよりよく理解することができる。
遺伝性病態に対するより個別化された予防的アプローチでは、遺伝子検査を検討している患者のために幅広い遺伝子リテラシーを開発する必要がある。ゲノム検査と遺伝子検査の利用可能性、臨床的有用性及び解釈を理解することは、より多くの情報に基づいた決定と患者のより良い結果を可能にする上で役立つ。患者はより力を与えられ、医療と検査の決定においてより積極的な役割を果たすことができ、本質的には、物事の飲み込みが早くなり、それについて何か行うことができるようになる。
このプラットフォームでは、FDAの認可/承認とCLIA認定の両方のデータの複数の科学的、臨床的及び商業的情報源から臨床的に利用可能な検査のデータベースを利用できると共に、NCCN、ACMG及びACOG等の専門機関ガイドラインによって推奨される臨床バイオマーカーを利用できる。プラットフォームによって検討可能な様々なガイドラインは、本開示にて以下の「ガイドライン」セクションに列挙されている。
プラットフォームによって参照される遺伝子検査とゲノム検査のデータベースは、関連性、信頼性及び通用性を確保するためにキュレートと定期的な更新を行うことができ、医療や遺伝子の専門家がチェックすることができる。継続的な更新には、保健機関、政府のウェブサイト、企業論文及び科学論文等の信用且つ信頼できる様々な情報源からの情報を含めることができる。
AI/MLプラットフォームは、利用可能な様々な種類の検査と、適格性と有用性を判断するために使用される用語を理解するのに役立ち、これによって適切な検査の選択と解釈を決定することができる。このことを容易にするため、NCCNやACMG等の専門機関からのガイダンスに加え、簡単な言語での用語の意味へのハイパーリンクや用語集を含めて、これらをデバイスのユーザーインターフェースを通して利用可能にすることもできる。
一例として、現在、遺伝性乳癌及び卵巣癌、結腸直腸癌の遺伝性癌リスク予測に分子検査を利用して、癌患者及び関連する家族歴のある健常者のリスクを評価している。
本開示では、プラットフォームがどのように使用されるか示すために癌と生殖遺伝学を用いているが、本解決策は様々な疾患(例えば、(1)全種類の癌、(2)生殖遺伝学(出生前検査、新生児スクリーニング、保因者検査)、(3)心血管、神経障害及び遺伝性癌の予測検査、(4)感染症、(5)炎症(免疫病態)、(6)希少疾患、(7)薬理ゲノミクスが挙げられるが、これらに限定されない)に利用できることを理解されたい。
AI/MLプラットフォームで利用されるマッチング技術によって、インターネットから利用可能な何千もの遺伝子検査を、各個人に最適な遺伝子検査の短いリストに数秒間で凝縮することができる。一実施形態では、この技術に関する幾つかの構成要素、即ち、包括的調達、意味的マッチング及び適応学習が存在する。
包括的調達を用いて、パブリックドメイン及びインターネット上の有料サイトで利用可能な何千もの遺伝子検査がプラットフォームによって特定且つ考慮され、検査の推奨が行われる。
意味的マッチングはキーワードだけでなく、コンテキストと意図を説明する。プラットフォームマッチングエンジンの一構成要素はオントロジーである。オントロジーはドメインのモデリングに関連する概念、関係及び他の特徴を定義する。一実施形態では、プラットフォームは、遺伝子検査ドメイン用に開発されたオントロジーを使用し、これには(1)表示/目的、即ち、概念間の階層と関係、(2)疾患の経過、再発リスク及び予後に関する包括的な情報、及び(3)検査の臨床的有用性の理解と、提案された検査における臨床研究、研究記事及び発明対象の専門家に基づいた十分な科学的証拠の有無が含まれる。例えば、これは遺伝性癌に関与する癌感受性遺伝子の識別性を含む場合があり、この遺伝子は科学文献及び国の医療ガイドラインによる癌の遺伝的リスクに関連している。幾つかの実施形態では、オントロジーは、検索及びマッチング技術と組み合わせて、ヒト遺伝子データの専門家によって継続的にキュレートされ、一貫して成長する場合がある。
プラットフォームマッチングエンジンの他の構成要素は、クエリー生成・概念抽出エンジンである。一実施形態では、クエリー生成と概念抽出エンジンを使用して遺伝子検査プロファイルを患者プロファイルにマッチングさせる方法は、(1)患者プロファイルから、オントロジーに対応する複数の概念、例えば、個人の病歴、家族の病歴、民族性及び年齢等を抽出する工程と、(2)正規化患者プロファイル(正規化患者プロファイルは、上述のような複数の概念を含む)を生成する工程と、(3)正規化患者プロファイルとオントロジーに少なくとも一部基づいて検索クエリーを形成する工程と、(4)遺伝子検査データベースの情報源に検索クエリーを提出する工程と、(5)遺伝子検査プロファイルの情報源から患者プロファイルと潜在的にマッチする遺伝子検査プロファイルの最初のバッチを受け取る工程と、(6)遺伝子検査プロファイルの最初のバッチ中の遺伝子検査プロファイルからオントロジーに対応する複数の概念の少なくとも1つのサブセットを抽出する工程と、(7)正規化遺伝子検査プロファイル(正規化遺伝子検査プロファイルは、複数の概念の少なくとも1つのサブセットを含む)を生成する工程と、(8)正規化患者プロファイルが正規化遺伝子検査プロファイルとマッチするかどうかを判断する工程を含む。
上述の方法では、患者プロファイルに基づいて最も実行可能な遺伝子検査のリストを作成する。様々な基準を評価する固有のロジック/ルールエンジンを使用し、この基準によって各患者に最も適切な遺伝子検査の選択が導かれる。このような基準の例は以下の通りである。
・遺伝性癌に関連する遺伝子検査の識別
・個人の病歴
・癌の種類
・診断の年齢
・サブタイプ(例えば、三種陰性)
・関連病態
・腫瘍検査結果(例えば、結腸癌、子宮癌)
・家族の病歴
・癌の種類
・パターン(例えば、どの2種の癌が一緒であるか)
・癌診断の年齢(例えば、脳癌<18歳、胃癌<40歳)
・癌履歴のある親族の数
・結腸ポリープの履歴(例えば、10より多いか少ない)
・特定された家族性遺伝子変異の履歴
・生殖遺伝学に関連する遺伝子検査の識別
・個人の病歴
・年齢−母親と父親
・民族性
・妊娠歴
・自然妊娠
・生殖補助技術(例えば、IVF、精子又は卵子提供者)
・受精能の問題
・再発性妊娠損失
・家族の病歴
・染色体異常(例えば、ダウン症候群)
・先天性欠損
・遺伝性障害
・血液障害(例えば、サラセミア、鎌状赤血球貧血)
・嚢胞性線維症、脊髄性筋萎縮症
・盲目と難聴
・心臓欠陥
収集された上述の患者/個人情報に基づき、プラットフォームは患者又は他の個人が遺伝子検査を受けるべきか否かを推奨することができ、受けるべきである場合にはプラットフォームは適切な検査を識別することができる。
適応学習に関しては、プラットフォームは、初期の知的ランキング及び機械学習ベースのルールエンジンに基づいて常に「自己学習」し、患者プロファイルと遺伝子検査プロファイルに基づいて、各患者に適した一連の検査を経時的に理解し、特定することができる。
セクションII:基盤技術
プラットフォームでは機械学習を利用して、遺伝カウンセラーの専門知識と彼らの患者分析における日常業務をシミュレートする。図1を参照すると、ルーチンとマッチング出力からのデータをML/AI独自のルールエンジンに入力し、推奨すべき適切な遺伝子検査を決定する。
GC(遺伝カウンセラー)からの非構造化データ:どの遺伝カウンセラーも、カウンセラーの経験や所属する地理、日常的に出会う患者の種類等の特定の外部因子を追加するといった、国内ガイドラインを解釈する独自の方法を持っている。これら全てのパラメータに基づき、カウンセラーは患者の病歴に基づいて患者に推奨されるものを分析する。このようなルーチンは標準化されておらず、アルゴリズムに使用するデータは構造化されていない。プラットフォームを訓練するため、遺伝カウンセラーには数千セットの入力に対して適切な検査を推奨することが求められ、最終的に、ML/AIエンジンは、健康関連変数(例えば、個人の病歴(PH)、家族の病歴(MH)、民族性、年齢及び性別)の数百万又は数兆の組み合わせに対して推奨される検査を予測した。遺伝カウンセラーからの入力を更に用いて、特定の結論に到達し、ある検査を推奨するためにカウンセラーが患者に対して通常たずねる質問を識別した。
ノードの構造化:アルゴリズムが機能して成長するためには、パターンと異なるパラメータ間の相関関係を特定する必要がある。このようなパターンと相関関係の特定に向けた第1の工程は、異なるノードでデータを構造化して、特定のパスにつながる方法でデータを更に分析し変換できるようにすることである。数人の遺伝カウンセラーからの上述のデータの構造化は、ノイズ(即ち、外部パラメータ)を除去し、一般的なパスを特定し、関連する全ての因子とガイドラインを考慮した、特定の検査の推奨につながる構造化ノードを作成することによって行われる。
検査に関する非構造化データ:現在、利用可能な遺伝子検査は1種以上の遺伝子の組み合わせである。現在、76000種を超える検査が利用可能であり、その数は日々増加している。これらの検査の多くは相互に関連しており、様々な命名法でこれらの検査を行うプロバイダーが多数存在し、混乱を招いている。このような問題に対処するため、プラットフォームでは、様々なプロバイダーとその検査を識別するのではなく、ユーザーに推奨できる全ての遺伝子検査と遺伝子パネル検査を高レベルで識別する。
出力の構造化:この工程では、遺伝子/遺伝子パネルと様々な遺伝性病態との相関関係を特定し、各シナリオで推奨すべき遺伝子及び/又は遺伝子パネルを決定する。一旦相関関係が特定されると、構造化情報アーキテクチャがこのデータを保存して、遺伝子と遺伝子パネルの推奨全体をこのデータセットから効率的に取り出せるようになる。
更に図1を参照すると、独自のルールエンジン(ML/AIエンジン)はデータセット(ユーザープロファイル情報、国内ガイドライン、及び関連する利用可能な検査データ)を取り込み、ユーザーを適切な遺伝子検査にマッチさせる。このエクササイズでは、実行時に何百万もの組み合わせを考慮して、結果(即ち、個人に「適切な」検査を推奨するレポート)を実質的に即座に得る。
多数の変数を考慮して「適切な」結果(即ち、推奨検査)を得る。一実施形態では、単純に言うと、遺伝的推奨は主に、ユーザーが提供可能な次の基本的な特徴とパラメータ、即ち、性別、年齢、民族性、個人の健康歴(存在する場合)、及び家族の健康歴(存在する場合)に基づく。特徴やパラメータを追加又は変更する度に、可能な組み合わせの数が指数関数的に増加する。
上述のように、遺伝カウンセラーからの非構造化データには、どの遺伝子検査を推奨すべきかについての結論に達するようにカウンセラーが患者に尋ねる一連の質問が含まれる場合がある。これらの一連の質問から、各遺伝カウンセラーが検査の推奨に向けて進む上で従うパターン(例えば、フローチャート)が特定される。プラットフォームで使用する場合、組み合わせを管理して結論に達するよう、質問を変更してクローズエンド型回答を得るようにする。このプロセスは必ずしも自動プロセスではないが、それは、正確な出力を得るのに使用する入力は一定ではないためである。従って、提供されるユーザー入力、ガイドライン及び検査の変更は絶えず進化しているため、アルゴリズムは時間と共に変化してこのような変更を反映する。
適切な遺伝子検査の識別性に関連する変数の組み合わせの数は相当なものになる可能性があり、その結果、大幅な計算コストが発生する。例えば、スプレッドシートの行で組み合わせを表し、数百万又は数兆の行を処理して適切な遺伝子検査を識別するには、数分以上の計算時間がかかることがある。図2に示す例では、性別、2種の民族性及び年齢を可能なパラメータとして考えると、木の下方に移動するのに伴い、組み合わせと複雑さの数が増加する。更なるパラメータが追加されると、複雑さが指数関数的に増大する。実行時の計算コストを最小限に抑えながら、数兆の組み合わせから正確にマッチするものを実質的に即座に見つけるため、プラットフォームには「GenomeBrain」と称される独自のフレームワークが組み込まれている。
GenomeBrainは、複数のオープンソースのルールエンジン(例えば、JRules、Easy Rules)と、利用可能な技術(例えば、MongoDB、ElasticSearch)、JavaScript Object Notation(JSON)ベースの解析フレームワーク、及び機械学習アルゴリズム(例えば、決定分類器やランダムフォレストアルゴリズム)の組み合わせを使用して内部で構築されたBLBB(Business Logic Building Blocks)との組み合わせとして構築されたフレームワークである。
図3は、GenomeBrainのアーキテクチャの一実施形態を示す。遺伝カウンセラーの質問パターン(例えば、MICROSOFT VISIOで表されるフローチャート)をJSONベースのパーサーを使用して解析し、得られたデータをデータベースに保存する(例えば、MongoDBを使用)。個人歴と家族歴、及び患者の人口統計学的特徴の組み合わせに基づき、医療ガイドライン(例えば、癌のNCCNガイドライン)を考慮して様々なシナリオを特定する。次に、シナリオを様々なバケットに限定して、ルール作成ツール(例えば、Easy Rules、JRules及びBLBB(独自のJSONベースのフレームワーク))を使用した更なる処理を行うようにする。ルールのセットの一例を表1に示す。行数はパラメータを追加する毎に指数関数的に増加する。これらの何兆もの行から正確にマッチするものを見つけることは、退屈で費用のかかる作業になる可能性がある。従って、既存のデータセットを最適化し、出力への最適なパスを作成する必要がある。
Figure 2021519479
一実施形態では、決定木分類器が教師となる(supervised)学習アルゴリズムを利用可能な訓練データと共に使用して、回帰と分類の問題を解決する。上述のツールによって作成したルールは、機械学習「決定木分類器」アルゴリズム用の訓練データセットとして渡される。次に、ランダムフォレストアルゴリズムを使用して出力を集計し、最終的にルールが最適化され、検査が推奨される。
決定木は、木が深くなるにつれて過剰適合の問題が発生し易くなる。この問題を解決するため、ランダムフォレストアルゴリズムを使用する。ランダムフォレストは決定木のコレクションであり、その複数の結果が1個の最終結果に集約される。バイアスに起因するエラーを実質的に増加させることなく過剰適合を制限できることが、このような強力なモデルとなる理由である。
明確にするため、「教師あり学習アルゴリズム」は訓練データを分析して推定関数をもたらすが、これは新しい例のマッピングに使用することができる。最適なシナリオにより、アルゴリズムは、未知のインスタンスのクラスラベルを正確に決定することが可能となる。これには、学習アルゴリズムが訓練データから未知の状況に「合理的な」方法で一般化する必要がある。「回帰」アルゴリズムの主な目的は離散値又は連続値の予測である。「分類」とは、何かが標的クラスに分類されるかどうかを予測することを意味する。「過剰適合」とは、学習システムが所定の訓練データに非常に密接に適合し、訓練されていないデータの結果を予測するのが不正確になる現象である。
ランダムフォレストはアンサンブル機械学習法の典型例である。簡単に言えば、アンサンブル法は、予測性の低いベースモデルを集約して、より優れた予測モデルを生成する方法である。直感的に推測し得るように、ランダムフォレストは、様々な決定木を組み立て、決定木の悪評高い過剰適合傾向を減らすことによって、より一般化されたモデルを生成する。
例えば、上述のルールエンジンの出力表を学習アルゴリズムの訓練データセットとして考えてみる。決定木では、レコードのクラスラベルを予測するプロセスの場合、プロセスは木のルートノードから開始する。ルート属性の値をレコード属性と比較する。比較に基づいて、その値に対応するブランチを追跡し、プロセスは次のノードにジャンプする。このプロセスは、レコード属性値を木の他の内部ノードと比較し続け、これは予測クラス値を有するリーフノードに達するまで行われる。従って、モデル化された決定木を使用して標的クラス又は値を予測することができる。
決定木モデルは次のように作成することができる。決定木は積和(SOP)表現に従う。図4は、ルートノードからリーフノードに向かって、患者の年齢が遺伝学において役割を果たすかどうか、患者の民族性が遺伝学において役割を果たすかどうか、患者の性別が遺伝学において役割を果たすかどうかを説明する予測を示す。SOPは論理和標準形としても知られている。あるクラスついては、木のルートから同じクラスを有するリーフノードまでのどのブランチも値の結合(積)であり、そのクラスで終わる異なるブランチは選言(和)を形成する。
決定木実行における主な課題は、各レベルでルートノードと見なす必要がある属性を特定することである。この処理は属性選択として知られている。様々な属性選択手段を使用して、各レベルでルートノードと見なすことができる属性を特定することができる。属性選択手段としては情報利得とジニ指数を挙げることができる。
データセットが「n」個の属性で構成されている場合、ルートにおいて又は木の様々なレベルで内部ノードとして配置する属性を決定するのは複雑な手順である。ルートとなるノードをランダムに選択しても問題は解決せず、結果の精度が低下する。これに対処するために、情報利得やジニ指数等の基準を使用することができる。このような基準によって、どの属性の値も計算される。値を並べ替え、属性を特定の順序に従って木に配置する。例えば、値の高い属性(情報利得の場合)をルートに配置する。情報利得を基準として使用する場合、属性を分類別であると見なし、ジニ指数を使用する場合、属性を連続であると見なす。ジニ指数又は情報利得の計算に基づいて決定木を構築することができる。これらの値に従って属性を木に配置する。
図1に戻ると、プラットフォームの結果の検証は定期的に行うことができる。例えば、ガイドライン、ユーザー質問プロセス、又は他のロジックが更新されると、プラットフォームは全ての検査ケースを新しい情報で再実行し、例外のフラグを立てる。こうして、プラットフォームは学習し、逸脱を特定してより良い結果をもたらす。
セクションIII:例示的実施形態
実施例1:遺伝子検査マッチングプラットフォームの使用:遺伝性癌
次に、遺伝性癌に関連する適切な遺伝子検査の識別に関して、AI/MLプラットフォームの一実施形態の使用例について説明する。個人及び患者向けにカスタマイズされた結果を受け取るために、例えば、潜在的な被験者が情報を電子ポータルに入力して、以下のデータをプラットフォームによって把握することができる。
遺伝性癌評価の例:質問は動的である(即ち、以下の質問は、前の質問への回答に基づいて変更される可能性がある)。更に、質問を複数の選択肢によってクローズエンドにすることができる。
人口統計学的な質問によって開始する。
年齢、性別(生物学的)、民族性−アシュケナージ系ユダヤ人、南アジア人、ヒスパニック系、黒人/アフリカ系アメリカ人、東南アジア人/太平洋諸島民、白人/コーカサス人、その他(この例では、ユーザーとして64歳の男性(民族性:黒人及びヒスパニック系)を選択)。
癌履歴はあるか−Yes又はNo。
どの種類の癌と診断されたか(Yesを選択すると、次の選択肢が表示される)。
該当するものを全て選択:脳癌、乳癌、結腸直腸癌、腎臓癌、黒色腫、膵臓癌、前立腺癌、皮膚癌(非黒色腫)、胃癌、甲状腺癌、子宮癌/子宮内膜癌、その他(各選択肢には、診断の特定の年齢を尋ねるサブ選択肢がある)。
「35歳で前立腺癌と診断」を選択すると、以下が表示される。
前立腺癌は高悪性度と見なされるか、又はグリーソンスコアが7以上であるか(ここではプラットフォームが複雑な用語の定義を詳しく説明できるため、この場合、グリーソンスコアとは何かに関するツールチップがある)。
回答には3個の選択肢がある(即ち、Yes又はNo又は分からない−医師に確認する必要あり)。(多くの場合、人々は疾患の詳細について知らないか、又は気付いていないため、正しい情報を確実に入力し、これによって全てのオープンクエスチョンの把握を容易にすることが重要である。回答は病院又は医師ポータルに提供できるため、医師は患者に連絡することができ、患者は評価レポートを取得するために情報を確認することができる)。
「No」を選択すると、次の質問に進む:癌はリンパ節又は体内の他の場所に広がっているか。(繰り返すが、プラットフォームは複雑な用語の定義を詳しく説明しており、この場合、リンパ節とは何かに関するツールチップがある)。
リンパ節に対して「Yes」を選択すると、個人の病歴入力が完了し、プラットフォームは家族の病歴セクションに移動する。(家族歴を取得することは重要であるが、それは、家族内の癌が世代から世代へと受け継がれてきた異常な遺伝子に起因するかどうかをプラットフォームに知らせることができるためである。家族歴のセクションにおいて、「家族」には血縁者、例えば、両親、兄弟、子供、叔母、叔父、祖父母、姪、甥、家族の両側の従兄弟が含まれる)。
家族歴に関する最初の質問は次の通りである:癌の家族歴があるか。
「Yes」を選択すると、続く質問は次の通りである:家族の誰かがどの種類の癌と診断されたか、該当するものを全て選択:脳癌、乳癌、結腸/直腸癌、腎臓癌、黒色腫、膵臓癌、前立腺癌、皮膚癌(非黒色腫)、胃癌、甲状腺癌、子宮癌/子宮内膜癌、その他。
家族において2種類の癌、この場合は「乳癌」と「結腸/直腸癌」を選択すると、個々の癌についての質問は行わず、代わりにプラットフォームは、癌が遺伝性であるかどうかを確認するための、見極めのための質問をする。提示された家族セクションの続く質問は次の通りである:次の癌のいずれかを有する近親者が、家族の同じ側に2人いるか。また、その内の少なくとも1人は50歳以前に癌と診断されたか。乳癌、卵巣癌、膵臓癌、前立腺癌、黒色腫、結腸/直腸癌、子宮癌、胃癌、腎臓癌、甲状腺癌。ここでは4個の選択肢がある:Yes、No、不明、又は確信が持てない−家族に確認する必要あり。
家族の同じ側に、年齢に関係なく次の癌のいずれかと診断されている近親者が3人いるか。乳癌、卵巣癌、膵臓癌、前立腺癌、黒色腫、結腸/直腸癌、子宮癌、胃癌、腎臓癌、甲状腺癌。
先の質問に対して「No」を選択すると、次の質問が表示される:次の癌のいずれかと診断された近親者がいるか。卵巣癌、膵臓癌、転移性前立腺癌(前立腺の外側に拡がっている)、45歳以前の乳癌、男性の乳癌。ここでは4個の選択肢がある:Yes、No、不明、又は確信が持てない−家族に確認する必要あり。
次に、最後の重要な2個の質問をする。1個目は:結腸ポリープの個人的な病歴はあるか。選択肢は「Yes」、「No」及び「医師に確認」である。「No」を選択すると、家族歴について質問する:結腸ポリープの家族歴はあるか。
もう1個の重要な質問は:癌遺伝子変異を有することが分かっているか。ここでも「Yes」又は「No」の選択肢がある。
「No」を選択すると、次の質問に進む:近親者の誰かが癌遺伝子変異を有していることが分かっているか。
「Yes」を選択すると、選択対象として全ての主要な癌遺伝子変異のリストが提示される:APC、ATM、EPCAM、BRCA1/2、MLH1、MSH2、CHEK2、MSH6、MUTYH、PTEN、NBN、TP53、PMS2、PALB2、BAPI、BRIP1、CDH1、CDK4、CDKN2A、FH、FLCN、MEN1、MET、RET、SDHA、SDHB、SDHC、SDHD、TSC1/2、VHL、OTHERS。
「MLH1」を選択すると、評価の終了に到達する。図5に示すように、確実に正確な評価が行えるように、全ての回答を見直す機会がユーザーに与えられる。
与えられた回答のまとめの最後に、ユーザーに「私のレポートを見る」ボタンが表示され、レポートの最初の画面が表示される。この例を図6に示す。図示のように、入力をまとめて、提案された検査の数(この場合は6種)を通知し、提案された遺伝子/遺伝子パネルをプラットフォームがどのように提示するかを説明する。リスク評価では、癌のリスクに影響を及ぼす可能性のある生活習慣や環境因子等の非遺伝的リスク因子は考慮されていないこと通知する。さらに、推奨される検査の全てを行う必要はないが、医師又は遺伝カウンセラーと共に決定するパネルの一部として、推奨される単一遺伝子の全てが含まれることを説明することによって、レポートに対して行動を起こす方法を説明する情報がユーザーに提供される。
図7は、図6の画面に続いて表示され得る画面上のレポートの一例を示す。画面上のレポートでは、検査の推奨の詳細が上部に記載され、その下に一般的な情報が記載されている。ユーザーが特定の遺伝子を選択した場合、図8に示すように、その遺伝子に関するより詳細な情報が表示される。次に、適切なフォーマット(例えば、PDF)のレポートをそのユーザー用に作成することができる。このレポートには、概要、遺伝子検査の実施時に結果を解釈する方法の詳細、関連コスト、保険の補償範囲、研究所、及びユーザー個別の検査の推奨が含まれる。
実施例1:バックエンドプロセス
個人と家族の癌履歴の詳細によって、プラットフォームのバックエンドで一連の動作が行われる。この場合、ユーザーが個人の履歴から前立腺癌を選択することにより、ルールエンジンは、回答に基づいて尋ねるべき一連の質問を特定し、関連する遺伝子検査を提案する。図9は、ルールエンジンが従う、前立腺癌に関連する手続き上の質問フローを表すフローチャートを示す。
フロントエンドでは、ユーザーは評価を通り、家族歴セクションに到達する。家族に癌の履歴が1種類しかない場合は、ルールエンジンを使用して次の一連の質問を決定する。家族に2種以上の癌がある場合、癌が本当にあるかどうかを確認するために、別の一連の見極めのための質問がなされる。バックエンドでは、図10に示すように、システムは2種の癌の組み合わせルールエンジンを利用するが、これは正しい遺伝子検査の推奨を決定するのに役立つ。より詳細には、遺伝子検査は、ユーザーの家族歴で特定された2種の癌に対応する行と列が交わる部分に基づいて選択される。ユーザーが乳癌と結腸/直腸癌の家族歴を選択し、特定の見極めのための質問に「Yes」と回答した場合、次の遺伝子検査が提案される:CHEK2、PTEN、STK11及び多重癌パネル。
一実施形態では、プラットフォームのユーザーに提示される最後の2個の質問は、ポリープと遺伝子変異に関するものである。ユーザーがポリープの家族歴又は個人歴に対して「Yes」と回答した場合、検査の提案はポリープに関するルールに基づいて行われる。遺伝子変異に関して、ユーザーが家族に遺伝子変異があったと肯定的に回答した場合、変異した特定遺伝子の検査が推奨される。この実施例では、ユーザーはポリープの個人歴や家族歴を選択していないが、MLH1変異を特定しているため、他の検査に加えてMLH1遺伝子の検査が推奨される。
実施例2:遺伝子検査マッチングプラットフォームの使用:生殖遺伝学
次に、生殖遺伝学に関連する適切な遺伝子検査を識別することに関して、AI/MLプラットフォームの一実施形態の使用例について説明する。
個人及び患者向けにカスタマイズされた結果を受け取るために、例えば、病気の可能性のある被験者が情報を電子ポータルに入力することで、以下のデータがプラットフォームによって獲得される。
生殖遺伝学評価の例:質問は動的である(即ち、以下の質問は、前の質問への回答に基づいて変更される可能性がある)。更に、質問を複数の選択肢によってクローズエンドにすることができる。
人口統計学的な質問から開始する:年齢、性別(生物学的)、民族性−アシュケナージ系ユダヤ人、南アジア人、ヒスパニック系、黒人/アフリカ系アメリカ人、東南アジア人/太平洋諸島民、白人/コーカサス人、その他。この場合、ユーザーはヒスパニック系の37歳の女性を選択する。
評価はこの質問から開始する:現在妊娠しているか(回答はYesとNo)。選択に基づき、評価において、ユーザーは異なる質問のセットを受ける。
「Yes」を選択すると、プラットフォームは次のように質問する:出産予定日はいつか。ユーザーは2019年9月22日の出産予定日と回答する。
この妊娠は体外受精(IVF)によってなされたか。選択に基づき、評価において、ユーザーは異なる質問のセットを受ける。
前の質問で「Yes」を選択すると、プラットフォームは次のように質問する:精子提供者はいるか。回答が「No」の場合、即ち、精子提供者がいない場合、次の質問はユーザーに尋ねられない。
しかし、精子提供者の質問に対して「Yes」を選択すると、プラットフォームは次のように質問する:提供時に精子提供者は40歳以上であったか。Yes、No、不明、及び確信が持てない−確認する必要あり。
「No」を選択すると、評価は次の質問に移る:精子提供者の民族性は何か。選択肢は次の通りである:アシュケナージユダヤ人、南アジア人、ヒスパニック系、黒人/アフリカ系アメリカ人、東南アジア人/太平洋諸島民、白人/コーカサス人、その他、不明、及び確信が持てない−確認する必要あり。
次の質問:卵子提供者がいたか。この例では、ユーザーは「No」と回答し、卵子提供者の質問はこれ以上行われない。次の質問は、ICSI(卵細胞質内精子注入法)を使用したか。(複雑な用語を持つ他の質問と同様に、ユーザーを手助けするためのツールチップがあり、この場合はICSIの意味が説明される)。
「Yes」を選択すると、プラットフォームは次の質問に移る:流産が2回以上あったか。
この質問に「No」を選択すると、次の質問は、あなた又はあなたの精子提供者は劣性遺伝性病態の家族歴があるか。(幾つかの劣性遺伝性病態の例としては、嚢胞性線維症、鎌状赤血球症、脊髄性筋萎縮症、αサラセミアが挙げられる)。(複雑な用語を持つ他の質問と同様に、ユーザーを手助けするため、プラットフォームは劣性遺伝性病態の意味を説明するツールチップを提供する)。
前述の質問に「No」と回答すると、次の質問がなされる。あなたは原因不明の卵巣機能不全症の履歴があるか。
前述の質問に「No」を選択すると、次の質問は、あなたの精子提供者は原因不明の男性不妊の履歴があるか。4個の選択肢がある。即ち、Yes、No、不明、及び確信が持てない−確認する必要がある。
この質問に「No」と回答すると、次の質問は、あなた又はあなたの精子提供者はX連鎖病態の保因者であるか(X連鎖病態の例としては、脆弱X症候群、血友病、デュシェンヌ型筋ジストロフィー、G6PD、X連鎖魚鱗癬が挙げられる)。
「No」を選択すると、次の質問は、あなた又はあなたの精子提供者は常染色体優性病態を有しているか。常染色体優性病態の例としては、ハンチントン病、マルファン病、遺伝性癌(リンチ症候群、遺伝性乳癌・卵巣癌症候群等)が挙げられる。
前述の質問に対して「No」と回答すると、次の質問がなされる。あなた又はあなたの精子提供者は、既知の遺伝性障害を伴う個人歴、家族歴又は妊娠歴があるか。
前述の質問に対して「No」を選択すると、次の質問がなされる。あなた又はあなたの精子提供者又は近親者は、次の病態又は妊娠歴のいずれかを有しているか(該当するもの全てにチェック):染色体異常(ダウン症候群等)、神経管欠損(二分脊椎や無脳症等);血液障害(血友病、サラセミア、鎌状赤血球)、嚢胞性線維症、神経障害又は筋障害(神経線維腫症、筋ジストロフィー)、骨障害又は骨格障害(軟骨無形成症又は低身長症)、出生時の心臓欠陥、腎臓異常、口唇裂/口蓋裂、知的障害、18歳未満の失明又は難聴、不明、確信が持てない、無し。
この例では、ユーザーは神経管欠損を選択する。これが最後の質問であり、プラットフォームは与えられた全ての回答のプレビューをユーザーに表示して、回答が正しいことを確認する。更に、与えられた回答のまとめの最後において、プラットフォームのディスプレイには、「全ての回答を読んだが、私の知る限り全て正しい」というメッセージを表示するチェックボックスがある。ボックスをチェックして「私のレポートを見る」ボタンをクリックすると、レポートの最初の画面が表示され、プラットフォームでは、推奨される検査の数を特定し、ルールエンジンの構築の一部として使用される全国の医療機関のガイドラインの詳細を提供し、実際の推奨検査について説明する。推奨される保因者スクリーニング検査の全てを個別に行う必要はないこともユーザーに説明されるが、パネルの一部として全ての遺伝性病態を含めることが提案される。1回の採血でこれら全ての遺伝子を一緒に検査することができる。出生前遺伝子検査によって、胎児が特定の遺伝性病態を有しているかどうかに関する情報が得られることが更に説明される。スクリーニング検査と診断検査の両方が提供され、ユーザーはパートナーや医師と話し合った後、自分に適した検査を選択するよう求められる。
次にプラットフォームは画面上のレポートを表示するが、このレポートでは、検査の観点からユーザーに関連する検査がハイライトされる。ユーザーが特定の検査をクリックすると、その検査に関する詳細が画面に表示される。
実施例2:バックエンドプロセス
ユーザーの妊娠履歴の詳細(自然妊娠と生殖補助医療)と遺伝性障害の家族歴によって、プラットフォームのバックエンドで独自の一連の動作が推進される。男性ユーザーと女性ユーザーではフローが異なる。更に、ユーザー/パートナーが妊娠しているか否かによって質問が変わる。ユーザーが妊娠しているが、生殖補助医療を利用している場合、フローは自然妊娠している可能性のあるユーザーとは更に異なる。
この場合、彼女が妊娠していてIVFを利用していることを選択すると、ルールエンジンは質問のセットを特定し、回答に基づいて、関連する遺伝子検査を提案する。
図11は、生殖遺伝学に関して女性ユーザーに質問するためにプラットフォームルールエンジンによって使用されるプロセスフローの一実施形態のフローチャートを示す。この実施例とこのプロセスフローにおいてユーザーから提供された入力に基づいて、次の検査がユーザーに推奨される。脊髄筋萎縮症保因者スクリーニング、サラセミア保因者スクリーニング、嚢胞性線維症保因者スクリーニング、州で義務付けられた新生児スクリーニング、拡張新生児スクリーニング、出生前スクリーニング検査、出生前診断検査(第一期血清スクリーン、解剖スキャン(超音波)、クアッドスクリーン、非侵襲性出生前スクリーニング、慢性非侵襲的出生前スクリーニング、絨毛膜絨毛検査、羊水穿刺。保因者検査はユーザーの民族性に基づいており、出生前検査は出産予定日に基づいて提案された。更に、ユーザーは35歳を超えていて、高リスクの妊娠となり、神経欠陥を家族歴/過去の妊娠歴として報告したため、これらの重要なトピックに関してユーザーに教育を提供するセクションがレポートに追加される。
実施例3:消費者教育プラットフォーム
人々が健康問題を早期に発見できない主な理由の一つは、意識と教育の欠如である。癌の場合、教育を受けて接し、リスクが高いかどうかを判断できるようにすることが重要である。その場合、一般集団の年齢に基づくスクリーニングガイドラインを変更し、癌を早期に発見するか、又は生活習慣を変えて癌を予防できるようにすることができる。生殖遺伝学の場合、保因者スクリーニング、出生前検査、場合によっては着床前遺伝子検査によって、家族で発生する可能性のある遺伝性障害を予防又は管理できることがある。
一実施形態では、プラットフォームは、基本的な遺伝学、遺伝性癌及び生殖遺伝学に焦点を合わせた教育プラットフォームを含む。このプラットフォームでは、概念を説明するための単純な言葉と画像を用い、使いやすい方法で情報を提供することにより、この複雑な分野の理解を容易にする。教育プラットフォームは、新しい関連項目で常に更新することができ、ユーザーが興味のある項目にアクセスできるように検索も可能である。
ガイドライン
専門家協会ガイドライン−生殖遺伝学
米国産科婦人科学会(ACOG)。ACOG Practice Bulletin No.78:妊娠中の異常ヘモグロビン症。
米国産科婦人科学会(ACOG)。ACOG Practice Bulletin No.138:妊娠中の遺伝性血栓性素因。
米国産科婦人科学会(ACOG)。ACOG Practice Bulletin No.200:早期の妊娠喪失。
米国産科婦人科学会(ACOG)。ACOG Committee Opinion No.640:胎児異数性の無細胞DNAスクリーニング。
米国産科婦人科学会(ACOG)。ACOG Committee Opinion No.690:ゲノム医学の時代における保因者スクリーニング。
米国産科婦人科学会(ACOG)。ACOG Committee Opinion No.691:遺伝性病態の保因者スクリーニング。
米国生殖医学会議(ASRM)。不育症の評価と治療:委員会の意見。
米国生殖医学会議(ASRM)。不妊症と不育症の定義:委員会の意見。
米国生殖医学会議(ASRM)。不妊男性の診断評価:委員会の意見。
Practice Bulletinに関する米国産科婦人科学会の委員会−産科、遺伝学委員会、母体胎児医学会議。Practice Bulletin No.162:遺伝性障害の出生前診断検査。
Practice Bulletinに関する米国産科婦人科学会の委員会−産科、遺伝学委員会、及び母体胎児医学会議。Practice Bulletin No.163:胎児異数性のスクリーニング。
専門家協会ガイドライン−遺伝性癌
リンチ症候群:
1.Ulmar A, et al. Revised Bethesda Guidelines for Hereditary Nonpolyposis Colorectal cancer (Lynch Syndrome) and Microsatellite Instability. J Natl Cancer Inst. 2004 February 18; 96 (4): 261-268.
2.ベセスダガイドライン
3.アムステルダム基準
米国予防医学専門委員会の推奨事項:
1.BRCA関連癌:リスク評価、遺伝カウンセリング、及び遺伝子検査。2013年(現在更新中)
2.前立腺癌:スクリーニング。2018年5月
3.乳癌スクリーニング。2016年
4.結腸直腸癌スクリーニング。2016年
5.卵巣癌スクリーニング:2018年
6.膵臓癌スクリーニング:2004年
乳癌:
1.NCCN遺伝性/家族性癌の高リスク評価:乳癌と卵巣癌。バージョン3.2019年。
2.NCCN乳癌リスクの軽減。バージョン1.2019年。
3.NCCN乳癌のスクリーニングと診断。バージョン3.2018年。
4.NSGC診療ガイドライン:遺伝性乳癌と卵巣癌のリスク評価と遺伝カウンセリング。(Berliner, J.L., Fay, A.M., Cummings, S.A. et al. J Genet Counsel (2013) 22: 155.)
5.Oeffinger KC, Fontham ETH, Etzioni R, et al. Breast Cancer Screening for Women at Average Risk: 2015 Guideline Update From the American Cancer Society. JAMA. 2015;314(15):1599-1614.
卵巣癌
1.NCCN遺伝性/家族性癌の高リスク評価:乳癌と卵巣癌。バージョン3.2019年。
2.NSGC診療ガイドライン:遺伝性乳癌と卵巣癌のリスク評価と遺伝カウンセリング。(Berliner, J.L., Fay, A.M., Cummings, S.A. et al. J Genet Counsel (2013) 22: 155.)
3.遺伝性婦人科癌素因のリスク評価に関する婦人科腫瘍学会の声明。
結腸癌:
1.NCCN結腸直腸癌のスクリーニング。バージョン1.2018年。
2.NCCN遺伝性/家族性癌の高リスク評価:結腸直腸癌。バージョン1.2018年。
3.Wolf A, Fontham E, Church T, et al. Colorectal cancer screening for average-risk adults: 2018 guideline update from the American Cancer Society. CA: A Cancer Journal for Clinicians/ Volume 68, Issue 4. 30 May 2018。
膵臓癌
1.NCCN膵臓腺癌−バージョン1.2019年。
前立腺癌
1.NCCN前立腺癌−バージョン4.2018年。
2.Wolf A, Wender R, Etzioni R, et al. American Cancer Society Guideline for the Early Detection of Prostate Cancer: Update 2010. CA: A Cancer Journal for Clinicians/ Volume 60, Issue 2.
甲状腺癌
1.NCCN甲状腺癌−バージョン2.2018年。
子宮癌
1.NCCN子宮腫瘍−バージョン2.2019年。
胃癌
1.NCCN胃癌−バージョン2.2018年。
神経内分泌腫瘍と副腎腫瘍
1.NCCN神経内分泌腫瘍と副腎腫瘍−バージョン4.2018年。
黒色腫
1.NCCNブドウ膜黒色腫−バージョン1.2018年。
2.NCCN皮膚黒色腫−バージョン1.2019年。
コンピュータベースの実施形態
幾つかの例では、上述の処理の一部又は全ては、パーソナルコンピューティングデバイスで、1個以上の集中型コンピューティングデバイスで、又は1個以上のサーバーによるクラウドベースの処理を介して実行することができる。幾つかの例では、一部の種類の処理があるデバイスで行われ、他の種類の処理が別のデバイスで行われる。幾つかの例では、上述のデータの一部又は全ては、パーソナルコンピューティングデバイス、1個以上の集中型コンピューティングデバイスにホストされるデータストレージ、又はクラウドベースのストレージを介して保存することができる。幾つかの例では、一部のデータをある場所に保存し、他のデータを別の場所に保存する。幾つかの例では、量子計算を使用することができる。幾つかの例では、関数型プログラミング言語を使用することができる。幾つかの例では、フラッシュベースのメモリ等の電気メモリを使用することができる。
本文献に記載の技術を実行するのに使用できるコンピュータシステムの例には、プロセッサ、メモリ、ストレージデバイス及び入力/出力デバイスが含まれる。構成要素の各々は、例えば、システムバスを使用して相互接続することができる。プロセッサはシステム内で実行用の命令を処理することができる。幾つかの実施形態では、プロセッサはシングルスレッドのプロセッサである。幾つかの実施形態では、プロセッサはマルチスレッドのプロセッサである。プロセッサは、メモリ又はストレージデバイスに保存されている命令を処理することができる。
メモリはシステム内に情報を保存する。幾つかの実施形態では、メモリは非一時的なコンピュータ可読媒体である。幾つかの実施形態では、メモリは揮発性メモリユニットである。幾つかの実施形態では、メモリは不揮発性メモリユニットである。
ストレージデバイスはシステムに大容量ストレージを提供することができる。幾つかの実施形態では、ストレージデバイスは非一時的なコンピュータ可読媒体である。様々な異なる実施形態では、ストレージデバイスは、例えば、ハードディスクデバイス、光ディスクデバイス、ソリッドデートドライブ、フラッシュドライブ、又は他のいくつかの大容量ストレージデバイスを含むことができる。例えば、ストレージデバイスは、長期データ(例えば、データベースのデータ、ファイルシステムデータ等)を保存することができる。入力/出力デバイスはシステムに対して入力/出力動作を行う。幾つかの実施形態では、入力/出力デバイスは、1個以上のネットワークインターフェースデバイス(例えば、イーサネットカード)シリアル通信デバイス(例えば、RS−232ポート)及び/又は無線インターフェースデバイス(例えば、802.11カード、3G無線モデム、又は4G無線モデム)を含むことができる。幾つかの実施形態では、入力/出力デバイスは、入力データを受信し、出力データを他の入力/出力デバイス(例えば、キーボード、プリンタ、及び表示デバイス)に送信するように構成されたドライバデバイスを含むことができる。幾つかの例では、モバイルコンピューティングデバイス、モバイル通信デバイス、及び他のデバイスを使用することができる。
幾つかの実施形態では、上述のアプローチの少なくとも一部は、実行時に1個以上の処理デバイスに上述のプロセスと機能を行わせる命令によって実現することができる。このような命令としては、例えば、スクリプト命令等の解釈された命令、又は実行可能コード、又は非一時的なコンピュータ可読媒体に保存された他の命令を挙げることができる。ストレージデバイスは、サーバーファームや広く分散されたサーバーのセット等のネットワーク上に分散された方法で実行してもよく、単一のコンピューティングデバイスで実行してもよい。
処理システムの例が説明されたが、本明細書に記載の発明の対象、機能操作及びプロセスの実施形態は、他の種類のデジタル電子回路、実体的に具体化されたコンピュータソフトウェア又はファームウェア、コンピュータハードウェア(例えば、本明細書に開示の構造及びその構造的均等物)、又はこれらの1個以上の組み合わせで実行することができる。本明細書に記載の発明の対象の実施形態は、1個以上のコンピュータプログラム、即ち、データ処理装置による実行のため、又はデータ処理装置の動作を制御するために実体的な不揮発性プログラムキャリア上にコード化されたコンピュータプログラム命令の1個以上のモジュールとして実行することができる。或いは又は更には、プログラム命令は、人工的に生成された伝搬信号、例えば、データ処理装置による実行のために適切な受信機装置に送信するための情報をコード化するために機械生成される電気的、光学的又は電磁的信号にコード化することができる。コンピュータストレージ媒体は、機械可読ストレージデバイス、機械可読ストレージ基板、ランダム又はシリアルアクセスメモリデバイス、又はこれらの1個以上の組み合わせとすることができる。
「システム」という用語は、一例として、プログラマブルプロセッサ、コンピュータ、又はマルチプルプロセッサ又はマルチプルコンピュータを含む、データ処理のための全ての種類の装置、デバイス及び機械を包含することができる。処理システムは、特殊用途ロジック回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)を含むことができる。処理システムは、ハードウェアに加えて、当該のコンピュータプログラム用の実行環境を作成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はこれらの1個以上の組み合わせを構成するコードを含むことができる。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、モジュール、ソフトウェアモジュール、スクリプト、又はコードとしても称されるか記載されることがある)は、コンパイラ型言語又はインタプリタ型言語、又は宣言型もしくは手続き型言語等の任意の形式のプログラミング言語で書くことができ、スタンドアロンプログラムとして、又はモジュール、コンポーネント、サブルーチン、又はコンピューティング環境における使用に適した他のユニットとして等、任意の形式で配備することができる。コンピュータプログラムは、ファイルシステム内のファイルに対応してもよいが、必ずしも対応する必要はない。プログラムは、他のプログラム又はデータ(例えば、マークアップ言語のドキュメントに保存されている1個以上のスクリプト)を保持するファイルの一部に、当該のプログラム専用の単一のファイルに、又は複数の協調ファイル(例えば、1個以上のモジュール、サブプログラム、又はコードの一部を保存するファイル)に保存することができる。コンピュータプログラムは、1個のコンピュータ上で、又は1個のサイトに位置するか、複数のサイトに亘って分散され通信ネットワークによって相互通信する複数のコンピュータ上で実行されるように配備することができる。
本明細書に記載のプロセスとロジックフローは、1個以上のコンピュータプログラムを実行する1個以上のプログラマブルコンピュータによって実施し、入力データを処理して出力を生成することによって機能を実行することができる。プロセスとロジックフローは、特殊用途ロジック回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)によって実行することもでき、装置はそのような特殊用途ロジック回路として実行することもできる。
コンピュータプログラムの実行に適したコンピュータは、一例として、汎用又は特殊用途マイクロプロセッサ又はその両方、又は任意の他の種類の中央処理装置を含むことができる。通常、中央処理装置は、リードオンリーメモリ又はランダムアクセスメモリ又はその両方から命令とデータを受信する。コンピュータは通常、命令を実施又は実行するための中央処理装置と、命令とデータを保存するための1個以上のメモリデバイスとを含む。通常、コンピュータは、例えば、磁気ディスク、光磁気ディスク又は光ディスク等のデータを保存するための1個以上のマスストレージデバイスを含むか、又はそのような1個以上のマスストレージデバイスからデータを受信又はそのデバイスにデータを送信又はその両方を行えるように接続される。しかし、コンピュータは、必ずしもそのようなデバイスを有する必要はない。更に、コンピュータは、別のデバイス、例えば、数例挙げるとすれば、モバイル電話、携帯情報端末(PDA)、モバイルオーディオ又はビデオプレーヤー、ゲームコンソール、グローバルポジショニングシステム(GPS)受信機、又はポータブルストレージデバイス(例えば、ユニバーサルシリアルバス(USB)フラッシュドライブ)に組み込むことができる。
コンピュータプログラム命令やデータを保存するのに適したコンピュータ可読媒体としては、例えば、半導体メモリデバイス(例えば、EPROM、EEPROM及びフラッシュメモリデバイス)、磁気ディスク(例えば、内部ハードディスク又はリムーバブルディスク)、光磁気ディスク、CD−ROMディスク、及びDVD−ROMディスク等の、全ての形式の不揮発性メモリ、媒体及びメモリデバイスが挙げられる。プロセッサとメモリは、特殊用途ロジック回路によって補完することができるか、又は特殊用途ロジック回路に組み込むことができる。
ユーザーとの対話を行うために、本明細書に記載の発明の対象の実施形態は、ユーザーに情報を表示するための表示デバイス(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、ユーザーのコンピュータへの入力を可能にするキーボードやポインティングデバイス(例えば、マウス又はトラックボール)とを有するコンピュータで実行することができる。他の種類のデバイスも同様にユーザーとの対話を行うために使用でき、例えば、ユーザーに提供されるフィードバックは任意の形式の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)とすることができ、ユーザーからの入力は、音響、音声又は触覚入力等の任意の形式で受信することができる。更に、コンピュータは、ユーザーが使用するデバイスにドキュメントを送信すると共にユーザーが使用するデバイスからドキュメントを受信することによって、例えば、ウェブブラウザから受信した要求に応じてユーザーのクライアントデバイス上のウェブブラウザにウェブページを送信することによってユーザーとの対話を行うことができる。
本明細書に記載の発明の対象の実施形態は、バックエンドコンポーネント(例えば、データサーバとして)を含む、又はミドルウェアコンポーネント(例えば、アプリケーションサーバ)を含む、又はフロントエンドコンポーネント(例えば、ユーザーがそれを介して本明細書に記載の発明の対象の実施形態と対話できる、グラフィックユーザインターフェース又はウェブブラウザを有するクライアントコンピュータ)を含むか、又はそのようなバックエンド、ミドルウェア、又はフロントエンドコンポーネントの1個以上の任意の組み合わせを含むコンピューティングシステムにおいて実行することができる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信によって相互接続することができ、例えば、通信ネットワークによって相互接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(「LAN」)及びワイドエリアネットワーク(「WAN」)(例えば、インターネット)が挙げられる。
コンピューティングシステムはクライアントとサーバーを含むことができる。クライアントとサーバーは一般には互いに離れており、通常は通信ネットワークを介して対話する。クライアントとサーバーとの関係は、それぞれのコンピュータ上で動作すると共に互いにクライアントとサーバーの関係を有するコンピュータプログラムによって生じる。
用語
本明細書で使用されている表現や用語は、説明を目的としたものであり、限定的なものと見なされるべきではない。
本明細書と特許請求の範囲で使用される「約」という用語、「ほぼ等しい」という語句、及び他の同様の語句(例えば、「Xは、ほぼYの値を有する」又は「Xは、Yにほぼ等しい」)は、ある値(X)が別の値(Y)の所定の範囲内にあることを意味すると理解されるべきである。所定の範囲は、特に明記しない限り、±20%、10%、5%、3%、1%、0.1%又は0.1%未満とすることができる。
本明細書と特許請求の範囲で使用される不定冠詞「a」と「an」は、別段の明示がない限り、「少なくとも1個」を意味すると理解すべきである。本明細書と特許請求の範囲で使用される「及び/又は」という語句は、そのように等位接続された要素、即ち、ある場合には結合的に存在し、別の場合には分離的に存在する要素の「いずれか又は両方」を意味すると理解すべきである。「及び/又は」で列挙された複数の要素は同じように、即ち、そのように等位接続された要素の「1個以上」と解釈すべきである。「及び/又は」節によって具体的に特定される要素以外の他の要素が、具体的に特定される要素に関連するか否かに関わらず、場合によっては存在することがある。従って、非限定的な例として、「A及び/又はB」への言及は、「含む(comprising)」等のオープンエンドの言語と共に使用される場合、一実施形態では、Aのみを指す(場合によってはB以外の要素を含む)、他の実施形態では、Bのみを指す(場合によってはA以外の要素を含む)、更に他の実施形態では、AとBの両方を指す(場合によっては他の要素を含む)等となり得る。
本明細書と特許請求の範囲で使用される「又は」は、上で定義された「及び/又は」と同じ意味を有すると理解すべきである。例えば、リスト内の項目を区切る場合、「又は」或いは「及び/又は」は包含的であると解釈される、即ち、複数の要素又は要素のリスト(場合によっては追加の列挙されていない項目)の内の少なくとも1個を含むが、1個を超えて含む場合もあると解釈されるものとする。これとは反対に明確に示される用語のみの場合、例えば「1個のみ」又は「正確に1個」、又は特許請求の範囲で使用される「〜のみで構成される」の場合、複数の要素又は要素のリストの内の正確に1個の要素を含むことを指す。一般に、使用される「又は」という用語は、「いずれか」、「〜の1個」、「〜の1個のみ」又は「〜の正確に1個」等の排他性の用語が前に付いている場合にのみ、排他的な選択肢(即ち、「どちらか一方であるが両方ではない」)を示すとして解釈されるものとする。「〜で本質的に構成される」は、特許請求の範囲で使用される場合、特許法の分野で使用される通常の意味を有するものとする。
明細書と特許請求の範囲で使用される場合、1個以上の要素のリストに関連する「少なくとも1個」という語句は、要素のリスト内の任意の1個以上の要素から選択される少なくとも1個の要素を意味するが、要素のリスト内に具体的に列挙されているどの要素もの少なくとも1個を必ずしも含むものでなく、要素のリスト内の任意の要素の組み合わせを除外するものではないことを理解すべきである。この定義によると、「少なくとも1個」という語句が参照する要素のリスト内で具体的に特定される要素以外の要素が、具体的に特定される要素に関連するか否かに関わらず、場合によっては存在し得る場合もある。従って、非限定的な例として、「A及びBの少なくとも1個」(又は同等に「A又はBの少なくとも1個」、又は同等に「A及び/又はBの少なくとも1個」)は、一実施形態では、少なくとも1個、場合によっては2個以上のAを含み、Bが存在しない(場合によってはB以外の要素を含む)、他の実施形態では、少なくとも1個、場合によっては2個以上のBを含み、Aが存在しない(場合によってはA以外の要素を含む)、更に他の実施形態では、少なくとも1個、場合によっては2個以上のAを含み、少なくとも1個、場合によっては2個以上のBを含む(場合によっては他の要素を含む)等を意味することがある。
「含む(including)」、「含む(comprising)」、「有する(having)」、「含む(containing)」、「含む(involving)」及びこれらの変形の使用は、その後に列挙される項目と追加の項目を包含することを意味する。
特許請求の範囲で「第1」、「第2」、「第3」等の順序を示す用語を使用してクレーム要素を修飾することは、それ自体は、あるクレーム要素の別のクレーム要素に対する優先、先行又は順序を意味するものではなく、方法の各動作を行う時間的順序を意味するものでもない。順序を示す用語は、特定の名称を有するあるクレーム要素を(順序を示す用語を使用すること以外は)同じ名前を有する別の要素から区別するための標識としてのみ使用してクレーム要素間の区別を行う。
本明細書は、多くの特定の実施形態の詳細を含んでいるが、これらは、請求され得る範囲を限定するものとして解釈すべきではなく、特定の実施形態に特有となり得る特徴の説明として解釈すべきである。別個の実施形態との関連で本明細書に記載のある特徴は、単一の実施形態における組み合わせで実施することもできる。逆に、単一の実施形態との関連で記載した様々な特徴は、複数の実施形態で別々に実施するか、又は任意の適切なサブコンビネーションで実施することもできる。更に、複数の特徴に関して特定の組み合わせで作動するように上述されていて、最初はそのように請求していたとしても、幾つかの場合では、請求した組み合わせから1個以上の特徴を削除することができ、請求した組み合わせは、サブコンビネーション又はサブコンビネーションの変形を対象とすることができる。
同様に、操作を特定の順序で図面に示しているが、このことを、望ましい結果を得るためにはそのような動作を図示した特定の順序又は順番に行う必要があるとか、図示した操作を全て行う必要があるとは理解すべきではない。ある状況下では、マルチタスク処理やパラレル処理が有利となる場合もある。更に、上述の実施形態における様々なシステムコンポーネントの分離は全ての実施形態においてそのような分離が必要であると理解すべきではなく、記載したプログラムコンポーネント及びシステムは通常、単一のソフトウェア製品内に一緒に統合することができるか、又は複数のソフトウェア製品にパッケージすることができると理解すべきである。
発明の対象の特定の実施形態を説明してきた。他の実施形態も以下の特許請求の範囲の範囲内にある。例えば、特許請求の範囲に記載の動作は異なる順序で行うことができ、それでも望ましい結果が得られる。一例として、添付図面に示したプロセスは、望ましい結果を得るために、図示した特定の順序又は順番で行うことを必ずしも必要としていない。ある実施形態では、マルチタスク処理やパラレル処理が有利となる場合もある。記載のプロセスに対して他の工程又は段階を提供してもよく、工程又は段階を削除してもよい。従って、他の実施形態は以下の特許請求の範囲内にある。

Claims (20)

  1. 遺伝子検査の識別性を改善するためにコンピュータによって実行される方法であって、
    健康関連変数の複数の異なる組み合わせを考慮した推奨遺伝子検査を含む第1の入力を受け取ることと、
    利用可能な遺伝子検査に関する情報を含む第2の入力を受け取ることと、
    前記第1の入力と前記第2の入力に基づいて、前記健康関連変数の異なる組み合わせと前記利用可能な遺伝子検査との間の複数のマッピングを含むルールのセットを生成することと、
    前記ルールのセットを訓練データとして使用して分類器を訓練することと、
    前記健康関連変数の複数の異なる組み合わせには含まれない組み合わせである、健康関連変数の第1の組み合わせを含む第3の入力を受け取ることと、
    前記健康関連変数の第1の組み合わせを前記分類器への入力として提供することと、
    前記分類器への入力に基づき、前記分類器からの出力として、前記利用可能な遺伝子検査から1種以上の推奨される遺伝子検査を受け取ることと
    を含む方法。
  2. 健康関連変数の特定の組み合わせは、年齢、民族性、性別、個人の病歴及び家族の病歴を含む、請求項1に記載の方法。
  3. 前記第1の入力は複数の遺伝カウンセラーから受け取る、請求項1に記載の方法。
  4. 前記第1の入力を構造化して、各々が特定の遺伝子検査の推奨につながる複数の一般的なパスを含む構造化第1入力を構築することを更に含み、前記ルールのセットを生成することは、前記構造化第1入力をルール生成ツールへの入力として提供することと、出力として前記ルールのセットを受け取ることを含む、請求項1に記載の方法。
  5. 前記第2の入力を構造化して、遺伝子/遺伝子パネルと異なる遺伝性病態との間の複数の相関関係を含む構造化第2入力を構築することを更に含み、前記ルールのセットを生成することは、前記構造化第2入力をルール生成ツールへの入力として提供することと、出力として前記ルールのセットを受け取ることを含む、請求項1に記載の方法。
  6. 1種以上の医療ガイドラインのセットを含む第4の入力を受け取ることと、
    前記1種以上の医療ガイドラインのセットに適用される健康関連変数の異なる組み合わせに基づいて複数のシナリオを特定することを更に含み、
    前記ルールのセットを生成することは、前記複数のシナリオの各シナリオについてルールのサブセットを生成することを含む、請求項1に記載の方法。
  7. 前記遺伝子検査は、遺伝性癌を特定するための遺伝子検査及び/又は生殖遺伝学に関連する検査を含む、請求項1に記載の方法。
  8. 前記ルールのセットを使用して前記分類器を訓練することは、決定木分類器への入力として前記ルールのセットを提供することと、ランダムフォレストアルゴリズムを利用することを含む、請求項1に記載の方法。
  9. 複数の質問をユーザーに提示して、ユーザーから前記健康関連変数の第1の組み合わせを収集するように構成されたユーザーインターフェースを提供することを更に含む、請求項1に記載の方法。
  10. 前記ユーザーインターフェースは、前記1種以上の推奨される遺伝子検査を前記ユーザーに提示するように更に構成されている、請求項9に記載の方法。
  11. 遺伝子検査の識別性を改善するためのシステムであって、
    プロセッサと、
    前記プロセッサによって実行されると、複数の動作を実施するように前記プロセッサをプログラムするコンピュータ実行可能命令を保存するメモリとを含むシステムにおいて、前記動作は、
    健康関連変数の複数の異なる組み合わせを考慮した推奨遺伝子検査を含む第1の入力を受け取ることと、
    利用可能な遺伝子検査に関する情報を含む第2の入力を受け取ることと、
    前記第1の入力と前記第2の入力に基づいて、前記健康関連変数の異なる組み合わせと前記利用可能な遺伝子検査との間の複数のマッピングを含むルールのセットを生成することと、
    前記ルールのセットを訓練データとして使用して分類器を訓練することと、
    健康関連変数の第1の組み合わせであって、前記健康関連変数の複数の異なる組み合わせには含まれない第1の組み合わせを含む第3の入力を受け取ることと、
    前記健康関連変数の第1の組み合わせを前記分類器への入力として提供することと、
    前記分類器への入力に基づき、前記分類器からの出力として、前記利用可能な遺伝子検査から1種以上の推奨される遺伝子検査を受け取ることを含むシステム。
  12. 健康関連変数の特定の組み合わせは、年齢、民族性、性別、個人の病歴及び家族の病歴を含む、請求項11に記載のシステム。
  13. 前記第1の入力は複数の遺伝カウンセラーから受け取る、請求項11に記載のシステム。
  14. 前記動作は、前記第1の入力を構造化して、各々が特定の遺伝子検査の推奨につながる複数の一般的なパスを含む構造化第1入力を構築することを更に含み、前記ルールのセットを生成することは、前記構造化第1入力をルール生成ツールへの入力として提供することと、出力として前記ルールのセットを受け取ることを含む、請求項11に記載のシステム。
  15. 前記動作は、前記第2の入力を構造化して、遺伝子/遺伝子パネルと異なる遺伝性病態との間の複数の相関関係を含む構造化第2入力を構築することを更に含み、前記ルールのセットを生成することは、前記構造化第2入力をルール生成ツールへの入力として提供することと、出力として前記ルールのセットを受け取ることを含む、請求項11に記載のシステム。
  16. 前記動作は、
    1種以上の医療ガイドラインのセットを含む第4の入力を受け取ることと、
    前記1種以上の医療ガイドラインのセットに適用される健康関連変数の異なる組み合わせに基づいて複数のシナリオを特定することを更に含み、
    前記ルールのセットを生成することは、前記複数のシナリオの各シナリオについてルールのサブセットを生成することを含む、請求項11に記載のシステム。
  17. 前記遺伝子検査は、遺伝性癌を特定するための遺伝子検査及び/又は生殖遺伝学に関連する検査を含む、請求項11に記載のシステム。
  18. 前記ルールのセットを使用して前記分類器を訓練することは、決定木分類器への入力として前記ルールのセットを提供することと、ランダムフォレストアルゴリズムを利用することを含む、請求項11に記載のシステム。
  19. 前記動作は、複数の質問をユーザーに提示して、ユーザーから前記健康関連変数の第1の組み合わせを収集するように構成されたユーザーインターフェースを提供することを更に含む、請求項11に記載のシステム。
  20. 前記ユーザーインターフェースは、前記1種以上の推奨される遺伝子検査を前記ユーザーに提示するように更に構成されている、請求項19に記載のシステム。
JP2021500783A 2018-03-19 2019-03-19 遺伝子検査とゲノム検査を識別するための人工知能と機械学習プラットフォーム Pending JP2021519479A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862644833P 2018-03-19 2018-03-19
US62/644,833 2018-03-19
PCT/US2019/023008 WO2019183122A1 (en) 2018-03-19 2019-03-19 Artificial intelligence and machine learning platform for identifying genetic and genomic tests

Publications (1)

Publication Number Publication Date
JP2021519479A true JP2021519479A (ja) 2021-08-10

Family

ID=66001351

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021500783A Pending JP2021519479A (ja) 2018-03-19 2019-03-19 遺伝子検査とゲノム検査を識別するための人工知能と機械学習プラットフォーム

Country Status (3)

Country Link
US (1) US20190287681A1 (ja)
JP (1) JP2021519479A (ja)
WO (1) WO2019183122A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7177300B2 (ja) * 2019-10-21 2022-11-22 フラティロン ヘルス,インコーポレイテッド ゲノムテストステータスを特定するシステム及び方法
US20210201417A1 (en) * 2019-12-28 2021-07-01 Kpn Innovations, Llc Methods and systems for making a coverage determination
US11599800B2 (en) * 2020-01-28 2023-03-07 Color Genomics, Inc. Systems and methods for enhanced user specific predictions using machine learning techniques
WO2024018356A1 (en) * 2022-07-17 2024-01-25 Betterfit Ltd. Apparatus and method for in-vitro fertilization treatments

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006511880A (ja) * 2002-12-18 2006-04-06 ジーイー・メディカル・システムズ・グローバル・テクノロジー・カンパニー・エルエルシー 生体外検査データを組み込む医療データ分析方法及び装置
JP2015505079A (ja) * 2011-12-05 2015-02-16 コーニンクレッカ フィリップス エヌ ヴェ 臨床判断支援のための患者シーケンシングデータからの臨床的に関連する情報の遡及的抽出

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0879449A2 (en) * 1996-02-09 1998-11-25 Adeza Biomedical Corporation Method for selecting medical and biochemical diagnostic tests using neural network-related applications
US8483966B1 (en) * 1999-08-02 2013-07-09 National Biomedical Research Foundation Method for increasing utilization of genetic testing
US7529685B2 (en) * 2001-08-28 2009-05-05 Md Datacor, Inc. System, method, and apparatus for storing, retrieving, and integrating clinical, diagnostic, genomic, and therapeutic data
JP5038671B2 (ja) * 2006-09-25 2012-10-03 株式会社東芝 検査項目選定装置、検査項目選定方法、及び検査項目選定プログラム
US20110093295A1 (en) * 2009-09-19 2011-04-21 Mankad Vipul N Consumer enabling system for personalized health maintenance
US10446272B2 (en) * 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
US20110301859A1 (en) * 2010-06-04 2011-12-08 N-Of-One Therapeutics, Inc. Personalized molecular medicine
US20140316821A1 (en) * 2011-09-15 2014-10-23 Genesfx Health Pty Ltd Improvements relating to decision support
CN104054084B (zh) * 2011-10-17 2017-07-28 英特托拉斯技术公司 用于保护和管理基因组及其它信息的系统和方法
EP3249561A1 (de) * 2016-05-25 2017-11-29 Siemens Healthcare GmbH Verfahren und system zur dokumentation eines diagnostischen tests
US20180121545A1 (en) * 2016-09-17 2018-05-03 Cogilex R&D inc. Methods and system for improving the relevance, usefulness, and efficiency of search engine technology
WO2018204763A2 (en) * 2017-05-05 2018-11-08 Orig3N, Inc. Systems and methods for generating genetic profile test and related purchase recommendations via an artificial intelligence-enhanced chatbot

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006511880A (ja) * 2002-12-18 2006-04-06 ジーイー・メディカル・システムズ・グローバル・テクノロジー・カンパニー・エルエルシー 生体外検査データを組み込む医療データ分析方法及び装置
JP2015505079A (ja) * 2011-12-05 2015-02-16 コーニンクレッカ フィリップス エヌ ヴェ 臨床判断支援のための患者シーケンシングデータからの臨床的に関連する情報の遡及的抽出

Also Published As

Publication number Publication date
US20190287681A1 (en) 2019-09-19
WO2019183122A1 (en) 2019-09-26

Similar Documents

Publication Publication Date Title
Gutierrez-Galve et al. Association of maternal and paternal depression in the postnatal period with offspring depression at age 18 years
Han et al. Varieties of uncertainty in health care: a conceptual taxonomy
Newton et al. Validation of electronic medical record-based phenotyping algorithms: results and lessons learned from the eMERGE network
Glenn Using online health communication to manage chronic sorrow: mothers of children with rare diseases speak
Eijzenga et al. Specific psychosocial issues of individuals undergoing genetic counseling for cancer–a literature review
JP2021519479A (ja) 遺伝子検査とゲノム検査を識別するための人工知能と機械学習プラットフォーム
US20060173663A1 (en) Methods, system, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality
Sousa et al. The potential of AI in health higher education to increase the students’ learning outcomes
Ferdousi et al. Digital twins for well-being: an overview
Hamilton et al. Sources of uncertainty and their association with medical decision making: exploring mechanisms in Fanconi anemia
Northstone et al. The avon longitudinal study of parents and children-a resource for COVID-19 research: questionnaire data capture may-july 2020
Rouabhi et al. Development of a bedside tool to predict the diagnosis of cerebral palsy in term-born neonates
Sullivan et al. Mortality risk in homebound older adults predicted from routinely collected nursing data
Markens “It just becomes much more complicated”: Genetic counselors' views on genetics and prenatal testing
Lee et al. Machine learning and precision medicine in emergency medicine: the basics
Deardorff et al. Development and External Validation of Models to Predict Need for Nursing Home Level of Care in Community-Dwelling Older Adults With Dementia
Oh et al. Predicting fetal alcohol spectrum disorders using machine learning techniques: multisite retrospective cohort study
Hindorff et al. Motivating factors for physician ordering of factor V Leiden genetic tests
Perivolaris et al. Quality of interaction between clinicians and artificial intelligence systems. A systematic review
Barankanira et al. Spatial distribution and predictive factors of antenatal care in Burundi: A spatial and multilevel baseline analysis for the third burundian demographic and health survey
Pinel et al. Slowing down decay: biological clocks in personalized medicine
Salama et al. Artificial Intelligence and Machine Learning in Cancer Pain: A Systematic Review
Durand et al. A review of decision support technologies for amniocentesis
Kwok et al. Artificial intelligence in perinatal mental health research: A scoping review
Semagn et al. Application of protection motivation theory to identify factors associated with breast self-examination behavior among female students at the University of Gondar: Structural equation modeling approach

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20210311

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231024