JP2019512783A - 抗生物質耐性識別 - Google Patents

抗生物質耐性識別 Download PDF

Info

Publication number
JP2019512783A
JP2019512783A JP2018546601A JP2018546601A JP2019512783A JP 2019512783 A JP2019512783 A JP 2019512783A JP 2018546601 A JP2018546601 A JP 2018546601A JP 2018546601 A JP2018546601 A JP 2018546601A JP 2019512783 A JP2019512783 A JP 2019512783A
Authority
JP
Japan
Prior art keywords
gene
resistance
antibiotic resistance
genes
genomic sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018546601A
Other languages
English (en)
Other versions
JP2019512783A5 (ja
JP6918817B2 (ja
Inventor
カーティケヤン ムルゲサン
カーティケヤン ムルゲサン
ネヴェンカ ディミトローヴァ
ネヴェンカ ディミトローヴァ
ヘンリー リン
ヘンリー リン
プラモッド ベヴー マイゴウダ
プラモッド ベヴー マイゴウダ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2019512783A publication Critical patent/JP2019512783A/ja
Publication of JP2019512783A5 publication Critical patent/JP2019512783A5/ja
Application granted granted Critical
Publication of JP6918817B2 publication Critical patent/JP6918817B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Data Mining & Analysis (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

病原体における抗生物質耐性の原因の遺伝子機構を識別する方法及びシステムが開示される。少なくとも1つの実施例によると、前記システムは、抗生物質耐性病原体に存在する遺伝子を識別する遺伝子耐性モジュールと、抗生物質耐性病原体に存在する突然変異を識別する単一ヌクレオチド多型モジュールと、前記識別された遺伝子及び突然変異に基づいて抗生物質耐性の原因を出力するように構成された抗生物質耐性モジュールとを含む。

Description

ここに記載される様々な実施例は、病原体における抗生物質耐性の原因遺伝機構を識別する方法及びシステムに関し、排他的にではないが、より具体的には、抗生物質耐性の原因遺伝機構を識別する方法及びシステムに関する。
微生物の抗生物質耐性は、微生物により引き起こされる感染を治療するように開発された抗菌薬の効果に抵抗する微生物の能力を指す。微生物における抗生物質耐性の発達は、不可避的な生物学的プロセスである。しかしながら、抗生物質は、控えめに、正確に、及び過剰にならないように使用されなければならない。これらの原理に従わない抗生物質使用は、病原体における耐性の取得を加速しうる。
特にESKAPE病原体、すなわちエンテロコッカス・フェシウム・黄色ブドウ球菌、クレブシエラ・ニューモニエ、アシネトバクター・バウマニ、緑膿菌、及びエンテロバクター種は、米国内の院内感染の主要な原因であると知られている。1つの主要な関心は、ESKAPE病原体の成長する抗生物質耐性である。
グローバルに現れ、広がる薬物耐性機構は、既存の治療方法の有効性を低減する又は効果を完全に無効にすることにより一般的な細菌感染を治療する医療関係者の能力に挑戦する。これは、不可避的に、増加するヘルスケア費用、ヘルスケア機関における増加された長さの滞在を生じ、実際に、より高い死亡率を生じる。
例えば、米国だけで、例えば、毎年200万を超える病気及び少なくとも23,000の死亡が、病原体において発達した抗生物質耐性に起因する。これらの数値は、世界的に増加し、抗生物質耐性は、世界中で毎年70万を超える死亡を引き起こしている。現在の傾向が続く場合、抗生物質耐性に起因する死亡者数は、2050年までに1000万人に達し、100兆ドルを超える予測GDP損失を生じる可能性がある。
抗生物質耐性は、既存の細菌感染を診断することを難しくするだけでなく、ヘルスケアの他の領域でも後の効果を持つ。例えば、抗生物質耐性は、手術、臓器移植、帝王切開、癌治療、並びに他の医療状態及び治療に影響を与える。
抗生物質耐性に対抗する既存の技術は、一般的に、耐性の根本原因を識別すること及び/又は発生を止めることよりむしろ、抗生物質耐性有機体の拡散を防ぐことを含み、ポリシー及び管理レベルにおいて抗生物質消費を制御するストラテジを含む。
他のストラテジは、様々な抗生物質に対する分離株の最小発育阻止濃度を計算することにより病原体の抗生物質耐性を数量化し、病院における様々な衛生的アプローチにより耐性の拡散を妨げることである。再び、しかしながら、これらの技術は、一般的に、抗生物質耐性病原体の播種を含むことに関係している。
この要約は、詳細な説明のセクションにおいて以下に更に記載される単純化された形式で概念の選択を導入するように提供される。この要約は、請求される主題の重要なフィーチャ又は必須のフィーチャを識別することを意図されず、請求される主題の範囲を決定する助けとして使用されることを意図されない。
先行する記載によると、抗生物質耐性に対抗するのを助けるために耐性取得及び分子進化の原因を特徴づける方法及びシステムを提供することが望ましい。
一態様において、様々な実施例が、病原体における抗生物質耐性を識別するシステムに関する。前記システムは、各々が複数の遺伝子を有する複数のゲノム配列を入力として受信し、前記複数のゲノム配列の各々に存在する遺伝子を識別する遺伝子存在‐不在マトリクスを生成し、前記複数のゲノム配列の各々に対する耐性又は感受性のラベルを出力する遺伝子‐耐性モジュールと、前記複数のゲノム配列を入力として受信し、前記複数のゲノム配列の各々において遺伝子突然変異を識別し、各識別された突然変異に対する耐性又は感受性のラベルを出力する単一ヌクレオチド多型‐耐性モジュールと、前記複数のゲノム配列の各々及び各識別された突然変異に対する耐性又は感受性のラベルに関連付けられた前記遺伝子及び突然変異を入力として受信し、前記受信されたラベルに基づいて抗生物質耐性を与える遺伝子及び抗生物質耐性を与える遺伝子のソースの少なくとも一方を識別する抗生物質耐性モジュールとを含む。
一実施例において、前記遺伝子‐耐性モジュールは、前記複数のゲノム配列のサンプル内に存在する遺伝子のセットを識別するように構成された遺伝子予測エンジンと、前記複数のゲノム配列の各々から前記識別された遺伝子のセットを取り除くように構成された遺伝子除去エンジンとを更に含み、前記遺伝子予測エンジン及び前記遺伝子除去エンジンは、前記遺伝子存在‐不在マトリクスを生成するように、残りのゲノム配列の各々に存在する遺伝子のセットを識別するステップと、前記残りのゲノム配列から前記識別された遺伝子のセットを取り除くステップとを反復するように更に構成される。
一実施例において、前記遺伝子‐耐性モジュールは、抗生物質耐性又は抗生物質感受性に対する遺伝子の寄与を表す値を生成するように更に構成される。
一実施例において、前記抗生物質耐性モジュールは、少なくとも2つの耐性遺伝子がネットワークとして動作するかどうかを決定するように更に構成される。
一実施例において、遺伝子の存在が、バイナリ値又はパーセントで規定されてもよい。
一実施例において、前記抗生物質耐性モジュールは、オペロンネットワークとして動作する少なくとも2つの遺伝子が突然変異を含むかどうかを決定するように更に構成される。
一実施例において、前記抗生物質耐性モジュールは、抗生物質耐性に関連付けられる少なくとも1つの遺伝子又は突然変異を識別するレポートを出力するように更に構成される。
一実施例において、前記遺伝子のソースが、前記ゲノム配列を宿主又は外来に分類するのに配列組成及び系統発生の少なくとも一方を使用して識別される。
他の態様において、様々な実施例が、病原体における抗生物質耐性を識別する方法に関する。前記方法は、遺伝子‐耐性モジュール及び単一ヌクレオチド多型‐耐性モジュールにおいて、各々が複数の遺伝子を有する複数のゲノム配列を受信するステップと、前記遺伝子‐耐性モジュールによって、前記複数のゲノム配列の各々に存在する遺伝子を識別する遺伝子存在‐不在マトリクスを生成するステップと、前記遺伝子‐耐性モジュールによって、前記複数のゲノム配列の各々に対する耐性又は感受性のラベルを出力するステップと、前記単一ヌクレオチド多型‐耐性モジュールによって、前記複数のゲノム配列の各々における遺伝子突然変異を識別するステップと、前記単一ヌクレオチド多型‐耐性モジュールによって、各識別された突然変異に対する耐性又は感受性のラベルを出力するステップと、抗生物質耐性モジュールにおいて、前記複数のゲノム配列の各々及び各検出された突然変異に対する耐性又は感受性のラベルに関連付けられた遺伝子及び突然変異を受信するステップと、前記抗生物質耐性モジュールによって、前記受信されたラベルに基づいて、抗生物質耐性を与える遺伝子及び抗生物質耐性を与える遺伝子のソースを識別するステップとを含む。
一実施例において、前記方法は、前記遺伝子‐耐性モジュールによって、前記複数のゲノム配列のサンプル内に存在する遺伝子のセットを識別するステップと、前記遺伝子‐耐性モジュールによって、前記複数のゲノム配列の各々から前記識別された遺伝子のセットを取り除くステップと、前記遺伝子存在‐不在マトリクスを生成するように、前記複数のゲノム配列の残りのサンプルの各々に存在する遺伝子のセットを識別するステップ及び前記残りのゲノム配列から前記識別された遺伝子のセットを取り除くステップを反復するステップとを更に含む。
一実施例において、前記方法は、前記遺伝子‐耐性モジュールによって、抗生物質耐性又は抗生物質感受性に対する遺伝子の寄与を表す値を生成するステップを更に含む。
一実施例において、前記方法は、前記抗生物質耐性モジュールによって、少なくとも2つの耐性遺伝子がネットワークとして動作するかどうかを決定するステップを更に含む。
一実施例において、遺伝子の存在は、バイナリ値又はパーセントで規定されてもよい。
一実施例において、前記方法は、前記抗生物質耐性モジュールによって、ネットワークとして動作する少なくとも2つの遺伝子が突然変異を含むかどうかを決定するステップを更に含む。
一実施例において、前記方法は、前記抗生物質耐性モジュールによって、抗生物質耐性に関連付けられた少なくとも1つの遺伝子又は突然変異を識別するレポートを出力するステップを更に含む。
一実施例において、前記遺伝子のソースは、前記ゲノム配列を宿主又は外来として分類するのに配列組成及び系統発生の少なくとも一方を使用して識別される。
更に他の態様において、様々な実施例が、抗生物質耐性を与える1以上の遺伝子を識別する方法に関する。前記方法は、各々が複数の遺伝子を有する複数のゲノム配列を受信するステップと、前記複数のゲノム配列のいずれが抗生物質耐性を与えるかを決定するステップと、前記複数のゲノム配列内のいずれの突然変異が抗生物質耐性を与えるかを決定するステップと、いずれのサンプル及び突然変異が抗生物質耐性を与えるかに基づいて抗生物質耐性に関連付けられた前記複数のゲノム配列内の少なくとも1つの遺伝子を識別するステップとを含む。
様々な実施例をよりよく理解するために、添付の図面が参照される。
一実施例による病原体における抗生物質耐性を識別するシステムを示す。 一実施例による図1の遺伝子耐性モジュール102を示す。 一実施例による遺伝子予測及び除去アルゴリズムを示す。 他の実施例による遺伝子予測及び除去アルゴリズムを示す。 一実施例による遺伝子予測及び除去アルゴリズムの複数の反復を示す。 一実施例による遺伝子存在‐不在マトリクスを描く。 他の実施例による遺伝子存在‐不在マトリクスを描く。 他の実施例による遺伝子存在‐不在マトリクスを描く。 一実施例による図1の単一ヌクレオチド多型(SAR)モジュール104を示す。 一実施例によるバリアントマトリクスを描く。 一実施例による耐性‐感受性ラベルを持つバリアントマトリクスを描く。 一実施例による典型的なSNP−遺伝子マッピングマトリクスを描く。 一実施例による図1の抗生物質耐性モジュール106を示す。 一実施例による遺伝子及び突然変異の結合されたフィーチャマトリクスを描く。 一実施例による病原体における抗生物質耐性を識別する方法のフローチャートを描く。 一実施例によるここに記載されたシステム及び方法を実施するハードウェア装置の一例を示す。
様々な実施例は、一部を形成し、特定の典型的な実施例を示す、添付の図面を参照して、以下に、より完全に記載される。しかしながら、本開示の概念は、多くの異なる形式で実施されてもよく、ここに記載された実施例に限定されると解釈されるべきではなく、むしろ、これらの実施例は、本開示の概念、技術及び実施の範囲を当業者に完全に伝えるために、徹底的かつ完全な開示の一部として提供される。実施例は、方法、システム又は装置として実施されてもよい。したがって、実施例は、ハードウェア実装、完全ソフトウェア実装又はソフトウェア及びハードウェア態様を組み合わせる実施の形を取りうる。以下の詳細な記載は、したがって、限定的な意味で取られるべきではない。
「一実施例」又は「実施例」に対する明細書内の参照は、実施例に関連して記載された特定のフィーチャ、構造又は特性が、本開示による少なくとも1つの例の実施又は技術に含まれることを意味する。明細書内の様々な場所における表現「一実施例において」の出現は、必ずしも同じ実施例を全て参照するわけではない。
後に続く記載のいくつかの部分は、コンピュータメモリ内に記憶された非過渡信号における動作のシンボル表現に関して提示される。これらの記載及び表現は、働きの内容を他の当業者に最も効果的に伝えるようにデータ処理分野の当業者により使用される。このような動作は、典型的には、物理量の物理的操作を必要とする。通常、必ずではないが、これらの量は、記憶、転送、結合、比較及び他の操作をされることができる電気、磁気又は光学信号の形を取る。原理的に一般的な使用の理由で、これらの信号をビット、値、要素、シンボル、文字、項、又は数等と称することは、時々、便利である。更に、物理量の物理的操作を必要とするステップの特定の構成をモジュール又はコード装置と称することも、一般性を失うことなく、時々便利である。
しかしながら、これら及び同様の用語の全てが、適切な物理量と関連付けられるべきであり、単にこれらの量に加えられた便利なラベルである。他の形で特に述べられない限り、以下の議論から明らかなように、記載を通して、「処理」又は「計算」又は「算出」又は「決定」又は「表示」等のような用語を使用する議論は、コンピュータシステムメモリ若しくはレジスタ、又は他のこのような情報記憶、伝送又は表示装置内で物理(電子)量として表されるデータを操作及び変換する、コンピュータシステム又は同様の電子計算装置の動作及び処理を指す。本開示の部分は、ソフトウェア、ファームウェア又はハードウェアにおいて実施されうる処理及び命令を含み、ソフトウェアで実施される場合、様々なオペレーティングシステムにより使用される異なるプラットフォームに存在するようにダウンロードされ、該プラットフォームから動作されてもよい。
本開示は、ここで前記動作を実行する装置にも関する。この装置は、要求される目的に対して特別に構成されてもよく、又はコンピュータに記憶されたコンピュータプログラムにより選択的に作動又は再設定される汎用コンピュータを有してもよい。このようなコンピュータプログラムは、限定的にではないが、フロッピー(登録商標)ディスク、光学ディスク、CD−ROM、光磁気ディスクを含む任意のタイプのディスク、読取専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、FEPROM、磁気又は光学カード、特定用途向け集積回路(ASIC)、又は電子命令を記憶するのに適した任意のタイプの媒体のようなコンピュータ可読記憶媒体に記憶されてもよく、各々は、コンピュータシステムバスに結合されてもよい。更に、明細書において参照されるコンピュータは、単一のプロセッサを含んでもよく、又は増加された計算性能に対するマルチプロセッサ設計を採用するアーキテクチャであってもよい。
ここで提示されるプロセス及び表示は、本質的にはいかなる特定のコンピュータ又は他の装置にも関連しない。様々な汎用システムが、ここの教示によってプログラムとともに使用されてもよく、又は1以上の方法ステップを実行するのにより特別化された装置を構築することが、便利であると判明してもよい。様々なこれらのシステムの構成は、以下の説明において論じられる。加えて、本開示の技術及び実施を達成するのに十分である任意の特定のプログラミング言語が、使用されうる。様々なプログラミング言語が、ここで論じられるように本開示を実施するのに使用されうる。
加えて、明細書において使用される言語は、主に読みやすさ及び教育目的で選択されており、開示される主題を説明する又は限定するように選択されていないかもしれない。したがって、本開示は、ここで論じられる概念の範囲を限定せず、理解を助けることを意図される。
ここに記載される方法及びシステムは、抗生物質耐性と関連付けられた突然変異、遺伝子及び耐性カセットを識別するように病原体の次世代シーケンシング(NGS)を含みうる。図1は、一実施例による病原体における抗生物質耐性を識別するシステム100を示す。前記システムは、遺伝子‐耐性モジュール102、単一ヌクレオチド多型‐耐性(SAR)モジュール104、及び抗生物質耐性モジュール106を含んでもよい。
遺伝子‐耐性モジュール102は、抗生物質に対する耐性を与える原因となる病原体内の遺伝子を識別しうる。SARモジュール104は、抗生物質に対する耐性を与える原因となる病原体内の非同義突然変異を識別しうる。遺伝子耐性モジュール102及びSARモジュール104の出力は、抗生物質耐性モジュール106に提供されうる。抗生物質耐性モジュール106は、前記SAR及びGARモジュールから識別された潜在的なバイオマーカに関する情報を統合し、抗生物質耐性及び感受性及び特異度値と関連付けられたSNP及び遺伝子のリストを出力しうる。抗生物質耐性モジュール106は、医療関係者等に対するレポートにおいてこれらの結果を出力してもよい。
図2は、より詳細に遺伝子‐耐性モジュール102の一実施例を示す。図示されるように、遺伝子‐耐性モジュール102は、ゲノムアセンブリパイプライン202、遺伝子除去エンジン204、遺伝子予測エンジン206、遺伝子存在/不在マトリクスモジュール208、及び遺伝子‐耐性関連付けエンジン210を含みうる。
動作時に、病原体分離株は、任意の適切なシーケンシング技術又はマシン(HiSeq、MiSeq等)を使用してヘルスケア施設内の患者から抽出されうる。抽出された分離株は、次いで、化学的に定義された、複合(complex)、還元性(reducing)、差(differential)、及び濃縮ベース(enrichment-based)の培養基(growth media)のような任意の適切な培養基を使用して培養されうる。使用される前記培養基は、異なってもよく、用途に依存しうる。
次に、DNAは、標準的な検査法を使用して前記培養された分離株から抽出されうる。抽出されたDNAは、次いで、任意の適切なシーケンシング手法又は技術を使用してシーケンシングに対して備えられうる。このプロセスは、前記病原体のゲノムの全体ゲノムシーケンシング又は標的シーケンシングのいずれかであることができる。
分離されたゲノム配列214の生の配列212は、次いで、デノボ(deNovo)アセンブルされるようにゲノムアセンブリパイプラインモジュール202内にフィードされうる。ゲノムアセンブリパイプラインモジュール202は、SPADES、MASURCA、又は現在利用可能である又は後に発明される他の適切なゲノムアセンブラのようなアセンブラを使用しうる。
アセンブルされた遺伝子配列は、次いで、遺伝子除去エンジン204にフィードされうる。遺伝子除去エンジン204及び遺伝子予測エンジン206は、ゲノムシーケンシングされた各病原体分離株から基準遺伝子を持っていない残余(residual)ゲノムを抽出するように協力して機能しうる。
基準ゲノムを含む複数のゲノム配列を検討する。遺伝子除去エンジン204及び遺伝子予測エンジン206の目的は、(既知の基準ゲノムを含む)ゲノムのコホートから遺伝子の存在及び/又は不在を識別し、残りの配列から前記コホート配列の各々に存在する遺伝子を除去することである。
デノボ遺伝子除去アルゴリズムは、図3に示される。図3において、S1は、基準ゲノム配列と見なされてもよく、g(S1)304は、S1において予測される遺伝子を指し得る。予測される遺伝子g(S1)のいくつかは、他のゲノム配列に存在してもよい。遺伝子除去エンジン204は、次いで、各ゲノム配列からg(S1)を除去し、S1R(任意の予測された遺伝子を持たない配列S1の残存(remnant)残余ゲノム)、S21(S2からS1のデノボ遺伝子の全てを取り除いた後のS2の残余ゲノム)等を生じる。
これは、次のサンプルS21に進む反復プロセスである。2回目の反復は、図4に示される。図4は、他の残余ゲノムS21、S31、Si1...Sn1(402)に沿った残存残余ゲノムS1Rを示す。g(S21)404は、S21において予測された遺伝子を指しうる。S21において予測された遺伝子の一部は、他のゲノム配列に存在しうる。遺伝子除去エンジン204は、次いで、各残りのゲノム配列S21、S31...Si1、...Sn1からg(S21)を取り除きうる。これは、S1R、S2R(いかなる遺伝子も持たない配列S2の残存残余ゲノム)、S32...Si2,...Sn2等を生じる。これは、各配列内に存在する遺伝子に関するデータを集める計算的に速く安価な方法を提供する。
この反復プロセスは、全ての入力サンプルの残余ゲノムが生成されるまで、各ゲノム配列に対して実行されうる。図5は、例えば、図3及び4に示されるアルゴリズムの複数の反復500a−eを示す。加えて、このプロシージャに対する疑似コードが、以下のように表現される。
i=1
while (i<n) //(S1,S2…Si……Sn) -> (S1R,S2R,…SiR….SnR)
{
g(Si(i-1)) = gene_prediction(Si(i-1))

gene_elimination(g(Si(i-1))
{
SiR<-Si(i-1)-g(Si(i-1))
for(k=i+1;k<=n;k++)
{
Ski<-Sk(i-1)-g(Si(i-1))
}
i++
Update gene_PA_mat [ ]
}
遺伝子除去エンジン204及び遺伝子予測エンジン206が、これらの反復を繰り返すと、いずれの遺伝子が各配列内に存在したかに関するデータは、遺伝子存在‐不在マトリクス208に通信されうる。遺伝子存在‐不在マトリクス208は、この情報を任意の適切な無線又は有線接続によって受信し、各サンプル内に存在する遺伝子を表すマトリクスを生成しうる。
図6は、例えば、一実施例による遺伝子存在‐不在マトリクス600を示す。マトリクス600は、分離株コホートの全ての遺伝子コンテンツの包括的な観察である(例えば、「1」の値は、特定の遺伝子が存在することを示してもよく、「0」の値は、前記遺伝子が存在しないことを示してもよい)。前記遺伝子の存在は、パーセントとして表現されてもよい。このデータを用いて、前記分離株の異なる観察された表現型(例えば抗生物質に対する耐性)に対する存在する遺伝子の原因推測が、判断されることができる。より具体的には、マトリクス600は、異なる分離株からの基準遺伝子及びデノボ遺伝子を示す。したがって、サンプル間で共通である又は各サンプルに対してユニークである遺伝子は、マトリクス600から直接的に読み出されることができる。
抗生物質に対する前記分離株の感受性は、分離株の感受性を表す連続的な数値を出力しうるマイクロスキャン最小発育阻止濃度(MIC)/イプシロメータ(Epsilometer)を使用して測定されることができる。感受性又は耐性のようなラベルは、例えばヘルスケア施設内の微生物学又は同様の課により各分離株に割り当てられうる。これらのラベルを割り当てる課は、前記分離株の感受性を表す上述の数値に対する閾値レベルを設定しうる。
一度マトリクス600が、遺伝子存在‐不在マトリクスモジュール208により生成されると、遺伝子耐性関連付けエンジン210は、マトリクス600からのいずれの遺伝子が分離株の臨床的抗生物質耐性プロファイルのセット216に基づいて前記割り当てられたラベルを説明することができるかを識別しうる。換言すると、遺伝子耐性関連付けエンジン210は、いずれの遺伝子が抗生物質耐性の原因である又は少なくとも寄与するかを決定しうる。
これを達成するために、少なくとも1つの実施例において、遺伝子耐性関連付けエンジン210は、関連付けの統計的検定に依存しうる。この技術によると、遺伝子ごとの存在及び不在の頻度が、2つのグループ、すなわち(1)感受性分離株及び(2)耐性分離株にわたって計算される。この頻度は、以下の表1のように2×2の分割表上に示されることができる。
Figure 2019512783
表1:遺伝子頻度分割表
表1は、特定の遺伝子(x)を含む耐性分離株の数、特定の遺伝子(y)を含む感受性分離株の数、遺伝子(a)を含まない耐性分離株の数、及び遺伝子(b)を含まない感受性分離株の数を提示しうる。カイ二乗統計的仮説検定を含む任意の適切な一変量統計的検定が、前記感受性又は耐性分離株のいずれかとの遺伝子の関連付けを表すp値を生成するように前記分割表に適用されることができる。
遺伝子耐性関連付けエンジン210は、(ボンフェローニ補正のように複数の仮説検定後に補正されうる)p値により特定の遺伝子をランク付けしうる。前記割り当てられたp値は、前記分離株の間の感受性表現型の差を説明する際に重要度により前記遺伝子をソートしうる。
重要なp値を持つ複数の遺伝子が、前記カイ二乗検定により識別されることができる。これらの遺伝子の各々は、個別に又はより大きな遺伝子のネットワークの一部としてのいずれかで動作することができ、前記遺伝子は、大きなp値を持つ必要がない。この分析は、識別された遺伝子関連付けがより大きな遺伝子オペロンネットワークの一部であるかどうかを識別するために実行されうる。これは、この後に、前記オペロンネットワークが、抗生物質耐性遺伝子を持ち、前記ゲノムの周りで移動することができる可動性遺伝子要素/可動性遺伝子カセットである尤度を生じうる。
他の実施例において、遺伝子耐性関連付けエンジン210は、いずれの遺伝子が、抗生物質に対する分離株の耐性の原因である又は少なくとも寄与するかを識別する機械学習技術に依存しうる。図7は、各分離株に対するフィーチャ(遺伝子存在/遺伝子不在)の表700を示す。行の数nは、観察/分離株の数に基づいてもよく、列の数mは、全ての分離株に対して検出されたフィーチャ/遺伝子の数に基づいてもよい。表700は、特定の抗生物質に関して、それぞれ、「耐性」及び「感受性」のラベルを表し得る予測子ラベルA及びBをも含む。例えば、最後の分離株Snは、遺伝子2を含み、特定の抗生物質に対する感受性としてラベル付けされる。
集められたデータを処理するために、遺伝子耐性関連付けエンジン210は、限定的にではないが、ランダムフォレスト、サポートベクターマシン、逆投影ニューラルネットワーク、ロジスティック回帰分析等のような、様々な機械学習アルゴリズムを使用してもよい。使用される前記アルゴリズムは、データに対して数学モデルをトレーニングしてもよく、フォーマット"y (labels) = f(features or genes)"で表される。機械学習アルゴリズムの上記リストは、非徹底的であり、現在利用可能であるか又は今後発明される他の機械学習プロシージャが、ここに記載される様々なフィーチャを達成するのに使用されてもよい。
例えば、ランダムフォレスト、ロジスティック回帰分析及びサポートベクターマシンのような特定の機械学習アルゴリズムは、表現型を予測してもよい。これらのモデルは、トレーニングデータセットに対してトレーニングされてもよく、任意の検定分離株に対してラベルを予測するのに使用されることができる。前記モデルは、真の陽性率、偽陽性率、曲線の下の面積等のような統計値を決定するようにk倍クロス確認(k fold cross validation)又はランダムサブサンプリングアプローチにより確認されうる。
使用される機械学習モデルに関わらず、前記モデルは、分離株のラベルを決定する際に各遺伝子の重要度を内部で割り当ててもよい。「より高い重要度」値を持つ遺伝子は、観察される表現型を説明すると見なされ、他の遺伝子より高くランク付けされる。
図8は、遺伝子耐性モジュール102により出力された典型的な遺伝子存在‐不在マトリクス800を示す。この特定の実施例において、遺伝子耐性モジュール102は、90のST736エンテロコッカス・フェシウム分離株に対して検定され、63が、ダプトマイシン感受性であり、27が、ダプトマイシン耐性であった。
前記分離株は、ゲノムアセンブラを使用してアセンブルされ、QCマトリクスは、QUAST(http://bioinf.spbau.ru/quast)を使用して評価された。基準ゲノムは、Eフェシウムゲノムの完全な長いアセンブルされたST736株であった。前記遺伝子存在‐不在マトリクスの大きさは、4496×90であった。前記マトリクスのカイ二乗検定は、[0.000989, 0.000127]の範囲のp値を持つ16の耐性関連遺伝子を生じた。Y軸上にカイ二乗p値802の昇順に配置された遺伝子及びX軸上に分離株識別804を持つ遺伝子存在不在マトリクス800が、図8に示される。
図9は、より詳細にSARモジュール104を示す。図示されるように、SARモジュール104は、アライメント(alignment)及びバリアントコール(variant calling)パイプラインモジュール902と、バリアントマトリクスモジュール904と、単一ヌクレオチド多型(SNP)耐性関連付けモジュール906と、SNP注釈モジュール908とを含みうる。SARモジュール104は、耐性と関連付けられた単一ヌクレオチド多型を識別するように、感受性病原体と比較される場合に基準ゲノムに対する前記サンプルのバリアント及び耐性サンプルの間で濃縮されたスポットバリアントをコールし得る。
動作時に、病原体分離株は、任意の適切なシーケンシングマシンを使用してヘルスケア施設において患者から抽出されうる。前記抽出された分離株は、次いで、化学的に定義された、複合、還元性、差、及び濃縮ベースの培養基のような任意の適切な培養基を使用して培養されうる。使用される前記培養基は、異なってもよく、用途に依存しうる。次に、DNAは、標準的な検査法を使用して前記培養された分離株から抽出されうる。前記抽出されたDNAは、次いで、限定的にではないが、HiSeq、MiSeq、PacBio及びONPのような任意の適切なシーケンシング技術を使用してシーケンシングするのに備えられうる。
抽出された分離株ゲノム配列912の生の配列910は、次いで、アライメント及びバリアントコールパイプラインモジュール902にフィードされうる。アライメント及びバリアントコールパイプラインモジュール902は、任意の適切な技術を使用してアライメントベースのバリアントコールを使用して読み込みをアセンブルしうる。このプロセスは、前記病原体のゲノムの全体的なゲノムシーケンシング又は標的シーケンシングのいずれかであることができる。
パイプラインモジュール902は、前記読み込みを処理し、これらを1以上の基準配列と比較してもよい。選択される前記基準配列は、予備知識及び/又は多遺伝子座配列分類に基づいてもよい。パイプラインモジュール902は、次いで、バリアントをコールするように検定配列が前記基準配列と異なるかどうかを決定するように前記基準配列に対して前記読み込みをアラインしてもよい。パイプラインモジュール902は、SAMTOOLS及び/又はGATKのような様々な技術及びツールに依存してもよい。
バリアントマトリクスモジュール904は、次いで、前記分離株コホートの全ての識別されたSNPの包括的な観察であるバリアントマトリクスを生成しうる。図10は、例えば、一実施例による典型的なバリアントマトリクス1000を示す。マトリクス1000は、識別された多型をリストするSNP列1002、及びそれぞれのゲノム1006における前記SNPの位置をリストする位置列1004を含む。列1008は、列1004に示されるそれぞれの位置における前記基準配列におけるヌクレオチドをリストする。
例えば、SNP2は、位置5105においてサンプルS1、S2及びS3において生じる検出された突然変異である。これらのサンプルにおいて、これらの配列内の位置5105におけるヌクレオチドは、グアニンGであり、前記基準配列内の位置5105におけるヌクレオチドは、アデニンAである。
図11は、他のバリアントマトリクス1100を示す。図7の表700と同様に、しかしながら、マトリクス1100は、特定の抗生物質に関する「耐性」又は「感受性」ラベルのいずれかを含む列1102を含みうる。このデータを用いて、抗生物質耐性に対する突然変異の原因推定が、決定されることができる。抗生物質に対する前記分離株の感受性は、分離株の感受性を表す連続的な数値を出力しうるマイクロスキャン最小発育阻止濃度(MIC)/イプシロメータ(Epsilometer)(E)を使用して測定されることができる。耐性又は感受性のラベルは、例えば、閾値レベルを超過する前記数値に基づいて割り当てられてもよい。
次のステップは、SNP耐性関連付けモジュール906が、マトリクス1000及び1100内の全ての突然変異の中からいずれの突然変異が、分離株の臨床的抗生物質耐性プロファイルのセット916に基づいて前記割り当てられたラベルを説明することができるかを識別することである。換言すると、SNP耐性関連付けモジュール906は、いずれの突然変異が抗生物質耐性の原因であるか又は少なくとも寄与するかを決定しうる。
これを達成するために、少なくとも一実施例において、SNP耐性関連付けモジュール906は、関連付けの統計的検定に依存してもよい。メジャー及びマイナーアレル(allele)カウントは、前記識別されたSNPの各々に対するバリアントから計算されうる。SNP耐性モジュール906は、次いで、どのように前記メジャー及びマイナーアレルが、耐性及び感受性株に分配されるかを学習しうる。この分配頻度は、以下の表2のように、株に対するアレル頻度に対する生成された2×2の分割表に示されることができる。
Figure 2019512783
表2:アレルカウント分割表
表1と同様に、表2は、カイ二乗統計的仮説検定を含む多くの一変量統計的検定を実行する基礎を形成する。表1のように、前記関連付けの程度は、生成されるp値により表されうる。すなわち、前記p値が低いほど、前記SNPと薬物感受性との間の関連付けは高い。すなわち、前記SNPの存在は、前記病原体が特定の抗生物質に対して耐性であるか又は感受性であるかの因子である。SNP耐性関連付けモジュール906は、(ボンフェローニ補正のように複数の仮説検定後に補正されうる)p値に従って特定の非同義突然変異を適切にランク付けしうる。前記割り当てられたp値は、前記分離株間の表現型の差を説明する際に重要度により前記突然変異をソートしうる。
他の実施例において、SNP耐性関連付けモジュール906は、いずれの非同義突然変異が分離株の抗生物質耐性の原因である又は少なくとも寄与するかを識別するのに機械学習技術に依存してもよい。これらの技術は、上で論じられたように、異なるバリアントコール位置における前記分離株及び前記アレルを示すマトリクス1000又は1100からのデータを分析しうる。各バリアントコール位置に対して、前記メジャー及びマイナーアレルが、決定されることができる。
マトリクス1000内に示されるデータは、処理のために前記機械学習アルゴリズムに提供されうる。SNP耐性関連付けモジュール906は、限定的にではないが、ランダムフォレスト、サポートベクターマシン、逆投影ニューラルネットワーク、又はロジスティック回帰分析等のような様々な機械学習アルゴリズムを使用しうる。このアルゴリズムは、前記データに対して数学モデルをトレーニングすることができ、フォーマット"y (labels) = f(features or genes)"で表される。しかしながら、具体的な数学的関数は、異なってもよく、特定の機械学習アルゴリズム又は使用されるプロセスに基づいてもよい。
使用される機械学習アルゴリズムに関わらず、前記モデルは、真の陽性率、偽陽性率、生成された曲線の下の面積等のような統計値を決定するように、k倍クロス確認又はランダムサブサンプリングアプローチにより確認されうる。機械学習アルゴリズム及び確認アプローチの上記のリストは、非徹底的であり、現在利用可能である又は以後に発明される他の技術が、ここに記載される様々なフィーチャを達成するのに使用されてもよい。
SNP注釈モジュール908は、次いで、前記識別されたSNPに注釈をつけ、下流の影響を分析しうる。例えば、SNP注釈モジュール908は、分離株のラベルを決定する際に各SNPの重要度を内部で割り当ててもよい。したがって、より高い重要度レーティングを持つSNPは、より低い重要度レーティングを持つSNPより大きな程度で観察される表現型(例えば、抗生物質耐性)を説明すると見なされる。
SNP注釈モジュール908は、前記分離株のゲノム上で前記SNPを位置特定し、任意の適切な方法を使用して、これが遺伝子内に存在するかどうかを見てもよい。前記SNPが、遺伝子内に存在する場合、SNP注釈モジュール908は、次いで、元のコドン及び前記SNPのコドンを比較することにより前記突然変異が同型であるか又は非同型であるかを決定してもよい。他方で、前記突然変異が、遺伝子内に存在しない場合、任意の生物学的影響が、e−QTL効果によってもよい。
図12は、一実施例による典型的なSNP−遺伝子マッピングマトリクス1200を描く。この典型的な用途において、SARモジュール104は、68の感受性分離株及び36の耐性分離株を持つ104のST736分離株に対して検定された。1730の結合されたSNPバリアント位置は、EフェシウムのE39基準ゲノムに対して前記104のST746分離株の中で識別された。717のSNPが、範囲[0.004245, 0.036]内であり、0.05より小さいカイ二乗p値を持つ18の耐性に関連付けられた非同型突然変異を持つ非同型突然変異であることが発見された。したがって、これらの非同型突然変異を含む遺伝子が、抗生物質耐性に関連して生物学的に意味があると見なされた。
図13は、より詳細に抗生物質耐性モジュール106を示す。この特定の実施例において、前記抗生物質耐性モジュールは、遺伝子ネットワーク予測モジュール1302及びモバイローム(mobilome)関連付けモジュール1304を含みうる。抗生物質耐性モジュール106は、遺伝子及び非同型突然変異の存在及び/又は不在の効果に対する包括的な見解を提供するように薬物感受性に関連付けられた遺伝子に関する重要な生物学的マーカ情報を結合するマスタモジュールとして機能しうる。
抗生物質耐性モジュール106は、例えば配列組成及び/又は表現型に基づいて染色体又は外から取得されたDNAのいずれかとして関心のゲノム領域のソースを特徴づけてもよい。外から取得されたDNAは、トランスポゾン、組込プラスミド、プロファージ、インテグロン、及び挿入配列因子を含みうる可動遺伝因子である。したがって、抗生物質耐性モジュール106は、臨床医のような医療関係者が、病院で強化された病原体における耐性を引き起こす機構の取得の原因を理解することを助ける際に重要なコンポーネントである。
遺伝子耐性モジュール102において識別された遺伝子及びSARモジュール104において識別された突然変異は、遺伝子ネットワーク予測モジュール1302に通信されることができる。遺伝子ネットワーク予測モジュール1302は、転写によって一緒に潜在的に機能し、補完的な生物学的機能を持ち、高い物理的近さを持つ遺伝子ネットワークを識別しうる。
遺伝子ネットワーク予測モジュール1302からの予測は、モバイローム関連付けモジュール1304に通信されうる。例えば、耐性表現型が、一緒に機能する遺伝子のネットワーク(一部が、非同型突然変異を含みうる)により引き起こされ、単一の遺伝子により又は個別の遺伝子の存在/不在によって引き起こされないことは、起こりうる。モバイローム関連付けモジュール1304は、例えば、オペロン領域を外生的である又はそうではないと分類してもよく、これは、ゲノム因子のソース又は取得のルートに対する洞察を与える。取得されたゲノム因子のソース/ルートに関する情報は、抗生物質耐性を扱い、防ぐのに有用でありうる。
この分析は、可動遺伝因子(トランスポゾン、組込プラスミド、インテグロン、プロファージ、耐性カセット、挿入配列因子等)又はゲノム間で抗生物質耐性遺伝子を運ぶことができるゲノムアイランドの一部である前記オペロンネットワークの尤度に関する情報を提供してもよい。
抗生物質耐性モジュール106の更に他の機能は、それぞれ遺伝子耐性モジュール102及びSARモジュール104からの遺伝子及び突然変異の重要度を認識することである。これは、どれだけ前記遺伝子及び前記SNPが、前記分離株の薬物感受性を説明するのに相対的に寄与するかの比較を提供する。
例えば、図14は、抗生物質耐性モジュール106により生成されうる結合フィーチャマトリクス1400を描く。結合フィーチャマトリクス1400は、最も重要な遺伝子及びSNPに関する情報を示しうる。遺伝子及びSNPの両方が、前記分離株に対して機械学習モデルをトレーニングするためにフィーチャとして結合されることができる。図14に示されるように、マトリクス1400は、遺伝子及びSNPをバイナリ値として示し、前記メジャーアレルは、「1」値を割り当てられ、前記マイナーアレルは、「0」値を割り当てられる。値は、例えば、パーセントとして示されてもよい。
結合フィーチャマトリクス1400に基づくフィーチャ選択は、観察される表現型におけるバリアントに最も関与する又は少なくとも寄与する遺伝子及びバリアントを抽出しうる。したがって、医療関係者又は他の当事者は、耐性特性を説明する原因因子の線形ネットワークを識別することができうる。
抗生物質耐性モジュール106は、加えて又は代わりに、これらの遺伝因子の取得のソースに関する情報を提供してもよい。例えば、抗生物質耐性モジュール106は、遺伝因子が、ゲノム自体の一部ではないが、代わりに環境から取得され、「浮遊ゲノム」であるかを決定してもよい。他の例として、抗生物質耐性モジュール106は、バイオマーカが、可動遺伝因子に一体化されたオペロンネットワークの一部であるかどうかを識別してもよい。換言すると、遺伝子耐性モジュール102により識別された遺伝子及びSARモジュール104により識別された非同型突然変異は、転写によって一緒に潜在的に機能し、補完的な生物学的機能を持ち、高い物理的近さを持つ遺伝子ネットワークを識別するのに使用されることができる。
図15は、一実施例による病原体における抗生物質耐性を識別する方法1500のフローチャートを描く。ステップ1502は、複数のゲノム配列を受信することを含む。これらのゲノム配列は、図1に示されるような遺伝子‐耐性(GAR)モジュール及び単一ヌクレオチド多型(SAR)モジュールにより受信されうる。
ステップ1504は、遺伝子存在‐不在マトリクスを生成することを含む。遺伝子存在‐不在マトリクスの例は、図6−8に示される。前記マトリクスは、いずれの遺伝子が各分離株配列内に存在するかを識別するために図3−5に示される遺伝子予測及び除去アルゴリズムを実行することにより生成されうる。
ステップ1506は、薬物感受性に影響を与える遺伝子の能力である、前記遺伝子に対するフィーチャ重要度/p値を出力することを含む。したがって、遺伝子‐耐性モジュール102により生成された前記遺伝子存在‐不在マトリクスは、複数の分離株配列、各配列内に存在する遺伝子、及び(微生物情報から抽出される、抗生物質に関する)耐性又は感受性としての前記配列の識別を含む。
ステップ1508は、前記複数のゲノム配列の各々における遺伝子突然変異を識別することを含む。これらの突然変異は、前に論じられたようにSARモジュール104により識別されうる。
ステップ1510は、薬物感受性に影響を与える突然変異の能力である、前記突然変異に対するフィーチャ重要度/p値を出力することを含む。SARモジュール104は、各突然変異及び(抗生物質に関する)耐性又は感受性のラベルを識別するバリアントマトリクスを出力しうる。したがって、SARモジュール104により出力されるバリアントマトリクスは、突然変異を持つ分離株、前記突然変異の場所、及び各突然変異に対応するフィーチャ重要度/p値計量のリストを含みうる。
ステップ1512は、それぞれGAR及びSARモジュールから高いフィーチャ重要度/低いp値の遺伝子及びSNPを受信することを含む。
ステップ1514は、前記受信されたラベルに基づいて抗生物質耐性を与える遺伝子及び抗生物質耐性を与える遺伝子のソースの少なくとも一方を識別することを含む。例えば、システム100の様々なコンポーネントが、いずれの遺伝子/突然変異が抗生物質耐性の原因である又は少なくとも寄与するかを識別するのに複数の機械学習ツールのいずれかを使用して前記識別された遺伝子、突然変異、及び耐性/感受性ラベルを分析しうる。同様に、抗生物質耐性に寄与する前記遺伝子/突然変異のソースが、決定されてもよい。
図16は、個々に記載された機能を実行する典型的なハードウェア装置1600を示す。図示されるように、装置1600は、1以上のシステムバス1610を介して相互接続されたプロセッサ1620、メモリ1630、ユーザインタフェース1640、ネットワークインタフェース1650、及びメモリ1660を含む。図16が、いくつかの点で、抽象概念を構成し、装置1600のコンポーネントの実際の組織が、図示よりも複雑であってもよいと理解されるだろう。
プロセッサ1620は、メモリ1630又は記憶部1660に記憶された命令を実行することができる又は他の形でデータを処理することができる任意のハードウェア装置でありうる。このように、前記プロセッサは、マイクロプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)又は他の同様の装置を含んでもよい。
メモリ1630は、例えばL1、L2若しくはL3キャッシュ又はシステムメモリのような様々なメモリを含んでもよい。このように、メモリ1630は、スタティックランダムアクセスメモリ(SRAM)、ダイナミックRAM(DRAM)、フラッシュメモリ、読取専用メモリ(ROM)又は他の同様のメモリ装置を含んでもよい。
ユーザインタフェース1640は、ユーザとの通信を可能にする1以上の装置を含んでもよい。例えば、ユーザインタフェース1640は、ユーザコマンドを受信するキーボード、マウス及びディスプレイを含んでもよい。一部の実施例において、ユーザインタフェース1640は、ネットワークインタフェース1650を介して離れた端末に提示されてもよいコマンドラインインタフェース又はグラフィックユーザインタフェースを含んでもよい。
ネットワークインタフェース1650は、他のハードウェア装置との通信を可能にする1以上の装置を含んでもよい。例えば、ネットワークインタフェース1650は、イーサネット(登録商標)プロトコルによって通信するように構成されたネットワークインタフェースカード(NIC)を含んでもよい。加えて、ネットワークインタフェース1650は、TCP/IPプロトコルによる通信に対するTCP/IPスタックを実装してもよい。ネットワークインタフェース1650に対する様々な代替的な又は付加的なハードウェア又は設定が、明らかである。
記憶部1660は、読取専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリ装置又は同様の記憶媒体のような1以上の機械可読記憶媒体を含んでもよい。様々な実施例において、記憶部1660は、プロセッサ1620により実行される命令又はプロセッサ1620が演算しうるデータを記憶してもよい。
例えば、記憶部1660は、病原体に存在する遺伝子を識別する遺伝子耐性モジュール1662と、病原体に存在する突然変異を識別するSARモジュール1663と、病原体の抗生物質耐性の原因である又は少なくとも寄与する遺伝子及び突然変異を識別する抗生物質耐性モジュール1664とを含むオペレーティングシステム1661を含んでもよい。抗生物質耐性モジュール1664は、病原体の抗生物質耐性の原因である遺伝子又は突然変異のソースを決定してもよい。
記憶部1660に記憶されると記載された様々な情報が、付加的に又は代替的に、メモリ1630に記憶されてもよいことは、明らかである。これに関して、メモリ1630は、「記憶装置」を構成すると見なされてもよく、記憶部1660は、「メモリ」と見なされてもよい。様々な他の構成が、明らかである。更に、メモリ1630及び記憶部1660は、両方とも、「非一時的機械可読媒体」と見なされてもよい。ここで使用されるように、用語「非一時的」は、一時的信号を除外するが、揮発性及び不揮発性メモリの両方を含む全ての形式の記憶部を含むと理解される。
装置1600が、各記載されたコンポーネントの1つを含むように示され、様々なコンポーネントが、様々な実施例において重複されてもよい。例えば、プロセッサ1620は、個々に記載された方法を独立して実行するように構成された又はここに記載された方法のステップ又はサブルーチンを実行するように構成された複数のマイクロプロセッサを含んでもよく、前記複数のプロセッサは、ここに記載された機能を達成するように協働する。更に、装置1600が、クラウドコンピューティングシステムにおいて実装される場合、様々なハードウェアが、別々の物理的システムに属してもよい。例えば、プロセッサ1620は、第1のサーバにおける第1のプロセッサ及び第2のサーバにおける第2のプロセッサを含んでもよい。
様々な実施例が、ハードウェア又はファームウェアにおいて実装されうることは、先行する記載から明らかであるべきである。更に、様々な典型的な実施例が、ここに詳細に記載された動作を実行するように少なくとも1つのプロセッサにより読み出され、実行されうる、機械可読記憶媒体に記憶された命令として実装されてもよい。機械可読記憶媒体は、パーソナル又はラップトップコンピュータ、サーバ又は他の計算装置のような機械により読取可能な形式で情報を記憶するいかなる機構をも含んでもよい。したがって、機械可読記憶媒体は、読取可能メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリ装置、及び同様の記憶媒体を含んでもよい。
ここで任意のブロック図が、ここに記載された原理を具体化する例示的な回路の概念図を表すことは、当業者により理解されるべきである。同様に、任意のフローチャート、フロー図、状態遷移図、及び疑似コード等が、機械可読媒体において実質的に表され、コンピュータ又はプロセッサが明示的に示されているか否かにかかわらず、コンピュータ又はプロセッサにより実行される様々な処理を表すと理解されるだろう。
様々な典型的な実施例が、特定の典型的な態様を参照して詳細に記載されているが、本発明は、他の実施例が可能であり、その詳細は、様々な明らかな点において修正が可能であると理解されるべきである。当業者に直ちに明らかであるように、変形例及び修正例が、本発明の精神及び範囲内に残っている間に影響されることができる。したがって、先行する開示、記載及び図は、説明目的のみであり、本発明をいかなる形にも限定しない。

Claims (17)

  1. 病原体における抗生物質耐性を識別するシステムにおいて、
    遺伝子‐耐性モジュールであって、
    各々が複数の遺伝子を有する複数のゲノム配列を入力として受信し、
    前記複数のゲノム配列の各々に存在する遺伝子を識別する遺伝子存在‐不在マトリクスを生成し、
    前記複数のゲノム配列の各々に対する耐性又は感受性のラベルを出力する、
    ように構成された当該遺伝子‐耐性モジュールと、
    単一ヌクレオチド多型‐耐性モジュールであって、
    前記複数のゲノム配列を入力として受信し、
    前記複数のゲノム配列の各々において遺伝子突然変異を識別し、
    各識別された突然変異に対する耐性又は感受性のラベルを出力する、
    ように構成された当該単一ヌクレオチド多型‐耐性モジュールと、
    抗生物質耐性モジュールであって、
    前記複数のゲノム配列の各々及び各識別された突然変異に対する耐性又は感受性のラベルと関連付けられた前記遺伝子及び突然変異を入力として受信し、
    前記受信されたラベルに基づいて抗生物質耐性を与える遺伝子又は抗生物質耐性を与える遺伝子のソースの少なくとも一方を識別する、
    ように構成された当該抗生物質耐性モジュールと、
    を有するシステム。
  2. 前記遺伝子‐耐性モジュールが、
    前記複数のゲノム配列のサンプル内に存在する遺伝子のセットを識別するように構成された遺伝子予測エンジンと、
    前記複数のゲノム配列の各々から前記識別された遺伝子のセットを取り除くように構成される遺伝子除去エンジンと、
    を含み、
    前記遺伝子予測エンジンが及び前記遺伝子除去エンジンが、残りのゲノム配列の各々に存在する遺伝子のセットを識別するステップと、前記遺伝子存在‐不在マトリクスを生成するように前記残りのゲノム配列から前記識別された遺伝子のセットを取り除くステップとを反復するように構成される、
    請求項1に記載のシステム。
  3. 前記遺伝子‐耐性モジュールが、抗生物質耐性又は抗生物質感受性に対する遺伝子の寄与を表す値を生成するように構成される、請求項1に記載のシステム。
  4. 前記抗生物質耐性モジュールは、少なくとも2つの耐性遺伝子がネットワークとして動作するかどうかを決定するように構成される、請求項1に記載のシステム。
  5. 遺伝子の存在が、バイナリ値又はパーセントで規定される、請求項1に記載のシステム。
  6. 前記抗生物質耐性モジュールは、オペロンネットワークとして動作する少なくとも2つの遺伝子が突然変異を含むかどうかを決定するように構成される、請求項1に記載のシステム。
  7. 前記抗生物質耐性モジュールが、抗生物質耐性と関連付けられた前記少なくとも1つの遺伝子又は突然変異を識別するレポートを出力するように構成される、請求項1に記載のシステム。
  8. 前記遺伝子のソースが、前記ゲノム配列を宿主又は外来として分類するように配列組成及び表現型の少なくとも一方を使用して識別される、請求項1に記載のシステム。
  9. 病原体における抗生物質耐性を識別する方法において、
    遺伝子‐耐性モジュール及び単一ヌクレオチド多型‐耐性モジュールにおいて、各々が複数の遺伝子を有する複数のゲノム配列を受信するステップと、
    前記遺伝子‐耐性モジュールによって、前記複数のゲノム配列の各々に存在する遺伝子を識別する遺伝子存在‐不在マトリクスを生成するステップと、
    前記遺伝子‐耐性モジュールによって、前記複数のゲノム配列の各々に対する耐性又は感受性のラベルを出力するステップと、
    前記単一ヌクレオチド多型‐耐性モジュールによって、前記複数のゲノム配列の各々において遺伝子突然変異を識別するステップと、
    前記単一ヌクレオチド多型‐耐性モジュールによって、各識別された突然変異に対する耐性又は感受性のラベルを出力するステップと、
    抗生物質耐性モジュールにおいて、前記複数のゲノム配列の各々及び各識別された突然変異に対する耐性又は感受性のラベルと関連付けられた前記遺伝子及び突然変異を受信するステップと、
    前記抗生物質耐性モジュールによって、前記受信されたラベルに基づいて抗生物質耐性を与える遺伝子及び抗生物質耐性を与える遺伝子のソースの少なくとも一方を識別するステップと、
    を有する方法。
  10. 前記遺伝子‐耐性モジュールによって、前記複数のゲノム配列のサンプル内に存在する遺伝子のセットを識別するステップと、
    前記遺伝子‐耐性モジュールによって、前記複数のゲノム配列の各々から前記識別された遺伝子のセットを取り除くステップと、
    前記遺伝子存在‐不在マトリクスを生成するように前記複数のゲノム配列の残りのサンプルの各々に存在する遺伝子のセットを識別するステップ及び残りのゲノム配列から前記識別された遺伝子のセットを取り除くステップを反復するステップと、
    を有する、請求項8に記載の方法。
  11. 前記遺伝子‐耐性モジュールによって、抗生物質耐性又は抗生物質感受性に対する遺伝子の寄与を表す値を生成するステップを有する、請求項8に記載の方法。
  12. 前記抗生物質耐性モジュールによって、少なくとも2つの耐性遺伝子がネットワークとして動作するかどうかを決定するステップを有する、請求項8に記載の方法。
  13. 遺伝子の存在が、バイナリ値又はパーセントで規定される、請求項8に記載の方法。
  14. 前記抗生物質耐性モジュールによって、ネットワークとして動作する少なくとも2つの遺伝子が突然変異を含むかどうかを決定するステップを有する、請求項8に記載の方法。
  15. 前記抗生物質耐性モジュールによって、抗生物質耐性と関連付けられた少なくとも1つの遺伝子又は突然変異を識別するレポートを出力するステップを有する、請求項8に記載の方法。
  16. 前記遺伝子のソースが、前記ゲノム配列を宿主又は外来として分類するように配列組成及び表現型の少なくとも一方を使用して識別される、請求項8に記載の方法。
  17. 抗生物質耐性を与える1以上の遺伝子を識別する方法において、
    各々が複数の遺伝子を有する複数のゲノム配列を受信するステップと、
    前記複数のゲノム配列のいずれが抗生物質耐性を与えるかを決定するステップと、
    前記複数のゲノム配列のいずれの突然変異が抗生物質耐性を与えるかを決定するステップと、
    いずれのサンプル及び突然変異が抗生物質耐性を与えるかに基づいて抗生物質耐性と関連付けられた前記複数のゲノム配列の少なくとも1つの遺伝子を識別するステップと、
    を有する方法。
JP2018546601A 2016-03-10 2017-03-10 抗生物質耐性識別 Active JP6918817B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662306283P 2016-03-10 2016-03-10
US62/306,283 2016-03-10
US201662418532P 2016-11-07 2016-11-07
US62/418,532 2016-11-07
PCT/EP2017/055621 WO2017153556A1 (en) 2016-03-10 2017-03-10 Antibiotic resistance identification

Publications (3)

Publication Number Publication Date
JP2019512783A true JP2019512783A (ja) 2019-05-16
JP2019512783A5 JP2019512783A5 (ja) 2020-03-26
JP6918817B2 JP6918817B2 (ja) 2021-08-11

Family

ID=58277277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018546601A Active JP6918817B2 (ja) 2016-03-10 2017-03-10 抗生物質耐性識別

Country Status (5)

Country Link
US (2) US10629291B2 (ja)
EP (1) EP3426799B1 (ja)
JP (1) JP6918817B2 (ja)
CN (1) CN108779498B (ja)
WO (1) WO2017153556A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2755738C2 (ru) 2018-01-08 2021-09-20 Иллюмина, Инк. Системы и устройства для секвенирования с высокой пропускной способностью с детектированием на основе полупроводников
US11561196B2 (en) 2018-01-08 2023-01-24 Illumina, Inc. Systems and devices for high-throughput sequencing with semiconductor-based detection
WO2019140402A1 (en) * 2018-01-15 2019-07-18 Illumina, Inc. Deep learning-based variant classifier
US11646117B2 (en) 2019-06-04 2023-05-09 International Business Machines Corporation Matrix factorization of antibiogram metadata
CN112349345A (zh) * 2020-11-06 2021-02-09 邹小明 一种定量评价环境中抗生素抗性基因对抗生素污染响应特性的新方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004523725A (ja) * 2000-06-08 2004-08-05 ビルコ・ビーブイビーエイ ニューラルネットワークを使用して治療薬耐性を予測し、そして薬剤耐性の遺伝的基礎を定めるための方法およびシステム
JP2011204261A (ja) * 2004-07-02 2011-10-13 Government Of The United States Of America As Represented By The Secretary Of The Navy リシークエンシング病原体マイクロアレイ
US20140030712A1 (en) * 2011-02-01 2014-01-30 Baylor College Of Medicine Genomic approach to the identification of biomarkers for antibiotic resistance and susceptibility in clinical isolates of bacterial pathogens
WO2015007487A1 (en) * 2013-07-17 2015-01-22 Siemens Aktiengesellschaft Method and system for determining a bacterial resistance to an antibiotic drug

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012027302A2 (en) 2010-08-21 2012-03-01 The Regents Of The University Of California Systems and methods for detecting antibiotic resistance
GB201107515D0 (en) * 2011-05-05 2011-06-22 Discuva Ltd Method for identifying antibiotic targets
ES2731913T3 (es) * 2014-01-30 2019-11-19 Ares Genetics Gmbh Pruebas de resistencia genética
US20150259729A1 (en) * 2014-03-13 2015-09-17 Opgen, Inc. Methods of detecting multi-drug resistant organisms
US9563741B2 (en) 2014-05-16 2017-02-07 Battelle Memorial Institute Constructing custom knowledgebases and sequence datasets with publications
WO2015184017A1 (en) 2014-05-27 2015-12-03 Opgen, Inc. Systems, apparatus, and methods for generating and analyzing resistome profiles

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004523725A (ja) * 2000-06-08 2004-08-05 ビルコ・ビーブイビーエイ ニューラルネットワークを使用して治療薬耐性を予測し、そして薬剤耐性の遺伝的基礎を定めるための方法およびシステム
JP2011204261A (ja) * 2004-07-02 2011-10-13 Government Of The United States Of America As Represented By The Secretary Of The Navy リシークエンシング病原体マイクロアレイ
US20140030712A1 (en) * 2011-02-01 2014-01-30 Baylor College Of Medicine Genomic approach to the identification of biomarkers for antibiotic resistance and susceptibility in clinical isolates of bacterial pathogens
WO2015007487A1 (en) * 2013-07-17 2015-01-22 Siemens Aktiengesellschaft Method and system for determining a bacterial resistance to an antibiotic drug

Also Published As

Publication number Publication date
CN108779498B (zh) 2022-08-02
CN108779498A (zh) 2018-11-09
EP3426799A1 (en) 2019-01-16
US20170270244A1 (en) 2017-09-21
EP3426799B1 (en) 2020-10-14
US20200152292A1 (en) 2020-05-14
WO2017153556A1 (en) 2017-09-14
JP6918817B2 (ja) 2021-08-11
US10629291B2 (en) 2020-04-21

Similar Documents

Publication Publication Date Title
JP6918817B2 (ja) 抗生物質耐性識別
Bakshi et al. Fast set-based association analysis using summary data from GWAS identifies novel gene loci for human complex traits
Ørsted et al. Genomic variation predicts adaptive evolutionary responses better than population bottleneck history
Yengo et al. Imprint of assortative mating on the human genome
Torres et al. Human demographic history has amplified the effects of background selection across the genome
Pylro et al. Data analysis for 16S microbial profiling from different benchtop sequencing platforms
Slatkin Linkage disequilibrium—understanding the evolutionary past and mapping the medical future
Lohmueller The impact of population demography and selection on the genetic architecture of complex traits
Yoshida et al. Sex chromosome turnover contributes to genomic divergence between incipient stickleback species
Lesecque et al. The red queen model of recombination hotspots evolution in the light of archaic and modern human genomes
Hemani et al. Retracted article: Detection and replication of epistasis influencing transcription in humans
Corona et al. Analysis of the genetic basis of disease in the context of worldwide human relationships and migration
JP2020525888A (ja) ディープラーニングベースの異常スプライシング検出
Leon-Novelo et al. A flexible Bayesian method for detecting allelic imbalance in RNA-seq data
Chimusa et al. A genomic portrait of haplotype diversity and signatures of selection in indigenous southern African populations
Johnson et al. Genotyping-by-sequencing (GBS) detects genetic structure and confirms behavioral QTL in tame and aggressive foxes (Vulpes vulpes)
Amorim et al. Detection of convergent genome-wide signals of adaptation to tropical forests in humans
Stott et al. Impact of homologous recombination on core genome phylogenies
Zieliński et al. Single nucleotide polymorphisms reveal genetic structuring of the Carpathian newt and provide evidence of interspecific gene flow in the nuclear genome
Kang et al. Genomic signatures of speciation in sympatric and allopatric Hawaiian picture-winged Drosophila
Rajapakse et al. Multivariate detection of gene‐gene interactions
Schield et al. The roles of balancing selection and recombination in the evolution of rattlesnake venom
Gaviria-Agudelo et al. Genomic heterogeneity of methicillin resistant Staphylococcus aureus associated with variation in severity of illness among children with acute hematogenous osteomyelitis
Yan et al. Archaic hominin genomics provides a window into gene expression evolution
VanWallendael et al. Alignment‐free methods for polyploid genomes: quick and reliable genetic distance estimation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210721

R150 Certificate of patent or registration of utility model

Ref document number: 6918817

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150