JP2019500706A - 一塩基多型及びインデルの複対立遺伝子遺伝子型決定 - Google Patents

一塩基多型及びインデルの複対立遺伝子遺伝子型決定 Download PDF

Info

Publication number
JP2019500706A
JP2019500706A JP2018539252A JP2018539252A JP2019500706A JP 2019500706 A JP2019500706 A JP 2019500706A JP 2018539252 A JP2018539252 A JP 2018539252A JP 2018539252 A JP2018539252 A JP 2018539252A JP 2019500706 A JP2019500706 A JP 2019500706A
Authority
JP
Japan
Prior art keywords
allele
sample
signal
call
allelic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018539252A
Other languages
English (en)
Other versions
JP2019500706A5 (ja
JP6858783B2 (ja
Inventor
ジェレミー ネイサン ゴラブ,
ジェレミー ネイサン ゴラブ,
マイケル エイチ. シャペロ,
マイケル エイチ. シャペロ,
ドロシー オリバー,
ドロシー オリバー,
デボラ ブラック,
デボラ ブラック,
ファルーク シディクイ,
ファルーク シディクイ,
Original Assignee
アフィメトリックス インコーポレイテッド
アフィメトリックス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アフィメトリックス インコーポレイテッド, アフィメトリックス インコーポレイテッド filed Critical アフィメトリックス インコーポレイテッド
Publication of JP2019500706A publication Critical patent/JP2019500706A/ja
Publication of JP2019500706A5 publication Critical patent/JP2019500706A5/ja
Application granted granted Critical
Publication of JP6858783B2 publication Critical patent/JP6858783B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2539/00Reactions characterised by analysis of gene expression or genome comparison
    • C12Q2539/10The purpose being sequence identification by analysis of gene expression or genome comparison characterised by
    • C12Q2539/115Comparative genomic hybridisation [CGH]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/501Detection characterised by immobilisation to a surface being an array of oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Physiology (AREA)
  • Ecology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

複対立遺伝子マーカーを遺伝子型決定するためのアレイベースの方法のための方法及びシステムが開示される。また本明細書では、全ゲノム増幅、及び結果として生じるデータにおける望ましくない偽遺伝子の効果を低減するために、増幅を選択的に付勢するための遺伝子座特異的多重PCRのための方法が開示される。遺伝子型決定方法は、典型的に、マーカーまたはゲノム変異体に対して1つの参照対立遺伝子及び1つの代替対立遺伝子を想定する。本明細書に開示される複対立遺伝子遺伝子型決定アルゴリズムは、従来の遺伝子型決定方法から拡張して、1つより多くの変異体を有する複対立遺伝子マーカーを扱う。
【選択図】図5

Description

関連出願の相互参照
本出願は、2015年10月18日出願の米国出願第62/243,078号の優先権を主張し、その開示は、その全体が参照により本明細書に組み込まれる。
本明細書に記載される態様は、概して、複対立遺伝子遺伝子型決定のためのシステム及び方法に関する。特に、本開示の1つ以上の態様は、一塩基多型(SNP)及びインデルを含む、複対立遺伝子マーカーを遺伝子型決定するアレイベースの方法、ならびに試料中の各変異体における複数の対立遺伝子に関する遺伝子型情報を判別するためのアルゴリズムを対象とする。
Affymetrix(登録商標)アレイ(Affymetrix,Inc.,Santa Clara,CA)などの合成核酸プローブアレイを使用して、生物系に関するかつてない量の情報が生成されてきた。例えば、アレイは、1アレイ当たり100万個の一塩基多型(SNP)を遺伝子型決定するために十分なプローブを含み得る。そのようなマイクロアレイからの遺伝子型データの分析は、新薬、植物、動物、細菌、古細菌、及び真菌を含む生物の新たな種または株、ならびに遺伝子情報(特定の標的集団及び/または個体に対して調整された情報を含む)及びそのような情報の、癌などの疾患との相関に基づく新たな診断ツール及び治療の開発につながり得る。
SNP及びインデル(例えば、塩基の挿入または欠失)の大部分は、遺伝的変異に2つの対立遺伝子が存在し得る、二対立遺伝子型であり得る。したがって、従来の遺伝子型決定方法は、2つの対立遺伝子を同定するための二対立遺伝子方法に向けられ得るが、いくつかの遺伝子変異体は、2つより多くの可能な対立遺伝子を有し得る。すなわち、複数の二対立遺伝子型変異体の対立遺伝子によって定義されるハプロタイプとは反対に、複数の代替対立遺伝子が単一遺伝子座に存在する、複対立遺伝子変異体を遺伝子型決定することに関心が高まっている。例えば、1000 Genomes Projectから入手されるものなどのゲノムデータは、約400,000個の複対立遺伝子SNP及びインデルを含み得る。Affymetrix(登録商標)Axiom(登録商標)アレイなどのマイクロアレイプレートは、どの代替対立遺伝子がパネルに存在するかに応じて、薬物代謝に対する著しい影響を有する数十個の複対立遺伝子変異体のパネルを含み得る。したがって、遺伝子型決定において複対立遺伝子変異体を同定するための新たな手法を有する必要性がある。
以下は、本明細書に記載される種々の態様に関する簡易概要を提示する。この概要は、広範囲の概観ではなく、重要なもしくは重大な要素を識別するか、または特許請求の範囲を描出することを意図しない。以下の概要は、単にいくつかの概念を、下で提供されるより詳細な説明に対する導入的前置として簡易形式で提示する。
本明細書に記載される態様は、複対立遺伝子遺伝子型決定のためのシステム、方法、及びアルゴリズム、ならびに本明細書に記載される他の方法を対象とする。遺伝子型決定方法は、典型的に、マーカーまたはゲノム変異体に対して1つの参照対立遺伝子及び1つの代替対立遺伝子を想定する。本明細書に開示される複対立遺伝子遺伝子型決定アルゴリズムは、従来の遺伝子型決定方法から拡張して、1つより多くの変異体を有する複対立遺伝子マーカーを扱う。すなわち、本明細書に開示される方法は、一度に考慮される対立遺伝子の数を低減するために、各試料の各変異体において考慮する2つの対立遺伝子を選択することによって、複対立遺伝子SNP及びインデルを遺伝子型決定することができる。
特定の実施形態によると、コンピュータシステムを使用して、1つ以上の複対立遺伝子マーカーを遺伝子型決定するための方法が本明細書に開示される。方法は、1つ以上の試料中の1つ以上の複対立遺伝子マーカーに対するシグナルを取得することと、各複対立遺伝子マーカーについて、1つ以上の試料からの複数の対立遺伝子対における各対立遺伝子対に対するシグナルをクラスタ化して、各対立遺伝子対を表すクラスタをもたらすことと、ホモ接合性対立遺伝子対を表す各ホモ接合性クラスタについて、代替対立遺伝子に対するバックグラウンドシグナルを算出するために、代替対立遺伝子に対するシグナルを収集して、各々がそれぞれの対立遺伝子を表す複数のバックグラウンドシグナルをもたらすことと、シグナル及びバックグラウンドシグナルに基づいて、各対立遺伝子対について最初の遺伝子型コールを各試料に割り当てることと、最初の遺伝子型コール及び前のクラスタパラメータを使用して、各クラスタの多変量正規分布を算出することと、各クラスタの各多変量正規分布について、各試料のメンバーシップの対数尤度を算出することと、このメンバーシップの対数尤度に基づいて、各試料について、各クラスタにおけるメンバーシップの確率を算出することと、このメンバーシップの確率に基づいて、最後の遺伝子型コールを各試料に割り当てることと、を含み得る。
更なる実施形態によると、アンプリコンの調製のための、全ゲノム増幅及び遺伝子座特異的多重ポリメラーゼ連鎖反応(mPCR)を利用するための方法も開示される。これらの方法は、増幅を選択的に付勢して、関心対象の所望のマーカーについての遺伝子型決定データの品質を改善すること、及び結果として生じるデータにおける望ましくない偽遺伝子の効果を低減することを対象とし得る。方法は、ゲノムDNAを(例えば、抽出によって)入手することと、全ゲノム増幅をゲノムDNAに適用することと、遺伝子座特異的mPCRを行って、所望の遺伝子変異体の、増加した数のアンプリコンを入手することと、を含み得る。結果として生じるDNA試料を断片化し、アレイにハイブリダイズすることができ、これを複対立遺伝子遺伝子型決定に利用することができる。関心対象の変異体の増幅に対して意図的な不均衡または付勢をもたらすことによって、下流の生物情報学的分析が改善され得る。
更なる実施形態によると、本開示は、生物学的アッセイもしくは試験もしくは実験を評価し、結果を提供もしくは評価するために、一緒にまたは独立して使用され得る方法及び/またはシステム及び/またはデバイスに関与する。特定の実施形態では、本開示は、データにアクセスし、本明細書に記載されるようにステップを実行するための論理命令またはモジュールで構成されたコンピュータまたは実験用具などの情報処理デバイスに関与する。更なる実施形態では、本発明は、有体媒体に記録された論理命令及び/またはデータに関与する。
これら及び追加の態様は、下で更に詳細に論じられる開示の利益により高く評価されるであろう。
特許または出願ファイルは、カラーで作成された少なくとも1つの図面を含む。カラー図面(複数可)を有する本特許または特許出願公開のコピーは、要望に応じて必要な料金の支払い時に特許庁によって提供されるであろう。本明細書に記載される態様及びそれらの利点に関するより完全な理解は、添付の図面を考慮し、以下の説明を参照することによって得ることができ、同様の参照番号は、同様の特徴を示す。
本発明の実施形態のソフトウェアを実行するために利用され得る、コンピュータシステムの例を示す。 図1のコンピュータシステムのシステムブロック図を示す。 対立遺伝子強度の、コントラスト及びサイズへの対数変換についての例示的なプロットを示す。 二対立遺伝子遺伝子型決定アルゴリズムにおけるクラスタに割り当てられた試料の例示的なプロットを示す。 複対立遺伝子遺伝子型決定方法の高レベルフローチャートを示す。 各対立遺伝子対についてのバックグラウンドシグナル算出の例示的なプロットを示す。 各対立遺伝子対についてのバックグラウンドシグナル算出の例示的なプロットを示す。 各対立遺伝子対についてのバックグラウンドシグナル算出の例示的なプロットを示す。 遺伝子型決定された試料のサブセットの初期分割の例示的なプロットを示す。 遺伝子型決定された試料のサブセットの初期分割の例示的なプロットを示す。 遺伝子型決定された試料のサブセットの初期分割の例示的なプロットを示す。 複対立遺伝子遺伝子型決定のためのN次元ガウス混合モデルの例を示す。 複対立遺伝子コール率対全ての複対立遺伝子プローブセットを含む平均クラスタ一致の例示的なプロットを示す。 いくつかの変換されたプローブセットに対するコール及び参照遺伝子型の例示的なプロットを示す。 いくつかの変換されたプローブセットに対するコール及び参照遺伝子型の例示的なプロットを示す。 いくつかの変換されたプローブセットに対するコール及び参照遺伝子型の例示的なプロットを示す。 単一遺伝子(例えば、CYP2D6)の遺伝子座特異的増幅と、全ゲノム増幅(WGA)との組み合わせのためのステップのフローに関する例示的な図を示す。 図11に例示される2つの手法を行うことから得られる結果の遺伝子型決定プロットを示す。 本開示の1つ以上の態様に従う、開示される増幅手法におけるワークフローの例示的な図を示す。 本開示の1つ以上の態様に従う、実行可能性について試験された多重プライマーセットの例示的な表を示す。 本開示の1つ以上の態様に従う、オリゴヌクレオチドスパイクイン研究からの遺伝子型決定結果の例を示す。 本開示の1つ以上の態様に従う、15−plex mPCRアッセイからの結果の例示的な表を示す。 本開示の1つ以上の態様に従う、15−plex mPCRアッセイからの結果の例示的な表を示す。
一般
本開示は、多くの好ましい実施形態を有し、当業者に既知の詳細について、多くの特許、出願、及び他の参照文献に依存する。したがって、特許、出願、または他の参照文献が下で引用されるか、または繰り返されるとき、あらゆる目的で、ならびに列挙される命題のために、その全体が参照により組み込まれることが理解されるべきである。
本出願で使用される場合、単数形「a」、「an」、及び「the」は、文脈上明らかに他の意味を示す場合を除き、複数の指示対象を含む。例えば、用語「因子」は、複数の因子を含み、それらの混合を含む。
個体は、ヒトに限定されないが、他の生物であってもよく、哺乳動物、植物、細菌、または上記のうちのいずれかに由来する細胞が挙げられるが、これらに限定されない。
本開示全体で、本開示の様々な態様が範囲形式で提示され得る。範囲形式での記述は、単に便宜性及び簡潔性のためであり、本開示の範囲に対する確固とした限定として解釈されてはならないことが理解されるべきである。したがって、範囲に関する記述は、可能な部分範囲ならびにその範囲内の個々の数値全てを具体的に開示したものとみなされるべきである。例えば、1〜6などの範囲の記述は、例えば1〜3、1〜4、1〜5、2〜4、2〜6、3〜6等の部分範囲、ならびにその範囲内の個々の数、例えば、1、2、3、4、5、及び6を具体的に開示したものとみなされるべきである。これは、範囲の幅にかかわらず該当する。関数ログに対する全ての指示対象は、別途指示されない限り、eを底としてデフォルト設定される(例えば、log.sub.10)。
本開示の実施は、別途示されない限り、有機化学、ポリマー技術、分子生物学(組み換え技法を含む)、細胞生物学、生化学、及び免疫学の従来技法及び記述を用いることができ、それらは当該技術の範囲内である。そのような従来技法としては、ポリマーアレイ合成、ハイブリダイゼーション、結紮、及び標識を使用するハイブリダイゼーションの検出が挙げられる。好適な技法に関する特定の例証は、本明細書における下記の実施例を参照することにより行われてもよい。しかし当然のことながら、他の同等の従来手順が使用されてもよい。そのような従来技法及び記述は、Genome Analysis:A Laboratory Manual Series(Vols.I−IV)、Using Antibodies:A Laboratory Manual、Cells:A Laboratory Manual、PCR Primer:A Laboratory Manual、及びMolecular Cloning:A Laboratory Manual(全てCold Spring Harbor Laboratory Pressから)、Stryer,L.(1995)Biochemistry(4th Ed.)Freeman,N.Y.,Gait,″Oligonucleotide Synthesis:A Practical Approach″1984,IRL Press,London、Nelson and Cox(2000),Lehninger,Principles of Biochemistry 3rd Ed.,W.H.Freeman Pub.,New York,N.Y.、及びBerg et al.(2002)Biochemistry,5th Ed.,W.H.Freeman Pub.,New York,N.Y.,などの標準実験マニュアルに見出すことができ、それらの全てが、あらゆる目的で参照によりそれら全体が本明細書に組み込まれる。
本開示は、いくつかの好ましい実施形態において、アレイを含む固体基質を用いることができる。ポリマー(タンパク質を含む)アレイ合成に適用可能な方法及び技法は、米国出願第09/536,841号、WO00/58516、米国特許第5,143,854号、同第5,242,974号、同第5,252,743号、同第5,324,633号、同第5,384,261号、同第5,405,783号、同第5,424,186号、同第5,451,683号、同第5,482,867号、同第5,491,074号、同第5,527,681号、同第5,550,215号、同第5,571,639号、同第5,578,832号、同第5,593,839号、同第5,599,695号、同第5,624,711号、同第5,631,734号、同第5,795,716号、同第5,831,070号、同第5,837,832号、同第5,856,101号、同第5,858,659号、同第5,936,324号、同第5,968,740号、同第5,974,164号、同第5,981,185号、同第5,981,956号、同第6,025,601号、同第6,033,860号、同第6,040,193号、同第6,090,555号、同第6,136,269号、同第6,269,846号、及び同第6,428,752号、PCT出願第PCT/US99/00730号(国際公開第WO99/36760)及びPCT/US01/04285号に記載されており、それらは全て、あらゆる目的でそれら全体が参照により本明細書に組み込まれる。
特定の実施形態において合成技法を記載している特許としては、米国特許第5,412,087号、同第6,147,205号、同第6,262,216号、同第6,310,189号、同第5,889,165号、及び同第5,959,098号が挙げられる。核酸アレイが、上記特許のうちの多くに記載されているが、同じ技法が、ポリペプチドアレイに適用される。
本開示において有用な核酸アレイとしては、Affymetrix(Santa Clara,Calif.)からブランド名GeneChip(登録商標)で商業的に入手可能なものが挙げられる。例示的なアレイは、ウェブサイト(affymetrix.com)で示されている。
本開示はまた、固体基質に付着させたポリマーの多くの用途を企図する。これらの用途としては、遺伝子発現モニタリング、プロファイリング、ライブラリスクリーニング、遺伝子型決定、及び診断が挙げられる。遺伝子発現モニタリング及びプロファイリング方法は、米国特許第5,800,992号、同第6,013,449号、同第6,020,135号、同第6,033,860号、同第6,040,138号、同第6,177,248号、及び同第6,309,822号に示され得る。したがって、遺伝子型決定及び用途は、米国出願第60/319,253号、同第10/013,598号、及び米国特許第5,856,092号、同第6,300,063号、同第5,858,659号、同第6,284,460号、同第6,361,947号、同第6,368,799号、及び同第6,333,179号に示される。他の用途は、米国特許第5,871,928号、同第5,902,723号、同第6,045,996号、同第5,541,061号、及び同第6,197,506号において具体化されている。
本開示はまた、ある特定の好ましい実施形態において、試料の調製方法を企図する。遺伝子型決定の前またはそれと同時に、ゲノム試料は、様々な機序によって増幅されてよく、それらのうちのいくつかは、PCRを用いる場合がある。例えば、PCR Technology:Principles and Applications for DNA Amplification(Ed.H.A.Erlich,Freeman Press,NY,N.Y.,1992)、PCR Protocols:A Guide to Methods and Applications(Eds.Innis,et al.,Academic Press,San Diego,Calif.,1990)、Mattila et al.,Nucleic Acids Res.19,4967(1991)、Eckert et al.,PCR Methods and Applications 1,17(1991)、PCR(Eds.McPherson et al.,IRL Press,Oxford)、ならびに米国特許第4,683,202号、同第4,683,195号、同第4,800,159号、同第4,965,188号、及び同第5,333,675号を参照されたい。各々があらゆる目的で、それら全体が参照により本明細書に組み込まれる。試料は、アレイ上で増幅され得る。例えば、米国特許第6,300,070号及び米国特許出願第09/513,300号を参照されたい(参照により本明細書に組み込まれる)。
他の好適な増幅方法としては、リガーゼ連鎖反応(LCR)(例えば、Wu and Wallace,Genomics 4,560(1989),Landegren et al.,Science 241,1077(1988)及びBarringer et al.Gene 89:117(1990))、転写増幅(Kwoh et al.,Proc.Natl.Acad.Sci.USA 86,1173(1989)及びWO88/10315)、自律的配列複製(Guatelli et al.,Proc.Nat.Acad.Sci.USA,87,1874(1990)及びWO90/06995)、標的ポリヌクレオチド配列の選択的増幅(米国特許第6,410,276号)、コンセンサス配列プライムポリメラーゼ連鎖反応(CP−PCR)(米国特許第4,437,975)、任意的プライムポリメラーゼ連鎖反応(AP−PCR)(米国特許第5,413,909号、同第5,861,245号)、ならびに核酸ベース配列増幅(NASBA)が挙げられる。(米国特許第5,409,818号、同第5,554,517号、及び同第6,063,603号を参照されたい。各々が参照により本明細書に組み込まれる)。使用され得る他の増幅方法としては、PCT特許出願第PCT/US87/00880号に記載されるQbeta Replicase、Walker et al.1992,Nucleic Acids Res.20(7):1691−6,1992に記載されるSDAなどの等温増幅方法、及び米国特許第5,648,245号に記載されるローリングサークル増幅が挙げられる。使用され得る他の増幅方法は、米国特許第5,242,794号、同第5,494,810号、同第4,988,617号、及び米国出願第09/854,317号、及び米国公開第2003/0143599号に記載されており、各々が参照により本明細書に組み込まれるいくつかの実施形態では、DNAは、多重遺伝子座特異的PCRによって増幅される。他の実施形態では、DNAは、アダプター結紮及び単一プライマーPCRを使用して増幅される。平衡PCR(Makrigiorgos,et al.(2002),Nat Biotechnol,Vol.20,pp.936−9)などの他の使用可能な増幅方法が使用されてもよい。
追加の試料調製方法及び核試料の複雑性を低減するための技法は、Dong et al.,Genome Research 11,1418(2001)、米国特許第6,361,947号、同第6,391,592号、ならびに米国特許出願第09/916,135号、同第09/920,491号、同第09/910,292号、及び同第10/013,598号に記載されている。
ポリヌクレオチドハイブリダイゼーションアッセイを行うための方法は、当該技術分野において十分に開発されてきた。ハイブリダイゼーションアッセイ手順及び条件は、適用に応じて異なり、Maniatis et al.Molecular Cloning:A Laboratory Manual(2.sup.nd Ed.Cold Spring Harbor,N.Y.,1989)、Berger and Kimmel Methods in Enzymology,Vol.152,Guide to Molecular Cloning Techniques(Academic Press,Inc.,San Diego,Calif.,1987)、Young and Davism,P.N.A.S,80:1194(1983)において言及されるものを含む、既知の一般的な結合方法に従って選択される。繰り返しの制御されたハイブリダイゼーション反応を実行するための方法及び装置は、米国特許第5,871,928号、同第5,874,219号、同第6,045,996号、及び同第6,386,749号、同第6,391,623号に記載されており、各々が参照により本明細書に組み込まれる。
本開示はまた、ある特定の好ましい実施形態において、リガンド間のハイブリダイゼーションのシグナル検出を企図する。米国特許第5,143,854号、同第5,578,832号、同第5,631,734号、同第5,834,758号、同第5,936,324号、同第5,981,956号、同第6,025,601号、同第6,141,096号、同第6,185,030号、同第6,201,639号、同第6,218,803号、及び同第6,225,625号、米国特許出願第60/364,731号、ならびにPCT出願第PCT/US99/06097号(WO99/47964として公開)を参照されたい。各々がまた、あらゆる目的で、その全体が参照により本明細書に組み込まれる。
シグナル検出及び強度データの処理のための方法及び装置は、例えば、米国特許第5,143,854号、同第5,547,839号、同第5,578,832号、同第5,631,734号、同第5,800,992号、同第5,834,758号、同第5,856,092号、同第5,902,723号、同第5,936,324号、同第5,981,956号、同第6,025,601号、同第6,090,555号、同第6,141,096号、同第6,185,030号、同第6,201,639号、同第6,218,803号、及び同第6,225,625号、米国特許出願第60/364,731号、ならびにPCT出願第PCT/US99/06097号(WO99/47964として公開)に開示されており、各々がまた、あらゆる目的で、その全体が参照により本明細書に組み込まれる。
本開示の実施はまた、従来の生物学的方法、ソフトウェア、及びシステムを用いることができる。本開示のコンピュータソフトウェア製品は、典型的に、本開示の方法の論理ステップを行うためのコンピュータ実行可能な命令を有するコンピュータ可読媒体を含む。好適なコンピュータ可読媒体としては、フロッピー(登録商標)ディスク、CD−ROM/DVD/DVD−ROM、ハードディスクドライブ、フラッシュメモリ、ROM/RAM、磁気テープ等が挙げられる。コンピュータ実行可能な命令は、好適なコンピュータ言語またはいくつかの言語の組み合わせで記述され得る。基本的な計算生物学方法は、例えば、Setubal and Meidanis et al.,Introduction to Computational Biology Methods(PWS Publishing Company,Boston,1997)、Salzberg,Searles,Kasif,(Ed.),Computational Methods in Molecular Biology,(Elsevier,Amsterdam,1998)、Rashidi and Buehler,Bioinformatics Basics:Application in Biological Science and Medicine(CRC Press,London,2000)、及びOuelette and Bzevanis Bioinformatics:A Practical Guide for Analysis of Gene and Proteins(Wiley&Sons,Inc.,2nd ed.,2001)に記載されている。
本開示はまた、プローブ設計、データ管理、分析、及び用具操作などの様々な目的で、種々のコンピュータプログラム製品及びソフトウェアを利用することができる。米国特許第5,593,839号、同第5,795,716号、同第5,733,729号、同第5,974,164号、同第6,066,454号、同第6,090,555号、同第6,185,561号、同第6,188,783号、同第6,223,127号、同第6,229,911号、及び同第6,308,170号を参照されたい。高密度マイクロアレイ分析を使用する遺伝子型決定に関連するコンピュータ方法を、本方法で使用することもできる。例えば、米国特許公開第2005/0250151号、同第2005/0244883号、同第2005/0108197号、同第2005/0079536号、及び同第2005/0042654号を参照されたい。
追加として、本開示は、米国特許出願第10/063,559号、同第60/349,546号、同第60/376,003号、同第60/394,574号、同第60/403,381号に示されるように、インターネットなどのネットワーク上で遺伝子情報を提供するための方法を含む、好ましい実施形態を有し得る。
定義
本開示に従う核酸は、ピリミジン及びプリン塩基の任意のポリマーまたはオリゴマー、好ましくはそれぞれシトシン、チミン、及びウラシル、ならびにアデニン及びグアニンを含み得る。(Albert L.Lehninger,Principles of Biochemistry,at 793−800(Worth Pub.1982)(あらゆる目的で、その全体が本明細書に組み込まれる)を参照されたい)。実際に、本開示は、任意のデオキシリボヌクレオチド、リボヌクレオチド、またはペプチド核酸成分、及びその任意の化学変異体、例えばこれらの塩基のメチル化、ヒドロキシメチル化、またはグルコシル化形態等を企図する。ポリマーまたはオリゴマーは、組成物中で異種または同種であってよく、天然に存在する起源から単離され得るか、または人工的もしくは合成的に生成され得る。加えて、核酸は、DNAもしくはRNA、またはそれらの混合物であってよく、一本鎖または二本鎖形態(同種二本鎖、異種二本鎖、及びハイブリッド状態を含む)で永久的または移行的に存在し得る。
オリゴヌクレオチドまたはポリヌクレオチドは、少なくとも2、好ましくは少なくとも8、15、または20ヌクレオチド長から最大50、100、1000、もしくは5000ヌクレオチド長であり得る範囲の核酸、またはポリヌクレオチドに特異的にハイブリダイズする化合物であり得る。本開示のポリヌクレオチドは、デオキシリボ核酸(DNA)もしくはリボ核酸(RNA)の配列、または天然起源から単離され得るか、組み換え的に生成され得るか、または人工的に合成され得るその模倣体を含む。本開示のポリヌクレオチドの更なる例は、ペプチド核酸(PNA)であり得る。(米国特許第6,156,501号(その全体が参照により本明細書に組み込まれる)を参照されたい。)本開示はまた、ある特定のtRNA分子内で同定され、三重らせんで存在すると仮定されたフーグスティーン塩基対合などの非伝統的塩基対合が存在する状況を包含する。「ポリヌクレオチド」及び「オリゴヌクレオチド」は、本出願において交換可能に使用される。
用語「ハイブリダイゼーション」は、本明細書で使用される場合、2つの一本鎖ポリヌクレオチドが、非共役的に結合して安定な二本鎖ポリヌクレオチドを形成するプロセスを指し、三本鎖ハイブリダイゼーションも理論的に可能である。結果として生じる(通常)二本鎖ポリヌクレオチドは、「ハイブリッド」である。安定なハイブリッドを形成するポリヌクレオチドの集団の比率は、本明細書において「ハイブリダイゼーションの程度」と称される。ハイブリダイゼーションは、通常ストリンジェントな条件下、例えば、約1M以下の塩濃度及び少なくとも25℃の温度で行われる。例えば、5×SSPE(750mM NaCl、50mM NaPhosphate、5mM EDTA、pH7.4)及び25〜30℃の温度の条件、または100mM MES、1M[Na+]、20mM EDTA、0.01% Tween−20及び30〜50℃の温度、好ましくは約45〜50℃の条件が、対立遺伝子特異的プローブハイブリダイゼーションに好適である。ハイブリダイゼーションは、約0.1mg/mLのニシン精液DNA、約0.5mg/mLのアセチル化BSAなどの薬剤の存在下で行われ得る。塩基組成物及び相補鎖の長さ、有機溶媒の存在及び塩基ミスマッチの程度を含む他の因子が、ハイブリダイゼーションのストリンジェンシーに影響を及ぼし得るため、パラメータの組み合わせは、いずれか1つの単独の絶対尺度よりも重要である。マイクロアレイに好適なハイブリダイゼーション条件は、Gene Expression Technical Manual,2004及びGENECHIP(登録商標)Mapping Assay Manual,2004に記載されている。
用語「断片」は、より大きいDNAポリヌクレオチドまたはDNAの部分を指す。ポリヌクレオチド、例えば、複数の断片に分割され得るか、または断片化され得る。核酸を断片化する種々の方法は、当該技術分野において周知である。これらの方法は、例えば、性質上化学的または物理的のいずれかであり得る。化学的断片化としては、DNaseによる部分分解、酸による部分脱ブリン化、制限酵素の使用、イントロンコードされたエンドヌクレアーゼ、核酸分子内の特定の位置に切断剤を局在化させるために、核酸セグメントの特異的ハイブリダイゼーションに依存する、三重及びハイブリッド形成方法などのDNAベースの切断方法、または既知もしくは未知の位置でDNAを切断する他の酵素もしくは化合物を挙げることができる。物理的断片化方法は、DNAを高せん断速度に供することを必要とし得る。高せん断速度は、例えば、DNAをチャンバもしくはチャネルを通してピットもしくはスパイクで動かすか、またはDNA試料を制限サイズ流路、例えばミクロンもしくはサブミクロンスケールの断面寸法を有する開口に通すことによってもたらすことができる。他の物理的方法としては、音波処理及び噴霧が挙げられる。熱及びイオン媒介の加水分解による断片化などの物理的及び化学的断片化方法の組み合わせも同様に用いることができる。例えば、Sambrook et al.,″Molecular Cloning:A Laboratory Manual,″3rd Ed.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2001)(″Sambrook et al.)(あらゆる目的で、参照により本明細書に組み込まれる)を参照されたい。これらの方法は、核酸を選択されたサイズ範囲の断片に消化するために最適化され得る。有用なサイズ範囲は、25、50、75、100、200、400、700、または1000〜500、800、1500、2000、4000、または10,000塩基対であり得る。しかしながら、4000、10,000、または20,000〜10,000、20,000、または500,000塩基対などの、より大きなサイズ範囲も有用であり得る。
「ゲノム」は、生物のDNAにコードされる、生物に対する遺伝的指令の完全な単一コピーセットを示す、または意味する。ゲノムは、多染色体であってよく、それにより、DNAが複数の個々の染色体間で細胞的に分布される。例えば、ヒトでは、22の染色体対に加えて性関連XXまたはXY対が存在する。
用語「染色体」は、クロマチンに由来し、DNA及びタンパク質構成要素(特にヒストン)を含む、生細胞の遺伝担持遺伝子を指す。従来の国際的に認識されている個々のヒトゲノム染色体付番システムが、本明細書において用いられる。個々の染色体のサイズは、1つの型から所与の多染色体ゲノムを有するものまで、また1種類のゲノムから別のものまで異なり得る。ヒトゲノムの場合では、所与の染色体の全体DNA質量は、通常約100,000,000bp超である。例えば、全体ヒトゲノムのサイズは、約3×10bpである。最大染色体、染色体番号1は、約2.4×10bpを含むが、最小染色体、染色体番号22は、約5.3×10bpを含む。
「染色体領域」は、染色体の部分である。任意の個々の染色体領域の実際の物理的サイズまたは程度は、大幅に異なり得る。領域は、個々の遺伝子の特定のコードセグメント(エクソン)を特定の考慮に入れる必要がないため、用語「領域」は、必ずしも特定の1つ以上の遺伝子に確定的でない。
「アレイ」は、好ましくは固体の支持体と、その支持体に付着した核酸プローブと、を含む。好ましいアレイは、典型的に、異なる既知の位置において基質の表面に連結されている、複数の異なる核酸プローブを含む。「マイクロアレイ」または口語的に「チップ」とも記載されるこれらのアレイは、概して、当該技術分野において、例えば、米国特許第5,143,854号、同第5,445,934号、同第5,744,305号、同第5,677,195号、同第5,800,992号、同第6,040,193号、同第5,424,186号、及びFodor et al.,Science,251:767−777(1991)に記載されている。これらの各々は、あらゆる目的で、その全体が参照により組み込まれる。
アレイは、一般に、機械的合成方法、またはフォトリソグラフィ方法と固相合成方法との組み合わせを組み込む光指向性合成方法などの、様々な技法を使用して生成され得る。機械的合成方法を使用するこれらのアレイの合成のための技法は、例えば、米国特許第5,384,261号及び同第6,040,193号に記載されており、あらゆる目的で、それら全体が参照により本明細書に組み込まれる。平坦なアレイ表面が好ましいが、このアレイは、実質的に任意の形状の表面または更には多数の表面上に作成され得る。アレイは、ビーズ、ゲル、ポリマー表面、光ファイバーなどのファイバー、ガラス、または任意の他の適切な基質上の核酸であり得る。(米国特許第5,770,358号、同第5,789,162号、同第5,708,153号、同第6,040,193号、及び同第5,800,992号(あらゆる目的で、それら全体が参照により本明細書に組み込まれる)を参照されたい。)
好ましいアレイは、Affymetrixからブランド名GeneChip(登録商標)及びAxiom(登録商標)で商業的に入手可能であり、様々な真核種及び原核種の遺伝子型決定及び遺伝子発現モニタリングを含む、様々な目的を対象とする。(Affymetrix Inc.,Santa Clara及びそのウェブサイト(affymetrix.com)を参照されたい。)他の商業的に入手可能なアレイとしては、Infinium(登録商標)アレイ(Illumina,Inc.,San Diego,California)及びSurePrint(登録商標)アレイ(Agilent Technologies,Inc.,Santa Clara,California)が挙げられる。
対立遺伝子は、細胞、個体内、または集団内の遺伝的配列(遺伝子など)の1つの特異的な形態、少なくとも1つの配列内の同じ遺伝子の他の形態とは異なる特定の形態、及び遺伝子の配列内の、多くの場合1ヶ所を超える変異体部位を指す。異なる対立遺伝子間で異なるこれらの変異体部位における配列は、「変異」、「多型」、または「突然変異」と呼ばれる。各常染色体特異的染色体位置または「遺伝子座」において、個体は2つの対立遺伝子を有し、1つは一方の親から、1つはもう一方の親から受け継がれ、例えば、1つは母親から、1つは父親から受け継がれる。遺伝子座に2つの異なる対立遺伝子を有する場合、個体は、その遺伝子座において「ヘテロ接合性」である。遺伝子座に2つの同一の対立遺伝子を有する場合、個体は、その遺伝子座において「ホモ接合性」である。
多型は、集団における2つ以上の遺伝子的に決定された代替配列または対立遺伝子の発生を指す。多型マーカーまたは部位は、分岐が発生する遺伝子座である。好ましいマーカーは、少なくとも2つの対立遺伝子を有し、各々が好ましくは選択された集団の1%を超える頻度、より好ましくは10%または20%を超える頻度で発生する。多型は、1つ以上の塩基変更、挿入、反復、または欠失を含み得る。多型遺伝子座は、1つの塩基対のように小さい場合がある。多型マーカーとしては、制限断片長多型、タンデム反復数(VNTR)、超可変領域、ミニサテライト、ジヌクレオチド反復、トリヌクレオチド反復、テトラヌクレオチド反復、単純配列反復、及びAluなどの挿入要素が挙げられる。最初に同定された対立遺伝子形態は、参照形態として任意に指定され、他の対立遺伝子形態は、代替または変異体対立遺伝子として指定される。選択された集団において最も頻繁に発生する対立遺伝子形態は、野生型形態と称されることもある。二倍体生物は、対立遺伝子形態に対してホモ接合性またはヘテロ接合性であり得る。二対立遺伝子(diallelic)または二対立遺伝子(biallelic)多型は、2つの形態を有する。三対立遺伝子多型は、3つの形態を有する。複対立遺伝子多型は、2つ以上の形態を有する。2つの核酸間の多型は、自然に発生し得るか、あるいは化学物質、酵素、もしくは他の因子への曝露もしくは接触、または核酸に損傷を引き起こす因子、例えば、紫外線照射、突然変異原、もしくは発癌物質への曝露によって引き起こされ得る。一塩基多型(SNP)は、ヒト集団において少なくとも2つの代替塩基が適切な頻度(1%超)で発生する位置であり、ヒト遺伝的変異の最も一般的な型である。複対立遺伝子マーカーは、3つ以上の可能な対立遺伝子を有するSNPまたはインデルを含み得る。
本明細書において交換可能に使用され、当該技術分野において一般に理解される用語「一塩基多型プローブ」または「SNPプローブ」は、特定の一塩基多型を照合するように設計された1つ以上のオリゴヌクレオチドのセットを指す。そのようなプローブは、一般に、アレイ上のそれらの位置に従って同定されるが、例えば、バーコード様式のタグ配列、検出可能な標識、プローブが付着される区別可能な固体支持体、または当該技術分野において既知の様々な他の手段の使用によって同定することもできる。Axiom(登録商標)アッセイ(Affymetrix,Inc.,Santa Clara,CA)またはInfinium(登録商標)IIアッセイ(Illumina,Inc.,San Diego,CA)などの当該技術分野において既知のある特定のアッセイにおいて、試料へのハイブリダイゼーション後に、試料配列における次の塩基に相補的な照合塩基が、SNPプローブに付加され(次いで、試料との少なくとも部分的に二本鎖の複合体を形成する)、付加された照合塩基からの直接的または間接的に検出可能なシグナルを使用して、付加された照合塩基の同定を決定し、それから関連対立遺伝子の同定が決定される。付加された照合塩基は、当該技術分野において既知の様々な技法によって、例えば結紮または一塩基延長によって付加されてよい。当該技術分野において既知のとおり、ある特定のアレイアッセイは、多型に対して順方向または逆方向のいずれかの透視から設計されたSNPプローブを利用し、したがって、プローブ設計の間、プローブは、多型の左または右のいずれかの配列に相補的であり得る。結紮ベースの照合手法の非限定例は、US2008/0131894に開示されている。
用語「遺伝子型決定」は、個体がゲノムにおける1つ以上の位置に運ぶ遺伝情報の決定を指す。例えば、遺伝子型決定は、個体がどの対立遺伝子(複数可)を単一SNPに運ぶかの決定、または個体がどの対立遺伝子(複数可)を複数のSNPに運ぶかの決定を含み得る。例えば、ゲノムにおける特定のヌクレオチドは、一部の個体においてA、他の個体においてCであり得る。その位置にAを有する個体は、A対立遺伝子を有し、Cを有するものは、C対立遺伝子を有する。二倍体生物において、個体は、多型位置を含む配列の2つのコピーを有することになるため、個体は、A対立遺伝子及びC対立遺伝子を有し得るか、または代替として、A対立遺伝子の2つのコピーもしくはC対立遺伝子の2つのコピーを有し得る。C対立遺伝子の2つのコピーを有する個体は、C対立遺伝子に対してホモ接合性であり、A対立遺伝子の2つのコピーを有する個体は、C対立遺伝子に対してホモ接合性であり、各対立遺伝子の1つのコピーを有する個体は、ヘテロ接合性である。アレイは、これら3つの可能な結果の各々を区別するように設計され得る。多型位置は、2つ以上の可能な対立遺伝子を有してよく、アレイは、全ての可能な組み合わせを区別するように設計され得る。
遺伝子型決定は、単一多型、例えば、単一ヌクレオチド多型もしくは単一塩基インデルに存在する情報、または複合体もしくは多塩基インデルなどの多塩基位置に存在する情報を指し得る。例えば、SNPが二対立遺伝子であり、AまたはCのいずれかであり得る場合、次いで個体が、その位置でAに対してホモ接合性である場合、SNPの遺伝子型は、ホモ接合性AまたはAAである。SNPはまた、複対立遺伝子であってよく(二対立遺伝子に対して)、3つ以上の可能な対立遺伝子変異体を有し得る。遺伝子型は、複数の多型位置に存在する情報を指し得る。
用語「プライマー」は、本明細書において使用される場合、好適な条件下(例えば、緩衝剤及び温度)、4つの異なるヌクレオシド三リン酸塩及び重合のための因子、例えば、DNAもしくはRNAポリメラーゼまたは逆転写酵素などの存在下で、テンプレート指向性DNA合成の開始点として作用可能な一本鎖オリゴヌクレオチドを指す。任意の所与の場合、プライマーの長さは、例えば、プライマーの意図した用途に依存し、一般に15〜30ヌクレオチドの範囲である。短プライマー分子は、一般に、テンプレートを用いて十分に安定なハイブリッド複合体を形成するために、より低い温度を必要とする。プライマーは、テンプレートの正確な配列を反映する必要はないが、そのようなテンプレートでハイブリダイズするために十分に相補的でなければならない。プライマー部位は、プライマーがハイブリダイズするテンプレートの領域である。プライマー対は、増幅される配列の5’端とハイブリダイズする5’上流プライマー、及び増幅される配列の3’端の相補体とハイブリダイズする3’下流プライマーを含む、プライマーのセットである。
用語「事前値(prior)」は、明細書において名詞として使用される場合、パラメータの推定値に加えて、任意の(現在の)データが観測される前に算出に入れられるそのパラメータの分布における不確実性を指す。これは、ベイジアン統計における標準記法である。遺伝子型クラスタ中心位置及び分散の推定値のような値は、事前値として使用され得る(他のデータセットまたはユーザが入力した量から得られるものなど)。
用語「プローブ」は、本明細書において使用される場合、特定の標的によって認識され得る表面固定化分子を指す。プローブと、10個、12個、及びより多くの塩基との全ての可能な組み合わせを有するアレイの例については、米国特許第6,582,908号を参照されたい。本開示によって調査され得るプローブの例としては、細胞膜受容体、毒素、及び毒液のアゴニスト及びアンタゴニスト、ウイルスエピトープ、ホルモン(例えば、オピオイドペプチド、ステロイド等)、ホルモン受容体、ペプチド、酵素、酵素基質、共因子、薬物、レクチン、糖、オリゴヌクレオチド、核酸、オリゴ糖、タンパク質、及びモノクローナル抗体が挙げられるが、これらに限定されない。本開示のいくつかの実施形態では、プローブは、一般に30塩基長のガラス結合されたオリゴヌクレオチドを含み得る。プローブの長さを調整して、高GCまたは低GC標的配列を補償することができ、GCは、標的配列におけるグアニン−シトシン含有量を表す。プローブの可変位置は、プローブの3’端における結紮部位にあっても、それに隣接していても、プローブの中心に向かっていても、結紮部位から離れていてもよい。
多型を分析するための対立遺伝子特異的プローブの設計及び使用は、例えば、Saiki et al.,Nature 324,163−166(1986)、Dattagupta,EP235,726、Saiki、及びWO89/11548によって記載されている。1つの個体からの標的DNAのセグメントをハイブリダイズするが、2つの個体からのそれぞれのセグメントにおける異なる多型形態の存在に起因して、別の個体からの対応するセグメントにハイブリダイズしない対立遺伝子特異的プローブが設計され得る。ハイブリダイゼーション条件は、対立遺伝子間のハイブリダイゼーション強度、及び好ましくは本質的に二値応答に有意差があるように十分にストリンジェントであるべきであり、これにより、プローブは、対立遺伝子のうちの1つのみにハイブリダイズする。
例示的実施形態
種々の実施形態に関する以下の説明では、上で特定され、その一部を形成する添付の図面が参照され、本明細書に記載される態様が実施され得る様々な実施形態が、例証として示される。他の実施形態を利用することができ、本明細書に記載される範囲から逸脱することなく、構造的及び機能的修正を行ってよいことが理解されるべきである。種々の態様は、他の実施形態が可能であり、種々の異なる方法で実施または実行することが可能である。
アレイベースのゲノム分析は、一般に、各々が少なくとも1つのプローブセットを有する非常に多くのSNP及び他の多型を標的とし、プローブセットは、特定のSNPの存在を決定するために使用されるオリゴヌクレオチド配列のセットを含む。例えば、プローブは、二対立遺伝子の対またはセット、及び複対立遺伝子プローブセットに組織化されてよく、各々が標的マーカーを照合する。いくつかのシステムでは、多くの多型は、2つ以上の異なるプローブセットを有してよく、異なるプローブセットの各々を用いて、多型について可能な遺伝子型決定結果を提供する。一方法では、個々の試料は、遺伝子型決定アレイまたは他のプローブセットシステムに曝露され、試料中の異なる多型対立遺伝子の存在を判別する。ほとんどの生物は、全ての染色体の複数コピーを有するため、同じ試料に対して異なる対立遺伝子が検出され得る。したがって、試料は、一般に各多型の複数の対立遺伝子(例えば、2つ以上)を特徴とする。多型に対して複数の対立遺伝子を決定することは、一般に、当該技術分野において遺伝子型決定またはSNP遺伝子型決定と称される。
最近の遺伝子型決定アレイの一例では、Affymetrix,Inc.からのAxiom(登録商標)遺伝子型決定アレイが、1アレイ当たり1,500〜260万個のSNPのカスタマイズ可能な選択から遺伝子型決定することができる。全体アレイは、オリゴヌクレオチドプローブでタイル配置(集合)されてよく、数千個のSNP及びゲノムプローブをアッセイすることができる。プローブは、標的試料からの標識化DNAに結合する。一般に、分析ソフトウェアを使用して、格子状画像上の蛍光を発する各DNA−プローブ複合体の明度を定量化する。高強度スポットは、プローブと標的DNA配列との間の高い親和性を示し、それらを使用して、個々のSNAの遺伝子型をデコードする。Affymetrixは、ヒト、イヌ、及び他のマウスアレイを含む、他のアレイを提供する。
SNPまたは多型遺伝子型コーリングは、どの対立遺伝子が多型位置に存在するかを決定するプロセスを指す。二対立遺伝子多型には、一般に、ある位置に存在し得る2つの異なる塩基対があり、対立遺伝子A及び対立遺伝子Bと称され得る。SNPの遺伝子型は、一般に(A、A)、(B、B)、または(A、B)のうちの1つである。最初の2つの遺伝子型は、一般に同種と称され、最後は異種と称される。複対立遺伝子多型には、N個の異なる塩基対が存在してよく、Nは、2を超える任意の数であり得る。例えば、N=3の場合、ある位置に存在し得る3つの異なる塩基対が存在してよく、対立遺伝子A、対立遺伝子B、及び対立遺伝子Cを含む。複対立遺伝子SNPの遺伝子型は、(A、A)、(B、B)、(A、B)、(A、C)、(B、C)、または(C、C)のうちの1つであり得る。
複対立遺伝子マーカーにおける追加の変異体を扱うために、改善された遺伝子型決定アルゴリズム及び方法が必要である。下でより詳細に記載される主題に対する一般的な導入として、本明細書に記載される態様は、複対立遺伝子マーカーを遺伝子型決定するために、1つ以上のソフトウェアプログラム、論理モジュール、及びデータ捕捉システムを含むシステム及び方法に向けられる。複対立遺伝子遺伝子型決定方法は、遺伝子型コールを、ベイジアンN−対立遺伝子遺伝子型決定を使用して、2つ以上の可能な変異体を有するマーカーに割り当てることを対象とする。このベイジアンN−対立遺伝子遺伝子型決定(BANG)アルゴリズムは、二倍体ゲノム内の遺伝子型複対立遺伝子マーカーを遺伝子型決定するために開発され、このアルゴリズムは、任意数の対立遺伝子(N)を扱うことが意図される。BANGアルゴリズムは、1000 Genomes Project(第3相)から得られ、360試料(HapMap 270+LWK)においてアッセイされた約100,000個の複対立遺伝子マーカーの約150,000個のプローブセットに対して試験されてきた。1000 Genomesに対するコール率及び一致の妥当な変換基準を使用して、プローブセットの約40%が、アルゴリズムパラメータ調整またはSNP特異的事前値なしに、初回通過分析において良好な性能を示した。
BANGアルゴリズムは、各々が正確に1つの予想される対立遺伝子に特異的なプローブ及び結紮チャネル対の設計を利用することができる。例えば、AffymetrixのAxiom(登録商標)遺伝子型決定アレイは、マイクロアレイ基質上でオリゴヌクレオチドプローブを用いる2色結紮ベースアッセイを用いる。アレイ上の各位置は、特徴部と称され、単一プローブの多くの事例を含む。いくつかの実施形態では、特徴部は、5×5または6×6ミクロンの寸法であり得る。アレイにおける各特徴部は、SNP部位に隣接しているゲノム配列に相補的な固有のオリゴヌクレオチド配列の多くの事例を含み得る。2つの染料のうちの1つに対する付着部位を担持する溶液プローブは、SNP部位の塩基に応じて(例えば、AまたはT、対GまたはC)、ガラスプローブ/標的複合体にハイブリダイズし、次いで特異性について結紮される。Axiom(登録商標)2色システムは、結果として生じる蛍光部分に基づいて、AまたはT対GまたはCの結紮を区別することができる。
プローブと結紮チャネルとの固有の組み合わせを使用して、標的配列に存在する対立遺伝子を判別することができる。試料の標的配列に存在する対立遺伝子は、結紮チャネルを使用して判別され、結果として生じる蛍光部分によって、AもしくはTヌクレオチドの結紮、またはGもしくはCヌクレオチドの結紮を区別することができる。すなわち、いくつかの実施形態では、試料の標的配列に存在する対立遺伝子は、示差的に標識されたオリゴヌクレオチドをアレイ上の複数のプローブに結紮することによって判別され、標識化オリゴヌクレオチドの3’端におけるA、T、C、またはGヌクレオチドでの標識化オリゴヌクレオチドの結紮を区別することができる。他の実施形態では、試料の標的配列に存在する対立遺伝子は、示差的に標識されたヌクレオチドでの、アレイ上の複数のプローブの単一塩基延長を使用することによって判別され、A、T、C、またはGヌクレオチドでの延長を区別することができる。
プローブ及び予想される結紮チャネルの集合を含むプローブセットは、特異的マーカーの種々の可能な対立遺伝子をアッセイすることが意図され得る。更に、BANGアルゴリズムは、多数の試料から強度データを取得する際に実装することができ、試料当たりの対立遺伝子ごとにシグナル値をもたらす。
図1は、本発明の実施形態のソフトウェアを実行するために使用され得るコンピュータソフトウェアの例を示す。図1は、ディスプレイ3、スクリーン5、キャビネット7、キーボード9、及びマウス11を含むコンピュータシステム1を示す。マウス11は、グラフィカルユーザインターフェースと相互作用するための1つ以上のボタンを有し得る。キャビネット7は、CD−ROMドライブ13、システムメモリ、及びハードドライブ(図2を参照されたい)を収容し、これらを利用して、本発明を実装するコンピュータコードを組み込むソフトウェアプログラム、本発明と共に使用するためのデータ等を記憶し、検索することができる。CD−ROM15は、例示的なコンピュータ可読記憶媒体として示されるが、フロッピー(登録商標)ディスク、テープ、フラッシュメモリ、システムメモリ、及びハードドライブを含む他のコンピュータ可読記憶媒体が利用されてもよい。追加として、搬送波で(例えば、インターネットを含むネットワークで)具体化されるデータシグナルは、コンピュータ可読記憶媒体であり得る。
図2は、本発明の実施形態のソフトウェアを実行するために使用されるコンピュータシステム1のシステムブロック図を示す。図1と同様に、コンピュータシステム1は、モニター3及びキーボード9、ならびにマウス11を含む。コンピュータシステム1は、好適なコンピューティングシステムの単なる一例であり、本開示に含まれる用途または機能性の範囲に関していかなる制限も示唆することを意図しない。コンピュータシステム1は、図1及び2に示される構成要素のうちのいずれか1つまたは組み合わせに関するいかなる依存性または要件も有すると解釈されてはならない。
コンピュータシステム1は、中央処理装置51、システムメモリ53、固定ストレージ55(例えば、ハードドライブ)、リムーバブルストレージ57(例えば、CD−ROMドライブ、フロッピー(登録商標)ディスク、USBドライブ)、ディスプレイアダプター59、サウンドカード61、スピーカー63、及びネットワークインターフェース65などのサブシステムを更に含む。本発明と共に使用するために好適な他のコンピュータシステムは、追加の、またはより少ないサブシステムを含み得る。例えば、別のコンピュータシステムは、1つより多くのプロセッサ51(すなわち、マルチプロセッサシステム)またはキャッシュメモリを含み得る。
コンピュータシステム1のシステムバスアーキテクチャは、矢印67によって表される。しかしながら、これらの矢印は、サブシステムにリンクする役割を果たす任意の相互接続スキームを例証している。例えば、ローカルバスを利用して、中央処理装置をシステムメモリ及びディスプレイアダプターに接続することができる。図2に示されるコンピュータシステム1は、本発明と共に使用するために好適なコンピュータシステムの単なる例である。異なる構成のサブシステムを有する他のコンピュータアーキテクチャが利用されてもよい。
いくつかの態様では、コンピュータシステム1は、様々なコンピュータ可読媒体を含み得る。コンピュータ可読媒体は、コンピュータシステム1によってアクセスされ得る任意の使用可能な媒体であってよく、非一時的であり得、コンピュータ可読命令、オブジェクトコード、データ構造、プログラムモジュール、または他のデータなどの情報の記憶のために任意の方法または技術で実装される、揮発性及び非揮発性の、リムーバブル及び非リムーバル媒体を含み得る。コンピュータ可読媒体の例としては、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電子的に消去可能なプログラム可能読み取り専用メモリ(EEPROM)、フラッシュメモリ、または他のメモリ技術、コンパクトディスク読み取り専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)、または他の光学ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ、もしくは他の磁気ストレージデバイス、あるいは所望の情報を記憶するために使用することができ、かつコンピュータシステム1によってアクセスされ得る任意の他の媒体を挙げることができる。
必要とされないが、本明細書に記載される種々の態様は、データ処理システムとして、またはコンピュータ実行可能命令を記憶するコンピュータ可読媒体として具体化され得る。例えば、開示される実施形態の態様に従う方法のステップをプロセッサに行わせる命令を記憶するコンピュータ可読媒体が企図される。例えば、本明細書に開示される方法ステップ及びアルゴリズムの態様は、コンピュータシステム1のプロセッサ上で実行され得る。そのようなプロセッサは、コンピュータ可読媒体上に記憶されたコンピュータ実行可能命令を実行することができる。
ソフトウェアは、メモリ53及び/またはストレージ(例えば、固定ストレージ55またはリムーバルストレージ57)内に記憶され、コンピュータシステム1が種々の機能を行うことを可能にするように、プロセッサ57に命令を提供することができる。例えば、メモリ53は、コンピュータシステム1によって使用されるソフトウェアを記憶することができ、オペレーティングシステム、アプリケーションプログラム、及び関連データベースが挙げられるが、これらに限定されない。また、コンピュータシステム1に対するコンピュータ実行可能命令の一部または全てが、ハードウェアまたはファームウェアにおいて具体化されてもよい。図示されていないが、メモリ53は、メモリに記憶されたアプリケーションデータを表す1つ以上のアプリケーションを含み得るが、コンピュータシステム1はオンであり、対応するソフトウェアアプリケーション(例えば、ソフトウェアタスク)は、コンピュータシステム1上で実行する。
ネットワークインターフェース65は、コンピュータシステム1が、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、または他のネットワークを含む任意のネットワーク接続上で他のデバイスと通信することを可能にし得る。例えば、コンピュータシステム1は、インターネットまたは他の種類のコンピュータネットワーク上で通信を確立することができる。いくつかの実施形態では、コンピュータシステム1は、アレイを走査するために使用され得る光学走査装置などの他のデバイスと通信し得る。例えば、走査装置は、標的分子と関連した標識からの蛍光もしくは他の発光を検出することによって、または伝搬、反射、または散乱した照射線を検出することによって標的を撮像することができる。走査装置は、検出された発光または反射光の波長の強度(及び恐らくは検出された波長と関連付けられ得る色などの他の特徴)を表すシグナル、ならびにその発光または反射波長が検出されたアレイ基質上の位置を提供することができる。典型的に、シグナルは、走査された基質の領域に対応する強度情報を含む。いくつかの実施形態では、コンピュータシステム1は、走査装置からのシグナル(例えば、全ての試料及び全ての可能な対立遺伝子についてのシグナルデータ)を、ネットワークインターフェース65を通じて入手または収集し、データを適宜に記憶された命令に処理することができる。
本開示は、多くの他の一般目的または特殊目的コンピューティングシステム環境または構成で操作される。開示される実施形態との使用に好適であり得る周知のコンピューティングシステム、環境、及び/または構成の例としては、パーソナルコンピュータ(PC)、サーバーコンピュータ、携帯型またはラップトップデバイス、スマートフォン、マルチプロセッサシステム、マイクロプロセッサベースシステム、光学走査装置、測定デバイス/器具、セットトップボックス、プログラム可能コンシューマー電子機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記システムまたはデバイスのうちのいずれかを含む分散コンピューティング環境等が挙げられるが、これらに限定されない。本発明との使用に好適なコンピュータシステムはまた、測定器具に埋め込まれてもよい。
いくつかの例では、ベイジアンN−対立遺伝子遺伝子型決定(BANG)アルゴリズム及び他の遺伝子型決定アルゴリズムは、コンピュータシステム1上で記憶及び/または実装され得る。複対立遺伝子遺伝子型決定アルゴリズムは、複対立遺伝子マーカーについて試料から得られた強度データに適用され得る。
アルゴリズム詳細
BANGアルゴリズムは、以下のステップで進めることができる。最初に、アルゴリズムは、複数の試料における各対立遺伝子についてバックグラウンドシグナルを推定することができる。次いで、アルゴリズムは、対立遺伝子の対を判別し、Affymetrix,Inc.からのAxiom(登録商標)GT1またはBRLMM−Pアルゴリズム、またはIllumina,Inc.からのGenTrainアルゴリズムを用いるGenCallソフトウェアなどの二対立遺伝子遺伝子型決定アルゴリズムを使用して、適切な試料を遺伝子型決定して、試料の大部分または全ての初期コールを入手する。次に、共役事前値を対応する試料のシグナルと組み合わせて、各二倍体遺伝子型クラスタに対応するシグナルの事後値、多変量正規分布を入手し、遺伝子型の最終割り当てを、各分布におけるメンバーシップの確率に基づいて試料に割り当てることができる。
いくつかの実施形態では、複対立遺伝子遺伝子型決定は、対立遺伝子対を同定するための二対立遺伝子遺伝子型決定技法を活用することができる。例えば、二対立遺伝子遺伝子型決定では、対立遺伝子強度データは、対数シグナル空間において、コントラスト及びサイズ値(例えば、シグナル強度)に変換され得る。図3は、対立遺伝子強度の、コントラスト及びサイズへの対数変換の例示的なプロットを示す。本明細書において使用されるデータは、人工のものであり、単に例証のために使用される。以下の等式を使用して、対立遺伝子A及び対立遺伝子Bの強度に基づいてコントラスト及びサイズの値を算出することができる。

次いで、変換された強度データをクラスタ化して、初期コールを割り当てるためにデータを分割することができる。各対立遺伝子対について、全ての試料からのそれらの対立遺伝子に対するシグナルを、Axiom(登録商標)GT1アルゴリズムを使用してクラスタ化し、SNP特異的事前値及びアルゴリズムパラメータを用いることができる。すなわち、各対立遺伝子対を表すクラスタが存在し得る。
図4は、二対立遺伝子遺伝子型決定アルゴリズムにおいてクラスタに割り当てられる試料の例示的なプロットを示す。図4におけるプロットは、対立遺伝子対BB、AB、及びAAのクラスタ、ならびに二次元空間の下のグラフにプロットされる密度を表す。変換された強度のプロットに基づいて、試料を異なるクラスタに割り当てることができ、データの対数尤度は、分布及びクラスタ割り当てを考慮して計算される。例えば、アルゴリズムは、X軸上のデータ間で垂直境界の全ての可能な配置を評価し、各区分について、クラスタ位置に関するデータ及びベイジアン事前値の組み合わせを考慮して、事後値尤度を計算することができる。クラスタ中心及び分散は、最も可能性のあるデータ区分を使用してデータ及び事前値の重み付き組み合わせから推定され得る。追加として、クラスタの各々における各試料の事後確率を計算することができる。クラスタのうちのいずれにも一致しない試料を同定し、「ocean」クラスタに追加することができ、確率は再正規化され得る。コールは、最高事後確率を有するクラスタに割り当てられてよく、この最高事後確率が低すぎる場合、コールは割り当てられない場合がある。
複対立遺伝子遺伝子型決定も同様に、Axiom(登録商標)GT1アルゴリズムを利用して、初期クラスタを設定し、最終遺伝子型コール及び信頼レベルを割り当てることができる。しかしながら、複対立遺伝子遺伝子型決定アルゴリズムはまた、尤度算出をn次元空間まで拡大し、クラスタのうちのいずれにも良く適合しない試料について追加される「ocean」クラスタと共に、各クラスタに属する各試料の事後確率を算出することができる。
図5は、複対立遺伝子遺伝子型決定方法の高レベルフローチャートを示す。図5のフローチャートは、BANGアルゴリズムに関与するステップの概要を提供する。
シグナル収集及びバックグラウンド推定
シグナルデータは、最初に全ての試料及び全ての可能な対立遺伝子について収集することができ、各試料は、2つより多くのシグナル値、1対立遺伝子当たり1つを有し得る。いくつかの実施形態では、試料中の複対立遺伝子マーカーに対するシグナルの取得は、複対立遺伝子マーカーを測定するための、アレイ上の複数のプローブとの試料のハイブリダイゼーションに基づき得る。試料は、全ての可能な二対立遺伝子の組み合わせにおいて、Axiom(登録商標)GT1アルゴリズムを使用して遺伝子型決定され得る。
アルゴリズムは、複対立遺伝子マーカーにおける各対立遺伝子(変異体)について、メトリクスを集めることができ、3個未満の変異体を有するマーカーをスキップする。各セットにおける対立遺伝子を分類し、二対立遺伝子対の各々について、メトリクスを集めることができる。照合される変異体の各々は、二対立遺伝子セットに対合されてもよく、各二対立遺伝子セットが遺伝子型決定され得る。例えば、3つの対立遺伝子A、B、及びCが潜在的に存在する場合、全ての試料は、A/B、A/C、及びB/C対立遺伝子の組み合わせを考慮して3度遺伝子型決定され得る。
対立遺伝子の各対について、全ての試料からのそれらの対立遺伝子に対するシグナルを、Axiom(登録商標)GT1アルゴリズムを使用してクラスタ化することができ、SNP特異的事前値及びアルゴリズムパラメータを用いることもできる。
ホモ接合体クラスタに割り当てられた各試料について、他の対立遺伝子シグナルを、その他の対立遺伝子に対する平均バックグラウンドシグナルの算出に含めることができる。例えば、対立遺伝子Aと対立遺伝子Bのクラスタ化において、AAクラスタにおける試料のBシグナルを、Bバックグラウンドシグナルの集合に追加することができる。同様に、BBクラスタにおける試料のAシグナルを、Aバックグラウンドシグナルの集合に追加することができる。このプロセスは、対立遺伝子の各対について繰り返すことができ、バックグラウンドシグナルの平均及び標準偏差を、各対立遺伝子について算出することができる。いくつかの実施形態では、対立遺伝子バックグラウンドシグナルの各々を、全ての対立遺伝子対合にわたって平均化することができるが、他の実施形態では、各対立遺伝子の独立したバックグラウンドシグナル推定値を入手することができる。
全ての試料がAA、AB、またはAC遺伝子型を有することが見出された場合、対立遺伝子Aバックグラウンドシグナルの推定値がない場合がある。対立遺伝子がいかなるバックグラウンドシグナルも有しないような場合、他の対立遺伝子の平均バックグラウンドシグナルの重み付き平均及びそれらの標準偏差の重み付き平均を代わりに使用することができる。いくつかの実施形態では、対立遺伝子に対するバックグラウンドシグナルの平均、分散、及び標準偏差を算出するために使用可能な値がない場合、大域的推定バックグラウンドシグナルを、対立遺伝子に使用することができる。大域的推定バックグラウンドシグナルは、全ての対立遺伝子に対する複数のバックグラウンドシグナルの平均であり得る。
各対合クラスタ化において、バックグラウンドシグナルは、問題の2つの対立遺伝子に対してのみ選択され得ることに留意されたい。すなわち、A対Bクラスタ化において、Cバックグラウンドシグナルは、選択されない場合がある。試料が、様々な対合クラスタ化において1つより多くの他の対立遺伝子のホモ接合体と呼ばれる場合、この試料はまた、同じバックグラウンド推定に対して1回より多く寄与することができる。
特定の事前値は、遺伝子型決定ラウンドの間に使用される事前値とは異なり得るため、これらの事前値は、バックグラウンド算出ステップ中のオプションとして許容され得る。事前値が提供されない場合、汎用値が使用されてもよい。プローブセットのシグナル及びバックグラウンドは、試料サイズが0を超える場合に算出され得る。そうでなければ、これらのメトリクスは、試料サイズが1未満である場合、0に設定され得るチャネルバックグラウンドの標準偏差を例外として、−1に設定され得る。
二対立遺伝子対の各対立遺伝子についてのメトリクスは、二対立遺伝子プローブセットに対するホモ接合体コールのシグナルから派生し得る。対立遺伝子に対する平均シグナル(avgSigallele)は、その対立遺伝子(allelehom)に対するホモ接合体コールのシグナルを合計し、次いでこれらのシグナル(nSigallele)に寄与した試料の総数で割ることによって派生され得る。対立遺伝子(bgndallele)のバックグラウンド値は、コールが対立遺伝子(Σallelein hom call not=allele)に一致しないとき、ホモ接合体コール中に、その対立遺伝子に対するシグナルを付加することによって算出され得る。対立遺伝子(avgBgndallele)のバックグラウンドの平均は、対立遺伝子からのこれらのシグナルの合計をシグナルの数で割ることによって算出することができる。分散(varianceBgndallele)及び標準偏差(stdevBgndallele)もまた、対立遺伝子に対するバックグラウンドシグナルについて算出され得る。所与の対立遺伝子のバックグラウンドにおいて見出される平均シグナルは、所与の対立遺伝子の個々のバックグラウンド閾値を設定するために、複数の標準偏差に付加され得る。
バックグラウンドシグナルの平均シグナル、バックグラウンドシグナル、平均、分散、標準偏差、及びそれぞれの各対立遺伝子についての他のパラメータは、以下の等式を使用して算出することができる。







全てのチャネルに寄与したシグナルの総数を算出することもできる。全てのプローブセット(nps)に対する全体平均バックグラウンド(allAvgBgnd)及び標準偏差(allAvgStDev)は、複対立遺伝子のセットにおける全てのプローブセットにわたって、重み付き平均バックグラウンド及び重み付き平均標準偏差の値を平均化することによって算出され得る。全体重み付き平均バックグラウンド(allWeightedAvgBgnd)値及び全体重み付き平均標準偏差(allWeightedAvgStDev)はまた、これらのメトリクスの平均値を合計し、それらを総重量に寄与する試料の数によって重み付けした後、この値を試料の数で割ることによって算出され得る。バックグラウンドにシグナルを有しないことに起因して個々の対立遺伝子閾値のセットを有していなかった対立遺伝子のバックグラウンド閾値を算出することができる。この算出は、重み付き平均標準偏差に、パラメータSIG_THRESHOLD_VAR_MULTIPLEによって特定される設定因子を掛けることを必要とし得る(例えば、現在のデフォルトは2であり得る)。この値を、全体重み付き平均バックグラウンドに付加することができる。





図6A、6B、及び6Cは、各対立遺伝子のバックグラウンドシグナル算出の例示的なプロットを示す。各複対立遺伝子マーカーについて、全ての試料を全ての可能な二対立遺伝子の組み合わせにクラスタ化することができ、結果として生じるホモ接合性コールを使用して、バックグラウンドシグナルの平均及び分散を推定することができる。図6A〜6Cに示される実施例において、rs3091244は、A/C/T三対立遺伝子マーカーであり、可能な二対立遺伝子の組み合わせとしては、C対立遺伝子対T対立遺伝子(図6A)、C対立遺伝子対A対立遺伝子(図6B)、及びT対立遺伝子対A対立遺伝子(図6C)が挙げられる。3つのバックグラウンドシグナル推定値は、およそ1,350〜およそ1,700の範囲である。
図7A、7B、及び7Cは、遺伝子型決定された試料のサブセットの初期分割の例示的なプロットを示す。例えば、試料のサブセットは、可能な二対立遺伝子の組み合わせの各々において遺伝子型決定され得る。結果として生じるコールは、仮の複対立遺伝子遺伝子型コールに統合され得る。図7Aにおいて、「高Aシグナル」を有する試料は、C対立遺伝子対T対立遺伝子クラスタ化プロットから除去され得る。「高Aシグナル」は、対立遺伝子Aバックグラウンド平均に加えて2標準偏差を超えるシグナルを示し得る。図7Bにおいて、高Tシグナルを有する試料は、C対立遺伝子対A対立遺伝子クラスタ化プロットから除去され得、図7Cにおいて、高Cシグナルを有する試料は、T対立遺伝子対A対立遺伝子クラスタ化プロットから除去され得る。
アルゴリズム設定
変異体を所与のマーカーにマッピングするための情報は、アルゴリズムの実装中にアクセスされるファイル(例えば、CDFファイル)に含まれ得る。このアルゴリズムを実行するプログラム(例えば、コンピュータシステム1上で実行するプログラム)は、複対立遺伝子マーカーの事前値ファイルならびに設定を読み取ることができる。複対立遺伝子遺伝子型決定アルゴリズムの設定は、二対立遺伝子遺伝子型決定中に使用されるパラメータ、ならびに複対立遺伝子遺伝子型決定のために割り当てられた異なる初期デフォルト値を有するパラメータを含み得る。複対立遺伝子遺伝子型決定のための初期コール割り当ては、二対立遺伝子遺伝子型決定アルゴリズムと同じパラメータ及び設定を使用可能にすることができる。以下の表1は、複対立遺伝子遺伝子型決定のための最終コール割り当てが有し得るパラメータを含み、これらは初期ステップとは異なり得る。
初期遺伝子型割り当て
各対立遺伝子に対するバックグラウンドシグナルを算出した後、アルゴリズムは、対立遺伝子シグナル及びバックグラウンドシグナルに基づいて、各試料の初期遺伝子型コールを対立遺伝子対に割り当てることができる。例えば、種々の二対立遺伝子プローブセットの組み合わせは、アルゴリズムのプログラムファイルにおけるクラスからのオブジェクトを使用して遺伝子型決定され得る。
各対立遺伝子は、バックグラウンドシグナルの推定値を有してよく、試料は、その対立遺伝子のシグナルが既定の閾値を超える場合、対立遺伝子のバックグラウンドを超えるシグナルを有するとみなされ得る。いくつかの実施形態では、既定の閾値は、avgBgndallele+2*stdevBgndalleleに等しくなるように算出され得る。対立遺伝子の各対について、アルゴリズムは、任意の他の対立遺伝子においてまたはいずれの代替対立遺伝子においても、バックグラウンドシグナルを超えるシグナルを有しない試料のサブセットを同定することができる。例えば、対立遺伝子A対対立遺伝子Bを考慮するとき、対立遺伝子C、対立遺伝子D等においてバックグラウンドを超えるシグナルを有しない全ての試料を、遺伝子型決定中に含め、分類することができる。換言すれば、二対立遺伝子の組み合わせの遺伝子型決定の各ラウンド中、そのラウンド中に遺伝子型決定されない他の対立遺伝子のうちの1つが、バックグラウンド閾値を超えるシグナルを有する場合、試料は、現在の遺伝子型決定ラウンドから除外され得る。
対立遺伝子の各対について、アルゴリズムは、試料のサブセットにおける試料の数(例えば、バックグラウンドを超える他の対立遺伝子シグナルを有しない試料)が、既定の最小値を超えるかどうかを判別することができる。例えば、最小数より多い(例えば、3または任意の数)の適切な試料が見出された場合、それらの試料は、Axiom(登録商標)GT1アルゴリズムを使用して対応する対立遺伝子対に表される2つの対立遺伝子について遺伝子型決定され得、特定の事前値及びアルゴリズムパラメータを用いることができる。この決定ステップは、最小数より多くの試料が見出された対立遺伝子の各対に対して繰り返すことができる。プロセスの最後に、試料は、種々の反復から0、1、またはそれ以上のコールを有し得る。
現在遺伝子型決定されている二対立遺伝子の組み合わせに特異的であり得る事前値は、特定の事前値が提供されない場合に使用されてもよい。遺伝子型決定された試料のコール、分類統計、二対立遺伝子比較の数、及び指標は、遺伝子型決定の全ラウンドについて記憶され得る(例えば、コンピュータシステム1によって記憶される)。
二対立遺伝子コールの複対立遺伝子コールへの複合
各試料の二対立遺伝子コールの全てを収集することができ、次いで各試料のコールの集合を単一の仮の遺伝子型コールに分解してもよい。各二対立遺伝子コールについて、プローブセットが照合している2つの対立遺伝子は、対応する複対立遺伝子シグナル、例えば、A、B、C、D、E、F等に辞書学的にマップされ得る。例えば、1つが三対立遺伝子A/C/Tマーカーを照合している場合、A対立遺伝子はAシグナルに、C対立遺伝子はBシグナルに、T対立遺伝子はCシグナルにマップされる。二対立遺伝子C/Tプローブセットに対するコールを行うために、アルゴリズムは、対応する二対立遺伝子コールを複対立遺伝子コールにマップすることができる。コールが−1である場合、アルゴリズムは、「ノーコール値」に戻り得る。コールが0である場合、戻る複対立遺伝子コールは、2つのC対立遺伝子を有することに対応するBBである。コールが2である場合、戻る複対立遺伝子コールは、2つのT対立遺伝子を有することに対応するCCである。コールが1である場合、ヘテロ接合体CTコールに対応するBCが戻され得る。全ての二対立遺伝子コールを、各試料に対して収集することができ、最も頻繁に行われた二対立遺伝子コールが、試料に割り当てられ得る。例えば、アルゴリズムは、各試料において最も頻繁に発生するコールを選択するために、各試料のコールを比較することができる。最も頻繁に行われたコールに同点がある場合、一致しないコールが試料に割り当てられ得る。いくつかの実施形態では、コール間に同点がある場合、「ノーコール」値が試料に割り当てられ得る。試料が反復のうちのいずれにも含まれなかった場合、「ノーコール」値が試料に割り当てられ得る。
多変量正規分布及び最終遺伝子型割り当て
初期コールが割り当てられた後、シグナルを、各クラスタを説明する多変量正規分布に適合させて、試料が所与のクラスタから派生した可能性を判別することができる。すなわち、アルゴリズムは、対立遺伝子及び初期コールによってサマリーシグナルを記述することができ、サマリーシグナルのファイルが、事前値ファイルと共に、そのアルゴリズムを実行するプログラムによって読み取られ得る。シグナルは、対数シグナル空間に変換されてよく、各プローブセットが、クラスタの各々に対応する事前値と共に、全ての可能なクラスタに割り当てられ得る。クラスタの観測数、平均、及び共分散は、初期コールから派生され得る。
換言すれば、アルゴリズムは、初期コール及び事前値(例えば、他のデータ上で訓練された汎用またはSNP特異的事前値)を使用して、対数シグナル空間における各二倍体遺伝子型クラスタの多変量正規分布を算出することができる。各二倍体遺伝子型クラスタについて、事前値は、そのクラスタに一時的に割り当てられた各試料のlog2シグナルで更新され得る。
所与のクラスタを説明する多変量正規の平均及び共分散は、そのクラスタの事前パラメータと組み合わされたそのクラスタのデータを使用して判別され得る。多変量正規分布に使用される共役事前値は、normal−inverse−Wishart形態であり得る。これらの事前パラメータは、アルゴリズムとの使用のためにロードされたファイルを通じて入力として使用可能であり得る。これらのパラメータのデフォルト値は、ファイルが提供されない事象において、プログラムを通じて設定され得る。これらのパラメータは、以下の様式で(以下の等式によって示されるように)クラスタデータと複合され得る。




いくつかの実施形態では、事後パラメータは、適宜調整されてよい。例えば、データにおけるシグナル強度を使用して、空のクラスタを予想される位置に配置することができ、それはこれらの位置が、事前ファイルにおいて特定された位置とは異なり得るためである。平均バックグラウンド対立遺伝子シグナル及び平均対立遺伝子シグナルは、データ内のホモ接合体シグナルから集めることができる。空のクラスタについて、シグナル強度は、平均対立遺伝子シグナルから得られ、次いで下方調整され得る。クラスタが対立遺伝子を含まない場合、シグナルは、対立遺伝子に対するバックグラウンドシグナルから得ることができる。対立遺伝子に対する実際の対立遺伝子シグナルまたはバックグラウンドシグナルが利用可能でない場合、予想量の差を存在するシグナルに加算するか、または減算することによって算出することができる。クラスタ間の予想量の差が、2つの変数に含まれてもよく、1つは、0個の対立遺伝子を有するクラスタと1個の対立遺伝子を有するクラスタとの間の予想距離を特定するためであり(copyNumber0to1)、もう1つは、1個の対立遺伝子を有するクラスタと2個の対立遺伝子を有するクラスタとの間の予想距離を特定するためである(copyNumber1to2)。
追加として、最終チェックを行い、クラスタが正しい順序であることを確認することができる。例えば、B対立遺伝子(BB、AB)を含むクラスタは、B対立遺伝子を含まないクラスタ(CC、CD)より高いシグナルを対立遺伝子Bに対して有し得る。2つの対立遺伝子を含むクラスタはまた、その対立遺伝子の1つのコピーのみを含むクラスタよりわずかに高いシグナルを、その対立遺伝子に対して有することが予想され得る。例えば、BBは、クラスタABより高いシグナルをBにおいて有し得る。この方法はまた、2つのシェルバリア値によって特定された距離がクラスタを分離することを確実にし得る。シェルバリア値は、問題の2つのクラスタ間の距離を特定することができる。変数「shellbarrier0to1」は、0個の対立遺伝子を有するクラスタと1個の対立遺伝子を有するクラスタとの間の最小距離であり得るが、「shellbarrier1to2」は、1個の対立遺伝子を有するクラスタと2個の対立遺伝子を有するクラスタとの間の最小距離であり得る。クラスタAA、AB、及びBB、ならびに対立遺伝子Aについて、「shellbarrier0to1」は、BBクラスタにおけるA対立遺伝子の位置とABクラスタにおけるA対立遺伝子の位置との間の最小距離を特定し得るが、「shellbarrier1to2」は、ABクラスタにおけるA対立遺伝子とAAクラスタにおけるA対立遺伝子との間の最小距離を特定することができる。
したがって、必要に応じて、事後平均位置は、順序を保存するように調整され得る。例えば、AAクラスタは、AB、AC等のクラスタより大きいlog2 Aシグナルを有することができ、順にA対立遺伝子を含まない全てのクラスタより大きいlog2 Aシグナルを有し得る。対立遺伝子コピー数1を有するクラスタを、対立遺伝子コピー数0を有するクラスタと比較することができ、それらの平均log2対立遺伝子シグナルは(必要に応じて)最大コピー数0 log2対立遺伝子シグナル+S(構成可能なパラメータであり得る)まで増加させることができる。次いで、この調整を繰り返し、ホモ接合体クラスタ(コピー数2)をヘテロ接合体クラスタ(コピー数1)と比較することができる。
確立された事後分布を用いて、各分布(クラスタ)におけるメンバーシップの対数尤度(L)を、各試料について以下のように算出することができる。


対数尤度のべき乗は、最小値を減算するか(負の対数尤度を扱う場合)、または尤度を最大値から減算するかのいずれかによって、尤度値を再スケーリングすることにより算出され得る。「ocean」調整値は、「ocean」パラメータの値を最小尤度値に乗算することによって算出され得る。
各クラスタにおける、または均一「ocean」クラスタにおけるメンバーシップの確率は、各試料について対数尤度から算出することができ、試料は、最大確率を有するクラスタに割り当てられ得る。すなわち、最終遺伝子型コールは、特定のクラスタのメンバーシップの確率に基づいて各試料に割り当てられ得る。他のクラスタのうちのいずれかにおける試料のメンバーシップの確率として定義される信頼値は、各試料について算出されてよく、既定の閾値と比較され得る。その閾値を超える試料は各々、「ノーコール」値に割り当てられ得る。
更なる実施例により、図8は、複対立遺伝子遺伝子型決定のためのN次元ガウス混合モデルの例を示す。図8のモデルは、最終複対立遺伝子コールを割り当てるために利用されてよく、このモデルは、共役事前値(汎用またはリアルデータ上で訓練された)を、各遺伝子型に一時的に割り当てられる試料からのデータと複合することによって構築され得る。各遺伝子型クラスタにおけるメンバーシップの事後確率を、各試料について算出することができ、最大尤度を有する遺伝子型は、それが指定された閾値を超える場合、最終遺伝子型コールとして割り当てられ得る。このステップは、初期分割からの任意の矛盾する遺伝子型コールを解消することができ、各試料について、可能な各遺伝子型の有意義な確率をもたらすことができる。
ソフトウェア実装
更なる特定の実施形態によると、上記方法のうちの1つ以上は、ソフトウェアパッケージに含まれ、アレイデータまたは同様の遺伝子型データからの複対立遺伝子マーカーを自動的に遺伝子型決定することができる。そのようなソフトウェアパッケージは、BANGアルゴリズムの実行中に多くの異なるファイルを読み取ることができる。プログラムファイルの例としては、以下が挙げられる(但し、これらに限定されない)。
AxiomDMETMultiallelicCaller.java
AxiomDMETClusterer.java
AxiomDMETStem.java
assign_final_calls.py
AxiomGT1.summary.txt−複対立遺伝子セットに存在する全ての二対立遺伝子プローブセットのシグナルを含むサマリーファイル
Probeset file (annotation file)−どの複対立遺伝子セットにプローブセットが属するか、またそのプローブセットがウォブルセットの一部であるかどうかに関する情報を含むファイル。これらは、複対立遺伝子コールが実行され得る前に、AxiomDMETSummarizer.javaプログラムによる統合を必要とするため、プログラムは、ウォブルセットのプローブセットをスキップする場合がある。
Reference file−参照コールを含むファイル。試験目的で使用される。
Output file name−これは、複対立遺伝子プローブセットに対するコールを含むファイルの名前である。この名前は、統計を詳述し(_ProbeSetSummary.txt)、SpotFireグラフ化プログラムと共に使用され得る(_spotfire.txt)他の出力ファイルを生成するときに接頭辞として使用される。
AxiomGT1.multiallelic_summary.txt−プログラムAxiomDMETMultiAllelicCaller.javaから生成されたサマリーファイル。
AxiomGT1.multiallelic_calls.txt−プログラムAxiomDMETMultiAllelicCaller.javaからのコールファイル。
プローブセット群(ps_group)を使用して、同じ複対立遺伝子マーカーを照合しているプローブセットの群を同定することができる。理想的には、複対立遺伝子セットにおける全てのプローブセットにmulti_asidが割り当てられ得る。複対立遺伝子コーリングプログラムを通じて実行する前に統合される必要があり得る、複対立遺伝子セットにおけるプローブセットの各セットのウォブルセットを同定するための別の識別子も存在する。alleles_fwdは、二対立遺伝子プローブセットが照合している対立遺伝子を同定するために依然として必要とされ得る。複対立遺伝子マーカーについて列挙されるアレイ上に存在する対立遺伝子の全てを有することが役立つ場合もある(multi_allelesフィールド)。この時点で、プログラムは、alleles_fwdフィールドに基づいてチャネルを割り当てることができる。この理想的な状況は、データを実装から分離するために、対立遺伝子または二対立遺伝子probeset_idとチャネルとの間にいくらかのマッピングを有することであり得る。
これらは、注釈ファイル内の必須データであり得る、ライブラリファイルにおいて使用可能であるべきである。
probeset_id−複対立遺伝子セットにおける異なる二対立遺伝子プローブセットを識別することができる方法を必要とする。現在の実装は、複対立遺伝子セットにおける二対立遺伝子プローブセットのprobeset_idを使用する。
multiallelic−どのプローブセットが複対立遺伝子であるかを識別する方法を必要とするため、複対立遺伝子コーリングアルゴリズムを使用してコールされる必要がある。現在の実装は、そのプローブセットが、プローブセットの複対立遺伝子セットの一部であるかどうかを示すブールを使用する(0/1)
multi_asid−複対立遺伝子プローブセット識別子。
ps_group−複対立遺伝子セットにおけるプローブセットが識別され得る手段。現在、プローブセット群がこの目的で使用されているが、セット内の識別子とプローブセットとの間でマッピングが行われる限り、任意の識別子を使用することができ、ならびに識別する方法
multi_alleles−複対立遺伝子マーカーに対する全ての対立遺伝子
affy_snp_id−二対立遺伝子プローブセットによって照合されているマーカーの識別子
wobble−プローブを使用して、標的変異体(ウォブル)に近い全ての変異体に対するマーカーを照合することができる。これらのウォブルセットは、遺伝子型決定される前にプローブセットに統合される必要がある。したがって、統合が起こる必要があるかどうかを識別する手段が必要であり得る。現在、ブールを使用して、プローブがウォブルセットの一部であるかどうかを示す(0/1)。これが統合を必要とするウォブルセットを識別するため、複対立遺伝子コーリングアルゴリズムは、現在、このブールが1に設定される全てのデータをスキップする。プログラムは最初に統合を行い、続いて遺伝子型決定を行うため、これはプロトタイプを超えて必要とされないであろう。
alleles_fwd−複対立遺伝子セットにおける二対立遺伝子プローブセットの統合の各々を識別することができる手段。順方向に照合されている対立遺伝子は、これまでこの目的を果たしてきた。
DMETcall−DMETコードに可能なコールを記憶する。対応する数値DMETコードに対するコールの二対立遺伝子コードをマップする方法を必要とする。
サマリーファイルは、以下のデータを含み得る。a_ij(サマリーファイルからの、プローブセットi及び試料jに対するチャネルAシグナル)、b_ij(サマリーファイルからの、プローブセットi及び試料jに対するチャネルBシグナル)。
参照ファイルは、複対立遺伝子プローブセットに対する参照コールを含み得る。
追加のパラメータ及び設定
以下のパラメータは、可能なユーザ設定とみなされ得る。
AxiomDMETMultiAllelicCaller.javaは、以下のパラメータを有する。
OUTPUT_CALLS_NUMERIC_CODE−数値DMETコードがコールファイルに使用されるべきかどうかを指定するブール
AxiomDMETStem.javaは、以下のパラメータを有する。
MIN_LOG2_SIG−log2シグナルの最小値(現在は0.000001に設定されている)
SIG_THRESHOLD_VAR_MULTIPLE−バックグラウンド閾値算出に使用される全体重み付き平均分散に適用される乗算。
AxiomDMETClusterer.javaプログラムは、以下のパラメータを有する。
WORKING_DIR_PATH−二対立遺伝子プローブセットをコール及び特徴付けるために作成された一次ファイルのためのパス
SUMMARY_FILE_NAME−1つの二対立遺伝子プローブセットの2つのチャネルからのシグナルを含む、作成されるサマリーファイルの名前
POSTERIOR_FILE_NAME−サマリーファイルのapt−summary−genotypeプログラムによって生成された二対立遺伝子プローブセットのモデルファイル
CALLS_FILE_NAME−apt−summary−genotype fによりサマリーファイルから生成された二対立遺伝子プローブセットのコールファイルの名前
METRICS_FILE_NAME−apt−summary−genotypeによって生成されたファイルに基づいて、Ps_metricsによって生成された二対立遺伝子プローブセットのメトリクスファイルの名前
PERFORMANCE_FILE_NAME−メトリクスファイル及びapt−summary−genotypeによって生成された他のファイルを使用して作成された二対立遺伝子プローブセットの性能(分類)ファイルの名前
APT_SUMMARY_GENOTYPE−プログラムのための実際のパス
OUTPUT_DIR_NAME−二対立遺伝子プローブセットについて、apt−summary−genotypeにより生成された遺伝子型結果が記憶される場所の名前
GENOTYPES_FILE_PATH−コールファイルのパス及び名前
PS_CLASS_FILE_PATH−性能ファイルのパス及び名前
SCRIPT_NAME−二対立遺伝子プローブセットのデータ上でapt−summary−genotype、Ps_metrics、及びPs_classificationをコールするために使用されるスクリプトの名前
CMD−スクリプトが依然として存在しない場合、二対立遺伝子プローブセット上で実行されるであろうスクリプトの文字列
プローブセット選択:
複対立遺伝子コールは、プローブセットファイルにおいて複対立遺伝子であり、ウォブルセットに属さないと指定されるプローブセットに対して生成され得る。「1」を使用して、プローブセットが複対立遺伝子であると指定することができ、「0」を使用して、プローブセットがウォブルセットの一部でないと指定することができる。
出力ファイル
いくつかの実施形態では、4つの初期出力ファイルが、複対立遺伝子遺伝子型決定アルゴリズムから生成され得る。出力ファイルは全て、ユーザによって指定される出力ファイル名(OutFileName)であり得る、同じ接頭辞を有し得る。出力ファイルの例を下に記載する。
OutFileName.txt−全てのプローブセット群に対する各試料の複対立遺伝子コールを含むコールファイル。コールファイルは、列に試料名を有する通常のAxiomGT1.calls.txtファイルに類似している。しかしながら、probeset_id列は、プローブセット群の識別子によって集められ、これは2つ以上の二対立遺伝子プローブセットによって共有される識別子であるべきである。コールは、フォーマットAA〜FFであり、それらはDMETコールフォーマットである。所与のマーカーについて、そのマーカーを照合している対立遺伝子は、実際の対立遺伝子をコールにマップするために、再びこれらの記号に辞書学的に連結されるべきである。3つの他の可能なコールが存在し、それらはノーコールである。NotAvailable−試料が遺伝子型決定されなかったため、他のチャネルの全てにおいて過剰なシグナルが存在していたコール。
CallsInconsistent−二対立遺伝子コールが複合されたときに、等しくコールされた2つの異なるコールが存在していた。
XX−遺伝子型決定及び遺伝子型コールの複合中にノーコールが割り当てられていなかった。
OutFileName_summary.txt−対立遺伝子シグナルに変換されたチャネルシグナルを有するサマリーファイル
OutFileName_ProbesetSummary.txt−プローブセット群を要約するデータ。列は以下のとおりである。
ps_group−プローブセット群の識別子を含む
multi_asid−複対立遺伝子プローブセットの識別子
multi_alleles−マーカーに対して照合されている対立遺伝子
tile_strand−順方向または逆方向
Line−ウォブルをグループ分けするための識別(複対立遺伝子または二対立遺伝子いずれかのプローブセット識別子が今後使用されるべきである)
Offset−このプローブセット群に対するオフセット
probeLength−このプローブセット群におけるプローブの長さ
nAllelesFound−コーリングプロセス中に実際に見出された対立遺伝子の数
AllelesFound−予想した対立遺伝子のうちのどの対立遺伝子が見出されたか
nBiallelicCombinations−二対立遺伝子の組み合わせの数
AveBgnd−このプローブセット群に対する平均バックグラウンド値
VarBgnd−このプローブセット群に対するバックグラウンドの分散
WeightedAveBgnd−バックグラウンド閾値を算出するために使用される重み付き平均バックグラウンド値
WeightedVarBgnd−バックグラウンド閾値を算出するために使用される重み付き平均標準偏差バックグラウンド値
SignalThreshold_weightedBNDPlus2sd−バックグラウンド閾値値を使用して、シグナルがバックグラウンドを超えるかどうかを判別する。
OutFileName_spotfire.txt−プローブセット群の全てを要約し、クラスタをspotfireで描くために使用することができるファイル。これは、コードをプロトタイプ化し、デバッギングするために作成されるファイルである。データの一部は、デバッギング目的で将来的に望ましい場合がある。
以下のファイルは、assign_final_calls.py scriptからの出力である。
calls file−ファイルは、複対立遺伝子遺伝子型決定アルゴリズムから割り当てられた最終コールを含む
confidences file−割り当てられたコールの信頼度
snp−posterior file−後続の実行で事前値ファイルとして使用され得る、クラスタの事後パラメータを含むファイル
probabilities file−ファイルは、クラスタの各々に属する所与の試料の可能性を含む
複対立遺伝子遺伝子型決定−アルゴリズム検証
実施例では、Axiom(登録商標)アレイは、約100,000個の複対立遺伝子マーカーのプローブセットと共に設計され、各々が1000 Genomes第3相データにおいて2つを超える対立遺伝子を有する。マーカーは、以下の4つの試料プレート:CoriellからのT01(CEU)、T02(CHB+JPT)、T03(YRI)、及びV12(LWK)HapMap試料プレート上の試料間で3番目に最も一般的な対立遺伝子の少なくとも1つの例の存在に対して選択された。プローブセットは、ほとんどの場合、最大2つのNIVが許容された数千個のエクソンマーカーのセットを除いて、任意の大陸集団において1%超のわずかな対立遺伝子頻度を有する近くの干渉変異体(NIV)を回避するように設計された。プローブセットは、4つの複製においてタイル配置されたエクソンプローブセットを除いて、2つの複製においてタイル配置された。マーカーは、常染色体性染色体及び染色体Xから選択した。
上に列挙される4つの集団プレートを、Axiomアレイプレート上でアッセイした。試料品質制御(QC)を、3,000 AFFX−SNP二対立遺伝子制御プローブセットを用いて通常どおり行い、QCコール率を評価した。QCに合格した試料からのシグナルを、BANGアルゴリズムのプロトタイプ実装に対する入力として使用した。汎用事前値及びデフォルトアルゴリズムパラメータを、各ステップで使用した。プローブセットは、そのプローブセットが以下の基準を満たした場合、良好に動作するとみなした。
1.90%コール率
2.各対立遺伝子コピー数について50%を超える対立遺伝子CN一致
a.コピー数2に対する一致は、正しくコールされたホモ接合体の数として各対立遺伝子について別個に算出し、1000 Genomes参照から予想されるホモ接合体の数で除算した。ノーコールは、エラーとしてカウントした。
b.コピー数1に対する一致は、正しくコールされたヘテロ接合体(対立遺伝子を含む)の数として各対立遺伝子について別個に算出し、対立遺伝子を含むヘテロ接合体の予想数で割った。すなわち、対立遺伝子AのCN1一致は、予想されるAB、AC等の遺伝子型を有する試料中の正確なコールの分数であった。ノーコールは、エラーとしてカウントした。
これらの基準によって、Axiomアレイにおけるプローブセットの約42%が良好に動作した。図9は、複対立遺伝子プローブセットコール率対予想される各遺伝子型クラスタに対する一致の重み付きでない平均の例示的なプロットを示す。一致は、予想される各遺伝子型について算出することができ、次いで各クラスタにおいて予想される試料数に関係なく平均化され得る。例えば、予想される遺伝子型は、AA、AB、ACであり得るが、遺伝子型BB、CC、BCを有する予想される試料は存在しない場合がある。したがって、それらのクラスタは省略されてもよい。ノーコール割り当ては、不正とみなされ得る。Axiomアレイ上の全ての複対立遺伝子プローブセットが示され、CEU、CHB、JPT、YRI、及びLWK集団からの約360個体に関して遺伝子型決定される。大きな少数プローブセットは、高いコール率及び一致を有し得る(図9の右上角)。性能の範囲にわたって、高いコール率及び低い一致で別の密度ピーク及びプローブセットが存在し得る。
図10は、いくつかの変換されたプローブセットに対するコール及び参照遺伝子型の例示的なプロットを示す。例えば、図10のプロットは、BANGコール対1000 Genomes第3相参照遺伝子型を示す。異なる三対立遺伝子マーカーの3つのプローブセットを示す。全てのプロットは、約360試料に対するスクリーニングアレイからのlog2シグナルを示す。左側のプロットは、BANGアルゴリズムによって割り当てられた遺伝子型に従って色付けされる。右側のプロットは、同じ個体について、1000 Genomes第3相コールに従って色付けされる。1000 genomes参照遺伝子型における多数のノーコール(黄色)は、スクリーニングされた個体の全てが1000 Genomesによってアッセイされたわけではないことを反映している。
プローブ設計
特定のプローブ設計は、複対立遺伝子遺伝子型決定手法に関してよく、関心対象のデータを入手するために有益であり得る。種々のDNA分析システムにおいて使用され得るSNPプローブの判別のための論理ルーチンは、長く存在している。SNPを照合するために設計された以前のアレイは、一般に、関心対象の標的(関心対象のSNPを含む)に対して完璧に相補的でありプローブ、及そのび完璧に相補的なプローブと比較して1つ以上の一置換を含む1つ以上の他のプローブを含んでいたプローブセットを利用する。次いで、プローブセットにおける異なるプローブについての、結果として生じる強度データを比較して、関心対象のSNPに対する遺伝子型コールを生成する。例えば、米国特許第5,858,659号(その全体が参照により本明細書に組み込まれる)を参照されたい。
SNPを遺伝子型決定するための最近のアレイとしては、Axiom(登録商標)アレイ(Affymetrix,Inc.,Santa Clara,CA)及びInfinium(登録商標)IIアレイ(Illumina,Inc.,San Diego,CA)が挙げられる。これらのアレイは、関心対象の標的核酸内のSNP部位に隣接する配列に相補的なSNPプローブを利用し、したがって、これらのアレイにおけるSNPプローブは、SNP部位において標的核酸と直接ハイブリダイズしない。代わりに、プローブ標的二本鎖の二本鎖部分は、SNPの直ぐ上流で終端する。次いで、SNP部位における標的の塩基に対する相補性を必要とする当該技術分野において既知の適切な機序を通じた(例えば、結紮または一塩基延長)SNPプローブの一端(例えば、5’、3’)へのヌクレオチドまたはプローブの付加(2つの異なるハプテンのうちの1つを含むヌクレオチドまたはプローブと共に)によって、SNP部位の照合が達成される。どの対立遺伝子が、SNP部位に存在していたかの判別は、付加されたヌクレオチドまたはプローブと関連した特定のハプテンの後続の検出を通じて確認される。
Axiom(登録商標)アッセイは、30塩基オリゴヌクレオチドSNPプローブを2色フォーマットで利用する。SNP部位における塩基の同定は、結紮されたSNPプローブに対する塩基の同一性に応じて、2つの蛍光標識のうちの1つの付着部位として機能する2つのハプテンのうちの1つを含むプローブの結紮によって確認される(例えば、第1のハプテン/標識の組み合わせは、SNP部位がAまたはTであるときに結紮するプローブと関連し、第2のハプテン/標識の組み合わせは、SNP部位がCまたはGであるときに結紮するプローブと関連する)。例えば、Hoffmann et al.,″Next generation genome−wide association tool:design and coverage of a high−throughput European−optimized SNP array,″Genomics,98(2):79−89(2011)、及びHoffmann et al.,″Design and coverage of high throughput genotyping arrays optimized for individuals of East Asian,African American,and Latino race/ethnicity using imputation and a novel hybrid SNP selection algorithm,″Genomics,98(6):422−30(2011)を参照されたい(いずれもそれら全体が参照により本明細書に組み込まれる)。
Axiom(登録商標)DMETアッセイは、薬物代謝における代謝経路の関与に関する遺伝子分析に用いることもできる。遺伝的変異は、異なる個体が薬物を代謝する能力における重要な決定因子であり得る。個々の遺伝子バックグラウンドの研究を使用して、媒介を標的とし、個体に存在する多型に応じて治療用量を調整することができる。DMETパネルは、薬物代謝において役割を果たし得る遺伝子のセットにおける1,200個より多くの多型を分析する単一アッセイを提供することによって、そのような試験を容易にする。DMETパネルは、多くの異なる遺伝子を同時に照合することができ、新薬の代謝に関与し得る異なる遺伝子における対立遺伝子の特定の組み合わせの検出を容易にする。
Infinium(登録商標)IIアッセイは、50塩基オリゴヌクレオチドSNPプローブを2色フォーマットで利用する。SNP部位における塩基の同定は、SNPプローブの一塩基延長を通じて2つの異なるハプテンのうちの1つを担持するddNTPの組み込みによって確認され、各ハプテンは、異なる蛍光標識と関連している(例えば、ddCTP及びddGTPは、第1のハプテン/標識の組み合わせと関連するが、ddATP及びddTTPは、第2のハプテン/標識の組み合わせと関連する)。例えば、Gunderson et al.,″Whole−genome genotyping of haplotype tag single nucleotide polymorphisms,″Pharmacogenomics,7(4):641−8(2006)、及びSteemers et al.,″Whole−genome genotyping with the single−base extension assay,″Nature Methods,3:31−33(2006)を参照されたい(いずれもそれら全体が参照により本明細書に組み込まれる)。
組み合わせた全ゲノム及び遺伝子座特異的増幅方法
本開示の追加の実施形態では、アレイアッセイと共に使用するために、全ゲノム増幅(WGA)及び遺伝子座特異的増幅を組み合わせて、所望の標的配列について、結果として生じる遺伝子型決定データを改善し、結果として生じるデータにおける望ましくない偽遺伝子の効果を低減するために、所望の標的配列に対して増幅を選択的に付勢することができる。
例えば、Axiom(登録商標)及びInfinium(登録商標)IIアッセイは、全ゲノム増幅DNAを利用し、増幅はゲノム全体で行われる。多置換増幅(MDA)、変性オリゴヌクレオチドPCR(DOP−PCR)、及びプライマー延長前置増幅(PEP)などの多くの全ゲノム増幅手法が、当該技術分野において既知であり、PicoPLEX(商標)WGAキット(New England Biolabs,Inc.,Ipswich,Massachusetts)、REPLI−g WGAキット(QIAGEN,Venlo,Netherlands)、及びGenomePlex(登録商標)全ゲノム増幅キット(Sigma−Aldrich Corporation,St.Louis,Missouri)などの多くのWGA用キットが商業的に入手可能である。複対立遺伝子標的について、関心対象の実際の遺伝子変異体、ならびに配列において近くにあり得るが、依然として関心対象の実際の変異体とはわずかな相違を有し得る、偽遺伝子が存在し得るため、特定の臨床または研究目標に対して有用なデータを提供しないばかりか、実際に関心対象の標的の効率的な照合及び遺伝子型決定を妨げる。偽遺伝子は、関連配列の分析を複雑にする場合があり、ホモ接合性コールをヘテロ接合性コールとして出現させ得るか、またはその逆も同様である。したがって、全ゲノム増幅(WGA)は、関心対象の標的と同様の増幅の程度でそのような偽遺伝子の増幅をもたらし得、関心対象の標的に対する正確な遺伝子型コールを行う際の困難につながり得る。
これを克服するために、全ゲノム増幅(WGA)を、関心対象の標的の遺伝子座特異的増幅で補充することによって結果を強化することが有益であり得る。多重ポリメラーゼ連鎖反応、後続PCRを伴う分子変換プローブ、後続ローリングサークル増幅を伴う錠型プローブ、及び他の手法の使用などの、遺伝子座特異的増幅の多くの形態が、当該技術分野において既知である。多重PCRは、PCRを使用して異なるDNA標的配列を同時に増幅させることからなり得る。すなわち、偽遺伝子を含む標的は、所望の遺伝子に特異的なプライマーを使用するmPCR増幅に供され得る。分子変換プローブの使用は、当該技術分野において既知であり、例えば、Hardenbol et al.,Nat.Biotechnol.21:673−8(2003)、Hardenbol et al.,Genome Res.15:269−275(2005)、Ji et al.,Cancer Res.66:7910−9、米国特許第6,858,412号、同第8,716,190号、同第8,828,688号、同第8,759,036号、ならびに米国公開出願第2013/0296172号、及び同第2015/0284786号に記載されており、各々があらゆる目的で、その全体が参照により本明細書に組み込まれる。後続ローリングサークル増幅を伴う錠型プローブの使用もまた、当該技術分野において既知であり、例えば、米国特許第6,558,928号及び同第7,074,564号に記載されており、各々があらゆる目的で、その全体が参照により本明細書に組み込まれる。1つの特定の標的配列(その同様の変異体の代わりに)の遺伝子座特異的増幅は、特に全ゲノム増幅と組み合わせたとき、マイクロアレイアッセイから得られるデータの後続分析と共に役立ち得る。
遺伝子座特異的増幅を利用して、最終的にゲノムの所望の標的の多くのコピーを作成し、結果として生じる増幅生成物を、望ましくない偽遺伝子に対向して、所望の標的に対して統計的に付勢するために、全ゲノム増幅を補足することができる。望ましくない領域に対するゲノムの標的部分の濃度の増加は、標的からのシグナルを増加させ、二対立遺伝子及び複対立遺伝子両方の遺伝子型決定において後続の遺伝子型決定結果を強化することができる。換言すれば、アレイ上の照合に使用可能な所望のアンプリコンの増加は、より効率的かつ強化された生物情報学的遺伝子型決定プロセスにつながり得る。遺伝子型決定プロセスの改善は、関心対象の遺伝子変異体における特異的SNPなどの、関心対象のマーカーの特定の標的が、多くの同様の偽遺伝子または変異体を有するときに特に有益であり得る。例えば、チトクロームP450内には、診断的、臨床的、及び/または薬理ゲノミクス的に重要であるが、関連のない変異体を近くに有する多くのマーカーが存在する。例えば、薬理ゲノミクス値の高いCYP2D6内にSNPが存在するが、CYP2D6と、CYP2D7及びCYP2D8などの偽遺伝子との間の高い相同性が、一般に、高い非特異的バックグラウンドシグナルの、関心対象のCYP2D6マーカー(例えば、SNP)の照合に対する後者の寄与を通じて後続の遺伝子型決定を複雑にするため、全ゲノム増幅単独に依存することは、所望のマーカーの正確な分析を妨げる場合がある。当業者によって認識されるように、偽遺伝子及びそうでなければ高い相同性の配列からのこの高い非特異的バックグラウンドは、ABCC2、CFTR、CYP1A2、CYP2A6、CYP2B6、CYP2C19、CYP2C8、CYP2C9、GSTM1、及びSULT1A1などの他の関心対象のマーカーも妨げる。
いくつかの実施形態では、ゲノムDNA試料を(例えば、抽出によって)入手してもよく、全ゲノム増幅が試料に適用され得る。遺伝子座特異的mPCR増幅を試料上で行い、関心対象の配列を標的とすることができ、複対立遺伝子遺伝子型決定のために、試料をアレイに断片化及びハイブリダイズしてもよい。
図11は、本開示の1つ以上の態様に従い、開示される増幅手法におけるステップのフローの例示的な図を示す。この実施例では、CYP2D6 5.6kb PCR製品が、2つの異なるステップで(全ゲノム増幅前または全ゲノム増幅後)Axiom(登録商標)ワークフローに付加され得る。いくつかの実施形態では、このワークフローは、約100個の変異体(2,973個のプローブセット)を、単一PCR製品を使用して見られるようにすることができる。
図12は、PCR増幅された標的を使用するために、2つの手順を試験することから得られる結果のプロットを示す。図12のプロットは、CYP2D6の全てを含む単一アンプリコンを増幅させることから得られるクラスタプロットを示す。いくつかの実施形態では、PCR増幅された標的を使用するための手順は、わずかに改善されたSNP変換率をもたらし得る。しかしながら、困難なマーカーに対する影響を評価するためには、より大規模な研究が必要であり得る。
いくつかの実施形態では、本明細書に開示されるAxiom(登録商標)DMET増幅方法は、同様のワークフローを有するAxiom 2.0ロバスト化学プラットフォームを、24ウェルフォーマット、マニュアル標的調製、及び試薬処理で利用することができる。mPCRステップは、QIAGEN多重PCRキットなどの商業的に入手可能なmPCRキットを使用して、Axiom(登録商標)ワークフローに組み込まれ得る。いくつかの実施形態では、mPCR製品は、ワークフローにおけるDNase断片化の前、全ゲノム増幅後に付加されてもよい。
図13は、本開示の1つ以上の態様に従い、開示される増幅手法におけるワークフローの例示的な図を示す。
図14は、本開示の1つ以上の態様に従い、実現可能性について試験された多重プライマーセットの表を示す。
追加として、オリゴヌクレオチドスパイクイン研究は、応答性プローブの識別を助けることができる。一実施例では、70−merオリゴマーを、第1層モノモルフ(例えば、A、B、C、D対立遺伝子)に対して合成した。オリゴマーは、両方の鎖にマッチし、ウォブル位置において配列退化を有する。増幅したgDNAを、DMETアレイプレート上で処理し、プローブ応答をモニタリングした。図15は、スパイクイン研究からの遺伝子型決定結果の例を示す。図15に示されるように、第1のプローブセットは、非応答性であったが、第2のプローブセットは、用量依存性応答を示した。
図16は、本開示の1つ以上の態様に従い、15−plex mPCRアッセイからの結果の例示的な表を示す。いくつかの実施形態では、Qiagen多重PCR Plusキット(PN 206151または206152)が、mPCRプロトコルにおいて利用されてもよい。図16に示される結果に示されるように、1%以上のわずかな対立遺伝子頻度(MAF)を有する3つのSNPが、DMET Plusから持ち越されたプライマー配列において観測された。参照SNP変異体rs76015180は、1−0214プライマーの重要な3’端に存在し、増幅に影響を及ぼすことが示された。
主題は、構造的特徴部及び/または方法論的作用に特異的な言語で記載されてきたが、添付の特許請求の範囲において定義される主題が、必ずしも上記の特定の特徴部または作用に限定されないことを理解されたい。むしろ、上記の特定の特徴部及び作用は、以下の特許請求の範囲の例示的な実装として記載される。

Claims (29)

  1. コンピュータシステムを使用して、1つ以上の複対立遺伝子マーカーを遺伝子型決定するための方法であって、
    1つ以上の試料内の1つ以上の複対立遺伝子マーカーに対するシグナルを取得することと、
    各複対立遺伝子マーカーについて、前記1つ以上の試料からの複数の対立遺伝子対における各対立遺伝子対に対する前記シグナルをクラスタ化して、各対立遺伝子対を表すクラスタをもたらすことと、
    ホモ接合性対立遺伝子対を表す各ホモ接合性クラスタについて、代替対立遺伝子に対するシグナルを、前記代替対立遺伝子に対するバックグラウンドシグナルの算出のために収集して、各々がそれぞれの対立遺伝子を表す複数のバックグラウンドシグナルをもたらすことと、
    前記シグナル及び前記バックグラウンドシグナルに基づいて、各対立遺伝子対について最初の遺伝子型コールを各試料に割り当てることと、
    前記最初の遺伝子型コール及び前のクラスタパラメータを使用して、各クラスタの多変量正規分布を算出することと、
    各クラスタの各多変量正規分布について、各試料のメンバーシップの対数尤度を算出することと、
    前記メンバーシップの対数尤度に基づいて、各試料について、各クラスタにおけるメンバーシップの確率を算出することと、
    前記メンバーシップの確率に基づいて、最終の遺伝子型コールを各試料に割り当てることと、を含む、方法。
  2. 前記1つ以上の複対立遺伝子マーカーが、一塩基多型(SNP)及び3つ以上の可能な対立遺伝子を有するインデルを含む、請求項1に記載の方法。
  3. 前記1つ以上の複対立遺伝子マーカーに対して取得された前記シグナルが、前記1つ以上の試料における各対立遺伝子の対立遺伝子強度データを含む、請求項1に記載の方法。
  4. 前記シグナルのクラスタ化が、アルゴリズムを、定義された一塩基多型(SNP)及び定義されたアルゴリズムパラメータと共に使用することを更に含む、請求項1に記載の方法。
  5. 前記最初の遺伝子型コールの割り当てが、
    各対立遺伝子対について、いずれの代替対立遺伝子においても前記バックグラウンドシグナルを超えるシグナルを有しない試料のサブセットを特定することと、
    各対立遺伝子対について、前記試料のサブセットにおける試料の数が、既定の最小値を超えることを判別することと、
    各対立遺伝子対について、対応する対立遺伝子対において表される2つの対立遺伝子に対して、前記試料のサブセットにおける各試料を遺伝子型決定することと、を更に含む、請求項1に記載の方法。
  6. 前記最初の遺伝子型コールの、各試料への割り当てが、
    各試料において最も頻繁に発生するコールを選択するために、各試料のコールを比較することを更に含み、前記コール間に同点がある場合、「ノーコール」値が、前記試料に割り当てられる、請求項1に記載の方法。
  7. 各クラスタの前記多変量正規分布が、対数シグナル空間において算出される、請求項1に記載の方法。
  8. 各試料の前記メンバーシップの対数尤度の算出が、以下を使用して算出され、

    式中、|Σ|が、共分散の決定因子であり、
    xが、プローブセットの試料に対する前記シグナルを含むk次元列ベクトルであり、
    kが、プローブセットに対するシグナルの数である、請求項1に記載の方法。
  9. 前記最終の遺伝子型コールの割り当てが、
    前記試料が、最高のメンバーシップの確率を有する特定のクラスタに各試料を割り当て、各試料に対するクラスタ割り当てをもたらすことと、
    前記クラスタ割り当てに基づいて、前記最終の遺伝子型コールを各試料に割り当てることと、を更に含む、請求項1に記載の方法。
  10. 各試料の信頼値を算出することであって、前記信頼値が、任意の他のクラスタにおける前記試料のメンバーシップの確率を含む、算出することと、
    各試料の前記信頼値を、既定の閾値と比較することと、
    前記既定の閾値を超える信頼値を有する各試料に「ノーコール」値を割り当てることと、を更に含む、請求項1に記載の方法。
  11. それぞれの各対立遺伝子について、前記バックグラウンドシグナルの平均、分散、及び標準偏差を算出することを更に含む、請求項1に記載の方法。
  12. 前記対立遺伝子について、前記バックグラウンドシグナルの前記平均、分散、及び標準偏差を算出するために利用可能な値がない場合、大域的推定バックグラウンドシグナルが、対立遺伝子に使用され、前記大域的推定バックグラウンドシグナルが、前記複数のバックグラウンドシグナルの平均である、請求項11に記載の方法。
  13. それぞれの各対立遺伝子についての、前記バックグラウンドシグナルの前記平均、分散、及び標準偏差の算出が、以下の等式を使用して算出することを更に含み、







    式中、avgSigalleleが、対立遺伝子の平均シグナルであり、allelehomが、当該対立遺伝子のホモ接合性コールのシグナルであり、nsigalleleが、前記シグナルに寄与した試料の総数であり、
    bgndalleleが、対立遺伝子のバックグラウンド値であり、Σallelein hom call not=allele)が、前記コールが、前記対立遺伝子に一致しないとき、ホモ接合性コール中の当該対立遺伝子のシグナルであり、
    avgBgndalleleが、対立遺伝子の前記バックグラウンドの平均であり、
    weightedAvgBgndが、前記バックグラウンドの加重平均であり、
    varianceBgndalleLeが、前記バックグラウンドの分散であり、
    stdevBgndallele=が、前記バックグラウンドの標準偏差であり、
    weightedAvgStDevBgndが、前記バックグラウンドの加重平均標準偏差である、請求項11に記載の方法。
  14. 前記1つ以上の試料における前記1つ以上の複対立遺伝子マーカーに対する前記シグナルを取得することが、前記複対立遺伝子マーカーを測定するための、アレイ上の複数のプローブとの前記試料のハイブリダイゼーションに基づいている、請求項1に記載の方法。
  15. 示差的に標識されたオリゴヌクレオチドを前記アレイ上の複数のプローブに結紮して、前記標識されたオリゴヌクレオチドの3’末端においてA、T、C、またはGヌクレオチドで標識されたオリゴヌクレオチドの結紮を区別することによって、前記試料の標的配列に存在する対立遺伝子を判別することを更に含む、請求項14に記載の方法。
  16. 示差的に標識されたヌクレオチドによる前記アレイの前記複数のプローブの一塩基延長を使用して、A、T、C、またはGヌクレオチドによる延長を区別することによって、前記試料の標的配列に存在する対立遺伝子を判別することを更に含む、請求項14に記載の方法。
  17. アレイによるアンプリコンのハイブリダイゼーション前に、ゲノムDNA試料を、遺伝子座特異的増幅及び全ゲノム増幅で増幅するための方法であって、
    ゲノムDNA試料を入手することと、
    前記ゲノムDNA試料を、ゲノムDNAの少なくとも第1の部分及び第2の部分に分割することと、 前記ゲノムDNAの第1の部分上で遺伝子座特異的増幅を行って、標的配列に対する第1のアンプリコンのプールを生成することと、
    全ゲノム増幅を、少なくとも前記ゲノムDNAの第2の部分上で行って、第2のアンプリコンのプールを生成することと、
    前記第1及び第2のアンプリコンのプールを断片化して、断片化アンプリコンを生成することと、
    前記断片化アンプリコンを、アレイにハイブリダイズすることと、を含む、方法。
  18. 前記遺伝子座特異的増幅が、多重ポリメラーゼ連鎖反応による前記標的配列の増幅を含む、請求項17に記載の方法。
  19. 前記遺伝子座特異的増幅が、分子反転プローブによる前記標的配列の増幅を含む、請求項17に記載の方法。
  20. 前記遺伝子座特異的増幅が、錠型プローブによる前記標的配列の増幅を含む、請求項17に記載の方法。
  21. 前記第1のアンプリコンのプールが、全ゲノム増幅が行われる前に前記ゲノムDNAの第2の部分に付加され、前記全ゲノム増幅が、前記第1のアンプリコンのプール及び前記ゲノムDNAの第2の部分上で行われる、請求項17に記載の方法。
  22. 前記全ゲノム増幅が、前記ゲノムDNAの第2の部分上のみで行われる、請求項17に記載の方法。
  23. 前記第1及び第2のアンプリコンのプールが、断片化前に複合される、請求項17に記載の方法。
  24. 前記標的配列が、複対立遺伝子マーカーを含む、請求項17に記載の方法。
  25. 前記ゲノムDNA試料が、前記標的配列と、前記標的配列の偽遺伝子と、を含む、請求項17に記載の方法。
  26. 前記遺伝子座特異的増幅が、前記標的配列に対する前記第1のアンプリコンのプールを生成するが、前記偽遺伝子のアンプリコンを生成しない、請求項25に記載の方法。
  27. 前記断片化アンプリコンが、前記偽遺伝子のアンプリコンより多くの前記標的配列のアンプリコンを含む、請求項26に記載の方法。
  28. 前記アレイが、1つ以上の複対立遺伝子マーカーを照合するための複数のプローブを含む、請求項17に記載の方法。
  29. 前記試料中の前記1つ以上の複対立遺伝子マーカーに対するシグナルを取得することと、
    ベイジアンN−対立遺伝子遺伝子型決定アルゴリズムを使用して、複対立遺伝子遺伝子型決定を行うことと、を更に含む、請求項26に記載の方法。
JP2018539252A 2015-10-18 2016-10-18 一塩基多型及びインデルの複対立遺伝子遺伝子型決定 Active JP6858783B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562243078P 2015-10-18 2015-10-18
US62/243,078 2015-10-18
PCT/US2016/057496 WO2017070096A1 (en) 2015-10-18 2016-10-18 Multiallelic genotyping of single nucleotide polymorphisms and indels

Publications (3)

Publication Number Publication Date
JP2019500706A true JP2019500706A (ja) 2019-01-10
JP2019500706A5 JP2019500706A5 (ja) 2019-06-13
JP6858783B2 JP6858783B2 (ja) 2021-04-14

Family

ID=58557921

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018539252A Active JP6858783B2 (ja) 2015-10-18 2016-10-18 一塩基多型及びインデルの複対立遺伝子遺伝子型決定

Country Status (10)

Country Link
US (1) US20180305748A1 (ja)
EP (2) EP3362580B1 (ja)
JP (1) JP6858783B2 (ja)
KR (1) KR20180071299A (ja)
CN (1) CN108138226B (ja)
AU (2) AU2016341845B2 (ja)
BR (1) BR112018007710A2 (ja)
IL (2) IL296418A (ja)
RU (1) RU2706203C1 (ja)
WO (1) WO2017070096A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210265006A1 (en) * 2018-07-24 2021-08-26 Affymetrix, Inc. Array based method and kit for determining copy number and genotype in pseudogenes
CN110706746B (zh) * 2019-11-27 2021-09-17 北京博安智联科技有限公司 一种dna混合分型数据库比对算法
CN114645080A (zh) * 2020-12-21 2022-06-21 高嵩 一种利用多态性位点和靶位点测序检测胎儿遗传变异的方法
WO2024047168A1 (en) * 2022-08-31 2024-03-07 Saga Diagnostics Ab Multi-vector detection of variant sequences

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003532367A (ja) * 1997-09-05 2003-11-05 アフィメトリックス・インコーポレーテッド ポリマーの識別、確認、マッピングおよび分類手法
JP2005531853A (ja) * 2002-06-28 2005-10-20 アプレラ コーポレイション Snp遺伝子型クラスタリングのためのシステムおよび方法
US20080131894A1 (en) * 2006-10-18 2008-06-05 Affymetrix, Inc. Enzymatic methods for genotyping on arrays
WO2008064687A1 (en) * 2006-11-27 2008-06-05 Fluimedix Fidelity enhanced allele specific amplification method
JP2010517545A (ja) * 2007-02-06 2010-05-27 ビオメリュー ベー.フェー. 一塩基変異多型(snp)を判別する方法
US20120221255A1 (en) * 2007-05-18 2012-08-30 Affymetrix, Inc. System, Method, and Computer Software Product for Genotype Determination Using Probe Array Data
US20130261196A1 (en) * 2010-06-11 2013-10-03 Lisa Diamond Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same
US20140274749A1 (en) * 2013-03-15 2014-09-18 Affymetrix, Inc. Systems and Methods for SNP Characterization and Identifying off Target Variants

Family Cites Families (104)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1359808A (en) 1916-03-20 1920-11-23 Martin R Jacobus Poultry-feeder
US4437975A (en) 1977-07-20 1984-03-20 Mobil Oil Corporation Manufacture of lube base stock oil
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5333675C1 (en) 1986-02-25 2001-05-01 Perkin Elmer Corp Apparatus and method for performing automated amplification of nucleic acid sequences and assays using heating and cooling steps
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
NO870613L (no) 1986-03-05 1987-09-07 Molecular Diagnostics Inc Deteksjon av mikroorganismer i en prŸve inneholdende nukleinsyre.
IL86724A (en) 1987-06-19 1995-01-24 Siska Diagnostics Inc Methods and kits for amplification and testing of nucleic acid sequences
WO1989001050A1 (en) 1987-07-31 1989-02-09 The Board Of Trustees Of The Leland Stanford Junior University Selective amplification of target polynucleotide sequences
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
JP2650159B2 (ja) 1988-02-24 1997-09-03 アクゾ・ノベル・エヌ・ベー 核酸増幅方法
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
AU632494B2 (en) 1988-05-20 1993-01-07 F. Hoffmann-La Roche Ag Immobilized sequence-specific probes
WO1990006995A1 (en) 1988-12-16 1990-06-28 Siska Diagnostics, Inc. Self-sustained sequence replication system
US5856092A (en) 1989-02-13 1999-01-05 Geneco Pty Ltd Detection of a nucleic acid sequence or a change therein
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5547839A (en) 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US5242974A (en) 1991-11-22 1993-09-07 Affymax Technologies N.V. Polymer reversal on solid surfaces
US6346413B1 (en) 1989-06-07 2002-02-12 Affymetrix, Inc. Polymer arrays
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5871928A (en) 1989-06-07 1999-02-16 Fodor; Stephen P. A. Methods for nucleic acid analysis
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US6309822B1 (en) 1989-06-07 2001-10-30 Affymetrix, Inc. Method for comparing copy number of nucleic acid sequences
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5252743A (en) 1989-11-13 1993-10-12 Affymax Technologies N.V. Spatially-addressable immobilization of anti-ligands on surfaces
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
WO1992003567A1 (en) 1990-08-24 1992-03-05 The University Of Tennessee Research Corporation Dna amplification fingerprinting
WO1992007095A1 (en) 1990-10-15 1992-04-30 Stratagene Arbitrarily primed polymerase chain reaction method for fingerprinting genomes
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
ATE148889T1 (de) 1991-09-18 1997-02-15 Affymax Tech Nv Verfahren zur synthese der verschiedenen sammlungen von oligomeren
US5324633A (en) 1991-11-22 1994-06-28 Affymax Technologies N.V. Method and apparatus for measuring binding affinity
US5550215A (en) 1991-11-22 1996-08-27 Holmes; Christopher P. Polymer reversal on solid surfaces
EP0916396B1 (en) 1991-11-22 2005-04-13 Affymetrix, Inc. (a Delaware Corporation) Combinatorial strategies for polymer synthesis
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5541061A (en) 1992-04-29 1996-07-30 Affymax Technologies N.V. Methods for screening factorial chemical libraries
US5491074A (en) 1993-04-01 1996-02-13 Affymax Technologies Nv Association peptides
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
EP0705271B1 (en) 1993-06-25 2002-11-13 Affymetrix, Inc. (a Delaware Corporation) Hybridization and sequencing of nucleic acids
US5858659A (en) 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
US6156501A (en) 1993-10-26 2000-12-05 Affymetrix, Inc. Arrays of modified nucleic acid probes and methods of use
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US6090555A (en) 1997-12-11 2000-07-18 Affymetrix, Inc. Scanned image alignment systems and methods
US5631734A (en) 1994-02-10 1997-05-20 Affymetrix, Inc. Method and apparatus for detection of fluorescently labeled materials
US5578832A (en) 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
WO1995030774A1 (en) 1994-05-05 1995-11-16 Beckman Instruments, Inc. Oligonucleotide repeat arrays
US5571639A (en) 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US5795716A (en) 1994-10-21 1998-08-18 Chee; Mark S. Computer-aided visualization and analysis system for sequence evaluation
US5599695A (en) 1995-02-27 1997-02-04 Affymetrix, Inc. Printing molecular library arrays using deprotection agents solely in the vapor phase
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
US5624711A (en) 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
US5648245A (en) 1995-05-09 1997-07-15 Carnegie Institution Of Washington Method for constructing an oligonucleotide concatamer library by rolling circle replication
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US5968740A (en) 1995-07-24 1999-10-19 Affymetrix, Inc. Method of Identifying a Base in a Nucleic Acid
US5733729A (en) 1995-09-14 1998-03-31 Affymetrix, Inc. Computer-aided probability base calling for arrays of nucleic acid probes on chips
US6300063B1 (en) 1995-11-29 2001-10-09 Affymetrix, Inc. Polymorphism detection
US6147205A (en) 1995-12-15 2000-11-14 Affymetrix, Inc. Photocleavable protecting groups and methods for their use
US6114122A (en) 1996-03-26 2000-09-05 Affymetrix, Inc. Fluidics station with a mounting system and method of using
US5981956A (en) 1996-05-16 1999-11-09 Affymetrix, Inc. Systems and methods for detection of labeled materials
DE69833758T2 (de) 1997-06-13 2006-08-31 Affymetrix, Inc. (n.d.Ges.d.Staates Delaware), Santa Clara Verfahren zur erkennung von genpolymorphismen und allelexpression unter verwendung von sondenchips
US6333179B1 (en) 1997-06-20 2001-12-25 Affymetrix, Inc. Methods and compositions for multiplex amplification of nucleic acids
WO1999005574A1 (en) 1997-07-25 1999-02-04 Affymetrix, Inc. Method and system for providing a probe array chip design database
ATE280246T1 (de) 1997-08-15 2004-11-15 Affymetrix Inc Polymorphismuserkennung mit hilfe cluster-analyse
DE69829402T2 (de) 1997-10-31 2006-04-13 Affymetrix, Inc. (a Delaware Corp.), Santa Clara Expressionsprofile in adulten und fötalen organen
US6013449A (en) 1997-11-26 2000-01-11 The United States Of America As Represented By The Department Of Health And Human Services Probe-based analysis of heterozygous mutations using two-color labelling
US6269846B1 (en) 1998-01-13 2001-08-07 Genetic Microsystems, Inc. Depositing fluid specimens on substrates, resulting ordered arrays, techniques for deposition of arrays
US6201639B1 (en) 1998-03-20 2001-03-13 James W. Overbeck Wide field of view and high speed scanning microscopy
US6428752B1 (en) 1998-05-14 2002-08-06 Affymetrix, Inc. Cleaning deposit devices that form microarrays and the like
US6185030B1 (en) 1998-03-20 2001-02-06 James W. Overbeck Wide field of view and high speed scanning microscopy
AU3601599A (en) 1998-03-25 1999-10-18 Ulf Landegren Rolling circle replication of padlock probes
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US5936324A (en) 1998-03-30 1999-08-10 Genetic Microsystems Inc. Moving magnet scanner
JP3565025B2 (ja) 1998-07-07 2004-09-15 日産自動車株式会社 治具交換装置および治具交換方法
US6185561B1 (en) 1998-09-17 2001-02-06 Affymetrix, Inc. Method and apparatus for providing and expression data mining database
US6262216B1 (en) 1998-10-13 2001-07-17 Affymetrix, Inc. Functionalized silicon compounds and methods for their synthesis and use
DE69929542T2 (de) 1998-10-27 2006-09-14 Affymetrix, Inc., Santa Clara Komplexitätsmanagement und analyse genomischer dna
US6177248B1 (en) 1999-02-24 2001-01-23 Affymetrix, Inc. Downstream genes of tumor suppressor WT1
WO2000058516A2 (en) 1999-03-26 2000-10-05 Whitehead Institute For Biomedical Research Universal arrays
US6218803B1 (en) 1999-06-04 2001-04-17 Genetic Microsystems, Inc. Position sensing with variable capacitance transducers
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
US6386749B1 (en) 2000-06-26 2002-05-14 Affymetrix, Inc. Systems and methods for heating and mixing fluids
AU2002246612B2 (en) 2000-10-24 2007-11-01 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic DNA
US6391592B1 (en) 2000-12-14 2002-05-21 Affymetrix, Inc. Blocker-aided target amplification of nucleic acids
US6988040B2 (en) 2001-01-11 2006-01-17 Affymetrix, Inc. System, method, and computer software for genotyping analysis and identification of allelic imbalance
US6804679B2 (en) 2001-03-12 2004-10-12 Affymetrix, Inc. System, method, and user interfaces for managing genomic data
US6872529B2 (en) 2001-07-25 2005-03-29 Affymetrix, Inc. Complexity management of genomic DNA
JP2005535283A (ja) 2001-11-13 2005-11-24 ルビコン ゲノミクス インコーポレイテッド ランダムフラグメント化により生成されたdna分子を用いたdna増幅および配列決定
US20030120431A1 (en) 2001-12-21 2003-06-26 Affymetrix, Inc. Method and computer software product for genomic alignment and assessment of the transcriptome
US20050042654A1 (en) 2003-06-27 2005-02-24 Affymetrix, Inc. Genotyping methods
EP1591534A1 (en) * 2004-04-01 2005-11-02 Stichting Sanquin Bloedvoorziening A method of genotyping blood cell antigens and a kit suitable for genotyping blood cell antigens
US8716190B2 (en) 2007-09-14 2014-05-06 Affymetrix, Inc. Amplification and analysis of selected targets on solid supports
US9513300B2 (en) 2008-05-05 2016-12-06 Cornell University Determination of serum anti-mullerian hormone as a diagnostic test for spay in companion animals
US8312249B1 (en) 2008-10-10 2012-11-13 Apple Inc. Dynamic trampoline and structured code generation in a signed code environment
US8828688B2 (en) 2010-05-27 2014-09-09 Affymetrix, Inc. Multiplex amplification methods
US20120028826A1 (en) 2010-07-27 2012-02-02 Affymetrix, Inc. Methods and Compositions for Analysis of Nucleic Acids
US8759036B2 (en) 2011-03-21 2014-06-24 Affymetrix, Inc. Methods for synthesizing pools of probes
CN104114703A (zh) * 2012-03-30 2014-10-22 深圳华大基因科技服务有限公司 全基因组扩增方法及其应用
EP3126524B1 (en) 2014-04-04 2020-07-22 Affymetrix, Inc. Improved compositions and methods for molecular inversion probe assays
TWI585937B (zh) 2014-08-01 2017-06-01 乾坤科技股份有限公司 具有順形電磁屏蔽結構的半導體封裝件及其製作方法
CN106252749B (zh) 2015-06-04 2020-12-29 松下知识产权经营株式会社 蓄电池包的控制方法以及蓄电池包

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003532367A (ja) * 1997-09-05 2003-11-05 アフィメトリックス・インコーポレーテッド ポリマーの識別、確認、マッピングおよび分類手法
JP2005531853A (ja) * 2002-06-28 2005-10-20 アプレラ コーポレイション Snp遺伝子型クラスタリングのためのシステムおよび方法
US20080131894A1 (en) * 2006-10-18 2008-06-05 Affymetrix, Inc. Enzymatic methods for genotyping on arrays
WO2008064687A1 (en) * 2006-11-27 2008-06-05 Fluimedix Fidelity enhanced allele specific amplification method
JP2010517545A (ja) * 2007-02-06 2010-05-27 ビオメリュー ベー.フェー. 一塩基変異多型(snp)を判別する方法
US20120221255A1 (en) * 2007-05-18 2012-08-30 Affymetrix, Inc. System, Method, and Computer Software Product for Genotype Determination Using Probe Array Data
US20130261196A1 (en) * 2010-06-11 2013-10-03 Lisa Diamond Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same
US20140274749A1 (en) * 2013-03-15 2014-09-18 Affymetrix, Inc. Systems and Methods for SNP Characterization and Identifying off Target Variants

Also Published As

Publication number Publication date
IL296418A (en) 2022-11-01
AU2016341845A1 (en) 2018-05-10
KR20180071299A (ko) 2018-06-27
EP3901279B1 (en) 2023-05-17
IL258795B2 (en) 2023-02-01
IL258795A (en) 2018-06-28
EP3362580B1 (en) 2021-02-17
JP6858783B2 (ja) 2021-04-14
EP3901279A1 (en) 2021-10-27
EP3362580A4 (en) 2019-03-27
EP3362580A1 (en) 2018-08-22
RU2706203C1 (ru) 2019-11-14
AU2022259706A1 (en) 2022-11-24
WO2017070096A1 (en) 2017-04-27
US20180305748A1 (en) 2018-10-25
IL258795B (en) 2022-10-01
BR112018007710A2 (pt) 2018-10-23
CN108138226B (zh) 2022-02-11
AU2016341845B2 (en) 2022-11-17
CN108138226A (zh) 2018-06-08

Similar Documents

Publication Publication Date Title
US11657900B2 (en) Methods for identifying DNA copy number changes using hidden markov model based estimations
Hughes et al. Clonal architecture of secondary acute myeloid leukemia defined by single-cell sequencing
Kronenberg et al. Wham: identifying structural variants of biological consequence
Alamancos et al. Methods to study splicing from high-throughput RNA sequencing data
JP7113838B2 (ja) 配列バリアントコールのための有効化方法およびシステム
Tebbutt et al. Microarray genotyping resource to determine population stratification in genetic association studies of complex disease
AU2022259706A1 (en) Multiallelic genotyping of single nucleotide polymorphisms and indels
US20050064476A1 (en) Methods for identifying DNA copy number changes
US20160300013A1 (en) METHOD FOR SIMULTANEOUS DETECTION OF GENOME-WIDE COPY NUMBER CHANGES, cnLOH, INDELS, AND GENE MUTATIONS
Aston et al. A review of genome-wide approaches to study the genetic basis for spermatogenic defects
Craig et al. Applications of whole-genome high-density SNP genotyping
US20050244883A1 (en) Method and computer software product for genomic alignment and assessment of the transcriptome
O'brien et al. Using genome-wide expression profiling to define gene networks relevant to the study of complex traits: from RNA integrity to network topology
Dudbridge et al. Detecting multiple associations in genome-wide studies
Su et al. Assessing the prospects of genome-wide association studies performed in inbred mice
Barrot et al. Big data in pharmacogenomics: current applications, perspectives and pitfalls
Lin et al. Pattern-recognition techniques with haplotype analysis in pharmacogenomics
Wang et al. Mitochondrial DNA enrichment reduced NUMT contamination in porcine NGS analyses
JP2023526441A (ja) 複合遺伝子バリアントの検出およびフェージングのための方法およびシステム
Lysenko et al. Genotyping and Statistical Analysis
NL2021473B1 (en) DEEP LEARNING-BASED FRAMEWORK FOR IDENTIFYING SEQUENCE PATTERNS THAT CAUSE SEQUENCE-SPECIFIC ERRORS (SSEs)
Angaji Single nucleotide polymorphisms and association studies: A few critical points
Grace Detection and exploitation of expression QTL in drug discovery and development
이재훈 Gene set analysis for Genome-Wide Association Study and Next Generation Sequencing data
JIN STATISTICAL CHALLENGES IN NEXT GENERATION POPULATION GENOMICS STUDY

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190510

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210324

R150 Certificate of patent or registration of utility model

Ref document number: 6858783

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250