JP2011504095A - 生物学的アッセイを実施する為に試料をプールする方法 - Google Patents

生物学的アッセイを実施する為に試料をプールする方法 Download PDF

Info

Publication number
JP2011504095A
JP2011504095A JP2010531978A JP2010531978A JP2011504095A JP 2011504095 A JP2011504095 A JP 2011504095A JP 2010531978 A JP2010531978 A JP 2010531978A JP 2010531978 A JP2010531978 A JP 2010531978A JP 2011504095 A JP2011504095 A JP 2011504095A
Authority
JP
Japan
Prior art keywords
sample
samples
pooling
pool
pooled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010531978A
Other languages
English (en)
Inventor
ランベルトゥス ヨハヌス フェライケン,アドリアヌス
パウラ ユンゲリウス,アンネミーケ
アントニウス アルノルドゥス アルバース,ゲラルドゥス
Original Assignee
ヘンドリクス ゲネティクス ビー.ブイ.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヘンドリクス ゲネティクス ビー.ブイ. filed Critical ヘンドリクス ゲネティクス ビー.ブイ.
Publication of JP2011504095A publication Critical patent/JP2011504095A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本発明はカテゴリー変数について分析されるべき試料をプールする方法に関し、ここで該分析は分析物の定量的測定を含み、該試料をプールする方法は、n個の試料のプールを用意することを含み、ここで該プール内の個々の試料の量は、該試料中の該分析物がX:X:X:X(n−1)のモル比で存在するものであり且つ、xは、カテゴリー変数のクラスの数を表す2以上の整数である。
【選択図】図7

Description

発明の分野
本発明は、生物学的試料についてのカテゴリカルアウトカムによる測定の分野に関し、より特には、カテゴリカルアウトカムによるバイオアッセイの試料調製の為の方法に関する。本発明は、試料をプールする方法、対立遺伝子変異体を遺伝子型同定する為の該方法の使用方法を提供する。本発明はさらに、複数の試料についての分析を実施する方法、複数の試料を1つのプールされた試料へとプールする為のプーリング装置、プールされた試料のセットについての分析を実施する為に構成されたプロセッサを備えている分析装置、試料をプールする方法を実行するコンピュータプログラム製品、及び複数の試料についての分析を実施する為の方法を実行するコンピュータプログラム製品を提供する。
発明の背景
バイオアッセイは、生物学的分析物の特性、濃度又は存在が試料中において測定される手順である。バイオアッセイは、科学の全分野における研究、最も顕著にはライフサイエンス及び特には分子生物学における研究の本質的部分である。
分子生物学における特定の種類の分析は、遺伝子型同定及びシークエンシングに関する。遺伝子型同定及びシークエンシングは、個体の遺伝子型を、生物学的アッセイにより決定するプロセスをいう。現在の方法は、PCR、DNA及びRNAシークエンシング、並びに種々のキャリア、例えばガラスプレート又はビーズなど、の上に乗せられたDNA及びRNAマイクロアレイへのハイブリダイゼーションを含む。該技術は、父であること/母であることについての試験にとって、疾患関連遺伝子の調査の為の臨床研究において、及び、任意の種の特性の遺伝子制御を調査することを目的とした他の研究、例えばQTL(量的形質遺伝子座)のための全ゲノムスキャンなど、において本質的である。
現在の技術の限界の故に、ほとんど全ての遺伝子型同定は部分的である。すなわち、個体の遺伝子型の小さい断片だけが決定される。多くの例において、これは問題でない。例えば、父であること/母であることについて試験するとき、10〜20の遺伝子の領域だけが調査されて、関係又は関係の欠如を決定する。これはヒトゲノムのごく小さな断片である。
一塩基多型(SNP)は、ゲノム中で最も豊富な種類の多型である。ハイスループットSNP遺伝子型同定の為の技術及び密集したSNPマーカーマップの並行の開発により、SNPは、多くの遺伝子研究にとって、よりぬきのマーカーとなった。たくさんの数の試料が、マッピング及び関連の研究において又はゲノムの選抜実験において必要とされる。
ハイスループットの遺伝子型同定能力を備える為に、整列化(arraying)技術が、開発された。そのような技術は、商業上の供給業者、例えばAffymetrix(マイクロアレイに基づくGeneChip(商標)マッピングアレイ)、Illumina(BeadArray(商標))、Biotrove(Open Array(商標))、及びSequenom(MassARRAY(商標))など、から利用可能である。多くの種(ヒト、家畜、植物、バクテリア及びウィルス)において、多数のSNPが利用可能であり、又は近い将来において利用可能となるであろう。新たな革新は、全ゲノムの遺伝子型同定又は関連研究及び、植物及び動物の育種の為の、関連する全ゲノム選抜プログラムを可能とした。今のところそのようなプログラムのコストはまだかなりのものであり、もし試料が個別に遺伝子型同定されるならば、最大で数百万ドルの予算を要求する。それ故に、任意の種におけるSNPの同定を目的とした研究は、現在、限られた数の個体だけの分析を含む。それ故に、本発明は、遺伝子型同定のコストの非常に実質的な減少を許すので、非常に意義あるものである。
ゲノムの変異性における十分な洞察を得るために、ゲノムの(関連のある部分の)全配列を知ることが必要である。しかしながら、全配列を決定するコストは、前の段落において記載された遺伝子型同定のコストよりもさらに高い。該コストにもかかわらず、シークエンシングは、遺伝子型同定に取って代わり、全ゲノムまたはその特定の領域についての個体の遺伝子型同定を与えるであろうことが期待される。本発明もまた、シークエンシングのコストを減じる方法を提供する。
試料プーリングは、通常は、分類形質についての研究において、分析コストを減ずるための手段として用いられる。いくつかの試料の混合物からなる該プールにおける特徴の存在は、そのプールにおける該試料の少なくとも1つにおけるその特徴の存在を示す。DNAプールは例えば、下記のために用いられる。
集団における対立遺伝子頻度を見積もるため。個体の良い試料を集団から採ることにより、対立遺伝子1の未加工の対立遺伝子頻度(raw allele frequency)が、該プールにおける対立遺伝子1についての結果と対立遺伝子1についての結果及び対立遺伝子2についての結果の合計との間の比として計算される。
症例及び対照が別のプールに分けられるところの症例−対照関連研究のため、及び
限定された数の個体及び限定された数のSNPについてのハプロタイプの再構築のため。該プールにおいて測定された対立遺伝子頻度に基づき、ハプロタイプは、種々のアルゴリズム、例えば最大尤度など、により見積もられうる。語「ハプロタイプ頻度」は、語「マーカーの同時分布(joint distribution of markers)」と同じことを意味する。
試料プーリングの重要な不利点は、該測定された特徴が、全体としての該プールにおいて同定されるだけであり、該プールにおける個々の試料のいずれにおいて同定されないことである。1つの例外は、2つの個体からなる2つのプールのそれぞれが作られた場合(父+子及び母+子)に三つ組(父、母及び子)を遺伝子型同定する為のDNAプールである。それぞれのプールにおいて観察された対立遺伝子頻度は、すべての3つの個体についての遺伝子型を示す。この種の試料プーリングは、33%のコスト減少を与えるが、そのような三つ組により可能なだけである。全ての他の例において、プールされた試料は、個々の試料についての結果を提供する為に、個々に再度分析されなければならない。
すなわち、三つ組以外の試料タイプについての試料プールを提供する一方で、なおもそのプール内の個々の試料についての試験結果を与えることが有益だろう。
発明の概要
本発明者らは今、プール中のそれぞれの個体試料の分布が、それぞれの他の試料の分布の固定された比である場合、すなわち試料の量が等モルでないが特定の比で与えられる場合、無作為の個体がプールされうること及び個体の遺伝子型がそのようなプールから取り出されうることを発見した。個々の試料についての結果は、試験がカテゴリー変数の定量的測定に関与すること、すなわち試験が定量的に測定される分類形質又は離散的形質(a categorical or discrete trait)に関与することを条件として、該プールされた試験結果から推測されうる。
実際に、本発明者らは、二倍体動物における或る座位での或る対立遺伝子の存在の研究の為に、1つの座位で2つの可能な対立遺伝子(A又はB)を有する第1の二倍体動物のDNA試料と同じ座位で2つの可能な対立遺伝子(A又はB)を有する第2の二倍体動物のDNA試料との1:3の比での混合が、その混合物における対立遺伝子のいずれかについて(2)+(2+2+2)=8の可能性の存在を結果すること、ここで一つの対立遺伝子(例えばA)からの期待される定量的装置シグナルが最大試料シグナル強度の12・5%である、を発見した。これは、最大試料シグナル強度の37.5%の測定されたシグナル強度で、該試料は、3x対立遺伝子Aを含むことを意味し、これは該シグナルが、該第1の二倍体動物から得られることはできず、そして該第2の二倍体動物からだけ得られることができることを意味し、該第1の二倍体動物は遺伝子型BBを有し及び該第2の二倍体動物は遺伝子型ABを有することを示す。同様に、測定されたシグナル強度が最大試料シグナル強度の50%である場合、全ての試料は、遺伝子型ABを有する。測定されたシグナル強度が、最大試料シグナル強度の0%である場合、そのときは全ての試料が遺伝子型BBを有する。該プール中の該2つ個体は、全部で3*3の可能な遺伝子型を有する。該測定の精度が少なくとも6.25%であるとすると、それぞれの測定は、100%の八分の一(1/8)の値又はその倍数に割り当てられうる。一般に、それぞれの可能な測定結果は、
Figure 2011504095
の値に割り当てられることができ、ここでy=2(1つの位置での対立遺伝子Aについての2つの可能な結果、対立遺伝子は存在する又は不在である)、pは倍数性レベルであり、nは試料の数であり、且つ100%は最大試料シグナル強度である。全部で、(倍数性レベル+1)の可能な遺伝子型があるであろう。
今、3つの動物の試料(x、y及びz)を1:3:9の比で(それぞれ、すなわち、3のプーリング因子で)プールしたとき、理論上は、その混合物中の対立遺伝子のいずれかについて合計26の可能性があり、ここで一つの対立遺伝子(例えばA)からの期待される定量的シグナルは、最大の試料シグナル強度の3.85%である。これは、最大試料シグナル強度の12%の測定されたシグナル強度で、該試料は、3x対立遺伝子Aを含み、動物xが遺伝子型BBを有し、動物yが遺伝子型ABを有し、及び動物zが遺伝子型BBを有することを示す。同様に、該測定されたシグナル強度が最大試料シグナル強度の96%であるとき、試料xは遺伝子型ABを有し、一方で試料y及びzは遺伝子型AAを有する。該測定の精度が少なくとも1.9%であるとすると、それぞれの測定は、100%の26分の1(1/26)の値、又はその倍数に割り当てられうる。(そのようなプールされた実験についての可能なアウトカムの概観について、以下の実施例を参照されたい)。
本発明者らは、この原理が、分析の結果が試料中の分析物の性質に関して分類的であるところの、該試料中の分析物の定量的測定を伴う多くの該分析について用いられうることを示した。
第一の局面において、本発明は今、カテゴリー変数について分析されるべき試料をプールする方法を提供し、ここで該分析は、分析物の定量的測定を含み、該試料をプールする方法は、n個の試料のプールを用意することを含み、ここで該プール中の個々の試料の量は、該試料中の分析物がx:x:x:x(n−1)のモル比で存在するような量であり、且つxは、カテゴリー変数(又はプーリング因子)のクラスの数を表す2以上の整数、例えば3、4、5、6、7、又は8など、好ましくは2又は3、であり、且つnは試料の数である。アノテーションx:x:x:x(n−1)は、x:x:x:・・・:x(n−1)又はx:x:x:xi;x(n−1)をいうとして理解されるべきであり、ここでnは試料の数であり且つiは、2とnの間の値を有する増加する整数である。
倍数体個体のプーリングについて、xは(倍数性レベル+1)に等しく、すなわち1つのシングル位置で2つの可能な対立遺伝子を有する一倍体についてx=2であり、二倍体についてx=3であり、そして四倍体についてx=5であり、xはまた、可能な遺伝子型の数にも等しい。
3つの可能な対立遺伝子があると仮定すると、そのときは、一倍体は3つの可能な遺伝子型を有し(x=3)、二倍体は6つの可能な遺伝子型を有し(x=6)、そして三倍体は10の可能な遺伝子型を有するだろう(x=10)。1つの二倍体個体において、第一の対立遺伝子は、第二及び第三の対立遺伝子と同じく0、1又は2回生じうる。これは、2つの対立遺伝子によるのと同じ比(x:x:x:x(n−1))(xがやはり倍数性レベル+1である)でプールすることを可能とする。3つの対立遺伝子についてのシグナル強度は、該プールされた試料中の対立遺伝子の数を発見する為に、最近の結果点
Figure 2011504095
(ここでy=2であり(対立遺伝子1、2又は3が存在する又は不在である)、p=倍数性レベルであり、且つn=試料の数である)に丸められる。
すなわち、該プール中の2つの個体の試料の間の比(例として)は、その中の分析物が、1:xのモル比で存在するような比であり、ここでxは分類形質についてのクラスの最大数である。
該プール中の個体の試料の量が、公比(common ratio)3を有する幾何数列として与えられるところの方法が、二倍体個体中の対立遺伝子変異を遺伝子型同定するために特に適しており、ここでそれぞれの個体は3つの可能な遺伝子型を有する。該遺伝子型は、3つの可能な変異(AA、AB及びBB)を有しうる分類形質である。
該プール中の該個体試料の量が公比2を有する幾何数列として与えられるところの方法は、一倍体中の対立遺伝子変異を遺伝子型同定するために特に適している。その例について、以下の実験の部で言及される。
他の局面において、本発明は、カテゴリー変数(x)のクラスの数がp+1に等しく、pが個体の倍数性レベルを表すところの一倍体又は倍数体個体中の対立遺伝子変異を遺伝子型同定するための、上記で記載された本発明の方法の使用方法に関する。そのような使用方法は例えば、一倍体又は倍数体個体中の対立遺伝子を遺伝子型同定することを許す。
さらに他の局面において、本発明は、複数の試料についての分析を実施する方法であって、該試料を、上記で記載された本発明の方法に従いプールして、プールされた試料を用意すること、及び該プールされた試料について該分析を実施することを含む上記方法に関する。得られた定量的結果は次に、最も近い結果点(最大試料シグナル強度がそれぞれの可能な結果について割られるところの理論上の間隔の数により決定される、以下を参照されたい)に四捨五入され、そして該シグナル強度は、該プールされた試料中のカテゴリー変数のクラスの合計数に割り当てられる。これから、該カテゴリー変数は、該プール中のそれぞれの個体試料について、該プール中の種々の個体試料の比を考慮して、決定される。
他の局面において、本発明は、複数の試料について分析を実施する方法であって、本明細書上記で定められたとおり試料をプールする方法により得られた、プールされた試料の1セットについて分析を実施することを含む、ここで該試料はカテゴリー変数について分析され且つ該試料中の分析物の定量的測定(a quantitative measurement)に関与する、上記方法を提供する。
この方法の好ましい実施態様において、分析の実施の方法はさらに、該測定から、該試料のプール中の個体試料の寄与を演繹するステップを含む。
他の局面において、本発明は、複数の試料を1つのプールされた試料へとプールする為のプーリング装置であって、プールされた試料を用意する為の試料アスピレーターを備えており及び本明細書上記で定義された試料をプールする方法を実施する為のプロセッサをさらに備えている上記装置を提供する。
他の局面において、本発明は、本明細書上記で定義されたとおりの試料をプールする方法により得られたプールされた試料のセットについての分析を実施する為に構成されたプロセッサを備えている分析装置を提供し、ここで該装置は、カテゴリー変数について該試料を分析する為に及び該試料中の分析物の定量的測定を実施するように構成されている。
この分析装置の好ましい実施態様において、該装置はさらに、プーリング装置を備えており、最も好ましくは上記で開示されたプーリング装置を備えている。
他の局面において、本発明は、コンピュータプログラム製品それ自身又はキャリア上のコンピュータプログラム製品を提供し、該プログラム製品は、コンピュータ、プログラムされたコンピュータネットワーク又は他のプログラム可能な装置においてロードされそして実行されたときに、本明細書上記において定義されたとおりの試料をプールする方法を実行する。
他の局面において、本発明は、コンピュータプログラム製品それ自身又はキャリア上のコンピュータプログラム製品を提供し、該プログラム製品は、コンピュータ、プログラムされたコンピュータネットワーク又は他のプログラム可能な装置においてロードされそして実行されたときに、複数試料に対する分析を実施する為の方法を実行し、該方法は、本明細書上記で定義されたとおりの試料をプールする方法により得られたプールされた試料のセットについて分析を実施することを含み、ここで該試料はカテゴリー変数について分析され及び該試料中の分析物の定量的測定に関与する。
このコンピュータプログラム製品の好ましい実施態様において、該方法はさらに、本明細書上記で定義されたとおりの試料をプールする方法に従うプーリングのステップを含む。
本発明の方法を用いることにより、分析コストが非常に、すなわち典型的には50%だけ、そしてさらには66%だけ又はそれより多く、減少されうる。
プールされたデータに基づいたときの対立遺伝子頻度(Y軸)と個別の測定に基づいたときの対立遺伝子頻度(X軸)との間の相関をグラフ表示で示す図である。 個体について測定されたときの対立遺伝子頻度(Y軸)とプールにおいて予測された対立遺伝子頻度(X軸)との間の関係をグラフ表示で示す図である。 プールにおける補正された対立遺伝子頻度(Y軸)と個別のタイピング後に固体について測定された対立遺伝子頻度(X軸)との間の関係をグラフ表示で示す図である。 実験1におけるプール1についての、(個別のタイピングに基づく)期待された対立遺伝子頻度と予測された対立遺伝子頻度との間の差をグラフ表示で示す図である。 実験2における全てのプールについての、(個別のタイピングに基づく)期待された対立遺伝子頻度と予測された対立遺伝子頻度との間の相関をグラフ表示で示す図である。 実験2における全てのプールについての、(個別のタイピングに基づく)期待された対立遺伝子頻度と予測された対立遺伝子頻度との間の差をグラフ表示で示す図である。 カテゴリー変数が、いくつかの可能なカテゴリーの1つである値をとることを示す図である。
好ましい実施態様の説明
本明細書において用いられるときに、語「カテゴリー変数」は、離散変数、例えば特徴又は形質など、例えば分析物又はそれにおける特徴の存在又は不在、又は分析物におけるホモ接合的若しくはヘテロ接合的な形で存在する若しくは不在である対立遺伝子形質、をいう。離散は、分類的(categorical)についての同義語であり、そして、非線形又は不連続的をいう。「変数」は一般に、試料の特性を測定する(分類上の)形質をいう。カテゴリー変数は、(2つのクラスからなる)バイナリーでありうる。「クラス」は、大きさ(測定値、a measurement)が割り当てられうるグループ又はカテゴリーをいう。すなわち、純粋なカテゴリー変数は、カテゴリーの割り当てを許すであろうものであり、及び、カテゴリー変数は、いくつかの可能なカテゴリー(クラス)の一つである値をとる。特に、該カテゴリー変数は、遺伝マーカー、例えば一塩基多型(SNP)、又は任意の他の遺伝マーカーなど、対立遺伝子、免疫応答、疾患、抵抗能力、毛の色、性、疾患感染の状態、遺伝子型又は試料又は生物学的実体の任意の他の形質又は特性の存在に関しうる。それらは、例えば分析装置により受信され、読み取られ及び/又は記録されうる生成された分析物シグナルとして、数値的に測定されうるが、カテゴリー変数それ自体は数値的な意味を有さず及び該カテゴリーは固有の順序付けを有さない。例えば、性は、2つのカテゴリー(しばしば0及び1としてコードされる男性及び女性)を有するカテゴリー変数であり、そして、好ましくは順序付けされないカテゴリーを表す。遺伝子型もまた、好ましくは順序付けされない多くのカテゴリー(ときどき2、1及び0としてコードされるAA、Aa及びaa)を有するカテゴリー変数である。
本発明の局面における試料は、カテゴリー変数が測定されるべきところの任意の試料でありうる。該試料は、生物学的試料、例えば動物(ヒトを含む)又は植物の組織試料又は体液試料など、環境試料、例えば土、空気又は水の試料などでありうる。該試料は、(部分的に)精製されてもよく、又は処理されていない(未加工の)試料であってもよい。該試料は、好ましくは核酸試料、例えばDNA試料である。
その存在又は形が定量的試験において測定される該分析物は、任意の化学的実体又は生物学的実体でありうる。好ましい実施態様において、該分析物は生体分子であり、そして、該カテゴリー変数は該生体分子の変異体(a variant)である。好ましくは、該生体分子は核酸、特にはポリヌクレオチド、例えばRNA、DNAなど、であり、そして、該変異体は例えば、該ポリヌクレオチドにおけるヌクレオチド多型、例えば対立遺伝子変異体、もっとも好ましくはSNP、又は特定のヌクレオチド位置の塩基アイデンティティー(base identity)でありうる。
本明細書において定義されたとおりの分析物は、このように、或るカテゴリー変数を示すDNA分子でありうる(例えば、A、T、C又はGのカテゴリー値を有する、その核酸分子中の特定のヌクレオチド位置の塩基アイデンティティー)。特定のヌクレオチド位置の塩基アイデンティティーは、例えば該ヌクレオチドの蛍光アナログを組み込んでいるcDNAコピーに由来する蛍光に基づく、定量的試験、例えばDNAシークエンシングの技術分野において既知のものなど、を用いることにより測定されうる。該DNAの特定の位置において該アナログにより放射されそして分析装置により測定された蛍光の定量的水準が次に、そのヌクレオチド位置についてのカテゴリー変数に、例えばその位置についてのアデニンとして、割り当てられる。
特定のヌクレオチド位置の塩基アイデンティティーを決定することにおいて、本発明は、特定の核酸のヌクレオチド配列が決定されるべき個体試料のプーリングに適する。本発明の方法のシークエンシングアッセイ(分析)についての適合性は、シークエンシングアッセイが、例えばシークエンシングゲル中の或る位置での任意の特定の塩基についてのシグナルの存在又は不在が、該核酸内の特定のヌクレオチド位置におけるその塩基アイデンティティーの存在又は不在に対応するところの、4つの可能な塩基のいずれか一つからのシグナルの決定を含むことに理解したときに、理解されうる。本明細書において記載されたとおりの比でシークエンスゲルを走らせる前の2つの試料のプーリングが、任意の特定のシグナルの源及びすなわちそれぞれの個体の核酸についての配列の決定を許すであろう。
該「分析物」は、ポリペプチド、例えばタンパク質、ペプチド又はアミノ酸など、でありうる。該分析物は、核酸、核酸プローブ、抗体、抗原、レセプター、ハプテン、およびレセプター又はその断片についてのリガンド、(蛍光)ラベル、色素原、放射性同位体など、であってもよい。事実、該分析物は、定量的に測定されることができ、そして該カテゴリー変数のクラスを決定するために用いられることができる、任意の化学的又は物理的物質により形成されることができる。
本明細書において用いられるときに、語「ヌクレオチド」は、糖、典型的にはリボース(RNA)又はデオキシリボース(DNA)のC−1炭素に結合されたプリン(アデニン又はグアニン)又はピリミジン(チアミン、シトシン又はウラシル)塩基を含み、そしてさらに該糖のC−5炭素に結合した1以上のホスフェート基を含む化合物をいう。該語は、個々のヌクレオチドの糖単位が、ホスホジエステル架橋を介して連結されて、吊り下がっているプリン又はピリミジン塩基を有する糖リン酸バックボーンを形成するところの核酸又はポリヌクレオチドの個々のビルディングブロックへの言及も含む。
本明細書において用いられるときに、語「核酸」は、一本鎖又は二本鎖のいずれかの形にある、デオキシリボヌクレオチド又はリボヌクレオチドのポリマー、すなわちポリヌクレオチドへの言及を含み、そして他の限定されない限り、天然に生じるヌクレオチドと同様の様式で一本鎖核酸にハイブリダイズする、天然のヌクレオチドの本質的な性質を有する既知のアナログ(例えばペプチド核酸)を包含する。ポリヌクレオチドは、天然の又は異種性の構造的又は調節的遺伝子の完全長又はサブシークエンスでありうる。他に示されない限り、該語は、該特定された配列ならびにその相補的配列への言及も含む。すなわち、「ポリヌクレオチド」が本明細書において意図されるときに、安定性の為に又は多の理由の為に修正されたバックボーンを有するDNA又はRNAは「ポリヌクレオチド」である。さらに、本明細書において該語が用いられるときに、ほんの2例だけ挙げると、普通ではない塩基、例えばイノシンなど、又は修正された塩基、例えばトリチル化された塩基など、を含むDNA又はRNAがポリヌクレオチドである。
語「定量的測定」は、試料中の分析物の量の決定をいう。語「定量的」は、該測定が数値的な値で表されうるという事実をいう。該数値的な値は、寸法、サイズ、程度、量、容量、濃度、高さ、深さ、幅(width)、幅(breadth)、長さ、重さ、体積又は面積に関しうる。該定量的測定は、測定シグナル、例えば色素生成シグナル又は蛍光シグナルなど、又は任意の他の定量的シグナルの強度、ピーク高さ又はピーク面(peak surface)に関与しうる。一般に、分析物の存在又は形を決定するときに、該測定は装置シグナルに関与するであろう。例えば、SNPの存在を決定するときに、該測定は、ハイブリダイゼーションシグナルに関与するであろうし、そして該測定は典型的には蛍光光度計により測定されたときの蛍光強度を与えるであろう。免疫応答の存在を決定するときに、該測定は抗体力価の測定を含むであろうし、そしてまた該測定は典型的には蛍光強度としても与えられるであろう。該測定は、連続的な測定結果を与えることを要しないが、離散間隔又はカテゴリーに関しうる。該測定は、準定量的でもありうる。該測定が最大試料シグナル強度の2n−1、3n−1又はxn−1の部分的な及び好ましくは比例的な間隔で決定されうる限り(該プールが、公比2、3又はxをそれぞれ有する幾何数列として与えられるかどうかに依って、ここでnは該プール中の試料の数である)、該測定は原理上適当である。
語「プールする(プーリング)」は、本明細書において用いられるときに、ユーザーへの利点を最大化する為に、試料を一緒にグループ化すること又は併合することをいう。特に、語「プールする(プーリング)」は、加重値の1つの試料を表すための複数試料のコレクションの調製をいう。複数試料を1つのシングル試料へと併合することは通常、試料を混合することにより実施される。本発明において、混合は、個々の試料の量を注意深く重さを量ることを要し、ここでそれぞれの試料中に存在する分析物の量は決定的である。試料Aが2g/lの分析物の量を有し且つ試料Bが1g/lの分析物の量を有するとき、これらの試料は、1:3の分析物比を与える為に、1:6の体積比でプールされる必要がある。
本発明の実施態様において定められたとおり、2つの試料が例えば1:3の比でプールされるとき、又は3つの試料が1:3:9の比でプールされるとき、該プール中の変異体の可能な頻度は、それぞれ12.5%及び3.85%の間隔のエンドポイントにより設定される。これらの間隔のエンドポイントは、本明細書において「結果点」といわれ、そして、最大試料シグナル強度に達するまでの定量的測定のステップ増加と等価である。
語「幾何数列(geometric sequence)」は、任意の2つの連続した項の間の比が同じであるところの数字の列をいう。言い換えると、毎回、該数列中の次の項が、前の項に同じ数を乗ずることにより得られる。この固定された数字は、該数列についての公比と呼ばれる。本発明の幾何数列において、試料の種類に依存して、第1項は1であり、及び公比は2又は3である。
語「最大試料シグナル強度」は、プール中の全ての試料が陽性(正)のシグナルを与えるとき、すなわち個体の試料の100%が、試験された分析物について陽性であるときに、そのプールから得られたシグナルをいう。該最大試料シグナル強度は、任意の適当な方法により決定されうる。例えば、50の個体の試料が、これらの試料のうちに存在する離散イベントの数の点でそれらの組成を決定する為に別々に測定されることができ、そしてその後、これらの試料がプールされた実験において次に測定されうる、ここで該プールされた試料について測定された該シグナル強度が、全ての個別の試料の全てのシグナル強度を合計することにより得られるだろうものと同じ比で見えている。
本発明の方法は、n個の試料の任意の数により実施されうる。しかしながら、実際は、nについての最大数は、測定方法の精度により、すなわち2つの連続的な結果点の間の統計的にしっかりとした区別が決定されうる精度により、設定される。該方法の該精度(標準偏差)は、それに従うべきである。
本発明の方法の適用は、遺伝子型同定方法を含むがこれに限定されない。DNAのプーリングに基づく遺伝子型同定は多くの適用を有する。遺伝子型は、全ての種において、マッピング、関連及び診断のために用いられうる。特定の遺伝子型同定の例は、a)ヒトにおける遺伝子型同定、例えば医療的診断などだけでなく、症例−対照研究プーリングが続く、フォローアップの個体のタイピングなど;b)家畜における遺伝子型同定、例えばQTL研究における、候補遺伝子アプローチにおける及びゲノムの広い選抜適用における、個体のタイピングなど;及びc)例えばマッピング研究及び関連研究のための、植物における遺伝子型同定を含む。
プーリングは、ヒト、家畜、植物、バクテリア、ウィルスをシークエンシングするときにも用いられうる。より特には、シークエンシングの為の個体の試料のプーリングは、2以上(2又はそれより多い)個体のシークエンスが比較されるべきときに適切である。
試料をプールする為の本発明の方法は、少なくとも第一の試料からのサブ試料と少なくとも第二の試料からのサブ試料をとることを含み、ここで該第一及び第二のサブ試料は一つの容器に併合されて、プールされた試料の形にある2つのサブ試料の混合物を与え、且つ、該プールされた試料中の該第一及び第二のサブ試料の比は、本明細書において記載されたとおりその中の分析物の濃度に基づき、1:3又は3:1である。同様に、3つの試料がプールされる場合(この言い回しは、3つのサブ試料が混合されるという事実をいう)、第一、第二及び第三のサブ試料(任意の順序における)の間の、プールされた試料において得られるべき比が、本明細書において定められたとおり1:3:9である。該プール中の変異体の可能な頻度は、それぞれ12.5%及び3.85%の間隔のエンドポイントにより設定される。これらの間隔のエンドポイントは、本明細書において「結果点」といわれ、そして、最大試料シグナル強度に達するまでの段階増加と等価である。
本明細書において定義されたとおり、プールする方法は、プーリング装置により(を用いて)実施されうる。そのような装置は適切に、例えば定められた(しかし可変の)体積の形で、試料の定められた量を集め及び配る為に構成された試料コレクターを備える。適当な試料コレクターは、研究室において用いられるロボットの試料配達及び処理システムにおいて一般に適用されるようなピペッターである。そのようなロボットのシステムは通常、1以上のマイクロプレートプロセッサステージ、試薬ステーション、フィルタープレートアスピレーター、及び、圧縮空気及びディスポーザブルピペットチップに基づくロボットピペッティングモジュールを適切に備えている卓上装置である。これらの試料ロボットシステムは、本発明の方法を実施する為に非常に適当である。なぜなら、それらは種々の試料からの種々の液体体積を1以上の反応チューブへと一緒にする為に、最終的に設計されているからである。それ故に、種々の試料からの種々の液体体積を一つのプールされた試料へ一緒にする仕事を実施する為にそのようなピペッティングロボティックシステムを採用することは、当業者の技術水準内である。しかしながら、そのようなピペッティングロボティックシステムは、複数の試料を1つのプールされた試料へとプールする為の試料プーリング装置のただ1つの適当な実施態様であり、該装置は試料を複数の試料バイアルから集める為及び試料を一つのプーリングバイアルへと配ってプールされた試料を用意する為の試料コレクターを備えており、そしてさらに本明細書において定義されたとおりの試料をプールする方法を実施する為に構成されたプロセッサを備えている。語「プロセッサ」は、本明細書において用いられるときに、メモリー又は他のストレージ装置からの記憶され及び取り戻された指示が、1以上の実行ユニット、例えばピペッティング装置及び、ピペッティングロボティックシステムの試料バイアルとプーリングバイアルとの間で該ピペッティング装置を動かす為のロボティックアームを備えているユニットなど、を用いて実行される任意のコンピューティング装置への言及を含むことが意図される。語「バイアル」は、広く解釈されるべきであり、そして、アレイ上の分析スポットへの言及を含みうる。本発明に従うプロセッサは、それ故に、たとえば、パーソナルコンピュータ、メインフレームコンピュータ、ネットワークコンピュータ、ワークステーション、サーバー、マイクロプロセッサ、DSP、特定用途向け集積回路(ASIC)、並びにこれらの一部及び組み合わせ及び他の種類のデータプロセッサを含みうる。該プロセッサは、本明細書上記で定義されたとおりのプーリング装置上で本発明に従い試料をプールする方法を実行するコンピュータプログラムからの指示を受け取る為に構成される。
カテゴリー変数について分析されるべき試料をプールする方法であって、該分析が分析物の定量的測定を伴い、該試料をプールする方法が、n個の試料のプールを用意することを含み、ここで該プール中の個々の試料の量は、該試料中の該分析物が、X:X:X:X(n−1)のモル比で存在するような量であり、且つxは、カテゴリー変数のクラスの数を表す2以上の整数である。
プールする方法は全く簡単であり、且つ比較的シンプルな方式で記載されることができる一方で、本明細書において記載されたとおりのプールされた試料の分析の方法はより複雑である。
本明細書において記載されたとおり、カテゴリー変数(例えば遺伝子型)は、いくつかの可能なカテゴリー(BB、AB、AA)の一つである値をとりうる。これれのカテゴリーは、結果間隔(resule interval)のクラスと一致する。該カテゴリーは、パラメーター(例えば蛍光)についての分析物(DNA)に対する定量的測定を実施すること、及び分析結果の分類化(categorization)に基づきこれらのパラメーター値にクラスを割り当てることにより決定され、該クラスのそれぞれが該カテゴリー変数についての変異体を表す(図7を参照されたい)。
一般に、可能な分析結果(アウトカム)の合計数は、カテゴリー変数の性質に依存する。例えば、二倍体生物の遺伝子型の場合、倍数性レベルが、可能な分析結果の数を決定する。一般的な点で、該カテゴリー変数の性質は、試料内の分析物の種々の数の変異体又はセットの存在を含みうる(図7におけるリピート)。また、可能な分析結果の合計数は、1つのリピートがとることができる可能な異なるカテゴリー値による。可能な分析結果の数の例が表1において与えられる。
Figure 2011504095
例えば、二倍体個体の遺伝子型(1つの試料内に1つの対立遺伝子の2のリピート)は、3(AA、AB及びBB)に等しい。なぜなら、1つの対立遺伝子は、2つの異なる変異体(A又はB)だけを有するからである。三倍体(1つの対立遺伝子の3のリピート)は、4つの異なる遺伝子型(AAA、AAB、ABB及びBBB)を有しうる。
個体についての血液集団は、4つの異なる変異体(A、B、AB又はO)を有する1つのリピートである。
表1における式は、どのリピートについて変異体が測定されるかが重要でないところの状況について適用できる。例えば、遺伝子型同定することについて、遺伝子型ABと遺伝子型BAとの間に差異はない。しかしながら、もし該リピートのアイデンティティーが重要であるならば、次に可能な分析結果の合計数を計算する為の式はnである。この式は次に、表1の該式
Figure 2011504095
にとってかわる。また、該表中の全ての値は、従って、変化する。1つのリピートについて2のリピート及び2の可能な結果を有する状況について、4の結果があるであろう。1つのリピートについて3のリピート及び3の可能な結果による状況について、9の異なる結果があるであろう。
可能な分析結果の合計数は、本明細書において、プーリング比(例えば1:3:9)として適用され、そして、「プーリング因子」(1:3:9の場合3)と呼ばれるものを直接に提供する。例えば、遺伝子型同定する為に一倍体個体をプーリングするとき、1リピート当たり2つの可能な変異体を有する1つのリピートがある。そのような場合、該プーリング因子は2に等しい(表1における結果の数である)。
4つの個体をプーリングすることは、次に、比2:2:2:2で行われる必要がある。
二倍体個体をプーリングするとき、プーリング因子は3である。3つの個体をプーリングすることは、比3:3:3で行われる必要がある。
プールにおける結果の合計数は次に、以下の式と等しい
合計のプール結果=プーリング因子試料数
シグナル強度についての増加は、次に、
増加=1/(プーリング因子試料数−1)×100%
又は
1/(y×((プーリング因子)+(プーリング因子)+(プーリング因子)+・・・+(プーリング因子)(n−1))×100%、
と等しく、
ここでnは試料数であり、及びy=プーリング因子マイナス1である。
もし測定強度が全ての変異体について1つのリピートについて存在するならば(全ての値マイナス1である(なぜなら該失われた1は次に他について1マイナス強度として計算されうるからである))、表1の最上列が続かれる。なぜならこれが、このリピートについての2つの可能なアウトカムに対応する、そのリピートのすべての値について存在する又は不在であるとして見られうるからである。3の可能な対立遺伝子が、2の変わりに想定され且つ2の代わりに3の異なる光強度を測定することができる上の例を参照されたい(赤及び緑)。
もし、一つの測定だけがあるならば、表1が従われる。
本明細書において意図されるとおりのプールされた試料を分析する為の本発明の方法は、該プールされた試料に対する要求された分析物についての測定の実施を含む。測定結果、例えば装置シグナル、を記録すると、該分析は次に、本明細書以下において与えられる実施例において非常に詳細に説明される一連の工程を伴う。
本発明の方法により得られたプールされた試料のセットについての分析を実施すること、ここで該試料はカテゴリー変数について分析される、は該試料内の分析物の定量的測定を含む。該分析物は、化学的又は物理的な物質又は実体であり、そのパラメーターが該カテゴリー変数の少なくとも1つの変異体の存在又は不在を示す。例えば、カテゴリー変数として、変異体対立遺伝子A又はBを有する生物の遺伝子型を決定するとき、該分析物は該生物のDNA、DNAプローブ又は遺伝子のラベルであり、そしてその分析物のパラメーターの絶対値が、変異体の存在(又は不在)に直接に関連付けられうる。該分析物についての該定量的測定は一般に、分析物パラメーターについての値としての蛍光強度、放射性同位体強度又は任意の定量的大きさ(任意の定量的測定値、any quantitative measurement)に関与するであろう。或る閾値又はカテゴリー値を越える大きさは一般に、該変異体の存在を示すであろう。試料中の分析物の定量的測定は、すなわち、該試料中において分析されるべきそのカテゴリー変数の変異体の存在又は不在を示す分析物を参照する。
本質的に、本明細書において記載されたとおりの試料をプールする方法により得られたプールされた試料を分析する方法において、該プール中の個体試料の寄与、すなわち、該プール中の個体試料についての結果は、以下の通りに決定される。
第1に、n個の試料のプールについて実施されるべき或る分析「A」についての最大試料シグナル強度が決定され、そして100%シグナルに設定される。該最大試料シグナル強度は、n個の試料のプール中の試料の100%が、該カテゴリー変数について陽性であるときに達せられるシグナル強度である。該最大試料シグナル強度は、n個の陽性の参照試料の試験プールを用意すること及び該測定シグナルを決定することにより決定されることができ、ここで該陽性の参照試料は、該カテゴリー変数に関して陽性であり、且つnは分析「A」が実施される該プール中の試料の数である。分析「A」についての該最大試料シグナル強度は、後の使用の為に、コンピュータメモリー中に記録され又は格納される。次に、関心のある該分析物は、該分析物についての該プールされた試料のシグナル強度が決定されるところの分析「A」を実施することにより、本発明の方法により得られたプールされた試料において測定される。該プールされた試料における該分析物についての得られたシグナル強度が記録され、上記で定められたとおりの最近の結果点へと四捨五入されそして任意的に格納され、そして次に該最大シグナル強度と比較される。適当には、この比較は以下の通りに実施されうる。一般に、それぞれの可能な測定結果は、値
Figure 2011504095
に割り当てられ、ここでnはプールされた試料の数であり、yは、「A」が存在するか又は不在であるかを表す2の整数であり、且つ100%は最大試料シグナル強度である。アノテーション
Figure 2011504095
は、
Figure 2011504095
をいうとして理解されるべきであり、ここでnは試料の数であり、及びiは2〜nの間の値を有する増加する整数である。例えば、カテゴリー変数のy=2のクラス(マーカー存在及びマーカー不在)、且つ4つの試料のプール、4つの陽性参照試料を用いて100%に設定された最大試料シグナル強度セットにより、合計で
Figure 2011504095
の結果点があり、ここでそれぞれの可能な測定結果が値
Figure 2011504095
又はその倍数に割り当てられうる。
試料のプール中のそれぞれの試料についての結果は、簡単な結果表から読み取られることができ、これはコンピュータメモリー中にコンピュータ読み取り可能な形で格納されることができ、そして該表は、該最大試料シグナル強度の0%〜100%の間の
Figure 2011504095
の増加する段階のそれぞれの結果点について、該プール中の個体試料のそれぞれについて対応する値を割り当てる。例えば、そのような結果表は、以下の表2において与えられるとおりの表である。
該分析は、該プールされた試料中の種々のサブ試料のそれぞれに、該カテゴリー変数を割り当てることにより完了される。
本明細書において定義されるとおりのプールされた試料を分析する方法は、分析装置により実施されうる。本発明の分析装置は、上記で記載されたとおりの試料をプールする為の方法により得られたプールされた試料のセットについての分析を実施する為に構成されたプロセッサを備えており、ここで該装置は、該試料をカテゴリー変数について分析する為に及び該試料中の分析物の定量的測定を実施するように構成されている。上記で言及されたとおり、該分析装置の独特の特徴は、それが、プールされた試料を、該プール中のそれぞれの個体試料におけるカテゴリー変数について分析する為及び該試料中の分析物の定量的測定を実施するように構成されていることである。本質的には、該分析装置は、該プールされた試料について得られた測定結果を測定し及び分析する為に並びにその結果からプール中のそれぞれの個体試料におけるカテゴリー変数を推測するように構成されている。そのような装置は適当には、該プールされた試料中の分析物シグナルの測定の為のシグナル読み取りユニットを備えている。該分析装置はさらに適当には、該測定結果及び上記で記載されたとおりの結果表を格納する為のメモリーを備えている。該分析装置はさらに適当には、メモリーから及び/又は該読み取りユニットからデータを回収する為に構成され、並びに計算を実施する為及び該プールされた試料についての測定結果が、上記言及された結果表を用いて、該プール中の個体試料についての対応する結果と比較され及び当該結果に割り当てられるところの反復プロセスを実施する為に構成されたプロセッサ;該メモリー又はプロセッサへと試料データを入力する為のインプット/アウトプットインターフェース;及び該プロセッサに接続されたディスプレイを備えている。該プロセッサは、本発明に従う試料を分析する方法を、本明細書上記で定義されたとおりの分析装置で実行するコンピュータプログラムからの指示を受信する為に構成されている。本明細書において用いられるときに、語「プロセッサ」は、メモリー又は他の記憶装置から回収された指示が1以上の実行ユニット、例えばプールされた試料を受け取る為及び試料中又はプールされた試料中において該分析物のシグナルを決定することにより分析物の測定を実施する為のシグナル読み取りユニットなど、を用いて実行される任意のコンピューティング装置への言及を含む。
本発明の分析装置はさらに、本発明のプーリング装置を備えうる。
本発明はさらに、コンピュータプログラム製品それ自身又はキャリア上のコンピュータプログラム製品を提供し、該プログラム製品は、コンピュータ、プログラムされたコンピュータネットワーク又は他のプログラム可能な装置においてロードされそして実行されたときに、上記で記載されたとおりの試料をプールする方法を実行する。本質的には、該コンピュータプログラム製品は、本発明のプーリング装置のメモリー内に格納されてよく、及び該装置のプロセッサにより、該プーリングの方法の種々のプロセスステップに対応する指示のセットを該プロセッサに備えることによって実行されてよい。
本発明はさらに、コンピュータプログラム製品それ自身又はキャリア上のコンピュータプログラム製品を提供し、該プログラム製品は、コンピュータ、プログラムされたコンピュータネットワーク又は他のプログラム可能な装置においてロードされそして実行されたときに、複数の試料についての分析を実施する為の方法を実行し、該方法は上記で記載されたとおりの試料をプールする方法によって得られたプールされた試料のセットについて分析を実施することを含み、ここで該試料はカテゴリー変数について分析され及び該試料における分析物の定量的測定に関与する(を含む)。本質的には、該コンピュータプログラム製品は、本発明の分析装置のメモリー内に格納されてよく、及び、該装置のプロセッサにより、該プロセッサに該分析の方法の種々のプロセスステップに対応する指示のセットを備えることによって実行されてよい。分析を実施する為の該コンピュータプログラム製品において、ソフトウェア指示に埋め込まれた該方法はさらに、上記で記載されたとおりの試料をプールする工程を含みうる。
本発明は今、以下の非限定的な実施例により説明されるであろう。
実施例
標準化の為に50の個体の1のプールを用いた、SNPの存在についての、二倍体個体試料の遺伝子型同定の例
ステップ1) 50の個体が個別に試験された。
全てのSNP及び全ての個体について、我々は、赤い蛍光(対立遺伝子の存在)及び緑の蛍光(対立遺伝子の不在)についての強度を、マイクロアレイフォーマットにおける2つの異なる蛍光色素を用いて得た。赤と緑との間の比は、ホモ接合性の動物について常には1(又は0)でなく、又はヘテロ接合性の動物について常には0.5でない。
個体のタイピングについてのデータは、全てのタイプされたSNPについてのシグナル強度からの補正因子を計算するために用いられた。
最も重要な補正因子(K)(対立遺伝子を表す際に、何らかの不均等な効率について、データを補正する為にしばしば用いられる補正因子)を得る為に、我々は、ヘテロ接合性の遺伝子型からのシグナルを用いた。もしヘテロ接合性遺伝子型が存在しないならば、我々は、研究されたSNPが、調査下の集団において分離されておらず、そしてそれ故に該プール中におけるこのSNPについての結果は取り除かれるべきであると想定した。
50の個体の試料におけるヘテロ接合体の不在に起因するSNPの除外は、結果として、低いMAF(minor allele frequency、マイナーな対立遺伝子の頻度)を有するSNPについての情報が失われうることを有しうる。多くの適用(例えばゲノムの広い選抜など)にとって、これは、非常に低いマイナーな対立遺伝子の頻度を有するSNPは精度にあまり寄与せず、そして次に、これらのSNPについてのデータを用いないこと又は該補正因子を適用しないことの決定がなされうるので有害でない。
我々が用いた第一の補正因子(K)は;
Figure 2011504095
であり、ここでXrawは赤についての測定された強度であり、及びYrawは緑についての測定された強度である。この値は、遺伝子型ABを有する個々に遺伝子型同定された試料から決定された。
1つの遺伝子型についての全てのビーズの平均結果を用いる代わりに、我々は全ての別々のビーズの結果を用いることもできる。すなわち、1つの試料から、我々は、Xraw及びYrawについて若しくはX及びYについての平均結果を用い、又は我々はその試料から全ての別々のビーズの結果を用いる。
他の補正因子はAAavg及びBBavgであった。AAavgは、AA遺伝子型の補正されていない対立遺伝子頻度の平均である。この値は、1に近いと期待される。BBavgは、BB遺伝子型の補正されていない対立遺伝子頻度の平均である。この値は0に近いと期待される。AAavg及びBBavgは、式
Figure 2011504095

を用いて計算された。
ステップ2) 上記ステップ1から全ての50の個体を含む1つの試験プールが構築された。この目的のために、ng/μlのDNA濃度が、それぞれの個体試料において、NanoDropスペクトロフォトメーター(Nanodrop Technologies、米国)を用いて測定された。全てのDNA試料は次に、一つの試料へとプールする前に、50ng/μlの標準濃度へと希釈された。このようにして得られた該試験プールにおいて、我々は、補正されていない又は第一のステップにおいて発見された補正因子に基づく対立遺伝子頻度を見積もった。
対立遺伝子Aについての未補正対立遺伝子頻度は、両方の強度の合計により割り算された赤強度の間の比として、以下の通りに計算される。
Figure 2011504095
我々が適用した、対立遺伝子頻度について第一の補正は
Figure 2011504095
であった。
我々が適用した第二の補正は標準化であった。
Figure 2011504095
補正及び標準化の両方について、我々は該個体試料とは別に、全てのSNPについて、全ての3つの遺伝子型を用いた。
見積もられた対立遺伝子頻度の精度の順序は、標準化された(最も正確)、補正された(間)及び補正されていない(最も正確でない)、であった。
これは、もしステップ1においてヘテロ接合性個体が無いならば、該補正因子Kは0.5に設定され、そしてもしホモ接合性個体が無いならば、補正因子AAavg及びBBavgがそれぞれ1及び0に設定されたことを意味する。
ステップ3) 我々は、個体のタイピング(分類、typing)について計算された対立遺伝子頻度及び該試験プールにおける結果に基づく対立遺伝子頻度を比較した。これから、我々は、現実の結果がX軸上にある四次多項式を見積もった。別々に試験された個体における及びほぼ18000のSNPを有するプールにおける遺伝子型同定結果についての図1を参照されたい。遺伝子型同定は、18K Chicken SNP iSelect Infiniumアッセイ(Illumina Inc、米国)を用いて、該チキンゲノムを通じて均等に分布されたSNPにより行われた(van As et al., 2007)。該アッセイについての詳細、ワークフロー及びチップは、Illuminaのウェブサイト上に見られうる(http://www.illumina.com/pages.ilmn?ID=12)。
この多項式から、我々は、個体から既知の該頻度が0、0.05、0.1、0.15・・・・・0.9、0.95及び1だろうときに、該試験プール中における予測された対立遺伝子頻度(the predicted allell frequency)を計算した。
Y軸上に現実の頻度を有する第二のグラフにこれらの結果を置くことにより、我々は、補正の第三ステップについての補正因子を得た、図2を参照されたい。
これらの補正因子を適用した後、該試験プールにおける対立遺伝子頻度は、現実の頻度との直線関係を示した、図3を参照されたい。
約18000のSNPによるこの実験において、50の個体の試験プールにおいて測定された(及び記載されたとおりに補正された)対立遺伝子頻度の96%超が、個体タイピングからの結果と比較して、+又は−6.25%の範囲内であった。
本発明の適用の為に、前の3ステップは好ましくは、「キャリブレーション」として、実際の分析の前に、該分析の精度を増す為に、実施される。しかしながら、これらのステップは、それぞれの回で実施される必要はない。該測定の該キャリブレーション(もし実施されるならば)は次にステップ4)が続く。
ステップ4) 比1:3、1:3:9又は1:3:3:3(n−1)における2、3又はn個の個体のDNAプールの構築し、及び該プールを遺伝子型同定のための測定に付す、ここでシグナル強度は、18K Chicken SNP iSelect Infiniumアッセイ(上記参照)を用いてマイクロアレイ上で赤及び緑について決定される。
ステップ5) ステップ1及びステップ3において発見された補正因子により、該対立遺伝子頻度が、該プールにおいて得られたシグナル強度から計算されうる。プール中の2つの個体により、該予測された補正された頻度は、結果点0%、12.5%、25.0%、37.5%、50.0%、62.5%、75.0%、87.5%及び100%を与える。四捨五入が、最近の結果点(the nearest result point)へと行われるべきである。該2つの個体の遺伝子型は、表2において示された結果から得られうる。
プール中の3つの個体により、四捨五入は、結果点の間の間隔が3.85%(100/(3−1))等であるところの最近の結果点へと行われるべきである。
連続的な結果点の間の間隔が短ければ短いほど、該結果点の一つへの特定の結果の適切な割り当てを許す為に、強度の読み取りはより正確である必要がある。より正確な読み取りは、遺伝子型同定技術のさらなる発展により実行可能となるであろう。
プール中に2つの個体を有する状況について、該プール内の見積もられ且つ補正された対立遺伝子頻度が、個体の現実の頻度から±6.25%の範囲内にあるところのSNPだけを用いることを決定しうる。(図3中の赤線を参照されたい)。
Figure 2011504095
プールされた結果と個体の結果(ステップ3における)との間の6.25%よりも大きな差異を示すSNPは、もし個体の遺伝子型を推測する為に他の情報が利用可能でないならば、取り除かれるべきである。
個体の遺伝子型を推測する為の追加情報が、個体の系図から又は、該個体が属するファミリー又は集団内に存在するハプロタイプについての情報から得られうる。
補正因子の再現性に依って、ステップ1、2及び3は、アッセイ条件が同じであると知られているところの新規分析において完全にスキップされうる。
実施例1の方法に従うとき、分析される必要がある試料の合計数を減少する一方でなお当初の個体試料についての信頼できる結果を得ることができることにより、著しい節約が達成されうる。分析されるべき試料の合計数の典型的な減少が表3に示される。
Figure 2011504095
標準化のための2の個体の25のプールを用いた、二倍体個体試料の遺伝子型同定の例
ステップ1) 50の個体が、実施例1のステップ1におけるとおりに別々に試験される。
ステップ2) 比1:3で、上記ステップ1からの全ての50の個体を含む、2つの試料の25プールをそれぞれ構築する。これらのプールにおいて、補正されていない又は第一のステップにおいて発見された補正因子に基づく対立遺伝子頻度を見積もる。
ステップ3) 2つの個体のタイピングからの対立遺伝子頻度の合計と、2つの個体試料のプールにおける該見積もられた頻度とを比較する。これらの25の点から、回帰直線を計算する。該回帰計数及び切片が次に、他のプールから見積もられた頻度を補正する為に用いられうる。
ステップ4) 次に、比1:3、1:3:9又は1:3:3:3(n−1)における2、3又はn個の個体のDNAプールを構築する。
ステップ5) ステップ1及びステップ3において発見された補正因子により、該プールにおいて得られたシグナル強度から対立遺伝子頻度を計算する。
試料数の節約は、二倍体個体のシークエンシングについての表8において言及された節約と同一である。
ハプロイド個体試料の遺伝子型同定の例
2つのハプロイド試料がプールされ、そしてゲノム内の或る位置での対立遺伝子Aの存在について測定されたとき、該測定(ピーク高さ、ピーク下面(surface under peak)、強度)における期待された比は以下のとおりである。
Figure 2011504095
もし2つの試料のプールだけが用いられるならば、補正因子は必要とされなくてもよい。より多くの試料がプールされる場合、補正因子はおそらく必要とされる。そのときは、それらは、ヘテロ接合性及びホモ接合性の二倍体個体を模倣する為に、該分析物の等しい量を有する2つの試料のプールから計算されうる。
3つの試料のプーリングが、1:2:4の比でプールされるとき、該測定における以下の比が期待される。
Figure 2011504095
シークエンシングプロトコールにおける本発明の使用
この発明において記載されたプールする方法は、2以上の個体において配列を決定する必要がある状況に適用されうる。
シークエンシングの為の個体、テンプレート又はPCR産物のプーリングは、一般的な慣習ではない。なぜなら、二重のトレースを分析するときの本質的な問題は、2つの塩基がそれぞれの位置で表され及び該トレースだけを説明することによりどのテンプレートからそれぞれの塩基が来たかを教えることが不可能であるからである。
二重トレースを結果する意図的にプールされたテンプレートに加えて、二重トレースを生じるいくつかの生物学的及び生物工学的状況が知られている。これらは、RT−PCRにより増幅された転写物のオルタナティブスプライシングされた領域において、直接にシークエンシングされ(クローニングすること無く)ることにおいて及びランダム挿入変異誘発実験において、見られる。
プールされた配列のハプロタイプ又は二重トレースをさかのぼる為のいくつかの方法が記載されている。Flotら(2006)は、個体のハプロタイプを見つけ出す為に提案されたいくつかの分子方法を記載する。例えば、クローン化されたPCR産物のシークエンシング(例えばMuirら、2001)、SSCP(一本鎖コンホメーション多型)(Sunnucksら、2000)、変性剤濃度勾配ゲル電気泳動(DGGE)(Knapp、2005)、一分子レベルへの極端なDNA希釈(Ding & Cantor、2003)、及び、対立遺伝子特異的PCRプライマーの使用(Petterssonら、2003)である。加えて、配列の混合物のハプロタイプ再構築の為のコンピュータによるいくつかの方法が提案されている。
しかしながら、記載された全ての方法は、非常にコストがかかり且つ時間を消費するものであり、並びに、特定の目的(例えば、再シークエンシング、オルタナティブスプライシング、テンプレート、又は、配列長の異なる2つの産物のPCR増幅された混合物、参照ゲノム配列の利用可能性)に適用できるだけであり、そして、ハプロイド若しくは二倍体の試料の標準的な直接のシークエンシング又は全く未知の配列のデノボシークエンシングに適さない。
本発明において記載されたプーリングに従う配列テンプレートのプーリングは、同じ配列断片が個体及びプールされた試料の両方において入手されうる状況に適用されうる。これは、例えばショットガンシークエンシング(ランダムに切断された断片)はプーリングにとって適当でないことを意味する。
上記で言及された全ての適用において、もしプーリングが意図的に適用されるならば、等しい量のテンプレート(試料、DNA、RNA又はPCR産物)がプールされる。
本明細書において、我々は、等しくない量のテンプレートのプーリングを記載する。この例について、2つのテンプレートからなるプールについての状況だけが記載されるが、本発明は、二倍体生物について比1:3、1:3:9、1:3:3:3(n−1)で、及びハプロイド生物について1:2、1:2:4、1:2:2:2(n−1)の比で、2、3又はnの個体のDNA(又はPCR後産物)のプールを構築するために用いられうる。
満たされる必要がある一般的条件は、該シークエンシング装置がテンプレートを(例えば蛍光について)スキャンし、そして、得られたクロマトグラムが、DNAテンプレートの配列を、規則的に間隔があけられ且つ同様の高さの一連のピークとして表すことである。
ステップ1) 50の個体についてシークエンス反応を別々に実施する
個々のシークエンシング反応についてのデータは、全塩基(又はヌクレオチド)の位置についてのピーク面積又はピーク高さから補正因子を計算するために用いられる。
ステップ2) 2つのプールされた個体の25のプールについてシークエンス反応を実施する
ピーク面積比が、塩基及びノイズのピークでの、第一及び第二のピークを区別する為に用いられる。該第二のピークは、該第一のピークの百分率であり、そして閾値が、ピークとノイズピークとを区別する為に用いられる。プールされたシークエンシング反応についてのデータは、全塩基(又はヌクレオチド)の位置についてのピーク面積又はピーク高さから補正因子を計算するために用いられる。
ステップ3) ステップ1及び2の結果のグラフを作り、そして回帰直線を構築する(回帰係数及び切片を計算する)
ステップ4) DNA(又はPCR後産物)のプールを構築する
比1:3、1:3:9、1:3:3:3(n−1)での二倍体生物についての及び1:2、1:2:4、1:2:2:2(n−1)の比でのハプロタイプ生物についての、2、3又はn個の個体のプールが構築される。
ステップ5) ステップ1、2およびステップ3において発見された補正因子を用いて、ベースコーリング(塩基判定、basecalling)が、該プール内の得られたシグナル強度から計算されうる。
この例において、2つだけの可能なヌクレオチド(A及びC)がそれぞれの塩基位置で示されるが、同じ原理が、遺伝コードに基づく4つの利用可能なヌクレオチドのうちの2つの他の組み合わせについて機能する。「A」ヌクレオチドについての平均ピーク高さは100に設定され、及び、「C」ヌクレオチドの平均ピーク高さは75である。これらのピーク高さに基づき、2つのハプロイド試料のプールにおけるヌクレオチドの全ての可能な組み合わせについて、相対的なピーク高さが表6に提示される。2つの二倍体テンプレートからなるプールについての相対的ピーク高さが表7に与えられる。
Figure 2011504095
Figure 2011504095
表8は、本発明におけるプーリング戦略と非プーリング状況とを比較する、シークエンス反応の数の減少を示す。
Figure 2011504095
択一的な補正方法を用いた標準化の為の、50の個体の1プール及び2の個体の25プールを用いた二倍体個体試料の遺伝子型同定の例
ステップ1) 50の個体が別々に試験された。
実施例1、ステップ1と同じだが、Xraw及びYrawの代わりに標準化された強度X及びYを用いた異なる補正方法を伴う。
第一の補正因子(K)はX及びYを用いて計算される。
Figure 2011504095
ここでXはA対立遺伝子(赤)についての標準化された強度であり、そしてYはB対立遺伝子(緑)についての標準化された強度である。この値は、遺伝子型ABを有する個々に遺伝子型同定された試料から決定された。
他の補正因子AAavg及びBBavgもまたX及びYに基づく。AAavgは、AA遺伝子型の補正されていない対立遺伝子頻度の平均である。この値は、1に近いことが期待される。BBavgは、BB遺伝子型の補正されていない対立遺伝子頻度の平均である。この値は、0に近いことが期待される。AAavg及びBBavgは式
Figure 2011504095
を用いて計算された。
全ての補正因子K、AAavg及びBBavgもまた、実施例1、ステップ1におけるとおり、Xraw及びYrawに基づき計算されうる。
もし遺伝子型AAが50の個体のうちで利用可能でないならば、AAavgは1に設定される。また、もしBB遺伝子型が利用可能でないならば、次にBBavgは0に設定される。
次のステップは、全ての50の個体が結果を有するところのそれらのSNPについての個体タイピングに基づき対立遺伝子頻度を計算することである。
ステップ2) 実施例1、ステップ2におけるとおり、ステップ1からの全ての50の個体を含む1つのプールが構築された。
対立遺伝子Aについての補正されていない対立遺伝子頻度が、両方の標準化された強度の合計(X+Y)により割り算された標準化された赤強度(X)の間の比として計算される。
補正されていない対立遺伝子頻度イコールX/(X+Y) (Rafと呼ばれる)
我々が適用した対立遺伝子頻度についての第一の補正は、

補正された対立遺伝子頻度=X/(X+K*Y) (Rafkと呼ばれる)

である。
ヘテロ接合性の遺伝子型がなかったならば、Kは計算されることができない。その場合、以下のルールが適用されうる;
もしRaf<0.1ならば、そのときはRafkは0に設定される。
もしRaf>0.9ならば、そのときはRafkは1に設定される。
Kが失われるところの全ての他の状況において、RafkはRafに等しく設定される。
AAavg及びBBavgを用いた標準化補正は、標準化された強度X及びYにより開始するときは、常には必要でない。もしXraw及びYrawにより開始するならば、AAavg及びBBavgを用いた標準化が実施例1、ステップ2におけるとおりに適用されうる。
標準化が適用されるならばそのときは、以下の式
Figure 2011504095
を使用する。
ステップ3) 我々は、ステップ1における個体タイピングについて計算された期待される対立遺伝子頻度(the expected allell frequency)と、ステップ2における50のプールにおける結果に基づく観察された(補正された又は補正されていない)頻度とを比較した。これから、我々は、以下のモデル

期待された対立遺伝子頻度=切片なしのb1*観察された頻度+b2*観察された頻度+b3*観察された頻度+b4*観察された頻度

を用いて、回帰係数を計算した。
補正された頻度(Rafk及びRafn)又は補正されていない頻度(Raf)のいずれかが、上記式において観察された頻度として用いられる。
該期待された対立遺伝子頻度と、該モデルから予測された対立遺伝子頻度とを比較することにより、最良の補正手順(Rafk、Rafn又はRaf)が発見されうる。
最良の補正手順(the best correction procedure)からの回帰係数は後で、ステップ5aにおいて2つの個体のプールからの対立遺伝子頻度を補正する為に用いられうる。
ステップ4) 50の個体試料から、比1:3で、2つの個体の25のDNAプールを構築する。該プールにおいて、どの個体が1回用いられ、そしてどれが3回用いられるかを注記する。
ステップ5a) 50の個体のプールの結果に基づく補正
ステップ1(K、AAavg及びBBavg)及びステップ3(回帰因子b1、b2、b3及びb4)において発見された補正因子により、該対立遺伝子頻度が、ステップ4下で構築されたプールにおける得られたシグナル強度から計算されうる。第一のRaf又はRafk又はRafnが、ステップ1からの補正因子K、AAavg及びBBavgを用いて(ステップ3において発見された最良の補正手順によって)計算される。
次に、Rafc又はRafkc又はRafncが、ステップ3下で発見された多項式の回帰係数を用いて、

期待された対立遺伝子頻度=b1*観察された頻度+b2*観察された頻度+b3*観察された頻度+b4*観察された頻度、ここで、観察された頻度=Raf又はRafk又はRafn

のとおりに計算される。
プール中の2つの個体により、該予測され補正された頻度は、結果点0%、12.5%、25.0%、37.5%、50.0%、62.5%、75.0%、87.5%及び100%を与えるべきである。最近の結果点への四捨五入がなされるべきである。該2つの個体の遺伝子型同定は、実施例1の表2において示されたとおりの結果から得られうる。
ステップ5b) 2つの個体のプールの結果に基づく補正
Raf、Rafk及びRafnが、ステップ4下で構築されたプールのシグナル強度及びステップ1下で発見された補正因子K、AAavg及びBBavgに基づき計算される。
次に、ステップ3、実施例5、におけるのと同じモデルを用いた多項式回帰係数が、20のプールに基づき計算されうる。このモデルは、全てのSNPについて別々に又は全てのSNPにわたって適用されうる。
他の5つのプールにおける該対立遺伝子頻度が、これらの回帰因子に基づき、
Figure 2011504095
のとおりに予測される。
これは、全ての試料が予測の為に1回用いられるような方法で5回繰り返されうる。これらのプールにおける該期待された対立遺伝子頻度は次に、最良の補正手順を発見する為に該予測された対立遺伝子頻度と比較される。
プールにおける2つの個体により、該予測され補正された頻度は、結果点0%、12.5%、25.0%、37.5%、50.0%、62.5%、75.0%、87.5%及び100%を与えるべきである。最近の結果点への四捨五入が行われるべきである。2つの個体の遺伝子型が、実施例1の表2に示されたとおりの結果から得られうる。
ステップ5c) 2つの個体のプールの結果に基づく補正
予測の他の方法が、多重線形回帰係数を用いて、以下のモデル
Figure 2011504095

に基づき光強度(X又はXraw及びY及びYraw)について、SNPにより行われうる。
これらの多重線形回帰因子により、対立遺伝子頻度が次に、
Figure 2011504095

を用いて予測されうる。
上記に記載されたとおりの該多重線形回帰係数が、20のプールに基づき計算される。
次に、他の5のプールの対立遺伝子頻度が、これらの回帰因子に基づき予測される。これは、全ての試料が予測の為に1回用いられるような方法で、5回繰り返される。これらのプール中における該期待された対立遺伝子頻度は次に、該最良の補正手順を発見する為に予測された対立遺伝子頻度と比較されうる。
ステップ5a及びステップ5bにおけるとおり、2つの個体の遺伝子型が、実施例1の表2において示されるとおりの結果から得られうる。
ステップ6) 他の個体の試料から、2つの個体の、比1:3でのDNAプールを構築する。ステップ4におけるとおり、該プールにおいて、どの個体が1回用いられそしてどの個体が3回用いられるかを注記する。
これらのプールから、我々は、記載されたとおりの対立遺伝子頻度の予測の為の最良の補正方法を用いて及び実施例1の表2を用いて、遺伝子型を得ることができる。
実験1
実施例5において記載された手順の、Infinium Assay BeadChipテクノロジー(Illumina,Inc、米国)を用いた全ゲノムSNP分析への適用
遺伝子型同定が、50の個体について、18K Chicken SNP iSelect Infiniumアッセイ(Illumina Inc、米国)を用いて、チキンゲノムを通じて均等に分散されたSNPにより、行われた(van Asら、2007)。該アッセイについての詳細、ワークフロー及びチップは、Illuminaのウェブサイト上で見られうる
Figure 2011504095
頻度が正確に見積もられうるかどうかをチェックする為に、(該50の個々に遺伝子型同定された個体のうちの4つの異なる動物からの)8の対立遺伝子が、1つのプール中に一緒にされた。表2を用いた、予測された対立遺伝子頻度から遺伝子型への翻訳が実施されなかったことを除き、実施例5において記載されとおりのステップ1〜3及びステップ5が、採用された。
ステップ4において、4の個体のDNAの等モル量が、比1:3での2つの個体からのDNAの代わりにプールされた。
もし2つの異なる動物からの比1:3が用いられるならば、我々は、これが8の対立遺伝子をプールへ一緒にしていると考えうる。4つの個体の等モル量を用いることによっても、8の対立遺伝子が一緒にされる。
このように、12のプールが構成されそして、ステップ1におけるとおり、50の動物の1つのプールが構成される(4+2の追加の試料のプールにおけるのと同じ試料が用いられる)。次に、これらの13のプールが、infiniumチップの第二のバッチを用いて遺伝子型同定された。
SNP当たりのK、AAavg及びBBavgが、実施例5、ステップ1におけるとおりに計算された。次に、50のプールからの補正されていない及び補正された対立遺伝子頻度が、実施例5、ステップ2におけるとおりに計算された。
多項式の回帰係数もまた、実施例5、ステップ3におけるとおりに計算された。
さらに、ステップ5b及び5cにおいて記載されたとおり、より多くの多項式及び多重線形回帰係数が計算された。これは、11のプールに基づき行われ、そして次に、残りのプール中の対立遺伝子頻度が、該回帰因子を用いて予測された。
この実験において、X及びY(赤及び緑についての強度)に対する多重線形回帰が最良の結果を与えた。最終的な結果について、図4及び表9を参照されたい。
全部で、4.6%の対立遺伝子頻度が、誤ったクラスに落ちていた。これらが1:3の比の2つの個体のプールであった場合、これは3.0%の遺伝子型同定エラーを結果しただろう。
Figure 2011504095
実験2
実施例5に記載された手順の、Veracode Assayテクノロジー(Illumina,Inc、米国)を用いたSNP分析への適用
遺伝子型同定が、ニワトリゲノムを通じて均等に分散したSNPにより、96Chicken SNP Veracode,Golden Gate Assay(Illumina Inc、米国)を用いて、50の個体に対して行われた(ステップ1)。該アッセイの詳細、ワークフロー及びチップは、Illuminaのウェブサイト上に見られうる
Figure 2011504095
すべての試料の1プールについても構築され(ステップ2におけるとおり)、そして2の個体の比1:3での24のプールについても構築された(ステップ4におけるとおり)。これらの25のプールが、化学物質の第二のバッチにより遺伝子型同定された。
すべての補正が、実施例5のステップ1〜3において記載されたとおりに行われた。ステップ5aにおける補正は、ステップ3において発見された多項式回帰因子を用いて、2のすべての24のプールについて適用された。
ステップ5b及びステップ5cについて、我々は、該回帰因子(ステップ5bにおいて多項式の、及びステップ5cにおいて多重線形の)を計算する為に毎回23のプールを用いて、残りのプールについての対立遺伝子頻度を予測することができた。全部で、我々はこれを24回行い、そしてすべてのプールが対立遺伝子頻度を予測するために1回用いられた。
最良の結果が、Rafk(標準化された値X及びYに基づき計算された)を用いて得られ、そして次に、Rafkcを結果する、ステップ5bからの多項式回帰因子を用いて補正された。
全部で、84のSNPが個体においてコールされた。次に、いくつかのSNPは、個体のいつくかについてコールされなかった。全部で、我々は1906の完全なプール*SNPの組み合わせを有した。
Figure 2011504095
全部で、138(138/1906*100=7.2%)のミスマッチがあった(表10)。すべての観察は、2つの個体試料からなるので、これは174の遺伝子型エラー(170/1906*2*100=4.46%)をもたらした、表11、図5及び図6を参照されたい。
この例(ステップ3(実施例5)及びステップ5a、5b又は5c(実施例5)を用いて行われたとおり)における最良の補正手順を定めるプロセスも、SNPによるミスマッチの数についての情報をもたらす。これは、より低いコールレート(call rate)の費用で、該セットからのSNPを排除してミステイクのリスクを減少することを可能にする。
Figure 2011504095
実験3
実施例5において記載された手順の、他の遺伝子型同定方法を用いたSNP分析への適用
実施例5において記載された手順はまた、実施例1及び実施例2において記載された方法以外の任意の他の遺伝子型同定方法、例えばAffymetrix GeneChip(Affymetrix Inc、米国)又はAgilent Technologiesなど、においても用いられうる。
他の補正方法を用いた以外は、実施例4におけるとおりのシークエンシングプロトコールにおける本発明の使用方法
ステップ1) 50の個体について別々にシークエンス反応を実施する
対立遺伝子1のピーク高さ及び対立遺伝子2のピーク高さをXraw及びYraw値として、又は相対的ピーク高さをX及びYとして用いる。
対立遺伝子1についての相対的ピーク高さはX=X/(X+Y)であり、そして、対立遺伝子2についての相対的ピーク高さはY=Y(X+Y)である。
次に、K、AAavg及びBBavgを、実施例5のステップ1において遺伝子型同定する為に行われたのと同じ方法で計算する。
ステップ2) すべての50の個体の1つのプールにおけるシークエンス反応を実施する
実施例5のステップ2におけるとおり、補正されていない及び補正された対立遺伝子頻度が計算される;
ステップ3) 個体のシークエンシングから及び該プールから頻度を計算する
多項式の回帰係数を発見する為に、実施例5のステップ3におけるのと同じモデルを用いる。
ステップ4) 2つのプールされた個体の25のプールについてシークエンス反応を実施する
ステップ5a) 最良の方法を発見する為に、全ての50の個体のプールに基づき期待された頻度と補正された頻度とを比較する
ステップ5b) モデル

期待された遺伝子頻度=切片なしの、b1*観察された頻度+b2*観察された頻度+b3*観察された頻度+b4*観察された頻度

を用いて、他の20のプールにおいて発見された多項式回帰因子を用いて、2の個体の5のプールにおける、Rafnc、Rafkc及びRafcを計算する
ステップ5c) モデル
Figure 2011504095

を用いて、他の20のプールにおいて発見された多重線形回帰係数を用いて、2の個体の5のプールにおける、予測された対立遺伝子頻度を計算する
ステップ3及びステップ5から、全てのプールが対立遺伝子頻度の予測のために用いられるような方法で、ステップ5b及び5cを数回繰り返すことにより、最良の補正手順を決定する(検証)。
もし必要ならば、検証についての他の数が用いられうる。例えば、回帰因子を発見する為に及び次にこれらの因子を用いてそれを予測する為に、24のプールを用いることができる。全部で、次に、これを25回繰り返すことが必要である。
最良の補正手段並びに必要とされる補正因子及び回帰因子により、新たなプールの頻度を予測すること及び表2における得られた対立遺伝子を読み取ることが可能であった。

Claims (19)

  1. カテゴリー変数について分析されるべき試料をプールする方法であって、該分析が分析物の定量的測定を含み、該試料をプールする方法がn個の試料のプールを用意することを含み、ここで該プールにおける個々の試料の量は、該試料中の該分析物がX:X:X:X(n−1)のモル比で存在するような量であり、且つxが該カテゴリー変数のクラスの数を表す2以上の整数である、上記方法。
  2. 該分析物が生体分子であり且つ該カテゴリー変数が該生体分子の変異体である、請求項1に記載の方法。
  3. 該生体分子が核酸である、請求項2に記載の方法。
  4. 該変異体が、該核酸におけるヌクレオチド多型である、請求項3に記載の方法。
  5. 該ヌクレオチド多型がSNPである、請求項4に記載の方法。
  6. 該変異体が、特定のヌクレオチド位置の塩基アイデンティティーである、請求項3に記載の方法。
  7. 該定量的測定が、装置シグナルの強度、ピーク高さ又はピーク面の測定を含む、請求項1〜6のいずれか1項に記載の方法。
  8. 該装置シグナルが蛍光シグナルである、請求項7に記載の方法。
  9. 半数体又は多数体の個体における対立遺伝子変異体を遺伝子型同定する為の、請求項1〜8のいずれか1項に記載の方法の使用方法であって、該カテゴリー変数(x)のクラスの数がp+1に等しく、pが倍数性レベルを表す、上記使用方法。
  10. 二倍体個体における対立遺伝子変異体を遺伝子型同定する為の、xが3である、請求項9に記載の使用方法。
  11. 複数の試料についての分析を実施する方法であって、請求項1〜8のいずれか1項の方法に従い該試料をプールして、プールされた試料を用意すること、及び該プールされた試料について該分析を実施することを含む、上記方法。
  12. 複数の試料についての分析を実施する方法であって、請求項1〜8のいずれか1項に従う方法により得られるプールされた試料のセットについて分析を実施することを含み、ここで該試料がカテゴリー変数について分析され且つ該試料内の分析物の定量的測定に関与する、上記方法。
  13. 該測定から、該試料のプールにおける個々の試料の寄与を演繹することをさらに含む、請求項12に記載の方法。
  14. 複数の試料を1つのプールされた試料へとプールする為のプーリング装置であって、プールされた試料を用意するための試料コレクターを備えており且つ請求項1〜8のいずれか1項に記載の方法を実施する為のプロセッサをさらに備えている、上記装置。
  15. 請求項1〜8のいずれか1項に記載の方法により得られるプールされた試料のセットについて分析を実施する為に構成されたプロセッサを備えている分析装置であって、該装置は該試料をカテゴリー変数について分析する為及び該試料内の分析物の定量的測定を実施するように構成されている、上記分析装置。
  16. 請求項14のプーリング装置をさらに備えている、請求項15に記載の装置。
  17. コンピュータ、プログラムされたコンピュータネットワーク又は他のプログラム可能な装置においてロードされそして実行されたときに、請求項1〜8のいずれか1項に記載の試料をプールする方法を実行する、コンピュータプログラム製品それ自体又はキャリア上のコンピュータプログラム製品。
  18. コンピュータ、プログラムされたコンピュータネットワーク又は他のプログラム可能な装置においてロードされそして実行されたときに、複数の試料について分析を実施する為の方法を実行し、該方法が、請求項1〜8のいずれか1項に記載の方法により得られるプールされた試料のセットについて分析を実施することを含み、該試料がカテゴリー変数について分析され且つ該試料内の分析物の定量的測定に関与する、コンピュータプログラム製品それ自体又はキャリア上のコンピュータプログラム製品。
  19. 該方法が請求項1〜8のいずれか1項に記載のプーリングのステップをさらに含む、請求項18に記載のコンピュータプログラム製品。
JP2010531978A 2007-10-31 2008-10-31 生物学的アッセイを実施する為に試料をプールする方法 Pending JP2011504095A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP07119761 2007-10-31
PCT/NL2008/050687 WO2009058016A1 (en) 2007-10-31 2008-10-31 Method of pooling samples for performing a bi0l0gical assay

Publications (1)

Publication Number Publication Date
JP2011504095A true JP2011504095A (ja) 2011-02-03

Family

ID=39052362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010531978A Pending JP2011504095A (ja) 2007-10-31 2008-10-31 生物学的アッセイを実施する為に試料をプールする方法

Country Status (18)

Country Link
US (1) US8594946B2 (ja)
EP (1) EP2222872B1 (ja)
JP (1) JP2011504095A (ja)
KR (1) KR20100098517A (ja)
CN (1) CN101910413B (ja)
AU (1) AU2008319580B2 (ja)
BR (1) BRPI0818870A2 (ja)
CA (1) CA2703938A1 (ja)
DK (1) DK2222872T3 (ja)
ES (1) ES2464817T3 (ja)
HK (1) HK1151069A1 (ja)
IL (1) IL205465A (ja)
MX (1) MX2010004821A (ja)
NZ (1) NZ585057A (ja)
RU (1) RU2010121856A (ja)
SG (1) SG185931A1 (ja)
WO (1) WO2009058016A1 (ja)
ZA (1) ZA201003233B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023007883A1 (ja) * 2021-07-28 2023-02-02 株式会社島津製作所 検体前処理装置及び検体プール検査方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2425011A1 (en) * 2009-04-29 2012-03-07 Hendrix Genetics Research, Technology & Services B.V. Method of pooling samples for performing a biological assay
KR101473705B1 (ko) 2013-10-11 2014-12-18 삼성에스디에스 주식회사 생물학적 샘플 분석 시스템 및 방법
KR20150137283A (ko) * 2014-05-29 2015-12-09 사회복지법인 삼성생명공익재단 생물학적 샘플 분석 시스템 및 방법
EP3978625A1 (en) * 2016-05-12 2022-04-06 Pioneer Hi-Bred International, Inc. Methods for simultaneous pooled genotyping of plants

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020172965A1 (en) 1996-12-13 2002-11-21 Arcaris, Inc. Methods for measuring relative amounts of nucleic acids in a complex mixture and retrieval of specific sequences therefrom
US20030152942A1 (en) 2001-05-09 2003-08-14 Lance Fors Nucleic acid detection in pooled samples
WO2005075678A1 (en) 2004-02-10 2005-08-18 Yissum Research Development Company Of The Hebrew University Of Jerusalem Determination of genetic variants in a population using dna pools

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023007883A1 (ja) * 2021-07-28 2023-02-02 株式会社島津製作所 検体前処理装置及び検体プール検査方法

Also Published As

Publication number Publication date
HK1151069A1 (en) 2012-01-20
EP2222872A1 (en) 2010-09-01
AU2008319580A1 (en) 2009-05-07
ZA201003233B (en) 2011-06-29
MX2010004821A (es) 2010-08-02
BRPI0818870A2 (pt) 2015-05-05
IL205465A0 (en) 2010-12-30
IL205465A (en) 2014-01-30
DK2222872T3 (da) 2014-06-02
ES2464817T3 (es) 2014-06-04
AU2008319580B2 (en) 2014-02-27
CN101910413B (zh) 2013-08-14
RU2010121856A (ru) 2011-12-10
CN101910413A (zh) 2010-12-08
EP2222872B1 (en) 2014-02-26
SG185931A1 (en) 2012-12-28
CA2703938A1 (en) 2009-05-07
US20100216666A1 (en) 2010-08-26
US8594946B2 (en) 2013-11-26
NZ585057A (en) 2012-09-28
KR20100098517A (ko) 2010-09-07
WO2009058016A1 (en) 2009-05-07

Similar Documents

Publication Publication Date Title
JP7197209B2 (ja) Dnaのサイズに基づく解析
Lo Non-invasive prenatal testing using massively parallel sequencing of maternal plasma DNA: from molecular karyotyping to fetal whole-genome sequencing
JP7067896B2 (ja) 品質評価方法、品質評価装置、プログラム、および記録媒体
CN110870016A (zh) 用于序列变体呼出的验证方法和系统
CN110997944A (zh) 用于检测brca1/2中的大片段重排方法和系统
WO2018106884A1 (en) Methods for detecting mutation load from a tumor sample
US8594946B2 (en) Method of performing a biological assay
Margraf et al. Variant identification in multi-sample pools by illumina genome analyzer sequencing
US20120046179A1 (en) Method of pooling samples for performing a biological assay
US20200318175A1 (en) Methods for partner agnostic gene fusion detection
JP2023526441A (ja) 複合遺伝子バリアントの検出およびフェージングのための方法およびシステム
US20050064436A1 (en) Methods and compositions for identifying patient samples
JP2006506605A (ja) mRNAの絶対量を測定する方法及びシステム
CN110643713A (zh) 用于大熊猫的str基因座集及用途
Emami et al. Association Study of Over 200,000 Subjects Detects Novel Rare Variants, Functional Elements, and Polygenic Architecture of Prostate Cancer Susceptibility
WO2024059487A1 (en) Methods for detecting allele dosages in polyploid organisms
Tromp et al. How does one study genetic risk factors in a complex disease such as aneurysms?
WO2024073544A1 (en) System and method for genotyping structural variants
CZ296587B6 (cs) Nový zpusob kvantifikace nukleových kyselin