JP2009504153A - オリゴヌクレオチド設計および/または核酸検出の方法および/または装置 - Google Patents

オリゴヌクレオチド設計および/または核酸検出の方法および/または装置 Download PDF

Info

Publication number
JP2009504153A
JP2009504153A JP2008525967A JP2008525967A JP2009504153A JP 2009504153 A JP2009504153 A JP 2009504153A JP 2008525967 A JP2008525967 A JP 2008525967A JP 2008525967 A JP2008525967 A JP 2008525967A JP 2009504153 A JP2009504153 A JP 2009504153A
Authority
JP
Japan
Prior art keywords
nucleic acid
target nucleic
probe
oligonucleotide
probes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008525967A
Other languages
English (en)
Other versions
JP2009504153A5 (ja
Inventor
ワン,クリストファー・ウィン・チョン
スン,ウィン‐キン
リー,チャーリー
ミラー,ランス・デイヴィッド
Original Assignee
エイジェンシー・フォー・サイエンス,テクノロジー・アンド・リサーチ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エイジェンシー・フォー・サイエンス,テクノロジー・アンド・リサーチ filed Critical エイジェンシー・フォー・サイエンス,テクノロジー・アンド・リサーチ
Publication of JP2009504153A publication Critical patent/JP2009504153A/ja
Publication of JP2009504153A5 publication Critical patent/JP2009504153A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation

Abstract

(I)増幅される少なくとも1つの標的核酸の領域を同定および/または選択ステップと、ここで、前記領域が、平均増幅効率(AE)よりも高いAEを有し、(II)選択される領域にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを設計するステップとを、任意の順序で含む核酸検出のための少なくとも1つのオリゴヌクレオチドを設計する方法が提供される。(i)少なくとも1つの生体試料を提供するステップと、(ii)生体試料中に含まれる核酸を増幅するステップと、(iii)生体試料中に標的核酸が存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを提供するステップと、(iv)前記オリゴヌクレオチドを増幅された核酸に接触させ、標的核酸にハイブリダイズしたオリゴヌクレオチドを検出するステップとを含む少なくとも1つの標的核酸を検出する方法もまた、提供される。具体的には、本方法は、少なくとも1つのヒト生体試料中の、少なくとも1つの病原体、例えばウイルスの存在を検出するためのものである。プローブは支持体、例えばマイクロアレイ上に配置してもよい。

Description

本発明は、オリゴヌクレオチド設計および/または核酸検出の分野に関する。本発明の方法、装置および/または製品は、病原体の検出、例えばウイルスの検出のために使用してもよい。
ヒト患者および集団におけるウイルス性および細菌性病原体の正確かつ迅速な検出は、医学的および疫学的に非常に重要である。歴史的に、診断技術は、細胞培養継代および種々の免疫学的アッセイまたは染色手順に依存してきた。感染性疾患因子の正確かつ感度の高い検出は、この分野における進歩の長い歴史にもかかわらず、現在でも依然として困難である。疾患症状から診断までの遅れの問題、およびこれらの手法による微生物の検出限界にもかかわらず、微生物学研究室において、培養および抗体ベースの検出の典型的な方法は、依然として中心的な役割を果たしている。感染のより速い診断によって、例えばより早期の適切な抗菌治療の実施によって、罹患率および死亡率が減少し得る。過去数十年間で、これを達成するための種々の方法が提案されており、PCRおよびマイクロアレイベースの技術を含む核酸検出に基づくものが、最も見込みがあると思われている。具体的には、PCRベースのアッセイが実施されて、より高い検出感度で疑いのある病原体をより迅速に診断することが可能になった。しかしながら、臨床上の実施において、病原因子は、しばしば未確認のままであり、無数の様式で検出を免れる。例えば、いくつかのウイルスは、培養を施行できない。またある時には、患者の試料は、従来の技術による病原体検出には、質が悪過ぎるか、または力価が不十分である場合がある。さらに、PCRベースおよび抗体ベースの手法はともに、PCRプライマー結合部位の変化および抗原連続変異を生じる天然の遺伝子多様化だけのために、疑いのある病原体を認識できない場合がある。
複数の病原体を並行して検出する能力を有するDNAおよびオリゴヌクレオチドマイクロアレイが記載されてきた(Wang et al.,2002;Urisman et al.,2005)。しかしながら、未解決の技術的問題によって、臨床設定におけるそれらの日常的な使用が妨げられている。例えば、増幅およびクロスハイブリダイゼーションによるアーチファクトに照らして病原体の「サイン」を比較するための最も情報を与えるプローブをどのようにして選択するか?どのレベルの蛍光シグナルおよびサインプローブによって、病原体が検出されるか?最適化された検出アルゴリズムの精度および感度は何か?(Striebel et al.,2003;Bodrossy and Sessitsch,2004;Vora et al.,2004)。
したがって、この技術の分野において、核酸の検出の代替的および改良された方法が必要である。具体的には、病原体の検出のための代替的および/または改良された診断方法が必要とされる。
本発明は、上述の問題を扱い、具体的には、オリゴヌクレオチド設計の方法、装置および/または製品を提供する。具体的には、オリゴヌクレオチドプローブおよび/またはプライマー設計の方法、装置および/または製品が提供される。核酸検出の方法、装置および/または製品もまた提供される。
第一の態様によると、本発明は、
(I)増幅される少なくとも1つの標的核酸の少なくとも1つの領域を同定および/または選択するステップと、ここで、領域が平均増幅効率(AE)よりも高いAEを有し、
(II)選択された領域にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを設計するステップと
を任意の順序で含む、核酸検出のための少なくとも1つのオリゴヌクレオチドを設計する方法を提供する。
少なくとも1つのオリゴヌクレオチドは、少なくとも1つのプローブおよび/またはプライマーであってもよい。具体的には、ステップ(I)において、AEのスコアは、標的核酸またはその少なくとも1つの領域の範囲上の各位置iについて判定され、次いで、平均AEスコアが得られる。平均よりも高いAEスコアを示す領域を、増幅される標的核酸の領域として選択してもよい。具体的には、選択される領域のAEは、増幅効率スコア(AES)として計算してもよく、これは、フォワードプライマーriが位置iに結合することができ、リバースプライマーrjが標的核酸の位置jに結合できる確率であり、|i−j|は、増幅されることが所望される標的核酸の領域である。具体的には、領域|i−j|は10000bp以下、より具体的には5000bp以下、または1000bp以下、例えば500bp以下であってもよい。具体的には、フォワードおよびリバースプライマーは、ランダムプライマーであってもよい。
別の態様によると、ステップ(I)は、標的核酸の各位置についての幾何学的増幅バイアスの効果を判定すること、および平均増幅効率(AE)よりも高いAEを有する領域として増幅される少なくとも1つの領域を選択することを含む。例えば、幾何学的増幅バイアスは、PCRバイアスである。
ステップ(I)で選択される領域にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを設計するステップ(II)は、当分野で公知の任意のオリゴヌクレオチド設計技術に従って行ってもよい。具体的には、選択される領域にハイブリダイズすることができるオリゴヌクレオチドは、以下の基準:
(a)選択されたオリゴヌクレオチドは、40%〜60%のCG含有量を有する;
(b)隣接モデルに基づいて計算される、最も高い自由エネルギーを有することによってオリゴヌクレオチドが選択される;
(c)標的核酸vaおよびvbのオリゴヌクレオチドsaおよびオリゴヌクレオチドsbサブストリングを仮定すると、saと任意の長さmのサブストリングsbとの間のハミング距離に基づいて、ならびに/またはsaおよびオリゴヌクレオチドsbの最長の共通するサブストリングに基づいてsaが選択される;
(d)標的核酸vaに特異的な長さmの任意のオリゴヌクレオチドsaについて、標的核酸と異なる核酸のいずれの領域ともいかなるヒットも有さない場合、オリゴヌクレオチドsaが選択され、長さmのオリゴヌクレオチドsaが標的核酸と異なる核酸とのヒットを有する場合、最小の最大アライメント長および/または最少の数のヒットを有する長さmのオリゴヌクレオチドsaが選択される;ならびに
(e)piが、増幅された標的核酸の位置iにハイブリダイズすると予測される場合、標的核酸の位置iのオリゴヌクレオチドpiが選択される
の少なくとも1つに従って、選択および設計してもよい。
具体的には、オリゴヌクレオチドは、プローブおよび/またはプライマーであってもよい。
したがって、オリゴヌクレオチドを設計するために、上述の基準の2つ以上を用いてもよい。例えば、全ての基準(a)〜(e)を適用することによって、オリゴヌクレオチドを設計してもよい。本明細書で言及されないが明らかに当業者の知識の範囲内である他の基準もまた、使用してもよい。
具体的には、基準(e)に基づいて、P(pi|va)>λであり、式中λが0.5であり、P(pi|va)が、piが標的核酸vaの位置iにハイブリダイズする確率である場合、標的核酸vaの位置iのオリゴヌクレオチドpiが選択される。より具体的には、λは0.8である。
具体的には、
Figure 2009504153
であり、式中、Xは、vaの全てのオリゴヌクレオチドの増幅効率スコア(AES)値を表す確率変数であり、kはva中のオリゴヌクレオチドの数であり、ciは、AES値がxi以下であるオリゴヌクレオチドの数である。
本発明の別の態様によると、上述のようにオリゴヌクレオチドを設計する方法は、選択および設計されたオリゴヌクレオチドを調製するステップをさらに含む。オリゴヌクレオチドは、少なくとも1つのプローブおよび/またはプライマーであってもよく、当分野で公知の任意の標準的な方法、例えば、化学合成またはフォトリソグラフィーによって調製してもよい。
別の態様によると、本発明は、
(i)少なくとも1つの生体試料を提供するステップと、
(ii)生体試料中に含まれる核酸を増幅するステップと、
(iii)生体試料中に標的核酸が存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを提供するステップと、ここで本明細書に記載される本発明の任意の態様による方法を用いることによって、前記オリゴヌクレオチドが設計および/または調製され、
(iv)前記オリゴヌクレオチドを増幅された核酸と接触させる、および/または標的核酸にハイブリダイズしたオリゴヌクレオチドを検出するステップと
を含む、少なくとも1つの標的核酸を検出する方法を提供する。
具体的には、オリゴヌクレオチドはプローブである。
増幅ステップ(ii)は、ランダムプライマーの存在下で行ってもよい。例えば、増幅ステップ(ii)は、少なくとも1つのランダムフォワードプライマー、少なくとも1つのランダムリバースプライマーおよび/または2つより多いランダムプライマーの存在下で行ってもよい。当分野で公知の任意の増幅方法を用いてもよい。例えば、増幅方法は、RT−PCRである。
具体的には、位置iに結合しているフォワードランダムプライマーおよび標的核酸vaの位置jに結合しているリバースランダムプライマーは、標的核酸vaの各位置iについて、
Figure 2009504153
の増幅効率スコア(AESI)を有するプライマーの間から選択され、式中
Figure 2009504153
であり、Pf(i)およびPr(i)は、ランダムプライマーriが、それぞれフォワードプライマーおよびリバースプライマーとして、vaの位置iに結合することができる確率であり、10000bp以下であるZは、増幅されることが所望されるvaの領域である。より具体的には、Zは5000bp以下、1000bp以下、または500bp以下であってもよい。
増幅ステップは、フォワードおよびリバースプライマーを含んでもよく、フォワードおよびリバースプライマーのそれぞれは、5’−3’配向で、不変のプライマー頭部および可変のプライマー尾部を含んでもよく、少なくとも可変の尾部は、標的核酸vaの一部にハイブリダイズする。具体的には、増幅ステップは、配列番号1のヌクレオチド配列またはそのバリアントもしくは誘導体を有するフォワードおよび/またはリバースランダムプライマーを含んでもよい。
生体試料は、哺乳動物から、例えばヒトから採取された任意の試料であってもよい。生体試料は、組織、血清、鼻咽頭洗浄液、唾液、他の任意の体液、血液、尿、便等であってもよい。増幅ステップを行う前に、生体試料を処置して、生体試料中に含まれる核酸を取り除いてもよい。標的核酸は、検出されることが意図される任意の核酸であってもよい。検出される標的核酸は、少なくとも、生体試料にとって外因性の核酸であってもよい。したがって、生体試料がヒト由来である場合、検出される外因性標的核酸(生体試料中に存在する場合)は、ヒト由来でない核酸である。本発明の態様によると、検出される標的核酸は、少なくとも、病原体ゲノムまたはその断片である。病原体核酸は、少なくとも、ウイルス、寄生生物、もしくは細菌の核酸、またはその断片であってもよい。
したがって、本発明は、少なくとも、存在する場合、生体試料中の標的核酸の検出の方法を提供する。方法は、生体試料中の病原体の存在の検出のための診断方法であってもよい。例えば、生体試料がヒトから得られる場合、標的核酸は、生体試料中に存在する場合、ヒト由来でない。
本発明のいずれかの方法に従って設計および/または調製されたオリゴヌクレオチドは、溶液中で使用するか、または不溶性支持体上に配置してもよい。例えば、当分野で公知の任意の技術に従って、オリゴヌクレオチドプローブを、不溶性支持体上に塗布するか、スポットするか、または印刷してもよい。支持体は、マイクロアレイ、バイオチップ、膜/合成表面、固体支持体またはゲルであってもよい。
次いで、プローブを、生体試料の核酸と接触させ、存在する場合、標的核酸とプローブがハイブリダイズし、標的核酸の存在が検出される。具体的には、検出ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値は、統計的に、vaに含まれないプローブの平均よりも高く、それによって、生体試料中のvaの存在が示される。
より具体的には、検出ステップに(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値は、統計的に、vaに含まれないプローブの平均値よりも高く、方法は、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含み、プローブvaのシグナル強度の密度分布は、vaに含まれないプローブのものよりも正に歪んでおり、それによって、生体試料中のvaの存在が示される。
例えば、検出ステップ(iv)において、そのプローブシグナル強度の密度分布が正規でない場合、すなわち、0.05以下のアンダーソン・ダーリン検定値および/または0.1以下のt検定の値および/または1.0以上、好ましくは5.0以上の重み付きカルバック・ライブラー情報量の値によって示すと、より正に歪んでいる場合に、生体試料中の少なくとも1つの標的核酸が検出される。具体的には、t検定値は0.05以下である。
より具体的には、検出ステップ(iv)の方法は、重み付きカルバック・ライブラー(WKL)情報量スコア:
Figure 2009504153
の分布を計算することによって、標的核酸vaについての各病原体特異的サインプローブセット(SPS)におけるプローブのプローブシグナル強度を評価することをさらに含み、
式中、Qa(j)は、瓶bjに見られるPaにおけるプローブのシグナル強度の累積分布関数であり、
Figure 2009504153
は、瓶bjに見られる
Figure 2009504153
におけるプローブのシグナル強度の累積分布関数であり、
Figure 2009504153
は、瓶bjに見られる
Figure 2009504153
におけるプローブのシグナル強度の累積分布関数であり、Paは、ウイルスvaのプローブのセットであり、
Figure 2009504153
である。
例えば、標的核酸vaの非存在を表す各サインプローブセット(SPS)は、正規分布したシグナル強度(0.05以下のアンダーソン・ダーリン検定値によって評価される)および/または5より小さい重み付きカルバック・ライブラー(WKL)情報量スコアを有する。少なくとも1つの標的核酸vaの存在を表す各サインプローブセット(SPS)は、正に歪んでいるシグナル強度分布および/または5より大きい重み付きカルバック・ライブラー(WKL)情報量スコアを有する。
本方法は、WKLスコアの分布に関してアンダーソン・ダーリン検定を行うことをさらに含み、P>0.05の結果は、それによって、標的核酸vaの非存在を示すか、または、P<0.05の結果は、それによって、標的核酸vaの存在を示す。また、さらなるアンダーソン・ダーリン検定を行って、それによって、さらなる重感染している標的核酸の存在を示してもよい。別の態様によると、本発明は、少なくとも1つの標的核酸vaへの、少なくとも1つのオリゴヌクレオチドプローブ(プローブは、当分野で公知の任意の本発明の方法に必ずしも限定されない方法に従って、選択および設計される)のハイブリダイゼーションを検出することを含む、標的核酸vaの存在を判定する方法を提供し、vaにハイブリダイズするプローブのシグナル強度の平均値は、vaに含まれないプローブの平均値よりも統計的に高く、それによって、vaの存在が示される。具体的には、vaにハイブリダイズするプローブのシグナル強度の平均値は、vaに含まれないプローブの平均値よりも統計的に高いことを特徴とし、本方法は、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含む方法であって、プローブvaのシグナル強度の密度分布は、vaに含まれないプローブのものよりも正に歪んでおり、それによって、vaの存在が示される方法である。より具体的には、生体試料中の標的核酸の存在は、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0以上、好ましくは5.0以上の、重み付きカルバック・ライブラー情報量の値によって示される。例えば、t検定値は0.05以下であってもよい。
別の態様によると、本発明は、
(i)少なくとも1つの生体試料を提供するステップと、
(ii)生体試料中に含まれる少なくとも1つの核酸を増幅するステップと、
(iii)生体試料中に標的核酸が存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドプローブを提供するステップと、
(iv)前記オリゴヌクレオチドを増幅された核酸と接触させ、標的核酸にハイブリダイズしたオリゴヌクレオチドを検出するステップと、ここで、vaにハイブリダイズするオリゴヌクレオチドのシグナル強度の平均値が、vaに含まれないオリゴヌクレオチドの平均値よりも統計的に高く、それによって生体試料中のvaの存在が示されるステップと
を含む、少なくとも1つの標的核酸を検出する方法を提供する。
具体的には、オリゴヌクレオチドは、オリゴヌクレオチドプローブである。
ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値は、vaに含まれないプローブの平均値よりも統計的に高いことを特徴とし、本方法は、高いシグナル強度を有する、検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含む方法であって、プローブvaのシグナル強度の密度分布は、vaに含まれないプローブのものよりも正に歪んでおり、それによって、生体試料中のvaの存在が示される方法である。具体的には、ステップ(iv)において、生体試料中の少なくとも1つの標的核酸の存在は、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0以上、好ましくは5.0以上の重み付きカルバック・ライブラー情報量の値によって示される。t検定値は、0.05以下であってもよい。検出される核酸は、生体試料の核酸にとって外因性の核酸である。検出される標的核酸は、少なくとも1つの病原体ゲノムまたはその断片であってもよい。病原体核酸は、ウイルス、寄生生物、もしくは細菌由来の少なくとも1つの核酸、またはその断片であってもよい。具体的には、試料がヒトから得られる場合、標的核酸は、生体試料中に存在する場合、ヒトゲノム由来でない。プローブは、不溶性支持体上に配置してもよい。支持体は、マイクロアレイ、バイオチップ、または膜/合成表面であってもよい。
本発明は、本発明の方法を行うための装置を含む本発明の装置を提供する。具体的には、装置は、核酸検出および/または増幅のためにオリゴヌクレオチドを設計するためであってもよく、装置は、増幅される少なくとも1つの標的核酸の少なくとも1つの領域を同定および/または選択するよう構成され、ここで前記領域は、平均増幅効率(AE)よりも高いAEを有し、同定および/または選択される領域にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドが設計される。より具体的には、装置は、少なくとも1つの生体試料を提供するステップ;生体試料に含まれる核酸を増幅するステップ;生体試料中に存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを提供し、オリゴヌクレオチドは、本発明に従って構成された装置に従って、設計および/または調製されるステップ;ならびにオリゴヌクレオチドを増幅された核酸と接触させる、および/または標的核酸にハイブリダイズしたオリゴヌクレオチドを検出するステップのいずれか1つを含む少なくとも1つの標的核酸を検出するよう構成してもよい。
本発明はまた、本発明の方法を行うために構成された少なくとも1つのコンピュータプログラム製品を提供する。本発明の装置の構成を記憶する少なくとも1つの電子記憶媒体もまた提供される。一態様によると、本発明は、本発明の方法を行うよう構成されたソフトウエアを含む取り外し可能な電子記憶媒体を提供する。具体的には、取り外し可能な電子記憶媒体は、少なくとも1つのオリゴヌクレオチドプローブおよび/もしくはプライマーを設計するため、ならびに/または少なくとも1つの標的核酸を検出するためのWKL情報量スコアおよび/またはアンダーソン・ダーリン検定を判定するよう構成されたソフトウエアを含んでもよい。より具体的には、ソフトウエア構成を含む取り外し可能な電子記憶装置は、本発明に従って定義されるように、WKL、アンダーソン・ダーリン検定、プローブを設計することおよび/または標的核酸を検出することを含んでもよい。したがって、上述のように構成されたソフトウエアもまた提供される。
本明細書で言及される書誌参照は、便宜上、参考文献のリストの形態で列挙し、実施例の最後に加えている。このような書誌参照の内容全体は、参照によって本明細書に組み込まれる。
本発明は、従来技術の課題を扱い、具体的には、オリゴヌクレオチド設計の少なくとも1つの方法、装置および/または製品を提供する。具体的には、プローブおよび/またはプライマー設計の方法、装置および/または製品が提供される。核酸検出の方法、装置および/または製品もまた提供される。
オリゴヌクレオチドハイブリダイゼーションマイクロアレイを病原体の存在を判定するための手段として使用する概念は提案されているが、相当な障害が残っており、したがって、これらのマイクロアレイの日常的な使用が妨げられている(Striebel,H.M.,2003)。これらの障害としては、プローブ設計およびデータ分析が挙げられる(Striebel,H.M.,2003;Bodrossy,L.およびSessitsch,A.,2004;Vora,G.J.et al.,2004)。本発明者らは、細部に至るプローブ選択にもかかわらず、コンピュータ内で設計された最良のプローブは、必ずしも患者試料に十分ハイブリダイズしないことを試験的なマイクロアレイにおいて観察した。本発明者らは、患者材料に一貫して十分ハイブリダイズするプローブを作製するために、最適な設計の予測の判断材料を判定するようなプローブ設計の新規なおよび/または改良された方法を開発することが必要であることに気づいた。具体的には、実施例の部分に記載されているように、本発明者らは、35のウイルスゲノム全体にタイリングされた重複する40塩基長のプローブを含む、マイクロアレイを作製した。しかしながら、本発明は、この特定の適用、プローブの長さ、および標的核酸の型に限定されない。
本発明の特定の態様によると、本発明者らは、どのようにして、支持体、具体的にはマイクロアレイ基盤を標的核酸検出、具体的には病原体検出における実行可能な手段になるように最適化するかを説明している。本発明者らはまた、融解温度、プローブのGC含有量、二次構造、ハミング距離、ヒトゲノムに対する類似性、ランダムPCR増幅効率におけるPCRプライマータグの効果、および/または配列多型の効果を含むプローブ設計の予測の判断材料を同定した。プローブおよび/またはプライマー設計の方法および基準の開発に、これらの結果は考慮され、および/または組み込まれた。より具体的な態様によると、本発明者らは、病原体であるかどうかわからない標的核酸の存在を正確に予測できる、データ分析アルゴリズムを開発した。例えば、病原体は、ウイルス、細菌および/または寄生生物であってもよいが、これらに限定されない。プローブが理想的に設計されなくて、アルゴリズムを使用してもよい。この検出アルゴリズムは、プローブ設計方法論と組み合わせて予測の信頼度レベルを有意に向上させる(表6および7参照)。
特定の態様によると、本発明の方法は、あり得る病原体の予測を必要としない場合があるが、ほとんどの公知のヒトウイルス、細菌および/または寄生生物、ならびにいくつかの新しい種を公平に検出することができる場合がある。ゲノムまたはその断片は、生物の染色体中の全遺伝物質として定義される。特定の生物の染色体中の遺伝物質由来のDNAは、ゲノムDNAである。ゲノムライブラリーは、生物の全ゲノムを表すランダムに生成された重複するDNA断片の組から作製されたクローンの収集物である。本発明のこの検出基盤の背後にある論拠は、ウイルス、細菌および/または寄生生物の各種が、それらのゲノムの一次配列内に特有の分子特性を含むことである。これらの特徴的な領域の同定によって、個々の種、およびいくつかの場合、個々の系の、特異的検出のための合理的なオリゴヌクレオチドプローブ設計が可能になる。科および属のメンバーの間で最も高度に保存された領域を表すオリゴヌクレオチド(オリゴ)プローブの同時の設計および/または調製によって、いくつかの新しい病原体の検出および部分的な特徴づけが可能になる。さらに、単一の支持体中にこのようなプローブ全てを含むことによって、臨床的試料に同時に重感染している複数のウイルス、細菌および/または寄生生物の検出が可能になる場合がある。支持体は、不溶性支持体、具体的には固体支持体であってもよい(例えば、マイクロアレイまたはバイオチップアッセイ)。
特定の態様によると、本発明は、オリゴヌクレオチドプローブが設計される様式、ならびに/またはマイクロアレイによって生成されるデータがどのように解釈および分析されるかに依存して、診断手段として使用してもよい。
<増幅効率の判定>
第一の態様によると、本発明は、
(i)増幅される少なくとも1つの標的核酸の少なくとも1つの領域を同定および/または選択するステップと、ここで、前記領域が平均増幅効率(AE)よりも高いAEを有し、
(ii)同定および/または選択された領域にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドプローブを設計するステップと
を任意の順序で含む、核酸検出のためのオリゴヌクレオチドプローブを設計する方法を提供する。
具体的には、ステップ(i)において、AEのスコアは、標的核酸の範囲またはその領域の各位置iについて判定され、平均AEが得られる。増幅される標的核酸の領域として、平均よりも高いAEを示す領域が選択される。具体的には、選択される領域のAEは、フォワードプライマーriが位置iに結合することができ、リバースプライマーrjが標的核酸の位置jに結合することができる確率である、増幅効率スコア(AE)として計算してもよく、および|i−j|は、増幅されることが所望される標的核酸の領域である。具体的には、領域|i−j|は、10000bp以下、より具体的には5000bp以下、または1000bp以下、例えば500bp以下であってもよい。具体的には、フォワードおよび/またはリバースプライマーはランダムプライマーであってもよい。
別の態様によると、増幅される標的核酸の領域の同定および/または選択のステップ(i)は、標的核酸の各位置についての幾何学的増幅バイアスの効果を判定すること、および平均増幅効率(AE)よりも高いAEを有する領域として増幅される領域を選択することを含む。幾何学的増幅バイアスは、核酸のいくつかの領域が、他の領域よりも効率的に増幅される可能性として定義してもよい。例えば、幾何学的増幅バイアスは、PCRバイアスである。
<増幅効率のモデリング>
患者試料内にどの標的核酸(例えば病原体)が存在するかは未知なので、増幅ステップおよび/または逆転写(RT)プロセスの間にランダムプライマーを用いて、存在する全てのRNAの、DNAへの公平な逆転写を確実にしてもよい。本発明の目的のために、当分野で公知の任意のランダム増幅方法を用いてもよい。本明細書において、ランダム増幅方法は、RT−PCRであってもよい。
しかしながら、本発明の方法がRT−PCRに限定されないことが、当業者に明らかになる。具体的には、RT−PCR手法は、プライマー−二量体結合によって引き起こされるシグナルの不正確さおよびRT−PCRプロセスにおける乏しい増幅効率の影響を受けやすい場合がある(Bustin,S.A et al.,2004)。この障害を克服するために、本発明者らは、ランダムプライマーを用いることによって、RT−PCRプロセスをモデリングした。
本発明の特定の態様によると、増幅ステップは、フォワードおよびリバースプライマーを含み、フォワードおよびリバースプライマーのそれぞれは、5’−3’配向で、不変のプライマー頭部および可変のプライマー尾部を含み、少なくとも可変の尾部は、標的核酸vaの一部にハイブリダイズする。固定されたプライマー頭部のサイズおよび可変のプライマー尾部のものは、本発明の方法の目的に適した、塩基長で任意のサイズであってもよい。固定された頭部は、10〜30塩基長、具体的には15〜25塩基長、例えば17塩基長であってもよい。可変の尾部は、1〜20塩基長、具体的には5〜15塩基長、例えば9塩基長であってもよい。これらのフォワードおよびリバースプライマーの例を、図1に示す。より具体的には、増幅ステップは、ヌクレオチド配列5’−GTTTCCCAGTCACGATANNNNNNNNN−3’(配列番号1)を有するフォワードおよび/またはリバースランダムプライマーを含んでもよく、Nは、A、T、C、およびGまたはその誘導体のいずれか1つである。
特定の実施形態によると、図1でも例示されているが、本発明者らは、以下のようにランダムRT−PCRプロセスをモデリングした。vaを、試料中の実際のウイルスとする。RT−PCRプロセスにおいて使用したランダムプライマーは、好ましくは、形態(5’−GTTTCCCAGTCACGATANNNNNNNN−3’)(配列番号1、および具体的には配列番号2〜7)の、固定された17塩基長の頭部および可変の9塩基長の尾部を有する26塩基長のプライマーであった。しかしながら、本発明のプライマーが配列番号1〜7の配列および図1に限定されないことは、当業者に明らかである。実際、プライマーの、特にその頭部および可変の尾部のヌクレオチドサイズは、上述の範囲内で変化および選択してもよい。vaの位置iとjの間の領域におけるRT−PCR産物を得るために、本発明者らは、(1)位置iに結合しているフォワードプライマー、(2)|i−j|≦10000、および(3)位置jに結合しているリバースプライマーを要した。具体的には、|i−j|は、増幅されることが所望される標的核酸の領域であり、5000bp以下、より具体的には1000以下、例えば500bp以下であってもよい。RT−PCR産物の質は、フォワードプライマーおよび/またはリバースプライマーがvaにどれだけよく結合するかに依存する。いくつかのランダムプライマーは、他のものよりもよくvaに結合することができる。このようなプライマー、およびそれらがどこでvaに結合するかの同定によって、vaの特定の領域がどの程度増幅されそうかの目安が提供される。この手法を用いて、vaの各位置についての増幅効率スコア(AES)を計算する増幅効率モデルが提供される。
標的核酸vaの特定の位置iについて、Pf(i)およびPr(i)は、ランダムプライマーriが、それぞれフォワードプライマーおよびリバースプライマーとしてvaの位置iに結合することができる確率である。簡単にするために、ランダムプライマーの最後の9ヌクレオチドがvaのリバース相補物のサブストリング(フォワードプライマー)またはvaのサブストリング(リバースプライマー)である場合に、ランダムプライマーがvaにだけ結合することができると仮定する。これを図1に示す。確立したプライマー設計基準(Wu,D.Y.et al.,1991)に基づいて、riが有意なプライマー−二量体を形成するか極度の融解温度を有する場合に、Pf(i)は低いと推定した。他方では、riがいかなる有意なプライマー−二量体を形成せず、最適な融解温度を有する場合、Pf(i)は高くなる。ランダムプライマーの頭部がvaに類似している場合に、これによって結合が助けられ、より高いPf(i)を生じる場合があることに留意されたい。同様に、Pr(i)を計算した。
フォワードプライマーとしてのvaの位置iでのランダムプライマーriの結合は、位置iの上流の少なくとも10000ヌクレオチドについて、RT−PCR産物の質に影響を及ぼす。同様に、リバースプライマーとしてのvaの位置iでのランダムプライマーriの結合は、位置iの下流の少なくとも10000ヌクレオチドについて、RT−PCR産物の質に影響を及ぼす。したがって、増幅効率スコア、vaの各位置iについてのAESiは、これを増幅する全てのフォワードおよびリバースプライマー対の複合効果を考慮することによって計算することができ、
Figure 2009504153
であり、式中、
Figure 2009504153
であり、Pf(i)およびPr(i)は、ランダムプライマーriが、それぞれフォワードプライマーおよびリバースプライマーとしてvaの位置iに結合することができる確率であり、10000bp以下であるZは、増幅されることが所望されるvaの領域である。
したがって、Zは、10000bp以下、5000bp以下、1000bp以下または500bp以下であってもよい。ウイルスの異なる領域によって提示されるシグナル強度の変化がそれらの対応する増幅効率スコアと直接相関を有するかどうかを検証するために、ヒトに影響を及ぼす一般的な病原体、ヒト呼吸器多核体ウイルスB(RSV−B)に関して、いくつかのマイクロアレイ実験(具体的な場合において、合計5つのマイクロアレイ実験)を行った。
<増幅効率についてのRT−PCRのモデリング>
(Sung et al.,2003;CSB)の方法の改良である本発明の方法によると、逆転写のために使用されるプライマーは、固定されたオリゴヌクレオチドタグ(頭部)およびランダムなオリゴヌクレオチド尾部を含む。理論的には、ランダムなオリゴヌクレオチド尾部は、患者試料中の全ての核酸に無差別に結合して、第一の鎖合成を開始するべきである。第二の鎖合成の後、全ての逆転写された配列は、固定されたオリゴヌクレオチドタグ(頭部)を両端に有する。これらの配列を、プライマーとして固定されたオリゴヌクレオチドタグ(頭部)を用いて少なくとも長さ10000bpのPCR産物を生じてPCRによって増幅する。具体的には、増幅されたPCR産物の大部分は、長さが500〜1000bpの間である。特定の実施形態によると、逆転写(RT)のために使用される26塩基長のプライマーは、9塩基長のランダムな尾部を有する固定された17塩基長のタグ:5’−GTTTCCCAGTCACGATANNNNNNNNN−3’(配列番号1)を含む。
本発明者らのモデルにおいて、vaは、臨床試料中の病原体を示す。vaの位置iおよびjによって定義されるゲノム中の任意の領域において、例えば500〜1000bpの少なくとも1つのPCR産物を生成することは、500=|i−j|=10000、および具体的には500=|i−j|=1000であるように、位置Iに結合しているフォワードプライマーおよびアンチセンス方向で位置jに結合しているリバースプライマーを必要とする。プライマーの結合親和性は、少なくとも2つの要因、(1)プライマー二量体形成、および(2)ウイルスvaに対するプライマーのハイブリダイゼーション親和性によって判定される。10000ヌクレオチド、具体的には1000または500ヌクレオチド内で理想的なプライマー結合配置を有することによってうまく増幅されることができるゲノム領域は、vaの各位置の増幅効率スコア(AES)を計算することによって予測することができる(図1)。
<増幅効率スコア(AES)>
aの各位置iについて、Pf(i)およびPr(i)を、ランダムプライマーriが、それぞれフォワードプライマーおよびリバースプライマーとしてvaの位置iに結合することができる確率とする。簡単にするために、本発明者らは、プライマーのランダムな尾部のヌクレオチド(例えば、図1に示されるようなランダムプライマーの最後の9ヌクレオチド)がvaのリバース相補物のサブストリング(フォワードプライマー)またはvaのサブストリング(リバースプライマー、図1)である場合に、ランダムプライマーがvaにのみ結合できると仮定する。確立したプライマー設計基準(Wu and Ugozzoli,1991)に基づいて、本発明者らは、riが有意なプライマー−二量体を形成するか、極端な融解温度を有する場合に、Pf(i)が低いと推定した。他方では、riが、いかなる有意なプライマー−二量体も形成せず、最適な融解温度を有した場合、Pf(i)は高い。ランダムプライマーの固定されたオリゴヌクレオチドタグ(頭部)(例えば、図1に示されるような固定された17塩基長のタグ)は、vaと類似しており、これはまた、結合を助け、より高いPf(i)を生じる場合がある。同様に、Pf(i)を計算した。
フォワードプライマーとしてのvaの位置iでのランダムプライマーriの結合は、位置Iの上流のヌクレオチド(例えば、位置iの上流の500〜1000ヌクレオチド)についてのRT−PCR産物の質に影響を及ぼす。同様に、リバースプライマーとしての、vaの位置iでのランダムプライマーriの結合は、位置Iの下流のヌクレオチド(例えば、位置iの下流の500〜1000ヌクレオチドについて)についてのRT−PCR産物の質および被覆に影響を及ぼす。vaの位置xを仮定する。位置iおよびjにある全ての効果的なプライマー対は、それぞれxでのRT−PCR産物の質に寄与する。i=x=jおよびi−j=10000であることに留意されたい。例えば、500〜1000塩基対長である場合、本発明者らのRT−PCR産物から500=i−j=1000である。したがって、vaの各位置xについての増幅効率スコア、AESXは、これを増幅する全てのプライマー対の複合効果を考慮することによって計算することができる。
Figure 2009504153
<成功するRT−PCRを予測するAES閾値>
ウイルスvaのためのプローブ選択のための増幅効率スコアの閾値を、AES値vaの累積分布関数によって判定する。Xを、vaの全てのプローブのAES値を表す確率変数とする。kを、vaにおけるプローブの数とする。このとき、本発明者らは、AES値がx以下である確率を
Figure 2009504153
と表し、式中、cは、x以下のAES値を有するプローブの数である。vaの位置iのプローブpiについて、xiを、その対応するAES値とする。プローブのシグナル強度はそのAES値と高度に相関するので、本発明者らは、vaの存在下でpiが高いシグナル強度を有する確率であるP(pi|va)を、P(X≦xi)と推定した。したがって、
Figure 2009504153
であり、式中、ciはAES値がxi以下であるxiと等しいプローブの数である。
プローブ選択のために、P(pi|va)≧λである場合にプローブpiを選択する。本発明者らの実験において、本発明者らは、λ=0.8に設定した。この閾値(上位20%AES)で、本発明者らは、期待されるプローブの50%より多くが、異なる臨床試料に再現性良くハイブリダイズすることを観察した。より高いAES(例えば、上位10%AES)を有するプローブを用いることによって、再現性が向上するが、これによって、種のレベルで10未満までいくつかのゲノムに残っている特有のプローブの数が減少し、結果として、アレイが病原体を特異的に同定する能力が損なわれる。したがって、上位20%AESを用いた。
<病原体検出マイクロアレイ上でのクロスハイブリダイゼーション閾値の経験的判定>
<プローブ設計>
選択される領域にハイブリダイズすることができるオリゴヌクレオチドプローブの設計のステップ(ii)は、当分野で公知のプローブ設計技術のいずれか1つに選択してもよい。以下の説明はプローブ設計に関するが、プライマーの設計、具体的にはRT−PCRのためのプライマーの設計にも、同じ原理が適用されることが当業者に明らかになる。
例えば、各vi∈Vについての標的核酸(例えば、ウイルスゲノム)V={v1,v2,・・・,vn}のセットを仮定すると、以下の条件を満たす長さmのプローブのセット(viのサブストリングである)を、例えば以下の、
(a)均質性、感度および特異性の確立されたプローブ設計基準(Sung,W.K.et al.,2003,CSB)
(b)ヒトゲノムゲノムに対する有意な配列類似性はない
(c)本明細書に記載されているように、例えばRT−PCRによってAEスコアを用いて効率的に増幅される
の少なくとも1つを考慮して設計してもよい。
クロスハイブリダイゼーションによるアーチファクトによって引き起こされるノイズの多い信号は、具体的には核酸の複合混合物中に存在する稀な病原体配列の同定のためのマイクロアレイデータの解釈への主な障害を提示する。例えば、臨床材料において、宿主組織に由来するもの等の混入している核酸配列は、配列相補性のある閾値を超える病原体特異的マイクロアレイプローブとクロスハイブリダイズする。これは、誤った結論につながる偽陽性シグナルを生じる場合がある。同様に、病原体配列は、その特異的プローブに結合することに加えて、他の非標的プローブ(すなわち、他の病原体を検出するよう設計されている)とクロスハイブリダイズする場合がある。この後者の現象は、問題があるように見えるがこのようなクロスハイブリダイゼーションを正確に予測することができる程度まで病原体同定のための有用な情報を提供することができた。アニーリング可能性および配列特異性を評価するための種々の評価指標で、マイクロアレイプローブは、昔から、(公知の標的への)最大の特異的ハイブリダイゼーションと(非特異的配列への)最小のクロスハイブリダイゼーションを確実にするよう設計されてきた。しかしながら、実際には、本発明者らは、多くのプローブは、最適なコンピュータ内でのパラメータを用いて設計されているが、不明な理由のために期待に従って機能しないことを見出した。
アレイベースの病原体検出の動力学を体系的に調査するために、本発明者らは、Nimblegenアレイ合成技術(Nuwaysir et al.,2002)を用いてオリゴヌクレオチドアレイを作製した。アレイを設計して、各ゲノムの全長にわたって平均8塩基の分解能でタイリングされた40塩基長のプローブを用いて35までのRNAウイルスを検出した(53,555プローブ、図6、表1)。
Figure 2009504153
Figure 2009504153
Figure 2009504153
各ウイルスプローブについての7つの複製、ならびにアレイ合成およびハイブリダイゼーションのための対照配列とともに(下記のように)、アレイは、合計390,482のプローブを含んだ。
<均質性、感度および特異性>
均質性は、類似した融解温度を有するプローブの選択を要する。低いCG含有量を有するプローブが、信頼できるハイブリダイゼーションシグナル強度を生じないこと、および高いCG含有量を有するプローブが非特異的結合を通して高いシグナル強度を生じる性向を有するがわかった。したがって、選択されたプローブのCG含有量が40%〜60%であるべきであることが確立できた。
したがって、本発明は、40%〜60%のCG含有量を有するプローブを選択することを含む核酸検出のためのオリゴヌクレオチドプローブを設計する方法を提供する。
用語「ハイブリダイゼーション」は、オリゴプローブが標的核酸またはその一部に非共有結合して、安定した二本鎖を形成するプロセスをいう。三重ハイブリダイゼーションもまた、理論的に可能である。
ハイブリダイゼーションプローブは、標的核酸の相補鎖に塩基特異的に結合することができるオリゴヌクレオチドである。特異的にハイブリダイズすることは、分子が、DNAまたはRNAの複合混合物(例えば、全細胞)中に配列が存在する場合に、ストリンジェントな条件下で、実質的に、または唯一、特定のヌクレオチド配列に、結合、二重化、またはハイブリダイズすることをいう。ハイブリダイゼーション、例えば対立遺伝子特異的プローブハイブリダイゼーションは、一般に、ストリンジェントな条件下で行われる。例えば、塩濃度が約1モル以下(M)、温度が少なくとも25℃、例えば、750mM NaCl、50mM リン酸Na、5mM EDTA、pH7.4(5×SSPE)および約25℃〜約30℃の温度である条件。ハイブリダイゼーションは、通常、ストリンジェントな条件下で、例えば1M以下の塩濃度および少なくとも25℃の温度で行われる。ストリンジェントな条件下については、例えば、その全体が上述の全ての目的のために参照によって本明細書に組み込まれる、Sambrook and Russel,Molecular Cloning:A Laboratory Manual,Cold Springs Harbor Laboratory,New York(2001)も参照されたい。
感度は、少量のmRNAを検出するために、有意な二次構造を形成することができないプローブが選択されることを要する。したがって、隣接モデルに基づいて計算される最も高い自由エネルギーを有するプローブが選択される(SantaLucia,J.,Jr.,et al.,1996)。
したがって、本発明は、核酸検出のための少なくとも1つのオリゴヌクレオチドプローブを設計する方法を提供し、プローブは、隣接モデルに基づいて計算される最も高い自由エネルギーを有することによって選択される。
特異性は、ウイルスゲノムに最も特有のプローブの選択を要する。これは、他の非標的核酸(例えば、ウイルスゲノム)とのプローブのクロスハイブリダイゼーションを最小限にすることである。標的核酸vaおよびvbのプローブsaおよびプローブsbサブストリングを仮定すると、saが、saと標的核酸vb由来の任意の長さmのサブストリングsbとの間のハミング距離ならびに/またはsaおよびプローブsbの最も長い共通するサブストリングに基づいて選択される。具体的には、saおよびsbを、それぞれウイルスゲノムvaおよびvb由来の長さmのサブストリングとし、ここで(va≠vb)である。
設計されるプローブの長さは、本発明の目的のために有用な任意の長さであってよい。プローブは、100塩基長未満、例えば20〜80塩基長、25〜60塩基長、例えば40塩基長であってもよい。ハミング距離および/または最も長い共通するサブストリングもまた変化してもよい。
Kaneの基準によると(Kane,M.D.et al.,2000)、saは、
(a)saとウイルスゲノムvb由来の任意の長さmのサブストリングsbとの間のハミング距離が0.25mより多く、
(b)saおよびsbの最も長い共通するサブストリングが15未満である
場合、vaに特異的である。
ハミング距離についてのカットオフ値は、所望されるストリンジェンシーに従って選択してもよい。所望される特定のストリンジェンシーに従ってハミング距離カットオフをどのようにして選択するかは当業者に明らかになる。本明細書に記載されるプローブ設計の特定の実施例によると、本発明者らは、特定のプローブについての他の標的核酸に関して10より大きく、および保存されたプローブについては10より小さい、好ましくは5より小さいハミング距離カットオフを使用した。特定のプローブでは、特定の標的核酸にのみハイブリダイズするプローブが示されるが、保存されたプローブでは、標的核酸のファミリーの任意のメンバーにハイブリダイズすることができるプローブが示される。
したがって、本発明はまた、核酸検出のためのオリゴヌクレオチドプローブを設計する方法を提供し、生体試料中に含まれる標的核酸vaおよびvbのプローブsaおよびsbサブストリングを仮定すると、saは、saと標的核酸vb由来の任意の長さmのサブストリングsbの間のハミング距離が0.25mより多く、saおよびプローブsbの最も長い共通するサブストリングが15未満である場合に選択される。
ヒトRNA由来のクロスハイブリダイゼーションの複雑性なしにアレイハイブリダイゼーション動力学を研究するために、SARSコロナウイルスおよびデング熱血清型1ウイルスRNAを感染細胞系の培地から精製し、逆転写し、ウイルス特異的プライマーを用いてPCR増幅した(Wong et al.,2004)。各ゲノムcDNAを、(配列決定によって確認されるように)その全体を増幅し、Cy3で標識し、マイクロアレイ上で別々にハイブリダイズさせた。SARS試料は、検出閾値を十分超えた蛍光(Cy3)シグナルを提示している(平均アレイシグナル強度よりも標準偏差の2倍を超える強度のプローブシグナル強度によって判定される;図7A)全3,805のSARS特異的プローブで、SARSタイリングプローブに十分ハイブリダイズした。コロナウイルス科の他のメンバーならびにピコナウイルス科およびパラミクソウイルス科のいくつかの種についてのみ観察すると、他の病原体プローブセットとのクロスハイブリダイゼーションは最小であり、SARSが他の公知のウイルスと配列相同性をほとんど共有していないという観察と一致した(Ksiazek et al.,2003)。他方では、1型デング熱のハイブリダイゼーションパターンは、より複雑であった(図7B)。まず、本発明者らは、配列多型のために、1型デング熱プローブセットへのハイブリダイゼーションが部分的に不完全である(すなわち、シグナルのない領域)ことを観察した。アレイ上でハイブリダイズされた1型デング熱試料を、1944年のハワイの分離株(ATCCカタログ番号VR−1254)から培養したが、アレイプローブセットは、1990年にシンガポールで単離されたS275/90株の配列(Fu et al.,1992)に基づく。cDNA標識とハイブリダイズできなかった1型デング熱プローブは、それぞれ、標的配列との少なくとも3つのミスマッチ(15塩基の範囲内に)を含んだ。第二に、本発明者らは、アレイ上に存在するほとんど全てのウイルスプローブセット、具体的には他のフラビウイルス科メンバーのプローブと、ある程度のクロスハイブリダイゼーションが起こったことを観察し、4型デング熱血清型が60〜70%の相同性を共有していることと一致した。ハイブリダイゼーションシグナル出力とアニーリング特異性との間の関係を理解するために、本発明者らは、まず、類似性の2つの尺度:プローブハミング距離(HD)および最大連続マッチ(MCM)を用いて、全てのプローブ配列を各ウイルスゲノムと比較した。HDは、類似した配列については低いスコアで、2つの配列の全体の類似性距離を評価する(Hamming,1950)。MCMは、類似した配列については高いスコアで、正確な適合である連続した塩基の数を評価する(Kane et al.,2000)。
本発明者らは、ハワイの1型デング熱分離株に関連して、各プローブについてHDおよびMCMスコアを計算し、これらのスコアが、それぞれプローブシグナル強度に対して反比例および直接の相関があることを観察した。ハワイの1型デング熱ゲノムに対して高い類似性を有する、すなわちHD=2(n=942)またはMCM=27(n=627)のアレイ上の全てのプローブは、バックグラウンドより3対数分高く、メジアンシグナル強度でハイブリダイズした。プローブの98%は0〜4の低HD範囲または18〜40の高いMCM範囲で検出可能であったが、メジアンプローブシグナル強度は、配列距離の各増分で減少した。メジアンシグナル強度は、それぞれ43%および46%の検出可能なプローブで、HD=7およびMCM=15でバックグラウンドレベルまで激減した。プローブの大部分(>96%、n>51,000)は、8〜21の間のHDスコアおよび/または0〜15の間のMCMスコアを有し、それぞれその1.23%および1.57%が検出可能であった。
理想的な、クロスハイブリダイゼーション類似性閾値は、特定の病原体を同定する全てのプローブが、病原体配列の多型の存在下であっても、常にバックグラウンドノイズより高い検出可能なシグナル強度を有するものである。最適な類似性閾値HD=4およびMCM=18で、98%を超えるプローブが、バックグラウンドよりも2対数分高いメジアンシグナル強度で検出することができたが、閾値をHD=5およびMCM=17まで1段階下に調節することによって、わずか約85%のプローブ検出、およびバックグラウンドよりも約1.2対数分高いメジアンシグナル強度が生じた(図8)。
これらの最適なHDおよびMCM閾値を用いてクロスハイブリダイゼーションを予測して、本発明者らは、全てのプローブを、所与の病原体を最も検出しそうなグループに分けた。本発明者らは、これらのグループを、特異的サインプローブセット(SPS)と呼び、アレイ上に示される35の病原体ゲノムのそれぞれについてのSPSを定義した(表2)。
Figure 2009504153
Figure 2009504153
各病原体のSPSは、そのゲノム配列に由来するタイリングプローブ(HD=0、MCM=40)、ならびに他の病原体に由来するクロスハイブリダイズしているプローブを含んだ(HD=4、MCM=18)。
本発明者らは、次に、本発明者らのSPSプローブの性能に影響を及ぼす確率のある他の非特異的ハイブリダイゼーション現象を考慮した。例えば、本発明者らは、プローブシグナルと%GC含有量との間の一般的な関係を観察した。以前の観察と一致して、本発明者らは、40%未満のGCのプローブが、減少したシグナル強度を生じるが、60%を超えるGC含有量のプローブは、より高いシグナル強度を示すことを見出した(Wong et al.,2004;Maskos and Southern,1993)。したがって、本発明者らは、さらなる選択フィルターとして%GC含有量を利用し、それによって、最適なHDおよびMCM値にもかかわらず、40%未満のGCおよび60%を超えるGCを有するプローブを本発明者らのSPSから排除した。
<ヒトゲノムに対する配列類似性>
検出される標的核酸がヒトから(例えば、ウイルスゲノムを含むヒト試料)抽出される場合、ヒトゲノムに対して高い相同性を有するプローブもまた避けられるべきである。したがって、標的核酸vaに特異的な長さmの任意のプローブsaについて、標的核酸と異なる核酸のいずれの領域ともいかなるヒットも有さない場合、プローブsaが選択され、長さmのプローブsaが標的核酸と異なる核酸とヒットを有する場合、最も小さい最大アライメント長および/または最少の数のヒットを有する長さmのプローブsaが選択される。具体的には、任意の長さmのプローブsaについて、BLASTアルゴリズムで、ヒトゲノムとのsaのヒットが見られる(Altschul,S.F.et al.,1997)。(W=15)のBLAST文字列サイズおよび100の期待値を用いて、全てのヒットを見出した。ヒトゲノムといかなるヒットも有さない、すなわち、vaに特異的である場合、saを選択する。しかしながら、vaの長さmの全てのサブストリングがヒトゲノムとヒットを有する場合、最も小さい最大アライメント長および最少の数のヒットを有するものを選択した。
さらに、ヒト配列とのクロスハイブリダイゼーションはまた、結果を複雑にする可能性があったので、本発明者らは、15の文字列サイズを用いたBLASTによって(Altschul et al.,1997)、全てのプローブをヒトゲノム集合(17を構築)(International Human Genome Sequencing Consortium.Initial sequencing and analysis of the human genome.Nature 409(6822)、860−921(2001))と比較した。SPSから100の期待値を有するプローブをさらにフィルタリングした(上記の表2参照)。
したがって、本発明は、核酸検出のためのオリゴヌクレオチドプローブを設計する方法を提供し、標的核酸vaに特異的な長さmの任意のプローブsaについて、標的核酸と異なる核酸のいずれの領域ともいかなるヒットも有さない場合、プローブsaが選択され、長さmのプローブsaが標的核酸と異なる核酸とヒットを有する場合、最も小さい最大アライメント長および/または最少の数のヒットを有する長さmのプローブsaが選択される。
さらに、オリゴヌクレオチドプローブの設計はまた、本発明のAESによって行ってもよい。具体的には、本発明は、piが増幅された標的核酸の位置iにハイブリダイズすると予測される場合に標的核酸の位置iのプローブpiが選択される、プローブを選択および/または設計する方法を提供する。
具体的には、選択される領域にハイブリダイズすることができるオリゴヌクレオチドプローブは、以下の基準:
(a)選択されたプローブが、40%〜60%のCG含有量を有する;
(b)隣接モデルに基づいて計算される最も高い自由エネルギーを有することによってプローブが選択される;
(c)標的核酸vaおよびvbのプローブsaおよびプローブsbサブストリングを仮定すると、saと標的核酸vb由来の任意の長さmのサブストリングsbの間のハミング距離および/もしくはsaおよびプローブsbの最も長い共通するサブストリングに基づいて、saが選択される;
(d)標的核酸vaに特異的な長さmの任意のプローブsaについて、標的核酸と異なる核酸のいずれの領域ともいかなるヒットも有さない場合、プローブsaが選択され、長さmのプローブsaが標的核酸と異なる核酸とヒットを有する場合、最も小さい最大アライメント長および/もしくは最少の数のヒットを有する長さmのプローブsaが選択される;ならびに/または
(e)piが増幅された標的核酸の位置iにハイブリダイズすると予測される場合、標的核酸の位置iのプローブpiが選択される
の少なくとも1つに従って、選択および/または設計してもよい。
本発明の特定の態様によると、オリゴヌクレオチドプローブを設計するために、上述の基準の2つ以上を用いてもよい。例えば、全ての基準(a)〜(e)を適用することによって、プローブを設計してもよい。本明細書で明らかに言及されていないが当業者に明らかな他の基準もまた用いてもよい。
具体的には、基準(e)に基づいて、P(pi|va)>λであり、式中λが0.5であり、P(pi|va)が、piが標的核酸vaの位置iにハイブリダイズしなければならない確率である場合、標的核酸vaの位置iのプローブpiが選択される。より具体的には、λは0.8である。
別の態様によると、本発明は、
Figure 2009504153
であり、式中Xはvaの全てのプローブの増幅効率スコア(AES)値を表す確率変数であり、kはvaにおけるプローブの数であり、ciはAES値がxi以下であるプローブの数である、上述のような方法を提供する。
別の態様によると、AESを用いて、ランダムプライマータグを設計して、ランダムPCRによって試料のランダム増幅を容易にすることもできる(病原体の検出、遺伝子発現の検出、クローンDNAライブラリーの構築、および当業者がランダムPCRを採用する他の用途等の用途における使用のために)。
<支持体上のオリゴヌクレオチドプローブの合成>
本発明の別の態様によると、上述のように少なくとも1つのオリゴヌクレオチドプローブを選択および/または設計する方法は、選択および/または設計されたプローブを調製するステップをさらに含む。プローブを設計することは、その配列を理解すること、および/または任意の適した手段によって、例えばソフトウエアを使用することによってそれを設計することを含む。プローブを調製するステップは、その物理的調製を含む。プローブは、当分野で公知の任意の標準的な方法に従って調製してもよい。例えば、プローブは、化学的に合成するか、またはクローニングによって調製してもよい。例えば、Sambrook and Russel,2001に記載されているように。
本発明の任意の実施形態に従って調製された、支持体、例えばマイクロアレイまたはバイオチップもまた提供される。
本発明の任意の方法に従って設計および調製されたプローブは、溶液中で使用するか、または不溶性支持体上に配置してもよい。例えば、当分野で公知の任意の技術に従って、不溶性支持体に塗布するか、スポットするか、または印刷してもよい。支持体は、固体支持体またはゲルであってもよい。プローブを塗布された支持体は、マイクロアレイまたはバイオチップであってもよい。
より具体的には、本発明は、最初の組織試料から調製されたPCR増幅cDNA(具体的には、ランダムPCR増幅cDNA)からの、病原体、例えばウイルスおよび/または細菌病原体の迅速な検出および同定のためのオリゴマイクロアレイハイブリダイゼーションベースの手法を提供する。
以下の説明において、プローブの調製は、マイクロアレイに特に関連して行われる。しかしながら、支持体、ならびにプローブは、本出願の内容全体にわたる任意の記載に従って調製してもよい。具体的には、「アレイ」は、合成または生合成のいずれで調製されてもよい分子の意図的に作られた収集物である。アレイ中の分子は、互いに同一でも異なってもよい。アレイは、種々の形式、例えば、可溶性分子のライブラリー、樹脂ビーズ、シリカチップ、または他の固体支持体に繋ぎ止められた化合物のライブラリーの形をとってもよい。アレイプレートまたはプレートは、ウェルと呼ばれる、液体の通過に耐性があって領域または空間を形成する物理的障壁によって、各アレイが他のアレイから分離されている複数のアレイを有する物体である。
<試料調製およびマイクロアレイへのハイブリダイゼーション>
生体試料は、哺乳動物、例えばヒトから採取される、任意の試料であってもよい。生体試料は、血液、体液、唾液、尿、便等であってもよい。生体試料は、増幅ステップを行う前に生体試料中に含まれる核酸を取り除くよう処理してもよい。標的核酸は、検出されることが意図される任意の核酸であってもよい。検出される標的核酸は、少なくとも、生体試料の核酸にとって外因性である核酸であってもよい。したがって、生体試料がヒトに由来する場合、検出される外因性標的核酸(生体試料中に存在する場合)は、ヒト由来でない核酸である。本発明の態様によると、検出される標的核酸は、少なくとも、病原体ゲノムまたはその断片である。病原体核酸は、少なくとも、ウイルス、寄生生物、もしくは細菌由来の核酸、またはその断片であってもよい。
本発明の態様によると、標的核酸検出分析の方法が提供される。検出されることが所望される生体試料由来の標的核酸は、任意の標的核酸、RNAおよび/またはDNAであってもよい(例えば、mRNAおよび/またはcDNA)。より具体的には、検出される標的核酸は、病原体または非病原体であってもよい。例えば、少なくとも1つのウイルス、少なくとも1つの細菌および/または少なくとも1つの寄生生物のゲノムまたはその断片であってもよい。選択および/または調製されるプローブは、当業者に公知の任意の標準的な技術に従って支持体上に配置、塗布および/または固定されてもよい。支持体は、不溶性支持体、例えば固体支持体であってもよい(具体的には、マイクロアレイおよび/またはバイオチップ)。
特定の実施例によると、確立されたプロトコルおよび商業的キットを用いて、患者試料、例えば組織、血清、鼻咽頭洗浄液、便からRNAおよびDNAを抽出した。例えば、核酸抽出のためのQiagenキットを用いてもよい。あるいは、フェノール/クロロホルムもまた、DNAおよび/またはRNAの抽出のために用いてもよい。例えばSambrookおよびRussel,2001に記載されているような、当分野で公知の任意の技術を用いてもよい。Bohlander et al.,1992およびWang et al.,2003によって記載されたプロトコルに基づいて、タグを付けたランダムプライマーを用いてRNAをcDNAに逆転写した。次いで、ランダムPCRによってcDNAを増幅した。マイクロアレイへの試料の断片化、標識およびハイブリダイゼーションは、Wong et al.,2004によって記載されているように行った。
<マイクロアレイ合成>
実施例部分に記載されている特定の実験によると、本発明者らは、シンガポールにおけるウイルス疾患の最も一般的な原因を代表するいくつかのウイルスゲノムを選択した。Genbankからダウンロードした全ゲノム配列を使用して、ゲノム全体にわたってタイリングされたオーバーラップ5塩基の解像度の40塩基長のプローブを生成した。Nimblegen技術(Nuwaysir,E.F.et al.,2002)を用いて、各ウイルスプローブの7つの複製を、マイクロアレイ上に直接合成した。マイクロアレイ上でプローブをランダムに分配して、ハイブリダイゼーションのアーチファクトの効果を最小限にした。試料の、プローブへの非特異的ハイブリダイゼーションを制御するために、10,000のオリゴヌクレオチドプローブをマイクロアレイ上に設計および合成した。これらの10,000のオリゴヌクレオチドは、ヒトゲノムに対して、または病原性ゲノムに対していかなる配列類似性も有さなかった。これらは40〜60%のCG含有量を有するランダムプローブであった。これらのプローブは、バックグラウンドシグナル強度を評価した。陽性対照として、免疫応答において公知または推定される機能を有するヒト遺伝子に対する400のオリゴヌクレオチドプローブをアレイ上で合成した。合計およそ380,000のプローブについて、植物ウイルス、PMMVを陰性対照として含めた。以下の説明において、病原体検出チップ分析(PDCとも呼ばれる)に関連して、本発明が、より具体的に説明される。しかしながら、分析(方法)は、この特定の実施形態に限定されず、本出願の内容全体にわたって記載されるような本発明のいくつかの態様を包含する。
<標的核酸を検出する方法>
別の態様によると、本発明は、
(i)生体試料を提供するステップと、
(ii)生体試料中に含まれる核酸を増幅するステップと、
(iii)生体試料中に存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドプローブを提供するステップと、ここで、前記プローブが、本明細書に記載される本発明の任意の態様による方法を用いることによって調製され、
(iv)プローブを増幅された核酸と接触させ、少なくとも1つの標的核酸にハイブリダイズしたプローブを検出するステップと
を含む、少なくとも1つの標的核酸を検出する方法を提供する。
増幅ステップ(ii)は、ランダムな、部分的にランダムな(すなわち、固定された部分およびランダムな部分を含む)または特異的なプライマーの存在下で行ってもよい。具体的には、増幅ステップ(II)は、少なくとも1つのランダムプライマーの存在下で行ってもよい。より具体的には、少なくとも1つのランダムフォワードプライマーおよび/または少なくとも1つのランダムリバースプライマーの存在下で。例えば、増幅ステップ(ii)は、2つより多いランダムプライマーの存在下で行ってもよい。当分野で公知の任意の増幅方法を用いてもよい。例えば、増幅方法は、RT−PCRである。
具体的には、本発明者らは、増幅効率スコア(AES)に基づいて、標的核酸にハイブリダイズしたプローブを検出する方法を開発した。これは、本明細書で、本発明のアルゴリズムとも呼ばれる。具体的には、
Figure 2009504153
の標的核酸vaの各位置iについての増幅効率スコア(AESI)を有するプライマーの間で、位置iに結合しているフォワードランダムプライマーおよび標的核酸vaの位置jに結合しているリバースプライマーが選択され、式中、
Figure 2009504153
であり、Pf(i)およびPr(i)は、ランダムプライマーriが、それぞれフォワードプライマーおよびリバースプライマーとしてvaの位置iに結合することができる確率であり、10000bp以下であるZは、増幅されることが所望されるvaの領域である。より具体的には、Zは5000bp以下、1000bp以下、または500bp以下であってもよい。
増幅ステップは、フォワードおよびリバースプライマーを含んでもよく、フォワードおよびリバースプライマーのそれぞれは、5’−3’配向で、不変のプライマー頭部および可変のプライマー尾部を含んでもよく、少なくとも可変の尾部は、標的核酸vaの一部にハイブリダイズする。具体的には、増幅ステップは、配列番号1〜7のいずれかのヌクレオチド配列、またはそのバリアントもしくは誘導体を有するフォワードおよび/またはリバースランダムプライマーを含んでもよい。
生体試料は、哺乳動物、例えばヒトから採取された任意の試料であってもよい。生体試料は、組織、血清、鼻咽頭洗浄液、唾液、任意の他の体液、血液、尿、便等であってもよい。増幅ステップを行う前に、生体試料を処置して、生体試料中に含まれる核酸を取り除いてもよい。標的核酸は、検出されることが意図される任意の核酸であってもよい。検出される標的核酸は、少なくとも、生体試料の核酸にとって外因性である核酸であってもよい。したがって、生体試料がヒト由来である場合、検出される外因性標的核酸(生体試料中に存在する場合)は、ヒト由来でない核酸である。
本発明の態様によると、検出される標的核酸は、少なくとも、病原体ゲノムまたはその断片である。病原体核酸は、少なくとも、ウイルス、寄生生物、もしくは細菌由来の核酸、またはその断片であってもよい。
したがって、本発明は、少なくとも、生体試料中に存在する場合、標的核酸の検出の方法を提供する。方法は、生体試料中の病原体の存在の検出のための診断方法であってもよい。例えば、生体試料がヒトから得られる場合、標的核酸は、生体試料中に存在する場合、ヒト由来でない。
本発明の任意の方法に従って設計および/または調製されたプローブは、溶液中で用いてもよく、または、不溶性支持体上に配置してもよい。例えば、当分野で公知の任意の技術に従って不溶性支持体上に、塗布するか、スポットするか、または印刷してもよい。プローブを塗布された支持体は、固体支持体またはゲルであってもよい。具体的には、マイクロアレイまたはバイオチップであってもよい。
次いで、プローブを生体試料の核酸に接触させ、存在する場合、標的核酸とプローブがハイブリダイズし、標的核酸の存在が検出される。具体的には、検出ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値は、vaに含まれないプローブの平均値よりも統計的に高く、それによって、生体試料中のvaの存在が示される。
より具体的には、検出ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値は、vaに含まれないプローブの平均値よりも統計的に高いことを特徴とし、本方法は、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含む方法であって、プローブvaのシグナル強度の密度分布は、vaに含まれないプローブのものよりも正に歪んでおり、それによって、生体試料中のvaの存在が示される方法である。
例えば、検出ステップ(iv)において、生体試料中の標的核酸の存在は、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0以上、好ましくは5.0以上の重み付きカルバック・ライブラー情報量の値によって示される。具体的には、t検定値は0.05以下である。
別の態様によると、本発明は、標的核酸vaへのプローブのハイブリダイゼーションを検出することを含む標的核酸vaの存在を判定する方法を提供し、vaにハイブリダイズするプローブのシグナル強度の平均値は、vaに含まれないプローブの平均値よりも統計的に高く、それによって、vaの存在が示される。具体的には、vaにハイブリダイズするプローブのシグナル強度の平均値は、vaに含まれないプローブの平均値よりも統計的に高いことを特徴とし、本方法は、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含む方法であって、プローブvaのシグナル強度の密度分布は、vaに含まれないプローブのものよりも正に歪んでおり、それによって、vaの存在が示される方法である。より具体的には、生体試料中の標的核酸の存在は、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0以上、好ましくは5.0以上の重み付きカルバック・ライブラー情報量の値によって示される。例えば、t検定値は、0.05以下であってもよい。
別の態様によると、本発明は、
(i)少なくとも1つの生体試料を提供するステップと、
(ii)生体試料中に含まれる核酸を増幅するステップと、
(iii)生体試料中に存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドプローブを提供するステップと、
(iv)プローブを増幅された核酸と接触させ、標的核酸にハイブリダイズしたプローブを検出するステップと、ここで、vaにハイブリダイズするプローブのシグナル強度の平均値が、vaに含まれないプローブの平均値よりも統計的に高く、それによって生体試料中のvaの存在が示されるステップと
を含む、少なくとも1つの標的核酸を検出する方法を提供する。
ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値は、vaに含まれないプローブの平均値よりも統計的に高いことを特徴とし、本方法は、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含む方法であって、プローブvaのシグナル強度の密度分布は、vaに含まれないプローブのものよりも正に歪んでおり、それによって、生体試料中のvaの存在が示される方法である。具体的には、ステップ(iv)において、生体試料中の標的核酸の存在は、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0以上、好ましくは5.0以上の重み付きカルバック・ライブラー情報量の値によって示される。t検定値は0.05以下であってもよい。検出される核酸は、生体試料の核酸にとって外因性の核酸である。検出される標的核酸は、少なくとも、病原体ゲノムまたはその断片であってもよい。病原体核酸は、少なくとも、ウイルス、寄生生物、もしくは細菌由来の核酸、またはその断片であってもよい。具体的には、試料がヒトから得られる場合、標的核酸は、生体試料中に存在する場合、ヒトゲノム由来でない。プローブは、不溶性支持体上に配置してもよい。支持体は、マイクロアレイまたはバイオチップであってもよい。
<RSV−Bの鋳型配列を用いた試験>
ウイルスの異なる領域によって提示されるシグナル強度の変動がそれらの対応する増幅効率スコアと直接的な相関を有するかどうかを検証するために、ヒトに影響を及ぼす一般的な病原体、ヒト呼吸器多核体ウイルスB(RSV−B)に関して、合計5つのマイクロアレイ実験を行った。
次に、NCBIから得られたRSV−Bの鋳型配列(NC_001781)に、上述のようなプローブ設計基準を適用した。これは、各マイクロアレイ上に斑点をつけられた1948のプローブが得られた。RSV−Bについての増幅効率マップもまた、実際の実験の前に計算し、図2に示す。この図は、平均AESよりも高いAESを有するピークを示し、より高い増幅の確率を有するRSV−Bの領域が示される。
ヒト呼吸器多核体ウイルスB(RSV−B)を含む5つの試料を用いて、独立したマイクロアレイ実験を行った。1つのこのような実験についての得られたシグナル強度を、図3に示す。
各実験について、1948のプローブのシグナル強度を、減少順で順位付けし、それらの対応するAES値と関連付けた。p値は、平均で2.2e-16未満であるとわかった。これは、RSV−Bの位置iのプローブのシグナル強度とAESiとの間の相関が全くランダムでないことを示す。さらなる調査によって、5つ全ての実験において一貫して高いシグナル強度を生じる約300のプローブが、90パーセンタイルレベルで増幅効率スコアを有することが明らかになった。
説明された増幅効率モデルはRSV−Bゲノムに関して功を奏することを示してきたが、本発明の方法が他のウイルスゲノムにも拡張することができることを示すことが望まれた。ヒトメタニューモウイルス(HMPV)に関して、別のマイクロアレイ実験を行った。今回は、マイクロアレイ上に1705のプローブがあった。ここでも、HMPVについての増幅効率マップを計算した。この実験において、シグナル強度と増幅効率スコアとの間の相関試験によって、1.335e-9のp値が示された。
したがって、本発明の増幅効率モデルは、説明された実験設定において、ウイルスゲノムの異なる領域によって生成されたシグナルの相対的強度を予測することができる。低い増幅効率スコアを有する領域由来のプローブは、シグナル強度を生じないか、または低いシグナル強度を生じる傾向が高い。これは、マイクロアレイ上で偽陰性を生じる。このようなプローブは、マイクロアレイデータの分析を複雑にし、これは、低いシグナル強度を有するプローブはその標的ゲノムが存在しないか、または単に増幅されなかったためである場合があるので、これがさらに複雑になる。そのようなものとして、適度に高い増幅効率スコアを有する領域におけるプローブを選択して、ランダムプライマーを用いたRT−PCRプロセスによって引き起こされる不正確性を最小限にするべきである。
ウイルスvaのプローブ選択のための増幅効率スコアの閾値は、AES値vaの累積分布関数によって判定される。Xを、全てのプローブvaのAES値を表す確率変数とする。kを、vaにおけるプローブの数とする。次いで、本発明者らは、AES値がx以下である確率を、P(X≦x)=c/kとし、式中cは、x以下であるAES値を有するプローブの数である。vaの位置iのプローブpiについて、xiを、その対応するAES値とする。プローブのシグナル強度はそのAES値と高度に相関があるので、本発明者らは、vaの存在下でpiが高いシグナル強度を有する確率であるP(pi|va)を、P(X≦xi)であると推定した。したがって、
Figure 2009504153
であり、式中ciは、AES値がxi以下であるプローブの数である。
プローブ選択のために、P(pi|va)>λの場合に、プローブpiが選択される。本実験において、λはλ=0.8として設定される。
したがって、本発明はまた、プローブ設計および/または標的核酸検出の方法を提供し、P(pi|va)>λの場合、標的核酸vaの位置iのプローブpiが選択され、式中、λは0.75であり、P(pi|va)は、piがvaの存在下で高いシグナル強度を有する確率である。より具体的には、
Figure 2009504153
であり、式中Xは、vaの全てのプローブの増幅効率スコア(AES)値を表す確率変数であり、kはvaにおけるプローブの数であり、ciは、xi以下であるAES値を有するプローブの数である。
<標的核酸検出分析>
以下の説明において、病原体検出チップ分析(PDCとも呼ばれる)に関連して、本発明をより具体的に説明する。しかしながら、分析(方法)は、この特定の実施形態に限定されず、本出願の内容全体にわたって記載されるような、本発明のいくつかの態様を包含する。したがって、具体的には、ウイルスゲノムのセットV={v1,v2,・・・,vn}のために設計される長さmのプローブのセットP={p1,P2,・・・,pI}を有するPDC仮定すると、病原体検出チップ分析の問題は、チップデータに基づいて試料中に存在するウイルスを検出することである。本明細書で、チップデータは、PDC上のプローブシグナルによって提供される集合的な情報をいう。したがって、チップデータD={d1,d2,・・・,dx}は、PDC上のプローブセットPの対応するシグナルのセットである。
試料を考慮すると、存在する場合、試料中に何の病原体が存在するか、いくつの異なる病原体が存在するのかは、全く不明である。しかしながら、ウイルスvaが実際に試料中にある場合、vaのプローブのシグナル強度は、他のウイルス由来のプローブのシグナル強度と有意に異なるべきである。特に、他のウイルスと比較してvaのより高い割合のプローブが、高いシグナル強度を有するべきである。したがって、vaにおけるプローブのシグナル強度の平均値が、vaに含まれないプローブのものよりも統計的に高いべきであると期待される。
したがって、本発明は、vaにハイブリダイズするプローブのシグナル強度の平均値がvaに含まれないプローブの平均値よりも統計的に高く、これが生体試料中のvaの存在を示す方法を提供する。
しかしながら、統計的により高い平均値を有することは、試料中にvaが存在すると結論付けるには、依然として不十分である場合がある。好ましくは、さらなるステップが必要とされる場合がある。本発明者らは、高いシグナル強度を有するPDC上のプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算する必要がある。これは、vaに含まれるプローブのシグナル強度の分布が、vaに含まれないプローブのものよりも正に歪んでいるという観察に基づく(図4Aの矢印参照。比較のために、図4B参照)。
上述の観察に基づいて、ウイルスの存在に関するチップデータDを、以下のように分析した。各ウイルスva∈Vについて、本発明者らは、片側t検定(Goulden,C.H.,1956)を用いて、vaに含まれるプローブのシグナル強度の平均値が、vaに含まれないプローブのシグナル強度のものよりも統計的に高いかどうかを判定した。したがって、t統計を計算した:
Figure 2009504153
式中、μa、σa 2およびnaは、それぞれvaに含まれるプローブのシグナル強度の、平均値、分散、およびサイズであり、μa'、σa' 2およびna'は、それぞれvaに含まれないプローブのシグナル強度の平均値、分散、およびサイズである。
差異の有意性を試験するために、有意性のレベルを0.05に設定した。これは、vaに含まれるプローブのシグナル強度の平均値がvaに含まれないプローブのシグナル強度のものよりも高いという仮説が、taのp値が0.05未満である場合にのみ許容されることを意味する。この場合、vaは、試料中に存在する見込みがある。
ウイルスのシグナル強度の分布が他のウイルスのものと異なるかどうかを本発明者らが知ることができるt検定のみでは、特定のウイルスが試料中にあるかどうかを判定するのに十分でない。2つの分布がどれだけ類似または相違しているかを知ることも必須である。真の分布とモデル分布との間の類似性を測定するのに用いることができる尺度は、カルバック・ライブラー情報量(Kullback and Leiber,1951)(相対エントロピーとしても公知)である。この適用において、vaにおけるプローブのシグナル強度の確率分布は真の分布であるが、Pにおける全てのプローブのシグナル強度の確率分布はモデル分布である。Paをvaにおけるプローブのセットとする。PaおよびPのシグナル強度の確率分布のカルバック・ライブラー(KL)情報量は、
Figure 2009504153
であり、式中、μはPにおけるプローブの平均シグナル強度であり、fa(x)はシグナル強度xのPaにおけるプローブの比率であり、f(x)はシグナル強度xのPにおけるプローブの比率である。したがって、KL(Pa‖P)=0の場合、Paの確率分布は、Pのものとちょうど同じということになる。そうでなければ、それらは異なる。
試料中に存在するウイルスは、母集団のものよりも高いシグナル強度を有するので、これは、KL(Pa‖P)>0の場合にvaが試料中に存在する確率を有することを含意する。したがって、KL(Pa‖P)の値が大きいほど、2つの確率分布はより異なり、vaが実際に試料中に存在する見込みが高くなる。
2つの確率分布の全てのxにわたるカルバック・ライブラー情報量が集合的な差異であることに留意することが重要である。したがって、カルバック・ライブラー情報量は確率分布の変化を見出すのには優れているが、拡散を見出すのには常にそれほど優れているわけではなく、これは確率分布の尾部に、より影響を及ぼす。図4(A、B)に説明されているように、確率分布の尾部は、ウイルスが試料中に存在するかどうかについてのほとんどの情報を提供する。したがって、カルバック・ライブラー情報量統計は、このような観察をより正確に反映するように改良されなければならない。
その感度を尾部の外に増大させるために、本発明者らは、カルバック・ライブラー情報量に安定化および重み付きされた統計、アンダーソン・ダーリン統計を導入した(Stephens,M.A.(1974).EDF Statistics for Goodness of Fit and Some Comparisons,Journal of the American Statistical Association,Vol 69,pp.730−737)。したがって、重み付きカルバック・ライブラー情報量(WKL)は、
Figure 2009504153
であり、式中、Q(x)は、Pにおけるプローブのシグナル強度の累積分布関数である。
経験的試験から、ウイルスがない試料中で、0.05の有意性レベルでt検定を通過するウイルスが5.0未満のWKLを有することが示される。実際にウイルスが存在する試料中で、実際のウイルスは、0.05の有意性レベルでt検定を通過するだけでなく、5.0以上のWKLを有する唯一のウイルスである。したがって、本発明者らは、試料中に存在するウイルスについての重み付きカルバック・ライブラー情報量閾値を、5.0に設定した。この解析フレームワークを図5に示す。
<本発明の方法を行う装置および/または製品>
本発明において提供されるアルゴリズムおよび/または方法を行うことできるソフトウエアをどのようにして構成するかは、当業者に周知である。したがって、本発明はまた、本発明の任意の実施形態によるアルゴリズムおよび/または方法を行うよう構成されたソフトウエアおよび/またはコンピュータプログラム製品も提供する。少なくとも1つの電子記憶媒体もまた提供される。電子記憶媒体は、コンピュータハードドライブ、CD−ROM、フラッシュメモリー素子(例えば、USBメモリ)、フロッピー(登録商標)ディスク、または当分野の任意の他の電子記憶媒体であってもよい。ソフトウエアは、パソコン、メインフレーム、および任意の計算処理装置上で実行されてもよく、具体的な構成は、当業者に公知である。
本発明が例によってのみ説明されてきたこと、ならびに本発明の精神および範囲から逸脱することなく設計における種々の変更を行ってもよいことは、当業者に理解される。
ここで、本発明を一般的に説明してきたが、例示によって提供され、本発明を限定することを意図されない、以下の実施例を参照して、より容易にこれが理解される。
当分野で公知で、具体的に説明されていない標準的な分子生物学技術は、一般に、Sambrook and Russel,Molecular Cloning:A Laboratory Manual,Cold Springs Harbor Laboratory,New York(2001)に記載されているように従った。
<マイクロアレイ合成>
本発明者らは、シンガポールにおけるウイルス疾患の最も一般的な原因を代表する35のウイルスゲノムを選択した(上記の表1参照)。
NCBI生物分類データベース(http://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html/)から全ゲノム配列をダウンロードして、ゲノム全体にわたってタイリングされたオーバーラップ平均8塩基の解像度の40塩基長のプローブ配列を生成した。Nimblegen専売特許の技術(Nuwaysir et al.,2002)を用いて、マイクロアレイ上に直接、各ウイルスプローブの7つの複製を合成した。マイクロアレイ上にプローブをランダムに分布させて、ハイブリダイゼーションアーチファクトを最小限にした。プローブへの試料の非特異的ハイブリダイゼーションを制御するため、およびバックグラウンドシグナルを測定するために、マイクロアレイ上に10,000のオリゴヌクレオチドプローブを設計および合成した。それらはヒトゲノムまたは病原体ゲノムに対する配列類似性がなく、40〜60%のGC含有量を有するランダムプローブである。陽性対照として、免疫応答において公知または推測される機能を有するヒト遺伝子に対する400のオリゴヌクレオチドプローブを、アレイ上で合成した。植物ウイルス、PMMVを、合計390,482のプローブで陰性対照として含めた。
<試料調製、マイクロアレイハイブリダイゼーションおよび染色>
デング熱細胞系(ATCC #VR−1254)をATCC推奨のように培養し、Sin850 SARS細胞系を記載されているように(Vega et al.,2004)培養した。臨床材料(鼻咽頭洗浄液)を、インドネシアの小児科集団から得て、RNAゾル(Leedo Medical Laboratories,Inc.,Friendswood,TX)中、−80℃で保存した。全ては特定の呼吸器疾患の臨床兆候を示す、肺炎の疑いのある7〜38月齢の間の患者であった。製造業者の使用説明書に従って(Smalling et al.,2002;Tang et al.,1999)、RNAゾルでRNAを抽出した。抽出されたRNAを、RNA保存溶液(Ambion、米国)に再懸濁し、必要になるまで−80℃で保存した。Bohlander et al.and Wang et al.(Wang et al.,2002;Bohlander et al.,1992)によって記載されたプロトコルに基づいて、タグを付けられたランダムプライマーを用いてRNAをcDNAに逆転写した。次いでこれまでに記載されているように(Wong et al.,2002)、cDNAをランダムPCRによって増幅し、断片化し、ビオチン標識で末端標識し、マイクロアレイ上にハイブリダイズさせ、染色した。本発明者らの最初の実験において本発明者らは、プローブGC含有量によって、シグナル強度がプローブGC含有量に正比例して増加する、シグナル強度測定におけるアーチファクトが生じる可能性があることを見出した。0.82MのTMACをNimblegenの専売特許のTMACハイブリダイゼーションバッファーに加えることによって、このアーチファクトが排除された。
<RSVおよびhMPVについてのリアルタイム診断用RT−PCR>
2μlの精製された患者RNA、5UのMuLV逆転写酵素、8Uの組換えRNアーゼ阻害剤、UNGを含まない10μlの2XユニバーサルPCRマスターミックス(全てApplied Biosystemsから)、0.9μMのプライマーおよび0.2μMのプローブを含有する20μlの反応混合物。ABI Prism 7900HT配列検出システム(Applied Biosystems)において、リアルタイムRT−PCR反応を行った。48℃で30分間RTを行い、続いてDNAポリメラーゼの活性化のために95℃で10分間行った。95℃で15秒間および60℃で1分間の40サイクルによってRT産物の増幅を行った。陰性対照およびプラスミドクローンの段階希釈(陽性対照)を各PCRアッセイに含んだ。増幅の間、各熱サイクルで蛍光発光をモニタリングした。閾値(CT)は、有意な蛍光が最初に検出されるサイクルを表す。既知の濃度の対照プラスミドを用いることによって、CT値をコピー数に変換した。RSVについては、2.61×109コピーが11.897のCT値を有したが、hMPVについては、7.51×109コピーが10.51のCT値を有した。
<コロナウイルスおよびライノウイルスについての一段階診断用RT−PCR>
陽性対照としての使用のために、ヒトコロナウイルスOC43、229Eおよびライノウイルス16の凍結した生きた培養物を、ATCC(Cat# VR−1558,VR−740,VR−283)から購入した。製造業者の使用説明書に従ってRNAミニキット(Qiagen,Germany)を用いて、これらの培養物からRNAを抽出した。以下の診断用プライマー対:パンコロナウイルス(Cor−FW,Cor−RV)、OC43(OC43−FW,OC43−RV)、229E(229E−FW,229E−RV)、ライノウイルス(アンプリマー1,アンプリマー2)を用いて、これまでに記載されているように試料を増幅した(Moes et al.,2005;Deffernez et al.,2004)。
<病原体マイクロアレイデータの分析>
本発明者らの病原体マイクロアレイは、35のウイルスゲノムV={v1,v2,・・・,v35}について異なるプローブハイブリダイゼーションサインに分けられた、40塩基長のプローブのセットP={p1,p2,・・・,ps}を含有する。病原体核酸のハイブリダイゼーションの際に、プローブセットPに対応するプローブシグナル強度データのセットD={d1,d2,・・・,ds}が生じる。
<片側T検定>
ウイルスvaが存在する場合、次いでそのハイブリダイゼーションサインを含むプローブ(vaに含まれるプローブ)は、t統計(片側T検定)によって判定すると、vaに含まれないプローブよりも統計的に高いシグナル強度を有するべきである。
Figure 2009504153
式中、μa、σa 2およびnaは、それぞれvaに含まれるプローブのシグナル強度の平均値、分散、およびサイズであり、μa'、sa' 2およびna'はそれぞれvaに含まれないプローブのシグナル強度の平均値、分散、およびサイズである。
有意性のレベルを0.05に設定した。これは、vaに含まれるプローブのシグナル強度の平均値がvaに含まれないプローブのシグナル強度のものよりも高いという仮説を、taのp値が0.05未満である場合にのみ許容することを意味する。この場合vaは、試料中に存在する見込みがある。しかしながらT検定の検出の方法は、多くの偽陽性信号を生じる。
<PDA v.1>
PDA v.1は、重み付きカルバック・ライブラー検定およびZスコア変換(WKLスコア)で始まり、正規性についてのアンダーソン・ダーリン検定が続く、一連の統計試験を含む。
ウイルスvaを考慮する。Paをウイルスvaのプローブのセットとし、
Figure 2009504153
である。[rlow,rhigh]をシグナル強度範囲とする。本発明者らはこれを、j=0,1,・・・,c−1についてのc個の瓶
Figure 2009504153
に分割した。修正されていないカルバック・ライブラー情報量は、
Figure 2009504153
によって計算してもよく、式中na jおよび
Figure 2009504153
は、それぞれ瓶bjに含有されるPaにおけるプローブおよび
Figure 2009504153
におけるプローブの数である。
Figure 2009504153
は、瓶bjに見られるPaにおけるプローブの比率であり、
Figure 2009504153
は、瓶bjに見られる
Figure 2009504153
におけるプローブの比率である。
確率分布の尾部のシグナル差異を比較するために、本発明者らは、
Figure 2009504153
Figure 2009504153
におけるプローブの平均シグナル強度、およびrhigh=最大シグナル強度に設定した。本発明者らは、瓶のデフォルト数をc=20に設定した。
確率分布の尾部でのカルバック・ライブラー情報量の感度をさらに安定化および/または増大させるために、2つの修正を行った。まず本発明者らは、アンダーソン・ダーリン型重み付き関数をカルバック・ライブラー情報量に導入した。これによって分布の中央部よりも尾部に、より多くの重み付けが生じた。次いで本発明者らは、それらの確率密度関数の代わりに、2つの対応する累積分布関数に統計を適用した。本発明者らは、本発明者らの改善されたカルバック・ライブラー情報量を重み付きカルバック・ライブラー情報量(WKLスコア)と呼ぶ。
Figure 2009504153
式中、Qa(j)は、瓶bjに見られるPaにおけるプローブのシグナル強度の累積分布関数であり;
Figure 2009504153
は、瓶bjに見られる
Figure 2009504153
におけるプローブのシグナル強度の累積分布関数である。
したがってハイブリダイズした各試料については、本発明者らはVに含まれる各ウイルスvaのWKLスコアを計算した。次に本発明者らは、Vに含まれる全てのウイルスvaのWKLスコアの分布が試料中にウイルスが存在しない場合、およそ正規であることを主張した。本発明者らはブートストラッププロセスによって、本発明者らの主張が正しいかどうかを経験的に検証した:nをVにおけるウイルスの数とする。k=1,・・・,nである、Vに含まれる各ウイルスvkについて本発明者らは、置換によってvkの「乱された」シグナル強度分布を形成して、実際のデータセットDからランダムに|vk|プローブシグナル強度を選択した。このような分布はvkが試料D中に存在しない状況を模倣することができる。その後n個のウイルスのセットについて、n個のWKLスコアが生じる。次に本発明者らは、95%信頼区間での正規性についてのアンダーソン・ダーリン検定によって、n個のWKLスコアが正規分布に従うかどうかを調べた。ブートストラップを100,000回繰り返した。分布は99%を超える回で正規であることがわかった。(NB:本発明者らのマイクロアレイ上に示される35のウイルスゲノムがあったので、n=35)
上述の議論に基づいて本発明者らは、以下の帰無仮説および対立仮説を作成することによって、試料がウイルスを含有するかどうかを試験することができる。
0:WKLスコアの分布は正規であり、すなわちウイルスは試料中に存在しない。
1:WKLスコアの分布は正規でなく、すなわち少なくとも1つのウイルスが試料中に存在する。
<定義>
アンダーソン・ダーリン検定は、
0:データは特定分布に従う。
a:データは特定分布に従わない。
検定統計:アンダーソン・ダーリン検定統計は、
2=−N−S
として定義され、
式中、
Figure 2009504153
であり、Fは特定分布の累積分布関数である。Y1が順序付けられたデータであることに留意されたい。
有意性レベル:α
臨界領域:アンダーソン・ダーリン検定についての臨界値は、試験されている特定分布に依存する。いくつかの特定分布(正規、対数正規、指数関数、ワイブル、ロジスティック、極値分布1型)についての表集計値および式は、公開されている(Stephens,1974,1976,1977,1979)。検定は片側検定であり、分布が特定の形態であるという仮説は、検定統計Aが臨界値よりも大きい場合に拒絶される。
として定義される。
本発明者らは、WKLスコアの分布に関する正規性についてのアンダーソン・ダーリン検定の適用を進め、95%の信頼区間を有するH0を拒絶する。WKLスコアの分布が正規でない場合本発明者らは、次いで範囲外のWKLスコアを有するウイルスを排除し、再びアンダーソン・ダーリン検定を適用する。H0が許容されるまでこのプロセスを繰り返す(重感染している病原体の存在を同定するため)。
本発明者らはH0がバックグラウンドWKL分布として許容される場合に、WKLスコアの分布を表示する。したがって排除されたウイルスは、それらのWKLスコアがバックグラウンドWKL分布に従わないので、試料中に存在する可能性が非常に高い。
本発明者らの実験において本発明者らは、ウイルスを含有する試料中で、所与のWKLスコアで非正規分布が偶然によって起こる可能性であるPが非常に低い、すなわちP<1.0×10-6であることを観察した(WKLスコアのZスコア変換によって得られる)。本発明者らのウイルス検出アルゴリズムについての擬似コードを以下に示す。
<ウイルス検出アルゴリズム>
ウイルスセットVおよびプローブセットPを有する病原体マイクロアレイデータDを仮定し、
present=Fとし、
Vに含まれる全てのvについて、DWKL
Figure 2009504153
のセットとし、
1.正規性についてのアンダーソン・ダーリン検定でDWKLの正規性を判定する。DWKLが有意性レベル0.05の正規分布である場合、Vpresentを返す。そうでなければステップ2に進む。
2.最も高いWKL(Pa‖Pa')を有するウイルスvaをDWKLから見つける。
present=Vpresent∪{va};DWKL=DWKL−{WKL(Pa‖Pa')}とする;ステップ1に進む。
3.検出されたSPSを除去し、WKL分布が正規であることを検証する。
4.分布が正規でない場合、ステップ2に戻って重感染している病原体を見つける。
<ゲノム規模での増幅バイアスの予測>
臨床材料中の未知の病原体を同定するためには、プライマー特異的増幅よりもランダムプライマー増幅が好ましい。しかしながら、既知の病原体を同定するためのランダムプライミング増幅を用いた最初の実験において本発明者らは、しばしば配列多型によって説明されない、ゲノム領域に渡る不完全なハイブリダイゼーションを観察した(図7C)。ゲノム二次構造、プローブ二次構造およびプローブGC含有量もまた、これらの低シグナル強度プローブを説明することができなかった。したがって本発明者らは、不完全なハイブリダイゼーションが、ランダムプライマーが逆転写(RT)ステップでウイルスゲノムに結合する能力の差異から生じるPCRバイアスによるかもしれないという仮説を立てた。本発明者らの実験において使用されるランダムプライマーは、固定された17塩基長の配列(5’−GTTTCCCAGTCACGATA)(配列番号1)でタグを付けられたランダムノナマー(3’)で構成される26塩基長であり(図1も参照)、ここで固定された5’タグの目的は、RT産物のPCRを容易にして、10000bp未満のPCR断片、具体的には500〜1000bpのPCR断片を生じることであった(Pang et al.,2005;Wang et al.,2002;Wang et al.,2003)。この現象を研究するために本発明者らは、アルゴリズム(AES)を設計して実験データを用いてRT−PCRプロセスをモデリングした。成功するRT−PCRはプライマーが鋳型に結合する能力に依存する。鋳型との間の二量体およびヘアピン形成等のプライマー内二次構造形成。タグとノナマーとの間の二量体およびヘアピン形成等のプライマー内二次構造形成、ならびにプローブ融解温度は、結合効率に影響を及ぼすことが公知である(Nguyen and Southern,2000;Ratushna et al.,2005)。
ランダムプライマーミックス中のノナマーがウイルスゲノムの配列を完璧に補完すると仮定して、アルゴリズムは500〜1000bpの産物が、ゲノム中の可能性のある各開始位置から生じることができる確率を判定する。したがって1000塩基のスライディングウインドウの各ヌクレオチドについて、これがうまく増幅される確率は、その増幅効率スコア(AES;上述の増幅効率スコア参照)に反映される。アルゴリズムを検証するために本発明者らは、ハイブリダイゼーションシグナル強度をRSVゲノムについての全1,948のSPSプローブについて順位付けし、それらをそれらのAES値と比較した。RSVゲノム全体で本発明者らは、AESがハイブリダイゼーションシグナル強度と極めて関連していることを観察し(Fisherの直接確率法P=2.2×10-16)、AESとプローブ検出との間の強い相関が示された(図12)。メタニューモウイルスについての1,705のSPSプローブを用いた別の比較から類似した結果、P=1.3×10-9が示された。臨床試料中のSPSプローブ検出の予測におけるAESの重要性を図10に示す。とりわけ本発明者らは、AESのより高い値が特に上位20%のAES値において、より大きい割合の検出可能なプローブと相関していたことを観察した。したがってHD、MCM、%GCおよび配列独自性は、プローブ性能の有益なパラメータであるが、それらはPCRバイアスを考慮せず、したがってAESなしで考えた場合、プローブ性能の不十分な予測の判断材料である。病原体SPSの選択における第一のフィルターとしての上位20パーセンタイルのAESを用いることによって、より高いWKLスコアおよび偽陽性信号の排除によって明らかなように病原体予測が有意に向上した(表3)。
Figure 2009504153
アレイ上でハイブリダイズした全ての患者試料についてのデータを、下記の表4に示す。
Figure 2009504153
Figure 2009504153
*LRTI:下気道感染
AESの重要性から、最適化されたRT−PCRプライマータグを用いることによって、増幅効率およびそれに続くプローブ検出が向上することができることが示唆された。したがって本発明者らは、ランダムに生じた17塩基長のタグ配列を用いてAESスコアを計算し、最も大きいAESスコアの全体的増大を生じる上位3つの最も相違するプライマーを選択した(図13)。AES最適化プライマーを用いて本発明者らは、向上したPCR効率および検出感度で、臨床試料由来のメタニューモウイルスおよびRSVを増幅した(図14、表5)。
Figure 2009504153
<PDA v.1−病原体を検出するためのアルゴリズム>
臨床材料はしばしば、ゲノム増幅のために準最適である。それらは低いウイルス価を有するか、アレイ上の参考菌株由来の配列多型を有するか、または重感染している病原体を有する場合がある。マイクロアレイはまた、非特異的ハイブリダイゼーションおよび他のアーチファクト由来の内部雑音を有する。したがってマイクロアレイデータを解釈することは、プローブシグナル強度プロフィールをSPSに適合させるか、または単純な統計的手法(例えば、T検定、ANOVA等)を用いる簡単な問題ではない。この問題を扱うために本発明者らは、コンピュータ内で予測されるSPSと関連してプローブシグナル強度の分布を分析して、ハイブリダイズした試料中に存在する病原体を同定する、ロバスト統計ソフトウエア、PDA v.1を確立した(上記参照)。
アレイ上の全てのプローブについてのシグナル強度は正規分布に分類されるが、試料中に存在する病原体SPSを含むプローブの大部分は右に歪んだ分布を生じる非常に強力なシグナル強度を有するという本発明者らの観察に基づいて、本発明者らは、プローブシグナル強度の分布を分析することによって、病原体の存在を検出することができると推測した(図9A)。各SPSについてシグナル強度分布の尾部を調べることによっても、試料中で重感染している病原体の存在を同定することが可能になる。
したがって、PDA v.1は、2つの部分を含む。(1)各病原体SPSにおけるプローブのプローブシグナル強度を評価するための重み付きカルバック・ライブラー情報量(WKL;本発明者らの、改良されたカルバック・ライブラー検定)、および(2)各SPSについてのWKLスコアの分布が正規であるかどうかを判定するためのアンダーソン・ダーリン検定。
元々のカルバック・ライブラーは確率分布の尾部の差異を確実に判定することができず、プローブ/ゲノムの数および各シグナル強度瓶のサイズに高度に依存している(Kullback and Leibler,1951)。本発明者らはアンダーソン・ダーリン統計を組み込んで、各分布の尾部により多くの重みを与えることによって、および元々の確率分布の代わりに累積分布関数を用いることによって、これらの欠点を克服した(Anderson and Darling,1952)。本発明者らは本発明者らの改良されたKL情報量を、重み付きカルバック・ライブラー情報量(WKL)と呼ぶ。
Figure 2009504153
式中、Qa(j)は、瓶bjに見られるPaにおけるプローブのシグナル強度の累積分布関数であり;
Figure 2009504153
は、瓶bjに見られる
Figure 2009504153
におけるプローブのシグナル強度の累積分布関数である。病原体の非存在を表すSPSは、正規のシグナル強度分布、および従って比較的低いWKLスコアを有するべきであるが、病原体の存在を表すものは高い、統計的に有意な、範囲外のWKLスコアを有するべきである(図9B)。PDA v.1の第二の部分において、WKLスコアの分布を、正規性についてのアンダーソン・ダーリン検定に供する。P<0.05の場合WKL分布は、正規でないと見なされ、範囲外のWKLスコアを有する病原体が存在することが含意される。病原体の同定の際に、そのWKLスコアなしで別々のアンダーソン・ダーリン検定を行って、重感染している病原体の存在について試験する。このようにして正規分布だけが残るまで(すなわち、P>0.05;上記の表3および表4参照)、手順を反復して適用する。PDA v.1は非常に速く、ハイブリダイズしたマイクロアレイから約10秒で診断を行うことができる。
<33の臨床患者試料に関する病原体診断>
本発明者らは図11に示されるワークフローに従って、33の臨床材料を本発明者らの病原体マイクロアレイ基盤にハイブリダイズすることによって、本発明者らの基盤を評価した。これらのうち27の標本は、予めRSV A、RSV−Bまたはメタニューモウイルスと診断されていた。本発明者らの基盤は21/27の試料から病原体を正確に検出した。ウイルスが検出されなかった6つの試料(偽陰性)は、リアルタイムPCRによる検出限界(<10ウイルスコピー/反応)であり、このような低いウイルス量は患者の深刻な疾患に関与する病原因子である可能性は低かった。これらのうち2つは、マイクロアレイによってライノウイルスに感染していると正しく診断された。未知の病原体によって引き起こされた深刻な呼吸器疾患を有する別の6人の患者のスクリーニングにおいて、マイクロアレイは試料のうちの1つにおいて、病原因子(ライノウイルス)を同定した(上記の表4)。リアルタイムPCRによってこれらの結果を検証した。期待されたように本発明者らは、非ウイルス性病因を有する肺炎患者から抽出された試料をハイブリダイズさせた場合、いかなる病原体も検出しなかった。
<データ解析>
Axon 4000bスキャナーおよびGenepix 4ソフトウエア(Axon Instruments)を用いて、5μm分解能でマイクロアレイをスキャンした。Nimblescan 2.1ソフトウエア(NimbleGen Systems)を用いてシグナル強度を抽出した。自動化スクリプトを使用して本発明者らは、各プローブの7つの複製からメジアンシグナル強度(ハイブリダイゼーションアーチファクトを排除するため)および標準偏差を計算した。プローブシグナル強度をゲノムによって分類し、配列順に配置し、次いでJava(登録商標) Treeview(http://jtreeview.sourceforge.net)でシグナル強度を図式的に見るために、CDT形式に再フォーマットした。並行してPDA v.1を用いてプローブメジアンシグナル強度を分析して、どの病原体が存在するか、および関連する予測の信頼水準を判定した。本発明者らは実験を行って、実験結果に対するプローブ設計の効果を示し、次いで本発明による分析アルゴリズムのロバスト性を示した。
<実験結果に対するプローブ設計の効果>
ヒトに影響を及ぼす35のウイルス由来の53555の40塩基長のプローブを含有するPDCを、4つの独立したマイクロアレイ実験に使用した。これらの53555のプローブを、各ウイルスの5bpのタイリングに基づいて選択し、プローブ設計基準のいずれにも供さなかった。したがって本発明者らは、CG含有量、クロスハイブリダイゼーションおよび不十分な増幅によって生じる誤差が、うまく設計されたプローブを有するPDCのものよりも有意に高いと期待した。本発明者らは4つの実験についてのこのような不利な設定において、本発明者らの分析アルゴリズムを試験した。
本実施例において、未知の病原体を含むヒト試料をランダムプローブを用いたRT−PCRプロセスによって増幅し、次いでPDC上にハイブリダイズさせた。本発明者らは、本発明者らのPDC上の35のウイルスのそれぞれについてのプローブを、0.05の有意性レベルの片側t検定に供し、チップ上の全てのプローブのシグナル強度に対してそれらのシグナル強度の重み付きカルバック・ライブラー(WKL)情報量を計算して、各実験について試料中にどのウイルスがあるかを判定した。ウエットラボPCRによって本発明者らのプログラムによる分析の精度の確認を行って、試料中の実際のウイルスを同定した。表6の4つの実験についての本発明者らの分析の結果およびそれらの対応するPCR検証を、表6に示す。
Figure 2009504153
Figure 2009504153
本結果から分析アルゴリズムが、最初の3つの実験において試験された試料中の実際のウイルスを正確に予測することが示される(上記の表6に示される結果)。さらに本発明者らは最後の実験において、試料がウイルスを有さないことを推測することができた。本発明者らが有意性のレベルが0.05のt検定を使用しただけの場合、各試料について存在すると検出されたウイルスの数が下記の表7に示されることに留意されたい。
Figure 2009504153
t検定を通過するウイルスの重み付きカルバック・ライブラー情報量を用いることによって本発明者らは、全ての偽陽性ウイルスを除去して、実際のウイルスを同定することができた。したがって本発明者らの分析アルゴリズムは、高レベルの雑音下でウイルスを確実に判定することができる。
次に本発明者らは、本発明者らの分析結果に対する、プローブ設計基準を適用したPDCを用いることの効果を調べた。まず35のウイルスのそれぞれについての増幅効率マップを計算した。次いで元々のPDC上のちょうど53555のプローブを、プローブ設計基準に供した。極端なレベルのCG含有量、ヒトおよび非標的ウイルスに対する高い類似性、ならびに低い増幅効率スコアを有するプローブをチップから除去した。合計10955のプローブを、第二の組の実験のために保持した。第一の組の実験で使用された試料を用いて、本発明者らは新しいチップで、下記の表8の4つの実験を繰り返した。実験結果を表8に示す。
Figure 2009504153
Figure 2009504153
以下の組の実験において分析アルゴリズムは、3つの試料、および陰性試料においても、実際のウイルスを正確に検出した。本発明者らのチップのための優れたプローブを設計した後、実験1、2および3における実際のウイルスの重み付きカルバック・ライブラー情報量は、プローブ設計のない対応する実験のものよりも大きかった。これは実際のウイルス由来のシグナル強度が、PDCにおけるバックグラウンドノイズよりも比較的高かったことを意味する。このことから、本発明者らのプローブ設計基準によってPDCからいくつかの不良なプローブが除去され、それによってより正確な分析が生じたことが示された。
ここでも有意性のレベルが0.05のt検定を用いただけの場合、下記の表9に示される4つの実験の結果を示す。このとき各試料について存在すると検出されたウイルスの数を表9に示す。
Figure 2009504153
表9から、プローブ設計によって試料35259_324および35179_122についてのt検定によって検出された偽陽性ウイルスの数が減少したことがわかる。より重要な点は、実際のウイルスについての重み付きカルバック・ライブラー情報量が4つ全ての試料において増大したことである。これはPDCにプローブ設計基準が適用された場合に、実際のウイルスのシグナルがバックグラウンドシグナルよりも差異があったことを意味する。
結論として本発明者らは、0.05の有意性レベルの片側t検定を用い、それに続いて各ウイルスのシグナル強度についての重み付きカルバック・ライブラー情報量を計算して、本発明者らがPDC上のデータを正確に分析し、高い確率で試料中の実際の病原体を判定することができたことを示した。分析アルゴリズムは高レベルのノイズ下でもうまく機能するが、本発明者らは、分析の精度が上述のプローブ設計基準を用いることによって改良されて、PDCについてのプローブの優れたセットが選択されることを示した。
<プローブ設計および病原体検出のための代替的方法>
マイクロアレイ上のクロスハイブリダイゼーションを予測するのに利用可能なアルゴリズムはほとんどなく、1つのアルゴリズム、E−Predictだけが、マイクロアレイ上で病原体を検出することについて報告および検証されている(Urisman et al.,2005;Li et al.,2005)。E−Predictは、ハイブリダイゼーションサインを各マイクロアレイプローブについてのハイブリダイゼーションの理論的自由エネルギーに由来する、予測されるサインと適合させる。しかしながらE−predictを用いて本発明者らのマイクロアレイを分析すると、多くの偽陽性信号を生じた(上記の表5参照)。例えばE−Predictは、RSV患者412においてコロナウイルスを検出した(図15)。パンコロナウイルスプライマーならびにOC43および229Eコロナウイルスのための特定の診断用プライマーを用いた診断用PCRによって、患者412のコロナウイルスの非存在が確認された(上記の表4参照)。本発明者らは、E−Predictを用いた偽陽性信号が、ヒトまたはRSVゲノムとクロスハイブリダイズするコロナウイルスプローブから生じたという仮説を立てた。実際に最も高いシグナル強度を有する50のコロナウイルスプローブの85%がヒトゲノムとクロスハイブリダイズすると予測され、65%がRSVに関して17未満のHDを有し、これは家族性クロスハイブリダイゼーションについての本発明者らの12のHD閾値のすぐ上である。さらにE−Predictを最適化して、ヒトゲノムへのクロスハイブリダイゼーションが重要な考慮すべき事柄であるタイリングアレイの代わりに、ウイルスゲノム領域の間で高度に保存されたプローブを含有するマイクロアレイ上で機能させた。したがってこれらの2つの要因−異なるマイクロアレイ設計戦略およびヒトゲノムへのクロスハイブリダイゼーションは、本発明者らの基盤に関してE−predictの貧弱な性能に寄与するようである。本発明者らのE−predictでの経験から、PDA v1はそれらは異なるプローブ長について設計され、他の適用および基盤について最適化されているので、他のアルゴリズムと比較するのは公正ではない。
<結論>
クロスハイブリダイゼーション閾値を経験的に判定することによって、本発明者らは、臨床試料中に存在する特定のウイルスとよくハイブリダイズするプローブのみを含むコンピュータ内での病原体サインプローブセットを作製した。AESアルゴリズムによってユニバーサルプライマータグを設計して、ウイルスゲノム全体を効率的に増幅することが可能になった。PDA v.1検出アルゴリズムとともに、臨床試料由来のマイクロアレイ上に示される病原体のいずれかを確実に同定することができる。この手法によって、各病原体ハイブリダイゼーションサインの経験的な検証の必要性が排除され、病原体同定の強力な診断の基盤となる、10000を越える病原体についてのプローブを含有する将来のマイクロアレイが可能になる。
本発明者らは、病原体検出マイクロアレイの設計および分析を最適化し、病院におけるそれらの使用を容易にした。本発明者らは、ランダムPCRにおいて日常的に使用されるプライマータグが偏っており、病原体ゲノムの不均一な増幅を生じることを発見した。この偏りは、本発明者らのAESアルゴリズムを用いてプライマーを設計することによって避けることができる。本発明者らのコンピュータ内でのサインプローブセットによって、どのプローブがアレイ上に示されるいずれかの病原体にハイブリダイズするかを正確に予測することができる。PDA v.1検出アルゴリズムとともに、この手法によって、各病原体ハイブリダイゼーションサインの経験的な検証の必要性が排除され、病原体同定のための強力な診断の基盤となる10000を越える病原体についてのプローブを含有する将来のマイクロアレイが可能になる。
ここで本発明者らは、ウイルス増幅効率、ハイブリダイゼーションシグナル出力、標的−プローブアニーリング特異性、および特注設計のマイクロアレイ基盤を用いた病原体検出の再現性の間の、複雑な関係の体系的調査の結果を報告する。本発明者らの発見によって、最適な病原体サインプローブセット(SPS)のコンピュータ内での予測の新規の方法論の基礎が形成され、(マイクロアレイハイブリダイゼーションの前の)ウイルス増幅効率を左右する要因に光明が投じられ、ウイルス増幅効率スコア(AES)と最適なプローブ選択との間の重要な関連が示される。最後に本発明者らは、ウイルス価の範囲全体で臨床材料中の病原体を迅速かつ再現性良く同定することができる、新しい統計ベースの病原体検出アルゴリズム(PDA)を説明する。
本発明者らは、公的に利用可能なデータベースから得られたウイルスゲノム配列を用いて、少なくとも4000のウイルスコピーが存在するかどうかの高い程度の確実性で、臨床試料中のウイルスを検出することの実行可能性を示した(上記の表3参照)。その感度は抗原検出方法のものに近づき、それによって臨床的に意義のある検出手段になる(Liu et al.,2005;Marra et al.,2003)。コンピュータ内で病原体ハイブリダイゼーションサインを正確に予測できることによって、最初にアレイを純粋な病原体試料にハイブリダイズさせることによる経験的な検証を必要とする現在のマイクロアレイ方法に対し、相当な進展が提供される。アレイ上に示される病原体の特異的同定に加えて、PDA v.1によってアレイ上に特異的に示されないそれらのゲノムについて、病原体の綱、科または属の同定が可能になる(HDおよびMCMの閾値を緩めることによって)。この情報はしばしば、病院における治療法の決定に十分である。AES最適化タグで、本発明者らは非AES最適化タグを用いて増幅した場合に、以前は検出することができなかった臨床試料由来のウイルスを同定することができた。したがってAESによるタグの選択によって、PCR効率および検出の感度が増大した。本発明のアルゴリズムは、DNAライブラリーの生成および再配列決定のためのRNAの強化等の、他のタグベースのPCR用途に適用してもよい。
Figure 2009504153
Figure 2009504153
ウイルス配列(配列番号1〜9)上のランダムプライマーの対のRT−PCR結合プロセスを示す。図1についての標識は以下のとおりである。 A:逆転写(RT)。プライマーが鋳型に結合する。 B:タグを付けたRT産物が生じる(詳細には、仮説上のウイルス配列鋳型および仮説上の特異的ランダムプライマーで)。 C:タグを組み込んで、第二の鎖合成を完了する。 D:PCRプライマーGTTTCCCAGTCACGATA(配列番号8)を使用した、タグを付けたRT産物の増幅。 RSV−Bゲノムについての増幅効率スコアリング(AES)マップを示す。 RSV−Bについての一実験のオリゴヌクレオチドプローブシグナル強度を示す。 図4Aは、試験した試料中のウイルスのシグナル強度の密度分布を示す。矢印は分布の正の歪みを示す。これは、ノイズはあるが有意な量の実信号もあることを示す。図4Bは、試料中にないウイルスのシグナル強度の密度分布を示す。これはノイズ領域である。 病原体検出チップデータの解析フレームワークを示す。 オリゴヌクレオチドプローブ設計スキーマ。これは、NC_001781ヒト呼吸器多核体ウイルス(RSV)のゲノム全体で作製されたタイリングプローブを示す。数字は各プローブの開始および終止部分を表す。1948のプローブを合成して、15225bpのRSVゲノム全体をカバーした。このプロセスを、残りの34のウイルスゲノムについて繰り返した。 マイクロアレイバーの標識の手掛かり:
Figure 2009504153
SARS Sin850感染細胞系(A)または1型デング熱感染細胞系(B)から単離されたRNAを、それぞれSARS特異的または1型デング熱特異的RT−PCRの後、病原体マイクロアレイ上にハイブリダイズした。SARSは他のコロナウイルス科ゲノム、具体的には高度に保存されたゲノムの中間部分にクロスハイブリダイズした(黒色で示す)(Ruan et al.,2003)。1型デング熱はそれらの配列類似性に基づいて、フラビウイルス科由来のプローブおよび他のゲノムにクロスハイブリダイズした。ハミング距離(HD)および最大連続マッチ(MCM)スコアを調べることによって、クロスハイブリダイゼーションが起こるかどうかを予測する閾値を確立し、この情報を利用してコンピュータ内でのハイブリダイゼーションサインを生成した。(C)RSVを有すると診断された臨床患者から単離されたRNAをランダムRT−PCRを用いて増幅し、病原体マイクロアレイ上にハイブリダイズさせた。
プローブハミング距離(HD)、プローブ最大連続マッチ(MCM)およびプローブシグナル強度の間の関係。平均プローブシグナル強度は、HDが増大しMCMが減少すると減少した。これは、検出可能なプローブのパーセンテージの減少と相関がある(シグナル強度>平均値+2SD)。最適なクロスハイブリダイゼーション閾値HD≦4またはMCM≧18(影付き)で、98%を超えるプローブを検出することができる。HD=5またはMCM=17で、検出率は85%に落ちる。 RSV感染患者から単離されたRNAを、病原体検出アレイにハイブリダイズさせた。(A)全53,555のプローブのプローブシグナル強度の分布から、正規分布(灰色の実線)が示される。非RSVプローブはゲノム特異的レベルで調べた場合、例えばパラインフルエンザ−1(灰色の点線)からも、正規分布が示される。RSV特異的プローブのシグナル強度は正の歪みを有し、分布の尾部のシグナル強度がより高い(黒色の実線)。(B)大多数が−5〜3の間の範囲である35のSPSについてのWKLスコアの分布頻度。しかしながら、RSVゲノムのWKLスコアは17であり、そのため分布は正規でない(アンダーソン・ダーリン検定によって、P<0.05)。異常値ゲノムを排除することによって正規分布が生じた。この計算から、ハイブリダイズした試料中にRSVが存在すると結論付ける。 AESはプローブ増幅効率の指標である。高いAESを有するより高い割合のプローブが、5つの実験にわたってシグナル強度閾値より高く検出可能である。 マイクロアレイを用いた病原体検出に必要なプロセスを示すスキーマ。 ハイブリダイゼーションシグナル強度は増幅効率スコア(AES)と相関があり、P=2.2×10-16である。RSV患者試料をマイクロアレイ上にハイブリダイズさせ、各プローブのシグナル強度を、計算したAESとともにプロットした。典型的なアレイ上での高信頼度検出のためのシグナル閾値を緑色の線によって示す。 ランダムRT−PCRのためのAES最適化プライマータグを用いることによって、AESが10〜30倍増大する。最適化プライマーは、マイクロアレイ上に示される全35のゲノム全体で同じ性能を有すると予測された。AES最適化プライマーA2を用いてほとんどの患者試料を増幅した。
Figure 2009504153
マイクロアレイバーの標識の手掛かり:
Figure 2009504153
ランダムRT−PCRにおけるプライマータグの選択は、PCR効率に対して有意な効果を有する。(A)Bohlander et al.,1992によって記載された元々のプライマー、または(B)マイクロアレイ上に示された全てのゲノム(高AES)が確実に効率的に増幅されるようにPCRモデリングに従って設計されたプライマーを用いたRT−PCRの後、臨床hMPV試料にハイブリダイズしているプローブを示すヒートマップ。
RSV患者#412についての診断PCR結果から、患者がコロナウイルス感染を有さないことが確認される。(A)パンコロナウイルスプライマーを用いたPCR。レーン1:OC43コロナウイルス陽性対照、レーン2:229Eコロナウイルス陽性対照、レーン3:RSV患者#412、レーン4:PCRプライマーおよび試薬のみの陰性対照。1kbラダー。(B)OC43特異的プライマーを用いたPCR。レーン1:OC43コロナウイルス陽性対照、レーン2:RSV患者#412、レーン3:ATCC由来の精製されたRSV、レーン4:PCR陰性対照。50bpラダー。(C)229E特異的プライマーを用いたPCR。レーン1:229Eコロナウイルス陽性対照、レーン2:RSV患者#412、レーン3:PCR陰性対照。1kbラダー。

Claims (93)

  1. (I)増幅される少なくとも1つの標的核酸の少なくとも1つの領域を同定および/または選択するステップと、ここで、領域が平均増幅効率(AE)よりも高いAEを有し、
    (II)同定および/または選択された領域にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを設計するステップと
    を任意の順序で含む、核酸検出のための少なくとも1つのオリゴヌクレオチドを設計する方法。
  2. 選択される領域のAEが、フォワードプライマーriが位置iに結合することができ、リバースプライマーrjが標的核酸の位置jに結合することができる確率である、増幅効率スコア(AES)として計算され、および|i−j|が、増幅されることが所望される標的核酸の領域である、請求項1に記載の方法。
  3. |i−j|が10000bp以下である、請求項2に記載の方法。
  4. |i−j|が1000bp以下である、請求項2に記載の方法。
  5. |i−j|が500bp以下である、請求項2に記載の方法。
  6. ステップ(I)が、幾何学的増幅バイアスまたは標的核酸の各位置の効果を判定すること、および平均増幅効率(AE)よりも高いAEを有する領域として増幅される少なくとも1つの領域を選択することを含む、請求項1〜5のいずれか一項に記載の方法。
  7. 幾何学的増幅バイアスがPCRバイアスである、請求項6に記載の方法。
  8. 選択される領域にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドが、以下の基準:
    (a)選択されたオリゴヌクレオチドは、40%〜60%のCG含有量を有する;
    (b)オリゴヌクレオチドは、隣接モデルに基づいて計算される、最も高い自由エネルギーを有することによって選択される;
    (c)標的核酸vaおよびvbのオリゴヌクレオチドsaおよびオリゴヌクレオチドsbサブストリングを仮定すると、saはsaと標的核酸vb由来の任意の長さmのサブストリングsbとの間のハミング距離ならびに/またはsaおよびオリゴヌクレオチドsbの最も長い共通するサブストリングに基づいて選択される;
    (d)標的核酸vaに特異的な長さmの任意のオリゴヌクレオチドsaについて、標的核酸と異なる核酸のいずれの領域ともいかなるヒットも有さない場合、オリゴヌクレオチドsaが選択され、長さmのオリゴヌクレオチドsaが標的核酸と異なる核酸とヒットを有する場合、最も小さい最大アライメント長および/または最少の数のヒットを有する長さmのオリゴヌクレオチドsaが選択される;ならびに
    (e)piが、増幅された標的核酸の位置iにハイブリダイズすると予測される場合、標的核酸の位置iのオリゴヌクレオチドpiが選択される
    の少なくとも1つに従って選択および設計される、請求項1〜7のいずれか一項に記載の方法。
  9. P(pi|va)>λであり、式中λが0.5であり、P(pi|va)が、piが標的核酸vaの位置iにハイブリダイズする確率である場合、基準(e)に基づいて、標的核酸vaの位置Iのオリゴヌクレオチドpiが選択される、請求項8に記載の方法。
  10. λが0.8である、請求項9に記載の方法。
  11. Figure 2009504153
    であり、式中Xはvaの全てのオリゴヌクレオチドの増幅効率スコア(AES)値を表す確率変数であり、kはva中のオリゴヌクレオチドの数であり、ciはAES値がxi以下であるオリゴヌクレオチドの数である、請求項1〜10のいずれか一項に記載の方法。
  12. 選択および/または設計されるオリゴヌクレオチドを調製するステップをさらに含む、請求項1〜11のいずれか一項に記載の方法。
  13. (i)少なくとも1つの生体試料を提供するステップと、
    (ii)生体試料中に含まれる核酸を増幅するステップと、
    (iii)生体試料中に標的核酸が存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを提供するステップと、ここで請求項1〜12のいずれか一項に記載の方法に従って前記オリゴヌクレオチドが設計および/または調製され、
    (iv)前記オリゴヌクレオチドを増幅された核酸と接触させるステップおよび/または標的核酸にハイブリダイズしたオリゴヌクレオチドを検出するステップと
    を含む、少なくとも1つの標的核酸を検出する方法。
  14. 少なくとも1つのオリゴヌクレオチドが、少なくとも1つのオリゴヌクレオチドプローブまたはプライマーである、請求項1〜13のいずれか一項に記載の方法。
  15. 増幅ステップが、少なくとも1つのランダムフォワードプライマーおよび/または少なくとも1つのリバースランダムプライマーの存在下で行われる、請求項1〜14のいずれか一項に記載の方法。
  16. 増幅ステップがRT−PCRである、請求項1〜15のいずれか一項に記載の方法。
  17. 位置iに結合しているフォワードランダムプライマーおよび標的核酸vaの位置jに結合しているリバースランダムプライマーが、
    Figure 2009504153
    の標的核酸vaの各位置iについての増幅効率スコア(AESI)を有するプライマーの間で選択され、
    式中、
    Figure 2009504153
    であり、Pf(i)およびPr(i)は、それぞれ、フォワードプライマーおよびリバースプライマーとしてランダムプライマーriがvaの位置iに結合する確率であり、10000bp以下であるZは、増幅されることが所望されるvaの領域である、請求項2〜16のいずれか一項に記載の方法。
  18. 増幅ステップが、フォワードおよびリバースプライマーを含み、フォワードおよびリバースプライマーのそれぞれが、5’−3’配向で、不変のプライマー頭部および可変のプライマー尾部を含み、少なくとも可変の尾部が、標的核酸vaの一部にハイブリダイズする、請求項1〜17のいずれか一項に記載の方法。
  19. 増幅ステップが、配列番号1のヌクレオチド配列またはそのバリアントもしくは誘導体を有するフォワードおよび/またはリバースランダムプライマーを含む、請求項1〜18のいずれか一項に記載の方法。
  20. 検出される標的核酸が、生体試料の核酸にとって外因性の核酸である、請求項1〜19のいずれか一項に記載の方法。
  21. 検出される標的核酸が、少なくとも、病原体ゲノムまたはその断片である、請求項1〜20のいずれか一項に記載の方法。
  22. 病原体核酸が、少なくとも、ウイルス、寄生生物、もしくは細菌由来の核酸、またはその断片である、請求項21に記載の方法。
  23. 生体試料がヒトから得られ、標的核酸が生体試料中に存在する場合、前記標的核酸はヒト由来でない、請求項1〜22のいずれか一項に記載の方法。
  24. プローブが不溶性支持体上に配置される、請求項1〜23のいずれか一項に記載の方法。
  25. 不溶性支持体がマイクロアレイである、請求項24に記載の方法。
  26. 検出ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値が、vaに含まれないプローブの平均値よりも統計的に高く、それによって生体試料中のvaの存在が示される、請求項13〜25のいずれか一項に記載の方法。
  27. 検出ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値が、vaに含まれないプローブの平均値よりも統計的に高いことを特徴とし、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有しvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含む請求項13〜25のいずれか一項に記載の方法であって、プローブvaのシグナル強度の密度分布が、vaに含まれないプローブのものよりも正に歪んでおり、それによって生体試料中のvaの存在が示される方法。
  28. 検出ステップ(iv)において、生体試料中の少なくとも1つの標的核酸の存在が、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0以上の重み付きカルバック・ライブラー情報量の値によって示される、請求項13〜25のいずれか一項に記載の方法。
  29. t検定値が0.05以下である、請求項28に記載の方法。
  30. 重み付きカルバック・ライブラー情報量の値が5.0以上である、請求項28または請求項29に記載の方法。
  31. 検出ステップ(iv)が、重み付きカルバック・ライブラー(WKL)情報量スコア:
    Figure 2009504153
    の分布を計算することによって、標的核酸vaについての各サインプローブセット(SPS)におけるプローブのシグナル強度を評価することを含み、式中、Qa(j)は瓶bjに見られるPaにおけるプローブのシグナル強度の累積分布関数であり、
    Figure 2009504153
    は瓶bjに見られる
    Figure 2009504153
    におけるプローブのシグナル強度の累積分布関数であり、Paはウイルスvaのプローブのセットであり、
    Figure 2009504153
    である、請求項13〜25のいずれか一項に記載の方法。
  32. 標的核酸vaの非存在を表す各サインプローブセット(SPS)が、正規分布したシグナル強度および/または5より小さい重み付きカルバック・ライブラー(WKL)情報量スコアを有する、請求項31に記載の方法。
  33. 少なくとも1つの標的核酸vaの存在を表す各サインプローブセット(SPS)が、正に歪んでいるシグナル強度分布および/または5より大きい重み付きカルバック・ライブラー(WKL)情報量スコアを有する、請求項32に記載の方法。
  34. WKLスコアの分布に関してアンダーソン・ダーリン検定を行うことをさらに含み、P>0.05の結果が、それによって標的核酸vaの非存在を示す、請求項31〜33のいずれか一項に記載の方法。
  35. WKLスコアの分布に関してアンダーソン・ダーリン検定を行うことをさらに含み、P<0.05の結果が、それによって、標的核酸vaの存在を示す、請求項31〜33のいずれか一項に記載の方法。
  36. さらなるアンダーソン・ダーリン検定が行われ、それによってさらなる重感染している標的核酸の存在が示される、請求項35に記載の方法。
  37. 少なくとも1つの標的核酸vaに対する少なくとも1つのオリゴヌクレオチドプローブのハイブリダイゼーションを検出することを含み、vaにハイブリダイズするプローブのシグナル強度の平均値がvaに含まれないプローブの平均値よりも統計的に高く、それによってvaの存在が示される、少なくとも1つの標的核酸vaの存在を判定する方法。
  38. aにハイブリダイズするプローブのシグナル強度の平均値が、vaに含まれないプローブの平均値よりも統計的に高く、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含み、プローブvaのシグナル強度の密度分布がvaに含まれないプローブのものより正に歪んでおり、それによってvaの存在が示される、請求項37に記載の方法。
  39. 少なくとも1つの生体試料中の少なくとも1つの標的核酸の存在が、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0以上の重み付きカルバック・ライブラー情報量の値によって示される、請求項37または請求項38に記載の方法。
  40. t検定値が0.05以下である、請求項39に記載の方法。
  41. 重み付きカルバック・ライブラー情報量の値が5.0以上である、請求項39または請求項40に記載の方法。
  42. (i)少なくとも1つの生体試料を提供するステップと、
    (ii)生体試料中に含まれる少なくとも1つの核酸を増幅するステップと、
    (iii)生体試料中に標的核酸が存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドプローブを提供するステップと、
    (iv)プローブを増幅された核酸と接触させ、標的核酸にハイブリダイズしたプローブを検出するステップと、ここで、vaにハイブリダイズするプローブのシグナル強度の平均値が、vaに含まれないプローブの平均値よりも統計的に高く、それによって生体試料中のvaの存在が示されるステップと
    を含む、少なくとも1つの標的核酸を検出する方法。
  43. ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値が、vaに含まれないプローブの平均値よりも統計的に高いことを特徴とし、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含む請求項42に記載の方法であって、プローブvaのシグナル強度の密度分布が、vaに含まれないプローブのものよりも正に歪んでおり、それによって生体試料中のvaの存在が示される、方法。
  44. ステップ(iv)において、少なくとも1つの生体試料中の少なくとも1つの標的核酸の存在が、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0以上の重み付きカルバック・ライブラー情報量の値によって示される、請求項42または請求項43に記載の方法。
  45. t検定値が0.05以下である、請求項44に記載の方法。
  46. 重み付きカルバック・ライブラー情報量の値が5.0以上である、請求項44または請求項45に記載の方法。
  47. 検出される標的核酸が、生体試料の核酸にとって外因性の核酸である、請求項37〜46のいずれか一項に記載の方法。
  48. 検出される標的核酸が、少なくとも1つの病原体ゲノムまたはその断片である、請求項37〜47のいずれか一項に記載の方法。
  49. 病原体核酸が、ウイルス、寄生生物、もしくは細菌由来の少なくとも1つの核酸、またはその断片である、請求項48に記載の方法。
  50. 生体試料がヒトから得られ、標的核酸が、生体試料中に存在する場合、ヒトゲノム由来でない、請求項37〜47のいずれか一項に記載の方法。
  51. 少なくとも1つのプローブが、不溶性支持体上に配置される、請求項37〜48のいずれか一項に記載の方法。
  52. 支持体がマイクロアレイである、請求項51に記載の方法。
  53. (I)増幅される少なくとも1つの標的核酸の少なくとも1つの領域を同定および/または選択する、ここで、前記領域が平均増幅効率(AE)よりも高いAEを有する、ならびに
    (II)同定および/または選択される領域にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを設計する
    ように構成された、核酸検出のための少なくとも1つのオリゴヌクレオチドを設計するための装置。
  54. 選択される領域のAEが、フォワードプライマーriが位置iに結合することができ、リバースプライマーrjが標的核酸の位置jに結合することができる確率である、増幅効率スコア(AES)として計算され、および|i−j|が、増幅されることが所望される標的核酸の領域である、請求項53に記載の装置。
  55. |i−j|が10000bp以下、1000bp以下、または500bp以下である、請求項54に記載の装置。
  56. ステップ(I)が、幾何学的増幅バイアスまたは標的核酸の各位置の効果を判定すること、および平均増幅効率(AE)よりも高いAEを有する領域として増幅される少なくとも1つの領域を選択することを含む、請求項53〜55のいずれか一項に記載の装置。
  57. 幾何学的増幅バイアスがPCRバイアスである、請求項56に記載の装置。
  58. 選択される領域にハイブリダイズすることができるオリゴヌクレオチドが、以下の基準:
    (a)選択されたオリゴヌクレオチドが、40%〜60%のCG含有量を有する;
    (b)オリゴヌクレオチドが、隣接モデルに基づいて計算される最も高い自由エネルギーを有することによって選択される;
    (c)標的核酸vaおよびvbのオリゴヌクレオチドsaおよびオリゴヌクレオチドsbサブストリングを仮定すると、saがsaと標的核酸vb由来の任意の長さmのサブストリングsbとの間のハミング距離および/またはsaおよびオリゴヌクレオチドsbの最も長い共通するサブストリングに基づいて選択される;
    (d)標的核酸vaに特異的な長さmの任意のオリゴヌクレオチドsaについて、標的核酸と異なる核酸のいずれの領域ともいかなるヒットも有さない場合、オリゴヌクレオチドsaが選択され、長さmのオリゴヌクレオチドsaが標的核酸と異なる核酸とヒットを有する場合、最も小さい最大アライメント長および/または最少の数のヒットを有する長さmのオリゴヌクレオチドsaが選択される;ならびに
    (e)標的核酸の位置iの少なくとも1つのオリゴヌクレオチドpiが、piが、増幅された標的核酸の位置iにハイブリダイズすると予測される場合に選択される
    の少なくとも1つに従って選択および/または設計される、請求項53〜57のいずれか一項に記載の装置。
  59. P(pi|va)>λであり、式中λが0.5であり、P(pi|va)が、piが標的核酸vaの位置iにハイブリダイズする確率である場合に、基準(e)に基づいて、標的核酸vaの位置iのオリゴヌクレオチドpiが選択される、請求項58に記載の装置。
  60. λが0.8である、請求項59に記載の装置。
  61. Figure 2009504153
    であり、式中Xはvaの全てのオリゴヌクレオチドの増幅効率スコア(AES)値を表す確率変数であり、kはva中のオリゴヌクレオチドの数であり、ciはAES値がxj以下であるオリゴヌクレオチドの数である、請求項53〜60のいずれか一項に記載の装置。
  62. 構成が、選択および/または設計されたオリゴヌクレオチドを調製するステップをさらに含む、請求項53〜61のいずれか一項に記載の装置。
  63. 少なくとも1つのオリゴヌクレオチドが、少なくとも1つのオリゴヌクレオチドプローブおよび/またはプライマーである、請求項53〜62のいずれか一項に記載の装置。
  64. (i)少なくとも1つの生体試料を提供するステップと、
    (ii)生体試料中に含まれる核酸を増幅するステップと、
    (iii)生体試料中に標的核酸が存在する場合、少なくとも1つの標的核酸にハイブリダイズすることができる少なくとも1つのオリゴヌクレオチドを提供するステップと、ここで前記オリゴヌクレオチドが、請求項53〜63のいずれか一項に記載の装置に従って構成されている装置に従って設計および/または調製され、
    (iv)オリゴヌクレオチドを増幅された核酸と接触させる、および/または標的核酸にハイブリダイズしたオリゴヌクレオチドを検出するステップと
    のいずれか1つのステップを含む、少なくとも1つの標的核酸を検出するよう構成された装置。
  65. 増幅ステップが、少なくとも1つのランダムフォワードプライマーおよび/または少なくとも1つのリバースランダムプライマーの存在下で行われる、請求項53〜64のいずれか一項に記載の装置。
  66. 増幅ステップがRT−PCRである、請求項53〜65のいずれか一項に記載の装置。
  67. 位置iに結合しているフォワードランダムプライマーおよび標的核酸vaの位置jに結合しているリバースランダムプライマーが、
    Figure 2009504153
    の標的核酸vaの各位置iについての増幅効率スコア(AESI)を有するプライマーの間で選択され、式中、
    Figure 2009504153
    であり、Pf(i)およびPr(i)は、それぞれフォワードプライマーおよびリバースプライマーとして、ランダムプライマーriがvaの位置iに結合する確率であり、10000bp以下であるZは増幅されることが所望されるvaの領域である、請求項53〜66のいずれか一項に記載の装置。
  68. 増幅ステップが、フォワードおよびリバースプライマーを含み、フォワードおよびリバースプライマーのそれぞれが、5’−3’配向で、不変のプライマー頭部および可変のプライマー尾部を含み、少なくとも可変の尾部は、標的核酸vaの一部にハイブリダイズする、請求項53〜67のいずれか一項に記載の装置。
  69. 増幅ステップが、配列番号1のヌクレオチド配列またはそのバリアントもしくは誘導体を有するフォワードおよび/またはリバースランダムプライマーを含む、請求項53〜68のいずれか一項に記載の装置。
  70. 検出される標的核酸が、生体試料の核酸にとって外因性である少なくとも1つの核酸である、請求項53〜69のいずれか一項に記載の装置。
  71. 検出される標的核酸が、少なくとも1つの病原体ゲノムまたはその断片である、請求項53〜69のいずれか一項に記載の装置。
  72. 病原体核酸が、ウイルス、寄生生物、もしくは細菌由来の少なくとも1つの核酸、またはその断片である、請求項71に記載の装置。
  73. 生体試料がヒトから得られ、標的核酸が生体試料中に存在する場合、前記標的核酸がヒト由来でない、請求項53〜72のいずれか一項に記載の装置。
  74. 少なくとも1つのプローブを配置する少なくとも1つの不溶性支持体を含む、請求項53〜73のいずれか一項に記載の装置。
  75. 不溶性支持体がマイクロアレイである、請求項74に記載の装置。
  76. 検出ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値が、vaに含まれないプローブの平均値よりも統計的に高く、それによって生体試料中のvaの存在が示される、請求項64〜75のいずれか一項に記載の装置。
  77. 検出ステップ(iv)において、vaにハイブリダイズするプローブのシグナル強度の平均値が、vaに含まれないプローブの平均値よりも統計的に高いことを特徴とし、高いシグナル強度を有する検出方法において使用されるプローブの割合に対する、高いシグナル強度を有するvaに含まれないプローブの割合の相対的差異を計算するステップをさらに含むよう構成された請求項64〜75のいずれか一項に記載の装置であって、プローブvaのシグナル強度の密度分布がvaに含まれないプローブのものよりも正に歪んでおり、それによって生体試料中のvaの存在が示される、装置。
  78. 検出ステップ(iv)において、生体試料中の標的核酸の存在が、0.1以下のt検定の値および/または0.05以下のアンダーソン・ダーリン検定値および/または1.0の重み付きカルバック・ライブラー情報量の値によって示される、請求項64〜75のいずれか一項に記載の装置。
  79. t検定値が0.05以下である、請求項78に記載の装置。
  80. 重み付きカルバック・ライブラー情報量の値が5.0以上である、請求項78または請求項79に記載の装置。
  81. 検出ステップ(iv)が、重み付きカルバック・ライブラー(WKL)情報量スコアの分布:
    Figure 2009504153
    を計算することによって、標的核酸についての各サインプローブセット(SPS)におけるプローブのシグナル強度を評価することを含み、式中Qa(j)は瓶bjに見られるPaにおけるプローブのシグナル強度の累積分布関数であり、
    Figure 2009504153
    は瓶bjに見られる
    Figure 2009504153
    におけるプローブのシグナル強度の累積分布関数であり、Paはウイルスvaのプローブのセットであり、
    Figure 2009504153
    である、請求項64〜75のいずれか一項に記載の装置。
  82. 標的核酸の非存在を表す各サインプローブセット(SPS)が、正規分布したシグナル強度および/または5より小さい重み付きカルバック・ライブラー(WKL)情報量スコアを有する、請求項81に記載の装置。
  83. 少なくとも1つの標的核酸の存在を表す各サインプローブセット(SPS)が、正に歪んでいるシグナル強度分布および/または5より大きい重み付きカルバック・ライブラー(WKL)情報量スコアを有する、請求項81に記載の装置。
  84. WKLスコアの分布に関してアンダーソン・ダーリン検定を行うことをさらに含み、P>0.05の結果が、それによって標的核酸の非存在を示す、請求項81〜83のいずれか一項に記載の装置。
  85. WKLスコアの分布に関してアンダーソン・ダーリン検定を行うことをさらに含み、P<0.05の結果が、それによって標的核酸の存在を示す、請求項81〜83のいずれか一項に記載の装置。
  86. さらなるアンダーソン・ダーリン検定が行われ、それによってさらなる重感染している標的核酸の存在が示される、請求項85に記載の装置。
  87. 少なくとも1つの電子記憶媒体上で構成が記憶される、請求項53〜86のいずれか一項に記載の装置。
  88. 請求項1〜52のいずれか一項に記載の方法を行うよう構成された、コンピュータプログラム製品。
  89. 少なくとも1つのオリゴヌクレオチドを設計するためおよび/または少なくとも1つの標的核酸を検出するために、WKL情報量スコアおよび/またはアンダーソン・ダーリン検定を判定するよう構成されたソフトウエアを含む、コンピュータプログラム製品。
  90. WKL、アンダーソン・ダーリン検定、オリゴヌクレオチドプローブの設計、オリゴヌクレオチドプライマーの設計、および/または標的核酸の検出が、請求項1〜52のいずれか一項に記載の方法に従って定義される、請求項89に記載のコンピュータプログラム製品。
  91. 請求項1〜52のいずれか一項に記載の方法を行うよう構成されたソフトウエアを含む、取り外し可能な電子記憶媒体。
  92. 少なくとも1つのオリゴヌクレオチドプローブを設計するため、オリゴヌクレオチドプライマーを設計するため、および/または少なくとも1つの標的核酸を検出するために、WKL情報量スコアおよび/またはアンダーソン・ダーリン検定を判定するよう構成されたソフトウエアを含む、取り外し可能な電子記憶媒体。
  93. WKL、アンダーソン・ダーリン検定、オリゴヌクレオチドプローブの設計、オリゴヌクレオチドプライマーの設計、および/または標的核酸の検出が、請求項1〜52のいずれか一項に従って定義される、請求項92に記載の取り外し可能な電子記憶媒体。
JP2008525967A 2005-08-12 2006-08-08 オリゴヌクレオチド設計および/または核酸検出の方法および/または装置 Pending JP2009504153A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/202,023 US20070042388A1 (en) 2005-08-12 2005-08-12 Method of probe design and/or of nucleic acids detection
PCT/SG2006/000224 WO2007021250A2 (en) 2005-08-12 2006-08-08 Method and/or apparatus of oligonucleotide design and/or nucleic acid detection

Publications (2)

Publication Number Publication Date
JP2009504153A true JP2009504153A (ja) 2009-02-05
JP2009504153A5 JP2009504153A5 (ja) 2009-09-24

Family

ID=37757981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008525967A Pending JP2009504153A (ja) 2005-08-12 2006-08-08 オリゴヌクレオチド設計および/または核酸検出の方法および/または装置

Country Status (7)

Country Link
US (3) US20070042388A1 (ja)
EP (1) EP1922418A4 (ja)
JP (1) JP2009504153A (ja)
KR (1) KR20080052585A (ja)
CN (1) CN101292044B (ja)
AU (1) AU2006280489B2 (ja)
WO (1) WO2007021250A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006246888A (ja) * 2005-03-08 2006-09-21 Samsung Electronics Co Ltd プライマー−プローブセットを設計する方法、それによって設計されたプライマー−プローブセット、該セットを含むキット、該方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体、および該セットを利用した標的配列の同定方法
WO2019117192A1 (ja) * 2017-12-15 2019-06-20 東洋鋼鈑株式会社 一塩基多型検出用プローブの設計方法及びプローブセット
US11319602B2 (en) 2017-02-07 2022-05-03 Tcm Biotech Internationl Corp. Probe combination for detection of cancer

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070042388A1 (en) * 2005-08-12 2007-02-22 Wong Christopher W Method of probe design and/or of nucleic acids detection
US20100159533A1 (en) * 2008-11-24 2010-06-24 Helicos Biosciences Corporation Simplified sample preparation for rna analysis
US20120264637A1 (en) * 2009-06-26 2012-10-18 The Regents Of The University Of California Methods and systems for phylogenetic analysis
US20110152109A1 (en) * 2009-12-21 2011-06-23 Gardner Shea N Biological sample target classification, detection and selection methods, and related arrays and oligonucleotide probes
WO2012173636A1 (en) * 2011-06-16 2012-12-20 University Of Rochester Hiv incidence assays with high sensitivity and specificity
JP5756247B1 (ja) 2012-05-08 2015-07-29 アダプティブ バイオテクノロジーズ コーポレイション マルチプレックスpcr反応における増幅バイアスを測定し校正する組成物及び方法
CN105780129B (zh) * 2014-12-15 2019-06-11 天津华大基因科技有限公司 目标区域测序文库构建方法
US10787699B2 (en) * 2017-02-08 2020-09-29 Microsoft Technology Licensing, Llc Generating pluralities of primer and payload designs for retrieval of stored nucleotides
CN109097450B (zh) * 2018-08-30 2022-05-13 江苏省疾病预防控制中心 一种核酸序列非依赖的全rna扩增方法
WO2020054906A1 (ko) * 2018-09-11 2020-03-19 한국과학기술정보연구원 목표 유전자를 검출하기 위한 프라이머의 설계 방법
KR102020614B1 (ko) * 2018-09-11 2019-09-11 한국과학기술정보연구원 결핵 진단용 프라이머 세트 및 이의 용도
CN115101128B (zh) * 2022-06-29 2023-09-15 纳昂达(南京)生物科技有限公司 一种杂交捕获探针脱靶危险性评估的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194554A (ja) * 1998-12-25 2000-07-14 Nec Corp 演算処理装置
WO2004017068A1 (ja) * 2002-08-12 2004-02-26 Hitachi High-Technologies Corporation Dnaマイクロアレイを用いた核酸検出方法及び核酸検出装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030096986A1 (en) * 2001-10-25 2003-05-22 Affymetrix, Incorporated Methods and computer software products for selecting nucleic acid probes
GB2377017A (en) * 2001-06-28 2002-12-31 Animal Health Inst Detection of foot and mouth disease virus
US20040259124A1 (en) * 2003-02-19 2004-12-23 Affymetrix, Inc. Methods for oligonucleotide probe design
US20070042388A1 (en) * 2005-08-12 2007-02-22 Wong Christopher W Method of probe design and/or of nucleic acids detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194554A (ja) * 1998-12-25 2000-07-14 Nec Corp 演算処理装置
WO2004017068A1 (ja) * 2002-08-12 2004-02-26 Hitachi High-Technologies Corporation Dnaマイクロアレイを用いた核酸検出方法及び核酸検出装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6012063253; Proc. IEEE Comput. Soc. Bioinform. Conf. vol.2, 2003, pp.65-74 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006246888A (ja) * 2005-03-08 2006-09-21 Samsung Electronics Co Ltd プライマー−プローブセットを設計する方法、それによって設計されたプライマー−プローブセット、該セットを含むキット、該方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体、および該セットを利用した標的配列の同定方法
US11319602B2 (en) 2017-02-07 2022-05-03 Tcm Biotech Internationl Corp. Probe combination for detection of cancer
WO2019117192A1 (ja) * 2017-12-15 2019-06-20 東洋鋼鈑株式会社 一塩基多型検出用プローブの設計方法及びプローブセット

Also Published As

Publication number Publication date
KR20080052585A (ko) 2008-06-11
CN101292044B (zh) 2012-11-07
US8234079B2 (en) 2012-07-31
AU2006280489A1 (en) 2007-02-22
AU2006280489B2 (en) 2012-05-24
US20090053708A1 (en) 2009-02-26
WO2007021250A3 (en) 2007-07-05
WO2007021250A2 (en) 2007-02-22
EP1922418A4 (en) 2010-02-03
CN101292044A (zh) 2008-10-22
EP1922418A2 (en) 2008-05-21
US20120309643A1 (en) 2012-12-06
US20070042388A1 (en) 2007-02-22

Similar Documents

Publication Publication Date Title
JP2009504153A (ja) オリゴヌクレオチド設計および/または核酸検出の方法および/または装置
Sengupta et al. Molecular detection and identification of influenza viruses by oligonucleotide microarray hybridization
US8232058B2 (en) Multiplex detection of respiratory pathogens
James et al. LamPORE: rapid, accurate and highly scalable molecular screening for SARS-CoV-2 infection, based on nanopore sequencing
US8980555B2 (en) Rapid genotyping analysis and devices thereof
Wong et al. Optimization and clinical validation of a pathogen detection microarray
AU2006259666B2 (en) Multiplexed polymerase chain reaction for genetic sequence analysis
Létant et al. Multiplexed reverse transcriptase PCR assay for identification of viral respiratory pathogens at the point of care
US20080228406A1 (en) System and method for fungal identification
Lin et al. Universal detection and identification of avian influenza virus by use of resequencing microarrays
US20050136395A1 (en) Methods for genetic analysis of SARS virus
JP2023519919A (ja) 病原体を検出するためのアッセイ
US20090246754A1 (en) Optimized probes and primers and methods of using same for the detection and quantitation of bk virus
US20090258342A1 (en) Optimized probes and primers and methods of using same for the detection, quantification and grouping of hiv-1
WO2011145614A1 (ja) 核酸標準物質検出用プローブの設計方法、核酸標準物質検出用プローブ及び当該核酸標準物質検出用プローブを有する核酸検出系
WO2022020259A1 (en) Methods and devices for detecting and sequencing sars-cov-2
US20110014598A1 (en) Optimized probes and primers and method of using same for the detection of herpes simplex virus
US10190176B2 (en) Primers, probes, and methods for mycobacterium tuberculosis specific diagnosis
Jabado et al. Nonparametric methods for the analysis of single-color pathogen microarrays
CN115044711A (zh) 实时荧光pcr鉴别新型冠状病毒变异株的方法
US20110256537A1 (en) Optimized oligonucleotides and methods of using same for the screening, detection, isolation, quantitation, monitoring and sequencing of prostate cancer associated viruses and host biomarkers
Uyehara et al. Broadband Respiratory Virus Surveillance
JP2009509499A (ja) 遺伝子配列分析のための多重ポリメラーゼ連鎖反応

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090807

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111209

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120309

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121204

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130423