CZ254699A3 - Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin - Google Patents

Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin Download PDF

Info

Publication number
CZ254699A3
CZ254699A3 CZ19992546A CZ254699A CZ254699A3 CZ 254699 A3 CZ254699 A3 CZ 254699A3 CZ 19992546 A CZ19992546 A CZ 19992546A CZ 254699 A CZ254699 A CZ 254699A CZ 254699 A3 CZ254699 A3 CZ 254699A3
Authority
CZ
Czechia
Prior art keywords
probes
nucleic acid
labeled
probe
sequence
Prior art date
Application number
CZ19992546A
Other languages
English (en)
Inventor
Radoje Drmanac
Original Assignee
Hyseq, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyseq, Inc. filed Critical Hyseq, Inc.
Priority to CZ19992546A priority Critical patent/CZ254699A3/cs
Publication of CZ254699A3 publication Critical patent/CZ254699A3/cs

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Způsob detekce druhů cílových nukleových kyselin zahrnuje získání sond fixovaných na substrát a velkého množství značených sond, kde každá značená sonda se vybralatak, abyměla první sekvenci nukleové kyseliny, kteráje komplementární s první částí cílové nukleové kyseliny akde sekvence nukleové kyseliny alespoňjedné sondy fixované na substrátuje komplementární s druhou částí sekvence cílové nukleové kyseliny, přičemž druhá část sousedí s první částí. Dále se popisuje aplikace cílové nukleové kyseliny na soubor za podmínek vhodných píro hybridizaci sekvecí sond ke komplementárnímsekvencím, začlenění značené sonety do souboru, hybridizace sondy fixované k substrátu s cílovou nukleovou kyselinou, hybridizace značené sonety s cílovou nukleovou kyselinou, spojení značené sondy se souseelní hybridizovanou sondou v souboru a detekce značené sonety spojené se sondou v souboru.

Description

Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin
Oblast vynálezu
Vynález se týká metod a zařízení určených pro analýzu nukleových kyselin.
Dosavadní stav techniky hybridizace s chybným oligonukleotidů, jejichž
Rychlost stanovení sekvence čtyř nukleotidů ve vzorcích nukleových kyselin je hlavní překážkou dalšího pokroku v molekulární biologie, medicíně a biotechnologii. Způsoby sekvenování nukleových kyselin, které zahrnují separaci molekul nukleových kyselin na gelu, se používají od roku 1978. Jinou metodou sekvenování nukleových kyselin je sekvenování hybridizací (SBH).
Tradičním způsobem stanovení sekvence nukleotidů (to je pořadí nukleotidů A, G, C a T ve vzorku) se provede přípravou směsi náhodně zakončených, odlišně značených fragmentů nukleových fragmentů degradací na specifické nukleotidy nebo dideoxy zakončení replikujících se řetězců. Výsledkem jsou fragmenty nukleové kyseliny, jejichž velikost se pohybuje v rozmezí 1 až 500 párů baží, které se pak dělí na gelu, přičemž vzniká žebříček pruhů, kde se sousedící vzorky se liší délkou jednoho nukleotidu.
Přístup SBH založený na uspořádání nevyžaduje při oddělení, degradaci, syntéze nebo zobrazení molekuly nukleové kyseliny rozlišení jedné báze. Za použití diskriminativní párováním v případě krátkých délku tvoří K bází, mohou se v případě cílové nukleové kyseliny stanovit seznamy konstituentních K-merních oligonukleotidů. Sekvence cílové nukleové kyseliny se může sestavit použitím oligonukleotidů, které se překrývají jedinou bází.
Existuje řada přístupů, kterých se dá použít při sekvenování hybridízací. V případě procesu, který se nazývá SBH Formát 1, se připraví vzorky nukleových kyselin a značená sonda hybridizuje se vzorky. Replika membrán, kde je nanesena stajná sada vzorků nukleových kyselin, se může použít při hybridízací s několika sondami a/nebo je možné použít více sond. Připraví se vzorky nukleových kyselin a provede se hybridizace na nylonových membránách nebo na jiných vhodných podkladech. Každou membránu lze použít několikrát. Formát 1 je zvláště účinný při zpracování velkého množství vzorků.
V případě způsobu SBH Formát 2 se sondy nanesou na určité pozice v substrátu, které odpovídají jejich sekvencím a značené fragmenty vzorku nukleových kyselin hubridizují se sondami. V tomto případě se informace o sekvenci fragmentu mohou stanovit současnou hybridizační reakcí se všemi sondami.
V případě sekvenování jiných fragmentů nukleových kyselin se může použít stejné uspořádání oligonukleotidů. Uvedeného uspořádání lze dosáhnout nanesením sond nebo jejich in šitu syntézou.
V případě SBH Formát 3 se používají dvě sady sond.
V jednom provedení sada může být ve formě souboru, kde sondy se nachází ve známých pozicích, a jiné provedení je, že značená sada se může uchovávat na plotnách s více prohlubněmi.
V tomto případě se cílová nukleová kyselina nemusí značit. Cílová nukleová kyselina a jeden nebo více značených sond se přidají k připraveným sadám sond.
přichycená a jedna značená sonda nukleovou kyselinou jsou kovalentně ligovány detekovatelná sekvence rovnající se součtu délky ligovaných sond. Tento způsob umožňuje sekvenování dlouhých fragmentů nukleových kyselin, například bakteriální genom, aniž je nutné sub-klónování menších kousků.
V případě, hybridizuj í že jedna s cílovou a vzniká • · · · • ·
V případě vynálezu se způsob SBH aplikuje z důvodu účinné identifikace a sekvenování jednoho nebo více vzorků nukleových kyselin. Tento způsob nachází řadu uplatnění při diagnostice za pomocí nukleových kyselin, v soudnictví a při mapování genů. Tento způsob lze také použít při identifikaci mutací odpovědných za genetické vady a jiné chyby, při stanovení biodiverzity a k produkci řady jiných typů informací závislých na sekvenci nukleových kyselin.
Podstata vynálezu
Vynález popisuje způsob detekce druhů cílových nukleových kyselin, který zahrnuje kroky: přípravu souboru sond fixovaných k substrátu a přípravu množství sond, kde každá značená sonda se vybrala tak, aby měla první sekvenci nukleové kyseliny, která je komplementární s první částí cílové nukleové kyseliny a kde sekvence nukleové kyseliny alespoň jedné sondy fixované k substrátu je komplementární s druhou částí sekvence cílové nukleové kyseliny, přičemž druhá část sousedí s první částí; cílová nukleová kyselina se aplikuje k souboru za podmínek, které jsou vhodné pro hybridizaci sekvencí sond s komplementárními sekvencemi; značená sonda se aplikuje na soubor; dojde k hybridizaci sondy fixované k substrátu s cílovou nukleovou kyselinou; dojde ke spojení značené sondy se sondou v souboru, která hybridizovala v těsném sousedství; a proběhne detekce značené sondy spojené se sondou v souboru. Podle preferovaných metod podle vynálezu soubor sond fixovaných k substrátu obsahuje univerzální sadu sond.
Vzhledem k jiným aspektům vynálezu alespoň dvě sondy fixované k substrátu definují překrývající se sekvence cílové sekvence nukleové kyseliny. Výhodnější je, když alespoň dvě značené sondy definují překrývající se sekvence sekvencí cílových nukleových kyselin.
• · ·
Vynález dále popisuje způsob detekce cílové nukleové kyseliny se známou sekvencí, který zahrnuje kroky: kontakt vzorku nukleové kyseliny se sadou imobilizovaných oligonukleotidových sond přichycených k pevnému substrátu za podmínek hybridizace, kdy imobilizovaná sonda je schopna specificky hybridizovat s různými částmi uvedené sekvence cílové nukleové kyseliny; kontakt cílové nukleové kyseliny se sadou značených oligonukleotidových sond v roztoku za podmínek hybridizace, kdy značené sondy jsou schopny specificky hybridizovat s různými částmi uvedené sekvence cílové nukleové kyseliny sousedící s imobilizovanými sondami; kovalentní spojení imobilizovaných sond se značenými sondami, které na cílové sekvenci bezprostředně s imobilizovanými sondami (například pomocí odstranění libovolné značené detekce přítomnosti cílové sousedí ligázy); ligována; detekcí sondy, která není nukleové kyseliny přítomnosti uvedené značené sondy spojené s imobilizovanými sondami. Vynález dále popisuje způsob stanovení exprese člena sady částečně nebo zcela sekvenovaných genů v určitém typu buňky, ve tkáni nebo ve směsi tkání, který zahrnuje kroky: definování párů fixované a značené sondy, které jsou specifické pro sekvenovaný gen; hybridizace vzorku neznačené nukleové kyseliny a odpovídajících značených sond s jednou sondou nebo s více soubory fixovaných sond; vznik kovalentních vazeb mezi značenou a fixovanou sondou, které hybridizují bezprostředně vedle sebe; odstranění neligovaných sond a stanovení přítomnosti sekvenovaného genu detekcí značených sond vázaných na předem určené pozice v souboru. V preferovaném provedení vynálezu cílová nukleová kyselina bude identifikovat přítomnost infekčního činidla.
Dále vynález popisuje soubor oligonukleotidových sond obsahujících nylonovou membránu; více sub-souborů oligonukleotidových sond na nylonové membráně, sub-soubor obsahující více jednotlivých spotů, kde každý spot obsahuje • · • · ·· · ·· ·· • · · · · · • · · · · · · více oligonukleotidových sond stejné sekvence; a více hydrofóbních bariér umístěných mezi jednotlivými soubory na nylonové membráně, přičemž více hydrofóbních bariér působí jako prevence při zkřížené kontaminaci mezi sousedními soubory.
Vynález dále popisuje způsob sekvenování repetice s prvním a druhým koncem, v cílové sekvenci, který zahrnuje kroky: (a) přípravu velkého množství mezerníkových oligonukleotidů různých délek, přičemž oligonukleotidy mezerníku obsahují repetice; (b) přípravu prvního oligonukleotidu, který sousedí s prvním koncem repetice; (c) přípravu velkého množství druhých oligonukleo.tidů, z nichž jeden sousedí s druhým koncem repetice, přičemž tyto druhé oligonukleotidy jsou značené; (d) hybridizaci prvního a velkého množství druhých oligonukleotidů a jednoho s velkého množství mezerníkových oligonukleotidů s cílovou nukleovou kyselinou; (e) ligování hybridizováných oligonukleotidů; (f) oddělení ligovaných oligonukleotidů od neligovaných nukleotidů a (g) detekci značek u ligovaných nukleotidů.
Vynález dále popisuje způsob sekvenování sekvence bodu překřížení, která má první a druhý konec v cílové nukleové kyselině zahrnující kroky: (a) přípravu prvního oligonukleotidu, který je komplementární s první částí sekvence bodu překřížení, přičemž první oligonukleotid se prodlouží od prvního konce sekvence bodu překřížení alespoň o jeden nukleotid; (b) přípravu velkého množství druhých oligonukleotidů, které jsou značeny a jsou komplementární s druhou částí sekvence bodu překřížení, přičemž druhé oligonukleotidy se prodlouží od druhého konce sekvence bodu překřížení alespoň o jeden nukleotid a část druhých oligonukleotidů, které se prodlouží od druhého konce sekvence bodu překřížení obsahuje sekvence, které jsou komplementární s velkým množstvím sekvencí, které vznikají ze sekvence bodu překřížení; (c) hybridizaci prvního oligonukleotidu a jeden • · • ·
z velkého množství druhých oligonukleotidů s cílovou DNA; (d) ligaci hybridizovaných oligonukleotidů; (e) separace ligovaných oligonukleotidů od neligovaných oligonukleotidů a (f) detekci značek ligovaných oligonukleotidů.
Vynález dále popisuje způsob potrvzení sekvence za použití sond, o nichž se předpokládá, že jsou negativní v případě cílové nukleové kyseliny. Sekvence cílové nukleové kyseliny se pak potvrzuje hybridizací cílové nukleové kyseliny „negativními sondami, aby se potvrdilo, že tyto sondy netvoří perfektní párování s cílovou nukleovou kyselinou.
Vynález dále popisuje způsob analýzy nukleové kyseliny za použití oligonukleotidových sond, které tvoří komplex s různými značkami tak, že sondy se mohou v hybridizační reakci znásobit, aniž se ztratí informace o sekvenci ( to znamená, že různé sondy mají různé značky, což umožňuje, že se může rozlišit hybridizace různých sond s cílovou nukleovou kyselinou). V preferovaném provedení vynálezu se jako značky používají radioizotopy nebo fluorescenční molekuly nebo enzymy nebo elektroforové hmotnostní značky. Ve více preferovaném provedení se u metody SBH formátu III používají různě značené oligonukleotidové sondy, přičemž se dohromady liguje řada sond (více jak dvě, přičemž jedna sonda je imobilizována).
Vynález dále popisuje způsob detekce přítomnosti cílové nukleové kyseliny se známou sekvencí v případě, že se jí ve vzorku ve srovnání s homologickými nukleovými kyselinami nachází velmi malé množství. V preferovaném provedení vynálezu cílová nukleová kyselina je alela, která je ve vzorku přítomná ve velmi malé frekvenci, přičemž vzorek obsahuje nukleové kyseliny s velkého počtu zdrojů. V jiném preferovaném provedení vynálezu cílová nukleová kyselina vykazuje mutovanou sekvenci a ve vzorku nukleových kyselin se vyskytuje s velmi nízkou frekvencí.
Vynález dále popisuje způsob potvrzení sekvence cílové nukleové kyseliny za použití sekvenováni na gelu s jedním • · η ···* ······ / · ·········· • · · » · · ·····» ··· ·· ·· ·, přechodem, Primery pro tento způsob sekvenování se odvodily ze sekvence získané pomocí SBH. Tyto primery se používají v případě standardních sekvenačních reakcí podle Sangera, kdy na gelu vzniká informace o sekvenci cílové nukleové kyseliny. Aby se potvrdila správnost sekvence, sekvence získaná metodou sekvenování na gelu s jedním přechodem se porovnává se sekvencí odvozenou metodou SBH.
Vynález popisuje způsob řešení bodu překřížení za použití sekvenování na gelu s jedním přechodem. Primery pro sekvenační reakce se získaly z konců Sfs získaných po prvním kole sekvenování metodou SBH. Tyto primery se pak používají při standardních sekvenačních reakcích podle Sangera, přičemž vzniká sekvenční informace na gelu o bodech překřížení Sfs. Sfs jsou pak uspořádány, aby se mohlo provést porovnání s výsledky sekvenování podle Sangera, z bodu překřížení až k Sfs, přičemž se identifikuje sousední Sfs.
Vynález dále popisuje způsob přípravy vzorku, který obsahuje cílové nukleové kyseliny pomocí PCR. Produkty PCR se před reakcemi SBH nemusí čistit. V případě SBH formát I se surové produkty PCR aplikují do substrátu, aniž se před tím čistí. Substrát se může před zavedením značených sond promýt.
Vynález dále popisuje způsob a zařízení pro analýzu cílové nukleové kyseliny. Zařízení zahrnuje dva soubory nukleových kyselin, které se smísí v požadovaném okamžiku. V preferovaném provedení vynálezu jsou nukleové kyseliny v jednom souboru značené. Ve výhodnějším provedení vynálezu se mezi uvedené dva soubory vkládá materiál, který působí preventivně smíchání nukleových kyselin obou souborů. V případě, že se materiál odstraní nebo se stane průchodným, nukleové kyseliny obou souborů se smísí dohromady. V jiném preferovaném provedení vynálezu nukleové kyseliny jednoho souboru jsou cílovými nukleovými kyselinami a nukleové kyseliny druhého souboru jsou oligonukleotidové sondy. V jiném preferovaném provedení vynálezu nukleové kyseliny obou souborů jsou oligonukleotidové • ·
sondy. U jiného preferovaného provedení vynálezu nukleové kyseliny jednoho souboru se tvoří oligonukleotidové sondy a cílové nukleové kyseliny a nukleové kyseliny druhého souboru jsou oligonukleotidové sondy. V jiném preferovaném provedené vynálezu nukleové kyseliny obou souborů jsou oligonukleotidové sondy a cílové nukleové kyseliny.
Jeden způsob podle vynálezu používající zařízení popsané shora v textu zahrnuje kroky: přípravu souboru nukleových kyselin fixovaných na substrát, přípravu druhého souboru nukleových kyselin, navození podmínek, které umožňují nukleovým kyselinám ve druhém souboru dostat se do kontaktu s nukleovými kyselinami fixovaného souboru, kde jeden ze souborů nukleových kyselin jsou cílové nukleové kyseliny a druhý soubor jsou oligonukleotidové sondy. Posledním krokem je analýza výsledků hybridizace. V preferovaném provedení vynálezu fixovaným souborem je cílová nukleová kyselina a druhým souborem jsou značené oligonukleotidové sondy. Ve výhodnějším provedení vynálezu se mezi oba soubory vkládá materiál, který brání promíchání nukleových kyselin do okamžiku, kdy se materiál odstraní nebo se stane průchozím pro nukleové kyseliny.
Druhý způsob podle vynálezu používající zařízení popsané shora v textu zahrnuje kroky: přípravu dvou souborů sond nukleových kyselin, přípravu podmínek, které umožňují, aby dva soubory sond se dostaly do vzájemného kontaktu a do kontaktu s cílovou nukleovou kyselinou, ligaci sond, které spolu sousedí na cílové nukleové kyselině, a analýzu výsledků. V preferovaném provedení vynálezu jsou sondy v jednom souboru fixované a sondy ve druhém souboru jsou značené. Ve výhodnějším provedení vynálezu se mezi oba soubory vkládá materiál, který brání smíchání sond do okamžiku, kdy se materiál odstarní nebo se stane pro sondy průchozím.
• · · · « • · · ♦ · • · · * · • · · · · · a
SBH Formát 1 je vhodný pro současnou analýzu velké sady vzorků. Paralelní testování tisíců vzorků ve velkém souboru se může provést tisíci nezávislými hybridizačními reakcemi za použití malých kousků membrán. Identifikace DNA může zahrnovat 1 až 20 sond na reakci a identifikace mutací může v některých případech zahrnovat více jak 1 000 sond, které jsou vybrány nebo navrženy specificky pro každý vzorek. V případě identifikace podstaty mutovaných segmentů DNA se mohou pro každou mutaci detekovatelnou v prvním kole hybridizací syntetizovat nebo vybrat specifické sondy.
Vzorky DNA se mohou připravit do malých souborů, které se mohou oddělit vhodnými mezerníky a mohou se současně testovat sondami vybranými ze sady oligonukleotidů, které se mohou uspořádát na plotny s velkým počtem prohlubní. Malý soubor může obsahovat jeden nebo více vzorků. Vzorky DNA na každém malém souboru mohou zahrnovat mutanty nebo jednotlivé vzorky sekvence. Konzekutivní malé soubory se mohou poskládat do většího souboru. Takové větší soubory mohou zahrnovat repliky stejných malých souborů nebo mohou zahrnovat soubory vzorků různých fragmentů DNA. Univerzální sada sond zahrnuje dostatek sond, aby se provedla analýza fragmentů DNA s předem specifikovanou přesností, například s ohledem na redundanci čtení každého páru baží („bp) . Tyto sady mohou zahrnovat sondy, které jsou nezbytné pro testování jednoho specifického fragmentu, ale mohou také zahrnovat několik sond, které jsou nutné pro testování tisíce vzorků DNA s různými sekvencemi.
Identifikace DNA nebo alel a diagnostické sekvenční postupy mohou zahrnovat kroky:
1) Výběr sady sond pro reprezentativní nebo univerzální sadu, které budou hybridizovat s každým z velkého množství malých souborů;
2) Přidání první sondy ke každému sub-uspořádání každého souboru, které se paralelně analyzují;
3) Provedení hybridizace a vyhodnocení výsledků hybridizace;
4) Odstranění dříve použitých sond;
5) Opakovaná hybridizace, vyhodnocení výsledků hybridizace, odstranění dříve použitých sond;
6) Zpracování získaných výsledků pro účely celkové analýzy nebo pro stanovení dalších sond pro hybridizaci;
7) Provedení dalších hybridizaci jistých sub-uspořádání;
a
8) Zpracování celých sad dat a získání konečné analýzy.
Tento přístup poskytuje rychlou identifikaci a sekvenaci malého počtu vzorků nukleových kyselin jednoho typu (např. RNA, DNA) a také umožňuje paralelní analýzu řady typů vzorku ve formě sub-uspořádání za použití předem syntetizované sady sond ovlivnitelné velikosti. Aby vznikl účinný a přizpůsobivý postup pro stanovení identity DNA, pro DNA diagnostiku a identifikaci mutací kombinovaly se dva přístupy.
V případě identifikace známých sekvencí se může místo delší jediné sondy použít malá sada kratších sond. Při tomto přístupu, ačkoli se zde vyskytuje více testovaných sond, se může syntetizovat univerzální sada sond, které pokryjí všechny typy sekvencí. Celá sada šestimérů zahrnuje pouze 4 096 sond a celá sada sedmimérů zahrnuje pouze 16 384 sond.
Úplné sekvenování fragmentu DNA se může provést ve dvou hybridizačních stupních. V prvním stupni hybridizuje dostatečné množství sond, které pokrývají každou bázi alespoň jednou. Pro tyto účely se může syntetizovat specifická sada sond. Výsledky hybridizace takové sady sond ukazují, zda a kde se u standardních vzorků vyskytují mutace (rozdíly). Tato sada sond může zahrnovat „negativní sondy. Za účelem stanovení shody změn, se vzorkem mohou hybridizovat další specifické sondy. Tato přídavná sada sond bude obsahovat jak pozitivní • ·
tak negativní sondy. Změny sekvencí se stanoví pozitivními sondami a potvrdí se negativními sondami.
V jiném provedení vynálezu se mohou použít všechny sondy z univerzální sady. Univerzální sada sond umožňuje použití relativně malého množství sond na jeden vzorek ve dvou stupňovém postupu, aniž se zbytečně vynakládá čas. Proces hybridizace může zahrnovat dva kroky. První je navržení optimální sady sond, které budou hybridizovat jako první, a pak na základě získaných výsledků se stanoví další sondy, které se použijí vedle sond univerzální sady. Obě sady sond obsahují negativní sondy, které potvrzují pozitivní sondy v sadě. Získaná sekvence se pak může potvrdit v kroku separace hybridizací vzorku se sadou negativních sond identifikovaných na základě výsledků SBH.
Při sestavováni sekvence metodou SBH K -1 oligonukleotidy, které se opakovaně vyskytují v analyzovaných fragmentech DNA, jsou důvodem, aby se staly předmětem zvláštní pozornosti. Jestliže neexistují další informace, mohou se sestavit relativně malé fragmenty DNA tak, že každý pár baží se čte několikrát.
Při sestavování relativně dlouhých fragmentů může dojít k dvoj smyslností, což je způsobeno opakovaným výskytem pozitivně hybridizujících sond sady v sekvenci K -1 (to znamená, že sekvence je kratší než délka sondy). K tomuto problému nedochází , jestliže se stanoví mutované nebo podobné sekvence (to znamená, že sekvence K-l není identicky opakovaná). Znalost jedné sekvence se může použít jako templát za účelem správného sestavení sekvence, o které se ví, že je podobná (například na základě jejího zařazení v databázi), uspořádáním pozitivních sond pro známou sekvenci, aby se ukázalo nej lepší uspořádání na templátu.
Použití souboru vzorků předchází nepřetržitému skórování řady oligonukleotidů na jediném vzorku nebo v malé sadě vzorků. Tento přístup umožňuje paralelní skórování řady sond • «
manipulací jediného fyzikálního objektu. Sub-uspořádání vzorků DNA s délkou 1 000 bp se může sekvenovat v relativně krátkém čase. Jestliže vzorky se nanesou do 50 sub-uspořádání v souboru a soubor se 10 krát testuje sondou, může se použít 500 sond. Při testování výskytu mutace se může použít dostatek sond po pokrytí každé báze třikrát. Jestliže je přítomna mutace, bude postižena několik sond. Použití informace o identitě negativních sond může mapovat mutaci s přesností dvou baží. Při řešení mapování mutace jediné báze tímto způsobem, se může použít dalších 15 sond. Tyto sondy pokrývají libovolnou kombinaci bází ve dvou testovaných pozicích (za předpokladu, že nezahrnují delece nebo inzerce). Tyto problémy se mohou objevit v jednom cyklu na 50 sub-uspořádání, které obsahuje daný vzorek. Při realizaci vícenásobného schématu značeného barvou se může dohromady použít dvě až šest sond, kdy každá je značena odlišným způsobem, jako jsou například různá fluorescenční barviva. Tento přístup snižuje počet hybridizačních cyklů a zkracuje postup sekvenování.
U více komplikovaných případů mohou existovat dvě blízké mutace nebo inzerce. Pak se může použít více sond. Inzert se třemi bázemi se může identifikovat za použití 64 sond. U nejvíce komplikovaných případů se může použít několika stupňové hybridizace a na základě výsledků předchozí hybridizace se může vybrat nová sada sond.
Jestliže analyzované sub-uspořádání obsahuje desítky nebo stovky vzorků jednoho typu, pak se může zjistit, že několik z nich obsahuje jednu nebo více změn (mutace, inzerce nebo delece). V případě každého segmentu, kde se objevila mutace, se může použít specifická sada sond. Celkový počet sond, který se použije v případě jednoho typu vzorku, je několik stovek. Při paralelním testování replik souborů se uplatňují stovky sond v relativně malém počtu cyklů. Navíc je možné kompatibilní sondy spojit. Pozitivní hybridizace se může vykázat v souvislosti se sondami, které se vybraly, aby se • · testovaly určité segmenty DNA, protože tyto segmenty se obvykle liší v 75 % jejich baží.
Když se použije větší sada delších sond, mohou se analyzovat delší cílové nukleové kyseliny. Tyto cílové nukleové kyseliny mohou reprezentovat směs fragmentů, jako je směs klonů exonů.
Při definování přítomnosti mutantů v segmentu genomu, který má být sekvenován z diploidní chromozomální sady, se může použít specifická metoda hybridizace. Existují dvě variace: i) sekvence z jednoho chromozomu reprezentuje známou alelu a sekvence z druhého chromozomu reprezentuje nový mutant; nebo ii) oba chromozomy obsahují nové, ale odlišné mutanty. V obou případech skenovací krok, který se navrhl, aby mapoval změny poskytuje v místě mutace dvojnásobný maximální rozdíl signálu. Způsob se dále může použít při identifikaci alel genu nesených jedincem nebo při stanovení, zda jedinec je v případě uvedeného genu homozygotní nebo heterozygotní.
Získání dvounásobných rozdílů signálu nutné v prvním případě se může účinně dosáhnout porovnáním odpovídajících signálů s homozygotními nebo heterozygotními kontrolami. Tento přístup umožňuje v daném vzorku stanovit relativní zeslabení hybridizačního signálu v případě každé určité sondy. To je podstatné, protože účinnost hybridizace může v případě určité sondy hybridizované s různými fragmenty nukleových kyselin, které mají stejný zcela párovaný cíl, kolísat více než dvojnásobně. Navíc různá místa mutace může ovlivnit víc jak jedna sonda v závislosti na počtu oligonukleotidových sond. Zeslabení signálu v případě dvou až čtyř po sobě jdoucích sond produkuje podstatnější indikaci mutantního místa. Výsledky se mohou kontrolovat testováním malé sady vybraných sond, mezi kterými jedna nebo několik sond poskytuje signál úplného párování, jenž je v průměru osmkrát silnější, než jsou signály vycházející s duplexů obsahujících chybné párování.
Oddělené membrány umožňují velmi flexibilní organizaci experimentů za účelem provedení relativně velkého počtu vzorků, které reprezentují daný typ sekvence, nebo řadu odlišných typů vzorků reprezentovaných relativně malým počtem vzorků. S dostatečnou účinností se může zpracovat rozmezí 4 až 256 vzorků. Sub-uspořádání v tomto rozmezí počtu bodů se může navrhnou tak, aby odpovídala konfigurace a velikost standardních destiček s prohlubněmi, které se používají při skladování a značení oligonukleotidů. Velikost sub-souborů se může přizpůsobit různému počtu vzorků nebo se může použít několik standardních velikostí. Jestliže se všechny vzorky určitého typu nevejdou na jedno sub-uspořádání, může se použít další sub-uspořádání nebo membrány a ty se mohou zpracovat použitím stejných sond. Navíc upravením počtu replik každého sub-uspořádání se čas provedení identifikace nebo procesu sekvenování může lišit.
Termín „intermediární fragment znamená oligonukleotid s délkou mezi 5 a 1 000 bázemi a upřednostňuje se délka mezi 10 a 40 bp.
V případě Formátu 3 je první sada nukleotidových sond známé sekvence imobilizována na pevném podkladu za podmínek, které jim umožňují hybridizovat s nukleovými kyselinami, které mají komplementární sekvence. Značená druhá sada oligonukleotidových sond se vyskytuje v roztoku. V obou sadách a mezi sadami se mohou vyskytovat sondy stejné nebo odlišné délky. Nukleová kyselina, která se má sekvenovat, nebo její intermediární fragmenty se mohou aplikovat na první sadu sond ve dvouřetězcové formě (zvláště, když je přítomen protein recA, hybridizace se provádí za podmínek, které nejsou denaturační) nebo b jednořetězcové formě a za podmínek, které umožňují hybridy různého stupně komplementarity (například za podmínek, které umožňují diskriminaci mezi hybridy s úplným párováním a hybridy s chybným párováním jedné báze). Sekvenovaná nukleová kyselina nebo její intermediární » r · · · · fragmenty se mohou aplikovat na první sadu sond před, po nebo současně s druhou sadou sond. Sondy, které se váží na sousedící místa cílové nukleové kyseliny se spojují dohromady (například staking interakcemi, ligací nebo jinými způsoby, které způsobují tvoření chemické vazby mezi sousedícími sondami). Po té, co dojde ke spojení sousedních sond, fragmenty a sondy, které nejsou imobilizované na povrchu chemickou vazbou na člena první sady sondy, se odstraní promytím. Například se může použít promývací roztok při vysoké teplotě (až 100 °C) , při které hybridy denaturují. Navázané sondy z druhé sady se pak mohou detekovat za použití způsobů, které jsou vhodné pro použitý typ značení (což může být chemiluminiscenční, fluorescenční, radioaktivní, enzymatické, denzitometrické nebo elektroforové hmotnostní značení).
Nukleotidové báze „ se párují nebo jsou „komplementární, jestliže tvoří stabilní duplex vodíkovou vazbou za specifikovaných podmínek. Například za podmínek, při kterých běžně probíhají hybridizace, se adenin (A) spojuje s thyminem (T) , ale nikoli s guaninem (G) nebo s cytozinem (C) . Podobně G se páruje s C, ale ne- s A nebo s T. Jiné báze, které se spojují vodíkovou vazbou méně specifickým způsobem, jako je inosin nebo univerzální báze („M báze, Nichols et al., 1994) nebo jiné modifikované báze, jako jsou například metylované báze, jsou komplementární s těmi bázemi, se kterými tvoří za specifických podmínek stabilní duplex. Když se v případě sondy řekne, že je „zcela komplementární nebo „zcela zpárovaná, znamená to, že každá báze sondy tvoří vodíkovou vazbou duplex s bází nukleové kyseliny, která se bude sekvenovat, podle pravidla párování bázi podle Watsona a Cricka ( to znamená, že nedochází k žádným okolním účinkům sekvence, vytvořený duplex má maximální vazebnou energii v případě určité sondy). Termín „zcela komplementární „ a „zcela zpárovaný se také používá v případě sond, které mají analogy nebo modifikované nukleotidy. Termín „zcela zpárované v případě analogu nebo modifikovaného nukleotidu se posuzuje podle „pravidla úplného párování vybraného pro tento analog nebo modifikovaný nukleotid (například vazebný pár, který má maximální vazebnou energií pro určitý analog nebo nukleotid). 0 každé bázi v sondě, která netvoří vazebný pár podle pravidla, se řekne, že je za specifických hybridizačních podmínek „ chybně párována.
Může se sestavit seznam sond, z nichž každá se zcela páruje s nukleovou kyselinou, jenž se bude sekvenovat. Sondy uvedené na seznamu se pak mohou analyzovat, aby se seřadily podle maximálního překryvu. Takové uspořádání se může provést srovnáním první sondy s každou další sondou na seznamu, aby se zjistilo, která sonda má 3'-konec, který má nejdelší sekvenci baží na 5'konci druhé sondy. První a druhá sonda se pak mohou překrývat a postup se může opakovat srovnáním 5'konce druhé sondy s 3'koncem všech zbývajících sond a srovnáním 3'-konce první sondy s 5'-koncem všech zbývajících sond. Proces může pokračovat až do okamžiku, kdy se na seznamu nevyskytují sondy, které se nepřekrývají s jinými sondami.
V jiném případě se může ze seznamu pozitivních vybrat víc jak jedna sonda a může se paralelně připravit více jak jedna sada překrývajících se sond („sekvenční jádro). Seznam sond pro libovolný takový postup sestavení sekvence může tvořit seznam všech sond, které jsou zcela komplementární s nukleovou kyselinou, která se má sekvenovat nebo to může být libovolná jeho část.
5'a 3'konce sond se mohou překrývat za vzniku delší sekvence. Tento postup sestavování sond pokračuje až se objeví nejednoznačnost vzhledem k bodu překřížení (sonda se ve fragmentu opakuje), vzhledem k tomu, že repetice je delší než sonda nebo vzhledem k segmentu, který nelze klonovat. Sekvence mezi dvěma nejednoznačnostmi se označují jako fragment subklónované sekvence (Sfs). Když se v uspořádání sekvence objeví dvoj smysl způsobený dostupností alternativních vhodných • · • · · · ·· ··· ··· • · · · · · ··· ·· ·· ·· překryvů se sondami, pak se může použít hybridizace s delšími sondami, která překlene místo překrývajících se alternativ, konkurenční hybridizace, ligace alternativního konce s koncovými páry sondy, což překlene místo nejednoznačnosti nebo analýza na gelu s jedním přechodem (aby došlo k jednoznačnému uspořádání Sfs) .
Použitím shora uvedených postupů lze z paternu hybridizace s překrývajícími se nebo nepřekrývajícími se sondami získat libovolný požadovaný stupeň sekvence (které může odpovídat identitě vzorku nukleové kyseliny, což slouží jako podpis pro identifikaci vzorku nukleové kyseliny) až po sestavenou Sfs a sestavit sekvenci pro intermediální fragment nebo celou zdrojovou molekulu DNA (například chromozom).
Sekvenování může v obecném případě obsahovat následující kroky:
(a) kontakt souboru imobilizováných oligonukleotidových sond s fragmentem nukleové kyseliny za podmínek, které umožňují, aby fragment tvořil primární komplex s imobilizovanou sondou, jenž vykazuje komplementární sekvenci;
(b) kontakt tohoto primárního komplexu se sadou značených oligonukleotidových sond v roztoku za podmínek, které umožní, aby primární komplex hybridizoval se značenou sondou, přičemž se tvoří sekundární komplexy, kde fragment hybridizuje s imobilizovanou a značenou sondou;
(c) od sekundárního komplexu se oddělí libovolná značená sonda, která nehybridizovala do polohy sousedící s imobilizovanou sondou;
(d) detekce přítomnosti přilehlé značené a neznačené sondy tím, že se detekuje přítomnost značení a (e) stanovení nukleotidové sekvence fragmentu spojením známé sekvence imobilizované a značené sondy.
Podmínky hybridizace a promývání se mohou vybrat tak, aby se detekovaly zcela spárované hybridy (takové, kde fragment a sonda hybridizuje v šesti ze sedmi pozic). Podmínky hybridizace se mohou zvolit tak, aby umožnily diferenciaci úplného párování a nesprávného párování jednoho páru baží nebo se mohou vybrat tak, aby umožnily detekci hybridů s úplným párováním.
Vhodné podmínky hybridizace se mohou rutině stanovit postupy optimalizace nebo na základě pilotních studií. Takové postupy jsou pro odborníka rutinou a odborník může sestavit protokol pro použití v laboratoři. Uvedený protokol se popisuje například v publikaci Ausubel et al., Current Protocols in Molecular Biology, Vol. 1-2, John Wiley and Sons (1989); Sambrook et al·., Molecular Cloning, A Laboratory Manual, 2nd Ed., Vols. 1-3, Cold Springs Harbor Press (1989) a Maniatis et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1982). Podmínky, jako je teplota, koncentrace komponentů, doba hybridizace a promývání, komponenty pufrů a jejich pH a iontová síla, se mění.
V provedení vynálezu, kde značené a imobilizované sondy nejsou fyzikálně nebo chemicky spojeny se může detekce opírat o kroky promývání při řízených striktních podmínkách. V případě takových podmínek sousedící sondy vykazují zvýšenou vazebnou afinitu staking interakcí. Tiby se optimalizoval shora popsaný proces, podmínky se mohou měnit.
V provedení vynálezu, kde dochází k ligaci imobilizovaných a značených sond, se může ligace uskutečnit chemickým ligačním činidlem (například ve vodě rozpustný karbodiimid nebo bromkyán) nebo ligačním enzymem, jako je komerčně dostupná T4 DNA ligáza. Podmínky promývání se mohou vybrat tak, aby se odlišily sousedící nebo nesousedící značené nebo imobilizované sondy, přičemž se využívá rozdílu ve stabilitě sousedících a nesousedících sond.
• · · · · »···.»---1 y · · * · · ·· ··· ··· ··· ·· ·· ··
Oligonukleotidové sondy se mohou značit fluorescenčními barvivý, chemoluminiscenčními systémy, radioaktivním značením (například 35S, 3H, 32P, nebo 33P) nebo izotopy detekovatelnými hmotnostní spektrometrií.
V případě, že molekula nukleové kyseliny neznámé sekvence je delší než přibližně 45 nebo 50 bp, může se rozdělit na fragmenty a stanoví se sekvence fragmentů. Fragmentace se může provést štěpením restrikčními enzymy , střihem nebo NaOH. Aby se získaly fragmenty s preferovanou délkou, což je přibližně 10 až 40 bp ragmenty, mohou se fragmenty separovat na základě velikosti (například elektroforézou na gelu).
Oligonukleotidy se mohou imobilizovat řadou způsobů, které jsou dobře známy v oboru, jako je laserem aktivovaná fotodeprotekční zachycení přes fosfátovou skupinu za použití činidla, jako je nukleozidhydrogenfosforát. Jako podklad se může použít sklo, nylon, silikon a fluorokarbon.
Oligonukleotidy se mohou uspořádat do souboru a tyto soubory mohou zahrnovat všechny sondy nebo sub-sadu všech sond dané délky nebo sady sond zvolených délek. Hydrofobní dělení se může použít při separaci sond nebo k sestavení subuspořádání sond. Mohou se navrhnout sobory pro různá použití (například mapování, částečné sekvenování, sekvenování cílových oblastí pro diagnostické účely, sekvenování mRNA a sekvenování ve velkém měřítku). Může se navrhnout specifický čip, který je určen pro určité aplikace, kde se požaduje výběr kombinací sond a jejich uspořádání na substrátu.
Například se může zkonstruovat 1 024 souborů imobilizovaných sond všech oligonukleotidových sond, jejichž délku tvoří 5 bází. Sondy v tomto příkladu jsou v informačním smyslu 5-méry (ve skutečnosti mohou být delší). Druhá sada obsahující 1 024 5-mérových sond se může značit a každá značená sonda se může aplikovat na soubor imobilizovaných sond spolu se sekvenovaným fragmentem. V tomto příkladu se bude kombinovat 1 024 souborů za vzniku super souboru nebo „super čip. V těchto případech, kdy imobilizovaná sonda a značená sonda hybridizuje konec s koncem spolu s fragmentem nukleové kyseliny, obě sondy se spojí například ligaci a po odstranění nevázaného značení se 10-méry, které jsou komplementární s fragmentm vzorku, detekují na základě korelace přítomnosti značky v bodě souboru, který obsahuje imobilizovanou sondu známé sekvence, na kterou se aplikovala značená sonda známé sekvence. Sekvence fragmentu vzorku je jednoduše sekvence imobilizované sondy, která pokračuje v sekvenci značené sondy. Tímto způsobem se může testovat jeden milion možných 10-mérů. Uvedený postup využívá pouze 5-méry a tak se v případě syntézy oligonukleotidů vynakládá jedna tisícina úsilí.
Aby se zabránilo hybridizací sekundární struktury ve vzorku, vzorek sekvenované nukleové kyseliny se může rozdělit na fragmenty nebo se může upravit jiným způsobem (například použitím recA) . Vzorek se může rozdělit na fragmenty například štěpením restrikčním enzymem, jako je CviJI, fyzikálním střihem (například ultrazvukem) nebo aplikací NaOH. Výsledné fragmenty se mohou separovat na gelu elektroforézou a fragmenty vhodné délky, která se pohybuje mezi přibližně 10 bp a 40 bp se mohou z gelu extrahovat.
Soubor SBH Formátu 3 se může připravit zavedením štěpitelné vazby mezi fixovanou a značenou sondu a pak po proběhnutí metody Formátu 3 se rozštěpením známé vazby analýza ukončí. Jako značená sonda se mohou použít ribonukloetidy a nebo se ribonukleotid může použít jako spojovací báze v případě značené sondy tak, že tato sonda se může následně odstranit například RNázou nebo aplikací uracil-DNAglykosylátu nebo NaOH. Navíc vazby vzniklé chemickou ligaci se mohou selektivně štěpit.
Různé variace provedení vynálezu zahrnují použití modifikovaných nukleotidů, za účelem růstu specifity nebo účinnosti, hybridizace v několika cyklech za účelem zesílení hybridizačního signálu. Příkladem je provedeni cyklu • * • Μ ·«= ·· · · · · ♦ · » · *· · · · “ * · « · » ·· ·· ······ • « “ · · · ·
22. ······ ·«··· · · ·· hybridizace za podmínek (například teplota) optimálně vybraných pro první sadu značených sond, po kterém následuje hybridizace za podmínek optimálně vybraných pro druhou sadu značených sond. Posuny ve čtecím rámci se mohou stanovit za použití směsí (upřednostňují se směsi equimolárního množství) sond končící každou ze čtyř nukleotídových baží A, T, C a G.
Body překřížení produkují nejednoznačnost, co se týká uspořádání sekvence fragmentu. Ačkoli sekvenční informace je stanovená metodou SBH buď (i) dlouhou čtecí délkou, kdy sekvenování na gelu s jedním přechodem tvoří pouze část nákladů úplného sekvenování na gelu nebo (ii) porovnání s příbuznými sekvencemi, což se může použít za účelem získání hybridizačních dat v případě, kde se objevují takové nejednoznačnosti (body překřížení). Primery pro sekvenování na gelu s jedním přechodem přes body překřížení se určily ze sekvenčních informací získaných metodou SBH nebo ze sekvencí známého vektoru, například sekvence lemující místa začlenění do vektoru. Na vzorku nukleové kyseliny se provedly standardní sekvenační reakce podle Sangera. Aby se určilo pořadí Sfs, sekvence získaná sekvenováním na gelu s jedním přechodem se porovnala s Sfs, která se čte uvnitř a vně bodu překřížení. V jiném případě se pořadí Sfs může stanovit na základě porovnání sekvence Sfs s příbuznými sekvencemi a Sfs se pak sestaví za vzniku sekvence, která je nejblíže k příbuzné sekvenci.
Navíc počet tandemových repetic segmentů nukleové kyseliny v cílovém fragmentu se může určit sekvenováním na gelu s jedním přechodem. Protože tandemové repetice se v oblastech genu kódujícího proteiny objevují zřídka, krok sekvenování na gelu se uskuteční pouze, když jsou tyto nekódující sekvence středem zájmu (například v případě, že jde o důležitou regulační oblast).
Získání informace o stupni hybridizace vykázaném v případě sady pouze přibližně 200 oligonukleotidových sond (přibližně 5 • ·
I · · * ► · ♦ * • « « · · · • · • · ·« % z množství, které je nutné pro celkovou hybridizací) definuje jedinečný obraz každého genu a může se použít při rozdělení cDNA z knihovny, za účelem stanovení, zda knihovna obsahuje více kopií stejného genu. Stejné, podobné a různé cDNA se mohou lišit takovými obrazy. Nukleové kyseliny a způsoby izolace, klonování a sekvenování nukleových kyselin jsou dobře známy v oboru. Popisují se například v publikaci Ausubel et al., Current Protocols in Molecular Biology, Vol. 1-2, John Wiley and Sons (1989); Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Ed., Vols. 1-3, Cold Springs Harbor Press (1989).
SBH je dobře vyvinutá metoda, která se může použít při řadě způsobů dobře známých v oboru. Postupy používané při sekvenování hybridizací se popisují v publikaci Drmanac et al., U.S. patent č. 5,202,231, zveřejněný 13. Dubna 1993; Drmac et al., Genomics, 4, 114-128 (1989); Drmanac et al.,
Proceedings of the First Intí. Conf.
Supercomputing Scientific Pub, Science, 260,
Electrophoresis
Human Genome Cantor et al., eds, World
Co. Singapore, 47-59 (1991); Drmanac et al.,
1649-1652 (1993); Lehrach et al., Genome
Analysis: Genetic and Physical Mapping, 1, 39-81 (1990), Cold
Spring Harbor Laboratory Press; Drmanac et al., Nucl. Acids Res., 4691 (1986); Stevanovic et al., Gene, 79, 139 (1989); Panusku et al., Mol. Biol. Evol., 1, 607, (1990); Nizetic et al., Nucl. Acids Res., 19, 182 (1991); Drmanac et al·., J. Biomol. Struct. Dyn., 5, 1085 (1991); Hoheisel et al., Mol.
Gen., 4, 125-132 (1991); Strezoska et al., Proč. Nat'1. Acad.
Sci. (USA), 88, 10089 (1991); Drmanac et al., Nucl. Acids Res., 19, 5839 (1991) a Drmanac et al., Int. J. Genome Res., 1, 59-79 (1992) .
Příklady provedení vynálezu:
Příklad 1: Příprava sady sond » · · · « · · · ·· «*· · · ·
Mohou se připravit dva typy univerzálních sad. První typ je úplná sada (nebo alespoň nekomplementární sub-sada) relativně krátkých sond, například všech 4 096 ( nebo přibližně 2 000 nekomplementárních) β-mérů nebo všech 16 384 (nebo přibližně 8 000 nekomplementárních) 7-mérů. Zcela nekomplementární sub-sada 8-mérů a další sondy jsou méně vhodné, protože zahrnují 32 000 sond a více.
Druhý typ sady sond se vybral jako malá sub-sada sond, která je stále dostačující pro čtení každého bp libovolné sekvence alespoň jednou sondou. Například postačuje 12 ze 16 dimérů. Malá sub-sada 7-mérů, 8-mérů a 9-mérů, která je vhodná pro sekvenování dvouřetězcové DNA, může zahrnovat přibližně 3 000, 10 000 a respektive 30 000 sond.
Sada sond se mohla také vybrat za účelem identifikace cílové nukleové sekvence se známou sekvencí a/nebo za účelem identifikace alel nebo mutantů cílové nukleové kyseliny se známou sekvencí. Taková sada sond obsahuje postačující sondy, aby každá pozice nukleotidu cílové nukleové kyseliny se četla alespoň jednou. Alely a mutanty se identifikovaly na základě zkutečnosti, že nedošlo k navázání jedné z pozitivních sond. Specifická sekvence těchto alel nebo mutantů se pak stanoví testováním cílové nukleové kyseliny sadou sond, které obsahují každou možnou změnu nukleotidu a kombinaci změn v uvedených pozicích sondy.
Sondy se mohou připravit za použití metod standardní chemie tak, aby se na konci použila jedna až tři nespecifikované (smíchané A, T, C nebo univerzální (například ,,M' radioaktivní báze nebo inozin) značení, sondy báze. Jestliže se použije mohou mít na 5'konci hydroxyskupinu vhodnou pro připojení radioaktivně značených skupin fosforu kinázou. V jiném případě se mohou použít sondy značené libovolným kompatibilním systémem, jako jsou například fluorescenční barviva. Dále se mohou použít jiné typy sond, jako je PNA (proteinové nukleové kyseliny) nebo sondy
β. · obsahující modifikované báze, které mění stabilitu duplexu. Sondy se mohou uchovávat v označených prohlubních na destičkách. V případě malého množství sond se mohou použít destičky s 96 prohlubněmi. V případě 10 00 sond nebo více se pro uchovávání preferují destičky s 384 nebo 864 prohlubněmi. Soubor 5 až 50 destiček je dostatečný pro uchování všech sond. V případě hybridizace s jedním vzorkem DNA stačí přibližně 5 pg sondy. Pak pro analýzu miliónu vzorků postačí syntéza v malém měřítku, při které vzniká 50 mg sondy. Jestliže se každá sonda použije pro každý třetí vzorek a jestliže každý vzorek obsahuje 1 000 bp, pak se musí sekvenovat přes 30 miliónů bází (což odpovídá 10 lidským genomům) pomocí 5 000 sond.
Příklad 2: Sondy obsahující modifikované nukleotidy
Modifikované nukleotidy se mohou zavést do hybridizačních sond a použijí se při vhodných podmínkách. Například pyrimidiny s halogenem v pozici C5 se mohou použít při zlepšení stability duplexu tím, že ovlivní staking interakce bází. 2,6diaminopurin se může použít, aby při párování baží s thyminem vznikla třetí vodíková vazba, čímž se stabilizuje duplexy DNA vzhledem k teplotě. Při použití 2,5-diaminopurinu může vzrůst stabilita duplexu a tak je možné použit přísnější podmínky v případě teplotní hybridizaci, čímž se zlepšuje specifita tvorby duplexu, potlačí se problémy pozadí a použijí se kratší oligoméry.
Syntéza verzí trifosfátu těchto modifikovaných nukleotidů se popisuje v publikaci Hoheisel and Lahrach (1990).
Odborník může také použít nediskriminující analogy bází nebo univerzální báze, jak popisuje Nichols et al. (1994). Tento nový analog 1-(2-deoxy-D-ribfuranosyl)-3-nitropyrol (označený jako „M) vznikl za účelem použití v oligonukleotidových sondách a v primerech při řešení problému s navrhováním primerů a sond, které vznikají jako • · ···· · · · ·· • ···· ···* ··· ··· ···· výsledek degenerace genetického kódu nebo v případě, že jsou dostupná pouze data zlomkové peptidové sekvence. Tento analog dosahuje maximálních staking interakcí, zatímco minimalizuje vodíkové interakce, aniž dojde ke sterickému porušení duplexu DNA.
Navrhl se analog nukleozidu M, aby došlo k maximalizaci staking interakcí aprotických polárních substituentů spojených do heteroaromatických kruhů a k zesílení staking interakce uvnitř a mezi řetězci, čímž se zmenšuje role vodíkových vazeb při specifitě párování bází. Nichols et al. (1994) věnoval pozornost 3-nitropyrol-2-deoxyribonukleozidu vzhledem k jeho strukturální a elektronové podobnosti s p-nitroanilinem, jehož deriváty jsou mezi nejmenšími známými interkaltory dvouřetězcové DNA.
Fosforamidit nukleozidu M chráněný dimethoxytritiovou skupinou je možné také začlenit do nukleotidů používaných jako primery při sekvenování a při polymerázové řetězové reakci (PCR). Nichols et al., (1994) ukázal, že podstatný počet nukleotidů se může nahradit bází M, aniž pimer ztratí specifitu.
Jedinečnou vlastností báze „M je schopnost nahradit dlouhé pruhy kontinuálních nukleozidů a při čemž se tvoří stále funkční sekvenční primery. Také se uvádí, že sekvence se třemi, šesti a devíti substitucemi báze „M dává vznik čitelnému sekvenčnímu žebříčku a PCR se třemi různými primery, které obsahují bázi „M, vede k amplifikaci správného porduktu (Nichols et al., 1994).
Schopnost oligonukleotidů obsahujících 3-nitropyrol fungovat jako primery silně naznačuje, že duplexová struktura musí tvořit komplementární řetězce. Zjistilo se, že optické teplotní profily získané pro oligonukleotidové páry d(5 -C2T5XT5G2-3) a d(5 -C2A5YA5G2-3) (kde symboly X a Y mohou být A, C, G, T nebo M) odpovídají normálnímu sigmoidálnímu paternu pozorovanému při přeměně dvouřetězcové DNA na jednořetězcovou.
Zjistilo se, že hodnoty teploty denaturace oligonukleotidů, které obsahují páry baží X M (kde symbol X je A, C, T nebo G a Y je M) spadají do rozmezí 3 °C (Nichols te al., 1994).
Příklad 3; Výběr a značení sond
Když vznikají soubory sub-uspořádání, definují se sady sond, aby hybridizovaly v každém hybridizačním cyklu s každým sub-uspořádáním. Z univerzální sady je možné vybrat sadu 384 sond a v každém ze čtyř cyklů se může uskutečnit 96 hybridizaci. Sondy vybrané tak, aby hybridizovaly v každém cyklu, s výhodou vykazují stejný obsah G+C.
Vybrané sondy pro každý cyklus se přenesly na destičku s 96 prohlubněmi a v případě, že nejsou značeny, se před uložením značily za použití kinázy nebo jiným druhem značení.
Na základě prvního kola hybridizaci se může pro každé subuspořádání definovat nová sada sond, které se použijí v dalších cyklech. Některé soubory se nemohou v některých cyklech použít. Například, jestliže pouze 8 ze 64 vzorků pacientů vykazuje mutaci a pro každou mutaci se použije 8 sond, pak všech 64 sond se může použít pouze v prvním cyklu a 32 sub-uspořádání se nepoužije. Tyto nepoužitá sub-uspořádání se pak může ošetřit hybridizačním pufrem, aby nevyschly filtry.
Sondy se mohou z destiček opět získat libovolným vhodným přístupem, jako je pipetovací zařízení s jedním kanálkem nebo použitím robota, jako je Beckman Biomek 1 000 (Beckman Instruments, Fullerton, California) nebo Mega Two robot (Megamation, Lawrenceville, New Jersey). Stanice robota může integrovat programy analýzy dat a programy navrhování sond. Výstup těchto programů může sloužit jako vstup pro jednu nebo více stanic.
Sondy se mohou získávat jedna po druhé a přidávají se k sub-uspořádání přelitým hybridizačním pufrem. Preferuje se, aby se znovu získané sondy umístily na novou destičku a • · nebo se smísily s hybridizačním roztokem, způsobem znovu získání sond je zpřístupnění skladovaných destiček jedné po druhé a pipetováním (nebo přenosem kovovou špičkou) dostatečného množství každé vybrané sondy se přenese sonda z každé destičky do specifických prohlubní na intermediární destičce. Aby se zrychlil proces znovu získání sond, je možné použít jednotlivě adresovatelné pipety nebo špičky.
značily se Preferovaným
Příklad 4: Příprava značených sond
Oligonukleotidové sondy se mohou připravit automatizovanou syntézou, což je pro odborníka rutinní metoda, kdy se používá systém Applied Biosystems. V jiném případě se mohou sondy připravit za použití metod Genosys Biotechnologies Inc., které využívají stakování porézních teflonových destiček.
V případě souborů se spoty 100 až 200 um nebo 100 až 400 um se oligonukleotidové sondy
32.
radioaktivně (35S, J^P, neradioaktivními izotopy p, mohou značit upřednostňuj e například
33T se
1990;
3P) ; nebo (Jacobsen et al., fluorofóry (Brumbaugh et al., 1988). Všechny takové metody značení jsou v oboru rutinní praxí, jak se popisuje v relevantních kapitolách publikace Sambrook et al., (1989) a Schubert et al. (1990), Murakami et al. (199i;
(1991).
Cate et al.
Běžnou metodou radioaktivního značení je značení konce oligonukleotidu za použití T4 polynukleotidové kinázy nebo značení s vysokou specifickou aktivitou za použití fragmentu Klenow nebo dokonce T7 polymerázy. Tyto metody se popisují dále v textu.
Syntetické oligonukleotidy se syntetizují aniž mají na svém 5'-konci fosfátovou skupinu a jsou proto jednoduše značeny přenosem -32P nebo 33P z [~32P] ATP nebo [-33P]ATP, za použití enzymu bakteriofágové T4 polynukleotidové kinázy. Jestliže reakce probíhá účinně, specifická aktivita takových • · · · • · • · sond může být tak vysoká, jako je specifická aktivita samotných [-32P] ATP nebo [-33P]ATP. Reakce popsaná dále v textu je určená pro značení 10 pmolů oligonukleotidu na vysokou specifickou aktivitu. Značení různých množství oligonukleotidu se může jednoduše dosáhnout zvětšením nebo zmenšením objemu reakce, přičemž koncentrace všech komponentů zůstávají konstantní.
Reakční směs se připraví za použití 1,0 ul oligonukleotidu (10 pmolů/ul), 2,0 ul lOx koncentrovaného pufru bakteriofágové T4 polynukleotidové kinázy, 5,0 ul [-32P] ATP nebo [~33P]ATP (specifická aktivita 5 000 Ci/mmol, 10 mCi/ml ve vodném roztoku) (10 pmolů) a 11,4 ul vody. Do reakční směsi se přidá 8 jednotek (přibližně 1 ul) bakteriofágové T4 polynukleotidové kinázy a směs se inkubuje při teplotě 37 °C po dobu 45 minut. Aby se deaktivovala bakteriofágové T4 polynukleotidové kináza, reakce se zahřívá po dobu 10 minut při teplotě 68 °C.
Pak se stanoví účinnost přenosu 32P nebo 33P na oligonukleotid a jeho specifická aktivita. V případě, že specifická aktivita sondy je přijatelná, dojde k izolaci sondy. Jestliže specifická aktivita je příliš nízká, přidá se dalších 8 jednotek enzymu a vše se inkubuje při teplotě 37 °C po dalších 30 minut. Aby došlo k deaktivaci enzymu, reakce se zahřeje po dobu 10 minut při teplotě 68 °C.
Čištění radioaktivně značených oligonukleotidů se může dosáhnout například srážením etanolem, srážením hexadecylpyridiniumbromidem, chromatografií na bio-gelu P-60 nebo chromatografií na koloně Sep-Pak Cis nebo elektroforézou na polyakrylamidovém gelu.
Sondy s vysokými specifickými aktivitami je možné získat za použití Klenow fragmentu bakterie E. coli. Při syntéze řetězce DNA komplementárního se syntetickým oligonukleotidem se použila DNA polymeráza I. Krátký primer se hybridizuje s oligonukleotidovým templátem, jehož sekvence je komplementární s požadovanou radioaktivně značenou sondou.
· « ·
Primer se pak prodlužuje za použití Klenow fragmentu bakterie E. coli DNA polymerázy I za účelem začlenit [-32P] dNTP nebo [33P] dNTP způsobem řízeným templátem. Po ukončení reakce se templát a produkt oddělí denaturací. Pak následuje elektroforéza na polyakrylamidovém gelu za denaturačních podmínek. Touto metodou je možné generovat oligonukleotidové sondy, které obsahují několik radioaktivních atomů na jednu molekulu oligonukleotidu.
Při použití této metody je třeba smísit v mikrocentrifugační zkumavce vypočítané množství [a-32P] dNTP nebo [a-33P] dNTP nezbytných pro dosažení specifické aktivity dostatečné k umožnění úplné syntézy všech řetězců templátu. Pak se do zkumavky přidalo vhodné množství primeru a templátové DNA, přičemž templát je v třínásobném až desetinásobném nadbytku ve srovnání s templátem.
Pak se přidá 0,1 objemu 10 x koncentrovaného Klenow pufru a prohluběň se promíchá. 2 až 4 jednotky Klenow fragmentu E. coli DNA polymerázy I se pak přidá do 5 ul reakčního objemu, vše se promíchá a inkubuje se po dobu 2 až 3 hodiny při teplotě 4 °C. Jestliže je nutné, aby se monitoroval proces reakce, odeberou se z reakce malé alikvóty (0,1 ul) a měří se podíl reaktivity, který je možné precipitovat s 10 % kyselinou trichloroctovou (TCA).
Reakce se naředí stejným objemem pufru, který se používá při nanášení vzorku na gel, zahřeje se na teplotu 80 °C po dobu 3 minut pak se celý vzorek nanese na denaturační polyakrylamidový gel. Následuje elektroforéza, gel se snímá autoradiografem, čímž se sonda lokalizuje a odstraní se z gelu. Při fluorescenčním značení sond je možné použít řadu způsobů. Brumbaugh et al. (1988) například popisuje syntézu fluorescenčně značených primerů. Syntetizuje se analog deoxyuridinu, na jehož C-5 je připojeno rameno linkeru primárního aminu s 12 atomy. Syntéza analogu zahrnuje derivatizaci 2-deoxyuridinu prostřednictvím organokovových • · ο η · ·· ···♦···
O v ····· · ······ · · · · · · · meziproduktů za vzniku 5-(metylpropenoyl)-2-deoxyuridinu. Reakce s dimethoxytritylchloridem produkuje odpovídající 5dimethoxytritylový adukt. Metylester se hydrolyzuje, aktivuje a reaguje s vhodně monoacylovaným alkyldiaminem. Po čištění se nukleozidy výsledného ramene linkeru mění na analogy nukleozidů, které jsou vhodné pro chemickou oligonukleotidovou syntézu.
Pak se připraví oligonukleotidy, které zahrnují jednu nebo dvě báze ramene linkeru za použití modifikované fosforiditové chemie. Do roztoku oligonukleotidu ramene linkeru o koncentraci 50 nmol v 25 ul 500 mM biouhličitanu sodného (pH 9,4) se přidá 20 ul 300 nM FITC v dimetylsulfoxidu. Směs se míchá při teplotě místnosti po dobu 6 hodin. Oligonukleotid se oddělí od volného FITC elucí z kolony Sephadex G-25 o velikosti 1 x 30 cm pomocí 20 mM acetátu amonného (pH 6) . Hromadí se frakce prvního UV absorbčního píku.
V obecném případě fluorescenční značení oligonukleotidu na jeho 5'-konci zahrnuje dva kroky. V prvním kroku se přidá na 5'-konec oligonukleotidu během automatizované syntézy nukleové kyseliny derivát aminoalkylfosforamiditu s chráněným N-koncem. Po odstranění všech chránících skupin se přes noc NHS ester vhodného fluorescenčního barviva spojí s 5'-aminoskupinou. Pak následuje čištění značeného oligonukleotidu, přičemž se odstraní nadbytek barviva za použití HPLC z reverzními fázemi nebo PAGE.
Schubert et al., (1990) popisuje syntézu fosforamiditu, který umožňuje, aby během automatizované syntézy DNA vznikaly oligonukleotidy značené fluoresceinem.
Murakami et al. také popisuje přípravu oligonukleotidů značených fluresceinem.
Cate et al., (1991) popisuje použití oligonukleotidových sond přímo spojených alkalickou fosfatázou v kombinaci s přímým chemiluminiscenčním substrátem (AMPPD), což umožňuje detekci sondy.
• ·
Značené sondy pochází z různých komerčních zdrojů, kam patří například GENSET, spíše než by byly připraveny syntézou.
Jiné značky zahrnují ligandy, které mohou sloužit jako specifické vazebné členy ke značeným protilátkám, chemoluminiscenčním činidlům, enzymům, protilátkám, které mohou sloužit jako člen specifického vazebného páru pro značený ligand a podobně. Může se použít velké množství různých značení. Další značení zahrnují antigeny, skupiny se specifikou reaktivitou a elektrochemicky detekovatelné části.
Elektroforové hmotnostní značení (EML) nukleových kyselin se popisuje například v publikaci Xu et al., J. Chromatography 764: 95-102 (1997). Elektrofóry jsou sloučeniny, které se mohou detekovat s vysokou citlivostí hmotnostní spektrometrií se záchytem elektronů (EC-MS) . EML se může připojit na sondu za použití chemických metod, které se používají v oboru pro reverzibílní modifikování nukleotidu (například se používají dobře známé chemické teze syntézy nukleotidů v případě připojení molekul k nukleotidům v případě ochranných skupin). EML se detekují za použití různých přístrojů pro hmotnostní spektrometrii se záchytem elektronů (například zařízení prodávaných firmou Finnigan Corporation). Další metody, které se mohou použít pro detekci EML zahrnují například hmotnostní spektrometrii s rychlým atomovým borbardováním (popisuje se například v publikaci Koster et al., Biomedical Environ. Mass Spec. 14: 111-116 (1987)), hmotnostní spektrometrií s desorpcí plazmy, použitím elektrosprejů/iontosprejů(například se popisuje v publikaci Fennet et al., J. Phys. Chem. 88: 4451-59 (1984), PCT Appl. Č. WO 90/14148, Smith et al., Anal. Chem. 62: 882-89 (1990)) a laserová desorpce na matrici /ionizace (Hillenkamp, et al., „Matrix Assisted UV-Laser Desorption/Ionization: A New Approach to Mass Spektrometry of Large Biomolecules, Biological Mass Spectrometry (Burlingame and McCloskey, eds.), Elsevier Science Publishers, Amsterdam, pp. 49-60, 1990), Huth -Fehre et al., „Matrix Assisted Laser
Desorption Mass Spectrometry of Oligodeoxythymidylic Acids, Rapid Communications in Mass Spectrometry, 6: 209-13 (1992)).
V preferovaném provedení vynálezu se EML připojí na sondu kovalentní vazbou, která je citlivá na světlo. EML se uvolní ze sondy po hybridizaci s cílovou nukleovou kyselinou laserem nebo jiným zdrojem světla, který emituje světlo dané vlnové délky. EML se pak nanese na GC-MS (plynový chromatografhmotnostní spektrofotometr) nebo jiný vhodný přístroj, který definuje jeho hmotnost.
Příklad 5: Příprava sekvenačních čipů a souborů
Základním příkladem je použití 6-mérů připojených na povrchy o velikosti 50 mikronů, přičemž vzniká čip o rozměru 3 x 3 mm. Čipy se mohou kombinovat za vzniku souboru 20 x 20 cm. Jiným příkladem je použití 9-mérových nukleotidů připojených na povrch o velikosti 10 x 10 mikronů za vzniku 9-mérového čipu s rozměry 5x5 mm. 4 000 jednotek takových čipů se může použít při přípravě souboru o velikosti 30 x 30 cm. V souboru je 4 000 až 16 000 oligočipů uspořádáno do čtverce. Destička nebo sbírka zkumavek, jak se také popisuje, se mohou přibalit do souboru jako součást sekvenčního kitu.
Soubory se mohou od sebe oddělit fyzikálně hydrofóbními povrchy. Jedním možným způsobem, jak využít hydrofobní separaci, je použití technologie takové, jako je systém IsoGrid Microbiology, který produkuje firma QA Laboratories, Toronto, Canada.
Hydrofobní mřížkové membránové filtry (HGMF) se používají při mikrobiologické analýze potravin, kde vykazují jedinečnou přitažlivost ve velkém numerickém rozmezí a automatické počítání kolonií. Jedna z komerčně dostupných mřížek je ISOGRID™ od firmy QA Laboratories Ltd. (Toronto, Canada), která obsahuje čtverec (o velikosti 60 x 60 cm) polysulfonového polyméru (Gelman Tuffryn HT-450, velikost pórů je 0,45 mikronů), na který se natiskla černá hydrofobní inkoustová ••••· · ·· ·· ·· • · · · · * ♦ * · · ···· ··· ··· e « « ·· ·· ····· • · · · · · ······ «·· · · ·· · · mřížka obsahující 1 600 (40 x 40) čtvercových buněk. HGMF se inokulovala bakteriální suspenzí za použití vakuové filtrace a inkubovala se na diferenciálním nebo selektivním médiu podle volby.
Protože mikrobakteriální růst je omezen na mřížku buněk, které se nacházejí na membráně ve známých pozicích a mají známou velikost, pak HGMF funguje více jako aparát MPN než jako konvenční destička nebo mebránový filtr. Peterkin et al. (1987) popisuje, že tyto HGMF se mohou použít, když se používají s replikátorem HGMF, pro pomnožení a uložení genomových knihoven. Jedno takové zařízení replikuje růst každé z 1 600 buněk ISO-GRID a umožňuje připravit řadu kopií hlavního HGMF (Peterkin et al., 1987).
Sharpe et al., (1989) popisuje ISO-GRID HGMF z QA Laboratories a automatizovaný počítač HGMF (MI-100 Interpreter) a RP-100 Replicator. Dále popisují způsoby udržení a testování řady mikrobiálních kultur.
Peterkin a jeho kolegové později popisují způsob testování DNA sond za použití hydrofóbního membránového filtru s mřížkou (Peterkin et al., 1989). Tito autoři popisují metody účinné hybridizace kolonií přímo na HGMF. Dříve se získaly jako následek nízké vazebné kapacitě DNA vůči epoxysulfonověrnu polyméru, na který se tisknou HGMF, velmi neuspokojivé výsledky. Avšak Peterkin et al., (1989) popisuje, že navázání DNA na povrch membrány se zlepšilo ošetřením replikované a inkubované HGMF polyetyleniminem, polykací dříve než přijde do kontaktu s DNA. Ačkoli tato práce používá buněčné připojení DNA a má ve srovnání s vynálezem odlišný předmět vynálezu, zde popisované metody se snadno upraví pro účelu metody SBH Formát 3.
Za účelem rychle identifikovat použitelné sekvence, Peterkin et al. (1989) používá radioaktivně značenou plazmidovou DNA z různých klonů a testuje její specifitu k DNA na připravených HGMF. DNA připravená tímto způsobem • · qΛ ♦·«· ······
O *-χ · ·«··«····· • · · · · · ······ ··· *· ·· · z rekombinantních plazmidů se rychle testovala hybridizaci kolonií proti 100 organizmům na replikách HGMF, které se mohou jednoduše a opakovaně připravit.
Manipulace s malými čipy (2 až 3 mm) umožňuje paralelně provést tisíce reakcí. Řešení vynálezu je držet čipy a sondy v odpovídajících souborech. V jednom příkladu vynálezu se čipy obsahující 250 000 9-mérů sysntetizovaly na silikonové destičce ve formě čipů o velikosti 8x8 mm (15 uM/oligonukleotid; Pease et al., 1994) uspořádaných do formátu 8 x 12 (96 čipů) . Mezi destičkami se nachází 1 mM žlábek. Sondy se přidávají buď pipetou s více kanály nebo sadou špiček, přičemž jedna sonda se nanáší na jeden čip. Aby se uplatnilo všech 4 000 6-mérů, použije se 42 čipových souborů. Bud se používají rozdílné soubory čipů nebo se jedna sada čipových souborů použije několikrát.
Ve shora popsaném případě je za použití dřívější nomenklatury přihlášky F=9; P=6 a F+P=15. Čipy mohou mít sondy podle vzorce BxNn, kde symbol x značí počet specifikovaných baží B a symbol n je počet nespecifikovaných baží, tak, že x=4 až 10 a n= 1 až 4. Aby se dosáhlo účinnější hybridizace a zabránilo se potencionálnímu vlivu libovolných podpůrných oligonukleotidů, specifikované báze se mohou obklopit nespecifikovanými bázemi tak, že jsou reprezentovány vzorcem (N)nBx(N)m (obrázek č. 4).
Příklad 6: Příprava oligonukleotidů vázaných na podklad
Oligonukleotidy, to znamená malé segmenty nukleové kyseliny, se mohou snadno připravit například přímou syntézou oligonukleotidů chemickou cestou, přičemž se běžně používá automatizovaný oligonukleotidový syntetizátor.
Oligonukleotidy vázané na podklad se připravují libovolnou z metod známých v oboru za použití libovolného vhodného podkladu, jako je sklo, polystyren nebo teflon. Jednou strategií je přesně nanést oligonukleotidy syntetizované na • · standardních syntetizérech. Imobilizace lze dosáhnout za použití pasivní adsorpce (Inouye and Hondo, 1990), za použití UV záření (Nagata et al., 1985; Dahlen et al., 1987; Morriey and Collins, 1989) nebo kovalentní vazbou báze modifikované DNA (Keller et al., 1988; 1989).
Jiná strategie je použití silné interakce biotinstreptavidin jako linkeru. Například Broude et al. (1994) popisuje použití sondy značené biotinem. Tyto sondy jsou duplexy, které jsou imobilizované na magnetických částicích potažených streptavidinem. Částice potažené strepatavidinem lze získat od firmy Dynal, která sídlí v Oslu. Samozřejmě stejný způsob navázání je možné aplikovat k potažení libovolného povrchu streptavidinem. Sondy značené biotinem je možné získat z různých zdrojů, jako je například firma Operon Technologies (Alameda, CA).
Firma Nunc Laboratories (Naperville, IL) také prodává vhodný materiál. Tato firma vyvinula způsob, kterým je DNA kovalentně vázána na povrch mikroprohlubní nazývaný Covalink NH. Covalink NH je polystyrénový povrch se sekundárními aminoskupinami (>NH), které slouží jako spojovací skupiny pro další párování. Moduly CovaLink se získaly od firmy Nunc Laboratories. Molekuly DNA se váží na CovaLink pouze 5'-koncem fosforamidátovou vazbou, což umožňuje imobilizaci více jak 1 pmol DNA (Rasmussen et al., 1991).
Popisuje se použití proužků materiálu CovaLink NH pro účely kovalentního navázání molekul DNA (Rasmussen et al., 1991). Při této technologii se používá fosforamidátová vazba (Chu et al., 1983). Preferuje se imobilizace za použití pouze jediné kovalentní vazby. Fosforamidátová vazba spojuje DNA se sekundárními aminoskupinami materiálu CovaLink NH, které jsou umístěny na konci ramen mezerníku kovalentně připojeného na polystyrénovém povrchu prostřednictvím ramene mezerníku s délkou 2 nm. Aby se mohl oligonukleotid spojit s materiálem CovaLink NH prostřednictvím fosforamidátové vazby, musí se na
5'-konci oligonukleotidů nacházet fosfátová skupina. V případě biotinu je dokonce možné, aby se kovalentně vázal na materiál CovaLink a pak se pro navázání sond použil streptavidin.
Způsob navázání zahrnuje rozpuštění DNA ve vodě (7,5 ng/μΐ) , denaturaci po dobu 10 minut při teplotě 95 °C a chlazení na ledu po dobu 10 minut. Pak se přidá ledem chlazený roztok 0,1 M 1-metylimidazolu, pH 7,0 (l-Melnv?) tak, aby jeho konečná koncentrace byla 10 mM. Pak se na proužky CovaLink NH nanese roztok jednořetězcové DNA (75 μΐ/prohlubeň) a vše se nechá stát na ledu.
Připraví se čerstvý arbodiimid 0,2 M l-etyl-3-(3dimetylaminopropyl)-karbodiimid (EDC) se rozpustí v 10 mM 1Melm7 a do každé prohlubně se přidá 25 μΐ roztoku. Proužky se inkubují po dobu 5 hodin při teplotě 50 °C. Po inkubaci se proužky promyjí například rozotkem Nunc-Immuno Wash. Prohlubně se nejprve promývají 3 krát, pak se v nich promývací roztok nechá stát po dobu 5 minut a nakonec se promyjí ještě 3 krát (v promývacím roztoku je 0,4 N NaOH, 0,25 % SDS ohřátý na teplotu 50 °C).
Další vhodná metoda podle vynálezu se popisuje v patentové přihlášce PCT WO 90/03382 (Southern and Maskos). Tento způsob přípravy oligonukleotidů navázaných na podklad zahrnuje připojení činidla na 3'-nukleosid prostřednictvím fosfátové skupiny pomocí kovalentního fosfodiesterového spojení k alifatickým hydroxylovým skupinám, které se nacházejí na podkladu. Na nukleosidovém podkladu se pak syntetizuje oligonukleotid a ze syntetického oligonukleotidového řetězce se pak odstraní za standardních podmínek chránící skupina, která chrání oligonukleotid, aby nedošlo k jeho odštěpení z podkladu. Vhodná činidla zahrnují nukleosidfosforamidit a nukleosidhydrogenfosforát.
Pro přípravu sond DNA za účelem přípravy souborů sond DNA se používá strategie čipů. Například při chemické syntéze oligonukleotidů přímo na skleněném povrchu (jak popisuje Fodor • * · · · · et al., (1991)) se používá adresovatelná fotoochrana aktivovaná laserem. Sondy se také mohou imobilizovat na nylonových podkladech, jak se popisuje v publikaci Van Ness et al. (1991) nebo se mohou vázat na teflon za použití způsobu popsaného v publikaci Duncan and Cavalier (1988).
Tiby se oligonukleotid navázal na nylonovou mebránu, jak popisuje Van Ness et al. (1991), je nutná aktivace nylonového povrchu prostřednictvím alkylace a selektivní aktivace aminu na 5'-konci oligonukleotidu cyanurovým chloridem.
Jedni ze způsobů jak připravit oligonukleotidy vázané na podklad je využití světlem vyvolané syntézy popsané v publikaci Pease et al., (1994). Autoři používaly současné litografické metody, aby vytvořily soubory imobilizovaných oligonukleotidových sond (čipy DNA). Tyto metody, kde se světlo používá pro vytvoření miniaturních souborů s vysokou hustotou sond, se využívají fotolabilní N-acyldeoxynukleosidfosforamidity s chráněným 5'-koncem a chemie povrchových linkerů a univerzální kombinační strategie syntézy. Tímto způsobem se může připravit matrice 256 prostorově definovaných oligonukleotidových sond a ta se pak může s výhodou použít při sekvenování za použití Formátu 3.
Samozřejmě je možné jednoduše získat čipy DNA, jako jsou shora popsané světlem aktivované čipy, z komerčních zdrojů. Je možné například kontaktovat firmu Affymetrix of Santa Clara, CA 95051 nebo Beckman.
Příklad 7: Příprava fragmentů nukleové kyseliny
Nukleové kyseliny, které se mají sekvenovat, se mohou získat z vhodných zdrojů, jako je cDNA, genomová DNA, chromozomální DNA, rozřezané chromozomální pruhy, kozmid, nebo inzerty YAC a RNA, které zahrnují mRNA, aniž probíhá jakýkoli amplifikační krok. Například v publikaci Sambrook et al. (1989) se popisují tři protokoly pro izolaci DNA s vysokou molekulovou hmotností ze savčích buněk (str. 9.14 až 9.23).
• · • · · · · • · · · · • · ··· ···
Cílové fragmenty nukleové kyseliny se mohou připravit jako klony M13, plazmidové vektory nebo vektor lambda a/nebo se mohou připravit přímo z genomové DNA nebo cDNA pomocí PCR nebo jiných metod amplifikace. Vzorky se mohou připravit nebo dávkovat na destičky s více prohlubněmi. Do konečného objemu 2 až 500 ml se mohou připravit přibližně 100 až 1 000 ng vzorků DNA. Do substrátu pro SBH Formát I se mohou přímo aplikovat cílové nukleové kyseliny připravené PCR. Po té, co se cílová nukleová kyselina fixuje na substrátu, může se promývat nebo přímo tepelně hybridizovat se sondou.
Z nukleových kyselin se pak připraví fragmenty použitím libovolných metod, které jsou dobře známy v oboru a zahrnují například použití restrikčních enzymů, jak se popisuje v publikaci Sambrook et al. (1989) na str. 9.24 až 9.28, přičemž se dále může použít ultrazvuk a NaOH.
Také je vhodný střih za nízkého tlaku, jak se popisuje v publikaci Schriefer et al. (1990). Při této metodě vzorky DNA procházejí malou tlakovou celou podle Frenche, kde je nízký až střední tlak. Zařízení umožňuje řízenou aplikaci nízkého až středního tlaku. Výsledky této studie ukazují, že střih při nízkém tlaku se může použít jako alternativa sonifikačních a enzymatických metod fragmentace DNA.
Zvláště vhodný způsob fragmentace DNA je použití endonukleáz, které rozeznávají jednotlivé báze, jako je například CviJI, která se popisuje v publikaci Fitzgerald et al. (1992). Autoři popisují způsob rychlé fragmentace a frakcionace DNA na určité velikosti, které jsou vhodné pro klonovaní a sekvenování. Tato metoda je také vhodná pro přípravu náhodných, ale relativně malých fragmentů DNA, které se používají při sekvenování podle vynálezu.
Restrikční endonukleáza CviJI v normálním případě štěpí sekvenci PuGCPy mezi G a C, přičemž fragmenty mají tupé konce. Netypické podmínky reakcí, které mění specifitu enzymu (CviJI**) vedou quazi-náhodné distribuci fragmentů DNA malé • · • · · · molekuly pUC19 (2688 párů baží). V publikaci Fitzgerald et al. (1992) se kvantitativně hodnotí náhodnost této strategie tvorby fragmentů při použití štěpení pUC19 enzymem CviJI**, které se rodělily podle velikosti rychlou gelovou filtrací a přímo se ligovaly, aniž se upravily konce, do klónovacího vektoru M13, který neobsahuje lac Z. Analýza sekvencí 76 klonů ukazuje, že enzym CviJI** štěpí vedle míst PuGCPy, pyGCPy a PuGCPu a že nová sekvenční data se hromadí rychlostí, která odpovídá náhodné fragmentaci.
Jak se uvádí v literatuře, výhody tohoto přístupu v porovnání s fragmentací, sonifikací a frakcionací na agarózovém gelu jsou: metoda vyžaduje použití menšího množství DNA (0,2 až 0,5 pg) , zahrnuje méně jednotlivých kroků (chybí pre-ligace, neupravují se konce, není nutná chemická extrakce nebo elektroforéza na agarózovém gelu a eluce). Tyto výhody se uplatňují při přípravě DNA pro sekvenování metodou Formát 3.
Bez ohledu na způsob jak je možné získat nebo připravit fragmenty nukleové kyseliny, je důležité denaturovat DNA za vzniku jednořetězcového kusu, který je vhodný pro hybridizaci. Toho se dosáhne inkubací roztoku DNA po dobu 2 až 5 minut při teplotě 80 až 90 °C. Roztok se pak rychle ochladí na teplotu 2 °C, aby nedošlo k renaturaci fragmentů DNA dříve než přijdou do kontaktu s čipem. Jak se popisuje v příkladu VI, musí se také z genomové DNA odstranit fosfátové skupiny.
Příklad 8: Příprava souborů DNA
Soubory se mohou připravit nanesením vzorků DNA na podklad, jako je nylonová membrána. Nanesení se může provést za použití sady kovových špiček (jejichž pozice odpovídá prohlubním souboru na mikrotitrační destičce), což umožňuje opakované nanesení přibližně 20 nl roztoku DNA na nylonovou membránu. Ofsetovým tiskem se dosáhne hustoty dotů vyšší než je hustota prohlubní. Na ploše 1 mm2 se může vyskytovat 1 až 25 dotů v závislosti na typu značení. Tím, že se zabrání nanesení • · • ·
DNA do některých předem zvolených svislých a vodorovných sloupců vzniknou oddělené sub-sady (sub-soubory). Vzorky v jednom souboru mohou tvořit stejné genomové segmenty DNA (nebo stejný gen) z různých jedinců nebo to mohou být různé, překrývající se genomové klony. Každý z pod-souborů může mít repliku, na které jsou nanesený stejné vzorky. V jednom příkladu se může vybraný segment genu amplifikovat pro 64 pacientů. V případě každého pacienta se amplifikovaný genový segment může nacházet na jedné destičce s 96 prohlubněmi (všech 96 prohlubní obsahuje stejný vzorek). Pro každého ze 64 pacientů se připraví jedna destička. Použitím zařízení s 96 špičkami lze nanést všechny vzorky na jednu membránu o rozměrech 8 x 12 cm.
Sub-soubor může obsahovat 64 vzorků, od každého pacienta jeden vzorek. V případě, že 96 sub-souborů je stejných, jeden spot může zaujímat plochu 1 mm2 a mezi sub-soubory může být 1 mm místa.
Jiný přístup je použití membrán nebo destiček (dostupných od firmy NUNC, Naperville, Illinois), které se mohou oddělit fyzikálním mezerníkem. Například se používá plastikový rošt tvořící šablonu na membráně. Mřížka je podobná druhu membrán, které se aplikují na dno prohlubní destiček, nebo hydrofóbním proužkům.
Příklad 9: Hybridizace a hodnocení procesu
Značené sondy se mohou smísit s hybridizačním pufrem a pipetují se s výhodou vícekanálovými pipetami na sub-soubor. Aby se předešlo smíchání sond mezi jednotlivými sub-soubory (jestliže se na membránách nenachází hydrofóbní proužky nebo fyzikální překážky) může se do membrány jemně vtlačit odpovídající plastiková, kovová nebo keramická mřížka. Také objem pufru se může snížit na 1 ml/mm2 nebo méně. Koncentrace sond a podmínky hybridizace mohou být stejné jako ty popsané dříve v textu s tou výjimkou, že se promývací pufr může rychle • · • · přelít přes soubor sub-souborů, aby se sondy rychle naředily a tak se předejde podstatné křížené hybridizaci. Ze stejného důvodu je možné použít minimální koncentrace sond a průběh hybridizace protáhnout na maximálně možnou dobu. Při detekci a sekvenování DNA znalost „normální sekvence umožňuje za účelem zesílení signálu použít jev kontinuálních staking interakcí. Vedle značených sond se mohou do hybridizační reakce přidat neznačené sondy, které hybridizují se značenými sondami. Množství hybridu může několikrát vzrůst. Sondy se mohou spojovat ligací. Tento přístup může být důležitý při rozdělení oblastí DNA, které tvoří „kompresi.
V případě radioaktivně značených sond se zobrazení filtrů může dosáhnout technologií uchování fosforu. Fluorescenční značení se může vyhodnocovat kamerami CCD, konfokální mikroskopií nebo jiným způsobem. Za účelem správně uspořádat a integrovat data z různých hybridizačních experimentů se na základě množství cílové nukleové kyseliny v každém dotu normalizovaly surové signály. Rozdíly v množství cílové DNA v dotu se mohou korigovat dělením signálů každé sondy průměrným signálem dosaženým u všech pozitivních sond v jednom dotu. Normalizované signály se mohou uspořádat obvykle od 1 do 100, aby se mohly porovnat data s různých experimentů. Také v každém sub-souboru se může při stanovení průměrného signálu pozadí v těch vzorcích, které neobsahují úplně párovaný cíl, použít několik kontrolních DNA. Například, aby se získalo diploidní skóre (polyploidní), může se použít homozygotní kontroly, což umožní ve vzorku rozeznat heterozygoty.
Příklad 10: Hybridizace s oligonukleotidy
Oligonukleotidy se získaly od firmy Genosys lne., Houston,
Texas nebo se připravily za použití syntetizéru DNA Applied Biosystems 381A. Většina používaných sond se nečistila ani HPLC ani elektroforézou na gelu. Sondy se například navrhly tak, aby měly v interferonu jeden zcela komplementární cíl, · · ·
klón M13 obsahující fragment interferonu EcoRI-BglII o velikosti 921 bp (Ohno and Tangiuchi, Proč. Nati. Acad. Sci. 74: 4370-4374 (1981)) a alespoň jeden cíl s chybným párováním koncové báze v samotném vektoru M13.
Značení konců oligonukleotidů se uskutečnilo, jak se popisuje v publikaci Maniatis et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Cold Spring Harbor, New York (1982), v 10 ml, kde je obsažena T4polynukleotidová kináza (5 jednotek, Amersham) , g32P-ATP (3,3 pM, 10 mCi Amersham 3 000 Ci/mM) a olígonukleotid (4 pM, 10 ng). Specifické aktivity sond byly 2,5 až 5 x 109 cpm/nM.
Jednořetězcová DNA (2 až 4 ml v roztoku 0,5 M NaOH a 1,5 M NaCl) se nanesla na membránu Gene Screen, která je zvlhčená stejným roztokem. Filtry se neutralizovaly v 0,05 M Na2HPO4 pH 6,5, pekly se v troubě při teplotě 80 °C po dobu 60 min. a ozářily se UV zářením po dobu 1 minuty. Pak se filtry inkubovaly v hybridizačním roztoku (0,5 M Na2HPO4 pH 7,2, 7 % lauroylsarkosin sodíku) po dobu 5 minut při teplotě místnosti a umístily se na povrch plastikové Petriho misky. Kapka hybridi začního roztoku (10 ml 0,5 M Na2HPO4 pH 7,2, 7 % lauroylsarkosin sodíku) s oligomérovou sondou značenou na konci 32P v koncentraci 4 nM se nanesla do 1 až 6 dotů na filtru. Filtr se překryl čtvercem polyetylénu (přibližně o rozměrech lxl cm) a inkuboval ve vlhké cele při označené teplotě po dobu 3 hodin. Hybridizace se ukončila tak, že se filtr umístil do promývacího roztoku 6 x SSC po dobu 3x5 minut při teplotě 0 °C. Tím se odstranila nehybridizovaná sonda. Filtr se buď sušil nebo se dále promýval po uvedenou dobu a při uvedené teplotě a snímal se autoradiografem. V případě diskriminačního měření se doty po autoradiografii vystřihly ze suchých filtrů (může se použít přístroj pro detekci fosforu, Molecular Dynamics, Sunnyvale, California) a umístily se do kapalného scintilačního koktejlu a spočítaly se « ·
.............
signály. Neupravený poměr cpm v případě dotů IF a Ml3 je označen jako D.
Zde uvedené podmínky umožňují hybridizaci s velmi krátkými oligonukleotidy, ale při tom zaručují diskriminaci mezi spárovanými a chybně párovanými oligonukleotidy, které jsou komplementární, a proto se váží na cílovou nukleovou kyselinu. Definovaly se faktory, které ovlivňují účinnou detekci hybridizace specifických krátkých sekvencí na základě stupně diskriminace (D) mezi zcela komplementárním cílem a neúplně komplementárním cílem s jedním chybným párováním v hybridu. V experimentálních testech se provedla dot-blot hybridizace 28 sond, které obsahovaly 6 až 8 nukleotidů se dvěma klony M13 nebo s modelovými oligonukleotidy vázanými na membránové filtry. Principy, které provázejí experimentální postupy jsou uvedeny dále v textu.
Hybridizace oligonukleotidu s cílovými nukleovými kyselinami vázanými na filtru, které jsou pouze o několik nukleotidů delší než sonda, za podmínek přebytky sondy probíhá reakcí pseudo-prvního řádu s ohledem na koncentraci cílové nukleové kyseliny. Tato reakce se definuje rovnicí:
St/ So = e“kh [0P1 \
Kde symbol St a So jsou koncentrace cílových sekvencí v čase t respektive to. (OP) je koncentrace sondy a symbol t je teplota. Rychlostní konstanta při tvorbě hybridu kh se v rozmezí teploty 0 °C až 30 °C zvyšuje pouze málo (Porschke and Eigen, J. Mol. Biol. 62: 361 (1971); Craig et al., J. Mol. Biol. 62: 383 (1971)). Denaturace hybridu je reakce prvního řádu s ohledem na koncentraci hybridu ( v tomto případě je nahrazena hmotou navázanou na filtr), jak se uvádí v rovnici:
Ht/Ho
-kmt
A ·
V této rovnici symboly Ht a Ho jsou koncentrace hybridu v čase t respektive to. Symbol km je rychlostní konstanta pro denaturaci hybridu, která je závislá na teplotě a koncentraci solí (Ikuta et al., Nucl. Acids Res. 15: 797 (1987); Porsclike and Eigen, J. Mol. Biol. 62: 361 (1971); Craíg et al., J. Mol. Biol. 62: 303 (1971)). Během hybridizace, což je proces spojování řetězců, také probíhá zpětná reakce, denaturace nebo disociace řetězce. Tak množství hybridu vytvořeného v čase je výsledek přímé a zpětné reakce. Rovnováha se posouvá směrem ke tvorbě hybridu tím, že se zvyšuje koncentrace sondy a /nebo se snižuje teplota. Během cyklů promývání velkými objemy pufru je však denaturace dominantní a zpětná reakce hybridizace není podstatná, protože sonda není v reakční směsi přítomna. Tato analýza ukazuje, že podmínky hybridizace krátkých oligonukleotidů (SOH) se mohou měnit v případě koncentrace sondy nebo teploty.
Symbol D nebo diskriminace se definuje v rovnici 4:
D = Hd (tw) / Hi (tw)
Kde Hp (tw) a Hi (tw) je množství hybridů zbývající po době promytí označené symbolem tw v případě stejných množství zcela a neúplně komplementárního duplexu, diskriminace D mění s délkou doby maximální hodnoty, když
Hi = B,
Pro danou teplotu se promývání a dosahuje detekovatelný signál jiné další zvýšení což je rovnice pět.
Symbol B reprezentuje nejnižší hybridizace v systému. Jelikož se netestovalo, hodnota D se zvyšuje při kontinuálním promývání. Hodnota doby promývání tw snižuje Hp poměrně s B a zdá se, že • · · · snižuje hodnotu D. Optimální doba promývání tw v případě neúplných hybridů z rovnice tři a pět je tw = -In (B / Hi (t0) ) / kmi
Protože Hp se promývá po stejnou dobu tw, kombinací rovnic se získá optimální diskriminační funkce:
D = gin (B / Hi (tO) ) km,p/ km, i χ (ίθ) } / g
Vzhledem k tomu,že změna D jako funkce T, je důležitá volba optimální teploty promývání. Získala se substitucí Arheniovy rovnice, která zní:
K- = A e'Ea/RT do předchozí rovnice za vzniku konečné rovnice:
D = Hp (t0)) / Β X ( B/Hi (t0)) (Ap/Ai)e ÍEa,i “ E a,p!/RT;
Kde B je menší než Hi (to) .
Protože aktivační energie úplných hybridů Ea,p a aktivační energie neúplných hybridů Ea,i může být buď stejná nebo Ea,i je menší než Ea,p. Veličina D je na teplotě nezávislá nebo klesá se vzrůstající teplotou. Tento výsledek ukazuje, že hledání přísných teplotních podmínek pro dobrou diskriminaci u SOH není správný. Promýváním při nízkých teplotách je možné získat stejnou nebo lepší diskriminaci, ale doba promývání exponencionálně roste se snižující se teplotou. Diskriminace silněji klesá s T, jestliže Hi (t0) relativně roste vůči Hp (t0) .
Proměná D při nízkých teplotách závisí více na poměru Hp (t0)/B než na poměru Hp (t0)/ Hi (to). Tento výsledek ukazuje, že je lepší při hybridizaci získat dostatečné množství Hp bez • · c
ohledu na diskriminaci, které lze v tomto kroku dosáhnout. Lepší diskriminace lze dosáhnout promýváním, protože větší množství úplného hybridu umožňuje delší trvání diferenciální denaturaci, aby se projevil účinek. V podobném případě použitím většího množství cílové nukleové kyseliny je možné dosáhnout nezbytné diskriminace dokonce s malými rozdíly mezi Km,p & Km, i ·
Jestliže se tato skutečnost extrapoluje na komplexnější situaci , než je ta, která se popisuje v tomto příkladu, pak výsledek je ten, že promýván! při nižších teplotách je dokonce důležitější pro dosažení diskriminace v případě hybridizace sondy, která má chybné párování na konci dané cílové nukleové kyseliny.
Při použití popsaných teoretických principů se dosáhlo jisté hybridizace se sondami, které obsahují šest až osm nukleotidů. Všechny experimenty se uskutečnily s flotujícím plastovým listem, kde je nad filtrem nanesen film hybridizačniho roztoku. Tento postup umožňuje maximální redukci množství sondy s tak se snižují náklady na značení u dot blot hybridizace. Vysoká koncentrace lauroylsarkosinu sodíku, který nahrazuje ve fosfátovém hybridizačním pufru lauroylsulfát sodíku, snižuje teplotu reakce z teploty místnosti na teplotu 12 °C. V podobném případě roztok 4x až 6x SSC, 10 % lauroylsarkosin sodíku umožňuje hybridizaci při teplotě až 2 °C. Detergent obsažený v těchto pufrech umožňuje získání tolerovatelného pozadí při použití značené sondy v koncentraci až 40 nM. Předchozí charakterizace termální stability krátkých oligonukleotidových hybridů se stanovila na prototypu oktaméru, kde obsah G+C je 50 %. To znamená, že sonda má sekvenci TGCTCATG. Teoreticky se očekává, že tato sonda patří mezi méně stabilní oktaméry. Její přechodová entalpie je podobná entalpii stabilnějších heptamérů nebo dokonce sondám, které obsahují 6 nukleotidů (Bresslauer et al., Proč. Nati. Acad. Sci. U.S.A. 83: 3746 (1986)). Parametr • «
Td, což je teplota, při které 50 % hybridu se denaturuje za jednotku času (minuta), je 18 °C. Výsledek ukazuje, že Td je 15 °C. Je tedy nižší v případě hybridu o velikosti 8 bp než v případě duplexu s 11 bp (Wallace et al., Nucleic Acids Res. 6: 3543 (1979)).
Vedle experimentů s modelem ologonukleotidů vektor M13 se vybral jako systém pro praktickou demonstraci hybridizace krátkých oligonukleotidů. Hlavním cílem bylo ukázat použitelnou diskriminaci nesprávně párovaného konce s cílovou nukleovou kyselinou, která je podobná cílové nukleové kyselině používané při různých aplikacích metod podle vynálezu. Oligonukleotidové sondy v případě modelu M13 se vybraly takovým způsobem, že samotný vektor M13 obsahuje nesprávně párovanou koncovou bázi. Vektor IF, což je rekombinantní M13 obsahující inzert genu lidského interferonu o velikosti 921 bp, nese jednu zcela spárovanou cílovou nukleovou kyselinu. Tak IF obsahuje buď identický nebo vyšší počet cílů s nesprávným párováním v porovnání se samotným vektorem M13.
Za použití podmínek s nízkou teplotou a dot blotů je možné získat dostatečné signály mezi vázaným dotem, který obsahuje úplně spárovaný cíl a cíl s nesprávným párováním a dotem, jenž obsahuje pouze cíle s nesprávným párováním. Tato skutečnost platí pro 7- a 8-mérové oligonukleotidy hybridizované s nukleovými kyselinami velkého komplexu IF-M13.
Signál hybridizace závisí na množství cílové nukleové kyseliny, která je v případě reakce se sondou dostupná na filtru. Nezbytnou kontrolou se musí prokázat, že rozdíl v intenzitě signálu neodráží různá množství nukleové kyseliny ve dvou dotech. Hybridizace se sondou, které se účastní stejný počet a druh cílových nukleových kyselin IF a M13, ukazuje, že v dotech je stejné množství DNA. Protože účinnost tvorby hybridů roste s délkou hybridu, signál pro duplex, který má šest nukleotidů, se nejlépe detekoval v případě oligonukleotidového cíle s vysokou hmotnostní, který je vázán • ···· * ·· ·· ·· • · · · · · e> * » · • ··· * · · · '4 · • « · ····*·«··· « t * · · * · ··· ··· ··· ·· *· ·· na filtr. Na danou oblast povrchu je možno navázat větší počet molekul cílové nukleové kyseliny s malou molekulovou hmotnostní ve srovnání s velkými molekulami, které slouží jako cíle. Aby se mohla změřit citlivost detekce nečištěné DNA , různá množství fágových supernatantů se nanesla na filtr a hybridizovala se s oktamérem značeným 3ZP. 50 miliónů nečištěných fágů, které obsahují ne více jak 0,5 ng DNA, dá detekovatelný signál, který ukazuje, že citlivost způsobu hybridizace krátkých oligonukleotidů je dostatečná. Doba reakce je krátká.
Jak se popisuje v teoretické části shora v textu, rovnovážný výtěžek hybridu závisí na koncentraci sondy a/nebo na teplotě reakce. Například síla signálu v případě stejného množství cílové nukleové kyseliny se 4nM oktamérem při teplotě 13 °C je 3 krát nižší než při hybridizací se sondou v koncentraci 40 nM a je snížena 4,5 krát při zvýšení teploty hybridizace na 25 °C.
Demonstrovalo se, že aby se dosáhlo maximální diskriminace, je nutné použít nízké teploty promývání. Aby se tento jev dal vizuálně pozorovat, k dotu obsahujícímu M13 se naneslo 50 krát více DNA, než v případě dotu IF za použití hybridizace se sondou, která je specifická pro vektor. Tímto způsobem signál po kroku hybridizace se sondou v případě chybného párování byl silnější než v případě úplného párování. Poměr Hp/ Hi je 1:4. Inverze intenzity signálu při prodloužené době promývání při teplotě 7 °C se dosáhlo bez velkých ztrát úplného hybridu, kdy poměr Hp/ Hi je 2:1. Naopak není možné dosáhnout libovolné diskriminace pří teplotě 25 °C, protože signál v případě párovaného cíle je snížen na úroveň pozadí při době promývání 2 minuty. Ve stejný okamžik je signál v případě hybridu s nesprávným párováním stále detekovatelný. Ztráta diskriminace při teplotě 13 °C ve srovnání s teplotou 7°C není tak velká, ale je jasně viditelná. Jestliže se uvažuje stav po 90 minutách promývání při teplotě 7 °C a stav • · • ···· · ·· • · * · · · · po 15 minutách promýván! při teplotě 13 °C, což reprezentuje optimální doby promýván! pro tyto podmínky, kdy signál hybridu s nesprávným párováním je blízko úrovně pozadí, je zřejmé, že množství hybridu je několikrát větší při teplotě 7 °C než při teplotě 13 °C. Pro další ilustraci časový průběh diskriminace s promýváním stejného množství počátečního hybridu při uvedených dvou teplotách ukazuje vyšší hodnotu maximálního D při nižší teplotě. Tyto výsledky potvrzují trend změny diskriminace s teplotou a poměr množství dvou typů hybridu na počátku kroku promývání.
Za účelem ukázat obecné využití podmínek hybridizace krátkých oligonukleotidu, v jediném M13 systému se provedly hybridizace 4 heptamérů, 10 oktamérů a dalších 14 sond až s 12 nukleotidy. Jsou zde zahrnuty nonamér se sekvencí GTTTTTTAA a oktamér GGCAGGCG reprezentující dva extrémy obsahu GC. Ačkoli se očekává, že obsah GC a sekvence ovlivňují stabilitu krátkých hybridů (Bresslauer et al., Proč. Nati. Acad. Sci. U.S.A. 83: 3746 (1986)), aby se dosáhlo dostatečné diskriminace při použití všech testovaných sond, aplikovaly se podmínky hybridizace krátkých oligonukleotidových sond s nízkou teplotou. Protože nej lepší hodnota diskriminace získaná při použití sond s 13 nukleotidy bylo 20, lze snadno tolerovat několikanásobný pokles způsobený variacemi sekvence.
Systém M13 je výhodný, protože ukazuje účinky komplexnosti cílové DNA na stupeň diskriminace. V případě dvou oktamérů, které mají buď žádný nebo pět nesprávně párovaných cílů a které se liší pouze jedním párem GC, pozorované diskriminace jsou 18,3 a 1,7. Za účelem ukázat využitelnost těchto metod, se testovaly tři sondy s 8 nukleotidy na souboru 51 dotů plazmidové DNA připravené z knihovny ve vektoru Bluescript. V systému M13 byla přítomna jedna sonda, ale sonda specifická pro vektor Blueskript nebyla zastoupena. Tento systém umožňuje hybridizaci pozitivních a negativních kontrolních DNA s každou sondou. Sekvence této sondy (CTCCCTTT) má také v inzertu • · interferonu komplementární cíl. Protože dot M13 je negativní, zatímco inzert interferonu buď v M13 nebo v Bluescriptu je pozitivní, hybridizace je sekvenčně specifická. Podobně sondy, které detekují cílovou sekvenci pouze v jednom z 51 inzertů nebo v žádném z testovaných inzertů spolu s kontrolami, jenž potvrzují průběh hybridizace, jestliže se v klonech nachází správné cílové nukleové kyseliny.
Křivka teplotní stability velmi krátkých oligonukleotidových hybridů, které mají 6 až 8 nukleotidů, jeu alespoň o 15 °C nižší, než křivky pro hybridy s 11 až 12 nukleotidy (což je zobrazeno na obrázku č. 1 a popisuje se v publikaci Wallace et al., Nucleic Acids res. 6: 3543-3557 (1979)). Hybridizační reakce při nízké teplotě a koncentraci oligonukleotidové sondy 0,4 až 40 nM umožňuje detekci komplementární sekvence ve známé nebo neznámé cílové nukleové kyselině. Za účelem stanovení úplné neznámé sekvence nukleové kyseliny se může použít celá sada obsahující 65 535 8-mérových sond. Dostatečné množství nukleové kyseliny pro tyto účely se nacházejí ve vhodných biologických vzorcích, jako je několik mililitrů kultury M13, plazmidová DNA připravená z 10 ml bakteriální kultury nebo jediná bakterie nebo méně než 1 ml standardní reakce PCR.
Krátké oligonukleotidy s délkou 6 až 10 nukleotidů vykazují skvělou diskriminaci. Relativní snížení stability hybridu s jedním chybným párováním koncové báze je vyšší než v případě delších sond. Výsledky dosažené v případě oktaméru se sekvencí TGCTCATG podporují tento závěr. Při experimentech, kde se vyskytuje cíl s nesprávným párováním koncové báze G/T, je hybridizace s cílem tohoto typu chybného párování nejstabilnější ze všech typů oligonukleotidů. Tato dosažená diskriminace je stejná nebo vyšší, než je diskriminace pro vnitřní chybné párování G/T duplexu s 19 párovanými bázemi (Ikuta et al., Nucl. Acids. Res. 15: 797 (1987)). Zkoumání těchto diskriminačních vlastností za použití popsaných podmínek hybridizace krátkých oligonukleotidů umožňuje velmi přesné stanovení oligonukleotidových cílů. Naopak problém při detekci diskriminace mezi úplnými a chybnými hybridy při použití velmi krátkých oligonukleotidů může nastat při přípravě dostatečného množství hybridů. V praxi se potřebné diskriminace Hp a Hi dosáhne zvýšením množství DNA v dotu a/nebo zvýšením koncentrace sondy nebo snížením teploty hybridizace. Vyšší koncentrace sondy však obvykle zvyšuje pozadí. Pro praktické použití však existují limity v množství cílové nukleové kyseliny. Tyto problémy se vyřešily použitím vyšší koncentrace detergentu sarkosyl, který poskytuje účinné pozadí za použití sondy o koncentraci 4 nM. Dalšího zlepšení se dosáhlo buď při použití kompetitorů v případě nespecifického navázání sondy na filtr nebo změnou hybridizačního podkladového materiálu. V případě sond, jejichž hodnota Ea je nižší než 45 Kcal/mol (což platí v případě mnoha heptamérů a u většiny hexamérů) , upravené oligonukleotidy dávají vzniku stabilnějšímu hybridu (Asseline et al., Proč. Nati. Acad. Sci. 81: 3297 (1984)), než je tomu v případě jejich neupravených partnerů. Při použití hybridizačních podmínek s nízkou teplotou dochází k lepší diskriminaci v případě všech sekvencí a duplexních hybridů. Aby se dosáhlo jednotných hybridizačních podmínek pro různé sekvence je nutné prodloužit dobu promývání z minut až na 24 hodin v závislosti na sekvenci. Doba promývání se může redukovat snížením koncentrace solí.
Nedá se také ignorovat vliv komplexity sekvence na hodnotu dosažené diskriminace. Účinky komplexity jsou více podstatné, když se pro specifické sekvence definují hybridizací s krátkými oligonukleotidy sekvenční informace. Tyto účinky se mohou obejít použitím vhodné sondy vzhledem k poměru délky cílové nukleové kyseliny. Poměr délek se vybral na základě statistiky tak, aby se připravily specifické sekvence, které mají počet chybného párování koncové báze takový, že bude • · · · • · možné eliminovat falešně invertovat diskriminaci. Výsledky naznačují, že je vhodné v případě inzertů nukleových kyselin kratších než 0,6, 2,5 a 10 kb, použít oligonukleotidy, které obsahují 6,7 respektive 8 nukleotidů.
Příklad 11: Sekvenování DNA
Soubor sub-souborů umožňuje účinné sekvenování malé sady vzorků uspořádaných ve formě replikovaných sub-souborů. Například 64 vzorků se může uspořádat do sub-souboru o rozměrech 8x8 mm a sub-soubory o rozměrech 16 x 24 mm se mohou replikovat na membránu o rozměrech 15 x 23 cm, kdy mezi sub-soubory se umístí mezerníky o šířce 1 mm. Může se připravit několik replik membrány. Například sondy pocházející z unverzální sady 3 072 7-mérů se může rozdělit na 32 destiček s 96 prohlubněmi a mohou se značit za použití enzymu kinázy. Během jednoho hybridizačního cyklu lze paralelně zpracovat 4 membrány. Na každé membráně se může hodnotid 384 sond. Všechny sondy se mohou zhodnotit ve dvou hybridizačních cyklech. Intenzita hybridizace a sestavení sekvencí se může hodnotit způsoby popsanými dále v textu.
Jestliže sub-soubor nebo sub-soubory pro jeden vzorek obsahují několik neznámých, zvláště, když se používají podobné vzorky, je dostatečné použít menší počet sond, zvláště, když jsou inteligentně vybrány na základě výsledků předcházejícího hodnocení sond. Jestliže například sonda se sekvencí ΆΆΆΆΆΑΑ není pozitivní, existuje malá šance, že libovolná s 8 překrývajících se sond bude pozitivní. Jestliže uvedená sonda se sekvencí ΆΆΑΆΆΆΑ je pozitivní, pak dvě sondy jsou obvykle pozitivní. Sekvenační proces v tomto případě zahrnuje nejdříve hybridizaci sub-sady minimálně se překrývajících sond s pozitivními „kotvami a pak se vyberou sondy, které potvrdí jednu z nejpravděpodobnějších hypotéz a uspořádání „kotev a velikost a typ mezer mezi nimi. V této druhé fázi se může použít 2 až 10 sond najednou, kde každá sonda se vybrala tak, aby byla pozitivní pouze vůči jednomu vzorku DNA, který se liší od vzorků, o kterých se předpokládá, že hybridizují s jinými než vybranými sondami.
Sub-soubor umožňuje účinnou implementaci konkurence sond (sond, které se překrývají) při řešení problému větvení. Po hybridizaci s univerzální sadou sond, program uspořádání sekvencí stanoví sekvenční sub-fragmenty (SFs) . V případě dalšího uspořádání SFs je nutné poskytnout další informace (z překrývajících se sekvencí fragmentů DNA, z podobných sekvencí nebo z jiných hybridizačních dat nebo z dat získaných při mapování restrikčními enzymy). Primery pro sekvenování na gelu s jedním přechodem přes bod překřížení se stanovily na základě informací získaných SBH nebo ze známých vektorových sekvencí, například ze sekvencí přilehlých k místu inzertu ve vektoru, pak se uskuteční standardní sekvenační reakce vzorků podle Sangera. Sekvence získaná při tomto sekvenování na gelu s jedním přechodem se porovná s Sfs, které se čtou do a z bodu překřížení, aby se stanovilo pořadí Sfs. Dále sekvenování na gelu s jedním přechodem se může kombinovat s SBH se sekvencí de novo nebo s resekvencí nukleové kyseliny.
Konkurenční hybridizace a souvislé staking interakce se mohou také použít při uspořádání Sfs. Tyto přístupy však mají limitovanou komerční hodnotu pro sekvenování velkého počtu vzorků pomocí SBH, kde značená sonda se aplikuje na vzorek fixovaný k souboru, v případě, že se použije jednotný soubor. Analýza malého počtu vzorků za použití replik sub-souborů umožňuje účinnou implementaci obou přístupů. Na každé replice sub-souboru je možné testovat jeden nebo více vzorků DNA za použití souboru sond podobně, jako při řešení mutovaných sekvencí v různých vzorcích nanesených ve stejném sub-souboru (uvedeno shora v textu).
Jestliže v každém ze 64 vzorků popsaných v tomto příkladu existuje přibližně 100 bodů překřížení a jestliže 8 vzorků se analyzuje paralelně na každém sub-souboru, pak alespoň 800 • · · · • · ··· · · «* ·· všechny body překřížení řeší alespoň 800 hybridizací. To znamená, že v případě 3 072 základních hybridizací se použije dalších 800 hybridizací (to je 25 %) . Je výhodné, aby se v případě jednoho bodu překřížení uskutečnily dvě hybridizace. Jestliže sub-soubory jsou malé, používá se nižší počet dalších hybridizací. Například jestliže sub-soubory obsahují 16 vzorků, může se použít 200 dalších hybridizací (6 %). Použitím 7-mérových sond (N1-2B7N1-2) a konkurenčního nebo kolaborativního větvení a na základě přibližně 4 000 hybridizací je možné sestavit fragmenty o velikosti přibližně 1 000 bp. Dále použitím 8-mérových sond (NB8N) pomocí přibližně 12 000 hybridizací je možné sestavit další fragmenty o velikosti přibližně 4 000 bp. Sondy, jako například NB4NB3N nebo NB4NB4N se mohou použít při redukci počtu bodů překřížení.
Příklad 12: Analýza DNA přechodným zachycení na sub-souborech sond a ligace značených sond.
Oligonukleotidové sondy o délce 4 až 40 baží se syntetizovaly za použití standardních postupů a uchovávaly se na destičkách s více prohlubněmi. Specifické sady sond obsahující jednu až 10 000 sond se uspořádaly uložením nebo syntézou in šitu na odděleném podkladu nebo do zřetelných sekcích většího podkladu. V posledním případě se sekce nebo sub-soubory mohou separovat fyzikálními nebo hydrofóbními překážkami. Soubor sond se může připravit syntézou in šitu. Vzorek DNA vhodné velikosti hybridizuje s jedním nebo více specifickými soubory nebo nezávisle s různými sub-soubory na jednom podkladu. Současně se vzorkem nebo následně po přidání vzorku se ke každému sub-souboru také přidá jedna značená sonda nebo několik sond dohromady. Jestliže vzorek DNA je zachycen na podkladu a značené sondy hybridizují těsně vedle sebe s komplementární cílovou nukleovou kyselinou, pak dochází k jejich ligaci. Výskyt ligace se stanoví detekcí značení sondy.
Tento postup je jednou z variant popsaného postupu analýzy DNA, kde vzorky DNA nejsou permanentě přichyceny k podkladu. Dočasné uchycení poskytují sondy fixované na podkladu. V tomto případě není nutné pořádat cílové DNA do souborů. Navíc ligace umožňuje detekci delších oligonukleotidových sekvencí kombinací krátkých značených sond s krátkými fixovanými sondami.
Tento způsob vykazuje několik jedinečných rysů. Dočasné přichycení k cílové nukleové kyselině umožňuje její opětné použití. Po ligaci se cílová nukleová kyselina může uvolnit a značení zůstane kovalentně navázáno na podkladu. Tento rys umožňuje cyklické použití cílové nukleové kyseliny a produkci detekovatelného signálu s malým množstvím cílové nukleové kyseliny. Při optimálních podmínkách není nutné amplifikovat cílové nukleové kyseliny. Pro účely diagnostiky a sekvenování je možné použít například přirozené zdroje vzorků DNA. Cíle se mohou uvolnit teplotními cykly mezi účinnou hybridizací a účinnou denaturací duplexů. Výhodnější je, když se cyklování neaplikuje. Teplota a koncentrace komponentů se může definovat tak, aby volné cílové nukleové kyseliny a cílové nukleové kyseliny vstupující do hybridů byly v rovnovážném poměru přibližně 50:50%. V tomto případě nedochází ke kontinuální produkci ligovaných produktů. Pro různé účely jsou optimální rovnovážné poměry různé.
Při zesílení použití cíle je možné použít elektrické pole. V případě rychlejšího rozdělení cílů se může na každý subsoubor aplikovat horizontální pole pulzů. V této fázi se rovnováha posouvá směrem k tvoření hybridů a musí se použít neznačené sondy. Po fázi třídění cílů se provede vhodné promývání (kterému může pomoci vertikální elektrické pole a dojde k ohraničení pohybu vzorků) . Tiby se zvýšila specifita je možné zavést do postupu několik cyklů diskriminativní denaturace hybridů, získání cílových nukleových kyselin hybridizací a ligaci a odstranění nepoužitích cílových • · nukleových kyselin. V dalším kroku se přidají značené sondy a aplikují se vertikální elektrické pulzy. Zvýšením teploty se může dosáhnout optimálního poměru volných a hybridizovaných cílových nukleových kyselin. Vertikální elektrické pole brání difúzi roztříděných cílů.
Sub-soubory fixovaných sond a sady značených sond (speciálně navržených nebo vybraných ze sady univerzálních sond) se může uspořádat různými způsoby, aby mohlo dojít k účinnému a flexibilnímu sekvenováni a k diagnostickým postupům. Jestliže se krátký fragment (přibližně 100 až 500 bp) bakteriálního genomu zčásti nebo zcela sekvenuje, může se použít malý soubor sond (obsahují 5 až 30 bází), který se navrhl na základě bází známé sekvence. Jestliže se na jeden sub-soubor použije odlišná směs 10 značených sond, soubor 10 sub-souborů obsahující 10 sond umožňuje kontrolu 200 bází, přičemž se předpokládá, že skórují pouze dvě ligaci spojené báze.
Za podmínek, kdy chybné párování je diskriminováno podél celého hybridu, se sondy mohou nahradit víc jak jednou bází, aby se delší cílová nukleová kyselina pokryla stejným počtem sond. Použitím dlouhých sond se může cílová nukleová kyselina použít přímo, aniž se amplifikuje nebo izoluje od zbytku DNA ve vzorku. Také se může současně v jednom vzorku analyzovat několik cílových nukleových kyselin. Jestliže získané výsledky indikují výskyt mutací (nebo patogen) , může se použít další sada sond, aby se stanovil typ mutace nebo subtyp patogenu. To je požadovaný rys postupu, který může být velmi výhodný při preventivní diagnostice, kdy se očekává, že u pacienta jsou infikovány nebo mutovány pouze malé frakce. Při procesu popsaném v příkladech se mohou použít různé detekční metody, například radioaktivní značení, fluorescenční značení, značení enzymy a protilátkami (chemiluminiscence) , značení pomocí velkých molekul nebo částicemi, které jsou detekovatelné rozptylem světla nebo interferometrickými postupy.
• · • » • · ·
Příklad 13: sekvenování cílové nukleové kyseliny za použití oktamérů a nonamérů
Data, která vyplývají z hybridizace oktamérových a nonamérových nukleotidů ukazují, že sekvenování hybridizaci poskytuje extrémně vysoký stupeň přesnosti. V tomto experimentu se použila známá sekvence, aby se mohly předpovědět série sousedících překrývajících se oktamérových a nonamérových oligonukleotidů.
Vedle zcela spárovaných oligonukleotidů, se testovaly chybně párované oligonukleotidy, oligonukleotidy, kde se v duplexu tvořeném oligonukleotidem a cílovou nukleovou kyselinou vyskytuje vnitřní nebo koncové chybné párování. Při této analýze se za účelem dosažení maximální hybridizace používala nejnižší možná teplota. Promývání se provedlo při stejné nebo nižší teplotě, aby se zajistila maximální diskriminace tím, že se využije vyšší rychlost disociace hybridizace chybně párovaného versus zcela spárovaného oligonukleotidů s cílovou nukleovou kyselinou. Ukázalo se, že tyto podmínky lze aplikovat na všechny sekvence, ačkoli absolutní výtěžek hybridizace závisí na sekvenci.
Nejmenší destabilizující chybné párování, které lze stanovit, je koncové chybné párování jediné báze. Test sekvenování metodou hybridizace umožňuje diskriminaci zcela spárovaných duplexů oligonukleotid/cílová nukleová kyselina od duplexů s chybným koncovým párováním oligonukleotid/cílová nukleová kyselina.
Diskriminační hodnoty v případě 102 ze 105 hybridizujících oligonukleotidů ve formátu dot blot byly vyšší než 2, což umožňuje vysoce přesnou tvorbu sekvence. Tento systém také umožňuje analýzu vlivu sekvence na hybridizaci a nestabilitu hybridizačních produktů.
Na základě dat, které jsou výsledkem hybridizace 105 oligonukleotidových sond známé sekvence s cílovou nukleovou kyselinou, se vytvořila známá část genu lidského interferonu o velikosti 100 párů baží. Používané oligonukleotidové sondy zahrnují 72 oktamérových a 21 nonamérových oligonukleotidů, jejichž sekvence je zcela komplementární s cílovou nukleovou kyselinou. Sada 93 sond poskytuje konzekutivní překrývající se rámce cílové sekvence nahrazené jednou nebo dvěma bázemi.
Pro zhodnocení účinku chybného párování se provedla hybridizace dalšími 12 sondami, kde došlo alespoň k jednomu chybnému koncovému párování, když sondy hybridizovaly s testovanou cílovou sekvencí o velikosti 100 bp. Také se testovala hybridizace dvanácti sond s cílovým chybným koncovým párováním se čtyřmi sekvencemi kontrolních nukleových kyselin vybraných tak, že 12 oligonukleotidů tvořilo zcela spárované duplexní hybridy se čtyřmi kontrolními DNA. Hybridizace vnitřně chybně párovaných, zcela párovaných duplexových párů a duplexových párů s chybným koncovým párováním oligonukleotidů a cílové nukleové kyseliny se hodnotilo v případě každého nukleotidu, který se v experimentu použil. Vliv absolutní koncentrace cílové DNA na hybridizaci s oktamérovými a nonamérovými oligonukleotidy se stanovil definováním koncentrace cílové DNA detekcí hybridizace odlišné oligonukleotidové sondy s místem, který není cílem a vyskytuje se v ko-amplifikované plazmidové DNA pouze jednou.
Výsledky tohoto experimentu ukazují, že všechny oligonukleotidy obsahují úplně spárovanou komplementární sekvenci s cílovou nukleovou kyselinou nebo s kontrolní DNA, která hybridizuje daleko silněji, než ty oligonukleotidy vykazující chybné párování. Aby se došlo k tomuto závěru testovaly se hodnoty Hp a D v případě každé sondy. Hodnota Hp definuje množství hybridního duplexu, který se vytvořil mezi testovaným cílem a oligonukleotidovou sondou. Získáním hodnot v rozmezí 0 a 10 v případě hybridizace provedené se 105 sondami, je zřejmé, že 68,5 % ze 105 sond mělo hodnotu Hp vyšší než 2.
Získaly se diskriminační hodnoty (D) , kde D se definovalo jako poměr intenzit signálu mezi 1) dotem, který obsahuje úplně spárovaný duplex vytvořený mezi testovaným oligonukleotidem a cílovou nebo kontrolní nukleovou kyselinou a 2) dotem, který obsahuje chybně párovaný duplex tvořený mezi stejným oligonukleotidem a odlišným místem na cílové nebo kontrolní nukleové kyselině. Variace hodnoty D jsou výsledkem buď 1) perturbací v účinnosti hybridizace, které umožňují vizualizaci signálu přes pozadí nebo 2) typu chybného párování nalezený mezi testovaným nukleotidem a cílovou nukleovou kyselinou. Hodnoty D získané v tomto experimentu jsou v rozmezí 2 a 40 v případě 102 ze 105 testovaných oligonukleotidových sond. Výpočtem hodnoty D v případě skupiny 102 oligonukleotidů jako celku se dosáhlo průměrné hodnoty D
10, 6.
Existuje 20 případů, kde duplexy oligonukleotid/ cílová nukleová kyselina vykazují chybné párování koncové báze. V pěti z těchto případů je hodnota D vyšší než 10. Vysoké hodnoty D v tomto případě jsou výsledkem destabilizace hybridizace způsobené jinými než nejvíce stabilním chybným párováním koncové báze (G/T a G/A) . Jiná možnost je, že existuje chyba v sekvenci buď oligonukleotidů nebo cílové nukleové kyseliny.
Chyba v nukleové kyselině, která je cílem pro sondu s nízkou hodnotou Hp, se vyloučila, protože taková chyba by ovlivnila hybridizaci každé z dalších osmi překrývajících se sond. V případě jiných překrývajících se oligonukleotidů neexistuje zjevná nestabilita způsobená chybným párováním sekvence, což ukazuje, že cílová sekvence je správná. Po té, co se znova testovalo sedm nově syntetizovaných oligonukleotidů, se vyloučila možnost chyby. Pouze 1 ze sedmi oligonukleotidů vedl k lepší hodnotě D. Nízké hodnoty tvorby hybridů mohou být výsledkem nestability hybridů nebo neschopnosti tvořit duplex hybridu. Neschopnost tvořit duplexy • · • · · hybridu jsou výsledkem buď 1) samotné komplementarity vybrané sondy nebo 2) hybridizace cílová nukleová kyselina/cílová nukleová kyselina. Tvorba duplexu oligonukleotid/oligonukleotid může být zvýhodněná před tvorbou duplexu oligonukleotid/cílový hybrid, jestliže sonda je sama k sobě komplementární. Podobně, spojení cílová nukleová kyselina/cílová nukleová kyselina může být zvýhodněna, jestliže cílová nukleová kyselina je sama k sobě komplementární nebo může tvořit vnitřní palindromy. Při hodnocení těchto možností vyplývá z analýzy sondy, že diskutované sondy netvoří hybridy sami se sebou. Při testování příspěvku hybridizace cílová nukleová kyselina/cílová nukleová kyselina se stanovilo, že jedna z diskutovatelných oligonukleotidových sond neúčinně hybridizovala s dvěma odlišnými DNA, které obsahují stejnou cílovou nukleovou kyselinu. Nízká pravděpodobnost, že dvě různé DNA mají sami k sobě komplementární oblast pro stejnou cílovou nukleovou kyselinu vede k závěru, že možná hybridizace cílová nukleová kyselina/cílová nukleová kyselina nemá vliv na slabou hybridizaci. Tyto výsledky pak indikují, že nestabilita hybridu a nikoli neschopnost tvořit hybridy negativně ovlivňuje nízkou hybridizaci pozorovanou u specifických oligonukleotidů. Výsledky také ukazují, že nízká tvorba hybridů je ovlivněna specifickými sekvencemi jistých oligonukleotidů. Výsledky ukazují, že spolehlivé výsledky pro vytvoření sekvence je možné získat za použití oktamérových a nonamérových oligonukleotidů.
Tyto výsledky ukazují, že použitím popsaných metod, lze vytvořit dlouhé sekvence libovolné specifické cílové nukleové kyseliny maximálním a jedinečným překryvem konstituentních oligonukleotidů. Takové způsoby sekvenování jsou závislé na obsahu jednotlivých oligomérů bez ohledu na jejich frekvenci a jejich pozici.
• ·
Sekvence, která vzniká použitím algoritmu popsaným dále v textu vykazuje vysokou přesnost. Algoritmus toleruje falešně pozitivní signály hybridizace dotů, jak vyplývá ze skutečnosti, že sekvence vzniklá na základě 105 hodnot hybridizace, které zahrnují čtyři méně hodnověrné hodnoty, je správná. Přesnost při sekvenování je dána kinetikou hybridizace krátkých oligonukleotidů a rozdílem ve stabilitě duplexu, které existují mezi zcela spárovanými duplexy a duplexy s chybným párováním. Poměr stability duplexu párovaných a duplexů a duplexů s chybným párováním koncové báze roste s klesající délkou duplexu. Vazebná energie klesá s klesající délkou duplexu, což vede k nižší účinnosti hybridizace. Výsledky ukazují, že hybridizace oktaméru umožňuje rovnováhu faktorů ovlivňujících stabilitu duplexu a diskriminaci, aby vznikla vysoce přesná metoda sekvenování hybridizací. Výsledky uvedené v jiných příkladech ukazují, že oligonukleotidy, které obsahují 6, 7 nebo 8 nukleotidů se mohou účinně používat při vytvoření spolehlivé sekvence cílové nukleové kyseliny, které jsou 0,5 kb velké (pro hexaméry), 2 kb (pro septaméry) a 6 kb (pro oktaméry) . Sekvence dlouhých fragmentů se může překrývat za vzniku celé sekvence genomu.
Příklad 14; Analýza získaných dat
Podoba souborů se zkoumá testovacím programem, jako je například program DOTS (Drmanac et al., 1993) a zkoumají se a hodnotí se statistickými funkcemi, které zahrnuje například program SCORE (Drmanac et al., 1994). Z distribuce signálů je možné stanovit optimální práh přenosu signálu vstupu +/výstupu. Na základě pozice detekovaného značení je možné stanovit kombinováním známých sekvencí zmobilizovaných a značených sond, které odpovídají značeným pozicím, F + P nukleotidové sekvence fragmentů. Celá sekvence nukleové kyseliny nebo sekvence sub-fragmentů původní molekuly, jako je například lidský chromozom, se pak sestaví na základě • ·· · překrývající se F + P sekvence, jenž se stanoví pomocí výpočetní dedukce.
Jednou možností je transformovat během procesu sestavení sekvence hybridizační signály, jako je například skóre, na +/V tomto případě sestavování začne se sekvencí F + P s velmi vysokým skóre, což může být například sekvence F + P s AAAAAATTTTTT. Skóre všech čtyř možných překrývajících se sond AAAAATTTTTTA, AAAAATTTTTT, AAAAATTTTTTC a AAAAATTTTTTG a tří dalších sond, které se liší v počátku sekvence (TAAAAATTTTTT, CAAAAATTTTTT, GAAAAATTTTTT) , se porovnává a definují se tři výstupy: (i) pouze počáteční sonda a pouze jeden ze čtyř překryvů má skóre, které je podstatně pozitivní vzhledem k jiným šesti sondám. V tomto případě sekvence AAAAAATTTTTT se protáhne o jeden nukleotid směrem doprava; (ii) žádná sonda mimo počáteční sondy nemá podstatně pozitivní skóre, sestavování se zastaví, například sekvence AAAAAATTTTT se nachází na konci molekuly DNA, která se sekvenuje; (iii) mezi překrývajícími se sondami a/nebo jinými třemi sondami se zjistila více jak jedna podstatně pozitivní sonda; sestavování se zastaví z důvodu výskytu chyby nebo větvení (Drmanac et al., 1989).
Při procesu výpočetní dedukce se použijí počítačové programy za použití existujících algoritmů (popisuje se například v publikacích Pevzner, 1989; Drmanac et al., 1991; Labat and Drmanac, 1993).
Jestliže se mimo F + P, stanovily F (mezera 1)P, F (mezera 2)P, F( mezera 3)P nebo F(mezera4)P, použije se algoritmus, za účelem párování všech sad dat, oprav potencionálních chyb nebo se vyřešení situace, kde je problém větvení (popisuje se například v publikacích Drmanac et al., 1989; Bains et al., 1988; ).
Příklad 15: Provedení sekvenování hybridizaci ve dvou krocích • ·
Následují příklady popisující provedení metody sekvenování podle vynálezu. Nejdříve celý čip bude hybridizovat se směsí DNA, jako komplex obsahující 100 miliónů bp (což odpovídá jednomu lidskému chromozómu). Návod jak provést hybridizaci je možné nalézt v publikacích, jako je Drmanac et al., (1990);
Khrapko et al., (1991) a Broude et al., (1994). Publikace popisují rozmezí teplot hybridizace, pufry a promývací kroky, které jsou vhodné pro použití v počátečním kroku hybridizace Formát 3 SBH.
Vynález popisuje, že hybridizace, kde je přítomna cílová DNA v nízké koncentraci, probíhá až několik hodin při vysoké koncentraci solí při nízké teplotě (-2 °C až 5 °C) . Z tohoto důvodu se místo pufru fosforečnanu sodného (Drmanac et al., 1990) používá SSC pufr, který se sráží při teplotě 10 °C. Promývání nesmí být s ohledem na druhý krok dlouhé (pouze několik minut) . Může se zcela vynechat, když se při sekvenování vysoce komplexních vzorků DNA použije hybridizace v cyklech. Stejný pufr se používá při hybridizaci a promývání, aby se mohlo pokračovat ve druhém stupni hybridizace se značenými sondami.
Po vhodném promytí za použití jednoduchého zařízení, se přidá ke každému souboru (například uspořádání 8x8 mm) jedna značená sonda (například 6-mér). Za tímto účelem se například může použít zařízení s 96 špičkami a provede se 42 operací. Opět se může použít rozmezí diskriminačních podmínek, jak se popisuje v odborných publikacích.
Vynález zvláště popisuje použití následujících podmínek. Nejprve po přidání značených sond a inkubaci po dobu pouhých několika minut (vzhledem k vysoké koncentraci přidaných oligonukleotidů) při nízké teplotě (0 až 5 °C) se teplota zvýší na 3 až 10 °C v závislosti na délce F a P. Pak se přidá promývací pufr. V této době se používá pufr, který je vhodný pro libovolnou ligační reakci (například 100 mM sůl). Po přidání ligázy teplota opět vzroste na 15 až 37 °C, což umožní rychlou ligaci (méně než 30 minut) a další diskriminaci zcela spárovaných a chybně spárovaných hybridů.
Při metodě SBH formát 3 je možné také použití kationtové detergenty, jak se popisuje v publikaci Pontius and Berg (1991). Autoři popisují použití dvou kationtových detergentů při renaturaci DNA. Jde o dodecyltrimetylamoniumbromid a cetyltrimetylamoniumbromid (DTAB a CTAB).
DTAB a CTAB jsou varianty kvarterního aminu tetrametylamoniumbromidu (TMAB), kde jedna z metylových skupin je nahrazena alkylovou skupinou s 12 uhlíky (DTAB) nebo s 16 uhlíky (CTAB). TMAB je bromidová sůl tetrametylamonného iontu, což je činidlo, které se používá při experimentech renaturace nukleové kyseliny, aby se snížil obsah G-C a teplota denaturace. DTAB a CTAB mají podobnou strukturu jako dodecylsulfát sodný (SDS), přičemž se záporně nabitý sulfát SDS nahradí pozitivně nabitým kvarterním aminem. Zatímco SDS se běžně používá v hybridizačních pufrech, aby se snížilo nespecifické navázání a inhibivovaly se nukleázy, neovlivňuje významně rychlost renaturace.
Když se použije ligace, je možné přidat enzym spolu se značenou sondou nebo za účelem snížení pozadí po kroku promytí. Ačkoli se dříve o ligaci nemluví ve spojitosti s libovolnou metodou SBH, ligace je v oboru molekulární Například Hood a jeho kolegové genu zprostředkovanou ligázou kterou je možné jednoduše přizpůsobit pro metodu SBH Formát 3. Wu a Wallace také popisují použití T4 DNA ligázy bakteriofágu při spojení dvou sousedících krátkých syntetických oligonukleotidů. Popisované ligační reakce proběhly v 50 mM Tris Hel pH 7,6, 10 mM MgCl2, 1 mM DTT a 5 % PEG. Ligační reakce se zahřály na teplotu 100 °C po dobu 5 až 10 minut, pak se ochladily na teplotu 0 °C a přidala se T4 DNA ligáza ( 1 jednotka, Bethesda Research biologie velmi dobře známa, popisují metodu detekce (Landegren et al., 1988), • v
Laboratory). Většina ligačních reakcí proběhla při teplotě 30 °C a ukončila se zahřátím na teplotu 100 °C po dobu 5 minut.
Pak se provede konečné promytí vhodné pro diskriminující detekci vedle sebe hybridizovaných nebo ligovaných oligonukleotidů v délce (F + P) . Tento promývací krok se provádí ve vodě po dobu několika minut při teplotě 40 až 60 °C, přičemž se odstraní všechny neligované značené sondy a všechny jiné sloučeniny, aby se maximálně redukovalo pozadí. Vzhledem k tomu, že značené oligonukleotidy se vážou kovalentně, zjednoduší se detekce (neexistují časová omezení a omezení nízkou teplotou).
V závislostí na použitém značení se ke zviditelnění čipů používají různé zařízení. Při radioaktivním značení se může použít technologie testování fosforu a zařízení Phosphorlmager (Molecular Dynamics, Sunnyvale, CA) . Čipy se umístí do kazety a překryjí se detektorem fosforu. Po 1 až 4 hodinách expozice se detektor skenuje a záznam zobrazení se uloží na harddisku počítače. Při detekci fluorescenčního značení se používá kamera CCD a epifluorescentní a konfokální mikroskopie. V případě čipů, které generují přímo záření, jenž zaznamenává kamera CCD, se detekce popisuje v publikaci Eggers et al. (1994).
Detektory (CCD) slouží jako aktivní pevné podklady, které kvantitativně detekují u ukazují distribuci značených cílových molekul v testech, kde se používají sondy. Tyto přístroje používají inherentní charakteristiky mikroelektroniky, která umožňuje paralelní testy, ultracitlivou detekci, vysokou průchodnost, získání a zpracování integrovaných dat. V publikaci Eggers et al. (1994) se použijí detektory CCD, které se používají v testech se sondami a umožňují kvantitativní odhad, což umožňuje vysoce citlivé a přímé párování.
Integrovaná detekce CCD umožňuje na čipu detekovat vazbu molekul. Detektor rychle tvoří dvourozměrný patern, který • · jedinečně charakterizuje vzorek. Při specifické operaci molekulárních detektorů založených na CCD, se imobilizují odlišné biologické sondy přímo na pixely CCD nebo se mohou zachytit na krycím sklíčku umístěném na povrchu CCD. Molekuly vzorku se mohou značit izotopy, chemickou luminiscencí nebo fluorescencí.
Při expozici vzorku uspořádání, kde sonda je umístěná na CCD, fotony nebo produkty rozkladu radioizotopů se emitují do oblasti pixelů, kde je navázán vzorek. V případě metody formátu 3 se použijí dvě komplementární sondy. Naopak na silikonu se tvoří páry elektron-vakance, kdy nabité partikule nebo záření ze značeného vzorku dopadají na brány CCD. Elektrony se pak sbírají do přilehlých bran CCD a postupně se zobrazují na modulu displeje. Počet fotoelektronů vytvořených na každém pixelu je přímo úměrný počtu navázaných molekul. Následně lze stanovit množství navázaných molekul (Eggers et al., 1994).
Umístěním zobrazovacího uspořádání do blízkosti vzorku se zvýší nejméně 10 krát účinnost oproti metodám s čočkou, která se nachází na běžných kamerách CCD. To znamená, že vzorek (emitor) je v úzkém kontaktu s detektorem (zobrazující uspořádání) a to eliminuje běžnou znázorňující optiku, jako jsou čočky a zrcadla.
V případě, že se na cílové molekuly navážou jako reportní skupiny radioizotopy, detekují se energetické partikule. Několik reportních skupin, které emitují partikule s různou energií, se úspěšně používají spolu s detektory s mikrotkaninou. Mezi tyto izotopy patří 32P, 33P, 35S, 14C, a 125L. Partikule s vyšší energií, jako tvoří například 32P, nejvíce citlivou detekci molekul, zatímco partikule s nižší energií, jako je 35S, poskytuje lepší rozlišení. Proto je možné vybrat radioizotop podle potřeby. Když se vybere určitý radioizotop, provedení detekce se může předpovědět výpočtšm • · poměru signálu ku pozadí (SNR), jak se popisuje v publikaci Eggers et sl. (1994).
Alternativní postupy luminiscenční detekce zahrnují použití skupin reportérů chemoluminiscence a luminiscence připojených na cílových molekulách. Fluorescenční značení může být připojeno kovalentně nebo pomocí interakcí. Fluorescenční barviva, jako je etidiumbromid s intenzivními pruhy absorpce v rozsahu ultrafialového záření (300 až 350 nm) a základní emisní pruhy ve viditelném záření jsou nejvhodnější při použití zařízení CCD, protože účinnost je několikanásobně nižší než při excitačních vlnových délkách než při vlnové délce fluorescenčního signálu.
Při detekci lumioniscenčního záření polysilikonové brány CCD mají takovou kapacitu, aby odfiltrovaly podíl dopadajícího světla v rozmezí UV. Jsou také velmi citlivé na viditelné záření vytvořené fluorescenčními reportními skupinami. Taková inherentně velká diskriminace proti UV excitaci umožňuje dosáhnout pomocí CCD velký SNR (vyšší než 100), jak se popisuje v publikaci Eggers et al. (1994).
Při imobilizaci sond na detektor se může vytvořit hybridizační matrice na laciných destičkách SiO2, které jsou následně umístěny na povrchu CCD, což umožňuje hybridizaci a sušení. Tento formát je ekonomicky výhodný, protože hybridizace DNA se provádí na levných destičkách z SiO2 na jedno použití, což umožňuje znovu použít dražšího detektoru CCD. V jiném případě se sondy mohou imobilizovat přímo na CCD, aby vznikla předem určená matrice sond.
Aby došlo k imobilizaci sond na potahu SiO2, na povrch filmu se naváže epoxidová vrstva používající epoxy-silanové činidlo a standardní chemii modifikace SiO2. Aminem oligonukleotidové sondy jsou pak spojeny SiO2 způsobem, kdy vzniká sekundární amin kruhem. Výsledné spojení vazeb separace mezi 3 modifikované s povrchem s epoxidovým rotovatelných umožňuje 17 třemi bázemi separace oligonukleotidů a povrchu z SiO2. Aby se zabezpečila úplná deprotonace aminu a minimalizace tvorby sekundární struktury během párování, reakce se provádí v 0,1 Μ KOH a inkubuje se při teplotě 37 °C po dobu 6 hodin.
Při SBH Formát 3 se signály hodnotí v každém z miliónu bodů. Není nutné, aby hýbridizovaly všechna uspořádání, například 4 000 uspořádání o. rozměrech 5x5 mm a je možné použít menší počet uspořádání.
Při zesílení hybridizačního signálu je možné použít cyklické hybridizace. V jednom cyklu většina fixovaných sond bude hybridizovat s fragmenty DNA s koncovými sekvencemi, nekomplementárními se značenými sondami. Zvýšením teploty dojde k roztavení hybridů. V následujícím cyklu budou některé z nich (až 0,1 %) hybridizovat s příslušným fragmentem DNA a dojde k vazbě dalších značených sond. V tomto případě dochází k diskriminačnímu tání hybridů DNA, nekomplementárních pro obě skupiny sond současně.
• >
Při hybridizačním cyklu se všechny složky přidávají před začátkem cyklů při teplotě 37 °C v případě T4 nebo při vyšší teplotě v případě použití termostabilní ligázy. Pak se teplota sníží na 15 až 37 °C a čip se inkubuje po dobu až 10 minut, načež se teplota zvýší na 37 °C nebo vyšší na několik minut a pak se znovu sníží. Cykly je možno opakovat až lOx. Podle jednoho z možných provedení je možno použít optimální vyšší teplotu 10 až 50 °C bez použití cyklů a vazba může probíhat delší dobu, 1 až 3 hodiny.
Popsaný způsob dovoluje přípravu složitých čipů při použití standardní syntézy a přesného uložení oligonukleotidů vzhledem k tomu, že je nutno použít jen relativně malý počet oligonukleotidů. Například v případě, že se synthetizují všechny 7-mery (16384 sond), je možno stanovit 256 milionů 14-merů.
Při jednom z důležitých provedení způsobu podle vynálezu je možno užít v základním uspořádání více než jednu sondu s různým značením. Tento postup může mít dva účely. Jedním z nich je snížit počet odděleně hybridizovaných uspořádání. Duhým z jich je stanovit ještě delší sekvence oligonukleotidů, například 3x6 nebo 3 x 7. V tomto případě je možno s použitím dvojího značení specifikovat 3 za sebou následující oligonukleotidy téměř absolutně, protože positivní místa mají dostatečné množství signálů z obojího značení.
• · ·
ΊΟ • · · · fr • · ·
Další variantou je použití čipů, které obsahují sondy BxNy, kde symbol y má hodnotu od 1 do 4. Tyto čipy umožňují čtení sekvence v různých rámcích. Toho lze také dosáhnout použitím vhodné sady značených sond nebo sondy P a F mohou mít některé nespecifikované koncové pozice (to znamená některý element konečné degenerace). Jako část linkeru je možné použít univerzální báze, aby se sondy s definovanou sekvencí spojily s pevným povrchem. To činí sondu více dostupnou pro hybridizaci a konstrukce jsou tak více stabilní. V případě, že sonda má pět bází, mohou se použít jako linker tři univerzální báze (Obrázek č. 4) .
Příklad 16: Stanovení sekvence z dat hybridizace
Uspořádání sekvence se může přerušit dokonce i tehdy, kdy existují dva nebo několik duplikátů daného překrývajícího se (N-l)-méru. Pak se pro prodloužení sekvence mohou použít oba ze dvou N-mérů, kteří se liší posledním nukleotidem. Tento bod větvení limituje jednoznačné uspořádání sekvence.
V některých případech neproběhne znovu uspořádání sekvence známých oligonukleotidů, které hybridizují s cílovou nukleovou kyselinou. K tomu dochází, protože některé informace se ztratí, protože v případě, že cílová nukleová kyselina se nevyskytuje jako fragmenty vhodné velikosti ve vztahu k velikosti oligonukleotidu, který se používá při hybridizaci. Množství ztracených informací je přímo úměrné délce cíle, který se sekvenuje. Když se však použije dostatečně krátká cílová DNA, její sekvence se nemusí stanovit jednoznačně.
Může se vypočítat pravděpodobná frekvence duplikovaných sekvencí, které budou interferovat s uspořádáním sekvence. Tato derivace vyžaduje zavedení definici parametru, který charakterizuje organizaci sekvence: subfragment sekvence (SF). Subfragment sekvence vzniká, jestliže libovolná část sekvence cílové nukleové kyseliny začíná a končí (N-l)merem, který se v cílové sekvenci opakuje dvakrát nebo více krát. Subfragmenty t ·»♦· · · í · ·*· · · « · · • » · · · · ··· · · · ·· ** · · jsou sekvence vytvořené mezi dvěma body větvení v procesu uspořádání sekvencí způsobem podle vynálezu. Součet všech subfragmentů je delší než skutečná cílová nukleové kyselina, protože obsahuje překrývající se krátké konce. V obecném případě subfragmenty se nemohou uspořádat lineárně bez dalších informací, protože na svém konci a začátku sdílí (N-l)mery.
V případě každé cílové nukleové kyseliny se získal různý počet subfragmentů v závislosti na počtu jejich opakovaných (Nl)merů. Počet závisí na hodnotě N-l a délce cílové DNA.
Pravděpodobnost výpočtů se může odhadnout na základě vztahu dvou faktorů. Jestliže uspořádání pozitivních N-merů se provede použitím překrývajících se sekvencí v délce N-l nebo v průměrné vzdálenosti Ao, pak délka N-l fragmentu, který tvoří Lf bází, je dána rovnicí jedna:
sf = 1 + Ao x K x P (K, Lf
Kde symbol K je větší nebo roven 2 a symbol P(K, Lf) reprezentuje pravděpodobnost N-méru vyskytujícího se K-krát ve fragmentu s počtem bází Lf. Počítačový program, který je schopen tvořit subfragmenty z obsahu N-mérů v případě dané sekvence se popisuje v příkladu 18.
Počet subfragmentů roste pro danou délku sondy s rostoucí délkou fragmentů. Získané subfragmenty se nemohou mezi sebou jedinečně uspořádat. Ačkoli tato informace není úplná, je velice užitečná při srovnávací analýze sekvencí a při rozeznávání funkčních sekvenčních charakteristik. Tento typ informace se může nazývat částečná sekvence. Jiná cesta získání částečné sekvence je použití pouze subsady oligonukleotidových sond dané délky.
Může existovat relativně dobrá shoda mezi předpovězenou sekvencí podle teorie a počítačovou simulací náhodné sekvence DNA. Například N-l = 7, (za použití 8-meru nebo skupin 16 10merů typu 5' (A, T, C, G) Bg (A, T, C, G) 3'), cílová nukleové • · kyselina obsahující 200 baží bude obsahovat průměr tří subfragmentů. Vzhledem k rozdělení okolo průměru, knihovna cílové nukleové kyseliny by měla mít inzerty o velikosti 500 bp tak, že 1 ve 2 000 cílech má více než tři subfragmenty. V ideálním případě se při stanovení sekvence dlouhé nukleové kyseliny může použít reprezentativní knihovna s podstatně krátkými inzerty cílové nukleové kyseliny. V případě takových inzertů je možná rekonstrukce jednotlivých cílových nukleových kyselin způsobem podle vynálezu. Celá sekvence velké nukleové kyseliny se pak získá překrytím definovaných sekvencí jednotlivých inzertů.
Je nutné redukovat potřebu velmi krátkých fragmentů, například fragmentů o délce 50 baží v případě 8-meru. Informace obsažená v překrývajících se fragmentech jsou přítomny při každém náhodném procesu fragmentace DNA, jako je klonování nebo náhodná PCR. Je také možné použít soubor krátkých fragmentů nukleových kyselin . Za použití 8-merů nebo 11-merů jako je 5' (A, T, C, G) N8 (A, T, C, G) 3' při sekvenováni 1 megabáze je místo 20 000 fragmentů o velikosti 50 bp potřeba pouze 2 100 vzorků.
Toto číslo zahrnuje 700 náhodných klonů o velikosti 500 bp (knihovna subfragmentů) a 150 klonů z přeskakující (nebo podobné) knihovny. Vyvinutý algoritmus (popisuje se v příkladu 18) regeneruje sekvenci za použití hybridizačních dat těchto popsaných vzorků.
Příklad 17: Algoritmus
Tento příklad popisuje algoritmus pro vytvoření dlouhé sekvence popsané čtyřmi písmeny abecedy od k-tuple slov v minimálním počtu oddělených, náhodně definovaných fragmentů počáteční sekvence nukleové kyseliny, kde symbol K je délka oligonukleotidové sondy. Algoritmus se primárně používá při sekvenováni procesem hybridizace (SBH). Algoritmus je založen na subfragmentech (SF), informativních fragmentech (IF) a • ····
možnosti použití souboru fyzikálních nukleových sekvencí v případě definování informačních framentů.
Jak se uvádí subfragmenty způsobené bodem překřížení při procesu uspořádání vznikají z repetice oligomerové sekvence ΚΙ v cílové nukleové kyselině.
Subfragmenty jsou fragmenty sekvence, které se nachází mezi libovolnými dvěmi opakovanými slovy v délce K-l, které se objevují v sekvenci. Vícenásobný výskyt slov K-l způsobuje přerušení uspořádání překryvu K-slov v procesu tvoření sekvence. Přerušení vede k tomu, že ze sekvence zbydou pouze fragmenty. Zřejmé segmenty mezi body překřížení nejsou zcela stanoveny a nazývají se sekvenční subfragmenty.
Informační fragmenty se definují jako fragmenty sekvence, které jsou určeny nejbližšími konci překrývajících se fyzikálních fragmentů sekvence.
Určitý počet fyzikálních fragmentů se může spojit, aniž dojde ke ztrátě možnosti definovat informativní fragmenty. Celková délka náhodně spojených fragmentů závisí na délce ktuple, které se použijí v sekvenčním procesu.
Algoritmus zahrnuje dvě hlavní jednotky. První část se používá při vytvoření subfragmentů ze sady K-tuple, které se nachází v sekvenci. Subfragmenty mohou vznikat v kódující oblasti fyzikální sekvence nukleové kyseliny určitých velikostí nebo v informačních fragmentech definovaných v dlouhých sekvencích nukleové kyseliny. Oba typy fragmentů jsou členy základní knihovny. Tento algoritmus nepopisuje stanovení obsahu k-tuple informativních fragmentů základní knihovny. To znamená, že krok přípravy informativních fragmentů se použije v procesu přípravy sekvence.
Druhá část algoritmu stanoví lineární uspořádání získaných fragmentů za účelem regenerace úplné sekvence fragmentů nukleové kyseliny základní knihovny. Za tímto účelem se používá knihovna druhého řádu, která se připravila náhodně spojením fragmentů počátečními sekvencemi. Za účelem • · • · ··· ··· ··· ·· ·· regenerace celé sekvence megabáze plus, algoritmus nezahrnuje krok kombinování sekvencí základních fragmentů. Toho lze dosáhnout použitím spojených fragmentů základní knihovny, která je nezbytně nutná pro regeneraci informativního fragmentu. V jiném případě lze dosáhnout regenerace informativního fragmentu použitím uvedeného algoritmu po vytvoření sekvencí fragmentů základní knihovny tak, že se použije způsob vyhledávání jejich překryvů na základě přítomnosti běžných koncových sekvencí.
Algoritmus nevyžaduje ani znalost počtu výskytu daných ktuple v sekvenci nukleové kyseliny základní nebo knihovny uspořádání ani nevyžaduje informaci, zda slova k-tuple se nachází na koncích fragmentu. Algoritmus zpracovává směs ktuple různých délek. Koncept algoritmu umožňuje operace se sadou k-tuple, které obsahují falešně pozitivní a falešně negativní k-tuple. Pouze ve specifických případech falešné ktuple primárně neovlivňují celistvost a správnost tvořené sekvence. Algoritmus se může použít při optimalizaci parametrů při stimulačních experimentech, stejně jako při tvorbě sekvence v uvedených experimentech SBH, například při tvorbě genomové sekvence DNA. Při optimalizaci parametrů v případě praktických a konvenčních fragmentů je zvláště důležitá volba oligonukleotidových sond (k-tuple) a/nebo v případě definovaných sond je zvláště důležitá volba optimální délky a počtu fragmentů.
Tato část algoritmu má důležitou úlohu při procesu tvorby sekvence z obsahu k-tuple. To se zakládá na jediněčném uspořádání k-tuple způsobem maximálního překryvů. Hlavními problémy při tvorbě sekvence jsou specifické opakované sekvence a falešně pozitivní a/nebo negativní k-tuple. Cílem této části algoritmu je získat minimální počet co možná nejdelších subfragmentů se správnou sekvencí. Tato část algoritmu obsahuje jeden základní a několik kontrolních kroků. Protože jisté informace se mohou použít pouze po vytvoření • · všech primárních subfragmentů, je nezbytné vytvořit dvoufázový proces.
Hlavním problémem tvorby sekvence je získání opakované sekvence z obsahů slov, které podle definice nenesou informaci o počtu výskytu určitých k-tuplů. Koncept celého algoritmu závisí na základě čeho je tento problém řešen. V principu existují dva přístupy: 1) opakované sekvence lze získat na začátku, při procesu přípravy pSF nebo 2) opakované sekvence se mohou získat později, při procesu konečného uspořádání subfragmentů. V prvním případě pSF obsahuje nadbytek sekvencí a v druhém případě obsahují nedostatek sekvencí. První přístup vyžaduje eliminaci nadbytku vytvořených sekvencí a druhý přístup požaduje vícenásobné použití některých subfragmentů v procesu konečného uspořádání sekvence.
Rozdíl v uvedených dvou přístupech je rozdíl ve stupni přísnosti pravidla jedinečného překryvu k-tuple. Méně přísné pravidlo je, že k-tuple X se nejednoznačně maximálně překrývá s k-tuple Y, jestliže a nebo pouze jestliže nejvíce pravý k-1 konec k-tuple X je přítomen pouze na nejvíce levém konci ktuple Y. Toto pravidlo umožňuje přípravu repetitivních sekvencí a tvorbu nadbytku sekvencí.
Přísné pravidlo, které se používá při druhém přístupu má další námitku: k-tuple X se nejednoznačně maximálně překrývá s k-tuple Y, jestliže a pouze jestliže nejvíce pravý konec k-1 k-tuple X je přítomen na nejvíce levém konci k-tuple Y a jestliže nejvíce levý konec k-1 k-tuple Y není přítomen na nejvíce pravém konci libovolného jiného k-tuple. Algoritmus založený na přísném pravidlu je jednodušší a je popsán vynálezem.
Proces elongace daného subfragmentů se zastaví, když pravý konec k-1 posledního zahrnutého k-tuple se nachází na levém konci libovolného k-tuple nebo je přítomen na dvou nebo více k-tuplů. Jestliže se nachází pouze na jednom k-tuple, druhá část pravidla se testuje. Jestliže se navíc existuje k-tuple, • · které se liší od dříve zahrnutého k-tuple, pak uspořádání daného subfragmentu je ukončeno pouze na první pozici nacházející se co nejvíce napravo. Jestliže toto k-tuple neexistuje, tyto podmínky nastávají pouze v případě jediného překryvu k-1, daný subfragment se prodlouží směrem doprava o jeden element.
Vedle základního pravidla se za účelem možnosti použití ktuple různých délek používá další podpůrné pravidlo. Maximální překryv je délka k-1 kratšího k-tuple překrývajícího se páru. Příprava pSF začala od prvního k-tuple ze souboru, ve kterém jsou k-tuple zobrazený náhodně a nezávisle na jejich pořadí v sekvenci nukleové kyseliny. Tak se první k-tuple v souboru nemusí nacházet nezbytně na počátku sekvence ani na počátku určitého subfragmentu. Postup tvoření subfragmentu se uskutečnil uspořádáním k-tuplů způsobem jediného překryvu, « který se definuje popsaným pravidlem. Každý použitý k-tuple vzešel ze souboru. Jestliže zde neexistují žádné další k-tuple jednoznačně přesahující poslední k-tuple, pak stavba subfragmentu se ukončí a začne se se stavbou jiného pSF.
Protože tvorba většiny subfragmentů nezačíná od jejich skutečného počátku, tvořené pSF se přidají k souboru k-tuple a považují se za delší než k-tuple. Jinou možností je tvorba subfragmentů, které probíhají v obou směrech od počátečního ktuple. Proces se zastaví, když už další přesah není možný, to znamená, když není možné dále subfragmenty prodlužovat.
PSF se mohou rozdělit do tří skupin: 1) subfragmenty maximální délky a správná sekvence v případech přesné sady ktuple; 2) krátké subfragmenty tvořené za použití maximálního a jednoznačného pravidla přesahu v nekompletní sadě a/nebo sada s některými falešně pozitivními k-tuple a 3) pSF nesprávné sekvence. Neúplnost sady v odstavci 2) je způsobena falešně negativními výsledky experimentu hybridizace, stejně jako použitím nesprávné sady k-tuple. Jejich vznik způsobují falešně pozitivní a falešně negativní k-tuple a mohou • · zahrnovat: a) špatně spojené subfragmenty; b) subfragmenty se špatným koncem a c) falešně pozitivní k-tuple, které se jeví jako falešné minimální subfragmenty.
Jestliže se zvažují falešně pozitivní k-tuple, existuje možnost přítomnosti k-tuple, který obsahuje více než jednu špatnou bázi nebo jednu špatnou bázi někde ve středu, stejně jako možnost výskytu k-tuple se špatnou bází na konci. Tvorba krátkých, chybných nebo špatně spojených subfragmentů je způsobena pozdějšími k-tuple. K-tuple dvou druhů reprezentují špatné pSF s délkou, která odpovídá délce k-tuple.
V případě jednoho falešně negativního k-tuple, vznikají pSF, protože není možný maximální přesah. V případě přítomnosti jednoho falešně pozitivního k-tuple se špatnou bází na jeho nejvíce levém nebo nejvíce pravém konci vznikají pSF, protože není možný jednoznačný překryv. Jestliže jsou v souboru zahrnuty jak falešně pozitivní nebo falešně negativní k-tuple s běžnou sekvencí k-1, vznikají pSF a jeden z těchto pSF obsahuje špatný k-tuple na relevantním konci.
Proces opravení subfragmentů s chybami v sekvenci a spojení s jednoznačně spojenými pSF se uskutečnil po vytvoření subfragmentů a v procesu uspořádání subfragmentů. Dále v textu se popisuje první krok, který zahrnuje štěpení chybně spojených pSF a získání konečných fragmentů jednoznačným spojením pSF.
Při tvorbě chybně spojených subfragmentů existují dva přístupy. V případě prvního přístupu se objeví chyba, když se objeví chybný k-tuple v bodech sestaveni opakovaných sekvencí délky k-1. V případě druhého přístupu opakované sekvence jsou kratší než k-1. Tyto situace se mohou objevit každá ve dvou variantách. V první variantě jedna z opakovaných sekvencí reprezentuje konec fragmentu. V druhé variantě se opakovaná sekvence objeví v libovolné poloze ve fragmentu. V prvním případě, aby došlo ke špatnému spojení, je nutné, aby k-tuple nebyly přítomny v souboru (falešně negativní k-tuple). Druhá • · • · možnost požaduje, aby v souboru byly přítomny jak falešně negativní tak falešně pozitivní k-tuple. Jestliže uvažujeme opakování sekvence k-1, pak to, že chybí pouze jedna k-tuple je dostatečné, v případě, že se interně opakuje libovolný konec. Důvodem je, že konec sekvence může považovat za lineární uspořádání bez konce falešně negativních k-tuple. Je velmi pravděpodobné, že tyto případy se budou detekovat, pouze v reálném experimentu, ostatní se vyskytují s daleko menší frekvencí.
Rozeznávání špatně spojených subfragmentů je přísněji definováno, když se opakovaná sekvence neobjeví na konci fragmentu. V této situaci je možné detekovat dva subfragmenty. Jeden z nich se nachází co nejvíce na levém a druhý co nejvíce na pravém konci sekvencí k-2, které jsou také přítomny ve špatně spojeném fragmentu. Když opakovaná sekvence leží na konci fragmentu, existuje zde pouze jeden subfragment, který obsahuje sekvenci k-2, způsobující chybu při tvoření subfragmentu na jeho nejvíce pravém a nejvíce levém konci.
Odstranění chybně spojených subfragmentů se provede jejich vystřižením podle běžného pravidla: jestliže nejvíce levá nebo nejvíce pravá sekvence o délce k-2 libovolných subfragmentů se rozdělí do dvou subfragmentů, každý z nich obsahuje sekvenci k-2. Toto pravidlo nepokrývá řidší situace opakovaného konce, kdy zde se vyskytuje více jak jeden falešně negativní k-tuple v bodě opakované sekvence k-1. Chybně spojené subfragmenty tohoto typu se mohou rozeznávat za použití informací z překrývajících se fragmentů nebo z informativních fragmentů jak základních tak knihoven uspořádání. Navíc fragment zůstává chybně spojený, když se objeví dva nebo více falešně negativních k-tuplů v obou pozicích, které obsahují identickou sekvenci k-1. Jde o velmi řídkou situaci, protože to vyžaduje alespoň 4 specificky falešné k-tuple. Navíc se může zavést další pravidlo za účelem štěpení těchto fragmentů na sekvence o délce k, jestliže daná sekvence se může získat kombinací sekvencí kratších než k-2 od konce jednoho subfragmentu a počátku druhého subfragmentu.
Přísnou aplikací popsaného pravidla se ztrácí úplnost, aby se zajistila přesnost na výstupu. Některé subfragmenty budou štěpeny, ačkoli jsou špatně spojeny, protože zapadají do paternu špatně spojeného subfragmentu. Existuje několik situací tohoto druhu. Například fragment vedla alespoň dvou identických sekvencí k-1 obsahuje libovolnou sekvenci k-2 od k-1 nebo fragment obsahuje nejméně dvakrát opakovanou sekvenci k-2 a alespoň jednu falešně negativní k-tuple obsahující danou sekvenci k-2, která se nachází uprostřed, atd.
Cílem této části algoritmu je redukce počtu pSF za účelem minimalizace počtu delších subfragmentů se správnou sekvencí. Vytvoření jedinečných delších fragmentů nebo celé sekvence je možné ve dvouch situacích. První situace zahrnuje specifické uspořádání opakovaných k-1 slov. Existují případy, ve kterých některé nebo všechny maximálně prodloužené pSF (první skupina pSF) mohou být jedinečně uspořádány. Například ve fragmentu SRl-a-R2-b-Rl-c-R2-E, kde symbol S a E znamená počátek a konec fragmentu, symbol a, b a c jsou různé sekvence specifické pro dané fragmenty a symboly R1 a R2 jsou dvě sekvence k-1, které se tandemově opakují, vzniká pět fragmentů (S-Rl, Rl-a-R2, R2b-Rl, R1-C-R2 a R-E) . Tyto fragmenty se mohou uspořádat dvěma způsoby; jako původní sekvence uvedená shora v textu nebo jako S-Rl-c-R-b-Rl-a-R-E. Naopak ve fragmentu se stejným počtem a typy opakovaných sekvencí, ale s odlišným uspořádáním, to znamená S-Rl-a-Rl-b-R-c-R-E, neexistuje žádná jiná sekvence, která zahrnuje všechny subfragmenty. Příklady tohoto typu se mohou vyskytovat pouze po ukončení procesu tvorby pSF. Tyto příklady ukazují, že v procesu tvorby pSF jsou nutné dva stupně. Důležitější je druhá situace tvoření falešných krátkých subfragmentů v místech neopakovaných sekvencí k-1, kdy soubory obsahují negativní a/nebo pozitivní k-tuple.
Řešení obou skupin pSF zahrnuje dvě části. Za prvé, jsou eliminovány falešně pozitivní k-tuple jevící se jako neexistující minimální subfragmenty. Všechny subfragmenty ktuple délky k, které nemají na libovolném konci přesah, a subfragmenty délky větší než k-a na jednom konci a větší než dalším konci se eliminují, aby umožnily tvorbu k-b na maximálního počtu spojení. V uvedených experimentech hodnoty symbolů 2 a 3 se jeví být adekvátní, aby eliminovaly dostatečný počet falešně pozitivních k-tuple.
Spojení subfragmentů, které mohou být spojeny jediným způsobem, se provádí ve druhém kroku. Pravidlo, kterým se řídí spojení, říká: dva subfragmenty mohou být jedinečně spojeny, jestliže a pouze jestliže přesahující sekvence na relevantním konci nebo začátku dvou subfragmentů není přítomna na počátku a/nebo na konci libovolného jiného subfragmentů. Výjimkou je skutečnost, že jeden subfragment z uvažovaného páru má stejný začátek a konec. V tom případě je spojení možné dokonce, když v souboru není jiný subfragment se stejným koncem. Hlavním problémem je přesná definice přesahující sekvence. Ke spojení nedojde, jestliže přesahující sekvence, která je pouze jediná pro jeden pár subfragmentů, je kratší než k-2 nebo je rovna k2 nebo je delší, ale existuje další subfragment s přesahující sekvencí libovolné délky delší než K-4. Také oba kónické konce pSF a konce po vypuštění jedné (nebo několika) posledních baží se považují za přesahující sekvence.
Po tomto kroku mohou přetrvávat některé falešně pozitivní k-tuple (jako minimální fragmenty) a některé subfragmenty se špatným koncem. Navíc, ve velmi řídkých případech, kde je současně přítomný jistý počet některých specifických falešných k-tuple, může dojít k chybnému spojení. Tyto případy se detekují a řeší v procesu uspořádání fragmentů a při dalších kontrolních krocích spolu se zpracováním chybně spojených fragmentů.
• · ··· · · ·· · • · · · » · · • · ·· ··· ··· • · · » » ·«· · · ·· «· . V běžném samy mezi
8i : ·. .
• * « · · · · ·
Krátké získané subfragmenty jsou dvojího druhu případě tyto subfragmenty jsou jednoznačně spojeny sebou vzhledem k distribuci opakovaných sekvencí k-1. To se může uskutečnit po procesu vytvoření pSF a je to dobrý příklad nezbytnosti procesu tvorby pSF se dvěma kroky. V případě použití souboru obsahujícího falešně pozitivní a/nebo falešně negativní k-tuple se získaly na místech s neopakovanými sekvencemi k-1 krátké pSF. Jestliže uvažujeme falešně pozitivní k-tuple, k-tuple mohou obsahovat více jak jednu špatnou bázi (nebo obsahují jednu špatnou bázi někde ve středu) na svém konci. Tvorbu krátkých a chybných (nebo špatně spojených) subfragmentů způsobují pozdější k-tuple. K-tuple tvořícího se druhu reprezentují chybné pSF s délkou, která je rovna délce k-tuple.
Cílem spojení části pSF algoritmu je redukce počtu pSF s minimálním počtem delších subfragmentů se správnou sekvencí. Všechny subfragmenty k-tuple, které nemají přesah ani na jednom konci a jejichž délka je větší než k-a na jednom a než k-b na druhém konci, se eliminují, což umožní maximální počet spojení. Tímto způsobem se odstraní většina falešně pozitivních k-tuple. Pravidlo spojení říká, že dva subfragmenty mohou být jedinečně spojeny, jestliže nebo pouze jestliže přesahující sekvence relevantního konce nebo počátku dvou subfragmentů není přítomna na počátku a/nebo na konci libovolného jiného subfragmentů. Výjimkou je subfragment s identickým počátkem a koncem. V tom případě je spojení možné dokonce i tehdy, když se v souboru vyskytuje jiný subfragment se stejným koncem. Hlavním problémem je přesná definice přesahující sekvence. Přítomnost alespoň dvou specifických falešně negativních k-tuple v místech repetice sekvencí k-1 nebo k-2, stejně jako kombinace falešně pozitivních a falešně negativních k-tuple může zničit nebo maskovat některé přesahující sekvence a mohou vznikat jednoznačné, ale chybně spojení pSF. Aby se tomu zabránilo, úplnost se musí obětovat • · * · • · « r · * 4 • · « « «a na účet přesnosti: spojení nelze uskutečnit na koncové sekvenci, která je kratší než k-2 a v přítomnosti extra se překrývající sekvence delší než k-4. Překrývající se sekvence se definují od konce pSF nebo se vypustí jedna nebo několik posledních bází.
Ve velmi řídkých situacích, když je přítomen jistý počet některých specifických falešně pozitivních a falešně negativních k-tuplů, mohou přetrvat některé subfragmenty se špatným koncem, mohou se zachovat některé falešně pozitivní ktuple (jako minimální subfragmenty) nebo může dojít k chybnému spojení. Tyto případy se detekují a řeší se ve subfragmentech procesem uspořádání a v dalších kontrolních krocích spolu se zpracováním neštěpených chybně spojených subfragmentů.
Proces uspořádání subfragmentů je podobný procesu jejich tvoření. Jestliže se uvažují subfragmenty jako delší k-tuple, uspořádání se uskuteční jejich zřejmým spojením prostřednictvím překrývajících se konců. Informační základ v případě zřejmého spojení je dělení subfragmentů vzniklých ve fragmentech základní knihovny do skupin, které reprezentují segmenty těchto fragmentů. Tento způsob je analogií biochemického řešení uvedeného problému založeného na hybridizací s delšími oligonukleotidy s relevantní spojovací sekvencí. Spojovací sekvence se tvoří jako subfragmenty za použití sady k-tuple vhodných segmentů základních fragmentů knihovny. Relevantní segmenty se definují jako fragmenty organizační knihovny, které se překrývají s fragmenty základní knihovny. Nej kratší segmenty jsou informativní fragmenty knihovny uspořádání. Delší fragmenty tvoří několik okolních informativních fragmentů nebo celé překrývající se části fragmentů odpovídající základní knihovně a knihovně uspořádání. Za účelem snížení počtu oddělených vzorků jsou fragmenty knihovny uspořádání náhodně sebrány a stanoví se obsah k-tuple.
• · • · • · · • · ·
Použitím velkého počtu fragmentů v knihovně uspořádání se tvoří velmi krátké segmenty, tak se snižuje možnost vícenásobného výskytu sekvencí k-l, což je důvodem vytvoření subfragmentů. Dále další segmenty zahrnující různé oblasti daného fragmentu základní knihovny neobsahují některé opakované sekvence k-l. V každém segmentu se spojovací sekvence (spojovací subfragment) tvoří pro jistý pár subfragmentů z daného fragmentu. Proces uspořádání zahrnuje tři kroky: (1) tvoření obsahů k-tuple pro každý segment; (2) tvoření subfragmentů v každém segmentu a (3) spojení subfragmentů segmentů. Primární segmenty se definují jako podstatné křížení a rozdíly obsahů k-tuple daného fragmentu základní knihovny s obsahy k-tuple souborů knihovny uspořádání. Sekundární (kratší segmenty) se definují jako křížení a rozdíly obsahů k-tuple primárních segmentů.
Existuje zde problém hromadění falešně pozitivních a negativních k-tuple jak v rozdílech tak i při křížení. Falešně negativní k-tuple se od počáteční sekvence hromadí ve křížení (překrývající se části) stejně jako falešně pozitivní k-tuple vyskytující se náhodně v obou sekvencích, ale nikoli v relevantní překrývající se oblasti. Na druhé straně, většina falešně pozitivních k-tuple z libovolných počátečních sekvencí není přítomna v křížení. To je příklad snížení experimentálních chyb přicházejících z jednotlivých fragmentů použitím informace z fragmentů, které se s nimi překrývají. Falešné k-tuple se z jiného důvodu hromadí v rozdílech z jiného důvodu. Sada falešně negativních k-tuple z původních sekvencí se zvětší o falešně negativní k-tuple pocházející z křížení a sada falešně pozitivních k-tuple se zvětší o ty ktuple, které nejsou zahrnuty do křížení kvůli chybě, to znamená, že jsou falešně negativní v křížení. Jestliže počáteční sekvence obsahují 10 % falešně negativních dat, pak primární a sekundární křížení bude obsahovat 19 % a 28 % falešně negativních k-tuple. Na druhou stranu matematický • · odhad je 77 falešně pozitivních k-tuple, v případě, že základní fragment a souhrn fragmentů má délku 500 bp a 10 000 bp. Existuje však možnost znovu získání „ztracených k-tuple a eliminování většiny falešně pozitivních k-tuple.
Nejdříve je nutné stanovit základní obsah k-tuple pro daný segment jako křížení daného páru obsahů k-tuple. Pak následuje zahrnutí všech počátečních obsahů k-tuple do křížení, které obsahuje na jednom konci k-1 a na druhém konci k-+ sekvencí, které se vyskytují na koncích dvou k-tuple základní sady. To se provede před vytvořením rozdílů a tak se předchází hromadění falešně pozitivních k-tuple v tomto procesu. Stejný typ zvětšení sady k-tuple se aplikuje na rozdíly v rozlišování, přičemž tato půjčka se získá z křížení. Všechny půjčené k-tuple se eliminují ze souborů křížení jako falešně pozitivní.
Překřížení, to znamená sada běžných k-tuple, se definuje pro každý pár (základní fragment ) X (soubor knihovny uspořádání). Jestliže počet k-tuple v sadě je podstatný, zvyšuje se falešně negativními k-tuple podle uvedeného pravidla. Primární sada rozdílů se získá odečtením daného základního fragmentu, čímž se získá sada křížení, negativní k-tuple jsou připojeny k sadě původně pochází ze sady překřížení podle shora uvedeného pravidla, a ve stejný čas jsou odstraněny ze sady překřížení jako falešně pozitivní k-tuple. Když je základní fragment delší, než sebrané fragmenty pak tento rozdíl může reprezentovat dva oddělené segmenty, které určitým způsobem redukují jejich využití v dalších krocích. Primární segmenty jsou všechna vytvořená překřížení a rozdíly párů (základní fragment) X (souhrn knihovny uspořádání) obsahující podstatný počet k-tuple. Sada k-tuple sekundárních segmentů se získaly porovnáním sady k-tuple všech možných párů primárních segmentů. Z každého páru se definují dva rozdíly, které produkují překřížení s podstatným počtem k-tuple. Většina
Falešně rozdílů, přičemž
dostupných informací z překrývajících se fragmentů se získala v tomto kroku tak, že existuje trochu, co se dá získat z třetího kola tvořících se překřížení a rozdílů.
(2) tvoření subfragmentů segmentů se uskuteční stejně, jak se popisuje v případě fragmentů základní knihovny.
(3) Způsob spojení subfragmentů zahrnuje sekvenční stanovení správně spojených párů subfragmentů z daného fragmentu základní knihovny, která má některé překrývající se konce. V případě 4 relevantních subfragmentů dva z nich obsahují stejný začátek a dva mají stejný konec. Existují 4 odlišné páry subfragmentů, které se mohou spojovat. V obecném případě dva jsou správné a dva jsou chybné. Aby se našel ten správný, testuje se přítomnost spojovacích sekvencí každého páru v subfragmentech vytvořených ze všech primárních a sekundárních segmentů daného základního fragmentu. Délka a umístění spojovací sekvence se zvolily tak, aby zabránily interferenci se sekvencemi, které se vyskytují pouze náhodou. Jejich délka je k+2 nebo delší a zahrnují alespoň jeden element 2 vedle překrývající se sekvence v obou subfragmentech daného páru. Spojení se provádí pouze v případě, že se našly dvě spojené sekvence a zbývající dvě neexistují. Dva spojené subfragmenty nahradí v souboru dosavadní subfragmenty a proces se cyklicky opakuje.
V tomto kroku se tvoří opakované sekvence. To znamená, že některé subfragmenty se ve spojených subfragmentech vyskytují více než jednou. Je možné je rozeznat tím, že se zjistí relevantní spojovací sekvence, které spojují jeden fragment se dvěmi různými subfragmenty.
Schopnost rozpoznat chybně spojené subfragmenty, které vznikají při postupu stavby pSF a spojování pSF za vzniku delších fragmentů, je založena na testování skutečnosti, zda sekvence subfragmentů z daného základního fragmentu se vyskytuje v sekvencích subfragmentů generované v segmentech • ♦ • · ·
« · · · · ·* ·· určených pro fragmenty. Sekvence z chybně spojených pozic nelze nalézt, což ukazuje na chybně spojené subfragmenty.
Vedle tří popsaných kroků uspořádání subfragmentů je nutné za účelem vytvoření úplnější sekvence bez chyb aplikovat další řídící krok nebo kroky pro specifické sekvence.
Stanovení skutečnosti, který subfragment patří kterému segmentu, se uskutečnilo porovnáním obsahů k-tuple ve segmentech a subfragmentech. Vzhledem k chybám v obsahu ktuple (způsobují primární chybu v souborech a statistické chyby ve frekvenci výskytu k-tuple) skutečná rozdělení subfragmentů na části je nemožná. Tak místo úplného nebo žádného dělení se pro každý subgfragement stanoví pravděpodobnost daná segmentem (P(sf,s)). Tato možnost je funkcí délky k-tuplů, délky subfragmentů, délky fragmentů knihovny uspořádání, velikosti souboru a procentického zastoupení falešných k-tuple v souboru:
P (sf, s) (Ck - F) / Lsf, kde symbol Lsf je délka subfragmentů, symbol Ck je počet běžných k-tuple daného páru subfragmentu/segment a symbol F je parametr, který zahrnuje vztah mezi délkami k-tuple, fragmenty základní knihovny, velikosti souboru a procenta chyb.
Subfragmenty přisuzované určitému segmentu se upravují jako redundantní krátké pSF a dochází k procesu jejich jednoznačnému spojení. Definice jednoznačného spojení se v tomto případě trochu liší, protože je založena na pravděpodobnosti zda fragmenty přesahující konec (konce) patří k uvažovanému segmentu. Mimo to přesnost jednoznačného spojení se řídí následujícím spojení těchto subfragmentů v jiných segmentech. Když dojde ke spojení a vzniknou různé segmenty, všechny získané subfragmenty se spojí dohromady. Eliminují se kratší subfragmenty zahrnuté v delších subfragmentech a zbývající subfragmenty se účastní běžného procesu spojení.
• ·
Jestliže nedojde k úplné regeneraci sekvence, postup dělení a spojení subfragmentů se opakuje se stejně nebo méně přísnými kritérii pravděpodobnosti patřící k určitému segmentu, pak následuje jednoznačné spojení.
Za použití přísného kriteria pro jednoznačné překrytí nelze použít některé informace. Místo úplné sekvence se získá několik subfragmentů, které definují počet možností pro daný fragment. Jestliže se použije méně přísné kriterium vznikne přesná a úplná sekvence. Při určitém počtu situací, například při chybných spojeních, je možné vytvořit úplnou, ale chybnou sekvenci nebo je možné vytvořit „znetvořené subfragmenty, mezi nimi nedojde ke spojení. Tak v případě každého fragmentu základní knihovny je možné získat: a) několik možných řešení, kde jedno je správné a b) nejpravděpodobnější správné spojení. Ve velmi malém počtu případů na základě chyb v procesu tvorby subfragmentů nebo specifickém poměru pravděpodobnosti nedojde k jednoznačnému ani nejpravděpodobnějŠímu řešení. Tyto případy zůstávají jako neúplné sekvence nebo srovnáním uvedených dat s jinými překrývajícími fragmenty základní knihovny lze dosáhnout jednoznačné řešení.
Popsaný algoritmus se testoval na náhodně vzniklé sekvenci o velikosti 50 kb, která obsahuje 40 % GC, což simuluje obsah GC lidského genomu. Do střední části uvedené sekvence se začlenily různé All a některé další repetice, jejichž celková délka je přibližně 4 kb. Za účelem simulace SBH experimentu in vitro a přípravy správných dat se uskutečnily následující experimenty.
Za účelem simulace přípravy základní knihovny se náhodně definovaly pozice 60 překrývajících se klonů o velikosti 5 kb:
Za účelem simulovat provedení knihovny uspořádání se náhodně definovaly pozice 1000 klonů o velikosti 500 b. Tyto fragmenty se extrahovaly ze sekvence. Připravily se náhodné soubory 20-ti fragmentů a stanovily se k-tuplové sady souborů • · · a uložily se na hard disku. Tyto data se používaly při fázi uspořádání subfragmentů: V případě celého lidského genomu při stejné hustotě klonů se použily pro základní knihovnu 4 miliónu klonů a pro knihovnu uspořádání 3 miliónu klonů. Celkový počet 7 miliónu klonů je několikanásobně menší než počet klonů o velikosti několika málo kb v případě náhodného klonování skoro všech genomových DNA a sekvenování za použití na gelu založené metodě.
Na základě dat z počátku a z konce fragmentů o velikosti 5 kb se stanovilo, že v sekvenci je 117 „informačních fragmentů. Pak následuje stanovení sad překrývajících se ktuplů, ze kterých se skládá jediný „informační fragment. Použil se pouze předem stanovený seznam sub-sady správně spárovaných k-tuplů. Seznam zahrnoval 65 % 8-mérů, 30 % 9-mérů a 5 % 10 až 12-mérů. Způsob přípravy a uspořádání subfragmentů se uskutečnil na základě uvedených dat.
Testování algoritmu se provedlo na základě simulovaných dat ve dvou experimentech. Sekvence 50-ti informačních fragmentů se vytvořila se 100 % správnou sadou dat ( více jak 20 000 bp) a dále zahrnuje 26 informačních fragmentů (přibližně 10 000 bp) a 10 % falešných k-tuple (5 % pozitivních a 5 % negativních).
V prvním experimentu všechny subfragmenty byly správné a pouze v jednom z 50-ti informačních fragmentů sekvence nebyla zcela regenerována, ale zůstala ve formě 5 subfragmentů. Analýza pozic překrývajících se fragmentů knihovny uspořádání ukázala, že chybí informace pro jedinečné uspořádání 5 subfragmentů. Subfragmenty se mohou spojit dvěma způsoby založenými na překrývajících se koncích, 1-2-3-4-5-6 a 1-4-32-5. Jediným rozdílem je změna pozic subfragmentů 2 a 4. Protože subfragmenty 2, 3 a 4 jsou relativně krátké (celková délka je přibližně 100 bp) existuje relativně vyšší pravděpodobnost, že v tomto případě žádný z těchto fragmentů knihovny uspořádání začíná a končí oblastí subfragmentů 3.
Za účelem simulace skutečného sekvenování se zahrnula některá falešná (hybridizační) data jako vstup v počtu experimentů. Při oligomérovém hybridizačním experimentu probíhajícím za navržených podmínek existuje pouze jedna situace, kdy se získávají nespolehlivá data je nesprávné párování konce versus hybridizace s úplným správným párováním. Proto při simulaci pouze těchto k-tuplů, které se liší od reálných pouze jedním elementem na každém konci, se uvažuje, že jsou falešně pozitivní. Tyto „falešné sady se připravují následným způsobem. Na jednu původní sadu k-tuplů informačního fragmentu se přidá sada 5 % falešně pozitivních k-tuplů. Falešně pozitivní k-tuple se připravují náhodným vybráním ktuple ze sady, vytvořením kopie a změnou nukleotidu na jeho začátku a konci. Pak následuje substrakce sub-sady 5 % náhodně vybraných k-tuplů. Tímto způsobem vznikají statisticky očekávaný počet nejvíce komplikovaných případů, kde správný ktuple se nahradí k-tuplem se špatnou bází na svém konci.
Produkce sad k-tuple vede až k 10 % falešných dat. Tato hodnota kolísá od případu k případu a způsobuje náhodnost volby k-tuplů, od kterých se tvoří kopie a které se mění. Navzdory tomu toto procento 3 krát až 4 krát přesahuje množství nespolehlivých dat při reálných experimentech hybridizace. Zavedená chyba 10 % vede ke dvojnásobnému zvýšení počtu subfragmentů jak u fragmentů základní knihovny (informační fragmenty základní knihovny) tak i v segmentech. Přibližně 10 % konečných subfragmentů vykazuje na svém konci špatnou bázi, jak se očekávalo u sady k-tuplů, která zahrnuje falešně pozitivní k-typly (popisuje se v odstavci příprava primárních subfragmentů). Nezjistily se ani případy špatného spojení subfragmentů ani subfragmenty se špatnou sekvencí. Ve čtyřech informativních segmentech z 26 testovaných v procesu uspořádání se neregenerovala celá sekvence. Ve všech čtyřech případech se získala sekvence ve formě několika delších subfragmentůa několika kratších subfragmentůobsažených • · • · ·
v několika segmentech. Tento výsledek ukazuje, že principy algoritmu umožňují pracovat s velkým procentem falešných dat.
Úspěch tvorby sekvence z obsahu k-tuplů se může popsat jako kompletnost a přesnost. Při procesu tvoření se mohou definovat dvě určité situace: 1) Ve tvořené sekvenci chybí některá část informací, ale je známo, kde se dvojznačnost nachází a ke kterému typu patří a 2) získaná regenerovaná sekvence se nepáruje se sekvencí, ze které vzniká obsah ktuplů, ale může se detekovat chyba. Za předpokladu, že se vyvinutý algoritmus má svá teoretická omezení, může dojít pouze k první uvedené situaci. Nekompletnost vede k jistému počtu subfragmentů, které se nemohou jednoznačně uspořádat a může vzniknout problém stanovení přesně délky monotóní sekvence, to znamená počtu úplných tandemových repetic.
Z falešných k-tuplů může vzniknout nesprávná sekvence. Důvod chyb nevychází z nevýhod algoritmu, ale ze skutečností, že daný obsah k-tuplů jednoznačně reprezentuje sekvenci, která se liší od původní sekvence. Mohou se definovat tři třídy chyb v závislosti na druhu falešných k-tuplů přítomných ve filu. Falešně negativní k-tuply (které nejsou doprovázeny falešně pozitivními) produkují „delece. Falešně pozitivní k-tuple produkují „prodloužení. Falešně pozitivní k-tuple, které jsou doprovázený falešně negativními k-tuply jsou důvodem pro tvorbu „inzercí samotných nebo v kombinaci s delecemi. Delece vznikají v případě, že všechny k-tuple (nebo jejich většina) mezi dvěma možnými počátky subfragmentů jsou falešně negativní k-tuply. Vzhledem k tomu, že každá pozice v sekvenci se definuje k k-tuply, výskyt delecí v běžném případě vyžaduje konsekutivní falešně negativní k-tuple. (S 10 % falešně negativních k-tuplů a k=8, tato situace nastává po každém 108 elementu). Tato situace není velmi častá dokonce při sekvenováni savčího genomu za použití náhodných knihoven, které obsahují deset ekvivalentů genomu.
• ·
Prodloužení konce sekvence způsobené falešně pozitivními k-tuply je specifický případ „inzerce, protože konec sekvence považovat se muže se může detekovat , fragmentech vznikají fragmenty knihovny místě delece může kombinací falešně uspořádání. Inzerce nebo vzniknout jako výsledek za nekonečný lineární soubor falešne negativních k-tuplů. Musí se brát na zřetel skupina falešně pozitivních k-tuplů, které produkují subfragmenty delší než jeden k-tupl. Situace tohoto druhu jestliže v překrývajících se subfragmentyjako náhodné fyzikální inzerce na specifických pozitivních a falešně negativních k-tuplů. V prvním případě počet konzekutivních falešně negativních k-tuplů je menší než K. Oba případy požadují několik překrývajících se falešně pozitivních k-tuplů. Inzerce a delece jsou ve většině případů teoretické možnosti bez určitelné praktické reakce, protože požadavky na počet a specifitu falešných k-tuplů jsou jednoduše příliš vysoké.
Při každé další situaci výskytu neshody s teoretickými požadavky minimálního počtu druhu falešně pozitivních a falešně negativních k-tuple, mohou chyby v obsahu k-tuple produkovat pouze menší úplnost tvořené sekvence.
SBH, vzorek nukleové kyseliny se sekvenuje tak, že přijde do styku se sondou známé sekvence vázanou na podkladue a se značenou sondou nebo sondami v roztoku. Vždy, když se do směsi sondy a vzorek přidá ligáza tak, že na podkladu navázaná sonda a značená sonda hybridizují v celém vzorku tak, že spolu sondy vzájemně sousedí, přičemž jsou spojeny chemickou vazbou působením ligázy. Po promytí se na základě přítomnosti značené sondy detekují pouze chemicky spojené na podkladě navázané a značené sondy. Na základě znalosti identity sondy navázané na podkladě v určité pozici v souboru a identity značené sondy se může stanovit část sekvence vzorku pomocí přítomnosti značky v určitém místě souboru vzorku tří substrátů. Žádný ze vzorků, který se má sekvenovat, nemůže být fragment nukleové kyseliny • ·
nebo oligonukleotid deseti párů baží (bp). Upřednostňuje se, aby vzorek obsahoval 4 000 až 1 000 baží.
Délka sondy je fragment, jehož délka je menší než 10 baží a upřednostňuje se, aby jeho délka byla mezi 4 a 9 bázemi. Tímto způsobem soubor sond vázaných na podpoře může zahrnovat všechny oligonukleotidy dané délky nebo může zahrnovat pouze oligonukleotidy vybrané pro případ určitého testu. V případě, že se používají všechny oligonukleotidy dané délky, počet centrálních oligonukleotidů se může vypočítat podle vzorce 4N, kde symbol N je délka sondy.
Příklad 18: Opětné použití sekvenčních čipů
Když se v procesu sekvenace použije ligace, pak se obyčejný oligonukleotidový čip nemůže opětovně použít. Vynález popisuje, že tuto skutečnost je možné obejít různými způsoby.
Jeden takový způsob může v případě druhé sondy využít ribonukleotidy, tzv. sondu P tak, že tato sonda se může následně odstranit ošetřením RNázou. V případě ošetření RNázou se může využít RNáza A, což je endoribonukláza, která specificky napadá 3-pyrimidínové zbytky jednořetězcové RNA a štěpí fosfátové produktem je s terminálním vazby k sousednímu pyrimidin-3-fosfát pyrimidin-3-fosfát.
nukleotidu. Konečným a oligonukleotidy
RNáza A působí v nepřítomnosti kofaktorů a dvoumocných kationtů.
Aby se RNáza mohla použít, je nutné čip inkubovat v libovolném vhodném pufru, který obsahuje Rnázu, jak se popisuje v publikaci Sambrook et al. (1989). Vhodné je použít 30 až 50 μΐ pufru obsahujícího Rnázu pro soubor o velikosti 8 x 8 mm nebo 9x9 mm při teplotě 37 °C po dobu mezi 10 a 60 minutami. Pak se soubor promyje hybridizačním pufrem.
Ačkoli to nenachází široké uplatnění, je možné v jistých provedeních vynálezu použít bázi uráčil, jak popisuje Craig et al. (1989). Poškození kombinace ligovaných sond, které povede k opětnému použití čipu, se dosáhne štěpením opravným enzymem • · • · · z bakterie E. coli, což je uracil-DNA-glykozyláza, která odstraňuje z DNA uráčil.
Je také možné vytvořit specificky štěpitelnou vazbu mezi sondami a pak štěpit tuto vazbu po detekci. Toho lze například dosáhnout chemickou ligací, jak se popisuje v publikaci Shabarova et el.,(1991) a Dolinnaya et al., (1988).
V publikaci Shabarova et el.,(1991) se popisuje kondenzace oligodeoxyribonukleotidů s bromkyanem, který se používá jako kondenzační činidlo. Při jednostupňové chemické ligaci se oligonukleotidy zahřívajína teplotu 97 °C, pomalu se ochladí na teplotu 0°C, pak se přidá 1 μΐ 10 mM BrCN v acetonitrilu.
V publikaci Dolinnaya et al., (1988) se ukazuje začlenit fosforamidiátovou a pyrofosfátovou internukleotidovou vazbu do duplexů DNA. Také se zde popisuje způsob chemické ligace při modifikaci cukr-fosfátové kostry DNA pomocí ve vodě rozpustného karbodiimidu (CDI, který se používá jako párovací činidlo. Selektivní štěpení fosfoamidové vazby zahrnuje kontakt s 15% CH3COOH po dobu 5 minut při teplotě 95 °C. Selektivní štěpení pyrofosfátové vazby zahrnuje kontakt se směsí pyridin-voda (v poměru 9:1) a s čerstvě destilovaným (CF3CO) 2O.
Příklad 19: Diagnostika- testování známých mutací nebo opětné sekvenování celého genu
V jednoduchém případě se může zkoumat cíl, zda se v segmentu DNA vyskytují známé mutace. Pro tento účel je dostatečné 12 sond. Například 5 sond je pozitivních pro jednu alelu, 5 je jich pozitivních pro druhou alelu 2 sondy jsou negativní v případě obou alel. Vzhledem k malému počtu použitých sond na jeden vzorek, může se analazyvota paralelně velký počet vzorků. Například s 12 sondami ve 3 hybridizačních cyklech lze na jedné membráně 6x9, která obsahuje 12 x 24 podsouborů, přičemž každý obsahuje 64 dotů reprezentující stejný segment DNA z 64 pacientů, analyzovat 96 různých * ·
genomových loků nebo genových segmentů z 64 pacientů. V tomto případě se mohou vzorky připravovat na 64 destičkách s 96 priohlubněmi. Každá destička může reprezentovat jednoho pacienta a každá prohlubeň může reprezentovat jeden ze segmentů DNA, které se analyzují. Vzorky z 64 ploten se mohou připravit ve čtyřech kopiích, jako čtyři čtverce na stejné membráně.
Sada 12 sond se může vybrat jedno kanálovou pipetou nebo transferovacím zařízením s jedinou špičkou (nebo lze použít soubor jednotlivě řízených pipet nebo špiček) pro každý ze 96 segmentů a vybrané sondy se mohou uspořádat na dvanáct destiček s 96 prohlubněmi. V případě, že sondy nejsou značeny předem, mohou značita ak se sondy ze čtyř destiček mohou smísit s hybridizačním pufrem a přidají se k podsouborům, k čemuž se s výhodou používá pipetovací zařízení s 96 kanály. Po jednom hybridizačním cyklu je možné stripovat dříve aplikovanou sondu tak, že se membrána inkubuje při teplotě 37 °C až 57 °C v neředěném hybridizačním nebo promývacím pufru.
Pravděpodobnost, že sondy, které jsou pozitivní v případě jedné alely, a sondy pozitivní pro druhé alely jsou negativní se může využít při stanovení přítomnosti druhu alel. V tomto redundantním testovacím schématu lze tolerovat určité množství chyb hybridizace s každou sondou (přibližně 10 %).
Při testování většiny alel lze použít neúplnou sadu sond. To je možné zvláště, jestliže je dostatečná menší redundance. Například se použije jedna nebo dvě sondy, které prokazují přítomnost nebo nepřítomnost jedné nebo dvou alel ve vzorku. Například v případě sady 4 000 8-mérů existuje 91 % pravděpodobnost nalezení alespoň jedné pozitivní sondy v případě jedné nebo dvou alel pro náhodně vybraný lokus. Neúplná sada sond se může optimalizovat, aby odrážela obsah baží G + C a jiných baží ve vzorcích.
V případě sekvenování celého genu se mohou geny amplifikovat jako vhodný počet segmentů. V případě každého segmentu se může zvolit sada sond (přibližně jedna sonda na 2 až 4 báze) a provede se hybridizace. Tyto sondy mohou v analyzovaných segmentech znamená subsoubory, které identifikovat, zda zde někde existuje mutace. Segmenty (to obsahují tyto segmenty), kde se detekovalo jedno nebo více mutovaných míst, může hybridizovat s dalšími sondami, aby se zjistila skutečná sekvence v místech mutací. Jestliže se vzorek DNA testuje každým druhým β-mérem a mutace se lokalizovala v pozici, která je obklopena pozitivně hybridizujícími sondami TGCAAA a TATTCC a a pokryta třemi negativními sondami: CAAAAC, AAACTA a ACTATT, pak mutované nukleotidy musí být A a/nebo Cvyskytující se v ormální sekvenci v uvedené pozici. Nukleotidy se mohou změnit mutací jediné báze nebo delecí jednoho nebo dvou nukleotidů a/nebo inzercí mezi báze AA, AC nebo CT.
Jeden přístup je, že se vybere sonda, která prodlouží pozitivně hybridizující sondu TGCAAA o jeden nukleotid směrem doprava a která prodlouží sondu TATTCC o jeden nukleotid směrem doleva. S těmito 8 sondami je možné stanovit dva sporné nukleotidy ( GCAAAA, GCAAT, GCAAAC, GCAAAG a ATATTC, CTATTC,
GTATTC).
Může se pak stanovit nejpravděpodobnější hypotéza o mutacích. Například se zjistilo, že A mutuje na G. Existují dvě řešení, které tyto výsledky podporují. Buď záměna nahrazení A nukleotidem G je pouze změna nebo navíc dochází k inzerci stejného počtu baží mezi nově stanovené G a následující C. Jestliže výsledek s přemosťovacími sondami je negativní, tyto možnosti se pak mohou kontrolovat nejdříve alespoň jednou přemosťovací sondou, která obsahuje mutovanou pozici (AAGCTA) , a dalšími 8 sondami: CAAAGA, CAAAGT, CAAAGC, CAAAGG a ACTATT, TCTATT, CCTATT, GCTATT. Za účelem selekce mutaci řešících sond existuje řada jiných způsobů.
V případě diploidu se může provést určité porovnání výsledku testovaných vzorků s homozygotní kontrolou, aby se
»· ·· identifikovaly zygoty (uvádí se shora v textu). Očekává se, že několik konsekutivních sond vykazuje přibližně dvakrát silnější signál, jestliže segment překrytý těmito sondami je na na jednom ze dvou chromozomů mutován.
Příklad 20: Identifikace genů (mutací) odpovědných za genetické poruchy a jiné znaky
Za použití univerzálních sad delších sond (8-méry nebo 9méry) na mobilizovaných souborech vzorků, fragmenty DNA o délce 5 aá 20 kb se mohou sekvenovat bez subklónování. Rychlost sekvenování může být přibližně 10 miliónů bp/den/hybridizační přístroj. To umožňuje opakovaně sekvenovat velké frakce lidských genů nebo lidského genomu z vědecky nebo medicínsky zajímavých jedinců. Za účelem opětné sekvenace 50 % lidských genů se kontroluje přibližně 100 miliónů bp. Musí se to provést v relativně krátkém časovém úseku při přijatelných nákladech.
Tato velká schopnost sekvenování se může použít několika způsoby při identifikaci mutací a/nebo genů, které kódují poruchy nebo libovolné jiné rysy. V základě se jako počáteční materiál může použít mRNA (které se mohou přeměnit na cDNA) pocházející z určitých tkání nebo genomových DNA pacientů, které trpí určitými poruchami. Z obou zdrojů DNA se mohou připravit separované geny nebo genomové fragmenty vhodné délky buď postupem klonování nebo in vitro amplifikaci (například PCR) . Jestliže se použije klonování, pak před sekvenováním se musí z knihovny vybrat minimální sada klonů, které se nudou analyzovat. To se může uskutečnit s dostatečnou účinností za použití hybridizace malého počtu sond, zvláště, se zde uchovává malý počet klonů delších než 5 kb. Klonování může zvýšit množství hybridizačních dat přibližně dvakrát, ale nevyžaduje desítky tisíc primerů PCR.
V jedné variantě postupu se fragmenty genu nebo genomu mohou připravit štěpením restrikčními enzymy , jako je Hga I, • · ·
který štěpí DNA následujícím způsobem: GACGC(N5')/CTGCG(N10'). V případě různých fragmentů se vzniklé konce s pěti bázemi liší. V případě určitého počtu genů jeden enzym produkuje vhodné fragmenty. Štěpením cDNA nebo genomové DNA několika enzymy v oddělených reakcích se každý gen může vhodně vystřihnout. Při jednom přístupu vystřižená DNA se dělí podle velikosti. Fragmenty DNA připravené tímto způsobem (a ošetřené exonukleázou III, která odstraňuje jednotlivé nukleotidy 3'konce a zvětšuje délku a specifitu konců) rozdělit do zkumavek nebo na destičky s více prohlubněmi. Z relativně malé sady adaptérů DNA s běžnou částí a s variabilním vyčnívajícím koncem vhodné délky je možné vybrat pro každý fragment, který se má amplifikovat, pár adaptérů. Tyto adaptéry se ligují a pak se uskuteční za použití univerzálních primerů PCR. Z 1 000 adaptérů se může vytvořit milión párů, tak se může specificky amplifikovat ze stejných podmínek s univerzálním párem primerů komplementárně s běžným koncem adaptérů.
Jestliže se zjistí, že rozdíly DNA se opakují u několika pacientů a že změny v sekvenci jsou nesmyslné nebo mění funkci odpovídajícího proteinu, pak mutovaný gen může být odpovědný za řadu poruch. Na základě analýzy podstatného počtu jednotlivců s určitými rysy jemožné spojit funkční alelové varianty určitých genů se specifickými rysy.
Tento přístup se používá za účelem eliminace potřeby velmi nákladného mapování genomu určitého plemene v případě, že neexistují taková genetická data nebo materiál.
Příklad 21: Testování polymorfizmů jednotlivých nukleotidů při mapování genomu
Metody popsané v tomto vynálezu jsou vhodné pro dostatečnou identifikaci genomových fragmentů s polymorfizmem jednoho nukleotidu (SNUP). U deseti jednotlivců je možné identifikovat podstatný počet segmentů DNA se SNUP tak, že se popsaný postup sekvenování aplikuje u velkého počtu genomových • · * · • · «>
« ·· fragmentů známé sekvence, která se může amplifikovat klonováním nebo amplifíkací in vitro. Polymorfní fragmenty se dále používají jako markéry SNUP. Tyto markéry se buď už mapovaly dříve (například reprezentují mapované STS) nebo se mohou mapovat testovacím postupem popsaným dále v textu.
SNUP se může testovat u každého jedince z relevantní rodiny nebo populace amplifíkací markérů a zahrnutím je do formy souboru podsouboru. Podsoubory obsahují stejný markér, který je amplifikovaný z analyzovaných jedinců. V případě každého markéru, které se používají jako diagnostika známých mutací, se může vybrat a testovat sada 6 nebo méně sond, které obsahují jednu alelu a 6 nebo méně sond, které jsou pozitivní v případě druhé alely. Pozice odpovědného genu(ů) se může stanovit na základě podstatné asociace jednoho nebo skupiny markérů s určitou poruchou. Vzhledem k vysoké průchodnosti a nízkým nákladů, je možné testovat tisíce markérů v případě tisíce jednotlivců. Toto množství dat umožňuje lokalizaci genu při úrovni rozlišení menší než jeden milion bp, stejně jako lokalizaci genů, které jsou zahrnuty do polygeních onemocnění. Lokalizované geny se mohou identifikovat sekvenováním určitých oblastí, které pochází z relevantních normálních a postižených jedinců za účelem testování mutace(í).
PCR se připravila za účelem amplifikace markérů z genomové DNA. Každý z markérů požaduje specifický pár primerů. Existující markéry jsou zaměnitelné nebo se mohou definovat nové markéry, které se mohou připravit štěpením genomové DNA restrikčními enzymy typu Hga I a ligaci páru adaptérů.
Markéry SNUP se mohou amplifikovat a za účelem redukce počtu nezávislých amplifikačních reakcí se mohou amplifikovat všechny dohromady. V tomto případě se testuje pro jedne vzorek více sond. Jestliže se spojí 4 markéry a nanesou se na 12 replik membrán, pak se testuje 48 sond (12 sond na jeden markér) ve 4 cyklech.
• · · · · • · · • 9 ·
Příklad 22: Detekce a ověření identity fragmentů
V experimentu se mohou snadno identifikovat fragmenty DNA vzniklé štěpením restrikčními enzymy, klonováním nebo amplifikací in vitro (například PCR) . Identifikace se může uskutečnit ověřením přítomnosti pruhu DNA specifické velikosti na gelové elektroforéze. V jiném případě se mohou připravit specifické oligonukleotidy a použít se pro ověření vzorku DNA hybridizací. Zde vyvinutý postup umožňuje více účinnou identifikaci velkého počtu vzorků, aniž se musí připravovat pro každý fragment specifický oligonukleotid. Sada pozitivních a negativních sond se může pro každý fragment vybrat z univerzální sady na základě známých sekvencí. Sondy, které se vybraly jako pozitivní, jsou obvykle schopny tvořit jeden nebo několik překrývajících skupin a negativní sondy pokrývají celý inzert.
Tato technologie se může použít při identifikaci STS v procesu jejich mapování na klonech YAC. Každý STS se může testovat na přibližně 100 klonech YAC nebo na sebraných klonech YAC. DNA z těchto 100 reakcí se nanesou, je-li to možné na jeden podsoubor. Různé STS mohou reprezentovat konzekutivní podsoubory. Při několika cyklech hybridizace se vytvoří pro každý vzorek DNA obraz, přičemž tento obraz prokazuje nebo neprokazuje existenci určitého STS v daném klonu YAC.
Za účelem redukovat počet nezávislých reakcí PCR nebo počtu nezávislých vzorků pro nanesení do spotů se několik STS může amplifikovat současně v jedné reakci nebo vzorky PCR se mohou smíchat. V tomto případě se pro jeden spot musí použít více sond. Spojení STS nezávisí na spojení YAC a může se použít v případě jednoho YAC nebo souboru více YAC. Toto schéma je zvláště vhodné, když se několik sond značených různými barvami hybridizují dohromady.
Vedle potvrzení existence fragmentu DNA ve vzorku se množství DNA může odhadnout z intenzity hybridizace několika • · · ·
100 « · · • · oddělených sond nebo jedné nebo více směsí sond. Porovnáním získané intenzity s intenzitou kontrolních vzorků, které obsahují známé množství DNA, se současně může stanovit množství DNA ve všech nanesených vzorcích. Protože pro identifikaci fragmentu je nezbytných pouze několik sond a existuje pouze N možných sond, které se mohou použít v případě DNA dlouhé N bází, tento vynález nevyžaduje velkou sadu sond, aby došlo k podstatné identifikaci libovolného segmentu DNA. Z jednoho tisíce 8-mérů je pro fragment o velikosti 1000 bp možné v průměru vybrat přibližně 30 plně párovaných sond.
Příklad 23: Identifikace organizmů infekčních onemocnění a jejich varianty
Testy pro detekcí virů, bakterií, hub a jiných parazitujících organizmů u pacientů založených na DNA jsou obvykle spolehlivější a méně nákladné než jiné alternativy. Hlavní výhoda testů DNA je schopnost identifikovat specifické kmeny a mutanty a eventuálně se tyto testy mohou aplikovat za účelem účinnější léčby. Dále v textu se popisují dva způsoby aplikace.
Amplifikací genů se může testovat přítomnost 12 známých genů kódujících rezistenci na antibiotika u bakteriálních infekcí. Amplifikované produkty ze 128 pacientů se mohou nanést do dvou podsouborů a 24 podsouborů pro 12 genů se pak může čtyřikrát opakovat na membráně o rozměrech 8 x 12 cm. V případě každého genu se může vybrat 12 sond za účelem pozitivních a negativních výsledků. Hybridizaci je možné provést ve 3 cyklech. V případě těchto testů je pravděpodobné, že daleko menší množství sond je univerzálních. Například ze sady obsahující 1 000 8-mérů, v průměru 30 sond hybridizuje pozitivně s fragmenty o velikosti 1 000 bp. Pro vysoce spolehlivou identifikaci obvykle postačuje 10 pozitivních sond. Jak se popisuje v příkladu 9, může se amplifikovat a/nebo nanést dohromady několik genů a tak se může stanovit
101 daná DNA. Množství amplifikováného genu se může použít jako indikátor síly infekce.
Jiný příklad popisuje možné sekvenování jednoho genu nebo celého genomu viru HIV. Vzhledem k rychlým změnám viru dochází k mnoha obtížnostem při selekci optimální terapie. Fragmenty DNA se mohou amplifikovat z izolovaných virů z až 64 pacientů a sekvenují se popsaným způsobem. Na základě získané sekvence se může vybrat optimální terapie. Jestliže zde existuje směs dvou typů virů, které vykazují základní sekvenci (podobně v případě heterozygot), může se identifikovat mutant na základě kvantitativního porovnání jeho výsledků hybridizace s výsledky jiných vzorků, zvláště kontrolních vzorků, které obsahují pouze virus základního typu. Dvakrát nižší skóre je možné získat v případě tří až čtyř sond, které pokrývají místo mutované v jednom nebo ve dvou typech virů, které jsou přítomny ve vzorku (uvedeno shora v textu).
Příklad 24: Identifikace pro účely soudu a určení rodičovství
Sekvenční polymorfizmus činí genomovou DNA jednotlivců jedinečnou. To umožňuje analýzu krve nebo jiných tělových tekutin nebo tkání, které pochází z místa činu, a výsledky se porovnávají se vzorky podezřelých. Dostatečný počet polymorfních míst vede ke vzniku jedinečného obrazu vzorku. Metoda SBH může produkovat takový obraz a tak jedinečně prokázat polymorfizmus jediného nukleotidu.
Sada fragmentů DNA (10 až 100) se může amplifikovat z několika vzorků a podezřelých. DNA ze vzorků a podezřelých reprezentující jeden fragment se nanese na jeden nebo několik podsouborů a každý podsoubor se může replikovat čtyřikrát. V případě každého DNA lokusu může 12 sond ve třech cyklech stanovit přítomnost alely A nebo B v každém ze vzorků, které zahrnují podezřelé. Správné párování paternů vzorků a podezřelých může vést k odhalení podezřelého z kriminálního činu.
• ·
102
Stejný postup se může aplikovat při prokázání nebo vyloučení rodičovství. Připraví se DNA pocházející z dítěte a dospělého a amplifikují se polymorfní loci; pro dítě a dospělého se stanoví hybridizací paterny alel A nebo B. Porovnání získaných paternů spolu s pozitivními a negativními kontrolami vedou ke stanovení rodičovského vztahu. V tomto případě za účelem identifikace stačí, když pouze podstatná část alel se správně páruje s jedním rodičem. Velký počet pozitivně reagujících loků umožňuje obejít statistické chyby při účincích mutací de novo.
Příklad 25: Stanovení genetické diverzity populace nebo druhu a biologická diverzita niků
Určení frekvence variací alel u podstatného počtu loků (například několik genů nebo celá mitochondriální DNA) umožňuje vývoj různých závěrů, jako jsou závěry týkající se vlivu prostředí na genotypy, historii a vývoj populace nebo její náchylnost k onemocnění nebo vyhynutí. Tato stanovení se mohou uskutečnit testováním specifických známých alel nebo celým sekvenováním některého loku, přičemž je možné definovat de novo mutace, které mohou prokázat jemné variace nebo přítomnost mutagenů v prostředí.
Navíc biodiverzita mikrobiálního světa může být objasněna sekvenováním vývojově konzervativních sekvencí DNA, jako jsou geny ribozomální RNA nebo geny vysoce konzervativních proteinů. DNA se může připravit z určitých genů amplifikovaných za použití primerů odpovídajících konzervativním sekvencím. Fragmenty DNA se mohou přednostně klonovat do plazmidového vektoru (nebo se naředit na koncentraci jedna molekula na jednu prohlubeň destičky s více prohlubněmi a pak se se mohou amplifikovat in vitro) . Klony připravené tímto způsobem se mohou sekvenovat, jak se popisuje dále v textu. Získají se dva typy informací. Nejdříve se definoval katalog různých druhů a hustota výskytu jedinců
103 • · každého druhu. Jiný segment informace se může použít k měření vlivu ekologických faktorů nebo populace na ekosystém. Může se zjistit, zda některé druhy vymřely nebo zda poměr relativního zastoupení jednotlivých druhů se nezmění působením znečištění. Tento způsob se může také použít při sekvenaci DNA z fosilií.
Příklad 26: Detekce nebo kvantifikace druhů nukleových kyselin
Druhy DNA nebo RNA se mohou detekovat a kvantifikovat použitím páru sond, které zahrnují neznačené sondy fixované na substrát a značené sondy, které se nachází v roztoku. Specie se mohou detekovat a kvantifikovat expozicí neznačené sondy v přítomnosti značené sondy a ligázy. Ve specifickém případě tvorba prodloužených sond ligací značené a neznačené sondy na vzorku kostry nukleové kyseliny indikuje přítomnost detekovaných druhů. Přítomnost značení ve specifickém bodě souboru na substrátu po odstranění neligované značené sondy indikuje přítomnost specií, zatímco množství značení indikuje sílu exprese specie.
V jiném případě jedna nebo více neznačených sond se může uspořádat do souboru na substrát, jako první členi párů tvořeného s jednou nebo více značených sond, které se zavedou do roztoku. Znásobení značení v souboru se může uskutečnit použitím barviv s fluorescencí s rozlišitelnou vlnovou délkou. Tímto způsobem se ve směsi cDNA aplikované na soubor vytvořený z párů značených a neznačených sond, které jsou specifické pro určité druhy, jenž se mají identifikovat, může testovat přítomnost a exprese množství druhů cDNA. Podle preferovaného provedení vynálezu se může tento přístup provést s částmi sekvence cDNA selekcí párů neznačených a značených párů sond srovnáním sekvencí, které překrývají celou samotnou sekvenci detekovanou cDNA.
Mohou se vybrat sondy pro detekci přítomnosti a množství genomu určitých patogenních organizmů. Tyto sondy jsou obsaženy v kompozici vybraných párů sond, které se jeví
104 v kombinaci pouze v genomu cílových patogenních organizmů. Zatímco jediný pár sondy nemusí být specifický pro genom patogenního organizmu, kombinace párů je specifická. V podobném případě při detekci nebo sekvenování cDNA může dojít k tomu, že určitá sonda není specifická pro cDNA nebo jiný druh. Nicméně přítomnost a množství určitých druhů se může stanovit jako výsledek, kde kombinace vybraných sond umístěných v rozlišných místech souboru ukazuje na přítomnost určitých druhů.
Infekční činidlo s DNA o velikosti přibližně 10 kb nebo větší se může detekovat za použití detekčního čipu vázaného na podpoře, aniž se použije polymerázová řetězcová reakce (PCR) nebo jiné amplifikační postupy. Podle jiných metod genomy infekčních činidel zahrnující bakterie a viry se testují amplifikací jediné cílové nukleotidové sekvence pomocí PCR a detekcí přítomnosti cíle hybridizaci značené sondy, která je specifická pro cílovou sekvenci. Protože taková sekvence je specifická pouze v případě jediné cílové sekvence, je proto nezbytné amplifikovat gen způsoby takovými, jako je PCR, aby vzniklo dostatečné množství cíle a tak vznikl detekovatelný signál.
Podle tohoto příkladu se vytvořila zdokonalená metoda detekce nukleotidových sekvencí infekčních činidel pomocí reakcí typu Formát 3, zatímco se připravil detekční čip s pevnou fází, který obsahuje soubor imobilizovaných oligonukleotidových sond, specifické pro dané infekční agents. Jediný dot obsahující směs mnoha neznačených sond, které jsou komplementární s cílovou nukleovou kyselinou, obsahuje značení specifická pro druhy v jedné pozici, přičemž zdokonaluje citlivost k difúzi nebo jednoduché značení sond. Takové vícenásobné sondy se mohou a nemusí překrývat s cílovou nukleotidovou sekvencí a nemusí s ní ani sousedit. Upřednostňuje se, aby takové sondy měly délku přibližně 5 až 12 nukleotidů.
více různých které jsou • ·
105
Vzorek nukleové kyseliny se kontaktoval se souborem sond a cílové sekvence ve vzorku se hybridizovaly s větším množství imobilizovaných sond. Souhrn většího množství značených sond, který se vybral na základě specifické vazby s cílovými sekvencemi přilehlými k imobilizovaným sondám, se pak aplikuje se vzorkem na soubor směsí neznačených oligonukleotidových sond. Na čip se pak aplikuje enzym ligáza, aby se ligací spojily sousedící sondy na vzorku. Detekční čip se pak promyje, aby se odstranily nehybridizovaná a neligovaná sonda a vzorek nukleových kyselin a přítomnost vzorku nukleové kyseliny se může stanovit na základě přítomnosti nebo nepřítomnosti značení. Tento způsob umožňuje detekovat přibližně 1 000 krát sníženou molární koncentraci vzorku činidla.
Dále vynález popisuje, že signál značených sond se může amplifikovat tak, že poskytuje běžný ocas volné sondy, který samotný obsahuje více chromogenních, enzymatických nebo radioaktivních značek nebo který je samotný vhodný ke specifickému navázání další sondy, jenž je vícenásobně značena. Tímto způsobem může proběhnout druhé kolo amplifikace signálu. V druhém kole amplifikace se mohou použít značené nebo neznačené sondy. V tomto druhém kole amplifikace delší vzorek DNA s více značkami může vést ke 10-ti násobnému až 100 násobnému zvýšení intenzity signálu amplifikace, což může vést až k 100 000 násobnému zesílení celkového signálu. Při použití obou aspektů tohoto příkladu může být intenzita signálu přibližně 100 000 krát silnější a může se prokázat pozitivní výsledek při ligaci sonda-DNA, aniž se použije PCR nebo jiný postup amplifikace.
Vzhledem k jinému předmětu vynálezu se může připravit soubor nebo super-soubor, který obsahuje úplnou sadu sond, například 4 096 šesti-mérních sond. Soubory tohoto typu jsou univerzální v tom smyslu, že se mohou použít pro detekci nebo pro částečné až úplné sekvenování kusu libovolné nukleové
106 kyseliny. Jednotlivé spoty v soubory mohou obsahovat jednotlivé druhy sond nebo jejich směs, například směs typů N(l-3) B (4-6) N(l-3), které se syntetizují v jediné reakci (N reprezentuje všechny čtyři nukleotidy, B představuje jeden specifický nukleotid a asociovaná čísla udávají počet bází, například 1 až 3 znamená jednu až tři báze.). Tyto směsi představují silnější signál v případě druhů nukleové kyseliny, které jsou přítomny v nízké koncentraci tím, že se hromadí signál z různých částí stejně dlouhé molekuly nukleové kyseliny. Univerzální sada sond se může rozdělit do mnoha podsad, které se nanášejí jako jednotkový soubor oddělený bariérami, jenž brání rozšíření hybridizačního pufru, vzorku a značených sond.
V případě detekce druhů nukleových kyselin se známou sekvencí se může vybrat jedna nebo více nukleových sekvencí obsahující jak neznačené tak i značené sondy v roztoku. Značené sondy se syntetizovaly nebo se vybraly z úplných předem syntetizovaných sad například 7-mérů. Značené sondy se přidaly do odpovídajících jednotkových souborů fixovaných sond tak, že pár fixovaných a značených sond bude hybridi zovat těsně vedle cílové sekvence tak, že po přidání ligázy se bude sonda kovalentně vázat.
Jestliže jednotkový soubor obsahuje více jak jednu fixovanou sondu (jako oddělené spoty nebo ve stejném spotu), které jsou pozitivní pro daný druh nukleové kyseliny, všechny značené sondy se mohou smísit a přidat se do stejného jednotkového souboru. Směsi značených sond jsou dokonce více důležitév případě, kdy se testují směsi nukleových kyselin. Jedním příkladem komplexní směsi nukleových kyselin jsou mRNA v jedné buňce nebo v tkáni.
Podle jednoho provedení vynálezu jednotkové soubory umožňují použití každé možné imobilizované sondy s koktejly relativně malého počtu značených sond. Jestliže se implementuje vícenásobné značící schéma, mohou se použít více
107 • · · · komplexní koktejly značených sond. Preferované vícenásobné metody se mohou použít s různými fluorescenčními značkami nebo molekulovými smyčkami, které se mohou oddělit hmotnostní spektroskopií.
V jiném případě podle preferovaného provedení vynálezu se mohou vybrat relativně krátké fixované sondy, které často hybridizuji s řadou sekvencí nukleových kyselin. Takové krátké sondy se používají v kombinaci koktejlem značených sond, které se mohou připravit tak, že alespoň jedna značená sonda odpovídá každé ze značených sond. Preferované koktejly jsou ty, ve kterých žádná ze značených sond neodpovídá více jak jedné fixované sondě.
Příklad 27: Zkoumání segmentů viru HIV se všemi možnými 10méry.
V tomto příkladu metody Formát III SBH se vytvořil soubor na nylonové membráně (například Gene Screen) všech možných vázaných 5-mérů (což je 1 024 možných pentamérů). Vázané 5mérní oligonukleotidy se syntetizovaly s 5konci, které zahrnují 5'-TTTTTT-NNN-3'(kde symbol N značí všechny čtyři báze A, C, G, T; v tomto kroku se při syntéze přidá stejné molární množství všech čtyř bází). Tyto oligonukleotidy se nanesly přesně na nylonovou membránu, spoty se nechaly uschnout a oligonukleotidy se imobilizovaly ošetřením suchých spotů UV zářením. Za použití této metody se dosáhlo hustoty až 18 oligonukleotidů na čtvereční nanometr. Po aplikaci UV zářením se nylonové membrány ošetřily při teplotě 60 až 80 °C detergentem, který obsahuje pufr. Spoty oligonukleotidů se nanesly na pomyslnou mřížku do subsouborů 10 krát 10 spotů a každý podsoubor má 64 5-mérních spotů a 36 kontrolních spotů. 16 podsouborů dá 1 024 5-mérů, které tvoří všechny možné 5méry.
Podsoubory v souboru jsou od sebe odděleny jinou fyzikální bariérou, například hydrofóbním proužkem, který umožňuje
108 • · aniž dojde ke
V preferovaném ze silikonu každému subsouboru hybridizovat se vzorkem, křížové kontaminaci přilehlých subsouborů. provedení je hydrofóbní proužek připraven (například ze silikonového lepidla nebo s těsnící pasty), který je rozpuštěn ve vhodném rozpouštědle (jako je jsou rozpouštědla dobře známá v oboru). Tento roztok silikonu se aplikuje mezi podsoubory a vznikají čáry, které po té, co se rozpouštědlo vypaří působí jako hydrofóbní proužky, které oddělují buňky.
V tomto příkladu metody Formátu III se syntetizovaly 5méry s 3konci 5-NN-3 (symbol N značí všechny čtyři báze A, C, G, T) , které jsou volné nebo jsou v roztoku (nejsou vázány). V tomto provedení vynálezu se volné 5-méry a vázané 5-méry kombinují, aby vznikly všechny možné 10-méry, které jsou vhodné pro sekvenování známé sekvence DNA, jenž není větší než 20 kb. Dvouřetězcové DNA o velikosti 20 kb se denaturuje za vzniku jednořetězcové DNA o velikosti 40 kb. Tato ssDNA o velikosti 40 kb hybridizuje s přibližně 4 % všech možných 10-mérů. Toto navázání 10-mérů s nízkou frekvencí a známá cílová sekvence umožňuje shromáždění 5-mérů volných nebo v roztoku (nevázaných), které jsou vhodné pro úpravu každého podsouboru, aniž dojde ke ztrátě informace o sekvenci. V preferovaném provedení vynálezu se pro každý podsoubor shromáždí 16 sond a všechny možné 15-méry jsou zastoupeny v 64 úplných souhrnech volných 5-mérů. Všechny možné 10-méry se mohou testovat jako sondy proti vzorku DNA za použití 1 024 podsouboru (16 podsouboru pro každý soubor volných 5-mérů).
Cílová DNA v tomto provedení vynálezu reprezentuje dva segmenty o velikosti 600 bp viru HIV. Tyto segmenty o velikosti 600 bp reprezentují dva soubory 60-ti překrývajících se 30-mérů (30-méry překrývají každý přilehlý 30-mér dvaceti nukleotidy). Soubor 30-mérů napodobuje cílovou DNA, která se upravuje za použití metod dobře známých v oboru. Jsou to * ·
109 sdílená, štěpená a/nebo náhodná PCR cílové DNA za vzniku náhodného souboru velmi malých fragmentů.
Jak se popisuje shora v textu v předchozích příkladech v metodách Formátu III se volné 5-méry značí radioaktivními izotopy, biotinem, fluorescenčními barvivý atd. Značené volné 5-méry se pak hybridizují s vázanými 5-méry na cílovou DNA a ligují se. V preferovaném provedení vynálezu se do reakce přidá 300 až 1 000 jednotek ligázy. Hybridizační podmínky jsou stejné jako v předchozích příkladech. Následuje ligace a odstranění cílové DNA a nadbytku volné sondy, přičemž soubor se testuje za účelem stanovení pozice značených sond (použitím metod popsaných ve shora popsaných příkladech).
Na základě známé cílové sekvence DNA a známých volných a vázaných 5-mérů každého podsouboru se předpovídá, které vázané 5-méry se budou ligovat, aby označily volné 5-méry v každém podsouboru. Signál z 20-ti uvedených předpovězených dotů se ztratil a pro každou změnu v cílové DNA z předpovězené sekvence vzniklo 20 nových signálů. Překrývající se sekvence vázaných 5-mérů u těchto deseti nových dotů identifikuje, který volný značený 5-mér je vázán na každý nový dot.
Za použití popsaných metod a souborů volných značených 5mérů se testovaná DNA HIV testovala se všemi možnými 10-méry. Za použití metody Formát III se správně identifikovala sekvence divokého typu testovaných segmentů, stejně jako několik sekvencí „mutantů, které se zavedly do těchto segmentů.
Příklad 28: Sekvenováni opakujících se sekvencí DNA.
V jednom provedení vynálezu opakující se sekvence DNA v cílové DNA je sekvenována s oligonukleotidy mezerníku za použití přístupu změněného Formátu III. Oligonukleotidy mezerníku lišící se délkou repetitivní sekvence DNA (opakující se sekvence identifikuje v prvním cyklu SBH) hybridizovaly s cílovou DNA spolu s prvním známým sousedícím • ·
110 oligonukleotidem a druhým známým oligonukleotidem nebo případně se skupinou možných oligonuklepotidů, který sousedí s další stranou mezerníku (je známý s prvním cyklem SBH). Když mezerník v délce repetitivního segmentu DNA hybridizuje s cílem, dva vedlejší oligonukleotidy se ligují s mezerníkem. Jestliže první známý oligonukleotid se fixuje na substrát a druhý známý oligonukleotid nebo další možný oligonukleotid(y) je značený, tvoří se ligací vázaný produkt, který zahrnuje značený druhý známý oligonukleotid nebo pravděpodobný oligonukleotid(y) v případě, že mezerník správné délky hybridizuje s cílovou DNA.
překřížení. Tato oligonukleotidu(ů) ,
Příklad 29: Sekvenování přes body překřížení metodou Formát III SBH
V jednom provedení vynálezu se body překřížení v cílové DNA sekvenovaly za použití třetí sady oligonukleotidů a upravenou metodou Formát III. Po prvním cyklu SBH, když se sestaví sekvence, se může identifikovat několik bodů místa se mohou řešit hybridizací které se částečně překrývají s jednou známou sekvencí, která vede do místa bodu překřížení a pak hybridizuje s cílovým oligonukleotidem, který je značen a odpovídá jedné ze sekvencí, které vycházejí z bodu překřížení. Jestliže správné oligonukleotidy hybridizují s cílovou DNA, značený oligonukleotid se může ligovat s jiným(i). V preferovaném provedení vynálezu se vybral první oligonukleotid, který je posunutý z bodu překřížení o jeden až několik nukleotidů (tak, že spadá do jedné ze sekvencí překřížení). Dále se vybral druhý oligonukleotid, který se čte od první větve sekvence do bodu překřížení sekvence a sada třetích oligonukleotidů, které odpovídají všem možným sekvencím větví s překryvem bodu překřížení jedním nebo několika nukleotidy (které odpovídají prvnímu nukleotidu). Tyto oligonukleotidy hybridizují s cílovou DNA a pouze třetí • ·
111 oligonukleotid se správnou sekvencí (která se správně páruje se sekvencí překřížení prvního oligonukleotidu) bude produkovat produkt ligace s prvním a druhým oligonukleotidem.
Příklad 30: Vícenásobné sondy vhodné pro analýzu cílové nukleové kyseliny.
V tomto příkladu se značí sada sond různými značkami tak, že každá sonda sady se může odlišovat od ostatních sond v sadě. Tak sada sond může přijít do kontaktu s cílovou nukleovou kyselinou v jediné hybridizační reakci, aniž dojde ke ztrátě jakékoli informace o sondě. V preferovaných provedeních vynálezu mezi používané značení patří radioizotopy, fluorescenční značení a EML. Tyto sady sond se mohou používat v metodách buď Formát I, Formát II nebo Formát
III SBH.
Při metodě Formát I SBH se sada odlišně značených sond hybridizuje s cílovou nukleovou kyselinou, která je fixována na substrátu za podmínek, které umožňují diferenciaci mezi úplným párováním a špatným párováním jediné báze. Specifické sondy, které se vážou na cílovou nukleovou kyselinu se identifikují na základě jejího různého značení a z této vazebné informace se alespoň z částí stanoví úplné párování.
U metody Formát II SBH jsou cílové nukleové kyseliny značeny různými sondami a hybridizují se soubory sond. Specifické cílové nukleové kyseliny, které se váží na sondy, se stanoví na základě jejich odlišného značení a z informací o navázání se stanoví úplné párování.
U metody Formát III SBH se sada odlišně značených sond a fixovaných sond hybridizuje s cílovou nukleovou kyselinou za podmínek, které umožňují úplné párování, aby se odlišily od chybného párování jediné báze. Značené sondy se pak nachází těsně vedle sebe na cílové DNA, fixované sondy se na sebe vzájemně váží a tyto produkty se detekují a diferencijují na základě různých značení.
• ·
112
V preferovaném provedení vynálezu se jako značení použije EML, které lze detekovat hmotnostní spektrometrií se záchytem elektronů (EC-MS). EML se může připravit z různých molekul kostry, přičemž se zvláště preferují jisté aromatické kostry, což se například popisuje v publikaci Xu et al., J. Chromatog. 764: 95-102 (1997). EML je připojeno k sondě vratným a stabilním způsobem a po té, co sonda hybridizuje s cílovou nukleovou kyselinou, EML se ze sondy odstraní a identifikuje se standardní metodou EC-MS (například EC-MS se může uskutečnit spojením plynové chromatografie a hmotnostní spektroskopie).
Příklad 31: Detekce málo frekventovaných cílových nukleových kyselin
Metoda Formát III SBH umožňuje dostatečné rozlišení, aby identifikovala sekvenci, která je přítomna ve vzorku v 1 části až v 99 částech podobné sekvence, které se liší jedním nukleotidem. Tak metoda Formát III se může použít při identifikaci nukleové kyseliny, která je ve vzorku nukleových kyselin přítomna ve velmi nízké koncentraci, například vzorek získaný z krve.
V jednom provedení podle vynálezu v případě cystické fibrózy existují dvě sekvence , které se od sebe vzájemně liší delecí tří nukleotidů. Sondy pro dvě sekvence, které se liší od divokého typu delecí, se fixovaly na substrátu a značená nejednoznačná sonda je běžná v obou případech. Za použití těchto cílů a sond se mohou metodou Formát III SBH detekovat deleční mutanty v případě, že jsou přítomny v jedné části až v 99 částech divokého typu.
Příklad 32: Přístroj Polaroid a způsob analýzy cílové nukleové kyseliny.
Přístroj pro analýzu nukleové kyseliny se může konstruovat tak, aby zahrnoval dva soubory nukleových kyselin a zvolený
113 materiál, který brání promíchání nukleových kyselin ze dvou souborů až do okamžiku, kdy se takové promíchání požaduje. Soubory přístroje se podporují řadou substrátů, které zahrnují, ale neomezují se na nylonové membrány, nitrocelulózové membrány nebo jiné zde popsané materiály. V preferovaných provedeních podle vynálezu jedním substrátem je membrána rozdělená do sektorů hydrofóbními proužky nebo vhodným podpůrným materiálem s prohlubněmi, které mohou obsahovat gel nebo houbu. V tomto provedení vynálezu se sondy umístí do sektoru s membránou nebo do prohlubně, na gel nebo houbu a na membránu nebo do prohlubně se nanese roztok (který obsahuje nebo neobsahuje cílovou nukleovou kyselinu) tak, že se sonda rozpustí. Roztok s rozpuštěnou sondou se pak kontaktuje s druhým souborem nukleových kyselin. Nukleové kyseliny mohou být, ale neomezují se na oligonukleotidové sondy nebo cílové nukleové kyseliny, přičemž sondy nebo nukleové kyseliny mohou být značeny. Nukleové kyseliny se mohou značit libovolným značením, které se běžně používá v oboru a zahrnuje, ale není omezeno na radioizotopy, fluorescenční značení a elektroforetické hmotnostní značení.
Materiál, který brání smíchání nukleových kyselin, může být umístěn mezi dva soubory takovým způsobem, že v případě jeho odstranění se nukleové kyseliny dvou uvedených souborů smísí dohromady. Tento materiál může zahrnovat libovolný materiál, který brání smíchání nukleových kyselin.
Tento přístroj se může použít při metodě Formát I SBH následujícím způsobem: první soubor přístroje má cílové nukleové kyseliny, které se fixují na substrát, a druhý soubor přístroje zahrnuje sondy nukleových kyselin, které jsou značeny a mohou se odstranit, aby se testovala cílová nukleová kyselina prvního souboru. Dva soubory se separují listem materiálu, který brání sondám přijít do kontaktu s cílovou nukleovou kyselinou a když se odstraní uvedený list sondy mohou testovat cílové nukleové kyseliny. Po vhodné inkubaci a
9 ··· 9 9 99 ·
9« 9*99
9 ·« « · · 999
9 9 9 9 • 99 99 9 9 99 může stanovit, Toto stanovení
114 krocích promývání se v souboru s cílovou DNA které sondy tvoří úplné páry s cílovou DNA.
probíhá automaticky a může se provést manuálně (například zrakem na autoradiogramu). Při metodě Formát II SBH následující postup bude podobný postupu, který se popisuje shora v textu s tou výjimkou, že cíl je značen a sondy jsou fixovány.
V jiném případě se přístroj může použít při metodě Formát III SBH následujícím způsobem: vytvoří se dva soubory sond nukleových kyselin, značí se sondy nukleových kyselin libovolného souboru nebo obou souborů a jeden ze souborů se může fixovat na substrát. Dva soubory se oddělí listem materiálu, který brání promíchání sond. Reakce Formátu II se zahajuje přidáním cílové nukleové kyseliny a odstraněním listu, což umožní vzájemné promíchání sond a smíchání sond a cílové DNA. Sondy, které se váží na sousedící místa na cílové DNA, se spojí (například interakcí staking bází nebo kovalentním spojením koster). Výsledky se hodnotí za účelem stanovení, které sondy se vážou na cílovou DNA těsně vedle sebe. V případě, že se jedna sada sond fixuje na substrát, pak fixovaný soubor se může číst, aby se stanovilo, které sondy z jiných souborů tvoří vazby s fixovanými sondami. Jako v případě shora popsané metody uvedené čtení může proběhnout automatizovaným způsobem (například čtecím zařízením pro test ELISA) nebo se může provést manuálním způsobem (například zrakem z autoradiogramu).
115

Claims (29)

  1. PATENTOVÉ NÁROKY
    1. Způsob potvrzení výsledků sekvenování, vyznačující se tím, že zahrnuje:
    • získání sekvence z nukleové kyseliny za použití SBH, • určení sady sond, které jsou komplementární a nejsou přesně komplementární s nukleovou kyselinou, • hybridizací sond s nukleovou kyselinou za podmínek, které umožňují odlišení úplného párování od chybného párování jedné báze, • potvrzení skutečnosti, že mezi sondou a nukleovou kyselinou nedochází k úplnému párování.
  2. 2. Způsob podle nároku 1, vyznačující se tím, že SBH je formát I SBH.
  3. 3. Způsob podle nároku 1, vyznačující se tím, že SBH je formát III SBH.
  4. 4. Způsob podle nároku 1, vyznačující se tím, že sada sond není přesně komplementární se sekvencí nukleové kyseliny.
    výsledků ž e zahrnuje:
    sekvenování,
  5. 5. Způsob potvrzení vyznačující se tím, • získání sekvence z nukleové kyseliny za použití SBH, • vybrání alespoň jednoho primeru pro nukleovou kyselinu, • sekvenování nukleové kyseliny s primerem za použití sekvenování podle Sangera, • srovnání sekvence nukleové kyseliny získané SBH se sekvencí nukleové kyseliny získané sekvenováním podle Sangera.
    116
  6. 6. Způsob uspořádání velkého množství Sfs ze sekvence nukleové kyseliny, vyznačující se tím, že zahrnuj e:
    • získání sekvence z nukleové kyseliny za použití SBH, • určení velkého množství primerů ze sekvence velkého množství Sfs, přičemž primery mohou začít replikační reakci nukleové kyseliny, která se bude číst skrz bod překřížení, • sekvenování nukleové kyseliny s primery za použití sekvenování podle Sangera, • srovnání sekvence nukleové kyseliny v okolí bodu překřížení získané sekvenováním podle Sangera se sekvencemi Sfs, přičemž se stanoví pořadí Sfs.
  7. 7. Velké množství sond vhodných pro kyseliny, vyznačující se tím, při zkoumání nukleové kyseliny za podmínek, množství sondy může odlišit jedna od druhé.
    analýzu nukleové ž e se používají přičemž se velké
  8. 8. Sondy podle nároku 7, vyznačující se tím, že nukleová kyselina má známou sekvenci a sondy jsou značeny značkou.
  9. 9. Velké množství sond podle nároku 7, vyznačující se tím, že jsou značeny velkým množstvím různých značek, přičemž sondy se mohou jedna od druhé odlišit na základě různých připojených značek.
  10. 10. Sada sond vhodných pro analýzu nukleové kyseliny, vyznačující se tím, že zahrnuje velké množství souborů sond, kde každý soubor se používá při zkoumání nukleové kyseliny a velké množství sond je značeno velkým množstvím různých značek, přičemž sondy každého souboru se mohou odlišit jedna od druhé na základě různých připojených značek.
    117
  11. 11. Sada sond podle nároku 9, vyznačující se tím, že velké množství různých značek je velké množství radioizotopů.
  12. 12. Sada sond podle nároku 9, vyznačující se tím, že velké množství různých značek je velké množství fluorescenčních molekul.
  13. 13. Sada sond podle nároku 9, vyznačující se tím, že velké množství různých značek je velké množství EML.
  14. 14. Sada sond podle nároku 10, vyznačuj ící se tím, že velké množství různých značek je velké množství radioizotopů.
  15. 15. Sada sond podle nároku 10, vyznačující se tím, že velké množství různých značek je velké množství fluorescenčních molekul.
  16. 16. Sada sond podle nároku 10, vyznačující se tím, že velké množství různých značek je velké množství EML.
    kyseliny, nukleové ž e zahrnuje:
  17. 17. Způsob analýzy vyznačující se tím, • získání souboru oligonukleotidových sond, • začlenění vzorku nukleové kyseliny do souboru, • přidání velkého množství značených sond k souboru za podmínek, které umožňují odlišení úplného párování od chybného párování jedné báze, • přidání ligázy k souboru,
    118 • inkubace ligázy, souboru sond za sondou souboru, sondou souboru na • detekci značených značených sond, vzorku nukleové kyseliny a podmínek, kdy se značená sonda liguje se přičemž značená sonda těsně sousedí se nukleové kyselině vzorku a sond, které jsou ligovány k souboru.
  18. 18. Způsob podle nároku 17, setím, že po inkubaci dále neligované značené sondy.
    vyznačuj ící zahrnuje odstranění
    19. Způsob podle nároku 18, v y z n a č u j se t í m, že nukleová kyselina má známou sekvenci a množství sond je značeno značkou.
    ící velké
  19. 20. Způsob podle nároku 19, vyznačuj ící se tím, že značka se vybrala ze skupiny zahrnující radioizotop, fluorescenční molekulu a EML.
  20. 21. Způsob podle nároku 18, vyznačuj ící se tím, že velké množství sond je značeno velkým množstvím různých značek, přičemž sondy se mohou od sebe odlišit na základě různých připojených značek.
    22. je velké Způsob podle nároku 21, velké množství různých značek množství radioizotopů. 23. Způsob podle nároku 21, vyznačuj ící se t í m, že velké množství různých značek je velké množství fluorescenčních molekul. 24. Způsob podle nároku 21, vyznačuj ící se t í m, že velké množství různých značek je velké množství různých EML.
    • ·
    -1 -i Γ\ ’ * · « · ·· xiy ··· ··· ··· ·· ·· ··
  21. 25. Způsob analýzy velkého množství nukleových kyselin, vyznačující se tím, že zahrnuje:
    • získání vzorku, který obsahuje velké množství nukleových kyselin, přičemž cílová nukleová kyselina je přítomna akespoň v poměru 1 část ku 99 částem nukleové kyseliny, která je homologní s cílovou nukleovou kyselinou a liší se od ní alespoň jedním nukleotidem.
    • výběr sady sond, které budou určovat cílovou nukleovou kyselinu, • smíchání vzorku a sond za podmínek, které umožňují odlišení úplného párování od chybného párování jedné báze, • stanovení, zda dochází k úplnému párování mezi sondami a nukleovou kyselinou vzorku.
  22. 26. Přístroj pro analýzu nukleové kyseliny, vyznačující se tím, že zahrnuje:
    • první soubor nukleových kyselin, • druhý soubor nukleových kyselin, • materiál, který je umístěn mezi prvním a druhým souborem a brání smíchání nukleových kyselin prvního souboru s nukleovými kyselinami druhého souboru.
  23. 27. Přístroj podle nároku 26, vyznačuj ící se tím, že nukleové kyseliny druhého souboru jsou značené oligonukleotidové sondy.
  24. 28. Přístroj podle nároku 27, vyznačuj ící se tím, že nukleové kyseliny prvního souboru tvoří velké množství nukleových kyselin vzorku.
  25. 29. Způsob analýzy cílové nukleové kyseliny, vyznačující se tím, ž e zahrnuje:
    • · · ·
    120 získání souboru vázaných sond známé sekvence, které jsou vázány na substrát, získání souboru značených sond se známou sekvencí, získání materiálu uloženého mezi soubory vázaných a značených sond, který brání smíchání sond v souborech vázaných a značených sond, přidání cílové nukleové kyseliny ke značeným sondám, odstranění materiálu mezi vázanými a značenými sondami tak, že značené sondy, vázané sondy a cílové nukleové kyseliny se smísí dohromady za podmínek, které umožňují odlišení úplného párování od chybného párování jedné báze, spojení vázaných a značených sond, které hybridizují se sousedícími místy v cílové nukleové kyselině, detekce značené vázaných sond.
    sondy, která je spojena souborem
  26. 30. Způsob analýzy cílové nukleové kyseliny, vyznačující se tím, že zahrnuje:
    • získání souboru vázaných sond známé sekvence fixovaných na substrát, • získání souboru značených sond známé sekvence, • získání materiálu uloženého mezi soubory vázaných a značených sond, který brání smíchání sond v souborech vázaných a značených sond, • odstranění materiálu mezi vázanými a značenými sondami tak, že se značené a vázané sondy smíchají dohromady, • přidání cílové nukleové kyseliny ke značeným a vázaným sondám za podmínek, které umožňují odlišení úplného párování od chybného párování jedné báze, *> ligace vázaných a značených sond, které hybridizují se sousedícími místy na cílové nukleové kyselině, • detekce značené sondy, která se ligovala se souborem vázaných sond.
    • · · · * · ·
    121
  27. 31. Způsob analýzy cílové nukleové kyseliny, vyznačující se tím, že zahrnuje:
    • získání souboru vázaných sond známé sekvence fixovaných na substrátu, přičemž některé vázané sondy jsou komplementární s velkým množstvím prvních částí cílové nukleové kyseliny, • získání souboru značených sond známé sekvence, přičemž některé značené sondy jsou komplementární s velkým množstvím druhých částí cílové nukleové kyseliny a specifické druhé části sousedí se specifickými prvními částmi, • získání materiálu uloženého mezi soubory vázaných a značených sond, které brání smíchání sond v soborech vázaných a značených sond, • přidání cílové nukleové kyseliny ke značeným sondám, • odstranění materiálu mezi vázanými a značenými sondami tak, že se značené sondy, vázané sondy a cílové nukleové kyseliny spolu smíchají za podmínek, které umožňují odlišení úplného párování od chybného párování jedné báze, • spojení vázaných a značených sond, které jsou navázané na specifické první a druhé části cílové nukleové kyseliny, • detekce značené sondy, která se spojila se souborem vázaných sond.
  28. 32. Způsob analýzy cílové nukleové kyseliny, vyznačující se tím, že zahrnuje:
    • získání souboru vázaných sond známé sekvence fixovaných na substrát, přičemž některé vázané sondy jsou komplementární s velkým množstvím prvních částí cílové nukleové kyseliny, • získání souboru značených sond známé sekvence, kde některé značené sondy jsou komplementární s velkým množstvím druhých částí cílové nukleové kyseliny a specifické druhé části sousedí se specifickými prvními částmi,
    122 • · · · * ··< ·· ·♦ · · • získání materiálu uloženého mezi soubory vázaných a značených sond, které brání smíchání sond v soborech vázaných a značených sond, • odstranění materiálu mezi vázanými a značenými sondami tak, že značené sondy a vázané sondy se mohou spolu smíchat, • přidání cílové nukleové kyseliny ke značeným a vázaným sondám za pdomínek, které umožňují odlišit úplné párování od chybného párování jedné báze, • spojení vázaných a značených sond, které se váží ke specifickým prvním a druhým částem cílové nukleové kyseliny, • detekce značené sondy, která se spojila se souborem vázaných sond.
  29. 33. Způsob analýzy cílové nukleové kyseliny, vyznačující se tím, že zahrnuje:
    • získání souboru vázaných cílových nukleových kyselin, • získání souboru značených sond známé sekvence, • získání materiálu uloženého mezi soubory vázané cílové nukleové kyseliny a značených sond, který brání smíchání cílové nukleové kyseliny a značených sond, • odstranění materiálu mezi vázanou cílovou nukleovou kyselinou a značenými sondami tak, že značené sondy a vázané cílové nukleové kyseliny se spolu smíchají za podmínek, které umožní odlišení úplného párování s chybným párováním jedné báze, • stanovení, které značené sondy se úplně párují s cílovou DNA.
CZ19992546A 1998-01-14 1998-01-14 Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin CZ254699A3 (cs)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CZ19992546A CZ254699A3 (cs) 1998-01-14 1998-01-14 Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CZ19992546A CZ254699A3 (cs) 1998-01-14 1998-01-14 Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin

Publications (1)

Publication Number Publication Date
CZ254699A3 true CZ254699A3 (cs) 2000-02-16

Family

ID=5465153

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ19992546A CZ254699A3 (cs) 1998-01-14 1998-01-14 Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin

Country Status (1)

Country Link
CZ (1) CZ254699A3 (cs)

Similar Documents

Publication Publication Date Title
US6297006B1 (en) Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
US6309824B1 (en) Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes
US6383742B1 (en) Three dimensional arrays for detection or quantification of nucleic acid species
US20030108897A1 (en) Methods and compositions for detection or quantification of nucleic acid species
US6355419B1 (en) Preparation of pools of nucleic acids based on representation in a sample
US6401267B1 (en) Methods and compositions for efficient nucleic acid sequencing
EP0723598B1 (en) Methods and compositions for efficient nucleic acid sequencing
US20220106586A1 (en) Compositions and methods for library sequencing
JP2001514906A (ja) 核酸種を検出または定量するための方法および組成物
JP2022521766A (ja) 次世代シーケンシングのための組成物および方法
US20030082576A1 (en) High throughput polymorphism screening
US20100028873A1 (en) Methods and means for nucleic acid sequencing
AU2005225525A1 (en) Methods and means for nucleic acid sequencing
US20030036084A1 (en) Nucleic acid detection method employing oligonucleotide probes affixed to particles and related compositions
CZ254699A3 (cs) Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin
KR20010022917A (ko) 핵산 종을 감지하고 이를 정량화하는 방법 및 그 조성물
WO1999036567A2 (en) Enhanced discrimination of perfect matches from mismatches using a modified dna ligase

Legal Events

Date Code Title Description
PD00 Pending as of 2000-06-30 in czech republic