DK179064B1

DK179064B1 - Fremgangsmåder til syntese af kodede biblioteker

Info

Publication number: DK179064B1
Application number: DKPA201170734A
Authority: DK
Inventors: Barry Morgan; Stephen Hale; Christopher C Arico-Muendel; Mathew Clark; Richard Wagner; Malcolm J Kavarana; Steffen Philip Creaser; George J Franklin; Paolo A Centrella; David I Israel; Malcolm L Gefter; Dennis Benjamin; Nils Jacob Vest Hansen; Raksha A Acharya
Original assignee: Glaxosmithkline Llc
Priority date: 2005-06-09
Filing date: 2011-12-20
Publication date: 2017-10-02
Also published as: ES2365534T3; BRPI0613566B1; DK201170734A; DK177345B1; IL187977A0; JP2008543289A; ZA201004791B; DK1910538T3; CN102392014A; CY1112036T1; RU2008100035A; EP2311786A3; AU2006257915A1; HK1120546A1; RU2011101778A; HRP20110528T1; JP2014039550A; HK1150454A1; EP2258870A3; BRPI0613566A2

Abstract

Den foreliggende opfindelse tilvejebringer en fremgangsmåde til syntetisering af et molekyle omfattende en funktionel enhed, der er operativt bundet til et kodende oligonukleotid.

Description

Fremgangsmåder til syntese af kodede biblioteker Opfindelsens baggrund Søgen efter mere effektive fremgangsmåder til at identificere forbindelser, der har nyttige biologiske aktiviteter, har ført til udvikling af fremgangsmåder til screening af enorme antal distinkte forbindelser, der findes i samlinger, som betegnes kombinatoriske biblioteker. Sådanne biblioteker kan omfatte 105 eller flere distinkte forbindelser. Der findes en række fremgangsmåder til fremstilling af kombinatoriske biblioteker, og der er blevet rapporteret om kombinatoriske synteser af peptider, peptidomimikker og små organiske molekyler. WO 2004/083427angår kodede kombinatoriske kemiske biblioteker. Dokumentet beskriver en fremgangsmåde til syntetisering af bifunktionelle komplekser, der har et kodet molekyle og et identifikator polynukleotid, som er i stand til at identificere kemiske enheder der har deltaget i syntesen af det kodede molekyle, hvor det kodede molekyle dannes ved at omsætte mindst to af flere kemiske enheder der er forbundet med en identifikator polynukleotid og de kemiske enheder er tilvejebragt som separate byggeblokke. Biblioteket af bifunktionelle komplekser omfatter 1000 eller flere forskellige medlemmer, såsom 105 eller 1012 forskellige medlemmer. WO 93/20242 angår ligational kodning af små molekyler. Dokumentet beskriver et bibliotek af bifunktionelle molekyler, som tilvejebringer et repertoire af kemisk mangfoldighed, således at hver kemisk del er forbundet med en genetisk kode, der letter identifikation af en kemisk struktur. Biblioteket kan anvendes til at identificere en kemisk struktur, der deltager i en forudvalgt binding eller katalysereaktion med et biologisk aktivt molekyle. WO 2005/026387 angår en fremgangsmåde til opnåelse af strukturel information om et kodet molekyle. Dokumentet beskriver en fremgangsmåde til identifikation af et (M1) display molekyle, der har affinitet til molekylært target, ved at blande molekylært target forbundet med target-oligonukleotidet med et bibliotek af bifunktionelle komplekser, der har display-molekyler bundet til identifikator oligonukleotider, som kobler identifikatorer af komplekser med target oligonukleotider, og udleder dermed identiteten af bindende display molekyler og/eller molekylære targets fra koblede produkter af identifikatorer og target oligonucleotider. KATAJISTO, J. et al: “Solid-phase Synthesis of Multiantennary Oligonucleotide Glycoconjugates Utilizing On-Support Oximation”, BIOCONJUGATE CHEMISTRY, Vol. 15 (2004), page 890-896 beskriver linkere, som kan bruges til at identificere en eller flere forbindelser, der binder til et biologisk target.

De to største udfordringer ved anvendelse af kombinatoriske metoder til lægemiddelopdagelse er syntese af biblioteker med tilstrækkelig kompleksitet og identifikation af molekyler, der er aktive i de anvendte screeninger. Det er generelt anerkendt, at jo højere kompleksitetsgrad et bibliotek har, dvs. antallet af distinkte strukturer, der er til stede i biblioteket, jo større er sandsynligheden for, at biblioteket indeholder molekyler med den interessante aktivitet. Den kemi, der anvendes ved bibliotekssyntese, skal derfor være i stand til at producere enorme antal forbindelser inden for en rimelig tidsramme. For en given formel eller generel koncentration vil en forøgelse af antallet af distinkte medlemmer i biblioteket imidlertid reducere koncentrationen af et vilkårligt bestemt biblioteksmedlem. Dette komplicerer identifikation af aktive molekyler fra højkomplekse biblioteker. Én måde, hvorpå man kan overvinde disse forhindringer, har været udvikling af kodede biblioteker og især biblioteker, hvori hver forbindelse omfatter en amplificerbar tag. Sådanne biblioteker omfatter DNA-kodede biblioteker, hvori en DNA-tag, der identificerer et biblioteksmedlem, kan amplificeres under anvendelse af molekylærbiologiske teknikker, såsom polymerase-kædereaktionen. Anvendelse af sådanne fremgangsmåder til fremstilling af meget store biblioteker er imidlertid endnu ikke blevet demonstreret, og det er klart, at forbedrede fremgangsmåder til fremstilling af sådanne biblioteker er nødvendige for at kunne realisere denne metodes potentiale til lægemiddelopdagelse.

Resumé af opfindelsen

Opfindelsen er beskrevet i kravene.

Den foreliggende opfindelse tilvejebringer forbindelser som beskrevet i de tilknyttede krav. Forbindelserne kan syntetiseres igennem anvendelse af fremgangsmåder der anvender en "spilt og foren" strategi, hvori en opløsning omfattende en initiator, der omfatter en første byggesten, som er bundet til et kodende oligonukleotid, deles ("splittes") i mange fraktioner. I hver fraktion omsættes initiatoren med en anden, unik, byggesten og et andet, unikt, oligonukleotid, der identificerer den anden byggesten. Disse reaktioner kan være samtidige eller sekventielle og, hvis de er sekventielle, kan hver reaktion gå forud for den anden. De i hver af fraktionerne producerede dimere molekyler kombineres ("forenes") og deles så igen i multiple fraktioner. Hver af disse fraktioner omsættes derefter med en tredje unik (fraktionsspecifik) byggesten og et tredje unikt oligonukleotid, der koder for byggestenen. Antallet af i produktbiblioteket tilstedeværende unikke molekyler er en funktion af (1) antallet af forskellige byggesten, der anvendes i hvert trin i syntesen, og (2) det antal gange foren- og del-processen gentages.

Fremgangsmåden kan syntetisere et molekyle omfattende eller bestående af en funktionel enhed, der er operativt bundet til et kodende oligonukleotid. Fremgangsmåden omfatter trinnene med: (1) tilvejebringelse afen initiator-forbindelse bestående af en funktionel enhed omfattende n byggesten, hvor n er et helt tal på 1 eller større, hvor den funktionelle enhed omfatter mindst én reaktiv gruppe og, hvor den funktionelle enhed er operativt bundet til et initialt oligonukleotid; (2) omsætning af initiatorforbindelsen med en byggesten omfattende mindst én komplementær reaktiv gruppe, hvor den mindst ene komplementære reaktive gruppe er komplementær til den reaktive gruppe i trin (1), under betingelser, der er egnede til omsætning af den reaktive gruppe og den komplementære reaktive gruppe til dannelse af en kovalent binding; (3) omsætning af det initiale oligonukleotid med et indkommende oligonukleotid, der identificerer byggestenen i trin (b) i nærvær af et enzym, der katalyserer ligering af det initiale oligonukleotid og det indkommende oligonukleotid, under betingelser, der er egnede til ligering af det indkommende oligonukleotid og det initiale oligonukleotid, hvorved der produceres et molekyle, der omfatter eller består af en funktionel enhed omfattende n+1 byggesten, der er operativt bundet til et kodende oligonukleotid. Hvis den funktionelle enhed i trin (3) omfatter en reaktiv gruppe, kan trin 1 -3 gentages én eller flere gange, hvorved der dannes cykluser 1 til i, hvor i er et helt tal på 2 eller større, hvor produktet fra trin (3) i en cyklus s, hvor s er et helt tal på i-1 eller mindre, bliver initiatorforbindelsen i cyklus s + 1.

Fremgangsmåden kan anvendes til syntetisering af et bibliotek af forbindelser, hvor forbindelserne omfatter en funktionel enhed omfattende to eller flere byggesten, der er operativt bundet til et oligonukleotid, som identificerer den funktionelle enheds struktur. Fremgangsmåden omfatter trinnene med (1) tilvejebringelse af en opløsning omfattende m initiatorforbindelser, hvor m er et helt tal på 1 eller større, hvor initiatorforbindelserne består af en funktionel enhed omfattende n byggesten, hvor n er et helt tal på 1 eller større, der er operativt bundet til et initialt oligonukleotid, som identificerer de n byggesten; (2) deling af opløsningen i trin (1) i r fraktioner, hvor r er et helt tal på 2 eller større; (3) omsætning af initiatorforbindelserne i hver fraktion med én af r byggesten, hvorved der produceres r fraktioner omfattende forbindelser bestående af en funktionel enhed omfattende n+1 byggesten, der er operativt bundet til det initiale oligonukleotid; (4) omsætning af det initiale oligonukleotid i hver fraktion med én af et sæt på r distinkte indkommende oligonukleotider i nærvær af et enzym, som katalyserer ligeringen af det indkommende oligonukleotid og det initiale oligonukleotid under betingelser, der er egnede til enzymatisk ligering af det indkommende oligonukleotid og det initiale oligonukleotid, hvorved der produceres r alikvotter omfattende molekyler bestående af en funktionel enhed omfattende n+1 byggesten, der er operativt bundet til et forlænget oligonukleotid, som koder for de n+1 byggesten. Fremgangsmåden kan eventuelt yderligere omfattet trinnet med (5) rekombination af de r fraktioner produceret i trin (4), hvorved der produceres en opløsning omfattende forbindelser bestående af en funktionel enhed omfattende n+1 byggesten, som er operativt bundet til et forlænget oligonukleotid. Trin (1) til (5) kan udføres én eller flere gange til opnåelse af cyklus 1 til i, hvor i er et helt tal på 2 eller større. I cyklus s+1, hvor s er et helt tal på i-1 eller mindre, er opløsningen omfattende m initiatorforbindelser i trin (1) opløsningen i trin (5) i cyklus s. På samme måde er initiatorforbindelserne i trin (1) i cyklus s+1 forbindelserne i trin (5) i cyklus s.

Byggestenene i hvert trin kan kobles under anvendelse af konventionelle kemiske reaktioner. Byggestenene kan kobles til tilvejebringelse af lineære eller forgrenede polymerer eller oligomerer, såsom peptider, peptidomimikker og peptoider, eller ikke-oligomere molekyler, såsom molekyler omfattende en stilladsstruktur, hvortil der er fastknyttet én eller flere yderligere kemiske enheder. Hvis for eksempel byggestenene er aminosyrerester, kan byggestenene kobles under anvendelse af standard peptidsyntesestrategier, såsom opløsningsfase- eller fastfasesyntese under anvendelse af egnede beskyttelses-/afbeskyttelsesstrategier, som er kendte inden for området. Fortrinsvis kobles byggestenene under anvendelse af opløsningsfasekemi. De kodende oligonukleotider er enkeltstrengede eller dobbeltstrengede oligonukleotider, fortrinsvis dobbeltstrengede oligonukleotider. De kodende oligonukleotider er fortrinsvis oligonukleotider med 4-12 baser eller basepar per byggesten; de kodende oligonukleotider kan kobles under anvendelse af standard opløsningsfase- eller fastfase-oligonukleotidsyntesemetodologi, men kobles fortrinsvis under anvendelse af en enzymatisk opløsningsfaseproces. For eksempel kan oligonukleotiderne kobles under anvendelse af en toposiomerase, en ligase, eller en DNA-polymerase, hvis de kodende oligonukleotiders sekvens omfatter en initieringssekvens til ligering med et af disse enzymer. Enzymatisk kobling af de kodende oligonukleotider frembyder fordele med (1) større additionsakkuratesse i sammenligning med standard syntese- (ikke-enzymatisk) kobling; og (2) anvendelse af en enklere beskyttelses-/afbeskyttelsesstrategi. I et aspekt tilvejebringer opfindelsen forbindelser med Formel I:

hvor X er en funktionel enhed omfattende én eller flere byggesten; Z er et oligonukleotid, der ved dets 3' terminus er fastknyttet til B; Y er et oligo-nukleotid, der ved dets 5' terminus er fastknyttet til C; A er en funktionel amino-gruppe, der danner en kovalent binding med X; B er en funktionel phosphat-gruppe, der danner en binding med 3'-enden af Z; C er en funktionel phosphat-gruppe, der danner en binding med 5'-enden af Y; D, F og E hver især uafhængigt er en bifunktionel bindingsgruppe; og S er et molekylært stillads og D er en alkylenkæde, E og F hver er en oligo(ethylenglycol)kæde, kendetegnet ved, at linkerenheden har strukturen

hvor n, m og p hver især uafhængigt er et helt tal fra 1 til 20. Sådanne forbindelser omfatter dem, der syntetiseres under anvendelse af fremgangsmåderne ifølge beskrivelsen.

Opfindelsen angår endvidere et forbindelsesbibliotek omfattende forbindelser, som omfatter en funktionel enhed, der omfatter to eller flere byggesten, som er operativt bundet til et oligonukleotid, der koder for den funktionelle enheds struktur. Sådanne biblioteker omfatter mindst 102 distinkte forbindelser, foreksempel 102,103,104,105,106,107,108,109,1010,1011, 1012 eller flere distinkte forbindelser, dvs. distinkte molekylære strukturer.

Forbindelserne, består hver især af Formel I:

(i) der omfatter en linkerenhed med en formel

hvor X er en funktionel enhed omfattende én eller flere byggesten; Z er et oligonukleotid, der ved dets 3' terminus er fastknyttet til B; Y er et oligonukleotid, der ved dets 5' terminus er fastknyttet til C; A er en funktionel amino-gruppe, der danner en kovalent binding med X; B er en funktionel phosphat-gruppe, der danner en binding med 3'-enden af Z; C er en funktionel phosphat-gruppe, der danner en binding med 5'-enden af Y; D, F og E hver især uafhængigt er en bifunktionel bindingsgruppe; og S er et molekylært stillads, og D er en alkylenkæde, og E og F hver er en oligo(ethylenglycol)kæde, kendetegnet ved, at linkerenheden har strukturen

hvor n, m og p hver især uafhængigt er et helt tal fra 1 til 20.

Her er beskrevet en fremgangsmåde til identifikation af en forbindelse, der binder til et biologisk target, hvilken fremgangsmåde omfatter trinnene med: (a) at bringe det biologiske target i kontakt med et forbindelsesbibliotek som beskrevet heri, hvor forbindelsesbiblioteket omfatter forbindelser, der omfatter en funktionel enhed omfattende to eller flere byggesten, der er operativt bundet til et oligonukleotid, som koder for den funktionelle enheds struktur. Dette trin udføres under betingelser, der er egnede til, at mindst ét medlem af forbindelsesbiblioteket binder til targetet; (2) at fjerne biblioteksmedlemmer, som ikke binder til targetet; (3) at amplificere de kodende nukleotider hos det mindst ene medlem af forbindelsesbiblioteket, som binder til targetet; (4) at sekventere de kodende oligonukleotider i trin (3); og at anvende de i trin (5) bestemte sekvenser til bestemmelse af strukturen af de funktionelle enheder hos de medlemmer af forbindelsesbiblioteket, der binder til det biologiske target.

Den foreliggende opfindelse tilvejebringer adskillige fordele ved identifikation af molekyler med en ønsket egenskab. For eksempel muliggør fremgangsmåderne anvendelse af en række kemiske reaktioner til konstruktion af molekylerne i nærvær af oligonukleotid-tag'en. Fremgangsmåderne tilvejebringer også en high-fidelity måde at inkorporere oligonukleotid-tags på i de således producerede kemiske strukturer. Endvidere muliggør de syntese af biblioteker med et stort antal kopier af hvert medlem, hvorved der muliggøres multiple selektionsrunder mod et biologisk target, mens der lades et tilstrækkeligt antal molekyler tilbage efter den sidste runde til amplifikation og sekventering af oligonukleotid-tags'ene.

Kort beskrivelse af tegningerne

Figur 1 er en skematisk gengivelse af ligering af dobbeltstrengede oligo-nukleotider, hvori det initiale oligonukleotid har et overhæng, der er komplementært til det indkommende oligonukleotids overhæng. Den initiale streng gengives som enten fri, konjugeret til en aminohexyllinker eller konjugeret til en phenylalaninrest via en aminohexyllinker.

Figur 2 er en skematisk gengivelse af oligonukleotidligering under anvendelse af en splintstreng. I denne udførelsesform er splinten et 12-mer oligonukleotid med sekvenser, der er komplementære til det enkelstrengede initiale oligonukleotid og det enkeltstrengede indkommende oligonukleotid.

Figur 3 er en skematisk gengivelse af ligering af et initialt oligonukleotid og et indkommende oligonukleotid, når det initiale oligonukleotid er dobbeltstrenget med kovalent bundne strenge, og det indkommende oligonukleotid er dobbeltstrenget.

Figur 4 er en skematisk gengivelse af oligonukleotidforlængelse under anvendelse af en polymerase. Den initiale streng gengives som enten fri, konjugeret til en aminohexyllinker eller konjugeret til en phenylalaninrest via en aminohexyllinker.

Figur 5 er en skematisk gengivelse af syntesecyklusen i én udførelsesform for opfindelsen.

Figur 6 er en skematisk gengivelse af en selektionsprocess med multiple runder under anvendelse af bibliotekerne ifølge opfindelsen.

Figur 7 er en gel, der hidrører fra elektroforese af produkterne fra hver af cykluserne 1 til 5 beskrevet i Eksempel 1 og efter ligering af lukker-primeren. Molekylvægtstandarder er vist i bane 1, og de indikerede mængder af en hyperstige til DNA-kvantificering er vist i bane 9-12.

Figur 8 er en skematisk afbildning af koblingen af byggesten under anvendelse af azidalkyncycloaddition.

Figur 9 og 10 illustrerer kobling af byggesten via nukleofil aromatisk substitution på en chloreret triazin.

Figur 11 viser repræsentative chlorerede heteroaromatiske strukturer, der er egnede til anvendelse i syntesen af funktionelle enheder.

Figur 12 illustrerer cyklisering af et lineært peptid under anvendelse af azid/alkyncycloadditionsreaktionen.

Figur 13a er et chromatogram af det som beskrevet i Eksempel 2 efter Cyklus 4 producerede bibliotek.

Figur 13b er et massespektrum af det som beskrevet i Eksempel 2 efter Cyklus 4 producerede bibliotek.

Detaljeret beskrivelse af opfindelsen

Den foreliggende opfindelse angår forbindelser og kombinatoriske forbindelsesbiblioteker.

Man har gjort en række tiltag til at producere og screene kombinatoriske kemiske biblioteker. Som eksempel kan nævnes fremgangsmåder, hvor de individuelle medlemmer af biblioteket er fysisk adskilt fra hinanden, såsom når en enkelt forbindelse syntetiseres i hver af en mængde reaktionsbeholdere. Disse biblioteker screenes imidlertid typisk én forbindelse ad gangen eller højst adskillige forbindelser ad gangen og resulterer derfor ikke i den mest effektive screeningsproces. I andre metoder syntetiseres forbindelser på faste underlag. Sådanne faste underlag omfatter chips, hvori specifikke forbindelser optager specifikke områder af chip'en eller membranen ("adresserbar position"). I andre metoder syntetiseres forbindelser på perler, hvor hver perle indeholder forskellig kemisk struktur.

To problemer, der opstår ved screening af store biblioteker, er (1) antallet af distinkte forbindelser, som kan screenes; og (2) identificeringen af forbindelser, der er aktive i screeningen. Ved én fremgangsmåde identificeres de forbindelser, der er aktive i screenen, ved at indsnævre det oprindelige bibliotek til endnu mindre fraktioner og subtraktioner, hvor der i hvert tilfælde vælges den fraktion eller subtraktion, der indeholder aktive forbindelser, og yderligere underopdeles, indtil der opnås en aktiv subtraktion, som indeholder et sæt forbindelser, som er tilstrækkeligt lille til, at alle medlemmer af subsettet kan syntetiseres individuelt og vurderes for den ønskede aktivitet. Dette er et møjsommeligt og tidskrævende forehavende.

En anden fremgangsmåde til at udpakke resultaterne af en screening af et kombinatorisk bibliotek er at benytte biblioteker, hvori biblioteksmedlemmerne er taggede med en identificerende mærkning, dvs., hver mærkning, der er til stede i biblioteket, er associeret med en diskret forbindelsesstruktur, som findes i biblioteket således, at identifikation af mærkningen giver det taggede molekyles struktur. Én tilgang til taggede biblioteker benytter oligonukleotidtags som beskrevet for eksempel i US patent nr. 5,573,905; 5,708,153; 5,723,598; 6,060,596, offentliggjorte PCT-ansøgninger WO 93/06121; WO 93/20242; WO 94/13623; WO 00/23458; WO 02/074929 og WO 02/103008, og af Brenner og Lerner (Proc. Natl. Acad. Sci. USA 89, 5381-5383 (1992); Nielsen og Janda {Methods: A Companion to Methods in EnzymologyG, 361-371 (1994); og Nielsen, Brenner og Janda (J. Am. Chem. Soc. 115, 9812-9813 (1993)). Sådanne tags kan amplificeres under anvendelse for eksempel af polymerasekædereaktion til fremstilling af mange kopier af tag'en og identifikation af tag'en ved sekventering. Tag'ens sekvens identificerer så strukturen af bindingsmolekylet, der kan syntetiseres i ren form og testes. Denne beskrivelse tilvejebringer en forbedring af fremgangsmåder til fremstilling af DNA-kodede biblioteker samt de første eksempler på store (105 medlemmer eller større) biblioteker af DNA-kodede molekyler, hvori den funktionelle enhed syntetiseres under anvendelse af opløsningsfase-syntesemetoder.

Opfindelsen omfatter bifunktionelle molekyler, der omfatter en første enhed ("funktionel enhed"), som består af byggesten, og en anden enhed, der er operativt bundet til den første enhed, omfattende en oligonukleotid-tag, der identificerer den første enheds struktur, dvs. oligonukleotid-tag'en indikerer, hvilke byggesten, der blev brugt ved konstruktionen af den første enhed, samt den rækkefølge, i hvilken byggestenene blev bundet. Generelt er den information, som oligonukleotid-tag'en giver, tilstrækkelig til at bestemme de byggesten, der blev brugt til at konstruere den aktive enhed. I visse udførelsesformer er oligonukleotid-tag'ens sekvens tilstrækkelig til at bestemme byggestenenes arrangement i den funktionelle enhed, for peptidenheder for eksempel aminosyresekvensen. Således som det anvendes heri, refererer udtrykket "funktionel enhed" til en kemisk enhed omfattende én eller flere byggesten. Fortrinsvis er byggestenene i den funktionelle enhed ikke nukleinsyrer. Den funktionelle enhed kan være en lineær eller forgrenet eller cyklisk polymer eller oligomer eller et lille organisk molekyle. Således som det anvendes heri, er udtrykket "byggesten" en kemisk strukturenhed, der er bundet til andre kemiske strukturenheder, eller kan bindes til andre sådanne enheder. Når den funktionelle enhed er polymer eller oligomer, er byggestenene polymerens eller oligomerens monomerenheder. Byggesten kan også omfatte en stilladsstruktur ("stilladsbyggesten"), hvortil der er eller kan fastknyttes én eller flere yderligere strukturer ("perifere byggesten").

Det skal forstås, at udtrykket "byggesten" anvendes heri til at referere til en kemisk strukturenhed, således som den eksisterer i en funktionel enhed og også i den til syntese af den funktionelle enhed anvendte reaktive form. En byggesten vil være til stede i den funktionelle enhed uden en eventuel del af byggestenen, som går tabt som følge af at inkorporere byggestenen i den funktionelle enhed. I de tilfælde for eksempel, hvor den bindingsdannende reaktion frigiver et lille molekyle (se nedenfor), er byggestenen, således som den er til stede i den funktionelle enhed, en "byggestenrest", dvs. resten af den byggesten, der blev anvendt ved syntesen efter tab af de atomer, som den leverer til det frigivne molekyle.

Byggestenene kan være en hvilken som helst kemisk forbindelse, der er komplementær, dvs. byggestenene skal være i stand til at reagere sammen til dannelse af en struktur omfattende to eller flere byggesten. Typisk vil alle de anvendte byggesten have mindst to reaktive grupper, selvom der er muligt, at nogle af de anvendte byggesten (for eksempel den sidste byggesten i en funktionel oligomerenhed) kun vil have én reaktiv gruppe hver. Reaktive grupper på to forskellige byggesten skal være komplementære, dvs. i stand til at reagere sammen til dannelse af en kovalent binding, eventuelt med ledsagende tab af et lille molekyle, såsom vand, HCI, HF og så videre.

Til nærværende formål er to reaktive grupper komplementære, hvis de er i stand til at reagere sammen til dannelse af en kovalent binding. I en foretrukket udførelsesform sker de bindingsdannende reaktioner hurtigt under omgivelsesbetingelser uden væsentlig dannelse af biprodukter. En given reaktiv gruppe vil fortrinsvis reagere med en given komplementær reaktiv gruppe præcis én gang. I én udførelsesform reagerer komplementære reaktive grupper i to byggesten for eksempel via nukleofil substitution til dannelse af en kovalent binding. I én udførelsesform er ét medlem af et par komplementære reaktive grupper en elektrofil gruppe, og det andet medlem af parret er en nukleofil gruppe.

Komplementære elektrofile og nukleofile grupper omfatter hvilke som helst to grupper, der reagerer via nukleofil substitution under egnede betingelser til dannelse af en kovalent binding. En række egnede bindingsdannende reaktioner er kendte inden for området. Se for eksempel March, Advanced Organic Chemistry, fourth edition, New York: John Wiley and Sons (1992), Chapters 10 to 16; Carey and Sundberg, Advanced Organic Chemistry, Part B, Plenum (1990), Chapters 1 -11; og Collman et al., Principles and Applications of Organotransition Metal Chemistry, University Science Books, Miil Valley, Calif. (1987), Chapters 13 to 20. Eksempler på egnede elektrofile grupper omfatter reaktive carbonylgrupper, såsom acylchloridgrupper, estergrupper, herunder carbonylpentafluorphenylestere og succinimidestere, ketongrupper og aldehydgrupper; reaktive sulfonylgrupper, såsom sulfonylchloridgrupper, og reaktive phosphonylgrupper. Andre elektrofile grupper omfatter terminale expoidgrupper, isocyanatgrupper og alkylhalegonidgrupper. Egnede nukleofile grupper omfatter primære og sekundær aminogrupper og hydroxylgrupper og carboxylgrupper.

Egnede komplementære reaktive grupper er anført nedenfor. En fagmand på området kan umiddelbart bestemme andre reaktive gruppepar, som kan anvendes i den foreliggende fremgangsmåde, og de heri anførte eksempler er ikke ment som værende begrænsende. I en første udførelsesform omfatter de komplementære reaktive grupper aktiverede carboxylgrupper, reaktive sulfonylgrupper eller reaktive phosphonylgrupper, eller en kombination deraf, og primære eller sekundære aminogrupper. I denne udførelsesform reagerer de komplementære reaktive grupper under egnede betingelser til dannelse af en amid-, sulfonamid- eller phosphonamidatbinding. I en anden udførelsesform omfatter de komplementære reaktive grupper epoxidgrupper og primære eller sekundære aminogrupper. En epoxidholdig byggesten reagerer med en aminholdig byggesten under egnede betingelser til dannelse af en kulftof-nitrogen-binding, hvilket resulterer i en β-amino alkohol. I en anden udførelsesform omfatter de komplementære reaktive grupper aziridingrupper og primære eller sekundære aminogrupper. Under egnede betingelser reagerer en aziridinholdig byggesten med en aminholdig byggesten til dannelse af en kulstof-nitrogen-binding, hvilket resulterer i en 1,2-diamin. I en tredje udførelsesform omfatter de komplementære reaktive grupper isocyanatgrupper og primære eller sekundære aminogrupper. En isocyanatholdig byggesten vil reagere med en aminoholdig byggesten under betingelser, der er egnede til dannelse af en kulstof-nitrogen-binding, hvilket resulterer i en urinstofgruppe. I en fjerde udførelsesform omfatter de komplementære reaktive grupper isocyanatgrupper og hydroxylgrupper. En isocyanatholdig byggesten vil reagere med en hydroxylholdig byggesten under betingelser, der er egnede til dannelse af en kulstof-oxygen-binding, hvilket resulterer i en carbamat-gruppe. I en femte udførelsesform omfatter de komplementære reaktive grupper aminogrupper og carbonylholdige grupper, såsom aldehyd- eller ketongrupper. Aminer reagerer med sådanne grupper via reduktiv aminering til dannelse af en ny kulstof-nitrogen-binding. I en sjette udførelsesform omfatter de komplementære reaktive grupper phosphorylidgrupper og aldehyd- eller ketongrupper. En phosphorylidholdig byggesten vil reagere med en aldehyd- eller ketonholdig byggesten under betingelser, der er egnede til dannelse af en kulstof-kulstof-dobbeltbinding, hvilket resulterer i en alken. I en syvende udførelsesform reagerer de komplementære reaktive grupper via cycloaddition til dannelse af en cyklisk struktur. Ét eksempel på sådanne komplementære reaktive grupper er alkyner og organiske azider, der reagerer under betingelser, der er egnede til dannelse af en triazol-ringstruktur. Et eksempel på anvendelse af denne reaktion til binding af to byggesten er illustreret i Figur 8. Egnede betingelser for sådanne reaktioner er kendte inden for området og omfatter de i WO 03/101972 beskrevne. I en ottende udførelsesform er de komplementære reaktive grupper et alkylhalogenid og en nukleofil, såsom en aminogruppe, en hydroxylgruppe eller en carboxylgruppe. Sådanne grupper reagerer under betingelser, der er egnede til dannelse af et kulstof-nitrogen (alkylhalogenid plus amin) eller kulstof oxygen (alkylhalogenid plus hydroxyl- eller carboxylgruppe). I en niende udførelsesform er de komplementære funktionelle grupper en halogeneret heteroaromatisk gruppe og en nukleofil, og byggestenene bindes under egnede betingelser via aromatisk nukleofilsubstitution. Egnede halogenerede heteroaromatiske grupper omfatter chlorerede pyrimidiner, triaziner og puriner, der reagerer med nukleofiler, såsom aminer, under milde betingelser i vandig opløsning. Repræsentative eksempler på omsætning af oligonucleotid-tagged trichlortriazin med aminer er vist i Figur 9 og 10. Eksempler på egnede chlorerede heteroaromatiske grupper er vist i Figur 11.

Yderligere bindingsdannende reaktioner, som kan anvendes til at sammenføje byggesten i syntesen af molekyler og biblioteker, omfatter de neden for viste. Reaktionerne, der er vist nedenfor, fremhæver de reaktive funktionelle grupper. Adskillige substituenter kan være til stede i reaktanterne herunder dem, der er mærket R-ι, R2, R3 og R4. De mulige stillinger, der kan substitueres, omfatter, men er ikke begrænset til, dem, der er vist med Ri, R2, R3 og R4. Disse substituenter kan omfatte hvilke som helst egnede kemiske enheder, men er fortrinsvis begrænset til dem, der ikke vil interferere med eller signifikant hæmme den indikerede reaktion, og som, med mindre andet er anført, kan omfatte hydrogen, alkyl, substitueret alkyl, aryl, substitueret aryl, heteroalkyl, substitueret heteroaryl, alkoxy, aryloxy, arylalkyl, substitueret arylalkyl, amino, substitueret amino og andre, som er kendte inden for området. Egnede substituender på disse grupper omfatter alkyl, aryl, heteroaryl, cyano, halogen, hydroxyl, nitro, amino, mercapto, carboxyl og carboxamid. Hvor det er anført, omfatter egnede elektron-tilbagetrækkende grupper nitro, carboxyl, haloalkyl, såsom trifluormethyl og ander, der er kendte inden for området. Eksempler på egnede elektrondonerende grupper omfatter alkyl, alkoxy, hydroxyl, amino, halogen, acetamido og ander, der er kendte inden for området. Tilsætning af en primær amin til en alken:

Nukleophil substitution:

Reduktiv alkylering af en amin:

Palladium-katalyseret carbon-carbon-bindingsdannende reaktioner:

Ugi kondensationsreaktioner:

Elektrofile aromatiske substitutionsreaktioner:

X er en elektrondonerende gruppe.

Imin/iminium/enamin-dannende reaktioner:

Cycloadditionsreaktioner:

Diels-Alder cycloaddition

1,3-dipolær cycloaddition, X-Y-.Z=C-N-0,C-N-S,N3

Nukleofile aromatiske substitutionsreaktioner:

W er en elektron-tilbagetrækkende gruppe

Eksempler på egnede substituenter X og Y omfatter substitueret eller usubstitueret amino, substitueret eller usubstitueret alkoxy, substitueret eller usubstitueret thioalkoxy, substitueret eller usubstitueret aryloxy og substitueret og usubstitueret thioaryloxy.

Heck-reaktion:

Acetaldannelse:

Eksempler på egnede substituenter X og Y omfatter substitueret og usubstitueret amino, hydroxyl og sulhydryl; Y er en linker, der forbinder X og Y, og er egnet til dannelse af den ringstruktur, der findes i produktet fra reaktionen.

Aldol-reaktioner:

Eksempler på egnede substituenter X omfatter O, S og NR3

Stilladsbyggesten, der kan anvendes til at danne molekylerne og bibliotekerne ifølge opfindelsen, omfatter dem, der har to eller flere funktionelle grupper, der kan deltage i bindingsdannende reaktioner med perifere byggestenprækursorer, for eksempel under anvendelse af én eller flere af de oven for omtalte bindingsdannende reaktioner. Stilladsenheder kan også syntetiseres under konstruktion af bibliotekerne og molekylerne ifølge opfindelsen, for eksempel under anvendelse af byggestenprækursorer, der kan reagere på specifikke måder til dannelse af molekyler omfattende en central molekylær enhed, hvortil der er vedhæftet perifere funktionelle grupper. I én udførelsesform omfatter et bibliotek ifølge opfindelsen molekyler omfattende en konstant stilladsenhed, men forskellige perifere enheder eller forskellige arrangementer af perifere enheder. I visse biblioteker omfatter alle biblioteksmedlemmer en konstant stilladsenhed; andre biblioteker kan omfatte molekyler med to eller flere forskellige stilladsenheder. Eksempler på stilladsenhedsdannende reaktioner, der kan anvendes ved konstruktion af molekylerne og bibliotekerne ifølge opfindelsen, er anført i Tabel 8. Grupperne R-ι, R 2, R3 og R4 er kun begrænset ved, at de ikke bør interferere med eller signifikant hæmme den viste reaktion, og kan omfatte hydrogen, alkyl, substitueret alkyl, heteroalkyl, substitueret heteroalkyl, cycloalkyl, heterocycloalkyl, substitueret cycloalkyl, substitueret heterocycloalkyl, aryl, substitueret aryl, arylalkyl, heteroarylalkyl, substitueret arylalkyl, substitueret heteroarylalkyl, heteroaryl, substitueret heteroaryl, halogen, alkoxy, aryloxy, amino, substitueret amino og andre, der er kendte inden for området. Egnede substituenter omfatter, men er ikke begrænset til, alkyl, alkoxy, thioalkoxy, nitro, hydroxyl, sulfhydryl, aryloxy, aryl-S-, halogen, carboxy, amino, alkylamino, dialkylamino, arylamino, cyano, cyanat, nitril, isocyanat, thiocyanat, carbamyl og substitueret carbamyl.

Det skal forstås, at syntese af en funktionel enhed kan ske via én bestemt type koblingsreaktion, såsom, men ikke begrænset til, en af de oven for omtalte reaktioner, eller via en kombination af to eller flere koblingsreaktioner, såsom to eller flere af de oven for omtalte koblingsreaktioner. I én udførelsesform sammenføjes byggestenene for eksempel ved en kombination af amidbindingsdannelse (komplementære amino- og carboxylsyregrupper) og reduktiv aminering (komplementære amino- og aldehyd- eller ketongrupper). En hvilken som helst koblingskemi kan anvendes forudsat, at den er kompatibel med tilstedeværelsen af et oligo-nukleotid. Dobbeltstrengede (duplex) oligonucleotid-tags, som anvendt i visse udførelsesformer for den foreliggende opfindelse, er kemisk mere robuste end enkeltstrengede tags og tolererer derfor et bredere interval af reaktionsbetingelser og muliggør anvendelse af bindingsdannende reaktioner, som ikke ville være mulige med enkeltstrengede tags.

En byggesten kan omfatte én eller flere funktionelle grupper foruden den/de til dannelse af den funktionelle enhed anvendte reaktive gruppe eller grupper. Én eller flere af disse yderligere funktionelle grupper kan beskyttes for at undgå uønskede reaktioner af disse funktionelle grupper. Egnede beskyttelsesgrupper er kendte inden for området til en række funktionelle grupper (Greene and Wuts, Protective Groups in Oraanic Svnthesis. second edition, New York: John Wiley and Sons (1991)). Særligt anvendelige beskyttelsesgrupper omfatter t-butylesterer og esterer, acetaler, tritylesterer og aminer, acetylesterer, trimethylsilylesterer, trichlorethylesterer og esterer og carbamater. I én udførelsesform omfatter hver byggesten to reaktive grupper, der kan være ens eller forskellige. For eksempel kan hver byggesten, der tilsættes i cyklus s, omfatte to reaktive grupper, der er ens, men som begge er komplementære til de reaktive grupper i de i trin s-1 og s +1 tilsatte byggesten. I en anden udførelsesform omfatter hver byggesten to reaktive grupper, der selv er komplementære. For eksempel kan et bibliotek omfattende polyamidmolekyler fremstilles via reaktioner mellem byggesten omfattende to primære aminogrupper, og byggesten omfattende to aktiverede carboxyl-grupper. I de resulterende forbindelser er der ingen N- eller C-terminus, da alternerende amidgrupper har modsat direktionalitet. Alternativt kan et polyamidbibliotek produceres under anvendelse af byggesten, som hver især omfatter en aminogruppe og en aktiveret carboxylgruppe. I denne udførelsesform vil de i trin n i cyklussen tilsatte byggesten have en fri reaktiv gruppe, der er komplementær til den til rådighed værende reaktive gruppe på n-1 byggestenen, mens den anden reaktive gruppe på den n'te byggesten fortrinsvis er beskyttet. Hvis for eksempel medlemmerne af biblioteket syntetiseres fra C- til N-retningen, vil de tilsatte byggesten omfatte en aktiveret carboxylgruppe og en beskyttet aminogruppe.

De funktionelle enheder kan være polymere eller oligomere enheder, såsom peptider, peptidomimikker, peptidnukleinsyrer eller peptoider, eller de kan være små ikke-polymere molekyler, for eksempel molekyler med en struktur omfattende et centralt stillads og strukturer anbragt omkring stilladsets periferi. Lineære polymere eller oligomere biblioteker vil fremkomme ved anvendelse af byggesten med to reaktive grupper, mens der vil fremkomme forgrenede polymere eller oligomere biblioteker ved anvendelse af byggesten med tre eller flere reaktive grupper, eventuelt i kombination med byggesten med kun to reaktive grupper. Sådanne molekyler kan gengives ved den almene formel X-[X2...Xn, hvor hvert X er en monomer enhed af en polymer omfattende n monomere enheder, hvor n er et helt tal større end 1. For så vidt angår oligomere eller polymere forbindelser behøver de terminale byggesten ikke at omfatte to funktionelle grupper. Når det for eksempel drejer sig om et polyamidbibliotek, kan den C-terminale byggesten omfatte en aminogruppe, men tilstedeværelsen af en carboxylgruppe er fakultativ. På samme måde kan byggestenen ved N-terminus omfatte en carboxylgruppe, men behøver ikke af indeholde en aminogruppe.

Forgrenede oligomere eller polymere forbindelser kan også syntetiseres forudsat, at mindst én byggesten omfatter tre funktionelle grupper, der er reaktive med andre byggesten. Et bibliotek ifølge opfindelsen kan omfatte lineære molekyler, forgrenede molekyler eller en kombination af disse.

Biblioteker kan også konstrueres under anvendelse af for eksempel en stilladsbyggesten med to eller flere reaktive grupper, i kombination med andre byggesten med kun én til rådighed værende reaktive gruppe for eksempel, hvor eventuelle yderligere reaktive grupper er enten beskyttede eller ikke reaktive med de andre reaktive grupper, der er til stede i stilladsbyggestenen. I én udførelsesform kan de syntetiserede molekyler for eksempel gengives ved den almene formel X(Y)n, hvor X er en stilladsbyggesten; hvert Y er en byggesten bundet til X, og n er et helt tal på mindst to, og fortrinsvis et helt tal fra 2 til ca. 6.1 én foretrukket udførelsesform er den initiale byggesten i cyklus 1 en stilladsbyggesten. I molekyler med formlen X(Y)n kan hvert Y være ens eller forskelligt, men i de fleste medlemmer af et typisk bibliotek vil Y være forskelligt. I én udførelsesform omfatter bibliotekerne ifølge opfindelsen polyamidforbindelser. Polyamidforbindelserne kan være sammensat af byggesten afledt af hvilke som helst aminosyrer, herunder de tyve naturligt forekommende α-aminosyrer, såsom alanin (Ala; A), glycin (Gly; G), asparagin (Asn; N), asparaginsyre (Asp; D), glutaminsyre (Glu; E), histidin (His; H), leucin (Leu; L), lysin (Lys; K), phenylalanin (Phe; F), tyrosin (Tyr; Y), threonin (Thr; T), serin (Ser; S) arginin (Arg; R), valin (Val; V), glutamin (Gin; Q), isoleucin (Ile; I), cystein (Cys; C), methionin (Met; M), prolin (Pro; P) og tryptofan (Trp; W), hvor trebogstavs- og etbogstavskoderne for hver aminosyre er anført. I deres naturligt forekommende form eksisterer hver af de foregående aminosyrer i L-konfiguration, hvilket skal antages heri, medmindre andet er anført. I den foreliggende fremgangsmåde kan D-konfigurationsformerne af disse aminosyrer imidlertid også anvendes. Disse D-aminosyrer er anført heri med trebogstavs- eller etbogstavskode med småt, dvs. ala (a), gly (g), leu (I), gin (q), thr (t), ser (s) og så videre. Byggestenene kan også afledes fra andre a-aminosyrer herunder, men ikke begrænset til, 3-arylalaniner, såsom naphthylalanin, phenylsubstituerede phenylalaniner, herunder 4-fluor-, 4-chlor-, 4-brom- og 4-methylphenylalanin; 3-heteroarylalaniner, såsom 3-pyridylalanin, 3-thienylalanin, 3-quinolylalanin, og 3-imidazolylalanin; ornithin; citrullin; homocitrullin; sarcosin; homoprolin; homocystein; substitueret prolin, såsom hydroxyprolin og fluorprolin; dehydroprolin; norleucin; O-methyl-tyrosin; O-methylserin; O-methylthreonin og 3-cyclohexylalanin. Hver af de foregående aminosyrer kan anvendes i enten D- eller L-konfiguration.

Byggestenene kan også være aminosyrer, der ikke er α-aminosyrer, såsom α-azaaminosyrer, β-, γ-,δ-ε-aminosyrer, og N-substituerede aminosyrer, såsom N-substitueret glycin, hvor N-substituenten for eksempel kan være en substitueret eller usubstitueret alkyl-, aryl-, heteroaryl-, arylalkyl- eller heteroarylalkylgruppe. I én udførelsesform er N-substituenten en sidekæde fra en naturligt forekommende eller ikke naturligt forekommende a-aminosyre.

Byggestenen kan også være en peptidomimikstruktur, såsom en dipeptid-, tripeptid-, tetrapeptid- eller pentapeptidmimik. Sådanne peptidomimik-byggesten er fortrinsvis afledt fra aminoacylforbindelser således, at kemien ved tilsætning af disse byggesten til den voksende poly(aminoacyl)gruppe er den samme som eller lig den kemi, der anvendes til de andre byggesten. Byggestenene kan også være molekyler, der er i stand til at danne bindinger, som er isosteriske med en peptidbinding, til dannelse af funktionelle peptido-mimikenheder omfattende en peptidskeletmodifikaion, såsom \|/[CH2S], \|/[CH2NH], y[CSNH2], ψ[ΝΗΟΟ], y[COCH2] og ψ[(Ε) eller (Z) CH=CH], I den oven for anvendte nomenklatur indikerer ψ fravær af en amidbinding. Den struktur, der erstatter amidgruppen, er specificeret i parentesen.

Her er beskrevet en fremgangsmåde til syntetisering af en forbindelse omfattende eller bestående af en funktionel enhed, der er operativt bundet til et kodende oligonukleotid. Fremgangsmåden omfatter trinnene med: (1) tilvejebringelse af en initiatorforbindelse bestående af en initial funktionel enhed omfattende n byggesten, hvor n er et helt tal på 1 eller større, hvor den initiale funktionelle enhed omfatter mindst én reaktiv gruppe, og hvor den initiale funktionelle enhed er operativt bundet til et initialt oligonukleotid, der koder for de n byggesten; (2) omsætning af initiatorforbindelsen med en byggesten omfattende mindst én komplementær reaktiv gruppe, hvor den mindst ene komplementære reaktive gruppe er komplementær til den reaktive gruppe i trin (1), under betingelser, der er egnede til omsætning af den reaktive gruppe og den komplementære reaktive gruppe til dannelse af en kovalent binding; (3) omsætning af det initiale oligonukleotid med et indkommende oligonukleotid i nærvær af et enzym, der katalyserer ligering af det initiale oligonukleotid og det indkommende oligonukleotid, under betingelser, der er egnede til ligering af det indkommende oligonukleotid og det initiale oligonukleotid, hvorved der produceres et molekyle, der omfatter eller består af en funktionel enhed omfattende n+1 byggesten, som er operativt bundet til et kodende oligonukleotid. Hvis den funktionelle enhed i trin (3) omfatter en reaktiv gruppe, kan trin 1 -3 gentages én eller flere gange, hvorved der dannes cyklus 1 til i, hvor i er et helt tal på 2 eller større, idet produktet fra trin (3) i en cyklus s-1, hvor s er et helt tal på i eller mindre, bliver initiatorforbindelsen i trin (1) i cyklus s. I hver cyklus tilsættes én byggesten til den voksende funktionelle enhed og én oligonukleotidsekvens, der koder for den nye byggesten, tilsættes til det voksende kodende oligonukleotid.

Den/de initiale initiatorforbindelse(r) kan genereres ved at omsætte en første byggesten med et oligonukleotid (for eksempel et oligonukleotid, der omfatter PCR-primersekvenser eller et initialt oligonukleotid) eller med en linker, hvortil et sådant oligonukleotid er fastknyttet. I den i Figur 5 viste udførelsesform omfatter linkeren en reaktiv gruppe til fastknytning af en første byggesten og er fastknyttet til et initialt oligonukleotid. I denne udførelsesform tilvejebringer reaktion af en byggesten eller i hver af multiple alikvotter én af en samling byggesten med linkerens reaktive gruppe og tilsætning af et oligonukleotid, der koder for byggestenen til det initiale oligonukleotid den ene eller flere initiale initatorforbindelser ifølge den oven for anførte proces.

Hver individuel byggesten kan være associeret med et distinkt oligonukleotid således, at sekvensen af nukleotider i det i en given cyklus tilsatte oligonukleotid identificerer den i samme cyklus tilsatte byggesten.

Koblingen af byggesten og ligering af oligonukleotider vil generelt ske ved lignende koncentrationer af udgangsmaterialer og reagenser. For eksempel foretrækkes koncentrationer af reaktanter i størrelsesordenen mikromolær til millimolær, for eksempel fra ca. 10 μΜ til ca. 10 mM, for at få effektiv kobling af byggesten.

Fremgangsmåden kan omfatte yderligere følgende trin (2), trinnet med fjernelse af eventuel uomsat initial funktionel enhed. Ved at fjerne eventuelt uomsat initial funktionel enhed i en bestemt cyklus forhindres cyklusens initiale funktionelle enhed i at reagere med en i en senere cyklus tilsat byggesten. Sådanne reaktioner kunne føre til generering af funktionelle enheder, der mangler én eller flere byggesten, hvilket potentielt fører til en række funktionelle enhedsstrukturer, der svarer til en bestemt oligonukleotid-sekvens. En sådan fjernelse kan opnås ved at omsætte eventuel tilbageværende initial funktionel enhed med en forbindelse, der reagerer med den reaktive gruppe i trin (2). Fortrinsvis reagerer fjernelsesforbindelsen hurtigt med den reaktive gruppe i trin (2) og omfatter ingen yderligere reaktive grupper, der kan reagere med i senere cyklusser tilsatte byggesten. Ved syntese af en forbindelse, hvor den reaktive gruppe i trin (2) er en amino- gruppe, er en egnet fjenelsesforbindelse for eksempel en N-hydroxy-succinimidester, såsom eddikesyre N-hydroxysuccinimidester.

Her er beskrevet en fremgangsmåde til fremstilling af et bibliotek af forbindelser, hvor hver forbindelse omfatter en funktionel enhed omfattende to eller flere byggesten rester, der er operativt bundet til et oligonukleotid. I en foretrukket udførelsesform giver det i hvert molekyle tilstedeværende oligonukleotid tilstrækkelig information til at identificere byggestenene i molekylet og eventuelt rækkefølgen for tilsætning af byggestenene. I denne udførelsesform omfatter fremgangsmåden en fremgangsmåde til syntetisering af et bibliotek af forbindelser, hvor forbindelserne omfatter en funktionel enhed omfattende to eller flere byggesten, som er operativt bundet til et oligonukleotid, der identificerer den funktionelle enheds struktur. Fremgangsmåden omfatter trinnene med (1) tilvejebringelse af en opløsning omfattende m initiatorforbindelser, hvor m er et helt tal på 1 eller større, hvor initiatorforbindelserne består af en funktionel enhed omfattende n byggesten, hvor n er et helt tal på 1 eller større, der er operativt bundet til et initialt oligonukleotid, som identificerer de n byggesten; (2) deling af opløsningen i trin (1) i mindst r fraktioner, hvor r er et helt tal på 2 eller større; (3) omsætning af hver fraktion med en af r byggesten, hvorved der produceres r fraktioner omfattende forbindelser, der består af en funktionel enhed omfattende n+1 byggesten, der er operativt bundet til det initiale oligonukleotid; (4) omsætning af hver af de r fraktioner i trin (3) med én af et sæt på r distinkte indkommende oligonukleotider under betingelser, der er egnede til enzymatisk ligering af det indkommende oligonukleotid til det initiale oligonukleotid, hvorved der produceres r fraktioner omfattende molekyler bestående af en funktionel enhed, som omfatter n+1 byggesten, der er operativt bundet til et forlænget oligonukleotid, som koder for de n+1 byggesten. Fremgangsmåden kan eventuelt yderligere omfattet trinnet med (5) rekombination af de r fraktioner produceret i trin (4), hvorved der produceres en opløsning omfattende molekyler bestående af en funktionel enhed omfattende n+1 byggesten, der er operativt bundet til et forlænget oligonukleotid, som koder for de n+1 byggesten. Trin (1) til (5) kan udføres én eller flere gange til opnåelse af cyklus 1 til i, hvor i er et helt tal på 2 eller større. I cyklus s+1, hvor s er et helt tal på i-1 eller mindre, er opløsningen omfattende m initiatorforbindelser i trin (1) opløsningen i trin (5) i cyklus s. På samme måde er initiatorforbindelserne i trin (1) i cyklus s+1 produkterne fra trin (4) i cyklus s.

Fortrinsvis deles opløsningen i trin (2) i r fraktioner i hver cyklus i bibliotekssyntesen. I denne udførelsesform omsættes hver fraktion med en unik byggesten. I fremgangsmåderne er rækkefølgen for tilsætning af byggestenen og det indkommende oligonukleotid ikke kritisk, og trin (2) og (3) i syntesen af et molekyle, og trin (3) og (4) i bibliotekssyntesen, kan reverseres, dvs. det indkommende oligonukleotid kan ligeres til det initiale oligonukleotid, før den nye byggesten tilsættes. I visse udførelsesformer kan det være muligt at udføre disse to trin samtidigt. I visse udførelsesformer omfatter fremgangsmåden yderligere efter trin (2) trinnet med fjernelse af eventuelt uomsat initial funktionel enhed. Ved at fjerne eventuelt uomsat initial funktionel enhed i en bestemt cyklus forhindres en cyklus initiale funktionelle enhed i at reagere med en i en senere cyklus tilsat byggesten. Sådanne reaktioner kunne føre til generering af funktionelle enheder, der mangler én eller flere byggesten, hvilket potentielt fører til en række funktionelle enhedsstrukturer, der svarer til en bestemt oligonukleotid-sekvens. En sådan fjernelse kan opnås ved at omsætte eventuel tilbagebleven initial funktionel enhed med en forbindelse, der reagerer med den reaktive gruppe i trin (2). Fortrinsvis reagerer fjernelsesforbindelsen hurtigt med den reaktive gruppe i trin (2) og omfatter ingen yderligere reaktive grupper, der kan reagere med i senere cykluser tilsatte byggesten. Ved syntese af en forbindelse, hvor den reaktive gruppe i trin (2) er en amino-gruppe, er en egnet fjernelsesforbindelse for eksempel en N-hydroxy-succinimidester, såsom eddikesyre N-hydroxysuccinimidester. I én udførelsesform vælges de byggesten, der anvendes i bibliotekssyntesen, fra et sæt kandidatbyggesten ved at vurdere kandidatbyggestenenes evne til at reagere med passende komplementære funktionelle grupper under de betingelser, der anvendes til syntese af biblioteket. Byggesten, der viser sig at være passende reaktive under sådanne betingelser, kan så vælges til inkorporering i biblioteket. Produkterne fra en given cyklus kan eventuelt oprenses. Når cyklusen er en mellemcyklus, dvs. en hvilken som helst cyklus inden den endelige cyklus, er disse produkter mellemprodukter og kan oprenses før initiering af den næste cyklus. Hvis cyklusen er den endelige cyklus, er produkterne fra cyklusen slutprodukterne og kan oprenses før nogen anvendelse af forbindelserne. Dette oprensningstrin kan for eksempel fjerne uomsatte eller overskydende reaktanter og det enzym, der blev brugt til oligonukleotidligering. Enhver metode, der er egnet til at separere produkterne fra andre arter, der er til stede i opløsning, kan anvendes, herunder væskechromatografi, såsom high-performance væskechromatografi (HPLC) og udfældning med et egnet cosolvent, såsom ethanol. Egnede fremgangsmåder til oprensning vil afhænge af produkternes beskaffenhed og det solventsystem, der anvendes til syntese.

Reaktionerne udføres fortrinsvis i vandig opløsning, såsom en bufret vandig opløsning, men kan også udføres i blandede vandige/organiske medier i overensstemmelse med opløsningsegenskaberne hos byggestenene, oligonukleotiderne, mellemprodukterne og slutprodukterne og det enzym, der anvendes til at katalysere oligonukleotidligering.

Det skal forstås, at det teoretiske antal forbindelser, der produceres af en given cyklus i den oven for beskrevne fremgangsmåde, er produktet af antallet af forskellige initiatorforbindelser, m, der anvendes i cyklusen og antallet af distinkte byggesten, som tilsættes i cyklusen, r. Det faktiske antal distinkte forbindelser, der produceres i cyklusen, kan være så højt som produktet af r og m (r x m), men kunne være lavere, forudsat forskelligheder i visse byggestens reaktivitet med visse andre byggesten. For eksempel kan en bestemt byggestens additionskinetik til en bestemt initiatorforbindelse være sådan, at der i den syntetiske cyklus tidsskala kun kan produceres lidt til intet af produktet fra den reaktion. I visse udførelsesformer tilsættes en gængs byggesten inden cyklus 1, efter den sidste cyklus eller imellem to vilkårlige cykluser. Når den funktionelle enhed for eksempel er et polyamid, kan der tilsættes en gængs N-terminal capping-byggesten efter den sidste cyklus. En gængs byggesten kan også indføres mellem to vilkårlige cykluser for eksempel for at tilsætte en funktionel gruppe, såsom en alkyn- eller azidgruppe, der kan anvendes til at modificere de funktionelle enheder for eksempel ved cyklisering efter bibliotekssyntese.

Udtrykket "operativt bundet" betyder, således som det anvendes heri, at to kemiske strukturer bindes sammen på en sådan måde, at de forbliver bundet gennem de forskellige manipulationer, som de forventes at gennemgå. Den funktionelle enhed og det kodende oligonukleotid bindes typisk kovalent via en egnet bindingsgruppe. Bindingsgruppen er en bivalent enhed med et fastknytningssted for oligonukleotidet og et fastknytningssted for den funktionelle enhed. Når den funktionelle enhed for eksempel er en polyamidforbindelse, kan polyamidforbindelsen fastknyttes til bindingsgruppen ved dens N-terminus, dens C-terminus eller via en funktionel gruppe på en af sidekæderne. Bindingsgruppen er tilstrækkelig til at adskille polyamidforbindelsen og oligonukleotidet med mindst ét atom, og fortrinsvis med mere end ét atom, såsom mindst to, mindst tre, mindst fire, mindst fem eller mindst seks atomer. Bindingsgruppen er fortrinsvis tilstrækkeligt fleksibel til at tillade polyamidforbindelsen at binde til targetmolekyler på en måde, der er uafhængig af oligonukleotidet. I én udførelsesform fastknyttes bindingsgruppen til polyamidforbindelsens N-terminus og oligonukleotidets 5'-phosphatgruppe. For eksempel kan bindingsgruppen afledes fra en bindingsgruppeprækursor omfattende en aktiveret carboxylgruppe på den ene ende og en aktiveret ester på den anden ende. Omsætning af bindingsgruppeprækursoren med det N-terminale nitrogenatom vil danne en amidbinding, der forbinder bindingsgruppen med polyamidforbindelsen eller den N-terminale byggesten, mens omsætning af bindingsgruppeprækursoren med oligonukleotidets 5'-hydroxygruppe vil resultere i fastknytning af oligonukleotidet til bindingsgruppen via en esterbinding. Bindingsgruppen kan for eksempel omfatte en polymethylen-kæde, såsom en -(CH2)n-kæde eller en poly(ethylenglycol)-kæde, såsom en -(CH2CH20)n-kæde, hvor n i begge tilfælde er et helt tal fra 1 til ca. 20. Fortrinsvis er n fra 2 til ca. 12, mere foretrukket fra ca. 4 til ca. 10. I én udførelsesform omfatter bindingsgruppen en hexamethylen (-(CH2)6-)-gruppe. Når byggestenene er aminosyrerester, er den resulterende funktionelle enhed et polyamid. Aminosyrerne kan kobles under anvendelse af enhver egnet kemi til dannelse af amidbindinger. Fortrinsvis udføres koblingen af aminosyrebyggestenene under betingelser, der er kompatible med enzymatisk ligering af oligonukleotider for eksempel ved neutral eller nær-neutral pH og i vandig opløsning. I én udførelsesform syntetiseres polyamidforbindelsen fra den C-terminale til den N-terminale retning. I denne udførelsesform kobles den første, eller C-terminale, byggesten ved dens carboxylgruppe til et oligonukleotid via en egnet bindingsgruppe. Den første byggesten omsættes med den anden byggesten, der fortrinsvis har en aktiveret carboxylgruppe og en beskyttet aminogruppe. Enhver aktiverings-/beskyttelses-gruppestrategi, der er egnet til amidbindingsdannelse i opløsningsfase, kan anvendes. Egnede aktiverede carboxylarter omfatter for eksempel acyl-fluorider (US patent nr. 5,360,928), symmetriske anhydrider og N-hydroxysuccinimidesterer. Acetylgrupperne kan også aktiveres in situ, således som det er kendt inden for området, ved omsætning med en egnet aktiveringsforbindelse. Egnede aktiveringsforbindelser omfatter dicyclohexylcarbodiimid (DCC), diisopropylcarbodiimid (DIC), 1-ethoxycarbonyl-2-ethoxy-1,2-dihydroquinolin (EEDQ), 1 -ethyl-3-(3-dimethyl-aminopropyl)carbodiimidhydrochlorid (EDC), n-propan-phosphonsyre-anhydrid (PPA), N,N-bis(2-oxo-3-oxazolidinyl)imido-phosphorylchlorid (BOP-Cl), brom-tris-pyrrolidinphosphonium hexafluorphosphat (PyBrop), diphenyl- phosphorylazid (DPPA), Castro's reagens (BOP, PyBop), O-benzotriazolyl-Ν,Ν,Ν',Ν'-tetramethyluroniumsalte (HBTU), diethylphosphorylcyanid (DEPCN), 2,5-diphenyl-2,3-dihydro-3-oxo-4-hydroxy-thiophendioxid (Steglich's reagens; HOTDO),1,1'-carbonyl-diimidazol (CDI), og 4-(4,6-dimethoxy-1,3,5-triazin-2-yl)-4-methylmorpholiniumchlorid (DMT-MM). Koblingsreagenserne kan anvendes alene eller i kombination med additiver, såsom N.N-dimethyl-4-aminopyridin (DMAP), N-hydroxy-benzotriazol (HOBt), N-hydroxybenzotriazin (HOOBt), N-hydroxysuccinimid (HOSu) N-hydroxy-azabezotriazol (HOAt), azabenzotriazolyltetramethyluroniumsalte (HATU, HAPyU) eller 2-hydroxypyridin. I visse udførelsesformer kræver syntese af et bibliotek anvendelse af to eller flere aktiveringsstrategier for at muliggøre anvendelse af strukturelt forskellige sæt byggesten. En fagmand på området kan fastslå den for hver byggesten hensigtsmæssige aktiveringsstrategi. N-terminal beskyttelsesgruppen kan være enhver beskyttelsesgruppe, der er kompatibel med processens betingelser, for eksempel beskyttelsesgrupper, der er egnede til opløsningsfase syntesebetingelser. En foretrukket beskyttelsesgruppe er fluorenylmethoxycarbonyl- ("Fmoc") gruppen. Eventuelle potentielt reaktive funktionelle grupper på aminoacylbyggestenens sidekæde skal måske også beskyttes hensigtsmæssigt. Fortrinsvis er sidekædebeskyttelsesgruppen orthogonal til N-terminal-beskyttelsesgruppen, dvs., at sidekædebeskyttelsesgruppen fjernes under betingelser, der er forskellige fra dem, der kræves til fjernelse af N-terminal- beskyttelsesgruppen. Egnede sidekædebeskyttelsesgrupper omfatter nitroveratryl-gruppen, der kan anvendes til at beskytte både sidekædecarboxylgrupper og sidekædeaminogrupper. En anden egnet sidekædeaminbeskyttelsesgruppe er N-pent-4-enoyl-gruppen.

Byggestenene kan modificeres efter inkorporering i den funktionelle enhed for eksempel ved en egnet reaktion, der involverer en funktionel gruppe på én eller flere af byggestenene. Byggestensmodifikation kan finde sted efter tilsætning af den endelige byggesten eller på ethvert mellemliggende punkt i syntesen af den funktionelle enhed, for eksempel efter enhver cyklus i synteseprocessen. Når et bibliotek af bifunktionelle molekyler ifølge opfindelsen syntetiseres, kan der udføres byggestensmodifikation på hele biblioteket eller på en del af biblioteket, hvorved bibliotekets kompleksitetsgrad forøges. Egnede byggestensmodificerende reaktioner omfatter de reaktioner, der kan udføres under betingelser, der er kompatible med den funktionelle enhed og det kodende oligonukleotid. Eksempler på sådanne reaktioner omfatter acylering og sulfonering af aminogrupper eller hydroxyl-grupper, alkylering af aminogrupper, esterificering eller thioesterificering af carboxylgrupper, amidering af carboxylgrupper, epoxidering af alkener og andre reaktioner, som er kendte inden for området. Når den funktionelle enhed omfatter en byggesten med en funktionel alkyn- eller azidgruppe, kan azid-/alkyncycloadditionsreaktionen anvendes til at derivatisere byggestenen. For eksempel kan en byggesten omfattende en alkyn omsættes med et organisk azid, eller en byggesten omfattende et azid kan omsættes med en alkyn, hvor der i begge tilfælde dannes en triazol. Byggestensmodifikationsreaktioner kan finde sted efter tilsætning af den endelige byggesten eller på et mellemliggende punkt i synteseprocessen, og kan anvendes til at vedhæfte en række kemiske strukturer til den funktionelle enhed, herunder kulhydrater, metalbindende enheder og strukturer til målretning efter visse biomolekyler eller vævstyper. I en anden udførelsesform omfatter den funktionelle enhed en lineær serie byggesten, og denne lineære serie cykliseres under anvendelse af en egnet reaktion. Hvis mindst to byggesten i den lineære række for eksempel omfatter sulfhydrylgrupper, kan sulfhydrylgrupperne oxideres til dannelse af en disulfidbinding, hvorved den lineære række cykliseres. De funktionelle enheder kan for eksempel være oligopeptider, som omfatter to eller flere L-eller D-cystein- og/eller L- eller D-homocysteinenheder. Byggestenene kan også omfatte andre funktionelle grupper, der er i stand til at reagere sammen til cyklisering af den lineære række, såsom carboxylgrupper og amino- eller hydroxylgrupper. I en foretrukket udførelsesform omfatter én af byggestenene i den lineære række en alkyngruppe, og en anden byggesten i den lineære række omfatter en azidgruppe. Azid- og alkyngrupperne kan induceres til at reagere via cycloaddition, hvilket resulterer i dannelse af en makrocyklisk struktur. I det i Figur 9 illustrerede eksempel er den funktionelle enhed et polypeptid omfattende en propargylglycinbyggesten ved dens C-terminus og en azidoacetyl-gruppe ved dens N-terminus. Omsætning af alkyn- og azidgruppen under egnede betingelser resulterer i dannelse af en cyklisk forbindelse, der omfatter en triazolstruktur i makrocyklusen. Når det drejer sig om et bibliotek, omfatter hvert medlem af biblioteket i én udførelsesform alkyn- og azid-holdige byggesten og kan cykliseres på denne måde. I en anden udførelsesform omfatter alle medlemmer af biblioteket alkyn- og azidholdige byggesten, men kun en del af biblioteket cykliseres. I en tredje udførelsesform omfatter kun visse funktionelle enheder alkyn- og azidholdige byggesten, og kun disse molekyler cykliseres. I foregående anden og tredje udførelsesform vil biblioteket efter cycloadditionsreaktionen omfatte både cykliske og lineære funktionelle enheder. I visse udførelsesformer, hvor den samme funktionelle enhed, for eksempel triazin, tilsættes til hver og en af samtlige fraktionerne i biblioteket under et bestemt syntesetrin, kan det være unødvendigt at tilsætte en oligonukleotidtag, der koder for den funktionsenhed.

Oligonukleotider kan ligeres med kemiske eller enzymatiske metoder. I én udførelsesform ligeres oligonukleotider med kemiske midler. Kemisk ligering af DNA og RNA kan udføres under anvendelse af reagenser, såsom vandopløseligt carbodiimid og cyanogenbromid, som beskrevet for eksempel af Shabarova et al. (1991), Nucleic Acids Research, 19, 4247-4251), Federova, et al (1996), Nucleosides and Nucleotides, 15, 1137-1147, og Carriero og Damha (2003) Journal of Organic Chemistry, 68, 8328-8338. I én udførelsesform udføres der kemisk ligering under anvendelse af cyanogenbromid, 5 M i acetonitril, i et 1:10 v/v forhold med 5' phosphoryleret oligonukleotid i en pH 7,6 buffer (1 M MES + 20 mM MgCI2) ved 0 grader i 1 -5 minutter. I en anden udførelsesform ligeres oligonukleotiderne under anvendelse af enzymatiske metoder. I begge udførelsesformer kan oligonukleotiderne være dobbeltstrengede, fortrinsvis med et overhæng på fra ca. 5 til ca. 14 baser. Oligonukleotidet kan også være enkeltstrenget, i hvilket tilfilde der anvendes en splint med et overlap på ca. 6 baser med hver af de oligonukleotider, der skal ligeres, for at positionere de reaktive 5' og 3' enheder i nærhed af hinanden. I én udførelsesform bindes den initiale byggesten operativt til et initialt oligonukleotid. Før eller efter kobling af en anden byggesten til den initiale byggesten ligeres en anden oligonukleotidsekvens, der identificerer den anden byggesten, til det initiale oligonukleotid. Fremgangsmåder til ligering af den initiale oligonukleotidsekvens og den indkommende oligonukleotidsekvens er anført i Figur 1 og 2. I Figur 1 er det initiale oligonukleotid dobbeltstrenget, og én streng omfatter en udhængssekvens, der er komplementær til én ende af det andet oligonukleotid, og bringer det andet oligonukleotid i kontakt med det initiale oligonukleotid. Fortrinsvis er det initiale oligonukleotids udhængssekvens og det andet oligonukleotids komplementære sekvens begge mindst ca. 4 baser; mere foretrukket har begge sekvenser begge samme længde. Det initiale oligonukleotid og det andet oligonukleotid kan ligeres under anvendelse af et egnet enzym. Hvis det initiale oligonukleotid bindes til den første byggesten ved 5'-enden af en af strengene ("topstrengen"), så vil den streng, der er komplementær til topstrengen ("bundstrengen"), omfatte udhængssekvensen ved sin 5'-ende, og det andet oligonukleotid vil omfatte en komplementær sekvens ved sin 5'-ende. Efter ligering af det andet oligonukleotid kan der tilsættes en streng, der er komplementær til det andet ologonukleotids sekvens, som er 3' fra den komplementære udhængssekvens, og som omfatter yderligere udhængssekvens. I én udførelsesform er oligonukleotidet forlænget, som anført i Figur 2. Det oligonukleotid, der er bundet til den voksende funktionelle enhed, og det indkommende oligonukleotid positioneres til ligering ved anvendelse af en "splint"-sekvens, der omfatter et område, som er komplementært til det initiale oligonukleotids 3'-ende, og et område, som er komplementært til det indkommende oligonukleotids 5'-ende. Splinten bringer oligonukleotides 5'-ende i nærhed af det indkommende oligos 3'-ende, og der udføres ligering under anvendelse af enzymatisk ligering. I det i Figur 2 illustrerede eksempel består det initiale oligonukleotid af 16 nukleobaser, og splinten er komplementær til de 6 baser ved 3'-enden. Det indkommende oligonukleotid består af 12 nukleobaser, og splinten er komplementær til de 6 baser ved 5'-terminusen. Splintens længde og de komplementære områders længde er ikke kritisk. Men de komplementære områder bør være tilstrækkeligt lange til at muliggøre stabil dimerdannelse under ligeringsbetingelserne, men ikke så lange, at der opnås et alt for stort kodende nukleotid i de endelige molekyler. Det er foretrukket, at de komplementære områder har en længde på fra ca. 4 baser til ca. 12 baser, mere foretrukket fra ca. 5 baser til ca. 10 baser, og mest foretrukket fra ca. 5 baser til ca. 8 baser.

Split-og-foren metoderne, der anvendes til de heri anførte fremgangsmåder til bibliotekssyntese, sikrer, at hver unik funktionel enhed er operativt bundet til mindst én unik oligonukleotidsekvens, som identificerer den funktionelle enhed. Hvis der anvendes 2 eller flere forskellige oligonukleotidtags til mindst én byggesten i mindst én af syntesecykluserne, vil hver distinkt funktionel enhed, der omfatter den byggesten, kodes af multiple oligonukleotider. Hvis der for eksempel anvendes 2 oligonukleotidtags til hver byggesten under syntesen af et 4 cyklus bibliotek, vil der være 16 DNA sekvenser (24), der koder hver unik funktionel enhed. Der er adskillige potentielle fordele ved at kode hver unik funktionel enhed med multiple sekvenser. For det første sikrer udvælgelse af en anden kombination af tagsekvenser, der koder for den samme funktionelle enhed, at disse molekyler blev udvalgt uafhængigt. For det andet eliminerer udvælgelse af en anden kombination af tagsekvenser, der koder for den samme funktionelle enhed, den mulighed, at udvælgelsen var baseret på oligonukleotidets sekvens. For det tredje kan teknisk artefakt genkendes, hvis sekvensanalyse antyder, at en bestemt funktionel enhed er stærkt beriget, men der optræder kun én sekvenskombination ud af mange muligheder. Multipel tagging kan opnås ved at have uafhængige split-reaktioner med samme byggesten men en anden oligonukleotidtag. Alternativt kan der opnås multipel tagging ved at blande et passende forhold af hver tag i en enkelt taggingreaktion med en individuel byggesten. I én udførelsesform er det initiale oligonukleotid dobbeltstrenget, og de to strenge sammenføjes kovalent. Én måde til kovalent sammenføjning af de to strenge er vist i Figur 3, hvor der anvendes en bindingsenhed, for eksempel en linker, til at binde de to strenge og den funktionelle enhed. Bindingsenheden kan være enhver kemisk struktur, der omfatter en første funktionel gruppe, som er tilpasset til omsætning med en byggesten, en anden funktionel gruppe, som er tilpasset til omsætning med et oligonukleotids 3'-ende, og en tredje funktionel gruppe, som er tilpasset til omsætning med et oligonukleotids 5'-ende. Fortrinsvis orienteres den anden og tredje funktionelle gruppe således, at de to oligonukleotidstrenge positioneres i en relativ orientering, som tillader hybridisering af de to strenge. Bindingsenheden, for eksempel linkeren, kan for eksempel have den almene struktur (I):

(i) hvor A er en funktionel gruppe, der kan danne en kovalent binding med en byggesten, B er en funktionel gruppe, der kan danne en binding med et oligonukleotids 5'-ende, og C er en funktionel gruppe, der kan danne en binding med et oligonukleotids 3'-ende. D, F og E er kemiske grupper, der binder funktionelle grupper A, C og B til S, der er et kerneatom eller stillads. Fortrinsvis er D, E og F hver især uafhængigt en kæde atomer, såsom en alkylenkæde eller en oligo(ethylenglycol)-kæde, og D, E og F kan være ens eller forskellige og er fortrinsvis effektive til at tillade hybridisering af de to oligonukleotider og syntese af den funktionelle enhed. I én udførelsesform er den trivalente bindingsenhed en linker med strukturen

I denne udførelsesform er NH-gruppen til rådighed for fastknytning til en byggesten, mens de terminale phosphatgrupper er til rådighed for fastknytning til et oligonukleotid. I udførelsesformer, hvor det initiale oligonukleotid er dobbeltstrenget, er de indkommende oligonukleotider også dobbeltstrengede. Som vist i Figur 3, kan det initiale oligonukleotid have én streng, der er længere end den anden, hvorved der tilvejebringes en udhængssekvens. I denne udførelsesform omfatter det indkommende oligonukleotid en udhængssekvens, der er komplementær til det initiale oligonukleotids udhængssekvens. Hybridisering af de to komplementære udhængssekvenser bringer det indkommende oligonukleotid i position til ligering til det initiale oligonukleotid. Denne ligering kan udføres enzymatisk under anvendelse af en DNA- eller RNA-ligase. Det indkommende oligonukleotids og det initiale oligonukleotids udhængssekvenser har fortrinsvis samme længde og består af to eller flere nukleotider, fortrinsvis fra 2 til ca. 10 nukleotider, mere foretrukket fra 2 til ca. 6 nukleotider. I én foretrukket udførelsesform er det indkommende oligonukleotid et dobbeltstrenget oligonukleotid med en udhængssekvens i hver ende. Udhængssekvensen ved den ene ende er komplementær til det initiale oligonukleotids udhængssekvens, mens udhængssekvensen ved den anden ende efter ligering af det indkommende oligonukleotid og det initiale oligonukleotid bliver udhængssekvens hos initialt oligonukleotid i næste cyklus. I én udførelsesform har de tre udhængssekvenser alle en længde på 2-6 nukleotider, og det indkommende oligonukleotids kodningssekvens har en længde på fra 3 til 10 nukleotider, fortrinsvis 3 til 6 nukleotider. I en særlig udførelsesform har udhægssekvenserne alle en længde på 2 nukleotider, og kodningssekvensen har en længde på 5 nukleotider. I den i Figur 4 viste udførelsesform har den indkommende streng et område ved dens 3'-ende, der er komplementært til det initiale oligonukleotids 3'-ende, hvilket efterlader udhæng ved 5'-enden af begge strenge. 5'-enderne kan for eksempel fyldes under anvendelse af en DNA-polymerase, såsom vent-polymerase, hvilket resulterer i et dobbeltstrenget forlænget oligonukleotid. Dette oligonukleotids bundstreng kan fjernes, og yderligere sekvens kan tilsættes ved topstrengens 3'-ende under anvendelse af sammen fremgangsmåde.

Den kodende oligonukleotid-tag dannes som resultat af den successive tilsætning af oligonukleotider, der identificerer hver successiv byggesten. I én udførelsesform for fremgangsmåderne kan de successive oligonukleotid-tags kobles ved enzymatisk ligering til fremstilling af et kodende oligonukleotid.

Enzym-katalyseret ligering af oligonukleotider kan udføres under anvendelse af ethvert enzym, der har evnen til at ligere nukleinsyrefragmenter. Som eksempler på enzymer kan nævnes ligaser, polymeraser og topoisomeraser. I specifikke udførelsesformer anvendes DNA-ligase (EC 6.5.1.1), DNA-polymerase (EC 2.7.7.7), RNA-polymerase (EC 2,7,7,6) eller topoisomerase (EC 5.99.1.2.) til at ligere oligonukleotiderne. Enzymer, der er indeholdt i hver EC-klasse, kan for eksempel findes som beskrevet i Bairoch (2000) Nucleic Acids Research 28:304-5. I en foretrukket udførelsesform er de i fremgangsmåderne anvendte oligonukleotider oligodeoxynukleotider, og det enzym, der anvendes til at katalysere oligonukleotidligeringen, er DNA-ligase. For at der kan ske ligering i nærvær af ligasen, dvs. for, at der kan dannes en phosphodiesterbinding mellem to oligonukleotider, skal ét oligonukleotid have en fri 5' phosphatgruppe, og det andet oligonukleotid skal have en fri 3' hydroxyl-gruppe. Eksempler på DNA-ligaser, der kan anvendes i fremgangsmåderne, omfatter T4 DNA-ligase, Taq DNA-ligase, T4 RNA-ligase, DNA-ligase (E. coli) (der alle kan skaffes for eksempel fra New England Biolabs, MA).

En fagmand på området vil forstå, at hver enzym, der anvendes til ligering, har optimal aktivitet under specifikke betingelser, for eksempel temperatur, bufferkoncentration, pH og tid. Hver af disse betingelser kan justeres for eksempel i henhold til producentens instruktioner for at opnå optimal ligering af oligonukleotid-tags'ene.

Det indkommende oligonukleotid kan have enhver ønsket længde, men har fortrinsvis en længde på mindst tre nukleobaser. Mere foretrukket har det indkommende oligonukleotid en længde på 4 eller flere nukleobaser. I én udførelsesform har det indkommende oligonukleotid en længde på fra 3 til ca. 12 nukleobaser. Det foretrækkes, at oligonukleotiderne i molekylerne i bibliotekerne ifølge opfindelsen har en fælles terminalsekvens, der kan tjene som en primer for PCR, således som det er kendt inden for området. En sådan fælles terminalsekvens kan inkorporeres som terminal-enden af det i den sidste cyklus i bibliotekssyntesen tilsatte indkommende oligonukleotid, eller den kan tilsættes efter bibliotekssyntese for eksempel under anvendelse af de heri beskrevne enzymatiske ligeringsmetoder.

En foretrukket udførelsesform for fremgangsmåden er anført i Figur 5. Processen begynder med en syntetiseret DNA-sekvens, der ved dens 5'-ende er fastknyttet til en linker, som terminerer i en aminogruppe. I trin 1 ligeres denne DNA-udgangssekvens til en indkommende DNA-sekvens i nærvær af en DNA-splintstreng, DNA-ligase og dithiothreitol i Tris-buffer.

Dette giver en tagged DNA-sekvens, der så kan anvendes direkte i næste trin eller oprenses for eksempel under anvendelse af HPLC eller ethanoludfældning, inden man går videre til næste trin. I trin 2 omsættes den taggede DNA med en beskyttet aktiveret aminosyre, i dette eksempel et Fmoc-beskyttet aminosyrefluorid, hvilket giver et beskyttet aminosyre-DNA-konjugat. I trin 3 afbeskyttes det beskyttede aminosyre-DNA-konjugat for eksempel i nærvær af piperidin, og det resulterende afbeskyttede konjugat oprenses eventuelt, for eksempel med HPLC eller ethanoludfældning. Det afbeskyttede konjugat er produktet i den første syntesecyklus, og bliver udgangsmaterialet for den anden cyklus, hvilket tilfører en anden aminosyre-rest til det afbeskyttede konjugats frie aminogruppe. I udførelsesformer, hvor der skal anvendes PCR til amplificering og/eller sekventering af udvalgte molekylers kodende oligonukleotider, kan de kodende oligonukleotider for eksempel omfatte PCR-primersekvenser og/eller sekventeringsprimere (for eksempel primere såsom for eksempel 3'-GACTACCGCGCTCCCTCCG-5' og 3'-GACTCGCCCGACCGTTCCG-5'). En PCR-primersekvens kan for eksempel inkluderes i det initiale oligonukleotid inden den første syntesecyklus, og/eller den kan inkluderes med det første indkommende oligonukleotid, og/eller den kan ligeres til det kodende oligonukleotid efter den sidste cyklus i bibliotekssyntese, og/eller den kan inkluderes i det indkommende oligonukleotid i den sidste cyklus. De PCR-primersekvenser, der tilsættes efter den sidste cyklus i bibliotekssyntese og/eller i det indkommende oligonukleotid i den sidste cylkus, benævnes heri "cappingsekvenser". I én udførelsesform er PCR-primersekvensen designet ind i den kodende oligonukleotidtag. For eksempel kan en PCR-primersekvens inkorporeres i den initiale oligonukleotiddtag, og/eller den kan inkorporeres i den endelige oligonukleotidtag. I én udførelsesform inkorporeres den samme PCR-primersekvens i den initiale og endelige oligonukleotidtag. I en anden udførelsesform inkorporeres en første PCR-primersekvens i den initiale oligonukleotidtag, og en anden PCR-primersekvens inkorporeres i den endelige oligonukleotidtag. Alternativt kan en anden PCR-primersekvens inkorporeres i cappingsekvensen, som beskrevet heri. I foretrukne udførelsesformer har PCR-primersekvensen en længde på mindst ca. 5, 7,10,13,15,17, 20 22 eller 25 nukleotider. PCR-primersekvenser, der er egnede til brug i bibliotekerne ifølge opfindelsen, er kendte inden for området; egnede primerer og fremgangsmåder er for eksempel anført i Innis et al., eds, PCR Protocols: A Guide to Methods and Applications, San Diego; Academic Press (1990). Andre egnede primere til anvendelse ved konstruktion af de heri beskrevne biblioteker, er de primere, der er beskrevet i PCT skrifterne WO 2004/069849 og WO 2005/003375. Således som det anvendes heri ved henvisning til primere, probér og nukleinsyrefragmenter eller segmenter, der skal syntetiseres ved primerekstension, defineres udtrykket "polynukleotid" som et molekyle bestående af to eller flere deoxyribonukleotider, fortrinsvis flere end tre. Således som det anvendes heri refererer udtrykket "primer" til et polynukleotid, hvad enten det er oprenset fra et restriktionsfordøjet nukleinsyreprodukt eller fremstillet syntetisk, som er i stand til at virke som initieringspunkt for nukleinsyresyntese, når det anbringes under betingelser, hvor syntese af et primerekstionsprodukt, som er komplementært til en nukleinsyrestreng, induceres, dvs. i nærvær af nukleotider og et middel til polymerisation, såsom DNA-poymerase, omvendt transkriptase og lignende, og ved passende temperatur og pH. Primeren er fortrinsvis enkeltstrenget af hensyn til maksimal effektivitet, men kan alternativt være i dobbeltstrenget form. Hvis den er dobbeltstrenget, behandles primeren først for at adskille den fra dens komplementære streng, inden den anvendes til fremstilling af ekstentionsprodukter. Primeren er fortrinsvis et polydeoxyribonukleotid. Primeren skal være tilstrækkelig lang til at prime syntesen af ekstensionsprodukter i nærvær af midlerne til polymerisation. Primerenes eksakte længde vil afhænge af mange faktorer, herunder temperatur og primerkilden.

De heri anvendte primere vælges således, at de er "i det væsentlige" komplementære til de forskellige strenge i hver specifik sekvens, der skal amplificeres. Dette betyder, at primeren skal være tilstrækkelig komplementær til, at den på ikke-tilfældig måde hydbidiserer med dens respektive skabelonstreng. Primersekvensen kan derfor afspejle eller ikke afspejle skabelonens eksakte sekvens.

Polynukleotidprimerene kan fremstilles under anvendelse af enhver egnet metode, såsom for eksempel phosphotriester- eller phosphodiester-metoderne, der er beskrevet i Narang et al., (1979) Meth. Enzymol., 68:90; US patent nr. 4,356,270, US patent nr. 4,458,066, US patent nr. 4,416,988, US patent nr. 4,293,652; og Brown et al., (1979) Meth. Enzymol., 68:109. I tilfælde, hvor PCR-primersekvenserne er inkluderet i et indkommende oligonukleotid, vil disse indkommende oligonukleotider fortrinsvis være signifikant længere end de indkommende oligonukleeotider tilsat i de andre cykluser, fordi de vil inkludere både en kodende sekvens og en PCR-primersekvens. I én udførelsesform tilsættes cappingsekvensen efter tilsætning af den sidste byggesten og det sidste indkommende oligonukleotid, og syntesen af et bibliotek som anført heri omfatter trinnet med ligering af cappingsekvensen til det kodende oligonukleotid, således at oligonukleotiddelen af i hovedsagen alle biblioteksmedlemmerne ender i en sekvens, der omfatter en PCR-primersekvens. Fortrinsvis tilsættes cappingsekvensen ved ligering til de forenede fraktioner, som er produkter fra den sidste syntesecyklus. Cappingsekvensen kan tilsættes under anvendelse af den ved konstruktionen af biblioteket anvendte enzymatiske proces. I én udførelsesform ligeres den samme cappingsekvens til hvert medlem af biblioteket. I en anden udeførelsesform anvendes en flerhed af capping-sekvenser. I denne udførelsesform ligeres oligonukleotidcappingsekvenserne indeholdende variable baser for eksempel til biblioteksmedlemmer efter den sidste syntesecyklus. I én udførelsesform forenes fraktionerne efter det sidste syntesecyklus, og opsplittes derefter igen i fraktioner, hvor hver fraktion har en forskellig tilsat cappingsekvens. Alternativt kan der tilsættes multiple cappingsekvenser til det forenede bibliotek efter den sidste syntesecyklus. I begge udførelsesformer vil medlemmerne af det endelige bibliotek indbefatte molekyler, der omfatter specifikke funktionelle enheder linket til identificerende oligonukleotider, der omfatter to eller flere forskellige cappingsekvenser. I én udførelsesform omfatter cappingprimeren en oligonukleotidsekvens, der indeholder variable, dvs. degenererede, nukleotider. Sådanne degenererede baser i cappingprimerene tillader identifikation af interessante biblioteksmolekyler ved bestemmelse af, hvorvidt en kombination af bygesten er konsekvensen af PCR-duplikering (identisk sekvens) eller uafhængige forekomster af molekylet (forskellig sekvens). Sådanne degenererede baser kan for eksempel reducere det potentielle antal faske positive, der identificeres under den biologiske screeening af det kodede bibliotek. I én udførelsesform omfatter eller har en degenereret cappingprimer følgende sekvens:

hvor N kan være enhver af de 4 baser, hvilket tillader 1024 forskellige sekvenser (45).

Primeren har følgende sekvens efter dens ligering til biblioteket og primerekstension: S '-CAGCGTTCGÅ 3'“AA GTCGCAAØCT N N N N N GT<irGTrOGAAGTØØACG-5' I en anden udførelsesform omfatter eller har cappingprimeren følgende sekvens:

hvor B kan være enhver af C, G eller T, hvilket tillader 19.683 forskellige sekvenser (39)

Designet af det degenererede område i denne primer forbedrer DNA-sekvensanalyse, da A-baserne, der flankerer og punktuerer de degenererede B-baser, forhindrer homopolymere strækninger på over 3 baser og letter sekvensalignment. I én udførelsesform ligeres det degenererede cappingoligonukleotid til medlemmerne af biblioteket under anvendelse af et egnet enzym, og det degenererede cappingoligonukleotids øverste streng polymeriseres efterfølgende under anvendelse af et egnet enzym, såsom en DNA polymerase. I en anden udførelsesform er PCR primingsekvensen en "universal adaptor" eller "universal primer". Således som den anvendes heri er en "universal adaptor" eller "universal primer" et oligonukleotid, der indeholder et unikt PCR-primende område, der for eksempel haren længde på 5, 7,10,13,15, 17, 20, 22 eller 25 nukleotider, og er lokaliseret stødende op til et unikt sekventerings primerområde, der for eksempel har en længde på ca. 5, 7, 10,13,15,17, 20, 22 eller 25 nukleotider, og eventuelt efterfølges af en unik diskriminerende nøglesekvens (eller prøveidentifikatorsekvens) bestående af mindst én af hver af de fire deoxyribonukleotider (dvs. A, C, G, T). Således som det anvendes heri henviser udtrykket "diskriminerende nøglesekvens" eller "prøveidentifikatorsekvens" til en sekvens, der kan anvendes til på unik måde at tagge en population molekyler fra en prøve. Multiple prøver, der hver indeholder en unik prøveidentifikatorsekvens, kan blandes, sekventeres og gensorteres efter DNA-sekventering til analyse af individuelle prøver. Den samme diskriminerende sekvens kan anvendes til et helt bibliotek, eller alternativt kan der anvendes forskellige diskriminerende nøglesekvenser til at spore forskellige biblioteker. I én udførelsesform er den diskriminerende nøglesekvens på enten 5'-PCR-primeren, 3'-PCR-primeren, eller på begge primere. Hvis begge PCR-primere indeholder en prøveidentifikatorsekvens, er antallet af forskellige prøver, som kan forenes med unikke prøveidentifikatorsekvenser, produktet af antallet af prøveidentifikator-sekvenser på hver primer. 10 forskellige 5'-prøveindikatorsekvensprimere kan således kombineres med 10 forskellige 3'-prøveindikatorsekvensprimere til opnåelse af 100 forskellige kombinationer af prøveidentifikatorsekvenser.

Ikke-begrænsende eksempler på unikke 5'-og 3'-PCR-primere indeholdende diskriminerende nøgleskevenser omfatter følgende 5'-primere (variable positioner med fed og kursiv skrift): og 55 A - GCCTTGCCAGCCCGCTCA04TGACTCCCAAATCGATGTG; 5’ C-GCCTTGCCAGCCCGCTCAGCTGACTCCCAAATCGATGTG; 5’ G - GCCTTGCCAGCCCGCTCAGGTGACTCCCAAATCGATGTG; 5’ T - GCCTTGCCAGCCCGCTCAGJTGACTCCCAAATCGATGTG; 5’ AA - GCCTTGCCAGCCCGCTCAGÆ4TGACTCCCAAATCGATGTG; 5’ AC - GCCTTGCCAGCCCGCTCAG^CTGACTCCCAAATCGATGTG; 5’ AG - GCCTTGCCAGCCCGCTCAGL4GTGACTCCCAAATCGATGTG; 5’ AT - GCCTTGCCAGCCCGCTCAG4TTGACTCCCAAATCGATGTG; og 5’ CA- GCCTTGCCAGCCCGCTCAGC4TGACTCCCAAATCGATGTG. 3' SID-primere (variable stillinger med fed og kursiv skrift): 3Ά-GCCTCCCT CGCGCC ATC AG4 GCAGGTGA AGCTTGTCT G; 3’ C - GCCTCCCTCGCGCCATCAGCGCAGGTGAAGCTTGTCTG; 3’ G~ GCCTCCCTCGCGCCATCAGGGCAGGTGAAGCTTGTCTG; 3’ T ~ GCCTCCCTCGCGCCATCAGrGCAGGTGAAGCTTGTCTG; 3’ AA---GCCTCCCTCGCGCCATCAGA4GCAGGTGAAGCTTGTCTG; 3* AC - GGCTCCCTCGCGCCATCAGACGCAGGTGAAGCTTGTCTG; 31 AG - GCCTCCCTCGCGCCATCAGAGGCAGGTGAAGCTTGTCTG; 35 AT - GCGTCCCTCGCGCCATCAG^ JGCAGGTGAAGCTTGTCTG; og

3’ CA- GCCTCCCTCGCGCCATCAGCAGCAGGTGAAGCTTGTCTG I én udførelsesform har den diskriminerende nøglesekvens en længde på ca. 4, 5, 6, 7, 8, 9 eller 10 nukleotider. I en anden udførelsesform er den diskriminerende nøglesekvens en kombination af ca. 1-4 nukleotider. I endnu en anden udførelsesform har hver universal adaptor en længde på ca. firreogfyrre nukleotider. I én udførelsesform ligeres de universale adaptorer uner anvendelse af T4 DNA ligase til enden af det kodende oligonukleotid. Forskellige universale adaptorer kan designes specifikt til hver biblioteksfremstilling og vil derfor tilvejebringe en unik identifikator til hvert bibliotek. De universale adaptorers størrelse og sekvens kan modificeres, som en fagmand på området måtte finde det nødvendigt.

Som anført ovenfor kan oligonukleotid-tag'ens nukleotidsekvens som del af fremgangsmåderne bestemmes under anvendelse af polymerasekædereaktionen (PCR).

Oligonukleotid-tag'en består af polynukleotider, der identificerer de byggesten, som udgør den funktionelle enhed som beskrevet heri. Oligonucleotid-tag'ens nukleinsyresekvens bestemmes ved at underkaste oligonukleotid-tag'en en PCR-reaktion som følger. Den egmede prøve bringes i kontakt med et PCR-primerpar, hvor hvert medlem af parret har en forudvalgt nukleotidsekvens. PCR-primerparret er i stand til at initiere primerekstensionsreaktioner ved hybridisering til et PCR-primerbindingssted på den kodende oligonukleotid-tag. PCR-primerbindingsstedet er fortrinsvis designet i den kodende oligonukleotid-tag. For eksempel kan et PCR-primerbindingssted være inkorporeret i den initiale oligonukleotid-tag, og det andet PCR-primerbindingssted kan være i den endelige oligonukleotid-tag. Alternativt kan det andet PCR-primerbindingssted være inkorporeret i cappingsekvensen som beskrevet heri. I foretrukne udførelsesformer har PCR-primerbindingsstedet en længde på mindst ca. 5, 7, 10, 13, 15, 17, 20, 22 eller 25 nukleotider. PCR-reaktionen udføres ved at blande PCR-primerparret, fortrinsvis en forudbestemt mængde deraf, med den kodende oligonukleotid-tag's nukleinsyrer, fortrinsvis en forudbestemt mængde deraf, i en PCR-buffer til dannelse af en PCR-reaktionstilblanding. Tilblandingen termocykles i et antal cykluser, der typisk er forudbestemt, som er tilstrækkeligt til dannelse af et PCR-reaktionsprodukt. En tilstrækkelig mængde produkt er en mængde, der kan isoleres i tilstrækkelig mængde til at tillade DNA-sekvensbestemmelse. PCR udføres typisk ved termocirkulation, dvs. ved gentagende gange at hæve og sænke en PCR-reaktionstilblandings temperatur i et temperaturinterval, hvis nedre grænse er fra ca. 30 °C til ca. 55 °C, og hvis øvre grænse er fra ca. 90 °C til ca. 100 °C. Denne hæven og sænken kan være kontinuerlig men er fortrinsvis i fase med tidsperioder med relativ temperaturstabilitet ved hver temperatur, der begunstiger polynukleotidsyntese, denaturering og hybridisering. PCR-reaktionen udføres under anvendelse af enhver egnet metode. Generelt finder den sted i bufret vandig opløsning, dvs. en PCR-buffer, fortrinsvis ved pH på 7-9. Fortrinsvis er der et molært overskud af primeren til stede. Et stort molært overskud foretrækkes for at forbedre processens effektivitet. PCR-bufferen indeholder også deoxyribonukleotidtriphosphaterne (polynukleotidsyntesesubstrater) dATP, dCTP, dGTP og dTTP og en polymerase, typisk termostabil, alle i adækvate mængder til primerekstensions- (polynukleotidsyntese) reaktion. Den resulterende opløsning (PCR-tilblanding) opvarmes til ca. 90 °C-100 °C i fra ca. 1 til 10 minutter, fortrinsvis fra 1 til 4 minutter. Efter denne opvarmningsperiode får opløsningen lov til at køle af til 54 °C, hvilket er foretrukket til primer-hybridisering. Syntesereaktionen kan finde sted ved en temperatur i intervallet fra rumtemperatur op til en temperatur, over hvilken polymerasen (induceringsmiddel) ikke længere fungerer effektivt. Hvis der således for eksempel anvendes DNA-polymerase, er temperaturen generelt ikke højere end ca. 40 °C. Termocirkulationen gentages, indtil den ønskede mængde PCR-produkt er produceret. Et eksempel på en PCR-buffer omfatter følgende reagenser: 50 mM KCI; 10 mM Tris-HCI ved pH 8,3; 1,5 mM MgCl.sub.2; 0,001 % (vægt/vol.) gelatine, 200 μΜ dATP; 200 μΜ dTTP; 200 μΜ dCTP; 200 μΜ dGTP; og 2,5 enheder Thermus aquaticus (Taq) DNA-polymerase I per 100 mikroliter buffer.

Egnede enzymer til forlængning af primersekvenserne omfatter for eksempel E. coli DNA-polymerase I, Taq DNA-polymerase, Klenow fragment af E. coli DNA-polymerase I, T4 DNA-polymerase, andre tilgængelige DNA- polymeraser, omvendt transkriptase, og andre enzymer, herunder varmestabile enzymer, hvilket vil lette kombination af nukleotiderne på den rette måde til dannelse af primerekstensionsprodukter, som er komplementære til hver nukleinsyrestreng. Generelt vil syntesen blive initieret ved hver primers 3'-ende og fortsætte i 5'-retningen langs templatestrengen, indtil syntesen standser, hvorved der produceres molekyler med forskellige længder.

Den nysyntetiserede DNA-streng og dens komplementære streng danner et dobbeltstrenget molekyle, der kan anvendes i de efterfølgende trin i analyseprocessen. PCR-amplifikationsmetoder er beskrevet detaljeret i US patent nr. 4,683,192, 4,683,202, 4,800,159 og 4,965,188, og til sidst i PCR Technology: Principles and Applications for DNA Amplification, H. Erlich, ed., Stockton Press, New York (1989); og PCR Protecols: A Guide to Metods and Applications, Innis et al., eds. Academic Press, San Diego, Calif. (1990 Når den kodende oligonukleotid-tag først er blevet amplificeret, kan tag'ens sekvens, og ultimativt det valgte molekyles sammensætning, bestemmes under anvendelse af nukleinsyresekvensanalyse, en velkendt procedure til bestemmelse af nukleotidsekvensers sekvens. Nukleinsyresekvensanalyse går man til ved en kombination af (a) fysisk kemiske teknikker, baseret på hybridisering eller denatuering af en probestreng samt dens komplementære target, og (b) enzymatiske reaktioner med polymeraser.

Opfindelsen angår endvidere de forbindelser, der kan fremstilles under anvendelse af fremgangsmåderne, og samlinger af sådanne forbindelser enten som isolerede arter eller forenet til dannelse af et bibliotek af kemiske strukturer. Forbindelser ifølge opfindelsen omfatter forbindelser med formlen

hvor X er en funktionel enhed omfattende én eller flere byggesten, Z er et oligonukleotid, der ved dets 3'-terminus er fastknyttet til B, og Y er et oligonukleotid, der ved dets 5'-terminus er fastknyttet til C. A er en funktionel amino-gruppe, der danner en kovalent binding med X, B er en funktionel phosphat-gruppe, der danner en binding med 3'-enden af Z, og C er en funktionel phosphat-gruppe, der danner en binding med 5'-enden af Y. D, F og E er kemiske grupper, som binder funktionelle grupper, A, C og B til S, der er et molekylært stillads. D er en alkylenkæde, og E og F er en oligo(ethylenglycol)-kæde og er fortrinsvis effektive til at tillade hybridisering af de to oligonukleotider og syntese af den funktionelle enhed.

Fortrinsvis er Y og Z i det væsentlige komplementære og er orienteret i forbindelsen på en sådan måde, at Watson-Crick baseparring og duplex-dannelse muliggøres under egnede betingelser. Y og Z har samme længde eller forskellig længde. Fortrinsvis har Y og Z sammen længde, eller én af Y og Z er fra 1 til 10 baser længere end den anden. I en foretrukket udførelsesform har Y og Z hver en længde på 10 eller flere baser og har komplementære områder på 10 eller flere basepar. Mere foretrukket er Y og Z i det væsentlige komplementære gennem hele deres længde, dvs. de har højst én fejlparring per hver ti basepar. Mest foretrukket er Y og Z komplementære gennem hele deres længde, dvs. bortset for et eventuelt overhængsområde på Y eller Z hybridiserer strengene via Watson-Crick baseparring uden nogen fejlparringer gennem hele deres længde. S er et molekylært stillads. For eksempel kan S være et kulstofatom, et boratom, et nitrogenatom eller et phosphoratom, eller et polyatomstillads, såsom en phosphatgruppe eller en cyklisk gruppe, såsom en cycloalkyl-, cycloalkenyl-, heterocycloalkyl-, heterocycloalkenyl-, aryl- eller heteroarylgruppe. Linkeren er en gruppe med strukturen r

hvor hver af n, m og p uafhængigt er et helt tal fra 1 til 20, fortrinsvis fra 2 til otte, og mere foretrukket fra 3 til 6.1 én bestemt udførelsesform har linkeren den herunder viste struktur.

I én udførelsesform omfatter bibliotekerne ifølge opfindelsen molekyler, der består af en funktionel enhed sammensat af byggesten, hvor hver funktionel enhed er operativt bundet til et kodende oligonukleotid. Det kodende oligonukleotids nukleotidsekvens er indikativ for de byggesten, der er til stede i den funktionelle enhed, og i visse udførelsesformer for byggestenenes konnektivitet eller arrangement. Her tilvejebringes den fordel, at den metodik, der anvendes til at konstruere den funktionelle enhed og den, der anvendes til at konstruere oligonukleotid-tag'en, kan udføres i samme reaktionsmedium, fortrinsvis et vandigt medium, hvorved fremgangsmåden til fremstilling af biblioteket simplificeres i sammenligning med til den kendte teknik hørende fremgangsmåder. I visse udførelsesformer, hvor oligonukleotidligeringstrinnet og byggestenadditionstrinnet begge kan udføres i vandigt medium, vil hver reaktion have forskelligt pH optimum. I disse udførelsesformer kan byggestensadditionsreaktionen udføres ved en egnet pH og temperatur i en egnet vandig buffer. Bufferen kan derefter udskiftes med en vandig buffer, der tilvejebringer en egnet pH til oligonukleotidligering.

I en anden udførelsesform tilvejebringes forbindelser og biblioteker omfattende sådanne forbindelser med Formel II

(Π) hvor X er et molekylært stillads, hver Y uafhængigt er en perifær enhed, og n er et helt tal fra 1 til 6. Hver A uafhængigt er en byggesten, og n er et helt tal fra 0 til ca. 5. L er en bindingsenhed, og Z er et enkeltstrenget eller dobbeltstrenget oligonukleotid, der identificerer strukturen -At-X(Y)n). Strukturen X(Y)n kan for eksempel være en af de i tabel 8 anførte stilladsstrukturer (se nedenfor). I én udførelsesform tilvejebringes forbindelser og biblioteker omfattende sådanne forbindelser med Formel III:

m hvor t er et helt tal fra 0 til ca. 5, fortrinsvis fra 0 til 3, og hver A uafhængigt er en byggesten. L er en bindingsenhed, og Z er et enkeltstrenget eller dobbeltstrenget oligonukleotid, der identificerere hver A, og Ri, R2, R3 og R4. Ri, R2, R3 og R4 er hver uafhængigt en substitutet valgt blandt hydrogen, alkyl, substitueret alkyl, heteroalkyl, substitueret heteroalkyl, cycloalkyl, hetero-cycloalkyl, substitueret cycloalkyl, substitueret hererocycloalkyl, aryl, substitueret aryl, arylalkyl, heteroarylalkyl, substitueret arylalkyl, substitueret heteroarylalkyl, heteroaryl, substitueret heteroaryl, alkoxy, aryloxy, amino og substitueret amino. I én udførelsesform er hver A en aminosyrerest.

Biblioteker, der omfatter forbindelser med Formel II eller Formel III, kan omfatte mindst ca. 100; 1000; 10 000; 100 000; 1 000 000 eller 10 0000 000 forbindelser med Formel II eller Formel III. I én udførelsesform fremstilles biblioteket via en metode, der er designet til at fremstille et bibliotek omfattende mindst ca. 100; 1000; 10 000; 100 000; 1 000 000 eller 10 000 000 forbindelser med Formel II eller Formel III.

Tabel 8

Stilladser Amin Aldehyd/keton Carboxylsyre Andet Reference

Carranco, I., et al. (2005) J. Comb. Chem. 7:33-41

Rosamilia, A.E., et al. benzaldehydes and (2005)

ammes ~ , X lur fural Organ ic

Letters 7:1525-1528

Syeda Huma, H.Z., et al. (2002) Tet Lett 43:6485-6488

Tempest, P., et al. (2001) Tet Lett 42:4959-4962

Paaivsnnan, K. (1999) Tet Lett 40:1851-1854

Tempest, P,, et al. (2001) Tet Lett 42:4963-4968

Tempest, P,, et al (2003) Tet Lett 44:19474950

Nefki. A., et al. (1999) Tet Lett 40:4939-4942

Bose, Å.K.. et al. (2005) Tet Lett 46:1901-1903

Stadier, A. and Kappe, C.O.(200i)J. Comb. Chem. 3:624-630; Lengar, A. and Kappe, C.O. (2004) Organic Letters 6:771-774

Ivaehtebenko, A.V., &tal, (2003) l Comb. Chem, 5:775-788

Micheli, F.} et al. (2001) J. Comb.

Chem.3:224- 228

Stemson, S.M., βί al. (2001) Org. Leti. 3:4239-4242

Cheng, W.-C., et al. (2002)3. Org.Chem. 67:5673-5677; Park, et al. (2001) J Conib Cheni 3:171-176

Brown, B J,, et al. (2000) Syntett 1:131-133

Kilbum, J.P., et al. (2001) TetLett 42:2583-2586

amino acid ester carboxylic acids

del Fresno, M., et al. (1998) Tet Lett 39:2639-2642 Alvarez-Gutierrez, J.M., et al. (2000) Tet Lett 41:609-612 Rinnovå, M., et al. (2002) J. Comb.Chem 4:209-213

Makara, G.M., et al. (2002) Orgarsic Lett 4:1751-1754

Schejl, P., et al. (2005) J. Comb. Cfaem 7:95-98

Feliu, L·, et al. (2003) J. Comb. Chsm 5:356-361

Amines Aidehydes

Hiroshige, M,, et al. . , (1995) J. Am. amin0aClds Chem.Soc. 117:11590- 11591

Bose, A.K., et al. (2005) Tet amlnoao,ds Lett 46:1901- 1903 Én fordel ved fremgangsmåderne er, at de kan anvendes til at fremstille biblioteker omfattende uhyre antal forbindelser. Evnen til at amplificere kodende oligonukleotidsekvenser under anvendelse af kendte metoder, såsom polymerasekædereaktion ("PCR"), betyder, at udvalgte molekyler kan identificeres, selv hvis der genvindes forholdsvis få kopier. Dette muliggør praktisk anvendelse af meget store biblioteker, der som følge af deres høje kompleksitetsgrad, enten omfatter forholdsvis få kopier af ethvert givent biblioteksmedlem eller kræver anvendelse af meget store volumener. For eksempel kræver et bibliotek bestående af 108 unikke strukturer, hvor hver struktur har 1 x 1012 kopier (ca. 1 pikomol), ca. 100 L opløsning i 1 μΜ effektiv koncentration. Hvis hvert medlem er repræsenteret ved 1 000 000 kopier, er det krævede volumen til samme bibliotek 100 μΙ_ i 1 μΜ effektiv koncentration. I en foretrukket udførelsesform omfatter biblioteket fra ca. 103 til ca. 1015 kopier af hvert biblioteksmedlem. Forudsat at der er forskelle i synteseeffektivitet blandt biblioteksmedlemmerne, er det muligt, at forskellige biblioteksmedlemmer vil have forskellige antal kopier i ethvert givent bibliotek. Selvom antallet af kopier af hvert medlem, der teoretisk er til stede i biblioteket, kan være det samme, er det faktiske antal kopier af et givent biblioteksmedlem derfor uafhængigt af antallet af kopier af ethvert andet medlem. Mere foretrukket omfatter forbindelsesbibliotekerne ifølge opfindelsen mindst ca. 105, 106 eller 107 kopier af hvert biblioteksmedlem eller af i det væsentlige alle biblioteksmedlemmer. Med "i det væsentlige alle" biblioteksmedlemmer menes mindst ca. 85 % af medlemmerne af biblioteket, fortrinsvis mindst ca. 90 %, og mere foretrukket mindst ca. 95 % af medlemmerne af biblioteket.

Fortrinsvis omfatter biblioteket et tilstrækkeligt antal kopier af hvert medlem til, at der kan udføres multiple (dvs. to eller flere) selektionsrunder mod et biologisk target, idet der er tilstrækkelige mængder bindingsmolekyler tilbage efter den sidste selektionsrunde til at muliggøre amplifikation af de tilbageværende molekylers oligonukleotid-tags og derfor identifikation af bindingsmolekylernes funktionelle enheder. En skematisk gengivelse af en sådan selektionsproces er illustreret i Figur 6, hvori 1 og 2 repræsenterer biblioteksmedlemmer, B er et targetmolekyle, og X er en enhed, der er operativt bundet til B, som muliggør fjernelsen af B fra selektionsmediet. I dette eksempel binder forbindelse 1 til B, mens forbindelse 2 ikke binder til B. Selektionsprocessen, som afbilledet i Runde 1, omfatter (I), at et bibliotek omfattende forbindelse 1 og 2 bringes i kontakt med B-X under betingelser, der er egnede til binding af forbindelse 1 til B; (II), at ubundet forbindelse 2 fjernes, (III), at forbindelse 1 dissocieres fra B og, at BX fjernes fra reaktionsmediet. Resultatet af Runde 1 er en samling molekyler, der er beriget i forbindelse 1 i forhold til forbindelse 2. Efterfølgende runder, der anvender trin l-lll, resulterer i yderligere berigelse af forbindelse 1 i forhold til forbindelse 2. Selvom der er vist tre selektionsrunder i Figur 6, kan der i praksis anvendes et hvilket som helst antal runder, for eksempel fra én runde til ti runder, for at opnå den ønskede berigelse af bindingsmolekyler i forhold til ikke-bindende molekyler. I den i Figur 6 viste udførelsesform er der ingen amplifikation (syntese af flere kopier) af de forbindelser, der er tilbage efter nogen af selektionsrunderne. Sådan amplifikation kan føre til en blanding af forbindelser, der ikke er konsistent med de relative mængder af de efter selektionen tilbageværende forbindelser. Denne inkonsistens skyldes, at nogle forbindelser kan syntetiseres mere umiddelbart end andre forbindelser og således kan amplificeres på en måde, der ikke er proportional med deres tilstedeværelse efter selektion. Hvis forbindelse 2 for eksempel kan syntetiseres mere umiddelbart end forbindelse 1, ville amplifikation af de molekyler, der er tilbage efter Runde 2, resultere i en uforholdsmæssig amplifikation af forbindelse 2 i forhold til forbindelse 1 og en resulterende blanding af forbindelser med en meget lavere (om nogen) berigelse af forbindelse 1 i forhold til forbindelse 2. I én udførelsesform immobiliseres targetet på et fast underlag ved hjælp af enhver kendt immobiliseringsteknik. Det faste underlag kan for eksempel være en vanduopløselig matrix indeholdt i en chromatografikolonne eller en membran. Det kodede bibliotek kan påføres på en vanduopløselig matrix indeholdt i en chromatografikolonne. Derefter vaskes kolonnen for at fjerne ikke-specifikke bindemidler. Targetbundne forbindelser kan derefter dissocieres ved at ændre pH, saltkoncentration, koncentration af organisk opløsningsmiddel eller andre metoder, såsom konkurrence med en kendt ligand for targetet. I en anden udførelsesform er targetet frit i opløsning og inkuberes med det kodede bibliotek. Forbindelser, der binder til targetet (heri også henvist til som "ligander"), isoleres selektivt ved hjælp af et størrelsessepareringstrin, såsom gelfiltrering eller ultrafiltrering. I én udførelsesform føres blandingen af kodede forbindelser og targetbiomolekylet gennem en størrelseseksklusions-chromatografikolonne (gelfiltrering), der separerer eventuelle ligand-arget-komplekser fra de ubundne forbindelser. Ligandtargetkomplekserne overføres til en omvendt-fase chromatografikolonne, der dissocierer liganderne fra targetet. De dissocierede ligander analyseres derefter med PCR-amplifika-tion og sekvensanalyse af de kodende oligonukleotider. Denne tilgang er særligt fordelagtig i situationer, hvor immobilisering af targetet kan resultere i tab af aktivitet. I nogle udførelsesformer kan udvælgelsesmetoden omfatte amplificering af det kodende oligonukleotid i mindst ét medlem af biblioteket af forbindelser, som binder til et target før sekventering. I én udførelsesform amplificeres biblioteket af forbindelser omfattende kodende oligonukleotider før sekvensanalyse for at minimere eventuelt skævhed i populationsfordelingen af DNA-molekyler i det udvalgte biblioteks-mix. For eksempel genvindes kun en lille mængde bibliotek efter et udvælgelsestrin og amplificeres typisk under anvendelse af PCR inden sekvensanalyse. PCR har potentialet til at producere en skævhed i populations fordelingen af DNA-molekyler i det udvalgte biblioteksmix. Dette er især problematisk, når antallet af inputmolekyler er lille, og inputmolekylerne er dårlige PCR-skabeloner. PCR-produkter produceret i tidlige cykluser er mere effektive skabeloner end kovalent duplexbibliotek, og frekvensen af disse molekyler i den endelige amplificerede population kan derfor være meget højere end i oprindelig inputskabelon.

For at minimere denne potentielle PCR-skævhed produceres der derfor i én udførelsesform en population af enkeltstrengede oligonukleotider svarende til de individuelle biblioteksmedlemmer, for eksempel under anvendelse af én primer i en reaktion efterfulgt af PCR-amplifikation under anvendelse af to primere. Ved at gøre dette, er der en lineær akkumulering af enkeltstrenget primerekstensionsprodukt før eksponentiel amplifikation med anvendelse af PCR, og diversiteten og fordelingen af molekyler i det akkumulerede primerekstensionsprodukt afspejler mere nøjagtigt diversiteten og fordelingen af molekyler i den oprindelige inputskabelon, da den eksponentielle amplifikationsfase først optræder efter, at meget af den tilstedeværende oprindelige molekylære diversitet er repræsenteret i den under primerekstensionsreaktonen producerede population af molekyler. Når enkelte ligander er blevet denitrificeret med den oven for beskrevne proces, kan der anvendes forskellige analyseniveauer for at opnå information om struktur-aktivitetforhold og for at styre yderligere optimering af ligandens affinitet, specificitet og bioaktivitet. Til ligander, der er afledt fra samme stillads, kan der anvendes tredimensional molekylærmodellering til at identificere signifikante strukturelle træk, der er fælles for liganderne, hvorved der genereres familier af ligander med lille molekyle, der formentlig binder i et fælles sted på targetbiomolekylet.

Der kan anvendes en række screeningstiltag for at opnå ligander, som besidder høj affinitet for ét target men signifikant svagere affinitet for et andet nært beslægtet target. Én screeningsstrategi består i at identificere ligander for begge biomolekyler i parallelle eksperimenter og efterfølgende at eliminere fælles ligander ved hjælp af en tværreference sammenligning. Ved denne fremgangsmåde kan ligander til hvert biomolekyle identificeres separat som beskrevet ovenfor. Denne fremgangsmåde er kompatibel med både immobiliserede targetbiomolekyler og targetbiomolekyler, der er fri i opløsning.

For så vidt angår immobiliserede targetbiomolekyler er en anden strategi at tilføje et præselektionstrin, der eliminerer alle ligander, som binder til ikke-targetbiomolekylet fra biblioteket. For eksempel kan et første biomolekyle bringes i kontakt med et kodet bibliotek som beskrevet ovenfor. Forbindelser, der ikke binder til det første biomolekyle, separeres derefter fra eventuelle første biomolekyle-ligand-komplekser, som dannes. Det andet biomolekyle bringes så i kontakt med de forbindelser, der ikke bandt til det første biomolekyle. Forbindelser, der binder til det andet biomolekyle, kan identificeres som beskrevet ovenfor, og har signifikant højere affinitet for det andet biomolekyle end for det første biomolekyle.

En ligand til et biomolekyle med ukendt funktion, som identificeres ved den oven for beskrevne fremgangsmåde, kan også anvendes til at bestemme biomolekylets biologiske funktion. Dette er fordelagtigt, for selvom der fortsat identificeres nye gensekvenser, er de af disse sekvenser kodede proteiners funktion og validitet som targets for ny lægemiddelopdagelse og -udvikling vanskelige at bestemme og repræsenterer måske den væsentligste hindring for at anvende genominformation ved behandling af sygdom. Target-specifikke ligander, der opnås ved den beskrevne proces, kan anvendes effektivt i biologiske helcelleassays eller i egnede dyremodeller til forståelse både af targetproteinets funktion og targetproteinets validitet til terapeutisk intervention. Denne tilgang kan også bekræfte, at targetet er specielt egnet til opdagelse af lægemiddel med lille molekyle. I én udførelsesform identificeres én eller flere forbindelser i et bibliotek ifølge opfindelsen som ligander til et bestemt biomolekyle. Disse forbindelser kan så vurderes i et in vitro assay med hensyn til evne til at binde til biomolekylet.

Fortrinsvis syntetiseres bindingsforbindelsernes funktionelle enheder uden oligonukleotid-tag'en eller linkerenheden, og disse funktionelle enheder vurderes med hensyn til evne til at binde til biomolekylet.

Effekten på biomolekylets funktion af at binde de funktionelle enheder til biomolekylet kan også vurderes under anvendelse af in vitro cellefri eller celle-baserede assays. For et biomolekyle med kendt funktion kan assayet omfatte en sammenligning af biomolekylets aktivitet i nærvær og fravær af liganden for eksempel ved direkte måling af aktiviteten, såsom enzymatisk aktivitet, eller ved en indirekte måling, såsom en cellefunktion, der påvirkes af biomolekylet. Hvis biomolekylet har ukendt funktion, kan en celle, der udtrykker biomolekylet, bringes i kontakt med liganden, og ligandens effekt på cellens levedygtighed, funktion, fænotype og/eller genekspression vurderes. In vitro assayet kan for eksempel være et celledødassay, et celleproliferationsassay eller et virusreplikationsassay. Hvis biomolekylet for eksempel er et protein udtrykt af en virus, kan en celle, der er inficeret med virusen, bringes i kontakt med en ligand til proteinet. Den virkning, som bindingen af liganden til proteinet har på viruslevedygtighed, kan så vurderes.

En ved fremgangsmåden identificeret ligand kan også vurderes i en in vivo model eller i et menneske. For eksempel kan liganden evalueres i et dyr eller en organisme, der producerer biomolekylet. Eventuel resulterende ændring i dyrets eller organismens helbredsstatus (for eksempel sygdomsprogression) kan bestemmes.

For så vidt angår et biomolekyle, såsom et protein eller et nukleinsyre-molekyle, med ukendt funktion, kan den virkning, som en ligand, der binder til biomolekylet, har på en celle eller organisme, som producerer biomolekylet, give information om biomolekylets biologiske funktion. For eksempel indikerer den observation, at en bestemt cellulær proces hæmmes i nærvær af liganden, at processen afhænger, i det mindste delvis, af biomolekylets funktion.

Ligander, der identificeres under anvendelse af fremgangsmåderne, kan også anvendes som affinitetsreagenser til det biomolekyle, til hvilket de binder. I én udførelsesform anvendes sådanne ligander til at bevirke affinitetsoprensning af biomolekylet, for eksempel via chromatografi af en opløsning omfattende biomolekylet under anvendelse af en fast fase, hvortil én eller flere sådanne ligander fastknyttes.

Denne opfindelse illustreres yderligere ved de efterfølgende eksempler. Eksempler

Eksempel 1: Syntese og karakterisering af et bibliotek af størrelsesordenen 105 medlemmer.

Syntesen af et bibliotek omfattende i størrelsesordenen 105 distinkte medlemmer blev opnået under anvendelse af følgende reagenser:

Forbindelse 1:

Etbogstavskoder for deoxyribonukleotider: A = adenosin C = cytidin G = guanosin T = thymidin

Byggestenprækursorer:

BBl BB2 BB3

BB4 BB5 BB6

BB7 BB8 BB9

BB1O BB11 BB12

Oligonukleotid-tags:

Sekvens Tag-nummer 5'-PO4-GCAACGAAG (SEQ ID N0:1) 1.1 ACCGTTGCT-P03-5' (SEQ ID NO:2) 5'-PO3-GCGTACAAG (SEQ ID NO:3) 1.2 ACCGCATGT-PO3-5' (SEQ ID NO:4) 5'-PO3-GCTCTGTAG (SEQ ID NO:5) 1.3 ACCGAGACA-PO3-5' (SEQ ID NO:6) 5'-PO3-GTGCCATAG (SEQ ID NO:7) 1.4 ACCACGGTA-PO3-5' (SEQ ID NO:8) 5'-PO3-GTTGACCAG (SEQ ID NO:9) 1.5 ACCAACTGG-PO3-5' (SEQ ID NO:10) 5'-PO3-CGACTTGAC (SEQ ID NO:11) 1.6 CAAGTCGCA-PO3-5' (SEQ ID NO:12) 5'-PO3-CGTAGTCAG (SEQ ID NO:13) 1.7 ACGCATCAG-PO3-5' (SEQ ID NO:14) 5'-PO3-CCAGCATAG (SEQ ID NO:15) 1.8 ACGGTCGTA-PO3-5' (SEQ ID NO:16) 5'-PO3-CCTACAGAG (SEQ ID NO:17) 1.9 ACGGATGTC-PO3-5' (SEQ ID NO:18) 5'-PO3-CTGAACGAG (SEQ ID NO:19) 1.10 CGTTCAGCA-PO3-5' (SEQ ID NO:20) 5'-PO3-CTCCAGTAG (SEQ ID NO:21) 1.11 ACGAGGTCA-P03-5' (SEQ ID NO:22) 5'-PO3-TAGGTCCAG (SEQ ID NO:23) 1.12 ACATCCAGG-P03-5' (SEQ ID NO:24) 5'-PO3-GCGTGTTGT (SEQ ID NO:25) 2.1 TCCGCACAA-PO3-5' (SEQ ID NO:26) 5'-PO3-GCTTGGAGT (SEQ ID NO:27) 2.2 TCCGAACCT-PO3-5' (SEQ ID NO:28) 5'-PO3-GTCAAGCGT (SEQ ID NO:2 9) 2.3 TCCAGTTCG-PO3-5' (SEQ ID NO:30) 5'-PO3-CAAGAGCGT (SEQ ID NO:31) 2.4 TCGTTCTCG-PO3-5' (SEQ ID NO:32) 5'-PO3-CAGTTCGGT (SEQ ID NO:33) 2.5 TCGTCAAGC-PO3-5' (SEQ ID NO:34) 5'-POs-CGAAGGAGT (SEQ ID NO:35) 2.6 TCGCTTCCT-PO3-5' (SEQ ID NO:36) 5'-PO3-CGGTGTTGT (SEQ ID NO:37) 2.7 TCGCCACAA-PO3-5' (SEQ ID NO:38) 5'-PO3-CGTTGCTGT (SEQ ID NO:39) 2.8 TCGCAACGA-PO3-5' (SEQ ID NO:40) 5'-PO3-CCGATCTGT (SEQ ID NO:41) 2.9 TCGGCTAGA-PO3-5' (SEQ ID NO:42) 5'-PO3-CCTTCTCGT (SEQ ID NO:43) 2.10 TCGGAAGAG-PO3-5' (SEQ ID NO:44) 5'-PO3-TGAGTCCGT (SEQ ID NO:45) 2.11 TCACTCAGG-PO3-5' (SEQ ID NO:46) 5'-PO3-TGCTACGGT (SEQ ID NO:47) 2.12 TCAGATTGC-P03-5' (SEQ ID NO:48) 5'-PO3-GTGCGTTGA (SEQ ID NO:4 9) 3.1 CACACGCAA-PO3-5' (SEQ ID NO:50) 5'-PO3-GTTGGCAGA (SEQ ID NO:51) 3.2 CACAACCGT-PO3-5' (SEQ ID NO:52) 5'-PO3-CCTGTAGGA (SEQ ID NO:53) 3.3 CAGGACATC-PO3-5' (SEQ ID NO:54) 5'-PO3-CTGCGTAGA (SEQ ID NO:55) 3.4 CAGACGCAT-PO3-5' (SEQ ID NO:56) 5'-PO3-CTTACGCGA (SEQ ID NO:57) 3.5 CAGAATGCG-PO3-5' (SEQ ID NO:58) 5'-PO3-TGGTCACGA (SEQ ID NO:59) 3.6 CAACCAGTG-PO3-5' (SEQ ID NO:60) 5'-PO3-TCAGAGCGA (SEQ ID NO:61) 3.7 CAAGTCTCG-PO3-5' (SEQ ID NO:62) 5'-PO3-TTGCTCGGA (SEQ ID NO:63) 3.8 CAAACGAGC-PO3-5' (SEQ ID NO:64) 5'-PO3-GCAGTTGGA (SEQ ID NO:65) 3.9 CACGTCAAC-PO3-5' (SEQ ID NO:66) 5'-PO3-GCCTGAAGA (SEQ ID NO:67) 3.10 CACGGACTT-PO3-5' (SEQ ID NO:68) 5'-PO3-GTAGCCAGA (SEQ ID NO:69) 3.11 CACATCGGT-PO3-5' (SEQ ID NO:70) 5'-PO3-GTCGCTTGA (SEQ ID NO:71) 3.12 CACAGCGAA-PO3-5' (SEQ ID NO:72) 5'-PO3-GCCTAAGTT (SEQ ID NO:73) 4.1 CTCGGATTC-PO3-5' (SEQ ID NO:74) 5'-PO3-GTAGTGCTT (SEQ ID NO:75) 4.2 CTCATCACG-PO3-5' (SEQ ID NO:76) 5'-POs-GTCGAAGTT (SEQ ID NO:77) 4.3 CTCAGCTTC-P03-5' (SEQ ID NO:78) 5'-PO3-GTTTCGGTT (SEQ ID NO:7 9) 4.4 CTCAAAGCC-PO3-5' (SEQ ID NO:80) 5'-PO3-CAGCGTTTT (SEQ ID NO:81) 4.5 CTGTCGCAA-PO3-5' (SEQ ID NO:82) 5'-PO3-CATACGCTT (SEQ ID NO:83) 4.6 CTGTATGCG-PO3-5' (SEQ ID NO:84) 5'-PO3-CGATCTGTT (SEQ ID NO:85) 4.7 CTGCTAGAC-PO3-5' (SEQ ID NO:86) 5'-PO3-CGCTTTGTT (SEQ ID NO:87) 4.8 CTGCGAAAC-PO3-5' (SEQ ID NO:88) 5'-PO3-CCACAGTTT (SEQ ID NO:89) 4.9 CTGGTGTCA-P03-5' (SEQ ID NO:90) 5'-PO3-CCTGAAGTT (SEQ ID NO:91) 4.10 CTGGACTTC-PO3-5' (SEQ ID NO:92) 5'-PO3-CTGACGATT (SEQ ID NO:93) 4.11 CTGACTGCT-PO3-5' (SEQ ID NO:94) 5'-PO3-CTCCACTTT (SEQ ID NO:95) 4.12 CTGAGGTGA-PO3-5' (SEQ ID NO:96) 5'-PO3-ACCAGAGCC (SEQ ID NO:97) 5.1 AATGGTCTC-PO3-5' (SEQ ID NO:98) 5'-PO3-ATCCGCACC (SEQ ID NO:99) 5.2 AATAGGCGT-P03-5' (SEQ ID NO:100) 5'-P03-GACGACACC (SEQ ID NO:101) 5.3 AACTGCTGT-P03-5' (SEQ ID NO:102) 5'-P03-GGATGGACC (SEQ ID NO:103) 5.4 AACCTACCT-P03-5' (SEQ ID NO:104) 5'-P03-GCAGAAGCC (SEQ ID NO:105) 5.5 AACGTCTTC-P03-5' (SEQ ID NO:106) 5'-P03-GCCATGTCC (SEQ ID NO:107) 5.6 AACGGTACA-P03-5' (SEQ ID NO:108) 5'-P03-GTCTGCTCC (SEQ ID NO:109) 5.7 AACAGACGA-P03-5' (SEQ ID NO:110) 5'-P03-CGACAGACC (SEQ ID NO:111) 5.8 AAGCTGTCT-P03-5' (SEQ ID NO:112) 5'-P03-CGCTACTCC (SEQ ID NO:113) 5.9 AAGCGATGA-P03-5' (SEQ ID NO:114) 5'-P03-CCACAGACC (SEQ ID NO:115) 5.10 AAGGTGTCT-P03-5' (SEQ ID NO:116) 5'-P03-CCTCTCTCC (SEQ ID NO:117) 5.11 AAGGAGAGA-P03-5' (SEQ ID NO:118) 5'-PO3-CTCGTAGCC (SEQ ID NO:119) 5.12 AAGAGCATC-P03-5' (SEQ ID NO:120) 1X ligasebuffer: 50 mM Tris, pH 7,5; 10 mM dithiothreitol; 10 mM MgCI2; 2,5 mM ATP; 50 mM NaCI. 10X ligasebuffer: 500 mM Tris, pH 7,5; 100 mM dithiothreitol; 100 mM MgCI2; 25 mM ATP; 500 mM NaCI.

Cyklus 1

Til hvert af tolv PCR-rør blev der tilsat 50 μΙ_ af en 1 mM opløsning af Forbindelse 1 i vand; 75 μΙ_ af en 0,80 mM opløsning af én af Tags 1.1-1.12; 15 μΙ_ 10X ligasebuffer og 10 μΙ_ afioniseret vand. Rørene blev opvarmet til 95 °C i 1 minut og derefter afkølet til 16 °C i løbet af 10 minutter. Til hvert rør blev der tilsat 5 000 enheder T4 DNA-ligase (2,5 μΙ_ af en 2 000 000 enhed/mL opløsning (New England Biolabs. Cat. No. M0202)) i 50 μΙ 1X ligasebuffer, og de resulterende opløsninger blev inkuberet ved 16 °C i 16 timer.

Efter ligering blev prøver overført til 1,5 ml Eppendorf-rør og behandlet med 20 μΙ_ 5 M vandigt NaCI og 500 μΙ_ kold (-20 °C) ethanol og holdt ved -20 °C i 1 time. Efter centrifugering blev supernatanten fjernet, og pelleten blev vasket med 70 % vandig ethanol ved -20 °C. Hver af pelletene blev derefter opløst i 150 pL 150 mM natriumboratbuffer, pH 9,4.

Udgangsopløsninger hver omfattende én af byggestenprækursorene BB1-BB12, Ν,Ν-diisopropylethanolamin og 0-(7-azabenzotriazol-1-yl)-1,1,3,3-tetramethyluronium hexafluorphosophat, hver i en koncentration på 0,25 M, blev fremstillet i DMF og omrørt ved rumtemperatur i 20 minutter. Byggesten-prækursoropløsningerne blev tilsat til hver af de ovenfor beskrevne pellet opløsninger til tilvejebringelse af et 10-fold overskud af byggestenprækursor i forhold til linker. De resulterende opløsninger blev omrørt. Yderligere 10 ækvivalenter byggestenprækursor blev tilsat til reaktionsblandingen efter 20 minutter, og yderligere 10 ækvivalenter efter 40 minutter. DMF-slut-koncentrationen i reaktionsblandingen var 22 %. Reaktionsopløsningerne blev derefter omrørt natten over ved 4 °C. Reaktionens fremadskriden blev overvåget med RP-HPLC under anvendelse af 50 mM vandigt tetraethyl-ammoniumacetat (pH=7,5) og acetonitril, og en gradient på 2-46 % acetonitril i løbet af 14 minutter. Reaktionen blev standset, da ~95 % udgangsmateriale (linker) var acyleret. Efter acylering blev reaktionsblandingerne forenet og lyofiliseret til tørhed. Det lyofiliserede materiale blev derefter oprenset med HPLC, og de fraktioner, der svarede til biblioteket (acetyleret produkt), blev forenet og lyofiliseret.

Biblioteket blev opløst i 2,5 ml 0,01 M natriumphosphatbuffer (pH= 8,2) og 0,1 ml piperidin ( 4 % v/v) blev tilsat dertil. Tilsætningen af piperidin resulterer i turbiditet, som ikke opløses ved blanding. Reaktionsblandingerne blev omrørt ved rumtemperatur i 50 minutter, og derefter blev den uklare opløsning centrifugeret (14 000 omdr./min), supernatanten blev fjernet under anvendelse af en 200 μΙ pipette, og pelleten blev gensuspenderet i 0,1 ml vand. Den vandige vask blev kombineret med supernatanten, og pelleten blev kasseret. Det afbeskyttede bibliotek blev udfældet fra opløsning ved tilsætning af overskud af iskold ethanol, for at bringe ethanolslutkoncentra-tionen i reaktionen på 70 % v/v. Centrifugering af den vandige ethanol-blanding gav en hvid pellet omfattende biblioteket. Pelleten blev vasket én gang med kold 70 % vandig ethanol. Efter fjernelse af opløsningsmiddel, blev pelleten tørret i luft ( ~5 min.) til fjernelse af spor af ethanol, og blev derefter anvendt i cyklus 2. Tags'ene og tilsvarende i Runde 1 anvendte byggesten-prækursorer er anført i Tabel 1 nedenfor.

Tabel 1

Cyklus 2-5

For hver af disse cykluser blev den fra den foregående cyklus resulterende kombinerede opløsning delt i 12 ens alikvotter, hver på 50 μΙ, og anbragt i PCR-rør. Til hvert rør blev der tilsat en opløsning omfattende en distinkt tag, og der blev udført ligering, oprensning og acylering som beskrevet for Cyklus 1 med undtagelse af, at for Cyklus 3-5 blev det for Cyklus 1 beskrevne HPLC-oprensningstrin udeladt. Overensstemmelsen mellem tags og byggestenprækursorer for Cyklus 2-5 er anført i Tabel 2.

Produkterne fra Cyklus 5 blev ligeret med den neden for viste lukker-primer under anvendelse af den oven for til ligering af tags beskrevne fremgangsmåde.

5'-PO3-GGCACATTGATTTGGGAGTCA GTGTAACTAAACCCTCAGT-P03-5'

Tabel 2

Resultater.

Den oven for beskrevne synteseprocedure er i stand til at producere et bibliotek omfattende 125 (ca. 249 000) forskellige strukturer. Syntesen af biblioteket blev overvåget via gelelektoforese af produktet fra hver cyklus. Resultaterne af hver af de fem cykluser og slutbiblioteket efter ligering af lukker-primeren er illustreret i Figur 7. Forbindelsen mærket "head piece" er Forbindelse 1. Figuren viser, at hver cyklus resulterer i den forventede molekylvægtforøgelse og, at produkterne fra hver cyklus er i hovedsagen homogene med hensyn til molekylvægt.

Eksempel 2: Syntese og karakterisering af et bibliotek af størrelsesordenen 108 medlemmer

Syntese af et bibliotek af størrelsesordenen 108 distinkte medlemmer blev opnået under anvendelse af følgende reagenser:

Forbindelse 2;

Etbogstavskoder for deoxyribonukleotider: A = adenosin C = cytidin G = guanosin T= thymidin

Byggestenprækursorer:

Tabel 3: I cyklus 1 anvendte oligonukleotid-tags:

Tagnummer Topstrengsekvens Bundstrengsekvens 5'-P03- 5'-P03-

AAATCGATGTGGTCACTCAG GAGTGACCACATCGATTTGG 1.1 (SEQ ID NO:121) (SEQ ID NO:122) 5'-P03- 5'-P03-

AAATCGATGTGGACTAGGAG CCTAGTCCACATCGATTTGG 1.2 (SEQ ID NO:123) (SEQ ID NO:124) 5'-P03- 5'-P03-

AAATCGATGTGCCGTATGAG CATACGGCACATCGATTTGG 1.3 (SEQ ID NO:125) (SEQ ID NO:126) 5'-P03- 5'-P03-

AAATCGATGTGCTGAAGGAG CCTTCAGCACATCGATTTGG 1.4 (SEQ ID NO:127) (SEQ ID NO:128) 5'-P03- 5'-P03-

AAATCGATGTGGACTAGCAG GCTAGTCCACATCGATTTGG 1.5 (SEQ ID NO:129) (SEQ ID NO:130) 5'-P03- 5'-P03-

AAATCGATGTGCGCTAAGAG CTTAGCGCACATCGATTTGG 1.6 (SEQ ID NO:131) (SEQ ID NO:132) 5'-P03- 5'-P03-

AAATCGATGTGAGCCGAGAG CTCGGCTCACATCGATTTGG 1.7 (SEQ ID NO:133) (SEQ ID NO:134) 5'-P03- 5'-P03-

AAATCGATGTGCCGTATCAG GATACGGCACATCGATTTGG 1.8 (SEQ ID NO:135) (SEQ ID NO:136) 5'-P03- 5'-P03-

AAATCGATGTGCTGAAGCAG GCTTCAGCACATCGATTTGG 1.9 (SEQ ID NO:137) (SEQ ID NO:138) 1.10 5'-P03- 5'-P03-

AAATCGATGTGTGCGAGTAG ACTCGCACACATCGATTTGG (SEQ ID NO:139) (SEQ ID NO:140) 5'-P03- 5'-P03-

AAATCGATGTGTTTGGCGAG CGCCAAACACATCGATTTGG 1.11 (SEQ ID NO:141) (SEQ ID NO:142) 5'-P03- 5'-P03-

AAATCGATGTGCGCTAACAG GTTAGCGCACATCGATTTGG 1.12 (SEQ ID NO:143) (SEQ ID NO:144) 5'-P03- 5'-P03-

AAATCGATGTGAGCCGACAG GTCGGCTCACATCGATTTGG 1.13 (SEQ ID NO:145) (SEQ ID NO:146) 5'-P03- 5'-P03-

AAATCGATGTGAGCCGAAAG TTCGGCTCACATCGATTTGG 1.14 (SEQ ID NO:147) (SEQ ID NO:148) 5'-P03- 5'-P03-

AAATCGATGTGTCGGTAGAG CTACCGACACATCGATTTGG 1.15 (SEQ ID NO:149) (SEQ ID NO:150) 5'-P03- 5'-P03-

AAATCGATGTGGTTGCCGAG CGGCAACCACATCGATTTGG 1.16 (SEQ ID NO:151) (SEQ ID NO:152) 5'-P03- 5'-P03-

AAATCGATGTGAGTGCGTAG ACGCACTCACATCGATTTGG 1.17 (SEQ ID NO:153) (SEQ ID NO:154) 5'-P03- 5'-P03-

AAATCGATGTGGTTGCCAAG TGGCAACCACATCGATTTGG 1.18 (SEQ ID NO: 155) (SEQ ID NO: 156) 5'-P03- 5'-P03-

AAATCGATGTGTGCGAGGAG CCTCGCACACATCGATTTGG 1.19 (SEQ ID NO: 157) (SEQ ID NO: 158) 5'-P03- 5'-P03-

AAATCGATGTGGAACACGAG CGTGTTCCACATCGATTTGG 1.20 (SEQ ID NO: 159) (SEQ ID NO: 160) 1.21 5'-P03- 5'-P03-

AAATCGATGTGCTTGTCGAG CGACAAGCACATCGATTTGG (SEQ ID N0:161) (SEQ ID NO: 162) 5'-P03- 5'-P03-

AAATCGATGTGTTCCGGTAG AOCCGGAACACATCGATTTGG 1.22 (SEQ ID NO: 163) (SEQ ID NO:164) 5'-P03- 5'-P03-

AAATCGATGTGTGCGAGCAG GCTCGCACACATCGATTTGG 1.23 (SEQ ID NO: 165) (SEQ ID NO: 166) 5'-P03- 5'-P03-

1.24 AAATCGATGTGGTCAGGTAG ACCTGACCACATCGATTTGG (SEQ ID NO: 167) (SEQ ID NO:168) 5'-P03- 5'-P03-

AAATCGATGTGGCCTGTTAG AACAGGCCACATCGATTTGG 1.25 (SEQ ID NO: 169) (SEQ ID NO:170) 5'-P03- 5'-P03-

AAATCGATGTGGAACACCAG GGTGTTCCACATCGATTTGG 1.2 6 (SEQ ID NO: 171) (SEQ ID NO: 172) 5'-P03- 5'-P03-

AAATCGATGTGCTTGTCCAG GGACAAGCACATCGATTTGG 1.2 7 (SEQ ID NO: 173) (SEQ ID NO: 174) 5'-P03- 5'-P03-

AAATCGATGTGTGCGAGAAG TCTCGCACACATCGATTTGG 1.2 8 (SEQ ID NO: 175) (SEQ ID NO: 176) 5'-P03- 5'-P03-

AAATCGATGTGAGTGCGGAG CCGCACTCACATCGATTTGG 1.2 9 (SEQ ID NO: 177) (SEQ ID NO: 178) 5'-P03- 5'-P03-

AAATCGATGTGTTGTCCGAG CGGACAACACATCGATTTGG 1.30 (SEQ ID NO: 179) (SEQ ID NO:180) 5'-P03- 5'-P03-

AAATCGATGTGTGGAACGAG CGTTCCACACATCGATTTGG 1.31 (SEQ ID NO: 181) (SEQ ID NO:182) 1.32 5'-P03- 5'-P03-

AAATCGATGTGAGTGCGAAG TCGCACTCACATCGATTTGG (SEQ ID NO: 183) (SEQ ID NO: 184) 5'-P03- 5'-P03-

AAATCGATGTGTGGAACCAG GGTTCCACACATCGATTTGG 1.33 (SEQ ID NO: 185) (SEQ ID NO: 186) 5'-P03- 5'-P03-

AAATCGATGTGTTAGGCGAG CGCCTAACACATCGATTTGG 1.34 (SEQ ID NO: 187) (SEQ ID NO:188) 5'-P03- 5'-P03-

AAATCGATGTGGCCTGTGAG CACAGGCCACATCGATTTGG 1.35 (SEQ ID NO: 189) (SEQ ID NO:190) 5'-P03- 5'-P03-

AAATCGATGTGCTCCTGTAG ACAGGAGCACATCGATTTGG 1.36 (SEQ ID NO: 191) (SEQ ID NO: 192) 5'-P03- 5'-P03-

AAATCGATGTGGTCAGGCAG GCCTGACCACATCGATTTGG 1.37 (SEQ ID NO: 193) (SEQ ID NO: 194) 5'-P03- 5'-P03-

AAATCGATGTGGTCAGGAAG TCCTGACCACATCGATTTGG 1.38 (SEQ ID NO: 195) (SEQ ID NO: 196) 5'-P03- 5'-P03-

AAATCGATGTGGTAGCCGAG CGGCTACCACATCGATTTGG 1.39 (SEQ ID NO: 197) (SEQ ID NO: 198) 5'-P03- 5'-P03-

AAATCGATGTGGCCTGTAAG TACAGGCCACATCGATTTGG 1.40 (SEQ ID NO: 199) (SEQ ID N0:200) 5'-P03- 5'-P03-

AAATCGATGTGCTTTCGGAG CCGAAAGCACATCGATTTGG 1.41 (SEQ ID NO:201) (SEQ ID NO:202) 5'-P03- 5'-P03-

AAATCGATGTGCGTAAGGAG CCTTACGCACATCGATTTGG 1.42 (SEQ ID NO:203) (SEQ ID NO:204) 5'-P03- 5'-P03-

1.43 AAATCGATGTGAGAGCGTAG ACGCTCTCACATCGATTTGG (SEQ ID NO:205) (SEQ ID NO:206) 5'-P03- 5'-P03-

AAATCGATGTGGACGGCAAG TGCCGTCCACATCGATTTGG 1.44 (SEQ ID NO:207) (SEQ ID NO:208) 5'-P03- 5'-P03-

AAATCGATGTGCTTTCGCAG GCGAAAGCACATCGATTTGG 1.45 (SEQ ID NO:209) (SEQ ID NO:210) 5'-P03- 5'-P03-

AAATCGATGTGCGTAAGCAG GCTTACGCACATCGATTTGG 1.4 6 (SEQ ID NO:211) (SEQ ID NO:212) 5'-P03- 5'-P03-

AAATCGATGTGGCTATGGAG CCATAGCCACATCGATTTGG 1.47 (SEQ ID NO:213) (SEQ ID NO:214) 5'-P03- 5'-P03-

AAATCGATGTGACTCTGGAG CCAGAGTCACATCGATTTGG 1.48 (SEQ ID NO:215) (SEQ ID NO:216) 5'-P03- 5'-P03-

AAATCGATGTGCTGGAAAG TTCCAGCACATCGATTTGG 1.4 9 (SEQ ID NO:217) (SEQ ID NO:218) 5'-P03- 5'-P03-

AAATCGATGTGCCGAAGTAG ACTTCGGCACATCGATTTGG 1.50 (SEQ ID NO:219) (SEQ ID NO:220) 5'-P03- 5'-P03-

AAATCGATGTGCTCCTGAAG TCAGGAGCACATCGATTTGG 1.51 (SEQ ID NO:221) (SEQ ID NO:222) 5'-P03- 5'-P03-

AAATCGATGTGTCCAGTCAG GACTGGACACATCGATTTGG 1.52 (SEQ ID NO:223) (SEQ ID NO:224) 5'-P03- 5'-P03-

AAATCGATGTGAGAGCGGAG CCGCTCTCACATCGATTTGG 1.53 (SEQ ID NO:225) (SEQ ID NO:226) 5'-P03- 5'-P03-

AAAT C GAT GT GAGAGC GAAG TCGCTCTCACATCGATTTGG 1.54 (SEQ ID NO:227) (SEQ ID NO:228) 5'-P03- 5'-P03-

AAATCGATGTGCCGAAGGAG CCTTCGGCACATCGATTTGG 1.55 (SEQ ID NO:229) (SEQ ID NO:230) 5'-P03- 5'-P03-

AAATCGATGTGCCGAAGCAG GCTTCGGCACATCGATTTGG 1.56 (SEQ ID NO:231) (SEQ ID NO:232) 5'-P03- 5'-P03-

AAATCGATGTGTGTTCCGAG CGGAACACACATCGATTTGG 1.57 (SEQ ID NO:233) (SEQ ID NO:234) 5'-P03- 5'-P03-

AAATCGATGTGTCTGGCGAG CGCCAGACACATCGATTTGG 1.58 (SEQ ID NO:235) (SEQ ID NO:236) 5'-P03- 5'-P03-

AAATCGATGTGCTATCGGAG CCGATAGCACATCGATTTGG 1.59 (SEQ ID NO:237) (SEQ ID NO:238) 5'-P03- 5'-P03-

AAATCGATGTGCGAAAGGAG CCTTTCGCACATCGATTTGG 1.60 (SEQ ID NO:239) (SEQ ID NO:240) 5'-P03- 5'-P03-

AAATCGATGTGCCGAAGAAG TCTTCGGCACATCGATTTGG 1.61 (SEQ ID NO:241) (SEQ ID NO:242) 5'-P03- 5'-P03-

AAATCGATGTGGTTGCAGAG CTGCAACCACATCGATTTGG 1.62 (SEQ ID NO:243) (SEQ ID NO:244) 5'-P03- 5'-P03-

AAATCGATGTGGATGGTGAG CACCATCCACATCGATTTGG 1.63 (SEQ ID NO:245) (SEQ ID NO:246) 5'-P03- 5'-P03-

AAATCGATGTGCTATCGCAG GCGATAGCACATCGATTTGG 1.64 (SEQ ID NO:247) (SEQ ID NO:248) 5'-P03- 5'-P03-

AAATCGATGTGCGAAAGCAG GCTTTCGCACATCGATTTGG 1.65 (SEQ ID NO:249) (SEQ ID NO:250) 1.66 5'-P03- 5'-P03-

AAATCGATGTGACACTGGAG CCAGTGTCACATCGATTTGG (SEQ ID NO:251) (SEQ ID NO:252) 5'-P03- 5'-P03-

AAATCGATGTGTCTGGCAAG TGCCAGACACATCGATTTGG 1.67 (SEQ ID NO:253) (SEQ ID NO:254) 5'-P03- 5'-P03-

AAATCGATGTGGATGGTCAG GACCATCCACATCGATTTGG 1.68 (SEQ ID NO:255) (SEQ ID NO:256) 5'-P03- 5'-P03-

AAATCGATGTGGTTGCACAG GTGCAACCACATCGATTTGG 1.69 (SEQ ID NO:257) (SEQ ID NO:258)

5'-P03- 5'-P03-CGATGCCCCATCCGA

AAATCGATGTGGGCATCGAG TTT GG 1.70 (SEQ ID NO:259) (SEQ ID NO:260) 5'-P03- 5'-P03-

AAATCGATGTGTGCCTCCAG GGAGGCACACATCGATTTGG 1.71 (SEQ ID NO:261) (SEQ ID NO:262) 5'-P03- 5'-P03-

AAATCGATGTGTGCCTCAAG TGAGGCACACATCGATTTGG 1.72 (SEQ ID NO:263) (SEQ ID NO:264) 5'-P03- 5'-P03-

AAATCGATGTGGGCATCCAG GGATGCCCACATCGATTTGG 1.73 (SEQ ID NO:265) (SEQ ID NO:266)

5'-P03- 5'-P03-TGATGCCCA CAT CGA

AAATCGATGTGGGCATCAAG TTT GG 1.74 (SEQ ID NO:267) (SEQ ID NO:268)

5'-P03- 5'-P03-CGA CAG GCA CAT

AAATCGATGTGCCTGTCGAG CGA TTT GG 1.75 (SEQ ID NO:269) (SEQ ID NO:270)

5'-P03- 5'-P03-ATC CGT CCA CAT

AAATCGATGTGGACGGATAG CGA TTT GG 1.76 (SEQ ID NO:271) (SEQ ID NO:272)

5'-P03- 5'-P03-GGA CAG GCA CAT

1.77 AAATCGATGTGCCTGTCCAG CGA TTT GG (SEQ ID NO:273) (SEQ ID NO:274)

5'-P03- 5'-P03-CGT GCT TCA CAT

AAATCGATGTGAAGCACGAG CGA TTT GG 1.78 (SEQ ID NO:275) (SEQ ID NO:276)

5'-P03- 5'-P03-TGA CAG GCA CAT

AAATCGATGTGCCTGTCAAG CGA TTT GG 1.79 (SEQ ID NO:277) (SEQ ID NO:278)

5'-P03- 5'-P03-GGT GCT TCA CAT

AAATCGATGTGAAGCACCAG CGA TTT GG 1.80 (SEQ ID NO:279) (SEQ ID NO:280)

5'-P03- 5'-P03-ACG AAG GCA CAT

AAATCGATGTGCCTTCGTAG CGA TTT GG 1.81 (SEQ ID NO:281) (SEQ ID NO:282)

5'-P03- 5'-P03-CGG ACG ACA CAT

AAATCGATGTGTCGTCCGAG CGA TTT GG 1.82 (SEQ ID NO:283) (SEQ ID NO:284)

5'-P03- 5'-P03-CAG ACT CCA CAT

AAATCGATGTGGAGTCTGAG CGA TTT GG 1.83 (SEQ ID NO:285) (SEQ ID NO:286)

5'-P03- 5'-P03-CGG ATC ACA CAT

AAATCGATGTGTGATCCGAG CGA TTT GG 1.84 (SEQ ID NO:287) (SEQ ID NO:288)

5' -P03- 5'-P03-CGC CTG ACA CAT

AAATCGATGTGTCAGGCGAG CGA TTT GG 1.85 (SEQ ID NO:289) (SEQ ID NO:290)

5'-P03- 5'-P03-TGG ACG ACA CAT

AAATCGATGTGTCGTCCAAG CGA TTT GG 1.86 (SEQ ID NO:291) (SEQ ID NO:292)

5'-P03- 5'-P03-CTC CGT CCA CAT

AAATCGATGTGGACGGAGAG CGA TTT GG 1.87 (SEQ ID NO:293) (SEQ ID NO:294)

5'-P03- 5'-P03-CTG CTA CCA CAT

AAATCGATGTGGTAGCAGAG CGA TTT GG 1.88 (SEQ ID NO:295) (SEQ ID NO:296) 5'-P03- 5'-P03-

AAATCGATGTGGCTGTGTAG ACACAGCCACATCGATTTGG 1.89 (SEQ ID NO:297) (SEQ ID NO:298)

5'-P03- 5'-P03-GTC CGT CCA CAT

AAATCGATGTGGACGGACAG CGA TTT GG 1.90 (SEQ ID NO:299) (SEQ ID N0:300)

5'-P03- 5'-P03-TGC CTG ACA CAT

AAATCGATGTGTCAGGCAAG CGA TTT GG 1.91 (SEQ ID NO:301) (SEQ ID NO:302) 5'-P03- 5'-P03-

AAATCGATGTGGCTCGAAAG TTCGAGCCACATCGATTTGG 1.92 (SEQ ID NO:303) (SEQ ID NO:304)

5'-P03- 5'-P03-CCG AAG GCA CAT

AAATCGATGTGCCTTCGGAG CGA TTT GG 1.93 (SEQ ID NO:305) (SEQ ID NO:306)

5'-P03- 5'-P03-GTG CTA CCA CAT

AAATCGATGTGGTAGCACAG CGA TTT GG 1.94 (SEQ ID NO:307) (SEQ ID NO:308)

5'-P03- 5'-P03-GAC CTT CCA CAT

AAATCGATGTGGAAGGTCAG CGA TTT GG 1.95 (SEQ ID NO:309) (SEQ ID NO:310)

5'-P03- 5'-P03-ACA GCA CCA CAT

AAATCGATGTGGTGCTGTAG CGA TTT GG 1.96 (SEQ ID NO:311) (SEQ ID NO:312)

Tabel 4:1 cyklus 2 anvendte oligonukleotid-tags:

Tag nummer Topstrengsekvens Bundstrengsekvens

5'-P03-GTT GCC TGT 5'-P03-AGG CAA CCT 2.1 (SEQ ID NO:313) (SEQ ID NO:314)

5'-P03-CAG GAC GGT 5'-P03-CGT CCT GCT 2.2 (SEQ ID NO:315) (SEQ ID NO:316)

5'-P03-AGA CGT GGT 5'-P03-CAC GTC TCT 2.3 (SEQ ID NO:317) (SEQ ID NO:318)

5'-P03-CAG GAC CGT 5'-P03-GGT CCT GCT 2.4 (SEQ ID NO:319) (SEQ ID NO:320)

5'-P03-CAG GAC AGT 5'-P03-TGT CCT GCT 2.5 (SEQ ID NO:321) (SEQ ID NO:322)

5'-P03-CAC TCT GGT 5'-P03-CAG AGT GCT 2.6 (SEQ ID NO:323) (SEQ ID NO:324)

5'-P03-GAC GGC TGT 5'-P03-AGC CGT CCT 2.7 (SEQ ID NO:325) (SEQ ID NO:326)

5'-P03-CAC TCT CGT 5'-P03-GAG AGT GCT 2.8 (SEQ ID NO:327) (SEQ ID NO:328)

5'-P03-GTA GCC TGT 5'-P03-AGG CTA CCT 2.9 (SEQ ID NO:329) (SEQ ID NO:330)

5'-P03-GCC ACT TGT 5'-P03-AAG TGG CCT 2.10 (SEQ ID NO:331) (SEQ ID NO:332)

5'-P03-CAT CGC TGT 5'-P03-AGC GAT GCT 2.11 (SEQ ID NO:333) (SEQ ID NO:334)

5'-P03-CAC TGG TGT 5'-P03-ACC AGT GCT 2.12 (SEQ ID NO:335) (SEQ ID NO:336)

5'-P03-GCC ACT GGT 5'-P03-CAG TGG CCT 2.13 (SEQ ID NO:337) (SEQ ID NO:338)

5'-P03-TCT GGC TGT 5'-P03-AGC CAG ACT 2.14 (SEQ ID NO:339) (SEQ ID NO:340)

5'-P03-GCC ACT CGT 5'-P03-GAG TGG CCT 2.15 (SEQ ID NO:341) (SEQ ID NO:342)

5'-P03-TGC CTC TGT 5'-P03-AGA GGC ACT 2.16 (SEQ ID NO:343) (SEQ ID NO:344)

5'-P03-CAT CGC AGT 5'-P03-TGC GAT GCT 2.17 (SEQ ID NO:345) (SEQ ID NO:346)

5'-P03-CAG GAA GGT 5'-P03-CTT CCT GCT 2.18 (SEQ ID NO:347) (SEQ ID NO:348)

5'-P03-GGC ATC TGT 5'-P03-AGA TGC CCT 2.19 (SEQ ID NO:34 9) (SEQ ID NO:350)

5'-P03-CGG TGC TGT 5'-P03-AGC ACC GCT 2.20 (SEQ ID NO:351) (SEQ ID NO:352)

5'-P03-CAC TGG CGT 5'-P03-GCC AGT GCT 2.21 (SEQ ID NO:353) (SEQ ID NO:354)

5'-P03-TCTCCTCGT 5'-P03-GAGGAGACT 2.22 (SEQ ID NO:355) (SEQ ID NO:356)

5'-P03-CCT GTC TGT 5'-P03-AGA CAG GCT 2.23 (SEQ ID NO:357) (SEQ ID NO:358)

5'-P03-CAA CGC TGT 5'-P03-AGC GTT GCT 2.24 (SEQ ID NO:359) (SEQ ID NO:360)

5'-P03-TGC CTC GGT 5'-P03-CGA GGC ACT 2.25 (SEQ ID NO:361) (SEQ ID NO:362)

5'-P03-ACA CTG CGT 5'-P03-GCA GTG TCT 2.26 (SEQ ID NO:363) (SEQ ID NO:364)

5'-P03-TCG TCC TGT 5'-P03-AGG ACG ACT 2.27 (SEQ ID NO:365) (SEQ ID NO:366)

5'-P03-GCT GCC AGT 5'-P03-TGG CAG CCT 2.28 (SEQ ID NO:367) (SEQ ID NO:368)

5'-P03-TCA GGC TGT 5'-P03-AGC CTG ACT 2.29 (SEQ ID NO:369) (SEQ ID NO:370)

5'-P03-GCC AGG TGT 5'-P03-ACC TGG CCT 2.30 (SEQ ID NO:371) (SEQ ID NO:372)

5'-P03-CGG ACC TGT 5'-P03-AGG TCC GCT 2.31 (SEQ ID NO:373) (SEQ ID NO:374)

5'-P03-CAA CGC AGT 5'-P03-TGC GTT GCT 2.32 (SEQ ID NO:375) (SEQ ID NO:376)

5'-P03-CAC ACG AGT 5'-P03-TCG TGT GCT 2.33 (SEQ ID NO:377) (SEQ ID NO:378)

5'-P03-ATG GCC TGT 5'-P03-AGG CCA TCT 2.34 (SEQ ID NO:379) (SEQ ID NO:380)

5'-P03-CCA GTC TGT 5'-P03-AGA CTG GCT 2.35 (SEQ ID NO:381) (SEQ ID NO:382)

5'-P03-GCC AGG AGT 5'-P03-TCC TGG CCT 2.36 (SEQ ID NO:383) (SEQ ID NO:384)

5'-P03-CGG ACC AGT 5'-P03-TGG TCC GCT 2.37 (SEQ ID NO:385) (SEQ ID NO:386)

5'-P03-CCT TCG CGT 5'-P03-GCG AAG GCT 2.38 (SEQ ID NO:387) (SEQ ID NO:388)

5'-P03-GCA GCC AGT 5'-P03-TGG CTG CCT 2.39 (SEQ ID NO:389) (SEQ ID NO:390)

5'-P03-CCA GTC GGT 5'-P03-CGA CTG GCT 2.40 (SEQ ID NO:391) (SEQ ID NO:392)

5'-P03-ACT GAG CGT 5'-P03-GCT CAG TCT 2.41 (SEQ ID NO:393) (SEQ ID NO:394)

5'-P03-CCA GTC CGT 5'-P03-GGA CTG GCT 2.42 (SEQ ID NO:395) (SEQ ID NO:396)

5'-P03-CCA GTC AGT 5'-P03-TGA CTG GCT 2.43 (SEQ ID NO:397) (SEQ ID NO:398)

5'-P03-CAT CGA GGT 5'-P03-CTC GAT GCT 2.44 (SEQ ID NO:399) (SEQ ID N0:400)

5'-P03-CCA TCG TGT 5'-P03-ACG ATG GCT 2.45 (SEQ ID NO:401) (SEQ ID NO:402)

5'-P03-GTG CTG CGT 5'-P03-GCA GCA CCT 2.46 (SEQ ID NO:403) (SEQ ID NO:404)

5'-P03-GAC TAC GGT 5'-P03-CGT AGT CCT 2.47 (SEQ ID NO:405) (SEQ ID NO:406)

5'-P03-GTG CTG AGT 5'-P03-TCA GCA CCT 2.48 (SEQ ID NO:407) (SEQ ID NO:408)

5'-P03-GCTGCATGT 5'-P03-ATGCAGCCT 2.49 (SEQ ID NO:409) (SEQ ID NO:410)

5'-P03-GAGTGGTGT 5'-P03-ACCACTCCT 2.50 (SEQ ID NO:411) (SEQ ID NO:412)

5'-P03-GACTACCGT 5'-P03-GGTAGTCCT 2.51 (SEQ ID NO:413) (SEQ ID NO:414)

5'-P03-CGGTGATGT 5'-P03-ATCACCGCT 2.52 (SEQ ID NO:415) (SEQ ID NO:416)

5'-P03-TGCGACTGT 5'-P03-AGTCGCACT 2.53 (SEQ ID NO:417) (SEQ ID NO:418)

5'-P03-TCTGGAGGT 5'-P03-CTCCAGACT 2.54 (SEQ ID NO:419) (SEQ ID NO:420)

5'-P03-AGCACTGGT 5'-P03-CAGTGCTCT 2.55 (SEQ ID NO:421) (SEQ ID NO:422)

5'-P03-TCGCTTGGT 5'-P03-CAAGCGACT 2.56 (SEQ ID NO:423) (SEQ ID NO:424)

5'-P03-AGCACTCGT 5'-P03-GAGTGCTCT 2.57 (SEQ ID NO:425) (SEQ ID NO:426)

5'-P03-GCGATTGGT 5'-P03-CAATCGCCT 2.58 (SEQ ID NO:427) (SEQ ID NO:428)

5'-P03-CCATCGCGT 5'-P03-GCGATGGCT 2.59 (SEQ ID NO:429) (SEQ ID NO:430)

5'-P03-TCGCTTCGT 5'-P03-GAAGCGACT 2.60 (SEQ ID NO:431) (SEQ ID NO:432)

5'-P03-AGTGCCTGT 5'-P03-AGGCACTCT 2.61 (SEQ ID NO:433) (SEQ ID NO:434)

5'-P03-GGCATAGGT 5'-P03-CTATGCCCT 2.62 (SEQ ID NO:435) (SEQ ID NO:436)

5'-P03-GCGATTCGT 5'-P03-GAATCGCCT 2.63 (SEQ ID NO:437) (SEQ ID NO:438)

5'-P03-TGCGACGGT 5'-P03-CGTCGCACT 2.64 (SEQ ID NO:439) (SEQ ID NO:440)

5'-P03-GAGTGGCGT 5'-P03-GCCACTCCT 2.65 (SEQ ID NO:441) (SEQ ID NO:442)

5'-P03-CGGTGAGGT 5'-P03-CTCACCGCT 2.66 (SEQ ID NO:443) (SEQ ID NO:444)

5'-P03-GCTGCAAGT 5'-P03-TTGCAGCCT 2.67 (SEQ ID NO:445) (SEQ ID NO:446)

5'-P03-TTCCGCTGT 5'-P03-AGCGGAACT 2.68 (SEQ ID NO:447) (SEQ ID NO:448)

5'-P03-GAGTGGAGT 5'-P03-TCCACTCCT 2.69 (SEQ ID NO:449) (SEQ ID NO:450)

5'-P03-ACAGAGCGT 5'-P03-GCTCTGTCT 2.70 (SEQ ID NO:451) (SEQ ID NO:452)

5'-P03-TGCGACCGT 5'-P03-GGTCGCACT 2.71 (SEQ ID NO:453) (SEQ ID NO:454)

5'-P03-CCTGTAGGT 5'-P03-CTACAGGCT 2.72 (SEQ ID NO:455) (SEQ ID NO:456)

5'-P03-TAGCCGTGT 5'-P03-ACGGCTACT 2.73 (SEQ ID NO:457) (SEQ ID NO:458)

5'-P03-TGCGACAGT 5'-P03-TGTCGCACT 2.74 (SEQ ID NO:459) (SEQ ID NO:460)

5'-P03-GGTCTGTGT 5'-P03-ACAGACCCT 2.75 (SEQ ID NO:461) (SEQ ID NO:462)

5'-P03-CGGTGAAGT 5'-P03-TTCACCGCT 2.76 (SEQ ID NO:463) (SEQ ID NO:464)

5'-P03-CAACGAGGT 5'-P03-CTCGTTGCT 2.77 (SEQ ID NO:465) (SEQ ID NO:466)

5'-P03-GCAGCATGT 5'-P03-ATGCTGCCT 2.78 (SEQ ID NO:467) (SEQ ID NO:468)

5'-P03-TCGTCAGGT 5'-P03-CTGACGACT 2.79 (SEQ ID NO:469) (SEQ ID NO:470)

5'-P03-AGTGCCAGT 5'-P03-TGGCACTCT 2.80 (SEQ ID NO:471) (SEQ ID NO:472)

5'-P03-TAGAGGCGT 5'-P03-GCCTCTACT 2.81 (SEQ ID NO:473) (SEQ ID NO:474)

5'-P03-GTCAGCGGT 5'-P03-CGCTGACCT 2.82 (SEQ ID NO:475) (SEQ ID NO:476)

5'-P03-TCAGGAGGT 5'-P03-CTCCTGACT 2.83 (SEQ ID NO:477) (SEQ ID NO:478)

5'-P03-AGCAGGTGT 5'-P03-ACCTGCTCT 2.84 (SEQ ID NO:479 (SEQ ID NO:480)

5'-P03-TTCCGCAGT 5'-P03-TGCGGAACT 2.85 (SEQ ID NO:481) (SEQ ID NO:482)

5'-P03-GTCAGCCGT 5'-P03-GGCTGACCT 2.86 (SEQ ID NO:483) (SEQ ID NO:484)

5'-P03-GGTCTGCGT 5'-P03-GCAGACCCT 2.87 (SEQ ID NO:485) (SEQ ID NO:486)

5'-P03-TAGCCGAGT 5'-P03-TCGGCTACT 2.88 (SEQ ID NO:487) (SEQ ID NO:488)

5'-P03-GTCAGCAGT 5'-P03-TGCTGACCT 2.89 (SEQ ID NO:489) (SEQ ID NO:490)

5'-P03-GGTCTGAGT 5'-P03-TCAGACCCT 2.90 (SEQ ID NO:4 91) (SEQ ID NO:492)

5'-P03-CGGACAGGT 5'-P03-CTGTCCGCT 2.91 (SEQ ID NO:4 93) (SEQ ID NO:494) 5'-P03-TTAGCCGGT5' - 5'-P03-CGGCTAACT5'- P03-3’ P03-3’ 2.92 (SEQ ID NO:495) (SEQ ID NO:496)

2.93 5'-P03-GAGACGAGT 5'-P03-TCGTCTCCT (SEQ ID NO:497) (SEQ ID NO:498)

5'-P03-CGTAACCGT 5'-P03-GGTTACGCT 2.94 (SEQ ID NO:499) (SEQ ID N0:500) 5'-P03-TTGGCGTGT5'- 5'-P03-ACGCCAACT5 ' - P03-3' P03-3' 2.95 (SEQ ID NO:501) (SEQ ID NO:502)

5'-P03-ATGGCAGGT 5'-P03-CTGCCATCT 2.96 (SEQ ID NO:503) (SEQ ID NO:504)

Tabel 5: I cyklus 3 anvendte oligonukleotid-tags

Tagnummer Topstrengsekvens Bundstrengsekvens

5'-P03-CAG CTA CGA 5'-P03-GTA GCT GAC 3.1 (SEQ ID NO:505) (SEQ ID NO:506)

5'-P03-CTC CTG CGA 5'-P03-GCA GGA GAC 3.2 (SEQ ID NO:5 0 7 ) (SEQ ID NO:508)

5'-P03-GCT GCC TGA 5'-P03-AGG CAG CAC 3.3 (SEQ ID NO:50 9) (SEQ ID NO:510)

5'-P03-CAG GAA CGA 5'-P03-GTT CCT GAC 3.4 (SEQ ID NO:511) (SEQ ID NO:512)

5'-P03-CAC ACG CGA 5'-P03-GCG TGT GAC 3.5 (SEQ ID NO:513) (SEQ ID NO:514)

5'-P03-GCA GCC TGA 5'-P03-AGG CTG CAC 3.6 (SEQ ID NO:515) (SEQ ID NO:516)

5' -P03-CTG AAC GGA 5'-P03-CGT TCA GAC 3.7 (SEQ ID NO:517) (SEQ ID NO:518)

5'-P03-CTG AAC CGA 5'-P03-GGT TCA GAC 3.8 (SEQ ID NO:519) (SEQ ID NO:520)

5' -P03-TCT GGA CGA 5'-P03-GTC CAG AAC 3.9 (SEQ ID NO:521) (SEQ ID NO:522)

3.10 5' -P03-TGC CTA CGA 5'-P03-GTA GGC AAC (SEQ ID NO:523) (SEQ ID NO:524)

5'-P03-GGC ΔΤΔ CGA 5'-P03-GTA TGC CAC 3.11 (SEQ ID NO:525) (SEQ ID NO:526)

5'-P03-CGG TGA CGA 5'-P03-GTC ACC GAC 3.12 (SEQ ID NO:527) (SEQ ID NO:528)

5'-P03-CAA CGA CGA 5'-P03-GTC GTT GAC 3.13 (SEQ ID NO:52 9) (SEQ ID NO:530)

5' -P03-CTC CTC TGA 5'-P03-AGA GGA GAC 3.14 (SEQ ID NO:531) (SEQ ID NO:532)

5'-P03-TCA GGA CGA 5'-P03-GTC CTG AAC 3.15 (SEQ ID NO:533) (SEQ ID NO:534)

5'-P03-AAA GGC GGA 5'-P03-CGC CTT TAC 3.16 (SEQ ID NO:535) (SEQ ID NO:536)

5'-P03-CTC CTC GGA 5'-P03-CGA GGA GAC 3.17 (SEQ ID NO:537) (SEQ ID NO:538)

5'-P03-CAG ATG CGA 5'-P03-GCA TCT GAC 3.18 (SEQ ID NO:539) (SEQ ID NO:540)

5'-P03-GCA GCA AGA 5'-P03-TTG CTG CAC 3.19 (SEQ ID NO:541) (SEQ ID NO:542)

5'-P03-GTG GAG TGA 5'-P03-ACT CCA CAC 3.20 (SEQ ID NO:543) (SEQ ID NO:544)

5'-P03-CCA GTA GGA 5'-P03-CTA CTG GAC 3.21 (SEQ ID NO:545) (SEQ ID NO:546)

5'-P03-ATG GCA CGA 5'-P03-GTG CCA TAC 3.22 (SEQ ID NO:547) (SEQ ID NO:548)

5'-P03-GGA CTG TGA 5'-P03-ACA GTC CAC 3.23 (SEQ ID NO:549) (SEQ ID NO:550)

5'-P03-CCG AAC TGA 5'-P03-AGT TCG GAC 3.24 (SEQ ID NO:551) (SEQ ID NO:552)

5' -P03-CTC CTC AGA 5'-P03-TGA GGA GAC 3.25 (SEQ ID NO:553) (SEQ ID NO:554)

3.26 5'-P03-CAC TGC TGA 5'-P03-AGC AGT GAC (SEQ ID NO:555) (SEQ ID NO:556)

5'-P03-AGC AGG CGA 5'-P03-GCC TGC TAC 3.27 (SEQ ID NO:557) (SEQ ID NO:558)

5'-P03-AGC AGG AGA 5'-P03-TCC TGC TAC 3.28 (SEQ ID NO:559) (SEQ ID NO:560)

5'-P03-AGA GCC AGA 5'-P03-TGG CTC TAC 3.29 (SEQ ID NO:561) (SEQ ID NO:562)

5'-P03-GTC GTT GGA 5'-P03-CAA CGA CAC 3.30 (SEQ ID NO:563) (SEQ ID NO:564)

5' -P03-CCG AAC GGA 5'-P03-CGT TCG GAC 3.31 (SEQ ID NO:565) (SEQ ID NO:566)

5'-P03-CAC TGC GGA 5'-P03-CGC AGT GAC 3.32 (SEQ ID NO:567) (SEQ ID NO:568)

5'-P03-GTG GAG CGA 5'-P03-GCT CCA CAC 3.33 (SEQ ID NO:569) (SEQ ID NO:570)

5'-P03-GTG GAG AGA 5'-P03-TCT CCA CAC 3.34 (SEQ ID NO:571) (SEQ ID NO:572)

5'-P03-GGA CTG CGA 5'-P03-GCA GTC CAC 3.35 (SEQ ID NO:573) (SEQ ID NO:574)

5'-P03-CCG AAC CGA 5'-P03-GGT TCG GAC 3.36 (SEQ ID NO:575) (SEQ ID NO:576)

5'-P03-CAC TGC CGA 5'-P03-GGC AGT GAC 3.37 (SEQ ID NO:577) (SEQ ID NO:578)

5'-P03-CGA AAC GGA 5'-P03-CGT TTC GAC 3.38 (SEQ ID NO:579) (SEQ ID NO:580)

5'-P03-GGA CTG AGA 5'-P03-TCA GTC CAC 3.39 (SEQ ID NO:581) (SEQ ID NO:582)

5'-P03-CCG AAC AGA 5'-P03-TGT TCG GAC 3.40 (SEQ ID NO:583) (SEQ ID NO:584)

5'-P03-CGA AAC CGA 5'-P03-GGT TTC GAC 3.41 (SEQ ID NO:585) (SEQ ID NO:586)

3.42 5'-P03-CTG GCT TGA 5'-P03-AAG CCA GAC (SEQ ID NO:587) (SEQ ID NO:588)

5'-P03-CAC ACC TGA 5'-P03-AGG TGT GAC 3.43 (SEQ ID NO:589) (SEQ ID NO:590)

5'-P03-AAC GAC CGA 5'-P03-GGT CGT TAC 3.44 (SEQ ID NO:591) (SEQ ID NO:592)

5'-P03-ATC CAG CGA 5'-P03-GCT GGA TAC 3.45 (SEQ ID NO:593) (SEQ ID NO:594)

5'-P03-TGC GAA GGA 5'-P03-CTT CGC AAC 3.46 (SEQ ID NO:595) (SEQ ID NO:596)

5' -P03-TGC G AA CGA 5'-P03-GTT CGC AAC 3.47 (SEQ ID NO:597) (SEQ ID NO:598)

5'-P03-CTG GCT GGA 5'-P03-CAG CCA GAC 3.48 (SEQ ID NO:599) (SEQ ID NO:600)

5'-P03-CAC ACC GGA 5'-P03-CGG TGT GAC 3.49 (SEQ ID NO:601) (SEQ ID NO:602)

5'-P03-AGT GCA GGA 5'-P03-CTG CAC TAC 3.50 (SEQ ID NO:603) (SEQ ID NO:604)

5'-P03-GAC CGT TGA 5'-P03-AAC GGT CAC 3.51 (SEQ ID NO:605) (SEQ ID NO:606)

5'-P03-GGT GAG TGA 5'-P03-ACT CAC CAC 3.52 (SEQ ID NO:607) (SEQ ID NO:608)

5'-P03-CCT TCC TGA 5'-P03-AGG AAG GAC 3.53 (SEQ ID NO:609) (SEQ ID NO:610)

5'-P03-CTG GCT AGA 5'-P03-TAG CCA GAC 3.54 (SEQ ID NO:611) (SEQ ID NO:612)

5'-P03-CAC ACC AGA 5'-P03-TGG TGT GAC 3.55 (SEQ ID NO:613) (SEQ ID NO:614)

5'-P03-AGC GGT AGA 5'-P03-TAC CGC TAC 3.56 (SEQ ID NO:615) (SEQ ID NO:616)

5' -P03-GTC AGA GGA 5'-P03-CTC TGA CAC 3.57 (SEQ ID NO:617) (SEQ ID NO:618)

3.58 5' -P03-TTC CGA CGA 5'-P03-GTC GGA AAC (SEQ ID NO:619) (SEQ ID NO:620)

5'-P03-AGG CGT AGA 5'-P03-TAC GCC TAC 3.59 (SEQ ID NO:621) (SEQ ID NO:622)

5' -P03-CTC GAC TGA 5'-P03-AGT CGA GAC 3.60 (SEQ ID NO:623) (SEQ ID NO:624)

5'-P03-TAC GCT GGA 5'-P03-CAG CGT AAC 3.61 (SEQ ID NO:625) (SEQ ID NO:626)

5'-P03-GTT CGG TGA 5'-P03-ACC GAA CAC 3.62 (SEQ ID NO:627) (SEQ ID NO:628)

5'-P03-GCC AGC AGA 5'-P03-TGC TGG CAC 3.63 (SEQ ID NO:629) (SEQ ID NO:630)

5'-P03-GAC CGT AGA 5'-P03-TAC GGT CAC 3.64 (SEQ ID NO:631) (SEQ ID NO:632)

5'-P03-GTG CTC TGA 5'-P03-AGA GCA CAC 3.65 (SEQ ID NO:633) (SEQ ID NO:634)

5' -P03-GGT GAG CGA 5'-P03-GCT CAC CAC 3.66 (SEQ ID NO:635) (SEQ ID NO:636)

5'-P03-GGT GAG AGA 5'-P03-TCT CAC CAC 3.67 (SEQ ID NO:637) (SEQ ID NO:638)

5'-P03-CCT TCC AGA 5'-P03-TGG AAG GAC 3.68 (SEQ ID NO:639) (SEQ ID NO:640)

5' -P03-CTC CTA CGA 5'-P03-GTA GGA GAC 3.69 (SEQ ID NO:641) (SEQ ID NO:642)

5'-P03-CTC GAC GGA 5'-P03-CGT CGA GAC 3.70 (SEQ ID NO:643) (SEQ ID NO:644)

5'-P03-GCC GTT TGA 5'-P03-AAA CGG CAC 3.71 (SEQ ID NO:645) (SEQ ID NO:646)

5'-P03-GCG GAG TGA 5'-P03-ACT CCG CAC 3.72 (SEQ ID NO:647) (SEQ ID NO:648)

5'-P03-CGT GCT TGA 5'-P03-AAG CAC GAC 3.73 (SEQ ID NO:649) (SEQ ID NO:650)

3.74 5'-P03-CTC GAC CGA 5'-P03-GGT CGA GAC (SEQ ID NO:651) (SEQ ID NO:652)

5'-P03-AGA GCA GGA 5'-P03-CTG CTC TAC 3.75 (SEQ ID NO:653) (SEQ ID NO:654)

5' -P03-GTG CTC GGA 5'-P03-CGA GCA CAC 3.76 (SEQ ID NO:655) (SEQ ID NO:656)

5' -P03-CTC GAC AGA 5'-P03-TGT CGA GAC 3.77 (SEQ ID NO:657) (SEQ ID NO:658)

5'-P03-GGA GAG TGA 5'-P03-ACT CTC CAC 3.78 (SEQ ID NO:659) (SEQ ID NO:660)

5'-P03-AGG CTG TGA 5'-P03-ACA GCC TAC 3.79 (SEQ ID NO:661) (SEQ ID NO:662)

5'-P03-AGA GCA CGA 5'-P03-GTG CTC TAC 3.80 (SEQ ID NO:663) (SEQ ID NO:664)

5'-P03-CCA TCC TGA 5'-P03-AGG ATG GAC 3.81 (SEQ ID NO:665) (SEQ ID NO:666)

5' -P03-GTT CGG AGA 5'-P03-TCC G AA CAC 3.82 (SEQ ID NO:667) (SEQ ID NO:668)

5'-P03-TGG TAG CGA 5'-P03-GCT ACC AAC 3.83 (SEQ ID NO:669) (SEQ ID NO:670)

5'-P03-GTG CTC CGA 5'-P03-GGA GCA CAC 3.84 (SEQ ID NO:671) (SEQ ID NO:672)

5'-P03-GTG CTC AGA 5'-P03-TGA GCA CAC 3.85 (SEQ ID NO:673) (SEQ ID NO:674)

5'-P03-GCC GTT GGA 5'-P03-CAA CGG CAC 3.86 (SEQ ID NO:675) (SEQ ID NO:676)

5'-P03-GAG TGC TGA 5'-P03-AGC ACT CAC 3.87 (SEQ ID NO:677) (SEQ ID NO:678)

5' -P03-GCT CCT TGA 5'-P03-AAG GAG CAC 3.88 (SEQ ID NO:679) (SEQ ID NO:680)

5' -P03-CCG AAA GGA 5'-P03-CTT TCG GAC 3.89 (SEQ ID NO:681) (SEQ ID NO:682)

3.90 5'-P03-CAC TGA GGA 5'-P03-CTC AGT GAC (SEQ ID NO:683) (SEQ ID NO:684)

5' -P03-CGT GCT GGA 5'-P03-CAG CAC GAC 3.91 (SEQ ID NO:685) (SEQ ID NO:686)

5'-P03-CCG AAA CGA 5'-P03-GTT TCG GAC 3.92 (SEQ ID NO:687) (SEQ ID NO:688)

5' -P03-GCG GAG AGA 5'-P03-TCT CCG CAC 3.93 (SEQ ID NO:689) (SEQ ID NO:690)

5'-P03-GCC GTT AGA 5'-P03-TAA CGG CAC 3.94 (SEQ ID NO:691) (SEQ ID NO:692)

5'-P03-TCT CGT GGA 5'-P03-CAC GAG AAC 3.95 (SEQ ID NO:693) (SEQ ID NO:694)

5' -P03-CGT GCT AGA 5'-P03-TAG CAC GAC 3.96 (SEQ ID NO:695) (SEQ ID NO:696)

Tabel 6:1 cyklus 4 anvendte oligonukleotid-tags

Tagnummer Topstrengsekvens Bundstrengsekvens

5'-P03-GCCTGTCTT 5'-P03-GAC AGG CTC 4.1 (SEQ ID NO:697) (SEQ ID NO:698)

5'-P03-CTCCTGGTT 5'-P03-CCA GGA GTC 4.2 (SEQ ID NO:699) (SEQ ID NO:700)

5'-P03-ACTCTGCTT 5'-P03-GCA GAG TTC 4.3 (SEQ ID NO:701) (SEQ ID NO:702)

5'-P03-CATCGCCTT 5'-P03-GGC GAT GTC 4.4 (SEQ ID NO:703) (SEQ ID NO:704)

5'-P03-GCCACTATT 5'-P03-TAG TGG CTC 4.5 (SEQ ID NO:705) (SEQ ID NO:706)

5'-P03-CACACGGTT 5'-P03-CCG TGT GTC 4.6 (SEQ ID NO:707) (SEQ ID NO:708)

4.7 5'-P03-CAACGCCTT 5'-P03-GGC GTT GTC (SEQ ID NO:709) (SEQ ID NO:710)

5'-P03-ACTGAGGTT 5'-P03-CCT CAG TTC 4.8 (SEQ ID NO:711) (SEQ ID NO:712)

5'-P03-GTGCTGGTT 5'-P03-CCA GCA CTC 4.9 (SEQ ID NO:713) (SEQ ID NO:714)

5'-P03-CATCGACTT 5'-P03-GTC GAT GTC 4.10 (SEQ ID NO:715) (SEQ ID NO:716)

5'-P03-CCATCGGTT 5'-P03-CCG ATG GTC 4.11 (SEQ ID NO:717) (SEQ ID NO:718)

5'-P03-GCTGCACTT 5'-P03-GTG CAG CTC 4.12 (SEQ ID NO:719) (SEQ ID NO:720)

5'-P03-ACAGAGGTT 5'-P03-CCT CTG TTC 4.13 (SEQ ID NO:721) (SEQ ID NO:722)

5'-P03-AGTGCCGTT 5'-P03-CGG CAC TTC 4.14 (SEQ ID NO:723) (SEQ ID NO:724)

5'-P03-CGGACATTT 5'-P03-ATG TCC GTC 4.15 (SEQ ID NO:725) (SEQ ID NO:726)

5'-P03-GGTCTGGTT 5'-P03-CCA GAC CTC 4.16 (SEQ ID NO:727) (SEQ ID NO:728)

5'-P03-GAGACGGTT 5'-P03-CCG TCT CTC 4.17 (SEQ ID NO:729) (SEQ ID NO:730)

5'-P03-CTTTCCGTT 5'-P03-CGG AAA GTC 4.18 (SEQ ID NO:731) (SEQ ID NO:732)

5'-P03-CAGATGGTT 5'-P03-CCA TCT GTC 4.19 (SEQ ID NO:733) (SEQ ID NO:734)

5'-P03-CGGACACTT 5'-P03-GTG TCC GTC 4.20 (SEQ ID NO:735) (SEQ ID NO:736)

5'-P03-ACTCTCGTT 5'-P03-CGA GAG TTC 4.21 (SEQ ID NO:737) (SEQ ID NO:738)

5'-P03-GCAGCACTT 5'-P03-GTG CTG CTC 4.22 (SEQ ID NO:739) (SEQ ID NO:740)

4.23 5'-P03-ACTCTCCTT 5'-P03-GGA GAG TTC (SEQ ID NO:741) (SEQ ID NO:742)

5'-P03-ACCTTGGTT 5'-P03-CCA AGG TTC 4.24 (SEQ ID NO:743) (SEQ ID NO:744)

5'-P03-AGAGCCGTT 5'-P03-CGG CTC TTC 4.25 (SEQ ID NO:745) (SEQ ID NO:746)

5'-P03-ACCTTGCTT 5'-P03-GCA AGG TTC 4.26 (SEQ ID NO:747) (SEQ ID NO:748)

5'-P03-CGG ACT 5'-P03-AAGTCCGTT TTC 4.27 (SEQ ID NO:749) (SEQ ID NO:750)

5'-P03-GGA CTG GTT 5'-P03-CCA GTC CTC 4.28 (SEQ ID NO:751) (SEQ ID NO:752)

5'-P03-GTCGTTCTT 5'-P03-GAA CGA CTC 4.29 (SEQ ID NO:753) (SEQ ID NO:754)

5'-P03-CAGCATCTT 5'-P03-GAT GCT GTC 4.30 (SEQ ID NO:755) (SEQ ID NO:756)

5'-P03-CTATCCGTT 5'-P03-CGG ATA GTC 4.31 (SEQ ID NO:757) (SEQ ID NO:758)

5'-P03-ACACTCGTT 5'-P03-CGA GTG TTC 4.32 (SEQ ID NO:759) (SEQ ID NO:760)

5'-P03-ATCCAGGTT 5'-P03-CCT GGA TTC 4.33 (SEQ ID NO:761) (SEQ ID NO:762)

5'-P03-GTTCCTGTT 5'-P03-CAG GAA CTC 4.34 (SEQ ID NO:763) (SEQ ID NO:764)

5'-P03-ACACTCCTT 5'-P03-GGA GTG TTC 4.35 (SEQ ID NO:765) (SEQ ID NO:766)

5'-P03-GTTCCTCTT 5'-P03-GAG GAA CTC 4.36 (SEQ ID NO:767) (SEQ ID NO:768)

5'-P03-CTGGCTCTT 5'-P03-GAG CCA GTC 4.37 (SEQ ID NO:769) (SEQ ID NO:770)

5'-P03-ACGGCATTT 5'-P03-ATG CCG TTC 4.38 (SEQ ID NO:771) (SEQ ID NO:772)

5'-P03-GGTGAGGTT 5'-P03-CCT CAC CTC 4.39 (SEQ ID NO:773) (SEQ ID NO:774)

5'-P03-CCTTCCGTT 5'-P03-CGG AAG GTC 4.40 (SEQ ID NO:775) (SEQ ID NO:776)

5'-P03-TACGCTCTT 5'-P03-GAG CGT ATC 4.41 (SEQ ID NO:777) (SEQ ID NO:778)

5'-P03-ACGGCAGTT 5'-P03-CTG CCG TTC 4.42 (SEQ ID NO:779) (SEQ ID NO:780

5'-P03-ACTGACGTT 5'-P03-CGT CAG TTC 4.43 (SEQ ID NO:781) (SEQ ID NO:782)

5'-P03-ACGGCACTT 5'-P03-GTG CCG TTC 4.44 (SEQ ID NO:783) (SEQ ID NO:784)

5'-P03-ACTGACCTT 5'-P03-GGT CAG TTC 4.45 (SEQ ID NO:785) (SEQ ID NO:786)

5'-P03-TTTGCGGTT 5'-P03-CCG CAA ATC 4.46 (SEQ ID NO:787) (SEQ ID NO:788)

5'-P03-TGGTAGGTT 5'-P03-CCT ACC ATC 4.47 (SEQ ID NO:789) (SEQ ID NO:790)

5'-P03-GTTCGGCTT 5'-P03-GCC GAA CTC 4.48 (SEQ ID NO:791) (SEQ ID NO:792)

5'-P03-GCC GTT CTT 5'-P03-GAA CGG CTC 4.49 (SEQ ID NO:793) (SEQ ID NO:794)

5'-P03-GGAGAGGTT 5'-P03-CCT CTC CTC 4.50 (SEQ ID NO:795) (SEQ ID NO:796)

5'-P03-CACTGACTT 5'-P03-GTC AGT GTC 4.51 (SEQ ID NO:7 97) (SEQ ID NO:798)

5'-P03-CGTGCTCTT 5'-P03-GAG CAC GTC 4.52 (SEQ ID NO:799) (SEQ ID N0:800)

5'-P03-AATCCGCTT 5'-P03-GCGGATTTC 4.53 (SEQ ID NO:801) (SEQ ID NO:802)

5'-P03-AGGCTGGTT 5'-P03-CCA GCC TTC 4.54 (SEQ ID NO:803) (SEQ ID NO:804)

5'-P03-GCTAGTGTT 5'-P03-CAC TAG CTC 4.55 (SEQ ID NO:805) (SEQ ID NO:806)

5'-P03-GGAGAGCTT 5'-P03-GCT CTC CTC 4.56 (SEQ ID NO:807) (SEQ ID NO:808)

5'-P03-GGAGAGATT 5'-P03-TCT CTC CTC 4.57 (SEQ ID NO:809) (SEQ ID NO:810)

5'-P03-AGGCTGCTT 5'-P03-GCA GCC TTC 4.58 (SEQ ID N0:811) (SEQ ID NO:812)

5'-P03-GAGTGCGTT 5'-P03-CGC ACT CTC 4.59 (SEQ ID NO:813) (SEQ ID NO:814)

5'-P03-CCATCCATT 5'-P03-TGG ATG GTC 4.60 (SEQ ID NO:815) (SEQ ID NO:816)

5'-P03-GCTAGTCTT 5'-P03-GAC TAG CTC 4.61 (SEQ ID NO:817) (SEQ ID NO:818)

5'-P03-AGGCTGATT 5'-P03-TCA GCC TTC 4.62 (SEQ ID NO:819) (SEQ ID NO:820)

5'-P03-ACAGACGTT 5'-P03-CGT CTG TTC 4.63 (SEQ ID NO:821) (SEQ ID NO:822)

5'-P03-GAGTGCCTT 5'-P03-GGC ACT CTC 4.64 (SEQ ID NO:823) (SEQ ID NO:824)

5'-P03-ACAGACCTT 5'-P03-GGT CTG TTC 4.65 (SEQ ID NO:825) (SEQ ID NO:826)

5'-P03-CGAGCTTTT 5'-P03-AAG CTC GTC 4.66 (SEQ ID NO:827) (SEQ ID NO:828)

5'-P03-TTAGCGGTT 5'-P03-CCG CTA ATC 4.67 (SEQ ID NO:829) (SEQ ID NO:830)

5'-P03-CCTCTTGTT 5'-P03-CAA GAG GTC 4.68 (SEQ ID NO:831) (SEQ ID NO:832)

5'-P03-GGTCTCTTT 5'-P03-AGA GAC CTC 4.69 (SEQ ID NO:833) (SEQ ID NO:834)

5'-P03-GCCAGATTT 5'-P03-ATC TGG CTC 4.70 (SEQ ID NO:835) (SEQ ID NO:836)

5'-P03-GAGACCTTT 5'-P03-AGG TCT CTC 4.71 (SEQ ID NO:837) (SEQ ID NO:838)

5'-P03-CACACAGTT 5'-P03-CTG TGT GTC 4.72 (SEQ ID NO:839) (SEQ ID NO:840)

5'-P03-CCTCTTCTT 5'-P03-GAA GAG GTC 4.73 (SEQ ID NO:841) (SEQ ID NO:842)

5'-P03-TAGAGCGTT 5'-P03-CGC TCT ATC 4.74 (SEQ ID NO:843) (SEQ ID NO:844)

5'-P03-GCACCTTTT 5'-P03-AAG GTG CTC 4.75 (SEQ ID NO:845) (SEQ ID NO:846)

5'-P03-GGCTTGTTT 5'-P03-ACA AGC CTC 4.76 (SEQ ID NO:847) (SEQ ID NO:848)

5'-P03-GACGCGATT 5'-P03-TCG CGT CTC 4.77 (SEQ ID NO:849) (SEQ ID NO:850)

5'-P03-CGAGCTGTT 5'-P03-CAG CTC GTC 4.78 (SEQ ID NO:851) (SEQ ID NO:852)

5'-P03-TAGAGCCTT 5'-P03-GGC TCT ATC 4.79 (SEQ ID NO:853) (SEQ ID NO:854)

5'-P03-CATCCGTTT 5'-P03-ACG GAT GTC 4.80 (SEQ ID NO:855) (SEQ ID NO:856)

5'-P03-GGTCTCGTT 5'-P03-CGA GAC CTC 4.81 (SEQ ID NO:857) (SEQ ID NO:858)

5'-P03-GCCAGAGTT 5'-P03-CTC TGG CTC 4.82 (SEQ ID NO:859) (SEQ ID NO:860)

5'-P03-GAGACCGTT 5'-P03-CGG TCT CTC 4.83 (SEQ ID NO:861) (SEQ ID NO:862)

5'-P03-CGAGCTATT 5'-P03-TAG CTC GTC 4.84 (SEQ ID NO:863) (SEQ ID NO:864)

5'-P03-GCAAGTGTT 5'-P03-CAC TTG CTC 4.85 (SEQ ID NO:865) (SEQ ID NO:866)

5'-P03-GGTCTCCTT 5'-P03-GGA GAC CTC 4.86 (SEQ ID NO:867) (SEQ ID NO:868)

5'-P03-GCCAGACTT 5'-P03-GTC TGG CTC 4.87 (SEQ ID NO:869) (SEQ ID NO:870)

5'-P03-GGTCTCATT 5'-P03-TGA GAC CTC 4.88 (SEQ ID NO:871) (SEQ ID NO:872)

5'-P03-GAGACCATT 5'-P03-TGG TCT CTC 4.89 (SEQ ID NO:873) (SEQ ID NO:874)

5'-P03-CCTTCAGTT 5'-P03-CTG AAG GTC 4.90 (SEQ ID NO:875) (SEQ ID NO:876)

5'-P03-GCACCTGTT 5'-P03-CAG GTG CTC 4.91 (SEQ ID NO:877) (SEQ ID NO:878)

5'-P03-AAAGGCGTT 5'-P03-CGC CTT TTC 4.92 (SEQ ID NO:879) (SEQ ID NO:880)

5'-P03-CAGATCGTT 5'-P03-CGA TCT GTC 4.93 (SEQ ID NO:881) (SEQ ID NO:882)

5'-P03-CATAGGCTT 5'-P03-GCC TAT GTC 4.94 (SEQ ID NO:883) (SEQ ID NO:884)

5'-P03-CCTTCACTT 5'-P03-GTG AAG GTC 4.95 (SEQ ID NO:885) (SEQ ID NO:886)

5'-P03-GCACCTCTT 5'-P03-GAG GTG CTC 4.96 (SEQ ID NO:887) (SEQ ID NO:888)

Tabel 7: Overensstemmelse mellem byggesten og oligonukleotid-tags for Cyklus 1-4.

1X ligase-buffer: 50 mM Tris, pH 7,5; 10 mM dithiothreitol; 10 mM MgCl2; 2mM ATP; 50 mM NaCI. 10X ligase-buffer: 500 mM Tris, pH 7,5; 100 mM dithiothreitol; 100 mM MgCl2; 20 mM ATP; 500 mM NaCI.

Fastknytning af Water Soluble Spacer til Forbindelse 2

Til en opløsning af Forbindelse 2 (60 ml_, 1 mM) i natriumboratbuffer (150 mM, pH 9,4), der var afkølet til 4 °C, blev der tilsat 40 ækvivalenter N-Fmoc-15-amino-4,7,10,13-tetraoxaoctadecanosyre (S-Ado) i N,N-dimethylformamid (DMF) (16 ml_, 0,15 M) efterfulgt af 40 ækvivalenter 4-(4,6-dimethoxy-[1.3.5]triazin-2-yl)-4-methylmorpholiniumchloridhydrat (DMTMM) i vand (9,6 ml_, 0,25 M). Blandingen blev rystet forsigtigt i 2 timer ved 4 °C, inden der blev tilsat yderligere 40 ækvivalenter S-Ado og DMTMM, og blev rystet i yderligere 16 timer ved 4 °C.

Efter acylering blev der tilsat et 0,1 X volumen 5 M vandigt NaCI og et 2,5X volumen kold (-20 °C) ethanol, og blandingen fik lov til at stå ved -20 °C i mindst én time. Blandingen blev derefter centrifugeret i 15 minutter ved 14 000 omdr./min. i en 4 °C centrifuge til opnåelse af en hvid pellet, der blev vasket med koldt EtOH og derefter tørret i et lyofiliseringsapparat ved rumtemperatur i 30 minutter. Faststoffet blev opløst i 40 mL vand og oprenset med omvendt fase HPLC med en Waters Xterra RP-i8 kolonne. Der blev anvendt en gradientprofil med binær mobil fase til at eluere produktet under anvendelse af en 50 mM vandig triethylammoniumacetatbuffer ved pH 7,5 og 99 % acetonitril/1 % vandopløsning. Det oprensede materiale blev koncentreret ved lyofilisering, og den resulterende rest blev opløst i 5 mL vand. Der blev tilsat et 0,1 X volumen piperidin til opløsningen, og blandingen blev rystet forsigtigt i 45 minutter ved rumtemperatur. Produktet blev derefter oprenset ved ethanoludfældning som beskrevet ovenfor og isoleret ved centrifugering. Den resulterende pellet blev vasket to gange med koldt EtOH og tørret ved lyofilisering til opnåelse af oprenset Forbindelse 3.

Cyklus 1

Til hver brønd i en plade med 96 brønde blev der tilsat 12,5 μΙ_ af en 4 mM opløsning af Forbindelse 3 i vand; 100 μΙ_ af en 1 mM opløsning af én af oligonukleotid-tags 1.1 til 1.96, som vist i Tabel 3 (molforholdet mellem Forbindelse 3 og tags var 1:2). Pladerne blev opvarmet til 95 °C i 1 minut og derefter afkølet til 16 °C i løbet af 10 minutter. Til hver brøn blev der tilsat 10 μΙ_ 10X ligasebuffer, 30 enheder T4 DNA-ligase- (1 μΙ_ af en 30 enhed/pL opløsning (Fermentas Life Science, Cat. No. EL0013)), 76,5 pLvand, og de resulterende opløsninger blev inkuberet ved 16 °C i 16 timer.

Efter ligeringsreaktionen blev der tilsat 20 pL 5 M vandigt NaCI direkte til hver brønd efterfulgt af 500 pL kold (-20 °C) ethanol, og blev holdt ved -20 °C i 1 time. Pladerne blev centrifugeret i 1 time med 3200 g i en Beckman Coulter Allegra 6R centrifuge under anvendelse af Beckman Microplus Carriers. Supernatanten blev omhyggeligt fjernet ved at invertere pladen, og pelleten blev vasket med 70 % vandigt kold ethanol ved -20 °C. Hver af pelletene blev derefter opløst i natriumboratbuffer (50 pL, 150 mM, pH 9,4) til en koncentration på 1 mM og afkølet til 4 °C.

Til hver opløsning blev der tilsat 40 ækvivalenter af én af de 96 byggesten-prækursorer i DMF (13 pL, 0,15 M) efterfulgt af 40 ækvivalenter DMT-MM i vand (8 pL, 0,25 M), og opløsningerne blev forsigtigt rystet ved 4 °C. Efter 2 timer blev der tilsat yderligere 40 ækvivalenter af én af hver byggesten-prækursor og DMTMM, og opløsningerne blev forsigtigt rystet i 16 timer ved 4 °C. Efter acylering blev der tilsat 10 ækvivalenter eddikesyre-N-hydroxy- succinimidester i DMF (2 μΙ_, 0,25 M) til hver opløsning og rystet forsigtigt i 10 minutter.

Efter acylering blev de 96 reaktionsblandinger forenet, og 0,1 volumen 5 M vandigt NaCI og 2,5 volumener kold absolut ethanol blev tilsat, og opløsningen fik lov til at henstå ved -20 °C i mindst én time. Blandingen blev derefter centrifugeret. Efter centrifugering blev så meget supernatant som muligt fjernet med en mikropipette, pelleten blev vasket med kold ethanol og centrifugeret igen. Supernatanten blev fjernet med en 200 μΙ_ pipette. Kold 70 % ethanol blev tilsat til røret, og den resulterende blanding blev centrifugeret i 5 minutter ved 4 °C.

Supernatanten blev fjernet, og den tilbageblevne ethanol blev fjernet ved lyofilisering ved rumtemperatur i 10 minutter. Pelleten blev derefter opløst i 2 ml_ vand og oprenset med omvendt fase HPLC med en Waters Xterra FIP1S kolonne. Der blev anvendt en gradientprofil med binær mobil fase til at eluere biblioteket under anvendelse af en 50 mM vandig triethylammoniumacetat-buffer ved pH 7,5 og 99 % acetonitril/1 % vandopløsning. Fraktioner indeholdende biblioteket blev opsamlet, forenet og lyofiliseret. Den resulterende rest blev opløst i 2,5 ml_ vand, og der blev tilsat 250 μΙ_ piperidine. Opløsningen blev rystet forsigtigt i 45 minutter og derefter udfældet med ethanol som tidligere beskrevet. Den resulterende pellet blev tørret ved lyofilisering og derefter opløst i natriumboratbuffer (4,8 mL, 150 mM, pH 9,4) til en koncentration på 1 mM.

Opløsningen blev afkølet til 4 °C, og der blev tilsat 40 ækvivalenter hver af N-Fmoc-propargylglycin i DMF (1,2 mL, 0,15 M) og DMT-MM i vand (7,7 mL, 0,25 M). Blandingen blev rystet forsigtigt i 2 timer ved 4 °C, før der blev tilsat yderligere 40 ækvivalenter N-Fmoc-propargylglycin og DMT-MM, og opløsningen blev rystet i yderligere 16 timer. Blandingen blev senere oprenset ved EtOH-udfældning og omvendt fase HPLC som beskrevet ovenfor, og N-Fmoc gruppen blev fjernet ved behandling med piperidin som tidligere beskrevet. Efter endelig oprensning med EtOH-udfældning blev den resulterende pellet tørret ved lyofilisering og ført ind i den næste syntesecyklus.

Cyklus 2-4

Til hver af disse cykluser blev den tørrede pellet fra den foregående cyklus opløst i vand, og bibliotekets koncentration blev bestemt med spektro-fotometri baseret på bibliotekets DNA-komponents ekstinktionskoefficient, hvor Forbindelse 2's initiale ekstinktionskoefficient er 131.500 L/(mol.cm). Bibliotekets koncentration blev justeret med vand således, at slut-koncentrationen i de efterfølgende ligeringsreaktioner var 0,25 mM. Biblioteket blev derefter delt i 96 ens alikvotter i en plade med 96 brønde. Til hver brønd blev der tilsat en opløsning omfattende en forskellig tag (molforholdet mellem biblioteket og tag var 1:2), og der blev udført ligeringer som beskrevet for Cyklus 1. I Cyklus 2, 3 og 4 anvendte oligonukleotid-tags er anført i henholdsvis Tabel 4, 5 og 6. Overensstemmelse mellem tags'ene og byggestenprækursorerne for hver af Cyklus 1 til 4 er anført i Tabel 7. Biblioteket blev udfældet ved tilsætning af ethanol som beskrevet ovenfor for Cyklus 1 og opløst i natriumboratbuffer (150 mM, pH 9,4) til en koncentration på 1 mM. Efterfølgende acyleringer og oprensninger blev udført som beskrevet for Cyklus 1 bortset fra, at HPLC oprensning blev udeladt under Cyklus 3.

Produkterne fra Cyklus 4 blev ligeret med den neden for viste lukker-primer under anvendelse af den oven for til ligering af tags beskrevne fremgangsmåde. 5' -PO3-CAG AAG ACA GAC AAG CTT CAC CTG C (SEQ ID NO:88 9) 5' -PO3-GCA GGT GAA GCT TGT CTG TCT TCT GAA(SEQ ID NO:890)

Resultater:

Den oven for beskrevne synteseprocedure er i stand til at producere et bibliotek omfattende 944 (ca. 108) forskellige strukturer. Syntesen af biblioteket blev overvåget via gelelektroforese og LC/MS af produktet fra hver cyklus. Efter færdiggørelse blev biblioteket analyseret under anvendelse af adskillige teknikker. Figur 13a er et chromatogram af biblioteket efter Cylus 4 men før ligering af lukker-primeren; Figur 13b er et massespektrum af biblioteket i samme syntesetrin. Middelmolekylvægten blev bestemt med negativ ion LC/MS-analyse. lonsignalet blev udpakket under anvendelse af ProMass software. Dette resultat er konsistent med bibliotekets forudsete middelmasse.

Bibliotekets DNA-komponent blev analyseret med agarosegelelektroforese, der viste, at størstedelen af biblioteksmaterialet svarer til ligeret produkt med korrekt størrelse. DNA-sekvensanalyse af molekylære kloner af fra en prøvetagning fra biblioteket afledt PCR-produkt viser, at der skete DNA-ligering, som var fuldstændig korrekt og næsten til fuldendelse.

Bibliotekscyklisering

Ved fuldendelsen af Cyklus 4 blev en del af biblioteket capped ved N-terminus under anvendelse af azidoeddikesyre under de sædvanlige acyleringsbetingelser. Efter oprensning med EtOFI-udfældning blev produktet opløst i natriumphosphatbuffer (150 nM, pH 8) til en koncentration på 1 mM, og der blev tilsat 4 ækvivalenter hver af CuS04 i vand (200 mM), ascorbinsyre i vand (200 mM), og en katalytisk mængde af den neden for viste forbindelse som en opløsning i DMF (200 mM) blev tilsat. Reaktionsblandingen blev derefter rystet forsigtigt i 2 timer ved rumtemperatur.

For at assaye cykliseringsgraden blev 5 μΙ_ alikvotter fra biblioteks-cykliseringsreaktionen fjernet og behandlet med fluorescensmærket azid eller alkyn (1 μΙ_ 100 mM DMF udgangsblandinger) fremstillet som beskrevet i Eksempel 4. Efter 16 timer var hverken alkyn- eller azid-mærkningerne blevet inkorporeret i biblioteket med HPLC-analyse ved 500 nm. Dette resultat indikerede, at biblioteket ikke længere indeholdt azid- eller alkyn-grupper, der var i stand til cycloaddition og, at biblioteket derfor må have reageret med sig selv, enten gennem cykliseringsreaktioner eller intermolekylære reaktioner. Det cykliserede bibliotek blev oprenset med omvendt fase HPLC som tidligere beskrevet. Kontrolforsøg, der anvendte ikke-cykliseret bibliotek, viste fuldstændig inkorporation af de oven for nævnte fluorescens-tags.

Eksempel 4. Fremstilling af fluorescens-tags til cykliseringsassay: I separate rør blev propargylglycin eller 2-amino-3-phenylpropylazid (8 pmol hver) kombineret med FAM-OSu (Molecular Probes Inc.) (1,2 ækviv.) i pH 9,4 boratbuffer (250 μΙ_). Reaktionerne fik lov til at skride frem i 3 timer ved rumtemperatur, og blev derefter lyofiliseret natten over. Oprensning med HPLC gav det ønskede fluorescerende alkyn og azid i kvantitativt udbytte.

Eksempel 5: Cyklisering af individuelle forbindelser under anvendelse af azid/alkyl-cycloadditionsreaktionen

Fremstilling af azidoacetyl-Gly-Pro-Phe-Pra-NH2:

Den anførte sekvens blev syntetiseret under anvendelse af 0,3 mmol Rink-amidharpiks under anvendelse af standard fastfase-synteseteknikker med Fmoc-beskyttede aminosyrer og HATU som aktiveringsmiddel (Pra = C-propargylglycin). Azidoeddikesyre blev brugt til at cappe tetrapeptidet. Peptidet blev spaltet fra harpiksen med 20 % TFA/DCM i 4 timer. Oprensning med RP HPLC gav produktet som et hvidt faststof (75 mg, 51 %). 1H NMR (DMSO-de, 400 MHz): 8,4-7,8 (m, 3H), 7,4-7,1 (m, 7H), 4,6-4,4 (m, 1H), 4,4- 4,2 (m, 2H), 4,0-3,9 (m, 2H), 3,74 (dd, 1H, J = 6 Hz, 17 Hz), 3,5-3,3 (m, 2H), 3,07 (dt, 1H, J = 5Hz, 14 Hz), 2,92 (dd, 1H, J = 5 Hz, 16 Hz), 2,86 (t, 1H, J = 2 Hz), 2,85-2,75 (m, 1H), 2,6-2,4 (m, 2H), 2,2-1,6 (m, 4H). IR (mull) 2900, 2100, 1450, 1300 cm'1. ESIMS 497.4 ([M+H], 100 %), 993,4 ([2M+H], 50 %). ESIMS med ionkildefragmentering: 519,3 ([M+Na], 100 %), 491,3 (100 %), 480.1 ([M-NH2], 90 %), 452,2 ([M-NH2-CO], 20 %), 424,2 (20 %), 385,1 ([M-Pra], 50 %), 357,1 ([M-Pra-CO], 40 %), 238,0 ([M-Pra-Phe], 100 %).

Cyklisering af azidoacetyl-Gly-Pro-Phe-Pra-NH2:

Azidoacetylpeptidet (31 mg, 0,62 mmol) blev opløst i MeCN (30 ml_). Diisopropylethylamin (DIEA, 1 ml_) og Cu(MeCN)4PF6 (1 mg) blev tilsat. Efter omrøring i 1,5 timer blev opløsningen fordampet, og den resulterende rest blev optaget i 20 % MeCN/H20. Efter centrifugering til fjernelse af uopløselige salte blev opløsningen underkastet præparativ omvendt fase HPLC. Det ønskede cykliske peptid blev isoleret som et hvidt faststof (10 mg, 32 %). 1H NMR (DMSO-de, 400 MHz): 8,28 (t, 1H, J = 5 Hz), 7,77 (s, 1H), 7,2-6,9 (m, 9H), 4,98 (m, 2H), 4,48 (m, 1H), 4,28 (m, 1H), 4,1-3,9 (m, 2H), 3,63 (dd, 1H, J = 5 Hz, 16 Hz), 3,33 (m, 2H), 3,0 (m, 3H), 2,48 (dd, 1H, J = 11 Hz, 14 Hz), 1,75 (m, 1H0, 1,55 (m, 1H), 1,32 (m, 1H), 1,05 (m, 1H). IR (mull) 2900, 1475, 1400 cm'1. ESIMS 497,2 ([M+H], 100 %), 993,2 ([2M+H], 30 %), 1015,2 ([2M+Na], 15 %). ESIMS med ionkildefragmentering: 535,2 (70 %), 519,3 ([M+Na], 100 %), 497,2 ([M+H], 80 %), 480,1 ([M-NH2], 30 %), 452.2 ([M-NH2-CO], 40 %), 208,1 (60 %).

Fremstilling af azidoacetyl-Gly-Pro-Phe-Pra-Gly-OH:

Den anførte sekvens blev syntetiseret under anvendelse af 0,3 mmol Glycin-Wang harpiks med anvendelse af Fmoc-beskyttede aminosyrer og HATU som aktiveringsmiddel. Azidoeddikesyre blev anvendt i sidste koblingstrin til at cappe pentapeptidet. Spaltning af peptidet blev opnået under anvendelse af 50 % TFA/DMC i 2 timer. Oprensning med RP HPLC gav peptidet som et hvidt faststof (83 mg; 50 %). 1H NMR (DMSO-d6, 400 MHz): 8,4-7,9 (m, 4H), 7,2 (m, 5H), 4,7-4,2 (m, 3H), 4,0-3,7 (m, 4H), 3,5-3,3 (m, 2H), 3,1 (m, 1H), 2,91 (dd, 1H, J = 4 Hz, 16 Hz), 2,84 (t, 1H, J = 2,5 Hz), 2,78 (m, 1H), 2,6-2,4 (m, 2H), 2,2-1,6 (m, 4H). IR (mull) 2900, 2100, 1450, 1350 cm'1. ESIMS 555,3 ([M+H], 100 %). ESIMS med ionkildefragmentering: 577,1 ([M+Na], 90 %), 555,3 ([M+H], 80 %), 480,1 ([M-Gly], 100 %), 385,1 ([M-Gly-Pra], 70 %), 357,1 ([M-Gly-Pra-CO], 40 %), 238,0 ([M-Gly-Pra-Phe], 80 %).

Cyklisering af azidoacetyl-Gly-Pro-Phe-Pra-Gly-OH:

Peptidet (32 mg, 0,058 mmol) blev opløst i MeCN (60 ml_). Diisopropyl-ethylamin (1 mL) og Cu(MeCN)4PF6 (1 mg) blev tilsat, og opløsningen blev omrørt i 2 timer. Opløsningsmidlet fordampedes, og det rå produkt blev underkastet RP HPLC til fjernelse af dimerer og trimerer. Den cykliske monomer blev isoleret som et farveløst glas (6 mg, 20 %). ESIMS 555,6 ([M+H], 100 %), 1109,3 ([2M+H], 20 %), 1131,2 ([2M+Na], 15 %). ESIMS med ionkildefragmentering: 555,3 ([M+H], 100 %), 480,4 ([M-Gly], 30 %), 452,2 ([M-Gly-CO], 25 %), 424,5 ([M-Gly-2CO], 10 %, kun muligt i en cyklisk struktur).

Konjugation af lineært peptid til DNA:

Forbindelse 2 (45 nmol) blev opløst i 45 pL natriumboratbuffer (pH 9,4; 150 mM). Ved 4 °C blev der tilsat lineært peptid (18 pL af en 100 mM udgangsblanding i DMF; 180 nmol; 40 ækviv.) efterfulgt af DMT-MM (3,6 pL af en 500 mM udgangsblanding i vand; 180 nmol; 40 ækviv.). Efter omrøring i 2 timer viste LCMS tilendebragt reaktion, og produkt blev isoleret med ethanoludfældning. ESIMS 1823,0 ([M-3H]/3, 20 %), 1367,2 ([M-4H]/4, 20 %), 1093,7 ([M-5H]/5, 40 %), 911,4 ([M-6H]/6, 100 %).

Konjugation af cyklisk peptid til DNA:

Forbindelse 2 (20 nmol) blev opløst i 20 μΙ_ natriumboratbuffer (pH 9,4; 150 mM). Ved 4 °C blev der tilsat lineært peptid (8 μΙ_ af en 100 mM udgangsblanding i DMF; 80 nmol; 40 ækviv.) efterfulgt af DMT-MM (1,6 μΙ-af en 500 mM udgangsblanding i vand; 80 nmol; 40 ækviv.). Efter omrøring i 2 timer viste LCMS tilendebragt reaktion, og produkt blev isoleret med ethanol-udfældning. ESIMS 1823,0 ([M-3H]/3, 20 %), 1367,2 ([M-4H]/4, 20 %), 1093,7 ([M-5H]/5, 40 %), 911,4 ([M-6H]/6, 100 %).

Cyklisering af DNA-bundet peptid:

Lineært peptid-DNA-konjugat (10 nmol) blev opløst i natriumphosphatbuffer (10 pL, 150 mm) med pH 8. Ved rumtemperatur blev der tilsat 4 ækvivalenter hver af CuS04, ascorbinsyre, og Sharpless liganden ( 0,2 pL 200 mM udgangsblandinger). Reaktionen fik lov til at forløbe natten over. RP HPLC viste, at der ikke var noget lineært peptid-DNA til stede og, at produktet koeluerede med autentisk cyklisk peptid-DNA. Der blev ikke observeret nogen spor af dimerer eller andre oligomerer.

eluerer @4,48 min. eluerer @ 4,27 min. LC-betingelser: Targa C18, 2,1 X40 mm, 10-40 %

MeCN i 40 mM vandig TEAA over 8 min.

Eksempel 6: Anvendelse af aromatiske nukleofile substitutions reaktioner ved syntese af funktionel enhed

Generel procedure for arylering af Forbindelse 3 med cyanursyrechlorid:

Forbindelse 2 opløses i pH 9,4 natriumboratbuffer i en koncentration på 1 mM. Opløsningen afkøles til 4 °C, og 20 ækvivalenter cyanursyrechlorid tilsættes derefter som en 500 mM opløsning i MeCN. Efter 2 timer bekræftes tilendebragt reaktion med LCMS, og det resulterende dichlortriazin-DNA-konjugat isoleres med ethanoludfældning.

Procedure for aminsubstitution af dichlortriazin-DNA:

Dichlortriazin-DNA-konjugatet opløses i pH 9,5 boratbuffer i en koncentration på 1 mM. Ved rumtemperatur tilsættes 40 ækvivalenter af en alifatisk amin som en DMF opløsning. Reaktionen følges med LCMS, og er sædvanligvis tilendebragt efter 2 timer. Det resulterende alkylamino-monochlortriazin-DNA-konjugat isoleres med ethanoludfældning.

Procedure for aminsubstitution af monochlortriazin-DNA:

Alkylamino-monochlortriazin-DNA-konjugatet opløses i pH 9,5 boratbuffer i en koncentration på 1 mM. Ved 42 °C tilsættes 40 ækvivalenter af en anden alifatisk amin som en DMF opløsning. Reaktionen følges med LCMS, og er sædvanligvis tilendebragt efter 2 timer. Det resulterende diaminotriazin-DNA-konjugat isoleres med ethanoludfældning.

Eksempel 7: Anvendelse af reduktive amineringsreaktioner ved syntese af funktionel enhed

Generel procedure for reduktiv aminering af DNA-linker indeholdende en sekundær amin med en aldehydbyggesten:

Forbindelse 2 blev koblet til en N-terminal prolinrest. Den resulterende forbindelse blev opløst i natriumphosphatbuffer (50 pL, 150 mM, pH 5,5) i en koncentration på 1 mM. Til denne opløsning tilsattes 40 ækvivalenter hver af en aldehydbyggesten i DMF (8pL, 0,25 M) og natriumcyanborhydrid i DMF (8 pL, 0,25 M), og opløsningen opvarmedes ved 80 °C i 2 timer. Efter alkylering blev opløsningen oprenset med ethanoludfældning.

Generel procedure for reduktive amineringer af DNA-linker indeholdende et aldehyd med aminbyggesten:

Forbindelse 2 koblet til en byggesten omfattende en aldehydgruppe blev opløst i natriumphosphatbuffer (50 μΙ_, 250 mM, pH 5,5) i en koncentration på 1 mM. Til denne opløsning blev der tilsat 40 ækvivalenter hver af en aminbyggesten i DMF (8 μΙ_, 0,25M) og natriumcyanborhydrid i DMF (8 μΙ_, 0.25M), og opløsningen blev opvarmet ved 80 °C i 2 timer. Efter alkylering blev opløsningen oprenset med ethanoludfældning.

Eksempel 8: Anvendelse af peptoidbyggereaktioner ved syntese af funktionel enhed

Generel procedure for peptoidsyntese på

DNA-linker:

Forbindelse 2 blev opløst i natriumboratbuffer (50 μΙ_, 150 mM, pH 9,4) i en koncentration på 1 mM og afkølet til 4 °C. Til denne opløsning blev der tilsat 40 ækvivalenter N-hydroxysuccinimidylbromacetat i DMF (13 pL, 0,15 M), og opløsningen blev rystet forsigtigt ved 4 °C i 2 timer. Efter alkylering blev DNA-linkeren oprenset med ethanoludfældning og genopløst i natriumboratbuffer (50 μΙ_, 150 mM, pH 9,4) i en koncentration på 1 mM og afkølet til 4 °C. Til denne opløsning blev der tilsat 40 ækvivalenter af en aminbyggesten i DMF (13 μΙ_, 0,15 M), og opløsningen blev rystet forsigtigt ved 4 °C i 16 timer. Efter alkylering blev DNA-likeren oprenset med ethanoludfældning og genopløst i natriumboratbuffer (50 μΙ_, 150 mM, pH 9,4) i en koncentration på 1 mM og afkølet til 4 °C. Peptoidsyntese fortsættes ved trinvis tilsætning af N-hydroxysuccinimidylbromacetat efterfulgt af tilsætning af en aminbyggesten.

Eksempel 9: Anvendelse af azid-alkyn-cycloadditionsreaktionen ved syntese af funktionel enhed

Generel procedure

Et alkynholdigt DNA-konjugat opløses i pH 8,0 phosphatbuffer i en koncentration på ca. 1 mM. Til denne blanding tilsættes 10 ækvivalenter af et organisk azid og 5 ækvivalenter hver af kobber- (II) sulfat, ascorbinsyre, og liganden (tris-((1-benzyltriazol-4-yl)methyl)amin, alle ved rumtemperatur. Reaktionen følges med LCMS og er sædvanligvis tilendebragt efter 1 -2 timer. Det resulterende triazol-DNA-konjugat kan isoleres med ethanoludfældning.

Eksempel 10 Identifikation af en ligand til Abl-kinase inde fra et kodet bibliotek

Evnen til at berige interessante molekyler i et DNA-kodet bibliotek frem for uønskede biblioteksmedlemmer er yderst vigtigt for at identificere enkeltforbindelser med definerede egenskaber mod interessante terapeutiske targets. For at demonstrere denne berigelsesevne blev et kendt bindingsmolekyle (beskrevet af Shah et al., Science 305, 399-401 (2004)), til rhAbl-kinase (GenBank U07563) syntetiseret. Denne forbindelse blev knyttet til et dobbeltstrenget DNA-oligonukleotid via den i de foregående eksempler beskrevne linker under anvendelse af kemiske standardmetoder til fremstilling af et molekyle, der ligner (funktionel enhed bundet til et oligonukleotid) dem, der produceres via de i Eksempel 1 og 2 beskrevne metoder. Et bibliotek generelt fremstillet som beskrevet i Eksempel 2 og den DNA-bundne Abl-kinase-binder blev designet med unikke DNA-sekvenser, som tillod qPCR-analyse af begge arter. Den DNA-bundne Abl-kinase-binder blev blandet med biblioteket i et forhold på 1:1000. Denne blanding blev ækvilibreret med rhAble-kinase, og enzymet blev fanget på en fast fase, vasket til fjernelse af ikke-bindende biblioteksmedlemmer, og bindingsmolekyler blev elueret. Forholdet mellem biblioteksmolekyler og den DNA-bundne Abl-kinase-inhibitor i eluatet var 1:1, hvilket indikerer en større end 500-fold berigelse af den DNA-bundne Abl-kinase-binder i et 1000-fold overskud af biblioteksmolekyler.

Claims

1. Forbindelse med formlen

der omfatter en linkerenhed med en formel

hvor: X er en funktionel enhed omfattende én eller flere byggesten; Z er et oligonukleotid, der ved dets 3'-terminus er fastknyttet til B; Y er et oligonukleotid, der ved dets 5'-terminus er fastknyttet til C; A er en funktionel amino-gruppe, der danner en kovalent binding med X; B er en funktionel phosphat-gruppe, der danner en binding med 3'-enden af Z; C er en funktionel phosphat-gruppe, der danner en binding med 5'-enden af Y; D, F og E hver især uafhængigt er en bifunktionel bindingsgruppe; og S er et molekylært stillads, og D er en alkylenkæde, E og F hver er en oligo(ethylenglycol)kæde .kendetegnet ved, at linkerenheden har strukturen

hvor n, m og p hver især uafhængigt er et helt tal fra 1 til 20.

2. Forbindelse ifølge krav 1,kendetegnet ved, at mindst en af byggestenene er en aminosyre.

3. Forbindelse ifølge krav 1,kendetegnet ved, at n, m og p hver især uafhængigt er et helt tal fra 2 til otte.

4. Forbindelse ifølge krav 1,kendetegnet ved, at n, m og p hver især uafhængigt er et helt tal fra 3 til 6.

5. Forbindelse ifølge krav 1,kendetegnet ved, at linkerenheden har strukturen

6. Forbindelsesbibliotek omfattende mindst 102 distinkte forbindelser ifølge krav 1,kendetegnet ved, at forbindelserne omfatter en funktionel enhed omfattende to eller flere byggesten, der er operativt bundet til et oligonukleotid, som identificerer den funktionelle enheds struktur, forbindelserne består hver især af Formel I:

(I) der omfatter en linkerenhed med en formel

hvor: X er en funktionel enhed omfattende én eller flere byggesten; Z er et oligonukleotid, der ved dets 3'-terminus er fastknyttet til B; Y er et oligonukleotid, der ved dets 5'-terminus er fastknyttet til C; A er en funktionel amino-gruppe, der danner en kovalent binding med X; B er en funktionel phosphat-gruppe, der danner en binding med 3'-enden af Z; C er en funktionel phosphat-gruppe, der danner en binding med 5'-enden af Y; D, F og E hver især uafhængigt er en bifunktionel bindingsgruppe; og S er et molekylært stillads, og D er en alkylenkæde, og E og F hver er en oligo(ethylenglycol)kæde .kendetegnet ved, at linkerenheden har strukturen

hvor n, m og p hver især uafhængigt er et helt tal fra 1 til 20.

7. Forbindelsesbibliotek ifølge krav 6, kendetegnet ved, at Y og Z er i hovedsagen komplementære og orienteret således i forbindelsen, at Watson-Crick baseparring og duplexdannelse muliggøres under egnede betingelser.

8. Forbindelsesbibliotek ifølge krav 6, kendetegnet ved, at Y og Z har samme længde eller forskellig længde.

9. Forbindelse ifølge krav 6, kendetegnet ved, at mindst en af byggestenene er en aminosyre.

10. Forbindelsesbibliotek ifølge krav 6, kendetegnet ved, at n, m og p hver især uafhængigt er et helt tal fra 2 til otte.

11. Forbindelse ifølge krav 6, kendetegnet ved, at n, m og p hver især uafhængigt er et helt tal fra 3 til 6.

12. Forbindelse ifølge krav 6, kendetegnet ved, at linkerenheden har strukturen