HRP20030240A2 - Method of operating a computer system to perform a diskrete substructural analysis - Google Patents

Method of operating a computer system to perform a diskrete substructural analysis Download PDF

Info

Publication number
HRP20030240A2
HRP20030240A2 HR20030240A HRP20030240A HRP20030240A2 HR P20030240 A2 HRP20030240 A2 HR P20030240A2 HR 20030240 A HR20030240 A HR 20030240A HR P20030240 A HRP20030240 A HR P20030240A HR P20030240 A2 HRP20030240 A2 HR P20030240A2
Authority
HR
Croatia
Prior art keywords
chemical
compounds
molecules
fragment
fragments
Prior art date
Application number
HR20030240A
Other languages
English (en)
Inventor
Church Dennis
Colinge Jacques
Original Assignee
Applied Research Systems Ars Holding N.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Applied Research Systems Ars Holding N.V. filed Critical Applied Research Systems Ars Holding N.V.
Publication of HRP20030240A2 publication Critical patent/HRP20030240A2/hr

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Computing Systems (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Description

Područje izuma
Izum je iz područja farmakologije i teorijske kemije.
Ovaj izum odnosi se na kompjutorski sustav i na metodu njegova rada, kojim se može izvršiti diskretna substrukturna analiza. Analiza omogućuje izvršenje kompjutorski primijenjenog identificiranja molekula s određenim svojstvima kao što su biološka i/ili kemijska aktivnost. Kompjutorski kontrolirana diskretna substrukturna analiza može se koristiti pri otkriću lijekova ili u drugim područjima gdje je od interesa biološki, farmakološki, toksikološki, pesticidno, herbicidno, katalitički itd. aktivni spojevi.
Stanje tehnike
Napredak u određenom području, npr. medicinskoj kemiji, ovisi o identificiranju biološki aktivnih molekula. U mnogim slučajevima, programi istraživanja usmjereni su prema sintezi malenih organskih molekula koje su u interakciji s poznatim enzimom ili receptorskom metom, da bi se postigao željeni farmakološki učinak. Takvi spojevi mogu, bar djelomično, oponašati ili inhibirati aktivnost poznatih, prirodnih tvari, ali su namijenjeni za postizanje jačeg i/ili selektivnijeg djelovanja. Spojevi koji su rezultat istraživanja ovog tipa mogu uključivati određena strukturna svojstva relevantnih prirodnih tvari.
Istraživački programi mogu se također zasnivati na prirodnim spojevima koji se nađu kao rezultat skeniranja izvor koji postoje u prirodi, primjerice uzorci tla ili ekstrakti biljaka. Aktivni spojevi koji su otkriveni na ovaj način mogu biti koristan vodič za program sintetske kemije.
U posljednje vrijeme povećana je potreba da se identificiraju nove i korisne biološki aktivne molekule, te kao posljedica, razvijene su nove metode generiranja ključnih spojeva. U tom smislu postoje dva razvoja koja su od osobita značaja, kombinacijska kemija i visokoučinkovito skeniranje (HTS).
Kombinacijska kemija koristi tehnike robota ili ručne tehnike da se izvrši množina kemijskih reakcija u malenom opsegu pri čemu svaka koristi različitu kombinaciju reagensa, istovremeno ili paralelno, čime se generira veliki broj različitih kemijskih entiteta za skeniranje. Zbirka spojeva koja je generirana ovom metodom poznata je kao ‘biblioteka’. Biblioteke za generiranje novih ključnih kemijskih spojeva obično je široka koliko je to moguće. Međutim, u određenim okolnostima biblioteka može biti skrenuta ili usmjerena prema konkretnom farmakološkom cilju, ili usredotočena na konkretno kemijsko područje, odabiranjem kemikalija koje su namijenjene uvođenju specifičnih strukturnih značajki u krajnje spojeve.
Visokoučinkovito skeniranje uključuje uporabu biokemijskih analiza za brzo ispitivanje aktivnosti in vitro velikog broja kemijskih spojeva u odnosu na jedan ili više bioloških ciljeva. Ova metoda je idealna za skeniranje velike biblioteke spojeva koji su generirani kombinacijskom kemijom.
Bez obzira na nesumnjive prednosti kombinacijske kemije i visokoučinkovitog skeniranja u generiranju novih ključnih struktura, s ovim metodama postoje određeni nedostaci. Visoki udio spojeva u nenamjenskim kombinacijskim bibliotekama nema potrebnu aktivnost. Otkriće korisnih ključnih spojeva počiva na vjerojatnosti i/ili broju ispitanih spojeva. Ciljane biblioteke imaju veći udio aktivnih spojeva, ali ovise o odabiru kriterija i čak mogu zakazati u traženju optimalnih spojeva. Nadalje, obje tehnike zahtijevaju odgovarajuće resurse i kapacitet eksperimentiranja.
Vjerojatnost izuma aktivne molekule u danom skupu spojeva može se povećati bilo povećanjem ukupnog broja spojeva (tj. veličine skupova) ili povećanjem odnosa aktivnih spojeva u jednom skupu. Može se pokazati da je povećanje odnosa aktivnih spojeva u zbirci spojeva učinkovitije za povećanje vjerojatnosti izuma aktivne molekule, nego što je to slučaj s jednostavnim povećanjem ukupnog broja spojeva koji su ispitani. Ovaj prvi pristup smanjuje broj spojeva koje treba načiniti i ispitati, pa je dakle pogodniji u smislu traženih resursa, primjerice za izum biološki aktivnih molekula.
Substrukturna analiza kao pristup problemu oblikovanja lijeka opisana je u Richard D. Cramer III. et al., J. Med. Chem., 17 (1974), str. 553 do 535. Opisano je da biološka aktivnost molekule, ili bilo koje drugo njeno svojstvo, može biti procijenjena kombinacijom doprinosa njenih strukturnih komponenti (substruktura) te njenih intra- i intermolekularnih interakcija. Doprinos dane substrukture vjerojatnosti aktivnosti može se dobiti iz podataka prethodno ispitanih spojeva koji sadrže dotičnu substrukturu. Prvi korak je da se načini substrukturna “iskustvena tablica” u kojoj su sažeti raspoloživi podaci. “Frekvencija substrukturne aktivnosti” (SAP) je definirana za svaku substrukturu kao odnos broja aktivnih spojeva koji sadrže tu dubstrukturu prema broju ispitanih spojeva koji sadrže tu substrukturu. Za SAP se kaže da predstavlja doprinos kojega ta substruktura može načiniti na vjerojatnost da spoj bude aktivan. Nakon toga, za svaki spoj se izračunava aritmetički prosjek SAP vrijednosti substruktura koje se nalaze u tom spoju.
Premda prethodne tehnike omogućuju rangiranje spojeva sukladno njihovim prosječnim SAP vrijednostima, dobivanje takve vrijednosti zahtijeva izračunavanje aritmetičkog prosjeka SAP vrijednosti za svaku substrukturu koja se nalazi u tom spoju. Štoviše, SAP vrijednosti koje su potrebne za ovo izračunavanje su rezultat prethodnog izračunavanja koje uključuje procjenu svake substrukture u svakoj pojedinoj ispitanoj molekuli. Ovaj pristup, dakle, vodi opsežnom proračunu što sprječava da ova tehnika bude primijenjena na veći skup podataka koji trenutačno postoji i koji bi se mogao koristiti kao izvor informacija za izvršenje molekularne strukturne analize. Kramerova metoda, međutim, ne može realno procijeniti stvarni doprinos dotične substrukture na aktivnost.
Postoji, prema tome, određen broj tehnika prethodne tehnike u području analize kemijske strukture.
Patent EP 938 055 A opisuje metodu za razvijanje odnosa kvantitativne strukturne aktivnosti temeljem podataka koji su generirani visokoučinkovitim skeniranjem, identificiranjem strukturnih karakteristika koje omogućuju da spoj bide ‘aktivan’. Metoda je namijenjena da se uspostavi statistički model za biološki aktivne spojeve koja prvo povezuje različite kemijske deskriptore za danu zbirku spojeva i zatim, korištenjem podskupa spojeva poznate biološke aktivnosti, koristi model da se predvidi hoće li ili neće novi spoj biti biološki aktivan.
Sheridan and Kearsley, J. Chem. Inf. Comput. Sci., 35 (1995), str. 310-320 opisuju uporabu genetskih algoritama za odabiranje podskupa fragmenata za uporabu u izradi kombinacijske biblioteke. Ova metoda uključuje generiranje populacije molekula iz podskupa molekularnih fragmenata, te izračunavanje indeksa za svaku molekulu, koji se temelje na specificiranim deskriptorima (npr. par atoma ili topološka distorzija) korištenjem bilo uzorka sličnosti ili metode trend vektora. Daljnja populacija generira se genetskim algoritmom, te indeksira. Rezultati predstavljaju listu fragmenata koja se dobiva maksimalnim indeksiranjem molekula, što se može koristiti za izradu kombinacijske biblioteke.
Patent WO 99/26901A1 opisuje metodu za oblikovanje kemijskih tvari kao molekula. Spoj se sastoji od osnovice i određenog broja mjesta. metoda počinje odabiranjem potencijalnih elemenata za mjesta i kreiranjem prediktivno oblikovanog polja PAD. Primjer PAD sastoji se od određenog broja virtualnih spojeva koji udovoljavaju određenim kombinacijskim uvjetima. Ovi spojevi se zatim sintetiziraju i ispituje se njihova biološka aktivnost. Nakon toga, provodi se određeni algoritam za predviđanje ukupne biološke aktivnosti tih spojeva koji nisu bili sintetizirani. U tu svrhu, izračunavaju se vrijednosti osobnog doprinosa za potencijalne elemente, što predstavlja odgovarajući doprinos aktivnosti svakog pojedinačnog elementa. Zatim, izračunava se prosječni doprinos biološkoj aktivnosti svake supstituentske skupine na određenom mjestu. Dan je primjer izračunavanja svakog doprinosa.
H. Gao et al., J. Chem. Inf. Comput. Sci. (39) 1999, 164-168 je članak koji opisuje primjenu QSAR (kvantitativan odnos struktura-aktivnost) tehnike u problemu izuma lijeka. Nakon što su biološki aktivni spojevi odabrani, optimizira se njihova biološka aktivnost. Budući da se QSAR temelji na hipotetskim odnosima između biološke aktivnosti i molekularne strukture, tehnika je povezana s identificiranjem strukturnih karakteristika koji čine spojeve aktivnima te predikcijom aktivnih i neaktivnih analoga.
Patent WO 00/41060 A1 opisuje metodu za koreliranje aktivnosti tvari sa strukturnim svojstvima tvari. Pojam "svojstvo" odnosi se na atome i veze u strukturi koji odgovaraju slici. U prvom stupnju, određeni su članovi skupa tvari koji udovoljavaju određenom strukturnom svojstvu i vlastitim ograničenjima. Nakon toga, za svaku kategoriju aktivnosti se oblikuju tvari koje spadaju u navedenu kategoriju. Nakon dijeljenja skupa tvari u nekoliko kategorija aktivnosti, izračunava se očekivana aktivnost za svaki podskup za svako strukturno svojstvo konstruira se skup bit vektora aktivnost-pripadnost-svojstvo koji označuje broj tvari koje sadrže navedeno svojstvo u navedenoj kategoriji aktivnosti. Dokument se odnosi na biološke aktivnosti i također se odnosi na otkriće lijeka.
Patent US 6,185,506 B1 opisuje metodu za odabiranje optimalne biblioteke malenih molekula koja se temelji na provjerenim molekularnim strukturnim deskriptorima. Koriste se višestruki skupovi literaturnih podataka koji sadrže različite kemijske strukture i pridružene aktivnosti. Aktivnost može biti biološka i kemijska aktivnost. Tehnika je opisana u kontekstu farmakoloških lijekova. Zatim, opisana je metoda za odabiranje podskupa molekula produkta za sve moguće molekule produkta koje mogu biti načinjene kombinacijskom sintezom iz konkretnih molekula reaktanata i zajedničke molekularne jezgre. U dijelu koji opisuje stanje tehnike, referenca se odnosi na biološki specifične biblioteke koje su oblikovane temeljem znanja o geometrijskim sklopovima strukturnih fragmenata koji su sažeti iz molekularnih struktura za koje se zna da su aktivne. Opisano je kao apsolutno neophodno da se koristi racionalno oblikovana biblioteka za skeniranje koja zadržava različitost kombinacijski dostupnih spojeva.
Patent WO 00/49539 A1 opisuje metodu skeniranja skupa molekula za identificiranje skupova molekularnih svojstava koja vjerojatno koreliraju sa specifičnom aktivnošću. Pojam svojstvo odnosi se na kemijske substrukture. Skup molekula je grupiran sukladno njihovoj molekularnoj strukturi te karakteriziran skupom deskriptora. Nakon toga, skupine koje predstavljaju višu razinu aktivnosti su identificirane i najčešće substrukture među molekulama u skupinama se nađu i one mogu biti u korelaciji s uočenom razinom aktivnosti. Uspostavlja se skup podataka koji predstavlja one molekule iz početnog skupa podataka A koje sadrže zajednički podskup svojstava. Opisana tehnika poprima oblik kompjutorski-zasnovanog sustava za automatiziranu analizu skupa podataka.
Patent US 5,463,564 opisuje metodu koja je zasnovana na računalu kojom se automatski generiraju spojevi robotskim sintetiziranjem i analiziranjem množine kemijskih spojeva. Proces se provodi iterativno i rezultira generiranjem kemijskih entiteta s definiranim svojstvima aktivnosti. Sintetizira se opsežna kemijska biblioteka koja sadrži množinu kemijskih spojeva. Podaci struktura-aktivnost dobiju se robotskom analizom sintetiziranih spojeva. Određen broj baza podataka je opisan te svaki sadrži polje koje označuje čimbenik poretka koji se dodjeljuje odgovarajućem spoju. Čimbenik poretka koji se dodjeljuje svakom spoju temelji se na tome koliko aktivnost spoja odgovara željenoj aktivnosti.
Gore navedene metode su bilo ‘prediktivni’ modeli ili još uvijek ne uspijevaju poboljšati generiranje aktivnih ključnih spojeva i povećati vjerojatnost izuma aktivnih spojeva unutar danog skupa spojeva. Zatim, uobičajene tehnike ne mogu zadovoljiti potrebe za povećanim brojem i kakvoćom pogodaka i vodilja kojima se ulazi u razvojnu liniju.
Prema tome, cilj ovog izuma je postići metodu radnog kompjutorskog sustava, te odgovarajući kompjutorski sustav, kojom se može povećati vjerojatnost otkrića novih, biološki i/ili kemijski aktivnih molekula.
Ovaj cilj je riješen ovim izumom kao što je navedeno u neovisnim patentnim zahtjevima.
Poželjne realizacije izuma definirane su u ovisnim patentnim zahtjevima.
Poželjna realizacija izuma s primjerima izvođenja
Jedna prednost izuma je što je načinjen kompjutorski sustav i radna metoda koja omogućuje povećanje udjela aktivnih spojeva u danom skupu kemijskih entiteta pri čemu se za navedene entiteta ne zna imaju li željenu aktivnost. To se vrši primjenom tehnika koje se temelje na znanju da se identificira nov pogodak i vodeći niz, izgradnjom sustava za provođenje kompjutorski vođenog otkrića molekule.
Druga prednost izuma je što se pomoću analiziranja baze podataka koja se može pretraživati po molekularnoj strukturi i biološkim i/ili kemijskim svojstvima, izbjegavaju skupi eksperimenti. Proces otkrivanja pomoću ovog izuma se dakle racionalizira što opet rezultira jeftinijim otkrivanjem lijeka.
Zatim, izum omogućuje izvršenje procesa otkrivanja brže tako da se molekule koje imaju željeno svojstvo mogu identificirati u kraćem vremenu pri usporedbi s metodama prethodne tehnike.
Zatim, izum ima osobite prednosti u području biokemije. Prije, DNA sekvenciranje, te poglavito genomsko sekvenciranje, stvorili su opširnu bazu podataka sekvencija aminokiselina koja se može koristiti kao polazna točka kada se realizira izuma. Nakon toga, izum omogućuje identificiranje poznatih i/ili usamljenih liganada i/ili usamljeni ligand-receptorskih parova predviđanjem pepetidne sekvencije temeljem rezultata koji su dobiveni s listom struktura analiziranih u svezi biološki aktivnih kemijskih determinanti. Nakon identificiranja u bazi podataka i ekspresije, peptidne sekvencije mogu se ispitati pomoću biokemijske analize. Dakle, izum omogućuje da se izvedu biološke strukture uspoređivanjem s listom kemijskih molekula, za koje je određena aktivnost na određenoj meti, pa se tako dobiva tehnika identificiranja (povratno sekvenciranje).
Opis crteža
Ovaj izum će sada biti opisan s više pojedinosti prema priloženim crtežima, koji prikazuju sljedeće:
Slika 1 je blok-dijagram koji prikazuje kompjutorski sustav sukladno poželjnoj realizaciji izuma;
Slika 2 je dijagram toka koji prikazuje glavni proces izvršenja diskretne strukturne analize sukladno poželjnoj realizaciji izuma;
Slika 3 je shematski dijagram koji prikazuje reiteracijski proces izuma;
Slika 4 je dijagram toka koji prikazuje proces generiranja biblioteke fragmenata sukladno poželjnoj realizaciji izuma;
Slika 5 je graf koji prikazuje kako se mogu odabrati fragmenti temeljem izračunatih indeksnih vrijednosti;
Slika 6 je dijagram toka koji prikazuje proces izračunavanja indeksne vrijednosti za fragment, sukladno poželjnoj realizaciji izuma;
Slika 7 je dijagram toka koji prikazuje proces analize biblioteke fragmenata pri izvršenju reiteracije;
Slika 8 je dijagram toka koji prikazuje proces odabiranja novog spoja korištenjem generičkih substruktura;
Slika 9 je dijagram toka koji prikazuje proces generiranja substruktura za uporabu u virtualnom skeniranju:
Slika 10 je dijagram toka koji prikazuje proces analiziranje biblioteke fragmenata pri izvršenju reiteracije, primjenom tehnike združivanja sukladno poželjnoj realizaciji izuma;
Slika 11 je primjer relativne kontribucijske mape za ilustriranje tehnike združivanja koja je primijenjena u procesu na slici 10;
Slika 12 je graf koji prikazuje učinak spoja na receptorski upravljano generiranje inozitol trifosfata;
Slika 13 je graf koji prikazuje učinak spoja na kinaza-ovisno proteinsko fosforiliranje;
Slika 14 je graf koji prikazuje učinak spoja na fosfatazno-ovisno proteinsko defosforiliranje;
Slika 15 je graf koji prikazuje relativni doprinos informacije nanošenjem determinanti u odnosu prema odgovarajućim indeksnim vrijednostima; i
Slike 16A-H su daljnji relativni kontribucijski dijagrami koji pokazuju ekvivalentnost indeksnih funkcija.
Opis izuma
Sada slijedi detaljan opis ovog izuma. Zatim će poželjne realizacije ovog izuma biti razmotrene u svezi s priloženim crtežima. Štoviše, bit će dan određen broj primjera kako se ovaj izum može primijeniti u određenom broju područja gdje se vrši otkriće spojeva.
Sukladno ovom izumu, načinjen je kompjutorski sustav za izvršenje diskretne substrukturne analize. Pristupa se bazi molekularnih struktura. Baza podataka se može pretraživati po molekularnoj informaciji te biološkim i/ili kemijskim svojstvima. Informacija o molekularnoj strukturi je bilo koja informacija koja je pogodna za određivanje molekularne strukture molekule. Biološka i/ili kemijska svojstva uključuju biokemijska, farmakološka, toksikološka, pesticidna, herbicidna i katalitička svojstva.
Korištenjem baze podataka, tehnikom sukladno ovom izumu identificira se podskup molekula koje imaju određeno biološko i/ili kemijsko svojstvo. U danom podskupu, određuju se zatim fragmenti molekule. Pojam ‘fragment’ odnosi se na bilo koju strukturnu podjedinicu molekule, uključujući jednostavne funkcionalne skupine, dvodimenzionalne strukture i njihove familije, jednostavne atome i veze, te bilo koji sklop strukturnih deskriptora u dvodimenzionalnom ili trodimenzionalnom molekularnom prostoru. Onaj tko poznaje ovo područje zna da je pojam molekularne substrukture nešto što nema analoga u standardnoj kemiji.
Nakon što su molekularne strukture razbijene u fragmente, izračunata je indeksna vrijednost za svaki fragment što odgovara doprinosu odgovarajućeg fragmenta danom biološkom i/ili kemijskom svojstvu. Dakle, izum omogućuje dodjeljivanje indeksne vrijednosti fragmentima koji se temelje na postojećem znanju u odnosu na biološka i/ili kemijska svojstva molekula. U opisu koji slijedi, molekula, struktura ili substruktura se naziva ‘aktivnom’ ako posjeduje dano svojstvo. Molekula, struktura ili substruktura koja u tom smislu nije aktivna naziva se ‘neaktivnom’. Dakle, ovaj izum definira substrukturnu analizu koja se temelji na informaciji o diskretnom biološkom i/ili kemijskom svojstvu. Glavni proces izuma se dakle naziva Diskretna substrukturna analiza (DSA).
Budući da, sukladno izumu, fragmenti u povezani s indeksnim vrijednostima koje naznačuju njihov doprinos za dano biološko i/ili kemijsko svojstvo, fragmente možemo smatrati kao kemijskim determinantama koje su odgovorne za dani biološki i/ili kemijski doseg. Identificiranje fragmenata vrši se sljedećim skupom logičkih pravila (algoritam), koji je inherentan u odnosu na sam DSA proces. U ovom kontekstu, sama indeksna vrijednost je funkcija:
a) prevalencije kemijske determinante u podskupu aktivnih molekula, i
b) prevalnecije iste navedene determinante u cijeloj listi spojeva koji se razmatraju.
Temeljem ove definicije, metoda zatim identificira jedan ili više lokalnih ekstrema indeksne funkcije, čije odgovarajuće kemijske determinante predstavljaju cjelovita ili djelomična kemijska rješenja za željeni biološki doseg. Izum najveće moguće vrijednosti koju indeksna funkcija može poprimiti u danom skupu podataka je ekvivalentno identificiranju kemijskih determinanti koje su sadržane unutar podskupova najjačih biološki aktivnih molekula koje imaju najnižu vjerojatnost slučajnog pojavljivanja u istim podskupovima.
Sada će ovaj izum biti opisan u svezi s priloženim crtežima, te poglavito slikom 1. Slika 1 prikazuje poželjnu realizaciju kompjutorskog sustava sukladno ovom izumu. Kompjutorski sustav obuhvaća središnju jedinicu za obradu podataka sukladno ovom izumu. Kompjutorski sustav obuhvaća središnju jedinicu za obradu podataka 100 koja je upravljana preko korisničkog međusklopa 105. Jedinice 100 i 105 mogu biti bilo koji kompjutorski sustav kao što je radna stanica ili osobno računalo. Poželjno, kompjutorski sustav je multiprocesorski sustav koji se izvršava na višezadaćnom operativnom sustavu.
Središnja jedinica obrade 100 povezana je s programskom pohranom 130 koja sprema izvršni programski kod uključujući naredbe za izvršenje DSA procesa sukladno ovom izumu. Ove naredbe obuhvaćaju funkcije fragemntiranja 135 za razbijanje molekularnih struktura u fragmente, indeksne funkcije 140 za izračunavanje indeksnih vrijednosti, funkcije generaliziranja 145 (primjerice za pozivanje izomera) za lokaliziranje generalizirajućih elemenata u framentnim strukturama i zamjenu tih elemenata s generaliziranim izrazima čime se generiraju generičke substrukture, funkcije virtualnog skeniranja 150 za izvršenje virtualnog skeniranja, te združivanja 155 za izvršenje fragmentnog združivanja procesa izuma. Pojedinosti o pojedinim funkcijama i procesorima koji se vrše pomoću središnje jedinice obrade 100 pri izvršenju ovih funkcija bit će detaljno navedene kasnije.
Središnja jedinica obrade 100 je dalje spojena sa bazom podataka strukturne aktivnosti ili listom aktivnosti spojeva, 115, da se dobije informacija o molekularnoj strukturi te informacija o biološkom i/ili kemijskom svojstvu. Ova informacija se slično može dobiti s ulazne podatkovne jedinice 110 koja omogućuje pristup vanjskim izvorima podataka.
Pristupom jedinicama 110 i/ili 115, može se dobiti podskup molekularnih struktura primjerice od bilo kojeg raspoloživog izvora kao što je vlastita ili javna baza podataka koja se može pretraživati po substrukturi i/ili biološkim svojstvima. javne baze podataka obuhvaćaju ali nisu ograničene na one koje su dostupne pod sljedećim imenima: MDDR, Pharmaprojects, Merck Index, SciFinder, Derwent. Podskup molekula može se također dobiti sintetiziranjem i testiranjem spojeva. Molekule će općenito obuhvaćati cjelovite spojeve, ali to također mogu biti molekularni fragmenti. Za bilo koje biološko ili kemijsko svojstvo, podskup sadrži spojeve koji ne posjeduju navedenu značajku, primjerice spojevi koji nisu aktivni (ili su ispod praga aktivnosti) kao i spojevi koji ne posjeduju navedenu značajku, primjerice spojevi koji pokazuju željenu aktivnost (tj. aktivnost iznad danog praga). Svi neaktivni spojevi se relevantni, pa se prema tome analiziraju.
Nakon pristupa internim ili eksternim podacima i izvršenja DSA procesa pomoću funkcija koje su pohranjene u programskoj memoriji 130, središnja jedinica obrade 100 pohranjuje biblioteku fragmenata 120 koja sadrži određene fragmente molekula zajedno s pripadnim indeksnim vrijednostima.
U jednoj poželjnoj realizaciji ovog izuma, biblioteka fragmenata 120 je rezultat glavnog procesa, sukladno ovom izumu. Biblioteku fragmenata 120 mogu zatim koristiti primjerice kemijski i biološki znanstvenici ili inženjeri kao izvor vrijednih informacija koje se mogu koristiti u bilo kakvom daljnjem procesu otkrivanja.
U drugoj poželjnoj realizaciji, biblioteka fragmenata 120 je međurezultat glavnog procesa izuma i može se prema tome pohraniti u privremenu, ako i u stalnu memoriju. Biblioteka fragmenata 120 sukladno ovoj realizaciji može biti očitana pomoću središnje jedinice obrade 100 pri izvršenju daljnjih funkcija koje su pohranjene u programskoj memoriji 130 za generiranje zbirke spojeva 125.
Zbirka spojeva 125 je zbirka molekula koje su dobivene procesom ovog izuma i koje su označene kao one koje posjeduju ili ne posjeduju željeno biološko i/ili kemijsko svojstvo. Molekule zbirke spojeva 125 mogu biti bilo poznate ili mogu biti hipotetske strukture koje prije nisu sintetizirane. U svakom slučaju, molekule zbirke spojeva 125 su rezultat procjene indeksne vrijednosti koja je dodijeljena fragmentima sukladno diskretnoj substrukturnoj analizi.
Kao što se može vidjeti na slici 1, središnja jedinica obrade 100 je dalje povezana s podatkovnom memorijom 160 koja pohranjuje skupove spojeva 165, skupove fragmenata 170 i indeksne vrijednosti 175. Memorija podataka 160 postavljena je za pohranjivanje podataka koji se rabe za pohranjivanje ulaznih parametara kada se pozivaju funkcije 135-155, ili za pohranjivanje povratnih vrijednosti ovih funkcija.
Sukladno slici 2 koja prikazuje poželjnu realizaciju glavnog DSA procesa, operator računalnog sustava koji je prikazan na slici 1 prvo odabire aktivnost u stupnju 210. Kao što je prije navedeno, aktivnost označuje neko biološko i/ili kemijsko svojstvo uključujući biokemijska, farmakološka, toksikološka, pesticidna, herbicidna, katalitička svojstva. Štoviše, kada se izum rabi za identificiranje usamljenih liganada, aktivnost može biti dani efekt na protein od interesa (tipično vezanje).
U ovoj specifikaciji, referenca na neko konkretno svojstvo, kao što je biološka aktivnost, može osim ako kontekst ne uvjetuje drukčije, biti ekstrapolirana na druge tipove bioloških i/ili kemijskih svojstava. Zatim, da se izbjegne nedoumica, pojmovi ‘spoj’, ‘molekula’ i ‘molekularna struktura’ mogu svi uključivati molekularne substrukture kao i cjelovite spojeve, sukladno kontekstu.
Nakon što je u stupnju 210 odabrana aktivnost, skup spojeva 125 odabran je u stupnju 220. Skup odabranih spojeva je skup molekula koje su ispitane da se utvrdi koji fragmenti doprinose odabranoj aktivnosti. Kao što će niže biti detaljnije opisano, skup spojeva koji je odabran u stupnju 220 obuhvaća molekule za koje se zna da su aktivne i molekule za koje se zna da su neaktivne.
Kada su jednom odabrani aktivnost i skup spojeva, proces se nastavlja generiranjem biblioteke fragmenata 120 u stupnju 230. Proces generiranja biblioteke fragmenata može se opisati kao proces odmjeravanja učinkovitosti molekularnih fragmenata, unutar podskupa poznatih struktura, prema određenom kemijskom i/ili biološkom svojstvu. Ovaj proces se može opisati kao proces koji se sastoji iz sljedećih stupnjeva:
I. identificiranje jednog ili više podskupova molekula koje imaju dano svojstvo u odnosu na kemijsko i/ili biološko svojstvo od interesa;
II. generiranje preliminarne biblioteke koja sadrži fragmente molekula u navedenom jednom ili više podskupova;
III. primjena algoritma da se procijeni doprinos navedenih fragmenata u odnosu na kemijsko i/ili biološko svojstvo od ineteresa; i
IV. dobivanje indeksne vrijednosti za svaki navedeni fragment na kojega se primjenjuje navedeni algoritam, koje se zatim rangiraju prema veličini; oni fragmenti koji najviše doprinose kemijskom i/ili biološkom svojstvu od interesa, povezani su s indeksnim vrijednostima koje su visoko rangirane.
Kao što je prije navedeno, biblioteka fragmenata 120 sadrži fragmente kao i dobivene indeksne vrijednosti za te fragmente. Kada je jednom biblioteka fragmenata 120 generirana u stupnju 230, proces može ili ne mora izvršiti reiteriranje u stupnju 240.
Realiziranjem DSA procesa na reiteracijski način, računalni resursi mogu se iskoristiti na vrlo učinkovit način. Naprimjer, proces poželjno započinje s malenim fragmentima. Budući da se broj mogućih fragmenata povećava približno eksponencijalno s maksimalnom veličinom fragmenata koji se istražuju, ova maksimalna vrijednost postavlja se u početku na prilično nisku vrijednost tako da se može obraditi čak i vrlo veliki broj molekularnih struktura.
Procesni stupnjevi 210 do 230 daju fragmente s visokim doprinosom željenoj aktivnosti. Dobiveni fragmenti mogu se zatim koristiti u sljedećem ciklusu (krugu) da se nađu fragmenti veće veličine, tj. veće molekularne težine. Primjer reiteracijskog procesa prikazan je na slici 3. U prvom krugu, fragment C=O je nađen kao onaj koji ima visoki doprinos željenoj aktivnosti. Ovaj fragment se zatim rabi za traženje fragmenata koji su veći od dobivenog fragmenta u prvom krugu, ali da sadrže taj fragment. U primjeru na slici 3, drugi krug prikazuje fragment N-C=O kao najbolji fragment te veličine u odnosu na željenu aktivnost. Reiteracijski proces se zatim nastavlja, povećanjem veličine fragmenata, te može dovesti do spoja koji vjerojatno ima željeno biološko i/ili kemijsko svojstvo i pogodan je za željenu primjenu.
Vratimo li se na sliku 2, ako je odlučeno u stupnju 240 da se izvrši sljedeći krug ili ciklus, biblioteka fragmenata 120 koja je generirana u stupnju 230 analizirana je u stupnju 250, pa se proces vraća na stupanj 220. Primjeri kako se biblioteka fragmenata 120 analizira u stupnju 250 sada će biti detaljno opisan. Vidljivo je, reiteracijski proces omogućuje primjenu više naprednih funkcija kao što su funkcije generaliziranja 145 i funkcije združivanja 155 da se dodatno poboljša proces otkrivanja pomoću diskretne substrukturne analize.
Najzad, ako je odlučeno u stupnju 240 da se reiteracijski proces ne izvrši, ili da je reiteracijski proces došao do završetka, zbirka spojeva 125 generira se u stupnju 260.
Vratimo li se natrag na stupanj 230 generiranja biblioteke fragmenata 120, poželjna realizacija podstupnjeva procesa generiranja sada će biti detaljno opisana prema slikama 4 do 6. Prvo, nakon što se pristupi internoj bazi podataka 115 i/ili vanjskom izvoru podataka te se identificira podskup molekula, podaci o strukturnoj aktivnosti koji se odnose na identificirane molekule dobiju se u stupnju 410. Nakon toga, fragmenti molekula u podskupu su određeni u stupnju 420.
Molekule mogu biti fragmentirane korištenjem određenog broja standardnih tehnika. Naprimjer, neki algoritam može se koristiti za izum bilo koje permutacije atoma koji su međusobno povezani. Fragmentacijske funkcije 135 mogu koristiti minimalnu veličinu i maksimalnu veličinu fragmenata. Kao sljedeći primjer, fragmentacijski algoritam može biti podučen da preskoči one fragmente u kojih su atomi organizirani linearno. Zatim, algoritam može imati ograničenja da uključi ili isključi određene tipove veza. Postoji mnogo različitih vrsta primjene fragmentacijskih funkcija koje su lako dostupne za osobu koja poznaje ovo područje.
Prema tome, svaka molekularna struktura može se koncepcijski razbiti u niz diskretnih substruktura ili fragmenata (stupanj 420). Fragmenti mogu biti jednostavne funkcionalne skupine, npr. NO2, COOH, CHO, CONH2; egzaktne 2D substrukture, npr. o-nitrofenol; labavo definirane familije substruktura, npr. R-OH; jednostavni atomi ili veze, ili neki sklop strukturnih deskriptora u 2D ili 3D kemijskom prostoru.
Nakon što je molekula razbijena u fragmente u stupnju 420, u stupnju 430 izračunati su fragmentni indeksi izračunavanjem indeksne vrijednosti za svaki fragment i povezivanjem izračunatih vrijednosti s fragmentom. Nakon toga, u stupnju 440 određeni su najveći indeksni fragmenti i pohranjeni u stupnju 450.
Na slici 5 dan je primjer kako se određuju najveći indeksni fragmenti. U tom primjeru, određene indeksne vrijednosti su nanesene prema broju spojeva koji sadrže dani fragment. U ovom grafu, svaki fragment je prikazan kao točka. Korištenjem ovog prikaza u stupnju 440 dobiva se više informacija nego samo odabiranjem najvećih indeksiranih fragmenata uspoređivanjem indeksnih vrijednosti, jer prikaz dodatno koristi informaciju o broju koji sadrže odgovarajuće fragmente.
Proces izuma najveće indeksne vrijednosti može se smatrati ekvivalentnim generiranju filogene mreže hijerarhijski nanizanih molekularnih fragmenata koji odgovaraju danoj biološkoj i/ili kemijskoj aktivnosti. U ovoj postavci, čvorovi mreže predstavljaju sami fragmenti, te je vjerojatnost da je jedan jedini fragment u osnovi biološke aktivnosti dana udaljenošću odgovarajućeg čvora od ishodišta, dakle od osnovice same mreže. Što je veća indeksna vrijednost za bilo koji dani fragment, to je dalje odgovarajući čvor od ishodišta ćelije i to je vjerojatnije da fragment predstavlja kemijsko rješenje u odnosu na, npr. farmakofor koji je utvrđen metom interesa.
Sada će detaljnije biti opisan stupanj 430 indeksiranja fragmenata prema slici 6. Primjena indeksiranih funkcija 140 odgovara prije navedenom skupu logičkih pravila ili stupnjeva izračunavanja. DSA metoda sukladno ovom izumu obuhvaća u poželjnoj realizaciji stupanj ugradnje varijabli koje se odnose na prevalenciju svakog fragmenta u jednoj ili više matematičkih funkcija kojima se procjenjuje indeksna vrijednost za bilo koji dani fragment.
Navedeni algoritam je funkcija:
a) broja molekula x unutar podskupa koji udovoljava danom pragu u odnosu na željeni doseg i koji sadrži dani fragment;
b) broja molekula y unutar navedenog podskupa koji sadrži dani fragment, bez obzira udovoljava li ili ne udovoljava navedenom pragu;
c) broja molekula z unutar navedenog podskupa koji udovoljava navedenom pragu, bez obzira sadrži li ili ne sadrži dani fragment; i
c) broja molekula N svih molekula u podskupu.
Doseg koji je naveden u (a) može biti bilo koji željeni parametar koji se odnosi na aktivnost spojeva, uključujući ali bez ograničenja na biološku, biokemijsku, farmakološku i/ili toksikološku aktivnost. Svaki spoj ili molekula u danom skupu mogu se analizirati već prema tome posjeduju li željeni parametar, u odnosu na zadani prag, kao što je željena razina aktivnosti. Prag može biti postavljen na bilo koju željenu razinu. U opisu koji slijedi, ‘aktivan’ spoj je onaj koji udovoljava željenom pragu dok je ‘neaktivan’ spoj onaj koji ne udovoljava navedenom pragu. Ovi pojmovi nisu namijenjeni izražavanju bilo kojeg apsolutnog svojstva.
Doprinos danog fragmenta može se odrediti primjenom varijabli x, y, z i N, mjere povezanosti ili indeksne funkcije 140. Kao što je dobro poznato onima koji poznaju ovo područje, postoji mnogo mogućih mjera povezanosti, a one spadaju u tri glavne kategorije:
Substraktivne mjere: npr. Nx-yz;
Mjera odnosa: npr. x(N-y-z-x)/(z-x)(y-x);
Pomiješane mjere: npr. (x/z)-(z-x)/(N-z).
Može se odabrati bilo koja mjera i osoba koja poznaje ovo područje će lako načiniti odgovarajući izbor.
Algoritam primijenjen u stupnju 430 može dakle uključivati sljedeće (vidi sliku 6):
(i) procjena broja spojeva x unutar podskupa koji udovoljavaju određeni prag u odnosu na kemijski ili biološki doseg od interesa i koji sadrže danu kemijsku determinantu (stupanj 610);
(ii) procjena broja spojeva y unutar navedenog podskupa spojeva koji sadrže navedenu kemijsku determinantu, bez obzira udovoljavaju li ili ne navedenom pragu (stupanj 620);
(iii) procjena broja spojeva z unutar navedenog podskupa spojeva koji udovoljavaju navedenom pragu bez obzira sadrže li ili ne sadrže navedenu kemijsku determinantu (stupanj 630);
(iv) procjena ukupnog broja spojeva N unutar navedenog podskupa spojeva (stupanj 640); i
(v) primjena mjere povezanosti dviju ili više varijabli x, y, z i N (stupanj 650), poželjno tri ili četiri varijable x, y, z i N.
Mjera povezanosti može se primijeniti izravno, da se odredi indeksna vrijednost koja odgovara danom fragmentu. Poželjno, međutim, mjera povezanosti je prevodi u indeksnu funkciju, da bi se procijenila vjerojatnost da substruktura doprinosi određenom dosegu. Time je olakšano jasnije određivanje rangiranja indeksnih vrijednosti koje su dobivene za ukupnost analiziranih fragmenata. Mjera povezanosti može se prevesti u indeksnu funkciju pomoću metoda koje su poznate u tehnici. Primjerice, metode mogu biti izabrane među statističkim metodama, npr. metodi kritičnog odnosa (z); Fisherovom egzaktnom testu, Personovom hi-kvadrat testu, Mantel Haenzelovom hi-kvadrat testu, te metodama koje se temelje na njima, ali bez ograničenja, izvršenjem inferencija na nagibu i slično. Međutim, mogu se koristiti i metode koje nisu statističke. Takve metode obuhvaćaju, ali nisu ograničene na izračunavanje i uspoređivanje egzaktnih i približnih intervala povjerenja, korelacijskih koeficijenata, ili bilo koje funkcije koja sadrži mjeru povezanosti koja obuhvaća kombinaciju dvije, tri ili četiri varijable x, y, z ili N, kao što je opisano gore.
Primjeri matematičkih formula koje predstavljaju mjeru povezanosti ili indeksne funkcije koje se mogu koristiti u ovom izumu obuhvaćaju:
[image]
Osoba s iskustvom u ovom području će uočiti da indeksna funkcija (VII) kao produkt momenta korelacijskog koeficijenta koja odražava stupanj dijeljene varijance između dihotomnih varijabli nije eksplicitno pokazana u navedenoj formuli.
Osoba s iskustvom u ovom području će uočiti da indeksna funkcija (VIII) koja se odnosi na procjenu rizika korištenjem nagiba regresijske linije predstavlja stupanj cijeljene varijance između dviju dihotomnih varijabli.
Osoba s iskustvom u ovom području će uočiti da je indeksna funkcija (IX) kao statistika hi-kvadrata modificirana za različite čimbenike. Primjerice, član N/2 u nazivniku drugog kvocijenta produkta koja je logaritamski skalirana predstavlja konzervativno ugađanje normalne aproksimacije za binomnu raspodjelu, što je korisna modifikacija kad se radi s razmjerno malenim vrijednostima x, y, z ili N. Osoba s iskustvom u ovom području će uočiti da se druge mjere povezanosti i/ili indeksne funkcije mogu koristiti u istu namjenu umjesto onih koje su opisane u formulama (I) i (II), a najprimjerenija, u smislu ovog izuma, sadrži različite kombinacije dvije, tri ili četiri varijable x, y, 2 i N.
Osoba s iskustvom u ovom području će uočiti da je indeksna funkcija (X) način kojim se procjenjuje vrijednost donje granice 95% intervala povjerenja mjere (111), korištenjem logaritamske transformacije da se zadrži raspodjela odnosa koji se može bolje usporediti s normalnom razdiobom, te aproksimacije Taylorova niza prvog reda da se procijeni varijanca logaritma istog navedenog odnosa.
Osoba s iskustvom u ovom području će uočiti da indeksna funkcija (XI) kao način uspoređivanja odnosa, omogućuje identificiranje kemijskih determinanti koje su najvjerojatnije selektivne za jednu metu u odnosu na drugu.
Osoba s iskustvom u ovom području će uočiti da indeksna funkcija (XII) kao način kombiniranja multiplih testova povezanosti, omogućuje identificiranje kemijskih determinanti koje najvjerojatnije djeluju na dva ili više danih svojstava istovremeno.
Osoba s iskustvom u ovom području će također uočiti može modificirati da sadrži dodatne varijable koje se odnose na molekularnu građu, biološka, kemijska i/ili fizičko-kemijska svojstva. Primjerice, takve modifikacije mogu sadržavat, ali bez ikakva ograničenja, ugađanje jačine spoja, selektivnost, toksičnost, biološku raspoloživost, stabilnost (metaboličku i kemijsku), sintetska svojstva, čistoću, komercijalnu raspoloživost, raspoloživost odgovarajućih reagensa za sintezu, cijenu, molekularnu težinu, molarnu refrakciju, molni volumen, logP (izračunati ili određeni), broj skupina koje primaju H-vezu, broj kupina koje stvaraju H-vezu, naboj (djelomični i formalni), konstanta protoniranja, broj molekula koje sadrže dodatne kemijske ključeve ili deskriptore, broj rotacijskih veza, indeksi elastičnosti, indeksi molekularnog oblika, podudarne i/ili volumeni preklapanja.
Tako primjerice, indeksna funkcija (VIII) može se dodatno modificirati npr. uzimanjem u obzir molekularne težine svake kemijske determinante koja se razmatra (MW) na sljedeći način:
[image]
Slično, indeksna funkcija (IX) može se modificirati da uključi da uključuje varijable MW i [S], koje dotično predstavljaju molekularnu težinu kemijske determinante o interesa (MW), te broj koliko puta se neka kemijska determinanta pojavljuje u podskupu aktivnih pojeva x ([S]), na sljedeći način:
[image]
da bi se identificiranje tijekom analize usmjerilo prema najvećoj mogućoj, singletnoj, biološki aktivnoj kemijskoj determinanti.
Rezultati stupnja 650 algoritma daju indeksnu vrijednost fragmenta koji se razmatra. Stupnjevi 610-650 algoritma mogu se ponoviti za svaki od odabranih fragmenata među podacima. kada se izračunaju vrijednosti za sve odabrane fragmente, rezultati predstavljaju indeksnu vrijednost koja odgovara potencijalnoj učinkovitosti svakog analiziranog fragmenta. Navedene indeksne vrijednosti mogu se rangirati prema veličini; pri čemu oni fragmenti koji najviše doprinose kemijskom i/ili biološkom svojstvu od interesa dobivaju indeksne vrijednosti koje su visoko rangirane. To omogućuje u stupnju 440 identificiranje jednog ili više lokalnih ekstrema vrijednosti indeksne funkcije, a njene kemijske determinante odgovaraju punom ili djelomičnom kemijskom rješenju za dano kemijsko ili biološko svojstvo. Pronalaženje najveće indeksne vrijednosti koje se može se postići u nekom skupu podataka ekvivalentno je identificiranju kemijskih determinanti koje su sadržane unutar podskupa molekula sa željenim svojstvima, te njene kemijske determinante imaju najmanju vjerojatnost da se u istom skupu nađu slučajnim izborom. Kada je željeno svojstvo dana biološka aktivnost, najveće indeksirani fragmenti ili kemijske determinante predstavljaju biološki aktivan farmakofor.
Vratimo li se slici 2, sada će biti razmotrene poželjne realizacije stupnja 250 analiziranja biblioteke fragmenata 120.
Jedan način analiziranja biblioteke fragmenata 120 prikazan je na slici 7. Proces započinje odabiranjem fragmenata u stupnju 710 temeljem indeksne vrijednosti koja je određena u prethodnom ciklusu. Nakon toga, spojevi iz prethodnog ciklusa koji sadrže odabrani fragment su ekstrahirani u stupnju 720. Budući da je u stupnju 710, odabran fragment s visokim doprinosom, spojevi koji su ekstrahirani u stupnju u stupnju 720 mogu se smatrati aktivnim spojevima. Nakon toga, u stupnju 730, odabire se skup neaktivnih spojeva, bilo iz prethodnog skupa ili iz baze podatak ili nekog drugog izvora. Nakon toga, aktivni i neaktivni spojevi se vežu zajedno u stupnju 740 te čine novi skup spojeva. Novi skup spojeva se zatim odabire u stupnju 220 kao skup spojeva sljedećeg reiteracijskog generiranja da bi se nastavio sljedeći ciklus.
Poželjna realizacija izvršenja stupnja 730 sada će biti opisana u sprezi sa slikom 8. Ova realizacija omogućuje uporabu generičkih substruktura da se odabere novi skup spojeva za sljedeći ciklus.
Proces na slici 8 počinje analiziranjem, u stupnju 810, strukture fragmenata koji su odabrani u stupnju 710. Kada se rabi generički aspekt izuma, fragment koji je odabran u stupnju 710 može se odabrati procjenom indeksne vrijednosti koja je izračunata u prethodnom krugu. Nadalje, odabiranje fragmenta može biti ovisno o daljnjim čimbenicima koji djeluju na pogodnost fragmenta da bude polazna točka generaliziranja. Ova pogodnost može biti funkcija broja atoma ili veza, načina povezanosti atoma, trodimenzionalne strukture određenog fragmenta itd.
Nakon što je struktura odabranog fragmenta analizirana u stupnju 810, generalizirana stavka je locirana u fragmentnoj strukturi u stupnju 820. Ova stavka je zatim zamijenjena s generaliziranim izrazom u stupnju 830 te rezultira generičkom substrukturom (npr. da se nađu bio-izosteri). Primjer je
[image]
gdje su u danom odabranom fragmentu locirane dvije generalizirane stavke i zamijenjene s općim izrazima [Ar] i A, gdje [Ar] označuje aromatski centar, a A označuje C ili S.
Generička substruktura u stupnju 830 se zatim koristi za izvršenje virtualnog skeniranja da se nađu novi spojevi koji odgovaraju generičkoj substrukturi. Pojam "virtualno skeniranje" odnosi se na neki proces skeniranja koji se vrši samo s podacima, čime se izbjegava potreba za sintetiziranjem spojeva. Novi spojevi koji se dobiju virtualnim skeniranjem, zatim se koriste za konstruiranje skupa novih spojeva u stupnju 850 koji se može koristiti u sljedećem reiteracijskom krugu.
Kao što se može vidjeti na slici 9, proces virtualnog skeniranja može se podijeliti u intra- i ekstra- domenu modifikacija fragmenata koja je dobivena upotrebom generičkih substruktura. Modifikacije intra-domene izvršene u stupnju 910 obuhvaćaju supstitucije, umetanja, brisanja i inverzije atoma fragmenata. Polazeći od gore navedenog egzaktnog fragmenta i generaliziranjem ovog fragmenta u generičku substrukturu, u sljedećem primjeru dobiju se tri različite supstitucije:
[image]
Modifikacije ekstra-domene u stupnju 920 sastoje se od promjena supstituenata fragmenata. Oni mogu biti slučajni, usmjereni, itd.
[image]
Skupovi usmjerenih spojeva su zbirke molekula koje se zasnivaju na modifikacijama jedne ili više generičkih substruktura:
[image]
Premda su na slici 9 stupnjevi izvršenja modifikacija intra-domene i ekstra-domene prikazani tako da se vrše u serijama, onaj tko poznaje ovo područje će znati da je izumom obuhvaćeno da se izvrši samo jedna od ovih različitih modifikacija, ili da se izvrše obje modifikacije u različitoj sekvenciji ili čak istovremeno. Podrazumijeva se da je rezultat virtualnog skeniranja opsežna zbirka spojeva koji imaju veliku vjerojatnost da budu aktivni, budući da obiluju substrukturama koje su povezane s aktivnošću.
Premda je u stupnju 710 odabran fragment koji čini osnovice za primjenu funkcija generalizacije 145 da se dobije generička substruktura, daljnja poželjna realizacija izuma je odabiranje većeg broja fragmenata visokog indeksa da se generiraju generičke substrukture. Naprimjer, pokazalo se da sljedeći fragmenti imaju visoki doprinos željenoj aktivnosti, te mogu biti odabrani u stupnju 710:
[image]
Ovi odabrani fragmenti se zatim reduciraju u generičke substrukture visokog indeksa, kao što su:
[image]
Ove generičke substrukture se zatim koriste za virtualno skeniranje komercijalnih baza podataka
[image]
ili zbirki spojeva.
Mada je reiteracijski proces opisan kao osobito pogodan iz računalnih razloga jer je koristan da se započne s malenim fragmentima i zatim povećava veličina fragmenta od jednog do drugog kraja, te mada je kasnije pokazano da se snaga otkrivanja još može povećati korištenjem generičkih aspekata reiteracijskog procesa, postoji drugi pristup sukladno ovom izumu dodatnog poboljšanja diskretne substrukturne analize procesa ovog izuma. Taj pristup se zasniva na tehnici združivanja što će sada biti opisano prema slici 10.
U poželjnoj realizaciji na slici 10, stupanj 250 analiziranja biblioteke fragmenata koji je generiran u prethodnom ciklusu, počinje stupnjevima 1010 i 1020 selektiranjem prvog i drugog fragmenta. Oba fragmenta su odabrana temeljem izračunate indeksne vrijednosti i može se uzeti da su to fragmenti s visokim doprinosom.
U sljedećem stupnju 1030, funkcija združivanja 155 primjenjuje se za povezivanje prvog i drugog fragmenta. Povezivanje fragmenata znači da se definira molekularna struktura ili substruktura koja uključuje oba fragmenta. U tu svrhu, koristi se određen broj različitih funkcija združivanja 155. Ove funkcije združivanja razlikuju se konkretnom primjenom kako se procjenjuju i koriste određeni parametri združivanja. Ti parametri su, primjerice, (unaprijed određena) udaljenost prvog i drugog fragmenta, broj atoma koji se nalaze između fragmenata, broj veza koji se rabi za međusobno povezivanje fragmenata, vrsta veze i atoma itd.
Zatim, proces združivanja poželjno se kombinira s generičkim aspektom koji je gore opisan. Ako, primjerice, u stupnjevima 1010 i 1020 fragmenti F1 i F2 su tako odabrani da je poznato da imaju visoke vrijednosti indeksa, funkcija združivanja koja je odabrana u stupnju 1030 i izvršena u stupnju 1040 može koristiti generički izraz
F1-[G]-F2
za povezivanje fragmenata. Opći izraz [G] je sinonim za molekularne substrukture danog svojstva i parametre združivanja te ovise o korištenoj funkciji združivanja.
Kada su jednom fragmenti kombinirani, pomoću egzaktnog ili generičkog izraza, generira se skup novih spojeva u stupnju 1040 koji uključuje oba fragmenta. Primjer molekule novog skupa spojeva prikazan je na slici 11, koji je dvodimenzionalna relativna kontribucijska mapa koja prikazuje relativni doprinos u odnosu na lokalne koordinate. Kao što se može vidjeti na slici 11, postoje dva lokalna maksimuma koji prikazuju približne indeksne vrijednosti od 1,2 i 1,7 fragmenata F1 i F2.
Proces združivanja ima prednosti iz dva razloga. Prva prednost je u tome što se povezuju dva fragmenta koji imaju visoki doprinos željenoj aktivnosti, te se dobiva veća molekula koja participira zbog činjenice što je uključen više od jednog fragment visokog indeksa. Dobivena struktura ima dakle dobre šanse da ima čak i veću indeksnu vrijednost nego što je najveća indeksna vrijednost dviju fragmenata.
Naprimjer, u strukturi na slici 11, dobiveni spoj uključuje fragmente koji imaju indeksne vrijednosti 1,2 i 1,7 ali može rezultirati ukupnom indeksnom vrijednošću za cijelu strukturu od, primjerice, 2,1. Tehnika združivanja dakle omogućuje otkrivanje spojeva čak i veće aktivnosti.
Druga prednost tehnike združivanja je što omogućuje izbjegavanja zaglavljivanja u računalnom procesu. Kao što se može vidjeti na slici 11, relativne kontribucijske vrijednosti označuju lokalni maksimum. Kada se izvršava reiteracijski proces prikazan na slici 3, polazeći od malenih fragmenata i povećanjem veličine fragmenata u svakoj reiteraciji od ciklusa do ciklusa, može doći do zaglavljivanja kada se odabrani fragment u jednom međustupnju nalazi u lokalnom maksimumu.
Naprimjer, kada je na kraju drugog ciklusa odabran fragment N-C=O i ovaj fragment je smješten na lokalnom maksimumu, sljedeći ciklus neće biti uspješan. Kao što je opisano gore, fragmenti sljedećeg ciklusa poželjno se konstruiraju iz odabranih fragmenata prethodnog ciklusa postupnim povećanjem veličine fragmenta. Dakle, kada se dodaje neki atom odabranom fragmentu, sljedeći ciklus će udaljiti fragment od lokalnog maksimuma. Prema tome, bilo koji dobiveni fragment imat če nižu indeksnu vrijednost nego odabrani fragment prethodnog ciklusa.
Da bi se izbjeglo ovo zaglavljivanje, može se primijeniti tehnika združivanja odabiranjem dviju fragmenata iz prethodnog ciklusa, povezivanjem fragmenata, izračunavanjem indeksne vrijednosti i nastavljanjem procesa. To se može načiniti periodički od ciklusa do ciklusa, ili onda kada se detektira zaglavljivanje.
Premda je izum opisan pomoću određenog broja poželjnih realizacija, onaj tko poznaje ovo područje će uočiti da izum ni na koji način nije ograničen na ove realizacije. Naprimjer, niz metodskih koraka koji je prikazan u dijagramu toka može se promijeniti, ili stupnjevi za koje je prikazano da se vrše konzekutivno mogu se izvršiti paralelno, vidi stupnjeve 1010 i 1020 procesa koji je prikazan na slici 10.
Zatim, očigledno je za one koji poznaju ovo područje da u bilo kojoj primjeni nisu neophodni svi metodski stupnjevi. Naprimjer, u procesu indeksiranja na slici 6, parametri koji nisu neophodni za indeksnu funkciju ne trebaju biti računati. Zatim, parametri se mogu računati istovremeno u višezadaćnom ili višenitnom operativnom sustavu.
Sada će kao primjer biti razmotrene dodatne realizacije izuma.
Naprimjer, biblioteka fragmenata koja je generirana u stupnju 230 može u teoriji sadržavati sve moguće fragmente i njihove kombinacije. To se može postići u praksi ako je biblioteka generirana pomoću računala. Međutim, ako je biblioteka generirana ručno, vjerojatno je da ona sadrži samo selekciju svih mogućih fragmenata. Metoda se dakle može ponoviti korištenjem kombinacije fragmenata, konkretno kombinacije fragmenata za koje su u prethodnoj analizi dobivene visoke indeksne.
Dakle, nakon početne analize fragmenata, oni fragmenti koji najvjerojatnije doprinose kemijskom i/ili biološkom djelovanju od interesa mogu se kombinirati i može se primijeniti algoritam kao što je opisano gore da se procjeni doprinos navedene kombinacije fragmenata u odnosu na kemijsko i/ili biološko djelovanje od interesa. Dobivena indeksna vrijednost može se usporediti s indeksnom vrijednošću pojedinog fragmenta da se procijeni rezultira li kombinacija unaprjeđenjem doprinosa kemijskom i/ili biološkom djelovanju od interesa.
U sljedećoj realizaciji ovog izuma, moguće je izvući između fragmenata koji imaju najveći doprinos kemijskom i/ili biološkom svojstvu od interesa zajednički strukturni dio da se odredi je li doprinos navedenog zajedničkog dijela jednaki ili veći od polaznih fragmenata.
Fragmenti koji imaju najveću indeksnu vrijednost, predstavljaju kemijsku determinantu ili otisak prsta s najvećoj težinom doprinosa za dano kemijsko ili biološko svojstvo.
Kada je jednom identificiran otisak prst, moguće je načiniti biblioteku spojeva koji sadrže navedenu kemijsku determinantu. Spojevi se mogu dobiti putem programa sinteze, oko dotičnog strukturnog svojstva. Alternativno, spojevi koji sadrže kemijsku determinantu mogu biti identificirani iz komercijalnog kataloga te nabavljeni iz odgovarajućeg izvora. Spojevi ne trebaju biti neizostavno priređeni za farmaceutsku namjenu i mogu se nabaviti iz različitih izvora.
Kada je jednom željena biblioteka sastavljena, ona se može skenirati u odnosu na metu o interesa. Rezultati skeniranja mogu identificirati pojeve koji su dovoljno aktivni da bi ih se kasnije razvilo, ili mogu biti putokaz za program sinteze. DSA metoda, sukladno ovom izumu, omogućuje kreiranje široke ali ipak i dovoljno koncentrirane biblioteke, u odnosu na konkretni biološki ili farmakološki cilj. Dakle, vjerojatnost uspjeha pri skeniranju aktivnih spojeva i/ili upotrebljivih vodilja se bitno povećava.
U daljnjoj realizaciji, izum definira metodu za identificiranje molekula s određenim poželjnim svojstvima, kao što su biološki aktivne molekule, a metoda obuhvaća sljedeće:
• Odmjeravanje doprinosa molekularnih fragmenata, unutar podskupa molekula, danom kemijskom ili biološkom svojstvu kao što je opisano prije,
• Identificiranje jednog ili više fragmenata s najvećom težinom, i
• Prevođenje skupa spojeva u skup spojeva koji sadrži jedan ili više navedenih fragmenata i proizvoljno
• Ispitivanje navedenih spojeva na željena svojstva.
Valja uočiti da se metoda može jednako koristiti za identificiranje fragmenata koji vode neželjenim svojstvima, npr. nepoželjnim biološkim sporednim učincima da bi se isključili iz razmatranja spojevi koji imaju navedene fragmente.
Tako proces ovog izuma generira strukturne hipoteze (fragmente) koji su vjerojatno objašnjenje za dano biološko, biokemijsko, farmakološko ili toksikološko svojstvo temeljem izračunatih indeksnih vrijednosti. Razmatranjem indeksne vrijednosti za dani fragment omogućuje da onaj tko razvija lijek donese utemeljene odluke da bi pristup pružio šansu da se postigne željeni cilj, kao što je identificiranje jačih spojeva, otkrivanje novih nizova aktivnih spojeva, identificiranje selektivnijih ili biološki dostupnijih spojeva ili eliminiranje toksičnih učinaka.
Metoda ovog izuma usredotočuje se na fragmente koji se nalaze unutar podskup spojeva od interesa, čime se uklanja potreba da se povode mukotrpna izračunavanja za opsežne, ali vjerojatno manje važne sektore kemijskog prostora. To rezultira smanjenjem broja stupnjeva izračuna koje je nužno provesti za dano biološko svojstvo, pri čemu se zadržava osnovna razina molekularnog razumijevanja koja je nužna da bi se pretpostavilo postojanje biološki aktivnih kemijskih determinanti.
Kao što je razmotreno prije, proces ovog izuma obuhvaća traženje lokalnog ekstrem za jednu ili više funkcija, koje se mogu jednostavno izabrati pa to odgovara vjerojatnostima koje su dane u standardnim statističkim tablicama. Tako se dobiva elegantna metoda za procjenu mogućeg doprinosa danog fragmenta nekom kemijskom ili biološkom svojstvu. Međutim, nije nužno da se analiza temelji na statističkoj teoriji da bi se realizirao ovaj izum.
DSA metoda izuma može se koristiti u širokom rasponu primjena otkrića lijekova. Kao što je opisano, gore navedena metoda omogućuje identificiranje farmakofora koji imaju veliku vjerojatnost doprinosa danoj biološkoj aktivnosti, primjerice, 7-TM receptorski antagonista, kinaza inhibitora, fofataznih inhibitora, ion-kanalnih blokatora, te proteaznih inhibitora kao i aktivnih entiteta prirodnih peptidergičnih liganada.
Metoda također omogućuje identificiranje endogenih modulatora ciljanih lijekova, što olakšava identificiranje novih smjerova farmakološke intervencije, kao i racionalne ugradnje novih farmakoloških svojstava u molekule koje prethodno nisu imale ta svojstva.
Metoda se može također koristiti za identificiranje lažno pozitivnih i lažno negativnih rezultata u skupovima podataka, primjerice onima koji se izvode iz visokoučinkovitog skeniranja. DSA se također koristi u predviđanju selektivnosti spoja, primjerice identificiranjem potencijalno nepoželjnih sekundarnih učinaka.
Metoda se na isti način može koristiti za predviđanje toksičnih učinaka spoja, identificiranjem “toksikofornih” kemijskih determinanti, koje u sprezi s gornjim, omogućuje konstrukciju kemijskih determinanti baze podataka koje su od velike koristi za odabiranje kemijskog niza. U ovom kontekstu, metoda nadalje omogućuje racionalnu ugradnju novih farmakoloških svojstava u kemijske spojeve koji prethodno nisu imali tu aktivnost. Najzad, zbog njezina kapaciteta da identificira najprimjereniju razinu molekularne različitost koju je potrebno ispitati tijekom kampanje skeniranja, DSA metoda omogućuje učinkovito provođenje racionalne, opsežne i paralelne, automatizirane visokoučinkovite kampanje skeniranja, što je značajan napredak u odnosu na HTP strategije otkrivanja.
Kao što se može vidjeti za gore navedenu metodu, bar jedan stupanj izvršava računalno kontrolirani sustav. Dakle, primjerice, vrijednosti x, y, z i N koje su dobivene iz ove baze podataka mogu se ubaciti u odgovarajući računalni program i njime obraditi. Ovaj izum nadalje se odnosi i na računalno-kontrolirane i računalno implementirane metode.
Iz gornjeg opisa, očigledno je da je ovaj izum nova metoda za brzo identificiranje molekula koje imaju određena poželjna svojstva kao što je biološki aktivna molekula. Konkretno, izum se odnosi na metodu odmjeravanja učinkovitosti molekularnih struktura, da bi se mogli identificirati biološki aktivni entiteti molekularnih struktura, te da bi se ti entiteti mogli koristiti pri oblikovanju namjenske zbirke kemijskih spojeva za brže i cijenom racionalizirano otkrivanje lijekova.
Definirana je metoda za povećanje udjela biološki aktivnih sojeva u danom skupu kemijskih entiteta pri čemu navedeni entiteti nisu otprije poznati kao oni koji imaju željenu biološku aktivnost. Navedena metoda obuhvaća primjenu različitih matematičkih tehnika za određivanje kvantitativnog odnosa strukture i aktivnosti (QSAR). Ova nova metoda, koja se može nazvati diskretna substrukturna analiza (DSA), nudi rješenje primjerice za problem prepoznavanja farmakoloških motiva, dakle za problem identificiranja kemijskih determinanti (CD) koje su odgovorne, u odnosu na dani spoj, za bilo kakav kemijski ili biološki učinak, što može primjerice biti biološka, biokemijska, farmakološka, kemijska i/ili toksikološka aktivnost.
Metoda ovog izuma ima široku primjenu i nije ograničena na farmaceutsko područje. U svezi biološki aktivnih pojeva, metode se može primjerice koristiti u svezi s pesticidima i herbicidima, kada je željena biološka aktivnost dotično pesticidna i herbicidna aktivnost. Metoda se može također koristiti u primjenama reaktivnog modeliranja gdje su željena svojstva kemijski, a ne biološki atributi, primjerice pri priređivanju katalizatora.
Valja uočiti da se tehnika izuma sastoji u kombiniranju unutar podskupa ili između različitih podskupova onih fragmenata koji najvjerojatnije doprinose kemijskom i/ili biološkom svojstvu od interesa, te primjeni algoritma za procjenu doprinosa navedenih kombiniranih fragmenata u odnosu na kemijska i/ili biološka svojstva od interesa, pa se dobivena indeksna vrijednost može usporediti s indeksnim vrijednostima pojedinih fragmenata da se provjeri rezultira li kombinacija povećanjem doprinosa kemijskom i/ili biološkom svojstvu od interesa.
Zatim, izum omogućuje da se izvuče među fragmentima koji imaju najveći doprinos kemijskom i/ili biološkom svojstvu od interesa zajednički strukturni dio za identificiranje je li doprinos navedenog zajedničkog dijela jednaki ili veći od onoga polaznih fragmenata.
Štoviše, koristi se mjera povezanosti koja je poželjno odabrana među substraktivnim mjerama, odnosu mjera ili miješanim mjerama. Mjera povezanosti je poželjno ugrađena u indeksnu funkciju ili se razvija u indeksnu funkciju. Indeksna funkcija može se razviti pomoću statističke metode koja je odabrana između metode kritično odnosa, Fisherova egzakta testa. Pearsonova hi-kvadrat testa, Mantel Haenzelova hi-kvadrat testa, chi-squared, nagiba i slično. Daljnja poželjna realizacija je što se indeksna funkcija razvija pomoću metode koja je odabrana između izračunavanja i uspoređivanja egzaktnih i približih intervala povjerenja, korelacijskih koeficijenata ili bilo koje funkcije koja eksplicitno sadrži neku mjeru povezanosti koja uključuje neku kombinaciju dvije, tri ili četiri varijable x, y, z i N.
Poželjno, izum izvršava stupanj odabiranja molekula koje sadrže najviše rangirane fragmente kao potencijalne ligande i proizvoljno ih ispituje kao modulatore ciljanog lijeka. Proces ovog izuma može se poželjno koristiti za identificiranje lažno pozitivnih i/ili lažno negativnih eksperimentalnih rezultata. Ostale poželjne primjene su izvršenje pretraživanja sličnosti, analiza raspršenosti i/ili konformacijska analiza.
U nastavku su dani primjeri koji prikazuju brojne primjene DSA procesa sukladno ovom izumu. Primjeri su poželjne realizacije izuma i služe za ilustriranje izuma, te se ni na koji ne trebaju smatrati ograničenjem njegova dosega.
Primjer br. 1
Racionalno identificiranje novih i selektivnih receptorskih liganada
Kompeticijska vezujuća analiza razvijena je za površinske stanične receptore priređivanjem rekombinantne membrane i radioobilježenog peptida. Načinjena je zbirka spojeva za ispitivanje u analizi, ona je ispitana, te su identificirani novi receptorski ligandi sukladno metodi ovog izuma. Prvi stupanj sastoji se u prevođenju liste od 208 struktura antagonista istog navedenog receptora pregledom tekuće znanstvene literature. Drugi stupanj sastoji se u identificiranju biološki aktivnih kemijskih determinanti koje su sadržane unutar ovih 208 receptorskih liganada. U tu svrhu, generirana je dodatna lista koja sadrži 101130 struktura koje su opisane kao strukture koje nemaju učinka na isto navedeni receptor, te je dodana prvoj listi. Dobivena lista od 101338 struktura je zatim analizirana na prisutnost biološki aktivnih kemijskih determinanti odabiranjem supstraktivnih mjera povezanosti (I), gdje x označuje broj aktivnih kemijskih struktura koje sadrže kemijsku determinantu od interesa, y označuje ukupni broj kemijskih struktura koje sadrže istu navedenu kemijsku determinantu, z označuje ukupni broj aktivnih kemijskih struktura u skupu od N molekula (tj. z = 208), a N označuje ukupni broj kemijskih struktura koje su podvrgnute analizi (tj. N = 101338).
(I) Nx-yz
Mjera povezanosti (I) zatim je razvijena u indeksnu funkciju (II), pa će je osoba koja poznaje ovo područje prepoznati kao posrednu mjeru vjerojatnosti slučajnog izbor modificiranjem za različite uključene čimbenike. Primjerice, član N/2 u nazivniku drugog kvocijent produkta je logaritamski skaliran kao konzervativno ugađanje normalne aproksimacije binomne raspodjele, što je korisna modifikacija kad se bavimo relativno malenim vrijednostima x, y, z ili N. Varijable MW i [S], koje označuju molekularnu težinu kemijske determinante o interesa (MW), te broj koliko puta se ista navedena kemijska determinanta pojavljuje u podskupu aktivnih spojeva x ([S]), uključene su u indeksnu funkciju da olakšaju identificiranje najveće moguće, singletne biološki aktivne kemijske determinante tijekom analize. Osoba s iskustvom u ovom području će uočiti da se druge mjere povezanosti i/ili indeksne funkcije mogu koristiti u istu svrhu umjesto onih koje su opisane u formuli (I) i (II), a najprimjerenija, u smislu ovog izuma, sadrži različite kombinacije dvije, tri ili četiri varijable x, y, z i N.
[image]
Osoba s iskustvom u ovom području također će uočiti da se indeksna funkcija (II) može također modificirati da obuhvati dodatne varijable koje se odnose na sastav molekule, biološka, kemijska i/ili fizičko-kemijska svojstva. Primjerice, takve modifikacije mogu uključivati, ali bez ikakva ograničenja, ugađanja jačine spoja, njegove selektivnosti, toksičnosti, biološke raspoloživosti, stabilnosti (metaboličke ili kemijske), sintetskih svojstava, čistoće, komercijalne raspoloživosti, raspoloživosti reagensa za sintezu, cijene, molekularne težine, molarne refrakcije, molekularnog volumena, logP (izračunatog ili određenog), prevalencije dane strukture u zbirci molekula koje su slične lijeku, ukupnog broja i/ili tipova atoma, ukupnog broja i/ili tipova kemijskih veza i/ili orbitala, broja skupina koje su vezane H-vezom, broja skupina koje mogu stvarati H-vezu, naboja (djelomičnog i formalnog), konstanti protoniranja, broja molekula koje sadrže dodatne kemijske ključeve ili deskriptore, broja rotirajućih veza, indeksa elastičnosti, indeksa oblika molekule, sličnosti koje se podudaraju i/ili volumena preklapanja.
Analiza 101338 struktura vodi identificiranju osam odvojenih kemijskih determinanti, u rasponu od 150 do 230 Da molekularne težine, koje imaju vjerojatnost manju od 1 prema 10000 da budu sadržane unutar podskupa aktivnih kemijskih struktura prema slučajnom izboru (p < 0,0001). Sukladno tome, osam kemijskih determinanti prihvaćene su kao reprezentativne za jednu ili više biološki aktivnih entiteta od 208 receptorskih liganada koji su izvedeni iz literature, pa su povezani u četvrtu listu. Izračunavanja korištenjem formule (II) su zatim reiterirana da bi se utvrdilo može li se identificirati veća kemijska determinanta koja je rezultat kombinacije daljnjeg širenja bilo kojeg o osam fragmenata. Najveća, statistički značajna kemijska determinanta koja je nađena u ovom dodatnom izračunavanju imala je molekularnu težinu Da, te je odabrana kao reprezentativni primjerak ili farmakološki aktivan "otisak prsta" za daljnje odabiranje spoja i sintezu. Treći stupanj procesa obuhvaća korištenje reperezentativnog primjerka koji je gore opisan kao predloška za virtualno skeniranje i odabiranje spoja. U tu svrhu, pretraživanje substruktura izvršeno je u bazi podataka od preko 600 000 komercijalno raspoloživih pojeva, korištenjem izračunatog otiska prsta i njegovih fragmenata. Ukupno 1360 je traženo temeljem ovih pretraživanja, te je slučajno izabrano dodatnih 1280 spojeva i traženo od istih izvora za kontrolnu namjenu.
Četvrti i peti stupanj, koji čine završnu fazu procesa, provedeni su istovremeno. Četvrti stupanj uključivao je ispitivanje dva skupa spojeva koji su gore opisani u radioligandnoj vezujućoj analizi. Od 1360 molekula koje su odabrane temeljem reprezentativnog uzorka, 205 molekula pokazalo je kompetitivnu aktivnost kada su analizirano u koncentracijom rasponu između 1 i 10 μM, 21 spoj je pokazao aktivnost kada je ispitan u koncentracijskom rasponu između 0,1 i 1 μM, dok je jedan spoj, označen spoj A, pokazao afinitet za receptor (Ki) od 8,1 + 1,05 nM (n = 12). Svaki od 1280 slučajno odabranih spojeva nije pokazao receptor vezujuća svojstva kada je ispitan pri koncentraciji 10 μM. Kao takav, skup spojeva koji je preveden temeljem reprezentativnog otiska prsta bio je bar 21 puta djelotvorniji prema aktivnim molekulama nego što je to bio skup slučajnih spojeva (p < 0,0001).
Za spoj A je nađeno da predstavlja novu, dakle bez ranijeg izvješća, klasu inhibitora receptora od interesa. Slika 12 prikazuje djelovanje spoja A na receptorski upravljano generiranje inozitol trifosfata. Stanice koje vrše ekspresiju receptora o interesa su prethodno napunjene radioobilježenih inozitolom, te su izložene receptorskom agonistu u prisutnosti rastućih koncentracija spoja A. Generiranje inozitol trifosfata (IP) izmjereno je nakon ispiranja radioobilježenog staničnog inozitol fosfata s afinitetne kolone. Spoj A inhibirao je agonist-izazvano generiranje IP3 s vrijednošću IC50 od 22 nM, a to je vrijednost u skladu s afinitetom spoja za receptor.
Kao što je prikazano na slici 12, spoj A značajno smanjuje receptor-upravljano stvaranje inozitol trifosfata u stanično utemeljenoj funkcionalnoj analizi (IC50 = 22 nM), a taj nalaz je u skladu s afinitetom poja za receptor, te uporabom receptorskog antagonista u izračunavanju koje je gore opisano. Najzad, spoj A određen je kao vrlo selektivan za receptor od interesa, pri čemu ne pokazuje značajnu aktivnost inhibiranja kada je ispitan pri koncentraciji 10 μM u više od 20 drugih analiza vezanja radioligandnog receptora.
Četvrti stupanj sastoji se od korištenja reprezentativnog pristupa koji je opisan gore da se usmjeri koncepcijsko oblikovanje i sinteza novih kemijskih spojeva, u smislu sastav tvari, te u svjetlu identificiranja novih molekula s receptor-vezujućim aktivnostima. U tu svrhu, načinjena je lista kemijskih reaktanata i reakcijskih produkata, gdje su biološki reprezentativan uzorak opisan gore, ili njegovi fragmenti, sadržani bilo unutar kemijskih struktura reaktanata ili unutar nastalih reakcijskih produkata. Odabrano je više od 2000 kombinacija reaktanata, te su odgovarajući reakcijski produkti sintetizirani za ispitivanje. Ispitivanje ovih spojeva u analizi receptorskog vezanja vodi identificiranju nove klase kemijskih spojeva u smislu sastava tvari, a određen broj njih imao je vrijednost IC50 u rasponu od 50 do 500 nM.
Primjer br. 2
Racionalno identificiranje novih i selektivnih kinaza inhibitora
Razvijena je enzimska analiza za humanu kinazu koja je uključena u upali, za koju nikakvi inhibitori nisu prethodno opisani u literaturi. Zbirka spojeva za ispitivanje u analizi je načinjena, ispitana i novi kinaza inhibitori su identificirani sukladno metodi ovog izuma. Prvi stupanj sastoji se od sastavljene liste s 2367 kemijskih struktura inhibitora vezujućih proteina purinskog nukleotida iz znanstvene literature, uključujući strukture spojeva za koje se pokazalo da inhibiraju druge kinaze, fosfodiesteraze, vezujuće receptore purinskog nukleotida, te modulirane ionske kanale purinskog nukleotida, koji su ovdje označeni kao “surogatne mete”. Drugi stupanj sastojao se u identificiranju biološki aktivnih kemijskih determinanti koje su sadržane unutar ovih 2367 kemijskih struktura. U tu svrhu, generirana je dodatna lista koja sadrži 98971 struktura koje su opisane kao one koje nemaju učinka na iste navedene surogatne mete, te je dodana prvoj listi. Nastala lista od 101338 struktura je analizirana na prisutnost biološki aktivnih kemijskih determinanti odabiranjem odnosa mjera povezanosti (III), gdje x označuje broj aktivnih kemijskih struktura koje sadrže kemijsku determinantu od interesa, y označuje ukupni broj kemijskih struktura koje sadrže istu navedenu kemijsku determinantu, z označuje ukupni broj aktivnih kemijskih struktura u skupu od N molekula (tj. z = 2367), a N označuje ukupni broj kemijskih struktura koje su obuhvaćene analizom (tj. N = 101338).
[image]
Mjera povezanosti (III) zatim je razvijena u indeksnu funkciju (IV), za koju će osoba koja poznaje ovo područje uočiti da je način kojim se procjenjuje donja granica 95% intervala povjerenja mjere (III), pomoću logaritamskog transformiranja da se zadrži raspodjela odnosa usporedivom s normalnom raspodjelom, te aproksimacija Taylorova niza prvog reda u procjeni varijance logaritma istog navedenog odnosa. U ovom slučaju, nikakve druge varijable osim x, y, z ili N se ne koriste u indeksnoj funkciji, premda je osobi koja poznaje ovo područje da se formula (IV) može također transformirati da obuhvati dodatne varijable koje se dnose na sastav molekule, biološka, kemijska i/ili fizičko-kemijska svojstva, kao što je navedeno, ali bez ograničenja, u onima koji su citirani u primjeru br. 1. Osoba s iskustvom u ovom području će također uočiti da se druge mjere povezanosti i/ili indeksne funkcije mogu koristiti za istu namjenu umjesto onih koje su opisane u formuli (III) i (IV), a najprimjerenije, u smislu ovog izuma, sadrže različite kombinacije dvije, tri ili četiri varijable x, y, z i N.
[image]
Analiza 101 338 kemijskih struktura koji su vezani uz različite biološke aktivnosti provedena je indeksiranjem kemijskih determinanti s formulom (IV), sve dok za jednu ili više skupina determinanti nije utvrđeno da sadrže elemente koji imaju vrijednost veću o jedan, što odgovara vjerojatnost manjoj o 1 prema 20 da bude sadržana u podskupu biološki aktivnih struktura slučajnim izborom (p < 0,05). Sukladno tome, ove kemijske determinante prihvaćene su kao reprezentativne za jedan ili više farmakološki aktivnih entiteta inhibitora surogatnih meta koje su opisane u literaturi, te su sastavljeni u četvrtoj listi. Umjesto da se provede pretraživanje na kombinacije ovih determinanti s maksimalnim indeksom kao što je opisano u primjeru br. 1, strukture su izravno korištene kao reprezentativni primjerci, ili farmakološki aktivan “otisak prsta” za kasnije odabiranje i sintezu spoja.
Treći stupanj uključuje korištenje reprezenativnih primjeraka koji su gore opisani kao predložaka za virtualno skeniranje i odabiranje spoja. U tu svrhu, pretraživanje substruktura izvršeno je u bazi od preko 250000 komercijalno raspoloživih spojeva, korištenjem izračunatih otisaka prsta, fragmenata i njihove kombinacije. Ukupno 2846 spojeva je izdvojeno temeljem ovih pretraživanja, te je za kontrolne potrebe korištena zbirka od 1280 slučajno odabranih spojeva koji su opisani u primjeru br. 1.
Četvrti i peti stupanj, koji sačinjavaju konačnu fazu procesa, izvršeni su istovremeno. Četvrti stupanj uključuje ispitivanje izdvojenih spojeva enzimskom analizom. Od 2846 molekula koje su odabrane temeljem reprezentativnog uzorka, 88 molekula pokazalo je aktivnost inhibiranja kada su ispitane pri koncentraciji 5 μM. Među njima, šest molekula imalo je IC50 u rasponu od 0,2 do 2 μM, te je spoj, označen spoj B, imao IC50 od 164 nM (Slika 13).
Slika 13 prikazuje djelovanje spoja B na kinaza-ovisno proteinsko fosforiliranje. Kinaza od interesa inkubirana je s radioobilježenim ATP i peptidnog supstrata u prisutnosti rastućih koncentracija spoja B. Proteinsko fosforiliranje izmjereno je standardnim radiometrijskim tehnikama.
Spoj B značajno inhibira kinaza-ovisno fosforiliranje proteinskog supstrata, pa je nađen IC50 od 164 nM.
Između 1280 slučajno odabranih spojeva koji su ispitani za potrebe kontrole, samo njih tri pokazalo je inhibitorsku aktivnost u screening analizi, a najjači od njih imao je IC50 od samo 7,8 μM. Kao takav, skup spojeva koji ej sastavljen temeljem reprezentativnog otiska prsta bio je 13,2 puta učinkovitiji za aktivne molekule nego što je to bio skup slučajno odabranih spojeva (p < 0,0001). Štoviše, spoj B je nađen kao nov inhibitor kinaze, dakle bez ranije izvješća, klase ATP, koji je pokazao 250 puta veću selektivnost na kinazu od interesa kada je ispitan u analizi selektivnosti korištenjem strukturno i funkcionalno srodnih alternativnih kinaza.
Peti stupanj sastojao se od korištenja jednog ili nekoliko reprezentativnih primjeraka koji su gore opisani za koncepcijsko oblikovanje i sintezu novih spojeva, u smislu sastava, te u svjetlu identificiranja novih molekula s aktivnosšću inhibiranja kinaze. U tu svrhu, sastavljena je lista kemijskih reaktanata i reakcijskih produkata, pri čemu su prije opisani biološki aktivni reprezentativni uzorci ili njihovi fragmenti sadržani unutar kemijskih struktura reaktanata, ili unutar nastalih reakcijskih produkata. Odabrano je više od 4000 kombinacija reaktanata, te su odgovarajući reakcijski produkti sintetizirani za testiranje. Ispitivanje ovih spojeva vodi identificiranju novih klasa kemijskih spojeva, u smislu sastava, a određen broj njihovih predstavnika imao je IC50 u rasponu od 100 do 500 nM.
Primjer br. 3
Racionalno identificiranje novih i selektivnih ion-kanalnih blokatora
Razvijena je analiza za ionski kanal za kojeg se vjeruje da ima ulogu pri neurodegeneraciji, a za kojega nije bilo u literaturi opisanih inhibitora. Sastavljena je zbirka spojeva za testiranje u analizi, te su novi spojevi identificirani sukladno metodi ovog izuma. Prvi stupanj sastojao se u generiranju neophodnih strukturnih podataka za identificiranje kemijskih determinanti inhibitora kanala od interesa. To je provedeno ispitivanjem prvih 3680 spojeva naše vlastite zbirke pri koncentraciji 5 μM u screening analizi, pa je označena svaka struktura u listi pripadnom inhibitorskom aktivnošću. Pomoću vrijednosti od 40% inhibiranja kao pragom klasificiranja, 36 struktura je označeno kao aktivno, dok je preostalih 3644 klasificirano kao neaktivne.
Drugi stupanj sastojao se od identificiranja biološki aktivnih kemijskih determinanti koje su sadržane unutar struktura 36 inhibitora. U tu svrhu, 3680 obilježenih struktura analizirano je odabiranjem prethodno opisanih mjera povezanosti (I), gdje x označuje broj aktivnih kemijkih struktura koje sadrže kemijske determinante od interesa, y označuje ukupni broj kemijskih struktura koje su sadržane u istoj navedenoj kemijskoj determinanti, z označuje ukupni broj aktivnih kemijskih struktura koje su podvrgnute analizi (tj. N = 3680). Mjera povezanosti (I) je zatim razvijena u indeksnu funkciju (V), za koju će iskusna osoba uočiti da je produkt momenta korelacijskog koeficijenta koji odražava stupanj varijance koju dijele dvije dihotomne varijable koje nisu eksplicitno pokazane u formuli (V).
[image]
U svezi s tim, nikakve dodatne varijable osim x, y, z ili N nisu korištene u indeksnoj funkciji, premda je očigledno za osobu koja ima iskustvo u ovom području da se indeksna funkcija (V) također može modificirati da obuhvati dodatne varijable koje se odnose na sastav molekule, biološka, kemijska i/ili fizičko-kemijska svojstva, kao što je navedeno, ali bez ograničenja, u primjeru br. 1. Osoba s iskustvom u ovom području također će uočiti da se mogu koristiti druge mjere povezivanja i/ili indeksne funkcije za istu svrhu umjesto onih koje su navedene u formulama (I) i (V), posebice budući da indeksna funkcija (V) nije invarijantna u odnosu na različite promjene u oblikovanju istraživanja i/ili raspodjele y, (N-y), z i (N-z). Najpogodnija od ovih alternativnih metoda, u smislu ovog izuma, sadrži različite kombinacije dvije, tri ili četiri varijable x, y, z i N.
Sljedeći prikaz daje primjere kemijskih determinanti koje su korištene za analizu i selektivno praćenje. Ukupno je ispitano 3680 struktura za kanalnu inhibirajuću aktivnost na prisutnost biološki aktivnih podstruktura korištenjem skupa kemijskih determinanti što uključuje pet onih koje su prikazane u prikazu A. Između ovih pet struktura, determinanta br. 4 ima najveću vrijednost indeksa, što znači da je imala najveću vjerojatnost da je kanal-inhibirajuće aktivnosti. Sukladno tome, izračunavanja su reiterirana za strukture koje sadrže determinantu br. 4, te je kemijska struktura navedena u prikazu B identificirana kao ona koja je najveća, statistički značajne determinante sadržane su u skupu od 36 inhibitora, te je nakon toga odabrana za praćenje. Simboli: A označuje C, N, O ili S; B označuje H ili OH.
[image]
Analiza 3680 zabilježenih struktura je provedena indeksiranjem niza kemijksih determinanti formule (V), te zadržavanjem onih struktura koje su imale najveće, ne-nul pozitivne vrijednosti. Primjeri nekih kemijskih determinanti koje su korištene u ovom procesu prikazani su u prikazu A, zajedno s njihovim izračunatim indeksnim vrijednostima. Među njima, determinanta br. 4 imala je najveću vrijednost indeksa, pa je procijenjeno da je vjerojatnost 1 prema 100 da se može naći u podskupu struktura koje vrše kanalno blokiranje samo slučajnim izborom (p < 0,01). Sukladno tome, determinanta br. 4 prihvaćena je kao predstavnik biološki aktivne vrste velikog dijela od 36 inhibitora, pa su izračunavanja korištenjem formule (V) reiterirana da bi se postiglo da se čak i veće kemijske determinante mogu identificirati. Najveća, statistički značajna kemijska determinanta koja je nađena u ovim dodatnim izračunavanjima može se vidjeti na prikazu B. Struktura je odabrana kao reprezentativna jezgra ili farmakološki aktivan "otisak prsta" za kasniji odabir i sintezu spojeva.
U trećem stupnju koristi se reprezentativni uzorak koji je opisan u prikazu B kao predložak za virtualno skeniranje i odabiranje spoja. U tu svrhu, izvršeno je pretraživanje substruktura u bazi podataka preko 400000 komercijalno raspoloživih spojeva, korištenjem i izračunatog otiska prsta i fragmenata. Ukupno 1760 spojeva odabrano je temeljem ovih pretraživanja, te je za kontrolnu svrhu korištena ista zbirka od 1280 slučajno odabranih spojeva koja je opisana u primjeru 1.
Četvrti i peti stupanj, koji sačinjavaju završne faze procesa, izvršeni su istovremeno. Četvrti stupanj uključuje ispitivanje odabranih spojeva enzimskom analizom. od 1760 molekula koje su odabrane kao reprezentativni uzorci, 84 molekule pokazale su inhibitorsku aktivnost od bar 40% kada su ispitane pri koncentraciji 5 μM. Među njima, 8 molekula imalo je IC50 u submikromlarnom području, a jedan spoj, nazvan spoj C, imao je vrijednost IC50 od 400 nM. Dva primjera ovih kanal-inhibirajućih spojeva su prikazana niže, a oba sadrže farmakološki aktivan "otisak prsta" koji se može vidjeti u prikazu B:
[image]
Ova dva kanal-inhibirajuća spoja odabrani su za ispitivanje korištenjem metode ovog izuma. obje molekule značajno inhibiraju kanal od interesa. Kao što je prikazano pomoću substruktura koje su naglašene crnim, kemijske strukture dviju spojeva sadrže farmakološki aktivnu kemijsku determinantu koja je identificirana korištenjem metoda ovog izuma, kao što je prikazano na prikazu B gore.
Između 1280 slučajno odabranih spojeva za kontrolne potrebe, ukupno 33 molekule imale su inhibitorsku aktivnost od bar 40% što je dala screening analiza. Kao takav, skup spojeva sastavljen na osnovi reprezentativnog otiska prsta prikazan je na prikazu B, te je bio 1,8 puta djelotvorniji za aktivne molekule nego što je bio skup slučajno odabranih spojeva (p < 0,005). Skup spojeva sastavljena osnovi reprezenatativnog otiska prsta prikazan na prikazu B bio je također 4,9 puta djelotvorniji za aktivne molekule nego što je bilo prvih 3680 spojeva iz vlastite zbirke spojeva (p < 0,0001).
Peti stupanj sastojao se od uporabe reprezentativnog uzorka koji je prikazan u prikazu B, da se usmjeri koncepcijsko oblikovanje i sinteza novih kemijskih spojeva, u smislu sastava, te u svjetlu identificiranja novih molekula s kanal-inhibirajućim svojstvima. U tu svrhu, jedan od 120 farmakološki aktivnih inhibitora koji je gore opisan odabran je za praćenje, te kemijski modificiran korištenjem prethodno sakupljenih pozitivnih i negativnih screening rezultata kao izvor informacija struktura-aktivnost. Ovaj rad vodio je sintezi i kasnijem identificiranju nove, ovdje opisane klase ion-kanal blokatora, u smislu sastava, a određen broj njih imao je IC50 vrijednost u rasponu 100 do 500 nM. Ispitivanje selektivnosti je pokazalo da je spoj selektivan za kanal od interesa preko 30 drugih ciljanih lijekova, te da nadalje inhibira staničnu smrt u modelu inducirane apoptoze zbog nedostatka čimbenika rasta živca.
Primjer br. 4
Racionalno identificiranje novih i selektivnih proteaznih inhibitora
Razvijena je enzimska analiza za proteaze za koje se vjeruje da imaju određenu ulogu u ishemičkoj bolesti i ozljedi. Dotična proteaza bila je član familije vrlo srodnih enzima, a sama je bila samo meta interesa za terapijsku intervenciju.
Sastavljena je zbirka spojeva za ispitivanje u analizi, pa je ispitana, a novi enzimski inhibitori su identificirani sukladno metodi ovog izuma. Prvi stupanj sastojao se u generiranju neophodnih strukturnih podataka za identificiranje kemijskih determinanti inhibitora enzima. To je provedeno ispitivanjem zbirke od 1680 spojeva pri koncentraciji 3 μM u screening analizi, te bilježenjem svake strukture koja je inhibitorski aktivna. Graničnom vrijednošću od 40% inhibiranja kao pragom za klasificiranje spoja, 17 struktura je identificirano ako aktivno, dok su preostale 1663 strukture označene kao neaktivne.
Drugi stupanj sastojao se u identificiranju biološki aktivnih kemijskih determinanti koje su sadržane unutar struktura 17 inhibitora. U tu svrhu, 1680 zabilježenih struktura bilo je analizirano odabiranjem miješane mjere povezanosti koja je prikazana niže (VI), gdje x označuje broj aktivnih kemijskih struktura koje sadrže kemijsku determinantu od interesa, y označuje ukupni broj kemijskih struktura koje su sadržane u istoj navedenoj kemijskoj determinanti, z označuje ukupni broj aktivnih kemijskih struktura u skupu od N molekula (tj. z = 17), a N označuje ukupni broj kemijskih struktura koje su podvrgnute analizi (tj. N = 1680). U ovom slučaju, mjera povezanosti (VI) izravno je korištena kao indeksna funkcija za identificiranje biološki aktivnih kemijskih determinanti koje su sadržane unutar 17 inhibitora od interesa.
[image]
U ovom kontekstu, nikakve dodatne varijable osim x, y, z ili N nisu korištene u indeksnoj funkciji, mada je očito za osobu koja poznaje ovo područje da se formula (VI) može također modificirati tako da obuhvati dodatne varijable koje se odnose na sastav molekule, biološka, kemijska i/ili fizičko-kemijska svojstva, kao što je navedeno, ali bez ograničenja, uz one koje su citirane u primjeru br. 1.
Osoba s iskustvom u ovom području će lako uočiti da se ostale mjere povezanosti i/ili indeksne funkcije mogu koristiti u istu svrhu umjesto onih koje su opisane u formuli (VI), osobito stoga što mjera povezanosti samo omogućuje relativnu procjenu vjerojatnosti da je dana kemijska determinanta osnova biološke aktivnosti. najprimjerenije od ovih alternativnih metoda, u smislu ovog izuma, sadrže različite kombinacije dvije, tri ili četiri varijable x, y, z i N.
Analiza 1680 zabilježenih struktura je provedena indeksiranjem niza kemijskih determinanti s formulom (VI), te zadržavanjem struktura koje imaju najveće pozitivne vrijednosti. Primjeri nekih kemijskih determinanti koje su korištene u ovom procesu su navedeni niže u prikazu A, zajedno s njihovim izračunatim indeksnim vrijednostima. Među njima, determinante br. 7 i 8 imale su najveće indekse, te su uzete kao reprezentativne za jedan ili više biološki aktivnih entiteta koji su sadržani unutar pretežnog dijela od 17 inhibitora. Izračunavanja korištenjem formule (VI) su zatim reiterirana da bi se utvrdilo može li se identificirati čak i veća kemijska determinanta, što nije bio slučaj kada je korištena raspoloživa zbirka od 17 struktura, te su determinante br. 7 i 8 povezane zajedno tako da predstavljaju reprezentativan uzorak, ili Farmakološki aktivan "otisak prsta" koji je prikazan niže u prikazu B, što je kasnije korišteno za odabiranje i sintezu spoja.
[image]
U dva prikaza su dani primjeri kemijskih determinanti koje su korištene za analizu i odabrane za praćenje. Ukupno 1680 struktura zabilježenih za aktivnost inhibiranja proteaze ispitano je u prisutnosti biološki aktivnih substruktura pomoću skupa kemijskih determinanti što uključuje četiri koje su prikazane u prikazu A. Među četiri strukture, determinante br. 7 i 8 imale su najveće indeksne vrijednosti, što naznačuje da su one imale najveću vjerojatnost da budu osnova aktivnosti inhibiranja proteaze. Za usporedbu, determinanta koja se sastoji do jednostavnog benzena imala je indeks 0,02. Budući da nisu identificirane strukture s većim indeksom kada je reiteracijski račun proveden s determinantama br. 7 i 8, ove dvije strukture su povezane zajedno u kemijski motiv koji je prikazan u prikazu B, što je kasnije korišteno kao farmakološki aktivan "otisak prsta" za virtualno skeniranje i odabiranje spoja. Simboli: A označuje C ili S; B označuje H, C, N, O ili neki atom halogena.
Treći stupanj uključuje korištenje reprezentativnog uzorka koji je opisan u prikazu B kao predloška za virtualno skeniranje i odabiranje spoja. U tu svrhu, pretraživanje substruktura provedeno s bazom podataka preko 150000 komercijalno raspoloživih spojeva, korištenjem u tu svrhu i izračunatog otiska prsta i njegove fragmente. Temeljem ovih pretraživanja nađeno je 589 spojeva.
Četvrti i konačni stupanj procesa uključuje ispitivanje nađenih spojeva enzimskom analizom. Od 589 spojeva koji su odabrani temeljem reprezentativnog uzorka, 52 molekule pokazale su inhibitorsku aktivnost od bar 40% kada su ispitane u analizi pri koncentraciji 3 μM. Među njima, 12 spojeva imalo je IC50 u submikromolarnom području, dok je jedan spoj, nazvan spoj D, imao IC50 od 65 nM. Šest primjera ovih molekula koje inhibiraju proteazu prikazano je niže, a svi oni sadrže bar jednom farmakološki aktivan "otisak prsta" koji je naveden u prikazu B:
[image]
Ovih šest spojeva koji inhibiraju proteazu odabrano je za ispitivanje korištenjem metode ovog izuma. Svaka molekula značajno inhibira protein od interesa, a imaju IC50 u rasponu 0,15 do 15 μM. kao što je prikazano pomoću struktura koje su naglašene crnim, strukture svakog od šest spojeva sadrže farmakološki aktivnu kemijsku determinantu koja je identificirana ovim izumom, te navedena u prikazu B gore. Neki od ovih spojeva zapravo sadrže više od jedne inačice otiska prsta, kao što je primjerice tetraciklička struktura koja je prikazana u donjem desnom kutu.
Kao takav, skup spojeva sastavljen je temeljem reprezentativnog otiska prsta koji je dan u prikazu B bio je 8,7 puta učinkovitiji za aktivne molekule nego što je bila izvorna zbirka od 1680 spojeva (p < 0,0001). Nadalje, 52 racionalno identificirana spoja su nađena selektivnim za proteazu od interesa, pri čemu je većina (> 90%) bila praktički bez aktivnosti inhibiranja kada su ispitani pri koncentraciji 5 μM na srodnoj proteazi koja pripada istoj enzimskoj porodici, kao i pri ispitivanju u identičnim uvjetima na 12 drugih meta za lijek.
Primjer br. 5
Racionalno identificiranje novih i selektivnih fosfataznih inhibitora
Razvijena je enzimska analiza za fosfatazu za koju se vjeruje da ima značajnu ulogu u receptorskoj sensitizaciji i reguliranju. Načinjena je zbirka spojeva za ispitivanje u analizi, ona je ispitana, te su identificirani novi enzimski inhibitori sukladno metodi ovog izuma. Prvi stupanj sastoji se u generiranju neophodnih strukturnih podataka za identificiranje kemijskih determinanti inhibitora enzima. To je izvršeno ispitivanjem prvih 12160 spojeva naše vlastite zbirke pri koncentraciji 3 μM u screening analizi, te bilježenjem inhibitorske aktivnosti svake kemijske strukture. Uzimanjem granične vrijednosti za 50% inhibiranje kao praga za klasificiranje spoja, ukupno 15 kemijskih struktura je identificirano kao aktivno, dok je preostalih 12145 molekula klasificirano kao neaktivno.
Drugi stupanj sastoji se u identificiranju biološki aktivnih kemijskih determinanti koje su sadržane u strukturama 15 inhibitora. U tu svrhu, 12160 zabilježenih spojeva je analizirano odabiranjem miješane mjere povezanosti (VII), gdje x označuje broj aktivnih kemijskih struktura koje sadrže kemijsku determinantu od interesa, y označuje ukupni broj kemijskih struktura koje sadrže istu navedenu kemijsku determinantu, z označuje ukupni broj aktivnih kemijskih struktura u skupu od N molekula (tj. z = 15), a N označuje ukupni broj kemijskih struktura koje su podvrgnute analizi (tj. N = 12145).
[image]
Mjera povezanosti (VII) je zatim razvijena u indeksnu funkciju (VIII), za koju će osoba koja poznaje ovo područje uočiti da se odnosi na relativni rizik korištenjem nagiba regresijske linije i predstavlja stupanj dijeljene varijance koja postoji između dihotomsnih varijabli, što je kasnije promijenjeno da se uzme u obzir molekularna težina svake kemijske determinante koja se razmatra (MW).
[image]
U ovom kontekstu, nikakve dodatne varijable x, y, z, N ili MW nisu korištene u indeksnoj funkciji, premda je osobi koja poznaje ovo područje očigledno da se formula (VIII) može također modificirati da obuhvati dodatne varijable koje se odnose na sastav molekule, biološka, kemijska i/ili fizičko-kemijska svojstva, kao što je navedeno, ali bez ograničenja u primjeru br. 1. Osoba s iskustvom u ovom području također će uočiti da se druge mjere povezanosti i/ili indeksne funkcije mogu koristiti u istu svrhu umjesto onih opisanih u formuli (VIII), pogotovo što uspoređivanje nagiba ne mora, u nekim slučajevima, postići dovoljnu diskriminaciju između dviju srodnih kemijskih determinanti. Najprimjerenija od takvih indeksnih funkcija, u smislu ovog izuma, uključuje kombinaciju dvije, tri ili četiri varijable x, y, z i N.
Analiza 12160 zabilježenih struktura izvršena je indeksiranjem niza kemijskih determinanti formule (VIII), te zadržavanjem struktura koje daju najveće pozitivne vrijednosti. To je rezultiralo identificiranjem triju odvojenih kemijskih determinanti, u rasponu od 120 do 220 Da molekularne težine, koje imaju vjerojatnost 1 prema 10 da budu sadržane u podskupu aktivnih kemijskih struktura sukladno slučajnom izboru (p < 0,1). Sukladno tome, tri kemijske determinante su uzete kao reprezentativne za jedan ili više biološki aktivnih entiteta 15 enzimskih inhibitora identificiranih skeniranjem, pa je načinjena četvrta lista. Izračunavanja korištenjem formule (VIII) su zatim reiterirana da bi se utvrdilo rezultira li kombiniranjem veća kemijska determinanta, ili se identificira daljnje širenje bilo kojeg od tri fragmenta. Najveća, statistički značajna kemijska determinanta nađena je u ovim dodatnim izračunavanjima i ona ima molekularnu težinu 255 Da, pa je odabrana kao reprezentativan uzorak ili farmakološki aktivan "otisak prsta" za daljnje odabiranje spoja.
Treći stupanj obuhvaća korištenje reprezentativnog uzorka koji je opisan gore kao predloška za virtualno skeniranje i odabiranje spoja. U tu svrhu, pretraživanje substruktura izvršeno je u bazi podataka preko 800000 komercijalnih i vlastitih spojeva korištenjem i izračunatog otiska prsta i fragmenata. Za ispitivanje je odabrano ukupno 1242 spojeva temeljem ovih pretraživanja, te je za kontrolne potrebe odabrana zbirka od 1280 slučajno odabranih spojeva koji su opisani u primjeru 1.
Četvrti i konačni stupanj obuhvaća ispitivanje spojeva enzimskom analizom. Od 1242 spojeva koji su odabrani temeljem reprezentativnog uzorka, 34 molekula pokazalo je aktivnost inhibiranja od bar 50% pri koncentraciji 3 μM. Među njima, osam spojeva imalo je vrijednosti IC50 u submikromolarnom rasponu, a jedna spoj, koji je nazvan spoj E, imao je vrijednost IC50 od 87 nM (Slika 14).
Slika 14 prikazuje djelovanje spoja E na proteinsko defosforiliranje koje ovisi o fosfatazi. Fosfataza od interesa inkubirana je s fosforiliranim peptidnim supstratom u prisutnosti rastućih koncentracija spoja E. Supstratno fosforiliranje je analizirano mjerenjem otpuštanja slobodnog fosfata u reakcijskom mediju s malahitnim zelenim. Spoj E značajno je inhibirao fosfataza-ovisno defoforiliranje, te je imao vrijednost IC50 od 87 nM.
Među 1280 slučajno odabranih spojeva za koji su ispitani za kontrolne potrebe, samo dva su pokazala aktivnost inhibiranja u screening analizi, a najjači je imao vrijednost IC50 od samo 1,8 μM. Kao takav, skup spojeva sastavljen je temeljem reprezentativnog otiska prsta i bio je 17,5 puta djelotvorniji za aktivne molekule nego što je bio skup slučajno odabranih spojeva (p < 0,0005), te 22,3 puta djelotvorniji od prvih 12160 spojeva vlastite zbirke spojeva (p < 0,00001).
Najzad, nađeno je da spoj E predstavlja novu, dakle još neobjelodanjenu klasu inhibitora fosfataze, koja pokazuje 20 puta veću selektivnost za metu od interesa kada se ispituje analizom selektivnosti korištenjem i strukturno i funkcionalno srodnih alternativnih fosfataza.
Primjer br. 6
Povećanje jačine kemijskih nizova
Ovaj izum može se također koristiti za povećanje jačine kemijskog niza. Kao primjer, zbirka od 1251 spojeva ispitana je pri koncentraciji 3 μM analizom proteaze, što je dalo 25 spojeva koji u pokazali aktivnost inhibiranja od bar 40%. Analiza struktura izvršena je kao što je opisano u primjeru br. 1, što vodi identificiranju određenog broja kemijskh determinanti, a jedna od njih imala je vjerojatnost manju od 1 prema 10000 da se nađe među 7 od 25 proteaznih inhibitora slučajnim izborom (p < 0,0001). Nažalost, sedma spojeva koji su sadržavali ovu determinantu pokazali su tek umjerenu aktivnost inhibiranja (prosjek IC50 = 3,4 μM + 1,34 μM, n = 7), što ih čini neprivlačnim za daljnje praćenje. Sukladno tome, dotične determinante su uzete kao reprezentant biološki aktivnog entiteta od interesa, te su izravno korištene kao reprezentativni uzorak ili farmakološki aktivan "otisak prsta", za daljnje odabiranje spoja.
U tu svrhu, baza podataka preko 100000 komercijalno raspoloživih molekula skenirana je na determinantu od interesa, te su za daljnje testiranje odabrane 142 molekule. Između ovih 142 spoja, 11 je pokazalo aktivnost inhibiranja u submikromolarnom rasponu, s prosjekom IC50 od 0,48 μM ± 0,09 μM (n = 11, prosječna vrijednost IC50 značajno je manja od prethodne vrijednosti za p < 0,05). Metoda ovog izuma omogućuje značajno povećanje jačine kemijskog niza.
Primjer br. 7
Povećanje selektivnosti kemijskih nizova
Ovaj izum može se također koristiti za povećanje selektivnosti kemijskih nizova. Da bismo to pojasnili primjerom, ispitana je zbirka od 3360 spojeva pri koncentraciji 3 μM analizom kinaze, koja je nazvan kinaza analiza br. 1, što je dalo 22 spoja koji su imali aktivnost inhibiranja od bar 40%. Analiza struktura izvršena je kao što je opisano u primjeru br. 2 što vodi identificiranju određenog broja kemijskih determinanti, a jedna od njih, nazvana "determinanta br. 10", procijenjeno je da ima vjerojatnost manju o 1 prema 20 da se nađe među 3 od 22 inhibitora kinaze slučajnim odabiranjem (p < 0,05). Nažalost, analize selektivnosti koje su izvršene na četiri druge kinaze su pokazale da je determinanta br. 10 također značajan konstituent inhibitora druge kinaze, koja je nazvana kinaza br. 2, što naviješta da se selektivni inhibitori kinaze br. 1 ne mogu razviti temeljem isključivo determinante br. 10. Zaista, tri strukture koje sadrže determinantu br. 10 bile su jednake jačine na dvije kinaze, s prosječnom vrijednošću IC50 od 7,2 μM ± 3,81 μM (n = 3), te 21,5 μM ± 9,29 μM (n = 3) na kinazama br. 1, odnosno 2, što predstavlja odnos selektivnosti od samo 2,98 u korist kinaze br. 1.
Sukladno tome, 3360 spojeva koji su ispitani na kinazi br. 1 su ponovo ispitani pri koncentraciji 3 μM na kinazi br. 2, što je dalo 92 spoja koji su pokazali aktivnost inhibiranja od bar 40%. Lista od 3360 struktura je kasnije zabilježena na aktivnost kinaze br. 1 i kinaze br. 2, te je izvršena analiza sukladno metodi ovog izuma odabiranjem mjera povezanosti (111), te njihovim razvijanjem u indeksnu funkciju (IX), gdje x1 označuje broj aktivnih kemijskih struktura na kinazi br. 1 koje sadrže kemijsku deerminantu o interesa, x2 označuje broj aktivnih kemijskih struktura na kinazi br. 2 koje sadrže istu navedenu kemijsku determinantu, y označuje ukupni broj kemijskih struktura koje sadrže kemijsku determinantu, z1 označuje ukupni broj aktivnih kemijskih struktura na kinazi br. 1 u skupu od N molekula (tj. z1 = 22), z2 označuje ukupni broj aktivnih kemijskih struktura na kinazi br. 2 u skupu od N molekula (tj. z2 = 92), a N označuje ukupni broj kemijskih struktura koje su podvrgnute analizi (tj. N = 3360).
[image]
Osoba s iskustvom u ovom području će uočiti da indeksna funkcija (IX) kao način uspoređivanja relativnih rizika, omogućuje identificiranje kemijske determinante koja je najvjerojatnije selektivna za jednu kinazu u odnosu na drugu. U ovom kontekstu, očigledno je za osobu koja poznaje ovo područje da se formula (IX) može tako modificirati da sadrži dodatne varijable koje se odnose na sastav molekule, biološka, kemijska i/ili fizičko-kemijska svojstva, kao što je navedeno, ali bez ograničenja, u primjeru br. 1. Najzad, valja uočiti da se mogu koristiti druge mjere povezanosti i/ili indeksne funkcije umjesto onih navedenih u formulama (III) i (IX). Primjerice, mjera povezanosti (I) može se koristiti u indeksnoj funkciji II), te se rezultantne indeksne vrijednosti za aktivnost kinaze br. 2 moraju oduzeti od onih koje su dobivene za aktivnost kinaze br. 1, ili obrnuto, vrijednosti koje su dobivene za aktivnost kinaze br. 1 moraju se oduzeti od onih koje su dobivene za aktivnost kinaze br. 2. Mogući su i brojni drugi pristupi, a najprimjereniji o njih, u smislu ovog izuma, koristi indeksne funkcije koje sadrže različite kombinacije dvije, tri i četiri varijable x, y, z i N.
Indeksiranje niza kemijskih determinanti s formulom (IX) vodi identificiranju određenog broja kinaza br. 1 selektivnih kemijskih determinanti, a jedna od njih, nazvana "determinanta br. 11", sastoji se od determinante br. 10 koja je supstituirana dodatnim kemijskim motivom. Sukladno tome, determinanta br. 11 prihvaćena je kao farmakološki aktivan entitet selektivnih inhibitora kinaze br. 1, te je korištena kao reprezentativan uzorak ili farmakološki aktivan "otisak prsta", za naknadno odabiranje spoja. U tu svrhu, izvršeno je pretraživanje struktura u bazi podataka preko 400000 komercijalno dostupnih spojeva korištenjem determinante br. 11 i njenih fragmenata. Nađeno je ukupno 498 spojeva temeljem ovih pretraživanja, koji su zatim analizirani s dvije analize, što je dalo tri inhibitora koji sadrže determinantu br. 10, koji su imali prosječnu vrijednost IC50s od 0,94 μM + 0,52 μM (n = 3), te 31,6 pM + 4,41 μM (n = 3) u kinaza analizama br. 1 i 2. Ovaj rezultat predstavlja povećanje 11 puta odnosa selektivnosti za niz kinaze br. 1 prema kinazi br. 2 (od 2,98 do 33,6, p < 0,05), što pokazuje da metoda ovog izuma omogućuje povećanje farmakološke selektivnosti kemijskog niza od interesa.
Primjer br. 8
Racionalno identificiranje višestrukih farmakoloških učinaka
Razvijena je funkcionalna analiza za ligand-reguliran ionski kanal za kojega se vjeruje da ima značajnu ulogu u imunološkom odgovoru. Sastavljena je zbirka spojeva za ispitivanje u analizi, ispitana je, te su identificirani novi ionski blokatori sukladno metodi ovog izuma. Kanal koji je istražen kao što je opisano pripada familiji meta koje su propusne za natrijeve ione, aktivirane pomoću purinskih nukleotida, te inhibirane određenim natrij-kanal blokatorima. U ovom svjetlu, odlučeno je da se identificira farmakološki otisak prsta koji ima dvojni kaacitet oponašanja purinskih nukleotida i inhibianja natrijevih kanala istovremeno, u svjetlu povećanja vjerojatnosti brzo identificirajućih inhibitora ligand-reguliranog kanala od interesa.
Prvi stupanj procesa sastoji se u sastavljanju dviju lista kemijskih struktura pregledom tekuće literature. Prva lista sadrži strukture 79 dokumentiranih natrij-kanal inhibitora. Druga lista sadrži strukture od 2367 inhibitora purine-nukleotid vezujućih proteina (vidi primjer br. 2 za pojedinosti). Drugi stupanj procesa sastoji s eu identificiranju biološki aktivnih kemijskih determinanti koje su istovremeno sadržane u obje liste kemijskih struktura. U tu svrhu, svaka lista je dopunjena strukturama više od 100000 molekula koje su opisane kao one koje nemaju učinka na surogatne mete od interesa, te je provedena analiza odabiranjem supstraktivne mjere povezanosti (I), kao što je opisano u primjeru br. 1, te njenim razvojem u indeksnu funkciju (X), gdje x1 označuje broj aktivnih kemijskih struktura za natrijeve kanale i koje sadrže kemijsku determinantu od interesa, x2 označuje broj kemijskih struktura koje su aktivne za purin nukleotid-vezujuće proteine te koje sadrže istu navedenu kemijsku determinantu, y1 označuje ukupni broj struktura koje sadrže kemijsku determinantu u listi struktura koja se odnosi na učinke blokiranja natrijeva kanala, y2 označuje ukupni broj struktura koje sadrže kemijsku determinantu u listi struktura koje se odnose na inhibiranje purin nukleotid-vezujućeg proteina, z1 označuje ukupni broj struktura koje inhibiraju natrijeve kanale u skupu od N1 molekula (tj. z1 = 79), z2 označuje ukupni broj kemijskih struktura koje djeluju na purin nukleotid-vezujući protein u skupu od N2 molekula (tj. 22 = 2367), dok N1 i N2 označuju ukupni broj kemijskih struktura koje su podvrgnute analizi u odgovarajućim listama zabilježnih struktura.
[image]
Osoba s iskustvom u ovom području će uočiti da indeksna funkcija (X) kao način kombiniranja dviju različitih testova povezanosti, omogućuje identificiranje kemijskih determinanti koje najvjerojatnije imaju učinka na natrijeve kanale i purin nukleotid-vezujuće proteine istovremeno. U ovom kontekstu, za iskusnog praktičara je jasno da se formula (X) može modificirati da obuhvati dodatne varijable koje se odnose na sastav molekule, biološka, kemijska i/ili fizičko-kemijska svojstva, kao što je navedeno, ali bez ograničenja, u primjeru br. 1. Također je jasno da se ostale mjere povezanosti i/ili indeksne funkcije mogu koristiti za istu namjenu umjesto onih koje su opisane u formulama (I) i (X), konkretno kao indeksna funkcija (X) koja ne uzima u obzir smjer razlike koja postoji između proporcija dviju skupova podataka, pri čemu se zahtijeva da te dvije proporcije budu usporedive, štoviše da N1 bude usporediv s N2 i da obje vrijednosti ne budu veće od 20. Primjerice, može se htjeti odvagnuti rezultate za skupove podataka kada se veličina uzoraka značajno razlikuje korištenjem indeksne funkcije koja se temelji na odmjerenom prosjeku razlika između proporcija (vidi primjer 21). Alternativno, želja može biti da se uvede treća, ili četvrta, ili N-to farmakološko svojstvo u izračunavanje, pa je u tom slučaju očigledno da se formula (X) može proširiti u njen općenitiji oblik (XI), gdje d označuje broj lista spojeva koji su povrgnuti analizi, pri čemu se dobivene indeksne vrijednosti mogu izravno povezati s tablicama standardne normalne raspodjele da bi se odredila vjerojatnost nalaženja jedne ili više kemijskih determinanti koje su sve osnova farmakoloških svojstava koja se razmatraju. Mogući su brojni drugi pristupi, a najprimjereniji od njih, u smislu ovog izuma, koristi indeksne funkcije koje sadrže kombinacije dvije, tri ili četiri varijable x, y, z i N.
[image]
Analiza dviju lista zabilježenih struktura je provedena indeksiranjem niza kemijskih determinanti formulom (X), te zadržavanje struktura koje daju najveće vrijednosti veće od 2. To vodi identificiranju kemijske determinante koja ima vjerojatnost manju od 1 prema 20 da se nađe u podskupovima biološki aktivnih struktura slučajnim izborom (p < 0,05). Sukladno tome, kemijska determinanta nazvana "determinanta br. 12", prihvaćena je kao reprezentativna za jedan ili više biološki aktivnih entiteta za natrijev kanal i za inhibitore purinskih nukleotid-vezujućih proteina, te je korištena izravno kao reprezentativan uzorak ili farmakološki aktivan "otisak prsta" za daljnje odabiranje spoja.
Treći stupanj procesa uključuje korištenje reprezentativnog uzorka kao predloška za virtualno skeniranje. U tu svrhu, pretraživanje substruktura izvršeno je u bazi podataka preko 250000 komercijalno dostupnih spojeva korištenjem determinante br. 12 i fragmenata. Nađeno je ukupno 800 spojeva temeljem ovih pretraživanja, te je ista zbirka od 1280 slučajno odabranih spojeva koja je opisana u primjeru br. 1 korištena za kontrolnu svrhu.
Četvrti i konačan stupanj procesa uključuje ispitivanje nađenih spojeva ion-kanalnom analizom. Od 800 molekula koje su odabrane temeljem determinante br. 12, 23 spoja su pokazali aktivnost inhibiranja od bar 40% kada su ispitani pi koncentraciji 3 μM. Među njima, tri spoja su imala IC50 u sumikromolarnom rasponu, a jedan spoj, nazvan spoj F, imao je vrijednost IC50 od 145 nM + 56 nM (n = 4). Među 1280 slučajno odabranih spojeva za kontrolu svrhu, samo jedna molekula pokazala je značajnu aktivnost inhibiranja u niskom mikromolarnom području, te je njena kemijska struktura ustvari sadržavala značajni dio determinante br. 12. Zanimljivo, kada je ista zbirka od 800 spojeva bila ispitana na kinazi za koju se vjerovalo da ima određenu ulogu u imunološkom odgovoru, osam spojeva pokazalo je aktivnost inhibiranja od bar 40% kada su ispitani za 5 μM, spoj F imao je vrijednost IC50 od 1,2 μM, a drugi spoj, označen spoj G, imao je vrijednost IC50 od 137 nM + 48 nM (n = 4). Spojevi F, G, te određen broj srodnih molekula također sadrži determinantu br. 12 u svojoj strukturi također su pokazali inhibiranje natrij-kanala, tipično s inhibiranjem 50-100% pri 1 μM. Razmotreni zajedno, ovi rezultati pokazuju da metoda ovog izuma omogućuje da se odabere i/ili načini spoj s višestrukim farmakološkim svojstvima, koji može biti od interesa za razvijanje lijekova koji se rabe za tretiranje stanja multifaktorijalnih bolesti, kao što je, ali bez ograničenja, upala. Očito je, analogijom, da se metoda može koristiti za izgrađivanje novih farmakoloških svojstava u kemijskom nizu koji ih prije nije imao.
Primjer br. 9
Prevođenje liste biološki aktivnih kemijskih determinanti
U poželjnoj realizaciji ovog izuma, metoda se također može koristiti za sastavljanje liste biološki aktivnih determinanti, koje se opet mogu koristiti kao referentne baze podataka za korištenje u izvršenju racionalnog oblikovanja lijeka, kao što su primjerice računalno-kontrolirani programi odlučivanja za uporabu u medicinskoj kemiji. Da bismo to pokazali primjerom, pregledana je znanstvena literatura, te je sastavljeno 25 lista farmakološki aktivnih molekula, a svaka lista sadrži liste kemijskih struktura spojeva s danim farmakološkim svojstvom, kao što je, primjerice, sigma receptorsko vezanje, dopaminski D2 receptorski agonizam, te estrogenski receptorski antagonizam. Svaka lista je nakon toga analizirana sukladno ovom izumu odabiranjem mjere povezanosti (III), kao što je opisano u primjeru br. 2, te njenim razvijanjem u funkciju (IV), koja je korištena za indeksiranje različitih kemijskih determinanti koje sadrže jednu ili više lista koje su podvrgnute analizi. Ova izračunavanja vode identificiranju velikog broja farmakološki aktivnih kemijskih determinanti, a tri od njih su prikazane u dijelu rezultirajuće matrice u sljedećoj tablici:
[image]
U ovoj tablici navedena je referentna lista farmakološki aktivnih kemijskih determinanti. Sastavljeno je 25 lista struktura koje sadrže molekule za koje je nađeno da imaju jedno od 25 različitih farmakoloških svojstava, te su analizirane sukladno metodi ovog izuma korištenjem mjera povezanosti (III) i indeksne funkcije (IV). 25 svojstava je obuhvatilo kapacitet vezanja za sigma receptore (sigma ligand), dopaminski D2 receptorski agonizam (D2 agonist), te estrogenski receptorski antagonizam (estrogen antagonist). Maleni dio rezultantne matrice s 26 kolona prikazan je u tablici gore. Vrijednosti koje su veće od 1 znače da dana kemijska determinanta ima vjerojatnost manju od 1 prema 20 da se slučajno nađe u skupu molekula koje dijele isto farmakološko svojstvo, što znači da je determinanta najvjerojatnije molekularna osnova istog navedenog svojstva. Tablice kao što je ova gore prikazana predstavljaju zalihu biološki aktivnih determinanti ili “otisaka prstiju”, te se mogu koristiti kao referentne liste pri donošenju utemeljenih odluka pri otkrivanju i razvoju lijeka.
Interpretiranje tablice s rezultatima izvršeno je na sljedeći način. Spojevi čija kemijska struktura sadrži determinantu br. 13 vjerojatno predstavljaju dopaminski D2 receptorski agonist a nemaju svojstva sigma receptorskog vezanja ili svojstva estrogenskog recetorskog antagonista, jer 8,12 > 1,85 > 0,05. Obrnuto, determinanta br. 13 je poželjna determinanta ta konstruiranje zbirke dopaminskih D2 receptorskih agonista, jer 8,12 > 2,93 > 0,00. Na taj način, spojevi čija kemijska struktura sadrži determinantu br. 14 su vjerojatno sigma receptorski ligandi, a ne dopaminski receptorski agonisti ili estrogenski receptorski antagonisti, jer 2,4 > 0,00 = 0,00. Opet, determinanta br. 14 je poželjna determinanta za stvaranje skupa sigma receptorskih liganda, jer 2,40 > 1,85 > 0,91. Najzad, spojevi čija kemijska struktura sadrži determinantu br. 15 najvjerojatnije pokazuju svojstva inhibiranja estrogenskog receptora, jer 28,17 > 2,93 > 0,91, te alternativno, determinanta br. 15 je poželjna otisak prsta za stvaranje zbirke potencijalnih estrogenskih receptorskih antagonista, jer 28,17 > 0,05 > 0,00.
Očigledno je za osobu koja poznaje ovo područje da se ostale mjere povezanosti i/ili indeksne funkcije mogu koristiti za izradu takvih tablica umjesto onih koje su opisane u funkcijama (III) i (IV). Korištena indeksna funkcija može također sadržavati druge varijable koje se odnose na sastav, biološka, kemijska i/ili fizičko-kemijska svojstva, kao što je navedeno, ali bez ograničenja, u primjeru br. 1. Očigledno je također da se indeksna funkcija ili proces indeksiranja mogu modificirati tako da obuhvate odmjeravanje ili stupanj normaliziranja da bi se dobile pojedinačne indeksne vrijednosti koje se lakše međusobno uspoređuju, što je zasigurno slučaj s gore navedenom tablicom, pri čijoj izradi su korištena tri veličinom slična uzorka, ali to ne mora biti slučaj s drugim skupovima podataka. Najzad, očigledno je da se isti proces može koristiti za sastavljanje referentne liste struktura koje su indeksirane za druga svojstva od interesa u procesu otkrivanja, kao što su, ali bez ograničenja, opća terapijska uporaba, toksičnost, apsorpcija, raspodjela, metabolizam i/ili izlučivanje.
Primjer br. 10
Predviđanje sekundarnih farmakološki aktivnih molekula
Ovaj izum može se nadalje koristiti za predviđanje sekundarno aktivnih molekula. Ilustrirajući to, identificirana je nova klasa kanalnih blokatora kao što je prikazano u primjeru br. 3. Kao što je prije opisano za druge inhibitore ovog istog kanala, temeljna kemijska struktura novog kemijskog niza koja sadrži kemijsku determinantu može se vidjeti na prikazu B primjera br. 3, konkretno u obliku determinante br. 5 koja se može vidjeti u prikazu A primjera br. 3. Uspoređivanjem determinante br. 5 s determinantama koje su sadržane u gornjoj tablici, predviđeno je da inhibitori od interesa imaju vrlo visoku vjerojatnost vezanja za sigma receptore, konkretno jer je kemijska struktura determinate br. 5 identična onoj za determinantu br. 14. Sukladno tome, kanalni blokatori koji sadrže determinantu br. 5 ispitani su u analizi vezanja sigma σ1 i σ2 receptora, te je nađeno da pokazuju submikromolarni afinitet za oba mjesta. Kao takvi, ovi rezultati pokazuju da indeksne vrijednosti koje su dobivene pomoću metode ovog izuma omogućuju da se predvidi sekundarno djelovanje kemijskih nizova, što je vrlo korisno za serijsku progresiju u medicinskoj kemiji.
Primjer br. 11
Identificiranje i predviđanje molekula s toksičnim djelovanjem
Iz prethodnih primjera jasno je da se metoda ovog izuma može također koristiti za identificiranje toksikotrofnih kemijskih determinanti koje se nalaze u pesticidima, herbicidima, insekticidima i sličnom, i to jednostavno analiziranjem liste struktura koje su pripisane toksikološkim umjesto farmakološkim svojstvima. U ovom kontekstu, izum se može izravno primijeniti jačih, selektivnijih i/ili šire djelujućim toksičnim kemikalijama za uporabu, primjerice, u agrikulturnim kemijskim programima za zaštitu usjeva.
Alternativno, izum se može koristiti za prevođenje referentnih lista ili baza podataka toksičnih kemijskih determinanti na način koji je identičan onom koji je opisan u primjeru br. 9. Takve liste mogu se onda koristiti za procjenu vjerojatnosti da kemijski nizovi pokažu dani toksični učinak, koji se primjerice može iskoristiti u skeniranju dodataka hrani i kemikalija za okoliš.
Ilustrirajući mogućnost predviđanja toksičnih učinaka u farmaceutskim istraživanjima, ispitano 4480 spojeva na staničnoj fosfatazi od interesa za tretiranje upale. Ukupno 25 spojeva pokazalo je aktivnost inhibiranja od bar 40% kada su testirani pri 10 μM u analizi, a svi su imali IC50 u niskom mikromolarnom rasponu. Rezultati analiza koje su provedene sukladno metodi ovog izuma, vode identificiranju dviju molekularno različitih kemijskih determinanti koje su najvjerojatnije u osnovici farmakološke aktivnosti, koje su označene determinante br. 16 i 17. Budući da su dvije determinante bile prisutne u ekvipotentnim molekulama, te budući da se čini da su obje sposobne stvarati kemijske nizove koji bi mogli jednako biti odgovorni za kemijsko praćenje, odlučeno je da se izvrši odabiranje između njih dviju temeljem predviđenih toksičnih sporednih učinaka.
U tu svrhu, strukture determinanti br. 16 i 17 su uspoređene sa strukturama koje su sadržane u toksikološkoj bazi podataka, te je nađeno da one molekule koje sadrže determinantu br. 16 u svojoj strukturi imaju značajno veću vjerojatnost da budu toksični spojevi nego spojevi koji sadrže samo determinantu br. 17. To znači da bi oni fosfatazni inhibitori koji nose determinantu br. 16 trebali biti manje zanimljivi za progresiju zbog inherentne toksičnosti farmakološkog otiska prsta. Ova hipoteza je eksperimentalno provjerena izlaganjem uzgojenih stanica 1 μM koncentracijama obje klase inhibitora, te mjerenjem stanične vijabilnosti pomoću standardne MTT analize, pri čemu je nađeno da svi spojevi koji sadrže determinantu br. 16 izazivaju staničnu smrt unutar 24 sata nakon primjene, što nije slučaj s većinom spojeva koji nose determinantu br. 17. Kao takvi, ovi rezultati jasno pokazuju da metoda ovog izuma omogućuje identificiranje i/ili predviđanje kemijskog niza koji najvjerojatnije pokazuje toksična svojstva u danoj postavci. U ovom kontekstu, očigledno je da se identična izračunavanja mogu izvršiti korištenjem, primjerice, podataka o mutagenosti (Ames testovi), podataka P450 izozimskog inhibiranja ili podataka koji su izvedeni iz drugog relevantnog testa toksičnosti.
Primjer br. 12
Identificiranje biološki aktivnih specija i receptorskih liganda
Receptor stanične površine odabran je kao meta interesa za kontrolu nekih endokrinoloških poremećaja. receptor je, kao što je opisano, endogeno aktiviran pomoću nepeptidnog hormona kojega je proizvela žlijezda hipofiza. Lista kemijskih struktura koje su opisane kao ligandi istog navedenog receptora je prevedena pregledom kemijske literature. Ova lista je nakon toga analizirana sukladno metodi ovog izuma, korištenjem mjere povezanosti, indeksne funkcija (IV), te liste kemijskih determinanti koje sadrže fragmente dvadeset općih aminokiselina (glicin, alanin, valin, leucin, izoleucin, prolin, serine, treonin, tirozin, fenilalanin, triptofan, lizin, arginin, histidin, aspartat, glutamat, asparagin, glutamin, cistein i metionin), kojima su dodani fragmenti strukture peptidnog skeleta (NH-CH-CO-)3. Primjeri ovih determinanti su prikazani niže:
[image]
Ovo su primjeri aminokiselina i iz peptidnih skeleta izvedene kemijske determinante koje se koriste za analizu. Lista receptorskih liganda je prevedena pregledom kemijske literature, te je analizirana sukladno ovom izumu korištenjem mjere povezanosti (III), indeksne funkcija (IV), te liste kemijskih determinanti u kojima su sadržani različiti fragmenti dvadeset zajedničkih aminokiselina prema fragmentima strukture peptidnog skeleta (-NH-CH-CO-)3. Primjeri nekih determinanti koje su izvedene iz triptofana prikazani su u prva dva reda. To su ili egazaktni fragmenti (ex: determinante br. 18, 19, 20, 21 i 26), sklopovi egzaktnih fragmenata (ex: determinanta br. 22), neegzaktnih fragmenata (ex: determinante br. 23, 24 i 25), ili sklopovi egzaktnih i neegzaktnih fragmenata (nije prikazano). Donja dva reda: primjeri determinanti koje su izvedene iz strukture peptidnog skeleta (NH-CH-CO-)3, što predstavlja egzaktne (determinante br. 29, 31, 32) i neegzaktne fragmente (determinante br. 27, 28, 30, 33). Simboli: A označuje C ili S; B označuje C ili N; E označuje C, N, O ili S.
Indeksiranje fragmenata s formulom (IV) vodi identificiranju određenog broja kemijskih determinanti koje imaju indeksne vrijednosti veće od 1, što znači da odgovarajuće strukture imaju manje od 1 prema 20 vjerojatnost da su sadržane unutar podskupa farmakološki aktivnih spojeva prema slučajnom izboru (p < 0,05). Primjeri takvih determinanti su prikazani niže, zajedno s njihovim pripadnim indeksnim vrijednostima:
[image]
Ovo su primjeri visoko-indeksiranih kemijskih determinanti koje su identificirane u prvom ciklusu analize. Zbirka receptorskih liganada je analizirana sukladno ovom izumu indeksiranjem kemijskih determinanti kao što je prije pokazano, kao i određen broj drugih, s indeksnom funkcijom (IV). Vrijednosti veće od 1 znače da je determinanta imala vjerojatnost manju od 1 prema 20 da se nađe u podskupu receptorskih liganada slučajnim izborom. Slika gore prikazuje neke od kemijskih determinanti s većim indeksom koje su identificirane u ovom procesu.
Sukladno tome, ove determinante su prihvaćene kao reprezentativne za jednu ili više aminokiselina unutar primarne sekvencije peptidnih hormona, pa su povezane u drugoj listi. Izračunavanja korištenjem formule (IV) su zatim reiterirana da bi se identificirale kombinacije s najvećim indeksom ovih novih determinanti, a određen broj njih je imao indeksnu vrijednost veću od 10. Struktura kemijske determinante s najvećim rangom, koja je označena kao determinanta br. 42, je nakon toga uspoređena sa strukturama 800 dipeptida koji sadrže različite kombinacije 20 aminokiselina, pa je nađeno da samo samo jedna dipeptidna sekvencija, koja je označena A1-A2, sadrži u cijelosti determinantu br. 42. Ovaj rezultat je uzet kao indikacija da hormon o interesa najvjerojatnije sadrži sekvenciju A1-A2 negdje unutar svoje primarne strukture, te nadalje, da bar jedna od dviju aminokiselina ima značajnu ulogu u vezanju endogenog liganda za njegov receptor. Verifikacija sekvencije hormona je pokazala da ona doista sadrži predviđenu sekvenciju A1A2, događaj za kojega je izračunata vjerojatnost da bude slučajan od samo 0,019. Zanimljivo, drugi rad je pokazao da peptidi koji sadrže mutaciju u položaju A2 sekvencije A1-A2 (npr. A1A3, ili A1A4 umjesto A1A2, gdje su A1, A2, A3 i A4 različite aminokiseline) pokazuju osjetno manji afinitet za receptor, što pokazuje da bar jedna od dviju predviđenih rezidua ne predstavlja značajnu vrstu koja je odgovorna za biološku funkciju hormona od interesa. Uzeti zajedno, ovi rezultati pokazuju da metoda ovog izuma omogućuje nekom identificiranje biološki aktivnih vrsta peptidnih liganada, što je korisno u programima medicinske kemije pri usredotočenju na racionalno oblikovanje, primjerice, peptidomimetskih enzimskih inhibitora i/ili receptorskih liganada.
Primjer br. 13
Predviđanje interakcija protein-protein
Ovaj izum također omogućuje da se predvidi postojanje protein-protein interakcija na način koji je analogan onom koji je opisan u prethodnom primjeru. Ilustrirajući to, ionski kanal je ugrađen kao što je opisano u primjeru br. 3, što vodi identificiranju više od dva tuceta molekula koje pokazuju inhibiranje od bar 40% pri ispitivanju uz koncentraciju 5 μM. Kemijske strukture ovih inhibitora su povezane u listu, koja je analizirana kao što je opisano u primjeru br. 12. To vodi identificiranju niza kemijskih determinanti aminokiselina i peptidnih skeleta, s visokim indeksom, što je nakon daljnje analize naznačilo da kanal od interesa najvjerojantije reagira s inhibitorskim peptidom ili proteinom koji specifično sadrži određenu dipeptidnu sekvenciju, koja je označena A5-A6. Zanimljivo, takvi inhibitorski proteini su prethodno opisani u literaturi, a svi oni sadrže domenu 20 aminokiselinskog “kanalnog inhibiranja” koja sadrži upravo predviđenu A5-A6 dipeptidnu sekvenciju. Budući da se može odrediti da 20 aminokiselinska sekvencija ima vjerojatnost od samo 0,046 da sadrži danu sekvenciju tvorbu dviju danih rezidua temeljem slučajnog izbora, može se procijeniti da vjerojatnost točnog predviđanja postojanja dviju odvojenih dipeptidnih sekvencija koji postoje u dva nepovezana proteina prema slučajnom izboru u ovom i prethodnom primjeru iznosi manje od 1 u 1097. Štoviše, točno predviđanje učinjeno je u oba slučaja, što pokazuje da izum omogućuje identificiranje i/ili predviđanje postojanja određenih tipova interakcija protein-protein. To se može načiniti jednostavno identificiranjem sekvencije aminokiselina koje sadrže najveću moguću kemijsku determinantu koja je identificirana iz podskupa farmakološki aktivnih struktura, pa zatim traženjem u sekvenciji baza podataka onih proteina koji sadrže sekvenciju aminokiselina od interesa. Opis ovog procesa može se naći u primjeru br. 14 dolje. U ovom kontekstu, očigledno je za osobu koja poznaje ovo područje da pristup nije ograničen samo na identificiranje dipeptidnih sekvencija što ovisi o strukturi farmakološki aktivnih spojeva koji su podvrgnuti analizi, već se mogu detektirati tri- ili čak tetrapeptidne sekvencije. Također je jasno da se sličan pristup može iskoristiti za nepeptidne ligande, dakle metoda se može prilagoditi za detektiranje, primjerice, ugljikohidratnih sekvencija (tj. šećera) nukleotida, i slično.
Primjer br. 14
Identificiranje usamljenih ligand-receptorskih parova
Ovaj izum može se nadalje primijeniti za identificiranje usamljenih liganada i/ili usamljenih ligand-receptor parova. Proces započinje prevođenjem liste kemijskih struktura koje imaju određeni učinak na protein o interesa (tipično vezanje), ali za što nisu poznati ligandi u vrijeme istraživanja. Ova informacija može se generirati na određen broj načina, kao što je, ali bez ograničenja, provedba NMR istraživanja, mjerenje konformacijskih promjena pomoću cirkularnog dikroizma, mjerenje protein-ligand interakcija površinskom plazmon rezonancijom, ili u slučaju usamljenog receptora, provedba analize s konstitutivno-aktiviranim mutantima receptora od interesa.
Ilustrirajući ovu koncepciju, pretpostavimo da su provedeni eksperimenti tipa kao što je onaj opisan gore s usamljenim receptorom, što daje strukture koje su prikazane dolje.
[image]
Ovo je hipotetska lista struktura koje su analizirane na biološki aktivne kemijske determinante. Devet struktura koje su gore prikazane je analizirano sukladno ovom izumu kao što je opisano u primjeru br. 12, korištenjem kemijskih determinanti koje su izvedene iz gore navedene liste aminokiselina i peptidnih skeleta.
Analiza struktura kao što je opisano u primjeru br. 12 vodi identificiranju određenog broja kemijskih determinanti koje su izvedene iz aminokiselina i peptidnih skeleta s indeksom koji je veći od 1. Primjeri takvih determinanti su prikazani niže, zajedno s njihovim odgovarajućim indeksnim vrijednostima:
[image]
Ovo su primjeri kemijskih determinanti s visokim indeksom koje su identificirane u prvom krugu analize. Zbirka hipotetskih receptorskih liganada analizirana je sukladno ovom izumu indeksiranjem kemijskih determinanti kao što je dano u prvom prikazu primjera br. 12, kao i određenim brojem drugih, s indeksnom funkcijom (IV). Vrijednosti koje su veće od jedan označuju da determinante imaju vjerojatnost manju od 1 prema 20 da se nađu u podskupu liganada temeljem slučajnog izbora. Gore su prikazane dvije kemijske determinante višeg indeksa koje su identificirane u ovom procesu.
Iz ovih primjera je jasno je da samo determinante br. 43 i 44 mogu biti sadržane unutar kemijskih struktura aminokiselina fenilalanina i tirozina. Sukladno tome, može se zaključiti da peptidi koji su u interakciji s usamljenim receptorom vjerojatno sadrže bilo reziduu tirozina ili fenilalanina u svojoj sekvenciji, te da te rezidue vjerojatno imaju značajnu ulogu bilo u vezanju liganada i/ili aktiviranju receptora pomoću ovih peptida. Ako se determinante s visokim indeksom 43 i 44 nakon toga ponovo analiziraju da bi se utvrdilo je li kombinacije s fragmentima drugih aminokiselina ne daju strukture s čak i većim indeksom, fragmenti kao što je determinanta br. 45, koja se nalazi u sljedećem prikazu, može se kasnije identificirati.
[image]
Ovi prikazi pokazuju kemijske determinante s visokim indeksom koje su identificirane u drugom ciklusu analize. Kemijske determinante poput onih koje su pije opisane su ponovo analizirane sukladno ovom izumu da se odredi hoće li kombinacije s fragmentima drugih aminokiselina dati strukture s još većim indeksima. Jedna od njih, nazvana determinanta br. 45 (prikaz A), imala je indeksnu vrijednost veću od 40. Zanimljivo, cjelina determinante br. 45 sadržana je u strukturi dipeptidne sekvencije Tyr-Gly (prikaz B), što navodi da usamljeni ligand od interesa sadrži Tyr-Gly dipeptidnu sekvenciju unutar svoje primarne strukture.
Pošto je jasno da je cjelina determinante br. 45 sadržana unutar strukture dipeptida tirozin-glicin (Tyr-Gly), slijedi da usamljeni ligandi koje smo tražili najvjerojatnije sadrže sekvenciju Tyr-Gly negdje u svojoj primarnoj strukturi. Sukladno ovoj informaciji, baze podataka aminokiselinskih sekvencija mogu se skenirati da bi se identificirali poznati i/ili usamljeni ligandi koji sadrže predviđenu Tyr-Gly sekvenciju, što nakon odabiranja i ekspresije, može biti testirano u originalnoj biokemijskoj screening analizi. Alternativno, kemijska determinanta br. 45 može se izravno koristiti za stvaranje zbirke spojeva potencijalnih Tyr-Gly mimetika.
Najzad, vrijedno je napomenuti da su kemijske strukture korištene u ovom primjeru stvarni opijatni receptorski agonisti koji su uzeti iz literature, te da prirodni opijatni receptorski agonisti dinorfin A, p-endorfin, leu-enkefalin i met-enkefalin svi sadrže predviđenu sekvenciju Tyr-Gly u svojoj primarnoj strukturi. Budući da je tirozinska rezidua utvrđena kao apsolutno nužna za opijatni agonističku aktivnost, ovaj primjer nadalje ilustrira kapacitet izuma pri identificiranju biološki aktivnih entiteta receptorskih liganada. Također se vidi da se procjene koje su gore opisane mogu poboljšati korištenjem alternativnih algoritama koji koriste varijable x, y, z i N, kao što je primjerice Fischerov egzaktan test. Zaista, samo devet struktura analizirano je korištenjem metode z koju nije učinjena adekvatna korekcija za malenu veličinu uzorka, što ukazuje da je indeksna vrijednost od 41,96 za determinantu br. 45 vjerojatno nešto precijenjena.
Primjer br. 15
Identificiranje endogenih modulatora ciljanih lijekova
Očigledno je za osobu koja poznaje ovo područje da se izum može primijeniti za identificiranje endogenih modulatora ciljanih lijekova. Da to pojasnimo primjerom, razvijena je funkcionalna analiza za ionski kanal od interesa u tretiranju neurodegeneracije. Skenirana je zbirka spojeva, te je analizirana dobivena lista inhibitora na prisutnost biološki aktivnih kemijskih determinanti kao što je opisano u primjeru br. 2. To vodi identificiranju kemijskih determinanti visokog indeksa za koje je nađeno da su sadržane u podskupu molekula koje su endogeno proizvedene u eukariotskim stanicama. Odgovarajući spojevi su kasnije nabavljeni i ispitani u analizi, pa je nađeno da je kanal od interesa selektivno inhibiran submikromolarnim koncentracijama konkretne klase staničnih fosfolipida, koja je zanimljivo prethodno povezana s neuronskom apoptozom kroz nepoznati mehanizam pomoću drugih skupina. Zajedno, ovi rezultati pokazuju da izum omogućuje identificiranje endogenih modulatora ciljanih lijekova.
Primjer br. 16
Identificiranje lažno pozitivnih eksperimentlanih rezultata
Razvijena je enzimka analiza za protein kinazu za koju se vjeruje da ima značajnu ulogu u imunološkom odgovoru. Sastavljena je zbirka spojeva za skeniranje mete sukladno ovom izumu, upravo kao što je opisano u primjeru br. 2. Spojevi zbirke su kasnije u analizi pri koncentraciji 5 μM, što vodi identificiranju 35 molecules koje vrše inhibianje od bar 40%. Strukture ovih spojeva analizirane su korištenjem pojednostavljene inačice formule (II) kao indeksne funkcije, pa su odgovarajuće indeksne vrijednosti izravno uspoređene s onima u statističkoj tablici, što daje procjenu vjerojatnosti da se dane kemijske determinante nalaze u podskupu od 35 farmakološki aktivnih spojeva temeljem slučajnog izbora.
Korištenjem praga za vjerojatnost slučajnog izbora od p < 0,05, određeno je da 14 od 35 inhibitora najvjerojatnije predstavlja lažno pozitivne rezultate. Kasnije ponovljeno ispitivanje 14 spojeva u analizi je potvrdilo ovu hipotezu, što ilustrira da izum omogućuje identificiranje lažno pozitivnih eksperimentalnih rezultata.
Primjer br. 17
Identificiranje lažno negativnih eksperimentalnih rezultata
zvršenjem izračunavanja koja su analogna onima koja su opisana u primjeru br. 16, izum nadalje omogućuje identificiranje lažno negativnih eksperimentalnih rezultata. Kako bismo to ilustrirali primjerom, kemijske strukture niza fosfataznih inhibitora analizirane su na prisutnost farmakološki aktivnih kemijskih determinanti kao što je opisano u primjeru br. 16. Rezultantne kemijske determinante s najvećim indeksom korištene su kao farmakološki aktivni “otisci prsta” za izvršenje substrukturnih pretraživanja u listi kemijskih struktura koja odogovara spojevima koji su izvorno ispitani u analizi. Dobiven je određen broj molekul koje sadrže jednu ili više gore navedenih kemijskih determinanti, ali koje su ipak identificirane kao negativne u screening analizi. Odgovarajuće molekule su nakon toga ponovo ispitane u analizi, pa je nađeno da je više od 15% njih lažno negativno, a jedan spoj je čak pokazao submikromolarnu aktivnost inhibiranja. Ovi rezultati jasno omogućuju identificiranje lažno negativnih eksperimentalnih rezultata.
Primjer br. 18
Provođenje kvantitativnih konfiguracijskih i konformacijskih analiza
U dodatno poboljšanoj realizaciji ovog izuma, mogu se također koristiti algoritmi koji obuhvaćaju različite kombinacije varijabli x, y, z i N za kvantitativnu konformacijsku i/ili konfiguracijsku analizu. Ilustrirajući ovu mogućnost, jasno je iz rezultata koji su prikazani u primjeru br. 4 da struktura farmakološki aktivnog, proteaza-inhibirajućeg “otiska prsta” koja je prikzana na prikazu B primjera br. 4 nije ni konfiguracijski ni konformacijski definirana. Zaista, nemoguće je reći iz predstavke strukture je li, u odnosu na dvije karbonilne ili sulfonilne skupine, to transoidna ili cisoidna konformacija verzije otiska prsta s jednostrukom vezom koja je farmakološki aktivna, ili dalje, je li to (E) ili (Z) konfiguracija otiska prsta koja je aktivna u slučaju inačice s dvostrukom vezom iste navedene strukture. Razlog tome je što je izračunavanje koje je izvršeno u primjeru br. 4 bilo usmjereno prema identificiranju kemijske determinante koja je najvjerojatnije osnova proteaza-inhibirajuće aktivnosti, bez razmatranja mogućih konformacija i/ili konfiguracija koje determinanta može poprimiti. U svjetlu činjenice da brojne farmakološki aktivne strukture sadrže dvostruku vezu i/ili prstenasti sustav, koji služi konformacijsku ograničenju kemijskih determinanti smanjenjem njihova ukupnog broja rotirajućih veza, moguće je koristiti ovaj izum da se odredi koje konformacije i/ili konfiguracije dane kemijske determinante su najvjerojatnije farmakološki aktivne.
Da bismo to prikazali, šest (proteaza inhibirajućih) struktura koje su prikazane u primjeru br. 4 je analizirano indeksiranjem niza konformacijski i konfiguracijski definiranih kemijskih determinanti koje su izvedene iz strukture koja je prikazana na prikazu B primjera br. 4, s indeksnom funkcijom (IV).
[image]
Na ovom prikazu ilustrirana je kvantitativna konformacijska/konfiguracijska analiza proteaza-inhibirajuće kemijske determinante. Šest struktura koje su prikazane u primjeru br. 4 je analizirano sukladno ovom izumu upotrebom liste konformacijski i konfiguracijski definiranih determinanti.
Kemijska determinanta br. 46, prikazana zajedno s niže indeksiranom kemijskom determinantom br. 47 gore, dobivena kao jedna od najvećih indeksnih vrijednosti, navodi da je (Z) konfiguracija dvostruke verzije vjerojatnije poželjan raspored koji je sadržan u kemijski strukturama inhibitora proteaze od interesa. Ova hipoteza je kasnije provjerena daljnjim usredotočenim visokoučinkovitim skeniranjem, što rezultira brojnim proteaznim inhibitorima i kojima je farmakološki aktivan otisak prsta sažet u (Z) ili “cisoidnoj” konfiguraciji, a samo je njih nekoliko koje to nisu.
Uzeti zajedno, ovi rezultati pokazuju da metoda ovog izuma omogućuje identificiranje biološki aktivnih konformacija i/ili konfiguracija kemijskih determinanti. Najzad, nađeno je da se takva izračunavanja mogu izvršiti s određenim brojem alternativnih algoritama koji rabe različite kombinacije varijabli x, y, z i N. U ovom kontekstu, vrijedno je naglasiti da se procjene koje su gore opisane mogu dalje pojačati uključivanjem dodatnih varijabli u različite indeksne funkcije, kao što su, ali bez ograničenja, varijable koje uzimaju u obzir farmakološku jačinu kemijskih struktura.
Primjer br. 19
Provođenje ispitivanja sličnosti
Jasno je iz prethodnih primjera da se pojam molekularne sličnosti, prema pogledu metode ovog izuma, jasno razlikuje od onoga što je općenito prihvaćeno kao značenje ovog pojma. Primjerice, spojevi u hipotetskoj listi primjera br. 14 su vrlo različiti, pa nema očiglednog načina sa se klasificira devet molekula u jednu kemijsku familiju pomoću klasičnih tehnika klasteriranja. Štoviše, pokazali smo u primjeru br. 14 da su ovi spojevi ustvari krajnje slični, ako svaki od njih sadrži bar jednu kemijsku determinantu koja je reprezentativni fragment aminokiseline tirozina; vidi ovaj prikaz:
[image]
Ovo su fragmenti aminokiseline tirozina koja je sadržana u strukturi devet opijatnih receptorskih agonista. Strukture koje su prikazane gore nisu slične pa ih je teško povezati u jednu kemijsku familiju pomoću klasičnih metoda klasteriranja. One su ipak vrlo slične u smislu ovog izuma, jer sve one sadrže bar jedan fragment kemijske determinante koja je definirana aminokiselinom tirozinom, a njegovo pojavljivanje je označeno masnim tiskom.
Kao takav, izum se lako koristi za mjerenje molekularne sličnosti i/ili za uspoređivanje sličnosti koja može postojati između različitih skupova kemijskih spojeva. Ilustrirajući ovu koncepciju ukratko, očigledno je da se jedna ili više referentnih molekula može izabrati iz liste kemijskih struktura, te se mogu analizirati na prisutnost određenih kemijskih determinanti, koje se nakon identificiranja mogu koristiti za povođenje jedne ili više substrukturnih pretraživanja jedne ili više novih molekula da se provjeri jesu li one slične. Indeksiranjem odgovarajućih kemijskih determinanti s indeksnom funkcijom tipa koji je opisan u prethodnim primjerima, te indeksiranjem novih kemijskih struktura temeljem, primjerice, određenog broja različitih determinanti koje može sadržavati, moguće je dodijeliti vrijednosti molekulama koje su ispitane što odražava stupanj sličnosti s izvornim skupom referentnih spojeva. Ovaj proces je vrlo koristan pri oblikovanju namjenske zbirke spojeva za otkrivanje lijeka, pošto omogućuje istraživaču da brzo identificira spojeve koji imaju vrlo veliku sličnost, u smislu ovog izuma, s farmakološki aktivnim referentnim pojevima.
Primjer br. 20
Analiziranje različitosti zbirke spojeva
Ovaj izum može se nadalje koristiti za analiziranje različitosti zbirke spojeva na način koji je analogan onom koji je opisan u prethodnom primjeru. U ovom kontekstu, očigledno je za osobu koja poznaje ovo područje da se pojam kemijskih determinanti može koristiti za uspoređivanje jedne zbirke spojeva s drugom. Primjerice, zbirka spojeva može se odabrati za visokoučinkovito skeniranje i odgovarajuća lista kemijskih struktura sukladno ovom izumu, pri čemu se referentan skup kemijskih struktura, kao što su one sadržane u Merck Index, Derwent, MDDR ili Pharmaprojects bazama podataka koristi kao referentna zbirka molekula koje su “slične lijeku”. U ovom slučaju, molekule čija struktura suštinski sadrži kemijske determinante s niskim indeksom čini se da su “slične lijeku”, budući da se iste navedene kemijske determinante nalaze u visokom udjelu referentnih struktura. Obrnuto, molekule koje se suštinski sastoje od kemijskih determinanti s visokim indeksom čini se da “nisu slične lijeku”, budući da su iste determinante slabo zastupljene u skupu referentnih spojeva. Ova informacija je vrlo korisna pri planiranju eksperimenata koji su usmjereni određenom otkriću, jer pomaže istraživaču identificiranje onih kemijskih struktura koje bi trebale biti uključene ili isključene iz zbirke spojeva za skeniranje. U ovom kontekstu, očigledno je da se za tu svrhu može koristiti više algoritama koji sadrže različite kombinacije varijabli x, y, z i N.
Primjer br. 21
Posebni algoritmi
Jasno je da prethodni primjeri ne daju iscrpnu listu svakog algoritma koji koristi različite kombinacije varijabli x, y, z i N koje se mogu koristiti za provedbu diskretne substrukturne analize. U ovom kontekstu, očigledno je za osobu koja poznaje ovo područje da se indeksne funkcije (XII), (XIII) i (XIV) mogu također koristiti za adresiranje određenog broja pitanja koja su prikazana u prethodnim primjerima. Zaista, u nekim slučajevima je čak primjerenije, u statističkom smislu riječi, koristiti jednu od ovih formula umjesto onih koje su eksplicitno dane u primjerima. Međutim, budući da je izum primarno namijenjen za identificiranje kemijskih determinanti koje su sadržane unutar liste kemijskih struktura za koje se vjeruje da su najvjerojatnije osnova određenog biološkog efekta, primarno se bavimo relativnim indeksima i kasnijim rangiranjem kemijskih determinanti. Štoviše, formule (XII), (XIII) i (XIV) navedene su niže u slučaju da: a) postoji potreba za točnom procjenom vjerojatnosti za malene skupove uzoraka (vidi XII, gdje s odgovara najmanjoj vrijednosti među varijablama x, (y-x), (z-x) i (N-y-z+x)); b) čini se da je proporcionalno težinski odmjerena procjena istovremenog doprinosa dviju determinanti primjerenije za uporabu u primjeru br. 8 (vidi XIII, gdje d odgovara broju odvojenih kemijskih determinanti); ili c) bitno je da se procijeni red efekata kada se procjenjuje istovremeni doprinos dviju međusobno povezanih kemijskih determinanti (vidi XIV). U ovom kontekstu, definicije varijabli x, y, z i N su točno one prethodno opisane.
[image]
Najzad, također je očigledno za nekoga tko je iskusan praktičar da uporaba određenih varijabli u indeksnim funkcijama i/ili algoritmima koji su oblikovani za identificiranje biološki aktivnih kemijskih determinanti, ali koji nisu eksplicitno opisani u prethodnim primjerima, može biti matematički ekvivalent korištenju različitih kombinacija varijabli x, y, z i N. Ilustrirajući to, indeksna funkcija koja koristi varijablu q, koja predstavlja broj neaktivnih molekula čija kemijska struktura sadrži danu kemijsku determinantu, ekvivalentna je korištenju x i y, kao q = y-x. Slično, indeksna funkcija koja koristi varijablu r, koja je definirana da predstavlja ukupni broj aktivnih spojeva koji ne sadrže danu kemijsku determinantu algebarski je ekvivalentna korištenju varijabli x i z, te se može lako pokazati da r = z-x. Također, indeksna funkcija koja koristi varijablu s, koja je definirana da sadrži ukupni broj neaktivnih spojeva koji ne sadrže danu kemijsku determinantu, ekvivalentna je korištenju varijabli x, y, z i N, kao s = N-y-z+x. Najzad, algoritmi koji koriste varijable t i u, odnosno predstavljaju ukupni broj molekula čija struktura ne sadrži danu determinantu (t), te ukupni broj neaktivnih molekula (u), su ekvivalentni korištenju varijabli N, y i/ili z, te se može lako pokazati da je t = N-y, te u = N-z.
Primjer br. 22
Mapiranje relativnih doprinosa
Ovaj izum također omogućuje konstrukciju relativnih kontribucijskih dijagrama. To su grafičke prezentacije kemijskih struktura pri čemu se relativni doprinos različitih atoma, veza, fragmenata i/ili podstruktura danom biološkom učinku označuje indeksnom vrijednošću koja je izračunata kao što je opisano u prethodnim primjerima. U poželjnoj realizaciji metode, koriste se vjerojatnosti indeksne vrijednosti kao što su one izračunate korištenjem formule (XII), gdje P(A) označuje vjerojatnost da je dana kemijska determinanta sadržana u podskupu biološki aktivnih struktura temeljem slučajnog odabira, koja se izračunava korištenjem formule s različitim kombinacijama varijabli x, y, z i N kao što je prije opisano.
[image]
U ovom kontekstu, očigledno je da se za procjenu P(A) mogu koristiti brojne mjere povezivanja i/ili indeksne funkcije. Dva primjera dijagrama relativnog doprinosa sada će biti detaljnije razmotrena. Sljedeći prikaz
[image]
prikazuje molekulu od interesa popraćenu nizom kemijskih determinanti koje se sastoje od fragmenata iste navedene molekule, koji su indeksirani pomoću formule (XII) te modificiranje mjere povezanosti (1) da se odredi P(A). Slika 15 prikazuje istu informaciju u grafičkom obliku, pri čemu su determinante grafički prikazane u odnosu na njihove odgovarajuće indeksne vrijednosti. U ovom kontekstu, očigledno je da ista informacija može biti prikazana u obliku konturnih mapa vjerojatnosti, kao što se može vidjeti na ovom prikazu:
[image]
Sveukupno, takvi dijagrami su vrlo korisni za oblikovanje zbirke spojeva, budući da pomažu istraživaču pri odabiranju spojeva temeljem matematičkih očekivanja o vjerojatnosti da budu uspješni u danoj analizi, smanjenjem potrebe koja se osniva na pojmu molekularne različitosti da bi se identificirao nov, biološki aktivan kemijski niz. Oni su također od interesa u medicinskoj kemiji, kao prikazi kao što je ovaj gore, koji jasno označuje koja vrsta molekula se može racionalno modificirati s najmanjim rizikom gubitka farmakološke aktivnosti. Obrnuto, takvi grafovi daju znak toksikologu koje specije toksičnog spoja treba promijeniti da bi se uklonio nepoželjan učinak.
Za dobivanje relativnog kontribucijskog mapiranja koje je prikazano gore i na slici 15, kemijske determinante koje odgovaraju fragmentima biološki aktivnih molekula su indeksirane sukladno ovom izumu korištenjem indeksne funkcije pomoću varijabli x, y, z i N što omogućuje izravnu procjenu vjerojatnosti slučajnog nalaženja unutar skupa aktivnih molekula (P(A)). Odgovarajuće vrijednosti P(A) su transformirane korištenjem indeksne funkcije (XII), postavljanjem indeksne vrijednosti vjerojatnosti za svaku determinantu koja odražava relativnu mogućnost da je odgovarajuća kemijska struktura osnova biološke aktivnosti od interesa. Vrijednosti mogu biti prikazane kao na slici 15 što je grafičko predstavljanje indeksnih vrijednosti za različite kemijske determinante. Kemijska determinanta br. 54 odgovara lokalnom maksimumu ovog niza. Ili, vrijednosti se mogu prikazati kao na gornjem prikazu koji je vjerojatnosna konturna mapa, koja naznačuje koji je fragment ili sektor kemijske strukture od interesa najvjerojatnije vezan za biološku aktivnost (determinanta br. 54 sadržana je unutar područja koji je omeđen s 95% konturnom crtom). Drugi način prikazivanja podataka prikazan je na slici 11.
Primjer br. 23
Ekvivalentnost indeksnih funkcija
Indeksne funkcije koje su korištene u prethodnom primjeru su načini da se identificiraju kemijske determinante koje su najvjerojatnije osnova danog biološkog, farmakološkog i/ili toksikološkog učinak. Premda je očigledno za osobu koja poznaje ovo područje da je određenu mjeru povezanosti i/ili indeksne funkcije najbolje koristiti za samo određeni tip pitanja, kada se rabi kao što je opisano u metodi ovog izuma, svaka formula omogućuje identificiranje stog, pri čemu je najveći rang kemijske determinante najvjerojatnije osnova danog biološkog učinka. kao takve , formule koje su navedene u prethodnom primjerima funkcionalno su ekvivalentne u smislu diskretne substrukturne analize.
Da bismo to pokazali, analiza kemijske strukture 131 dopamin D2 receptorskih agonista izvršena je osam puta paralelno pomoću osam mjera povezanosti i indeksnih funkcija koje sadrže različite kombinacije varijabli x, y, z i N prikazano niže. Istraživanje je izvršeno kao što je prije opisano, dodavanjem kemijskih struktura 101207 molekula koje su opisane kao molekule koje nemaju učinka na dopamin D2 receptor prve liste 131, te indeksiranjem niza od 19 kemijskih determinanti prikazanih niže s indeksnim funkcijama (XV) do (XXIII), pa će čitatelj uočiti da one predstavljaju iste funkcije kao one koje su korištene u određenom broju prethodnih primjera i/ili su blisko povezane s njihovim inačicama.
[image]
Ovo su kemijske determinante koje su indeksirane s osam različitih indeksnih funkcija. 19 kemijskih determinanti prikazano je gore koje su indeksirane pomoću funkcija (XV) do (XXII) te lista kemijskih struktura koja je pripisana dopaminskoj D2 aktivnosti receptorskog agonista. Te funkcije su:
[image]
[image]
Slike 16A do 16H prikazuju odgovarajuće relativne kontribucijske dijagrame. Kemijske determinante koje su navedene u gornjem prikazu indeksirane su kao što je prije opisano, te nanesene u odnosu na njihove pripadne indeksne vrijednosti. Slika 16A prikazuje indekse dobivene s funkcijom (XV), slika 16B indekse dobivene s funkcijom (XVI), slika 16C indekse dobivene s funkcijom (XVII), slika 16D indekse dobivene s funkcijom (XVIII), slika 16E indekse dobivene s funkcijom (XIX), slika 16F indekse dobivene s funkcijom (XX), slika 16G indekse dobivene s funkcijom (XXI) te slika 16H indekse dobivene s funkcijom (XXII). Svaka indeksna funkcija bez iznimke označuje istu kemijsku determinantu (br. 73) kao najvjerojatniju temeljem biološke aktivnosti.
Kao što je prikazano, za relativni kontribucijski dijagram koji je prikazan na slikama 16A do 16H, za svaku od osam indeksnih funkcija identificirana je kemijska determinanta br. 73 kao ona koja odgovara lokalnom maksimumu, što označuje da je kemijski motiv najvjerojatnije ono što je osnova dopaminske D2 agonističke aktivnosti unutar liste 19 testiranih determinanti. Zanimljivo, različite indeksne funkcije su varirane prema smanjenju ranga njihovih kemijskih determinanti, pri čemu determinanta br. 62 sugerirala značaj biološke aktivnosti trećim rangom pri izračunavanju korištenjem indeksnih funkcija (XV), (XVI) i (XVII), dok je determinanta br. 63 rangirana treća korištenjem indeksnih funkcija (XXII), determinanta br. 65 rangirana treća sukladno indeksnim funkcijama (XIX) i (XXI), te najzad, determinanta br. 66 rangirana treća kada je ispitana s indeksnim funkcijama (XVIII) i (XXII).
Sveukupno, ove manje razlike su od manjeg značaja za uspješnu realizaciju metode, kao u svakom slučaju, niže rangirane determinante su stvarno fragmenti više, najviše rangirane determinante br. 73 (vidi gornji prikaz). Kao takvi, oni su dostatni za izravno korištenje kemijske determinante br. 73 i njenih fragmenata za oblikovanje zbirke spojeva za brzo skeniranje, budući da one sadrže strukture koje sadrže svaku od niže rangiranih determinanti. Uzorak tipa spoja koji bi trebao biti uključen u takvu zbirku je prikazan niže.
[image]
Ovi uzorci struktura su primjeri spojeva koji se mogu odabrati za uključivanje u zbirku spojeva koja je oblikovana za identificiranje dopaminskih D2 receptorskih agonista. Svaka od gore navedenih struktura sadrži kemijsku determinantu br. 73, ili njen pretežni dio.
Kao zaključak, te premda matematičko rasuđivanje leži iza konstrukcije i uporabe osam različitih indeksnih funkcija u svakom slučaju, svi oni identificiraju posve istu kemijsku determinantu koja je najvjerojatnije u osnovi biološke aktivnosti. Kao takvi, algoritmi koji sadrže različite kombinacije varijabli x, y, z i N, ili q, r, s, t i u kao što je prethodno navedeno, su funkcionalno ekvivalentni u smislu ovog izuma.
Primjer br. 24
Informatička pomagala za otkriće lijeka
Očigledno je iz prije navedenih primjera da ovaj izum može biti ugrađen u jedan niz ili više nizova procedura, kao što su, ali bez ograničenja, računalni programi koji su načinjeni da se poveća učinkovitost brzog skeniranja, otkriće spojeva, spoj napredovanja i/ili optimiziranja. takvi postupci ili programi su poželjno oblikovani za strojeve i/ili robotske sustave koji vrše skeniranje lijekova, odabiranje spoja, generiranje skupa i/ili kemijsku sintezu na poluautonomni ili potpuno automatizirani način. takve procedure obuhvaćaju, ali nisu ograničene na sljedeće primjere koji čine poželjne realizacije ovog izuma:
Proces u kojem su kemijske strukture, označene s odgovarajućim eksperimentalnim rezultatima, analizirane, te su biološki aktivne kemijske determinante identificirane sukladno ovom izumu.
• Proces u kojem su biološki aktivne kemijske determinante, identificirane sukladno ovom izumu, korištene za provedbu pretraživanja u kemijskim bazama podataka, virtualnih ili drugih, da bi se identificirali spojevi, biološki reagensi, reakcijski produkti, intermedijeri ili drugi, koji najvjerojatnije pokazuju dano farmakološko, biokemijsko, toksikološko i/ili biološko svojstvo.
• Proces u kojem su biološki aktivne kemijske determinante, identificirane sukladno ovom izumu, pohranjene u registru zajedno s pratećim eksperimentalnim podacima i/ili indeksnim vrijednostima, u elektroničkom ili drugom obliku, dopunjeni ili nedopunjeni, koji služe kao izvor strukturnih informacija u postupku odlučivanja, automatiziran ili neautomatiziran, za kemijski spoj, niz i/ili temeljnu osnovicu za visokoučinkovito skeniranje, medicinsku kemiju i/ili optimiziranje, pri čemu se navedeni eksperimentalni rezultati i indeksne vrijednosti odnose na bilo koje zadano farmakološko, biokemijsko, toksikološko i/ili biološko svojstvo.
• Proces u kojem su izum, kao što je opisano u bilo kojem prethodnom primjeru, korištene za identificiranje farmakoloških modulatora meta lijeka; kao što su primjerice, ali bez ograničenja, receptorski ligandi, kinaza inhibitori, modulatori ionskog kanala, proteaza inhibitori, fosfataza inhibitori i steroidni receptorski ligandi.
• Proces u kojem su izum, kao što je opisano u bilo kojem prethodnom primjeru, izravno rabi, ili koristi u računalnom programu koji je načinjen za analiziranje kemijskih struktura da bi se povećala snaga kemijskih nizova, povećala selektivnost kemijskih nizova, oblikovali spojevi s višestrukim farmakološkim učincima, predvidjeli mogući sekundarni farmakološki učinci molekule, predvidjeli mogući toksikološki učinci molekule, identificirale biološki aktivne vrste receptorskih liganada, predvidjele potencijalne protein-protein interakcije, identificirali usamljeni ligand-receptorski parovi, i/ili identificirali endogeni modulatori ciljanog lijeka. Ova posljednja uporaba odnosi se konkretno na područja genomike i proteomike, gdje se primjerice nukleotidne i/ili aminokiselinske sekvencije odabiru za istraživanje temeljem kemijskih struktura molekula koje su identificirane u analizi biokemijskog skeniranja i obradi sukladno ovom izumu, kao što je primjerice identificiranje usamljenih liganada.
• Proces kojim se izum ili izravno koristi, ili se koristi u programima koji su načinjeni da se identificiraju lažno pozitivni i/ili negativni eksperimentalni rezultati.
• Proces kojim se izum ili izravno koristi, ili se koristi u programima koji su načinjeni da se predvide potencijalni opasni učinci molekule na čovjeka, živi svijet ili okolinu, kao primjerice pri skeniranju kemikalija za uporabu kao hrana ili kao dodatak hrani, u plastici, tkanini i slično.
• Proces kojim se izum ili izravno koristi, ili se koristi u programima koji su načinjeni da se izvrši konfiguracijska, stereokemijska, analiza sličnosti i/ili analiza različitosti.
• Proces kojim se izum ili izravno koristi, ili se koristi u programima koji su načinjeni da se generiraju relativne kontribucijske mape i/ili grafičke prezentacije biološki aktivnih vrsta ili kemijskih struktura.
• Proces kojim se bilo koji od gore navedenih procesa, korišten sam ili u serijskim i/ili paralelnim kombinacijama, koristi za funkcioniranje informacijskog pomagala, računalnog programa i/ili ekspertnog sustava koji je namijenjen za uporabu pri otkrivanju lijekova, herbicida i/ili pesticida.
• Proces kojim se bilo koji od gore navedenih procesa, korišten sam ili u serijskim i/ili paralelnim kombinacijama, koristi za usmjerenje funkcije stroja i/ili instrumentacije, automatizirane ili ne, autonomne ili ne, te korištenjem registara kemijskih determinanti s označenim ili neoznačenim indeksnim vrijednostima, za korištenje u racionalnom generiranju kemijskih struktura, dobivanje kemijskih spojeva, racionalno generiranje eksperimentalnih protokola i/ili skeniranje podataka, te/ili racionalno odabiranje rezultata i/ili kemijskih struktura u području farmaceutskih i/ili agrikulturnih otkrića.
Ostale postupke ugradnje izuma može lako izvesti osoba s iskustvom i općim znanjem.

Claims (22)

1. Metoda realizacije računalog sustava za izvršenje diskretne substrukturne analize, naznačena time što obuhvaća sljedeće stupnjeve: pristupanje (210, 220, 410) bazi podataka (110, 115) molekularnih struktura, pri čemu se baza podataka može pretraživati sukladno informacijama o molekularnoj strukturi te biološkim i/ili kemijskim svojstvima; identificiranje (220) u navedenoj bazi podataka podskup molekula koje imaju dano biološko i/ili kemijsko svojstvo; određivanje (230, 420) fragmenata molekule u navedenom podskupu; za svaki fragment, izračunavanje (230, 430, 610-650) indeksa vrijednosti koji označuje doprinos odgovarajućeg fragmenta danom biološkom i/ili kemijskom svojstvu; i izvršenje (240, 250) reiteracijskog procesa analiziranjem (250) određenih fragmenata i izračunatih indeksnih vrijednosti, pri čemu je odabran bar jedan fragment koji ima takvu indeksnu vrijednost koja pokazuje visoki doprinos navedenom biološkom i/ili kemijskom svojstvu, pa zatim ponavljanjem stupnjeva pristupanja, identificiranja, određivanja i izračunavanja.
2. Metoda prema zahtjevu 2, naznačena time što stupanj izračunavanja indeksnih vrijednosti uključuje sljedeći stupanj: izračunavanje (610) broja molekula (x) unutar navedenog podskupa molekula koje sadrže dani fragment.
3. Metoda prema bilo koje zahtjevu 1 ili 2, naznačena time što također obuhvaća sljedeće stupnjeve: identificiranje u navedenoj bazi podataka drugog podskupa molekula koje nemaju navedeno biološko i/ili kemijsko svojstvo; pri čemu navedeni stupanj izračunavanja indeksne vrijednosti obuhvaća sljedeće stupnjeve: izračunavanje (620) broja molekula (y) u navedenom podskupu i navedenom drugom podskupu molekula koje sadrže dani fragment.
4. Metoda prema jednom od zahtjeva 1 do 3, naznačena time što navedeni stupanj izračunavanja indeksnih vrijednosti obuhvaća sljedeći stupanj: izračunavanje (630) broja molekula (z) unutar navedenog podskupa molekula.
5. Metoda prema jednom od zahtjeva 1 do 4, naznačena time što obuhvaća sljedeći stupanj: identificiranje u navedenoj bazi podataka drugog podskupa molekula koji nema navedeno biološko i/ili kemijsko svojstvo; pri čemu stupanj izračunavanja indeksne vrijednosti uključuje sljedeći stupanj: izračunavanje (640) ukupnog broja molekula (N) unutar navedenog podskupa i navedenog drugog podskupa molekula.
6. Metoda prema jednom od zahtjeva 1 do 5, naznačena time što se reiteracijski proces izvršava odabiranjem da fragmenti sljedećeg ciklusa budu veće molekularne težine nego fragmenti prethodnog ciklusa.
7. Metoda prema jednom od zahtjeva 1 do 6, naznačena time što također uključuje sljedeće stupnjeve: odabiranje (710) fragmenta temeljem izračunatih indeksnih vrijednosti; analiziranje (810) strukture odabranog fragmenta; lociranje (820) generalizirane stavke u fragmentnoj strukturi; i zamjena (830) generalizirane stavke s generaliziranim izrazom da se generira generička substruktura.
8. Metoda prema zahtjevu 7, naznačena time što također obuhvaća sljedeći stupanj: izvršenje (840) virtualnog skeniranja korištenjem generičke substrukture.
9. Metoda prema jednom od zahtjeva 1 do 8, naznačena time što stupanj analiziranja određenih fragmenata i izračunavanje indeksnih vrijednosti obuhvaća sljedeće stupnjeve: odabiranje (1010) prvog fragmenta koji se temelji na izračunatim indeksnim vrijednostima; odabiranje (1020) drugog fragmenta temeljem izračunate indeksne vrijednosti; i generiranje (1030) molekularne substrukture uključujući navedeni prvi fragment i navedeni drugi fragment primjenom funkcije združivanja.
10. Metoda prema jednom od zahtjeva 1 do 9, naznačena time što stupanj analiziranja određenih fragmenata i izračunatih indeksnih vrijednosti obuhvaća sljedeće stupnjeve: odabiranje (710) bar jednog fragmenta temeljem izračunate indeksne vrijednosti; ekstrahiranje (720) spojeva iz prethodnog podskupa molekula, pri čemu ekstrahirani spojevi sadrže odabrani fragment; odabiranje (730) spojeva iz prethodnog podskupa molekula koje ne sadrže odabrani fragment, ili spojeva koji nisu uključeni u prethodnom podskupu molekula; i stvaranje (740) novog podskupa molekula uključujući ekstrahirane i odabrane spojeve.
11. Metoda prema jednom zahtjevu 1 do 10, naznačena time što obuhvaća sljedeći stupanj: generiranje (230) biblioteke fragmenata (120) uključujući određene fragmente i izračunate indeksne vrijednosti.
12. Metoda prema jednom zahtjevu 1 do 11, naznačena time što je navedena baza podataka vlasnička baza podataka.
13. Metoda prema jednom od zahtjeva 1 do 12, naznačena time što je navedena baza podataka javna baza podataka.
14. Metoda prema jednom od zahtjeva 1 do 13, naznačena time što je navedena baza podataka baza podataka aminokiselinskih sekvencija i/ili sekvencija nukleinskih kiselina, a navedeno biološko i/ili kemijsko svojstvo je dani učinak proteina od interesa.
15. Metoda prema jednom zahtjevu 1 do 14, naznačena time što je navedeno biološko i/ili kemijsko svojstvo farmakološko svojstvo, a metoda koja se koristi je otkriće lijeka.
16. Metoda prema jednom od zahtjeva 1 do 15, naznačena time što također obuhvaća sljedeći stupanj: prevođenje (260) skupa spojeva koji sadrže bar jedan od zadanih fragmenata.
17. Metoda prema zahtjevu 16, naznačena time što također obuhvaća sljedeći stupanj: ispitivanje spojeva navedenog prevedenog skupa za dano biološko i/ili kemijsko svojstvo.
18. Računalni programski proizvod, naznačen time što je namijenjen za izvršenje metode prema jednom zahtjevu od 1 do 17.
19. Biblioteka fragmenata, naznačena time što se koristi za izvršenje metode prema jednom od zahtjeva 1 do 17.
20. Računalni sustav za izvršenje diskretne substrukturne analize, naznačen time što obuhvaća: sklop (100, 110, 115) za pristupanje bazi podataka molekularnih struktura, a baza podataka može se pretraživati prema informaciji o molekularnoj strukturi te biološkim i/ili kemijskim svojstvima: sklop (100, 130) za identificiranje u navedenoj bazi podataka navedenog podskupa molekula koje imaju dano biološko i/ili kemijsko svojstvo; sklop (100, 130, 135) za određivanje fragmenata molekula u danom podskupu; sklop (100, 130, 140) za izračunavanje, za svaki fragment, indeksne vrijednosti koja označuje doprinos odgovarajućeg fragmenta za dano biološko i/ili kemijsko svojstvo; i sklop (100, 130) za određivanje mora li se izvršiti reiteriranje, pa ako je to potrebno, analiziranje određenih fragmenata i izračunatih indeksnih vrijednosti, pa izvršenje procesa reiteracije.
21. Računalni sustav prema zahtjevu 20, naznačen time što je oblikovan za izvršenje metode prema jednom od zahtjeva 1 do 17.
22. Spoj koji se upotrebljava kao lijek, naznačen time što je dobiven sintetitiranjem molekule koja sadrži bar jedan fragment određen izvršenjem metode prema jednom od zahtjeva 1 do 17.
HR20030240A 2000-10-17 2003-03-31 Method of operating a computer system to perform a diskrete substructural analysis HRP20030240A2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP00309114 2000-10-17
PCT/EP2001/011955 WO2002033596A2 (en) 2000-10-17 2001-10-16 Method of operating a computer system to perform a discrete substructural analysis

Publications (1)

Publication Number Publication Date
HRP20030240A2 true HRP20030240A2 (en) 2005-02-28

Family

ID=8173320

Family Applications (1)

Application Number Title Priority Date Filing Date
HR20030240A HRP20030240A2 (en) 2000-10-17 2003-03-31 Method of operating a computer system to perform a diskrete substructural analysis

Country Status (24)

Country Link
US (1) US20040083060A1 (hr)
EP (1) EP1366440A2 (hr)
JP (2) JP2004512603A (hr)
KR (1) KR20030059196A (hr)
CN (1) CN1264110C (hr)
AU (2) AU2002215028B2 (hr)
BG (1) BG107717A (hr)
BR (1) BR0114987A (hr)
CA (1) CA2423672A1 (hr)
CZ (1) CZ20031090A3 (hr)
EA (1) EA005286B1 (hr)
EE (1) EE200300150A (hr)
HK (1) HK1061911A1 (hr)
HR (1) HRP20030240A2 (hr)
HU (1) HUP0302507A3 (hr)
IL (1) IL155332A0 (hr)
MX (1) MXPA03003422A (hr)
NO (1) NO20031730D0 (hr)
PL (1) PL364772A1 (hr)
SK (1) SK4682003A3 (hr)
UA (1) UA79231C2 (hr)
WO (1) WO2002033596A2 (hr)
YU (1) YU25603A (hr)
ZA (1) ZA200302395B (hr)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005069188A1 (ja) * 2003-12-26 2005-07-28 Dainippon Sumitomo Pharma Co., Ltd. 化合物および蛋白質間の相互作用を予測するシステム
CA2554979A1 (en) * 2004-03-05 2005-09-29 Applied Research Systems Ars Holding N.V. Method for fast substructure searching in non-enumerated chemical libraries
JP2006090733A (ja) * 2004-09-21 2006-04-06 Fuji Photo Film Co Ltd 化合物抽出装置およびプログラム
EP1762954B1 (en) * 2005-08-01 2019-08-21 F.Hoffmann-La Roche Ag Automated generation of multi-dimensional structure activity and structure property relationships
JP5512077B2 (ja) * 2006-11-22 2014-06-04 株式会社 資生堂 安全性評価方法、安全性評価システム及び安全性評価プログラム
CN102282560B (zh) * 2008-12-05 2015-08-19 狄克雷佩特公司 用于产生马库什结构专利权利要求内的虚拟化合物链接库的方法
CN102043864A (zh) * 2010-12-30 2011-05-04 中山大学 中药心血管毒性分析的计算机操作方法及其系统
EP2698733A4 (en) * 2011-04-11 2014-12-03 Jingbo Yan USES OF A MULTIDIMENSIONAL MATRIX IN THE DESIGN OF PHARMACEUTICAL MOLECULES AND METHOD FOR DESIGNING PHARMACEUTICAL MOLECULES
CN102262715B (zh) * 2011-06-01 2013-09-11 山东大学 Bcl-2蛋白抑制剂三维定量构效关系模型的构建方法及应用
ES2392915B1 (es) * 2011-06-03 2013-09-13 Univ Sevilla Compuestos bioactivos polifenolicos conteniendo azufre o selenio y sus usos
WO2014047463A2 (en) * 2012-09-22 2014-03-27 Bioblocks, Inc. Libraries of compounds having desired properties and methods for making and using them
CN103049674A (zh) * 2013-01-26 2013-04-17 北京东方灵盾科技有限公司 一种化学药物hERG钾离子通道阻断作用的定性预测方法及其系统
US9799006B2 (en) 2013-10-08 2017-10-24 Baker Hughes Incorporated Methods, systems and computer program products for chemical hazard evaluation
US9424517B2 (en) 2013-10-08 2016-08-23 Baker Hughes Incorporated Methods, systems and computer program products for chemical hazard evaluation
WO2016179531A1 (en) * 2015-05-07 2016-11-10 University Of Kentucky Research Foundation Method for designing compounds and compositions useful for targeting high stoichiometric complexes to treat conditions
EP3206145A1 (en) * 2016-02-09 2017-08-16 InnovativeHealth Group SL Method for producing a topical dermal formulation for cosmetic use
WO2018220368A1 (en) * 2017-05-30 2018-12-06 Gtn Ltd Tensor network machine learning system
US11710543B2 (en) 2017-10-19 2023-07-25 Schrödinger, Inc. Methods for predicting an active set of compounds having alternative cores, and drug discovery methods involving the same
CN113348514B (zh) 2018-09-13 2024-03-08 思科利康有限公司 预测化学结构性质的方法和系统
CN112689877A (zh) * 2018-09-14 2021-04-20 富士胶片株式会社 化合物的合成适用性的评价方法、化合物的合成适用性的评价程序及化合物的合成适用性的评价装置
US11580275B1 (en) * 2018-12-18 2023-02-14 X Development Llc Experimental discovery processes
EP3712897A1 (en) * 2019-03-22 2020-09-23 Tata Consultancy Services Limited Automated prediction of biological response of chemical compounds based on chemical information
CN110728078B (zh) * 2019-11-14 2022-11-25 吉林大学 一种基于胶粘剂化学特性的粘接结构在全服役温度区间下的力学性能的预测方法
CN111354424B (zh) * 2020-02-27 2023-06-23 北京晶泰科技有限公司 一种潜在活性分子的预测方法、装置和计算设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994028504A1 (en) * 1993-05-21 1994-12-08 Arris Pharmaceutical A machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics
US5463564A (en) * 1994-09-16 1995-10-31 3-Dimensional Pharmaceuticals, Inc. System and method of automatically generating chemical compounds with desired properties
EP1163613A1 (en) * 1999-02-19 2001-12-19 Bioreason, Inc. Method and system for artificial intelligence directed lead discovery through multi-domain clustering
AU4565600A (en) * 1999-06-18 2001-01-09 Synt:Em (S.A.) Identifying active molecules using physico-chemical parameters

Also Published As

Publication number Publication date
NO20031730L (no) 2003-04-14
CN1493051A (zh) 2004-04-28
US20040083060A1 (en) 2004-04-29
NO20031730D0 (no) 2003-04-14
IL155332A0 (en) 2003-11-23
HK1061911A1 (en) 2004-10-08
YU25603A (sh) 2005-07-19
ZA200302395B (en) 2004-03-29
AU1502802A (en) 2002-04-29
WO2002033596A3 (en) 2003-10-02
AU2002215028B2 (en) 2007-11-15
WO2002033596A2 (en) 2002-04-25
BR0114987A (pt) 2004-02-03
SK4682003A3 (en) 2003-12-02
CA2423672A1 (en) 2002-04-25
MXPA03003422A (es) 2004-05-04
UA79231C2 (en) 2007-06-11
KR20030059196A (ko) 2003-07-07
CN1264110C (zh) 2006-07-12
BG107717A (bg) 2004-01-30
EP1366440A2 (en) 2003-12-03
PL364772A1 (en) 2004-12-13
CZ20031090A3 (cs) 2004-01-14
EE200300150A (et) 2003-08-15
HUP0302507A3 (en) 2004-05-28
EA200300475A1 (ru) 2003-10-30
JP2004512603A (ja) 2004-04-22
JP2007137887A (ja) 2007-06-07
HUP0302507A2 (hu) 2003-11-28
EA005286B1 (ru) 2004-12-30

Similar Documents

Publication Publication Date Title
HRP20030240A2 (en) Method of operating a computer system to perform a diskrete substructural analysis
AU2002215028A1 (en) Method of operating a computer system to perform a discrete substructural analysis
Liu et al. Predicting hepatotoxicity using ToxCast in vitro bioactivity and chemical structure
Horvath Pharmacophore-based virtual screening
Mannhold et al. Advanced computer-assisted techniques in drug discovery
US5741653A (en) Profiling reference panel enriched by non-Ig proteins
Willett Dissimilarity-based algorithms for selecting structurally diverse sets of compounds
Hu et al. LEAP into the Pfizer Global Virtual Library (PGVL) space: creation of readily synthesizable design ideas automatically
López‐Vallejo et al. Increased diversity of libraries from libraries: chemoinformatic analysis of bis‐diazacyclic libraries
Beroza et al. Chemoproteomics as a basis for post-genomic drug discovery
Gillet et al. Similarity and dissimilarity methods for processing chemical structure databases
Hu et al. Development of QSAR models for microsomal stability: identification of good and bad structural features for rat, human and mouse microsomal stability
US20070198195A1 (en) Determining Pharmacophore Features From Known Target Ligands
Carter Inferring network interactions within a cell
Steinfath et al. Integrated data analysis for genome-wide research
JP2004500614A (ja) レセプタ選択性マッピング
Bell et al. Plate-based diversity subset screening generation 2: an improved paradigm for high-throughput screening of large compound files
US8010331B2 (en) System reconstruction: integrative analysis of biological data
Laggner et al. Pharmacophore-based virtual screening in drug discovery
Scheiber et al. Chemogenomic analysis of safety profiling data
Inhester Mining of Interaction Geometries in Collections of Protein Structures
Goldman Machine Learning Methods for Discovering Metabolite Structures from Mass Spectra
Oduguwa et al. An overview of soft computing techniques used in the drug discovery process
Froloff et al. Construction of a homogeneous and informative in vitro profiling database for anticipating the clinical effects of drugs
Jacoby et al. Molecular informatics as an enabling in silico technology platform for drug discovery

Legal Events

Date Code Title Description
A1OB Publication of a patent application
ARAI Request for the grant of a patent on the basis of the submitted results of a substantive examination of a patent application
PPPP Transfer of rights

Owner name: LABORATOIRES SERONO SA, CH

OBST Application withdrawn