NO343718B1 - Fremgangsmåte for diagnose av kreft ved påvisning av tilstedeværelse av en abnormal kromosomstruktur - Google Patents
Fremgangsmåte for diagnose av kreft ved påvisning av tilstedeværelse av en abnormal kromosomstruktur Download PDFInfo
- Publication number
- NO343718B1 NO343718B1 NO20083957A NO20083957A NO343718B1 NO 343718 B1 NO343718 B1 NO 343718B1 NO 20083957 A NO20083957 A NO 20083957A NO 20083957 A NO20083957 A NO 20083957A NO 343718 B1 NO343718 B1 NO 343718B1
- Authority
- NO
- Norway
- Prior art keywords
- weight
- gene
- sequence
- symbol
- dna
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 29
- 210000001726 chromosome structure Anatomy 0.000 title claims abstract description 10
- 206010028980 Neoplasm Diseases 0.000 title claims description 34
- 201000011510 cancer Diseases 0.000 title claims description 27
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 129
- 230000014509 gene expression Effects 0.000 claims abstract description 61
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 238000003745 diagnosis Methods 0.000 claims abstract description 18
- 108020004414 DNA Proteins 0.000 claims description 45
- 210000001519 tissue Anatomy 0.000 claims description 32
- 238000004458 analytical method Methods 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 22
- 210000000349 chromosome Anatomy 0.000 claims description 21
- 230000002759 chromosomal effect Effects 0.000 claims description 18
- 239000002773 nucleotide Substances 0.000 claims description 9
- 125000003729 nucleotide group Chemical group 0.000 claims description 9
- 238000003776 cleavage reaction Methods 0.000 claims description 8
- 238000004132 cross linking Methods 0.000 claims description 8
- 230000007017 scission Effects 0.000 claims description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 239000003446 ligand Substances 0.000 claims 2
- 210000004027 cell Anatomy 0.000 description 78
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 74
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 74
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 70
- 239000003550 marker Substances 0.000 description 68
- 239000000523 sample Substances 0.000 description 39
- 229940113082 thymine Drugs 0.000 description 37
- 229930024421 Adenine Natural products 0.000 description 35
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 35
- 229960000643 adenine Drugs 0.000 description 35
- 229940104302 cytosine Drugs 0.000 description 35
- 238000013518 transcription Methods 0.000 description 32
- 230000035897 transcription Effects 0.000 description 32
- 239000000047 product Substances 0.000 description 29
- 101100219403 Homo sapiens CALCRL gene Proteins 0.000 description 23
- 241000282414 Homo sapiens Species 0.000 description 21
- 101000908713 Homo sapiens Dihydrofolate reductase Proteins 0.000 description 21
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 19
- 102100038358 Prostate-specific antigen Human genes 0.000 description 18
- 230000001105 regulatory effect Effects 0.000 description 17
- 102100021393 Transcriptional repressor CTCFL Human genes 0.000 description 16
- 239000000872 buffer Substances 0.000 description 15
- 230000008859 change Effects 0.000 description 15
- 201000010099 disease Diseases 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 102000009572 RNA Polymerase II Human genes 0.000 description 14
- 108010009460 RNA Polymerase II Proteins 0.000 description 14
- 230000002103 transcriptional effect Effects 0.000 description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 14
- 238000001727 in vivo Methods 0.000 description 13
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 12
- 102100028843 DNA mismatch repair protein Mlh1 Human genes 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 11
- 239000002157 polynucleotide Substances 0.000 description 11
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 102000004169 proteins and genes Human genes 0.000 description 11
- 210000002889 endothelial cell Anatomy 0.000 description 10
- 230000002062 proliferating effect Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000003757 reverse transcription PCR Methods 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- 206010033128 Ovarian cancer Diseases 0.000 description 8
- 206010061535 Ovarian neoplasm Diseases 0.000 description 8
- 206010060862 Prostate cancer Diseases 0.000 description 8
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 8
- 108091034057 RNA (poly(A)) Proteins 0.000 description 8
- 239000011324 bead Substances 0.000 description 8
- 238000003909 pattern recognition Methods 0.000 description 8
- 102000004196 processed proteins & peptides Human genes 0.000 description 8
- 230000000284 resting effect Effects 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 239000007788 liquid Substances 0.000 description 7
- 230000008520 organization Effects 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000022131 cell cycle Effects 0.000 description 6
- 239000012212 insulator Substances 0.000 description 6
- 210000004924 lung microvascular endothelial cell Anatomy 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 210000004940 nucleus Anatomy 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 108010077544 Chromatin Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 238000000636 Northern blotting Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 210000003483 chromatin Anatomy 0.000 description 5
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000011835 investigation Methods 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 239000008188 pellet Substances 0.000 description 5
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 5
- 108020005345 3' Untranslated Regions Proteins 0.000 description 4
- 206010004446 Benign prostatic hyperplasia Diseases 0.000 description 4
- 102000056906 Calcitonin Receptor-Like Human genes 0.000 description 4
- 101710118454 Calcitonin gene-related peptide type 1 receptor Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 241001275954 Cortinarius caperatus Species 0.000 description 4
- 108700024394 Exon Proteins 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- 208000004403 Prostatic Hyperplasia Diseases 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 239000003431 cross linking reagent Substances 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003511 endothelial effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 102000005962 receptors Human genes 0.000 description 4
- 108020003175 receptors Proteins 0.000 description 4
- 230000005030 transcription termination Effects 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 208000008839 Kidney Neoplasms Diseases 0.000 description 3
- 229930040373 Paraformaldehyde Natural products 0.000 description 3
- 108010022394 Threonine synthase Proteins 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 102000004419 dihydrofolate reductase Human genes 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 210000003917 human chromosome Anatomy 0.000 description 3
- 238000003364 immunohistochemistry Methods 0.000 description 3
- 238000001114 immunoprecipitation Methods 0.000 description 3
- 230000003211 malignant effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 2
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 2
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001599018 Melanogaster Species 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 2
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 206010038389 Renal cancer Diseases 0.000 description 2
- 230000018199 S phase Effects 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 2
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 2
- 230000001594 aberrant effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000030944 contact inhibition Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 201000010982 kidney cancer Diseases 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- -1 para-formaldehyde Chemical class 0.000 description 2
- 229920002866 paraformaldehyde Polymers 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 101100068891 Arabidopsis thaliana GLV7 gene Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091060211 Expressed sequence tag Proteins 0.000 description 1
- 230000010190 G1 phase Effects 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 1
- 208000017095 Hereditary nonpolyposis colon cancer Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000760563 Homo sapiens Calcitonin gene-related peptide type 1 receptor Proteins 0.000 description 1
- 101100332578 Homo sapiens DHFR gene Proteins 0.000 description 1
- 101000577853 Homo sapiens DNA mismatch repair protein Mlh1 Proteins 0.000 description 1
- 101000605534 Homo sapiens Prostate-specific antigen Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- GDBQQVLCIARPGH-UHFFFAOYSA-N Leupeptin Natural products CC(C)CC(NC(C)=O)C(=O)NC(CC(C)C)C(=O)NC(C=O)CCCN=C(N)N GDBQQVLCIARPGH-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 240000008790 Musa x paradisiaca Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 108700020978 Proto-Oncogene Proteins 0.000 description 1
- 102000052575 Proto-Oncogene Human genes 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101100248196 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rgf3 gene Proteins 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 1
- 101710128101 Transcriptional repressor CTCFL Proteins 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 101150114189 calcrl gene Proteins 0.000 description 1
- 239000003560 cancer drug Substances 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000003831 deregulation Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 210000003038 endothelium Anatomy 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000012520 frozen sample Substances 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 102000050254 human CALCRL Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000003365 immunocytochemistry Methods 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- GDBQQVLCIARPGH-ULQDDVLXSA-N leupeptin Chemical compound CC(C)C[C@H](NC(C)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C=O)CCCN=C(N)N GDBQQVLCIARPGH-ULQDDVLXSA-N 0.000 description 1
- 108010052968 leupeptin Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 101150049514 mutL gene Proteins 0.000 description 1
- 108700024542 myc Genes Proteins 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 208000015768 polyposis Diseases 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000005267 prostate cell Anatomy 0.000 description 1
- 238000012755 real-time RT-PCR analysis Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/136—Screening for pharmacological compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Saccharide Compounds (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Description
Dagens fremgangsmåter for å diagnostisere en sykdom er ofte utilstrekkelige ettersom en egnet markør ikke er tilgjengelig for pålitelig diagnose av en sykdom eller for å fastsette sykdomsstadiet. Dagens tilnærminger omfatter bruk av protein-, mRNA- eller antistoffdeteksjon.
Litteraturen beskriver regulering av gentranskripsjon ved en dynamisk endring mellom kvasi-stabile genløkker dannet ved samposisjonering av to separate områder av et gen, så som CC-markører (Ramadrass A. et al. Poster-sammendrag P037, Transcription UK, Imperial College London, 13-15 april 2005). Eksempler på mRNA og proteinmarkører benyttet for påvisning av kreft kan finnes i artiklene Parnell T.J. et al. “An indigenous suppressor of Hairy-wing insulator separates regulatory domains in Drosophila”, november 2003, Proceedings of the National Academy of Sciences, USA, vol. 100, nr. 23, side 13436-13441, ISSN: 0027-8424, og Galande S., “Chromatin (dis)organization and cancer; BUR-binding proteins as biomarkers for cancer”, 2002, Current Cancer Drug Targets, vol. 2, side 157-190.
Protein-, mRNA- eller antistoffdeteksjon er i mange tilfeller uegnet for diagnose ettersom deteksjon av disse molekylene ikke nøyaktig representerer ekspresjon av genene forbundet med sykdommen. Den stokastiske variasjonen for ekspresjonsnivåene til disse molekylene mellom enkelte celler er betydelige høy, mens halveringstiden varierer vesentlig og kan være svært lav, f.eks. omkring 15 minutter for c-myc-protoonkogenpolypeptid. I tillegg følger deteksjon av disse molekylene kun etterfølgende trinn i rekkefølgen genekspresjon, transkripsjon og translasjon.
Det epigenetiske konformasjonsoppsettet til genet for potensielle gjenoppstartete runder med transkripsjon og ekspresjon gir en mulighet for diagnostikk ved et mye tidligere genekspresjonstadium. Slike konformasjonelle strukturer ser også ut til å være stabile, dvs. ha lang halveringstid, hvilket gjør dem lettere å detektere.
Oppfinnerne har funnet at analyse av kromosomkonformasjon i genomisk DNA kan brukes for diagnose av kreft. Konformasjonen dannes ved assosiasjon eller samposisjonering av fjerntliggende eller ikke-tilgrensende seter i genet. Setene kan være CC-markører (som diskuteres videre nedenfor). Det har vært funnet at endringer i kromosomkonformasjon i forskjellige gener fører til en endring i ekspresjon fra genene, og dermed kan deteksjon av den spesifikke konformasjonen brukes for å detektere abnorm ekspresjon av et gen.
Følgelig sørger oppfinnelsen for en fremgangsmåte for deteksjon eller diagnose av abnorm genekspresjon i et individ, omfattende bestemmelse, i en prøve fra individet, av tilstedeværelse eller fravær av en abnormal kromosomstruktur hvor to separate områder i genet er blitt posisjonert i nærheten av hverandre, for derved å detektere eller diagnostisere om individet har abnorm genekspresjon hvor fremgangsmåten er særpreget ved de trinn som er angitt i den karakteriserende delen av krav 1.
Beskrivelse av tegningene
Figur 1 viser identifikasjon av markørene for RNAPII-transkripsjonelle enheter ved en mønstergjenkjenningsalgoritme. (A) Skjema for innstilling og testing av markørmodellen. Det tas prøver av 422 annoterte humane gener som testes og som gir tilbakemelding i 103 sykluser inntil en konvergerende modell utvikles. Ved 3’ til genene, inkluderte konsensus et tidligere ukjent signal med et multipleksmønster, Checkpoint Charlie, sammen med et veldefinert poly(A)signal og U-rike konsensusseter. (B). Ved 3’-enden av det humane betaglobingenet er CC-markøren (merket med Gaussisk distribusjon) til stede nedstrøms for det U-rike setet og tilsvarer CoTC-setet beskrevet tidligere. Grafen viser et fall i energiverdi (merket i grått) ved CC/CoTC-setet i forhold til den naboliggende sekvensen. (C) På kromosom X i D. Melanogaster, sammenfaller CC-markøren (gaussisk fordeling) med gypsyinsulatoren i 7B2-båndet. Tetthet mav CC-forutsigelser er i samsvar med Su(Hw)-bindingsseter. Tidligere undersøkelser viser gypsy-elementer i kromosombånd 7B2 og 7B8 samposisjonert med dannelse av en sløyfe rundt cut locus.
Figur 2 viser regulert ekspresjon av modellgener. (A) Transkripsjon fra hDHFR-genet reguleres på hoved- og underordnete promotorer på en cellesyklusavhengig måte. I hvilende celler initieres en kort transkript fra den underordnete oppstrømspromotoren. Fluoresensaktivert cellesortering (FACS) av U2OS-celler brukt i forsøkene, dyrket ved tilstedeværelse av 10 % FCS (1) og under kontaktinhibering ved tilstedeværelse av 0,5 % FCS. Prosenten av G0, G2/M-, S- og G1–celler ved hver tilstand er vist i diagrammene. I overenstemmelse med tidligere rapporter, bekrefter ”Northern blot” akkumulering av DHFR mRNA i profilerende celler (bånd 3), sammenlignet med hvilende celler (bånd 4). RT-PCR-sanntidsanalyse av transkripter initiert fra en underordnet promotor i profilerende (bånd 5) og hvilende (bånd 6) celler. De viste verdiene er beregnet fra tre uavhengige forsøk. (B) hCALCRL-transkripter, i full lengde, produseres kun i endotelceller (HMVEC, bånd 1) og ikke i ikke-endotelceller (HEK293T, bånd 2). Korte ikke-kodende transkripter er til stede i begge celletypene som detektert ved en 3’RACE fra første ekson (bånd 3, endotelceller og bånd 4, ikke-endotelceller). Immunokjemi bekrefter at reseptorekspresjon er begrenset in vivo til endotel (svarte piler) og ikke epitel- eller stromalceller (hvite piler).
Figur 3 viser termineringsegenskapene til CC-markørene. (A) Humant DHFR-gen inneholder tre CC-markører (fylte trekanter). Transkripsjonstermineringsegenskapene til markørene ble kartlagt ved RT-PCR, som vist i skjema. Bakoverprimere (reverse primers) (B,C) kommer før eller etter posisjonen av den testete CC-markøren. RT-PCR for CCCHFR-2 ble kartlagt i hvilende celler, ettersom CCDHFR-2 viste regulerende termineringsegenskapene kun under disse betingelsene. Profilene for fri foldingsenergi ved bruk av Zuker-algoritme viser et fall i verdien (merket i grått) for alle tre CC-markørene. (B) Human CALCRL-genstruktur omfatter tre CC-markører (fylte trekanter). CC-markørene i hCALCRL (CCCALCRL-1, CCCALCRL-2 og CCCALCRL-3) viser også potensiell terminering av transkripsjon. En 5’RACE fra første ekson bekrefter at alle transkripter oppstår nedstrøms for CCCALCRL-1, med eventuelle potensielle intergeniske transkripter terminert på en vellykket måte. Beviset for terminert transkripsjon ved CCCALCRL-2 og CCCALCRL-3 ble bekreftet ved 3’RACE. Aksesjonsnumre for RACE-transkripter er vist i klammer. I det nedre panelet viser grafene et fall i fri foldingsenergi (merket i grått) for hver av hCALCRL CC-markørene.
Figur 4 viser kromosomkonformasjonsegenskaper til CC-markører. (A) Den integrerte 3C-undersøkelsen ble utført for CC-setene på hDHFR-genet under profilerende og hvilende betingelser. Kontroller indikerer full avhengighet for undersøkelsen på kryssbinding, restriksjon, ligering, PCR og anrikelse av RNAPII ved immunoutfelling. I profilerende celler eksisterer en romlig nærhet mellom CCDHFR-1 og CCDHFR-3 (bånd 1+3), men ikke mellom CCDHFR-1 og CCDHFR-2 (bånd 1+2) -seter i hDHFR-genet. I hvilende celler er en romlig nærhet også funnet mellom CCDHFR-1 og CCDHFR-2 (bånd 1+2) seter. En skjematisk visning av mulige konformasjoner detektert av 3C-undersøkelsen under undersøkte betingelser. (B) Den integrerte 3C-undersøkelsen ble utført for CC-setene på hCALCRL-genet i endotel- og ikkeendotelcellelinjer. Kontroller viser full avhengighet for undersøkelsen på kryssbinding, restriksjon, ligering, PCR og anrikning av RNAPII ved immunoutfelling. I endotelceller ble en interaksjon funnet mellom CCCALCRL-1, CCCALCRL-2 og CCCALCRL-3 som indikerer en konformasjon som samposisjonerer alle markørene (bånd 1+2 og 1+3, se skjema). I ikke-endotelceller kunne kun en interaksjon mellom CCCALCRL-1 og CCCALCRL-2 (bånd 1+2, se skjema) detekteres, med interaksjon mellom CCCALCRL-1 og CCCALCRL-3, som er unik for produktiv transkripsjon i full lengde i endotelceller.
Figur 5 viser beregninger av Checkpoint Charlie i andre organismer. Modellen, som var innstilt på 422 humane gener, identifiserer CC-markører (røde trekanter) i andre arter. Merk at, i tilfelle med RGF3, skiller en enkel CC-markør to annoterte gener, og fungerer som en 3’-markør for ett gen og 5’-markør for et annet. Eksoner og introner er vist som henholdsvis grønne og grå rektangler. Hele linjer representerer intergeniske sekvenser.
Figur 6 viser prinsippene i kromosomkonformasjonsdeteksjon ved bruk av 3C-undersøkelsen.
Figur 7 viser typebestemmelse av c-myc for å diagnostisere nyrekreft. CC-markører 1 og 2 er plassert rundt P0-promotoren. Samposisjonering av CC1-CC2 fører til dannelse av den lukkete strukturen som isolerer P0 og forhindrer initiering fra P0, men ikke fra P1,2. Analyse av den konformasjonelle samposisjoneringen CC1-CC2 på vevsprøver viser tilstedeværelse av et spesifikt PCR-produkt, og bekrefter eksisterende konformasjon på pasienter med nyrekreft (T1-3), men ikke i normalt vev (N1-3). Alle prøver ble testet uavhengig for tilstedeværelse av stabil konformasjon på urelatert gen, kalsitoninreseptorlignende reseptor (CRLR). Denne konformasjonen er til stede i alt vev og fungerer som en internkontroll for undersøkelsen (merket kontroll).
Figur 8 viser kromosomkonformasjon som viser eggstokkreft med m1h1.
Figur 9 viser konformasjonsderegulering i prostatacellelinjer.
Detaljert beskrivelse av oppfinnelsen
Oppfinnelsen sørger for en fremgangsmåte for deteksjon av abnorm ekspresjon fra et gen basert på bestemmelse av den tredimensjonale strukturen av høyere grad som genet har anlagt, og spesielt basert på posisjonen/mønsteret til de assosierte/ samposisjonerte setene i genet. Fremgangsmåten kan detektere tilstedeværelse eller fravær av samposisjonerte seter, eller en kromosomkonfirmasjon forårsaket av en slik samposisjonering, ved ett eller flere steder i genet. Den normale ekspresjonsformen fra et gen er vanligvis definert som ekspresjon av et produkt (RNA eller polypeptid) i en form og/eller mengde som tillater produktet å utføre sin cellulære/fysiologiske funksjon.
Abnorm ekspresjon kan defineres som en ekspresjonsform hvor et forskjellig produkt utføres (vanligvis som følge av en endring i posisjonen til transkripsjonstermineringen) og/eller mengden av produkt som er uttrykt ved et endret nivå (eller ikke i det hele tatt). Abnorm ekspresjon kan føre til en sykdomstilstand i organismen (slik som hvilken som helst av sykdommene nevnt her), og vil vanligvis føre til en svekkelse av levedyktigheten og/eller funksjonen til cellen eller vevet eller organet hvor den abnorme ekspresjonen forekommer. Abnorm ekspresjon kjennetegnes vanligvis ved ekspresjon av RNA eller protein med økt eller redusert lengde sammenlignet med normalt produkt og/eller ekspresjon av RNA eller protein ved et økt eller redusert nivå sammenlignet med normale ekspresjonsnivåer.
I en foretrukket utførelsesform skjer endringen fra normal til abnorm ekspresjon som følge av en endring i kromosomstrukturen som definert ved CC-markører. Den strukturelle samposisjoneringen av CC-markører definerer vanligvis grensen til transkripsjonsenhetene, og generelt overlegger abnorm ekspresjon til avvikende (forskjellige) grenser på de som er observert i vanlig ekspresjon.
Oppfinnelsen sørger for diagnose av en krefttilstand eller diagnose av kreftstadiet i et individ. Slik kreft er vanligvis én hvor abnorm ekspresjon av ett eller flere gener forekommer. Slik abnorm ekspresjon kan føre til eller bidra til sykdommen. Genet kan være ett som uttrykker et funksjonelt polypeptid eller RNA som ikke er translatert (slik som ikke-kodende RNA-gener og pseudogener). Genene kan uttrykke RNA som har en regulerende rolle.
Genet er fortrinnsvis et proto-onkogen (slik som c-myc) eller et tumorhemmende gen (slik som BRCA1). Genet kan være hvilket som helst av genene angitt i tabell 2. Genet kan være hDHFR, hCALCRL, MLH1, PSA eller BORIS (f.eks. som beskrevet i GenBank aksesjonsnr. NM000791, NM005795, NM000249, NM001030047 eller NM080618). Genet har vanligvis 2, 3 4 eller flere CC-markørsekvenser. Genet kan omfatte en CC-markør i et intron i nærheten av promotoren, vanligvis det første intronet.
Sykdommen er kreft, slik som kreft i nyre, eggstokk, blære, tarm eller prostata. Kreften kan være genetisk relatert, vanligvis forårsaket ved ekspresjon av et endret RNA eller polypeptidprodukt (som definert ovenfor) og/eller forårsaket av ekspresjon av et forskjellig nivå på RNA eller polypeptidprodukt (slik som mangel på ekspresjon av et produkt).
I én utførelsesform blir fremgangsmåten utført for å bestemme kreftstadiet. Fremgangsmåten kan utføres for å bestemme risikoen for progresjon av kreften. Dermed kan fremgangsmåten brukes for å forutsi hastigheten eller alvorligheten av progresjonen av kreften eller svulsten.
Individet som diagnostiseres
Individet som diagnostiseres må ha ett eller flere symptomer av hvilken som helst av sykdomstilstandene nevnt her og/eller ha mistanke om å ha en slik sykdomstilstand. Individet kan ha en risiko for hvilken som helst slik sykdomstilstand, f.eks. som følge av at sykdommen ligger i familiehistorikken eller som følge av miljøpåvirkinger som fører til eller bidrar til utvikling av sykdommen. I tilfellet med kreft i et menneske, må individet være over 40 år, slik som over 50 eller over 60 år. Individet kan være eller ha vært en røyker.
Individet kan være én som har CC-markører (med en forbindelse som definerer kromosomstrukturen) i minst ett gen i sitt genom. Individet er vanligvis et eukaryot, slik som en lavere eller høyere eukaryot. Individet kan være en plante, gjær, insekt, pungdyr, fugl eller pattedyr. Individet er fortrinnsvis et pattedyr, slik som et primat, menneske eller en gnager.
Diagnose
Foreliggende oppfinnelse sørger for en fremgangsmåte for diagnose av abnorm genekspresjon og dermed en fremgangsmåte for diagnose av spesifikke kreftbetingelser. Fremgangsmåten omfatter deteksjon av om det er en abnorm kromosomkonformasjon i DNAet til individet (f.eks. enten direkte ved deteksjon av den faktiske kromosomstrukturen eller indirekte ved bestemmelse av setene for tilhøring/samposisjonering i genet). En slik abnorm konformasjon vil vanligvis omfatte tilstedeværelse av en ny samposisjonering (eller en kombinasjon av samposisjoneringer) ved setene i et gen (hvor de ikke normalt observeres, f.eks. når genet uttrykkes normalt) eller fravær av én eller flere samposisjoneringer (som observeres normalt under normal ekspresjon). Som nevnt ovenfor vil normal konformasjon føre til at genet uttrykker RNA-transkript med en forskjell i sekvens og/eller funksjon og/eller mengde, og forskjellen i ekspresjon kan forårsake eller bidra til kreft i individet. Den abnorme kromosomkonformasjonen kan føre til ekspresjon av en forskjellig spleisevariant.
Hvilken som helst egnet måte kan brukes for å detektere/undersøke kromosomkonformasjon av DNAet som analyseres. Vanligvis vil deteksjonen bestemme posisjonen til minst én sløyfelignende struktur i DNAet i individet. I én utførelsesform kan fremgangsmåten omfatte bestemmelse av tilstedeværelse eller fravær av et gitt samposisjonert par av CC-markører, og derved, f.eks., tillate å trekke slutningen av observert konformasjon er forskjellig fra den normale.
Vanligvis utføres fremgangsmåten in vitro på en prøve fra individet. Prøven omfatter DNA fra individet i en tilstand hvor områder av genomet som er forbundet i naturlig tilstand forblir forbundet i prøven (dvs. den epigenetiske kromosomale tilstanden bevares), f.eks., for assosierte områder med en avstand på mindre enn 5kb, 3kb, 1kb, 500 basepar eller 200 baserpar. Prøven omfatter vanligvis cellene til individet. Prøven vil vanligvis omfatte celler fra et vev som er involvert i diagnosen av sykdommen. Prøven omfatter vanligvis et kroppsfluid fra individet og kan f.eks. tas ved bruk av en sekretprøve tatt med vattpensel, slik som en munnsekretprøve. Prøven er fortrinnsvis én blodprøve eller en frossen prøve. Prøven kan være en biopsi, slik som av en svulst. Fremgangsmåten kan utføres på en enkel celle fra individet.
Prøven blir vanligvis bearbeidet før fremgangsmåten utføres, f.eks. kan DNA-ekstraksjon utføres. DNAet i prøven kan spaltes enten fysisk eller kjemisk (f.eks. ved bruk av et egnet enzym). I én utførelsesform brukes et antistoff som er spesifikk for RNA-polymerase II for å skille DNA fra andre komponenter i cellen.
Kromosomkonformasjon kan detekteres ved bestemmelse av de assosierte sekvensene, som f.eks. danner basen til en sløyfelignende struktur. I en foretrukket utførelsesform blir DNAet utsatt for kryssbinding før en slik bestemmelse. Kryssbindingen vil vanligvis omfatte en kovalent bundet binding for å dannes og blir vanligvis dannet ved å bringes i kontakt med et middel som forårsaker kryssbinding. Et slikt middel kan være et aldehyd, slik som para-formaldehyd, eller D-biotinoyl-εaminokapronsyre-N-hydroravsyreester eller digoksigenin-3-O-metylkarbonyl-εaminokapronsyre-N-hydroksyravsyreester. Paraformaldehyd kan kryssbinde DNA-kjeder som har en avstand på 4 Ångstrøm.
I fremgangsmåten kan setet for samposisjonering bestemmes ved bestemmelse av sekvensene som bringes nærmere ved dannelse av sløyfen. En slik bestemmelse kan utføres ved hvilken som helst egnet metode, og i en foretrukket utførelsesform utføres ved bruk av PCR.
I én utførelsesform brukes kromosomkonformasjonsfangingsprøven, f.eks. som beskrevet i Dekker et al. (2002) Science 295, 1306. I denne undersøkelsen er DNAet kryssbundet (f.eks. som beskrevet nedenfor). Det kryssbundete DNAet spaltes deretter, vanligvis ved restriksjonsspalting, og den spaltede strukturen utsettes for ligering. Ligering vil resultere i at DNA-strengendene, som ble dannet ved spalting, blir ligert sammen. Dermed vil ligering vanligvis resultere i DNA med en ny sekvens (som ikke var til stede i det opprinnelige genet) som omfatter begge sekvensene til de samposisjonerte setene. Deteksjon av den nye sekvensen kan brukes som grunnlag for deteksjon av konformasjonen (dvs. for å detektere tilstedeværelse av samposisjonering ved en bestemt posisjon).
Sekvensen generert ved ligering kan detekteres ved hvilken som helst egnet metode. Den detekteres vanligvis basert på sin sekvens, f.eks. ved bruk av PCR. I én utførelsesform brukes en PCR-reaksjon hvor PCR-primere som blir brukt, binder på hvilken som helst side av ligeringspunket og resulterer i vellykket PCR-reaksjon ved tilstedeværelse av det ligerte produktet, men som ikke resulterer i en vellykket PCR-reaksjon når utført ved tilstedeværelse av et gen som ikke har den relevante strukturen (vanligvis fordi primere blir bundet for langt fra hverandre på gensekvensen og orienteringen av primerne ekskluderer valg av andre produkter (primerne blir valgt i den samme orienteringen for å forhindre avvikende produkter)). I denne utførelsesformen vil et PCR-produkt kun detekteres ved tilstedeværelse av det ligerte produktet (se figur 1). Vanligvis vil PCR-primere binde innenfor 500 basepar av hverandre når det ligerte produktet bindes.
Den ligerte sekvensen kan detekteres/analyseres ved sekvensspesifikk PCR eller ved direkte sekvensering. Deteksjon kan utføres ved bruk av et gelbasert system hvor den ligerte sekvensen kjøres på en gel, og deretter blir gelen farget med en detekterbar forbindelse som binder til polynukleotider. Den ligerte sekvensen kan detekteres ved bruk av en probe, slik som en polynukleotidprobe som binder spesifikt til den ligerte sekvensen.
PCR-produkter som dannes i PCR-reaksjonene nevnt ovenfor, kan detekteres ved hvilken som helst egnet metode, f.eks. ved hvilken som helst egnet metode fra blant metodene nevnt ovenfor for deteksjon av det ligerte produktet.
I én utførelsesform omfatter fremgangsmåten også deteksjon av kromosomstrukturen til et ytterligere gen, som er et vevsspesifikt gen. Deteksjon av strukturen til det ytterligere genet (f.eks. ved hvilken som helst måte beskrevet her) vil tillate bestemmelse av om det ytterligere genet uttrykkes eller ikke, og vil derfor tillate bestemmelse av den vevsspesifikke ekspresjonen. Dette kan bistå i diagnosen av sykdommen.
I én utførelsesform av oppfinnelsen analyseres 2, 3 eller flere gener for å bistå diagnosen. Spesielt i tilfellet med kreftdiagnose, kan analyse av mer enn ett gen som er implisert i å forårsake kreft bistå i bestemmelse av den spesifikke kreften.
I en ytterligere utførelsesform sammenlignes analysen av kromosomstruktur som utføres i henhold til fremgangsmåten ifølge oppfinnelsen med den samme analysen som er utført på en kontrollbiopsi fra sykt vev (slik som kreft/svulst) for å bistå diagnose.
I én utførelsesform utføres fremgangsmåten ifølge oppfinnelsen på en kvantitativ måte for å bestemme forholdet mellom cellene i individet (f.eks. en bestemt in vivo plassering eller i et bestemt vev) som har en abnorm genekspresjon. Dette kan bistå bestemmelse av kreftstadiet.
Sekvenser i genet som er forbundet for å danne kromosomstrukturen
Som nevnt her omfatter fremgangsmåten ifølge oppfinnelsen deteksjon av tilstedeværelse av en kromosomkonformasjon som er dannet ved forbindelse av spesifikke områder i et gen. Slike områder er på det samme kromosomet, og har en avstand som vanligvis er mindre enn 50.000, slik som mindre enn 20.000, 10.000, 5.000, 1.000 eller mindre enn 500 baser. Forbindelsen av sekvensene kan føre til dannelse av en sløyfe/sløyfelignende/topologisk lukket struktur. En fagperson vil forstå hva som menes når det henvises til områder i et gen som er forbundet. Slike områder er nærme nok til å kryssbindes sammen, slik som ved hvilke som helst kryssbindingsmidler nevnt her. De vil derfor vanligvis ha en avstand mellom hverandre i Ångstrømsområdet, slik som, f.eks., mindre en 50 Ångstrøm eller mindre enn 10 Ångstrøm.
Én eller flere av sekvensene som kan være forbundet kan:
-forårsake, regulere eller bidra til transkripsjonsterminering, og/eller
-være CC-markører.
CC-markører har vanligvis en lengde på 1 til 30 nukleotider, f.eks. 5 til 20 eller 10 til 15 baser.
CC-markører kan detekteres i hvilken som helst gitt gensekvens ved bruk av informasjonen i tabell 1. Én av de senere delene nedenfor viser i detalj hvordan CC-markørsekvenser identifiseres. En kort beskrivelse av hvordan informasjonen i tabell 1 brukes er som følger: tabellen viser 4 sett med verdier. For hvert av settene med verdier er en posisjon angitt og posisjonsverdier for hver type nukleotid er gitt i forhold til utgangsposisjonen (i tabell 1 er dette definert som kolonneposisjonen som er i forhold til utgangsposisjonen). Det kan sees at, for det første settet med verdier, er verdier for guanin, cytosin, adenin og tymin gitt for posisjoner 0 til 18. Ved bruk av verdiene i tabell 1 bestemmes en verdi for hver base av en gitt sekvens i forover- og bakoverstrengen. Denne analysen utføres ved å skanne sekvensen fra venstre til høyre og deretter gjenta den på dens komplementære streng. Under skanning er en base ansett som et referansepunkt og verdien for den basen bestemmes ved bruk av posisjonsverdiene til 4 sett med verdier og den relative avstanden mellom verdiene (dvs. for hver base bestemmes en verdi basert på sekvensen rundt den basen som har posisjoner som er definert ved bruk av posisjonstallene i tabell 1). Hvis denne verdien er større enn X (inngangsverdien gitt av brukeren), er det aktuelle baseparet innenfor en CC-markør. Denne fremgangsmåten gjentas for alle basene.
Verdien konverteres vanligvis til en eksponensiell verdi (invers logaritmisk) verdi. I én utførelsesform velges CC-markører som har en invers logaritmisk verdi på mer enn 0,9, slik som mer enn 0,95 eller mer enn 0,99 (beregning av den logaritmiske verdien er beskrevet i større detalj i en senere del).
Oppfinnerne har brukt informasjonen i tabell 1 for å detektere CC-markører i menneske, gjær og bananflue (D.melanogastersekvenser).
Sett for å utføre fremgangsmåten
Oppfinnelsen kan også utføres med et sett for å utføre fremgangsmåten. Settet vil vanligvis omfatte midler for deteksjon av spesifikke sidestilte sekvenser i et gen. Vanligvis vil settet omfatte et primerpar eller probe som kan brukes for å detektere en samposisjonert sekvens (f.eks. ved å detektere et ligert produkt som beskrevet her). Vanligvis vil én eller flere primere og/eller proben omfatte en sekvens som er et fragment av gensekvensen eller av sekvensen som er homolog med gensekven sen (det er innforstått at henvisning til gensekvensen omfatter også den komplementære sekvensen, ettersom én primer selvfølgelig vil binde gensekvensen og den andre primeren vil binde den komplementære sekvensen). En slik gensekvens kan være 5’ til kodingssekensen (f.eks. promotorsekvensen), kodingssekvensen, intronsekvensen eller sekvens 3’ til kodingssekvensen.
Primerne eller proben er vanligvis minst 10, 15, 20 30 eller flere baser lang, og omfatter vanligvis DNA, normalt i form av en enkel streng. Primerne eller probene kan være til stede i isolert form. Primerne eller proben kan ha en opplysende/detekterbar markør. Egnete markører omfatter radioisotoper slik som 32P eller 35S, fluoriserende markører, enzymmarkører eller andre proteinmarkører, slik som biotin.
Settet kan omfatte et kryssbindingsmiddel som er i stand til å kryssbinde DNA, slik som hvilke som helst kryssbindingsmidler nevnt her.
I én utførelsesform er settet for gjennomføring av utførelsesformer av oppfinnelsen hvor kromosomstrukturen til mer enn ett gen blir analysert, slik som 2, 3, 4 eller flere gener. I slike tilfeller kan settet også omfatte primere eller prober for å analysere 2, 3, 4 eller flere forskjellige gener.
Settet kan i tillegg omfatte én eller flere andre reagenser eller instrumenter som gjør det mulig for hvilke som helst av utførelsesformene av fremgangsmåten nevnt ovenfor å utføres. Slike reagenser eller instrumenter omfatter ett eller flere av følgende: en detekterbart markør (slik som en fluorescerende markør), en enzymmarkør for å virke på et polynukleotid (vanligvis en polymerase, restriksjonsenzym, ligase, RNAse H eller et enzym som kan feste en markør på et polynukleotid), egnet(e) buffer(e) (vandige løsninger) for enzymreagenser, en positiv og/eller negativ kontroll, et gelelektroforeseapparat, en måte å isolere DNA fra prøven, en måte å oppnå en prøve fra individet (slik som en vattpinne eller et instrument omfattende en nål) eller en bærer omfattende brønner hvor deteksjonsreaksjoner kan utføres.
Fremgangsmåte for utvelgelse
Oppfinnelsen gir en fremgangsmåte for diagnostisering av kreft ved å identifisere en forbindelse for behandling av abnorm ekspresjon fra et gen omfattende bestemmelse av om et kandidatstoff er i stand til å kunne føre til endring i kromosomstrukturen til genet fra den abnorme strukturen som er antatt under abnorm ekspresjon til normal struktur, for derved å bestemme om kandidatstoffet er i stand til å behandle abnorm ekspresjon. Endringen i kromosomstruktur kan detekteres ved bruk av hvilken som helst egnet fremgangsmåte beskrevet her. Fremgangsmåten kan også utføres for å identifisere forbindelser som kan føre til en endring i ekspresjon fra et gen (f.eks. en endring fra én ekspresjonsmodus til en annen ekspresjonsmodus), ved å igjen bestemme om en kandidatforbindelse kan føre til endringer i genstrukturen.
Fremgangsmåten kan utføres in vitro (inne i eller utenfor en celle). I én utførelsesform utføres fremgangsmåten på en celle, cellekultur, celleekstrakt, vev, organ eller organisme som omfatter genet. Cellen er vanligvis én hvor abnorm ekspresjon av genet observeres.
Fremgangsmåten utføres vanligvis ved kontakt av kandidatstoffet med genet, cellen, cellekulturen, celleekstraktet, vevet, organet eller organismen og bestemme om en endring i normal kromosomstruktur forekommer.
Egnete kandidatstoffer som ble testet i fremgangsmåtene for utvelgelse ovenfor, omfatter antistoffmidler (f.eks. monoklonale og polyklonale antistoffer, enkelkjedete antistoffer, chimere antistoffer og DCR-podete antistoffer). Videre kan kombinatoriske bibliotek, definerte kjemiske identiteter, peptid og peptidmimetikker, oligonukleotider og bibliotek over naturlige midler, slik som fremvisningsbibliotek (f.eks. bakteriofagfremvisningsbibliotek) også testes. Kandidatstoffene kan være kjemiske forbindelser, som vanligvis er utledet fra syntese rundt små molekyler som kan ha hvilke som helst av egenskapene til middelet nevnt her (slik som organiske forbindelser nevnt her). Satser med kandidatstoff kan brukes i innledende utvelgelse/undersøkelse av, f.eks., ti stoffer per reaksjon, og stoffene med satser som viser endring testes hver for seg.
Kunstig fremstilte gener og organismer
Oppfinnelsen kan benytte en fremgangsmåte for å endre ekspresjonsprofilen til et gen omfattende
i) å innføre en CC-markør i genet, og/eller
ii) å fjerne en CC-markør fra et gen, eventuelt ved å innføre 1, 2, 3 eller flere mutasjoner i CC-markøren, hvor hver mutasjon er en addisjon, substitusjon eller delesjon av en nukleotidbase,
hvor minst 50 % av kodingssekvensen til genet forblir uendret i fremgangsmåten.
I én utførelsesform forblir det totale antall CC-markøresekvenser (dvs. funksjonelle CC-markørsekvenser) uendret i fremgangsmåten.
Ved ”fjerning av en CC-markør” er det innforstått at hele CC-markørsekvensen ikke trenger å fjernes, men i stedet kan mutasjoner innføres i CC-markørsekvensen for å gjøre den inaktiv, slik at, i én utførelsesform, den endrete CC-markørsekvensen ikke lenger er i stand til å føre til assosiasjon av regioner i genet.
RNA eller polypeptidproduktet fra genet beholder funksjonell aktivitet eller kan ha en forskjellig aktivitet eller kan ha ingen aktivitet (sammenlignet med produktet fra det ikke kunstig fremstilte genet). Det kunstig fremstilte genet kan være hvilket som helst av genene nevnt her. Det kunstige fremstilte genet kan replikeres og/eller uttrykkes og/eller innføres i en celle.
I fremgangsmåten kan det benyttes et polynukleotid, omfattende en CC-markør, for å endre ekspresjon fra et gen. Et slikt polynukleotid kan brukes for å innføre eller fjerne en CC-markør fra et gen, som i tilfellet med hvilke som helst av de kunstig fremstilte genene beskrevet her. Polynukleotidet er vanligvis et DNA-molekyl. Polynukloetidet kan være i form av en vektor, slik som en viral vektor. Polynukleotidet kan være i form av et transposon.
Homologer
Homologer av polynukleotidsekvenser er vist til her. Slike homologer har vanligvis minst 60 % homologi, fortrinnsvis minst 80 %, 90 %, 95 %, 97 % eller 99 % homologi, f.eks. over et område på minst 15, 20, 30, 100 eller flere tilgrensende nukleotider. Homologien kan beregnes basert på nukleotididentitet (noen ganger vist til som ”hard homologi”).
For eksempel sørger UWGCG pakken for et BESTFIT-program som kan brukes for å beregne homologi (f.eks. brukt som dens normalinnstilling). (Devereux et al.
(1994) Nucleic Acids Research 12, s. 387-395). PILEUP- og BLAST-algoritmene kan brukes for å beregne homologi eller stille opp sekvenser (slik som å identifisere ekvivalente eller tilsvarende sekvenser (vanligvis på deres normalinnstilling), f.eks. som beskrevet i Altschul, S.F. (1993) J Mol Evol 36:290-300; Altschul, S.F. et al. (1990) J Mol Biol 215:403-10.
Programvare for å utføre BLAST-analyse er offentlig tilgjengelig gjennom National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/). Denne algoritmen omfatter først å identifisere sekvenspar med høy verdi (HSP) ved å identifisere korte ord med lengde W i utprøvningssekvensen som enten er lik, eller tilfredsstiller, en positiv terskelverdi T når oppstilt med et ord av samme lengde i databasesekvensen. T vises til som naboordterskelverdi (Altschul et al, ovenfor). Disse innledende treffene på naboord fungerer som kimen for å innlede søk for å finne HSPer inneholdende disse. Ordtreffene strekker seg i begge retninger langs hver sekvens så lenge den kumulative oppstillingsverdien kan økes. Forlengelser for ordtreffene i hver retning stanses når: den kumulative oppstillingsverdien faller av med mengden X fra sin maksimale oppnådde verdi; den kumulative verdien blir null eller mindre, som følge av akkumulering av én eller flere restoppstillinger med negativ verdi; eller enden på hver sekvens nås. BLAST-algoritmeparametrene W, T og X bestemmer følsomheten og hastigheten til oppstillingen. BLAST-programmet bruker som normalverdier en ordlengde (W) på 11, BLOSUM62 verdisettingsmatrisen (se Henikoff og Henikoff (1992) Proc. Natl. Acad. Sci. USA 89: 10915-10919) oppstillinger (B) på 50, forventet verdi (E) på 10, M=5, N=4, og en sammenligning av begge strengene.
BLAST-algoritmen utfører en statistisk analyse av likheten mellom to sekvenser; se f.eks. Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5787. Et mål på likheten som er gitt av BLAST-algoritmen er minstesumssannsynlighet (P(N)), som gir en indikasjon av sannsynligheten for at et likhetstreff mellom to polynukleotidsekvenser vil forekomme tilfeldig. For eksempel anses en sekvens å være lignende en annen sekvens hvis den minstesumssannsynligheten i en sammenligning av den første sekvensen til den andre sekvensen er mindre enn ca. 1, fortrinnsvis mindre enn ca. 0,1, mer foretrukket mindre enn ca. 0,01 og mest foretrukket mindre enn ca. 0,001.
Den homologe sekvensen er vanligvis forskjellig med mindre enn 2, 3, 5 eller 8 baser (som kan bære substitusjoner, delesjoner eller innsetninger av nukleotider). Disse endringene kan måles over hvilke som helst av områdene nevnt ovenfor i forhold til å beregne homologi.
Følgende eksempler illustrerer oppfinnelsen:
Bruk av mønstergjenkjenningsanalyse for å undersøke strukturell organisering av gener
Et fremkommende paradigme i eukaryotisk biologi er at de strukturelle aspektene av organisering av kjernen spiller en direkte rolle i transkripsjonsregulering av genene. Fra kromosomområdene til gensløyfene – diverse strukturelle nivåer fremkommer som viktige komponenter av spesifikke transkripsjonsresponser (1-3). Her har vi kombinert to tilnærminger for å identifisere noen av de egenskapene som er implisert i strukturell organisering av transkriberte gener in vivo. Fra anvendt matematikk har vi brukt mønstergjenkjenningsanalyse, basert på den generaliserte lineære modellen og Bayes teori, og brukt denne for å identifisere grensene til RNA-polymerase II (RNAPII) transkripsjonsenheter. Fra molekylær biologi har vi brukt in vivo undersøkelser for å analysere og beskrive spekteret av transkripsjonsaktivitet og den strukturelle subkromosomale domeneorganiseringen ved de setene.
Mønstergjenkjenningsanalyse har vært bredt anvendt i forskjellige fagområder, slik som medisin, teknikk og lingvistikk, hvor bildeanalyse og dataavkoding tillater identifisering av underliggende karakteristiske markører i komplekse systemer. Vi har brukt mønstergjenkjenningsmetodologi for å analysere humant genomdata i forhold til transkripsjonsenhetene, bearbeidet ved RNAPII. Et sett med sekvenser fra 422 manuelt bårete gener på humant kromosom 22 (4) ble brukt for dataidentifikasjon av regulerende signaler. For den aktuelle undersøkelsen, fra alle fremgangsmåtene tilgjengelig for mønstergjenkjenning, har vi funnet Relevance Vector Machine (RVM) (5-6) som den mest vellykkete. RVM-simulatoren bruker et sparsomt Bayesian prinsipp som tar hensyn til avstandsvariasjonen som er observert mellom de regulerende signalene (7). Fra det gitte sekvenssettet, skanner innstilleren for markører som definerer dem og konstruerer en generalisert lineær sannsynlighetsmodell. Senere kan denne ”innstilte” modellen brukes for å klassifisere valgte sekvenser for tilstedeværelse av definerte markører. Derivasjon av denne modellen er basert på betingelsessannsynlighet av Bayes teori gitt nedenfor
hvor dataene representerer settet med DNA-sekvenser. P(data|model) er den ytre sannsynligheten som gir sannsynligheten av en sekvens derivert fra modellen. Den avhenger av sannsynligheten av dataene levert til modellen og sannsynlighetene til modellen og dataene.
Hver markør som definerer egenskapene til sekvensen, x, er gitt som en DNA-vektmatrise relativ til spaltningssetet. Matematisk representeres dette som:
hvor P er en posisjonssannsynlighet og W(x, i ) er en DNA-vektmatrisesannsynlighet for en forskyvning i relativ til spaltningssetet. En kombinasjon av disse markørene brukes deretter for å bygge en generalisert lineær modell:
hvor M er settet med markører som definerer genet og β er vektene (eller viktigheten) av hver markør.
Modellen, som ble innstilt på 422 annoterte humane gener fra kromosom 22, identifiserte tre typer generelle markører ved 3’endene (figur 1A). Tidligere kjente transkripsjonssignaler: poly(A)signal og U-rikt sete nær 3’endene av RNAPII transkriberte gener er to av de tre typene markører identifisert. Dette resultatet validerte vår tilnærming ettersom den entydig bekreftet allerede beskrevne sekvenser funksjonelt angitt i terminering og bearbeiding av 3’enden av mRNA (8-10). Det er interessant at den tredje typen markør identifisert av RVM-innstilleren var tidligere ukjent. Den var plassert ytterligere nedstrøms for det U-rike setet og omfattet flere DNA-vektmatriser. Avstandsvariasjonen i hver type markør ble fanget som en Gaussiks fordeling. Det er interessant at, når modellen ble testet på human kromosom 20 sekvenser, markøren ikke var begrenset til 3’endene, men også til stede ved 5’endene av de annoterte genene. Som følge av forbindelsen av den nylig definerte markøren med grenser langs transkripsjonsenhetene, har vi oppkalt den etter den mest kjente grenseposten i Berlin fra den kalde krigen – en Checkpoint Charlie (CC) markør.
Det er interessant at, i motsetning til poly(A) setet, vi kunne identifisere eventuell forlenget primer sekvenskonsensus for CC-markørene. Dette antyder at vi, gjennom mønstergjenkjenningsanalyse, har identifisert setene som kan dele fellesegenskaper gjennom informasjonen som er kodet i de sekundære og tertiære strukturene til de tilsvarende sekvensene. Faktisk viser sekvensanalyse av CC-markører ved bruk av Zuker-algoritmen (11) lave frie foldingsenergier, som er karakteristisk av høyere sekundære og tertiære strukturer for de tilsvarende transkriptene.
For å bestemme den funksjonelle relevansen til CC-markørene på transkripsjonell regulering, lette vi etter eventuelle eksempler på CC-markører blant allerede definerte regulerende elementer. Det er viktig å nevnt at algoritmen, som var innstilt på humane gener, kunne identifisere CC-markører i eukaryoter over mange arter (figur 5). Vi tilegnet dette den evolusjonært bevarte funksjonen mediert markørstrukturer av høyere grad.
Her presenterer vi to eksempler på CC-markørens funksjonalitet forbundet med transkripsjonell regulering. Det første eksempelet på CC-markøren ble funnet i det humane beta-globingenet, undersøkt grundig for sine egenskaper ved flere laboratorier. Nyere rapporter viste at terminering av transkripsjon i beta-globingenet avhenger ikke bare av gjenkjenning av poly(A)setet, men også det kotranskripsjonelle spaltningssetet (CoTC) videre nedstrøms (7, 12-14). Det er interessant at CoTC-setet sammenfaller med den identifiserte CC-markøren og viser lave foldingsenergier, som nevnt tidligere (figur 1B). Denne observasjonen ikke bare bekrefter den potensielle relevansen CC-markøren har for grensen til det transkriberte genet, men antyder også dens funksjonelle innblanding i mekanismen for regulert transkripsjonell terminering.
Det andre eksempelet på CC-markør var funnet på X-kromosomet til Drosophila melanogaster, hvor den sammenfalt med gypsy-insulatoren i kromosombåndet 7B2 (figur 1C). Gypsy er et velkjent 350 bp insulatorelement, med flere Su(Hw) bindingsseter, som styrer sløyfelignende kromatinnstrukturer av høyere grad (15). Et forsøk som var utført på cut locus i Drosophila, viste to insulatorseter ved kromosombånd 7B2 og 7B8 kommer sammen ved kjernens periferi og danner sløyfe rundt lokus (16) (figur 1c). Lignende organisering av kromatinnfibre mediert ved krysskommunikasjon mellom insulatorer har også vært vist for scs og grensesekvensene til scs (17). Sammen er disse observasjonene i henhold til det faktum at funksjonaliteten til CC-markørene også kan spille en rolle i strukturer av høyere grad, inklusiv subkromosomale domenekonformasjoner, som kunne detektere ved tidligere rapporterte Chromosom Conformation Capture (3C) undersøkelsen (18).
For å validere observasjonene ovenfor, ble en systematisk analyse av CC-markører utført på to regulerte humane gener (figur 2). Begge modellgenene – det cellesyklusregulerte dihydrofolatreduktase (DHFR)-genet (19) og det celletypespesifikke kalsitoninreseptorlignende reseptor (CALCRL)-genet (20-22) – viser alternative måter for regulert transkripsjonell aktivitet. I vår analyse var vi spesielt interesserte i å vite om CC-markører (i) kan begrense området for RNAPII-transkripsjon og (ii) korrelere med eventuelle kromosomale konformasjoner.
Human DHFR (hDHFR) er et cellesyklusregulert gen, regulert fra de underordnete promotorene som ligger oppstrøms og hovedpromotorene som ligger nedstrøms. Genet har en spennvidde på 28,5 kb i kromosom 5 og inneholder 6 eksoner (figur 2A). Uavhengige undersøkelser har vist at hDHFR-ekspresjon fremkalles ved inngangen til en S-fase i cellesyklusen og skrus av i hvilende celler (G0) (figur 2A) (23). Når i G1/S-fasene, drives produktiv transkripsjon av hDHFR-genet fra hovedpromotoren, i hvilende celler, er den transkripsjonelle aktiviteten ikke annulert, men settes over i en alternativ modus – med utgangspunkt fra den underordnete promotoren oppstrøms og termineres aktivt i det andre intronet. Transkriptet fra den underordnete promotoren er ustabil, men kan detekteres i overflod i hvilende celler ved RT-PCR.
hDHFR-genet inneholder tre CC-markører: (i) oppstrøms fra begge promotorene (CCDHFR-1); (ii) i det andre intronet (CCDHFR-2); (iii) nedstrøms fra det funksjonelle poly(A)signalet (CCDHFR-3) (figur 3A). Det er interessant at parallelanalyse avslører flere enn 40 kryptiske poly(A)signaler til stede i det samme genet. Alle tre beskrevne CC-seter viste lav fri foldingsenergi, som er karakteristisk for svært strukturerte enkelstrengsnukleinsyrer (figur 3A). For å fastslå termineringsegenskapene til hver av CC-setene, kvantifiseres rikeligheten av in vivo transkripter ved RT-PCR, omfattende ustabile og sjeldne, oppstrøms og nedstrøms for CC-setene. I alle tre tilfellene fant vi bevis for terminering av transkripter ved CC-seter (figur 3A). Ved CCDHFR-1-setet ble transkripsjonsterminering av sjeldne intergeniske transkripter detektert. I hvilende celler ble det korte ikke-kodende transkriptet terminert ved CCDHFR-2-setet. Et kanonisk AATAAA-sete er også til stede nær CCDHFR-2-setet og den delen av DNA-sekvensen er i overenstemmelse med forskjellige uttrykte sekvensmerker (Expressed Sequence Tags) og cDNAer fra den offentlige databasen. I prolifererende celler anga CCDHFR-3-setet terminering av produktiv transkripsjon nevnt tidligere. Assosiasjon av CCDHFR-3-setet med det funksjonelle poly(A) signalet ligner den tidligere beskrevne korrelasjonen med beta-globingenet.
Det andre foretrukne modellgenet var det celletypespesifikke humane CALCRL-genet (hCALCRL) (figur 2B). Den koder en syv-transmembran G-roteinkoblet reseptor (GPCR). GPCR fra pattedyr utgjør en stor og variert proteinfamilie som har som primærfuksjon å omforme ekstracellulær stimuli til intracellulære signaler. De fleste GPCR viser en respons på endogene signaler (endoGPCR), slik som peptider, lipider, neurotransmittere eller nukleotider. EndoGPCRer er svært konserverte og deres ekspresjonsprofiler er unike og gir tusener av vevs- og cellespesifikke reseptorkombinasjoner for modulering avfysiologiske prosesser. Repertoaret til endoGPCRer omfatter 367 reseptorer i mennesker. Mekanismene som regulerer deres spesifikke ekspresjon og funksjon forblir imidlertid i hovedsak ukjent. EndoGPCR som kodes ved hCALCRL-genet er ansett å være et nøkkelmolekyl i regulering av aktiviteten til medlemmer av kalsitoninfamilien av peptider som spiller viktige roller i cellevekst, celleoverlevelse og cellenavigering. Humant CALCRL-gen (103,15 kb) ligger på kromosom 2 og inneholder femten eksoner og transkriberes i forskjellig humant vev og svulster. hCALCRL-genet transkriberes i sin fulle lengde i endotel- og ikkeendotelceller som vist i ”northern blotting” og immunohistokjemi (figur 2B). I ikkeendotelceller kan imidlertid en ikke-kodende transkript, som termineres i det første intronet, detekteres (figur 2B). Vi anser hCALCRL-genet for å være en god modell for celletypespesifikk regulering av genekspresjon (22).
På lignende måte som hDHFR, kunne CC-markørene detekteres både oppstrøms for promotoren (CCCALCRL-1) og nedstrøms for det funksjonelle poly(A)signalet (CCCAL-
CRL-3) til hCALCRL-genet. En ytterligere tredje CC-markør (CCCALCRL-2) er til stede i det første intronet i genet (figur 3B). En 5’ RACE fra det første eksonet bekrefter at alle transkriptene initieres nedstrøms og ingen oppstrøms for CCCALCRL-1-markøren. Dette antyder at CCCALCRL-1 kanskje kan terminere transkripter som kan interferere med hCALCRL-transkripsjonsenheten. En 3’RACE–analyse bekrefter tilstedeværelse av terminerte transkripter nær CCCALCRL-2 (i det første intronet) og CCCALCRL-3-seter (i et område nedstrøms for spaltningssetet). Alle tre CC-markørsetene viser lav fri foldingsenergi som vist ovenfor (figur 3B). Dermed viser CC-markørene transkripsjonelle termingeringsegenskaper in vivo, både i hDHFR- og hCALCRL-gener.
For å validere den andre foreslåtte egenskapen til CC-markøren, undersøkte vi om de er impliserte i eventuelle spesifikke kromosomale konformasjoner som definert ved 3C-undersøkelsen. Denne undersøkelsen ble utviklet for å overvåke svært fleksible in vivo kromosomale konformasjoner ved å detektere en romlig nærhet mellom fjerntliggende seter omfattet i dannelse av sløyfelignende strukturer. Vi har justert betingelsene for undersøkelsen for å forbedre utbyttet og følsomheten for deteksjon av humane celler (se Materials and Methods). Det er vesentlig at det innledende trinnet til undersøkelsen også omfatter anrikelse av de transkriberte kromosomale kjernene med anti-RNAPII-immunoutfelling (24).
Når analysert for hDHFR-genet, ble setene for CCDHFR-1- og CCDHFR-3-markørene, plassert mer enn 29 kb fra hverandre, funnet å være sidestilte i normale prolifererende celler (figur 4A). Den romlige nærheten mellom disse to setene var svært spesifikk (figur 4A, sammenligne 1+2, 1+3 i prolifererende celler) og avhengig av tilstedeværelse av RNAPII, kryssbinding, restriksjon og PCR (figur 4A, hDHFR-kontroller). Som vist tidligere (figur 3A), viser begge disse setene også transkripsjonelle egenskaper i prolifererende celler.
Endringer i transkripsjonell modus på hDHFR–genet under hvilende betingelser er blant annet forbundet med generering av korte transkripter som terminerer inne i det andre intronet. Det er viktig at hDHFR-genet inneholder en tredje CC-markør plassert ved det samme setet. Tidligere analyse av hDHFR-transkripsjon i hvilende tilstand indikerer at CCDHFR-2-markøren ble aktivert som et termineringssete for det korte ikke-kodende transkriptet (figur 3A). Vi ville derfor undersøke om en annen transkripsjonell modus i hvilende tilstand ville korrelere med alternativ kromosomal konformasjon for CCDHFR-2-markøren. Faktisk, som vist i figur 4A, kan in vivo konformasjon, som samposisjonerer CCDHFR-1- og CCDHFR-2-markørene, detekteres ved 3C-undersøkelse i hvilende celler. Kun lave ivåer av denne konformasjonen ble detektert i populasjonen av prolifererende celler. Det er interessant at den observerte CCDHFR-1:CCDHFR-2–konformasjonen ikke utsletter CCDHFR-1:CCDHFR-3–konformasjonen beskrevet tidligere for de prolifererende cellene. Når karakteren til 3C-underøkelsen tas i betraktning, kan dette resultatet ha flere begrunnelser. Først kan hvilende-spesifikk konformasjon være overlagt på den beholdte CCDHFR-1:CCDHFR-3–konformasjonen. Deretter kan resultatet representere to populasjoner av celler mens de bytter fra én konformasjon til en annen. Det er viktig at CCDHFR-1:CCDHFR-2–konformasjonen var spesifikk for den hvilende transkripsjonsmodusen og i overenstemmelse med området av detekterte transkripter. Vi har derfor detektert for hDHFR-genet in vivo kromosomale konformasjoner kjennetegnet ved romlig nærhet mellom CC-markører. Nærheten mellom CCDHFR-1 og CCDHFR-2-markører var spesifikk for transkripsjonsmodusen beskrevet for den hvilende cellesyklustilstanden.
For å teste om CC-markører deltar i eventuell strukturell ordning forbundet med celletypespesifikk ekspresjon av hCALCRL-genet, undersøkte vi dens konformasjoner i transkripsjonstillatende (endotel, HMVEC) og ikke-tillatende (ikke-endotel, HEK293T) -celler. I HMVEC-celler viser det aktive hCALCRL-genet en konformasjonell profil hvor alle tre CCCALCRL-markører var samposisjonerte, med nærhet mellom CCCALCRL-1:CCCALCRL-2 og CCCALCRL-1:CCCALCRL-3 (figur 4B; data for CCCALCRL2:CCCALCRL-3 er ikke vist). Det er viktig at grensene mellom disse to potensielle sløyfekonformsjonene tilsvarer grensene til de to transkriptene detektert i HMVEC-celler (figur 2B). For å teste om noen av disse konformasjonene er unike for HMVEC-celler, analyserte vi hCALCRL i HEK293T, transkripsjonelt ikke-tillatende celler. Mens vi fremdeles detekterte samposisjonering av CCCALCRL-1 og CCCALCRL-2, var samspillet mellom CCCALCRL-1 og CCCALCRL-3, omfattende den fulle lengden av hCALCRL-genet, ikke lenger til stede (figur 4B). CCCALCRL-1:CCCALCRL-2– konformasjonen forekommer med tilstedeværelse av korte hCALCRL–transkripter som termineres ved det første intronet ved CCCALCRL-2-setet i HEK293T-celler (figur 2B). Dermed er celletypespesifikk ekspresjon av hCALCRL–genet forbundet med unik kromosomal konformasjon, som detektert mellom CCCALCRL-1- og CCCALCRL-3-markører. Det er viktig at denne konformasjonen omfatter full lengde av reproduktive transkripter generert i HMVEC- celler.
Anvendelse av mønstergjenkjenningsanalyse på grensene til 422-annoterte humane gener har identifisert og definert flere markører, omfattende en tidligere ukjent markør implisert i transkripsjonell regulering. Markøren – Checkpoint Charlie, som konsekvent korrelerer med grensene for kodende og ikke-kodende transkripsjonelle enheter i et variert utvalg av arter (se også figur 5), viser svært ordnete sekundære og tertiære strukturer for de tilsvarende transkriptene, forbinder den regulerte termineringen av transkripsjon ved RNAPII in vivo, og styrer dannelsen av tranksripsjonsavhengige alternative kromosomale konformasjoner. Når analysert på de cellesyklusspesifikke hDHFR- og celletypespesifikke hCALCRL-genene, forbindes markøren funksjonelt med de enestående strukturelle konformasjonene av høyere grad, som er karakteristiske for den éne eller den andre av modusene for transkripsjonell aktivitet. De samposisjonerte CC-markørene ikke bare korrelerer med subkromatinstrukturer ladet med RNAPII, men lager også et omriss for grensene til transkriptene syntetisert innenfor de strukturene. Vår data er forenelig med tidligere antydninger om at strukturer av høyere grad er dannet på en transkripsjonsavhengig måte og kan være viktig for transkripsjonell reinitiering.
Transkripsjonell regulering utføres ved forskjellige viktige nivåer ved flere aktiviteter koblet til DNA-sekvensspesifikk rekruttering, kromatinnmodifikasjon og remodellering av CC-markører og medhørende strukturell organisering er tydelig implisert in vivo i etablering av de ytre grensene for forskjellige transkripsjonelle enheter.
Northern blotting
Northern blotting for hDHFR ble utført fra total RNA isolert fra U2OS-celler. Prolifererende celler ble dyrket ved tilstedeværelse av 10 % FCS, mens hvilende celler ble oppnådd under kontaktinhibering ved tilstedeværelse av 0,5 % FCS. Sonder syntetisert ved bruk av en mal omfattende sekvenser mellom fjerde og sjette ekson av hDHFR ble brukt som sonde.
Northern blotting for hCALCRL ble utført som beskrevet tidligere (25). Human CL i full lengde ble RT-PCR-forsterket og klonet i pcDNA 3,1 vektor. Den resulterende vektoren ble sekvensert ved bruk av et Applied Biosystems 377 genetisk analyseinstrument og sekvens ble vurdert opp mot GenBankdatabasen. Innsetningen ble tatt ut og brukt som en mal for å generere sonder.
I begge tilfellene ble sondene merket med 32P-dCTP ved bruk av MegaPrime Labelling Kit (Amersham, UK). Etter hybridisering og kraftig vasking ble blottet utsatt for Hyperfilm (Amersham, UK) og deretter Phosphoscreen. Hybridiseringssignaler ble analysert ved bruk av programvaren ImageQuant.
Fluorescensaktivert cellesortering (FACS)
FACS sortering av U2OS dyrkende og hvilende celler ble utført som beskrevet tidligere (26).
Omvendt transkripsjonspolymerasekjedereaksjon (RT-PCR)
Omvendt transkripsjon PCR, for å bestemme terminering av transkripter i hDHFR, ble utført på total RNA isolert fra U2OS-celler. De følgende forover- og bakoverprimerne ble brukt for CCDHFR-1-, CCDHFR-2- and CCDHFR-3-seter:
CCDHFR-1
Foroverprimer (A): tggggaactgcacaatatga (SEQ ID NO:1)
Bakoverprimer (B): aggggtgcgtcttttaacct (SEQ ID NO:2)
Bakoverprimer (C): ccgcacgtagtaggttctgtc (SEQ ID NO:3)
CCDHFR-2
Foroverprimer (A): ttccagagaatgaccacaacc (SEQ ID NO:4)
Bakoverprimer (B): tgttccttttgatcgtggtg (SEQ ID NO:5)
Foroverprimer (C): tggggtatctaatcccagtttg (SEQ ID NO:6)
CCDHFR-3
Foroverprimer (A): tttggaaaaacccatgaagg (SEQ ID NO:7)
Bakoverprimer (B): caacagtcctgccagttgtt (SEQ ID NO:8)
Bakoverprimer (C): cagggttttggtctgtcacc (SEQ ID NO:9)
RT-PCR ble utført ved bruk av Omniscript Reverse Transcription Kit fra Qiagen, UK.
Hurtig amplifisering (rapid amplifications) av cDNA-ender (RACE)
Race ble utført i hovedsak som beskrevet tidligere (27). Genspesifikke primere ble utformet for 3’- (cagagagtgtcacctcctgctttagg) (SEQ ID NO:10) og 5’-RACE (cccacaagcaaggtgggaaagagtg) (SEQ ID NO:11) basert på den rapporerte sekvensen av humant CALCRL cDNA (28). Transkriptene fra 5’ og 3’ RACE (som terminerer ved første intron) ble sekvensert og innlevert til GenBank-databasen.
Antistoffproduksjon og karakterisering
Polyklonal kaninantistoff LN-1436 ble hevet mot syntetisk peptid tilsvarende residuer 427-461 (HDIENVLLKPENLYN) (SEQ ID NO:12) ved det ekstreme C-terminus i humant CL (hCL)-protein (aksesjonsnumre AAC41994 og AAA62158; kodet av CALCRL-genet). Spesifisiteten til antistoffene ble karakterisert ved immunoblotanalyse av kortvarig uttrykt CL i HEK293T-celler.
Immunocytokjemi
Formalinfikserte, parafininnsatte prøver (n=74) med 20 normale humane vev ble valgt fra arkiverte filer fra The Department of Cellular Pathology, John Radcliffe Hospital, University of Oxford, Oxford, UK. Flere vevsmikromatriser (Multiple tissue microarrays - TMAer) ble fremstilt ved å anskaffe sylindriske kjerner (1,0 mm diameter) for hver prøve plassert i matrisen ved høy tetthet inn i en mottaker TMA-blokk. Antigenutvinningsprosedyren ble utført på 4 µm avvoksete og rehydrerte deler før immunohistokjemi utføres ved bruk av et anti-hCL antistoff LN-1436. Immunohistokjemi ble utført i hovedsak som tidligere beskrevet. Biotinylerte sekundære antistoffer, streptavidinalkalifosfatasekompleks Vectastain ABC-AP Kit og Vector Red deteksjonssystem (alle fra Vector, Burlingame, US) ble brukt. Kontroller omfatter preimmunt kaninserum brukt ved hensiktsmessige konsentrasjoner.
Kromosomkonformasjonfanging (3C)
3C–analyse ble utført som beskrevet tidligere (31) med følgende endringer. Ca 4 × 106 hele celler ble kryssbundete ved å behandle med 2 % formaldehyde ved romtemperatur i 10 minutter. Kryssbindingen ble stoppet med en ekvimolar mengde glysin og celler ble høstet og lysert i hypotonisk buffer (10 mM Tris-HCl [pH7,2], 2 mM MgCl2og 0,5 % Triton X-100). Kjernene ble deretter resuspendert i 10 minutter på is i CSK-buffer (100 mM NaCl, 300 mM sukrose, 10 mM PIPES [pH 6,8], 3mM MgCl2, 10µM leupeptin, 1 mM EGTA, 1,2 mM PMSF and 0,5 % Trion X-100). Suspensjonen ble sentrifugert ved 5000 rpm ved 4 ºC i en Hettich Mikro 22R sentrifuge og pelleten ble behandlet med 2M NaCl. Etter inkubering i 10 minutter på is ble tilstrekkelige mengder vann tilsatt for å redusere NaCl-konsentrasjonen til 150 mM. Denne prøven ble brukt for å uføre RNAPII kromatinnimmunoutfellingsundersøkelse som beskrevet tidligere (32) Kromatinnet som ble immunoutfelt med RNAPII-antistoff (H-224, Santa Cruz Biotechnology Inc., USA) ble deretter utsatt for restriksjon med BglII restriksjonsenzym (New England Biolabs, UK) og ligert med T4 DNA-ligase (Roche, UK). Etter spalting av proteinene med Proteinase K (Roche, UK) og RNA med Ribonuclease A (Sigma, UK), ble DNAet ekstrahert med etanol. PCR-analyse på det ekstraherte DNA-et ble utført ved bruk av spesifikke primere med TakaRa LA TaqTM fra Takara Bio Inc., Japan.
Diagnose av kreft i eggstokk og prostata
MLH1-ekspresjon i normalt vev og eggstokkreftvev (se figur 8)
Svulsthemmende gener spiller en viktig rolle i overlevelse og opprettholdelse av celler. Å stanse svulsthemmere, signalisere uhemmet vekst som fører til kreft. Som et feilsikringssystem gjennomgår celler apoptose når slike signaler for uhemmet vekst detekteres.
En human homolog av Escherichia coli mutL genet, tarmkreft ikke-polypøs type 2 (MLH1), er et slikt gen som koder for et DNA upassende rearasjonsgen. MLH1-signaliserer reparasjonsmekanismen initiert av DNA-skade og setter igang apoptose i svulstceller. Dette genet er funnet i lokus 3p21,3, og akkumulerer forskjellige mutasjoner og modifikasjoner etter hvert som cellen eldes. Én slik forandring, økning i metyleringsnivåer i promotorområdet til MLH1, er blitt forbundet med arvelig ikkepolypøs tarmkreft. I tillegg er det blitt vist at MLH1-alternative spaltningsvarianter er vevsspesifikke og bidrar til fenotypisk variasjon i arvelige kreftformer.
For å se om MLH1-mutasjoninduserte spaltningsvariasjoner er forbundet med eggstokkreft, så vi etter CC-seter som omfattet transkripsjonsenheten. Ved skanning av MLH1-sekvensen fant vi en CC-markør ved det 8. intronet og en annen i 3’UTR dannet grenser til en alternativ spaltningsvariant. 3C-analyse utført på disse to setene viser CC-setene som samposisjoneres kun i normale pasienter. Mens vevs- og fluidprøver tatt fra pasienter med eggstokkreft viser ingen samposisjonering. Dermed kan MLH1 CC-seter brukes som en markør for å kjennetegne eggstokkreft.
Prostatakreft
Tester for diagnostiske markører for prostata ble utført på cellelinjer, og representerte godartete eller sene stadier av svulstvekst. De foretrukne genene var PSA og BORIS.
BORIS- og PSA-ekspresjon i normalt vev og prostatakreftvev (se figur 9)
Et nytt medlem av testikkelkreftgenfamilien, “Brother of the regulator of imprinted sites” (BORIS), er uttrykt kun i spermocytter og ikke i normale somatiske celler. Dens ekspresjon er imidlertid forbundet med flere humane kreftformer omfattende brystkreft og lungekreft. BORIS konkurerer med andre Zn-fingertranskripsjonsindikatorer, CTCF for epigene perturberinger i humant ondartet vev. Dermed bestemte vi oss for å teste forbindelsen mellom BORIS og human prostatakreft (LNCaP).
BORIS har to CC-seter omfattende den definerte transkripsjonsenheten i kromosomalplassering 20q13,31. Ettersom genet er vesentlig uttrykt i ondartet vev, bestemte vi oss for å teste samposisjoneringen av to CC-seter i LNCaP. Fra resultatene, vist i den medfølgende figuren, skjer samposisjonering av CC-seter kun i LNCaP og ikke i humane osteosarkom (U20S) -cellelinjer. Ytterligere bekreftelse ble oppnådd ved å sekvensere PCR-produktet.
Vi vurderte også en annen veletablert prostatakreftdanner, prostataspesifikt antigen (PSA). PSA, kodet ved humant Kallikrein 3 (KLK3) -gen, brukes for diagnose av prostatakreft ved å detektere nivåer av PSA i blod. Her bruker vi imidlertid 3C-teknikken for å se på PSA-genet i humane osteosarkomceller og godartete prostatahyperplasi (BPH1) -cellelinjer. Det kan sees av BORIS at KLK3- transkripsjonsenheten også defineres av to CC-seter, en i 5'UTR og den andre i 3'UTR. Resultatene viser at disse to CC-setene krysskommuniserer kun i BPH1-celler og ikke i U20S.
Dermed kan PSA og BORIS brukes som biomarkører for å identifisere henholdsvis godartete og ondartete prostatakreftceller.
PCR-metoder
MLH1
3C Restriksjonsenzym - BssSI
MLH1-primere
MF3UTR2 TGGTTTTAGCTGGGATGGAG
MF3UTR1 GAGGCAGGCAGATCACTTGT
MREI2 AGAAGATGCAGGCCAACAAT
MREI1 CTCGTAAAGCCCAAGGAGGT
Første runde med PCR-reaksjon
2X buffer I 25 µl
dNTP (2,5 mM) 8 µl
DNA 1 µl
Primere (25 µM)
Forover (MREI2) 1 µl
Bakover (MF3UTR2) 1 µl
TakaRa LA Taq 0,5 µl
Vann 13,5 µl
Total 50 µl
Primere
MREI2 - MF3UTR2
PCR-program
94 ºC - 5 min
94 ºC - 1 min
57 ºC - 1 min i 30 sykluser
72 ºC - 45 sek
72 ºC - 5 min
Forventet produktstørrelse
MREI2 - MF3UTR2 - 527 bp
Andre runde med PCR-reaksjon
2X buffer I 25 µl
dNTP (2,5 mM) 8 µl
DNA 2 µl
Primere (25 µM)
Forover (MREI1) 1 µl
Bakover (MF3UTR1) 1 µl
TakaRa LA Taq 0,5 µl
Vann 12,5 µl
Total 50 µl
Primere
MREI1 - MF3UTR1
Prøver
Ta 48 µl blanding og 2 µl av den respektive PCR-reaksjonen fra 1. runde
PCR program
94 ºC - 5 min
94 ºC - 1 min
59 ºC - 1 min i 25 sykluser
72 ºC - 30 sek
72 ºC - 5 min
Forventet produktstørrelse
MREI1 - MF3UTR1 -325 bp
BORIS
3C Restriksjonsenzym - TaqI
BORIS-primere
BR5UTR4 GGCTGGAATTGCCCTAAAGT BR5UTR3 CCTATGAGGGGGCAGTATCA
BR3UTR2 GCTCTTCCTGCTGGGAAAT BR3UTR1 TACAGGGGTGGAGACAGGTT
Første runde med PCR-reaksjon
2X buffer I 25 µl dNTP (2,5 mM) 8 µl DNA 1 µl Primere (25 µM) Forover (BR5UTR4) 1 µl Bakover (BR3UTR2) 1 µl TakaRa LA Taq 0,5 µl Vann 13,5 µl Total 50 µl
Primere
BR5UTR4 – BR3UTR2
PCR-program
94 ºC - 5 min
94 ºC – 45 sek
57 ºC – 30 sek i 30 sykluser 72 ºC - 25 sek
72 ºC - 5 min
Forventet produktstørrelse
BR5UTR4 – BR3UTR2 – 430 eller 784 bp
Merk: To produktstørrelser er gitt ettersom 3C-restriksjonsenzymet (Taq I) spaltes ved hvilken som helst av de to restriksjonssetene i nærheten av CC-markøren.
Andre runde med PCR-reaksjon
X buffer I 25 µl
dNTP (2,5 mM) 8 µl
DNA 2 µl
Primers (25 µM)
Forover (BR5UTR3) 1 µl
Bakover (BR3UTR1) 1 µl
TakaRa LA Taq 0,5 µl
Vann 12,5 µl
Total 50 µl
Primere
BR5UTR3 - BR3UTR1
Prøver
Ta 48 µl blanding og 2 µl av den respektive PCR-reaksjonen fra 1. runde
PCR-program
94 ºC - 5 min
94 ºC – 45 sek
55 ºC - 30 sek i 25 sykluser
72 ºC - 20 sek
72 ºC - 5 min
Forventet produktstørrelse
BR5UTR3 - BR3UTR1 - 260 eller 564 bp
Merk: Her er to produktstørrelser gitt ettersom 3C-restriksjonsenzymet (Taq I) spaltes ved hvilket som helst av de to restriksjonssetene i nærheten av CC-markøren. Figur 9 viser båndet ved 564 bp, som er blitt bekreftet ved sekvensering.
PSA
3C-restriksjonenzym - TaqI
PSA-primere
PR5UTR2 CGTGATCCACCCATCTCAG
PR5UTR1 CTATTGGGAGACCGAAGCAG
PF3UTR2 GGGAAAGGGAGAAGATGAGG
PF3UTR1 TAGGGGAAGGTTGAGGAAGG
Første runde med PCR-reaksjon
2X buffer I 25 µl
dNTP (2,5 mM) 8 µl
DNA 1 µl
Primere (25 µM)
Forover (PR5UTR2) 1 µl
Bakover (PF3UTR2) 1 µl
TakaRa LA Taq 0,5 µl
Vann 13,5 µl
Total 50 µl
Primere
PR5UTR2 – PF3UTR2
PCR-program
94 ºC - 5 min
94 ºC – 45 sek
61 ºC – 30 sek i 30 sykluser
72 ºC - 25 sek
72 ºC - 5 min
Forventet produktstørrelse
PR5UTR2 – PF3UTR2 – 481 bp
Andre runde med PCR-reaksjon
2X buffer I 25 µl
dNTP (2,5 mM) 8 µl
DNA 2 µl
Primere (25 µM)
Forover (PR5UTR1) 1 µl
Bakover (PF3UTR1) 1 µl
TakaRa LA Taq 0,5 µl
Vann 12,5 µl
Total 50 µl
Primere
PR5UTR1 - PF3UTR1
Prøver
Ta 48 µl blanding og 2 µl av den respektive PCR-reaksjonen fra 1. runde
PCR program
94 ºC - 5 min
94 ºC – 45 sek
61 ºC - 30 sek i 25 sykluser
72 ºC - 20 sek
72 ºC - 5 min
Forventet produktstørrelse
PR5UTR1 - PF3UTR1 - 266 bp
CC-markørdetaljer
MLH1
CC1 - 24367 bp nedstrøms for TSS
TAACCCCAT
CC2 - 57357 bp nedstrøms for TSS
TAACATAA
(Uthevete og understrekete bokstaver representerer en CC-markørsekvens)
I normalt vev uttrykkes genet med alternative transkripter. Én slik transkript begynner ved det 8. intron, hvor CC1 er til stede og avslutter ved CC2-markøren. I eggstokkreftvev nedreguleres genet etterhvert som den akkumulerer mutasjoner, delesjoner og metylering som fører til feil eller ingen transkript. Vi fant samposisjonering av CC1 og CC2 i normalt vev, men ikke i eggstokkreftvev. Dette er forbundet med endring i transkripsjonsmodusen til genet i dette vevet.
BORIS
CC1 - 5282 bp oppstrøms for TSS
CTTTGAAAGC
CC2 - 28038 bp nedstrøms for TSS
AAAATTGCT
(Uthevete og understrekete bokstaver representerer en CC-markørsekvens)
BORIS har to CC-seter, én i 5'UTR og den andre i 3'UTR. I U20S-celler er BORIS-ekspresjon ikke forventet og dermed bør ingen samposisjonering av CC-markører kunne observeres. Derimot utrykkes BORIS i human prostatakreftcellelinje (LNCaP). Vi fant en samposisjonering av CC1 og CC2 i LNCaP og ikke i U20S.
PSA/KLK3
CC1 - 408 bp oppstrøms for TSS
CTGGTCTCAGAGT
CC2 - 5843 bp nedstrøms for TSS
TACTGTGGTTTA
(Uthevete og understrekete bokstaver representerer en CC-markørsekvens)
KLK3 har to CC-seter, én i nærheten av 5'UTR og den andre i 3'UTR. KLK3-ekspresjon er ikke forventet i U20S-celler og dermed kan ingen samposisjonering av CC-markører observeres. Derimot uttrykkes KLK3 i godartet prostatahyperplasicellelinjer (BPH-1) KLK3. Dermed observeres samposisjonering av CC1 og CC2 i BPH-1 og ikke i U20S.
Kildehenvisninger
Referanser
1. P. R. Cook, I. A. Brazell, E. Jost, Journal of Cell Science 22, 303 (Nov, 1976).
2. T. Cremer, C. Cremer, Nat Rev Genet 2, 292 (Apr, 2001).
3. D. Carter, L. Chakalova, C. S. Osborne, Y. F. Dai, P. Fraser, Nature Genetics 32, 623 (Dec, 2002).
4. J. E. Collins et al., Genome Research 13, 27 (Jan, 2003).
5. T. A. Down, T. J. Hubbard, Genome Research 12, 458 (Mar, 2002).
6. M. E. Tipping, Journal of Machine Learning Research 1, 211 (Jun 1, 2001).
7. M. J. Dye, N. J. Proudfoot, Cell 105, 669 (Jun 1, 2001).
8. N. J. Proudfoot, A. Furger, M. J. Dye, Cell 108, 501 (Feb 22, 2002).
9. G. Yeung et al., Molecular and Cellular Biology 18, 276 (Jan, 1998).
10. M. Yonaha, N. J. Proudfoot, EMBO Journal 19, 3770 (Jul 17, 2000).
11. M. Zuker, Nucleic Acids Research 31, 3406 (Jul 1, 2003).
12. A. Teixeira et al., Nature 432, 526 (Nov 25, 2004).
13. S. West, N. Gromak, N. J. Proudfoot, Nature 432, 522 (Nov 25, 2004).
14. M. Kim et al., Nature 432, 517 (Nov 25, 2004).
15. T. I. Gerasimova, V. G. Corces, Cell 92, 511 (Feb 20, 1998).
16. K. Byrd, V. G. Corces, Journal of Cell Biology 162, 565 (August 18, 2003).
17. J. Blanton, M. Gaszner, P. Schedl, Genes and Development 17, 664 (Mar 1, 2003).
18. J. Dekker, K. Rippe, M. Dekker, N. Kleckner, Science 295, 1306 (Feb 15, 2002).
19. J. E. Slansky, P. J. Farnham, Bioessays 18, 55 (Jan, 1996).
20. B. Fluhmann, M. Lauber, W. Lichtensteiger, J. A. Fischer, W. Born, Brain Research 774, 184 (Nov 7, 1997).
21. N. Aiyar et al., Journal of Biological Chemistry 271, 11325 (May 10, 1996).
22. L. L. Nikitenko, D. M. Smith, R. Bicknell, M. C. Rees, FASEB Journal 17, 1499 (Aug, 2003).
23. S. L. Hendrickson, J. S. Wu, L. F. Johnson, Proceedings of the National Academy of Sciences of the United States of America 77, 5140 (Sep, 1980).
24. R. Metivier et al., Cell 115, 751 (Dec 12, 2003).
25. L. L. Nikitenko et al., Molecular Human Reproduction 7, 655 (Jul, 2001).
26. Z. Darzynkiewicz, The Cell Cycle. A Practical Approach. P. Fantes, R. Brooks, Eds. (IRL Press, Oxford, 1993), pp. 45-68.
27. L. L. Nikitenko, D. M. Smith, R. Bicknell, M. C. Rees, FASEB Journal 17, 1499 (Aug, 2003).
28. N. Aiyar et al., Journal of Biological Chemistry 271, 11325 (May 10, 1996).
29. J. Kononen et al., Nature Medicine 4, 844 (Jul, 1998).
30. L. L. Nikitenko, I. Z. MacKenzie, M. C. Rees, R. Bicknell, Molecular Human Reproduction 6, 811 (Sep, 2000).
31. J. Dekker, K. Rippe, M. Dekker, N. Kleckner, Science 295, 1306 (Feb 15, 2002).
32. R. Metivier et al., Cell 115, 751 (Dec 12, 2003).
Beskrivelse av CC-markører og deres deteksjon
Mønstergjenkjenningsanalyse har vært bredt anvendt i forskjellige fagområder, slik som i medisin, teknikk og lingvistikk, hvor bildeanalyse og dataavkoding tillater identifikasjon av underliggende karakteristiske markører i komplekse systemer. Vi har brukt mønstergjenkjenningsmetoder for å analyser data over det humane genomet i forhold til transkripsjonsenhetene, bearbeidet ved RNA polymerase II. Et sett med sekvenser fra 422 manuelt annoterte gener på humant kromosom 22 ble brukt for dataidentifikasjon av regulerende signaler til stede ved grensene til transkripsjonsenhetene. Spesiell oppmerksomhet er viet identifikasjon av signalene ved 3’-enden av transkripsjonsenhetene. Dette viste seg å være funksjonelt relevant ettersom senere forsøk bekreftet at signalene har avslutningsegenskaper in vivo.
Mønsteret funnet ved grensene har flere signaler og representeres i XML-format som forklarer 3 nøkkeltrekk
a. DNA alfabetet til hvert signal som er identifisert
b. Variasjon i posisjon for hvert signal som Gaussisk distribusjonsbredde
c. Avstand mellom hvert signal i et mønster i basepar
Etter hvert som mønster observeres på grensene til transkripsjonsenhetene, kaller vi det “Checkpoint Charlie” (CC)-markør.
CC-markører på en kjent sekvens kan identifiseres ved bruk av et sett med koder som identifiseres som ”Skanner”. Skanneren trenger 3 inngangsdata fra brukeren:
a. Sekvensen som undersøkes
b. Mønsteret i XML-format
c. Strenghetsfaktor (invers logaritmisk verdi) for å utelukke svake CC-markører (normalverdi: f.eks. 0,99)
Skanneren leser DNA inngangsdata og prøver å tilpasse mønstrene i sekvensen. Dette gjøres ved å gå langs DNA-sekvensen ved å ta hver base som referansepunkt. Skanneren begynner med den første basen som referansepunkt og prøver å tilpasse mønsteret definert i XML-formatet. Graden av tilpasning avgjøres ved en verdi. Hvis denne verdien er større enn strenghetsfaktoren gitt av brukeren, ble en CC-markør funnet. Posisjonen til den identifiserte CC-markøren er gitt i et standard GFF-format og skanneren beveger seg til den andre basen i inngangssekvensen.
Denne fremgangsmåten gjentas inntil skanneren leser alle basene på inngangs-DNA og dens komplementære streng.
Sluttresultatet fra denne skanningen for CC-markørmønsteret vil være en tekstfil med potensielle CC-markørplasseringer i inngangssekvensen med sin respektive verdi i GFF-format.
CC-markørdeteksjon
For å illustrere deteksjon av CC-markøren i en gitt sekvens, ta i betraktning følgende sekvens.
ATATTTGTACTATGGCTCTGAATAAATAATAAGGACAGGAAGCCCGGAGAAG-GAGAGTTTTTTTTTTTTTTTGGTACGAGAACTCTCTGTACTATTTTTTCAAC-TTTTCTTTTTCTTTTCTTTTGAGACGGAGTCTTACTCTTCTTGCCCAGGCTGGAGTGCAAT-GGCGCGATCTCGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGTGATTCTCCTGCCT-CAGCCTCCCAAGTAGCTGGGATTACAGGCATGTGCCACCATGCCTGG-CTAATTTTGTATTTTTAGTAGAGATGGGGGTTTCACCATGAGCGCCAGGCTGGTCTT-GAACACCTGACCTCGTGATCCACCTGCCTCGGCCTCCCAAAGTACTGGGACTACAGGTAT-GAGCCACTGTGCCCAGCCGACAAAAC
Gitt denne sekvensen utføres en skanning fra venstre til høyre for å finne CC-markøren. La oss se på den 50. basen (understreket) som vårt referansepunkt. For å bestemme om denne basen er en CC-markør eller ikke, bør settet med 4 vekter, som er beskrevet i tabell 1, tilsvare denne sekvensen. For enkelhets skyld vises et eksempel hvor alle de 4 settene med vekter (også understreket) er til stede.
Som beskrevet tidligere har de 4 settene med vekter en relativ distanse mellom hverandre i forhold til referansepunktet. For eksempel, fra tabell 1 kan det sees at det første settet med vekter begynner ved posisjon 8 i forhold til referansepunktet. Dette første settet med vekter har 19 posisjonsverdier for hver type nukleotid som viser seg ved den posisjonen. For eksempel, for den første posisjonen vil et guanin få en verdi på 0,19 og et tymin vil få en verdi på 0,33. Likeledes, for den andre posisjonen, vil guanin få en verdi på 0,20 og et tymin vil få en verdi på 0,39. Den andre verdien multipliseres med den første. Dette gjentas inntil alle de 19 posisjonsverdiene er avlest og multiplisert med sin foregående verdi.
I vårt eksempel har vi TTTTTTTTTTTTTTTTGGT som begynner ved 8. base i forhold til referansepunktet. Dermed er vår verdi for dette settet med vekter (0,33*0,39*0,34*0,35*0,41…) og så videre.
Denne fremgangsmåten gjentas hver gang for andre tre sett med verdier også, og multipliserer posisjonsverdien med den foregående verdien som hittil var beregnet.
Den endelige verdien fra alle de 4 settene med verdier konverteres til en eksponensiell verdi (invers logaritmisk) verdi, for enkel håndtering. Den logaritmiske verdien er lik 1,0/(1+e-x) hvor X er verdien som oppnås ved fremgangsmåten ovenfor ved å bruke verdiene i tabell 1. Hvis denne logaritmiske verdien er større enn 0,90 (f.eks.) så anses den basen å være en CC-markør. I vårt eksempel ga multiplikasjon av posisjonsverdiene fra alle 4 setene med verdier en invers logaritmisk verdi på 0,99999. Ettersom denne verdien er større enn 0,99, er den 50. basen, A, innenfor CC-markørsekvensen. Analyse av andre baser i sekvensen tillater identifikasjon av sekvensen fra den 41. til den 56. basen som CC-markøren (med en endelig verdi på 0,99968).
Fremgangsmåte brukt i deteksjon av samposisjonering av CC-markører in vivo
Fremgangsmåten beskrevet nedenfor identifiserer brede nøkkeltrinnen i deteksjon av CC-markørsamposisjonering i vevsprøver. Dette er den første utviklete metodologien for å analysere frossent vevsprøve fra pasienter.
● Vevsprøvene skjæres i tynne deler på et objektglass.
● Tilsett 1 ml iskald 1X PBS til objektglasset og vask i 5 minutter.
● Tilsett 0,67 M paraformaldehyd for å kryssbinde protein og DNA.
● Inkuber i 10 minutter ved romtemperatur på en vuggende plattform.
● Tilsett 1M glysin for å bråstanse kryssbindingsreaksjonen.
● Skrot cellene og overfør cellene til eppendorf.
● Sentrifuger ved 13.000 rpm i 1 minutt for å samle cellen ved romtemperatur.
● Fjern overskuddsvæsken og tilsett 1 ml iskald hypotonisk buffer.
● Pipetter cellen et par ganger for å danne en fin cellesuspensjon (om nødvendig foreta en rask omdreining).
● Inkuber på is i 10 minutter for å svelle cellen og få frem kjernen.
● Sentrifuger ved 5.000 rpm i 5 minutter ved 4 ̊C for å samle kjernen.
● Drener overskuddet av cytosol og oppløs kjernepelletten i 1 ml CSK-buffer.
● Inkuber på is i 20 minutter
● Sentrifuger ved 5.000 rpm i 5 minutter ved 4 ̊C for å samle kjernen.
● Drener overskuddsvæsken så mye som mulig og behold pelletten.
● Oppløs kjernepelletten i 2M NaCl (løsningen blir viskøs).
● Inkuber på is i 10 minutter.
● Fortynn prøven med tilstrekkelig vann for å redusere NaCl-konsentrasjonen til 150 mM.
● Tilsett 10 µl Pol II antistoff (H-224) til eppendorfen.
● Inkuber ved 4 ̊C over natten med omrøring eller rotering.
● Ta 30 µl av protein G Sepharoseperleoppslemming for å oppnå omtrent 20 µl tørre perler (skjær av pipettetuppen om nødvendig).
● Sentrifuger ved 2.000 rpm i 3 minutter for å samle perlene.
● Vask to ganger med 1 ml MilliQ-vann og sentrifuger ved 2.000 rpm i 3 minutter for å samle perlene.
● Tilsett 1 ml restriksjonsvaskebuffer til perlene.
● Bland godt og fordel i forskjellige eppendorfer (om nødvendig), vask og sentrifuger ved 2.000 rpm i 3 minutter for å samle perlene.
● Overfør hele innholdet av eppendorfen med perlene og bland godt.
● Inkuber ved 4 ̊C i 1 time med omrøring eller rotasjon.
● Spinn ved 1000 rpm i 3 minutter ved 4 ̊C og fjern overskuddsvæsken.
Overskuddsvæsken kan analyseres for ubundete fraksjoner.
● Tilsett 1 ml restriksjonsvaskebuffer, roter ved 4 ̊C i 5 minutter, sentrifuger ved 2000 rpm i 3 minutter ved 4 ̊C. Fjern overskuddsvæsken.
● Tilsett 1 ml restriksjonsvaskebuffer, roter ved 4 ̊C i 5 minutter, sentrifuger ved 2000 rpm i 3 minutter. Fjern overskuddsvæske.
● Tilsett 1 ml restriksjonsvaskebuffer, roter ved 4 ̊C i 5 minutter, sentrifuger ved 2000 rpm i 3 minutter. Fjern overskuddsvæske.
● Mål perlene og mengdene restriksjonsbuffer som er igjen, tilsett
o Restriksjonsbuffer 1X
o Restriksjonsenzym 30-60 enheter
o Vann variabelt for 100 µl reaksjon
● Spalt DNA ved inkubering ved 37 ̊C over natten.
● Inkuber ved 65 ̊C i 10 minutter for å stanse restriksjonsspalting.
● Tilsett > 200 µg/ml RNase A til bufferen.
● Inkuber ved 37 ̊C i 30 minutter.
● Tilsett 400 µl MillliQ vann og fortynn restriksjonsreaksjonen.
● Tilsett:
o Ligeringsbuffer 1X
o T4 DNA ligase 30 enheter
o Vann variabelt for 100 µl reaksjon
● Inkuber ved 16 ̊C i 4 timer.
● Inkuber ved 65 ̊C over natten for å reversere kryssbindinger.
● Tilsett 450 µg Proteinase K til hver prøve.
● Inkuber ved 42 ̊C i 1 time for å spalte proteiner.
● Tilsett 660 µl fenol, pH 7,9 (lik volum) til hver prøve og virvle.
● Sentrifuger ved 13.000 rpm i 10 minutter.
● Overfør overskuddsvæsken til 1,5 ml eppendorf.
● Tilsett 0,3M NaCl og 0,5 µg glykogen.
● Bland godt og tilsett 1 ml iskald etanol.
● Utfell DNA ved -80 ̊C i 1 time.
● Sentrifuger ved 14.000 rpm i 20 minutter ved 4 ̊C.
● Resuspender DNA-pelletten i 10 µl RNasefritt vann.
● Sett opp en Takaka PCR-reaksjon for hver prøve.
● PCR buffer 1X
● dNTP 200 µM av hver NTP
● DNA 1 µl
● Forover primer 0,5 µM
● Bakover primer 0,5 µM
● TakaRa LA Taq 2,5 enheter
● Vann Variabel for 50 µl reaksjon
● Kjør prøvene i en 2 % agarosegel.
Tabell 1
<?xml version="1.0"?>
- <model>
<unity weight="-0.10936629789322752" />
<unity weight="-9.14545921645492" />
- <constraint weight="9.722125061947459" nolog="false">
- <positioned pos="8" max="true">
<gaussianDistribution width="0.7303045966167145" offset="0" />
- <weightmatrix reverse="0.0" normalizeByMaximum="false" alphabet="DNA" columns="19">
- <column pos="0">
<weight symbol="guanine" weight="0.19891304347826086" /> <weight symbol="cytosine" weight="0.32065217391304346" /> <weight symbol="adenine" weight="0.14673913043478262" /> <weight symbol="thymine" weight="0.33369565217391306" /> </column>
- <column pos="1">
<weight symbol="guanine" weight="0.2076086956521739" /> <weight symbol="cytosine" weight="0.23804347826086958" /> <weight symbol="adenine" weight="0.1641304347826087" /> <weight symbol="thymine" weight="0.39021739130434785" /> </column>
- <column pos="2">
<weight symbol="guanine" weight="0.22934782608695653" /> <weight symbol="cytosine" weight="0.2423913043478261" /> <weight symbol="adenine" weight="0.1858695652173913" /> <weight symbol="thymine" weight="0.3423913043478261" /> </column>
- <column pos="3">
<weight symbol="guanine" weight="0.23369565217391305" /> <weight symbol="cytosine" weight="0.29456521739130437" /> <weight symbol="adenine" weight="0.12065217391304348" /> <weight symbol="thymine" weight="0.35108695652173916" /> </column>
- <column pos="4">
<weight symbol="guanine" weight="0.22065217391304348" /> <weight symbol="cytosine" weight="0.22065217391304348" /> <weight symbol="adenine" weight="0.14673913043478262" /> <weight symbol="thymine" weight="0.41195652173913044" /> </column>
- <column pos="5">
<weight symbol="guanine" weight="0.2554347826086957" /> <weight symbol="cytosine" weight="0.22934782608695653" /> <weight symbol="adenine" weight="0.16847826086956522" /> <weight symbol="thymine" weight="0.3467391304347826" /> </column>
- <column pos="6">
<weight symbol="guanine" weight="0.22934782608695653" /> <weight symbol="cytosine" weight="0.21630434782608696" /> <weight symbol="adenine" weight="0.17282608695652174" /> <weight symbol="thymine" weight="0.3815217391304348" /> </column>
- <column pos="7">
<weight symbol="guanine" weight="0.2597826086956522" /> <weight symbol="cytosine" weight="0.22934782608695653" /> <weight symbol="adenine" weight="0.14673913043478262" /> <weight symbol="thymine" weight="0.3641304347826087" /> </column>
- <column pos="8">
<weight symbol="guanine" weight="0.2076086956521739" /> <weight symbol="cytosine" weight="0.20326086956521738" /> <weight symbol="adenine" weight="0.1858695652173913" /> <weight symbol="thymine" weight="0.4032608695652174" /> </column>
- <column pos="9">
<weight symbol="guanine" weight="0.19021739130434784" /> <weight symbol="cytosine" weight="0.225" />
<weight symbol="adenine" weight="0.1815217391304348" /> <weight symbol="thymine" weight="0.4032608695652174" /> </column>
- <column pos="10">
<weight symbol="guanine" weight="0.29456521739130437" /> <weight symbol="cytosine" weight="0.20326086956521738" /> <weight symbol="adenine" weight="0.15543478260869564" /> <weight symbol="thymine" weight="0.3467391304347826" /> </column>
- <column pos="11">
<weight symbol="guanine" weight="0.2510869565217391" /> <weight symbol="cytosine" weight="0.19456521739130436" /> <weight symbol="adenine" weight="0.15108695652173912" /> <weight symbol="thymine" weight="0.4032608695652174" /> </column>
- <column pos="12">
<weight symbol="guanine" weight="0.2467391304347826" /> <weight symbol="cytosine" weight="0.225" />
<weight symbol="adenine" weight="0.14673913043478262" /> <weight symbol="thymine" weight="0.3815217391304348" /> </column>
- <column pos="13">
<weight symbol="guanine" weight="0.2728260869565217" /> <weight symbol="cytosine" weight="0.15978260869565217" /> <weight symbol="adenine" weight="0.225" />
<weight symbol="thymine" weight="0.3423913043478261" /> </column>
- <column pos="14">
<weight symbol="guanine" weight="0.2858695652173913" /> <weight symbol="cytosine" weight="0.19456521739130436" /> <weight symbol="adenine" weight="0.1858695652173913" /> <weight symbol="thymine" weight="0.33369565217391306" /> </column>
- <column pos="15">
<weight symbol="guanine" weight="0.2597826086956522" /> <weight symbol="cytosine" weight="0.1858695652173913" /> <weight symbol="adenine" weight="0.15978260869565217" /> <weight symbol="thymine" weight="0.39456521739130435" /> </column>
- <column pos="16">
<weight symbol="guanine" weight="0.3641304347826087" /> <weight symbol="cytosine" weight="0.19021739130434784" /> <weight symbol="adenine" weight="0.19021739130434784" /> <weight symbol="thymine" weight="0.2554347826086957" /> </column>
- <column pos="17">
<weight symbol="guanine" weight="0.2684782608695652" /> <weight symbol="cytosine" weight="0.27717391304347827" /> <weight symbol="adenine" weight="0.20326086956521738" /> <weight symbol="thymine" weight="0.2510869565217391" /> </column>
- <column pos="18">
<weight symbol="guanine" weight="0.2554347826086957" /> <weight symbol="cytosine" weight="0.22934782608695653" /> <weight symbol="adenine" weight="0.15108695652173912" /> <weight symbol="thymine" weight="0.3641304347826087" /> </column>
</weightmatrix>
</positioned>
</constraint>
- <constraint weight="7.430703153194244" nolog="false">
- <positioned pos="-22" max="true">
<gaussianDistribution width="7.116598573800258" offset="0" />
- <weightmatrix reverse="0.0" normalizeByMaximum="false" alphabet="DNA" columns="5">
- <column pos="0">
<weight symbol="guanine" weight="0.1261574074074074" /> <weight symbol="cytosine" weight="0.12152777777777778" /> <weight symbol="adenine" weight="0.5520833333333333" /> <weight symbol="thymine" weight="0.20023148148148148" /> </column>
- <column pos="1">
<weight symbol="guanine" weight="0.18171296296296297" /> <weight symbol="cytosine" weight="0.1863425925925926" /> <weight symbol="adenine" weight="0.35300925925925924" /> <weight symbol="thymine" weight="0.2789351851851852" /> </column>
- <column pos="2">
<weight symbol="guanine" weight="0.18171296296296297" /> <weight symbol="cytosine" weight="0.14004629629629628" /> <weight symbol="adenine" weight="0.20949074074074073" /> <weight symbol="thymine" weight="0.46875" />
</column>
- <column pos="3">
<weight symbol="guanine" weight="0.10763888888888888" /> <weight symbol="cytosine" weight="0.09375" />
<weight symbol="adenine" weight="0.5983796296296297" /> <weight symbol="thymine" weight="0.20023148148148148" /> </column>
- <column pos="4">
<weight symbol="guanine" weight="0.16782407407407407" /> <weight symbol="cytosine" weight="0.1863425925925926" /> <weight symbol="adenine" weight="0.5335648148148148" /> <weight symbol="thymine" weight="0.11226851851851852" /> </column>
</weightmatrix>
</positioned>
</constraint>
- <constraint weight="20.800433402457763" nolog="false">
- <positioned pos="309" max="false">
<gaussianDistribution width="123.21919574445802" offset="0" />
- <weightmatrix reverse="0.0" normalizeByMaximum="false" alphabet="DNA" columns="4">
- <column pos="0">
<weight symbol="guanine" weight="0.5205858504341704" /> <weight symbol="cytosine" weight="0.1598047165219432" /> <weight symbol="adenine" weight="0.1598047165219432" /> <weight symbol="thymine" weight="0.1598047165219432" /> </column>
- <column pos="1">
<weight symbol="guanine" weight="0.1525271710220418" /> <weight symbol="cytosine" weight="0.1525271710220418" /> <weight symbol="adenine" weight="0.5424184869338746" /> <weight symbol="thymine" weight="0.1525271710220418" /> </column>
- <column pos="2">
<weight symbol="guanine" weight="0.5571014456775343" /> <weight symbol="cytosine" weight="0.14763285144082192" /> <weight symbol="adenine" weight="0.14763285144082192" /> <weight symbol="thymine" weight="0.14763285144082192" /> </column>
- <column pos="3">
<weight symbol="guanine" weight="0.1410134350947342" /> <weight symbol="cytosine" weight="0.5769596947157973" /> <weight symbol="adenine" weight="0.1410134350947342" /> <weight symbol="thymine" weight="0.1410134350947342" /> </column>
</weightmatrix>
</positioned>
</constraint>
- <constraint weight="13.776783968061828" nolog="false">
- <positioned pos="-29" max="true">
<gaussianDistribution width="17.24379973438928" offset="0" />
- <weightmatrix reverse="0.0" normalizeByMaximum="false" alphabet="DNA" columns="6">
- <column pos="0">
<weight symbol="guanine" weight="0.17708333333333331" /> <weight symbol="cytosine" weight="0.21875" />
<weight symbol="adenine" weight="0.4270833333333333" /> <weight symbol="thymine" weight="0.17708333333333331" /> </column>
- <column pos="1">
<weight symbol="guanine" weight="0.22337962962962962" /> <weight symbol="cytosine" weight="0.14467592592592593" /> <weight symbol="adenine" weight="0.3761574074074074" /> <weight symbol="thymine" weight="0.25578703703703703" /> </column>
- <column pos="2">
<weight symbol="guanine" weight="0.19560185185185183" /> <weight symbol="cytosine" weight="0.13541666666666666" /> <weight symbol="adenine" weight="0.14004629629629628" /> <weight symbol="thymine" weight="0.5289351851851851" /> </column>
- <column pos="3">
<weight symbol="guanine" weight="0.15393518518518517" /> <weight symbol="cytosine" weight="0.16782407407407407" /> <weight symbol="adenine" weight="0.505787037037037" /> <weight symbol="thymine" weight="0.1724537037037037" /> </column>
- <column pos="4">
<weight symbol="guanine" weight="0.24652777777777776" /> <weight symbol="cytosine" weight="0.16782407407407407" /> <weight symbol="adenine" weight="0.42245370370370366" /> <weight symbol="thymine" weight="0.16319444444444445" /> </column>
- <column pos="5">
<weight symbol="guanine" weight="0.13541666666666666" /> <weight symbol="cytosine" weight="0.19560185185185183" /> <weight symbol="adenine" weight="0.5567129629629629" /> <weight symbol="thymine" weight="0.11226851851851852" /> </column>
</weightmatrix
</positioned>
</constraint>
</model>
Claims (7)
1. Fremgangsmåte for diagnose av kreft ved påvisning av en abnormal genekspresjon i et individ, omfattende å bestemme, i en prøve fra individet, tilstedeværelse av en abnormal kromosomstruktur som er
k a r a k t e r i s e r t v e d
(i) tilstedeværelse av en ny posisjonering som ikke er til stede under normal ekspresjon eller
(ii) fravær av minst en posisjonering som er til stede under normal genekspresjon,
hvor nevnte posisjonering er av to separate områder av et gen, for derved å diagnostisere hvorvidt individet har kreft.
2. Fremgangsmåte ifølge krav 1, hvor nevnte kromosomstruktur er en løkke eller en topologisk lukket struktur.
3. Fremgangsmåte ifølge et hvilket som helst av de foregående krav, hvor to eller flere gener som er forbundet med kreft, analyseres for å tillate diagnose av typen av kreft og/eller minst et av genene som analyseres, er et vevsspesifikt gen som tillater vevet hvor den abnormale ekspresjon inntreffer, å bli identifisert.
4. Fremgangsmåte ifølge et hvilket som helst av de foregående krav, omfattende å påvise kromosom-konformasjon ved å bestemme hvorvidt sekvenser i genet har blitt brakt i samposisjonering ved assosiasjonen av CC-markører i genet og/eller hvor samposisjoneringen påvises ved:
- å kryssbinde samposisjonert DNA fulgt av
- påvisning av det kryssbundne DNA, eventuelt ved hjelp av en sekvensbasert påvisningsmetode,
hvor nevnte CC-markører er 5 til 30 nukleotider lange.
5. Fremgangsmåte ifølge krav 4, hvor, etter kryssbindingen av DNA,
- det kryss-bundne DNA underkastes restriksjonsspalting,
- den spaltede struktur underkastes ligering og
- den ligerte struktur analysers/påvises.
6. Fremgangsmåte ifølge krav 5, hvor analyse av den ligerte struktur omfatter påvisning av en DNA-sekvens som er til stede i den ligerte struktur og som ikke er til stede i genet.
7. Fremgangsmåte ifølge krav 6, hvor DNA-sekvensen som er til stede i ligandstrukturen, påvises ved sekvensering eller ved PCR, hvor eventuelt tilstedeværelsen av ligand-sekvensen påvises ved å bruke en PCR-reaksjon hvor primerne lykkes i å danne et PCR-produkt ved å bruke den ligerte sekvens som et templat, men som ikke amplifikerer gensekvensen under de samme PCR-betingelser.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB0603251.0A GB0603251D0 (en) | 2006-02-17 | 2006-02-17 | DNA conformation |
PCT/GB2007/000564 WO2007093819A2 (en) | 2006-02-17 | 2007-02-19 | Dna conformation (loop structures) in normal and abnormal gene expression |
Publications (2)
Publication Number | Publication Date |
---|---|
NO20083957L NO20083957L (no) | 2008-11-14 |
NO343718B1 true NO343718B1 (no) | 2019-05-20 |
Family
ID=36142050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NO20083957A NO343718B1 (no) | 2006-02-17 | 2008-09-17 | Fremgangsmåte for diagnose av kreft ved påvisning av tilstedeværelse av en abnormal kromosomstruktur |
Country Status (16)
Country | Link |
---|---|
US (2) | US9777327B2 (no) |
EP (1) | EP1991697B1 (no) |
JP (1) | JP5345857B2 (no) |
CN (1) | CN101384734B (no) |
AT (1) | ATE519864T1 (no) |
AU (1) | AU2007216315B2 (no) |
CA (1) | CA2642331C (no) |
DK (1) | DK1991697T3 (no) |
ES (1) | ES2368767T3 (no) |
GB (1) | GB0603251D0 (no) |
HK (1) | HK1125416A1 (no) |
MY (1) | MY182608A (no) |
NO (1) | NO343718B1 (no) |
NZ (1) | NZ571201A (no) |
WO (1) | WO2007093819A2 (no) |
ZA (1) | ZA200807948B (no) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0603251D0 (en) | 2006-02-17 | 2006-03-29 | Isis Innovation | DNA conformation |
WO2009092381A1 (en) | 2008-01-23 | 2009-07-30 | Herlev Hospital, Region Hovedstaden | Ykl-40 as a general marker for non-specific disease |
GB0810051D0 (en) * | 2008-06-02 | 2008-07-09 | Oxford Biodynamics Ltd | Method of diagnosis |
WO2010028658A1 (en) | 2008-09-15 | 2010-03-18 | Herlev Hospital, Region Hovedstaden | Ykl-40 as a marker for gastrointestinal cancers |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9567631B2 (en) | 2012-12-14 | 2017-02-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10273541B2 (en) | 2012-08-14 | 2019-04-30 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10584381B2 (en) | 2012-08-14 | 2020-03-10 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CA2881685C (en) | 2012-08-14 | 2023-12-05 | 10X Genomics, Inc. | Microcapsule compositions and methods |
US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9411930B2 (en) * | 2013-02-01 | 2016-08-09 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
CA2900543C (en) | 2013-02-08 | 2023-01-31 | 10X Genomics, Inc. | Partitioning and processing of analytes and other species |
EP4321628A3 (en) | 2013-05-23 | 2024-04-24 | The Board of Trustees of the Leland Stanford Junior University | Transposition into native chromatin for personal epigenomics |
CN106413896B (zh) | 2014-04-10 | 2019-07-05 | 10X基因组学有限公司 | 用于封装和分割试剂的流体装置、系统和方法及其应用 |
JP6838969B2 (ja) | 2014-06-26 | 2021-03-03 | 10エックス ジェノミクス, インコーポレイテッド | 個々の細胞または細胞集団由来の核酸の分析方法 |
US10526641B2 (en) | 2014-08-01 | 2020-01-07 | Dovetail Genomics, Llc | Tagging nucleic acids for sequence assembly |
US20160122817A1 (en) | 2014-10-29 | 2016-05-05 | 10X Genomics, Inc. | Methods and compositions for targeted nucleic acid sequencing |
US9975122B2 (en) | 2014-11-05 | 2018-05-22 | 10X Genomics, Inc. | Instrument systems for integrated sample processing |
CN112126675B (zh) | 2015-01-12 | 2022-09-09 | 10X基因组学有限公司 | 用于制备核酸测序文库的方法和系统以及用其制备的文库 |
WO2016134034A1 (en) | 2015-02-17 | 2016-08-25 | Dovetail Genomics Llc | Nucleic acid sequence assembly |
KR20170119710A (ko) | 2015-02-24 | 2017-10-27 | 10엑스 제노믹스, 인크. | 표적화된 핵산 서열 커버리지 방법 |
EP4286516A3 (en) | 2015-02-24 | 2024-03-06 | 10X Genomics, Inc. | Partition processing methods and systems |
US11807896B2 (en) | 2015-03-26 | 2023-11-07 | Dovetail Genomics, Llc | Physical linkage preservation in DNA storage |
WO2016207647A1 (en) | 2015-06-24 | 2016-12-29 | Oxford Biodynamics Limited | Epigenetic chromosome interactions |
SG11201803289VA (en) | 2015-10-19 | 2018-05-30 | Dovetail Genomics Llc | Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection |
SG11201804086VA (en) | 2015-12-04 | 2018-06-28 | 10X Genomics Inc | Methods and compositions for nucleic acid analysis |
KR20180116377A (ko) | 2016-02-23 | 2018-10-24 | 더브테일 제노믹스 엘엘씨 | 게놈 어셈블리를 위한 페이징된 판독 세트의 생성 및 반수체형 페이징 |
GB201608000D0 (en) | 2016-05-06 | 2016-06-22 | Oxford Biodynamics Ltd | Chromosome detection |
EP3455356B1 (en) | 2016-05-13 | 2021-08-04 | Dovetail Genomics LLC | Recovering long-range linkage information from preserved samples |
WO2017197338A1 (en) | 2016-05-13 | 2017-11-16 | 10X Genomics, Inc. | Microfluidic systems and methods of use |
AU2017367245B2 (en) | 2016-12-01 | 2020-09-24 | Oxford BioDynamics PLC | Application of epigenetic chromsomal interactions in cancer diagnostics |
US10011872B1 (en) | 2016-12-22 | 2018-07-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10550429B2 (en) | 2016-12-22 | 2020-02-04 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10815525B2 (en) | 2016-12-22 | 2020-10-27 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
JP7045086B2 (ja) * | 2016-12-23 | 2022-03-31 | オックスフォード バイオダイナミックス パブリック リミテッド カンパニー | 分類法 |
WO2018140966A1 (en) | 2017-01-30 | 2018-08-02 | 10X Genomics, Inc. | Methods and systems for droplet-based single cell barcoding |
EP4230746A3 (en) | 2017-05-26 | 2023-11-01 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
US10844372B2 (en) | 2017-05-26 | 2020-11-24 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
CN111511930A (zh) | 2017-11-03 | 2020-08-07 | 牛津生物动力有限公司 | 通过染色体相互作用遗传调节免疫响应 |
SG11201913654QA (en) | 2017-11-15 | 2020-01-30 | 10X Genomics Inc | Functionalized gel beads |
US10829815B2 (en) | 2017-11-17 | 2020-11-10 | 10X Genomics, Inc. | Methods and systems for associating physical and genetic properties of biological particles |
CN112262218A (zh) | 2018-04-06 | 2021-01-22 | 10X基因组学有限公司 | 用于单细胞处理中的质量控制的系统和方法 |
JP2022523564A (ja) | 2019-03-04 | 2022-04-25 | アイオーカレンツ, インコーポレイテッド | 機械学習を使用するデータ圧縮および通信 |
JP2023502944A (ja) * | 2019-11-15 | 2023-01-26 | フェーズ ジェノミクス インコーポレイテッド | 組織試料からの染色体立体構造捕捉 |
CN114550817B (zh) * | 2022-01-25 | 2022-12-23 | 云南大学 | 基于多特征的ctcf介导染色质环预测方法 |
CN114841294B (zh) * | 2022-07-04 | 2022-10-28 | 杭州德适生物科技有限公司 | 一种检测染色体结构异常的分类器模型训练方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002044719A1 (en) | 2000-11-29 | 2002-06-06 | Statens Serum Institut | A screening assay for detecting chromosome rearrangements or recombinations |
CN1231596C (zh) * | 2001-12-27 | 2005-12-14 | 赵兴波 | 利用线粒体dna指纹进行动物遗传信息鉴定的方法 |
CN1515692A (zh) * | 2003-01-02 | 2004-07-28 | 缪金明 | “锚定点灯”式寡核苷酸芯片的检测技术 |
EP2295604B1 (en) | 2004-02-09 | 2015-04-08 | Thomas Jefferson University | Diagnosis and treatment of cancers with microRNA located in or near cancer-associated chromosomal features |
US20060015264A1 (en) | 2004-06-02 | 2006-01-19 | Mcshea Andrew | Interfering stem-loop sequences and method for identifying |
DK1899488T3 (en) | 2005-07-04 | 2015-12-21 | Univ Erasmus Medical Ct | CHROMOSOM CONFORMATIONS "CAPTURE-ON-CHIP" (4C) -ASSAY |
GB0603251D0 (en) | 2006-02-17 | 2006-03-29 | Isis Innovation | DNA conformation |
-
2006
- 2006-02-17 GB GBGB0603251.0A patent/GB0603251D0/en not_active Ceased
-
2007
- 2007-02-19 EP EP07712741A patent/EP1991697B1/en active Active
- 2007-02-19 AT AT07712741T patent/ATE519864T1/de not_active IP Right Cessation
- 2007-02-19 NZ NZ571201A patent/NZ571201A/en unknown
- 2007-02-19 WO PCT/GB2007/000564 patent/WO2007093819A2/en active Application Filing
- 2007-02-19 CN CN2007800057991A patent/CN101384734B/zh active Active
- 2007-02-19 US US12/279,133 patent/US9777327B2/en active Active
- 2007-02-19 AU AU2007216315A patent/AU2007216315B2/en active Active
- 2007-02-19 CA CA2642331A patent/CA2642331C/en active Active
- 2007-02-19 ES ES07712741T patent/ES2368767T3/es active Active
- 2007-02-19 DK DK07712741.3T patent/DK1991697T3/da active
- 2007-02-19 ZA ZA200807948A patent/ZA200807948B/xx unknown
- 2007-02-19 MY MYPI20083134A patent/MY182608A/en unknown
- 2007-02-19 JP JP2008554852A patent/JP5345857B2/ja active Active
-
2008
- 2008-09-17 NO NO20083957A patent/NO343718B1/no unknown
-
2009
- 2009-05-07 HK HK09104232.1A patent/HK1125416A1/xx unknown
-
2017
- 2017-08-22 US US15/683,504 patent/US11384396B2/en active Active
Non-Patent Citations (3)
Title |
---|
GALANDE S., Chromatin (dis)organization and cancer; BUR-binding proteins as biomarkers for cancer, 2002, Current Cancer Drug Targets, vol. 2, side 157-190, Dated: 01.01.0001 * |
PARNELL T.J. ET AL., An indogenous suppressor of Hairy-wing insulator separetes regulatory domains in Drosophila, November 2003, Proceedings of the National Academy of Sciences, USA, vol. 100, nr. 23, side 13436-13441, ISSN: 0027-8424, Dated: 01.01.0001 * |
RAMADRASS A. ET AL., Regulation of the hDHFR gene transcription by the dynamic switch between quasi-stable gene loops, [Online] April 2005, side 1,Transcription UK Hentet fra internet 2007.06.18; http://www.biochemistry.org/meetings/abstracts/SA035/SA035P037.pdf, Dated: 01.01.0001 * |
Also Published As
Publication number | Publication date |
---|---|
CN101384734A (zh) | 2009-03-11 |
WO2007093819A2 (en) | 2007-08-23 |
HK1125416A1 (en) | 2009-08-07 |
ZA200807948B (en) | 2009-11-25 |
JP2009526543A (ja) | 2009-07-23 |
ATE519864T1 (de) | 2011-08-15 |
EP1991697A2 (en) | 2008-11-19 |
CA2642331A1 (en) | 2007-08-23 |
CN101384734B (zh) | 2013-10-30 |
ES2368767T3 (es) | 2011-11-22 |
GB0603251D0 (en) | 2006-03-29 |
WO2007093819A3 (en) | 2007-10-04 |
NZ571201A (en) | 2011-07-29 |
DK1991697T3 (da) | 2011-09-19 |
EP1991697B1 (en) | 2011-08-10 |
NO20083957L (no) | 2008-11-14 |
US9777327B2 (en) | 2017-10-03 |
JP5345857B2 (ja) | 2013-11-20 |
US20180080081A1 (en) | 2018-03-22 |
US11384396B2 (en) | 2022-07-12 |
US20090186352A1 (en) | 2009-07-23 |
CA2642331C (en) | 2018-06-19 |
AU2007216315B2 (en) | 2012-10-04 |
MY182608A (en) | 2021-01-26 |
AU2007216315A1 (en) | 2007-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NO343718B1 (no) | Fremgangsmåte for diagnose av kreft ved påvisning av tilstedeværelse av en abnormal kromosomstruktur | |
Arruabarrena-Aristorena et al. | FOXA1 mutations reveal distinct chromatin profiles and influence therapeutic response in breast cancer | |
Jing et al. | Tazarotene-induced gene 1 (TIG1) expression in prostate carcinomas and its relationship to tumorigenicity | |
Kim et al. | A neuronal piRNA pathway inhibits axon regeneration in C. elegans | |
Inaki et al. | Transcriptional consequences of genomic structural aberrations in breast cancer | |
Han et al. | A fluorescence in situ hybridization screen for E26 transformation–specific aberrations: identification of DDX5-ETV4 fusion protein in prostate cancer | |
Michalak et al. | Genome-wide patterns of expression in Drosophila pure species and hybrid males | |
Rienzo et al. | Integrator complex and transcription regulation: Recent findings and pathophysiology | |
Zhou et al. | Somatic mutations of GNA11 and GNAQ in CTNNB1-mutant aldosterone-producing adenomas presenting in puberty, pregnancy or menopause | |
Cumbo et al. | Monitoring of minimal residual disease (MRD) in chronic myeloid leukemia: recent advances | |
CN111183233A (zh) | 使用靶基因表达的数学建模评估Notch细胞信号传导途径活性 | |
US10815477B2 (en) | Methods and systems for identifying patient specific driver mutations | |
WO2011043220A1 (ja) | 融合遺伝子の測定方法 | |
Rumpler et al. | Identification of differentially expressed genes in models of melanoma progression by cDNA array analysis: SPARC, MIF and a novel cathepsin protease characterize aggressive phenotypes | |
Rieger et al. | CLIP and massively parallel functional analysis of CELF6 reveal a role in destabilizing synaptic gene mRNAs through interaction with 3′ UTR elements | |
Thu Tran et al. | Molecular characterization of an X (p21. 2; q28) chromosomal inversion in a Duchenne muscular dystrophy patient with mental retardation reveals a novel long non-coding gene on Xq28 | |
Roh et al. | Gene expression profiling of breast cancers with emphasis of β-catenin regulation | |
EP3475448B1 (en) | Method and kit for detecting fusion transcripts | |
CN104212884B (zh) | 胰腺神经内分泌肿瘤易感基因位点及检测方法和试剂盒 | |
Saghizadeh et al. | ZBED4, a BED-type zinc-finger protein in the cones of the human retina | |
JP2017135985A (ja) | B前駆細胞性急性リンパ芽球性白血病新規キメラ遺伝子 | |
Quayle | Identification and characterization of genes associated with the hormonal progression of prostate cancer | |
WO2001048191A1 (fr) | Technique de detection d'un agent perturbateur de differentiation sexuelle |