CN101384734B - 正常和异常基因表达中的dna构象(环结构) - Google Patents

正常和异常基因表达中的dna构象(环结构) Download PDF

Info

Publication number
CN101384734B
CN101384734B CN2007800057991A CN200780005799A CN101384734B CN 101384734 B CN101384734 B CN 101384734B CN 2007800057991 A CN2007800057991 A CN 2007800057991A CN 200780005799 A CN200780005799 A CN 200780005799A CN 101384734 B CN101384734 B CN 101384734B
Authority
CN
China
Prior art keywords
weight
sequence
gene
dna
comprised
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007800057991A
Other languages
English (en)
Other versions
CN101384734A (zh
Inventor
亚历山大·阿库里特切夫
阿鲁尔·萨尔瓦姆·拉马达斯
利奥尼德·勒尼多维奇·尼基坚科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Oxford Innovation Co., Ltd.
Original Assignee
Oxford University Innovation Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford University Innovation Ltd filed Critical Oxford University Innovation Ltd
Publication of CN101384734A publication Critical patent/CN101384734A/zh
Application granted granted Critical
Publication of CN101384734B publication Critical patent/CN101384734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • General Chemical & Material Sciences (AREA)

Abstract

本发明涉及个体中异常基因表达的检测或诊断方法,所述方法包括确定来自所述个体的样品中是否存在其中所述基因的两个分开区域已被使得紧密邻近的染色体结构,从而检测或诊断所述个体是否具有异常的基因表达。

Description

正常和异常基因表达中的DNA构象(环结构)
技术领域
本发明涉及诊断和基因表达。
背景技术
因为不能获得用于疾病的可靠诊断或确诊疾病阶段的合适标记,所以已有的疾病诊断方法通常不能令人满意。目前的途径包括使用蛋白质、mRNA或抗体检测。
发明内容
蛋白质、mRNA或抗体检测在许多诊断情况下并不合适,这是因为对这些分子的检测并不能真正代表与疾病相关联的基因的表达。这些分子在单个细胞间的表达水平的随机变化是相当高的,同时半衰期变化显著并可能非常低,例如对于c-myc原癌基因多肽为15分钟左右。此外,对这些分子的检测仅在基因表达顺序-转录和翻译的后序阶段之后。
用于转录和表达的潜在重启循环的基因的外遗传构象设置提供了在基因表达的非常早期的诊断潜力。这些构象结构也似乎是稳定的,即具有长的半衰期,使得它们容易被检测到。
本发明人已发现,分析基因组DNA中的染色体构象可用于疾病诊断。所述构象由基因中远离的或不相邻的位点的联合(association)或并置(juxtaposition)而形成。所述位点可以是CC标记(以下将进一步讨论)。已发现不同基因的染色体构象的变化导致由所述基因的表达的变化,并因此检测所述特殊的构象可用于检测基因的异常表达。
因此,本发明提供了个体中异常基因表达的检测或诊断方法,所述方法包括确定在来自所述个体的样品中是否存在其中两个分开的基因区域已被使得处于紧密临近的染色体结构,从而检测或诊断所述个体是否具有异常的基因表达。
附图说明
图1显示了利用模式识别算法鉴别用于RNAPII转录单元的标记。(A)训练和测试所述标记模型的图示。对422个有注释的人类基因进行取样、测试和反馈103循环直至演化出收敛模型(convergent model)。在所述基因的3′,共有序列包括以前未知的多重模式的信号:查理检验点(Checkpoint Charlie),以及完全明确的poly(A)信号和富含U的共有位点。(B)在人类β-球蛋白基因的3′端,所述CC标记(用高斯分布进行标记)存在于所述富含U位点的下游并且对应于先前描述的CoTC位点。所述图显示出在所述CC/CoTC位点能量值相对于其相邻序列下降(以灰色突出表示)。(C)在黑腹果蝇(D.melanogaster)的染色体X上,所述CC标记(高斯分布)与7B2带内的吉卜赛隔离子相一致。CC预测的密度与Su(Hw)结合位点相关。较早的研究显示在染色体带7B2和7B8中的吉卜赛元件与围绕cut座位的环的形成并置。
图2显示了所述模型基因的受控表达。(A)hDHFR基因的转录以细胞周期依赖性方式在主要和次要启动子上受调控。在静止期细胞中,由上游次要启动子引发短转录本。在实验中使用U2OS细胞的荧光激活细胞分选(FACS),在10%FCS(1)的存在下生长,在0.5%FCS的存在下进行接触抑制。在每个条件下的G0、G2/M、S和G1细胞的百分比显示在所述图中。与较早的报道相一致,Northern印迹确认了与静止期细胞(道4)相比,DHFR mRNA在增殖期细胞中的累积(道3)。在增殖期(道5)和静止期(道6)细胞中由次要启动子引发的转录本的实时RT-PCR分析。显示的数值由三次独立的实验计算而得。(B)仅在内皮细胞(HMVEC,道1)中,而不在非内皮细胞(HEK293T,道2)中产生全长hCALCRL转录本。通过由第一外显子的3′RACE的检测可知在两种细胞类型中均存在短的非编码转录本(道3,内皮细胞;和道4,非内皮细胞)。免疫化学法确认受体表达在体内限为内皮细胞(黑色箭头),而不是上皮细胞或基质细胞(白色箭头)。
图3显示所述CC标记的终止特性。(A)人DHFR基因包含三个CC标记(实心三角)。如图中所描述,通过RT-PCR分析所述标记的转录终止特性。反向引物(B、C)在所测试的CC标记的位置之前或之后。在静止期细胞中分析CCDHFR-2的RT-PCR,原因在于CCDHFR-2仅在这些条件下显示出受控终止特性。采用Zuker算法计算的折叠自由能的概图显示对于所有三个CC标记均有数值上的下降(以灰色突出显示)。(B)人CALCRL基因结构包括三个CC标记(实心三角)。在hCALCRL中的CC标记(CCCALCRL-1、CCCALCRL-2和CCCALCRL-3)也显示出转录的潜在终止。由第一外显子的5′RACE确认所有转录本开始于CCCALCRL-1的下游,任何潜在的基因间转录本都被成功地终止。在CCCALCRL-2和CCCALCRL-3终止转录的证据由3′RACE所证实。RACE转录本的登录号提供于括号内。在下面部分,所述图显示出每个hCALCRL CC标记的折叠自由能下降(以灰色突出显示)。
图4显示CC标记的染色体构象特性。(A)在增殖期和静止期条件下,对所述hDHFR基因上的CC位点进行集成3C测定。对照表明所述测定对交联、限制、连接、PCR和RNAPII通过免疫沉淀的富集的完全依赖。在增殖期细胞中,在所述hDHFR基因内,CCDHFR-1和CCDHFR-3(道1+3)位点之间检测到空间邻近,但在CCDHFR-1和CCDHFR-2(道1+2)位点之间未检测到空间邻近。在静止期细胞中,CCDHFR-1和CCDHFR-2(道1+2)位点之间也检测到空间邻近。在测试条件下由3C测定检测到的可能构象的示意性描述。(B)在内皮细胞系和非内皮细胞系中所述hCALCRL基因上的CC位点进行集成3C测定。对照表明所述测定对交联、限制、连接、PCR和RNAPII通过免疫沉淀的富集的完全依赖。在内皮细胞中,在CCCALCRL-1、CCCALCRL-2和CCCALCRL-3之间检测到相互作用,表明所有标记并置的构象(道1+2和1+3,参见图)。在非内皮细胞中,仅可检测到CCCALCRL-1和CCCALCRL-2(道1+2,参见图)之间的相互作用,CCCALCRL-1和CCCALCRL-3之间的相互作用为内皮细胞中全长制造性转录所独有的。
图5显示了在其他生物体中的查理检验点预测。在422个人类基因上训练的模型鉴别出在其他物种中的CC标记(红色三角形)。注意到在RGF3的情况下,单个CC标记隔开两个有注释的基因,对一个基因而言为3′标记,而对另一个基因而言为5′标记。外显子和内显子分别以绿色和灰色矩形表示。实线表示基因间序列。
图6显示了使用所述3C测定进行染色体构象检测的原理。
图7显示了c-myc的分型以诊断肾癌。CC标记1和2位于P0启动子附近。CC1-CC2的并置导致形成封闭的结构,所述结构将P0分隔开并防止出现由P0起始而不是从P1,2起始。对组织样品的CC1-CC2构象并置的分析显示出特殊PCR产物的存在,确认肾脏肿瘤患者上存在构象(T1-3),而在正常组织(N1-3)中不存在。对所有样品进行独立测试,以测试无关基因:降钙素受体样受体(CRLR)上的稳定构象的存在。该构象在所有组织中存在并作为所述测定的内参(标记为对照)。
图8显示具有mlh1的卵巢癌的染色体构象概图。
图9显示在前列腺细胞系中的构象解除调节。
具体实施方式
本发明提供了根据确定基因已采用的三维高级结构,尤其是根据所述基因内联合的/并置的位点的位置/模式来检测基因异常表达的方法。所述方法可检测在基因中的一个或多个位置上并置位点的存在或缺失,或者由所述并置导致的染色体构象。基因表达的正常形式通常定义为产物(RNA或多肽)以使所述产物能执行其细胞/生理功能的形式和/或量进行表达。
异常表达可定义为以下表达模式,其中形成不同的产物(通常由于转录终止位置的变化)和/或产物量以改变的水平进行表达(或者甚至完全不表达)。异常表达可导致生物体的病态(例如此处提到的任何疾病),并通常导致其中发生所述异常表达的细胞或组织或器官的生存力和/或机能的损害。异常表达的特征通常为:与正常产物相比RNA或蛋白质表达的长度增长或缩短和/或与正常表达水平相比RNA或蛋白质的表达水平提高或降低。
在一个优选的实施方式中,由正常表达变为异常表达源自于如CC标记所定义的染色体结构中的变化。CC标记的结构性并置通常界定了转录单元的边界,并且异常表达通常将异常(不同的)边界过分施加(over-impose)于在正常表达中观察到的边界。
本发明提供了个体中疾病状况的诊断或疾病阶段的诊断。所述疾病通常为其中发生一个或多个基因的异常表达的疾病。所述异常表达可导致所述疾病或对所述疾病起作用。所述基因可以是表达了功能性多肽或未被翻译的RNA的基因(诸如非编码RNA基因和假基因)。所述基因可以表达具有调控作用的RNA。
所述基因优选为原癌基因(诸如c-myc)或肿瘤抑制基因(诸如BRCA1)。所述基因可以是列在表2中的任何基因。所述基因可以是hDHFR、hCALCRL、MLH1、PSA或BORIS(例如在GenBank登录号NM000791、NM005795、NM000249、NM001030047或NM080618中所公开的)。所述基因通常具有2、3、4或多个CC标记序列。所述基因可在启动子近侧内含子,通常在第一内含子中包括CC标记。
所述疾病可以是癌症,诸如肾癌、卵巢癌、膀胱癌、结肠癌或前列腺癌。所述疾病可以是遗传疾病,所述遗传疾病通常由改变的RNA或多肽产物的表达(如上所定义)所导致和/或由RNA或多肽产物的不同水平的表达(诸如该产物表达的缺失)所导致。
在一个实施方式中,尤其是在所述疾病为癌症的情况下,实施所述方法以确定疾病的阶段。可实施所述方法以确定癌症进程的风险。因此所述方法可用于预测肿瘤或疾病进程的速度或严重性。
对其进行诊断的个体
待诊断的个体可具有此处提到的任何病情的一种或多种症状和/或被怀疑具有任何所述病情。所述个体可能有患上任何所述病情的风险,诸如由于有所述疾病的家族史或者由于生活在导致所述疾病或者有助于疾病发展的环境之中。在人类癌症的情况下,所述个体可以超过40岁,诸如超过50岁,或者超过60岁。所述患者可具有吸烟史。
所述个体可以是在其基因组的至少一个基因中具有CC标记(其的联合定义了染色体结构)的个体。所述个体通常为真核生物,诸如低级或高级真核生物。所述个体可以是植物、酵母、昆虫、有袋动物、鸟或哺乳动物。所述个体优选为哺乳动物,诸如灵长类、人或啮齿类。
诊断
本发明提供了异常基因表达的诊断方法,并因此提供了特定病情的诊断方法。所述方法包括检测在所述个体的DNA中是否有异常染色体构象(例如或者直接通过实际染色体结构的检测或者间接地通过所述基因中的联合/并置的位点的检测)。如此的异常构象将通常包括在基因中的位点(例如在基因正常表达时通常没有观察到的地方)存在新的并置(或并置的组合)或者一个或多个并置(通常在正常表达中能观察到的)的缺失。如上所述,所述异常构象将导致所述基因表达具有不同序列和/或功能和/或量的RNA转录本,并且所述表达的差异将导致所述个体中的疾病或者对形成所述疾病起作用,所述疾病例如癌症。所述异常染色体构象可导致不同剪接变异体的表达。
任何合适的手段均可用于检测/检查所述被分析的DNA的染色体构象。通常所述检测将确定所述个体的DNA中至少一个类似环的结构的位置。在一个实施方式中,所述方法可包括确定是否存在CC标记的给定并置对,从而例如能使得推论出所观察到的构象不同于正常构象。
通常在体外对来自于所述个体的样品实施所述方法。所述样品可包括个体的DNA,所述DNA的状态为在自然状态下为相联合的基因组区域在样品中保持相联合(即保持所述外遗传染色体状态),例如对于距离少于5kb、3kb、1kb、500碱基对或200碱基对的相联合区域即如此。所述样品通常包括所述个体的细胞。所述样品通常包括来自待诊断的疾病中所牵涉到的组织的细胞。所述样品通常包括所述个体的体液,和可例如使用拭子诸如口腔拭子而获得。所述样品优选为血液样品或冷冻样品。所述样品可以是诸如肿瘤的活组织检查样品。可对来自个体的单细胞实施所述方法。
通常在实施所述方法前对样品进行处理,例如可进行DNA提取。所述样品中的DNA可物理地或化学地(例如使用合适的酶)切割。在一个实施方式中,RNA聚合酶II的特异性抗体用于将DNA与其他细胞组分分离。
可通过确定相联合的序列,例如形成类似环的结构的基础的序列来检测所述染色体构象。在一个优选的实施方式中,所述DNA在该检测前进行交联。所述交联通常包括形成共价连接键,并且通常通过与能导致交联的试剂相接触而形成。这样的试剂可以是醛诸如多聚甲醛,或D-生物素酰化-ε-氨基己酸-N-羟基琥珀酰亚胺酯或洋地黄毒苷-3-O-甲基羰基-ε-氨基己酸-N-羟基琥珀酰亚胺酯。多聚甲醛能交联相距4埃的DNA链。
在所述方法中,通过由于所述环的形成而使得处于紧密邻近的序列的确认可以确定所述并置的位点。这样的确认可通过任何合适的手段进行,在一个优选实施方式中可以使用PCR进行。
在一个实施方式中,采用染色体构象俘获测定,例如如同在Dekker等(2002)Science 295,1306中所述那样。在该测定中,DNA被交联(例如如上所述)。然后所述已交联的DNA通常通过限制性消化而被切割,和使所述被切割/消化的结构连接。连接将使由于切割/消化形成的DNA链末端变为连接在一起。因此,连接通常将导致包括具有所述并置位点的两条序列的新序列(该序列并不存在于原来基因中)。所述新序列的检测可用作所述构象检测的基础(即检测在特定位置的并置的存在)。
由连接形成的序列可通过任何合适的手段进行检测。通常,例如通过采用PCR在其序列的基础上对其进行检测。在一个实施方式中,采用了PCR检测反应,其中所使用的PCR引物结合在所述连接点的任一侧并在所述连接产物的存在下导致成功的PCR反应,但在不具有相关结构的基因的存在下进行时不会导致成功的PCR反应(通常是因为所述引物在所述基因序列上相互相距甚远并且所述引物的取向排除了选择其他产物(所述引物经选择为同一取向以防止异常产物))。在该实施方式中,仅在所述连接产物存在下检测到PCR产物(参见图1)。通常,在结合所述连接产物时,所述PCR引物在相互相距500个碱基对之内结合。
可通过序列特异性PCR或者通过直接测序来检测/分析所述连接序列。可使用基于凝胶的系统进行检测,其中,使所述连接序列跑在凝胶上,然后所述凝胶用与多核苷酸相结合的可检测化合物进行染色。可使用探针检测所述连接序列,诸如与所述连接序列特异性结合的多核苷酸探针。
在上述提到的PCR反应中形成的PCR产物可通过任何合适的手段进行检测,例如通过在上述提到的用于检测所述连接产物的方法中的任何适宜的方法。
在一个实施方式中,所述方法也包括检测作为组织特异性基因的另一基因的染色体结构。所述另一基因的结构的检测(例如通过此处描述的任何手段)可使之能确认所述另一基因是否被表达,并从而使之能确认表达的组织特异性。这将助于所述疾病的诊断。
在本发明的一个实施方式中,分析2个、3个或更多个基因以助于诊断。尤其是在癌症诊断中,分析多于一个的在致癌中所牵涉到的基因将有助于所述特定癌症的确认。
在另一实施方式中,根据本发明的方法进行的染色体结构的分析与对来自疾病组织(诸如癌症/肿瘤)的对照活组织检查样品进行的相同分析进行对比以助于诊断。
在一个实施方式中,以定量方式进行本发明的方法以确定具有异常基因表达的所述个体的细胞的比例(例如位于体内特定位置或特定组织)。这将有助于确认所述疾病阶段。
在基因中相联合以形成染色体结构的序列
如此处所提到,本发明的方法包括检测由基因的特定区域相联合而形成的染色体构象的存在。所述区域在同一染色体上,并通常相距少于50,000个碱基,诸如少于20,000、10,000、5000、1000或少于500个碱基。所述序列的联合可导致形成环/环样/拓扑封闭的结构。本领域技术人员会认识到所提及的相联合的基因区域表示的是什么意思。这些区域足够接近从而能被诸如此处提到的任何交联剂交联在一起。因此,它们将通常相距埃量级的距离,诸如例如相距小于50埃或小于10埃。
联合的序列中的一条或两条可以:
-导致、调控或有助于转录终止,和/或
-为CC标记。
所述CC标记通常具有1~30个核苷酸碱基的长度,例如为5~20个碱基或10~15个碱基。
采用表1中的信息可在任何给定的基因序列中检测CC标记。在以下的后续节中的一节详细描述了如何鉴别CC标记序列。如何使用表1中的信息的简单描述如下:所述表显示了四组权重(weight)。对于每组权重,引用了位置,并参考所述初始位置给出了每种核苷酸的位置值(在表1中这定义为关于所述初始位置的栏位置)。可以看到,对于第一组权重,将鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的值给出为位置0~18。使用表1中的值,为正向和反向链中的指定序列的每个碱基确定分值。通过从左至右扫描所述序列,然后在其互补链上重复而完成所述分析。扫描时,将一个碱基作为一个参考点,利用四组权重的位置值以及所述权重间的相对距离确定该碱基的分值(即对于每个碱基,根据该碱基周围的序列确定分值,使用表1中的位置数字定义所述碱基的位置)。如果此分值大于X(由使用者给定的输入值),那么正被讨论的碱基对处于CC标记之中。对所有碱基重复该过程。
所述分值通常换算为指数值(反对数)分值。在一个实施方式中,被选择的CC标记具有的反对数值超过0.9,诸如超过0.95或超过0.99(所述对数分值的计算在后续节中进行更详细的描述)。
本发明人已使用表1中的信息来检测人、酵母和果蝇(黑腹果蝇序列)中的CC标记。
用于实施所述方法的试剂盒
本发明还提供用于实施所述方法的试剂盒。所述试剂盒通常包括用于检测基因中特定并置序列的手段。通常,所述试剂盒将包括可用于检测并置序列的引物对或探针(例如通过检测此处所描述的连接产物)。通常,一个或两个引物和/或所述探针将包括的序列是所述基因序列的片段或者是与所述基因序列同源的序列的片段(应当理解提及基因序列也包括互补序列,这当然是因为一个引物与所述基因序列相结合,而另一引物将结合互补序列)。这样的基因序列可以是编码序列的5′序列(例如启动子序列)、编码序列、内含子序列或编码序列的3′序列。
所述引物或探针通常为至少10、15、20、30或更多个碱基长,并一般包括通常为单链形式的DNA。所述引物或探针可以以独立的形式存在。所述引物或探针可携带显示/可检测标记。适宜的标签包括诸如32P或35S等放射性同位素、荧光标签、酶标签或诸如生物素等其他蛋白质标签。
所述试剂盒可包括用于实施本发明的方法的说明书。所述试剂盒可包含能交联DNA的交联剂,诸如任何在此处提到的交联剂。
在一个实施方式中,所述试剂盒用于实施本发明的实施方式,在所述实施方式中,分析了多于1个基因的染色体结构,诸如2、3、4或更多个基因。在这些情况下,所述试剂盒也包含用于分析2、3、4或更多个不同基因的引物或探针。
所述试剂盒可另外包含一种或多种的其他试剂或器具,使得以上所提到的任何方法的实施方式得以实施。这些试剂或器具包括以下一种或多种:可检测标签(诸如荧光标签)、能作用于多核苷酸的酶(通常为聚合酶、限制性酶、连接酶、RNAse H或能将标签附着在多核苷酸上的酶)、用于酶试剂的合适的缓冲剂(水溶液)、阳性和/或阴性对照、凝胶电泳装置、用于从样品中分离DNA的工具、由个体获得样品的工具(诸如拭子或包括针头的器具)或者具有能在其上完成检测反应的孔的支持物。
筛选方法
本发明提供了鉴别用于治疗基因的异常表达的化合物的方法,所述方法包括确定候选物质是否能导致所述基因的染色体结构由其在异常表达中所采用的异常结构变为正常结构,从而由此确定所述候选物质是否能治疗异常表达。可用此处所描述的任何适宜的方法检测染色体结构的变化。也可实施所述方法以通过再次确认候选化合物是否能引起基因的结构变化,从而鉴别能引起所述基因的表达变化(例如由一种表达模式转换为另一种表大模式)的化合物。
所述方法可在体外(细胞内或细胞外)或在体内(对非人类生物体)实施。在一个实施方式中,对包含所述基因的细胞、细胞培养物、细胞提取物、组织、器官或生物体实施所述方法。所述细胞通常是其中观察到所述基因的异常表达的细胞。
通常通过将所述候选物质接触(或施用于)所述基因、细胞、细胞培养物、细胞提取物、组织、器官或生物体并确定是否发生变为正常染色体结构的变化,从而实施所述方法。
在上述筛选方法中测试的合适的候选物质包括抗体物质(例如单克隆抗体和多克隆抗体、单链抗体、嵌合抗体和CDR-接枝抗体)。此外,组合文库、明确的化学成分、肽和肽拟似物、寡核苷酸和天然物质文库诸如展示文库(例如噬菌体展示文库)也可被测试。所述候选物质可以是化学上的化合物,其通常衍生自在可具有上述提到的物质的任何性质的小分子(诸如此处提到的有机化合物)周围进行合成。在初筛选中可以采用候选物质批次,例如,每反应十种物质,显示出调控的批次物质将进行单独测试。
工程基因和生物体
本发明提供了改变基因表达谱的方法,所述方法包括:
(i)将CC标记引入所述基因,和/或
(ii)从基因中除去CC标记,所述除去可选地通过将1、2、3或更多个突变引入所述CC标记进行,其中,每个突变为核苷酸碱基的添加、取代或缺失,
其中,在所述方法中,所述基因的编码序列的至少50%保持不变。
在一个实施方式中,在所述方法中CC标记序列(即功能性CC标记序列)的总数保持不变。
“除去CC标记”将被理解为并不需要移去整个CC标记序列,取而代之的是可将突变引入所述CC标记序列使之失活,由此在一个实施方式中,被改变的CC标记序列将不再能引起所述基因的区域联合。
所述基因的RNA或多肽产物保持功能性活性或可具有不同的活性或可不具有活性(与非工程基因的产物相比)。所述工程基因可以是此处提到的基因中的任一个。所述工程基因可被复制和/或表达和/或引入细胞。
本发明提供了含有CC标记的多核苷酸改变基因表达的用途。所述多核苷酸可用于向基因引入或从基因除去CC标记,正如在此处所描述的任何工程基因的情况中。所述多核苷酸通常为DNA分子。所述多核苷酸可以为载体的形式,诸如病毒载体。所述多核苷酸可以为转座子的形式。
本发明还提供了非人类工程真核生物体,所述生物体在其基因组中包含至少一个基因,所述至少一个基因的表达谱已通过引入和/或除去CC标记序列而改变,其中所述基因的编码序列的至少50%保持不变。所述生物体由此包含上述本发明的工程基因。所述(转基因)生物体可以是此处提到的任何生物体。本发明也可提供包含所述工程基因的生物体的一部分,诸如所述生物体的细胞或器官。
本发明提供了制造本发明的工程生物体的方法,所述方法包括在所述生物体的细胞中的基因里引入或除去CC标记,并且在多细胞生物体的情况下允许所述细胞生长为生物体。可对生殖细胞或胚胎干细胞实施所述CC标记的引入或除去。
同源物(Homologues)
此处论及多核苷酸序列的同源物。例如对至少15、20、30、100或更多连续核苷酸的区域而言,所述同源物通常具有至少70%的同源性,优选为至少80%、90%、95%、97%或99%的同源性。所述同源性可在核苷酸同一性(有时称之为“硬同源性”)的基础上计算。
例如,UWGCG套装提供了可用于计算同源性的BESTFIT程序(例如按照其默认设置进行使用)(Devereux等(1984)Nucleic Acids Research12,第387-395页)。PILEUP和BLAST算法也可用于计算同源性或排列序列(诸如鉴别等价或对应序列(通常按照其默认设置),例如在AltschulS.F.(1993)J Mol Evol 36:290-300;Altschul,S,F等(1990)J Mol Biol215:403-10中所描述)。
用于进行BLAST分析的软件可通过国家生物技术信息中心(NationalCenter for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)公开获得。该算法包括首先通过以下所述鉴别高分值序列对(HSP),即鉴别查询序列中长度W的短词,当与数据库序列中相同长度的词进行比对时其或者匹配或者满足一些正值阈值分值T。T称之为邻近词分值阈值(Altschul等,如上)。这些初始邻近词命中(hits)用作初始搜索以找到含有其的HSP的种子。只要累计比对分值能增加,所述词命中将沿着每个序列的两个方向延伸。在如下情况下所述词命中在各方向上的延伸将停止:累计比对分值由其最大实现值下降数量X;由于一个或多个负分值残基比对的累计,累计分值变为0或0以下;或者抵达任一序列的末端。所述BLAST算法参数W、T和X决定了所述比对的敏感度和速度。所述BLAST程序使用的默认词长度(W)为11,BLOSUM62计分矩阵(参见Henikoff和Henikoff(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919)比对(B)为50,期望值(E)为10,M=5,N=4和两条链的比较。
所述BLAST算法进行两个序列之间的相似度的统计分析;参见例如Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5787。由BLAST算法提供的相似度的一个测量方法是最小概率和(P(N)),其提供了以下指示:两个多核苷酸序列之间偶然发生匹配的概率。例如,如果在第一序列和第二序列的比较中最小概率和小于约1,优选小于约0.1,更优选小于约0.01,并最优选为小于约0.001,则将认为某序列与另一序列相似。
同源序列通常在于少于2、3、5或8个碱基的不同(可以为核苷酸的取代、缺失或插入)。对于计算同源性,可以在上述任何区域中测量这些变化。
实施例
以下的实施例描述了本发明:
使用模式识别分析来研究基因的结构性组织
新兴的真核生物学范例是核组织的结构方面在基因的转录调控中扮演着直接角色。从染色体领域至基因环-各种结构水平显现为特异性转录应答的重要部分(1-3)。此处,我们组合了两种途径以鉴别体内经转录基因的结构组织中隐含的一些所述性质。由应用数学,我们已采用模式识别分析,其基于广义线性模型和贝叶斯定理(Bayes theorem),并将其用于鉴别RNA聚合物II(RNAPII)转录单元的边界。根据分子生物学,我们已采用体内测定以分析和描述转录活性谱和在这些位点的结构性亚染色体域组织。
模式识别分析已广泛应用于研究的各个领域,诸如医药、工程和语言学,其图像分析和数据解码使得能在复杂系统中鉴别潜在的特征性标记。对于经RNAPII处理的转录单元,我们已用模式识别方法分析了人类基因组数据。来自人类染色体22(4)上的422个人工组织管理的基因的一组序列用于调控信号的计算鉴别。对于给定研究,由所能获得的所有模式识别方法我们发现关联向量机(Relevance Vector Machine,RVM)(5-6)最为成功。所述RVM训练者应用稀疏贝叶斯原理,其适应在所述调控信号之间被注意到的距离变量(7)。由给定的序列组,所述训练者扫描界定其的标记并构建概率性广义线性模型。随后,对于限定的标记的存在,该“经训练”的模型可用于对选择序列进行分类。该模型的推导是基于如下给出的贝叶斯定理的条件概率:
Figure G2007800057991D00141
其中,数据表示DNA序列组。P(模型|数据)是后验概率,其给出了由所述模型衍生出的序列的概率。其取决于给定的数据、模型的概率和所述模型和数据的概率。
定义所述序列x的特征性的每个标记给出为关于切割位点的DNA权重矩阵。数学上,其表示为:
φ ( x ) = Σ i = - ∞ ∞ P ( i ) W ( x , i )
其中,P是后验概率,而W(x,i)是相对于切割位点的偏移i的DNA权重矩阵概率。这些标记的组合然后用于构建广义线性模型:
Figure G2007800057991D00143
其中,M是定义所述基因的标记组,而β是每个标记的给定权重(或重要性)。
由来自染色体22的422个有注释的人类基因所训练的模型鉴别出3′端的三种类型的通用标记(图1A)。先前已知的转录终止信号:poly(A)信号和在RNAPII转录的基因的3′端附近的富含U位点是所述鉴别出的三种类型标记中的两种。由于其明确地确认了功能性参与mRNA的3′端的终止和加工的已描述的序列(8-10),所以该结果验证了我们的方法。令人感兴趣的是,由所述RVM训练者鉴别出的第三类型标记是先前未知的。其位于所述富含U位点的更下游并由多个DNA权重矩阵构成。在每种类型的标记中注意到的距离变化作为高斯分布被俘获。令人感兴趣的是,当在人类染色体20序列上测试所述模型时,所述标记并未限制在所述3′端,而是也可以出现在有注释的基因的5′端。由于所述新定义的标记与所述转录单元的边界的相关联,我们用冷战期间最著名的柏林边界岗哨为其命名-查理检查点(CC)标记。
令人感兴趣的是,与所述poly(A)位点不同,我们不能鉴别出所述CC标记的任何扩展的一级序列共有序列。这表明通过模式识别分析,我们已鉴别出通过在所述相应序列的二级和三级结构中所编码的信息来共享共同性质的位点。实际上,采用Zuker算法(11)的CC标记的序列分析揭示了低折叠自由能,其为相应转录本的高级二级和三级结构的特征。
为确定所述CC标记与转录调控的功能相关性,我们在业已定义的调控元件中搜寻CC标记的任何例子。需要重点提及的是在人类基因上训练的算法也能鉴别跨许多物种的真核生物中的CC标记(图5)。我们将这归结于由所述标记的高级结构所介导的进化上的保守功能。
此处,我们提出与转录调控功能性相关联的CC标记的两个例子。已发现所述CC标记的第一个例子在其性质已被多个实验室深入研究的人类β-球蛋白基因中。最近的报道显示β-球蛋白基因的转录终止不仅依赖于所述poly(A)位点的识别,而且还依赖于在更下游的共转录切割位点(CoTC)(7、12-14)。令人感兴趣的是,所述CoTC位点与所鉴别的CC标记一致并显示出低折叠能,正如之前所述(图1B)。该观察结果不仅确证了CC标记与经转录的基因的边界的潜在相关性,而且提示其功能性参与受控转录终止的机制。
已发现CC标记的第二例子在黑腹果蝇的X染色体上,它与染色体带7B2内的吉卜赛隔离子相一致(图1C)。吉卜赛是明确表征的350bp隔离子元件,具有多个Su(Hw)结合位点,指示了更高级的染色质环样结构(15)。在果蝇的cut座位上完成的实验表明在染色体带7B2和7B8的两个隔离子位点在围绕所述位点之间的核外围处连在一起(16)(图1C)。由隔离子之间的串扰所介导的染色质纤维的相似组织结构已显示了scs和scs′边界序列(17)。总而言之,这些观察均与以下事实相符,即功能性CC标记也可在包括亚染色体域构象的高级结构的组织结构中扮演重要角色,这可由先期报道的染色体构象俘获(3C)测定所检测(18)。
为了确证上述观察结果,我们对两个受控人类基因上的CC标记进行了系统分析(图2)。两个模型基因-细胞周期调控的二氢叶酸还原酶(DHFR)基因(19)和细胞类型特异性降钙素受体样受体(CALCRL)基因(20-22)-展示了受控转录活性的替换模式。在我们的分析中,我们非常感兴趣地想知道CC标记是否(i)能限制RNAPII转录的范围和(ii)与任何特异性染色体构象相关。
人类DHFR(hDHFR)是细胞周期调控基因,由上游次要和下游主要启动子所控制。所述基因在染色体5中横跨28.5kb并含有6个外显子(图2A)。独立研究已显示hDHFR表达在进入细胞周期的S期时被诱导,并在静止期细胞(G0)中被关闭(图2A)(23)。在G1/S期,所述hDHFR基因的制造性转录由所述主要启动子所驱动,在静止期细胞中,所述转录活性并未废止,而是切换为另一模式-由上游次要启动子开始并在第二内含子处主动终止。由次要启动子的转录本不稳定,但在静止期细胞中可由RT-PCR大量检测到。
所述hDHFR基因含有三个CC标记:(i)两个启动子的上游(CCDHFR-1);(ii)在第二内含子中(CCDHFR-2);(iii)功能性poly(A)信号下游(CCDHFR-3)(图3A)。令人感兴趣的是,平行分析表明在相同基因中存在超过40个的隐藏poly(A)信号。所有三个已描述的CC位点显示出低折叠自由能,其为高度结构化的单链核酸的特征(图3A)。为确保每个所述CC位点的终止性质,我们通过RT-PCR量化了位于所述CC位点上游和下游的体内转录本的丰度,包括不稳定的和罕见的转录本。在所有三种情况下,我们发现了转录本在CC位点终止的证据(图3A)。在CCDHFR-1位点,我们检测到罕见的基因间转录本的转录终止。在静止期细胞中,短的非编码转录本在CCDHFR-2位点终止。规范的AATAAA位点也存在于CCDHFR-2位点附近并且那部分DNA序列与来自于公共数据库的多种表达序列标签和cDNA相匹配。在增殖期细胞中,CCDHFR-3位点标示了在别处提及的制造性转录的终止。CCDHFR-3位点与功能性poly(A)信号的关联性与先期描述的所述β-球蛋白基因内的相关性类似。
所选择的第二模型基因是细胞类型特异性人类CALCRL基因(hCALCRL)(图2B)。它编码七次跨膜G蛋白偶联受体(GPCR)。哺乳动物GPCR构成大型的多样性蛋白家族,其主要功能是将细胞外刺激转换为细胞内信号。大多数GPCR响应内源性信号(endoGPCR)诸如肽、脂质、神经递质或核苷酸。EndoGPCR是高度保守的并且其表达谱是独特的,为生理过程的调节而产生成千的组织-和细胞-特异性受体组合。在人体中,endoGPCR文库由367个受体构成。然而,调控其特异性表达和功能的机制还很大程度上未知。由hCALCRL基因编码的EndoGPCR被认为是调控降钙素肽家族成员的活性中的关键分子,而降钙素肽家族成员在细胞生长、存活和导航(navigation)中起着必要作用。人类CALCRL基因(103.15kb)位于染色体2并含有十五个外显子并在多个人体组织和肿瘤中转录。如由Northern印迹和免疫组织化学表明,hCALCRL基因在内皮细胞中以其全长进行转录,而在非内皮细胞中并不是这样(图2B)。然而,在非内皮细胞中,可以检测到非编码转录本终止在第一内显子中(图2B)。我们认为hCALCRL基因为基因表达的细胞类型特异性调控的良好模型(22)。
与hDHFR相似,hCALCRL基因的启动子的上游(CCCALCRL-1)和功能性poly(A)信号的下游(CCCALCRL-3)均能检测到所述CC标记。另外的第三CC标记(CCCALCRL-2)存在于基因中的第一内含子中(图3B)。由第一外显子的5′RACE证实了所有的转录本均起始于所述CCCALCRL-1标记的下游,无一起始于上游。这表明CCCALCRL-1可终止将干扰hCALCRL转录单元的基因间转录本。3′RACE分析确认靠近CCCALCRL-2(在第一内含子中)和CCCALCRL-3位点(在切割位点下游的区域)存在被终止的转录本。所有三个CC标记位点均显示出如上所示的低折叠自由能(图3B)。因此在体内,在hDHFR和hCALCRL基因中,所述CC标记均显示出转录终止性质。
为了验证CC标记的第二个所提出的性质,我们于是测试了它们是否如通过所述3C测定所确定那样参与任何特定染色体构象。开发所述测定以监测高度柔性的体内染色体构象,其通过检测在形成环样结构中所涉及的相距较远的位点的空间邻近而进行。我们已经调整了所述测定的条件以改善在人细胞中的检测结果和灵敏度(参见材料和方法)。重要的是,所述测定的起始步骤也包括用抗-RNAPII免疫沉淀(24)进行的所转录的染色体座位的富集。
当对hDHFR基因进行分析时,在正常增殖期细胞中发现相距超过29kb的CCDHFR-1和CCDHFR-3标记的位点相互并置(图4A)。这两个位点的空间邻近性是高度特异性的(图4A,与增殖期细胞中的1+2,1+3相比)并且依赖于RNAPII的存在、交联、限制性、连接和PCR(图4A,hDHFR对照)。如之前所示(图3A),这两个位点在增殖期细胞中也显示出转录终止性质。
在静止期条件下,除了别的以外,hDHFR基因上的转录模式的变化与终止于第二内含子中的短转录本产生相关。重要的是,所述hDHFR基因含有位于同一位点的第三CC标记。在静止期状态的hDHFR转录的先期分析表明CCDHFR-2标记被激活作为短的非编码转录本的终止位点(图3A)。我们因此希望分析在静止期状态,不同的转录模式是否与CCDHFR-2标记的替换性染色体构象相关。实际上,如图4A所示,在静止期细胞中通过3C测定可检测到CCDHFR-1和CCDHFR-2标记并置的体内构象。在增殖期细胞群体中仅仅检测到低水平的这种构象。令人感兴趣的是,所观察到的CCDHFR-1:CCDHFR-2构象并不使先前描述的所述增殖期细胞的CCDHFR-1:CCDHFR-3构象消失。考虑到3C测定的特性,该结果可有多种解释。首先,所述静止期特异性构象过分施加到所保持的CCDHFR-1:CCDHFR-3构象上。其次,由一种构象变换为另一种构象时该结果可能代表两个细胞类群。重要的是,CCDHFR-1:CCDHFR-2构象对于转录的静止期模型是特异性的并且与所检测的转录本范围保持一致。因此对于hDHFR基因,我们已检测了特征为CC标记空间邻近的体内染色体构象。CCDHFR-1和CCDHFR-2标记的邻近对于所描述的细胞周期静止期状态的转录模式是特异性的。
为测试CC标记是否参与任何与hCALCRL基因的细胞类型特异性表达相关的结构排列,我们研究了其在转录允许细胞(内皮细胞,HMVEC)和转录非允许细胞(非内皮细胞,HEK293T)中的构象。在HMVEC细胞中,活性hCALCRL基因显示出所有三个CCCALCRL标记均并置的构象概图,其中CCCALCRL-1:CCcALCRL-2和CCCALCRL-1:CCCALCRL-3之间紧密邻近(图4B;CCCALCRL-2:CCCALCRL-3的数据未显示)。重要的是,这两个潜在的环构象的边界对应于在HMVEC细胞中检测到的两个转录本的边界(图2B)。为测试任何这些构象对于HMVEC细胞是否为特有的,我们分析了转录非允许的细胞HEK293T中的hCALCRL。尽管我们依然检测到CCCALCRL-1和CCCALCRL-2的并置,但涵盖hCALCRL基因全长的CCCALCRL-1和CCCALCRL-3之间的相互作用不再存在(图4B)。在HEK293T细胞中,所述CCCALCRL-1:CCCALCRL-2构象与短hCALCRL转录本的存在同时发生,所述短hCALCRL转录本在CCCALCRL-2位点于第一内含子中终止(图2B)。由此,hCALCRL基因的细胞类型特异性表达与如在CCCALCRL-1和CCCALCRL-3标记之间检测到的特有的染色体构象相关。重要的是,该构象涵盖了在HMVEC细胞中生成的制造性转录本的全长。
将模式识别分析应用至422个有注释人类基因的边界,已鉴别和确定了数个标记,包括参与转录调控的先前未知的标记。所述标记-查理检验点-与多种物种中的编码和非编码转录单元的边界始终相关(也参见图5),显示出相应转录本的高度有序的二级和三级结构,与体内受RNAPII调控的转录终止相关,并且指导转录依赖性的替换性染色体构象的形成。值得注意的是,当对细胞周期特异性hDHFR和细胞类型特异性hCALCRL基因进行分析时,所述标记功能性地与独特的高级结构构象相关联,所述独特的高级结构构象对所述转录活性的一种或另一种模式而言是特征性的。所述并置的CC标记不仅与负载有RNAPII的亚染色质结构相关,而且勾勒出在这些结构中合成的转录本的边界。我们的数据与早先的提议相一致,即高级结构以转录依赖性方式形成并对转录重新开始而言是重要的。
通过与DNA序列特异性募集、染色质修饰相关联的多数活性在各种重要水平进行转录调控,和重塑CC标记以及相关的结构组织在体内明显参与在各种转录单元的外边界的建立。
Northern印迹
由分离自U2OS细胞的总RNA进行hDHFR的Northern印迹。在10%FCS的存在下培养增殖期细胞,而在0.5%FCS的存在下在接触抑制情况下获得细胞静止期。采用涵盖hDHFR的第四和第六外显子之间的序列作为模板合成的探针用作探针。
如先前所描述进行hCALCRL的Northern印迹(25)。全长的人类CL进行RT-PCR扩增并克隆入pcDNA 3.1载体。所得载体用AppliedBiosystems 377基因分析仪进行测序,序列用GenBank数据库核查。将插入物切下并用作形成探针的模板。
在任一情况下,使用MegaPrime标记试剂盒(Amersham,UK)将所述探针用32P-dCTP标记。在杂交和严格洗涤之后,将所述印迹暴露于Hyperfilm(Amersham,UK),随后暴露于磷屏(Phosphoscreen)。杂交信号用ImageQuant软件进行分析。
荧光激活的细胞分选(FACS)
U2OS生长期和静止期细胞的FACS分选如之前所描述进行(26)。
反转录聚合酶链式反应(RT-PCR)
对分离自U2OS细胞的总RNA进行反转录PCR以确证转录本在hDHFR中的终止。对于CCDHFR-1、CCDHFR-2和CCDHFR-3位点使用以下正向和反向引物:
CCDHFR-1
正向引物(A):tggggaactgcacaatatga(SEQ ID NO:1)
反向引物(B):aggggtgcgtcttttaacct(SEQ ID NO:2)
反向引物(C):ccgcacgtagtaggttctgtc(SEQ ID NO:3)
CCDHFR-2
正向引物(A):ttccagagaatgaccacaacc(SEQ ID NO:4)
反向引物(B):tgttccttttgatcgtggtg(SEQ ID NO:5)
反向引物(C):tggggtatctaatcccagtttg(SEQ ID NO:6)
CCDHFR-3
正向引物(A):tttggaaaaacccatgaagg(SEQ ID NO:7)
反向引物(B):caacagtcctgccagttgtt(SEQ ID NO:8)
反向引物(C):cagggttttggtctgtcacc(SEQ ID NO:9)
采用来自Qiagen,UK的Omniscript反转录试剂盒进行RT-PCR。
cDNA末端的快速扩增(RACE)
基本按照先前所述进行RACE(27)。根据已报道的人CALCRL cDNA的序列设计3′-(cagagagtgtcacctcctgctttagg)(SEQ ID NO:10)和5′-RACE(cccacaagcaaggtgggaaagagtg)(SEQ ID NO:11)的基因特异性引物。将由5′和3′RACE的转录本(在第一内含子中终止)进行测序并提交至GenBank数据库。
抗体产生和表征
产生抗合成肽的兔多克隆抗体LN-1436,所述合成肽对应于在人CL(hCL)蛋白(登录号AAC41994和AAA62158;由CALCRL基因编码)的最远C-端的残基427-461(HDIENVLLKPENLYN)(SEQ ID NO:12)。通过在HEK293T细胞中的瞬时表达CL的免疫印迹分析对所述抗体的特异性进行表征。
免疫细胞化学
20个正常人类组织的经福尔马林固定,石蜡包埋的试样(n=74)选自英国牛津的牛津大学约翰拉德克里夫医院细胞病理科(The Department ofCellular Pathology,John Radcliffe Hospital,University of Oxford,Oxford,UK)的档案文件。多组织微阵列(TMA)如下制造,即对于每个试样获得圆柱形核心(1.0mm直径),所述试样以高密度阵列安置入接受TMA块中(29)。在利用抗hCL抗体LN-1436进行免疫组织化学之前,在4μm脱蜡和重新水化的切片上进行抗原修复过程。基本按照先前的描述进行免疫组织化学(30)。使用了生物素化的二抗、链霉亲和素-碱性磷酸酶复合物Vectastain ABC-AP试剂盒和Vector Red检测系统(均来自Vector,Burlingame,US)。对照包括在合适浓度下使用的预免疫兔血清。
染色体构象俘获(3C)
如先前所述并具有以下改进进行3C分析(31)。通过在室温下用2%甲醛处理10分钟将大约4×106的完整细胞进行交联。用等摩尔量的甘氨酸终止所述交联并收获细胞,以及在低渗缓冲液(10mM Tris-HCl[pH7.2],2mM MgCl2和0.5%Triton X-100)中裂解。将细胞核再次悬浮,并在CSK缓冲液(100mM NaCl,300mM蔗糖,10mM PIPES[pH 6.8],3mM MgCl2,10μM亮肽素,1mM EGTA,1.2mM PMSF和0.5%TrionX-100)中在冰上温育20分钟。所述悬浮液在Hettich Mikro 22R离心机中,在4℃,以5000rpm离心,并且用2M NaCl处理沉淀。在冰上温育10分钟之后,加入足够量的水以降低所述NaCl浓度至150mM。如以前所述使用该样品进行RNAPII染色质免疫沉淀测定(32)。用RNAPII抗体(H-224,Santa Cruz Biotechnology Inc.,USA)免疫沉淀的染色质然后用BglII限制性酶(New England Biolabs,UK)进行限制性切割,并用T4 DNA连接酶(Roche,UK)进行连接。在用蛋白酶K(Roche,UK)消化蛋白质和用核糖核苷酸酶A(Sigma,UK)消化RNA之后,用乙醇提取DNA。使用来自Takara Bio Inc.,日本的用TakaRa LA TaqTM,采用基因特异性引物,对所提取的DNA进行PCR分析。
卵巢癌和前列腺癌诊断
正常组织和卵巢癌组织中的MLH1表达(参见图8)
肿瘤抑制基因在细胞生存和保持中起到至关重要的作用。使肿瘤抑制子沉默,失控生长信号将导致癌症。作为失败的保险机制,当检测到这样的生长失控信号时,发生细胞凋亡。
大肠杆菌(Escherichia coli)mutL基因的人类同源物,结肠癌非息肉2型(MLH1)是一种这样基因,该基因编码DNA错配修复基因。用于修复机制的MLH1信号由DNA损伤引发并诱导肿瘤细胞的凋亡。该基因位于座位3p21.3,并随着细胞变老而累积各种突变和改变。一种如此的变化-MLH1的启动子区域中的甲基化水平增高与遗传性非息肉结肠癌相关。同样,已显示出,MLH1替代性剪接变异体是组织特异性的并对遗传性癌症中的表型变异性起作用。
为了解MLH1突变诱导的剪接变异是否与卵巢癌相关,我们寻找涵盖所述转录单元的CC位点。扫描所述MLH1序列,我们在内含子8中发现CC标记,在替代性剪接变异体的3′UTR形成的边界发现另一个。对这两个位点进行的3C分析显示,所述CC位点仅仅在正常患者中并置。然而,收集自卵巢癌患者的组织和体液样品显示没有并置。因此,MLH1CC位点可用作辨别卵巢癌的标记。
前列腺癌
前列腺诊断标记的测试在代表肿瘤生长的良性阶段或后期阶段的细胞系中进行。所选择的基因是PSA和BORIS。
正常组织和前列腺癌组织中的BORIS和PSA表达(参见图9)
睾丸癌基因家族的新成员,印记位点的调节子兄弟(Brother of theregulator of imprinted sites(BORIS)),仅在精母细胞中表达,而不在普通体细胞中表达。然而,其表达与多种人类癌症相关,所述癌症包括乳癌和肺癌。BORIS与另一锌指转录因子CTCF相竞争人体恶性肿瘤中的外遗传扰动(epigenetic perturbations)。因此,我们决定试验BORIS和人前列腺癌(LNCaP)的相关性。
BORIS具有涵盖染色体位置20ql3.31中的明确转录单元的两个CC位点。由于所述基因在恶性肿瘤中显著表达,我们决定测试LNCaP中两个CC位点的并置。由显示在附图中的结果可知,CC位点的并置仅发生在LNCaP中,而不发生在人骨肉瘤(U20S)细胞系中。通过对PCR产物测序进一步得以证实。
我们同样也观察了另一个清楚确认的前列腺癌标记,前列腺特异性抗原(PSA)。通过检测血液中PSA蛋白的水平,由人类激肽释放酶3(KLK3)基因编码的PSA用于前列腺癌的诊断和预后。然而,此处我们使用3C技术观察在人骨肉瘤细胞和良性前列腺增生(BPH1)细胞系中的PSA基因。如同在BORIS中所观察到的,KLK3转录单元也是由两个CC位点界定,一个在5′UTR而另一个在3′UTR。结果显示,这两个CC位点仅在BPH1细胞中而不在U20S中串扰。
因此,PSA和BORIS可用作生物标记以分别鉴别良性和恶性前列腺癌细胞。
PCR方法
MLH1
3C限制性酶-BssSI
MLH1引物
MF3UTR2TGGTTTTAGCTGGGATGGAG
MF3UTR1GAGGCAGGCAGATCACTTGT
MREI2AGAAGATGCAGGCCAACAAT
MREI1CTCGTAAAGCCCAAGGAGGT
第一轮PCR反应
2×缓冲液I       25μl
dNTP(2.5mM)      8μl
DNA              1μl
引物(25μM)
正向(MREI2)      1μl
反向(MF3UTR2)    1μl
TakaRa LA Taq    0.5μl
水               13.5μl
总计             50μl
引物
MREI2-MF3UTR2
PCR程序
94℃-5min(分钟)
94℃-1min
57℃-1min,30循环
72℃-45sec(秒)
72℃-5min
预期的产物大小
MREI2-MF3UTR2-527bp
第二轮PCR反应
2×缓冲液I         25μl
dNTP(2.5mM)        8μl
DNA                2μl
引物(25μM)
正向(MREI1)        1μl
反向(MF3UTR1)      1μl
TakaRa LA Taq      0.5μl
水                 12.5μl
总计               50μl
引物
MREI1-MF3UTR1
样品
取48μl的混合物和2μl来自第一轮的各自PCR反应物
PCR程序
94℃-5min
94℃-1min
59℃-1min    25循环
72℃-30sec
72℃-5min
预期的产物大小
MREI1-MF3UTR1-325bp
BORIS
3C限制性酶-TaqI
BORIS引物
BR5UTR4GGCTGGAATTGCCCTAAAGT
BR5UTR3CCTATGAGGGGGCAGTATCA
BR3UTR2GCTCTTCCTGCTGGGAAAT
BR3UTR1TACAGGGGTGGAGACAGGTT
第一轮PCR反应
2×缓冲液I     25μl
dNTP(2.5mM)    8μl
DNA            1μl
引物(25μM)
正向(BR5UTR4)  1μl
反向(BR3UTR2)  1μl
TakaRa LA Taq  0.5μl
水             13.5μl
总计           50μl
引物
BR5UTR4-BR3UTR2
PCR程序
94℃-5min
94℃-45sec
57℃-30sec    30循环
72℃-25sec
72℃-5min
预期的产物大小
BR5UTR4-BR3UTR2-430或784bp
注:给出了两个产物大小,这是因为所述3C限制性酶(Taq I)在靠近所述CC标记的两个限制性位点中的任一处进行切割。
第二轮PCR反应
2×缓冲液I     25μl
dNTP(2.5mM)    8μl
DNA            2μl
引物(25μM)
正向(BR5UTR3)  1μl
反向(BR3UTR1)  1μl
TakaRa LA Taq  0.5μl
水             12.5μl
总计           50μl
引物
BR5UTR3-BR3UTR1
样品
取48μl的混合物和2μl来自第一轮的各自PCR反应物
PCR程序
94℃-5min
94℃-45sec
55℃-30sec    25循环
72℃-20sec
72℃-5min
预期的产物大小
BR5UTR3-BR3UTR1-260或564bp
注:此处给出了两个产物大小,这是因为所述3C限制性酶(Taq I)在靠近所述CC标记的两个限制性位点中的任一处进行切割。图9显示了564bp带,通过测序对其进行了确认。
PSA
3C限制性酶-Taq1
PSA引物
PR5UTR2CGTGATCCACCCATCTCAG
PR5UTR1CTATTGGGAGACCGAAGCAG
PF3UTR2GGGAAAGGGAGAAGATGAGG
PF3UTR1TAGGGGAAGGTTGAGGAAGG
第一轮PCR反应
2×缓冲液I    25μl
dNTP(2.5mM)   8μl
DNA           1μl
引物(25μM)
正向(PR5UTR2) 1μl
反向(PF3UTR2) 1μl
TakaRa LA Taq 0.5l
水            13.5μl
总计          50μl
引物
PR5UTR2-PF3UTR2
PCR程序
94℃-5min
94℃-45sec
61℃-30sec    30循环
72℃-25sec
72℃-5min
预期的产物大小
PR5UTR2-PF3UTR2-481bp
第二轮PCR反应
2×缓冲液I    25μl
dNTP(2.5mM)   8μl
DNA           2μl
引物(25μM)
正向(PR5UTR1) 1μl
反向(PF3UTR1) 1μl
TakaRa LA Taq 0.5μl
水            12.5μl
总计          50μl
引物
PR5UTR1-PF3UTR1
样品
取48μl的混合物和2μl来自第一轮的各自PCR反应物
PCR程序
94℃-5min
94℃-45sec
61℃-30sec    25循环
72℃-20sec
72℃-5min
预期的产物大小
PR5UTR1-PF3UTR1-266bp
CC标记细节
MLH1
CC1-TSS下游24367bp
TAACCCCAT
CC2-TSS下游57357bp
TAACATAA
(带有下划线的黑体字母表示CC标记序列)
在正常组织中,所述基因以替换性转录本进行转录。一个这样的转录本开始于第8个内含子,在此处存在CC1并在CC2标记处终止。在卵巢癌组织中,由于其累计突变、缺失和甲基化导致错误或者没有转录本,因此该基因被下调。我们发现在正常组织中所述CC1和2并置,但在卵巢癌组织中未并置。这涉及该基因在这些组织中转录模式的转换。
BORIS
CC1-TSS上游5282bp
CTTTGAAAGC
CC2-TSS下游28038bp
AAAATTGCT
(带有下划线的黑体字母表示CC标记序列)
BORIS具有两个CC位点,一个在5′UTR而另一个在3′UTR。在U20S细胞中,预计没有BORIS表达,并因此不应当观察到CC标记的并置。然而,在人类前列腺癌细胞系(LNCaP)中,BORIS被表达。我们在LNCaP中发现CC1和CC2并置,但在U20S中未并置。
PSA/KLK3
CC1-TSS上游408bp
CTGGTCTCAGAGT
CC2-TSS下游5843bp
TACTGTGGTTTA
(带有下划线的黑体字母表示CC标记序列)
KLK3具有两个CC位点,一个靠近5′UTR而另一个在3′UTR中。在U20S细胞中,预计没有KLK3表达,并因此不应当观察到CC标记的并置。然而,在良性前列腺增生细胞系(BPH-1)中,KLK3被表达。因此在BPH-1中观察到所述CC1和CC2并置,但在U20S中未并置。
参考文献
1.P.R.Cook,I.A,Brazell,E.Jost,Journal of Cell Science 22,303(1976年11月)。
2.T.Cremer,C.Cremer,Nat Rev Genet 2,292(2001年4月)。
3.D.Carter,L.Chakalova,C.S.Osborne,Y.F.Dai,P.Fraser,NatureGenetics 32,623(2002年12月)。
4.J.E.Collins等,Genome Research 13,27(2003年1月)。
5.T.A.Down,T.J.Hubbard,Genome Research 12,458(2002年3月)。
6.M.E.Tipping,Journal of Machine Learning Research 1,211(2001年6月1日)。
7.M.J.Dye,N.J.Proudfoot,Cell 105,669(2001年6月1日)。
8.N.J.Proudfoot,A.Furger,M.J.Dye,Cell 108,501(2002年2月22日)。
9.G.Yeung等,Molecular and Cellular Biology 18,276(1998年1月)。
10.M.Yonaha,N.J.Proudfoot,EMBO Journal 19,3770(2000年7月17日)。
11.M.Zuker,Nucleic Acids Research 31,3406(2003年7月1日)。
12.A.Teixeira等,Nature 432,526(2004年11月25日)。
13.S.West,N.Gromak,N.J.Proudfoot,Nature 432,522(2004年11月25日)。
14.M.Kim等,Nature 432,517(2004年11月25日)。
15.T.I.Gerasimova,V.G.Corces,Cell 92,511(1998年2月20日)。
16.K.Byrd,V.G.Corces,Journal of Cell Biology 162,565(2003年8月18日)。
17.J.Blanton,M.Gaszner,P.Schedl,Genes and Development 17,664(2003年3月1日)。
18.J.Dekker,K.Rippe,M.Dekker,N.Kleckner,Science 295,1306(2002年2月15日)。
19.J.E.Slansky,P.J.Farnham,Bioessays 18,55(1996年1月)。
20.B.Fluhmann,M.Lauber,W.Lichtensteiger,J.A.Fischer,W.Born,Brain Research 774,184(1997年11月7日)。
21.N.Aiyar等,Journal of Biological Chemistry 271,11325(1996年5月10日)。
22.L.L.Nikitenko,D.M.Smith,R.Bicknell,M.C.Rees,FASEBJournal 17,1499(2003年8月)。
23.S.L.Hendrickson,J.S.Wu,L.F.Johnson,Proceedings of theNational Academy of Sciences of the United States of America 77,5140(1980年9月)。
24.R.Metivier等,Cell 115,751(2003年12月12日)。
25.L.L.Nikitenko等,Molecular Human Reproduction 7,655(2001年7月)。
26.Z.Darzynkiewicz,The Cell Cycle.A Practical Approach.P.Fantes,R.Brooks,Eds.(IRL Press,Oxford,1993),第45-68页。
27.L.L.Nikitenko,D.M.Smith,R.Bicknell,M.C.Rees,FASEBJournal 17,1499(2003年8月)。
28.N.Aiyar等,Journal of Biological Chemistry 271,11325(1996年5月10日)。
29.J.Kononen等,Nature Medicine 4,844(1998年7月)。
30.L.L.Nikitenko,I.Z.MacKenzie,M.C.Rees,R.Bicknell,Molecular Human Reproduction 6,811(2000年9月)。
31.J.Dekker,K.Rippe,M.Dekker,N.Kleckner,Science 295,1306(2002年2月15日)。
32.R.Metivier等,Cell 115,751(2003年12月12日)。
CC标记及其检测的描述
模式识别分析已广泛应用于研究的各个领域,诸如医药、工程和语言学,其图像分析和数据解码使得能在复杂系统中鉴别潜在的特征性标记。对于经RNA聚合酶II处理的转录单元,我们已用模式识别方法分析人类基因组数据。将来自人类染色体22上的422个人工注释基因的一组序列用于存在于所述转录单元边界的调控信号的计算鉴别。对鉴别在转录单元的3′端的信号给予了特别的注意。正如后期实验确认所述信号具有体内的终止性质,这被证明是功能上相关的。
在所述边界发现的模式具有多重信号并以XML格式表示,其解释了3个关键方面
a.鉴别出的每个信号的DNA字母表
b.以高斯分布宽度表示的每个信号的位置变化
c.在每个碱基对中模式中每个信号间的距离
由于在转录单元的边界观察到所述模式,我们将其命名为“查理检查点”(CC)标记。
用一组鉴别为“扫描子”的密码可鉴别出未知序列上的CC标记,所述扫描子需要用户输入3个输入数据
a.被研究的序列
b.XML格式的模式
c.严格性因子(反对数分值)以将弱CC标记排除(例如默认值:0.99)
所述扫描子读取输入的DNA并试图使模式在所述序列中适合。这是通过将每个碱基作为参考点沿着所述DNA序列移动而实现的。所述扫描子从作为参考点的第一个碱基开始并试图使所述XML格式中限定的模式适合。适合程度由分值决定。如果该分值高于用户提供的严格性因子,则找到CC标记。所鉴别出的CC标记的位置以标准GFF格式给出,然后将所述扫描子移动至所述输入序列的第二个碱基。
重复该过程直至所述扫描子读取所输入DNA及其互补链中的所有碱基。
扫描CC标记模式的最终结果将是文本文件,其具有在所述输入序列上的潜在CC标记位置及GFF格式的其各自分值。
CC标记检测
为阐明在给定序列中的CC标记的检测,考虑以下序列。
ATATTTGTACTATGGCTCTGAATAAATAATAAGGACAGGAAGCCCGGAGAAGGAGAGTTTTTTTTTTTTTTTGGTACGAGAACTCTCTGTACTATTTTTTCAACTTTTCTTTTTCTTTTCTTTTGAGACGGAGTCTTACTCTTCTTGCCCAGGCTGGAGTGCAATGGCGCGATCTCGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCAAGTAGCTGGGATTACAGGCATGTGCCACCATGCCTGGCTAATTTTGTATTTTTAGTAGAGATGGGGGTTTCACCATGAGCGCCAGGCTGGTCTTGAACACCTGACCTCGTGATCCACCTGCCTCGGCCTCCCAAAGTACTGGGACTACAGGTATGAGCCACTGTGCCCAGCCGACAAAAC
给出该序列,从左至右完成扫描以找到所述CC标记。现在让我考虑第50个碱基,(标以下划线)作为我们的参考点。为确定该碱基是否为CC标记,表1中所描述的4组权重应匹配该序列。简单起见,举出一个例子,其中存在所有所述4组权重(也标以下划线)。
如之前所述,相对于参考点,所述4组权重相互之间具有相关距离。例如,从表1可以看到,相对于参考点,第一组权重开始于位置8。该第一组权重对于在该位置出现的每种类型的核苷酸有19个位置值。例如,对于第一个位置,鸟嘌呤将获得0.19的值,而胸腺嘧啶将得分0.33。同样,对于第二个位置,鸟嘌呤将得分0.20而胸腺嘧啶得分0.39。第二分值与第一个分值相乘。对此进行重复直至读取所有19个位置值并与其之前的数值相乘。
在我们的例子中,我们有相对于参考点从第8个碱基开始的TTTTTTTTTTTTTTTTGGT。因此,对于这套权重,我们的分值为(0.33×0.39×0.34×0.35×0.41…)等等。
也对其他3组权重重复该过程,每次将所述位置值与至此之前计算所得的分值相乘。
将来自所有4组权重的最终分值换算为指数值(反对数)分值以便于处理。所述对数分值等于1.0/(1+e-x),其中X是通过上述过程使用表1中的权重获得的分值。如果该对数分值大于0.90(例如),则所述碱基被认为是CC标记。在我们的例子中,将来自所有4组权重的位置值相乘给出0.99999的反对数分值。由于该数值大于0.99,第50个碱基A在CC标记序列内。分析该序列中的其他碱基使得鉴别出从第41个至第56个碱基的序列为CC标记(最终分值为0.99968)。
检测CC标记体内并置的方法
以下描述的方法广泛地鉴定了在组织样品中检测CC标记并置的关键步骤。这是开发出的第一种用于分析来自患者的冷冻组织样品的方法。
·在玻璃载玻片上将组织样品切为薄片
·向所述载玻片加1ml冰冷的1×PBS并洗涤5分钟
·加入0.67M多聚甲醛以交联蛋白质和DNA
·室温下,在摇动台上温育10分钟
·加入1M甘氨酸以淬灭交联反应
·刮下细胞并将所述细胞转移至eppendorf管中
·在室温,在13,000rpm离心1min以收集细胞
·除去上清液并加入1ml的冰冷低渗缓冲液
·吸打所述细胞数次以获得良好的细胞悬浮液(必要时可做快速的轻微旋转)
·在冰上温育10分钟以使细胞溶胀和细胞核显现出来
·在4℃,在5,000rpm下离心5分钟以收集所述细胞核
·吸干细胞溶质上清液并将细胞核沉淀溶解在1ml CSK缓冲液中
·在冰上温育20分钟
·在4℃,在5,000rpm离心5分钟以收集所述细胞核
·尽可能地吸干上清液并保留沉淀
·将所述细胞核沉淀溶解在2M NaCl中(溶液变粘)
·在冰上温育10分钟
·用足够的水稀释样品降低NaCl浓度至150mM
·向所述eppendorf管中加入10μl Pol II抗体(H-224)
·伴随搅动或旋转,在4℃温育过夜
·取30μl蛋白G琼脂糖凝胶小珠浆得到大约20μl干燥小珠(必要时切掉所述移液管尖端)
·在2,000rpm离心3分钟以收集所述小珠
·用1ml MilliQ水洗涤两次,并在2,000rpm离心3分钟以收集所述小珠
·向所述小珠加入1ml限制性洗涤缓冲液
·很好地混合并分装至不同的eppendorf管(必要时),洗涤,并在2,000rpm离心3分钟以收集所述小珠
·将所有内含物转移至装有小珠的eppendorf管并很好地混合
·伴随搅动或旋转,在4℃温育1小时
·在4℃,在1000rpm旋转3分钟并移去上清液。可分析所述上清液中的未结合组分
·加入1ml限制性洗涤缓冲液,在4℃旋转5min,在4℃,在2000rpm离心3分钟。移去上清液
·加入1ml限制性洗涤缓冲液,在4℃旋转5min,在4℃,在2000rpm离心3min。移去上清液
·加入1ml限制性洗涤缓冲液,在4℃旋转5min,在4℃,在2000rpm离心3min。移去上清液
·测量所述小珠和剩余的限制性缓冲液的量,并加入
·限制性缓冲液  1×
·限制性酶      30-60单位
·水            用于100μl反应的不同量
·通过在37℃温育过夜消化所述DNA
·在65℃温育10min以停止限制性消化
·向所述缓冲液加入>200μg/ml RNase A
·在37℃温育30min
·加入400μl MilliQ水并稀释所述限制性反应物
·加入,
·连接缓冲液   1×
·T4DNA连接酶  30单位
·水           用于100μl反应的不同量
·在16℃温育4小时
·在65℃温育过夜以使交联逆转
·向每个样品加入450μg蛋白酶K
·在42℃温育1小时以消化蛋白质
·向每个样品加入660μl苯酚,pH 7.9(等体积)并涡旋
·在13,000rpm离心10min
·将上清液转移至1.5ml eppendorf管
·加入0.3M NaCl和0.5μg糖原
·充分混合并加入1ml冰冻乙醇
·在-80℃沉淀DNA1小时
·在4℃,在14,000rpm离心20分钟
·在10μl无RNase的水中再次悬浮DNA沉淀
·对每个样品安排TakaRa PCR反应
·PCR缓冲液     1×
·dNTP          每种NTP 200μM
·DNA           1μl
·正向引物      0.5μM
·反向引物      0.5μM
·TakaRa LA Taq 2.5单位
·水            用于50μl反应的不同量
·在2%琼脂糖胶上跑样品
表1
<?xml版本=″1.0″?>
二<模型>
   <单位权重=″-0.10936629789322752″/>
   <单位权重=″-9.14545921645492″/>
  二<约束权重=″9.722125061947459″nolog=″假″>
     二<定位的位置=″8″最大值=″真″>
        <高斯分布宽度=″0.7303045966167145″
           偏移=″0″/>
       二<权重矩阵反向=″0.0″
           用最大值标准化(normalizeByMaximum)=″假″字母表=″DNA″
           栏数=″19″>
         二<栏位置=″0″>
             <权重符号=″鸟嘌呤″
                权重=″0.19891304347826086″/>
             <权重符号=″胞嘧啶″
                权重=″0.32065217391304346″/>
             <权重符号=″腺嘌呤″
                权重=″0.14673913043478262″/>
             <权重符号=″胸腺嘧啶″
                权重=″0.33369565217391306″/>
         </栏>
        二<栏位置=″1″>
            <权重符号=″鸟嘌呤″
               权重=″0.2076086956521739″/>
            <权重符号=″胞嘧啶″
               权重=″0.23804347826086958″/>
            <权重符号=″腺嘌呤″
               权重=″0.1641304347826087″/>
            <权重符号=″胸腺嘧啶″
               权重=″0.39021739130434785″/>
         </栏>
        二<栏位置=″2″>
           <权重符号=″鸟嘌呤″
              权重=″0.22934782608695653″/>
           <权重符号=″胞嘧啶″
              权重=″0.2423913043478261″/>
           <权重符号=″腺嘌呤″
              权重=″0.1858695652173913″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.3423913043478261″/>
         </栏>
        二<栏位置=″3″>
           <权重符号=″鸟嘌呤″
              权重=″0.23369565217391305″/>
           <权重符号=″胞嘧啶″
              权重=″0.29456521739130437″/>
           <权重符号=″腺嘌呤″
              权重=″0.12065217391304348″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.35108695652173916″/>
         </栏>
        二<栏位置=″4″>
    <权重符号=″鸟嘌呤″
       权重=″0.22065217391304348′/>
    <权重符号=″胞嘧啶″
       权重=″0.22065217391304348″/>
    <权重符号=″腺嘌呤″
       权重=″0.14673913043478262″/>
    <权重符号=″胸腺嘧啶″
       权重=″0.41195652173913044″/>
 </栏>
二<栏位置=″5″>
    <权重符号=″鸟嘌呤″
       权重=″0.2554347826086957″/>
    <权重符号=″胞嘧啶″
       权重=″0.22934782608695653″/>
    <权重符号=″腺嘌呤″
       权重=″0.16847826086956522″/>
    <权重符号=″胸腺嘧啶″
       权重=″0.3467391304347826″>
 </栏>
二<栏位置=″6″>
    <权重符号=″鸟嘌呤″
       权重=″0.22934782608695653″/>
    <权重符号=″胞嘧啶″
       权重=″0.21630434782608696″/>
    <权重符号=″腺嘌呤″
       权重=″0.17282608695652174″/>
    <权重符号=″胸腺嘧啶″
       权重=″0.3815217391304348″/>
 </栏>
二<栏位置=″7″>
    <权重符号=″鸟嘌呤″
       权重=″0.2597826086956522″/>
    <权重符号=″胞嘧啶″
       权重=″0.22934782608695653″/>
    <权重符号=″腺嘌呤″
       权重=″0.14673913043478262″/>
    <权重符号=″胸腺嘧啶″
       权重=″0.3641304347826087″/>
 </栏>
二<栏位置=″8″>
    <权重符号=″鸟嘌呤″
       权重=″0.2076086956521739″/>
    <权重符号=″胞嘧啶″
       权重=″0.20326086956521738″/>
    <权重符号=″腺嘌呤″
       权重=″0.1858695652173913″/>
    <权重符号=″胸腺嘧啶″
       权重=″0.4032608695652174″/>
 </栏>
二<栏位置=″9″>
    <权重符号=″鸟嘌呤″
       权重=″0.19021739130434784″/>
    <权重符号=″胞嘧啶″权重=″0.225″/>
    <权重符号=″腺嘌呤″
       权重=″0.1815217391304348″/>
  <权重符号=″胸腺嘧啶″
     权重=″0.4032608695652174″/>
 </栏>
二<栏位置=″10″>
    <权重符号=″鸟嘌呤″
       权重=″0.29456521739130437″/>
    <权重符号=″胞嘧啶″
       权重=″0.20326086956521738″/>
    <权重符号=″腺嘌呤″
       权重=″0.15543478260869564″/>
    <权重符号=″胸腺嘧啶″
       权重=″0.3467391304347826″/>
 </栏>
二<栏位置=″11″>
    <权重符号=″鸟嘌呤″
       权重=″0.2510869565217391″/>
    <权重符号=″胞嘧啶″
       权重=″0.19456521739130436″/>
    <权重符号=″腺嘌呤″
       权重=″0.15108695652173912″/>
    <权重符号=″胸腺嘧啶″
       权重=″0.4032608695652174″/>
 </栏>
二<栏位置=″12″>
  <权重符号=″鸟嘌呤″
     权重=″0.2467391304347826″/>
  <权重符号=″胞嘧啶″权重=″0.225″/>
  <权重符号=″腺嘌呤″
     权重=″0.14673913043478262″/>
  <权重符号=″胸腺嘧啶″
     权重=″0.3815217391304348″/>
 </栏>
二<栏位置=″13″>
   <权重符号=″鸟嘌呤″
      权重=″0.2728260869565217″/>
   <权重符号=″胞嘧啶″
      权重=″0.15978260869565217″/>
   <权重符号=″腺嘌呤″权重=″0.225″/>
   <权重符号=″胸腺嘧啶″
      权重=″0.3423913043478261″/>
 </栏>
二<栏位置=″14″>
   <权重符号=″鸟嘌呤″
      权重=″0.2858695652173913″/>
   <权重符号=″胞嘧啶″
      权重=″0.19456521739130436″/>
   <权重符号=″腺嘌呤″
      权重=″0.1858695652173913″/>
   <权重符号=″胸腺嘧啶″
      权重=″0.33369565217391306″/>
 </栏>
二<栏位置=″15″>
  <权重符号=″鸟嘌呤″
     权重=″0.2597826086956522″/>
  <权重符号=″胞嘧啶″
                  权重=″0.1858695652173913″/>
               <权重符号=″腺嘌呤″
                  权重=″0.15978260869565217″/>
               <权重符号=″胸腺嘧啶″
                  权重=″0.39456521739130435″/>
             </栏>
            二<栏位置=″16″>
               <权重符号=″鸟嘌呤″
                  权重=″0.3641304347826087″/>
               <权重符号=″胞嘧啶″
                  权重=″0.19021739130434784″/>
               <权重符号=″腺嘌呤″
                  权重=″0.19021739130434784″/>
               <权重符号=″胸腺嘧啶″
                  权重=″0.2554347826086957″/>
           </栏>
          二<栏位置=″17″>
             <权重符号=″鸟嘌呤″
                权重=″0.2684782608695652″/>
             <权重符号=″胞嘧啶″
                权重=″0.27717391304347827″/>
             <权重符号=″腺嘌呤″
                权重=″0.20326086956521738″/>
             <权重符号=″胸腺嘧啶″
                权重=″0.2510869565217391″/>
         </栏>
        二<栏位置=″18″>
           <权重符号=″鸟嘌呤″
              权重=″0.2554347826086957″/>
           <权重符号=″胞嘧啶″
              权重=″0.22934782608695653″/>
           <权重符号=″腺嘌呤″
              权重=″0.15108695652173912″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.3641304347826087″/>
         </栏>
      </权重矩阵>
   </定位的>
 </约束>
二<约束权重=″7.430703153194244″nolog=″假″>
  二<定位的位置=″-22″最大值=″真″>
      <高斯分布宽度=″7.116598573800258″
         偏移=″0″/>
     二<权重矩阵反向=″0.0″
         用最大值标准化=″假″字母表=″DNA″
         栏数=″5″>
       二<栏位置=″0″>
           <权重符号=″鸟嘌呤″
              权重=″0.1261574074074074″/>
           <权重符号=″胞嘧啶″
              权重=″0.12152777777777778″/>
           <权重符号=″腺嘌呤″
              权重=″0.5520833333333333″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.20023148148148148″/>
        </栏>
       二<栏位置=″1″>
          <权重符号=″鸟嘌呤″
             权重=″0.18171296296296297″/>
          <权重符号=″胞嘧啶″
             权重=″0.1863425925925926″/>
          <权重符号=″腺嘌呤″
             权重=″0.35300925925925924″/>
          <权重符号=″胸腺嘧啶″
             权重=″0.2789351851851852″/>
        </栏>
       二<栏位置=″2″>
           <权重符号=″鸟嘌呤″
              权重=″0.18171296296296297″/>
           <权重符号=″胞嘧啶″
              权重=″0.14004629629629628″/>
           <权重符号=″腺嘌呤″
              权重=″0.20949074074074073″/>
           <权重符号=″胸腺嘧啶″权重=″0.46875″/>
        </栏>
       二<栏位置=″3″>
         <权重符号=″鸟嘌呤″
            权重=″0.10763888888888888″/>
         <权重符号=″胞嘧啶″权重=″0.09375″/>
         <权重符号=″腺嘌呤″
            权重=″0.5983796296296297″/>
         <权重符号=″胸腺嘧啶″
            权重=″0.20023148148148148″/>
        </栏>
       二<栏位置=″4″>
          <权重符号=″鸟嘌呤″
             权重=″0.16782407407407407″/>
          <权重符号=″胞嘧啶″
             权重=″0.1863425925925926″/>
          <权重符号=″腺嘌呤″
             权重=″0.5335648148148148″/>
          <权重符号=″胸腺嘧啶″
             权重=″0.11226851851851852″/>
       </栏>
     </权重矩阵>
   </定位的>
 </约束>
二<约束权重=″20.800433402457763″nolog=″假″>
  二<定位的位置=″309″最大值=″假″>
     <高斯分布宽度=″123.21919574445802″
        偏移=″0″/>
    二<权重矩阵反向=″0.0″
        用最大值标准化=″假″字母表=″DNA″
        栏数=″4″>
       二<栏位置=″0″>
           <权重符号=″鸟嘌呤″
              权重=″0.5205858504341704″/>
           <权重符号=″胞嘧啶″
             权重=″0.1598047165219432″/>
          <权重符号=″腺嘌呤″
             权重=″0.1598047165219432″>
          <权重符号=″胸腺嘧啶″
             权重=″0.1598047165219432″/>
        </栏>
       二<栏位置=″1″>
          <权重符号=″鸟嘌呤″
             权重=″0.1525271710220418″/>
          <权重符号=″胞嘧啶″
             权重=″0.1525271710220418″/>
          <权重符号=″腺嘌呤″
             权重=″0.5424184869338746″/>
          <权重符号=″胸腺嘧啶″
             权重=″0.1525271710220418″/>
        </栏>
       二<栏位置=″2″>
          <权重符号=″鸟嘌呤″
             权重=″0.5571014456775343″/>
          <权重符号=″胞嘧啶″
             权重=″0.14763285144082192″/>
          <权重符号=″腺嘌呤″
             权重=″0.14763285144082192″/>
          <权重符号=″胸腺嘧啶″
             权重=″0.14763285144082192″/>
        </栏>
       二<栏位置=″3″>
          <权重符号=″鸟嘌呤″
             权重=″0.1410134350947342″/>
          <权重符号=″胞嘧啶″
             权重=″0.5769596947157973″/>
          <权重符号=″腺嘌呤″
             权重=″0.1410134350947342″/>
          <权重符号=″胸腺嘧啶″
             权重=″0.1410134350947342″/>
       </栏>
     </权重矩阵>
   </定位的>
 </约束>
二<约束权重=″13.776783968061828″nolog=″假″>
 二<定位的位置=″-29″最大值=″真″>
    <高斯分布宽度=″17.24379973438928″
       偏移=″0″/>
   二<权重矩阵反向=″0.0″
       用最大值标准化=″假″字母表=″DNA″
       栏数=″6″>
     二<栏位置=″0″>
        <权重符号=″鸟嘌呤″
           权重=″0.17708333333333331″/>
        <权重符号=″胞嘧啶″权重=″0.21875″/>
        <权重符号=″腺嘌呤″
        权重=″0.4270833333333333″/>
        <权重符号=″胸腺嘧啶″
           权重=″0.17708333333333331″/>
         </栏>
        二<栏位置=″1″>
           <权重符号=″鸟嘌呤″
              权重=″0.22337962962962962″/>
           <权重符号=″胞嘧啶″
              权重=″0.14467592592592593″/>
           <权重符号=″腺嘌呤″
              权重=″0.3761574074074074″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.25578703703703703″/>
         </栏>
        二<栏位置=″2″>
           <权重符号=″鸟嘌呤″
              权重=″0.19560185185185183″/>
           <权重符号=″胞嘧啶″
              权重=″0.13541666666666666″/>
           <权重符号=″腺嘌呤″
              权重=″0.14004629629629628″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.5289351851851851″/>
         </栏>
        二<栏位置=″3″>
           <权重符号=″鸟嘌呤″
              权重=″0.15393518518518517″/>
           <权重符号=″胞嘧啶″
              权重=″0.16782407407407407″/>
           <权重符号=″腺嘌呤″
              权重=″0.505787037037037″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.1724537037037037″/>
         </栏>
        二<栏位置=″4″>
           <权重符号=″鸟嘌呤″
              权重=″0.24652777777777776″/>
           <权重符号=″胞嘧啶″
              权重=″0.16782407407407407″/>
           <权重符号=″腺嘌呤″
              权重=″0.42245370370370366″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.16319444444444445″/>
         </栏>
        二<栏位置=″5″>
           <权重符号=″鸟嘌呤″
              权重=″0.13541666666666666″/>
           <权重符号=″胞嘧啶″
              权重=″0.19560185185185183″/>
           <权重符号=″腺嘌呤″
              权重=″0.5567129629629629″/>
           <权重符号=″胸腺嘧啶″
              权重=″0.11226851851851852″/>
        </栏>
      </权重矩阵>
    </定位的>
  </约束>
</模型>
Figure G2007800057991D00461
Figure G2007800057991D00471

Claims (8)

1.选自以下组的一个或多个探针或引物对在制备用于诊断个体中卵巢癌或前列腺癌的方法的测试试剂盒中的用途:
(i)MREI2和MF3UTR2;其中MREI2由序列AGAAGATGCAGGCCAACAAT组成,MF3UTR2由序列TGGTTTTAGCTGGGATGGAG组成;
(ii)MREI1和MF3UTR1;其中MREI1由序列CTCGTAAAGCCCAAGGAGGT组成,MF3UTR1由序列GAGGCAGGCAGATCACTTGT组成;
(iii)BR5UTR4和BR3UTR2;其中BR5UTR4由序列GGCTGGAATTGCCCTAAAGT组成,BR3UTR2由序列GCTCTTCCTGCTGGGAAAT组成;
(iv)BR5UTR3和BR3UTR1;其中BR5UTR3由序列CCTATGAGGGGGCAGTATCA组成,BR3UTR1由序列TACAGGGGTGGAGACAGGTT组成;
(v)PR5UTR2和PF3UTR2;其中PR5UTR2由序列CGTGATCCACCCATCTCAG组成,PF3UTR2由序列GGGAAAGGGAGAAGATGAGG组成;和
(vi)PR5UTR1和PF3UTR1;其中PR5UTR1由序列CTATTGGGAGACCGAAGCAG组成,PF3UTR1由序列TAGGGGAAGGTTGAGGAAGG组成;
其中组(i)和(ii)中的所述探针或引物对用于诊断卵巢癌,组(iii)~(vi)中的所述探针或引物对用于诊断前列腺癌;
其中,所述方法包括确定来自所述个体的样品的DNA中是否存在MLH1、BORIS或PSA基因中的环或拓扑封闭的结构,从而检测或诊断所述个体是否具有卵巢癌或前列腺癌;并且其中,所述环或拓扑封闭的结构通过以下步骤进行检测:
-使所述环或拓扑封闭的结构中的DNA交联,
-对已交联的DNA进行限制性消化,
-对已消化的结构进行连接,和
-使用组(i)~(vi)中的所述探针或引物对通过测序或PCR分析/检测在所述已连接的结构中存在的DNA序列。
2.如权利要求1所述的用途,其中,所述方法包括确定所述基因是否包含在某位置的环或拓扑封闭的结构,所述位置不同于所述环或拓扑封闭的结构在所述基因正常表达过程中所出现的位置。
3.如权利要求1所述的用途,其中,所述分析已连接的结构包括检测在所述已连接的结构中存在而在所述基因中不存在的DNA序列。
4.如权利要求3所述的用途,其中,采用PCR反应检测所述已连接的序列的存在,在所述PCR反应中采用所述已连接的序列作为模板,引物成功地形成PCR产物但在相同的PCR条件下并不扩增所述基因序列。
5.如权利要求1所述的用途,其中,所述测试试剂盒用于对个体进行指纹分析,所述对个体进行指纹分析包括通过如前述权利要求中任一项所述的方法对所述个体的2个或所有所述基因的染色体结构进行分析。
6.如权利要求1所述的用途,其中所述测试试剂盒还包含能使DNA交联的物质。
7.如权利要求1所述的用途,其中所述测试试剂盒还包含限制性酶和/或连接酶。
8.如权利要求1所述的用途,其中所述测试试剂盒还包含DNA聚合酶。
CN2007800057991A 2006-02-17 2007-02-19 正常和异常基因表达中的dna构象(环结构) Active CN101384734B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0603251.0 2006-02-17
GBGB0603251.0A GB0603251D0 (en) 2006-02-17 2006-02-17 DNA conformation
PCT/GB2007/000564 WO2007093819A2 (en) 2006-02-17 2007-02-19 Dna conformation (loop structures) in normal and abnormal gene expression

Publications (2)

Publication Number Publication Date
CN101384734A CN101384734A (zh) 2009-03-11
CN101384734B true CN101384734B (zh) 2013-10-30

Family

ID=36142050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800057991A Active CN101384734B (zh) 2006-02-17 2007-02-19 正常和异常基因表达中的dna构象(环结构)

Country Status (16)

Country Link
US (2) US9777327B2 (zh)
EP (1) EP1991697B1 (zh)
JP (1) JP5345857B2 (zh)
CN (1) CN101384734B (zh)
AT (1) ATE519864T1 (zh)
AU (1) AU2007216315B2 (zh)
CA (1) CA2642331C (zh)
DK (1) DK1991697T3 (zh)
ES (1) ES2368767T3 (zh)
GB (1) GB0603251D0 (zh)
HK (1) HK1125416A1 (zh)
MY (1) MY182608A (zh)
NO (1) NO343718B1 (zh)
NZ (1) NZ571201A (zh)
WO (1) WO2007093819A2 (zh)
ZA (1) ZA200807948B (zh)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0603251D0 (en) 2006-02-17 2006-03-29 Isis Innovation DNA conformation
CA2740028A1 (en) 2008-01-23 2009-07-30 Herlev Hospital Ykl-40 as a general marker for non-specific disease
GB0810051D0 (en) * 2008-06-02 2008-07-09 Oxford Biodynamics Ltd Method of diagnosis
CA2737292A1 (en) 2008-09-15 2010-03-18 Herlev Hospital Ykl-40 as a marker for gastrointestinal cancers
EP4063518A1 (en) * 2010-07-09 2022-09-28 Cergentis B.V. V3-d genomic region of interest sequencing strategies
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
CN113528634A (zh) 2012-08-14 2021-10-22 10X基因组学有限公司 微胶囊组合物及方法
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3567116A1 (en) 2012-12-14 2019-11-13 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
KR20200140929A (ko) 2013-02-08 2020-12-16 10엑스 제노믹스, 인크. 폴리뉴클레오티드 바코드 생성
SG11201508985VA (en) 2013-05-23 2015-12-30 Univ Leland Stanford Junior Transposition into native chromatin for personal epigenomics
AU2015243445B2 (en) 2014-04-10 2020-05-28 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
CN113249435B (zh) 2014-06-26 2024-09-03 10X基因组学有限公司 分析来自单个细胞或细胞群体的核酸的方法
CA2956925C (en) 2014-08-01 2024-02-13 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
AU2015339148B2 (en) 2014-10-29 2022-03-10 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequencing
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
WO2016114970A1 (en) 2015-01-12 2016-07-21 10X Genomics, Inc. Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
CA2976902A1 (en) 2015-02-17 2016-08-25 Dovetail Genomics Llc Nucleic acid sequence assembly
WO2016138148A1 (en) 2015-02-24 2016-09-01 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
US10697000B2 (en) 2015-02-24 2020-06-30 10X Genomics, Inc. Partition processing methods and systems
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
WO2016207647A1 (en) * 2015-06-24 2016-12-29 Oxford Biodynamics Limited Epigenetic chromosome interactions
KR20180096586A (ko) 2015-10-19 2018-08-29 더브테일 제노믹스 엘엘씨 게놈 어셈블리, 하플로타입 페이징 및 표적 독립적 핵산 검출을 위한 방법
WO2017096158A1 (en) 2015-12-04 2017-06-08 10X Genomics, Inc. Methods and compositions for nucleic acid analysis
SG11201807117WA (en) 2016-02-23 2018-09-27 Dovetail Genomics Llc Generation of phased read-sets for genome assembly and haplotype phasing
GB201608000D0 (en) 2016-05-06 2016-06-22 Oxford Biodynamics Ltd Chromosome detection
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
EP3954771A1 (en) 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
WO2018100381A1 (en) 2016-12-01 2018-06-07 Oxford Biodynamics Limited Application of epigenetic chromsomal interactions in cancer diagnostics
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
JP7045086B2 (ja) * 2016-12-23 2022-03-31 オックスフォード バイオダイナミックス パブリック リミテッド カンパニー 分類法
EP4310183A3 (en) 2017-01-30 2024-02-21 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
US20180340169A1 (en) 2017-05-26 2018-11-29 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CN109526228B (zh) 2017-05-26 2022-11-25 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
CA3078675A1 (en) 2017-11-03 2019-05-09 Oxford Biodynamics Limited Genetic regulation
CN111051523B (zh) 2017-11-15 2024-03-19 10X基因组学有限公司 功能化凝胶珠
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
WO2019195166A1 (en) 2018-04-06 2019-10-10 10X Genomics, Inc. Systems and methods for quality control in single cell processing
JP2022523564A (ja) 2019-03-04 2022-04-25 アイオーカレンツ, インコーポレイテッド 機械学習を使用するデータ圧縮および通信
CN114729351A (zh) * 2019-11-15 2022-07-08 相位基因组公司 从组织样品进行染色体构象捕获
CN114550817B (zh) * 2022-01-25 2022-12-23 云南大学 基于多特征的ctcf介导染色质环预测方法
CN114841294B (zh) * 2022-07-04 2022-10-28 杭州德适生物科技有限公司 一种检测染色体结构异常的分类器模型训练方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1428439A (zh) * 2001-12-27 2003-07-09 赵兴波 利用线粒体dna指纹进行动物遗传信息鉴定的方法
CN1515692A (zh) * 2003-01-02 2004-07-28 缪金明 “锚定点灯”式寡核苷酸芯片的检测技术

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002220521A1 (en) 2000-11-29 2002-06-11 Statens Seruminstitut A screening assay for detecting chromosome rearrangements or recombinations
WO2005078139A2 (en) 2004-02-09 2005-08-25 Thomas Jefferson University DIAGNOSIS AND TREATMENT OF CANCERS WITH MicroRNA LOCATED IN OR NEAR CANCER-ASSOCIATED CHROMOSOMAL FEATURES
US20060015264A1 (en) 2004-06-02 2006-01-19 Mcshea Andrew Interfering stem-loop sequences and method for identifying
RU2478716C2 (ru) * 2005-07-04 2013-04-10 Эрасмус Юниверсити Медикал Сентр Улавливание и характеристика совместно локализованного хроматина
GB0603251D0 (en) 2006-02-17 2006-03-29 Isis Innovation DNA conformation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1428439A (zh) * 2001-12-27 2003-07-09 赵兴波 利用线粒体dna指纹进行动物遗传信息鉴定的方法
CN1515692A (zh) * 2003-01-02 2004-07-28 缪金明 “锚定点灯”式寡核苷酸芯片的检测技术

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
Blanton Jason et al,.Protein:protein interactions and the pairing of boundary elements in vivo.《GENES& DEVELOPMENT》.2003,第17卷(第5期),664-675.
Blanton Jason et al,.Protein:protein interactions and the pairing of boundary elements in vivo.《GENES&amp *
Byrd K, and Corces V.,.Visualization of chromatin domains created by the gypsy insulator of Drosophila.《The Journal of Cell Biology》.2003,第162卷(第4期),565-574. *
Dekker J, et al,.Capturing Chromosome Conformation.《Science》.2002,第295卷(第5558期),1306. *
DEVELOPMENT》.2003,第17卷(第5期),664-675. *
Job Dekker.A closer look at long-range chromosomal interactions.《TRENDS in Biochemical Sciences》.2003,第28卷(第6期),277-280. *
Parnell T., et al,.An endogenous Suppressor of Hairy-wing insulator separates regulatory domains in Drosophila.《PNAS》.2003,第100卷(第23期),13436-13441. *
Wei Guo et al,.Mechanisms of Methotrexate Resistance in Osteosarcoma.《Clinical Cancer Research》.1999,第5卷621-627. *

Also Published As

Publication number Publication date
US9777327B2 (en) 2017-10-03
CN101384734A (zh) 2009-03-11
MY182608A (en) 2021-01-26
US20090186352A1 (en) 2009-07-23
US11384396B2 (en) 2022-07-12
AU2007216315B2 (en) 2012-10-04
CA2642331A1 (en) 2007-08-23
WO2007093819A3 (en) 2007-10-04
NO20083957L (no) 2008-11-14
WO2007093819A2 (en) 2007-08-23
ATE519864T1 (de) 2011-08-15
AU2007216315A1 (en) 2007-08-23
NZ571201A (en) 2011-07-29
ZA200807948B (en) 2009-11-25
CA2642331C (en) 2018-06-19
GB0603251D0 (en) 2006-03-29
US20180080081A1 (en) 2018-03-22
EP1991697A2 (en) 2008-11-19
HK1125416A1 (en) 2009-08-07
NO343718B1 (no) 2019-05-20
ES2368767T3 (es) 2011-11-22
JP5345857B2 (ja) 2013-11-20
JP2009526543A (ja) 2009-07-23
DK1991697T3 (da) 2011-09-19
EP1991697B1 (en) 2011-08-10

Similar Documents

Publication Publication Date Title
CN101384734B (zh) 正常和异常基因表达中的dna构象(环结构)
KR102622309B1 (ko) 염색체 상호작용의 검출
CN103403181B (zh) ncRNA及其用途
Jiang et al. The sheep genome illuminates biology of the rumen and lipid metabolism
Frio et al. DICER1 mutations in familial multinodular goiter with and without ovarian Sertoli-Leydig cell tumors
US20230304103A1 (en) Systems and methods for detecting genetic alterations
Tejpar et al. Prognostic and predictive biomarkers in resected colon cancer: current status and future perspectives for integrating genomics into biomarker discovery
Jing et al. Tazarotene-induced gene 1 (TIG1) expression in prostate carcinomas and its relationship to tumorigenicity
CN101646783B (zh) 新型癌症标记物
Kim et al. Discovery of a novel, paternally expressed ubiquitin-specific processing protease gene through comparative analysis of an imprinted region of mouse chromosome 7 and human chromosome 19q13. 4
CN109182521B (zh) circRNA作为甲状腺乳头状癌标志物的应用
KR20190025814A (ko) 유방암과 관련된 염색체 상호 작용의 검출
CN102439174B (zh) 基于检测slc45a3-elk4融合转录子的用于诊断前列腺癌的组合物和方法
JP2023054163A (ja) 融合遺伝子及び/又はエクソンスキッピングにより生ずる転写産物を検出するためのプローブ及び方法
Nance et al. Canine models of human cancer: Bridging the gap to improve precision medicine
Portman Profiling C. elegans gene expression with DNA microarrays
CN110452989A (zh) 生物标志物在胃癌检测、诊断中的应用
WO2019091429A1 (en) Unique genetic fingerprints for murine tumor model and uses thereof
JP2007082433A (ja) 悪性脳腫瘍マーカー遺伝子およびその用途
CN110055333A (zh) Rp11-116o18.1作为分子标志物在肺癌中的应用
Hasegawa et al. Sequence analysis of the 5′-flanking regions of human dihydropyrimidine dehydrogenase gene: identification of a new polymorphism related with effects of 5-fluorouracil
Yue et al. Prognostic Value of Long Non-Coding RNA Long Intergenic Non-Protein Coding RNA 1586 in Pancreatic Cancer
Blacklock Application of Genomics to Identify Novel Prognostic Biomarkers for Cancers in Dogs
Shelton et al. Long-read sequencing for brain tumors
Gulsuner et al. Long-read DNA and cDNA sequencing identify cancer-predisposing deep intronic variation in tumor-suppressor genes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Oxfordshire

Patentee after: University of Oxford Innovation Co., Ltd.

Address before: Oxfordshire

Patentee before: ISIS Innovaton Ltd.