CN1643162A - 新的hmga等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用 - Google Patents

新的hmga等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用 Download PDF

Info

Publication number
CN1643162A
CN1643162A CNA038061198A CN03806119A CN1643162A CN 1643162 A CN1643162 A CN 1643162A CN A038061198 A CNA038061198 A CN A038061198A CN 03806119 A CN03806119 A CN 03806119A CN 1643162 A CN1643162 A CN 1643162A
Authority
CN
China
Prior art keywords
animal
polymorphism
hmga
gene
genotype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038061198A
Other languages
English (en)
Inventor
马克斯·F·罗思柴尔德
金关石
月·树·阮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Iowa Research Foundation UIRF
Iowa State University Research Foundation ISURF
Original Assignee
Iowa State University Research Foundation ISURF
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iowa State University Research Foundation ISURF filed Critical Iowa State University Research Foundation ISURF
Publication of CN1643162A publication Critical patent/CN1643162A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明揭示了可用作动物生长、脂肪量、肉质和饲料消耗比的遗传标记,鉴别这些标记的方法,及筛选动物以确定更可能产生所需生长、脂肪量、肉质及饲料消耗比的方法,并优选选择那些动物进行以后的育种目的。所述遗传标记基于HMGA核苷酸序列中存在或缺少某种多态性。

Description

新的HMGA等位基因及作为生长、脂肪量、肉质及饲料消耗比性 状遗传标记的应用
发明背景:
遗传多态性存在于动物个体之间,也存在于通过育种技术得到的具有所需特征的品种之间。例如,中国品种已知性成熟早、产崽数高,而美国品种已知生长迅速、瘦肉率高。然而,所需性状的遗传度往往较低,而且依据表型变异选择动物的传统育种方法并没有充分地考虑存在的遗传变异和复杂的基因相互作用。
已经有几个研究小组用限制性片段长度多态性(RFLP)分析研究了猪的DNA。在此并入参考的Jung等Theor.Appl.Genet.,77:271-274(1989)报道了他们使用RFLP技术显示两个猪品种间的遗传变异。这些品种中证明了猪白细胞抗原(SLA)I类基因的多态性。在此并入参考的Hoganson等在Abstract for Annual Meeting ofMidwestern Section of the American Society of Animal Science,March26-28,1990中也报道了RFLP分析所证明的中国猪猪主要组织相容性复合体(MHC)基因的多态性。在此并入参考的Jung等在Theor.Appl.Genet.,77:271-274(1989)中还报道了对某些公猪中SLA I类基因的RFLP分析。作者提出结果提示猪SLA/MHC I类基因和猪的生殖及行为性状之间可能相关。他们进一步提出应用SLA I类限制性片段作为遗传标记,将来很可能会有助于我们改良猪的生长行为。
要追踪特定有利遗传等位基因包括新的及冗长的鉴别主要效应基因的DNA分子标记的方法。。标记可能与具有主效的单个基因连锁,也可能与具有附加效果的多个基因连锁。DNA标记有一些优点:易于分离测量而且明确,并且DNA标记是共显性的,即能明确地区分杂合子和纯合子动物。一旦建立了一个标记系统,那么选择就很容易进行了,因为从动物幼体甚至是胚胎中获得组织或血液样本后,可以随时进行DNA标记的检测。
受体基因遗传差异的应用已经成为了进行选择的一个重要标记系统。例如,Rothschild等人的美国专利5,550,024和5,374,526揭示了与产崽数提高相关的猪雌激素受体基因的多态性,其在此并入参考;美国专利号5,935,784揭示了与产崽数提高和总体繁殖率相关的猪促乳素受体基因的多态性标记。
生猪肉的质量受到多种遗传和非遗传因素的影响。后者包括农场、运输、屠宰和加工条件。肉类科学家针对这些因素已经进行了大量的研究,从而大大提高了猪肉的质量。部分研究针对动物的遗传背景,而且一些研究揭示了遗传因素的重要性。这使工业上意识到动物选择性育种和基因技术在提高猪肉质量方面可以起到重要的作用。
DNA水平的信息可以有助于确定特定的主效基因,但它同时也有助于就我们选定的数量性状进行选择。除了表型数据,分子信息可以提高选择的精确度从而提高选择应答。许多科研工作者已经从理论角度对这样一个标记辅助选择系统(Marker Assisted Selection)(MAS)程序中的额外应答的大小进行了研究。总的来说,MAS对于遗传度低及测量表型昂贵的表型而言更为有益。尽管如生长、脂肪量、肉质及饲料消耗比的性状通常并不用这种方法来考量,但就这些性状而言,使用标记进行选择仍然有非常明显的优点。例如,Meuwissen和goddard分析了MAS对不同类型性状的影响。如肉质的性状在屠宰后测量的性状中受到的影响最大并且结合标记信息信息额外的应答可以达到64%。对生长性状这种在活体动物上测量的性状而言,这个数字相对要小,是8%。但是,一旦证明这种关联的存在,那么在表型测试或是选择动物之前(参见下文),可以使用这个标记信息,这样预计可以取得最高达38%的应答。
确实,从遗传上改良经济性状的最佳途径是在待选的群体中直接寻找相关的DNA标记。在育种机构的核心动物群的一些动物中可以连续进行表型测量。由于这些性状中的绝大多数只能在屠宰后才能得到完整评估,因此数据只能取自被选择的动物而不能得自潜在的育种动物。
收集这些表型数据以便能够检测出相关的DNA标记,并使用实验种群确证鉴别的标记或测试候选基因。明显的标记或基因可以直接运用到选择方法中。这种分子信息的一个优点在于我们能在育种动物还非常年幼时就获得它,意味着可以在完成生长行为测试之前就基于DNA标记预选择动物。这对总体测试和选择系统而言是非常有利的。
从前述的内容我们可以看到,需要鉴别遗传标记,其可以用于在基因水平通过鉴别及选择具有改良性状的动物而改良具有经济价值的有益性状。
本发明的一个目的是提供基于或在编码HMGA的核苷酸序列中的遗传标记,其是如生长、脂肪量、肉质及饲料消耗比等具有经济价值的有利性状的一个表征。
本发明的另一个目的是提供确定这个遗传标记是否存在的检测方法。
另一个目的是提供一种评估动物的方法,该方法提高了针对所需性状的选择及育种方法的精确性。
此外本发明的另一个目的是提供一种PCR扩增的检测方法,其可以快速确定该标记是否存在。
本发明的其他目的和优点一部分将在下文说明书中得到说明,而且也可以部分地由说明书中明显得出,或是通过实施本发明了解到。本发明的目的和优点可以通过所附权利要求中的手段及特别指出的组合实现。
发明概述
本发明涉及编码HMGA的核苷酸序列的不同基因形式的发现,其可以用于对追踪动物品系的遗传鉴别及作为与动物的生长、脂肪量、肉质和饲料消耗比性状相关的遗传标记。这些基因在物种和动物之间都是保守的,预计此处揭示的不同等位基因也与其它经济或产肉动物如牛、羊、鸡等的这些基因的多态性相关。
为了达到所述目的并依照本发明的目的,如此处包含及广泛描述的,本发明提供了不同基因型的发现,其提供了遗传分型动物及筛选动物以确定更有可能具备有利的生长、脂肪量、肉质及饲料消耗比性状的动物或选择淘汰具有表明较不利的生长、脂肪量、肉质及饲料消耗比性状的动物的方法。此处所说的“有利的生长、脂肪量、肉质、饲料消耗比性状”是指多个可测量的生长、脂肪量、肉质、饲料消耗比性状中之一相比一个给定群体的平均值,有显著的改良(增高或降低),所以这个信息可以用于育种中以获得一个在生长、脂肪量、类质、饲料消耗比方面优化的均一群体,这可以包括根据所需性状,提高某些性状或降低其它性状。如欲了解一些经济性状的例子,可参考以下文献:Sosnicki,A.A.,E.R.Wilson,E.B.Sheiss,A.deVries,1998“Is there a cost effective way to produce high quality pork?”,ReciprocalMeat Conference Proceedings,Vol.51.
因此,本发明提供了筛选动物以鉴别更可能产生有利的生长、脂肪量、肉质及饲料消耗比,或不太可能产生这些有利的生长、脂肪量、肉质及饲料消耗比的动物的的方法,以对最佳生长、脂肪量、肉质及饲料消耗比优化育种及选择技术。
检测这些性状的方法一般包括以下步骤:1)从动物中获取生物学样品;及2)分析1)中获得的基因组DNA或蛋白质,确定存在哪种HMGA等位基因。也可以使用单元型数据,其将HMGA基因的一系列多态性运用到选择或鉴别方案中以最大化这些标记的益处。
由于一些多态性可能在于HMGA蛋白氨基酸组成的变化,或是表明存在这种变化,因此检测方法甚至也可以包括对HMGA蛋白氨基酸组成的确定。进行这样的纯化和分析的方法典型地涉及通过包括荧光标记抗体的手段分离蛋白,分离纯化蛋白(即利用反相HPLC系统),及使用自动蛋白质测序仪鉴定存在的氨基酸序列。这些检测使用的方法是本领域中已经标准化并已知的,如Ausubel等(eds.),ShortProtocols in Molecular Biology Fourth ed.John Wiley and Sons 1999所揭示。
一个优选的实施方案中,分析了遗传样品。简而言之,从动物中获取遗传物质样品,并分析该样品以确定是否含有与改良的生长、脂肪量、肉质、饲料消耗比相关的HMGA核苷酸序列多态性。
本领域技术人员熟知,要比较核酸分子之间的序列差异,有多种技术可以应用。这些包括比如限制性片段长度多态性分析、异源双链分析、单链构象多态性分析、变性梯度电泳和温度梯度电泳。
一个优选的实施方案中,多态性是限制性片段长度多态性,其检测包括以下步骤:从分离的遗传物质中鉴定动物的HMGA基因;将该基因暴露于限制性酶以产生该基因的长度不同的限制片段;分离限制片段形成限制性图谱,如通过电泳或HPLC分离;及比较从已知含有或不含有所述标记的HMGA核苷酸序列得到的限制性片段图谱。如果一个动物对标记测试呈阳性,可以考虑将这样的动物纳入育种计划。如果动物对标记基因型测试不呈阳性,则可以将它挑出用作他用。单元型数据的应用还可以与筛选与生长、脂肪量、肉质和饲料消耗比的不同方面的复等位基因相组合。
最优选的实施方案中,通过使用引物及DNA聚合酶扩增含有多态性的这些基因的特异区域来分离这些基因。然后用限制性酶消化扩增的区域并分离得到的片段。显示RFLP图谱可以通过对片段进行简单染色进行,或者通过标记扩增过程中使用的引物或核苷三磷酸。
另一个实施方案中,本发明包含了在特定的动物群体中鉴定有关生长、脂肪量、肉质及饲料消耗比的遗传标记的方法。繁殖同一个品种或杂交种或是相似遗传品系的雌性动物和雄性动物,并确定每个动物的生长、脂肪量、肉质和饲料消耗比。鉴别每个动物的一个或全部两个HMGA等位基因的多态性,并将其与生长、脂肪量、肉质及饲料消耗比相关联。优选地,使用RFLP分析确定多态性。
另一个实施方案中,本发明包含了对任意的一种特定经济动物进行生长、脂肪量、肉质及饲料消耗比的遗传标记鉴别的方法。基于这个基因在不同动物中的高度保守性,推测仅用上述常规检测方法可以将该标记应用到不同动物中,以基于此处的教导进行生长、脂肪量、肉质、饲料消耗比的选择。繁殖同一个品种或杂交种或是具有相似遗传品系的雌性和雄性动物,并确定每个动物的生长、脂肪量、肉质和饲料消耗比并相关联。对于可以获取其序列的其它动物,可以使用BLAST对比确定特定等位基因是否与此处揭示的一个等位基因相似。这种相似的多态性存在于其它动物和其他紧密相关的基因中。术语“相似的多态性”应该是由BLAST对比确定的与上述任一相同的多态性。
以下术语用于描述两个或多个核酸或多核苷酸之间的序列关系:(a)“参考序列”,(b)“对比窗”,(c)“序列一致性”,(d)“序列一致性比例”和(e)“实质一致性”。
(a)此处所用“参考序列”是一个用于序列对比基础的确定的序列,此处指参考HMGA序列。一个参考序列可以是一个特异序列的一部分或全部,例如全长cDNA或基因序列的一部分,或是全部cDNA或基因序列。
(b)此处所用“对比窗”指一个多核苷酸序列的一个连续且特异的片段,其中该多核苷酸序列可以与一个参考序列相对比,而且其中对比窗中的该部分多核苷酸序列与参考序列(其没有添加或缺失)相比,可以包含添加或缺失(即,缺口),以充分地对比这两个序列。一般而言,对比窗在长度上至少要有20个连续的核苷酸,也任意地可以是30、40、50、100甚至更多。本领域技术人员了解为避免由于多核苷酸序列含有缺口而导致的与参考序列的高相似性,典型地要引入一个缺口惩罚值,并从匹配数中减去。
本领域熟知对比序列的对比方法。最佳的序列对比的对比可以采用局部同源性算法(Local Homology Algorithm),Smith and Waterman,Adv.Appl.Math.2:482(1981);同源性对比算法(Homology AlignmentAlgorithm),Needleman and Wunsch,J.Mol.Biol.48:443(1970);寻似法(Search for Similarity Method),Pearson and Lipman,Proc.Natl.Acad.Sci.85:2444(1988);以及这些算法的计算机化应用,包括但非限于:Intelligenetics,Mountain View,California开发的PC/Gene程序中的CLUSTAL;Genetics Computer Group(GCG),575 Science Dr.,Madison,Wisconsin,USA开发的Wisconsin Genetics Software Package中的GAP、BESTFIT、BLAST、FASTA和TFASTA;CLUSTAL程序在以下文献中有详细的描述:Higgins and Sharp,Gene 73:237-244(1988);Higgins and Sharp,CABIOS 5:151-153(1989);Corpet,et al.,NucleicAcids Research 16:10881-90(1988);Huang,et al.,ComputerApplications in the Biosciences 8:155-65(1992);及Pearson,et al.,Methods in Molecular Biology 24:307-331(1994)。可用于数据库相似性搜寻的BLAST系列程序包括:用于将核苷酸查询序列与核苷酸数据库序列进行对比的BLASTN;用于将核苷酸查询序列与蛋白质数据库序列进行对比的BLASTX;用于将蛋白质查询序列与蛋白质数据库序列进行对比的BLASTP;用于将蛋白质查询序列与核苷酸数据库序列进行对比的TBLASTN;以及用于将核苷酸查询序列与核苷酸数据库序列进行对比的TBLASTX。参见Current Protocols in MolecularBiology,Chapter 19,Ausubel,et al.,Eds.,Greene Publishing andWiley-Interscience,New York(1995)。
除非另有说明,本文提供的序列一致性/相似性数值指的是使用BLAST 2.0版本中的全套程序、在参数设为默认值下获得的数值。参见Altschul et al.,Nucleic Acids Res.25:3389-3402(1997)。进行BLAST分析的软件可公开获得,例如国家生物技术信息中心( http://www.hcbi.nlm.nih.gov/)。
这个算法首先要确定“高得分序列对”(high scoring sequencepairs)(HSPs),从查询序列中鉴定一个长度为W的短字,与数据库序列中相同长度的一个字对比时,其匹配或满足某个正数阈值分值T。T被称为邻近字分值阈值(neighborhood word score threshold)(Altschul et al.,同上)。这些初始的邻近字采样(neighborhood wordhits)作为起始搜寻发现含有其的更长的HSPs的种子。只要累积对比分值还能增加,字采样就沿每个序列向两个方向延伸。对于核苷酸序列,使用参数M(一对匹配残基的奖励分值,总是>0)和N(对错配残基的惩罚分值,总是<0)计算累积分值。对于氨基酸序列,利用一个得分矩阵(scoring matrix)来计算累积分值。字采样向每个方向延伸在下列情况时停止:累积对比分值比其得到的最大值小X;由于一或多个负分值残基对比的累积,累积分值等于或小于0;或者到了一个序列的端点。BLAST算法的参数W、T和X决定了对比的灵敏度和速度。(核苷酸序列)BLASTN程序使用的缺省设置为字长(W)为11,期望值(E)为10,落差值为100,M=5,N=-4,并且对比两条链。对于氨基酸序列,BLASTP程序使用的缺省设置为字长(W)为3,期望值(E)为10,及得分矩阵为BLOSUM62(参见Henikoff& Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)。
除计算序列一致性百分比外,BLAST算法也可对两个序列之间的相似性进行统计分析(参见,例如Karlin & Altschul,Proc.Natl.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的相似性的一种测量方法是最小总可能性(smallest sum probability)(P(N)),其表示两个核苷酸或氨基酸序列随机配对的可能性。
BLAST搜寻假设蛋白质可以被模型化为随机序列。然而,很多真实的蛋白质包含非随机序列区域,其可能是同聚物序列(homopolymeric tracts)、短周期重复序列或是富含一或多种氨基酸的区域。可以在非相关蛋白质之间对比这些低复杂性区域,尽管其它区域可能完全不同。可以使用多个低复杂性过滤程序减少这些低复杂性对比。例如,可以单独或组合使用SEG(Wooten and Federhen,Comput.Chem.,17:149-163(1993))和XNU(Claverie and States,Comput.Chem.,17:191-201(1993))低复杂性过滤程序。
(c)本文中两个核酸或多肽序列的“序列一致性”或“一致性”是指当就一个特异的对比窗进行最大对应对比时,两序列中相同的残基。当在蛋白质中使用序列一致性百分比时,认为不一致的残基位置通常由保守的氨基酸取代造成不同,其中氨基酸残基被其它有相似化学性质(比如带电情况和疏水性)的氨基酸残基所取代,因此并不改变分子的功能性质。当序列在保守取代上有差异,可以上调序列一致性百分比以校正该取代的保守性质。由于保守取代有差异的序列被称为具有“序列相似性”或“相似性”。本领域技术人员熟知进行这种调整的方法。典型地,这需要将一个保守取代看作部分的而不是完全的错配来得分,因而提高了序列一致性百分比。因此,例如,当一个相同氨基酸给1分,一个非保守取代给0分时,那么一个保守取代给分在0到1之间。保守取代的得分是通过计算得出的,比如可以依照Meyers and Miller,Computer Applic.Biol.Sci.,4:11-17(1988)例如,如程序PC/GENE(Intelligenetics,Mountain View,California,USA)中提到的算法。
(d)“序列一致性百分比”指通过对一个对比窗对比两条最佳对比的序列确定的数值,其中与参考序列(其不包含添加或缺失)相比,该对比窗的多核苷酸序列部分可以包含添加或缺失(即,缺口),以最佳对比这两个序列。通过如下方法计算该百分比:确定两个序列中相同核酸碱基或氨基酸残基所在的位点数以确定匹配位点数,将匹配位点数除以对比窗中所有位点数再乘以100以计算出序列一致性百分比。
(e)术语多核苷酸序列的“实质一致性”是指一个多核苷酸包含这样一段序列,使用上述标准参数设置的对比程序之一确定,其相比于一个参考序列具有至少70%序列一致性、优选至少80%,更优选至少90%及最优选至少95%的序列一致性。本领域技术人员已知可以在考虑密码子兼并性、氨基酸相似性、阅读框的定位等的前提下,可以适当地调整这些值以确定两个核苷酸序列所编码的蛋白质的一致性。为此目的,氨基酸序列的实质一致性一般是指序列的一致性至少为60%,或优选至少为70%、80%、90%,及最优选至少为95%。
这些程序和算法可以在一个靶基因中确定特定多态性与本文所述的多态性之间的相似性。预计这种多态性在其它动物中也存在,而且在其它动物中对这种多态性的利用可以依照本文的提示,通过简单地参数优化就可以实现。
另外,还可能在不同DNA标记的特异等位基因与已知与特定基因(如本文讨论的HMGA基因)相关的DNA标记的等位基因之间建立连锁,其已显示与特定性状相关。因此,在现有情况下,利用一个或全部两个HMGA基因,通过选择不同染色体标记的特异等位基因而选择HMGA相关标记的某些等位基因,至少在短期内可以间接选择可能产生所需的生长、脂肪量、肉质和饲料消耗比的动物,或是淘汰在可能产生非所需的生长、脂肪量、肉质和饲料消耗比的动物。本文所说的“遗传标记”不应该仅仅包括通过检测多态性相关的蛋白质变化、连锁标记、使用微卫星手段揭示的核苷酸多态性,还甚至包括检测标记表明的蛋白变化及使用其影响动物生长、脂肪量、肉质和饲料消耗比的手段揭示的核苷酸多态性。
正如本文所用,通常一个特定多态性是以一个特定限制性酶的名称来命名。这并不意味着识别该位点的唯一途径就是使用这种限制性酶。本领域技术人员可以获得许多数据库和资源鉴定其他可用于鉴定特定多态性的限制性酶例如 http://darwin.bio.geneseo.edu,其可以依据待鉴定的序列和多态性的分析,给出限制性酶。实际上,本文也表明有多种不同方法可以鉴定特定多态性或等位基因,其可能甚至都不使用限制性酶,但其检测相同的遗传或蛋白质组的不同形式。
并入的作为本文说明书组成部分的附图阐明了本发明的一个实施方案,并且与说明书一起阐明本发明的原理。
附图说明
图1a和b示出了HMGA I的BanI(a)和NaeI(b)PCR-RFLP测试结果。
图2示出了HMGA2的HhaI PCR-RFLP测试结果。
图3是猪hmga1的共有序列(SEQ ID NO:19)。
下划线及粗体字标示出的是两个BanI识别位点。其中一个在54位含有单核苷酸多态性。NaeI多态性位点(GCYGGC)以下划线表示。
Y=C或T。
图4是猪hmga2的一个共有序列,长度:1168。三个HhaI识别位点(GCGC)以下划线表示,其中两个同时加亮,其含有DNA多态性。SEQ ID NO:20。
框1是Mix1的近似PCR片段。
框2是Mix2的近似PCR片段。
K=G或T
Y=C或T
图5是表中所示的Berkshire和Yorkshire杂交品种猪1号染色体的重组频率图(recomb.Frac.,Kosambi cM):
图6是Berkshire和Yorkshire杂交品种猪7号染色体的遗传图谱。性平均值图(recomb.frac.,Kosambi cM)。
图7总结了HMGA1的其它引物位置和区域。
图8是猪HMGA1的DNA序列(重叠群(contig)1)长度:2484bp.SEQ ID NOS:21-24
图9是猪HMGA1的DNA序列(重叠群2)长度:1103 bp.NOS:25-29
发明详述
以下参考文献将详细说明本发明的实施方案,与以下的实施例一起解释本发明的原理。
本发明涉及与动物有经济价值的性状有关的遗传标记。该标记代表与生长、脂肪量、肉质及饲料消耗比性状显著相关的等位基因,因此本发明提供了一种育种时筛选动物以确定可能更可能产生所需生长、脂肪量、肉质及饲料消耗比(一个或全部这些性状)的动物的方法,通过鉴别与所需生长、脂肪量、肉质及饲料消耗比相关的一或两个HMGA核苷酸序列多态性的存在与否来进行。
因此,本发明涉及鉴别特定品种(breed)、种系(strain)、种群(population)或群体(group)动物的遗传标记以及鉴定这些标记的方法,由此可以筛选出具备所需的生长、脂肪量、肉质及饲料消耗比的动物。
本发明鉴定了与动物改良性状相关的HMGA核苷酸序列的新等位基因。本发明的一个实施方案中,已经示出通过BanI或NaeI限制性位点识别的新的猪HMGA1等位基因与较低的脂肪含量和其它如脂肪、生长、肉质和/或饲料消耗比性状相关。另一个实施方案中,已经鉴定了与脂肪和生长性状相关的HMGA2基因的一个新的HhaI识等位基因。在另一个实施方案中,已经示出所述标记一起具有加性效应(additive effect)。
可以使用任何可以鉴定这个标记存在与否的方法,包括例如单链构象多态性(SSCP)分析、碱基切除序列扫描(BESS)、RFLP分析、异源双链分析、变性梯度凝胶电泳及温度梯度电泳、等位基因PCR、连接酶链式反应直接测序、微测序、核酸杂交、微阵列检测HMGA基因或其它HMGA基因连锁序列。而且本发明的范围还包括了在这个多态性存在的情况下对蛋白质构象或序列变化的检测。多态性可能不是导致突变出现的原因,但它指示这个变化的存在,而且可以同时检测表型差异的遗传或蛋白质基础。
以下内容是可以用于检测本发明的多态性的技术的一般性回顾。
本发明中,从动物中取得遗传物质样品。样品可以来自血液、组织、精液等。一般常使用外周血细胞作为来源,并且遗传物质是DNA。获得足够量的细胞以提供供分析用的足量的DNA。本领域技术人员已知或容易确定这个量。通过本领域技术人员已知的技术从血细胞中分离DNA。
核酸的分离和扩增
基因组DNA样品可以分离自任何方便地来源,所述来源包括唾液、口腔细胞、毛根、血液、脐带血(cord blood)、羊水、组织液、腹膜液、绒毛膜绒毛,以及有完整分裂间期(interphase)细胞核的其它合适的细胞或组织样品或分裂中期细胞。这些细胞可以取自实体组织,如新鲜或保存的器官或组织样品或活检组织。所述样品可以含有在自然状态下不与生物物质如防腐剂、抗凝剂、缓冲液、固定剂、营养物质、抗生素等混合的化合物。
从多种这些来源中分离基因组DNA的方法在例如Kirby,DNAFingerprinting,An Introduction,W.H.Freeman & Co.New York(1992)中描述。基因组DNA还可以分离自来自任一上述组织样品的培养的原代或二级细胞培养物或转化细胞系。
还可以使用动物的RNA样品。RNA可以依照Sambrook et al.,如上描述的从表达HMGA基因的组织中分离。RNA可以是总细胞RNA、mRNA、poly A+RNA或其任意组合。为获得最好的效果,纯化该RNA,但也可以用未经纯化的胞浆RNA。可以将RNA逆转录出DNA,所得DNA用作扩增模板,以便PCR间接扩增特定RNA转录产物。见,例如Sambrook,同上,Kawasaki et al.,Chapter 8 in PCRTechnology,(1992)同上,和Berg et al.,Hum.Genet.85:655-658(1990)。
PCR扩增
最常用的扩增手段是聚合酶链式反应(PCR),如美国专利Nos.4,683,195、4,683,202、4,965,188,全部在此并入参考。如果要用PCR来扩增血细胞中的靶区域,应该将加有肝素的全血抽入密封的真空管中,比与其他样品隔离开来保存,处理时也应戴上干净的手套。为获得最佳效果,最好在采血后立即对血液进行处理;如果做不到这一点的话,那么血液应该一直被保存在4℃的密封容器中至使用。也可以检测其他生理体液中的细胞。当使用这些体液时,体液中的细胞应该通过离心与其他体液成分分离开来。
组织应该先用一把已消毒的一次性解剖刀和一根消毒的解剖针(或者用两把解剖刀)在5mm的培养皿中初步剪碎。从组织块中去除石蜡的方法在本领域技术人员所熟知的多种专业手册中都有描述。
为通过PCR扩增样品中的靶核酸序列,该序列必须要能接触到扩增系统中的成分。一种分离靶DNA的方法是用于较大样品的粗提取方法。简而言之,血样样品中的单核细胞、羊水细胞中的羊膜细胞(amniocyte)、培养的绒毛膜绒毛细胞等通过标准方法在无菌的Ficoll-Hypaque梯度上分层(layering)分离。再收集间期细胞,并在提取DNA之前在无菌磷酸盐缓冲盐溶液中洗涤3次。如果测试外周血淋巴细胞的DNA,建议再进行渗压震扰(将在蒸馏水中处理沉淀10秒),然后如果还可见残留有红细胞,在第一次洗涤后再洗涤两次。这样可以避免血红蛋白中的血红素基团对PCR反应的抑制作用。如果PCR测试不在采样后立即进行,则将细胞均分为106个细胞一份,沉淀在Eppendorf管中并在-20℃冷冻干燥,保存至使用。
将细胞重悬在补充了100μg/ml蛋白酶K的50mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2,0.5%Tween 20,0.5%NP40的缓冲液中(每100μl有106个有核细胞)。在56℃孵育两小时后,将细胞在95℃加热10分钟以灭活蛋白酶K,然后迅速移至于冰上降温(骤冻)。如果存在较大的聚集物,则还需在同样的缓冲液中再进行另一次消化循环。取出10μl提取物用作扩增。
从组织例如绒毛膜绒毛细胞或铺满培养的细胞中提取DNA时,那么根据组织样品的大小不同,上述含有蛋白酶K的缓冲液量也可有所差别。提取物在50-60℃孵育4-10个小时,之后在95℃处理10分钟灭活蛋白酶。在更长时间的孵育过程中,以原始浓度孵育4小时后,需要再补加新鲜的蛋白酶K。
样品含有细胞含量少时,提取可以参照下述的方法完成,Higuchi,“Simple and Rapid Preparation of Samples for PCR”,PCR Technology,Ehrlich,H.A.(ed.),Stockton Press,New York,其并入参考。可以应用PCR扩增来自骨髓和外周血细胞培养物的单个集落的很少量细胞(1000-5000个)中的靶区域。将样品中的细胞悬浮在20μl PCR裂解缓冲液(10mM Tris-HCl(Ph8.3),50mM KCl,2.5mM MgCl2,0.1mg/ml明胶,0.45%NP40,0.45%Tween 20)中并冻存直至使用。当要进行PCR时,向在PCR裂解缓冲液中的细胞加入0.6μl蛋白酶K(2mg/ml)。然后将样品加热至大约60℃并孵育1小时。然后将样品加热至95℃10分钟灭活蛋白酶K而终止消化,再在冰上冷却。
下面还有一种相对比较简便的提取用于PCR的DNA的方法,是根据Miller et al.,Nucleic Acids Res.16:1215(1988)的方法改进的盐析法,所述文献并入参考。在Ficoll-Hypaque梯度上分离单核细胞。将细胞重悬在3ml裂解缓冲液(10mM Tris-HCl,400mM Nacl,2mMNa2EDTA,pH8.2)中。然后向细胞中加入50μl 20mg/ml的蛋白酶K和150μl 20%的SDS的溶液,然后在37℃孵育过夜。孵育过程中摇动试管促进样品的消化。如果孵育过夜后蛋白酶K的消化仍不完全(即还有可见的片段),可以在体系中再加入50μl 20mg/ml的蛋白酶K溶液,再在37℃轻轻摇动或在摇床上孵育过夜。在充分消化后,向样品中加入1ml 6M的NaCl溶液并剧烈混匀。所得溶液在3000rpm离心15分钟。沉淀含有沉淀的细胞蛋白质,而上清液中含有DNA。将上清液转移到装有4ml异丙醇的15ml试管中。轻轻混匀试管中的内容物至水相与醇相混合并形成白色的DNA沉淀。将DNA沉淀移出并滴入至70%乙醇中,轻轻混合。再将DNA沉淀从乙醇中取出并在空气中干燥。向沉淀中加入蒸馏水将其溶解。
用于PCR的提取高分子量DNA的试剂盒包括Genomic IsolationKit A.S.A.P(Boehringer Mannheim,Indianapolis,Ind.)、Genomic DNAIsolation System(GIBCO BRL,Gaithersburg Md.)、Elu-Quik DNAPurification Kit(Schleicher & Schuell,Keene,N.H.)、DNA extraction Kit(Stratagene,LaJolla,Calif.)、TurboGen Isolation Kit(Invitrogen,SanDiego,Calif.)等等。一般而言可以在实践本发明的方法前,按照厂商说明使用这些试剂盒来纯化DNA。
提取出的DNA的浓度和纯度可以通过对稀释等份样品在260nm和280nm的光吸收分光光度分析来确定。提取出DNA后,可以进行PCR扩增。PCR每一次循环的第一步需要将引物延伸获得的核酸双链分开。一旦双链分开,PCR的下一步是使分开的链与在靶序列侧翼的引物杂交。引物接下来可以延伸以形成靶链的互补拷贝。为成功进行PCR扩增,设计引物以便要使一个引物与母链杂交后,延伸产生的子链在与母链变性分开后,可以与另一个引物杂交并作为该引物延伸的模板。变性、杂交及延伸的循环重复所需的次数以获得所需量的扩增核酸。
PCR扩增的一个特别有用的实施方案中,通过将反应体系加热到足够高的温度并进行足够长的时间以引起双链变性但不引起聚合酶发生不可逆变性而分开链(见U.S.Pat.No.4,965,188,并入参考)。典型地热变性涉及的温度在80℃到105℃之间,时间长短数秒至数分钟。然而链的分开则可以任何合适的方法包括物理、化学或酶学手段实现。例如,可以用解旋酶或有解旋酶活性的酶诱导链分开。例如,在有ATP存在的情况下酶RecA具有解旋酶活性。通过解旋酶的链分开的适宜反应条件是本领域已知的(见Kuhn Hoffman-Berling,1978,CSH-Quantitative Biology,43:63-67;和Radding,1982,Ann.Rev.Genetics 16:405-436,全部并入参考)。
PCR中模板依赖的引物延伸由聚合剂(polymerizing agent)在存在足量的4种去氧核苷三磷酸(一般是dATP、dGTP、dCTP和dTTP)的情况下在包含有适当的盐、金属阳离子以及pH缓冲系统的反应介质中催化进行。适当的聚合剂是已知催化模板依赖的DNA合成的酶。某些情况下,靶区域可能编码细胞表达的蛋白的至少一部分。这样,mRNA也可用于扩增靶区域。或者,PCR还可用于从RNA构建一个cDNA文库以进行进一步的扩增,引物延伸的最初模板是RNA。适于从RNA模板合成互补拷贝DNA(cDNA)序列的聚合剂是逆转录酶(RT),如禽成髓细胞瘤病毒RT、Moloney鼠白血病病毒RT、嗜热栖热菌(Thermus Thermophilus)(Tth)DNA聚合酶,一种由PerkinElmer Cetus,Inc.开发的具有逆转录酶活性和热稳定DNA聚合酶。典型地,最初逆转录步骤后的第一次变性步骤过程中,基因组RNA模板被热降解,只留下DNA模板。适用于以DNA作模板的聚合酶包括,例如,大肠杆菌(E.coli)DNA聚合酶I或者其Klenow片段、T4 DNA聚合酶、Tth聚合酶和Taq聚合酶,分离自水生栖热菌(Thermus aquaticus)的一种热稳定DNA聚合酶,从Perkin ElmerCetus,Inc.可以买到。后一种酶广泛用于核酸的扩增和测序。本领域已知使用Taq聚合酶的反应条件并在Gelfand,1989,PCR Technology,同上中也有描述。
等位基因特异PCR
等位基因特异的PCR可以区分存在缺少变异或多态性的靶区域。选择只结合靶序列的某种等位基因的PCR扩增引物。Gibbs,NucleicAcid Res.17:12427-2448(1989)中描述了这一方法。
等位基因特异寡核苷酸筛选方法
进一步诊断筛选方法使用了等位基因特异寡核苷酸(ASO)筛选方法(allele-specific oligonucleotide screening method),如Saiki等在Nature 324:163-166(1986)中所描述。对任意特定等位基因产生一或多个碱基对错配的寡核苷酸。ASO筛选方法检测变体靶基因组或PCR扩增DNA和非突变寡核苷酸之间的错配,示出相较于突变寡核苷酸,减少的寡核苷酸结合。寡核苷酸探针可以设计来在低严格条件下与等位基因的两种多态性形式都能结合,而在高严格条件下,结合其所对应的等位基因。另外,可以控制严格条件,获得基本的二元应答,即对应于一个靶基因变体形式的ASO将与那个等位基因杂交,而不与野生型等位基因杂交。
连接酶介导的等位基因检测方法
通过连接酶介导的等位基因检测,可以对比测试对象DNA靶区域和未影响和影响的家族成员中的靶区域。见Landegren et al.,Science 241:107-1080(1988)。连接酶也可用于在Wu et al.,Genomics4:560-569(1989)中描述的连接扩增反应中检测点突变。连接扩增反应(LAR)通过连续多轮模板依赖的连接,实现了特定DNA序列的扩增,如Wu,同上和Barany,Proc.Nat.Acad.Sci.88:189-193(1990)中所述。
变性梯度凝胶电泳
使用聚合酶链式反应得到的扩增产物可以用变性梯度凝胶电泳分析。不同的等位基因可以通过基于序列依赖解链性质和在溶液中DNA电泳迁移的不同得以鉴别。在温度升高或变性强度增大时,DNA分子区段解链,这些区段称为解链结构域(melting domain)。每个解链结构域在不同的、碱基特异的解链温度(TM)下协同解链。解链结构域长度至少为20个碱基对,也可以高达数百个碱基对。
可以用聚丙烯酰胺凝胶电泳评估基于序列特异解链结构域不同的等位基因的分化,如Chapter 7,Erlich,ed.,PCR Technology,Principles and Applications for DNA Amplification,W.H.Freeman andCo.,New York(1992)所述,其内容并入参考。
一般而言,通过变性梯度凝胶电泳分析的靶区域使用靶区域侧翼的PCR引物扩增。扩增的PCR产物用线性变性梯度的聚丙烯酰胺凝胶分析,如Myers et al.,Meth.Enzymol.155:501-527(1986)和Myers etal.,Genomic Analysis,A Practical Approach,K.Davies Ed.IRL PressLimited,Oxford,pp.95-139(1988)所述,其内容并入参考。电泳系统维持在稍稍低于靶序列解链结构域的Tm的温度。
另一种变性梯度凝胶电泳的方法中,将靶序列可以先附于一段称为GC夹(GC clamp)的GC核苷酸,如Chapter 7,Erlich,同上所述。优选地,GC夹中至少有80%的核苷酸是鸟嘌呤或胞嘧啶。优选地,GC夹至少长达30个碱基。这种方法特别适用于高Tm的靶序列。
通常,通过上述聚合酶链式反应扩增靶区域。一个寡核苷酸PCR引物在5’端带有至少30个碱基的富含GC序列的GC夹,其在扩增过程中掺入到靶区域的5’端。所得扩增的靶区域在上述变性梯度条件下进行电泳。只相差一个碱基变化的DNA片段在凝胶上迁移的位置不同,通过溴化乙锭染色可见。
温度梯度凝胶电泳
温度梯度凝胶电泳(TGGE)与变性梯度凝胶电泳基于相同的原理,只是变性梯度是由温度差异产生,而不是化学变性剂的浓度不同而产生的。标准的TGGE使用的是随电泳路径具有温度梯度的电泳仪。当样品在化学变性剂浓度一致的凝胶里迁移时,其面对升高的温度。另一种TGGE的方法是时间温度梯度凝胶电泳(TTGE或tTGGE),即逐步地升高整块电泳凝胶的温度以达到同样的结果。随着样品在凝胶中迁移,整块凝胶的温度升高,因此随样品通过凝胶迁移,它们遇到越来越高的温度。样品准备,包括掺入GC夹的PCR扩增,以及产物的显示都与变性梯度凝胶电泳相同。
单链构象多态性分析
HMGA基因座的靶序列或等位基因可以使用单链构象多态性分析区分,其根据单链PCR产物电泳迁移的改变来区分碱基的差别,如Orita et al.,Proc.Nat.Acad.Sci.85:2766-2770(1989)所述。扩增的PCR产物可以按上述方法产生,然后加热或其它方法变性,从而形成单链扩增产物。单链核酸可能会部分地根据碱基序列重新折叠或形成二级结构。因此,单链扩增产物的电泳迁移率可以检测等位基因或靶序列之间碱基顺序的差别。
错配碱基的化学或酶学方法切割
靶序列间的差异还可以通过错配碱基对的差异化学切割区分,如Grompe et al.,Am.J.Hum.Genet.48:212-222(1991)所述。另一种方法中,可以通过错配碱基对的酶切割检测靶序列之间的差异,如Nelsonet al.,Nature Genetics 4:11-18(1993)所述。简而言之,来自一个动物或一个受影响家族成员的遗传物质可以用于产生错配游离异源杂交DNA双链。本文所指的“异源杂交”指DNA双链的包含来自一个动物的一条链,及来自另外一个动物的第二条链,而且通常是在感兴趣的性状的表型上有差别的动物。没有错配的异源双链的正选择可以确定可能与HMGA多态性相关的小的插入、缺失或其它多态性。
非凝胶系统
其它可能的技术包括非凝胶系统,如TaqManTM(Perkin Elmer)。这一系统中,设计要研究的突变侧翼的寡核苷酸PCR引物,并通过PCR扩增该区域。另外还要设计第三个寡核苷酸探针以与在基因的不同等位基因中含有碱基对象变化的区域杂交。这一探针的5’和3’端都用荧光染料标记。选择这些染料以便当其互相临近时,其中之一的荧光被另一种染料的荧光淬灭而不能被检测到。相对于探针,PCR引物在Taq DNA聚合酶的作用下从模板的5’端开始延伸,导致附于退火探针的染料通过Taq DNA聚合酶的5’核酸酶活性而切割。这样除去了淬灭效应使得可以检测到探针3’端染料的荧光。如果探针与模板分子的杂交不完全,即存在某种形式的错配,那么染料就不会被切割,这样就可以区分不同的DNA序列。因此只有当寡核苷酸探针的核苷酸序列与它结合的模板分子完全互补,才会除去淬灭。一个反应混合物中,可能含有两种不同探针的序列,每个针对可能存在的不同等位基因设计,从而可以在一次反应中检测两个等位基因。
还有一种技术称为Invader Assay,其包括依赖于荧光催化释放的等温扩增。见Third Wave Technology, www.twt.com.
不依赖PCR的DNA诊断
可以基于多态性包括一个动物和家族成员的限制性片段长度多态性在内的多态性而不用扩增步骤鉴定与HMGA序列连锁的DNA序列。杂交探针一般是通过互补碱基配对结合全长或部分靶核酸的寡核苷酸。探针典型地依赖于杂交条件的严格程度与缺少与探针序列完全互补的靶序列结合。探针优选直接或间接标记,因此可以通过检测探针的存在与否来检测靶序列的存在与否。直接标记方法包括放射性同位素标记,如用32P或35S。间接标记方法包括荧光标签、能结合抗生物素蛋白或链霉抗生物素蛋白的生物素复合体,或肽或蛋白质标签等。可见检测办法包括光致发光剂(photoluminescent)、德克萨斯红、罗丹明及其衍生物、red leuco dye、3,3’,5,5’-四甲联苯胺(TMB)、荧光素及其衍生物、丹磺酰、伞形酮及其类似化合物或辣根过氧化物酶、碱性磷酸酶等。
杂交探针包括任意能与一个HMGA编码序列所在的猪染色体杂交核苷酸序列,因此确定与HMGA基因之一连锁的遗传标记,包括限制性片段长度多态性、高度可变区、重复元件,或是可变数目的串联重复。杂交探针可以是任何基因或适合的类似物。其它合适的杂交探针包括已知定位在染色体相关区域的cDNA或基因的外显子片段或部分。
优选地用于本发明的串联重复杂交探针是在高严格的杂交条件下,识别特异基因座的少量片段或是降低严格条件时识别该基因座的较大量片段的探针。
可以使用一或多个限制性酶和/或探针和/或引物。其它的酶、构建的探针以及引物可以通过本领域技术人员的常规实验确定,其也包含在本发明的范围内。
尽管本文所述方法可以使用单一的限制性酶和单一的一组引物,但是这些方法不限于此。如果需要,可以使用一或多种其它的限制性酶和/或探针和/或引物。确实在有些情况下,可能优选使用给出特异单元型的标记组合。结合本文提供和引用的的教导,通过常规实验可以确定其它的酶、构建的探针和引物。
按照本发明,在一个或全部两个HMGA核苷酸序列中,鉴定了与生长、脂肪量、肉质和饲料消耗比相关的多态性。这些标记的存在与否,在一个实施方案中可以通过使用限制性内切核酸酶的PCRRFLP分析来检测,并且由于多态性周围区域的高度同源性,可以使用类似的人、猪或其它HMGA序列设计扩增引物,或者可以使用GenBank中的已知HMGA序列(例如人的)设计或者甚至可以根据从邻近密切的基因的连锁数据得出的序列设计,如本文的教导和参考文献。多态性周围的序列可以有助于设计另外的PCR测试,其中从紧挨多态性的序列中挑出大约4-30个连续碱基的引物用于聚合酶链式反应以在用所需的限制性酶处理前大大扩增该区域。引物不必精确互补,满基本等同序列就可以。本领域技术人员已知PCR扩增引物的设计,详细讨论见Ausubel(ed.),“Short Protocols in MolecularBiology,Fourth Edition”John Wiley and Sons 1999中有详细介绍。下文是对引物设计的简要说明。
引物设计策略
聚合酶链式反应(PCR)方法的广泛应用促使开发很多程序辅助设计或选择用作PCR引物的寡核苷酸。下面是可以通过因特网免费获得的4个这样的程序:Whitehead Institute的Mark Daly和SteveLincoln开发的PRIMER(UNIX、VMS、DOS和Macintosh)、WashingtonUniversity in St.Louis的Phil Green和LaDeana Hiller开发的Oligonucleotide Selection Program(OSP)(UNIX、VMS、DOS和Macintish)、Yoshi开发的PGEN(只用于DOS)以及University ofWisconsin的Bill Engels开发的Amplify(只用于Macintosh)。通常这些程序通过寻找已知重复序列元件的比特并通过分析推定引物的长度和GC含量来优化Tm来辅助引物设计。还可以获得商业软件,而且引物方法正迅速地被包含在大多数的普通序列分析软件包中。
测序和PCR引物
设计用作测序或PCR引物的寡核苷酸需要选择一个特异识别靶的适当序列,然后需测试该序列以排除该寡核苷酸具有稳定二级结构的可能。序列中的反向重复可以使用上述的重复鉴别或RNA折叠程序来鉴别(见Prediction of Nucleic Acid Structure)。如果观察到了可能的茎环结构,那么引物的序列可以向任意方向移动几个核苷酸以最小化可能的二级结构。寡核苷酸的序列也应该与恰当的载体和插入DNA的双链序列进行比较。很明显,测序引物与靶DNA应该只有单一的匹配。还建议不要选用与非所需靶DNA序列只有一个错配的引物。对用于扩增基因组DNA的PCR引物,该引物序列应该与GenBank数据库中的序列进行比较,以确定是否有任何显著的匹配。如果寡核苷酸序列出现在任何已知的DNA序列中,或者更关键的是在任何已知的重复元件中,就应该改变对引物序列。
本发明的方法和材料也可以更广泛应用以评价动物DNA、在基因定型个体动物及检测动物中的遗传差异。特别地,动物基因组DNA的样品可以通过与一或多个对照参比评价,以确定是否存在HMGA序列之一的多态性。优选地,对该动物的HMGA序列进行RFLP分析,并将结果与对照进行比较。对照的结果来自于另一个动物一或全部两条HMGA序列的RFLP分析,其中这个动物的HMGA基因的多态性是已知的。与此类似,一个动物的HMGA基因型可以通过以下方法确定:取得其基因组DNA样品,对DNA中HMGA基因进行RFLP分析,再将结果与对照对比。同样,对照结果来源于另一个动物的一条HMGA序列的RFLP分析。这个结果通过确定HMGA基因的多态性,对动物进行基因定型。最后,动物之间的遗传差异可以通过以下方法检测:从至少两个动物中获取基因组DNA样品,在一条HMGA核苷酸序列上鉴别多态性的存在与否,并比较结果。
这些检测用于鉴别与生长、脂肪量、肉质和饲料消耗比相关的遗传标记,如上所述,鉴别HMGA基因中可能与其它特征相关的其他多态性,以及动物基因型和表型的一般科学分析。
本文的例子和方法揭示了一些已被鉴别具有多态性的基因,所述多态性与一种有利性状相关,而该性状又会对携带这种多态性的动物的生长、脂肪量、肉质及饲料消耗比产生影响。一基因是否带有多态性通常通过导致在某些等位基因形式中出现一个限制性位点的单个碱基变换进行鉴定。然而,如本文证明和讨论的那样,某个等位基因可能有多个碱基改变,这些改变可以被检测相同多态性(等位基因)的表征。此外,其它遗传标记或基因可能与本文所述的多态性连锁,因此检测也可能涉及鉴定其它的基因或基因片段,但是最终还是需要依赖于动物的遗传分析以寻找相同的多态性。本发明期冀能够涵盖任何基于本文所揭示的等位基因差异分选和鉴别动物的检测方法。
本领域技术人员知道,一旦鉴定了一个多态性并将其与特定的性状建立了联系,那么就有多种方法可以根据这个多态性基因定型(genotype)动物。这些替代测试方案只是本领域技术人员已知的对参数的优化,本发明也期冀能涵盖这些内容。
实施例
HMGI(在新命名系统下HMGA的名称;Bustin,2001)基因家族由两个基因组成,其编码三种与染色质结构和转录控制相关的蛋白质(HMG-I、-Y和C)。HMGI/Y蛋白是同一个基因RNA选择性剪接的产物,而HMGIC则由不同的基因编码。
人的HMGIY(HMGA1)基因定位在染色体区域6p21处(Friedmann et al.,1993),并且可能参与细胞生长和分化的基因表达的调节(Reeves and Beckerbauer,2001)。因此,HMGI/Y蛋白的异常或过表达与多种癌症的形成强烈相关(Hess,1998;Tallini and DalCin,1999;Reeves,2000)。由于HMGI/Y蛋白在脂肪细胞特异基因的表达中起着转录作用,HMGI/Y可能在脂肪细胞生长和分化中起着重要的作用(Melillo et al.,2001)。
人HMGIC(HMGA2)基因被物理定位在染色体12q14-12处,而这一区域示出是经常引起脂瘤(lipoma)的染色体重排的位点,所述脂瘤主要由成熟脂肪细胞组成(Asher et al.,1995)。这些发现在表达截短的HMGIC基因结构域的转基因小鼠中得到了证实。这些转基因小鼠都发生肥胖并有异常的脂瘤高发率(Arlotta et al.,2000)。与此相反,HMGIC基因敲除的小鼠示出成年体重降低,主要影响脂肪组织(Zhou et al.1995)。这些结果表明HMGA基因的变异可能与人肥胖的变异和动物脂肪量相关。
HMGA1:PCR-RFLP测试
引物:
正向(HMGY1)-5′AGA AGG AGC CCA GCG AAG T3′SEQ ID NO:1
反向(HMYS2)-5′ACA GTG CTC ACC CAA TGG C3′SEQ ID NO:2
位置:两个都位于外显子中
PCR条件:
Mix1
10XPCR缓冲液       1.0μl
MgCl2(25mM)       0.6μl
dNTPs(2.5mM)       0.5μl
HMGYl(25pmol/μl)  0.1μl
HMYS2(25pmol/μl)  0.1μl
Taq聚合酶(5U/μl)  0.07μl
ddH2O             7.63μl
基因组DNA          1.0μl
在一个PCR反应管中将Mix1和DNA组合。在Mix上覆盖矿物油。按以下PCR程序进行反应:94℃3分钟;然后94℃30秒,63.8℃1分钟,及72℃1分30秒,这样的循环进行36次;然后进行最后72℃10分钟的延伸。取出2μl的PCR反应产物在1.6%的琼脂糖凝胶上证实扩增成功和阴性对照的理想结果。
消化可按以下步骤进行:
BanI消化反应:            NaeI消化反应:
PCR产物        4.0μl    PCR产物       4.0μl
NE缓冲液4      1.0μl    NE缓冲液1     1.0μl
BSA(10mg/ml)   0.1μl    BSA(10mg/ml)  0.1μl
BanI(20U/μl)  0.2μl    NaeI(10U/μl) 0.4μl
ddH2O         4.7μl    ddH2O       4.5μl
混合PCR产物、缓冲液、酶和水。在37℃孵育至少4小时或过夜。然后将消化溶液与上样染料(loading dye)混合(2∶5),在3%的NuSieve琼脂糖凝胶上电泳。
HMGA2:HhaI PCR-RFLP测试
引物:
HMGIC-5:5′ACT GAA GAG ACA TCC TCA CA3′SEQ ID NO:3
HMGIC-T1:5′CTA AAC CIG GGA CIG TGA AG3′SEQ ID NO:4
Mix2的引物:660bp
HMGIC-SF:5′GAT AGG ACT AGA TAC AAC TTA C3′SEQ ID NO:5
HMGIC-T2:5′GGA TAT ATT GCA TCT CTG GC3′SEQ ID NO:6
Mix1:250bp
PCR条件:
Mix1:                           Mix2:
10X Promega缓冲液       1.0μl   10X Promega缓冲液       1.0μl
25mM MgCl2             0.6μl   25mM MgCl2            0.6μl
dNTPs混合物(每种2.5mM)  0.5μl   dNTPs混合物(每种2.5mM)  0.5μl
25pmol/μl HMGIC 5      0.1μl   25pmol/μl HMGIC SF     0.1μl
25pmol/μl HMGIC T1     0.1μl   25pmol/μl HMGIC T2     0.1μl
dd无菌H2O              7.4μl   dd无菌H2O             7.4μl
Taq聚合酶(5U/μl)       0.07μl  Taq聚合酶(5U/μl)       0.07μl
基因组DNA(12.5ng/μl)   1.0μl   基因组DNA(12.5ng/μl)   1.0μl
1、按以下PCR程序进行反应:94℃2分钟;然后94℃30秒,56℃(Mix1)和52℃(Mix2)1分钟,再72℃1分30秒,循环35次;然后最后在72℃延伸10分钟。当HMGIC-5和HMGIC-T2引物用于PCR扩增时(退火温度为56℃),PCR片段(1.2kb)含有全部两个HhaI多态性位点。
2、在标准的1%琼脂糖凝胶上检测3μl的PCR反应产物以证实扩增成功和阴性对照的理想结果。
3、HhaI消化反应:在每个含有DNA的管里加入5μl扩增产物。在37℃孵育至少4小时或过夜。然后将反应混合物与上样染料混合,将全部体积上样在3%的琼脂糖凝凝胶上。
PCR产物          5.0μl
10X NE缓冲液4    1.0μl
BSA(10mg/ml)     0.3μl
HhaI酶(20U/μl)  0.3μl
dd无菌H2O       3.6μl
图2中BanI的识别位点用下划线及粗体字表示。其中一个在第54位含有单核苷酸多态性。
图1示出HMGA的序列,其具有下划线表示的NaeI多态性位点(GCYGGC)。
Y=C或T
三个HhaI识别位点(GCGC)均用下划线表示,其中用灰色加亮的两个含有DNA多态性。
框1是Mix1的大致PCR片段。
框2是Mix2的大致PCR片段。
K=G或T
Y=C或T
我们测序并分析了用聚合酶链式反应扩增的猪HMGA1和HMGA2片段。猪HMGA2基因片段的序列覆盖了外显子5到3’UTR,在DNA水平示出与相应人序列大约79%的一致性。猪HMGA1基因片段序列覆盖了外显子6和7,在DNA水平示出与相应人外显子序列大约93%的一致性。
我们还在猪HMGA1和HMGA2基因中鉴别出了一些单核苷酸取代(SNPs)。HMGA1基因中鉴别的两个SNPs分别位于BanI和NaeI限制性酶识别位点内,而HMGA2基因中鉴别的另两个SNPs位于HhaI识别位点内。发展了这些SNPs的PCR RFLP测试并测试了来自Berkshire×Yorkshire 3代家系中和PIC商用群体的动物的DNA样品。利用上述DNA样品的PCR RFLP测试的基因型进行了QTL和相关分析。对于Berkshire和Yorkshire杂交参考家系中脂肪相关性状,两个HMGA基因都位于QTL区域内。在几个商用PIC群体的动物中,HMGA1基因的等位基因1 NaeI多态性的存在明显地与较少的背部脂相关。此外,这些商用群体中,HMGA2基因型也与脂肪和生长性状相关。这个参考家系中的两个基因的组合分析清楚地表明两个基因对脂肪性状有加性效应。
这些结果表明,这些多态性与生产猪和肉质的多种具有重要经济价值的性状相关,而且利用这些多态性能够在育种工作中准确选择具有所需性状及表型的动物。
在PIC群体中HMGA基因的相关分析
2000年8月1日针对肉质在所有动物中计算了平均值(s.e.)和Sigma P。
所有结果都由mixed model得出,将父系作为随机影响,并固定屠宰日期。
LS平均值显著性水平:     α和δ显著性水平:
水平:
a-b    p<.3             ap<.3
c-d    p<.1             bp<.1
e-f    p<.05      cp<.05
g-h    p<.01      dp<.01
i-j    p<.005     ep<.005
k-l    p<.001     fp<.001
m-n    p<.0005    gp<.0005
o-p    p<.0001    hp<.0001
估计值是有偏倚(biased)的。
geno p:性状=父系+屠宰日期+基因型的模型中基因型的p值。
Expl.%σe2由“基因型”导致的误差方差的减少。
α和δ性状=父系+屠宰日期+ADD+DOM的模型的标记的加合和上位效应。
结果以性状值给出。
  性状 描述
  Dirty wt 屠宰后畜体的dirty weight
  hcw 刚宰的畜胴体的重量
  ccw 宰后尸体冷却后的重量
  L_binwt 腰部(一边腰部)的带骨重量
  L_blswt 腰部(一边腰部)的去骨重量
  loinminl 腰部的minolta L客观颜色值(objective colorscore)
  loinmina 腰部的minolta a客观颜色值
  loinminb 腰部的minolta b客观颜色值
  Japcs 主观测量:日本颜色值(1-6)
  肥瘦均匀相间的肉(marbling) 腰部的肥瘦均匀相间的肉的主观值(1-5)
  硬度(firmness) 腰部硬度的主观值(1-3)
    腰部pH 24小时时腰部pH
    h_binwt 股部(一个股部)的带骨重量
    h_blswt 股部(一个股部)内侧肌肉的去骨重量
    hamminl 股部的minolta L客观颜色值
    hammina 股部的minolta a客观颜色值
    hamminb 股部的minolta b客观颜色值
    股部pH 24小时时股部pH
    dripprct 48小时后的driploss百分比(样品重量的减少)
    hprofat Henessey探查的背部脂肪厚度
    hpromeat Henessey探查的腰肉深度
    Hprorib Henessey探查的肋骨厚度
    LMprct 屠宰后畜体的瘦肉百分比
    aloc_f Aloca背部脂肪厚度P2位置
    Endwt 测试结束时动物的重量
    Days 测试结束时的天数
    LDG,g/d 生命史中每日增加的重量(从出生至测试结束)
    TDG,g/d 测试时每日增加的重量
    US_MD 测试结束时的肌肉深度
US-Landrace中HMGA1 NaeI的肉质和生产性状的分析
          No.动物                           LSmeans(s.e.) geno             α              δ
性状 平均数(s.e.) σp 11 12 22 11 12 22 p 性状(s.e.) p 性状(s.e.) p
  marbling 1.72(0.03) 0.62 170 184 38 1.73(0.04)a 1.75(0.05)c 1.60(0.09)bd 0.20 -0.07(0.05) a 0.06(0.04) a
  firmness 2.75(0.07) 1.13 123 108 14 2.81(0.07)e 2.99(0.07)f 2.90(0.17) 0.06 0.05(0.09) 0.09(0.07) a
  dripprct 2.80(0.09) 1.44 128 111 13 2.55(0.14)ac 2.82(0.15)bg 1.79(0.38)dh 0.02 -0.38(0.20) b 0.43(0.16) d
  hprofat 12.98(0.11) 2.51 215 219 45 12.77(0.21)e 13.40(0.22)f 13.77(0.41)f 0.014 0.50(0.22) c 0.09(0.17)
  Hpromast 53.08(0.57) 12.7 220 227 51 53.41(0.64)e 53.46(0.67)e 56.15(1.15)f 0.04 1.37(0.59) c -0.88(0.47) b
  Hprorib 13.20(0.25) 3.9 124 109 17 13.35(0.39)ic 11.89(0.44)j 11.59(0.96)d 0.008 -0.88(0.50) b -0.38(0.40)
  LMprct 46.77(0.08) 1.16 119 101 11 46.99(0.14)ea 46.67(0.16)f 46.52(0.36)b 0.10 -0.23(0.18) a -0.06(0.14)
  Days 159.1(0.70) 12.1 136 128 34 156.4(0.82)ai 157.6(0.87)bg 162.1(1.60)jh 0.005 2.84(0.87) e -1.14(0.74) a
  US_MD 60.75(0.38) 7.71 173 195 48 60.53(0.62)c 60.68(0.61)c 62.87(1.10)d 0.12 1.17(0.60) b -0.68(0.50) a
US-Large white中HMGA1 NaeI的肉质和生产性状的分析
    No.动物                 LSmeans(s.e.) geno              α              δ
性状 平均数(s.e.) σp 11 12 22 11 12 22 p 性状(s.e.) p 性状(s.e.) p
Hcw 188.5(0.78) 14.5 93 162 87 185.9(1.83)ce 189.2(1.47)d 190.4(1.75)f 0.09 2.26(1.08) c 0.71(0.98)
Ccw 186.3(0.82) 14.5 82 150 78 183.6(1.88)ce 187.0(1.52)d 188.4(1.79)f 0.08 2.39(1.13) c 0.70(0.99)
Dripprct 2.30(0.11) 1.2 30 62 28 2.67(0.30)e 2.47(0.22)e 1.86(0.28)f 0.07 -0.41(0.18) c 0.14(0.16)
Hprofat 14.09(0.15) 2.61 86 150 79 13.66(0.39)ai 14.12(0.32)be 14.95(0.37)jf 0.012 0.65(0.22) e -0.12(0.19)
Hprorib 13.46(0.37) 3.97 33 58 23 12.93(0.98)e 13.49(0.76)e 15.81(0.99)f 0.06 1.44(0.61) c -0.58(0.54) a
LMprct 46.09(0.10) 0.96 28 48 20 46.39(0.27)c 46.25(0.21)c 45.72(0.27)d 0.13 -0.33(0.17) b 0.13(0.15)
aloc_f 13.48(0.17) 3.2 98 170 90 12.95(0.41)ai 13.42(0.32)be 14.40(0.39)jf 0.009 0.73(0.24) e -0.17(0.22)
Hodwt 109.5(0.36) 6.84 98 170 90 107.7(0.90)ac 109.1(0.72)b 109.5(0.87)d 0.17 0.91(0.52) b 0.33(0.47)
Days 170.2(0.78) 10.6 43 82 58 166.2(1.89)ae 163.8(1.48)b 161.9(1.65)fa 0.09 -2.17(0.98) c -0.20(0.93)
US_MD 58.71(0.38) 6.92 96 160 82 57.60(0.74)ai 58.66(0.59)be 60.64(0.75)jf 0.009 1.52(0.50) e -0.31(0.45)
US-Large white×Duroc中HMGA1 NaeI的肉质和生产性状的分析
    No.动物                       (s.e.) geno              α               δ
性状 平均数(s.e.) σp 11 12 22 11 12 22 p 性状(s.e.) p 性状(s.e.) p
Hprofat 15.88(0.16) 3.46 128 245 109 15.41(0.37)c 15.45(0.29)e 16.31(0.39)df 0.06 0.45(0.23) b -0.28(0.19) a
mloc_f 13.83(0.15) 3.47 148 274 119 13.35(0.32)ci 13.98(0.26)d 14.68(0.36)jc 0.010 0.67(0.22) e -0.02(0.18)
所有品系中HMGA1 NaeI的肉质和生产性状的分析
     No.动物             LSmeans(s.e.) geno Line*geno               α                 δ
性状 平均数(s.e.) σp 11 12 22 11 12 22 p p 性状(s.e.)     p 性状(s.e.)    p
Loinmina 6.85(0.03) 1.59 634 853 702 6.90(0.09)c 7.05(0.08)d 7.08(0.07)d 0.12 0.16 0.09(0.05) b 0.04(0.04)
Loinminb 3.36(0.03) 1.3 627 841 695 3.37(0.06)ae 3.44(0.05)b 3.53(0.05)fa 0.09 0.003 0.08(0.04) c b -0.01(0.03) c
HampH 5.70(0.00) 0.18 398 529 475 5.71(0.01)a 5.69(0.01)fa 5.70(0.01)b 0.02 0.22 -0.00(0.01) -0.01(0.01) c
Hprofat 14.68(0.09) 4.17 594 791 680 15.42(0.20)ai 15.66(0.17)be 16.06(0.16)jf 0.02 0.12 0.32(0.11) e b -0.05(0.09) b
Hpromeat 54.16(0.28) 12.9 612 826 694 54.95(0.47)e 55.32(0.40)c 56.10(0.37)fd 0.10 0.72 0.58(0.27) c -0.14(0.23)
LMprct 46.17(0.06) 2.01 313 388 353 45.98(0.13)ae 45.86(0.11)be 45.60(0.10)f 0.04 0.47 -0.19(0.07) c 0.04(0.06)
aloc_f 13.23(0.08) 3.91 664 883 733 13.59(0.20)ci 13.90(0.17)de 14.28 (0.16)jf 0.008 0.45 0.34(0.11) e a -0.02(0.09)
US_MD 59.04(0.19) 8.37 536 710 679 57.19(0.45)ai 57.77(0.39)be 58.71(0.35)jf 0.006 0.18 0.76(0.24) e -0.12(0.20) a
US-Landrace中HMGA2的肉质和生产性状的分析
      No.动物                    LSmeans(s.e.) geno             α              δ
性状 平均数(s.e.) σp 11 12 22 11 12 22 p 性状(s.e.) p  性状(s.e.) p
Hprofat 12.96(0.16) 2.56 6 60 186 13.83(0.99)a 12.53(0.37)be 13.35(0.27)f 0.07 -0.24(0.49) -0.71(0.39) b
LMprct 46.78(0.08) 1.17 5 51 135 46.07(0.49)ea 47.16(0.19)fg 46.67(0.15)bh 0.01 0.30(0.24) a 0.53(0.19) d
Endwt 111.6(0.43) 6.94 6 61 192 107.5(2.81)c 110.4(0.96)e 112.4(0.68)df 0.04 2.48(1.41) b 0.28(1.11)
LDG,g/d 683.0(2.98) 48 6 61 192 638.0(23.1)a 661.8(6.93)c 674.2(5.63)bd 0.09 18.08(11.5) a 3.78(8.66)
TDG,g/d 896.1(5.58) 73.2 3 43 126 850.1(41.0)a 875.2(12.1)e 900.9(9.76)bf 0.08 25.41(20.4) a -0.22(15.4)
US-Large white中HMGA2的肉质和生产性状的分析
      No.动物                     LSmeans(s.e.) geno             α             δ
性状 平均数(s.e.) σp 11 12 22 11 12 22 p 性状(s.e.) p 性状(s.e.) p
L_binwt 19.78(0.16) 1.72 12 55 47 20.29(0.45)e 19.97(0.25)e 19.26(0.26)f 0.02 -0.52(0.23) c 0.13(0.20)
L_blawt 6.68(0.06) 0.59 12 55 47 6.77(0.15)c 6.69(0.09)e 6.49(0.09)df 0.08 -0.14(0.08) b 0.04(0.07)
Endwt 109.9(0.50) 6.12 12 68 72 109.1(1.85) 109.4(0.93)e 107.2(0.94)f 0.12 -0.94(0.95) 0.80(0.78)
LDG,g/d 662.4(3.08) 38 12 68 72 670.2(11.2)a 677.3(5.89)i 658.0(5.21)bj 0.009 -6.12(5.67) a 8.78(4.63) b
TDG,g/d 863.5(5.50) 65.8 11 61 71 877.7(19.3)a 876.9(9.85)g 848.3(8.78)bh 0.02 -14.7(9.79) a 9.25(8.00) a
US-Duroc中HMGA2的肉质和生产性状的分析
       No.动物                       LSmeans(s.e.) geno              α             δ
性状 平均数(s.e.) σp 11 12 22 11 12 22 p 性状(s.e.) p 性状(s.e.) p
dirty wt 230.6(1.65) 19.1 50 48 36 227.6(3.36)e 227.8(2.96)e 236.0(3.24)f 0.07 4.20(2.10) c -2.68(2.21) a
Hprofat 13.49(0.28) 3.1 46 46 34 14.71(0.67)ic 12.58(0.59)j 13.29(0.64)d 0.01 -0.71(0.39) b -0.94(0.40) c
Endwt 107.0(0.86) 9.97 50 49 35 104.6(1.92)c 104.7(1.67)e 109.1(1.93)df 0.09 2.24(1.17) b -1.41(1.20) a
LDG,g/d 655.4(4.65) 53.9 50 49 35 648.1(10.8)a 636.5(9.60)be 660.9(10.9)bf 0.09 6.40(5.94) a -12.0(5.95) c
TDG,g/d 847.4(8.81) 100 49 48 33 836.9(19.4)a 816.2(17.0)be 860.8(19.5)bf 0.09 11.95(11.1) a -21.8(11.2) b
US_MD 56.93(0.60) 6.94 50 49 35 55.01(1.03)ec 57.54(0.91)f 57.44(1.05)d 0.08 1.22(0.65) b 0.88(0.68) a
US-Large white×Duroc中HMGA2的肉质和生产性状的分析
        No.动物                    LSmeans(s.e.) geno             α             δ
性状 平均数(s.e.) σp 11 12 22 11 12 22 p 性状(s.e.) p 性状(s.e.) p
Hpromast 53.77(0.45) 7.57 55 147 83 54.78(1.06)e 51.81(0.68)fi 55.05(0.88)j 0.002 0.13(0.67) -2.07(0.58) f
Hprorib 15.07(0.26) 4.03 48 125 63 13.89(0.71)ce 15.18(0.48)d 15.76(0.61)f 0.09 0.93(0.43) c 0.24(0.36)
LMprct 45.49(0.09)- 1.37 48 125 63 45.91(0.22)c 45.50(0.15)d 45.87(0.19)c 0.07 -0.02(0.13) -0.26(0.11) c
Days 151.1(0.65) 8.85 40 100 44 152.0(1.29)a 150.6(0.84)e 153.8(1.24)bf 0.08 0.89(0.85) a -1.56(0.78) c
LDG,g/d 684.3(3.35) 57.2 57 151 84 668.0(7.96)a 678.9(4.85)b 672.8(5.82) 0.41 2.40(4.91) 5.68(4.30) a
TDG,g/d 883.5(6.72) 76.1 21 62 45 850.3(13.9)c 877.1(8.45)da 862.5(10.1)b 0.17 6.08(8.55) 13.82(7.41) b
US_MD 60.25(0.59) 6.12 17 51 40 59.61(1.58)a 60.12(0.94)a 61.88(1.09)b 0.35 1.13(0.96) a -0.42(0.77)
在参考家系中具有脂肪性状的HMGA基因之间的相互作用分析
A.Berkshire和Yorkshire杂交家系F2代动物
1)基因频率
HMGA1
(BanI)      频率    百分比    频率     百分比
            11      88        17.85    88       17.85
            12      232       47.06    320      64.91
            22      173       35.09    493      100.00
HMGA2       频率    百分比    频率     百分比
            11      64        12.75    64       12.75
            12      234       46.61    298      59.36
            22      204       40.64    502      100.00
HMGA2
频率百分比Row PctCol Pct                  HMGA1
11 12 22 总数
11     20.413.332.27     234.7438.3310.13     357.2258.3320.59     6012.37
12     449.0719.6450.00     10621.8647.3246.70     7415.2633.0443.53     22446.19
22     428.6620.9047.73     9820.2148.7643.17     6112.5830.3535.88     20141.44
总数     8818.14     22746.80     17035.05     485100.00
B)对最后一根肋骨上脂肪(lrib)性状的影响
HMGA1和HMGA2基因型都与最后一根肋骨性状的变化相关。HMGA2等位基因2的存在适度增加了最后一根肋骨脂肪含量(比较12和22号基因型)。HMGA1等位基因1的存在示出与脂肪含量的增加强烈相关。
HMGA2                lrib LSMEAN          误差
11                   3.18575614           0.11603336
12                   3.12045322           0.04885318
22                   3.22801544           0.04984788
HMGA1                lrib LSMEAN          误差
11                   3.35804436           0.07798118
12                   3.16165424           0.04771340
22                   3.07576363           0.04890591
最后一根肋骨  HMGA1HMGA2         11        12        2211            3.38      3.21      2.9612            3.28      3.14      3.0022            3.44      3.20      3.21
3)对腰部脂肪(lum)性状的影响
HMGA1和HMGA2基因型都示出与腰部脂肪(lumbar fat)相关。HMGA1和HMGA2的组合结果示出对腰部脂肪的明显的加性效应。
HMGA2             lum LSMEAN            误差
11                3.47003685            0.13421404
12                3.53704166            0.05650774
22                3.55401930            0.05765829
HMGA1             lum LSMEAN            误差
11                3.77507026            0.08990991
12                3.55616811            0.05501209
22                3.39947934            0.05638702
Lum脂肪  HMGA1HMGA2     11        12       2211        3.65      3.72     3.3112        3.69      3.60     3.3922        3.91      3.63     3.50
C)对总脂质(tlip)性状的影响
HMGA2基因型与总脂质(total lipid)的变化相有关
HMGA2         tlip LSMEAN            误差
11            2.88214497             0.23811466
12            3.06472896             0.10025272
22            3.23158737             0.10229396
HMGA1        tlip LSMEAN         误差
11           3.33719722          0.16344925
12           3.03313238          0.10000771
22           3.10162605          0.10250722
          HMGA1HMGA2     11       12        2211        2.83     2.56      3.0412        3.25     2.91      3.1522        3.46     3.38      2.99
5)对第10根肋骨脂肪(trib)性状的影响
HMGA1基因型与第10根肋骨脂肪显著相关。
HMGA2         trib LSMEAN        误差
11            3.00876115         0.13088375
12            3.08337129         0.05507852
22            3.11863733         0.05619663
HMGA1         trib LSMEAN        误差
11            3.28558871         0.08686549
12            3.07574337         0.05310117
22            2.98812120         0.05442963
第10根肋骨  HMGA1HMGA2       11       12        2211          3.05     3.20      2.9512          3.26     3.11      2.9422          3.35     3.23      3.02
1.Berkshire和Yorkshire杂交家系的猪1号染色体的遗传图谱见图4
性平均图谱(recomb.frac.,Kosambi cM):
 9 SW1515                         0.0
                0.17     17.3
 2 S0316                          17.3
                0.03     3.4
11 SWR2300                        20.8
                0.11     10.9
10 S0008                          31.6
                0.16     16.0
 4 SW781                          47.7
                0.04     4.3
 8 S0312                          51.9
                0.13     13.4
 7 S0331                          65.4
                0.03     3.3
 1 MC4R                           68.6
                0.04     4.0
 0 HMGA2                          72.6
                0.15     15.2
 6 SW974                          87.8
                0.17     17.1
 3 SW373                          104.9
                0.22     23.0
 5 SW1301                         128.0
*表示recomb.frac.在这个分析中保持不变
log10_like=-1425.68
性特异图谱(recomb.frac.,Kosambi cM--雌性,雄性):
 9 SW1515                         0.0                         0.0
                0.19     19.7                0.15     14.9
 2 S0316                          19.7                        14.9
                0.03     3.2                 0.02     2.3
11 SWR2300                        22.9                        17.2
                0.08     7.6                 0.16     16.1
10 S0008                          30.5                        33.3
                0.16     16.6                0.14     14.8
 4 SW781                          47.1                        48.1
                0.02     2.0                 0.07     7.0
 8 S0312                          49.1                        55.1
                0.22     23.4                0.04     4.1
 7 S0331                          72.5                        59.2
                0.04     4.5                 0.02     2.1
 1 MC4R                           77.0                        61.3
                0.06     5.6                 0.02     2.2
 0 HMGA2                          82.5                        63.5
                0.20     21.3                0.09     9.5
 6 SW974                          103.8                       73.0
                0.20     21.6                0.13     13.3
 3 SW373                          125.4                       86.3
                0.19     19.4                0.24     26.4
 5 SW1301                         144.8                       112.7
*表示recomb.frac.在这个分析中保持不变
log10_like=-1396.97
2.Berkshire和Yorkshire杂交家系的猪7号染色体的遗传图谱见图5性平均图谱(recomb.frac.,Kosambi cM):
 10   S0025                    0.0
0.27   29.7
  9   S0064                    29.7
0.17   18.1
  8    TNFB                    47.8
0.04   4.4
  0   HMGA1                    52.3
0.12   12.5
  7   SWR1928                  64.7
0.10    9.7
  2   SW2040                   74.4
0.09    9.0
  5   SW252                    83.5
0.06    6.1
  1   SW632                    89.6
0.05    5.5
  4   SW1083                   95.1
0.20   21.6
  3   S0101                    116.7
0.21   22.6
  6   SW764                    139.3
*表示recomb.frac.在这个分析中保持不变
log10_like=-1441.45
性特异图谱(recomb.frac.,Kosambi cM--雌性,雄性):
10  S0025    0.0     0.0    0.30   35.4   0.23   24.9
 9  S0064    35.4    24.9   0.14   14.2   0.21   22.1
 8  TNFB     9.6     47.0   0.06   5.6    0.04   3.5
 0  HWGA1    55.2    50.5   0.17   17.8   0.08   7.9
 7  SWR1928  72.9    58.4   0.08   7.8    0.12   11.9
 2  SW2040   80.7    70.3   0.12   12.1   0.06   5.9
 5  SW252    92.9    76.2   0.09   9.0    0.04   3.8
 1  SW632    101.8   80.0   0.05   5.0    0.06   6.3
 4  SW1083   106.9   86.3   0.21   21.8   0.20   21.3
 3  S0101    128.7   107.6  0.25   27.3   0.17   17.8
 6  SW764            156.0         125.5
log10_like=-1428.65
HMGA1的另一些引物和新序列
引物:
HMA1-F1(正向)5′AAG CAG CCT CCG GTG AGT C3′SEQ ID NO:7
HMA1-R1(正向)5′CAC TTC GCT GGG CTC CTT CT3′SEQ ID NO:8
位于外显子5到内含子5之间(~1800bp,退火温度Ta是65℃)
HM766F(正向)5′TCT CTA GTT CCT CAT TCC3′SEQ ID NO:9
HM766R(正向)5′CCC AAG ACA GAA TAA AAA G3′SEQ ID NO:10
两者都位于内含子5内(~800bp,Ta是51.7℃)
HM867F(正向)5′CCT CTT GTC ATT TTA CTG TC3′SEQ ID NO:11
HM867R(正向)5′ACC CCA CTT TCC TCA ACT3′SEQ ID NO:12
位于内含子5到内含子6之间(~390bp,Ta是57.4℃)
HM978F(正向)5′CTC TGC CTC CAC TCT CTA3′SEQ ID NO:13
HM978R(正向)5′TGC CAA AGG TGA CAA GAC3′SEQ ID NO:14
均位于内含子5内(~1000bp,Ta是59.3℃)
HMAI2F(正向)5′CCA GGA AGG AAA CCA AGG G3′SEQ ID NO:15
HMAI2R(正向)5′TGA CTC AGC AAC CTC CAC G3′SEQ ID NO:16
位于外显子7到内含子7之间(~1200bp,Ta是60℃)
HMAI2F(正向)5′CCA GGA AGG AAA CCA AGG G3′SEQ ID NO:17
HMAI3R(正向)5′TGA CTC AGC AAC CTC CAC G3′SEQ ID NO:18
位于外显子7到内含子7之间(~800bp,Ta是56℃)
PCR条件:
Mix1:
10X PCR缓冲液      1.0μl
MgCl2(25mM)       0.6μl
dNTPs(2.5mM)       0.5μl
HMGY1(25pmol/μl)  0.1μl
HMYS2(25pmol/μl)  0.1μl
Taq聚合酶(5U/μl)     0.07μl
ddH2O                7.63μl
基因组DNA             1.0μl
在PCR反应管中组合Mix1与DNA。在混合物上方覆盖矿物油。按以下PCR程序进行反应:94℃3分钟;36个循环的94℃30秒、Ta1分钟及72℃1分40秒;然后在72℃进行10分钟的最后延伸。在1.6%琼脂糖凝胶上检测2μl的PCR反应产物以证实扩增成功和阴性对照的所需理想结果。(每套引物组在相同的程序中在适当的退火温下进行,如上述)
注意:另外的SNPs通过序列分析来鉴别。SNP位置以粗体字(boldfont)来表示。
各品种间重叠群(contig)序列对比及HMGA1的共有序列
注:另外的SNPS通过序列分析来鉴别。对4个不同品种的猪的测序表明HMGA1基因DNA序列中存在一些多态性。SNP位置以符号(*、+)和箭头来表示。下面是对SNPs的描述。
表1:通过重叠群1和2的序列分析鉴别的新SNPs的位置和碱基变化的描述
    位置     SNP 位于     位置     SNP 位于
重叠群1     197     G/T 内含子5 重叠群1     1391     A/G 内含子5
    259     C/T 内含子5     1564     A/C 内含子5
    309     G/A 内含子5     1643     G/A 内含子5
    913     T/C 内含子5     1784(BanI)     C/T 外显子6
    1004     T/G 内含子5     1848     A/C 内含子6
    1028     T/C 内含子5     2306(NaeI)     C/T 内含子6
    1065     G/A 内含子5     2375     T/C 内含子6
    1170     G/A 内含子5     123     C/A 内含子7
    1333     G/A 内含子5     762     C/T 内含子7
注:重叠群2还有其它通过序列分析无法证实的潜在SNPs。
参考文献
Arlotta,P.,Tai,A.K.,Manfioletti,G.,Clifford,C.,Jay,G.,Ono,S.J.2000.Transgenic mice expressing a truncated form of the high mobilitygroup I-C protein develop adiposity and an abnormally high prevalenceof lipomas.J.Biol.Chem.275,14394-14400.
Ashar,H.R.,Fejzo,M.S.,Tkachenko,A.,Zhou,X.,Fletcher,J.A.,Weremowicz,S.,Morton,C.C.,Chada,K.1995.Disruption of thearchitectural factor HMGI-C:DNA-binding AT hook motifs fused inlipomas to distinct transcriptional regulatory domains.Cell 82:57-65.
Bustin,M.,2001.Revised nomenclature for high mobility group(HMG)chromosomal proteins.Trends Biochem.Sci.26,152-153.
Friedmann,M.,Holth,L.T.,Zoghhbi,H.Y.,Reeves,R.1993.Organization,inducible-expression and chromosome localization of thehuman HMGI(Y)nonhistone protein gene.Nucleic Acids Res.21,4259-4267.
Hess,J.L.1998.Chromosomal translocaitons in benign tumors.Am.J.Clin.Path.109,251-261.
Melillo,R.M,,Pierantoni,G.M,,Scala.S.,Battista,S.,Fedele,M.,Stella,A.,De Biasio,M.C.,Chiappetta,G.,Fidanza,V.,Condorelli,G.,Santoro,M.,Croce,C.M.,Viglietto,G.,Fusco,A.2001.Critical role ofthe HMGI(Y)proteins in adipocytic cell growth and differentiation.Mol.Cell.Biol.21,2485-2495.
Tallini,G.,Dal Cin,P.1999.HMGI(Y)and HMGI-C dysregulation:a common occurrence in human tumors.Adv.Anat.Pathod.6,237-246.
Reeves,R.2000.Structure and function of the HMGI(Y)family ofarchitectural transcription and chromatin structure.Environ.HealthPerspect.108,803-809.
Reeves,R.,Beckerbauer,L.2001.HMGI/Y proteins:flexibleregulators of transcription and chromatin structure.Biochim.Biophy.Acta 1519,13-29.
Zhou,X.,Benson,K.F.,Ashar,H.R.,Chada,K.1995.Mutationresponsible for the mouse pygmy phenotype in the developmentallyregulated factor HMGI-C.Nature 376,771-774.
                                 序列表
<110>衣阿华州立大学研究基金公司
<120>新的HMGA等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用
<130>ISURF 2900
<150>60/364,959
<151>2002-03-15
<160>30
<170>PatentIn version 3.1
<210>1
<211>19
<212>DNA
<213>porcine
<400>1
agaaggagcc cagcgaagt                                                19
<210>2
<211>19
<212>DNA
<213>porcine
<400>2
acagtgctca cccaatggc                                                19
<210>3
<211>20
<212>DNA
<213>porcine
<400>3
actgaagaga catcctcaca                                            20
<210>4
<211>20
<212>DNA
<213>porcine
<400>4
ctaaacctgg gactgtgaag                                            20
<210>5
<211>22
<212>DNA
<213>porcine
<400>5
gataggacta gatacaactt ac                                         22
<210>6
<211>20
<212>DNA
<213>porcine
<400>6
ggatatattg catctctggc                                            20
<210>7
<211>19
<212>DNA
<213>porcine
<400>7
aagcagcctc cggtgagtc                                             19
<210>8
<211>20
<212>DNA
<213>porcine
<400>8
cacttcgctg ggctccttct                                            20
<210>9
<211>18
<212>DNA
<213>porcine
<400>9
tctctagttc ctcattcc                                              18
<210>10
<211>19
<212>DNA
<213>porcine
<400>10
cccaagacag aataaaaag                                             19
<210>11
<211>20
<212>DNA
<213>porcine
<400>11
cctcttgtca ttttactgtc                                            20
<210>12
<211>18
<212>DNA
<213>porcine
<400>12
accccacttt cctcaact                                              18
<210>13
<211>18
<212>DNA
<213>porcine
<400>13
ctctgcctcc actctcta                                              18
<210>14
<211>18
<212>DNA
<213>porcine
<400>14
tgccaaaggt gacaagac                                              18
<210>15
<211>19
<212>DNA
<213>porcine
<400>15
ccaggaagga aaccaaggg                                             19
<210>16
<211>19
<212>DNA
<213>porcine
<400>16
tgactcagca acctccacg                                             19
<210>17
<211>19
<212>DNA
<213>porcine
<400>17
ccaggaagga aaccaaggg                                             19
<210>18
<211>19
<212>DNA
<213>porcine
<400>18
tgactcagca acctccacg                                             19
<210>19
<211>703
<212>DNA
<213>porcine
<400>19
ccaacaccta aaagacctcg gggccgacca aaggggagca aaaacaaggg cgcygccaag     60
acccgggtga ggcttgaagg ggtggctcct ggtggaggga agtgggaagt aaccccccgc    120
cccctgcaag cagctgaggg aggtctggga aggggtgggc ttgtcctgat tctctgcatg    180
ccctttctct ggtacgtggg cccgatgggt cttggctagt tgaggaaagt ggggtgatgg    240
ccgaggccta acttctaggg ccttgtcttg cccaggacac tggggaagtc aagtcagatg    300
tcccagagct ttcctggtct ggagggaggc cagttgggca gaatggaggg ctgttccccc    360
tgggctgaga tgtcacctcc cccccaaccc caggccgcct gggtcctgag ggtgggggag    420
caggcaaggc cagatctaca gtggcattgg cctttggaga agttgttttg ttttttattt    480
tattttttct aagacacgac tcatatcctc tgagtcacgg gtgaaggagg gagtgggggc    540
gtgtgtgtgt atgttggggt ggggggcggt gtggcyggcc agtcatcccc agctggactc    600
cggtgggcct gctgggctga gagtcccggc tgcccctccc tgctcgccct cgccctccag    660
ggcactggtc actgcggggc acccgccatt gggtgagcac tgt                      703
<210>20
<211>1168
<212>DNA
<213>porcine
<400>20
actgaagaga catcctcaca gaagtctgca gaagaggatt aggaggckcc aacattcaac     60
gtccacctca gcagcagttg aatcttttga agggagaact acttactccc tattgccatg    120
gtttttccac tttcatctgg ggttgcaggg gaagggtggg ggtggggtgg gaggagaagg    180
gacataacct tgaaaaggac tgtattaatc accttctttg taatcccttc acagtcccag    240
gtttagtgga aaactgctgt aaacacagga gacacagttt aacaatgcaa cttttaatga    300
ctgttttcat tttccttaac ctactaatag tttgtggatc tgatgagcag gagtgggtgg    360
gtgagaaaaa ctctgaatgg gtttagccaa tcactgtact gcatccaaac cagaaacgtg    420
tcacctgcgt gacagtgggc attcctctag gcaaggtgca gtaggaaatg ctgcccacct    480
cagacgtcac ccagccccct ctcagtggtg aagcttctgt ttagaacacc aaagatagga    540
ctagatacta cttactttct catataacct ggtagacact tacttgatga tgtttttatt    600
tttaccttta tttctaagtg agaggaaatg ctgatgtatc ytttcatcca actaaccaga    660
aaaggtgatg ttctcttttc aaaaagggaa gtaagcaaac tcagattgcc aactcctata    720
tttatggatg ctatacattg cttatttaat acacagttaa cagtaatggt gagttttaat    780
tctctccgta gcgcctttgg taattcacaa tagtgatgga tctaatggtt ctagcatttt     840
aagaaaccta gacaagtaaa attattctct ttatgatttc atgaaaaggt acaacagaat     900
aacccatgat gaacttacct ggattatgag acgggagaag caaaatctaa atctattttg     960
ctatagttat actacaattt aaagaacaac aacaaagcag gctctcttgt ctctttcttt    1020
ytctctctgt ctctctctcc attgtgtatg agtttctgtg aaagatctaa ataccatgtt    1080
cctcaaatga agcttatgtg ttactccagg taatacgttt tgacatagga tggttggctg    1140
aagtgctttt ctttgacatc agcgycgc                                       1168
<210>21
<211>1838
<212>DNA
<213>porcine
<220>
<221>misc_feature
<222>(725)..(725)
<223>n can be any nucleotide
<400>21
aaaaagtttc tgggctagca cctgttcatg ggcctccttg agtggccctg ggttgggctc     60
tgcctccact ctctaaaagg aaattgaagc ccaagaagtt gacagtgttg aggagttggt    120
gcagagtgac tcagagccct gattctgtcc cacccctccc cccaaaggtc acgtgaggtt    180
aaaaggccac cctggcactt tgtgcgcccc agggagcttg gcccgtcagg ctgtggggac    240
cacctgttat atggtggaga tcttggtgtc tgttacaggg gggcagctgt ccccaagtga    300
ggggcagcgg ctggtggtga agcccagtta cttccttttc aggggggaga ggaaaggaat    360
tgaggtcgat ccctggcctt tagatggcag gcagtttgtg tacctgggcc tccggcttcc    420
ccgtctgtag gtggagagac ctggcggagc caggggtcat gagaagtcca atgggtgctg    480
gactcgagct gcctcatgga gggccctcag ctcgtgggga acttgtcctc ttcatctggt    540
cctttggcct ctcccagcck cctgttagcg gcggtcatgg ttgcgggggg atcagaaggg    600
gtgttgggtt actggaccac gcgcagcctg gggaaaccat agctgacgtg cctttgctgc    660
ccagagcctg tgctgcatgt agcagctttt tattctgtct tgggttagta caatttcagt     720
ggcantaatg ggcagggatc tggggctcca agatctggac agaatcctct gggggaggca     780
gcctggaggt cccttctgtt tggggggatg tcctctccca cctcctgcat cgccctggac     840
actggcacgt ccttcattgt acattgttca gtttttttta ctgtcacagg gaagcaaggg     900
gagaggcctt gcaaaggatg ttcagactgg gaacctgaat ccccagggct gtgcctgcca     960
tgattcctgt ggattctgga gtggggctgt cggggtgggg gtggggtggg gcagagactg    1020
tctggtgaaa gaggtgggac actggtgtct atgccctgac cgttccatct gtctttgcag    1080
aaggagccca gcgaagtgcc aacacctaaa agacctcggg gccgaccaaa ggggagcaaa    1140
aacaagggcg ccgccaagac ccgggtgagg cttgaagggg tggctcctgg tggagggaag    1200
tgggaagtaa cccccagccc cctgcaagca gctgagggag gtctgggaag gggtgggctt    1260
gtcctgattc tctgcatgcc ctttctctgg tacgtgggcc cgatgggtct tggctagttg    1320
aggaaagtgg ggtgatggcc gaggcctaac ttctagggcc ttgtcttgcc caggacactg    1380
gggaagtcaa gtcagatgtc ccagagcttt cctggtctgg agggaggcca gttgggcaga    1440
atggagggct gttccccctg ggctgagatg tcacctcccc cccaacccca ggccgcctgg    1500
gtcctgaggg tgggggagca ggcaaggcca gatctacagt ggcattggcc tttggagaag    1560
ttgttttgtt ttttatttta ttttttctaa gacacgactc atatcctctg agtcacgggt    1620
gaaggaggga gtgggggcgt gtgtgtgtat gttggggtgg ggggcggtgt ggcyggccag    1680
tcatccccag ctggactccg gtgggcctgc tgggctgaga gtcccggctg cccctccctg    1740
ctygccctcg ccctccaggg cactggtcac tgcggggcac ccgccattgg gtgagcactg    1800
tcagggacat ttttgacaat ggatcttttc tctgcaca                            1838
<210>22
<211>2484
<212>DNA
<213>porcine
<400>22
ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag     60
gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca    120
tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc    180
caagccgaag ggaccctgtg gtcaggcagg ccagtgctca caccggggta aagcacccag    240
cctttgtttc cacctcattg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat     300
agaaacgcaa aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca     360
cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc     420
tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc     480
cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga     540
agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc     600
tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag     660
cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac     720
aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct     780
tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt     840
tgtgtacctg ggcctccggc ttccccgtct gtaggtggag agacctggcg gagccagggg     900
tcatgagaag tctaatgggt gctggactcg agctgcctca tggagggccc tcagctcgtg     960
gggaacttgt cctcttcatc tggtcctttg gcctctccca gcctcctgtt agcggcggtc    1020
atggttgtgg ggggatcaga aggggtgttg ggttactgga ccacacgcag cctggggaaa    1080
ccatagctga cgtgcctttg ctgcccagag cctgtgctgc atgtagcagc tttttattct    1140
gtcttgggct tagtacaatt tcagtgacac taatgggcag ggatctgggg ctccaagatc    1200
tggacagaat cctctggggg aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc    1260
tcccacctcc tgcatcgccc tggacactgg cacgtccttc attgtacatt gttcagtttt    1320
cgtgactcta caaggtaggt cttgtcacct ttggcagatg aggggaactg tagctcaagc    1380
ataaagcgtc ttgcccaaga tcttagacct aggcaatggc agagctggga tgcgaacaga    1440
gcagcctaag aaggggtttc tgtccccatg acacccttcc caatgggctt ctagcctctt    1500
gtcattttac tgtcacaggg aagcaagggg agaggccttg caaaggatgt tcagactggg    1560
aacctgaatc cccagggctg tgcctgccat gattcctgtg gattctggag tggggctgtc    1620
ggggtggggg tggggtgggg cagagactgt ctggtgaaag aggtgggaca ctggtgtcta    1680
tgccctgacc gttccatctg tctttgcaga aggagcccag cgaagtgcca acacctaaaa    1740
gacctcgggg ccgaccaaag gggagcaaaa acaagggcgc tgccaagacc cgggtgaggc    1800
ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag    1860
ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt    1920
acgtgggccc gatgggtctt ggctagttga ggaaagtggg gtgatggccg aggcctaact    1980
tctagggcct tgtcttgccc aggacactgg ggaagtcaag tcagatgtcc cagagctttc    2040
ctggtctgga gggaggccag ttgggcagaa tggagggctg ttccccctgg gctgagatgt    2100
cacctccccc ccaaccccag gccgcctggg tcctgagggt gggggagcag gcaaggccag    2160
atctacagtg gcattggcct ttggagaagt tgttttgttt tttattttat tttttctaag    2220
acacgactca tatcctctga gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg    2280
ttggggtggg gggcggtgtg gccggccagt catccccagc tggactccgg tgggcctgct    2340
gggctgagag tcccggctgc ccctccctgc tygccctcgc cctccagggc actggtcact    2400
gcggggcacc cgccattggg tgagcactgt cagggacatt tttgacaatg gatcttttct    2460
ctgaccatct agaaaaccac caca                                           2484
<210>23
<211>2484
<212>DNA
<213>porcine
<400>23
ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag     60
gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca    120
tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc    180
caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag    240
cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat    300
agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca    360
cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc    420
tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc    480
cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga    540
agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc    600
tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag    660
cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac    720
aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct    780
tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt    840
tgtgtacctg ggcctccggc ttccccgtct gtaggtggag agacctggcg gagccagggg    900
tcatgagaag tctaatgggt gctggactcg agctgcctca tggagggccc tcagctcgtg     960
gggaacttgt cctcttcatc tggtcctttg gcctctccca gcctcctgtt agcggcggtc    1020
atggttgtgg ggggatcaga aggggtgttg ggttactgga ccacgcgcag cctggggaaa    1080
ccatagctga cgtgcctttg ctgcccagag cctgtgctgc atgtagcagc tttttattct    1140
gtcttgggct tagtacaatt tcagtggcac taatgggcag ggatctgggg ctccaagatc    1200
tggacagaat cctctggggg aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc    1260
tcccacctcc tgcatcgccc tggacactgg cacgtccttc attgtacatt gttcagtttt    1320
cgtgactctg caaggtaggt cttgtcacct ttggcagatg aggggaactg tagctcaagc    1380
ataaagcatc ttgcccaaga tcttagacct aggcaatggc agagctggga tgcgaacaga    1440
gcagcctaag aaggggtttc tgtccccatg acacccttcc caatgggctt ctagcctctt    1500
gtcattttac tgtcacaggg aagcaagggg agaggccttg caaaggatgt tcagactggg    1560
aacctgaatc cccagggctg tgcctgccat gattcctgtg gattctggag tggggctgtc    1620
ggggtggggg tggggtgggg cagagactgt ctggtgaaag aggtgggaca ctggtgtcta    1680
tgccctgacc gttccatctg tctttgcaga aggagcccag cgaagtgcca acacctaaaa    1740
gacctcgggg ccgaccaaag gggagcaaaa acaagggcgc cgccaagacc cgggtgaggc    1800
ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag    1860
ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt    1920
acgtgggccc gatgggtctt ggctagttga ggaaagtggg gtgatggccg aggcctaact    1980
tctagggcct tgtcttgccc aggacactgg ggaagtcaag tcagatgtcc cagagctttc    2040
ctggtctgga gggaggccag ttgggcagaa tggagggctg ttccccctgg gctgagatgt    2100
cacctccccc ccaaccccag gccgcctggg tcctgagggt gggggagcag gcaaggccag    2160
atctacagtg gcattggcct ttggagaagt tgttttgttt tttattttat tttttctaag    2220
acacgactca tatcctctga gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg    2280
ttggggtggg gggcggtgtg gctggccagt catccccagc tggactccgg tgggcctgct    2340
gggctgagag tcccggctgc ccctccctgc tcgccctcgc cctccagggc actggtcact    2400
gcggggcacc cgccattggg tgagcactgt cagggacatt tttgacaatg gatcttttct    2460
ctgaccatct agaaaaccac caca                                           2484
<210>24
<211>1950
<212>DNA
<213>porcine
<400>24
ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag      60
gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca     120
tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc     180
caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag     240
cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat     300
agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca     360
cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc     420
tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc     480
cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga     540
agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc     600
tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag     660
cttggcccgt caggctgtgg actttgtgcg ccccagggag cttggcccgt caggctgtgg     720
ggaccacctg ttatatggtg gagatcttgg tgtctgttac aggggggcag ctgtccccaa     780
gtgaggggca gcggctggtg gtgaagccca gttacttcct tttcaggggg gagaggaaag     840
gaattgaggt cgatccctgg cctttagatg gcaggcagtt tgtgtacctg ggcctccggc     900
ttccccgtct gtaggtggag agacctggcg gagccagggg tcatgagaag tctaatgggt     960
gctggactcg agctgcctca tggagggccc tcagctcgtg gggaacttgt cctcttcatc    1020
tggtcctttg gcctctccca gcctcctgtt agcggcggtc atggttgtgg ggggatcaga    1080
aggggtgttg ggttactgga ccacgcgcag cctggggaaa ccatagctga cgtgcctttg    1140
ctgcccagag cctgtgctgc atgtagcagc tttttattct gtcttgggct tagtacaatt    1200
tcagtggcac taatgggcag ggatctgggg ctccaagatc tggacagaat cctctggggg    1260
aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc tcccacctcc tgcatcgccc    1320
tggacactgg cacgtccttc attgtacatt gttcagtttt cgtgactctg caaggtaggt    1380
cttgtcacct ttggcagatg aggggaactg tagctcaagc ataaagcatc ttgcccaaga    1440
tcttagacct aggcaatggc agagctggga tgcgaacaga gcagcctaag aaggggtttc    1500
tgtccccatg acacccttcc caatgggctt ctagcctctt gtcattttac tgtcacaggg    1560
aagcaagggg agaggccttg caaaggatgt tcagactggg cacctgaatc cccagggctg    1620
tgcctgccat gattcctgtg gattctggag tggggctgtc ggggtggggg tggggtgggg    1680
cagagactgt ctggtgaaag aggtgggaca ctggtgtcta tgccctgacc gttccatctg    1740
tctttgcaga aggagcccag cgaagtgcca acacctaaaa gacctcgggg ccgaccaaag    1800
ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag    1860
ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt    1920
acgtgggccc gatgggtctt ggctagttga                                     1950
<210>25
<211>2404
<212>DNA
<213>porcine
<400>25
ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag     60
gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca    120
tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc    180
caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag    240
cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat    300
agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca    360
cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc    420
tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc    480
cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga    540
agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc    600
tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag    660
cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac    720
aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct    780
tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt    840
tgtgtacctg ggcctccggc ttccccgtct gtaggtggag gctggactcg agctgcctca    900
tggagggccc tcagctcgtg gggaacttgt cctcttcatc tggtcctttg gcctctccca    960
gcctcctgtt agcggcggtc atggttgtgg ggggatcaga aggggtgttg ggttactgga    1020
ccacgcgcag cctggggaaa ccatagctga cgtgcctttg ctgcccagag cctgtgctgc    1080
atgtagcagc tttttattct gtcttgggct tagtacaatt tcagtggcac taatgggcag    1140
ggatctgggg ctccaagatc tggacagaat cctctggggg aggcagcctg gaggtccctt    1200
ctgtttgggg ggatgtcctc tcccacctcc tgcatcgccc tggacactgg cacgtccttc    1260
attgtacatt gttcagtttt cgtgactctg caaggtaggt cttgtcacct ttggcagatg    1320
aggggaactg tagctcaagc ataaagcatc ttgcccaaga gcagcctaag aaggggtttc    1380
tgtccccatg acacccttcc caatgggctt ctagcctctt gtcattttac tgtcacaggg    1440
aagcaagggg agaggccttg caaaggatgt tcagactggg aacctgaatc cccagggctg    1500
tgcctgccat gattcctgtg gattctggag tggggctgtc ggggtggggg tggggtgggg    1560
cagagactgt ctggtgaaag aggtgggaca ctggtgtcta tgccctgacc gttccatctg    1620
tctttgcaga aggagcccag cgaagtgcca acacctaaaa gacctcgggg ccgaccaaag    1680
gggagcaaaa acaagggcgc cgccaagacc cgggtgaggc ttgaaggggt ggctcctggt    1740
ggagggaagt gggaagtaac cccccgcccc ctgcaagcag ctgagggagg tctgggaagg    1800
ggtgggcttg tcctgattct ctgcatgccc tttctctggt acgtgggccc gatgggtctt    1860
ggctagttga ggaaagtggg gtgatggccg aggcctaact tctagggcct tgtcttgccc    1920
aggacactgg ggaagtcaag tcagatgtcc cagagctttc ctggtctgga gggaggccag    1980
ttgggcagaa tggagggctg ttccccctgg gctgagatgt cacctccccc ccaaccccag    2040
gccgcctggg tcctgagggt gggggagcag gcaaggccag atctacagtg gcattggcct    2100
ttggagaagt tgttttgttt tttattttat tttttctaag acacgactca tatcctctga    2160
gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg ttggggtggg gggcggtgtg    2220
gcyggccagt catccccagc tggactccgg tgggcctgct gggctgagag tcccggctgc    2280
ccctccctgc tcgccctcgc cctccagggc actggtcact gcggggcacc cgccattggg    2340
tgagcactgt cagggacatt tttgacaatg gatcttttct ctgaccatct agaaaaccac    2400
caca                                                                 2404
<210>26
<211>1103
<212>DNA
<213>porcine
<400>26
tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt      60
aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc     120
tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc     180
aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag     240
cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta     300
gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc     360
ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt     420
gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca     480
 aatagctga gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct     540
tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc     600
accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag     660
tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt     720
gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc     780
tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg     840
ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct     900
ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc     960
agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg    1020
gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta    1080
aattcttcct tttttatgaa tga                                            1103
<210>27
<211>1103
<212>DNA
<213>porcine
<400>27
tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt      60
aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc     120
tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc     180
aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag     240
cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta     300
gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc     360
ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt     420
gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca     480
aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct     540
tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc     600
accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag     660
tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt     720
gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc     780
tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg     840
ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct     900
ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc     960
agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg    1020
gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta    1080
aattcttcct tttttatgaa tga                                            1103
<210>28
<211>1102
<212>DNA
<213>porcine
<220>
<221>misc_feature
<222>(949)..(949)
<223>n is any nucleotide
<220>
<221>misc_feature
<222>(957)..(957)
<223>n is any nucleotide
<400>28
tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt      60
aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc     120
tgmggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc     180
aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag     240
cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta     300
gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc     360
ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt     420
gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca     480
aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct     540
tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc     600
accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag     660
tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt     720
gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc     780
tggggtagcc cgcggccagc ctgttgtggc cgctccacag cccagcagct gcccctgcgg     840
gccaaggcca cctgggtccc cggcacccac cagtgcagtg agggggctca ttgcaccctc     900
caggcaccct gtcccatttc ctcccctgac cacctccctg ctccccccnc cacccancca     960
gtcacttcct ccagcctagt gctgccctgg gccctgccag gtccctgcct tgggcctggg    1020
ggccaagggc ctggctcggt gagagcagcc catgtgtgtg gtttttttcc ctccctttaa    1080
attcttcctt ttttatgaat ga                                             1102
<210>29
<211>1059
<212>DNA
<213>porcine
<400>29
tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt      60
aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc     120
tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc     180
aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag     240
cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta     300
gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc     360
ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt     420
gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca     480
aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct     540
tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc     600
accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag     660
tgagtaacag gaaacaagtt gttttggagt ttgtgctggc acgggggccc ccatgtggtg     720
tcccaacatt ccggcccagt gagtgagccc cacacttccc tttcctcccc gccctggcct     780
ggggtcagcc cgcggccagg gccaaggcca cctgggtccc cggcacccac cagtgcagtg     840
agggggctca ttgcaccctc caggcaccct gtcccatttc ctcccctgac cacctccctg     900
ctccccccac cacccagcca gtcattcctc cagctagtgc tgccctgggc cctgccaggt     960
ccctgccttg ggcctggggg ccaagggctg gctcggtgag agcagcccat gtgtgtggtt    1020
tttttccctc cctttaaatt cttccttttt tatgaatga                           1059
<210>30
<211>1103
<212>DNA
<213>porcine
<400>30
tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt     60
aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc    120
tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc    180
aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag    240
cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta    300
gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc    360
ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt    420
gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca    480
aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct     540
tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc     600
accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag     660
tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt     720
gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc     780
tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg     840
ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct     900
ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc     960
agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg    1020
gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta    1080
aattcttcct tttttatgaa tga                                            1103

Claims (31)

1、一种鉴别具有表征一种表型性状的基因型的动物的方法,所述方法包括:从所述动物中获取核酸样品,检测样品中是否存在特征为HMGA1或HMGA2基因多态性的基因型或者是否存在与其连锁的多态性,所述基因型是已表明与一种表型性状显著相关的基因型;及根据所述动物中存在的基因型将所述动物与所述表型性状相关联。
2、权利要求1的方法,其中经BLAST对比确定所述多态性导致HMGA基因或其等价物的氨基酸变化。
3、权利要求1的方法,其中所述多态性位于HMGA1基因中。
4、权利要求3的方法,其中所述基因型是NaeI或BanI多态性。
5、权利要求1的方法,其中所述多态性定位在HMGA2基因中。
6、权利要求5的方法,其中所述基因型是HhaI多态性。
7、权利要求1的方法,其中所述检测步骤选自以下一组中:限制性片段长度多态性(RFLP)分析、微测序、MALD-TOF、SINE、异源双链分析、单链构象多态性(SSCP)、变性梯度凝胶电泳(DGGE)和温度梯度凝胶电泳(TGGE)。
8、权利要求1的方法,其中所述动物是猪。
9、权利要求1的方法,所述方法进一步包括扩增HMGA核苷酸序列或其含有所述多态性部分的量的方法。
10、权利要求9的方法,其中所述扩增包括以下步骤:选择能够扩增含有一个或多个多态性NaeI、BanI或HhaI位点的HMGA核苷酸序列的一个区域的正向和反向引物。
11、权利要求9的方法,其中所述正向和反向引物选自以下一组:SEQ ID No:1和2、3和4、5和6、7和8、9和10、11和12、13和14、15和16,或17和18。
12、一种筛选动物以确定更可能示出改良的生长、脂肪量、肉质和饲料消耗比性状的动物的方法,包括:从所述动物中获取生物学样品;检测所述动物中是否存在与改良的生长、脂肪量、肉质、饲料消耗比性状相关的基因型,所述基因型的特征为:a)在HMGA核苷酸序列中的多态性,所述多态性导致一或多个NaeI、BanI或HhaI位点。
13、权利要求12的方法,所述方法进一步包括扩增HMGA编码核苷酸序列基因或其含有所述多态性部分的量的步骤。
14、一种在表达时编码HMGA蛋白的核苷酸序列或等位基因,所述核苷酸序列包含由NaeI、BanI或HhaI多态性位点所致的变体。
15、权利要求11的HMGA蛋白。
16、一种鉴别具有表征一种显著相关的表型性状的所需基因型的动物的方法,,该方法包括:从动物中获取包含HMGA1或HMGA2基因的核酸样品,将该样品用与BanI、NaeI或HhaI识别位点相同的限制性酶消化以获得片段,将消化产生的片段从消化物中分离出来,鉴别HMGA1或HMGA2基因的等位基因上是否存在BanI、NaeI或HhaI位点,其中存在所述等位基因表明动物具有表征一种显著相关的表型性状的基因型。
17、一种选择具有所需性状的动物的方法,包括如下步骤:从动物中获取核酸样品,鉴别多态性,所述多态性是特征为BanI、NaeI或HhaI限制位点的HMGA1或HMGA2基因中的核苷酸,然后选择具有与所需性状相关的核苷酸的动物。
18、一种间接选择HMGA基因中多态性的方法,所述方法包括:从一个动物中获取核酸样品,并用已知与HMGA基因相关的DNA标记在HMGA1或HMGA2基因中鉴别特征为BanI、NaeI或HhaI限制位点的多态性,所述DNA标记进一步是已知与用于间接鉴别核苷酸取代的有利性状相关的标记,并根据核苷酸取代的存在来选择所述动物。
19、一种鉴别具有表征表型性状的所需基因型的动物的方法,该方法包括:通过从感兴趣的品系或品种的动物中获取样品、从各样品中制备每个动物的核酸样品、筛选多态性而确定HMGA基因的基因型来确定HMGA基因型和感兴趣的性状间的关联,其中该多态性的存在表明该动物具有表征有利表型性状的基因型,然后计算该HMGA基因型与所述性状之间的关联。
20、一种选择育种用动物的方法,所述方法包括:从所述动物中获取核酸样品;检测样品HMGA1或HMGA2基因是否存在多态性,所述多态性已示出与表型性状显著相关;然后根据标记基因型的效应估计值,将HMGA1或HMGA2基因型用在选择模型中,并从而根据得出的估计值选择用作育种的动物。
21、一种隔离动物以在屠宰时提供均一性的方法,该方法包括:从所述动物中获取核酸样品;检测样品中与肉质相关的多态性在HMGA基因中存在与否,然后根据存在于所述动物中的多态性对所述动物进行隔离。
22、一种筛选更可能产生所需的生长、脂肪量、肉质和饲料消耗比的动物的方法,该方法包括:从所述动物中获取遗传物质样品;并检测在所述动物中与提高的生长、脂肪量、肉质和饲料消耗比相关的基因型存在,所述基因型具有以下特征:a)HMGA基因中的多态性。
23、权利要求22的方法,其中用BLAST对比确定所述多态性导致HMGA基因或其等价物的氨基酸变化。
24、权利要求22的方法,其中所述多态性位于HMGA1或HMGA2基因中。
25、权利要求22的方法,其中所述基因型为NaeI、BanI或HhaI多态性。
26、权利要求22的方法,其中所述检测步骤选自以下一组:限制性片段长度多态性(RFLP)分析、微测序、MALD-TOF、SINE、异源双链分析、单链构象多态性(SSCP)、变性梯度凝胶电泳(DGGE)和温度梯度凝胶电泳(TGGE)。
27、权利要求22的方法,其中所述动物是猪。
28、权利要求22的方法,进一步包括扩增含有所述多态性的HMGA核苷酸序列或其部分量的步骤。
29、权利要求28的方法,其中所述扩增包括以下步骤:选择能够扩增含有一或多个NaeI、BanI或HhaI位点的HMGA核苷酸序列的一个区域的正向和反向引物。
30、一个在表达时编码HMGA蛋白的核苷酸序列或等位基因,所述核苷酸序列包含SEQ ID NOS:19、20、21、22、23、24、25、26、27、28或29。
31、权利要求30的HMGA蛋白。
CNA038061198A 2002-03-15 2003-03-14 新的hmga等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用 Pending CN1643162A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36495902P 2002-03-15 2002-03-15
US60/364,959 2002-03-15

Publications (1)

Publication Number Publication Date
CN1643162A true CN1643162A (zh) 2005-07-20

Family

ID=28041994

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038061198A Pending CN1643162A (zh) 2002-03-15 2003-03-14 新的hmga等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用

Country Status (9)

Country Link
US (1) US7244564B2 (zh)
EP (1) EP1485504A4 (zh)
JP (1) JP2005535292A (zh)
CN (1) CN1643162A (zh)
AU (1) AU2003220315A1 (zh)
BR (1) BR0308340A (zh)
CA (1) CA2477911A1 (zh)
MX (1) MXPA04008989A (zh)
WO (1) WO2003078651A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102220410A (zh) * 2010-04-16 2011-10-19 中国农业大学 一种辅助鉴定具有不同体重性状鸡的方法
CN103898107A (zh) * 2014-04-17 2014-07-02 江西农业大学 影响猪生长性状的主效snp标记及其在种猪生产性能遗传改良中的应用
CN110904243A (zh) * 2019-12-12 2020-03-24 东北农业大学 一种预示和鉴定鸡腹部脂肪量的分子标记方法及应用
CN111560421A (zh) * 2020-06-16 2020-08-21 西北农林科技大学 一种夏南牛HMGA2基因Indel标记的检测方法及应用
CN113801878A (zh) * 2011-06-15 2021-12-17 Nse产品公司 识别热量限制标记物和热量限制模拟物

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0308340A (pt) 2002-03-15 2005-05-24 Univ Iowa State Res Found Inc Alelos de hmga inusitados e seu uso como marcadores genéticos para traços de crescimento, gordura, qualidade da carne e eficiência da ração
ZA200506094B (en) 2002-12-31 2006-11-29 Mmi Genomics Inc Compositions, methods and systems for inferring bovine traits
WO2005040400A2 (en) * 2003-10-24 2005-05-06 Mmi Genomics, Inc. Methods and systems for inferring traits to manage non-beef livestock
WO2007065206A1 (en) * 2005-12-05 2007-06-14 Commonwealth Scientific And Industrial Research Organisation Selection markers for net feed intake
GB0722068D0 (en) * 2007-11-09 2007-12-19 Mars Inc Predictive test
EP3153030B1 (en) 2007-11-29 2019-03-27 Monsanto Technology LLC Meat products with increased levels of beneficial fatty acids
US20110054246A1 (en) * 2009-08-28 2011-03-03 Clutter Archie C Whole genome scan to discover quantitative trai loci (qtl) affecting growth, body composition, and reproduction in maternal pig lines
CN103409440B (zh) * 2013-07-02 2015-05-06 江西农业大学 Phkg1基因及其在种猪肉质性状遗传改良中的应用
CN109694916B (zh) * 2019-01-08 2022-03-25 甘肃农业大学 一种与绵羊饲料转化率相关的分子标记及其应用
CN109554489B (zh) * 2019-01-25 2022-03-25 甘肃农业大学 一种与绵羊饲料转化率相关的分子标记及其应用
CN111363833B (zh) * 2020-04-24 2023-10-31 佛山科学技术学院 与猪肉质导电率性状相关的snp分子标记及其应用
CN117265139B (zh) * 2023-11-23 2024-02-20 北京康普森生物技术有限公司 一种萨福克羊体重相关snp标记及其筛选方法与应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998030689A1 (en) 1997-01-10 1998-07-16 Nutreco Nederland B.V. Selection for dwarfism in poultry
BR0308340A (pt) 2002-03-15 2005-05-24 Univ Iowa State Res Found Inc Alelos de hmga inusitados e seu uso como marcadores genéticos para traços de crescimento, gordura, qualidade da carne e eficiência da ração

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102220410A (zh) * 2010-04-16 2011-10-19 中国农业大学 一种辅助鉴定具有不同体重性状鸡的方法
CN102220410B (zh) * 2010-04-16 2013-05-22 中国农业大学 一种辅助鉴定具有不同体重性状鸡的方法
CN113801878A (zh) * 2011-06-15 2021-12-17 Nse产品公司 识别热量限制标记物和热量限制模拟物
CN103898107A (zh) * 2014-04-17 2014-07-02 江西农业大学 影响猪生长性状的主效snp标记及其在种猪生产性能遗传改良中的应用
CN103898107B (zh) * 2014-04-17 2015-07-22 江西农业大学 影响猪生长性状的主效snp标记及其在种猪生产性能遗传改良中的应用
CN110904243A (zh) * 2019-12-12 2020-03-24 东北农业大学 一种预示和鉴定鸡腹部脂肪量的分子标记方法及应用
CN110904243B (zh) * 2019-12-12 2020-11-10 东北农业大学 一种预示和鉴定鸡腹部脂肪量的分子标记方法及应用
CN111560421A (zh) * 2020-06-16 2020-08-21 西北农林科技大学 一种夏南牛HMGA2基因Indel标记的检测方法及应用
CN111560421B (zh) * 2020-06-16 2023-05-30 西北农林科技大学 一种夏南牛HMGA2基因Indel标记的检测方法及应用

Also Published As

Publication number Publication date
US20040029145A1 (en) 2004-02-12
US7244564B2 (en) 2007-07-17
MXPA04008989A (es) 2005-06-03
JP2005535292A (ja) 2005-11-24
AU2003220315A1 (en) 2003-09-29
CA2477911A1 (en) 2003-09-25
EP1485504A2 (en) 2004-12-15
WO2003078651A3 (en) 2004-02-26
WO2003078651A2 (en) 2003-09-25
EP1485504A4 (en) 2007-03-07
BR0308340A (pt) 2005-05-24
AU2003220315A2 (en) 2003-09-29

Similar Documents

Publication Publication Date Title
CN1483081A (zh) 新的prkag3等位基因及其作为生殖和肉质性状的遗传标记的应用
CN1643162A (zh) 新的hmga等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用
CN1806051A (zh) 通过(例如)t细胞受体v/d/j基因中的重复鉴定克隆性细胞
CN1263559A (zh) 分析动物产品的方法
CN1896284A (zh) 一种鉴别等位基因类型的方法
US20090269741A1 (en) Method for assessing traits selected from longissimus dorsi peak force, intramuscular fat, retail beef yield and net feed intake in bovine animals
CN1930306A (zh) 发展用于血栓形成倾向识别的方法(mert)
CN1500144A (zh) 扩增的核酸及其固定化制品
CN1524127A (zh) 核苷酸多态性的检测方法
MXPA06009452A (es) Polimorfismos del promotor de leptin y sus usos.
CN1798974A (zh) 基因组比较杂交
CN1890368A (zh) 扩增核酸的方法
CN1193102C (zh) 黑皮质素-4受体基因及其作为动物脂肪含量、体重增加和/或饲料消耗的遗传标记的用途
CN1918305A (zh) 核酸检测方法及其应用
Burgos et al. Allelic incidence in several pig breeds of a missense variant of pig melanocortin-4 receptor (MC4R) gene associated with carcass and productive traits; its relation to IGF2 genotype
CA2453001A1 (en) Method of testing a mammal for its predisposition for fat content of milk and/or its predisposition for meat marbling
CN1668635A (zh) 新钙蛋白酶抑制蛋白(cast)等位基因
AU2010295245B2 (en) Methods of genotyping livestock
CN1809644A (zh) 第17号染色体数量性状基因座精细定位及其在标记辅助选择中的应用
CN1503847A (zh) 用于鉴定牛脊椎畸形综合征携带者的遗传试验
CN1671841A (zh) 基因多态性分型方法
CN101048504A (zh) 对干扰素治疗肾细胞癌反应的鉴定标记
CN1496402A (zh) 表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法
US20070003956A1 (en) Approaches to identifying genetic traits in animals
CN1678741A (zh) 用于检测基因多态性的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication