CN117431324A - 一种奶牛全基因组中高密度snp芯片及其应用 - Google Patents

一种奶牛全基因组中高密度snp芯片及其应用 Download PDF

Info

Publication number
CN117431324A
CN117431324A CN202311218327.1A CN202311218327A CN117431324A CN 117431324 A CN117431324 A CN 117431324A CN 202311218327 A CN202311218327 A CN 202311218327A CN 117431324 A CN117431324 A CN 117431324A
Authority
CN
China
Prior art keywords
snp
chip
cows
genome
cow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311218327.1A
Other languages
English (en)
Inventor
孙东晓
麻柱
刘林
郑伟杰
张琪
吕小青
李艳华
贺巾锋
韩博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING DAIRY CATTLE CENTER
China Agricultural University
Original Assignee
BEIJING DAIRY CATTLE CENTER
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING DAIRY CATTLE CENTER, China Agricultural University filed Critical BEIJING DAIRY CATTLE CENTER
Priority to CN202311218327.1A priority Critical patent/CN117431324A/zh
Publication of CN117431324A publication Critical patent/CN117431324A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P60/00Technologies relating to agriculture, livestock or agroalimentary industries
    • Y02P60/80Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
    • Y02P60/87Re-use of by-products of food processing for fodder production

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种中高密度奶牛全基因组126K SNP芯片,其包含检测120,155个SNP位点的试剂,所述SNP位点来自:第一类,发明人团队前期研究挖掘与鉴定的奶牛重要经济性状显著相关的SNP位点,包含5,363个SNP位点;第二类,奶牛主要遗传缺陷基因位点和亲子鉴定基因位点,包含223个SNP个位点;第三类,基于我国的大规模奶牛群体,根据检出率、基因频率、位置唯一性、基因型填充原理及基因组上的分布,从现有商业化奶牛基因组芯片挑选的SNP位点,包含114,569个SNP位点。本发明的芯片,可用于进行中国荷斯坦牛的全基因组关联分析、全基因组选择育种、亲子鉴定和常见牛遗传缺陷鉴定等方面。

Description

一种奶牛全基因组中高密度SNP芯片及其应用
技术领域
本发明涉及分子生物学和生物芯片领域,具体地,本申请提供了一种中高密度奶牛全基因组126K SNP芯片及其应用。
背景技术
SNP(单核苷酸多态性)分析是目前挖掘与鉴定重要复杂性状关键基因以及基因组选择(Genome selection,GS)的重要分析手段。基于芯片的SNP基因分型技术可以实现同时对大量SNP位点进行检测,具有快速、高通量的优势,显著提高了检测效率。作为基因组选择的信息载体,目前奶牛通用商业化芯片品类繁多,且大多是基于微珠阵列的固相芯片。自2009年,美国illumina公司陆续开发出2款牛基因组芯片,Bovine SNP 50K芯片(含54,000SNPs)和Bovine HD(含777,962SNPs);自2014年,美国纽勤公司陆续开发了GeneSeek80K、GeneSeek 150K、GeneSeek 100K、GeneSeek 9K牛基因组SNP芯片。目前,我国的奶牛育种工作所用芯片全部依赖进口。这些芯片广泛应用于国内外奶牛基因组评估及基因挖掘,但存在以下几点不足:(1)芯片研发基于欧美国家荷斯坦奶牛群体(荷斯坦奶牛在世界大多数国家的奶业生产中都占有主导地位),我国荷斯坦奶牛群体重要性状相关的SNP效应位点未纳入芯片(中国荷斯坦牛占我国奶牛存栏的90%)。因此,针对我国荷斯坦奶牛群体遗传背景的基因组评估和基因挖掘效率较低;(2)芯片检测技术受限于人,奶牛生物样本需送至国外检测基因信息,导致我国奶牛个体遗传资源信息安全无法得到保障;(3)现国际奶牛通用芯片为固相芯片,该技术基于微珠阵列检测量化荧光标记来检测基因型,其探针分子固定在支持物上形成规则排列的点阵,位点更新升级周期长和成本高。
设计和开发一款针对我国荷斯坦奶牛群体的中高密度SNP育种芯片用于全基因组选择很有必要的,不仅可以实现奶牛育种关键技术摆脱进口依赖,提高我国优秀种牛自主培育能力,加快种牛育种效率;同时可保障我国奶牛遗传资源基因信息安全;还可以降低检测成本,方便增加新的重要性状相关SNP位点以维持芯片持续迭代升级。综合考虑以上因素,发明人提出一款基于目标区域基因组序列液相捕获和高深度测序分型技术的中高密度奶牛全基因组126K SNP芯片。
发明内容
本申请提供了一种中高密度奶牛全基因组126K SNP芯片,所述126K SNP芯片包含检测与奶牛产奶、体型和健康性状相关的SNP位点的试剂。
进一步地,所述的126K SNP芯片包含检测说明书表3所示的SNP位点的试剂。
进一步地,所述试剂为探针。
进一步地,所述126K SNP芯片为液相探针杂交芯片。
进一步地,所述126K SNP芯片包含序列如SEQ ID NO.1-12所示的探针。
另一方面,本申请提供了上述126K SNP芯片在奶牛育种中的应用。
进一步地,所述育种为分子标记辅助育种,具体指基因组选择育种。
另一方面,本申请提供了上述126K SNP芯片在奶牛基因分型检测中的应用。
另一方面,本申请提供了上述126K SNP芯片在奶牛中的亲缘关系鉴定中的应用。
另一方面,本申请提供了上述126K SNP芯片在奶牛中的遗传缺陷病诊断中的应用。
进一步地,所述奶牛为荷斯坦奶牛。
所述SNP分子标记主要来自于3类SNP位点:第一类,发明人团队前期研究挖掘与鉴定的奶牛重要经济性状显著相关的SNP位点,包含5,363个SNP位点;第二类,奶牛主要遗传缺陷基因位点和亲子鉴定基因位点,包含223个SNP位点;第三类,基于我国的大规模奶牛群体,根据检出率、基因频率、位置唯一性、基因型填充原理及基因组上的分布,从现有商业化奶牛基因组芯片挑选的SNP位点,包含114,569个SNP位点。以上3类共计包含120,155个SNP位点。
由于篇幅原因,本申请中仅列举了部分探针序列。在已知SNP位点的情况下,本领域技术人员可以根据芯片种类,检测方法等需求常规设计相应的检测探针,并对其准确性进行验证。
本申请的奶牛126K SNP芯片具有三个优点:(1)添加了针对我国荷斯坦奶牛群体遗传背景的重要性状相关功能基因遗传变异位点,发明人团队前期通过多组学研究挖掘和鉴定了大量产奶、体型和健康性状显著相关的功能基因SNP效应位点,使得该款芯片更适用于我国荷斯坦奶牛的基因组选择和遗传分析;(2)SNP位点在我国奶牛群体中多态性高,而且在全基因组范围内分布均匀,保证了基因组选择的准确性;(3)相比国际通用奶牛50K、80K、100K、150K芯片,其检测成本有一定幅度降低,更适合大规模基因组参考群扩建和种牛育种价值评价。为提高优秀种牛选育效率,考虑到分型成本和基因组选择准确性,本专利设计了126K SNP(120,155SNPs)芯片。这对我国摆脱奶牛生物育种芯片进口依赖,快速扩大基因组参考群规模以及培育优秀种公牛、种母牛以加快群体遗传改良具有重要意义。
附图说明
图1为本发明芯片和设计和制备流程图。
图2为本发明SNP位点在全基因组水平分布。
图3为本发明SNP芯片的实物图。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实例仅为了阐述本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术邻域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
芯片设计过程如图1所示。
实施例1第一类SNP位点的获得
研究表明,在SNP芯片中添加与目标性状显著相关的SNP位点,能够提高基因组选择的准确性,因此,在芯片添加我国荷斯坦奶牛群体遗传背景的位点是必要的。发明人团队前期全基因组关联分析、重测序、转录组和代谢组等多组学技术挖掘和鉴定到与我国荷斯坦奶牛重要性状(包含产奶、体型和健康性状)显著相关的5,363个SNP位点。
第一类位点位于表3的第1-5,363个SNP位点。其中,各性状相关SNP位点获得的详细过程如下:
1、产奶性状
产奶性状是奶牛最重要的经济性状,包括产奶量、乳脂量、乳蛋白量、乳脂率、乳蛋白率和乳脂肪酸含量。
(1)候选基因遗传效应分析
目前研究发现的影响奶牛产奶性状的主效基因有DGAT1、GHR、ABCG2和EEF1D。同时,发明人团队前期基于iTRAQ技术对中国荷斯坦牛不同泌乳阶段(干奶期、泌乳初期和泌乳高峰期)肝脏组织进行转录组和蛋白质组分析,一共鉴定到3252个蛋白质(FDR≤0.01),其中差异表达蛋白一共鉴定到905个(P30.05,FCE1.2),在三个比较组中(干奶期vs.乳初期、干奶期vs.乳高峰期、泌乳初期vs.乳高峰期)分别为523个、337个和458个。随后通过功能富集分析,经过与奶牛产奶性状OTL和前人GWAS结果中与产奶性状显著相关的SNPs进行物理位置比对,发现在73个差异表达蛋白中有41个关键功能基因与产奶性状OTL峰值和GWAS结果中与产奶性状显著关联的SNPs位置临近,包括AKT3、PKLR、SEC13、ACAT1、ACOX2、ADIPOQ、ALDH18A1、AMDHD2、APOA2、APOB、APOC4、CLINT1、CYP2C18、CYP3A5、CYP7A1、DH1、EHHADH、ETFA、FBP2、GLUL、HADH、HADHB、HSD17B2、IDH2、LDHA、MAT2A、NPL、PCK1、PM20D1、PP4C、PRKACA、SUCLA2、APOP4、APOP5、GYS2、LDHB、NGFR、NR0B2、PC、PPP2R2B和SLC22A7。
进一步基于北京首农畜牧22个牛场、45个公牛家系的共计947头中国荷斯坦母牛为试验群体进行遗传效应分析。通过冻精DNA混池测序,共鉴定到135个SNP位点,利用靶向测序基因型分型技术(Genotyping By Target Sequencing,GBTS)进行个体基因分型检测。利用SAS软件MIXED过程及动物模型(模型如下)对SNP位点与5个产奶性状(产奶量、乳脂量、乳脂率、乳蛋白量和乳蛋白率)进行单标记和单倍型关联分析。
y=μ+hys+b×M+G+a+e
其中y为产奶性状表型值(个体305天产奶量、乳脂量、乳蛋白量、乳脂率和乳蛋白率)、μ为总体均值、hys为产年季效用、b为协变量M的回归系数、M为产犊月龄效应、G为基因型/单倍型组合效应、a为个体随机加性遗传效应及e为随机残差效应。
根据单标记和单倍型关联分析结果发现,上述135个SNP位点均与一个或多个产奶性状显著关联(P<0.05、P<0.01),等位基因替代效应或加性遗传效应(P<0.05、P<0.01)。
发明人团队前期通过极端高低乳脂率/乳蛋白率的泌乳期奶牛乳腺上皮组织进行转录组研究鉴定到了DDIT3、RPL23A、SESN2和NR4A14个产奶性状候选基因。基于北京首农畜牧的中国荷斯坦母牛群体,选择1093头系谱完整、DHI记录规范的母牛为试验群体,首先利用40头荷斯坦公牛(1093头母牛的父亲)的基因组DNA,采用基因组DNA混池测序方法对上述4个候选基因的全部编码区及上、下游调控区各3000bp进行分段PCR扩增和测序。根据混池DNA测序结果,共发现35个SNP位点。进一步通过飞行时间质谱技术进行个体基因型检测,单标记关联分析结果显示:35个SNP位点均至少与一个产奶性状关联显著(P≤0.0001~0.0493),等位基因替代效应或加性遗传效应(P<0.05、P<0.01)。
(2)全基因组关联分析
研究采用女儿设计,试验群体是来自北京首农畜牧14头公牛家系的2,093头母牛。采用个体的估计育种值(EBV)作为分析的表型值。利用Bovine SNP50K芯片分型,基因型数据经过严格的质量控制后,利用两种统计分析方法,即单标记传递不平衡检验(L1-TDT)和单标记回归分析(MMRA)方法分别对产奶量、乳脂量、乳蛋白量、乳脂率、乳蛋白率五个产奶性状进行关联分析。分析共发现105个SNP位点达到了基因组显著水平(P<1.27E-06),其中有38个SNP位点同时被两种方法检测到,其他4个和63个SNP位点分别单独被L1-TDT方法和MMRA方法检测到。L1-TDT和MMRA方法共定位到20个、9个、21个、65个和28个显著的SNP位点影响产奶量、乳脂量、乳蛋白量、乳脂率和乳蛋白率性状。
以北京首农畜牧18个牛场的21头公牛家系的784头中国荷斯坦母牛为研究群体,以BovineSNP50芯片分型获得基因型数据,利用气相色谱法检测牛奶样品中的乳脂肪酸含量,获得了月桂酸、豆蔻油酸、棕榈酸、亚油酸等22个乳脂肪酸含量性状的表型。首先利用SAS9.1广义线性模型过程进行固定效应分析,对乳脂肪酸表型值进行校正;然后,采用PLINK软件(v1.07)中的数量性状加性效应模型进行全基因组关联分析,在全基因组水平上共鉴定83个SNP位点与22个乳脂肪酸含量性状显著相关(P<1.23E-06)。
(3)基因组重测序
利用Illumina二代测序平台对8头具有极端高/低乳蛋白率、乳脂率育种值(EBV)的荷斯坦公牛(来自4个全同胞/半同胞:高/低组〉进行了全基因组重测序(10×)。通过与牛参考基因组(UMD3.1)比对,共检测到10,961,243个SNP位点,其中4个高、低组间等位基因方向一致的共有SNP位点57,451个(基于后续所述均匀分布,有4,840个SNP位点被纳入芯片)。
2、体型性状
利用Bovine SNP50牛全基因SNP芯片对来自北京首农畜牧的1,314头中国荷斯坦牛进行个体基因型检测;采用LASSO模型(模型具体如下)对29个体型性状(包括大小、体高、前段、胸宽、体深、腰强度、尻宽、尻角度、骨质地、蹄角度、后肢侧视、乳房深度、乳房质地、中央悬韧带、前房附着、前乳头位置、乳头长度、后附着高度、后附着宽度、后乳头位置以及棱角性,以及8个功能评分性状包括总分、容量、乳用特征、尻部、肢蹄、前乳房、后乳房和泌乳系统)进行了全基因组关联分析。
首先,利用单性状混合模型分析(SMMA)估计每个SNP的效应值。然后选取500个P值最低的SNP进行LASSO分析。SMMA模型为y=1μ+xjβj+Zg+e,其中,y为各体型性状表型值,1是单位向量,μ是群体均值,xj是第j个标记的基因型,βj是SNP效应,g是微效多基因效应,Z是g的相关矩阵,e是随机残差。g~N(0,Aσg 2),e~N(0,Iσe 2),其中A是基于系谱的加性遗传相关矩阵,σg 2是残差方差。
其次,利用改进的LASSO对SMMA模型检测到的SNP进行效应值估计,其模型为y=1μ+Xβ+Zg+e,X是500个SNP基因型协变量矩阵,β是SNP效应向量。
全基因组关联分析在基因组水平上检测到59个显著SNP位点与26个体型性状显著关联(P<0.01)。
3、健康性状
(1)免疫球蛋白
以北京首农畜牧的588头中国荷斯坦牛群体为研究对象,产犊后24小时内采集初乳、血清以及牛毛样品。利用ELISA试剂盒检测初乳和血清中免疫球蛋白及白蛋白浓度,并用GeneSeek 150K芯片进行基因型分型。基于GCTA软件,初乳和血清IgG、IgA IgM和白蛋白浓度遗传力估计值为0.08~0.48,除血清IgG1、IgG2浓度外,大部分免疫球蛋白浓度为中高遗传力(0.12~0.48)。利用GCTA软件基于混合线性模型进行全基因组关联分析,结果在全基因组水平上检测到36个SNP位点与初乳和血清IgG、IgG2和IgM浓度显著关联(P<3.08E-6)。
(2)副结核病易感性/抗性
选取北京首农畜牧的945头奶牛为研究群体,采用Case-control策略对副结核病易感性/抗性进行全基因组关联分析。利用Bovine 50K芯片和GeneSeek 150K芯片进行个体基因分型,以血清副结核抗体OD值为表型(阳性185头,阴性760头),利用GRAMMAR-GC和ROADTRIPS软件对两个数据集(50K和150K两种芯片交集数据vs.将低密度填充到高密度后的数据集)分别进行全基因组关联分析,两种方法分别检测到14和18个全基因组水平显著的SNP位点与荷斯坦奶牛副结核病易感性/抗性显著关联(P<5×10-5)。
实施例2第二类SNP位点的获得
1、遗传缺陷
奶牛遗传缺陷主要包括脊柱畸形综合征CVM、白细胞黏附缺陷症BLAD、尿苷酸合酶缺乏症和瓜氨酸血症等,会导致母牛早期流产、犊牛死亡,存活率降低,对奶牛养殖业造成了巨大的经济损失。通过在SNP芯片中添加遗传缺陷基因位点,可实现简便、快速和准确鉴定与筛查奶牛个体是否携带遗传缺陷隐性有害基因,从而通过早期淘汰或科学的选种选配降低群体的有害基因频率,提高我国奶牛群体的质量。因此,在本芯片中添加了19种常见牛遗传缺陷致因突变位点,共25个SNP位点,位点信息来自OMIA数据库收录的主要牛遗传缺陷位点。
表1常见牛遗传缺陷致因突变位点
2、亲子鉴定
在奶牛育种工作中,正确的系谱记录是准确估计个体育种值、加快群体遗传进展的重要基础。系谱错误是奶牛养殖场中的常见现象,通过遗传标记进行亲子鉴定和系谱校正具有重要意义。国际动物遗传学学会(ISAG)研究并推荐了198个SNP位点用于牛亲子鉴定(以便各国实验室之间进行研究和交流),因此将其添加进本芯片。
第二类位点位于表3的第5,364-5,586个SNP位点。
实施例3第三类SNP位点的获得
大规模、高质量的参考群体是基因组选择的重要基础和必要环节,发明人团队自2008年至今,构建了我国唯一的奶牛基因组选择参考群体,目前规模已达2.3万头,参考群个体的基因型检测所使用的SNP芯片均来自国外,包含50K 5,811头、80K 1,535头、100K 5,000头、150K 10,591头。因此,本芯片需要与该参考群体的芯片数据之间具有较高的基因型填充准确性,从而对母牛群体进行准确的基因组评估。
基因组选择的前提假设是标记与QTL之间紧密连锁,因此标记在基因组分布均匀,能在最大限度捕获影响性状的QTL,从而提高基因组片段基因型推断及基因组评估的准确性。基因型填充方法是基于推断单倍型(指同一染色体上临近标记之间连锁遗传的等位基因组合)对缺失基因型进行填充。基本过程为:首先,利用具有高密度标记的个体以及家系信息和群体间的连锁不平衡信息构建单倍型;然后,然将待填充芯片中的标记与单倍型中的标记进行配比填充。
影响芯片基因型填充准确性的因素包括:最小等位基因频率、标记密度、参考群体规模和填充方法等因素。鉴于上述参考群体的基因型芯片数据包括50K、80K、100K和150KSNP三种类型芯片,因此,发明人基于我国的大规模奶牛群体,根据检出率、基因频率、位置唯一性、基因型填充原理及基因组上的分布,从现有50K、80K、100K和150K商业化牛基因组芯片中挑选部分SNP位点。
1、质量控制
基于2.3万头中国荷斯坦牛的基因型数据,根据检出率、最小等位基因频率、哈代温伯格平衡检验,挑选出适合我国荷斯坦奶牛群体中的有效SNP位点。利用PLINK软件进行质量控制:(1)剔除SNP检出率小于0.95的SNP位点;(2)剔除最小等位基因频率小于0.01的SNP位点;(3)剔除不符合哈代温伯格平衡的SNP位点(P-value<1×10-6)。经过质量控制后,对四者的共有位点去重后获得154,363个SNP位点。
2、SNP位点分布
为确保SNP位点均匀覆盖奶牛全基因组,捕获全基因组范围内的重要性状遗传变异,实现准确的基因组评估。在染色体上设置24Kb滑动窗口在前述位点集合中进行筛选。最终确定114,569个第三类SNP位点。
第三类位点位于表3的第5,587-120,155个SNP位点。
表2芯片中所用的SNP位点列表
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
所述SNP位点的变异信息采用染色体编号_物理位置参考基因型>等位基因型的形式表示。实施例中所述的表2中SNP位点的编号为按照横行依次排列,即Chr1_1277227A>C为第1个,Chr1_3249057G>T为第2个,Chr1_8437530T>G为第3个,依次类推。
实施例4芯片的制备
上述三类SNP位点的集合如表1所示,其在染色体上的分布如图2所示。
为确保SNP位点在全基因组上的物理位置唯一,将上述三类SNP进行位点核对和评估。
首先,基于目前主要应用的2个牛参考基因组序列(UMD3.1.1和ARS-UCD1.2),利用blastn软件将111,991个SNP位点的侧翼序列分别进行比对,默认参数为-evalue 1e-5、-dust yes、identical>=98%,对于符合要求的SNP位点保留,最终共计111,991个SNP位点。
然后,基于SNP位点在奶牛参考基因组上的物理位置和侧翼序列,均成功进行了探针设计(部分实例如SEQ ID NO.1-13所示)。实物如图3所示。
表3部分探针序列列表
目标SNP 染色体号 物理位置 突变点 探针序列
Chr1:41768691G>T Chr1 41768691 G>T SEQ ID NO.1
Chr1:109550832G>A Chr1 109550832 G>A SEQ ID NO.2
Chr1:127318739C>A Chr1 127318739 C>A SEQ ID NO.3
Chr1:144659141A>C Chr1 144659141 A>C SEQ ID NO.4
Chr1:144762379T>G Chr1 144762379 T>G SEQ ID NO.5
Chr1:144833882A>G Chr1 144833882 A>G SEQ ID NO.6
Chr10:49904259G>A Chr10 49904259 G>A SEQ ID NO.7
Chr10:53840143T>A Chr10 53840143 T>A SEQ ID NO.8
Chr10:6988001T>C Chr10 6988001 T>C SEQ ID NO.9
Chr11:103963998C>T Chr11 103963998 C>T SEQ ID NO.10
Chr11:14189221A>G Chr11 14189221 A>G SEQ ID NO.11
Chr11:4671286C>T Chr11 4671286 C>T SEQ ID NO.12
Chr11:506778G>A Chr11 506778 G>A SEQ ID NO.13
由于序列表格式的限制,SEQ ID NO.1-13仅表示未变化的原始序列,突变序列本领域技术人员可以从表2中记载的突变位点和突变方式获得。
实施例5本申请芯片的实用效果
为验证本芯片的实用效果,发明人设计了(1)实验一:从北京首农畜牧所属奶牛场选择近5000头健康的荷斯坦奶牛检测126K芯片进行SNP位点检出率、多态性检测;(2)实验二:从北京首农畜牧所属奶牛场选择33头荷斯坦奶牛同时检测126K和50K芯片,23头荷斯坦奶牛同时检测126K和GGP 85K芯片,93头荷斯坦奶牛同时检测126K和GGP 100K芯片,93头荷斯坦奶牛同时检测126K和GGP 150K芯片,进行个体基因型检出率及比较验证分析。
首先,利用PLINK软件对所有奶牛的芯片基因型数据进行质量分析:(1)实验一:5000头奶牛的126K芯片检测结果,SNP检出率为98.12%~99.86%,平均检出率为99.54%,位点多态信息含量平均为0.401;(2)实验二:126K与50K、85K、100K、150K芯片的基因分型一致性为98.46%、98.89%、99.25%和99.39%。结果说明,126K芯片与现有奶牛商业化芯片检测性能一致,且位点多态性表现更好,更符合我国奶牛遗传背景。
然后,针对实验二验证群体,基于实施例3所述的基因组选择参考群体(2.3万头),利用Beagle5.2软件,将126K、50K、85K、100K、150K基因型数据依次填充到50K、85K、100K、150K水平,计算不同类型芯片的填充准确性。结果表明,126K芯片填充准确性为98.53%,与现有奶牛芯片性能一致(96.11%~99.81%),满足基因组评估及基因挖掘工作的需要。

Claims (11)

1.一种低密度奶牛全基因组126K SNP芯片,其特征在于,所述126K SNP芯片包含检测与奶牛产奶、体型、繁殖和健康性状相关的SNP位点的试剂。
2.根据权利要求1所述的126K SNP芯片,其中所述的126K SNP芯片包含检测说明书表3所示的SNP位点的试剂。
3.根据权利要求2所述的126K SNP芯片,其中所述试剂为探针。
4.根据权利要求3所述的126K SNP芯片,其中所述126K SNP芯片为液相探针杂交芯片。
5.根据权利要求4所述的126K SNP芯片,其中所述126K SNP芯片包含序列如SEQ IDNO.1-13所示的探针。
6.根据权利要求1-5任一项所述的126K SNP芯片在奶牛育种中的应用。
7.根据权利要求6所述的应用,其中所述育种为分子标记辅助育种,具体指基因组选择育种。
8.根据权利要求1-5任一项所述的126K SNP芯片在奶牛基因分型检测中的应用。
9.根据权利要求1-5任一项所述的126K SNP芯片在奶牛中的亲缘关系鉴定中的应用。
10.根据权利要求1-5任一项所述的126K SNP芯片在奶牛中的遗传缺陷病诊断中的应用。
11.根据权利要求6-9任一项所述的应用,其中所述奶牛为荷斯坦奶牛。
CN202311218327.1A 2023-09-20 2023-09-20 一种奶牛全基因组中高密度snp芯片及其应用 Pending CN117431324A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311218327.1A CN117431324A (zh) 2023-09-20 2023-09-20 一种奶牛全基因组中高密度snp芯片及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311218327.1A CN117431324A (zh) 2023-09-20 2023-09-20 一种奶牛全基因组中高密度snp芯片及其应用

Publications (1)

Publication Number Publication Date
CN117431324A true CN117431324A (zh) 2024-01-23

Family

ID=89552410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311218327.1A Pending CN117431324A (zh) 2023-09-20 2023-09-20 一种奶牛全基因组中高密度snp芯片及其应用

Country Status (1)

Country Link
CN (1) CN117431324A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117746979A (zh) * 2024-02-21 2024-03-22 中国科学院遗传与发育生物学研究所 一种动物品种的鉴定方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117746979A (zh) * 2024-02-21 2024-03-22 中国科学院遗传与发育生物学研究所 一种动物品种的鉴定方法

Similar Documents

Publication Publication Date Title
CN111225986B (zh) 一种鸡全基因组snp芯片及其应用
CN110791574B (zh) 与山羊产羔数、生长性状关联的分子标记及其应用
CN110191965A (zh) 猪全基因组50k snp芯片及应用
CN115029451B (zh) 一种绵羊液相芯片及其应用
CN110484636B (zh) 一种与猪总乳头数性状相关的分子标记及应用
WO2019153294A1 (zh) 牦牛全基因组snp位点的应用及检测用引物组和试剂盒
CN112609009B (zh) 基于全基因组测序筛选的与广西三黄鸡体重、体尺相关的snp分子标记组合及应用
CN112746110B (zh) 基于全基因组测序筛选的与广西麻鸡体尺相关的snp分子标记组合及应用
CN106498078B (zh) 一种检测绵羊kitlg基因的单核苷酸多态性的方法及其应用
CN108998541B (zh) 一种与苏淮猪腿臀围性状相关的snp标记引物对及其应用
CN117431324A (zh) 一种奶牛全基因组中高密度snp芯片及其应用
CN110734983A (zh) 一种与苏淮猪肌内脂肪性状相关的snp标记及检测方法和应用
CN110438242B (zh) 一种三疣梭子蟹微卫星标记的引物及其应用
CN104862388B (zh) 与猪有效乳头对数性状相关的snp分子标记及应用
CN106755371A (zh) 利用pcr‑rflp检测绵羊pcnp基因单核苷酸多态性的方法及其应用
CN110484629B (zh) 一种与三疣梭子蟹生长性状相关的微卫星标记、其引物及应用
CN106701930B (zh) 利用pcr-sscp检测绵羊fth-1基因插入缺失多态性的方法及其应用
CN116083592A (zh) 一种与绵羊生长性状相关的分子标记及其应用
CN105368941B (zh) 一种用于奶牛生产寿命辅助选择的分子标记检测方法
CN113832240A (zh) 一个与中国南方荷斯坦奶牛305天产奶量显著相关的snp分子标记及应用和选育方法
CN116356041A (zh) 低密度奶牛全基因组30k snp芯片及其应用
CN106755370B (zh) 利用pcr-rflp检测绵羊fth-1基因单核苷酸多态性的方法及其应用
CN117701727B (zh) 基于全基因组测序筛选的与摩拉水牛体尺、初生重相关的snp分子标记组合及应用
CN110760593A (zh) 肉用西门塔尔牛6号染色体上与脾脏重相关的snp位点及应用
CN104988238B (zh) 一种预示和鉴定绵羊超数排卵性状的分子标记方法及其分子标记引物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination