CN108642568B - 一种家犬全基因组低密度品种鉴定专用snp芯片设计方法 - Google Patents

一种家犬全基因组低密度品种鉴定专用snp芯片设计方法 Download PDF

Info

Publication number
CN108642568B
CN108642568B CN201810469731.9A CN201810469731A CN108642568B CN 108642568 B CN108642568 B CN 108642568B CN 201810469731 A CN201810469731 A CN 201810469731A CN 108642568 B CN108642568 B CN 108642568B
Authority
CN
China
Prior art keywords
snp
breed
molecular
expansion factor
domestic dog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810469731.9A
Other languages
English (en)
Other versions
CN108642568A (zh
Inventor
罗晗
刘星彤
白冰
林书弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810469731.9A priority Critical patent/CN108642568B/zh
Publication of CN108642568A publication Critical patent/CN108642568A/zh
Application granted granted Critical
Publication of CN108642568B publication Critical patent/CN108642568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明公开了一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,包括:S1:从犬只基因库中,选取样本数量大于5的品系,从而获得包含有对应犬只品系的SNP分子库;S2:用PLINK软件滑动窗口程序,并结合设定的方差膨胀因子以及阶层式分群法,从所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;S3:再以S2中选出的SNP标记分子位点为SNP芯片设计模型设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片。依据本发明所述设计方法设计的家犬品种鉴定专用的SNP芯片,在满足分类精度的前提下,筛选出品种分类所需要最小数据集,并根据该数据集开发一款专用于家犬品种鉴定低成本且高效的SNP芯片。

Description

一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法
技术领域
本发明涉及全基因组SNP芯片技术领域,具体涉及一种家犬全基因组品种鉴定专用SNP芯片,特别涉及一种家犬品种鉴定专用的全基因组低密度SNP芯片设计方法、依据该设计方法设计出的SNP芯片,及其对应的家犬品种鉴定SNP检测方法。
背景技术
家犬是人类忠实的动物伙伴,经过200多年的培育,目前共有400多个品系,由于他们可爱的外形、温顺忠诚的性格有很大一部分家犬成为了我们的密不可分家庭伴侣,还有一部分经过特殊训练承担着某种其他物种难以替代的工作,例如导盲、搜救、缉毒。据不完全统计,在世界范围内,约有5.25亿只家犬,不少欧美国家平均每人拥有一只家犬。家犬的血统来源或品系是否纯正常常决定着犬只的外型、性格特点、训练价值、市场价格等,也是饲养者非常关心的问题。
SNP芯片检测技术是一种常用的遗传多样性检测技术,其根据已知的SNP位点构造固定的、等位基因特异的探针,通过与荧光染料染色的样品DNA杂交,读取杂交信号的方式检测遗传多样性位点在群体或个体中的基因型。由于其高效的检测方式、低廉的成本、简易的数据读取流程,该技术已经被广泛的用于大规模的家犬的遗传学研究,其中包括品系分类、性状相关基因/突变检测等方面。
目前常用的家犬SNP芯片主要是由Illunima、Thermo Fisher和affymatrix公司提供。Illunima公司开发了CanineSNP20和CanineHD芯片,其中CanineSNP20包括约22000个从多个品种犬中选取的探针,约每1M区域中分布8个探针;该公司最新推出的CanineHD芯片共包括172115个SNP位点,其包含的SNP位点选自Broad Institute家犬基因组项目提供的2500000个SNP,还有~1600个位点来源于一个靶向重测序项目。样本来自于多个品种的犬只,每1M区域中至少分布70个位点。而由affymatrix公司与Broad Institute联合开发的两个版本的芯片,第一版和第二版分别包括约27000和50000个SNP位点。这两款芯片的SNP位点同样选自于Broad Institute家犬基因组项目提供的2500000个SNP,包含不低于10个品种的信息。Thermo Fisher也提供了两个版本的芯片,AxiomTM Canine GenotypingArraySetsA和B,其中A包含约1100000个位点,B包含约670,000个位点,这些位点都来源于>300只家犬的基因组数据。
纵观现有常用家犬品种分析SNP芯片,大都是以提供更大的数据量,从而更精确的定位性状相关位点为目的而构建的。然而,高密度、均匀分布的SNP芯片可以提供更丰富的遗传信息,为下一步的分析研究提供更多的基础数据支持的同时,更高的密度、更多的数量也无可避免的提高了检测和下游分析的成本,这类型的芯片在实际用于家犬品种分类时,往往造成不必要的经费及数据浪费。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,本发明提供一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,该方法通过搜集已经发表的、经过严格质量控制的、多品种的家犬SNP数据,在满足分类精度的前提下,筛选出品种分类所需要最小数据集,并根据该数据集开发一款专门为家犬品种分类制作的、低成本的、高效的SNP芯片。
本发明另一目的在于,提供依据该设计方法设计的SNP芯片及其对应的检测方法。
为了实现上述发明目的,本发明提供了以下技术方案:
一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,包括如下步骤:
S1:从犬只基因库中,选取样本数量大于5的品系,从而获得包含有对应犬只品系的SNP分子库;
S2:利用PLINK软件滑动窗口程序,并结合不同的方差膨胀因子以及阶层式分群法,从步骤S1所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;
S3:再以S2中选出的SNP标记分子位点为SNP芯片设计模型,设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片。
进一步,所述步骤S1中的SNP分子库,具体指从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库。
进一步,在所述步骤S2中,利用PLINK软件滑动窗口程序,对所述SNP分子库中分子位点筛选的过程,具体包括:
S201:设定方差膨胀因子标准值;
S202:以50个SNP为窗口,5个SNP为步长,对滑动窗口内的SNP位点进行回归分析,得到各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于步骤S201中设定的方差膨胀因子标准值的SNP分子位点删除,从而保留方差膨胀因子低于和等于所述标准值的SNP分子位点;
S203:按照所述步骤S202方式,将所述SNP分子库中的所有SNP位点进行回归分析,筛选出所有方差膨胀因子低于所述标准值的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点。
其中,所述方差膨胀因子值代表解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比,在回归分析过程中方差膨胀因子越低,则意味着该解释变量在与其他解释变量共同建模时不产生多重共线性的问题,因而是较佳的解释变量。
所述步骤S202中的各SNP位点对应的方差膨胀值,具体是通过选定窗口中的一个SNP作为被解释变量,其他所有SNP作为解释变量,进行回归分析以及方差膨胀因子估计,接着将方差膨胀因子大於指定数值的SNP去除。完成筛选後,按照指定步长向下一个窗口重复同样步骤,直到所有SNP均经过筛选。
进一步,当选用1作为方差膨胀因子标准值后,依照该方法筛选出的家犬品种高鉴别率的SNP标记分子位点,包括10659个SNP分子位点。经检测该10659个SNP分子位点搭配阶层式分群法,家犬品种鉴定正确率能够达到97.4%。
进一步,当选用1.58作为方差膨胀因子标准值后,依照该方法筛选出的家犬品种高鉴别率的SNP标记分子位点,包括49580个SNP分子位点。经检验,该49580个SNP分子位点搭配阶层式分群法,家犬品种鉴定正确率能够达到99.07%。
进一步,依据本发明所述设计方法制备的一种家犬全基因组低密度品种鉴定专用SNP芯片,该芯片包括10659个SNP分子位点,所述10659个SNP分子位点搭配阶层式分群法,品种鉴定正确率高于96%。
进一步,依据本发明所述设计方法制备的一种家犬全基因组低密度品种鉴定专用SNP芯片,该芯片包括49580个SNP分子位点,所述49580个SNP分子位点搭配阶层式分群法,品种鉴定正确率高于98%。
进一步,基于相同发明构思下,本发明进一步公开一种家犬品种鉴定专用的SNP检查方法,该方法包括如下步骤:
Sa:从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库;
Sb:利用PLINK软件滑动窗口程序,结合设定的方差膨胀因子以及阶层式分群法,从步骤Sa所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;
Sc:依据Sb中选出的SNP标记分子位点,设计SNP探针,并将该探针用于被检测家犬品种鉴定。
与现有技术相比,本发明的有益效果:
1、依据本发明所述家犬全基因组低密度家犬品种鉴定专用SNP芯片设计方法,首次在现有家犬SNP芯片往往以提供更大数据量的SNP分子位点,从而实现对家犬性状进行精确定位的构建思路上,提出的一种完全相反的设计思路:即通过利用PLINK软件滑动窗口程序,结合不同方差膨胀因子和阶层式分群法,从包含有多家犬品种系的SNP分子库中,筛选出各品种特有的遗传多态性SNP位点相组合,从而设计出SNP分子位点数量少并且同时保障家犬品种鉴定准确率高的家犬品种鉴定专用SNP芯片。
2、并且,依据本发明所述设计方法,能够显著减少现有家犬鉴定SNP芯片中SNP分子位点数量,降低家犬鉴定SNP芯片制造成本,同时保障设计出的SNP芯片对家犬品种鉴定准确率高达97%以上。
3、在本发明所述设计方法中,通过对方差膨胀因子标准值,及在PLINK软件滑动窗口回归分析过程中对每个窗口内SNP位点数和分析步长的具体限定,从而确保最终筛选出的SNP分子位点组合,同时满足数量少和检测精确度高要求。
4、相对于现有家犬SNP芯片通常具有17万以上的SNP分子位点而言,依据本发明所述设计方法设计的SNP芯片,只需要约1万或者5万个位点即可达成97%及最高可达99%以上正确率,大幅度减少了鉴别品种所需要的SNP数量,降低了品种鉴定的成本。
附图说明:
图1为本发明所述SNP芯片设计模型中的SNP标记分子位点分布示意图;其中,
图1.A圆环部分表示10659个SNP标记分子位点在染色体上的分布示意图;
图1.B圆环部分表示49580个SNP标记分子位点在染色体上的分布示意图。
图2为SNP芯片设计模型分类正确率测试结果统计图。
图3为以本发明实施例1中筛选出来的10659个SNP位点作为分类模型,对德国牧羊犬(图中左边圆圈)和藏獒(图中右边圆圈)进行分类检测,得到的PCA分析结果图。
图4为以本发明实施例2中筛选出来的49580个SNP位点作为分类模型,对诺里奇梗犬和苏格兰梗犬两种家犬进行分类检测,得到的系统发育树构建示意图。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
实施例1
一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,该方法具体包括如下步骤:
S1:从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库。
S2:利用PLINK软件滑动窗口程序,并结合设定的方差膨胀因子以及阶层式分群法,从步骤S1所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点。其中,利用PLINK软件滑动窗口程序,对所述SNP分子库中分子位点筛选步骤,具体包括:
S201:设定1为方差膨胀因子标准值;
S202:以50个SNP为窗口,5个SNP为步长,对滑动窗口内的SNP位点进行回归分析,得到各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于1的SNP分子位点删除,从而保留方差膨胀因子等于和低于1的SNP分子位点;
S203:按照所述步骤S202方式,将所述SNP分子库中的所有SNP位点进行回归分析,筛选出所有方差膨胀因子低于和等于1的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点。
所述步骤S203具体操作方式为:在PLINK软件滑动窗口程序中,设定1为方差膨胀因子标准值后,以50个SNP为窗口,5个SNP为步长,对该滑动窗口内的SNP位点进行回归分析,得到各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于1的SNP分子位点删除,从而保留方差膨胀因子等于和低于1的SNP分子位点之后,更新窗口内被检测的SNP位点,并按上述相同步骤分析处理,直至将所有方差膨胀因子高于1的SNP分子位点删除,筛选出所有方差膨胀因子低于和等于1的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点。
进一步,依据步骤S203中筛选方法,筛选得到10659个SNP分子位点,并搭配阶层式分群法,品种鉴定正确率能够达到为97.4%的SNP标记分子位点的,即为家犬品种高鉴别率的SNP标记分子位点。
S3:再将步骤S203筛选出的SNP标记分子位点作为为SNP芯片设计模型一,设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片,编号为①。
实施例2
一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,该方法具体包括如下步骤:
S1:从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库。
S2:利用PLINK软件滑动窗口程序,并结合不同的方差膨胀因子以及阶层式分群法,从步骤S1所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点。其中,利用PLINK软件滑动窗口程序,对所述SNP分子库中分子位点筛选步骤,具体包括:
S201:设定1.58为方差膨胀因子标准值;
S202:以50个SNP为窗口,5个SNP为步长,对滑动窗口内的SNP位点进行回归分析,得到各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于1.58的SNP分子位点删除,从而保留方差膨胀因子低于1.58的SNP分子位点;
S203:按照所述步骤S202方式,将所述SNP分子库中的所有SNP位点进行回归分析,筛选出所有方差膨胀因子低于1.58的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点。
所述步骤S203具体操作方式为:在PLINK软件滑动窗口程序中,设定1为方差膨胀因子标准值后,以50个SNP为窗口,5个SNP为步长,对该滑动窗口内的SNP位点进行回归分析,得到各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于1的SNP分子位点删除,从而保留方差膨胀因子等于和低于1的SNP分子位点之后,更新窗口内被检测的SNP位点,并按上述相同步骤分析处理,直至将所有方差膨胀因子高于1的SNP分子位点删除,筛选出所有方差膨胀因子低于和等于1的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点。
进一步,依据步骤S203中筛选方法,筛选得到49580个品种鉴定正确率能够达到99.07%的SNP标记分子位点的,即为家犬品种高鉴别率的SNP标记分子位点。
S3:再将步骤S203筛选出的SNP标记分子位点作为SNP芯片设计模型二,设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片,编号为②。
其中,依据本发明实施例1和实施例2所述设计方法,分别筛选得到的包含10659个SNP标记分子位点组成的SNP芯片设计模型一和包含49580个SNP标记分子位点组成的SNP芯片设计模型二在染色体上的分布示意图如图1所示。其中,图1.A圆环部分代表10659个SNP标记分子位点在染色体上的分布示意图;图1.B圆环部分表示49580个SNP标记分子位点在染色体上的分布示意图。
进一步,依据本发明实施例1和实施例2所述设计方法,分别筛选得到的包含10659个SNP标记分子位点组成的SNP芯片设计模型一和包含49580个SNP标记分子位点组成的SNP芯片设计模型二在染色体上的分布数量,如下表所示:
Figure BDA0001662952490000101
Figure BDA0001662952490000111
实施例3
将实施1和2设计方法设计得到的家犬品种鉴定专用的低密度SNP芯片①和②进行家犬品种鉴定。
测试例1
为验证在本发明所述设计方法中,对方差膨胀因子标准值选取对筛选出的SNP标记分子位点组合成的SNP芯片设计模型的检测正确率的影响,我们在1-2间,以0.05为步长测试了选用不同的方差膨胀因子标准值时,筛选出的SNP标记分子位点数量及其对应的分类正确率检测。具体选用中国建立的犬只基因组SNP资料库(DoGSD)作为检测对象,进行家犬品种分类鉴定,并记录下选取不同的方差膨胀因子标准值下所得SNP标记分子数量,及依据所得SNP标记分子组设计的SNP芯片对应的分类正确率;测试结果统计如图2所示:
从图2可知,方差膨胀因子标准值为1时能够达到97.4%正确分类,并在方差膨胀因子标准值取1-1.6过程中,选取得到的SNP标记分子位点的数量及检测正确率,显著增加。当方差膨胀因子标准值界定为1.58之后,筛选得到的SNP标记分子位点的检测正确率不再随数量增加而增加。
进一步表明依据本发明所述设计方法,并将选取1.58作为方差膨胀因子标准值时,即可选取得到数量最少并且检测正确率高的SNP标记分子位点组合。
测试例2
为验证本发明的有效性,我们用实施例1中构建的包含有10659个SNP标记分子位点组成的SNP芯片设计模型一,对中国建立的犬只基因组SNP资料(DoGSD:http://dogsd.big.ac.cn/)中分别选取的10只德国牧羊犬和11只藏獒的SNP数据作为测试样本进行分类SNP检测,并将此分类结果与实际样本的相比较,得到如图3所示的PCA分析结果图。
如图3所示,依据PCA分析的结果显示,两个品种的犬只清晰的被区分开,并无交叠,进一步验证依据本发明实施例1中设计方法筛选出的10659个SNP标记分子位点组成的SNP芯片设计模型一,能准确的鉴别出DoGSD当中的犬只品系。
测试例3
为验证本发明的有效性,发明人将实施例2中构建的包含有49580个SNP标记分子位点组成的SNP芯片设计模型二为分类模型,对来自于诺里奇梗犬和苏格兰梗的20个内部SNP数据(下载地址:https://www.ncbi.nlm.nih.gov/m/pubmed/28445722/)进行分类鉴定检测,得到如图4所示的系统发育树构建示意图。
依据如图4所示的系统发育树显示,两个品种的家犬按照品种只聚合到了两个支系,其中并无任何样品品种错分。说明依据本发明实施例2中的设计方法得到的SNP芯片设计模型二中包含的49580个SNP标记分子位点,对家犬品种鉴定正确率高,不会出现样品品种错分情况。

Claims (9)

1.一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,包括如下步骤:
S1:从犬只基因库中,选取样本数量大于5的品系,从而获得包含有对应犬只品系的SNP分子库;
S2:利用PLINK软件滑动窗口程序,并结合设定的方差膨胀因子标准值以及阶层式分群法,从步骤S1所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;
利用PLINK软件滑动窗口程序,对所述SNP分子库中分子位点进行筛选的过程,具体包括:
S201:设定方差膨胀因子标准值;
S202:以50个SNP为窗口,5个SNP为步长,对滑动窗口内的SNP位点进行回归分析,得到与各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于步骤S201中设定的方差膨胀因子标准值的SNP分子位点删除,从而保留方差膨胀因子低于和等于所述标准值的SNP分子位点;
S203:按照所述步骤S202方式,将所述SNP分子库中的所有SNP位点进行回归分析,筛选出所有方差膨胀因子低于所述标准值的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点;
所述方差膨胀因子值代表解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比,具体是通过选定窗口中的一个SNP作为被解释变量,其他所有SNP作为解释变量,进行回归分析以及方差膨胀因子估计;
S3:再以S2中选出的SNP标记分子位点为SNP芯片设计模型,设计SNP探针,并制成家犬品种鉴定专用的低密度SNP芯片。
2.根据权利要求1所述的一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,所述步骤S1中的SNP分子库,具体指从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库。
3.根据权利要求1所述的一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,选用1作为方差膨胀因子标准值,对所述SNP分子库中的SNP分子位点进行回归分析筛选。
4.根据权利要求3所述的一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,依照该方法筛选出的家犬品种高鉴别率的SNP标记分子位点,包括10659个SNP分子位点。
5.根据权利要求1所述的一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,选用1 .58作为方差膨胀因子标准值,对所述SNP分子库中的SNP分子位点进行回归分析筛选。
6.根据权利要求5所述的一种家犬全基因组低密度品种鉴定专用SNP芯片设计方法,其特征在于,依照该方法筛选出的家犬品种高鉴别率的SNP标记分子位点,包括49580个SNP分子位点。
7.根据权利要求1所述设计方法制备的一种家犬全基因组低密度品种鉴定专用SNP芯片,其特征在于,该芯片包括10659个SNP分子位点,所述10659个SNP分子位点搭配阶层式分群法,品种鉴定正确率高于96%。
8.根据权利要求1所述设计方法制备的家犬全基因组低密度品种鉴定专用SNP芯片,其特征在于,该芯片包括49580个SNP分子位点,所述49580个SNP分子位点搭配阶层式分群法,品种鉴定正确率高于98%。
9.一种家犬品种鉴定专用的SNP检测方法,其特征在于,包括如下步骤:
Sa:从美国国家人类基因组研究院犬只基因计划中,选取样本数量大于5的品系,从而获得91品系862只狗的SNP分子库;
Sb:利用PLINK软件滑动窗口程序,结合设定的方差膨胀因子以及阶层式分群法,从步骤Sa所得SNP分子库中选取家犬品种高鉴别率的SNP标记分子位点;
利用PLINK软件滑动窗口程序,对所述SNP分子库中分子位点进行筛选的过程,具体包括:
S201:设定方差膨胀因子标准值;
S202:以50个SNP为窗口,5个SNP为步长,对滑动窗口内的SNP位点进行回归分析,得到与各SNP位点对应的方差膨胀因子值;再将方差膨胀因子高于步骤S201中设定的方差膨胀因子标准值的SNP分子位点删除,从而保留方差膨胀因子低于和等于所述标准值的SNP分子位点;
S203:按照所述步骤S202方式,将所述SNP分子库中的所有SNP位点进行回归分析,筛选出所有方差膨胀因子低于所述标准值的SNP分子位点,即得到家犬品种高鉴别率的SNP标记分子位点;
所述方差膨胀因子值代表解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比,具体是通过选定窗口中的一个SNP作为被解释变量,其他所有SNP作为解释变量,进行回归分析以及方差膨胀因子估计;
Sc:依据Sb中选出的SNP标记分子位点,设计SNP探针,并将该探针用于被检测家犬品种鉴定。
CN201810469731.9A 2018-05-16 2018-05-16 一种家犬全基因组低密度品种鉴定专用snp芯片设计方法 Active CN108642568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810469731.9A CN108642568B (zh) 2018-05-16 2018-05-16 一种家犬全基因组低密度品种鉴定专用snp芯片设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810469731.9A CN108642568B (zh) 2018-05-16 2018-05-16 一种家犬全基因组低密度品种鉴定专用snp芯片设计方法

Publications (2)

Publication Number Publication Date
CN108642568A CN108642568A (zh) 2018-10-12
CN108642568B true CN108642568B (zh) 2021-07-27

Family

ID=63756352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810469731.9A Active CN108642568B (zh) 2018-05-16 2018-05-16 一种家犬全基因组低密度品种鉴定专用snp芯片设计方法

Country Status (1)

Country Link
CN (1) CN108642568B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111607650A (zh) * 2019-02-22 2020-09-01 伊万基因诊断中心有限公司 用单核苷酸多态性标记识别动物个体的方法
CN113699255B (zh) * 2020-09-02 2023-10-20 北京中科昆朋生物技术有限公司 鉴别具有攻击行为犬的生物标记物、试剂盒和方法
CN112233722B (zh) * 2020-10-19 2024-01-30 北京诺禾致源科技股份有限公司 品种鉴定的方法、其预测模型的构建方法和装置
CN113684280A (zh) * 2021-07-07 2021-11-23 中国海洋大学三亚海洋研究院 一种仿刺参抗高温育种低密度12k snp芯片及应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103966209A (zh) * 2014-05-02 2014-08-06 华中农业大学 与猪肌内脂肪含量性状相关的snp分子标记及应用
CN107871060A (zh) * 2017-11-11 2018-04-03 深圳深知生物科技有限公司 基于dna标记的犬类品系鉴定方法
CN107967409A (zh) * 2017-11-24 2018-04-27 中国农业大学 一种猪全基因组低密度snp芯片及其制作方法和应用
CN108004344A (zh) * 2017-12-20 2018-05-08 中国农业科学院作物科学研究所 一种玉米全基因组snp芯片及其应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11377687B2 (en) * 2015-10-16 2022-07-05 Inguran, Llc Methods of genomic evaluation in livestock

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103966209A (zh) * 2014-05-02 2014-08-06 华中农业大学 与猪肌内脂肪含量性状相关的snp分子标记及应用
CN107871060A (zh) * 2017-11-11 2018-04-03 深圳深知生物科技有限公司 基于dna标记的犬类品系鉴定方法
CN107967409A (zh) * 2017-11-24 2018-04-27 中国农业大学 一种猪全基因组低密度snp芯片及其制作方法和应用
CN108004344A (zh) * 2017-12-20 2018-05-08 中国农业科学院作物科学研究所 一种玉米全基因组snp芯片及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《An exome sequencing based approach for genome-wide association studies in the dog》;Bart J. G. Broeckx et.al.;《SCIENTIFIC REPORTS》;20171115;第7卷(第15680期);第1-11页 *
《利用犬170 K高密度SNP芯片检测16个中国地方犬种全基因组拷贝数变异》;刘晨龙 等;《畜牧兽医学报》;20171231;第48卷(第6期);第1017-1027页 *

Also Published As

Publication number Publication date
CN108642568A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN108642568B (zh) 一种家犬全基因组低密度品种鉴定专用snp芯片设计方法
Brinton et al. A haplotype-led approach to increase the precision of wheat breeding
CN107423578B (zh) 检测体细胞突变的装置
CN104532359A (zh) 玉米DNA指纹库构建及品种分子鉴定SNP核心位点组合-maizeSNP384
CN108154010B (zh) 一种ctDNA低频突变测序数据分析方法和装置
CN105930690A (zh) 一种全外显子组测序数据分析方法
CN106055928B (zh) 一种宏基因组重叠群的分类方法
Gong et al. lncRNA-screen: an interactive platform for computationally screening long non-coding RNAs in large genomics datasets
CN115198023B (zh) 一种海南黄牛液相育种芯片及其应用
CN111180013B (zh) 检测血液病融合基因的装置
CN108304694B (zh) 基于二代测序数据分析基因突变的方法
CN106021986B (zh) 超低频突变分子一致性序列简并算法
Page et al. Methods for mapping and categorization of DNA sequence reads from allopolyploid organisms
CN106021987B (zh) 超低频突变分子标签聚类分群算法
CN112233722A (zh) 品种鉴定的方法、其预测模型的构建方法和装置
CN107885972A (zh) 一种基于单端测序的融合基因检测方法及其应用
CN112102944A (zh) 一种基于ngs的脑肿瘤分子诊断的分析方法
CN114530200B (zh) 基于计算snp熵值的混合样本鉴定方法
US20230061214A1 (en) Guided analysis of single cell sequencing data using bulk sequencing data
CN114925759A (zh) 一种以太坊钓鱼行为账户的特征分析方法
CN107545152A (zh) 一种基于Illumina数据找变异的方法
CN114021716A (zh) 一种模型训练的方法、系统及电子设备
Valdes et al. Methods to detect transcribed pseudogenes: RNA-Seq discovery allows learning through features
KR101911307B1 (ko) 유전자 단위에서 단상형을 구분하는 태그-snp 선발 및 활용 기술
JP2013505012A5 (zh)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant