CN111118168A - 用于推断中国西北和毗邻中亚国家主体民族的snp标记组合 - Google Patents

用于推断中国西北和毗邻中亚国家主体民族的snp标记组合 Download PDF

Info

Publication number
CN111118168A
CN111118168A CN201811297264.2A CN201811297264A CN111118168A CN 111118168 A CN111118168 A CN 111118168A CN 201811297264 A CN201811297264 A CN 201811297264A CN 111118168 A CN111118168 A CN 111118168A
Authority
CN
China
Prior art keywords
snp
china
snp marker
northwest
marker combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811297264.2A
Other languages
English (en)
Other versions
CN111118168B (zh
Inventor
陈华
谭晓彤
石承民
赵石磊
刘琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Genomics of CAS
Original Assignee
Beijing Institute of Genomics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Genomics of CAS filed Critical Beijing Institute of Genomics of CAS
Priority to CN201811297264.2A priority Critical patent/CN111118168B/zh
Publication of CN111118168A publication Critical patent/CN111118168A/zh
Application granted granted Critical
Publication of CN111118168B publication Critical patent/CN111118168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于生物技术领域,具体公开了用于推断中国西北和毗邻中亚国家不同主体民族的SNP标记组合,所含SNP分子标记的具体信息如表1所示。本发明提供的SNP标记组合可对维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、藏族和汉族人群进行区分推断,不同容量的SNP标记组合的区分准确率可分别到达90%,95%和99%以上。

Description

用于推断中国西北和毗邻中亚国家主体民族的SNP标记组合
技术领域
本发明属于生物技术领域,具体地说,推断中国西北和毗邻中亚国家不同主体民族(维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、藏族和汉族)人群的SNP标记组合。
背景技术
随着我国与中亚各国的政治经济合作的不断深入,经贸往来日益频繁,西北地区已逐步成为我国对外开放的重要内陆窗口。然而,人口的跨区、跨境流动在一定程度上也给社会治安和国家安全带来了重大风险。由于中亚国家人群和我国西北居民在民族、语言和宗教信仰方面均存在一定程度的重叠,在体貌特征方面与国内人群高度相似,因此,对中亚人群民族区分和祖源推断在司法刑侦工作中显得格外重要。对不同民族人群的可靠鉴定将有效提高调查的进度和侦查的效率。
分子遗传分析技术给法医侦查带来了革命性的变化,DNA分析已经成为法医调查的必备手段。特别是,基于单核苷酸多态性(SNP)DNA分子标记的遗传分析在人群祖源推断和个体鉴定中发挥重要作用。SNP标记已成为当前人群祖源推断的主要DNA分子标记,已被成功运用于人群的地理起源和民族归属的分析和推断。虽然,SNP分子标记是人类基因组中最丰富的标记,具备全系列等位基因频率模式,在进行遗传分析时需要扩增片段短,适用于降解DNA样品的分析,但是,从大多数法医学样本中仅能获得微量的、高度降解的DNA,仅能满足分析有限数目的SNP标记位点的需要。因此,从基因组中筛选人群祖源信息量高的分子标记组合,用于人群祖源的有效推断变得至关重要。结合法医鉴定样本的特点,本发明提供一套简单、高效、准确并适合分析微量样品推断中国西北和毗邻中亚民族来源的分子标记。
发明内容
为了解决现有技术中存在的问题,本发明的目的是提供用于推断中国西北和毗邻中亚民族人群的标记组合。
为了实现本发明目的,本发明的技术方案如下:
本发明首先提供一种用于推断中国西北和毗邻中亚民族人群的SNP标记组合(SNP参照系),简称BIG-CAtag-27panel,其包含如下27个SNP分子标记:
rs7515066,rs4657305,rs16854785,rs13016074,rs7571218,rs12105006,rs3749097,rs6737482,rs7652331,rs2691080,rs9875030,rs1035068,rs17395916,rs1230190,rs255522,rs1359243,rs3734369,rs11011842,rs7947951,rs4237941,rs7969141,rs7143097,rs10141592,rs12444317,rs9898731,rs1401927,rs6115458。
BIG-CAtag-27panel对维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、藏族和汉族人群的平均分类准确率可达90.24%。
进一步地,在上述BIG-CAtag-27panel的基础上,为了提高SNP参照系的平均分类准确率,本发明在BIG-CAtag-27panel的基础上,补充15个新的SNP分子标记,形成新的标记组合(SNP参照系),简称BIG-CAtag-42panel。所述15个新的SNP分子标记如下:
rs271313,rs2486746,rs2355232,rs2192362,rs10070761,rs11961994,rs2140553,rs7123778,rs16923429,rs11066209,rs4842838,rs16949855,rs1994230,rs1418029,rs17193516。
BIG-CAtag-42panel对维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、藏族和汉族人群的平均分类准确率可达95.11%。
进一步地,在上述BIG-CAtag-42panel的基础上,为了提高SNP参照系的平均分类准确率,本发明在BIG-CAtag-42panel的基础上,补充46个新的SNP分子标记,形成新的标记组合(SNP参照系),简称BIG-CAtag-88panel。所述46个新的SNP分子标记如下:
rs12031088,rs6588209,rs1857353,rs1886766,rs10165711,rs17025877,rs9677290,rs4621214,rs1371031,rs16850914,rs9876298,rs17288582,rs3896909,rs12487488,rs11736130,rs4693716,rs7696248,rs2921571,rs700499,rs10085217,rs9387978,rs10102276,rs2382087,rs17760657,rs1888162,rs10491578,rs11014839,rs1440284,rs4408302,rs7106567,rs7487682,rs2643626,rs3783257,rs7333310,rs2490637,rs17108533,rs7164994,rs12916408,rs12933105,rs7199334,rs11078212,rs2138852,rs854666,rs8074674,rs11660925,rs11698441。
BIG-CAtag-88panel对维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、藏族和汉族人群的平均分类准确率可达99.01%。
本发明所述的SNP分子标记的具体信息如表1所示:
表1中国西北和毗邻中亚不同民族人群的SNP标记组合的信息
Figure BDA0001851485120000031
Figure BDA0001851485120000041
Figure BDA0001851485120000051
进一步地,本发明提供了前述SNP标记组合在如下任一中的应用:
(1)构建DNA芯片或多重PCR基因型分析或其它应用性试剂盒;
(2)中国西北和中亚地区不同民族身份鉴定;
(3)中国西北和中亚地区不同民族祖源分析。
需要说明的是,本领域技术人员可根据本发明所述SNP标记组合中涉及的SNP分子标记的具体信息,应用常规技术手段设计引物(成套引物)或基因芯片,本发明对此不另做限定,但依据本发明所提供的SNP标记组合,设计得到的用于检测本发明前述任一种SNP标记组合的成套引物或基因芯片均属于本发明的保护范围。
所述成套引物或基因芯片也同样可应用在如下任一方面:
(1)构建DNA芯片或多重PCR基因型分析或其它应用性试剂盒;
(2)中国西北和中亚地区不同民族身份鉴定;
(3)中国西北和中亚地区不同民族祖源分析。
本发明所述的不同民族人群指维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、藏族和汉族。
本发明的有益效果在于:
本发明通过从海量基因组数据中提取信息分度高的SNP标记组合,形成可用于对维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、藏族和汉族人群进行区分的参照系,不同大小的参照系的区分准确率分别可到达90.24%,95.11%和99.01%。
本发明所构建的高效的SNP分子标记组合,用于对中国西北和毗邻中亚国家不同主体民族(维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、藏族和汉族)人群的祖源推断,可满足法医和医学遗传分析的需要。
附图说明
图1为实施例2中的平均分类准确率SNP数量的变化曲线。
图2为实施例2中的全部150793个SNP、BIG-CAtag-27panel、BIG-CAtag-42panel以及BIG-CAtag-88panel所作的PCA图结果比较;图中圆形符号代表汉族个体、三角形符号代表哈萨克族和柯尔克孜族个体、米字符号代表塔吉克族个体、方块十字符号代表藏族个体、方形符号代表维吾尔族个体。
具体实施方式
下面结合实施例对本发明做进一步的解释说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1
本实施例从Xuanyao Liu,et al.在European Journal of Human Genetics(2017)上发表的文章Characterising private and shared signatures of positiveselection in 37Asian populations以及Jinchuan Xing,et al.在PLOS Genetics(2013)上发表的Genomic analysis of natural selection and phenotypic variation inhigh-altitude Mongolians文章数据中筛选出汉族、藏族、哈萨克族、柯尔克孜族、维吾尔族和塔吉克族六个地理人群,结合自行采集的样本,共计551个样本的基因组水平SNP数据。各个地区包含的人群和样本量如表2所示。经过对不同来源数据的整合、归并和位点质量控制以及个体筛选,形成了包括551个非亲缘个体、每个个体包含150793个SNP位点的原始数据集,用于后续祖源指征性SNP标记组合的构建。
表2.样本来源
Figure BDA0001851485120000071
本实施例用于说明从上述样本总共150793个SNP中提取BIG-CAtag-27panel、BIG-CAtag-42panel、BIG-CAtag-88panel。
所述BIG-CAtag的构建流程如下所示,方法具体为:
(1)数据分割:
以已知的SNP遗传标记数据库作为样本,按照遗传信息差异对样本数据进行分割,得到三类(Classes):{汉族-藏族,哈萨克族-柯尔克孜族-维吾尔族,塔吉克族};{汉族,藏族};{哈萨克族-柯尔克孜族,维吾尔族};其中将“-”连接的元素合并视为一个整体对待。
(2)数据过滤:
分别计算三类中的SNP遗传标记的FST值,并据此对SNP遗传标记进行降序排列,保留每个类中FST排序前50000个SNP遗传标记;
(3)遗传标记挑选:使用AIM-SNPTag方法从三类数据中的50000个SNP遗传标记中分别挑选200个SNP标记,组成三个MaC-SNP(最大区分力SNP)集合。然后将三个MaC-SNP集合融合得到对不同民族人群具有均衡的区分能力的最终的SNP标记组合。设置融合终止阈值为:1)SNP标记组合的平均准确率(AAC)达到99.99%;2)SNP标记组合中SNP数量达到100。最终,当SNP数量为100个时满足终止条件2)。
(4)在最终的100个SNP的组合中,提取前27个SNP构建BIG-CAtag-27panel,祖源推断准确率为90.24%;提取前42个SNP构建BIG-CAtag-42panel,祖源推断准确率为95.11%;提取前88个SNP构建BIG-CAtag-88panel,祖源推断准确率为99.01%。
实施例2
实施例1从总共150793个SNP中提取有利于祖源推断的SNP组合。该算法能够权衡SNP本身的祖源推断能力以及不同SNP之间信息重叠,以获得最佳的组合推断效应。依次加入筛选到的SNP,并计算平均分类准确率AAC,得到曲线如图1所示。分类准确率AC定义为正确分类样本数与总测试样本数的比值,
Figure BDA0001851485120000081
平均分类准确率(AAC)定义为在随机选取测试集的情况下,重复计算1000次AC值得到的平均值。
本实施例采用三种方式对实施例1获得的SNP参照系进行性能评估。第一种方式是直接比较真实祖源与预测祖源;第二种方式是计算分类问题中常用的指标,包括敏感性(Sensitivity)、特异性(Specificity)、阳性预测值(PPV,positive predictive value)以及阴性预测值(NPV,negative predictive value);第三种方式是通过PCA图直观分析SNP参照系的性能。
(1)比较真实祖源与预测祖源,每类群体的分类准确率如下:
表3 BIG-CAtag-27panel(AAC=90.24%)
Figure BDA0001851485120000091
表4 BIG-CAtag-42panel(AAC=95.11%)
Figure BDA0001851485120000092
表5 BIG-CAtag-88panel(AAC=99.01%)
Figure BDA0001851485120000093
(2)常用的分类性能指标
真正TP:true positive(A群体个体被认定为A群体)
假负FN:false negative(A群体个体被认定为非A群体)
假正FP:false positive(非A群体个体被认定为A群体)
真负TN:true negative(非A群体个体被认定为非A群体)
敏感性:Sensitivity=TP/(TP+FN)
特异性:Specificity=TN/(FP+TN)
阳性预测值positive predictive value:PPV=TP/(TP+FP)
阴性预测值negative predictive value:NPV=TN/(TN+FN)
表6 BIG-CAtag-27panel(AAC=90.24%)性能
Figure BDA0001851485120000101
表7 BIG-CAtag-42panel(AAC=95.11%)性能
Figure BDA0001851485120000102
表8 BIG-CAtag-88panel(AAC=99.01%)性能
Figure BDA0001851485120000103
(3)主成分分析
通过主成分分析方法验证SNP参照系的效果。主成分分析是一种常用的数据特征提取方法。在使用SNP对个体的祖源进行推断时,个体的每一个SNP相当于该个体的一个祖源属性标签(个体的每一个SNP相当于推断其祖源的一条线索),若干这样的祖源属性标签联合在一起,组成一个panel,便能够对个体进行十分有效的祖源推断。
将全部150793个SNP、BIG-CAtag-27panel、BIG-CAtag-42panel、以及BIG-CAtag-88panel所作的PCA图进行比较,如图2(1)~(4)所示。
图中圆形符号代表汉族个体、三角形符号代表哈萨克族&柯尔克孜族个体、米字符号代表塔吉克族个体、方块十字符号代表藏族个体、方形符号代表维吾尔族个体。图2(1)中,所有相同类型的符号均被聚集在一起,而不同类型的符号之间没有交叉,这表明全部SNP包含了足够多的信息用以区分不同群体的样本;图2(2)BIG-CAtag-27panel、图2(3)BIG-CAtag-42panel、图2(4)BIG-CAtag-88panel与图2(1)相似,不同群体之间在第一和第二主成分空间仅有极小部分的个体有所交叉,但在其他主成分空间交叉个体仍然可以明确区分,说明尽管只有27~88个SNP,但其所包含的信息已足够对个体所属群体进行十分有效的推断。另外,从敏感性、特异性、阳性预测值和阴性预测值这四个指标上讲,BIG-CAtag-88panel的性能优于BIG-CAtag-42panel,BIG-CAtag-42panel的性能优于BIG-CAtag-27panel(表6-8)。实际应用中,可根据具体需求选择合适的SNP标记组合进行使用。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (7)

1.用于推断中国西北和毗邻中亚国家不同主体民族的SNP标记组合,其特征在于,包括如下SNP位点:rs7515066,rs4657305,rs16854785,rs13016074,rs7571218,rs12105006,rs3749097,rs6737482,rs7652331,rs2691080,rs9875030,rs1035068,rs17395916,rs1230190,rs255522,rs1359243,rs3734369,rs11011842,rs7947951,rs4237941,rs7969141,rs7143097,rs10141592,rs12444317,rs9898731,rs1401927,rs6115458。
2.根据权利要求1所述的SNP标记组合,其特征在于,还包括如下SNP位点:rs271313,rs2486746,rs2355232,rs2192362,rs10070761,rs11961994,rs2140553,rs7123778,rs16923429,rs11066209,rs4842838,rs16949855,rs1994230,rs1418029,rs17193516。
3.根据权利要求2所述的SNP标记组合,其特征在于,还包括如下SNP位点:rs12031088,rs6588209,rs1857353,rs1886766,rs10165711,rs17025877,rs9677290,rs4621214,rs1371031,rs16850914,rs9876298,rs17288582,rs3896909,rs12487488,rs11736130,rs4693716,rs7696248,rs2921571,rs700499,rs10085217,rs9387978,rs10102276,rs2382087,rs17760657,rs1888162,rs10491578,rs11014839,rs1440284,rs4408302,rs7106567,rs7487682,rs2643626,rs3783257,rs7333310,rs2490637,rs17108533,rs7164994,rs12916408,rs12933105,rs7199334,rs11078212,rs2138852,rs854666,rs8074674,rs11660925,rs11698441。
4.根据权利要求1~3任一项所述的SNP标记组合,其特征在于,所述中国西北和毗邻中亚国家不同主体民族包括维吾尔族、哈萨克族、柯尔克孜族、塔吉克族、汉族和藏族。
5.权利要求1~4任一项所述的SNP标记组合在如下任一中的应用:
(1)构建DNA芯片或多重PCR基因型分析或其它应用性试剂盒;
(2)中国西北和中亚地区不同民族身份鉴定;
(3)中国西北和中亚地区不同民族祖源分析。
6.用于检测权利要求1~4任一项所述SNP标记组合的成套引物或基因芯片。
7.权利要求6所述的成套引物或基因芯片在如下任一中的应用:
(1)构建DNA芯片或多重PCR基因型分析或其它应用性试剂盒;
(2)中国西北和中亚地区不同民族身份鉴定;
(3)中国西北和中亚地区不同民族祖源分析。
CN201811297264.2A 2018-11-01 2018-11-01 用于推断中国西北和毗邻中亚国家主体民族的snp标记组合 Active CN111118168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811297264.2A CN111118168B (zh) 2018-11-01 2018-11-01 用于推断中国西北和毗邻中亚国家主体民族的snp标记组合

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811297264.2A CN111118168B (zh) 2018-11-01 2018-11-01 用于推断中国西北和毗邻中亚国家主体民族的snp标记组合

Publications (2)

Publication Number Publication Date
CN111118168A true CN111118168A (zh) 2020-05-08
CN111118168B CN111118168B (zh) 2022-04-29

Family

ID=70494991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811297264.2A Active CN111118168B (zh) 2018-11-01 2018-11-01 用于推断中国西北和毗邻中亚国家主体民族的snp标记组合

Country Status (1)

Country Link
CN (1) CN111118168B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110656184A (zh) * 2018-06-28 2020-01-07 中国科学院北京基因组研究所 用于区分中国汉族、日本、朝鲜/韩国人群的snp标记组合

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008059165A2 (fr) * 2006-11-15 2008-05-22 Institut Genetique Nantes Atlantique (Igna) Methodes et outils pour determiner l'origine d'un sujet
CN103146820A (zh) * 2013-02-22 2013-06-12 公安部物证鉴定中心 一种推断未知来源个体汉、藏、维群体来源的方法和系统
CN107400713A (zh) * 2017-08-18 2017-11-28 公安部物证鉴定中心 一种在27个群体中识别中国青藏高原藏族群体个体的方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008059165A2 (fr) * 2006-11-15 2008-05-22 Institut Genetique Nantes Atlantique (Igna) Methodes et outils pour determiner l'origine d'un sujet
CN103146820A (zh) * 2013-02-22 2013-06-12 公安部物证鉴定中心 一种推断未知来源个体汉、藏、维群体来源的方法和系统
CN107400713A (zh) * 2017-08-18 2017-11-28 公安部物证鉴定中心 一种在27个群体中识别中国青藏高原藏族群体个体的方法和系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JINCHUAN XING 等: "Genomic Analysis of Natural Selection and Phenotypic Variation in High-Altitude Mongolians", 《PLOS GENET》 *
SHIWEI DUAN 等: "FstSNP-HapMap3: a database of SNPs with high population differentiation for HapMap3", 《BIOINFORMATION 》 *
XUANYAO LIU 等: "Characterising private and shared signatures of positive selection in 37 Asian populations", 《EUROPEAN JOURNAL OF HUMAN GENETICS》 *
YI-LIANG WEI 等: "A single-tube 27-plex SNP assay for estimating individual ancestry and admixture from three continents", 《INT J LEGAL MED》 *
冯杏玲 等: "27重SNP系统推断种族来源的效能", 《J SOUTH MED UNIV》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110656184A (zh) * 2018-06-28 2020-01-07 中国科学院北京基因组研究所 用于区分中国汉族、日本、朝鲜/韩国人群的snp标记组合
CN110656184B (zh) * 2018-06-28 2022-04-29 中国科学院北京基因组研究所 用于区分中国汉族、日本、朝鲜/韩国人群的snp标记组合

Also Published As

Publication number Publication date
CN111118168B (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
Bamshad et al. Deconstructing the relationship between genetics and race
Touw et al. Data mining in the Life Sciences with Random Forest: a walk in the park or lost in the jungle?
Alonso-Rodríguez et al. Evaluation of the new advanced 15-loci MIRU-VNTR genotyping tool in Mycobacterium tuberculosis molecular epidemiology studies
CN105154542B (zh) 一组用于肺癌分子分型的基因及其应用
CA2575921A1 (en) Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification
CN106460045B (zh) 人类基因组常见拷贝数变异用于癌症易感风险评估
Snedecor et al. Fast and accurate kinship estimation using sparse SNPs in relatively large database searches
CN104946740A (zh) 一种海洋褐潮生物群落结构的检测方法
Wang et al. Is the Atkinson discriminant function a reliable method for distinguishing between Betula pendula and B. pubescens (Betulaceae)?
CN111118168B (zh) 用于推断中国西北和毗邻中亚国家主体民族的snp标记组合
CN110885888B (zh) 用于推断亚洲不同地理区域人群的snp标记组合
CN107577923A (zh) 一种高度相似微生物的鉴定和分类方法
CN108875307B (zh) 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法
CN109321660A (zh) 遗传标记组合、个体基因身份证及其应用
CN110656184B (zh) 用于区分中国汉族、日本、朝鲜/韩国人群的snp标记组合
EP2665010A1 (en) Nucleic acid information processing device and processing method thereof
US20220259657A1 (en) Method for discovering marker for predicting risk of depression or suicide using multi-omics analysis, marker for predicting risk of depression or suicide, and method for predicting risk of depression or suicide using multi-omics analysis
EP2665009A1 (en) Nucleic acid information processing device and processing method thereof
KR102440452B1 (ko) 핵산서열 분석 기반 유전자 변이 해석 방법
Qu et al. Deep learning approach to biogeographical ancestry inference
CN107679365A (zh) 基于y染色体分子标记高效推断姓氏的方法
CN110310700B (zh) 基于深度学习模型的dna甲基化芯片标志位点筛选方法
Hediyeh-zadeh et al. Identification of cell types, states and programs by learning gene set representations
JP2003028855A (ja) クラスタリング結果評価方法及びクラスタリング結果表示方法
CN115261500B (zh) 爆发力相关的肠道微生物标记物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant