CN101467032A - 个体识别方法及设备 - Google Patents

个体识别方法及设备 Download PDF

Info

Publication number
CN101467032A
CN101467032A CNA2007800211208A CN200780021120A CN101467032A CN 101467032 A CN101467032 A CN 101467032A CN A2007800211208 A CNA2007800211208 A CN A2007800211208A CN 200780021120 A CN200780021120 A CN 200780021120A CN 101467032 A CN101467032 A CN 101467032A
Authority
CN
China
Prior art keywords
sample
result
data
recognin
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800211208A
Other languages
English (en)
Other versions
CN101467032B (zh
Inventor
麻生川稔
杉泽正俊
奥井伸司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN101467032A publication Critical patent/CN101467032A/zh
Application granted granted Critical
Publication of CN101467032B publication Critical patent/CN101467032B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种个体识别方法,用于通过使用电泳法分析DNA样品来识别个体,该方法包括:分析被给予个体的识别子的附有个体识别子的DNA样品的第一分析步骤;将通过分析附有识别子的DNA样品的结果与对应的识别子一起存储在数据库中的步骤;分析作为进行个体识别的DNA样品的新样品并使用该结果作为新样品分析结果的第二分析步骤,其中分析新样品时的精度低于分析附有识别子的DNA样品时的精度;以及基于新样品的分析结果检索数据库的步骤。

Description

个体识别方法及设备
技术领域
本发明涉及对DNA(脱氧核糖核酸)使用电泳法的个体识别方法,并且更具体地说,本发明涉及使用仅具有低读取性能的电泳分析仪来精确识别个体的方法和设备。
背景技术
当为了犯罪调查的目的而使用DNA来识别个体,即所谓的DNA鉴定时,对个体之间彼此不同的基因组内的DNA区域进行分析。作为一种分析DNA的方法,电泳法被广泛采用。电泳法的优点在于当对其施加电场时,由于DNA本质上的差异而使其流率不同。
作为使用人类DNA进行的个体识别,FBI(联邦调查局)、日本的警察机关等已经采用通过分析被称为“微卫星”的区域进行的方法,在该区域中约四个或五个碱基的序列重复出现。作为测量微卫星区域的重复的次数的方法,有通过电泳法测量DNA的碱基长度的方法。当为了进行个体识别而进行DNA的电泳测量时,经常将DNA序列测定仪作为硬件使用,所述DNA序列测定仪还多用在DNA测定项目(或基因组测定项目)中。
DNA序列测定仪使用约40cm长的填充有凝胶作为电泳介质的毛细管。从毛细管的一端引入含有DNA片段的溶液样品,其中通过PCR(聚合酶链式反应)来只扩增DNA的微卫星区域和与其相邻的区域来获得该DNA片段,并且该DNA片段通过由电场导致的力而产生的电泳朝毛细管的另一端移动。该通过PCR扩增的DNA片段称为“扩增子”。在该情况下,由于取决于扩增子的尺寸,即DNA中碱基的数目而使得移动速度不同,因此扩增子到达毛细管另一端所用的时间彼此不同。这里,通过测量扩增子到达毛细管另一端所用的时间,能够估算与扩增子相关的DNA的尺寸,从而能够测量微卫星区域中的重复次数。
该方法不仅可用于人类,而且还可用于个体之间具有不同DNA区域的生命体。在联合DNA索引系统(CODIS)等中,使用了前述分析微卫星的方法,所述CODIS系统是作为使用DNA识别人类个体的系统而由FBI提出的DNA鉴定系统,但这里使用的基因座中在微卫星的重复中的碱基的数目以四个碱基或五个碱基为单位。
除了对微卫星进行分析以外,还有通过限制酶使DNA片段化并分析长度不同的片段来识别个体的方法。限制性内切酶是指认出并切断DNA中特定序列的酶。在该方法中,电泳法也可用于分析。
由此,通过PCR扩增产生的扩增子包括被靶向的微卫星的重复序列部分,以及能够被PCR的引物杂化的部分。因此,假定微卫星中每个重复内的碱基的数目为4,当某扩增子中微卫星内的重复数目为4时,微卫星部分具有16(=4×4)个碱基,并且假定能够被PCR的引物杂化的碱基的数目为,例如,10个碱基,则扩增子的碱基长度为26(=10+16)个碱基。同理,假定微卫星的重复的数目为5,则有30个碱基。以下,微卫星的重复次数用STR(短串联重复序列)数表示。例如,当测量的扩增子的尺寸为30个碱基时,则可测定STR数为5。由于STR数对应于扩增子的碱基的长度,因此能够认为其为与扩增子有关的碱基长度信息。
在上述示例中,随着STR数增加1,扩增子的长度以四个碱基(或五个碱基)为单位增加,例如30个碱基、34个碱基等。然而,在人类DNA鉴定中使用的某些基因区域中,有时候重复不以4个碱基(或5个碱基)为增量。例如,在某些情形中,存在除了正常的STR外还有具有两个额外的碱基的类型。除了5次重复的STR外还具有两个额外的碱基的类型标记为“5.2”。假定当STR数为5时,扩增子具有30个碱基,则“5.2”表示32个碱基。除了xx.2以外,还存在xx.1、xx.3等。如本领域中已知的,并不是在所有的STR数中都存在作为相对于以该方式重复的小数的碱基,而是在有限的类型的即特定的STR数中出现。
例如,被称为FGA的基因座具有如下多样性。表1列出了示出基因座多样性出现概率的示例,其示出了对于约200名在美国的非洲人进行研究的关于FGA多样性的数据。这里,存在18种类型的FGA,即,FGA存在18种不同的STR数,其中有四种类型为xx.2型。在表1中所示的数据中,如下所述,来自父亲和母亲的两种类型的STR数总计大于200,而分析失败总计小于400。同样,由于当STR数的出现频率等于或小于5时,出现概率统一设定为0.014,因此出现概率的总和超过1.0。表1所示的数据是基于Bruce Budowle,“Genotype Profiles for Six PopulationGroups at the 13 CODIS Short Tandem Repeat Core Loci and Other PCRBBased Loci”,Forensic Science,第1卷,第2期(1999年7月)(非专利文献1)中作为“dnaloci.txt”公开的原始数据。
表1:基因座多样性的出现频率的实例
 
STR数 频率 概率
17.2 1 0.014
18 3 0.014
18.2 3 0.014
19 19 0.053
19.2 1 0.014
20 26 0.072
21 45 0.125
22 81 0.225
22.2 2 0.014
23 45 0.125
24 67 0.186
25 36 0.100
26 13 0.036
27 8 0.022
28 6 0.017
29 2 0.014
30 1 0.014
30.2 1 0.014
总计 360 1.073
由于有两组人类基因组,因此对于每个基因座存在来自父亲的STR数和来自母亲的STR数,并且这构成用于指定个体的信息。例如假定在某基因座中有十种类型的STR数,总共存在100(=10×10)种类型的组合。在其中的十种类型中,在来自父亲的基因座中的STR数与在来自母亲的基因座中的STR数相匹配。因此,即使对这样的人类进行DNA分析以找到STR数时,也仅能找到一个STR数。这样的情形被称为“同型接合”。
在除了同型接合以外的其余的90种类型中,来自父亲的STR数不同于来自母亲的STR数。当对这样的人类进行DNA分析时,如果精度足够,将会找到两个STR数。这种情形称为“异型接合”。对此,当分析DNA时,不能区分哪个STR数是来自父亲和哪个STR数是来自母亲,因此实际上,异型接合具有45种类型,即90种类型的一半。
具体地,当在每个基因组的每组中存在10种类型的基因座的STR数时,DNA分析中能够存在的结果具有总共55种类型,即10种类型的同型接合和45种类型的异型接合的组合,并且这构成用于指定个体的信息。在使用微卫星的DNA分析和比对中,分析这55种类型以挑选有关的类型,并从数据库中检索与该分析结果完全匹配的条目。
在基于DNA的个体识别领域中,分析多个基因座以提高认出精度并检索数据库。由于STR数对于人类中的每个基因座是独立确定的,因此通过分析多个基因座能够提高认出精度。在FBI等中进行的DNA分析中,使用13个基因座。这种DNA分析的细节详细描述于,例如,“Forensic DNA Typing,Second Edition(第二版):Biology,Technology,and Genetics of STR Markers,”John M.Bulter,(2005),pp.85-117,345-370和373-386(非专利文献2)。
在这点上,JP-2002-253203-A(专利文献1)公开了将用于指定个体的DNA的碱基序列信息数字化并固定在条形码或IC(集成电路)卡等上。JP-2003-245098-A(专利文献2)公开了通过电泳法检测PCR产物以找到碱基序列的尺寸的信息。JP-2004-073188-A(专利文献3)公开了将标志物引入待识别对象的方法,其中该方法使用DNA片段作为标志物。JP-2005-013226-A(专利文献4)公开了由DNA识别大豆的方法,其中使用电泳法等识别PCR的结果,并在检索已知的大豆基因序列时访问数据库以检索卫星DNA。JP-2005-160302-A(专利文献5)公开了使用微卫星多形标志物的基因匹配方法。JP-2005-237334-A(专利文献6)公开了快速且灵敏地测量DNA重复序列的方法,该方法通过以下实施:杂化端粒重复序列和与其互补的标记探针,并检测其DNA的一个分子的移动速度。JP-2005-307216-A(专利文献7)公开了能够用于本人认证的合成DNA油墨。JP-11-118760-A(专利文献8)公开了分析DNA片段的电泳模式的方法,该方法适于生成数据库。
WO97/15690(专利文献9)公开了关于DNA序列的定量、识别或确定的发明。WO98/35060(专利文献10)公开了用于对多形核酸片段进行分析或分类的聚合酶。WO01/14590(专利文献11)公开了使用含有固态支持介质的二氧化硅,诸如具有可确定的与已知量的DNA靶物质进行不可逆耦合的能力的二氧化硅磁性颗粒,和大于所述颗粒的耦合能力的DNA靶物质从介质中的另一物质中分离限定量的DNA靶物质的方法。WO02/08469(专利文献12)公开了通过计算机执行的用于进行等位基因查出(allele call)的方法。WO02/66650(专利文献13)公开了对链球菌抗原片段的分析。WO03/06692(专利文献14)公开了与电泳分析的内部校正标准有关的发明。WO02/86794(专利文献15)公开了基于质谱的分析DNA的方法。
以下,列举本说明书中所引用的文献。
专利文献1:JP-2002-253203-A
专利文献2:JP-2003-245098-A
专利文献3:JP-2004-073188-A
专利文献4:JP-2005-013226-A
专利文献5:JP-2005-160302-A
专利文献6:JP-2005-237334-A
专利文献7:JP-2005-307216-A
专利文献8:JP-11-118760-A
专利文献9:WO97/15690(JP-2000-500647-A)
专利文献10:WO98/35060(JP-2001-511018-A)
专利文献11:WO01/14590(JP-2003-507049-A)
专利文献12:WO02/08469(JP-2004-516455-A)
专利文献13:WO02/66650(JP-2004-531235-A)
专利文献14:WO03/06692(JP-2004-535198-A)
专利文献15:WO02/86794(JP-2005-509844-A)
非专利文献1:Bruce Budowle,“Genotype Profiles for SixPopulation Groups at the 13 CODIS Short Tandem Repeat Core Loci andOther PCRB Based Loci”,Forensic Science,第1卷,第2期(1999年7月)(也可从互联网上以下URL获得:
<URL.http://www.fbi.gov/hq/lab/fsc/backissu/july1999/budowle.htm>)。
非专利文献2:“Forensic DNA Typing,Second Edition(第二版):Biology,Technology,and Genetics of STR Markers,”John M.Bulter,(2005).pp.85-117、345-370和373-386。
发明内容
本发明所要解决的问题:
用于个体识别的上述传统的DNA分析需要使用大的电泳设备,出现下述问题,即电泳需要长的时间而使得分析时间更长。这是因为在DNA分析和与DNA数据库的匹配中以1bp(碱基对)的精度测量扩增子的长度。以这种方式用如此高的1bp精度进行分析是由于以下原因,例如,FBI提出的作为使用人类DNA等的个体识别系统的CODIS中,其所使用的基因座的扩增子的DNA尺寸的最小变化宽度为约2bp,从而除非以约1bp的精度认出碱基长度,否则不能实现与数据库的匹配。
为了确保扩增子长度的测量精度,不可能使用比目前在电泳设备中使用的毛细管更短的毛细管,或减少更多的电泳的路径长度。由于这个原因,不可能简化电泳设备等的构造,或者在短时间分析电泳。
本发明的目的是提供一种个体识别方法,即使使用读取精度低的电泳设备,所述方法也能确保要求的精度并在短时间内做出分析。
本发明的另一目的是提供一种个体识别设备,即使使用读取精度低的电泳设备,所述方法也能确保要求的精度并在短时间内做出分析。
解决问题的方法:
考虑到个体识别的DNA分析的操作,已经先建立了数据库,然后,分析新获得样品的DNA,并且就该分析结果是否与存储在数据库中的一个一致进行匹配。这里,对新获得样品的DNA的分析要求在短时间内进行处理,或用简化设备进行处理,而对先存储在数据库中的数据的DNA分析几乎不要求用简化设备进行处理或在短时间内进行处理。因此,本发明使得能够使用以前在个体识别的DNA分析中由于精度太低而无法使用的电泳设备对新获得样品进行DNA分析。在下文中,该新获得样品称为“新样品”。
作为参考,在数据库中登记的试样(样品)的身份是清楚的,即,从何人,或在何时何地取样是清楚的,并且其附有指定身份的识别子。因此,在以下描述中,在数据库中登记的试样(样品)称为“附有识别子的样品”。当附有识别子的样品存储在数据库(即,附有识别子的样品分析数据存储器)中时,DNA分析可以采用相对高精度的电泳设备,诸如传统使用的设备,或相对低精度的电泳设备,诸如不能传统使用的设备。如后所述,本发明即使在分析附有识别子的样品和分析新样品中均使用低精度电泳设备也能精确实现在数据库中的匹配。
通过使用电泳法分析DNA样品来识别个体的个体识别方法而实现本发明的目的,该方法包括:分析被给予个体的识别子的附有识别子的DNA样品的第一分析步骤;将通过分析附有识别子的DNA样品获得的结果与相应的识别子一起存储在附有识别子的样品分析数据存储器中的步骤;分析新样品并使用该结果作为新样品分析结果的第二分析步骤,其中,所述新样品为以低于分析附有识别子的DNA样品时的精度的精度进行个体识别的DNA样品;以及基于所述新样品分析结果检索所述附有识别子的样品分析数据存储器的步骤。
在该个体识别方法中,例如,当分析附有识别子的DNA样品和新样品时,通过电泳法找到与样品的碱基长度有关的信息,并且具体地,捕捉与该样品中微卫星重复次数有关的信息。
在该个体识别方法中,典型地,第一分析步骤中的分析精度为能够识别两个DNA的精度,其中两个DNA的碱基长度相差新样品中碱基长度变化的可能的最小量,并且所述第二分析步骤中的分析精度为下述精度:即以该精度不能识别其碱基长度相差变化的最小量的两个DNA。
而且,该第二分析步骤包括:例如,从每个都包括一种类型的扩增子的样品的组中以任意组合选择多个样品,并将选择的样品混合以产生多类型扩增子样品的步骤;通过电泳法分析多类型扩增子样品的第三分析步骤;将所述第三分析步骤中获得的结果与所述多类型扩增子样品的碱基长度信息以配对方式存储在多类型扩增子数据存储器中的步骤;通过电泳法分析新样品以获得新样品电泳结果数据的第四分析步骤;以及基于所述新样品电泳结果数据检索所述多类型扩增子数据存储器并使用该结果作为新样品分析结果的检索步骤。
或者,通过使用电泳法分析DNA样品来识别个体的个体识别方法而实现本发明的目的,该方法包括:分析被给予个体的识别子的附有识别子的DNA样品以获得所述附有识别子的DNA样品的碱基长度的信息的第一分析步骤;将通过分析附有识别子的DNA样品所获得的结果与相应的识别子一起存储在附有识别子的样品分析数据存储器中的步骤;分析作为被进行个体识别的DNA样品的新样品,并使用包括与所述新样品的碱基长度有关的信息的结果作为新样品分析结果的第二分析步骤;以及基于所述新样品分析结果检索所述附有识别子的样品分析数据存储器的步骤,其中所述第一分析步骤和所述第二分析步骤中的精度为下述精度:如果两个DNA的碱基长度相差在被进行个体识别的DNA样品中碱基长度变化可能的最小量时以该精度不能识别这两个DNA。
通过使用电泳法分析DNA样品来识别个体的个体识别设备而实现本发明的第二目的,该设备包括:第一分析装置,用于分析被给予个体的识别子的附有识别子的DNA样品;附有识别子的样品分析数据存储器,用于将通过所述第一分析装置分析附有识别子的DNA样品获得的结果和相应的识别子一起存储;第二分析装置,用于分析新样品并使用该结果作为新样品分析结果,该第二分析装置的分析精度低于第一分析装置的分析精度,所述新样品为被进行个体识别的DNA样品;以及识别装置,用于基于所述新样品分析结果检索所述附有识别子的样品分析数据存储器以获得个体识别结果。
或者,通过使用电泳法分析DNA样品来识别个体的个体识别设备而实现本发明的第二目的,该设备包括:第一分析装置,用于分析被给予个体的识别子的附有识别子的DNA样品以获得附有识别子的DNA样品的碱基长度的信息;附有识别子的样品分析数据存储器,用于将通过分析所述附有识别子的DNA样品所获得的结果和相应的识别子一起存储;第二分析装置,用于分析作为被进行个体识别的DNA样品的新样品,并使用包括与该新样品的碱基长度有关的信息的结果作为新样品分析结果;以及识别装置,用于基于所述新样品分析结果检索所述附有识别子的样品分析数据存储器,其中所述第一分析装置和所述第二分析装置中的分析精度为下述精度:即如果两个DNA的碱基长度相差被进行个体识别的DNA样品中碱基长度的变化可能的最小量时以该精度不能识别这两个DNA。
当上述本发明的个体识别方法和设备分析DNA样品以进行个体识别时,它们能够通过组合其它生物识别信息,诸如指纹信息、掌纹信息、虹膜信息、脸部信息等进一步提高个体识别的精度。
根据本发明,由于在通过电泳法分析被进行个体识别的样品、即新样品时,能够使用比目前使用的毛细管短的毛细管及较短的电泳的路径长度,因此缩短分析需要的时间,结果能够在较短时间内进行基于DNA的个体识别。
而且,由于使用这种短的毛细管和短的电泳的路径长度,可提供以下优点。
(1)与传统的个体识别设备相比,该设备能够简化构造,具有减少的尺寸,结果能够在需要的位置无论是在室内还是室外进行基于DNA的个体识别。
(2)通过覆盖整个设备能够容易地防止从外部引入杂物,并且由于该设备构造简单,因此容易控制影响电泳的外部因素,诸如温度、湿度等,从而使得能够防止由于从外部引入杂物以及分析仪器的环境不稳定而导致的错误分析。
(3)影响设备的外部因素,诸如温度、湿度等,容易通过覆盖整个设备而得以控制,从而使得能够改进维护性及耐故障性。
如上所述,根据本发明,能够在短时间内进行基于DNA的个体识别,能够在需要的位置无论是在室内或是室外进行基于DNA的个体识别,并且能够防止错误分析。因此,本发明的设备能够容易地与使用其它生物识别信息进行个体识别的另一设备组合,并且通过与使用其它生物识别信息的个体识别组合可提高认出精度。
附图说明
图1是示出根据本发明第一实施例的个体识别设备的构造的图;
图2是示出图1中所示的个体识别设备中低精度电泳分析单元的构造的图;
图3是示出分析包括两种类型的扩增子的DNA样品的混合物的模拟结果的曲线图;
图4是示出根据本发明第二实施例的个体识别设备中低精度电泳分析单元的构造的图;
图5是示出根据本发明第三实施例的个体识别设备中低精度电泳分析单元的构造的图;
图6是示出根据本发明第四实施例的个体识别设备中低精度电泳分析单元的构造的图;
图7是示出根据本发明第五实施例的个体识别设备的构造的图;
图8是示出根据本发明第六实施例的个体识别设备的构造的图;
图9是示出根据本发明第七实施例的个体识别设备的构造的图;和
图10是示出根据本发明第八实施例的个体识别设备的构造的图。
附图标记的说明
101 单类型扩增子样品保存单元
102 选择的样品
103 多类型扩增子样品
104 电泳分析单元
105 多类型扩增子电泳结果数据
106 多类型扩增子数据存储器
107 新样品
108 新样品电泳分析单元
109 新样品电泳结果数据
110 新样品结果数据分析单元
111 新样品分析结果
201 插值数据生成单元
202 插值数据存储器
301 具有参数估算功能的新样品结果数据分析单元
401 单类型扩增子电泳结果数据
402 单类型扩增子数据存储器
403 插值多类型扩增子数据生成单元
404 插值多类型扩增子数据存储器
501 附有识别子的样品
502 高精度电泳分析仪
503 样品分析结果
504 附有识别子的样品分析数据存储器
505 低精度电泳分析单元
506 个体识别单元
507 个体识别结果
601 低精度附有识别子的样品分析结果
602 低精度附有识别子的样品分析数据存储器
603 低精度个体识别单元
604 低精度个体识别结果
701 高精度个体识别单元
702 高精度个体识别结果
901 新样品获得对象
902 DNA样品
903 基于DNA分析的个体识别单元
904 附有识别子的DNA分析数据存储器
905 基于DNA分析的个体识别结果
906 指纹样品
907 基于指纹分析的个体识别单元
908 附有识别子的指纹分析数据存储器
909 基于指纹分析的个体识别结果
910 使用多个信息项的个体识别单元
911 具有多个信息项的个体识别结果
1001 (5,5)混合的样品
1002 (5,5.2)混合的样品
1003 (5,6)混合的样品
1004 (5,6.2)混合的样品
1005 (5,7)混合的样品
1006 (5,7.2)混合的样品
1007 (5,8)混合的样品
具体实施方式
《第一实施例》
图1示出根据本发明第一实施例的个体识别设备的构造。该个体识别设备包括:高精度电泳分析仪502,用于通过电泳法分析附有识别子的样品501;附有识别子的样品分析数据存储器504,用于存储由高精度电泳分析仪502提供的样品分析结果503;低精度电泳分析单元505,用于通过电泳法分析新样品107;以及个体识别单元506,用于基于由低精度电泳分析单元505提供的新样品分析结果111检索附有识别子的样品分析数据存储器504中的数据以识别新样品107的个体,并提供个体识别结果507。新样品107是要进行个体识别的DNA的样品。第一实施例的个体识别设备测量新样品107中的DNA的STR数并基于测量结果检索数据库,即附有识别子的样品分析数据存储器504来识别个体。
附有识别子的样品501是一组附有个体的识别子的样品,并且高精度电泳分析仪502是用于以传统使用的足够的读取精度分析每个这样的附有识别子的样品501的设备。样品分析结果503是使用高精度电泳分析仪502分析附有识别子的样品501的结果,并且其包括指示附有识别子的样品501中包括的DNA中的多个STR数的集合的数据。附有识别子的样品分析数据存储器504以配对方式为附有识别子的样品501的每个个体存储多个STR数的集合和附有识别子的样品501中的个体的识别子,该多个STR数的集合为用传统上使用的足够的读取精度进行分析的样品分析结果503。
虽然将在后面详细描述用于分析新样品107的低精度电泳分析单元505的构造,而低精度电泳分析单元505本身包含电泳分析仪。在第一实施例中,假定该低精度电泳分析单元505表现出与高精度电泳分析仪502类似或更低的读取精度。新样品分析结果111是分析新样品107的结果,并且包含指示多个STR数的集合的数据。个体识别单元506在附有识别子的样品分析数据存储器504中检索下述识别子以生成个体识别结果507,所述识别子具有新样品分析结果111的多个STR数的集合,所述集合与附有识别子的样品分析数据存储器504中每个条目的STR数的集合重叠。个体识别结果507可以包括一个个体识别子或多个个体识别子,或者可以完全不包括任何个体识别子。
下面,将参照图2描述低精度电泳分析单元505的构造。
在第一实施例中,低精度电泳分析单元505包括:单类型扩增子样品保存单元101;电泳分析单元104,用于通过使用电泳分析多类型扩增子样品103,通过混合从单类型扩增子样品保存单元101中选择的DNA样品,即,选择的样品102而产生所述多类型扩增子样品103;多类型扩增子数据存储器106,用于存储由电泳分析单元104提供的多类型扩增子电泳结果数据105;新样品电泳分析单元108,用于使用电泳法分析新样品107;以及新样品结果数据分析单元110,用于基于由新样品电泳分析单元108提供的新样品电泳结果数据109检索多类型扩增子数据存储器106以输出作为新样品分析结果111的检索结果。
这里,单类型扩增子样品保存单元101保存多个单类型扩增子样品,该多个单类型扩增子样品中的每一个均为包括一种类型的扩增子的DNA样品,并且在这些样品中为扩增子样品之间保持STR数。选择的样品102包括以任意组合从单类型扩增子样品保存单元101中选择的(一组)多个样品。通过混合以这种方式选择的多种类型的选择的样品102,生成多类型扩增子样品103。从而,多类型扩增子样品103在单一样品中包括STR数不同的多种类型的扩增子。
在低精度电泳分析单元505中,通过电泳法分析单元104分析多类型扩增子样品103以产生多类型扩增子电泳结果数据105作为其结果。多类型扩增子数据存储器106以配对方式存储多类型扩增子电泳结果数据105和下述扩增子中的每一个的STR数,所述扩增子形成多类型扩增子样品103的与多类型扩增子电泳数据105对应的部分。而且,通过新样品电泳分析单元108分析新样品107的结果为新样品电泳结果数据109,且新样品结果数据分析单元110通过基于新样品电泳结果数据109在多类型扩增子数据存储器106中检索数据来分析新样品107的STR数,并输出该STR数分析的结果作为新样品分析结果111。
下面,将描述该个体识别设备的操作。
首先,为了在数据库(即附有识别子的样品分析数据存储器504)中存储数据,通过高精度电泳分析仪502分析每个附有识别子的样品501,所述高精度电泳分析仪502具有足以读取这些样品中的STR数的信息的读取精度。结果,由于包括在附有识别子的样品501内的DNA中的多个STR数被作为样品分析结果503而得到,因此附有识别子的样品分析数据存储器504以配对方式存储作为样品分析结果503的信息,和对应于附有识别子的样品501的个体的识别子。
接着,通过低精度电泳分析单元505分析被进行个体识别的新样品107以获得新样品分析结果111,该新样品分析结果111是多个STR数的集合。接下来,将参考图2描述低精度电泳分析单元505中的处理。
如上所述,由于多个DNA样品和它们的STR数保存在单类型扩增子样品保存单元101中,因此以任意组合从单类型扩增子样品保存单元101中选择两种或更多种类型的样品作为选择的样品102,并将这些选择的样品102的DNA样品混合以生成多类型扩增子样品103。然后,在电泳分析单元104中通过电泳法分析该多类型扩增子样品103以获得多类型扩增子电泳结果数据105作为结果。使用锥形波形的峰位置和锥形波形的形状特征,或它们中的一种作为电泳分析单元103中电泳的结果。该锥形波形的形状特征包括以下中的一个或多个:(a)峰高、(b)峰宽、(c)该锥形波形的面积,和(d)波形的拐点。由于分析电泳结果的途径是本领域的技术人员熟知的,并且本发明并不直接涉及,因此省略了对其的详细描述。
一旦获得多类型扩增子电泳结果数据105,就将该多类型扩增子电泳结果数据105与选择的样品102中的STR数以配对方式存储在多类型扩增子数据存储器106中。由于如上所述该STR数是扩增子的碱基长度信息,故多类型扩增子数据存储器106存储多类型扩增子的碱基长度信息。通过这种处理,通过多种类型的扩增子的DNA样品的组合,对由电泳分析结果得到哪些变化进行测量,并获得统计数据。在这点上,当多类型扩增子电泳结果数据和STR数关联时,它们仅仅作为具有多个STR数的比较样品使用,而并不直接关联真实个体。
通过新样品电泳分析单元108使用电泳法分析被进行个体识别的新样品107。这里,新样品电泳分析单元108具有与上述电泳分析单元104相同或基本等同的分析性能。单个电泳分析仪被分享为电泳分析单元104和新样品电泳分析单元108。由于通过新样品电泳分析单元108分析新样品107得到新样品电泳结果数据109作为结果,故新样品结果数据分析单元110检索存储在多类型扩增子数据存储器106内的多类型扩增子电泳结果数据105中与新样品电泳结果数据109相似的那些来分析新样品107的STR数,并将该分析结果作为新样品分析结果111输出。
在第一实施例中,如上所述,假定低精度电泳分析单元505的读取精度等于或低于高精度电泳分析仪502。接着,个体识别单元506(参见图1)检索识别子以生成个体识别结果507,该识别子具有与附有识别子的样品分析数据存储器504中的各条目的STR数的集合重叠的新样品分析结果111的多个STR数的集合。个体识别结果507视情况可以包括一个或多个个体识别子,或者可以不包括任何个体识别子。
接下来,将描述即使采用读取精度不足的低精度电泳分析单元505分析新样品107时,如何获得具有足够精度的个体识别结果。
在第一实施例中,假定作为低精度电泳分析单元505的新样品电泳分析单元108或电泳分析单元104,与个体识别中常规使用的电泳分析仪相比仅使用一个分析仪。在这种情况下,即使一种类型的微卫星区域通过PCR扩增,由于DNA的不完全复制,也可产生细微不同的扩增子,或甚至相同尺寸的扩增子在通过毛细管的移动中也可受到扩散的影响,从而即使进行电泳的是来自一种类型的微卫星区域的样品,它们到达毛细管另一端时的到达时间也会彼此不同。结果,在电泳结果中,扩增子相对于到达时间在整个宽度上分布,且观察其浓度为锥形波形。这种现象不仅在使用毛细管等时发生,而且在使用凝胶板作为电泳的介质时也发生,使得扩增子尺寸分析的精度降低。
当在异型接合的人体的DNA微卫星区域中存在具有相似尺寸的两种类型的扩增子时,对应于不同扩增子的两个锥形波形互相匹配,作为电泳的结果,它们可显而易见地观察为单一锥形波形。然而,当与锥形波形的宽度相比,两种类型的扩增子的尺寸相差大时,两个锥形波形出现在不同的地方,且没有重叠,从而正确地分析由每个扩增子的尺寸引起的每个锥形波形的位置和浓度。
无法分离紧密相邻的波形是电泳过程中由扩散等引起的分辨率问题,并且在防止该现象发生的高分辨设备中,即,具有高读取精度的电泳分析仪中,在分析结果中锥形波形具有较窄的宽度,从而即使两种类型的扩增子在尺寸方面基本相同也可分离地观察波形。
当两种类型的扩增子在浓度方面基本相同时,通过组合两种类型的扩增子所产生的锥形波形的峰的位置位于被认为是由各自的扩增子的电泳所产生的两个锥形波形的各自峰的中间。例如,当两种类型的扩增子具有STR数为5,即30个碱基,和STR数为5.2,即32个碱基时,观察锥形波形在31个碱基处有峰。假定存在2bp的读取误差,该样品被认为是30至32个碱基。因此,不能确定其具有STR数为5或是还是STR数为5.2。
为描述该情况,图3显示了对以下情况中的结果进行模拟的结果:其中锥形波形的形状近似为高斯分布,且混合包括两种扩增子的DNA样品,该扩增子具有STR数为5和STR数为5至8,并对该最终的混合物进行分析。在图3中,X轴表示DNA的尺寸。假设在这里STR的重复单元是4bp(碱基对),(5,5)混合的样品1001表现出(5,5)混合的样品的锥形波形的形状。这里,(x,y)混合的样品指STR数为x的样品与STR数为y的样品混合。当x=y时,这代表同型接合,而当x≠y时,这代表异型接合。从图3的模拟可以看出,扩增子进行电泳时的到达时间由于扩散等的影响而改变,锥形波形的宽度更大,甚至在STR数相差1的位置处出现影响。在下面,STR数相差1被描述为“相差1个STR”。
这样,以STR数相差1的位置处出现影响的程度,在锥形波形的宽度较大的分辨率处,对于下述情形,能够清楚地认出DNA样品为异型接合的样品,所述情况为:例如,(5,7)混合的样品1005、(5,7.2)混合的样品1006和(5,8)混合的样品1007。因此,看起来在这里所示的分辨率下,能够正确地识别相差2个以上STR数的混合的样品为异型接合。在这点上,即使在相差1.2个STR(即6bp)的(5,6.2)混合样品1004中,也能够正确地认出异型接合,条件是分辨率为2bp或更精细。如果依靠峰位置,看起来能够正确认出相差1个STR(即4bp)的(5,6)混合的样品1003,因为没有其它类似的锥形波形,且峰位置没有移位。
然而,在该分辨率下,在两种扩增子相差2bp的(5,5.2)混合的样品1002中获得单独的单峰型锥形波形。由于该锥形波形在形状上与同型接合((5,5)混合的样品1001)的锥形波形相似,故不能从锥形波形的形状指定其是异型接合或是同型接合。由于同型接合的(5,5)混合的样品1001的峰与异型接合的(5,5.2)混合的样品1002的峰在位置上偏离约1bp,因此当能够用高精度分析DNA的长度时,能够认出两者之间的差异,但是当精度相对于DNA的长度较低时,难以正确认出。
总之,在上述的模拟条件中,考虑到锥形波形的形状特异性和电泳的正确性两者,能够区分1个STR以上的差别,但是不能区分差别小于1个STR的同型接合或异型接合。在第一实施例中,假定与常规电泳设备相比,低精度电泳分析单元505中的新样品电泳分析单元108或电泳分析单元104的读取精度低。因此,即使直接检索储存基于高精度分析的结果的附有识别子的样品分析数据存储器504并基于通过该低精度电泳分析单元505获得的数据进行匹配,在某些情形中也不能检索出完全匹配的数据。这是因为当由精度为约2bp以下的读取器进行分析时,不能区分能够作为人类的STR数出现的xx、xx.2等。
然而,假定分辨率为如前述示例中的约2bp,该STR数能够确定为5或5.2,条件是测量的碱基长度为约30个碱基。在这种情况下,在参照数据库中,包括正确的STR数的条目能够通过作为5或5.2的STR数处理而被检索。然而,在该情况下,问题出现在假定真实的STR数为5,还会另外检索出STR数为5.2的条目。具体而言,在通过具有低分辨率的设备测量新样品电泳结果数据109的情况下,当在由高分辨率数据生成的数据库中进行检索时,考虑到那些可能的STR数,尽管能够使检索包括新样品107中所包括的STR数的条目,但会另外检索出错误的条目。这种获得多余结果的问题在实际的使用场合中,通过组合后述的其它途径,例如,使用多种类型的基因座信息等的方法,在现实中几乎不是问题。
接下来,将描述为什么获得的多余结果不能构成个体识别的阻碍。
出于描述的目的,在这里假定存在5种可能类型的STR数4、5、5.2、6、7,它们可作为状况出现,且各自的碱基长度为26、30、32、34、38个碱基。
作为示例问题,假定DNA样品(新样品107)的扩增子的真实STR数为(5,5.2)。当在低分辨率(约2bp)下获得新样品电泳结果数据时,该数据在某些情形中不能区分,其中,该数据与通过在高精度诸如1bp下进行读取所生成的数据库中的四种类型的STR数{(5,5),(5,5.2),(5.2,5.2),(5.2,6)}相匹配。换句话说,与其中使用分辨率为1bp的设备的情形相比,指定STR数的能力降低。然而,不会认出被分析的DNA样品(新样品107)是前述四种类型以外的类型。
类似地,假定新样品的扩增子的真实STR数是(5.2,5.2)。在该情况中,作为与数据库匹配的结果,认出其为{(5,5),(5,5.2),(5.2,5.2),(5.2,6),(6,6)}中的任一种。虽然包括真实的STR数(这里,(5.2,5.2)),但检索出包括真实的STR数在内的更多的STR数。这里,认为锥形波形的峰的读取误差,即,正确性大约是一个碱基。换言之,即使读取34个碱基,33、34、35个碱基均可能是实际的DNA尺寸。假定分辨率大约为2bp。换言之,考虑具有相差2bp的扩增子的异型接合的情形,两个锥形波形相匹配,从而它们被读取为单一的锥形波形。例如,如图3中所示的示例,在包含碱基长度为30bp和32bp的扩增子的异型接合的情形中,读取单峰型锥形波形,其峰位于约31bp处。对于异型接合,读取误差相对于碱基长度彼此独立地发生,但是当扩增子尺寸的差等于或小于4bp时,扩增子在电泳结果的曲线图中邻接,从而认为这两个扩增子不存在相对读取误差。
表2显示了两种类型的扩增子的混合物的电泳结果的示例,该示例显示了如何在前述情况中通过电泳法分析两种类型的扩增子的混合物。行开头的编号中的“**”表示存在具有相同的观察到的DNA尺寸对的情形。例如,当真实的STR数为(4,5)和(4,5.2)时,两种情形通过电泳分析仪均可分析为(25bp,31bp)的组合。
表2:两种扩增子的混合物的电泳结果的示例
格式为(观察到的DNA尺寸对)←(真实尺寸对)=(真实的STR数)
行开头编号中的**表示存在相同的(观察到的DNA尺寸对)。
研究FBI在DNA联合索引系统(CODIS)等中使用的基因座的DNA数据,描述为xx.1、xx.2的非整数STR数出现次数少。在以下描述中,任何xx.1、xx.2和xx.3均用xx.{1,2,3}表示。例如,在前述表1中所示的显示基因座FGA多样性的数据中,存在18种可能的STR数,其中它们中仅有4种类型与非整数计数相关,这里指xx.2型。
前述Budowle等的文章(非专利文献1)中公开的“dnaloci.txt”不仅包括显示非裔美国人中基因座FGA多样性的数据,而且还包括与其它人群、其它基因座中的同样的多样性有关的数据。以下,将描述第一实施例的个体识别设备如何能使用Budowle等的文章所附的原始数据“dnaloci.txt”正确地识别个体。表3显示了以下描述中所使用的数据的概括,该数据显示了基于基因座的STR数与出现频率之间的关系。这里,表3仅显示了与似乎难以用约4bp的精度进行分析的STR数关联的数据。
表3:基于基因座的STR数与出现频率
 
基因座 xx.{1,2,3}的STR数 出现频率
CSF1PO 10.3 0.11
D18S51 13.2 0.17
D18S51 14.2 0.01
D18S51 15.2 0.01
D18S51 21.2 0.02
D21S11 24.2 0.36
D21S11 24.3 0.03
D21S11 29.2 0.12
D21S11 30.2 2.79
D21S11 30.3 0.01
D21S11 31.2 8.72
D21S11 32.1 0.01
D21S11 32.2 10.44
D21S11 33.2 3.42
D21S11 34.2 0.19
D21S11 35.2 0.12
D3S1358 15.2 0.02
D7S820 10.1 0.01
D7S820 11.3 0.01
FGA 17.2 0.09
FGA 18.2 0.32
FGA 19.2 0.10
FGA 20.2 0.17
FGA 21.2 0.06
FGA 22.2 0.71
FGA 22.3 0.01
FGA 23.2 0.16
FGA 24.2 0.01
FGA 24.3 0.01
FGA 30.2 0.08
THO1 8.3 0.11
THO1 9.3 22.25
总计 50.65%(13个基因座:1300%中)
仅限于似乎难以用约4bp的精度进行分析的STR数
这里使用的数据包括在美国的六种人群(非裔美国人、美国白种人、西南部的西班牙人、巴哈马人、牙买加人、特立尼达人)的数据。下面,为了知晓平均能力,假定美国的人群组成比为:非裔美国人占25%;美国白种人占45%;西南部的西班牙人占20%;而巴哈马人、牙买加人和特立尼达人占其余的10%。假设巴哈马人、牙买加人和特立尼达人的比例分别为4%、4%和2%,生成数据以继续进行统计分析。而且,前述原始数据中的诸如“<xx”、“>xx”等标记指具有小于或大于xx的STR数的那些STR数的概率,但是由于它们导致复杂的处理且出现次数少,因此省略。
xx.{1,2,3}型的STR数包括在七种基因座(CSF1PO、D18S51、D21S11、D3S1358、D7S820、FGA和THO1)中,总计32种类型。当由于在计算全部基因座时,有总共163种类型的STR数,因此xx.{1,2,3}型数据占19%的类型比。xx.{1,2,3}的出现率为3.85%。
CODIS本身使用13种类型的基因座,并且xx.{1,2,3}在这些基因座中的出现率总计等于50.65%。在这点上,由于总共有13种基因座,因此总频率共计为1300%。将注意力集中于频率数据,能够认为xx.{1,2,3}的频率在基因座D21S11中是高的,而xx.{1,2,3}的频率在其余的基因座中非常低,从而xx.{1,2,3}型STR数并未碰到很多次。具体而言,预计当使用不能区分xx.{1,2,3}与xx的设备判定STR数为约18时,真实的STR数为18或18.2,但由于18.2出现的次数小至0.014,从而即使将18和18.2加起来作为一个时,识别能力也几乎不改变。在这点上,后面将描述正确的估算。
对于正确估算认出能力而言,假定每个人的每个STR数独立出现。考虑在该情况下两个人的STR数正好匹配的概率。这是称为“识别力”的值,它是指示某分析途径具有多高的认出能力的量。当两个人的STR数正好匹配的概率较低时,认出能力被认为较高。
考虑表3中所示的在美国的六种人群的数据的混合的示例,FGA的一个STR数为25的概率为0.100,而其为24的概率为0.186。因此,随机选择的人的FGA为(24,25)的概率为0.100×0.186×2。这里,两个随机选择的人的FGA正好为(24,25)的概率为(0.100×0.186×2)2。使用FGA时的识别力可通过以下总和求得,因为这是两个随机选择的人对于与所有FGA有关的STR数的组合具有相同的STR数的概率。然而,应注意,这是同型接合的情形,其不同于前述异型接合的示例,在同型接合的情形中,出现概率不隐含加倍项,这与异型接合的情形不同,例如,在(24,24)的情形中为诸如0.186×0.186。
以下分别给出异型接合和同型接合的出现概率。
在异型接合的情形中:
Figure A200780021120D00351
在同型接合的情形中:
Figure A200780021120D00352
作为精确评估,如上所述在STR数的组合为五人以下时基于有五个人的假定计算概率,但是该数据假设混合了六个人群的数据,因此基于不需要该精度的假定忽略了这种计算。
在基因座FGA的情形中,识别力,即,两个人的STR数正好匹配的概率为0.30391。CODIS中所使用的其它基因座的识别力如表4中所示。表4显示了基于基因座到基因座的识别力,以及当使用全部13种基因座时两个随机选择的人的全部STR数匹配的概率。
表4:基于基因座到基因座的识别力以及当使用全部13种基因座时两个随机选择的人的全部STR数匹配的概率
 
基因座 识别力 -log10标记 类型数
D13S317 0.080887 (1.092124) 9
CSF1PO 0.104326 (0.981606) 11
D16S539 0.075676 (1.121040) 8
D18S51 0.025047 (1.601245) 19
D21S11 0.037495 (1.426024) 23
D3S1358 0.085779 (1.066618) 9
D5S818 0.126088 (0.899327) 10
D7S820 0.070993 (1.148787) 11
D8S1179 0.066310 (1.178421) 11
FGA 0.030391 (1.517258) 26
THO1 0.078208 (1.106751) 8
TPOX 0.143799 (0.842243) 8
vWA 0.061754 (1.209334) 10
总计 6.444986×10-16 (15.190778) 163
表4左数第三列中括号内的数字表示-log10标记的“识别力(即,它们正好匹配的概率)”。因此,当括号中的数字为1.0时,这表示在每十个人中的一个人STR数正好匹配。最后一列中的数字表示基于基因座到基因座的STR数的类型数。STR数的类型越多,偶然匹配的概率越低。然而,即使STR数的类型数相同,STR数的分布也存在偏差,因此“偶然匹配的概率”并不相同。
如上所述,当全部163种STR数用于13种基因座时,两个随机选择的人正好匹配的概率是各基因座的识别力的乘积,计算为6.444986×10-16(=10-15.190778),从而在每1.551594×10+15(=1/6.444986×10-16)个人中匹配出现一次。
在第一实施例中,使用低精度电泳分析单元505中的新样品电泳分析单元108或电泳分析单元104得到分析DNA样品,即,新样品107的结果作为新样品分析结果111,并且基于该分析结果检索数据库,从而使得能够检索出包括在DNA样品中的STR数的条目。在该情况中,如上所述,还多余检索出错误条目。因而,考虑还多余检索出错误条目的情况中“两个随机选择的人正好匹配的概率”。
假定由于使用低精度电泳分析单元505所引起的低读取精度,xx、xx.2和xx+1不能彼此区分。换言之,考虑它们“被认出为一种类型的STR数”的情况。表5显示了在与电泳中分析精度为约1bp时的识别力进行对比情况下的识别力,其显示了使用低精度电泳分析仪时,每个基因座的识别力以及当使用全部13种基因座时两个随机选择的人的全部STR数匹配的概率。
表5:使用低精度电泳分析仪时每个基因座的识别力以及当使用全部13种基因座时两个随机选择的人的全部STR数匹配的概率
Figure A200780021120D00371
表5中最左边的列表示基因座的名称,并且左数第二和第三列表示使用提供约1bp的分析精度的高精度电泳分析仪时的识别力,以及其-log10标记的表示。在这点上,左数第二列和第三列中的值与表4中所示的相同。表5中左数第4列所述的“低精度电泳分析仪”表示使用提供约4bp的分辨率的上述低精度电泳分析单元505时的识别力,并且第5列表示第四列中-log10标记的识别力。表5中最右边的列表示第三列和第5列之间的差。考虑由c及其以10为底的幂,即,10c表示的最右边的列中的值,使用低精度电泳分析单元505导致识别力减少10c
在基因座D12S317、D16S539、D5S818、D8S1179、TPOX和vWA中,STR数中不存在xx.{1,2,3}型,从而即使如上所述在电泳中精度下降,也能够准确地识别不同的STR数,从而不发生识别力下降。表5中最右列中的值等于零表明了这一点。另一方面,在基因座D21S11和THO1中,作为-log10标记之差的最右列中所示的值为约0.2,由此可见识别力下降了0.63倍(=10-0.2)。
如表5的最下行所示,假定使用这里所示的13种基因座的全部STR数,并且使用如上所述的低精度电泳分析单元505,两个随机选择的人正好匹配的概率为1.972332×10-15(=10-14.705020),这意味着匹配以每5.07014×10+14个人中一次的概率发生。这里所使用的13种基因座与CODIS中所使用的13种基因座相同。
另一方面,当如常规使用的那样,使用提供1bp分析精度的电泳分析仪并使用13种基因座的全部STR数时,两个随机选择的人正好匹配的概率为6.444986×10-16(10-15.190778),这意味着匹配以每1.551594×10+15(1/6.444986×10-16)个人中一次的概率发生。因此,能够看出使用低精度的电泳分析单元505,识别力在CODIS等所使用的13种基因座中从1/(1.551594×10+15)恶化至1/(5.07014×10+14)。换言之,识别力恶化了0.3267699倍。
考虑平均使用STR数作为检索条件一次可将对象缩小到约十分之一的事实,当使用CODIS的13种基因座进行个体识别时,使用分辨率为1bp的电泳分析仪和使用分辨率为4bp的电泳分析仪时的识别能力的差(0.32677699倍)可视作与“未使用某一基因座的信息”时的情况相似,或者识别能力的下降与其相等或更低。
识别力能够用于计算指标“手边样品的STR数每隔多久与数据库中的某条目匹配一次”。该值是在法庭等中使用的以证明鉴定的证明力等的值。识别力是“两个随机选择的人均具有相同的个体基因类型的概率”,而该指标表示“手边样品的STR数与数据库中的条目匹配,但其它n个人的样品的STR数不与数据库匹配”的概率。这里假定p表示“两个随机选择的人具有相同的个体基因类型的概率”,则(1-p)表示“它们不与数据库匹配”的概率。由于有n个人,“所有n个人均不与数据库匹配的概率”表示为(1-p)n。以1%以下的显著性水平进行计算,使得这种事情本身几乎不发生,得到(1-p)n≥1-0.01。
将该情况应用到美国的人群,n为300,000,000,且给出p≤3.33×10-11,注意(1-p)n能够近似为1-np。
有必要比较在1bp的分辨率下读取时该值正好和两个随机选择的人的STR数匹配的概率6.444986×10-16(=10-15.190778)与在4bp的分辨率下读取时该值正好和两个随机选择的人的STR数匹配的概率1.972332×10-15(=10-14.705020)。
注意:
(1-p)n≥1-显著性水平,
1-np≥1-显著性水平,和
显著性水平≥np,
如前述条件所示,在1bp的分辨率下读取的显著性水平和在4bp的分辨率下读取的显著性水平分别为1.933496×10-7(=6.444986×10-16×3×108)和5.916996×10-7(=1.972332×10-15×3×108)。较低分辨率下的显著性水平与1bp下的显著水平相比为约高2倍。
综上所述,当在常规的高分辨率下进行分析时,可断言“手边样品的STR数与数据库中的条目匹配,但n个其它人的样品的STR数不与数据库匹配”的概率为99.99998%(=1.0-1.933496×10-7)。另一方面,在由于低精度电泳分析单元505的读取精度低而xx、xx.2和xx+1彼此不能区分的情况中,不同之处在于,能够断言“手边样品的STR数与数据库中的条目匹配,但n个其它人的样品的STR数不与数据库匹配”的概率为99.99994%(=1.0-5.916996×10-7)。换言之,可看出由于“两个随机选择的人具有相同的个体基因类型的概率”在第五小数位略有变化,因此实际上不会出现问题。
《第二实施例》
接着,将描述根据本发明第二实施例的个体识别设备。虽然该个体识别设备与图1中所示的第一实施例的个体识别设备相似,但它们在低精度电泳分析单元505的构造上不同。图4显示了第二实施例的个体识别设备中的低精度电泳分析单元505的构造。
在上述第一实施例中,在应存储于多类型扩增子数据存储器106中的数据的生成中,以所有组合提供多类型扩增子样品103,而在第二实施例中,以适当组合制备STR数的DNA样品(所选择的样品102)并将它们混合以生成多类型扩增子样品103,而并不以所有组合制备多类型扩增子样品103。然后,通过电泳分析单元104分析多类型扩增子样品103,并将分析获得的多类型扩增子电泳结果数据105保存在多类型扩增子数据存储器106中。在该情况下,当在扩增子可能的组合中存在下述STR数的组合时,即具有所述STR数组合的多类型扩增子样品103并未实际生成,使用模拟法等由多类型扩增子数据存储器106中的测定的数据通过插值等相对于这样的STR数的组合产生数据。从而,在第二实施例中,低精度电泳分析单元505包括插值数据生成单元201,用于由测定的且存储在多类型扩增子数据存储器106中的数据通过插值产生数据,以及插值数据存储器202,用于通过插值数据生成单元201生成插值数据。新样品结果数据分析单元110比较并分析作为通过电泳法分析新样品107的结果的新样品电泳结果数据109,以及存储在多类型扩增子数据存储器106中的数据和存储在插值数据存储器202中的数据以估算新样品107的STR数,并将该结果作为新样品分析结果111输出。
《第三实施例》
接着,将描述根据本发明第三实施例的个体识别设备。虽然该个体识别设备与图1中所示的第一实施例的个体识别设备相似,但它们在低精度电泳分析单元505的构造上不同。图5示出第三实施例的个体识别设备中的低精度电泳分析单元505的构造。
在上述第一实施例中,在应存储于多类型扩增子数据存储器106中的数据的生成中,以所有组合提供多类型扩增子样品103,而在第三实施例中,以适当组合制备STR数的DNA样品(选择的样品102)并将它们混合以生成多类型扩增子样品103,而并不以所有组合制备多类型扩增子样品103。然后,通过电泳分析单元104分析多类型扩增子样品103,并将从分析获得的多类型扩增子电泳结果数据105保存在多类型扩增子数据存储器106中。在该情况下,当STR数的组合存在于可能的扩增子组合中而具有该STR数组合的多类型扩增子样品103并未实际生成时,第三实施例采用具有参数估算功能的新样品结果数据分析单元301作为新样品结果数据分析单元,该新样品结果数据分析单元301具有参数估算功能。
具有参数估算功能的新样品结果分析单元301基于作为新样品电泳分析单元108分析新样品107的结果的新样品电泳结果数据109检索出多类型扩增子数据存储器106中的数据,并在分析新样品电泳结果数据109时,使用以前存储在多类型扩增子数据存储器106中的数据,以使新样品电泳结果数据109以基于STR数的变化而变化的方式参数化,供分析中使用。具有参数估算功能的新样品结果分析单元301分析新样品电泳结果数据109的STR数以输出新样品分析结果111。
《第四实施例》
接着,将描述根据本发明第四实施例的个体识别设备。虽然该个体识别设备与图1中所示的第一实施例的个体识别设备相似,但它们在低精度电泳分析单元505的构造上不同。图6示出第四实施例的个体识别设备中的低精度电泳分析单元505的构造。
第一实施例产生通过电泳法分析的多类型扩增子样品103,并将分析的结果存储在多类型扩增子数据存储器106中,而第四实施例在没有产生多类型扩增子样品的情况下对单类型扩增子样品本身进行电泳分析,通过插值从电泳分析中获得包括多个扩增子的样品的分析结果并存储该分析结果,并且基于存储的结果分析新样品电泳结果数据109,从而生成新样品107的分析结果作为新样品分析结果111。
具体地,在第四实施例中,低精度电泳分析单元505包括:单类型扩增子样品保存单元101;电泳分析单元104,用于通过电泳法分析从单类型扩增子样品保存单元101中选择的DNA样品(选择的样品102);单类型扩增子数据存储器402,用于存储由电泳分析单元104提供的单类型扩增子电泳结果数据401;插值多类型扩增子数据生成单元403,用于基于存储在单类型扩增子数据存储器402中的数据生成插值多类型扩增子数据;存储生成的插值多类型扩增子数据的插值多类型扩增子数据存储器404;新样品电泳分析单元108,用于通过电泳法分析新样品107;以及新样品结果数据分析单元110,用于基于由新样品电泳分析单元108输出的新样品电泳结果数据109检索单类型扩增子数据存储器402和/或插值多类型扩增子数据存储器404以输出检索结果作为新样品分析结果111。
这里,单类型扩增子样品保存单元101保存多个单类型扩增子样品,每个样品均为包括一种扩增子的DNA样品,并且还为每个扩增子样品保存这些样品中的STR数。选择的样品102包括从单类型扩增子样品保存单元101中选择的一种类型的样品。电泳分析单元104通过电泳法分析选择的样品102的结果是单类型扩增子电泳结果数据401,并且单类型扩增子数据存储器402以配对方式存储单类型扩增子电泳结果数据401和与该单类型扩增子电泳结果数据401对应的扩增子的STR数。在第四实施例中,所有样品均从单类型扩增子样品保存单元101中选择,并分别称为选择的样品102。测量选择的样品102以确定电泳的结果如何变化从而生成统计数据。
第四实施例使用插值法以找到由包括多个扩增子的样品所指示的电泳结果。因此,插值多类型扩增子数据生成单元403使用模拟法等由存储在单类型扩增子数据存储器402中的数据生成这样的数据,即,插值多类型扩增子数据,并将该生成的插值多类型扩增子数据保存在插值多类型扩增子数据存储器404中。
新样品结果数据分析单元110比较并分析作为通过电泳法分析新样品107的结果的新样品电泳结果数据109,以及存储于插值多类型扩增子数据存储器404中的数据以估算新样品107的STR数,该新样品107的STR数作为新样品分析结果数据111输出。
在第四实施例的另一示例中,可不将单类型扩增子样品保存单元101中存储的所有单类型扩增子样品分别用作选择的样品102,而是可从单类型扩增子样品保存单元101中选择一部分样品作为选择的样品102使用。
或者,在第四实施例中,当新样品结果数据分析单元110分析新样品电泳结果数据109时,除了存储于插值多类型扩增子数据存储器404中的数据外,还可使用存储于单类型扩增子数据存储器402中的单类型扩增子电泳结果数据401。
《第五实施例》
图7示出根据本发明第五实施例的个体识别设备的构造。该个体识别设备与第一实施例的相似,但其与第一实施例的最大不同在于使用低精度电泳分析单元505代替高精度电泳分析仪用于分析附有识别子的样品501。低精度电泳分析单元505以低精度分析附有识别子的样品501的每个样品,并将该结果作为低精度附有识别子的样品分析结果601输出。低精度附有识别子的样品分析结果601与附有识别子的样品501的每个个体的识别子一起存储在低精度附有识别子的样品分析数据存储器602中。
进行个体识别的新样品107通过低精度电泳分析单元505以与第一实施例中相似的方式进行分析,从而,获得新样品分析结果111。低精度个体识别单元603参照低精度附有识别子的样品分析数据存储器602检索具有新样品分析结果111所共有的STR数的条目,并将找到的条目作为低精度个体识别结果604输出。
当识别力随着电泳中分析精度降低而相应地下降时,如第一实施例中所述,能够评价识别力下降了多少。附有识别子的样品501的电泳分析的分辨率的降低能够有效地作为分析精度处理,其中所述分析精度是对附有识别子的样品501不下降,而对新样品分析结果111进一步下降。当基于在新样品分析结果111中分析精度以该方式进一步下降的假定而计算识别力时,附有识别子的样品501可以通过低精度电泳分析单元505分析而不会引起任何问题,条件是计算出的识别力是可接受的。
《第六实施例》
图8示出根据本发明第六实施例的个体识别设备的构造。该个体识别设备与第一实施例的相似,但与第一实施例的不同之处在于:当通过低精度电泳分析单元505分析新样品107并将其与附有识别子的样品分析数据存储器504中的数据比较以获得个体识别结果507时,且根据得到的个体识别结果507多个个体的STR数能够与新样品107匹配时,通过高精度电泳分析仪502再次分析新样品107。通过高精度电泳分析仪502分析新样品107以生成样品结果503。该个体识别设备设有高精度个体识别单元701,且高精度个体识别单元701基于由新样品107获得的样品分析结果503在附有识别子的样品分析数据存储器504中的条目中检索具有与样品分析结果503共同的STR数的条目,并将该检索结果作为高精度个体识别结果702输出。
《第七实施例》
图9示出根据本发明第七实施例的个体识别设备的构造。该个体识别设备包括:低精度附有识别子的样品分析数据存储器602,其中低精度附有识别子的样品分析结果601以与第五实施例的情形(参见图7)相似的过程存储;以及附有识别子的样品分析数据存储器504,其中附有识别子的样品501的样品分析结果503以与第六实施例的情形(参见图8)相似的过程存储。然后,在该个体识别设备中,以与第五实施例的情形相似的方式,先通过低精度电泳分析单元505分析新样品107以获得新样品分析结果111,并且低精度个体识别单元603基于新样品分析结果111检索低精度附有识别子的样品分析数据存储器602以输出低精度个体识别结果604。当存在一个或多个个体识别条目时,接着基于以前生成的新样品分析结果111通过个体识别单元506参照附有识别子的样品分析数据存储器504检索识别子,该识别子具有与附有识别子的样品分析数据存储器504中的每个条目的STR数的集合重叠的新样品分析结果111的STR数的集合,并将该检索结果以与第一实施例等的情形相似的方式用作个体识别结果507。
当检索到一个或多个条目并且所述条目存在于个体识别结果507中时,完全匹配的条目能够存在于附有识别子的样品分析数据存储器504中。为了对此进行研究,接着,通过高精度电泳分析仪502以与第六实施例的情形相似的方式分析新样品107以获得样品分析结果503。高精度个体识别单元701基于由新样品107得到的样品分析结果503检索附有识别子的样品分析数据存储器504的条目中具有与样品分析结果503共同的STR数的条目,并将该检索结果作为高精度个体识别结果702输出。
《第八实施例》
图10示出根据本发明第六实施例的个体识别设备的构造。该个体识别设备进行DNA分析,并且还使用其它的个体识别信息(生物识别信息)诸如指纹等进行个体识别。这里,将描述对新样品获取对象901进行个体识别的情形,其中新样品获取对象901指能够从其取样DNA样品902和指纹样品906等的对象。
该个体识别设备包括:基于DNA分析的个体识别单元903;附有识别子的DNA分析数据存储器904;基于指纹分析的个体识别单元907;附有识别子的指纹分析数据存储器908;以及使用多项信息的个体识别单元910。这里,基于DNA分析的个体识别单元903与上述任一个实施例中的个体识别设备相似,并且分析DNA样品902(每个前述实施例中的新样品107),基于分析结果检索附有识别子的DNA分析数据存储器904,并将该检索结果作为基于DNA分析的个体识别结果905输出。附有识别子的DNA分析数据存储器904与前述实施例中的附有识别子的样品分析数据存储器504(或低精度附有识别子的样品分析数据存储器602)相当,并存储DNA样品中的分析结果,该DNA样品附有识别子,即,该DNA样品的来源是确定的。
同理,附有识别子的指纹分析数据存储器908存储分析指纹数据的结果,该指纹数据附有识别子,即,该指纹数据的来源是确定的。参照附有识别子的指纹分析数据存储器908,基于指纹分析的个体识别单元907对取自新样品获取对象901的指纹样品906进行指纹分析,并输出指示指纹样品906识别为哪个个体的信息作为基于指纹分析的个体识别结果909。在这点上,由于指纹分析技术是本领域技术人员熟知的且不直接涉及本发明,故省略对其的详细描述。
这样,一旦获得基于DNA分析的个体识别结果905和基于指纹分析的个体识别结果909,使用多项信息的个体识别单元910组合这些个体识别结果905、906以输出使用多项信息的个体识别结果911。由于第八实施例的个体识别设备通过组合DNA分析的结果和指纹分析的结果等进行个体识别,故能够改善个体识别能力。
第八实施例除前述指纹分析信息外,还可采用通过利用虹膜,掌印,脸等的个体识别技术得到的信息作为与DNA分析结果组合的其它个体识别信息。由于这些分析技术中的每一个都是本领域技术人员熟知的且不直接涉及本发明,故省略对其的详细描述。

Claims (24)

1.一种个体识别方法,用于通过使用电泳法分析DNA样品来识别个体,所述方法包括:
分析被给予了用于个体的识别子的附有识别子的DNA样品的第一分析步骤;
将通过分析附有识别子的DNA样品获得的结果与对应的识别子一起存储在附有识别子的样品分析数据存储器中的步骤;
以下述精度分析作为进行个体识别的DNA样品的新样品并使用该结果作为新样品分析结果的第二分析步骤,其中所述精度低于分析附有识别子的DNA样品时的精度;以及
基于新样品分析结果检索所述附有识别子的样品分析数据存储器的步骤。
2.根据权利要求1所述的方法,其中在分析附有识别子的DNA样品和新样品时,通过电泳法找到与样品的碱基长度有关的信息。
3.根据权利要求2所述的方法,其中在分析附有识别子的DNA样品和新样品时,获取与样品中微卫星的重复次数有关的信息。
4.根据权利要求2或3所述的方法,其中所述第一分析步骤中的分析精度为下述精度,以该精度能够识别碱基长度相差新样品中碱基长度的所能想到的最小变化量的两个DNA,并且所述第二分析步骤中的分析精度为下述精度,以该精度不能识别碱基长度相差的所述最小变化量的所述两个DNA。
5.根据权利要求1至4中任一项所述的方法,其中所述第二分析步骤包括:
从每个都包括一种类型的扩增子的一组样品中以任意组合选择多个样品并将选择的样品混合以产生多类型扩增子样品的步骤;
通过电泳法分析多类型扩增子样品的第三分析步骤;
将所述第三分析步骤中获得的结果与多类型扩增子样品的碱基长度信息以配对方式存储在多类型扩增子数据存储器中的步骤;
通过电泳法分析新样品以获得新样品电泳结果数据的第四分析步骤;以及
基于新样品电泳结果数据检索所述多类型扩增子数据存储器并使用该结果作为新样品分析结果的检索步骤。
6.根据权利要求5所述的方法,进一步包括通过关于扩增子组合中其分析结果还未存储在所述多类型扩增子数据存储器中的组合进行插值来产生碱基长度信息并将该碱基长度信息存储在插值数据存储器中的步骤,
其中在所述检索步骤中,基于新样品电泳结果数据检索所述多类型扩增子数据存储器和所述插值数据存储器,并将该结果用作新样品分析结果。
7.根据权利要求1至4中任一项所述的方法,其中所述第二分析步骤包括:
基于从每个包括一种类型的扩增子的一组样品可得到的组合中的部分组合选择样品并将选择的样品混合以产生多类型扩增子样品的步骤;
通过电泳法分析多类型扩增子样品的第三分析步骤;
将所述第三分析步骤中获得的结果与多类型扩增子样品的碱基长度信息以配对方式存储在多类型扩增子数据存储器中的步骤;
通过电泳法分析新样品以获得新样品电泳结果数据的第四分析步骤;以及
参照所述多类型扩增子数据存储器,相对于新样品中碱基长度的变化将新样品电泳结果数据参数化,基于参数化的结果和新样品电泳结果数据检索所述多类型扩增子数据存储器,并使用该检索的结果作为新样品分析结果的步骤。
8.根据权利要求1至4中任一项所述的方法,进一步包括下述步骤:当作为基于新样品分析结果检索所述附有识别子的样品分析数据存储器的结果从所述附有识别子的样品分析数据存储器找到相关条目时,以与所述第一分析步骤中使用的类似精度分析新样品,并使用该分析的结果检索所述附有识别子的样品分析数据存储器以获得个体识别结果。
9.一种个体识别方法,用于通过使用电泳法分析DNA样品来识别个体,所述方法包括:
分析被给予了用于个体的识别子的附有识别子的DNA样品以获得附有识别子的DNA样品的碱基长度的信息的第一分析步骤;
将通过分析附有识别子的DNA样品获得的结果与对应的识别子一起存储在附有识别子的样品分析数据存储器中的步骤;
分析作为进行个体识别的DNA样品的新样品,并使用包括与新样品的碱基长度有关的信息的结果作为新样品分析结果的第二分析步骤;以及
基于新样品分析结果检索所述附有识别子的样品分析数据存储器的步骤,
其中所述第一分析步骤和所述第二分析步骤中的精度为下述精度,即如果两个DNA的碱基长度相差进行个体识别的DNA样品中碱基长度的所能想到的最小变化量时以该精度不能识别所述两个DNA。
10.根据权利要求9所述的方法,其中,在分析附有识别子的DNA样品和新样品时,获取与样品中微卫星的重复次数有关的信息。
11.一种基于多种信息的个体识别方法,包括:
使用从新样品取得对象得到的DNA作为进行个体识别的DNA样品实施根据权利要求1至10中任一项所述的方法的第一个体识别步骤;
使用从新样品取得对象得到的除DNA以外的生物识别信息识别个体的第二个体识别步骤;以及
基于在所述第一个体识别步骤中获得的结果和在所述第二个体识别步骤中获得的结果进行个体识别的第三个体识别步骤。
12.根据权利要求11所述的基于多种信息的个体识别方法,其中所述生物识别信息为指纹信息。
13.一种个体识别设备,用于通过使用电泳法分析DNA样品来识别个体,所述设备包括:
第一分析装置,用于分析被给予了用于个体的识别子的附有识别子的DNA样品;
附有识别子的样品分析数据存储器,用于将通过所述第一分析装置分析附有识别子的DNA样品获得的结果和对应的识别子一起存储;
第二分析装置,具有低于所述第一分析装置的分析精度,用于分析作为进行个体识别的DNA样品的新样品并使用该结果作为新样品分析结果;以及
识别装置,用于基于新样品分析结果检索所述附有识别子的样品分析数据存储器以获得个体识别结果。
14.根据权利要求13所述的设备,其中所述第一和第二分析装置均通过电泳法找到与样品的碱基长度有关的信息。
15.根据权利要求14所述的设备,其中当所述第一和第二分析装置分别分析附有识别子的DNA样品和新样品时,所述第一和第二分析装置获取与样品中的微卫星的重复次数有关的信息。
16.根据权利要求14或15所述的设备,其中所述第一分析装置的分析精度为下述精度,以该精度能够识别碱基长度相差新样品中碱基长度的所能想到的最小变化量的两个DNA,并且所述第二分析装置的分析精度为下述精度,以该精度不能识别碱基长度相差的所述最小变化量的所述两个DNA。
17.根据权利要求13至16中任一项所述的设备,其中所述第二分析装置包括:
单类型扩增子样品保存单元,用于容纳每个都包括一种类型的扩增子的一组样品;
第一电泳分析单元,用于从所述单类型扩增子样品保存单元中以任意组合选择多个样品并使用电泳法分析通过混合选择的样品而生成的多类型扩增子样品;
多类型扩增子数据存储器,用于存储所述第一电泳分析单元中获得的结果及多类型扩增子样品中的碱基长度信息;
第二电泳分析单元,用于通过电泳法分析新样品以获得新样品电泳结果数据;以及
数据分析单元,用于基于新样品电泳结果数据检索所述多类型扩增子数据存储器,并使用该结果作为新样品分析结果。
18.根据权利要求17所述的设备,进一步包括:
插值数据生成单元,用于通过关于扩增子组合中其分析结果还未存储在所述多类型扩增子数据存储器中的组合进行插值来产生碱基长度信息;以及
插值数据存储器,用于存储通过所述插值数据生成单元生成的碱基长度信息,
其中所述数据分析单元基于新样品电泳结果数据检索所述多类型扩增子数据存储器和所述插值数据存储器,并将该结果作为新样品分析结果。
19.根据权利要求13至16中任一项所述的设备,其中所述第二分析装置包括:
第一电泳分析单元,用于通过电泳法分析多类型扩增子样品,该多类型扩增子样品是通过基于从每个都包括一种类型的扩增子的一组样品可得到的组合中的部分组合选择样品并将选择的样品混合来产生的;
多类型扩增子数据存储器,用于以配对方式存储通过所述第一电泳分析单元获得的结果及多类型扩增子样品的碱基长度信息;
第二电泳分析单元,用于通过电泳法分析新样品以获得新样品电泳结果数据;以及
数据分析单元,用于参照所述多类型扩增子数据存储器,相对于新样品中碱基长度的变化将新样品电泳结果数据参数化,基于参数化的结果和新样品电泳结果数据检索所述多类型扩增子数据存储器,并使用该检索的结果作为新样品分析结果。
20.根据权利要求13至16中任一项所述的设备,进一步包括:
第三分析装置,具有与所述第一分析装置类似的精度;以及
高精度识别装置,用于使用所述第三分析装置的结果检索所述附有识别子的样品分析数据存储器以获得个体识别结果,
其中当作为所述识别装置基于新样品分析结果检索所述附有识别子的样品分析数据存储器的结果从所述附有识别子的样品分析数据存储器中找到相关条目时,所述第三分析装置分析新样品。
21.一种个体识别设备,用于通过使用电泳法分析DNA样品来识别个体,所述设备包括:
第一分析装置,用于分析被给予了用于个体的识别子的附有识别子的DNA样品以获得附有识别子的DNA样品的碱基长度的信息;
附有识别子的样品分析数据存储器,用于将通过分析附有识别子的DNA样品获得的结果与对应的识别子一起存储;
第二分析装置,用于分析作为进行个体识别的DNA样品的新样品,并使用包括与该新样品的碱基长度有关的信息的结果作为新样品分析结果;以及
识别装置,用于基于新样品分析结果检索所述附有识别子的样品分析数据存储器,
其中所述第一分析装置和所述第二分析装置中的分析精度为下述精度,如果两个DNA的碱基长度相差进行个体识别的DNA样品中碱基长度的所能想到的最小变化量时以该精度不能识别所述两个DNA。
22.根据权利要求21所述的设备,其中,在分析附有识别子的DNA样品和新样品时,所述第一和第二分析装置获得与样品中的微卫星的重复次数有关的信息。
23.一种基于多种信息的个体识别设备,包括:
第一个体识别装置,包括根据权利要求13至22中任一项所述的设备,用于使用从新样品取得对象得到的DNA作为进行个体识别的DNA样品;
第二个体识别装置,用于使用从新样品取得对象得到的除了DNA以外的生物识别信息来识别个体;以及
第三个体识别装置,用于基于所述第一个体识别装置中获得的结果和所述第二个体识别装置中获得的结果进行个体识别。
24.根据权利要求23所述的基于多种信息的个体识别设备,其中所述生物识别信息为指纹信息。
CN2007800211208A 2006-04-14 2007-04-12 个体识别方法及设备 Active CN101467032B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006112600 2006-04-14
JP112600/2006 2006-04-14
PCT/JP2007/058055 WO2007119779A1 (ja) 2006-04-14 2007-04-12 個体識別方法および装置

Publications (2)

Publication Number Publication Date
CN101467032A true CN101467032A (zh) 2009-06-24
CN101467032B CN101467032B (zh) 2013-03-27

Family

ID=38609539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800211208A Active CN101467032B (zh) 2006-04-14 2007-04-12 个体识别方法及设备

Country Status (7)

Country Link
US (1) US20090277790A1 (zh)
EP (1) EP2012116A4 (zh)
JP (1) JP5051126B2 (zh)
KR (1) KR101163425B1 (zh)
CN (1) CN101467032B (zh)
TW (1) TWI452291B (zh)
WO (1) WO2007119779A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113439117A (zh) * 2019-03-05 2021-09-24 株式会社日立高新技术 基因型解析装置及方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5641465B2 (ja) * 2009-04-14 2014-12-17 独立行政法人農業・食品産業技術総合研究機構 一塩基反復多型解析方法及び一塩基多型解析方法
GB201108587D0 (en) * 2011-05-23 2011-07-06 Forensic Science Service Ltd Improvements in and relating to the matching of forensic results
US9094211B2 (en) 2011-08-26 2015-07-28 Life Technologies Corporation Systems and methods for identifying an individual
KR101287400B1 (ko) * 2011-11-16 2013-07-18 (주)인실리코젠 Dna 검색 방법
JP5900908B2 (ja) * 2014-09-03 2016-04-06 国立研究開発法人農業・食品産業技術総合研究機構 一塩基反復多型解析方法及び一塩基多型解析方法
WO2021100204A1 (ja) * 2019-11-22 2021-05-27 日本電気株式会社 Dna増幅方法、dna増幅キット及び鑑定/診断方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0630799A (ja) * 1992-07-10 1994-02-08 Hitachi Ltd 遺伝子検出方法及び遺伝子検出装置
CN1091831A (zh) * 1992-12-09 1994-09-07 株式会社日立制作所 检测核酸的方法
US5972693A (en) 1995-10-24 1999-10-26 Curagen Corporation Apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US6306588B1 (en) 1997-02-07 2001-10-23 Invitrogen Corporation Polymerases for analyzing or typing polymorphic nucleic acid fragments and uses thereof
GB9707980D0 (en) * 1997-04-21 1997-06-11 Brax Genomics Ltd Characterising DNA
JPH11118760A (ja) 1997-10-14 1999-04-30 Hitachi Ltd 核酸断片の電気泳動パターンの解析法
ATE280225T1 (de) 1999-08-20 2004-11-15 Promega Corp Simultane isolierung und quantifizierung von dna
JP2001168855A (ja) * 1999-12-13 2001-06-22 Sony Corp 暗号鍵生成装置、暗号化・復号化装置および暗号鍵生成方法、暗号化・復号化方法、並びにプログラム提供媒体
JP2001338135A (ja) * 2000-03-22 2001-12-07 Hidekazu Kihara 電子商取引システム及びこれを用いた電子商取引方法
JP4310104B2 (ja) 2002-09-28 2009-08-05 英俊 猪子 マイクロサテライト遺伝多型マーカを用いる遺伝子のマッピング方法
US6531282B1 (en) * 2000-05-30 2003-03-11 Oligotrail, Llc Multiplex amplification and analysis of selected STR loci
AU2002211212A1 (en) 2000-07-21 2002-02-05 Applera Corporation Methods, systems, and articles of manufacture for evaluating biological data
US8898021B2 (en) * 2001-02-02 2014-11-25 Mark W. Perlin Method and system for DNA mixture analysis
CA2438921C (en) 2001-02-21 2012-04-10 Shire Biochem Inc. Streptococcus pyogenes polypeptides and corresponding dna fragments
JP2002253203A (ja) 2001-03-01 2002-09-10 Id Technica:Kk 識別情報表示物及びその識別情報表示物を利用した認証システム
US20020155587A1 (en) 2001-04-20 2002-10-24 Sequenom, Inc. System and method for testing a biological sample
EP2184369A1 (en) 2001-07-11 2010-05-12 Applied Biosystems, LLC Method for normalisation in electrophoresis
JP2003150720A (ja) * 2001-11-16 2003-05-23 Dainippon Printing Co Ltd 不正受験防止方法
JP2003245098A (ja) 2002-02-25 2003-09-02 Hitachi Ltd 遺伝子検索方法及びリストの提供方法
AR037006A1 (es) 2002-06-20 2004-10-20 S I G Sist S De Identificacion Marcador de objetos a identificar consistente en al menos un fragmento de adn.
JP4418303B2 (ja) 2003-06-02 2010-02-17 株式会社日清製粉グループ本社 ダイズの検査方法
JP2005237334A (ja) 2004-02-27 2005-09-08 Olympus Corp 反復配列長の検出方法
JP2005307216A (ja) 2005-05-09 2005-11-04 Ntt Data Technology Corp 合成dnaインク

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113439117A (zh) * 2019-03-05 2021-09-24 株式会社日立高新技术 基因型解析装置及方法
CN113439117B (zh) * 2019-03-05 2023-12-22 株式会社日立高新技术 基因型解析装置及方法

Also Published As

Publication number Publication date
US20090277790A1 (en) 2009-11-12
KR101163425B1 (ko) 2012-07-13
JP5051126B2 (ja) 2012-10-17
EP2012116A4 (en) 2009-09-09
EP2012116A1 (en) 2009-01-07
WO2007119779A1 (ja) 2007-10-25
CN101467032B (zh) 2013-03-27
KR20080111537A (ko) 2008-12-23
JPWO2007119779A1 (ja) 2009-08-27
TW200801506A (en) 2008-01-01
TWI452291B (zh) 2014-09-11

Similar Documents

Publication Publication Date Title
CN101467032B (zh) 个体识别方法及设备
CN101748213B (zh) 一种环境微生物检测方法和系统
CN110914911B (zh) 压缩分子标记的核酸序列数据的方法
Corvelo et al. taxMaps: comprehensive and highly accurate taxonomic classification of short-read data in reasonable time
CA2906725C (en) Characterization of biological material using unassembled sequence information, probabilistic methods and trait-specific database catalogs
US20230197196A1 (en) Allelotyping Methods for Massively Parallel Sequencing
KR102165933B1 (ko) 둘 이상의 데이터 세트를 이용한 비정상적인 시그널의 검출
CN115083521B (zh) 一种单细胞转录组测序数据中肿瘤细胞类群的鉴定方法及系统
CN113470743A (zh) 一种基于bd单细胞转录组和蛋白组测序数据的差异基因分析方法
Kearse et al. The Geneious 6.0. 3 read mapper
Ohta et al. Using nanopore sequencing to identify fungi from clinical samples with high phylogenetic resolution
Krawetz Sequence errors described in GenBank: a means to determine the accuracy of DNA sequence interpretation
EP4083226A1 (en) Tailored gene chip for genetic test and fabrication method therefor
CN101429559A (zh) 一种环境微生物检测方法和系统
CN108182348A (zh) 基于种子序列信息的dna甲基化数据检测方法及其装置
Vauterin et al. Integrated databasing and analysis
Sovic et al. Fast and sensitive mapping of error-prone nanopore sequencing reads with GraphMap
US20240221954A1 (en) Disease prediction methods and devices, electronic devices, and computer readable storage media
Reed et al. Identifying individual DNA species in a complex mixture by precisely measuring the spacing between nicking restriction enzymes with atomic force microscope
CN102831331A (zh) 基于酶切建库双末端测序的长度多态性标记的引物设计开发方法
Gudodagi et al. Investigations and Compression of Genomic Data
CA2961563C (en) Methods of analyzing massively parallel sequencing data
US11468970B2 (en) Allelotyping methods for massively parallel sequencing
Ohta et al. DNA metabarcoding workflow utilizing nanopore long-read sequencing and consensus generation for rapid identification of fungal taxa with high phylogenetic resolution
Valouev Shotgun optical mapping: a comprehensive statistical and computational analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant