CN109722470A - 品质评价方法、装置、程序、记录介质、及品质管理试样 - Google Patents

品质评价方法、装置、程序、记录介质、及品质管理试样 Download PDF

Info

Publication number
CN109722470A
CN109722470A CN201811245802.3A CN201811245802A CN109722470A CN 109722470 A CN109722470 A CN 109722470A CN 201811245802 A CN201811245802 A CN 201811245802A CN 109722470 A CN109722470 A CN 109722470A
Authority
CN
China
Prior art keywords
gene
mentioned
sequence
quality
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811245802.3A
Other languages
English (en)
Inventor
铃木健一郎
铃木誓吾
渡边玲子
佐藤淳
泽贤一
身野健二郎
冈明秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sysmex Corp
Original Assignee
Sysmex Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sysmex Corp filed Critical Sysmex Corp
Publication of CN109722470A publication Critical patent/CN109722470A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及品质评价方法、装置、程序、记录介质、及品质管理试样。本发明提供精度更高的基因检查的品质管理方法和装置。本发明的品质评价装置(1)是评价在对于从受试体采集的试样中的基因检查至少第1类别的基因变异和与第1类别不同的第2类别的基因变异的基因检查中的品质的品质评价装置(1),其具备:对含具有上述第1类别的基因变异的第1标准基因和具有第2类别的基因变异的第2标准基因的品质管理试样中所含的基因的序列信息进行解析的数据调整部(113),及生成用于基于序列信息而评价基因检查的品质的指标的品质管理部(117)。

Description

品质评价方法、装置、程序、记录介质、及品质管理试样
【技术领域】
本发明涉及基因检查的品质评价方法、品质评价装置、程序、记录介质、及品质管理试样。
【背景技术】
近年的基因检查技术的进展之中,对受试体的基因序列进行解析,适合地选择对应于受试体的特性的治疗法或药剂的对个别化医疗的期待升高。在基因序列的解析中,例如,已知使用第二代测序仪高通量解析在与特定的疾病关联的特定的基因中的异常或在翻译成蛋白质的外显子区域中的异常的组合检查。
在非专利文献1中记载了利用第二代测序仪的基因检查的品质管理方法。
【现有技术文献】
【非专利文献】
【非专利文献1】Lih et al.,Analytical Validation of the Next-GenerationSequencing Assay for a Nationwide Signal-Finding Clinical Trial,The Journalof Molecular Diagnostics,Vol.19,No.2,March 2017
【发明的概要】
【发明要解决的课题】
但是,在基因检查领域中的品质管理是试行阶段,不是作为基因检查的标准的品质管理方法确立的。例如,以在非专利文献1中记载的技术作为以多个基因作为解析对象的组合检查的品质管理方法使用时,品质评价的精度可变低。
本发明以在以组合检查等的多个基因作为解析对象时,提供精度更高的基因检查的品质管理方法作为主要的目的。
【用于解决课题的手段】
为了解决上述的课题,本发明的一实施方式涉及的品质评价方法是在对于从受试体采集的试样中的基因检查含第1类别的基因变异及与上述第1类别不同的第2类别的基因变异的多个类别的基因变异的基因检查中的品质评价方法,其包括:准备含具有第1类别的基因变异的第1标准基因和具有第2类别的基因变异的第2标准基因的品质管理试样,取得品质管理试样中所含的基因的序列信息,输出用于基于取得的上述序列信息而评价基因检查的品质的指标。
根据上述的构成,通过对品质管理试样进行解析,输出用于评价基因检查的品质的指标。在品质管理试样中,由于在基因检查中至少含1个具有成为检测对象的变异类别的变异的标准基因,可在评价基因检查的品质的基础上,输出对应于各种各样的变异类别的指标。从而,有充分的精度的基因检查的品质管理变得可能。
“受试体”是指人受试体以及不是人的受试体、例如,哺乳类、无脊椎动物、脊椎动物、菌类、酵母、细菌、病毒及植物等。本说明书的实施例关于人受试体,但本发明的概念可应用于人以外的任意的动物或植物等的生物来源的基因组,在医疗、兽医学及动物科学等的领域中有用。
“试样”也可称为受试体或样品,在本领域中以与标本、调制物同义使用,是指从作为供给源的生物材料(例如,个体、体液、细胞株、组织培养物或组织切片)得到的任意的调制物。
“品质管理试样”是指例如,为了实施用于对基因的序列进行解析的预处理、及用于由测序仪2读取序列信息的处理等而调制的调制物。
“变异”含基因的核苷酸的取代、缺失、或者插入、基因的融合、或者拷贝数多态性。“取代”是指基因的序列之中至少1碱基成为不同的碱基的现象。“取代”含点突变及1碱基多态性。“缺失”及“插入”也记作“InDel(Insertion and/or Deletion)”。InDel是基因的序列之中插入有至少1个碱基,及/或缺失的现象。“基因的融合”是指由染色体的转座等,某基因的5’侧的序列和别的基因的3’末端侧的序列结合的现象。“拷贝数多态性”是指每1细胞的基因组上的拷贝数在个体间不同。具体而言,例示VNTR(Variable Nucleotide of TandemRepeat、串联重复序列多态性)、及STRP(Short Tandem Repeat Polymorphism、微卫星多态性)、基因扩增等。
第1类别的基因变异是核苷酸的取代、缺失、或者插入、多态性、基因的拷贝数异常或基因融合,第2类别的基因变异是核苷酸的取代、缺失、或者插入、多态性、基因的拷贝数异常或基因融合,其也可与第1类别的基因变异不同。
品质管理试样也可在基因检查中对于成为检测对象的多个变异类别各含具有至少1个基因变异的标准基因。
也可基于指标而评价基因检查的品质。
也可与品质管理试样中所含的基因的序列信息一同,取得试样中所含的基因的序列信息。
品质管理试样也可还含无变异的基因。
也可基于指标满足指定的基准与否而评价基因检查的品质。
指定的基准也可在基因检查中使用的第1基因组合和与第1基因组合不同的第2基因组合上不同。
将品质管理试样中所含的基因的序列信息由测序仪取得,指标也可为利用测序仪的序列信息的读取品质。
指标也可显示由测序仪读取的基因序列中的各碱基的正确性。
测序仪在流动池上扩增基因而形成群集,指标也可显示在流动池中的各基因的群集的接近程度。
将品质管理试样中所含的基因的序列信息由测序仪取得,指标也可显示用测序仪读取的碱基之中靶区域的碱基的比例。
指标也可显示取得的品质管理试样中所含的基因的序列信息的深度。
指标也可显示取得的品质管理试样中所含的基因的序列信息的深度的偏差。
也可准备基因不同的多个品质管理试样,选择从多个品质管理试样调制的品质管理试样。
也可调制作为在基因检查中不成为解析对象的基因,至少含1个具有变异类别的变异的基因的品质管理试样。
也可向与多个检查设施连接的管理服务器(3)发送指标。
也可从管理服务器(3)接收品质的评价结果。
本发明的一实施方式涉及的品质评价装置(1)是评价在对于从受试体采集的试样中的基因检查至少第1类别的基因变异和与第1类别不同的第2类别的基因变异的基因检查中的品质的品质评价装置(1),其具备:对含具有上述第1类别的基因变异的第1标准基因和具有第2类别的基因变异的第2标准基因的品质管理试样中所含的基因的序列信息进行解析的数据调整部(113),及生成用于基于序列信息而评价基因检查的品质的指标的品质管理部(117)。
根据上述的构成,解析品质管理试样而生成用于评价基因检查的品质的指标。在品质管理试样中,由于在基因检查中至少含1个有成为检测对象的变异类别的变异的标准基因,可在评价基因检查的品质的基础上,生成对应于各种各样的变异类别的指标。从而,通过由使用者向品质评价装置提供指标,有充分的精度的基因检查的品质管理变得可能。
本发明的一实施方式涉及的程序是在对于从受试体采集的试样中的基因检查至少第1类别的基因变异和与上述第1类别不同的第2类别的基因变异的基因检查中的品质评价程序,其为用于使计算机执行下列步骤的程序:取得含具有上述第1类别的基因变异的第1标准基因和具有上述第2类别的基因变异的第2标准基因的品质管理试样中所含的基因的序列信息的步骤,及生成用于基于取得的上述序列信息而评价上述基因检查的品质的指标的步骤。
根据上述的构成,发挥与本发明的一实施方式涉及的品质评价方法同等的效果。
本发明的一实施方式涉及的记录介质是记录本发明的一实施方式涉及的程序的计算机能读取的记录介质。
本发明的一实施方式涉及的品质管理试样是在对于从受试体采集的试样中的基因检查至少第1类别的基因变异和与上述第1类别不同的第2类别的基因变异的基因检查中的品质管理试样,其含具有上述第1类别的基因变异的第1标准基因和具有上述第2类别的基因变异的第2标准基因。
根据上述的构成,在基因检查中至少含1个有成为检测对象的变异类别的变异的标准基因。所以,在评价基因检查的品质的基础上,通过应用品质管理试样生成对应于各种各样的变异类别的指标变得可能。
【发明的效果】
根据本发明的一实施方式,可提供有充分的精度的基因检查的品质管理方法。
【附图的简单的说明】
【图1】是显示本发明的一实施方式涉及的基因解析系统的典型的应用例的图。
【图2】是显示在基因解析系统中进行的主要的处理的例的序列图。
【图3】是含品质评价装置的软件构成的一例的功能块图。
【图4】是显示用于对试样的基因序列进行解析的处理的流程的一例的流程图。
【图5】是对用于将试样DNA的碱基序列由测序仪解析的预处理的顺序的一例进行说明的流程图。
【图6】是对品质管理试样的一例进行说明的图。
【图7】是显示基因组合关联信息数据库的数据结构的例的图。
【图8】是显示品质管理试样的具体例的图。
【图9】是对于试样的片段化的工序(a)、及索引序列及适配体序列的赋予的工序(b)的例进行说明的图。
【图10】是对于杂交的工序的一例进行说明的图。
【图11】是对于回收成为解析对象的DNA片段的工序的一例进行说明的图。
【图12】是对将试样DNA的碱基序列由测序仪解析的顺序的一例进行说明的流程图。
【图13】是对于将DNA片段供于流动池的工序的一例进行说明的图。
【图14】是对于对成为解析对象的DNA片段进行扩增的工序的一例进行说明的图。
【图15】是对于测序工序的一例进行说明的图。
【图16】是对利用品质评价装置的解析的流程的一例进行说明的流程图。
【图17】是显示读长序列信息的文件格式的一例的图。
【图18】(a)是对由数据调整部的比对进行说明的图,(b)是显示数据调整部的比对结果的格式的一例的图。
【图19】是显示参照序列数据库的结构例的图。
【图20】是显示整合到参照序列数据库中所含的参照序列(不是表示野生型的序列的)的已知的变异的例的图。
【图21】是对比对的详细的工序的一例进行说明的流程图。
【图22】(a)是显示评分算出的一例的图,(b)是显示评分算出的其他例的图。
【图23】是显示变异鉴定部生成的结果文件的格式的一例的图。
【图24】是显示变异数据库的结构的一例的图。
【图25】是显示变异数据库中的变异信息的结构的详细例的图。
【图26】是显示品质评价指标的一例的图。
【图27】是显示品质评价指标的一例的图。
【图28】是显示制成的报告的一例的图。
【图29】是显示含取代变异的标准基因的一例的图。
【图30】是显示含融合变异的标准基因的一例的图。
【具体实施方式】
〔实施方式1〕
以下,对于本发明的一实施方式而具体进行说明。
(基因解析系统100的应用例)
首先,使用图1对于本发明的一实施方式涉及的基因解析系统100的概略进行说明。图1是显示本发明的一实施方式涉及的基因解析系统100的典型的应用例的图。基因解析系统100是对基因的序列信息进行解析的系统,其具备至少品质评价装置1和管理服务器3即可。
图1中所示的基因解析系统100管理在检查机关120中执行的解析整体的解析系统管理机关130、及对应于来自医疗机关210的解析委托,对提供的试样进行解析,将解析结果提供于医疗机关210的检查机关120中应用。
检查机关120是将从医疗机关210提供的试样检查-解析,制成基于解析结果的报告,向医疗机关210提供该报告的机关。在检查机关120设置测序仪2、及品质评价装置1等,但不限于此。
解析系统管理机关130是管理在利用基因解析系统100的各检查机关120中执行的解析整体的机关。
医疗机关210是医师、看护师、药剂师等对于患者进行诊断、治疗、调剂等的医疗行为的机关,例如,可举出医院、诊疗所、药局等。
(应用在基因解析系统100的例中的处理)
接下来,对于图1中所示的基因解析系统100的应用例中的处理的流程而使用图2具体性地说明。图2是显示在基因解析系统100中进行的主要的处理的例的序列图。再者,图2中所示的处理仅是在各机关中进行的处理的一部分。
<基因解析系统利用的申请及利用开始>
首先,希望基因解析系统100的利用的检查机关120导入品质评价装置1。进而,向解析系统管理机关130申请基因解析系统100的利用(步骤S101)。
检查机关120及解析系统管理机关130可从多个契约类别之中,关于基因解析系统100的利用而在事前缔结期望的契约。例如,也可为选自从解析系统管理机关130提供于检查机关120的服务内容、解析系统管理机关130对于检查机关120请求的系统利用费的确定方法、及系统利用费的支付方法等不同的多个契约类别的。解析系统管理机关130的管理服务器3对应于来自检查机关120的申请,确定在检查机关120之间缔结的契约的内容(步骤S102)。
接下来,由解析系统管理机关130管理的管理服务器3对于缔结契约的检查机关120的品质评价装置1赋予检查机关ID,开始各种服务的提供(步骤S103)。
品质评价装置1从管理服务器3接收各种服务。在各种服务中,含可从品质评价装置1输出的基因序列的解析结果,及用于控制基于该解析结果的报告等的程序或信息的提供。由此,品质评价装置1可输出适合于输入的关于基因组合的信息的解析结果及报告等。
基因组合在多数的情况中,含引物或探针等的一套的试剂。再者,基因组合的解析不限于此,也可在单核苷酸多态性(SNP、Single Nucleotide Polymorphism)、及拷贝数多态性(CNV、Copy Number Polymorphism)等的多态性的解析中使用。另外,基因组合也可在关于解析对象基因整体的变异等的量的信息(也称为Tumor Mutation Burden等)的输出,或甲基化频度的算出中使用。
<向检查机关120的解析委托>
在医疗机关210中,医师等根据必要,采集受试体的病变部位的组织及血液等的试样。将采集的试样的解析委托于检查机关120时,例如,从设在医疗机关210的通信终端5发送解析委托(步骤S105)。向检查机关120委托试样的解析时,医疗机关210与解析委托的发送一同,将针对每个试样赋予的试样ID提供于检查机关120。赋予每个试样的试样ID将采集各试样的受试体的信息等和各试样对应。
以下举例说明医疗机关210向检查机关120委托解析组合检查的情况。再者,组合检查不限于临床检查,也含研究用途的检查。
从医疗机关210委托基因组合检查时,也可指定期望的基因组合。所以,在图2的步骤S105中从医疗机关210发送的解析委托中,可含关于基因组合的信息。其中,关于基因组合的信息是可为了确定基因组合而使用的信息即可,例如可为基因组合名、及成为组合检查中的解析对象的基因的名等。
<在检查机关120的解析>
品质评价装置1从医疗机关210接收解析委托(S106)。再者,品质评价装置1从作为该解析委托的发送源的医疗机关210接受试样。
再者,可在检查机关120从医疗机关210受委托的解析中使用的基因组合有多个,并且,成为解析对象的基因组针对每个基因组合确定。检查机关120将多个基因组合根据解析的目的分开使用也是可能的。即,对于从医疗机关210提供的第1试样,可为了对第1解析对象基因组进行解析而使用第1基因组合,对于第2试样,可为了对第2解析对象基因组进行解析而使用第2基因组合。
在本实施方式中,例如,第1种类的基因变异是“取代”,第2种类的基因变异是“缺失”。此时,在成为品质管理的对象的基因检查中,至少检查取代及缺失的有无、种类等。在此实施方式中,第1标准基因相对于野生型基因的序列而含特定的取代变异,第2标准基因相对于野生型基因的序列而含特定的缺失变位。
品质评价装置1从使用者接受为了解析试样而使用的关于基因组合的信息的输入(步骤S107)。
在检查机关120中,对于接受的试样使用基因组合而进行预处理,进行使用测序仪2的测序(步骤S108)。
另外,在检查机关120中,与通常的试样的测序不同地,通过对于对应于基因组合的指定的品质管理试样使用基因组合而进行预处理,进行使用测序仪2的测序(步骤S108)来进行精度管理。
将品质管理试样供于预处理、测序、及序列解析等的基因检查时的结果作为组合检查的品质评价指标利用。
可为每基因组合对应1个或多个品质管理试样,也可为例如,每基因组合预先调制对应的品质管理试样。另外,品质管理试样可单独测定,也可与从医疗机关210提供的试样一同测定。
其中,品质管理试样是在检查第1类别的基因变异和与第1类别不同的第2类别的基因变异的基因检查中使用的品质管理用的试样。“品质管理试样”是含具有第1类别的基因变异的第1标准基因和具有第2类别的基因变异的第2标准基因的调制物。
预处理可含对试样中所含的DNA等的基因进行片段化至回收片段化的基因的处理。另外,测序含读取用预处理回收的成为解析对象的1个或多个DNA片段的序列的处理。由利用测序仪2的测序读取的序列信息作为读长序列信息输出到品质评价装置1。
另外,预处理可含对试样及品质管理试样中所含的DNA等的基因进行片段化至回收片段化的基因的处理。
读长序列是指由测序得到的多核苷酸序列,指从测序仪2输出的序列。
测序含读取用预处理回收的成为解析对象的1个或多个DNA片段的序列的处理。由利用测序仪2的测序读取的序列信息作为读长序列信息输出到品质评价装置1。
测序仪2也可将含作为关于基因序列的读取工序的品质评价指标的质量评分的读长序列信息输出到品质评价装置1。另外,测序仪2也可将作为关于成为解析对象的DNA片段的扩增工序的品质评价指标的群集浓度输出到品质评价装置1。再者,对于“质量评分”、及“群集浓度”在后说明。
再者,可在检查机关120从医疗机关210受委托的解析中使用的基因组合有多个,并且,针对每个基因组合确定成为解析对象的基因组。检查机关120将多个基因组合根据解析的目的分开使用也是可能的。即,从医疗机关210提供的第1试样,可为了对第1解析对象基因组进行解析而使用第1基因组合,对于第2试样,可为了对第2解析对象基因组进行解析而使用第2基因组合。
品质评价装置1从测序仪2取得读长序列信息而进行基因序列的解析(步骤S109)。
再者,品质管理试样还用与在来自医疗机关210的试样的组合检查中进行的工序相同的工序处理,解析品质管理试样的基因的序列信息。生成用于基于解析品质管理试样的结果而评价组合检查的品质的品质评价指标。
接下来,品质评价装置1基于生成的品质评价指标而评价组合检查的品质(步骤S110)。具体而言,品质评价装置1可基于对针对每个品质评价指标设定的评价基准和生成的品质评价指标进行比较的比较结果而评价各组合检查的品质。
品质评价装置1基于步骤S109中的解析结果,及基于解析品质管理试样的结果生的指标而制成报告(步骤S111)、向通信终端5发送制成的报告(步骤S112)。在报告中,例如,也可含读长序列信息的比对结果的数据、及关于鉴定的变异等的数据等的品质评价装置1解析的结果的数据自身、及关于组合检查的品质的信息。
再者,可为在检查机关120打印制成的报告,也可为例如,以检查机关120制成的报告作为纸介质送到医疗机关210。
利用基因解析系统100的检查机关120的品质评价装置1向管理服务器3通知在解析中使用的关于基因组合的信息、关于解析的基因的信息、解析成效、及对于进行的基因检查而生成的品质评价指标等(步骤S114)。
管理服务器3经例如网络4而从利用基因解析系统100的各检查机关120的品质评价装置1取得检查机关ID、基因组合ID、基因ID、及解析成效等。另外,管理服务器3对应存储取得的检查机关ID、基因组合ID、基因ID、及解析成效等(步骤S115)。
再者,检查机关ID是确定进行基因的序列解析的使用者的信息,也可为赋予每个利用品质评价装置1的使用者的识别信息的使用者ID。
基因组合ID是为了确定在成为对象的基因的解析中使用的基因组合而赋予的识别信息。赋予基因组合的基因组合ID与基因组合名及提供该基因组合的会社名等对应。
基因ID是为了确定解析对象的基因而赋予每个基因的识别信息。
(基因解析系统100的构成)
基因解析系统100是对基因的序列信息进行解析的系统,其具备至少品质评价装置1和管理服务器3。品质评价装置1经内部网及互联网等的网络4而与管理服务器3连接。
(测序仪2)
测序仪2是为了读取试样中所含的基因的碱基序列而利用的碱基序列解析装置。
本实施方式涉及的测序仪2优选为进行使用第二代测序技术的测序的第二代测序仪、或者优选第3代的测序仪。第二代测序仪是近年开发的改进的一组的碱基序列解析装置,通过将克隆扩增的DNA模板或单独DNA分子在流动池内进行大量地并列处理而有飞跃性地提升的解析能力。
另外,在本实施方式中能使用的测序技术可为由重复阅读相同的区域(深度测序)取得多个读长序列的测序技术。
作为能在本实施方式中使用的测序技术的例,可举出离子半导体测序、焦磷酸测序(pyrosequencing)、使用可逆染料终止子的边测序边合成(sequencing-by-synthesis)、边测序边连接(sequencing-by-ligation)、及由寡核苷酸的探针结扎的测序等的基于Sanger法以外的序列原理的能在每1次运行取得多数的读长序列的测序技术。
在测序中使用的测序引物不特别限定,基于对于扩增目的区域而言适宜的序列而适宜设定。另外,对于在测序中使用的试剂,也对应于使用的测序技术及测序仪2选择适宜的试剂即可。在后举具体例说明预处理至测序的顺序。
(品质评价装置1的构成)
图3是品质评价装置1的构成的一例。品质评价装置1具备:取得由测序仪2读取的读长序列信息及关于含成为解析对象的多个基因的基因组合的信息的控制部11,及基于关于控制部11取得的基因组合的信息,输出读长序列信息的解析结果的输出部13。品质评价装置1可使用计算机构成。例如,控制部11是CPU等的处理器,存储部12是硬盘驱动器。
另外,在存储部12中,也存储用于序列解析的程序、用于生成单一的参照序列的程序等。输出部13含显示器、打印机、扬声器等。输入部17含键盘、鼠标、触摸传感器等。另外,也可使用如触摸传感器和显示器一体化的触控面板一样的有输入部及输出部的双方的功能的装置。通信部14是用于控制部11与外部的装置通信的接口。
品质评价装置1具备总的控制品质评价装置1所具备的各部的控制部11、存储解析执行部110使用的各种数据的存储部12、输出部13、通信部14、及输入部17。控制部11具备解析执行部110及管理部116。再者,解析执行部110具备序列数据读取部111、信息选择部112、数据调整部113、变异鉴定部114、及报告制成部115。在存储部12中,存储基因组合关联信息数据库121、参照序列数据库122、变异数据库123、及解析成效日志151。
品质评价装置1即使是在每解析使用不同的基因组合时,也制成含对应于使用的基因组合的解析结果的报告。利用基因解析系统100的使用者不受基因组合的类别的影响而用共同的解析程序解析组合检查的结果,制成报告变得可能。从而,解除在实施组合检查时,分开使用每个基因组合使用的解析程序,或不得不对解析程序使用的针对每个基因组合进行特殊的设定的烦扰,使用者的便利性提升。
品质评价装置1的使用者从输入部17输入关于基因组合的信息时,信息选择部112以参照基因组合关联信息数据库121,对应于输入的关于基因组合的信息,解析程序执行解析对象的基因的解析的方式,控制解析程序的算法。
其中,关于基因组合的信息是确定在利用测序仪2的测定中使用的基因组合的即可,例如,基因组合名、成为基因组合的解析对象的基因名、及基因组合ID等。
信息选择部112变更用于基于关于从输入部17输入的基因组合的信息而进行对应于关于该基因组合的信息所显示的作为基因组合的解析对象的基因的解析的解析算法。
信息选择部112对于数据调整部113、变异鉴定部114、及报告制成部115的至少任何1个输出基于关于基因组合的信息的指示。通过采用此构成,品质评价装置1可将读长序列信息的解析结果基于输入的关于基因组合的信息而输出。
即,信息选择部112是以取得关于含成为解析对象的多个基因的基因组合的信息,基于取得的关于基因组合的信息而从输出部13输出读长序列信息的解析结果的方式控制的功能块。
在由实施组合检查的使用者解析各种各样的试样中所含的基因时,对应于每试样的解析对象基因组使用各种各样的基因组合。
即,品质评价装置1可从第1试样取得使用用于解析第1解析对象基因组的第1基因组合读取的第1读长序列信息、及从第2试样取得使用用于解析第2解析对象基因组的第2基因组合读取的第2读长序列信息。
品质评价装置1即使是在使用各种各样的基因组合解析各种组合的解析对象基因时,通过具备信息选择部112,也可适合地输出对读长序列信息进行解析的解析结果。
即,不对于使用者设定针对每个解析对象基因在读长序列信息的解析中使用的解析程序或进行解析,仅选择关于基因组合的信息,能适合地输出各读长序列信息的解析结果。
例如,在信息选择部112对于数据调整部113输出基于关于基因组合的信息的指示时,进行由数据调整部113反映关于该基因组合的信息的比对处理等。
信息选择部112对应于指示,关于基因组合的信息,数据调整部113将在读长序列信息的定位中使用的参照序列(野生型的基因组序列及整合了变异序列的参照序列)仅限定于关于对应于关于基因组合的信息的基因的参照序列。
此时,由于由数据调整部113的处理的结果已经反映关于基因组合的信息,信息选择部112也可不对于由数据调整部113的处理的之后进行处理的变异鉴定部114输出基于关于基因组合的信息的指示。
例如,在信息选择部112对于变异鉴定部114输出基于关于基因组合的信息的指示时,进行由变异鉴定部114反映关于该基因组合的信息的处理。
例如,信息选择部112对应于关于基因组合的信息而指示将变异鉴定部114参照的变异数据库123的区域仅限定于关于对应于关于基因组合的信息的基因的变异。由此,成为向由变异鉴定部114的处理的结果反映关于基因组合的信息。
(用于对试样的基因序列进行解析的处理的流程)
其中,对于用于解析试样及品质管理试样的基因序列的处理的流程而使用图4进行说明。图4是显示用于对试样的基因序列进行解析的处理的流程的一例的流程图。
首先,在图4的步骤S31中进行用于解析解析对象的基因的序列的预处理。在预处理中含对试样及品质管理试样中所含的DNA等的基因进行片段化至回收片段化的基因的处理。再者,在从医疗机关210提供的试样是组织及血液等时,也含从组织或血液提取基因(例如,DNA)的处理。
接下来,在步骤S32中,由测序仪2读取结束预处理的试样及品质管理试样中所含的基因的序列。
此步骤S32,具体而言是读取预处理之后回收的成为解析对象的1个或多个DNA片段的序列的工序。读长序列信息含此工序中读取的基因序列。预处理之后回收的成为解析对象的1个或多个DNA片段有时被称呼为“库”。
接下来,对品质管理试样进行测定时,在步骤S33中,品质评价装置1对读取的基因序列进行解析,确定序列中的变异的有无、变异的位置、变异的类别等。通过对读取的基因序列进行解析而鉴定检测的变异。
接下来,在步骤S34中,品质评价装置1生成用于评价组合检查的品质的品质评价指标。品质评价装置1也可基于生成的品质评价指标而评价进行的组合检查的品质。
最后,品质评价装置1制成含关于在步骤S33鉴定的变异的信息等的解析结果,及在步骤S34中生成的品质评价指标等表示组合检查的品质的信息的报告。制成的报告提供于医疗机关210。
(预处理)
接下来,根据图5所示的流程说明图4的步骤S31的预处理的顺序。图5是对用于将试样DNA的碱基序列由测序仪2解析的预处理的顺序的一例进行说明的流程图。
从试样及品质管理试样各自提取DNA而进行序列解析时,首先,从含解析对象的基因的试样、及对应于使用的基因组合的品质管理试样提取DNA(图5的(a)的步骤300)。
此时,对试样来源的DNA、及品质管理试样来源的DNA各自进行步骤S301往后的处理。
通过对于从品质管理试样提取的DNA进行与从试样提取的DNA相同的处理,可生成对于评价在组合检查中的序列解析的品质有用的品质评价指标。
再者,品质管理试样的利用法不限于此。例如,如图5的(b)所示,也可仅提取在步骤300a中品质管理试样的DNA,进行步骤S301往后的处理。
或者,如图5的(c)所示,也可作为品质管理试样准备含变异的品质管理试样和不含变异的品质管理试样,从这些提取DNA(步骤300b)。
通过对含变异的品质管理试样来源的DNA的解析结果和不含变异的品质管理试样来源的DNA的解析结果进行比较,可生成对于评价在组合检查中的序列解析的品质有用的品质评价指标。
或者,如图5的(d)所示,也可从含解析对象的基因的试样、含变异的品质管理试样、及不含变异的品质管理试样提取DNA(步骤300c)。含解析对象的基因的试样也可为血液试样及肿瘤细胞试样的组合。
再者,在步骤S301往后的处理中,也可不是对试样来源的DNA、及品质管理试样来源的DNA个别地进行处理而混合试样来源的DNA、及品质管理试样来源的DNA而进行步骤S301往后的处理。由此,在步骤S301往后的全部的处理中,由于两者的条件变得相同,可生成更正确的品质评价指标。另外,变得没有必要仅为了从品质管理试样调制的DNA片段而使用在测序仪2中使用的流动池的泳道的一部分的必要。由此,可将有限的数的泳道对于含解析对象的基因的试样来源的DNA片段有效地使用。
再者,此时,优选(1)用于使品质管理试样中所含的标准基因和组合检查的解析对象基因适合地片段化而调制库的试剂、及(2)使品质管理试样中所含的标准基因和组合检查的解析对象基因片段化之后,利用含用于适合地捕获各自的DNA片段的RNA诱饵的试剂。
(品质管理试样)
在一实施方式中,品质管理试样是含多个标准基因的组合物。品质管理试样可通过将多个标准基因混合调制。可以将这些标准基因混合而收容在单一的容器的试剂作为品质管理试样提供于使用者。另外,也可作为品质管理试样,将多个标准基因收容在分别的容器而作为试剂盒的形态提供于使用者。品质管理试样可为溶液的状态,也可为固体(粉末)的状态。作为在溶液中提供时的溶剂,可使用水、TE缓冲液等本领域技术人员公知的水性溶剂。
对于品质管理试样而使用图6进行说明。图6是对品质管理试样的一例进行说明的图。
图6的(a)显示在使用基因组合的组合检查中可成为解析对象的基因的列表。此列表之中的1个或多个基因作为成为基因组合的解析对象的基因相关联(参照图7的数据121B)。
图6的(b)显示在组合检查中成为检测对象的变异类别的例。在成为检测对象的变异类别中,显示“SNV(单核苷酸多态性)”、“Insertion(插入)”及“Deletion(缺失)”(在图中,表述为“InDel”)、“CNV(拷贝数多态性)”、及“Fusion(融合)”。
对应于基因组合A的品质管理试样A1在含SNV的标准基因、含Insertion的标准基因、含Deletion的标准基因、含CNV的标准基因、及含Fusion的标准基因之中至少含2个。例如,品质管理试样A1作为标准基因,含相对于野生型而含“SNV”的基因A的部分序列和相对于野生型含“Insertion”的基因B的部分序列。
图6的(d)是使用基因组合A的基因检查的解析结果和品质管理试样的解析结果的输出例。在此例中,作为基因组合A的解析结果,检测到GNA11、AKT1及PIK3CA的SNV、EGFR的长插入(Long insertion)及长缺失(Long deletion)、SLC34A2和ROS1的融合基因、CCDC6和RET的融合基因、MET的基因扩增、MYC-N的基因扩增、及MYC-C的基因扩增。基因组合A的品质管理试样含有含GNA11的SNV的标准基因、含AKT1的SNV的标准基因、含PIK3CA的SNV的标准基因、含EGFR的长插入(Long insertion)的标准基因、含EGFR的长缺失(Long deletion)的标准基因、含SLC34A2和ROS1的融合序列的标准基因、含CCDC6和RET的融合序列的标准基因、含MET的基因扩增的标准基因、含MYC-N的基因扩增的标准基因、及含MYC-C的基因扩增的标准基因。在这里显示品质管理试样含10种标准基因的例,但不限于此。
品质管理试样中所含的第1标准基因和第2标准基因可为不同的DNA分子,也可为这些相连接。当第1标准基因和第2标准基因相连接时,可为第1标准基因的序列和第2标准基因的序列直接连接,也可为在第1标准基因的序列和第2标准基因的序列之间经间隔物序列连接。
所述间隔物序列优选供于基因检查的受试体中所含的可能性低的序列。例如,可为仅腺嘌呤碱基多个(例如,100个)连续的序列。
标准基因可为解析对象的基因组合中所含的基因,也可为解析对象的基因组合中不含的基因。可为成为基因检查的对象的生物种的基因,也可为不同的生物种的基因。例如,当基因检查的对象是人时,可为人以外的动物、植物、细菌等的基因。
标准基因的合成方法不特别限定。例如,可用公知的DNA合成机合成。另外,也可通过将成为模板的生物来源的基因由PCR扩增,纯化而取得。也可通过以在DNA合成机上合成的标准基因作为模板PCR扩增、纯化而取得。
标准基因的长度不特别限定。例如,标准基因的长度可为50个核苷酸以上。当用PCR扩增时,只要是2000个核苷酸以内,就可简便地扩增而适宜。用DNA合成机合成时可合成至数kbp。
品质管理试样中的标准基因的浓度不特别限定。例如,可作为与受试体中的DNA浓度同程度。
品质管理试样中的标准基因可为单链,也可为双链。另外,可为直链状,也可为环状。
以下,对品质管理试样的一调制例进行具体性地说明。
(1)含取代变异的标准基因的调制
将有SEQ ID NO:1的序列的标准基因用公知的DNA合成机合成。将合成的DNA使用含DNA聚合酶、dNTPs及缓冲液的市售的试剂,由PCR扩增。SEQ ID NO:1的序列示于图29。此序列是PIK3CA基因的外显子20的序列,含野生型PIK3CA基因的第3140A向G的取代(A3140G)(对于A3140G,参照美国专利公报第8026053号参照。美国专利公报第8026053号而整合到本说明书)。SEQ ID NO:1的序列是476mer的长度,A3140G的取代变异存在于第204位置。再者,野生型PIK3CA基因的编码序列示于SEQ ID NO:2。
将扩增产物供于琼脂糖凝胶电泳,切出500bp附近的条带部分。将切出的凝胶由定法纯化。纯化后,通过对DNA进行定量,用TE缓冲液稀释为任意的浓度而取得有SEQ ID NO:1的序列的标准基因。
(2)含融合变异的标准基因的调制
将有SEQ ID NO:3的序列的标准基因用公知的DNA合成机合成。将合成的DNA使用含DNA聚合酶、dNTPs及缓冲液的市售的试剂,由PCR扩增。SEQ ID NO:3的序列示于图30。SEQID NO:3的序列是EEML4基因及ALK基因的融合基因的部分序列。在SEQ ID NO:3的序列中,第1~500的序列来源于EML4基因,第501~1000的序列来源于ALK基因(参照图30)。EML4-ALK融合基因登记在GenBank Accession No.AB663645.1。SEQ ID NO:3的序列是GenBankAccession No.AB663645.1的第1158~2157的序列。
与上述(1)同样地取得有SEQ ID NO:3的序列的标准基因。
(3)含标准基因的品质管理试样的调制
将有SEQ ID NO:1的序列的标准DNA分子和有SEQ ID NO:3的序列的标准DNA分子以任意的浓度混合,调制品质管理试样。此品质管理试样与受试体混合,调制序列解析用试样。
(4)解析
使用调整的序列解析用试样而评价使用第二代测序仪(例如,Illumina公司NextSeq500)的基因组合检查的品质。此基因组合以含PIK3CA基因及EML4-ALK融合基因的多个基因作为目标基因。序列解析用试样中的受试体来源的基因组DNA及标准基因供于预处理(片段化、DNA浓缩、使用标签引物的PCR扩增等)及序列解析,取得目标基因的序列信息。序列解析时取得用于品质管理的指标,基于标准DNA分子的序列解析的指标,评价目标基因的解析结果的品质。使用者可基于所述品质评价的结果,判断解析对象基因的解析结果的可靠性。
上述的例是品质管理试样和受试体在(3)中相混合,但也可不使品质管理试样和受试体混合,各自供于序列解析。
另外,重复进行使用相同的基因组合的组合检查时,也可重复使用相同的品质管理试样。如图7的数据121D所示,也可作为对应于各基因组合的品质管理试样准备多个各品质管理试样中所含的标准基因及变异类别不同的多种品质管理试样。
通过将标准基因的组合不同的多个品质管理试样每组合检查、每周、每月分开使用,可通过检测更多样的标准基因的变异而生成用于评价在组合检查中检测变异的处理的品质的品质评价指标。从而,组合检查的品质管理的完整性提升。
例如,作为对应于基因组合A的品质管理试样的品质管理试样A和品质管理试样B示于图8。品质管理试样A中所含的标准基因a1、标准基因a2、标准基因a3在品质管理试样B中,各自变更为标准基因b1、标准基因b2、标准基因b3。
接下来,如图9的(a)所示,将试样(受试体来源的基因组DNA及/或标准基因)片段化为用于用测序仪2读取序列的长度(图5的步骤S301)。试样DNA的片段化,例如,可由超声波处理或由对核酸进行片段化的试剂的处理等的公知的方法进行。得到的DNA片段(核酸片段),例如,可为数十至数百bp的长度。
接下来,如图9的(b)所示,向步骤S301中得到的DNA片段的两端(3′末端及5′末端)赋予对应于使用的测序仪2的种类或测序流程的适配体序列(图5的步骤S302)。但是,本工序是在测序仪2是Illumina公司的测序仪、或者,与Illumina公司的测序仪采用同样的方式的装置时必须的工序,在使用其他种类的测序仪2时,也有可省略的情况。
适配体序列是在此后的工序中为了执行测序而使用的序列,在一实施方式中,在桥式PCR(Bridge PCR)法中,可为用于与固定化在流动池的寡DNA杂交的序列。
在一实施方式中,如图9的(b)的上段所示,也可向DNA片段的两端直接附加适配体序列(例如,图9中的适配体1序列及适配体2序列)。向DNA片段附加适配体序列可使用在本领域中公知的方法。例如,也可使DNA序列平末端化,连接适配体序列。
向DNA片段附加适配体序列可使用在本领域中公知的方法。例如,也可使DNA片段平末端化,连接索引序列之后,再连接适配体序列。
接下来,如图10所示,对于赋予适配体序列的DNA片段杂交生物素化RNA诱饵库(图5的步骤S303)。
生物素化RNA诱饵库由与成为解析对象的基因杂交的生物素化RNA(以下,称为RNA诱饵)构成。RNA诱饵的长度是任意的,例如,也可为了提高特异性而使用120bp左右的长寡RNA诱饵。
再者,在本实施方式中的使用测序仪2的组合检查中,多数的基因(例如,100以上)成为解析对象的基因。
在组合检查中使用的试剂中,含对应于所述多数的基因的各的RNA诱饵的组。如果组合不同,由于检查对象的基因的数及种类不同,在组合检查中使用的试剂中所含的RNA诱饵的组也不同。在以与解析对象的基因不同的基因作为标准基因使用时,有也准备结合于标准基因的诱饵的必要。
进而,如图11所示,回收成为解析对象的DNA片段(图5的步骤S304)。具体而言,如图11的上段所示,对于使生物素化RNA诱饵库杂交的DNA片段,将链霉亲和素和磁性珠相结合的链霉亲和素磁性珠混合。
由此,如图11的中段所示,链霉亲和素磁性珠的链霉亲和素部分和RNA诱饵的生物素部分相结合。进而,如图11的下段所示,将链霉亲和素磁性珠用磁铁集磁的同时,将不与RNA诱饵杂交的片段(即,非成为解析对象的DNA片段)由清洗除去。
由此,可选择-浓缩与RNA诱饵杂交的DNA片段、即,成为解析对象的DNA片段。测序仪2这样通过读取使用多个RNA诱饵选择的DNA片段的核酸序列而取得多个读长序列。
(由测序仪2的读长序列的读取)
接下来,一边适宜参照图13~图15,一边对于图4的步骤S32的顺序根据图12所示的流程进行说明。图12是对将试样DNA的碱基序列由测序仪2解析的顺序的一例进行说明的流程图。
如图13的左栏至中央栏所示,通过从浓缩的DNA片段解下链霉亲和素磁性珠及RNA诱饵,由PCR法扩增,使预处理结束。
首先,如图13的右栏所示,将扩增的DNA片段的序列应用于流动池(图12的步骤S305)。
接下来,如图14所示,在流动池上,由桥式PCR(Bridge PCR)法扩增成为解析对象的DNA片段(图12的步骤S306)。
即,成为解析对象的DNA片段(例如,图14中的模板DNA)是由上述的预处理在两末端附加2种不同的适配体序列(例如,图14中的适配体1序列及适配体2序列)的状态(图14的“1”),使此DNA片段成为单链,将5’末端侧的适配体1序列固定在流动池上(图14的“2”)。
向流动池上预先固定5’末端侧的适配体2序列,通过DNA片段的3’末端侧的适配体2序列与流动池上的5’末端侧的适配体2序列结合而成为桥渡的状态,形成了桥(图14的“3”)。
在此状态下由DNA聚合酶进行DNA延伸反应(图14的“4”)、使变性,则得到了2条单链DNA片段(图14的“5”)。
通过以此顺序重复这样的桥的形成、DNA延伸反应及变性,可使多数的单链DNA片段局部扩增固定而形成群集(图14的“6”~“10”)。
进而,如图15所示,以形成群集的单链DNA作为模板,由边测序边合成(Sequencing-by-synthesis)读取序列(图12的步骤S307)。
首先,对于固定在流动池上的单链DNA(图15的上段左栏),添加DNA聚合酶、及被荧光标记,3’末端侧被阻断的dNTP(图15的上段中央栏)、再者,添加序列引物(图15的上段右栏)。
序列引物,例如,以与适配体序列的一部分杂交的方式设计即可。换言之,序列引物以对试样DNA来源的DNA片段进行扩增的方式设计即可,在附加索引序列时,以还对索引序列进行扩增的方式设计即可。
添加序列引物后,由DNA聚合酶进行3’末端封闭荧光dNTP的1碱基延伸反应。由于使用3’末端侧被阻断的dNTP,在1碱基1碱基延伸时,聚合酶反应停止。进而,除去DNA聚合酶(图15的中段右栏)、对于延伸1碱基的单链DNA(图15的下段右栏),由激光激发与碱基结合的荧光物质,以该时发生的发光作为照片记录(图15的下段左栏)。
照片是,为了使用荧光显微镜确定4种碱基,一边变更波长滤器,一边针对对应于A、C、G、T各自的每个荧光色进行摄影。拍摄全部的照片之后,从照片数据确定碱基。进而,除去荧光物质及阻断3’末端侧的保护基,进到之后的聚合酶反应。通过以此流程作为1个循环,重复第2个循环、第3个循环,可对全长进行测序。
由于由以上的方法可解析的链长达至150碱基×2,能以比皮量滴定板远小的单位的解析,通过高密度化,可在1次的解析中得到40~200Gb的庞大的序列信息。
(c.基因组合)
在利用测序仪2的读长序列的读取中使用的基因组合,如上所述,是指用于将多个解析对象由一次的运行解析的解析试剂盒,在一实施方式中,可为用于对关于特定的疾病的多个基因序列进行解析的解析试剂盒。
在本说明书中使用时,用语“试剂盒”是指具备内包特定的材料的容器(例如,瓶、板、管、皿等)的包装。优选为,具备用于使用各材料的指示书。在本说明书中在试剂盒的方面使用时,“具备(具备)”是指内包在构成试剂盒的各容器之任一者之中的状态。另外,试剂盒可为将多个不同的组合物捆包为1个的包装、其中,组合物的形态可为上述的形态、溶液形态的情况也可内包在容器中。
试剂盒可将物质A及物质B在相同的容器中混合而具备,也可在分别的容器中具备。在“指示书”中,显示将试剂盒中的各构成应用于治疗及/或诊断的顺序。再者,“指示书”可为书写或印刷在纸或其他介质,或者也可附在磁带、计算机能读取盘或带、CD-ROM的任何电子介质。试剂盒还可具备内包稀释剂、溶剂、清洗液或其他试剂的容器。再者,试剂盒也可共具备对于应用于治疗及/或诊断必要的器具。
在一实施方式中,基因组合也可具备上述的,品质管理试样、使核酸片段化的试剂、连接用试剂、清洗液、PCR试剂(dNTP、DNA聚合酶等)等的试剂、及磁性珠之中一个以上。另外,基因组合也可具备用于向片段化的DNA附加适配体序列的寡核苷酸、用于向片段化的DNA附加索引序列的寡核苷酸、RNA诱饵库等之中一个以上。
特别是,各基因组合具备的索引序列可为所述基因组合固有的用于识别所述基因组合的序列。另外,各基因组合具备的RNA诱饵库可为含对应于所述基因组合的各检查基因的RNA诱饵的所述基因组合固有的库。
(序列数据读取部111、数据调整部113、变异鉴定部114)
接下来,一边对于解析执行部110的序列数据读取部111、数据调整部113、及变异鉴定部114而适宜参照图17~图25,一边根据图16所示的处理的流程进行说明。图16是对由品质评价装置1的解析的流程的一例进行说明的流程图。再者,图16中所示的处理对应于图2所示的步骤S109、及图4所示的步骤S33。
<序列数据读取部111>
首先,在图16的步骤S11中,序列数据读取部111读入从测序仪2提供的读长序列信息。
读长序列信息是表示用测序仪2读取的碱基序列的数据。测序仪2对使用特定的基因组合得到的多数的核酸片段进行测序,读取它们的序列信息,作为读长序列信息提供于品质评价装置1。
在一实施方式中,在读长序列信息中,也可与读取的序列一同,含序列中的各碱基的质量评分。另外,向品质评价装置1输入将从受试体的病变部位采集的FFPE试样供于测序仪2而得到的读长序列信息和将同受试体的血液试样供于测序仪2而得到的读长序列信息这两方。
图17是显示读长序列信息的文件格式的一例的图。在图22中所示的例中,在读长序列信息中,含序列名、序列、及质量评分。序列名也可为赋予测序仪2输出的读长序列信息的序列ID等。序列显示用测序仪2读取的碱基序列。质量评分显示由测序仪2的碱基配比未正确进行的概率。任意的碱基的序列质量评分(Q)由以下的式表示。
Q=-10log10E
在此式中,E表示碱基配比未正确进行的概率的推定值。Q值越高,表示错误的概率越低。Q值越低,其读长序列的无法使用的部分变得越大。
另外,有假阳性的变异配比也增加,结果的精度降低的担忧。再者,“假阳性”是指虽然读长序列无成为判断对象的实际变异,但仍被判断为有变异。
再者,“阳性”是指读长序列有成为判断对象的实际变异,“阴性”是指读长序列无成为对象的变异。例如,质量评分只要是20,错误的概率就是100分之1,从而,是指读取的基因序列中的各碱基的正确性(也称为“碱基响应的精度”)是99%的。
<数据调整部113>
接下来,在图16的步骤S12中,数据调整部113基于序列数据读取部111读入的读长序列信息而执行读长序列信息中所含的各核酸片段的读长序列的比对。
图18的(a)是对由数据调整部113的比对进行说明的图。数据调整部113参照储存到参照序列数据库122的参照序列(参照序列信息),通过将各核酸片段的读长序列对于要作为读长序列信息的比较对象的参照序列而定位,执行比对。在一实施方式中,在参照序列数据库122中,储存多种对应于各解析对象的基因的参照序列。
另外,数据调整部113对于将从受试体的病变部位采集的FFPE试样供于测序仪2而得到的读长序列信息和将同受试体的血液试样供于测序仪2而得到的读长序列信息这两方而执行比对。
图18的(b)是显示数据调整部113的比对结果的格式的一例的图。比对结果的格式只要是可各自确定读长序列、参照序列及定位位置的,就不特别限定,如图18的如(b)一样,也可为含参照序列信息、读长序列名、位置信息、图谱品质及序列的。
参照序列信息是表示在参照序列数据库122中的参照序列名(参照序列ID)、参照序列的序列长等的信息。读长序列名是表示成为比对对象的各读长序列的名称(读长序列ID)的信息。位置信息是表示定位读长序列的最左碱基的参照序列上的位置(Leftmostmapping position)的信息。图谱品质是表示对应于所述读长序列的定位品质的信息。序列是表示对应于各读长序列的碱基序列(例:…GTAAGGCACGTCATA…)的信息。
图19是显示参照序列数据库122的结构例的图。如图19所示,在参照序列数据库122中,存储显示野生型的序列的参照序列(例如,染色体#1~23的基因组序列)和对野生型的序列整合了已知的变位的参照序列。
再者,向参照序列数据库122中的各参照序列赋予表示关于基因组合的信息的元数据。向各参照序列赋予的关于基因组合的信息可为例如,直接的或间接显示各参照序列所对应的解析对象的基因的。
在一实施方式中,信息选择部112,在数据调整部113从参照序列数据库122取得参照序列时,也可以参照输入的关于基因组合的信息和各参照序列的元数据,选择对应于关于所述基因组合的信息的参照序列的方式控制。
例如,在一实施方式中,信息选择部112也可以选择对应于由输入的关于基因组合的信息确定的解析对象的基因的参照序列的方式控制数据调整部113。由此,由于数据调整部113可进行对于仅与使用的基因组合关联的参照序列的定位即可,可使解析的效率提升。
另外,在其他实施方式中,信息选择部112也可不进行上述控制。此时,信息选择部112,如后所述,控制变异鉴定部114或报告制成部115即可。
图20是显示整合到参照序列数据库122中所含的参照序列(不是表示野生型的序列的序列)的已知的变异的例的图。已知的变异是登记在外部的数据库(例如,COSMIC、ClinVar等)的变异,如图20所示,确定染色体位置、基因名及变异。在图25的例中确定了氨基酸的变异,但也可确定核酸的变异。变异类别不特别限定,可为取代、插入、缺失等各种各样的变异,也可为结合了其他染色体的一部分的序列或逆互补序列的变异。
图21是对在图16的步骤S12中的比对的详细的工序的一例进行说明的流程图。在一实施方式中,在图16的步骤S12中的比对由图21中所示的步骤S401~S205执行。
在图21的步骤S401中,数据调整部113在序列数据读取部111取得的读长序列信息中所含的各核酸片段的读长序列之中,选择未进行比对的而与从参照序列数据库122取得的参照序列比较。进而,在步骤S402中,数据调整部113确定与读长序列的一致度满足指定的基准的参照序列上的位置。其中,一致度是指表示取得的读长序列信息和参照序列以何程度一致的值,例如,作为一例举一致的碱基的数或比例等。
在一实施方式中,数据调整部113算出表示读长序列和参照序列的一致度的评分。表示一致度的评分可作为例如2个序列间的相同性的百分率(percentage identity)。数据调整部113,例如,确定读长序列的碱基和参照序列的碱基变得相同的位置的数,求出一致的位置的数,通过一致的位置的数除以与参照序列比较的读长序列的碱基数(比较窗的碱基数)而算出百分率。
图22的(a)是显示评分算出的一例的图。在一实施方式中,在图22的(a)中所示的位置,读长序列R1和参照序列的一致度的评分由于读长序列13碱基中13碱基一致而成为100%,读长序列R2和参照序列的一致度的评分由于读长序列13碱基中12碱基一致而成为92.3%。
另外,数据调整部113在表示读长序列和参照序列的一致度的评分的计算中,在读长序列相对于参照序列含指定的变异(例如,插入-缺失(InDel:Insertion/Deletion))时,也可以附比通常的计算低的评分的方式计算。
在一实施方式中,数据调整部113也可通过对于读长序列相对于参照序列含插入及缺失的至少一方的序列而例如,用如上所述的通常计算算出的评分乘以根据对应于插入-缺失的碱基数的加权系数,修正评分。加权系数W也可以例如,W={1-(1/100)×(对应于插入-缺失的碱基数)}计算。
图22的(b)是显示评分算出的其他例的图。在一实施方式中,在图22的(b)中所示的位置,读长序列R3和参照序列的一致度的评分在通常计算中,由于读长序列17碱基(将表示缺失的*也作为一碱基计算)中15碱基一致而成为88%,修正后的评分成为88%×0.98=86%。另外,读长序列R4和参照序列的一致度的评分在通常计算中,由于读长序列21碱基中17碱基一致而成为81%,修正后的评分成为81%×0.96=77.8%。
数据调整部113通过改变对于各参照序列的读长序列的定位位置而算出一致度的评分,确定与读长序列的一致度满足指定的基准的参照序列上的位置。此时,也可使用动态规划法、FASTA法、BLAST法等的在本领域公知的算法。
回到图21,接下来,数据调整部113在与读长序列的一致度满足指定的基准的参照序列上的位置是单一的位置时(步骤S203中NO),使读长序列与所述位置比对,在与读长序列的一致度满足指定的基准的参照序列上的位置是多个位置时(步骤S403中YES),数据调整部113使读长序列与一致度最高的位置比对(步骤S404)。
进而,在数据调整部113不比对序列数据读取部111取得的读长序列信息中所含的全读长序列时(步骤S405中NO)、回到步骤S401,在比对读长序列信息中所含的全读长序列时(步骤S405中YES),结束步骤S12的处理。
<变异鉴定部114>
接下来,回到图16,在步骤S13中,变异鉴定部114对比对供给从受试体的病变部位采集的试样而得到的读长序列的参照序列的序列(比对序列)和比对供给同受试体的血液试样而得到的读长序列的参照序列的序列(所谓的,比对序列)进行比较。
进而,在图16的步骤S14中,以两比对序列间的相异作为变异提取。例如,只要是对于相同的解析对象的基因的相同的位置的血液受试体来源的比对序列是ATCGA,肿瘤组织来源的比对序列是ATCCA,变异鉴定部114就以G和C的相异作为变异提取。
在一实施方式中,变异鉴定部114基于提取的变异而生成结果文件。图23是显示变异鉴定部114生成的结果文件的格式的一例的图。所述格式,例如,可为基于Variant CallFormat(VCF)的。
如图23所示,在结果文件中,针对每被提取的变异记述位置信息、参照碱基及变异碱基。位置信息表示参照基因组上的位置,例如,含染色体编号和该染色体上的位置。参照碱基表示在上述位置信息所显示的位置的参照碱基(A,T,C,G等)。变异碱基表示参照碱基的变异后的碱基。参照碱基是血液受试体来源的比对序列上的碱基,变异碱基是肿瘤组织来源的比对序列上的碱基。
再者,在图23中,参照碱基是C、变异碱基是G的变异是取代变异的例,参照碱基是C、变异碱基是CTAG的变异是插入(Insertion)变异的例,参照碱基是TCG、变异碱基是T的变异是缺失(Deletion)变异的例。另外,变异碱基是G]17:198982]、]13:123456]T、C[2:321682[、或者,[17:198983[A的变异是结合了其他染色体的一部分的序列或逆互补序列的变异的例。
回到图16,接下来,在步骤S15中,变异鉴定部114检索变异数据库123。进而,在步骤S16中,变异鉴定部114通过参照变异数据库123的变异信息而向结果文件中所含的变异赋予注释,鉴定变异。
图24是显示变异数据库123的结构的一例的图。变异数据库123,例如,基于COSMIC或ClinVar等的外份数据库构建。另外,在一实施方式中,向数据库中的各变异信息赋予关于关于基因组合的信息的元数据。在图24中所示的例中,在数据库中的各变异信息中,作为元数据赋予解析对象的基因的基因ID。
图25是显示变异数据库123中的变异信息的结构的详细例的图。如图25所示,在一实施方式中,在变异数据库123中所含的变异信息中,也可含变异ID、变异的位置信息(例如,“CHROM”、及“POS”)、“REF”、“ALT”、“Annotation”。变异ID是用于识别变异的识别码。
变异的位置信息之中,“CHROM”表示染色体编号,“POS”表示染色体编号上的位置。“REF”表示在野生型(Wild type)中的碱基,“ALT”表示变异后的碱基。“Annotation”表示关于变异的信息。“Annotation”也可为例如,表示称为“EGFR C2573G”、“EGFR L858R”的氨基酸的变异的信息。例如,“EGFR C2573G”是表示蛋白质“EGFR”的2573残基目的半胱氨酸被取代为甘氨酸的变异。
上述的如例一样,变异信息的“Annotation”也可为用于将基于碱基信息的变异变换为基于氨基酸信息的变异的信息。此时,变异鉴定部114能基于参照的“Annotation”的信息,将基于碱基信息的变异变换为基于氨基酸信息的变异。
变异鉴定部114以确定结果文件中所含的变异的信息(例如,变异的位置信息和对应于变异的碱基信息)作为关键字,检索变异数据库123。例如,变异鉴定部114也可以“CHROM”、“POS”、“REF”及“ALT”的信息之任一者作为关键字检索变异数据库123。变异鉴定部114在通过比较血液受试体来源的比对序列和病变部位来源的比对序列提取的变异登记到变异数据库123时,以所述变异作为存在于试样中的变异进行鉴定,向结果文件中所含的所述变异赋予注释(例如,“EGFR L858R”、“BRAF V600E”等)。
(报告制成部115)
报告制成部115基于变异鉴定部114输出的信息、及从信息选择部112提供的关于基因组合的信息而制成报告(对应于图2的步骤S110、及图4的步骤S35)。向制成的报告披露的信息含关于基因组合的信息、及鉴定的关于变异的信息。
报告制成部115是,信息选择部112基于来自信息选择部112的关于基因组合的信息而取舍选择在报告中披露的对象,未选择的信息从报告删除。或者,信息选择部112也可为以选择与对应于经输入部17输入的关于基因组合的信息的基因关联的信息作为在报告中披露的对象,未选择的信息从报告删除的方式控制报告制成部115的构成。
(输出部13)
由报告制成部115制成的报告也可作为读长序列信息的解析结果,从输出部13数据发送到设置在医疗机关210的终端装置5(对应于图2的步骤S111)。或者,也可发送到与品质评价装置1连接的打印机(未图示),由该打印机印刷之后,作为纸介质,从检查机关120送到医疗机关210。
(品质评价指标)
通过对品质评价试样进行测定得到的,品质评价指标,例如,可举出如下所述的。
·指标(i):表示由测序仪2的读长序列信息的读取品质的品质评价指标。
·指标(ii):表示成为多个解析对象的基因中所含的碱基之中用测序仪2读取的碱基的比例的品质评价指标。
·指标(iii):表示读长序列信息的深度的品质评价指标。
·指标(iv):表示读长序列信息的深度的偏差的品质评价指标。
·指标(v):表示全部检测到品质管理试样中所含的各标准基因所具有的变异与否的品质评价指标。
进而,在指标(i)中可含:
指标(i-1):质量评分、及
指标(i-2):群集浓度。
其中,对于上述的品质评价指标而从图26使用图28进行说明。
指标(i-1):质量评分
质量评分是表示由测序仪2读取的基因序列中的各碱基的正确性的指标。
例如,从测序仪2以FASTQ文件输出读长序列信息时,质量评分也含在读长序列信息中(参照图17)。再者,由于已经说明了质量评分的细节,在这里省略其说明。
指标(i-2):群集浓度
测序仪2在流动池上局部扩增固定多数的单链DNA片段而形成群集(参照图14的9)。进而,通过使用荧光显微镜而摄像流动池上的群集组,检测对应于A、C、G、T各自的荧光色(即,荧光波长不同)而读取序列。群集密度是表示进行测序之时的形成在流动池上的,各基因的群集接近何程度的指标。
例如,群集的密度变得过高,群集彼此过度接近或重合了,则由于对流动池进行摄像的图像的对比度即S/N比变低,变得难以取得荧光显微镜的焦点。所以,变得无法正确检测荧光,结果,变得无法正确地读取序列。
指标(ii):表示用测序仪2读取的碱基之中用测序仪2读取的靶区域的碱基的比例的品质评价指标
此指标是表示由测序仪2读取的碱基(还含靶区域以外)之中仅读取了哪个靶区域的碱基的指标,可作为读取的碱基的总数和靶区域的碱基的总数的比算出。
指标(iii):表示读长序列信息的深度的品质评价指标。
此指标是对于成为解析对象的基因中所含的各碱基而基于读取该碱基的读长序列信息的总数的指标,可作为读取的碱基之中深度是指定的值以上的碱基的总数和读取的碱基的总数的比算出。
再者,深度(depth)是指对于相同的碱基而读取的读长序列信息的总数。
在图26中,显示在解析对象的基因的全长是T碱基,读取的区域的碱基是t1碱基时的显示读取的各碱基的深度的坐标图。此坐标图的,横轴是碱基的位置,纵轴是各碱基的深度。在图26中所示的例中,读取的区域的t1碱基之中,深度在指定的值(例如100)以上的区域的总碱基数是(t2+t3)碱基。此时,指标(iii)作为(t2+t3)/t1的值生成。
指标(iv):表示读长序列信息的深度的偏差的品质评价指标。
此指标是表示深度的一致性的指标。在仅读取读取的区域之中的某部分的读长序列信息极端多时,深度的一致性低,经读取的区域比较遍历而存在读长序列信息时,深度的一致性高。深度的一致性不限于此,例如,可使用四分位范围(IQR)进行数值化。显示IQR越高,一致性越低,IQR越低,一致性越高。
指标(v):表示全部检测到品质管理试样中所含的各标准基因所具有的变异与否的品质评价指标。
此指标是表示检测并正确鉴定了品质管理试样中所含的各标准基因所具有的变异的指标。图27中所示的品质管理试样A中所含的各标准基因所具有的变异(参照“Variant”的栏)是已知的变异。以可正确鉴定这些变异的位置、变异类别等与否作为品质评价指标使用。
图28是显示由报告制成部115制成的报告的一例的图。在此例中所示的报告的左上的部分记载了表示受试体ID的“患者ID”、“患者的性别”、“患者的病名”、作为医疗机关210中担当该受试体的医师的名字的“担当医师名”、及表示医疗机关名的“机关名”。
在其下,作为关于基因组合的信息,也含称为“A组合”的基因组合名。再者,使用品质管理试样的处理及从解析结果等得到的品质评价指标“QC指标”也输出到报告。
在此报告中,在称为“检测的基因变异及关联药剂”的栏含关于由变异鉴定部114鉴定的变异的信息和关于药剂的列表。
再者,品质评价指标低于指定的基准时,可向检测的基因变异附“*”。另外,不限于此,可附表示可靠性低的意思的评论。
本发明不限定于上述的各实施方式,在权利要求中所示的范围中各种变更是可能的,对于在将在不同的实施方式中各自公开的技术性手段适宜组合而得到的实施方式也含在本发明的技术性范围内。
【符号的说明】
1:品质评价装置
2:测序仪
3:管理服务器
4:网络
11:控制部
13:输出部
100:基因解析系统
117:品质管理部
121:基因组合关联信息数据库
122:参照序列数据库
124:药剂数据库
125:参照数据库
126:品质评价基准
序列表
<110> Sysmex Corporation
<120> 品质评价方法、装置、程序、记录介质、及品质管理试样
<130> 17-056JP
<160> 3
<170> PatentIn version 3.5
<210> 1
<211> 476
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<400> 1
gtttcaggag atgtgttaca aggcttatct agctattcga cagcatgcca atctcttcat 60
aaatcttttc tcaatgatgc ttggctctgg aatgccagaa ctacaatctt ttgatgacat 120
tgcatacatt cgaaagaccc tagccttaga taaaactgag caagaggctt tggagtattt 180
catgaaacaa atgaatgatg cacgtcatgg tggctggaca acaaaaatgg attggatctt 240
ccacacaatt aaacagcatg cattgaactg aaagataact gagaaaatga aagctcactc 300
tggattccac actgcactgt taataactct cagcaggcaa agaccgattg cataggaatt 360
gcacaatcca tgaacagcat tagatttaca gcaagaacag aaataaaata ctatataatt 420
taaataatgt aaacgcaaac agggtttgat agcacttaaa ctagttcatt tcaaaa 476
<210> 2
<211> 3412
<212> DNA
<213> 智人(Homo sapiens)
<400> 2
atgcctccaa gaccatcatc aggtgaactg tggggcatcc acttgatgcc cccaagaatc 60
ctagtggaat gtttactacc aaatggaatg atagtgactt tagaatgcct ccgtgaggct 120
acattagtaa ctataaagca tgaactattt aaagaagcaa gaaaataccc tctccatcaa 180
cttcttcaag atgaatcttc ttacattttc gtaagtgtta cccaagaagc agaaagggaa 240
gaattttttg atgaaacaag acgactttgt gatcttcggc tttttcaacc atttttaaaa 300
gtaattgaac cagtaggcaa ccgtgaagaa aagatcctca atcgagaaat tggttttgct 360
atcggcatgc cagtgtgcga atttgatatg gttaaagatc ctgaagtaca ggacttccga 420
agaaatattc ttaatgtttg taaagaagct gtggatctta gggatcttaa ttcacctcat 480
agtagagcaa tgtatgtcta tccgccacat gtagaatctt caccagagct gccaaagcac 540
atatataata aattggatag aggccaaata atagtggtga tttgggtaat agtttctcca 600
aataatgaca agcagaagta tactctgaaa atcaaccatg actgtgtgcc agaacaagta 660
attgctgaag caatcaggaa aaaaactaga agtatgttgc tatcatctga acaattaaaa 720
ctctgtgttt tagaatatca gggcaagtac attttaaaag tgtgtggatg tgatgaatac 780
ttcctagaaa aatatcctct gagtcagtat aagtatataa gaagctgtat aatgcttggg 840
aggatgccca atttgaagat gatggctaaa gaaagccttt attctcaact gccaatggac 900
tgttttacaa tgccatctta ttccagacgc atttccacag ctacaccata tatgaatgga 960
gaaacatcta caaaatccct ttgggttata aatagagcac tcagaataaa aattctttgt 1020
gcaacctacg tgaatctaaa tattcgagac attgacaaga tttatgttcg aacaggtatc 1080
taccatggag gagaaccctt atgtgacaat gtgaacactc aaagagtacc ttgttccaat 1140
cccaggtgga atgaatggct gaattatgat atatacattc ctgatcttcc tcgtgctgct 1200
cgactttgcc tttccatttg ctctgttaaa ggccgaaagg gtgctaaaga ggaacactgt 1260
ccattggcat ggggaaatat aaacttgttt gattacacag acactctagt atctggaaaa 1320
atggctttga atctttggcc agtacctcat ggattagaag atttgctgaa ccctattggt 1380
gttactggat caaatccaaa taaagaaact ccatgcttag agttggagtt tgactggttc 1440
agcagtgtgg taaagttccc agatatgtca gtgattgaag agcatgccaa ttggtctgta 1500
tcccgagaag caggatttag ctattcccac gcaggactga gtaacagact agctagagac 1560
aatgaattaa gggaaaatga caaagaacag ctcaaagcaa tttctacacg agatcctctc 1620
tctgaaatca ctgagcagga gaaagatttt ctatggagtc acagacacta ttgtgtaact 1680
atccccgaaa ttctacccaa attgcttctg tctgttaaat ggaattctag agatgaagta 1740
gcccagatgt attgcttggt aaaagattgg cctccaatca aacctgaaca ggctatggaa 1800
cttctggact gtaattaccc agatcctatg gttcgaggtt ttgctgttcg gtgcttggaa 1860
aaatatttaa cagatgacaa actttctcag tatttaattc agctagtaca ggtcctaaaa 1920
tatgaacaat atttggataa cttgcttgtg agatttttac tgaagaaagc attgactaat 1980
caaaggattg ggcacttttt cttttggcat ttaaaatctg agatgcacaa taaaacagtt 2040
agccagaggt ttggcctgct tttggagtcc tattgtcgtg catgtgggat gtatttgaag 2100
cacctgaata ggcaagtcga ggcaatggaa aagctcatta acttaactga cattctcaaa 2160
caggagagga aggatgaaac acaaaaggta cagatgaagt ttttagttga gcaaatgagg 2220
cgaccagatt tcatggatgc cctacagggc ttgctgtctc ctctaaaccc tgctcatcaa 2280
ctaggaaacc tcaggcttaa agagtgtcga attatgtctt ctgcaaaaag gccactgtgg 2340
ttgaattggg agaacccaga catcatgtca gagttactgt ttcagaacaa tgagatcatc 2400
tttaaaaatg gggatgattt acggcaagat atgctaacac ttcaaattat tcgtattatg 2460
gaaaatatct ggcaaaatca aggtcttgat cttcgaatgt taccttatgg ttgtctgtca 2520
atcggtgact gtgtgggact tattgaggtg gtgcgaaatt ctcacactat tatgcaaatt 2580
cagtgcaaag gcggcttgaa aggtgcactg cagttcaaca gccacacact acatcagtgg 2640
ctcaaagaca agaacaaagg agaaatatat gatgcagcca ttgacctgtt tacacgttca 2700
tgtgctggat actgtgtagc taccttcatt ttgggaattg gagatcgtca caatagtaac 2760
atcatggtga aagacgatgg acaactgttt catatagatt ttggacactt tttggatcac 2820
aagaagaaaa aatttggtta taaacgagaa cgtgtgccat ttgttttgac acaggatttc 2880
ttaatagtga ttagtaaagg agcccaagaa tgcacaaaga caagagaatt tgagaggttt 2940
caggagatgt gttacaaggc ttatctagct attcgacagc atgccaatct cttcataaat 3000
cttttctcaa tgatgcttgg ctctggaatg ccagaactac aatcttttga tgacattgca 3060
tacattcgaa agaccctagc cttagataaa actgagcaag aggctttgga gtatttcatg 3120
aaacaaatga atgatgcaca tcatggtggc tggacaacaa aaatggattg gatcttccac 3180
acaattaaac agcatgcatt gaactgaaag ataactgaga aaatgaaagc tcactctgga 3240
ttccacactg cactgttaat aactctcagc aggcaaagac cgattgcata ggaattgcac 3300
aatccatgaa cagcattaga tttacagcaa gaacagaaat aaaatactat ataatttaaa 3360
taatgtaaac gcaaacaggg tttgatagca cttaaactag ttcatttcaa aa 3412
<210> 3
<211> 1000
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<400> 3
gttattgatg actccaatga gcatatgctt actgtatggg actggcagag gaaagcaaaa 60
ggagcagaaa taaagacaac aaatgaagtt gttttggctg tggagtttca cccaacagat 120
gcaaatacca taattacatg cggtaaatct catattttct tctggacctg gagcggcaat 180
tcactaacaa gaaaacaggg aatttttggg aaatatgaaa agccaaaatt tgtgcagtgt 240
ttagcattct tggggaatgg agatgttctt actggagact caggtggagt catgcttata 300
tggagcaaaa ctactgtaga gcccacacct gggaaaggac ctaaaggtgt atatcaaatc 360
agcaaacaaa tcaaagctca tgatggcagt gtgttcacac tttgtcagat gagaaatggg 420
atgttattaa ctggaggagg gaaagacaga aaaataattc tgtgggatca tgatctgaat 480
cctgaaagag aaatagagtt tagtgcttca agggccaggc tgccaggcca tgttgcagct 540
gaccacccac ctgcagtgta ccgccggaag caccaggagc tgcaagccat gcagatggag 600
ctgcagagcc ctgagtacaa gctgagcaag ctccgcacct cgaccatcat gaccgactac 660
aaccccaact actgctttgc tggcaagacc tcctccatca gtgacctgaa ggaggtgccg 720
cggaaaaaca tcaccctcat tcggggtctg ggccatggcg cctttgggga ggtgtatgaa 780
ggccaggtgt ccggaatgcc caacgaccca agccccctgc aagtggctgt gaagacgctg 840
cctgaagtgt gctctgaaca ggacgaactg gatttcctca tggaagccct gatcatcagc 900
aaattcaacc accagaacat tgttcgctgc attggggtga gcctgcaatc cctgccccgg 960
ttcatcctgc tggagctcat ggcgggggga gacctcaagt 1000

Claims (22)

1.在对于从受试体采集的试样中的基因检查含第1类别的基因变异及与上述第1类别不同的第2类别的基因变异的多个类别的基因变异的基因检查中的品质评价方法,其特征在于,包括:
准备含具有上述第1类别的基因变异的第1标准基因和具有上述第2类别的基因变异的第2标准基因的品质管理试样,
取得上述品质管理试样中所含的基因的序列信息,及
输出用于基于取得的上述序列信息而评价上述基因检查的品质的指标。
2.权利要求1所述的品质评价方法,其中
上述第1类别的基因变异是核苷酸的取代、缺失、或者插入、多态性、基因的拷贝数异常或基因融合,
上述第2类别的基因变异是核苷酸的取代、缺失、或者插入、多态性、基因的拷贝数异常或基因融合,与上述第1类别的基因变异不同。
3.权利要求1或2所述的品质评价方法,其特征在于,上述品质管理试样在上述基因检查中对于各成为检测对象的多个变异类别而含具有至少1个基因变异的标准基因。
4.权利要求1~3之任一项所述的品质评价方法,其特征在于,基于上述指标而评价上述基因检查的品质。
5.权利要求1~4之任一项所述的品质评价方法,其特征在于,与上述品质管理试样中所含的基因的序列信息一同,取得试样中所含的基因的序列信息。
6.权利要求1~5之任一项所述的品质评价方法,其特征在于,上述品质管理试样还含无变异的基因。
7.权利要求1~6之任一项所述的品质评价方法,其特征在于,基于上述指标满足指定的基准与否而评价上述基因检查的品质。
8.权利要求7所述的品质评价方法,其特征在于,上述指定的基准在上述基因检查中使用的第1基因组合和与上述第1基因组合不同的第2基因组合上不同。
9.权利要求1~8之任一项所述的品质评价方法,其特征在于,将上述品质管理试样中所含的基因的序列信息由测序仪取得,
上述指标是利用上述测序仪的上述序列信息的读取品质。
10.权利要求9所述的品质评价方法,其特征在于,上述指标表示由上述测序仪读取的基因序列中的各碱基的正确性。
11.权利要求9所述的品质评价方法,其特征在于,上述测序仪在流动池上扩增基因而形成群集,
上述指标表示上述流动池中的各基因的群集的接近程度。
12.权利要求1~11之任一项所述的品质评价方法,其特征在于,将上述品质管理试样中所含的基因的序列信息由测序仪取得,
上述指标表示用上述测序仪读取的碱基之中靶区域的碱基的比例。
13.权利要求1~12之任一项所述的品质评价方法,其特征在于,上述指标表示取得的上述品质管理试样中所含的基因的序列信息的深度。
14.权利要求1~13之任一项所述的品质评价方法,其特征在于,上述指标表示取得的上述品质管理试样中所含的基因的序列信息的深度的偏差。
15.权利要求1~14之任一项所述的品质评价方法,其特征在于,准备基因不同的多个品质管理试样,选择从上述多个品质管理试样调制的品质管理试样。
16.权利要求1~15之任一项所述的品质评价方法,其特征在于,作为在上述基因检查中不成为解析对象的基因,调制含至少1种有上述变异类别的变异的基因的品质管理试样。
17.权利要求1~16之任一项所述的品质评价方法,其特征在于,向与多个检查设施连接的管理服务器发送上述指标。
18.权利要求17所述的品质评价方法,其特征在于,从上述管理服务器接收品质的评价结果。
19.评价在对于从受试体采集的试样中的基因检查至少第1类别的基因变异和与上述第1类别不同的第2类别的基因变异的基因检查中的品质的品质评价装置,其特征在于,具备:
对含具有上述第1类别的基因变异的第1标准基因和具有上述第2类别的基因变异的第2标准基因的品质管理试样中所含的基因的序列信息进行解析的数据调整部,及
生成用于基于上述序列信息而评价上述基因检查的品质的指标的品质管理部。
20.在对于从受试体采集的试样中的基因检查至少第1类别的基因变异和与上述第1类别不同的第2类别的基因变异的基因检查中的程序,其用于使计算机执行下列步骤:
取得含具有上述第1类别的基因变异的第1标准基因和具有上述第2类别的基因变异的第2标准基因的品质管理试样中所含的基因的序列信息的步骤,及
生成用于基于取得的上述序列信息而评价上述基因检查的品质的指标的步骤。
21.计算机能读取的记录介质,其记录权利要求20所述的程序。
22.在对于从受试体采集的试样中的基因检查至少第1类别的基因变异和与上述第1类别不同的第2类别的基因变异的基因检查中的品质管理试样,其特征在于,含:
具有上述第1类别的基因变异的第1标准基因、和
具有上述第2类别的基因变异的第2标准基因。
CN201811245802.3A 2017-10-27 2018-10-25 品质评价方法、装置、程序、记录介质、及品质管理试样 Pending CN109722470A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-208652 2017-10-27
JP2017208652A JP7067896B2 (ja) 2017-10-27 2017-10-27 品質評価方法、品質評価装置、プログラム、および記録媒体

Publications (1)

Publication Number Publication Date
CN109722470A true CN109722470A (zh) 2019-05-07

Family

ID=64051401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811245802.3A Pending CN109722470A (zh) 2017-10-27 2018-10-25 品质评价方法、装置、程序、记录介质、及品质管理试样

Country Status (4)

Country Link
US (1) US20190127807A1 (zh)
EP (2) EP4095262A3 (zh)
JP (2) JP7067896B2 (zh)
CN (1) CN109722470A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113811949A (zh) * 2019-05-13 2021-12-17 富士通株式会社 评价方法、评价程序和评价装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7067896B2 (ja) * 2017-10-27 2022-05-16 シスメックス株式会社 品質評価方法、品質評価装置、プログラム、および記録媒体
JP6920251B2 (ja) * 2018-06-29 2021-08-18 シスメックス株式会社 解析方法、情報処理装置、プログラム
JPWO2021145140A1 (zh) * 2020-01-16 2021-07-22
CN114540488B (zh) * 2020-11-26 2024-04-30 福建和瑞基因科技有限公司 一种用于高通量靶向测序检测肿瘤突变负荷的基因组合、检测装置、检测试剂盒及应用
WO2023099209A1 (en) * 2021-12-03 2023-06-08 Koninklijke Philips N.V. Sessing quality of genomic regions studied for inclusion in standardized clinical formats
CN114395619B (zh) * 2021-12-29 2024-04-30 福建和瑞基因科技有限公司 一种高通量测序方法以及内参质控品
CN117594130B (zh) * 2024-01-19 2024-07-16 北京普译生物科技有限公司 纳米孔测序信号评价方法、装置、电子设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001092558A2 (en) * 2000-05-31 2001-12-06 Regents Of The University Of California End sequence profiling
US20070217949A1 (en) * 2006-03-14 2007-09-20 Tomonori Mimura Quality control system
JP2012248217A (ja) * 2012-08-22 2012-12-13 Sysmex Corp 管理装置、管理システム、および検体分析装置の精度管理方法
CN104968806A (zh) * 2013-02-01 2015-10-07 Sk电信有限公司 提供与基于基因序列的个人标记有关的信息的方法和装置
US20160319347A1 (en) * 2013-11-08 2016-11-03 Health Research Inc. Systems and methods for detection of genomic variants
CN106480205A (zh) * 2016-11-11 2017-03-08 北京吉因加科技有限公司 用于同时检测多种突变类型的序列组合和探针
JP2017510244A (ja) * 2013-12-11 2017-04-13 アキュラジェン, インコーポレイテッド 稀な配列変異体を検出するための組成物および方法
CN106636404A (zh) * 2016-12-23 2017-05-10 上海思路迪生物医学科技有限公司 基于高通量测序检测人egfr基因变异的质控方法及试剂盒

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020090622A1 (en) * 2000-08-23 2002-07-11 Monisola Adeokun Chemical compounds
US20020120408A1 (en) 2000-09-06 2002-08-29 Kreiswirth Barry N. System and method for tracking and controlling infections
US6818762B2 (en) 2001-05-25 2004-11-16 Maine Molecular Quality Controls, Inc. Compositions and methods relating to nucleic acid reference standards
DK1730303T3 (da) 2004-03-02 2013-11-04 Univ Johns Hopkins Mutationer i pik3ca-genet ved humane cancerformer
WO2012027446A2 (en) * 2010-08-24 2012-03-01 Mayo Foundation For Medical Education And Research Nucleic acid sequence analysis
US20140129201A1 (en) 2012-11-07 2014-05-08 Good Start Genetics, Inc. Validation of genetic tests
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
DK3083994T3 (da) 2013-12-20 2021-09-13 Illumina Inc Bevarelse af genomisk konnektivitetsinformation i fragmenterede genomiske DNA-prøver
CN106462670B (zh) 2014-05-12 2020-04-10 豪夫迈·罗氏有限公司 超深度测序中的罕见变体召集
WO2016193084A1 (en) 2015-05-29 2016-12-08 Altergon Sa Methods, supports and kits for enhanced cgh analysis
JP7067896B2 (ja) * 2017-10-27 2022-05-16 シスメックス株式会社 品質評価方法、品質評価装置、プログラム、および記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001092558A2 (en) * 2000-05-31 2001-12-06 Regents Of The University Of California End sequence profiling
US20070217949A1 (en) * 2006-03-14 2007-09-20 Tomonori Mimura Quality control system
JP2012248217A (ja) * 2012-08-22 2012-12-13 Sysmex Corp 管理装置、管理システム、および検体分析装置の精度管理方法
CN104968806A (zh) * 2013-02-01 2015-10-07 Sk电信有限公司 提供与基于基因序列的个人标记有关的信息的方法和装置
US20160319347A1 (en) * 2013-11-08 2016-11-03 Health Research Inc. Systems and methods for detection of genomic variants
JP2017510244A (ja) * 2013-12-11 2017-04-13 アキュラジェン, インコーポレイテッド 稀な配列変異体を検出するための組成物および方法
CN106480205A (zh) * 2016-11-11 2017-03-08 北京吉因加科技有限公司 用于同时检测多种突变类型的序列组合和探针
CN106636404A (zh) * 2016-12-23 2017-05-10 上海思路迪生物医学科技有限公司 基于高通量测序检测人egfr基因变异的质控方法及试剂盒

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AMY S GARGIS等: "Assuring the quality of next-generation sequencing in clinical laboratory practice" *
ANDREW G. HADD等: "Targeted, high-depth, next-generation sequencing of cancer genes in formalin-fixed, paraffin-embedded and fine-needle aspiration tumor specimens" *
JIHUN KIM等: "Good Laboratory Standards for Clinical Next-Generation Sequencing Cancer Panel Tests" *
曲守方等: "EML4-ALK融合基因变体1和变体3质控品的建立" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113811949A (zh) * 2019-05-13 2021-12-17 富士通株式会社 评价方法、评价程序和评价装置

Also Published As

Publication number Publication date
EP4095262A3 (en) 2023-03-15
EP4095262A2 (en) 2022-11-30
US20190127807A1 (en) 2019-05-02
JP2019080501A (ja) 2019-05-30
JP7067896B2 (ja) 2022-05-16
JP2022093592A (ja) 2022-06-23
EP3476946A1 (en) 2019-05-01

Similar Documents

Publication Publication Date Title
CN109722470A (zh) 品质评价方法、装置、程序、记录介质、及品质管理试样
US20230295690A1 (en) Haplotype resolved genome sequencing
US12087401B2 (en) Using cell-free DNA fragment size to detect tumor-associated variant
KR102356323B1 (ko) 서열 변이체 콜에 대한 검증방법 및 시스템
CN107849612B (zh) 比对和变体测序分析管线
US20200350035A1 (en) Gene analysis method, gene analysis apparatus, management server, gene analysis system, program, and storage medium
JP2019083781A (ja) 配列解析方法、配列解析装置、参照配列の生成方法、参照配列生成装置、プログラム、および記録媒体
CN110178184A (zh) 致癌剪接变体确定
JP2019083011A5 (zh)
US20200082911A1 (en) Analysis method, information processing apparatus, gene analysis system and non-transitory storage medium
JP2023139180A (ja) 遺伝子解析方法および遺伝子解析装置
WO2020194057A1 (en) Biomarkers for disease detection
WO2023091316A1 (en) Methods and systems for accurate genotyping of repeat polymorphisms
WO2017009718A1 (en) Automatic processing selection based on tagged genomic sequences
JP7399238B2 (ja) 解析方法、情報処理装置、レポート提供方法
JP6891151B2 (ja) 解析方法、情報処理装置、遺伝子解析システム、プログラム、記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190507

WD01 Invention patent application deemed withdrawn after publication