JPWO2019009431A1 - Highly accurate method for identifying mutations in tumor cells - Google Patents

Highly accurate method for identifying mutations in tumor cells Download PDF

Info

Publication number
JPWO2019009431A1
JPWO2019009431A1 JP2019527998A JP2019527998A JPWO2019009431A1 JP WO2019009431 A1 JPWO2019009431 A1 JP WO2019009431A1 JP 2019527998 A JP2019527998 A JP 2019527998A JP 2019527998 A JP2019527998 A JP 2019527998A JP WO2019009431 A1 JPWO2019009431 A1 JP WO2019009431A1
Authority
JP
Japan
Prior art keywords
mutation
mutations
tumor
dna
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019527998A
Other languages
Japanese (ja)
Inventor
菊也 加藤
菊也 加藤
洋児 久木田
洋児 久木田
和宏 片山
和宏 片山
和良 大川
和良 大川
良司 高田
良司 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DNA Chip Research Inc
Osaka Prefectural Hospital Organization
Original Assignee
DNA Chip Research Inc
Osaka Prefectural Hospital Organization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DNA Chip Research Inc, Osaka Prefectural Hospital Organization filed Critical DNA Chip Research Inc
Publication of JPWO2019009431A1 publication Critical patent/JPWO2019009431A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】 被験者におけるDNAの突然変異を同定することによって腫瘍細胞で生じた突然変異を高精度に識別する方法を提供すること。【解決手段】 被験者から検出された突然変異のうち、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とを高精度に識別する方法であって、被験者のDNAにおける突然変異を同定する工程と、前記同定した突然変異を癌特異的突然変異が集積されたデータベースに照合する工程であって、前記同定した突然変異が、前記腫瘍に特異的な突然変異として前記データベースに所定の閾値症例数またはそれ以上集積されている場合に、前記腫瘍細胞由来の突然変異であると判定する、前記照合する工程とを有する、方法。【選択図】 なしPROBLEM TO BE SOLVED: To provide a method for identifying a mutation caused in a tumor cell with high accuracy by identifying a DNA mutation in a subject. A method for highly accurately discriminating a mutation occurring in a tumor cell and a mutation occurring in a normal cell among mutations detected in a subject, the mutation being identified in the DNA of the subject. And a step of collating the identified mutation with a database in which cancer-specific mutations are accumulated, wherein the identified mutation is a predetermined threshold case in the database as a mutation specific to the tumor. If the number or more is accumulated, it is determined that the mutation is derived from the tumor cell, and the collating step is included. [Selection diagram] None

Description

本発明は、被験者から検出された突然変異のうち、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とを高精度に識別する方法、特に、被験者におけるDNAの突然変異を同定することによって腫瘍細胞で生じた突然変異を高精度に識別する方法に関する。   The present invention provides a method for highly accurately discriminating a mutation generated in a tumor cell from a mutation generated in a normal cell among mutations detected in a subject, and particularly to identifying a DNA mutation in a subject. The present invention relates to a method for identifying a mutation caused in a tumor cell with high accuracy.

循環腫瘍DNA(ctDNA)は、アポトーシスや免疫によって破壊された癌細胞のゲノムDNAが血中に漏出されたセルフリーDNA(cfDNA)であり、腫瘍特異的突然変異の情報と組み合わせることによって癌のバイオマーカーとしての利用や、薬剤耐性の早期検出およびモニタリングなどの幅広い用途が期待されている。また、ctDNAは被験者の血液から取得することができるため、非侵襲的な診断が可能となる。そのため、ctDNAの癌への診断適用が望まれているものの、1ミリリットルの血液中に平均して170塩基対に断片化された1から数千のゲノム由来のcfDNAが含まれるため、正常細胞由来の膨大な量のDNAの中から癌細胞で生じた突然変異を検出し定量することは極めて困難である。   Circulating tumor DNA (ctDNA) is cell-free DNA (cfDNA) in which genomic DNA of a cancer cell destroyed by apoptosis or immunity is leaked into the blood. It is expected to have a wide range of uses such as use as a marker and early detection and monitoring of drug resistance. Further, since ctDNA can be obtained from the blood of the subject, non-invasive diagnosis is possible. Therefore, although it is desired to apply ctDNA to cancer for diagnosis, since 1 ml of blood contains cfDNA derived from 1 to several thousand of fragments fragmented to 170 base pairs on average, it is derived from normal cells. It is extremely difficult to detect and quantify mutations that have occurred in cancer cells from the enormous amount of DNA.

このような突然変異を検出するための技術としてデジタルPCRや次世代シークエンシング(NGS)が用いられている。しかし、癌細胞で生じた突然変異はわずかな量しか血中に存在しないため、NGSによるシーケンシングエラー率は大きな問題となる。そこで本発明者らはこの問題を解決するため、シーケンシング配列に分子バーコード配列を導入している(特許文献1)。この分子バーコード技術によれば、多くの場合10から15塩基のランダムな配列でDNA断片をラベルし、個々の分子由来のリードを見分け、各分子由来のリードのグループ化を可能にする。つまり、リードのコンセンサスを作ることにより、高品質のDNAシーケンシングを提供し、配列決定した分子を計数することができるようになる。   Digital PCR and next-generation sequencing (NGS) are used as techniques for detecting such mutations. However, since the mutations generated in cancer cells are present in the blood in a small amount, the sequencing error rate due to NGS becomes a serious problem. Therefore, the present inventors have introduced a molecular barcode sequence into the sequencing sequence in order to solve this problem (Patent Document 1). According to this molecular barcode technology, DNA fragments are often labeled with a random sequence of 10 to 15 bases, which makes it possible to distinguish the leads from individual molecules and to group the leads from each molecule. Thus, creating a consensus of reads will provide high quality DNA sequencing and allow the counting of sequenced molecules.

特許第6125731号Patent No. 6125731

Schmitt MW, Kennedy SR, Salk JJ, Fox EJ, Hiatt JB, Loeb LA. Detection of ultra-rare mutations by next-generation sequencing. Proc Natl Acad Sci USA 2012;109:14508-13.Schmitt MW, Kennedy SR, Salk JJ, Fox EJ, Hiatt JB, Loeb LA. Detection of ultra-rare mutations by next-generation sequencing. Proc Natl Acad Sci USA 2012; 109: 14508-13. Newman AM, Lovejoy AF, Klass DM, Kurtz DM, Chabon JJ, Scherer F, et al. Integrated digital error suppression for improved detection of circulating tumor DNA. Nat Biotechnol 2016;34:547-55.Newman AM, Lovejoy AF, Klass DM, Kurtz DM, Chabon JJ, Scherer F, et al. Integrated digital error suppression for improved detection of circulating tumor DNA. Nat Biotechnol 2016; 34: 547-55.

しかしながら、このような分子バーコード技術によって配列を正確に読み取ることができたとしても、サンプル調製の際のDNA損傷によるゲノムDNA中の塩基置換のような、PCR前に生じた塩基の相違については検出することができない。また正常組織あるいは血中セルフリーDNAで低頻度に存在する体細胞突然変異についても、正常細胞由来のDNAなのか、ごく少数存在する腫瘍細胞由来のDNAなのかを区別することを困難とさせている。   However, even if the sequence can be accurately read by such a molecular barcode technique, the difference in the bases generated before the PCR such as the base substitution in the genomic DNA due to the DNA damage during the sample preparation is Cannot be detected. Also, with regard to somatic mutations that occur in low frequencies in normal tissues or in cell-free DNA in blood, it is difficult to distinguish between normal cell-derived DNA and tumor cell-derived DNA that is present in a very small number. There is.

二本鎖シーケンシング技術は、DNAの二本の鎖に存在する変異(突然変異)と、一本の鎖にのみ存在する変異(DNA損傷)とを区別することができる(非特許文献1)。そのため、二重鎖シーケンシング技術を用いた癌患者由来cfDNAの包括的な分析は変異の原因を解明する上で非常に有益であるものの、二重鎖シーケンシング技術には膨大な量のDNAを必要とするため、診断用途としては適していない(非特許文献2)。そこで、被験者のcfDNAの突然変異について、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とを区別するために、診断用途で用いることのできるより高精度な方法の開発が望まれている。   The double-stranded sequencing technology can distinguish a mutation (mutation) existing in two strands of DNA from a mutation (DNA damage) existing only in one strand (Non-Patent Document 1). .. Therefore, although comprehensive analysis of cancer patient-derived cfDNA using double-stranded sequencing technology is very useful for elucidating the cause of mutation, a large amount of DNA is required for double-stranded sequencing technology. Since it is necessary, it is not suitable for diagnostic use (Non-Patent Document 2). Therefore, it is desired to develop a more accurate method that can be used for diagnostic purposes in order to discriminate between mutations occurring in tumor cells and mutations occurring in normal cells in the mutation of cfDNA of a subject. There is.

本発明は、このような状況を鑑みてなされたものであり、被験者におけるDNAの突然変異を同定することによって腫瘍細胞で生じた突然変異を高精度に識別する方法を提供することを目的とする。   The present invention has been made in view of such circumstances, and an object of the present invention is to provide a method for identifying a mutation caused in a tumor cell with high accuracy by identifying a DNA mutation in a subject. ..

本発明者らは、このような課題を解決するために、癌体細胞突然変異カタログ(COSMIC)に集積された突然変異の特徴に着目した結果、健常人被験者で観察された突然変異の多くが、COSMICに登録されていないか、または数エントリーしか登録されていないことがわかった。そこで鋭意研究を重ねた結果、癌組織における体細胞突然変異である可能性の低い変異体を除外できるフィルターを開発し、このフィルターを用いて被験者のDNAにおける突然変異を解析することにより、腫瘍細胞で生じた突然変異なのか正常細胞で生じた突然変異なのかを見分けることができることを見出した。   In order to solve such a problem, the present inventors have focused on the characteristics of mutations accumulated in the cancer somatic mutation catalog (COSMIC), and as a result, found that most of the mutations observed in healthy subjects were , COSMIC, or only a few entries were found. Therefore, as a result of intensive research, we developed a filter that can eliminate mutants that are unlikely to be somatic mutations in cancer tissues, and analyze mutations in the DNA of test subjects using this filter to detect tumor cells. It was found that it was possible to discriminate between the mutations that occurred in (1) and the mutations that occurred in normal cells.

具体的には、本発明の第一の主要な観点によれば、被験者から検出された突然変異のうち、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とを高精度に識別する方法であって、被験者のDNAにおける突然変異を同定する工程と、前記同定した突然変異を癌特異的突然変異が集積されたデータベースに照合する工程であって、前記同定した突然変異が、前記腫瘍に特異的な突然変異として前記データベースに所定の閾値症例数またはそれ以上集積されている場合に、前記腫瘍細胞由来の突然変異であると判定する、前記照合する工程とを有する、方法が提供される。   Specifically, according to the first main aspect of the present invention, among mutations detected from a subject, a mutation occurring in a tumor cell and a mutation occurring in a normal cell are distinguished with high accuracy. A method of identifying a mutation in a subject's DNA, and matching the identified mutation to a database of accumulated cancer-specific mutations, wherein the identified mutation is the tumor And a predetermined threshold number of cases or more are accumulated in the database as a mutation specific to the tumor cell, the mutation is determined to be derived from the tumor cell, and the matching step is provided. It

このような構成によれば、被験者のDNAにおける突然変異を同定するだけで、その突然変異が腫瘍細胞で生じた突然変異なのか、正常細胞で生じた突然変異なのかを見分ける方法を提供することができる。また、このような構成によれば、非侵襲的かつ簡便に被験者における突然変異の存在を同定することを介して、被験者における腫瘍細胞の存在の有無を確認することができ、これを通して、被験者に適した治療法を選択するための材料として資することができる。   According to such an arrangement, it is intended to provide a method for identifying a mutation in a tumor cell or a normal cell by simply identifying a mutation in a subject's DNA. You can Further, according to such a configuration, the presence or absence of tumor cells in the subject can be confirmed by non-invasively and conveniently identifying the presence of the mutation in the subject, and through this, It can serve as a material for selecting a suitable treatment method.

また、本発明の一実施形態によれば、上述の本発明の第一の主要な観点の方法において、前記DNAを血液由来のセルフリーDNAとすることができる。   Moreover, according to one embodiment of the present invention, in the method according to the first main aspect of the present invention, the DNA can be cell-free DNA derived from blood.

さらに、本発明の他の一実施形態によれば、上述の本発明の第一の主要な観点の方法において、前記同定した突然変異が、体細胞突然変異として前記データベースに2例またはそれ以上集積されていることができる。   Furthermore, according to another embodiment of the present invention, in the method according to the first main aspect of the present invention described above, the identified mutation is accumulated in the database as a somatic mutation in two or more cases. Can have been.

また、本発明の別の一実施形態によれば、上述の本発明の第一の主要な観点の方法において、前記腫瘍を膵臓癌とすることができる。この場合、前記突然変異がTP53遺伝子の変異であり、体細胞突然変異として前記データベースに10例またはそれ以上集積されていることが好ましい。またこの場合、前記正常細胞は膵管内乳頭粘液性腫瘍細胞を含むこともできる。   Further, according to another embodiment of the present invention, in the method of the first main aspect of the present invention described above, the tumor can be pancreatic cancer. In this case, it is preferable that the mutation is a mutation of the TP53 gene, and 10 or more cases of somatic mutation are accumulated in the database. In this case, the normal cells can also include intraductal papillary mucinous tumor cells of the pancreas.

また、本発明のさらに別の一実施形態によれば、上述の本発明の第一の主要な観点の方法において、前記血液を血漿成分とすることもできる。   Further, according to still another embodiment of the present invention, in the method of the first main aspect of the present invention described above, the blood can be used as a plasma component.

本発明の第二の主要な観点によれば、上述の第一の主要な観点に係る方法を実行するシステムが提供され、具体的には、被験者から検出された突然変異のうち、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とを高精度に識別する突然変異識別システムであって、被験者のDNAにおける突然変異を同定する手段と、前記同定した突然変異を癌特異的突然変異が集積されたデータベースに照合する手段であって、前記同定した突然変異が、前記腫瘍に特異的な突然変異として前記データベースに所定の閾値症例数またはそれ以上集積されている場合に、前記腫瘍細胞由来の突然変異であると判定する、前記照合する手段とを有する、システムが提供される。   According to a second main aspect of the present invention, there is provided a system for carrying out the method according to the above-mentioned first main aspect, and in particular, among mutations detected in a subject, A mutation discriminating system for highly accurately discriminating a generated mutation from a mutation generated in a normal cell, comprising means for identifying a mutation in DNA of a subject, and the identified mutation as a cancer-specific mutation Is a means for collating with an accumulated database, wherein the identified mutation is accumulated in the database as a mutation specific to the tumor in a predetermined threshold number of cases or more, the tumor cell A system is provided which comprises said matching means for determining a mutation of origin.

なお、上記した以外の本発明の特徴及び顕著な作用・効果は、次の発明の実施形態の項及び図面を参照することで、当業者にとって明確となる。   In addition, the features of the present invention other than those described above, and the remarkable operation / effect will be clear to those skilled in the art by referring to the following embodiment section and drawings.

図1は、本願発明の一実施形態において、バーコードシーケンスのためのバーコードタグの結合を示す反応スキームである。FIG. 1 is a reaction scheme showing the attachment of barcode tags for barcode sequences in one embodiment of the present invention. 図2は、本発明の一実施形態において、サンプルデータにおけるフィルター処理された変異体数とフィルター処理によって除外された変異体数の分布を示すスキャッタープロットである。FIG. 2 is a scatter plot showing the distribution of the number of filtered variants and the number of variants excluded by the filtering in the sample data according to an embodiment of the present invention.

以下に、本願発明に係る一実施形態および実施例を、図面を参照して説明する。
上記のとおり、本願発明は、被験者から検出された突然変異のうち、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とを高精度に識別する方法であって、被験者のDNAにおける突然変異を同定する工程と、前記同定した突然変異を癌特異的突然変異が集積されたデータベースに照合する工程であって、前記同定した突然変異が、前記腫瘍に特異的な突然変異として前記データベースに所定の閾値症例数またはそれ以上集積されている場合に、前記腫瘍細胞由来の突然変異であると判定する、前記照合する工程とを有するものである。
An embodiment and an example according to the present invention will be described below with reference to the drawings.
As described above, the present invention is a method for highly accurately discriminating a mutation occurring in a tumor cell from a mutation occurring in a normal cell among mutations detected in a subject, which is a sudden mutation in a DNA of a subject. A step of identifying a mutation and a step of matching the identified mutation with a database in which cancer-specific mutations are accumulated, wherein the identified mutation is stored in the database as a mutation specific to the tumor. When the number of cases of a predetermined threshold value or more is accumulated, it is determined that the mutation is derived from the tumor cell, and the collating step is included.

本願明細書において、「腫瘍細胞で生じた突然変異」とは、被験者の血液中に浮遊している腫瘍由来の遊離DNAである循環腫瘍DNA(ctDNA)における突然変異を指す。特定の癌に特有の突然変異を有するctDNAに基づくリキッドバイオプシーを用いることにより、画像診断などの方法で癌と診断されるよりも前に癌を発見することができ、また治療の奏功の判断が可能となる。なお、一般的に、血液中に存在するDNAのうち、ctDNAは、正常細胞DNAに比べて非常に微量でしか存在しないことが知られている。   As used herein, the term “tumor cell-generated mutation” refers to a mutation in circulating tumor DNA (ctDNA), which is free DNA derived from a tumor floating in the blood of a subject. By using a liquid biopsy based on ctDNA having a mutation unique to a particular cancer, it is possible to detect the cancer before it is diagnosed by a method such as imaging, and it is possible to judge the success of the treatment. It will be possible. In addition, it is generally known that, among DNAs existing in blood, ctDNA is present in a very small amount as compared with normal cell DNA.

本願明細書において、「正常細胞で生じた突然変異」とは、被験者の正常細胞の死滅によって細胞から血漿中に放出されたセルフリーDNA(cfDNA)における突然変異を指す。   As used herein, the term “mutation produced in normal cells” refers to a mutation in cell-free DNA (cfDNA) released from cells into plasma by the death of normal cells of a subject.

本願発明の一実施形態において、「癌特異的突然変異が集積されたデータベース」とは、種々の癌組織に存在する固有の突然変異を塩基単位で捉えた癌組織由来の塩基配列から得られるものであり、1塩基多型、コピー数変異、構造多型などの癌に関連する体細胞変異の情報を網羅的に集積したデータベースであればよい。例えば、「癌特異的突然変異が集積されたデータベース」としては、Catalogue Of Somatic Mutations In Cancer (COSMIC)、The Cancer Genome Atlas(TCGA)、International Cancer Genome Consortium(ICGC)等を用いることができるが、これに限られるものではない。   In one embodiment of the present invention, the “database in which cancer-specific mutations are accumulated” is obtained from a cancer tissue-derived base sequence in which unique mutations existing in various cancer tissues are captured in base units. Therefore, a database that comprehensively accumulates information on somatic mutations related to cancer such as single nucleotide polymorphism, copy number mutation, structural polymorphism, etc. may be used. For example, as the “database in which cancer-specific mutations are accumulated”, Catalog Of Somatic Mutations In Cancer (COSMIC), The Cancer Genome Atlas (TCGA), International Cancer Genome Consortium (ICGC) and the like can be used, It is not limited to this.

また、本願明細書において、「所定の閾値症例数」とは、同定した突然変異が腫瘍細胞由来の突然変異なのか正常細胞由来の突然変異なのかを上記のデータベースを用いて判定する際に、その判定の閾値となる症例数を指す。例えば、閾値症例数を2例、3例、4例、5例、6例、7例、8例、9例、10例またはそれ以上などのように、突然変異が生じる癌または腫瘍または遺伝子に応じて適宜設定可能である。   Further, in the present specification, the "predetermined threshold number of cases", when determining whether the identified mutation is a tumor cell-derived mutation or a normal cell-derived mutation using the above database, It refers to the number of cases that is the threshold for the determination. For example, the threshold number of cases is 2 cases, 3 cases, 4 cases, 5 cases, 6 cases, 7 cases, 8 cases, 9 cases, 10 cases or more. It can be set as appropriate.

例えば、腫瘍が膵臓癌の場合、同定した突然変異が、癌組織突然変異としてデータベースに2例またはそれ以上集積されている場合に、腫瘍細胞由来の突然変異であると判定することもでき、この症例数はその突然変異や突然変異が生じる遺伝子によって変更することができる。TP53遺伝子の場合は登録変異数が多く正常細胞の変異あるいは塩基配列決定時の誤りが多いため、同定した突然変異がTP53遺伝子の場合には閾値症例数を変更することもでき、例えば体細胞突然変異として前記データベースに10例またはそれ以上集積されている場合に、腫瘍細胞由来の突然変異であると判定することもできる。このように、本願明細書において、「所定の閾値症例数」とは、癌の種類、同定した突然変異の種類、突然変異が生じた遺伝子の種類等によって適宜変更することも可能である。   For example, in the case where the tumor is pancreatic cancer, it can be determined that the mutation is derived from a tumor cell when the identified mutation is accumulated in the database as two or more cancer tissue mutations. The number of cases can be changed depending on the mutation and the gene in which the mutation occurs. In the case of the TP53 gene, the number of registered mutations is large, and there are many mutations in normal cells or errors in determining the nucleotide sequence. Therefore, when the identified mutation is the TP53 gene, the threshold number of cases can be changed. When 10 or more mutations are accumulated in the database, it can be determined to be a mutation derived from a tumor cell. As described above, in the present specification, the “predetermined threshold number of cases” can be appropriately changed depending on the type of cancer, the type of identified mutation, the type of gene in which the mutation has occurred, and the like.

本願発明の一実施形態において、このような腫瘍細胞由来の突然変異であると判定するための所定の閾値症例数をCV78フィルターと呼ぶこともできる。このフィルターによって処理することにより、設定した閾値を超える症例数を有する変異体が選択され、腫瘍組織に特異的な体細胞突然変異とみなすことができ、一方でその症例数に満たない他の変異体は除外することができる。例えば、CV78フィルターにおいて、TP53遺伝子の変異の場合には閾値症例数を10とし、その他の遺伝子の変異の場合には2とするなど、同一のフィルター内において、突然変異が生じた遺伝子の種類毎に閾値症例数を設定することもできる。   In one embodiment of the present invention, the predetermined threshold number of cases for determining such a tumor cell-derived mutation can also be referred to as a CV78 filter. By processing with this filter, mutants with a number of cases exceeding the set threshold value are selected and can be considered as somatic mutations specific to the tumor tissue, while other mutations that are less than that number of cases are selected. The body can be excluded. For example, in the CV78 filter, the threshold number of cases is set to 10 in the case of mutation of the TP53 gene, and 2 in the case of mutation of other genes. It is also possible to set a threshold number of cases to.

また、本願発明の一実施形態において、腫瘍が膵臓癌の場合、正常細胞として膵管内乳頭粘液性腫瘍(IPMN)細胞を含むこともできる。このようにすることで、同定した突然変異が膵臓癌細胞由来の突然変異なのかIPMN細胞由来の突然変異なのかを通じて、IPMNと膵臓癌とを区別することもできる。   Further, in one embodiment of the present invention, when the tumor is pancreatic cancer, intraductal papillary mucinous tumor of the pancreas (IPMN) cells may be included as normal cells. By doing so, IPMN and pancreatic cancer can also be distinguished based on whether the identified mutation is a pancreatic cancer cell-derived mutation or an IPMN cell-derived mutation.

本願明細書において、「被験者のDNA」とは被験者から得られたDNAであればよく、その由来細胞または由来組織は特に限られない。本願発明の一実施形態において、「被験者のDNA」を被験者の血液由来のセルフリーDNAとすることができ、この場合には被験者の血漿成分を用いることが好ましい。   In the present specification, the “subject DNA” may be DNA obtained from a subject, and the cell or tissue from which it is derived is not particularly limited. In one embodiment of the present invention, the “subject DNA” can be cell-free DNA derived from the blood of the subject, and in this case, it is preferable to use the plasma component of the subject.

なお、上述のような突然変異の識別方法は、癌特異的突然変異が集積されたデータベースの蓄積サンプル数が多ければ多いほど好ましく、本発明に係る識別方法の精度も高くなると考えられる。また、本願発明においては、このような蓄積サンプルに係るデータを、任意のデータベースに格納できる構成を取り得る。すなわち、本願発明は、このようなデータを格納するデータベースと、当該データ及び比較解析に必要なプログラム等を読み出して実行する解析装置またはシステムをも提供することができる。このような解析装置またはシステムによれば、対象となる被験者毎に、識別の対象となる突然変異に係る情報を蓄積し、必要に応じてその蓄積した情報を取り出し、癌特異的突然変異が集積されたデータベースと照合することにより、被験者から検出された突然変異のうち、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とをいつでも高精度に識別することができる。   The mutation identification method as described above is preferable as the number of accumulated samples in the database in which cancer-specific mutations are accumulated is larger, and the accuracy of the identification method according to the present invention is considered to be higher. Further, in the present invention, it is possible to adopt a configuration in which the data relating to such accumulated samples can be stored in any database. That is, the present invention can also provide a database that stores such data, and an analysis device or system that reads and executes the data and a program necessary for comparative analysis. According to such an analysis device or system, information on mutations to be identified is accumulated for each target subject, and the accumulated information is extracted as needed to accumulate cancer-specific mutations. Among the mutations detected from the subject, the mutations occurring in the tumor cells and the mutations occurring in the normal cells can be discriminated with high accuracy at any time by collating with the database obtained.

また、このようなシステムは、コンピュータシステムに内蔵されたCPUにシステムバスを介してRAM、ROMやHDD、磁気ディスクなどの外部記憶装置及び入出力インターフェース(I/F)が接続されて構成されることができる。入出力I/Fには、キーボードやマウスなどの入力装置、ディスプレイなどの出力装置、及びモデムなどの通信デバイスが夫々接続されている。外部記憶装置は、ctDNA量情報DB、画像診断情報DB、及びプログラム格納部とを備え、いずれも記憶装置内に確保された一定の記憶領域である。   In addition, such a system is configured by connecting an external storage device such as a RAM, a ROM, a HDD, and a magnetic disk and an input / output interface (I / F) to a CPU incorporated in a computer system via a system bus. be able to. An input device such as a keyboard and a mouse, an output device such as a display, and a communication device such as a modem are connected to the input / output I / F. The external storage device includes a ctDNA amount information DB, an image diagnosis information DB, and a program storage unit, all of which are fixed storage areas secured in the storage device.

さらに、このようなシステムは、DNA量を測定および解析するシステムおよび突然変異を同定するシステムを有することができ、このようなシステムは、被験者から分子診断用採血管等で採取された核酸を含む生体サンプルを元に核酸分析を行う核酸分析装置を含むことができ、それぞれ、専用回線や公衆回線等の通信ネットワークによって電子的に接続されることができる。   Further, such a system can have a system for measuring and analyzing the amount of DNA and a system for identifying mutations, and such a system includes a nucleic acid collected from a subject by a blood collection tube for molecular diagnosis or the like. A nucleic acid analyzer for performing nucleic acid analysis based on a biological sample can be included, and each can be electronically connected by a communication network such as a dedicated line or a public line.

以下に、実施例を用いて、本発明をより詳細に説明するが、本発明はこれらの実施例に限定されるものではない。   Hereinafter, the present invention will be described in more detail with reference to examples, but the present invention is not limited to these examples.

(実験手法および材料)
以下に、本発明において用いる実験手法および材料について説明する。なお、本実施形態において、以下の実験手法を用いているが、これら以外の実験手法を用いても、同様の結果を得ることができる。
(Experimental method and materials)
The experimental methods and materials used in the present invention will be described below. Although the following experimental methods are used in the present embodiment, similar results can be obtained by using other experimental methods.

被験者およびサンプル
大阪府立成人病センターにおいて、2012年1月から2016年2月までの間に、膵癌患者およびIPMN(膵管内乳頭粘液性腫瘍)患者の血液サンプリングを行った。血漿調製およびDNA抽出は従来周知の手段によって行った。また組織サンプルについては内視鏡、超音波誘導、及び細針吸引を用いて得た。すべての患者から書面による同意を得ており、この研究は大阪府立癌医療センターの倫理委員会で承認されている。
Subjects and Samples Blood samples of pancreatic cancer patients and IPMN (intraductal papillary mucinous tumor of the pancreas) patients were sampled between January 2012 and February 2016 at Osaka Prefectural Adult Center. Plasma preparation and DNA extraction were performed by means well known in the art. Tissue samples were obtained using endoscopy, ultrasound guidance, and fine needle aspiration. Written consent was obtained from all patients and the study was approved by the Ethics Committee of the Osaka Cancer Center.

標的領域を増幅するためのアダプターおよびプライマー
膵臓癌に関連する遺伝子の標的領域を表1に示した。イオントレントシーケンシングのためのプライマー配列を含む30塩基長のアダプター配列を、固体の指標となる5塩基、分子の指標となる12塩基、および3’側のスペーサーとなる20塩基に結合した。
Adapters and Primers for Amplifying Target Regions Target regions of genes associated with pancreatic cancer are shown in Table 1. A 30-base long adapter sequence containing a primer sequence for ion torrent sequencing was bonded to 5 bases as a solid index, 12 bases as a molecular index, and 20 bases as a 3'side spacer.

Figure 2019009431
Figure 2019009431

バーコード鎖を用いたライブラリー構築
2つの遺伝子特異的プライマーで血漿サンプルあたり2つの別個の反応混合物を調製した。約1mlの全血由来のセルフリーDNAを、pH8.0の50mM Tris−HCl、10mM MgCl、10mM ジチオスレイトール、1mM ATP、0.4mM dNTP、2.4ユニットのT4 DNAポリメラーゼ(Takara Bio, Kusatu, Japan)、7.5ユニットのT4ポリヌクレオチドキナーゼ(NEB, Ipswich, MA, USA)、及び0.5ユニットのKOD DNAポリメラーゼ(Toyobo, Osaka, Japan)を含む15μl溶液中で、25℃で30分間、次いで75℃で20分間インキュベートすることによって末端修復した。12ヌクレオチドのバーコード配列でタグ付けされたアダプターのライゲーションを、20μlの末端修復溶液中で、0.5μLの10×T4 DNAリガーゼ緩衝液(NEB)、40pmolのアダプター、及び2000ユニットのT4 DNAリガーゼを添加し、25℃で15分間インキュベートすることによって行った。ライゲーション産物を1.2倍量のAMPure XPビーズ(Beckman Coulter, Brea, CA, USA)で2回精製した。精製ビーズを、1×Q5反応緩衝液(NEB)、0.2mM dNTPs、6μM遺伝子特異的プライマー混合物、及び0.4ユニットのQ5ホットスタートHigh Fidelity DNAポリメラーゼ(NEB)を含む20μlの線形増幅溶液に混合した。AMPure XPビーズを除去した後、以下のように増幅を行った。変性のための98℃で30秒、次に98℃で10秒、及び65℃で2分を15サイクル。続いて、1.2μLの100μM T_PCR_Aを反応混合物に加え、98℃で10秒、65℃で30秒、及び72℃で30秒を15サイクルで増幅した。増幅産物を1.2倍量のAMPure XPで1回精製し、20μLの0.1×TEで回収した。3μlの精製産物を、1×High Fidelity PCR緩衝液(Thermo Fisher Scientific, Waltham, MA, USA)、0.2mM dNTPs、2mM MgSO、0.5μM T_PCR_A、0.5μMネステッドプライマーミックス、及び0.4ユニットのPlatinum Taq DNAポリメラーゼ、High Fidelity(Thermo Fisher Scientific)を含むPCR増幅溶液(各20μL)の2本のチューブに添加した。熱サイクルは以下のように行った。変性を95℃で2分、及び95℃で15秒、63℃で1分を25サイクルまたは30サイクル。増幅産物を1.2倍容量のAMPure XPビーズで精製した。Qubit dsDNA HS Assay KitまたはQuant-iT PicoGreen dsDNA Assay Kit(Thermo Fisher Scientific)を用いて生成物濃度を測定した。
Library construction using barcode strands Two separate reaction mixtures were prepared per plasma sample with two gene specific primers. About 1 ml of cell-free DNA derived from whole blood was treated with 50 mM Tris-HCl, pH 8.0, 10 mM MgCl 2 , 10 mM dithiothreitol, 1 mM ATP, 0.4 mM dNTP, 2.4 units of T4 DNA polymerase (Takara Bio, Kusatu, Japan), 7.5 units of T4 polynucleotide kinase (NEB, Ipswich, MA, USA), and 0.5 units of KOD DNA polymerase (Toyobo, Osaka, Japan) in a 15 μl solution at 25 ° C. The ends were repaired by incubating for 30 minutes, then 20 minutes at 75 ° C. Ligation of adapters tagged with a 12 nucleotide barcode sequence was performed in 20 μl of end repair solution with 0.5 μl of 10 × T4 DNA ligase buffer (NEB), 40 pmol of adapter and 2000 units of T4 DNA ligase. Was added and incubated at 25 ° C. for 15 minutes. The ligation product was purified twice with 1.2 volumes of AMPure XP beads (Beckman Coulter, Brea, CA, USA). Purified beads were added to 20 μl of linear amplification solution containing 1 × Q5 reaction buffer (NEB), 0.2 mM dNTPs, 6 μM gene-specific primer mix, and 0.4 units of Q5 Hot Start High Fidelity DNA Polymerase (NEB). Mixed. After removing the AMPure XP beads, amplification was performed as follows. 15 cycles of 98 ° C for 30 seconds for denaturation, then 98 ° C for 10 seconds, and 65 ° C for 2 minutes. Subsequently, 1.2 μL of 100 μM T_PCR_A was added to the reaction mixture and amplified at 98 ° C. for 10 seconds, 65 ° C. for 30 seconds, and 72 ° C. for 30 seconds in 15 cycles. The amplified product was purified once with 1.2 volumes of AMPure XP and recovered with 20 μL of 0.1 × TE. 3 μl of purified product was added to 1 × High Fidelity PCR buffer (Thermo Fisher Scientific, Waltham, MA, USA), 0.2 mM dNTPs, 2 mM MgSO 4 , 0.5 μM T_PCR_A, 0.5 μM nested primer mix, and 0.4. A unit of Platinum Taq DNA polymerase, High Fidelity (Thermo Fisher Scientific) was added to two tubes of PCR amplification solution (20 μL each). The thermal cycle was performed as follows. Denaturation at 95 ° C. for 2 minutes and 95 ° C. for 15 seconds, 63 ° C. for 1 minute for 25 or 30 cycles. The amplification product was purified with 1.2 volumes of AMPure XP beads. Product concentrations were measured using the Qubit dsDNA HS Assay Kit or the Quant-iT PicoGreen dsDNA Assay Kit (Thermo Fisher Scientific).

シーケンシングおよびデータ解析
プロトコールに従って、Ion Torrent Protonシーケンサー(Thermo Fisher Scientific)を用いて、大規模並列シーケンシングを行った。Torrent Suite(Thermo Fisher Scientific)を使用して、ローシグナルをベースコールに変換し、シーケンスリードのFASTQファイルを抽出した。
Massively parallel sequencing was performed using an Ion Torrent Proton sequencer (Thermo Fisher Scientific) according to the sequencing and data analysis protocols. The raw signal was converted to base call using the Torrent Suite (Thermo Fisher Scientific) and the FASTQ file of sequence reads was extracted.

FASTQ形式のリードは、個体の割り当てのための5塩基のインデックスを使用して分類した。5塩基インデックスとスペーサー配列との間の配列を分子バーコードタグとして使用した。スペーサーおよびそれに続く配列の全長が50塩基よりも大きい場合、BWA−MEMを用いてリードを標的領域に並べた。短いマッピング末端(40塩基未満)のリードは破棄した。同じバーコード配列を持つリードはまとめてグループ化し、エラーバーコードタグの検出および除去を特許文献1に記載したとおりに行なった。同じバーコードを有するリードのコンセンサス配列はVarScanを用いて行った。リードの85%以上があるポジションに同じ塩基を持っている場合、それをコンセンサス塩基とした。変異体の検出のため、シークエンシングエラーを計算するためのポアソン分布モデルを適用した。変異体の存在ごとに各標的領域を評価し、検出閾値としてP=10−4を設定した。KRAS遺伝子のコドン12および13の各塩基位置を特定の閾値で評価した。この分析では、一般的なSNP部位およびエラーが起こりやすい部位は考慮しなかった。ヒトリファレンスゲノムのバージョンはGRCh37/hg19である。FASTQ format reads were classified using a 5-base index for individual assignment. The sequence between the 5 base index and the spacer sequence was used as a molecular barcode tag. If the spacer and subsequent sequence were greater than 50 bases in length, the reads were aligned to the target region using BWA-MEM. Reads with short mapping ends (less than 40 bases) were discarded. Reads with the same barcode sequence were grouped together and detection and removal of error barcode tags was performed as described in US Pat. A consensus sequence for reads with the same barcode was performed using VarScan. When 85% or more of reads had the same base at a position, it was set as a consensus base. For the detection of variants, a Poisson distribution model was applied to calculate the sequencing error. Each target region was evaluated for each presence of the mutant, and P = 10 −4 was set as the detection threshold. Each base position of codons 12 and 13 of the KRAS gene was evaluated at a specific threshold. This analysis did not consider common SNP sites and error prone sites. The version of the human reference genome is GRCh37 / hg19.

結果
膵臓癌のシーケンシング
KRAS、TP53、SMAD4、CTNNB1、CDKN2A、GNAS、HRAS、およびNRASの膵臓癌関連遺伝子の標的領域を上述の方法によってシーケンシングした。標的領域の総サイズは2.8kbであった。バーコードタグ付きアダプターは直接cfDNAの未消化末端に結合させた。ライブラリー構築のために、遺伝子特異的プライマーのみを用いた線形増幅工程の後、アダプターと遺伝子特異的プライマーの混合物とを用いて標的領域を増幅した。反応スキームを図1に示した。このライブラリーをイオントレントシーケンサーでシーケンスした。シーケンスリードは、分子バーコードを用いてグループ化した。エラー配列を除去した後、高品質の配列データを用いて各リード群についてコンセンサス配列を構築した。配列決定された分子の平均数は、標的領域あたり900塩基であった。
Results Pancreatic Cancer Sequencing Target regions of pancreatic cancer-related genes of KRAS, TP53, SMAD4, CTNNB1, CDKN2A, GNAS, HRAS, and NRAS were sequenced by the method described above. The total size of the target area was 2.8 kb. The barcode-tagged adapter was directly attached to the undigested end of cfDNA. For library construction, the target region was amplified with a mixture of adapters and gene-specific primers after a linear amplification step using only gene-specific primers. The reaction scheme is shown in FIG. This library was sequenced on an Ion Torrent sequencer. Sequence reads were grouped using molecular barcodes. After removing the error sequences, high quality sequence data was used to construct a consensus sequence for each read group. The average number of molecules sequenced was 900 bases per target region.

非腫瘍特異的変異体を除去するためのフィルターの構築
第1のデータセットは、健常人12名および膵臓癌患者57名のコホートから得た。変異体検出の結果を表2の上半分にまとめた。健常人サンプルにおいては12の変異体が見出された(表3)。
Construction of filters to remove non-tumor specific variants The first data set was obtained from a cohort of 12 healthy subjects and 57 patients with pancreatic cancer. The results of mutant detection are summarized in the upper half of Table 2. Twelve mutants were found in the healthy volunteer samples (Table 3).

Figure 2019009431
Figure 2019009431

Figure 2019009431
Figure 2019009431

1%未満のリードに存在する変異体は全ゲノムまたはエキソームシーケンシングのような次世代シーケンサーの従来の適用での分析では影響しないが、ctDNAの検出においては重大な問題となる。この実施例では、12人の健常人のうち5人が変異体陽性と判定された(表2)。つまり、健常人であっても癌特異的変異に陽性と判断された個人が5名いることとなり、シーケンシングの結果から直接的に癌特異的変異に陽性であると判断することは、膵臓癌の突然変異の診断として適切ではない。したがって、本発明者らは変異体フィルターを設定した。   Variants present in less than 1% of reads are unaffected by analysis of conventional applications of next-gen sequencers such as whole genome or exome sequencing, but pose a significant problem in the detection of ctDNA. In this example, 5 out of 12 healthy individuals were determined to be mutant positive (Table 2). In other words, there are 5 individuals who were judged to be positive for the cancer-specific mutation even in healthy people, and it is directly determined from the results of sequencing that the cancer-specific mutation is positive. Is not suitable for diagnosing mutations in. Therefore, we set up a mutant filter.

すべての癌特異的突然変異のデータは、癌体細胞突然変異カタログ(COSMIC)と呼ばれる公開データベースに保存されている。国際癌ゲノムコンソーシアムおよび癌ゲノムアトラスなどの癌ゲノムを特徴付ける最近の大規模な努力により、原発腫瘍に起因するほとんどの変異を同定していると推定される。しかしながら、健常人で同定された12の変異体のうち10種はCOSMICに登録されていなかった。本発明者らはこれに対処するために以下の2つのことを前提とした。(1)COSMICは癌組織に存在するすべての体細胞突然変異をカバーする。(2)COSMICにおける低頻度のエントリーはDNA損傷やPCR/シーケンシングエラーなどの人工的な要因から生じる可能性がある。したがって、TP53の変異体を除き、COSMIC(バージョン78)でカタログ化されていない変異体とシングルエントリーの変異体を除外した。TP53については、多くの体細胞突然変異がそのコード領域においてカタログ化されているため、より厳格な基準を適用し、10未満のエントリーの変異体を除外した。このようなバイオインフォマティクスプロセスをCV78フィルターと命名した。CV78フィルターによって変異体を検証すると、健常人に存在するすべての変異体を除外した(表2)。フィルター処理された変異体は、CV78フィルターによって選択された変異体として定義した(表2)。本実施例の実験では挿入/欠損のエラーは稀であったため、解析から除外した(1つの欠損と1つの挿入)。   All cancer-specific mutation data are stored in a public database called the Cancer Somatic Mutation Catalog (COSMIC). Recent large-scale efforts to characterize the cancer genome, such as the International Cancer Genome Consortium and the Cancer Genome Atlas, are presumed to identify most mutations attributable to the primary tumor. However, 10 of the 12 mutants identified in healthy individuals were not registered with COSMIC. The present inventors presupposed the following two things in order to cope with this. (1) COSMIC covers all somatic mutations present in cancer tissues. (2) Infrequent entries in COSMIC can result from artificial factors such as DNA damage and PCR / sequencing errors. Therefore, TP53 variants were excluded, and variants not cataloged in COSMIC (version 78) and single entry variants were excluded. For TP53, many somatic mutations were cataloged in its coding region, so more stringent criteria were applied and variants with less than 10 entries were excluded. Such a bioinformatics process was named CV78 filter. Validation of the variants by the CV78 filter ruled out all variants present in healthy individuals (Table 2). Filtered variants were defined as those selected by the CV78 filter (Table 2). Insertion / deletion errors were rare in the experiments of this example and were therefore excluded from the analysis (one deletion and one insertion).

膵臓癌患者10例については、血漿および腫瘍の両方のサンプルを入手できた。シーケンシングで同定したその変異体を表4に示す。   Both plasma and tumor samples were available for 10 patients with pancreatic cancer. The variants identified by sequencing are shown in Table 4.

Figure 2019009431
Figure 2019009431

同定された35の変異体のうち、6つは血漿サンプルでのみ検出された。これらの変異体をCV78フィルターで検証すると、6つの変異体のすべてが除外された。すなわち、CV78フィルターは正常細胞に存在する変異体と腫瘍細胞に存在する変異体とを識別できることがわかる。   Of the 35 variants identified, 6 were only detected in plasma samples. Validation of these variants with a CV78 filter ruled out all 6 variants. That is, it can be seen that the CV78 filter can discriminate between mutants existing in normal cells and mutants existing in tumor cells.

管状乳頭粘液性腫瘍(IPMN)と膵臓癌との区別
最初のシーケンシングによる変異体の同定、その後の癌特異性のための変異体のフィルタリングの全プロセスを、独立した第2のサンプルセットで検証した。このサンプルセットにはIPMN患者20人と膵臓癌患者86人の血漿サンプルが含まれる。第2のデータセットに含まれる膵臓癌患者由来の血漿サンプルは、組織サンプルとペアになった血漿サンプルを除いて、第1のデータセットに含まれる患者のものよりも後に得られた。CV78フィルターの構築後にのみ、第2のセットのすべてのサンプルをアッセイし、分析した。
Discrimination between Tubular Papillary Mucinous Tumor (IPMN) and Pancreatic Cancer The entire process of first identifying variants by sequencing and then filtering variants for cancer specificity is validated in a second independent sample set. did. This sample set includes plasma samples from 20 IPMN patients and 86 pancreatic cancer patients. Plasma samples from patients with pancreatic cancer included in the second dataset were obtained later than those of patients included in the first dataset, except for plasma samples paired with tissue samples. All samples in the second set were assayed and analyzed only after construction of the CV78 filters.

IPMNは膵管内で増殖する新生物であり、そのため、血流中にcfDNAを放出する可能性は低い。KRAS突然変異は、良性新生物患者の血漿中ではほとんど検出されない。IPMN症例のかなりの割合が膵臓癌に進行するため、IPMNと膵臓癌との区別は実質的な臨床的利益を有すると考えられる。   IPMN is a neoplasm that grows in the pancreatic duct and is therefore unlikely to release cfDNA in the bloodstream. KRAS mutations are rarely detected in the plasma of benign neoplastic patients. The distinction between IPMN and pancreatic cancer is believed to have substantial clinical benefit, as a significant proportion of IPMN cases progress to pancreatic cancer.

IPMN患者20人のうち10人はCV78フィルター処理前には変異型陽性であったが、CV78フィルター処理後には1人の患者のみが変異型陽性となった(表2)。一方、膵臓癌患者86人のうち32人は、CV78フィルター処理後にも変異体陽性となった。   Ten of the 20 IPMN patients were mutant positive before CV78 filtering, but only one patient was mutant positive after CV78 filtering (Table 2). On the other hand, 32 out of 86 patients with pancreatic cancer were also mutant positive after CV78 filter treatment.

バーコードシーケンスによって同定された変異の他の特徴
バーコードシーケンスによって同定された変異を、特定の遺伝子におけるそれらの存在に従って分類した(表5)。
Other Features of Mutations Identified by Barcode Sequences Mutations identified by barcode sequences were classified according to their presence in a particular gene (Table 5).

Figure 2019009431
Figure 2019009431

第1および第2のサンプルセットに共通して、CV78フィルターで処理してもKRAS突然変異の場合では突然変異とみなされるものが多い。これはコドン12および13に存在する突然変異ホットスポットに起因する。第1および第2のサンプルセット間のリカバリー率(変異体として選択された割合)に有意差はなかった。   Common to both the first and second sample sets, treatment with the CV78 filter is often considered a mutation in the case of a KRAS mutation. This is due to the mutation hotspots present at codons 12 and 13. There was no significant difference in recovery rate (rate selected as mutant) between the first and second sample sets.

第1および第2のサンプルセットの結果に有意差がなかったため、その後の分析は両方のサンプルセット由来のデータを組み合わせて行った。フィルター処理した変異体では、G>T/C>Aのトランスバージョン変異およびC>T/G>Aのトランジション変異がそれぞれ23.3%および62.8%の割合で見出された(表6)。CV78フィルターによって除外された変異体では、G>T/C>Aのトランスバージョン変異およびC>T/G>Aのトランジション変異が、それぞれ32.2%および40.6%の割合で見出された(表6)。これらのトランスバージョン変異およびトランジション変異は両方のデータセットの大部分の突然変異を占めた。   Since the results for the first and second sample sets were not significantly different, subsequent analyzes were performed combining data from both sample sets. In the filtered mutants, G> T / C> A transversion mutations and C> T / G> A transition mutations were found at a rate of 23.3% and 62.8%, respectively (Table 6). ). In the mutants excluded by the CV78 filter, G> T / C> A transversion mutations and C> T / G> A transition mutations were found at rates of 32.2% and 40.6%, respectively. (Table 6). These transversion and transition mutations accounted for the majority of mutations in both datasets.

Figure 2019009431
Figure 2019009431

すべてのサンプルを、x軸をシーケンスされた分子数、y軸を変異体分子数としてスキャッタープロット上にプロットした(図2)。フィルター処理された変異体(フィルター処理で残された変異体)と除外された変異体の分布は互いに異なっていた。フィルター処理された変異体分子は、シーケンスされた分子の10%超から1%未満までのそれぞれの割合で広く分布していた。一方で、除外された変異体はシーケンスされた分子の10%以上を占めることはほぼなく、その割合は1%前後であった。   All samples were plotted on a scatter plot with the number of molecules sequenced on the x-axis and the number of mutant molecules on the y-axis (Figure 2). The distribution of filtered mutants (mutants left over by filtering) and excluded mutants differed from each other. The filtered mutant molecules were widely distributed at respective rates from> 10% to <1% of the sequenced molecules. On the other hand, the excluded mutants occupy almost no more than 10% of the sequenced molecules, the ratio being around 1%.

その他、本発明は、さまざまに変形可能であることは言うまでもなく、上述した一実施形態に限定されず、発明の要旨を変更しない範囲で種々変形可能である。   In addition, it goes without saying that the present invention can be variously modified, and is not limited to the above-described one embodiment, and can be variously modified without changing the gist of the invention.

Claims (8)

被験者から検出された突然変異のうち、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とを高精度に識別する方法であって、
被験者のDNAにおける突然変異を同定する工程と、
前記同定した突然変異を癌特異的突然変異が集積されたデータベースに照合する工程であって、前記同定した突然変異が、前記腫瘍に特異的な突然変異として前記データベースに所定の閾値症例数またはそれ以上集積されている場合に、前記腫瘍細胞由来の突然変異であると判定する、前記照合する工程と
を有する、方法。
Among the mutations detected from the subject, a method for highly accurately distinguishing between mutations occurring in tumor cells and mutations occurring in normal cells,
Identifying a mutation in the subject's DNA,
The step of matching the identified mutation with a database in which cancer-specific mutations are accumulated, wherein the identified mutation is a predetermined threshold number of cases in the database as the tumor-specific mutation or The above-mentioned collating step of determining that the mutation is derived from the tumor cell when the above-mentioned accumulations have been made.
前記DNAが血液由来のセルフリーDNAである、請求項1記載の方法。   The method according to claim 1, wherein the DNA is cell-free DNA derived from blood. 前記同定した突然変異が、体細胞突然変異として前記データベースに2例またはそれ以上集積されている、請求項1記載の方法。   The method according to claim 1, wherein the identified mutation is accumulated in the database as a somatic mutation in two or more cases. 前記腫瘍が膵臓癌である、請求項1記載の方法。   The method of claim 1, wherein the tumor is pancreatic cancer. 請求項4記載の方法において、前記同定した突然変異がTP53遺伝子の変異であり、体細胞突然変異として前記データベースに10例またはそれ以上集積されている、方法。   The method according to claim 4, wherein the identified mutation is a mutation in the TP53 gene, and 10 or more cases are accumulated in the database as a somatic mutation. 請求項4記載の方法において、前記正常細胞は膵管内乳頭粘液性腫瘍細胞を含む、方法。   The method of claim 4, wherein the normal cells comprise intraductal papillary mucinous tumor cells of the pancreas. 前記血液が血漿成分である、請求項1記載の方法。   The method of claim 1, wherein the blood is a plasma component. 被験者から検出された突然変異のうち、腫瘍細胞で生じた突然変異と正常細胞で生じた突然変異とを高精度に識別する突然変異識別システムであって、
被験者のDNAにおける突然変異を同定する手段と、
前記同定した突然変異を癌特異的突然変異が集積されたデータベースに照合する手段であって、前記同定した突然変異が、前記腫瘍に特異的な突然変異として前記データベースに所定の閾値症例数またはそれ以上集積されている場合に、前記腫瘍細胞由来の突然変異であると判定する、前記照合する手段と
を有する、システム。
Among mutations detected from a subject, a mutation discrimination system for highly accurately discriminating a mutation generated in a tumor cell and a mutation generated in a normal cell,
Means for identifying mutations in the subject's DNA,
A means for collating the identified mutation with a database in which cancer-specific mutations are accumulated, wherein the identified mutation is a predetermined threshold number of cases in the database as the tumor-specific mutation or The above-mentioned means for collating, which determines that the mutation is derived from the tumor cell when accumulated above.
JP2019527998A 2017-07-07 2018-07-09 Highly accurate method for identifying mutations in tumor cells Pending JPWO2019009431A1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762529953P 2017-07-07 2017-07-07
US62/529,953 2017-07-07
PCT/JP2018/025914 WO2019009431A1 (en) 2017-07-07 2018-07-09 Method for highly accurately distinguishing spontaneous mutations occurring in tumor cells

Publications (1)

Publication Number Publication Date
JPWO2019009431A1 true JPWO2019009431A1 (en) 2020-05-21

Family

ID=64951027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019527998A Pending JPWO2019009431A1 (en) 2017-07-07 2018-07-09 Highly accurate method for identifying mutations in tumor cells

Country Status (2)

Country Link
JP (1) JPWO2019009431A1 (en)
WO (1) WO2019009431A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113990492A (en) * 2021-11-15 2022-01-28 至本医疗科技(上海)有限公司 Method, apparatus and storage medium for determining detection parameters for minimal residual disease of solid tumors

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140336996A1 (en) * 2013-05-10 2014-11-13 James Xin Sun Analysis of genetic variants
JP2015501974A (en) * 2011-11-07 2015-01-19 インジェヌイティ システムズ インコーポレイテッド Methods and systems for identification of causal genomic mutations.
CN104462869A (en) * 2014-11-28 2015-03-25 天津诺禾致源生物信息科技有限公司 Method and device for detecting somatic cell SNP
US20160273049A1 (en) * 2015-03-16 2016-09-22 Personal Genome Diagnostics, Inc. Systems and methods for analyzing nucleic acid

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015501974A (en) * 2011-11-07 2015-01-19 インジェヌイティ システムズ インコーポレイテッド Methods and systems for identification of causal genomic mutations.
US20140336996A1 (en) * 2013-05-10 2014-11-13 James Xin Sun Analysis of genetic variants
CN104462869A (en) * 2014-11-28 2015-03-25 天津诺禾致源生物信息科技有限公司 Method and device for detecting somatic cell SNP
US20160273049A1 (en) * 2015-03-16 2016-09-22 Personal Genome Diagnostics, Inc. Systems and methods for analyzing nucleic acid

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113990492A (en) * 2021-11-15 2022-01-28 至本医疗科技(上海)有限公司 Method, apparatus and storage medium for determining detection parameters for minimal residual disease of solid tumors

Also Published As

Publication number Publication date
WO2019009431A1 (en) 2019-01-10

Similar Documents

Publication Publication Date Title
JP7119014B2 (en) Systems and methods for detecting rare mutations and copy number variations
AU2020202153B2 (en) Single-molecule sequencing of plasma DNA
US9982295B2 (en) Non-invasive prenatal diagnosis of fetal genetic condition using cellular DNA and cell free DNA
JP6161607B2 (en) How to determine the presence or absence of different aneuploidies in a sample
US9885080B2 (en) Kit, a device and a method for detecting copy number of fetal chromosomes or tumor cell chromosomes
CN108229103B (en) Method and device for processing circulating tumor DNA repetitive sequence
CN108595918B (en) Method and device for processing circulating tumor DNA repetitive sequence
US20180135044A1 (en) Non-unique barcodes in a genotyping assay
Kukita et al. Selective identification of somatic mutations in pancreatic cancer cells through a combination of next-generation sequencing of plasma DNA using molecular barcodes and a bioinformatic variant filter
JPWO2019009431A1 (en) Highly accurate method for identifying mutations in tumor cells
Welkers et al. Improved detection of artifactual viral minority variants in high-throughput sequencing data
CN111020710A (en) ctDNA high-throughput detection of hematopoietic and lymphoid tissue tumors
US20230235394A1 (en) Chimeric amplicon array sequencing
Autio Comparison of endogenous retroviral RNA profiles from blood cells and plasma, between nonagenarians and young controls
WO2018148903A1 (en) Auxiliary diagnosis method for urinary system tumours

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221108