JP2024043823A - 対象のがん罹患の可能性を分析する方法 - Google Patents

対象のがん罹患の可能性を分析する方法 Download PDF

Info

Publication number
JP2024043823A
JP2024043823A JP2022149024A JP2022149024A JP2024043823A JP 2024043823 A JP2024043823 A JP 2024043823A JP 2022149024 A JP2022149024 A JP 2022149024A JP 2022149024 A JP2022149024 A JP 2022149024A JP 2024043823 A JP2024043823 A JP 2024043823A
Authority
JP
Japan
Prior art keywords
cancer
sequence
rna
subject
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022149024A
Other languages
English (en)
Inventor
友美 安東
美津子 石原
良威 佐野
拓也 宮川
幸二 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2022149024A priority Critical patent/JP2024043823A/ja
Priority to PCT/JP2023/031406 priority patent/WO2024062867A1/ja
Priority to US18/591,077 priority patent/US20240200149A1/en
Publication of JP2024043823A publication Critical patent/JP2024043823A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】より簡便に、早期段階のがんを検出することが可能な方法を提供する。【解決手段】実施形態のがん罹患の可能性を分析する方法は、参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の当該RNAの種類数をカウントすること、得られた当該RNAの種類数を指標にして当該対象のがん罹患の可能性を判断することを含む。【選択図】図1

Description

本発明の実施形態は、対象のがん罹患の可能性を分析する方法に関する。
採取が容易な体液から分離される核酸を解析することでがん罹患者と健常者を識別する系が知られている。例えば、広く検証されている系は、miRNA(microRNA)を用いた識別系である。miRNAは、17~25塩基程度の一本鎖核酸であり、遺伝子発現を調節する機能を持つことが明らかにされ、種々の疾患でその種類や発現量が初期の段階から変化していることが報告されている。例えば、がん患者では、種々のmiRNA量ががんマーカーとして使用され、健常者と比較して増加、或いは減少していることが知られている。これらの知見は、被験者ががんか否かを知るための手段として、被検者から採取された試料中に含まれる目的とするmiRNAを定量的に調べることを提案している。
特開2020-202768号公報
本発明が解決しようとする課題は、より簡便に、早期段階のがんを検出することが可能な方法を提供することである。
実施形態のがん罹患の可能性を分析する方法は、参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の当該RNAの種類数をカウントすること、得られた当該RNAの種類数を指標にして当該対象のがん罹患の可能性を判断することを含む。
第1の実施形態を示すスキーム図。 第1の実施形態の1例について説明する図。 第2の実施形態の1例を示すスキーム図。 第2の実施形態の更なる1例を示すスキーム図。 第3の実施形態を示すスキーム図。 第4の実施形態の1例を示すスキーム図。 第4の実施形態の1例を示す図。 第4の実施形態の1例を示す図。 第5の実施形態を示すスキーム図。 第5の実施形態の1例を示す図。 第5の実施形態の更なる例を示す図。 第5の実施形態の更なる例を示す図。 例1の結果を示す図。 例2の結果を示す図。 例3の結果を示す図。
以下、実施形態について、添付の図面を参照して説明する。なお、各実施形態において、実質的に同一の構成部位には同一の符号を付し、その説明を一部省略する場合がある。図面は模式的なものであり、各部の厚さと平面寸法との関係、各部の厚さの比率等は現実のものとは異なる場合がある。
(第1の実施形態)
本願の実施形態に係る分析方法は、RNA編集に基づく配列変動がRNA群においてどのように存在しているのかを明らかにすることによって、がん罹患者と非がん者とを識別できる知見を得たことにより達成されたものである。この発見により、対象のがん罹患の可能性を定量ではなく、定性的に分析することが可能になる。それによって、より簡便に、ひいては、より安価に、早期段階でがんを発見することが可能である。例えば、遺伝子を定量する必要がないので、定量性能を担保する必要がない。当該分析方法は、非常に独創的な発見に基づいた飛躍的且つ画期的な方法である。
第1の実施形態について、図1を用いて説明する。この実施形態は、対象のがん罹患の可能性を分析する方法である。当該分析方法は、参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中のその数、即ち、種類数をカウントすること、得られた種類数を指標にして当該対象のがん罹患の可能性を判定することを含む。
RNA編集(RNA editing)とは、DNAから転写されたRNA、又は転写中のRNAの塩基配列を置換したり、1~数塩基を挿入したり、削除したりする、動植物における機構である。RNA転写後の修飾の1つとも考えられており、様々な生体プロセスの制御に係わっていることが報告されている。図2を用いて、代表的なRNA編集の例について説明する。即ち、代表的なRNA編集の例は、(1)A-to-I RNA編集、(2)C-to-U RNA編集、(3)1~数塩基の挿入、(4)1~数塩基の削除(欠失)などである。A-to-I RNA編集(adenosin to inosin editing)は、ADAR酵素によるRNA編集である。アデノシン(A)のアミノ基を加水分解し、イノシン(I)に置換するものであり、翻訳時には、化学構造が類似しているグアノシン(G)として認識される。C-to-U RNA編集(cytidine to uridine editing)は、シチジン(C)からウリジン(U)に置換されるものである。当該分析方法においては、RNA編集の機序は問わず、参照配列に照らして、配列変動が存在するRNAについて、試料中の種類数がカウントされればよい。
参照配列は、RNA編集による配列変動が発生していない配列であればよく、例えば、対応する野生型の配列であり得る。野生型の配列の情報は、例えば、RNAの種類に応じた遺伝子バンク、例えば、Ensembl又はNCBIなどの全ての遺伝子データが集まるデータベースや、miRNAのデータベースであるmiRBaseなど特定の種類のRNAの情報を収集しているデータベースを利用しても、参照してもよく、また情報の更新があれば所望に応じて最新の情報を参照し得る。また、参照配列は、特定の全長RNAであっても、特定のRNAの部分配列であっても、その組み合わせであってもよい。
対象由来の試料とは、対象から採取された細胞、組織及び/又は液体、或いは、それらの混合物、それらを適切に処理することにより得られた処理物等を含む。試料が体液である場合、例えば、血清又は血漿であってよく、或いはその他の体液、例えば、血液、白血球間質液、尿、便、汗、唾液、口腔内粘膜、鼻腔内粘膜、鼻水、咽頭粘膜、喀痰、消化液、胃液、リンパ液、髄液、涙液、母乳、羊水、精液、膣液又はそれらの混合物等であってもよい。或いは、試料は、組織若しくは細胞、又はそれらの混合物等であってもよい。また試料は、対象から採取された直後のもの、培養されたもの、所望の手続きで保存されたもの、或いはそれらを所望の液体中に維持した後に得られるその上清であってもよい。採取が容易であるので、血液、血清及び血漿などの体液を対象由来の試料とすることは好ましい。
試料についてのRNAに関する情報は、試料からRNAを抽出した後に行われ得る。RNAの抽出方法は、それ自身公知の方法により行われてよく、例えば、市販のキットを使用することも可能である。
対象は、本方法において分析に供される動物、即ち、試料を提供する動物である。対象は、何らかの疾患を有する動物であってもよいし、健常な動物であってもよい。例えば、対象は、がんに罹患している可能性がある動物、或いは過去にがんに罹患したことのある動物等であってもよく、特に、乳がんに罹患している可能性がある動物、或いは過去に乳がんに罹患したことのある動物等であってもよい。対象はヒトであることが好ましい。
或いは、対象は他の動物であってもよい。他の動物は、例えば哺乳動物であり、例えば、サル等の霊長類、マウス、ラット又はモルモット等の齧歯類、イヌ、ネコ又はウサギ等の伴侶動物、ウマ、ウシ又はブタ等の家畜動物、或いは展示動物等に属する動物を含む。
当該分析方法では、対象に由来する試料中に含まれる母集団RNAのうち、何種類のRNAが、RNA編集に基づく配列変動を有しているのか、種類数をカウントし、得られた種類数を指標にして対象のがん罹患の可能性を判断する。当該分析方法においては、配列変動を有するRNAについて、特定のRNA種の発現量やコピー数を量るのではなく、対象からの試料に含まれるRNAのうち、RNA編集によって、参照配列とは異なる配列を有する、即ち、配列変動を有するRNAが何種類あるのか、その数をカウントする。詳しくは後述するが、種類数のカウントは、例えば、特定のカテゴリーのRNAを網羅的に調べ、カウントしてもよく、特定又は任意のRNA母集団を設定し、それらについて網羅的に調べてカウントしてもよい。例えば、RNA母集団に含まれるRNA分子の数は、例えば、使用するデータベースに登録される数としても、或いは、そこから任意に選択してもよい。例えば、現時点のmiRBaseには、271の生物種に対して38589のpre-miRNAが、4860のmiRNAが登録されている。そのうち、ヒトゲノムは、1917のpre-miRNA、2654のmiRNAが登録されている。これらの数をRNA母集団に含まれるRNA分子の数とし得るが、これらに限定されるものではない。例えば、特定のRNA母集団を形成する場合、例えば、対象とするmiRNAの数を制限する方法であれば、発現量が単純に多いものから選ぶ方法や、検体間で発現量のばらつきの小さいものから選ぶ、あるいは変異の比率の高いものから選ぶ、検体間の変異の比率のばらつきが小さいものから選ぶなどの基準が考えられるが、これらに限定されるものではない。また、RNAの長さは、例えば、miRNAであれば、約17塩基長~約25塩基長であり得るが、これらに限定されるものではない。またPre-miRNAであれば、例えば、約60塩基対~約70塩基対であり得る。RNAの長さは、例えば、miRNAであれば、17塩基長~25塩基長であり得るが、これらに限定されるものではない。またPre-miRNAであれば、例えば、60塩基対~70塩基対であり得る。
カウントされるRNAは、RNA編集に基づく配列変動が存在し得るRNA種であればよく、例えば、RNA、mRNA、ncRNA(non-coding RNA)、ハウスキーピング ncRNA、tRNA、スモールncRNA、miRNA、piRNA、tsRNA、IncRNAなどであってもよい。これらのRNAは、カテゴリー包括的にカウントされてもよく、幾つかのカテゴリーが混合している状態でカウントされてもよく、特定のカテゴリーのRNAについてカウントされてもよい。例えば、特定のカテゴリーのRNAをカウントする場合には、mRNA、tRNA、スモールncRNA、miRNA、piRNA、tsRNAなどであってよく、例えば、それらのうちの少なくとも2カテゴリーの混合物であってもよい。或いは、そのような特定のカテゴリーのRNAは、例えば、miRNAであってよい。配列変動を有するRNAについて、特定のRNA種の発現量やコピー数ではなく、RNA群に分布しているRNAの種類の数をカウントし、得られた種類数に基づいて対象のがん罹患の可能性の高さが判断され得る。
RNA編集による配列変動をより精度よく追跡するためには、転写以前の核酸、例えば、ゲノム上で起こり得る配列変動や多様性、例えば、多型、変異、置換、欠失、挿入などの頻度が低く、影響が出にくい部位、例えば、高度に保存された配列、又は高度に保存された部位の配列若しくはそれを含む配列を選択してもよい。例えば、miRNAであれば、シード配列を称される5’末端の1位~10位には、一般的に一塩基多型などの存在確率が低く、配列変動性が低いため高い有用性があるといえる。
対象のがん罹患の可能性を分析するとは、例えば、対象ががんを罹患している可能性があるのか否かを判定すること、対象ががんを罹患している可能性が高い又は低いことを判定すること、対象ががん罹患者であるのか、非がん者であるのかを識別することなどであってもよい。第1の実施形態によれば、対象ががんに罹患している可能性の高さを客観的な比較基準に基づいて機械的及び/又は自動的に決定することが可能である。例えば、対象のがん罹患の可能性を分析する方法は、例えば「対象ががんに罹患している可能性に関する情報を取得する方法」との言い換えることが可能である。取得された情報は、例えば、医師が医療目的で「対象」である人間の病状や健康状態等について判断、即ち、診断するために利用することが可能である。このような医師による「判断」、即ち「診断」を「対象における標的がん群の罹患の有無の判定」であるとすれば、当該実施形態は、「医師」によるこのような医療目的での「対象におけるがんの罹患の有無の判定」を「補助する分析方法」であるともいえる。
例えば、判定は、予め設定した閾値よりも大きい数の種類数があった場合に、対象ががんを罹患している可能性が高いとすることができる。或いは、予め設定した閾値よりも小さい数の種類数があった場合に、対象ががんを罹患している可能性が低いとすることもできる。閾値の設定は、母集団RNA及び参照配列を対応させて、非がん者に由来する試料を用いてえられた結果と代表的ながん罹患者に由来する試料を用いて得られた結果とを予め比較することにより決定されてもよい。
本明細書においてがんは、何れの病期のものも含み、例えば、発生母地の臓器内にがんが留まった状態、更に周辺の組織までがんが及んだ状態、更にリンパ節へがんが転移した状態、及び更に離れた臓器へのがんの転移がある状態等を含む。また本明細書において乳がんは、乳腺組織に形成される悪性腫瘍(新生物)をいう。例えば、乳がんは、一般に「乳癌」又は「乳がん」と称されるものも含む。また、実施形態に従う乳がんは、何れの種類の乳がんも含み、例えば乳腺小葉がん又は乳管がんを含む。また、実施形態に従う乳がんは、例えば上皮性腫瘍、非上皮性腫瘍、並びに上皮性及び非上皮性の両方からなる悪性葉状腫瘍を含む。
例えば、がんは、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんであり得る。
本実施形態の方法は、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。
例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。がんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。
(第2の実施形態)
第2の実施形態は、対象のがん罹患の可能性を分析する方法である。当該分析方法は、対象からの試料について第1の実施例に示したように種類数をカウントするのに加えて、対象、例えば、非がん対照からの試料についても同様に種類数をカウントする。得られた種類数を指標にして、この実施形態において、対象からの種類数と非がん対照からの種類数とを比較することで、当該対象のがん罹患の可能性を判断する。
対照は、例えば、健常体であり得る。健常体とは、少なくともがんに罹患していない個体であってよい。健常体は、疾患や異常を有さない健康な個体であることが好ましい。対照として選択される個体は、本方法で分析される対象とは別の個体であってもよく、同じ種に属する個体、即ち対象がヒトであればヒトであることが好ましい。また、対照の年齢、性別及び身長体重等の身体的条件又は人数は特に限定されるものではないが、身体的条件は、本分析方法で検査を受ける対象のものと同じ又は類似であることが好ましい。或いは、経時的に対象由来の試料を採取し、対象が、健常体である場合の検査結果を対照、非がん者若しくは非がん対照として使用してもよい。
図3を用いて、第2の実施形態としての当該分析方法の1例について概念的に説明する。第2の実施形態の1例として、ヒトを対象として、RNAは、特定のカテゴリーとしてのmiRNAを選択し、カウントする例を示している(図3、S31(a)、S32A、S32B)。ここでは、対象は対象者、対照は非がん対照者、母集団RNAは母集団miRNAと表している。また図3には、比較例として一般的な定量試験の1例についても概念的に示した(図3、S31(f)、S32A(g)、S32B(h))。
まず、最初に、対象者からの試料(a)と非がん対照者からの試料(f)を準備する(S31)。これらの試料に含まれる特定のカテゴリーのRNAを母集団として、RNA編集に基づく配列変動が存在するRNAの種類について、対象者と非がん対照者に由来する試料中の種類数をカウントする(S32A(b)、(b1)、(b2))。この例では、母集団miRNAは、血清中に存在するmiRNAを網羅的に分類して分析し、RNA編集に基づく配列変動が存在するRNAの種類をカウントした例を示す。母集団miRNAのうちの5種類、miR-1、miR-2、miR-3、miR-4及びmiR-5を代表的に図3に示し、他の画分については省略している(S32A(b))。この場合の判定基準は、非がん対照者よりも多くの種類のmiRNAにRNA編集に基づく配列変動が存在した場合に、対象者はがんに罹患している可能性が高いと識別する。
以下、便宜的にコピー数にまで言及してシミュレーションする。非がん者の試料においては、miR-1は3コピー、miR-2が2コピー、miR-3が6コピー、miR-4が0コピー、miR-5が2コピーとして、血清中に分泌しているとする(S32A(b1))。そのうちのmiR-3の2コピーにRNA編集が見られている(それぞれx印)。この場合、非がん者由来の試料におけるRNA編集に基づく配列変動が存在するRNAは、1種類、即ちmiR-3のみである。これに対して、対象者ががん罹患者であったことを仮定してシミュレーションした結果を示す。対象者では、miR-1は12コピー、miR-2が9コピー、miR-3が10コピー、miR-4が5コピー、miR-5が9コピーとして、血清中に分泌している(S32A(b2))。そのうちのmiR-1の2コピー、miR-2の1コピー、miR-3の3コピー、miR-4の1コピーにRNA編集が見られる(それぞれx印)。従って、対象者由来の試料におけるRNA編集に基づく配列変動が存在するRNAは、miR-1~miR-4の4種類である。比較すると、対照者の1種類に比べて、対象者は4種類であり、種類数が多い。この結果から、対象者はがんに罹患している可能性が高いと識別される。
当該分析方法は、定性試験であり、ここで使用される母集団miRNAに含まれる各種類のmiRNAの配列、標的、機能及び表現型などの特性は、一切考慮することなく、単にRNA編集に基づく変異があるのか、もしくはないのか、を判定し、且つその種類について、非がん対照者と対象者との間で数を比較することによって、対象者の「がん」である可能性の高低を判定することができる。
これに対して、一般的に知られる特定の種類のmiRNAをがんマーカーとして使用し、対象の「がん」の可能性の高低を判定する場合には、定量試験が行われている。即ち、図3(g)に示すように、対象者からの試料(a)と非がん対照者からの試料(f)を準備し
(S31)、その後、非がん者の試料に含まれる特定のmiRNA(ここでは便宜的にmiR-0と示している)の発現量(S32A(g1))と、対象者の試料に含まれる対応するmiRNA(ここでは、miR-0)の発現量(S32A(g2))とを比較する。そして、比較の結果、例えば、対象者からの試料のmiR-0が対照者よりもその量が多い場合に、対象者は「がん」である可能性が高いと判定される。
本実施形態の分析方法において、RNA編集に基づく配列変動が存在するRNAの種類数をカウントすることは、例えば、S32Bに示すように、がん組織中の変異頻度と血清中へのmiRNAの分泌量との両方の情報を含んでいるともいえる。言い換えると、一般的に定量試験の場合、例えば、血清中へのmiRNAの分泌量が、正常細胞で少なく、がん細胞で多いという情報(S32B(h))、がん組織中の変異頻度が正常細胞で少なく、がん細胞で多いという情報(S32B(i))を掛け合わせた情報が血清中のmiRNAで変異が検出されるmiRNAの種類数、正常細胞では(少ない×少ない)、がん細胞では(多い×多い)となる(S32B(c))。これにより、結果が強調されることにより、より見やすい結果となり得る。また、濃度ではなく個数を指標とした定性試験となり得る。
上述のような第2の実施形態は、図4のスキーム図に示しているように、参照配列に比較し、RNA変種に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の種類数をカウントする(S41)ことと、得られた種類数と、対照に由来する試料から得られた種類数とを比較して、その結果を基に当該対象のがん罹患の可能性を判断する(S42)ことを備えていてもよい。
母集団となるmiRNAは、それ自体公知の何れのmiRNAのデータベースを利用して、或いは公知の発見ツールなどを利用して独自にデータベースを作製した後に、それらのデータベースに含まれる任意の種類のmiRNAから任意に選択、設計及び/又は設定すればよい。miRNAのデータベースの例は、miRNABase,Rfam、miRIAD、dbDEMCなどであってもよい。発見ツールの例は、miRscan、miRNAFold、miRDeep、miRanalyzer、ChIPBase、sRNAbenchなどであってもよい。或いは、MiREDiBase(miRNA Editing Database)などのRNA編集に基づく変異を起こし得る配列が登録されているmiRNAのデータベースから任意に選択されてもよい。母集団に含まれるmiRNAの数は、例えば、300種以上、400種類以上、500種類以上、600種類以上であってよい。
第2の実施形態は、本発明者らが、低侵襲に採取できる体液から核酸を分離し、その配列変動を利用して健常者とがん罹患者を識別できることを見出したことに基づく。言い換えると、第2の実施形態により、低侵襲に採取できる体液から核酸を分離し、その配列変動を利用して健常者とがん罹患者を識別することが可能である。また、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。また例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。
(第3の実施形態)
第3の実施形態である対象のがん罹患の可能性を分析する方法を図5に示した。当該方法は、3つの工程、試料データ取得工程(S51)と、特徴抽出工程(S52)と、罹患判定工程(S53)とを備える。試料データ取得工程では、参照配列からの配列変動に関する情報を、対象から得られた体液から取得する(S51)。参照配列から配列変動に関する情報とは、体液中に含まれるRNAについての情報である。特徴抽出工程では、配列変動が存在するRNAの種類数をカウントする(S52)。罹患判定工程では、配列変動が存在するRNAの種類数を指標として、がん罹患の有無の可能性を決定する。或いは、この罹患判定工程は、当該指標を用いて、対象が、がん罹患者であるのか、非がん者であるのかを識別される工程であってもよい。
本実施形態の方法が、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。
例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。これによりがんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。また、血清又は血漿は、そこに含まれるRNA濃度、例えば、miRNA濃度が安定しているため、より正確な検査を行うことが可能である。
(第4の実施形態)
第4の実施形態である対象のがん罹患の可能性を分析する方法を図6に示す。当該分析方法は、4つの工程を含む。まず、対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類する(S61)。次に、各参照配列に対して分類されたRNA集団で同一の配列をもつ代表配列群を決定する(S62)。代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出する(S63)。更に、配列変動を有する当該代表配列の種類数をカウントする(S64)。この方法はまた、配列変動を検出する方法として使用され得る。配列変動を検出する方法は、対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、各参照配列に対して分類されたRNA集団で同一の配列をもつ代表配列群を決定すること、代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、を備え得る。更に、特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な配列変動を検出する方法でもあり得る。
RNA配列の相同性によって分類するとは、情報を得ようとするRNAの特定の部位の配列について、相同性の高い配列同士を1グループに分類することにより、複数のグループを作るということである。その際に、参照配列(データベースから入手した既知の配列)をグループの基準の配列として使用する。相同性による分類は、例えば、次世代シーケンサー(NGS)、qPCR、サンガー、RNA検出用のマイクロアレイ、及びハイブリダイゼーションなどを使用することによって行われ得る。或いはこれらの手法を少なくとも2つ組み合わせて使用することにより行われてもよい。
例えば、miRNAについて、次世代シーケンサーを使用して網羅的に分析する例のイメージを図7~図11に示す。図7(a)に示すように、試料は、健常者30例、乳がん24例、肺がん18例、大腸がん24例、子宮がん24例、胃がん24例、すい臓がん24例、前立腺癌24例、卵巣癌24例、腎臓がん24例、脳腫瘍24例、子宮頸がん13例、胆管がん24例、食道がん24例、膀胱がん24例、肉腫24例及び肝臓肝3例から採取した血清を用いた。図7(b)に示すように、分析したmiRNAは、has-let-7a-2-3p、has-let-7a-3p、has-let-7a-5p、has-let-7b-3p、has-let-7b-5p、has-let-7c-3p、has-let-7c-5p、has-let-7d-3p、has-let-7d-5p、has-let-7e-3p、has-let-7e-5p、has-let-7f-3p、has-let-7f-5p、has-let-7g-3p、has-let-7g-5p、has-let-7i-3p、has-let-7i-5p、has-miR-100-3p、has-miR-100-5p、has-miR-101-3p、has-miR-101-5p、has-miR-103a-2p、has-miR-103a-3p、has-miR-103b、has-miR-105-3p、has-miR-103-5p、has-miR-106a-3p、has-miR-106a-5p、has-miR-106b-3pを含む2654種類である。まず、これらのmiRNAについて、健常者及びがん罹患者について1例ずつ、次世代シーケンサーにより定量した。図7(b)には、その結果の一部分を示している。miRNAの名前をカラムAに、カラムC、D、E…と、30例の健常者、各がんの罹患者データを並べて示している。これは、対象に由来する試料に含まれるRNAが、その配列の相同性によって、分類された状態である。
次に、分類された集団それぞれ(=各miRNA、例えばAGCTAGCT)で参照配列に対して配列変動を持つかどうかを決定するために、分類された各集団の代表配列群(= AGCTAGCT(野生型)あるいは変異型AGCTGGCTあるいはAGCTAGTT)のうち、参照配列に対して配列変動を持つ配列(=変異型AGCTGGCTあるいはAGCTAGTT)を1つあるいは複数選んだ。各集団から選ばれた配列変動を持つ配列を候補リストと定めた。すなわち、候補リストは集団名と配列変動を持つ配列情報から成る。候補リストと同一の集団に選ばれた配列変動を持つ配列と同一の配列(=AGCTGGCTあるいはAGCTAGTT)を持つ場合に、その候補に対して変異を持つと判定した。図8(c)の表は、図7(b)からのデータの一部分であり、5例の健常者と6例のがん罹患者について、予め作製されたmiRNA変異候補リストに含まれる種類のmiRNAについて変異の有無を決定する。図8(c)においては、miRNA_mutant_1、miRNA_mutant_2、miRNA_mutant_3、miRNA_mutant_4、miRNA_mutant_5、miRNA_mutant_6、miRNA_mutant_7がmiRNA変異候補の一部分として示されている。変異があるものは「1」、変異のないものは「0」を入力し、変異リスト全体で変異が存在したmiRNAの種類数をカウントする。予め決定された閾値又は随時決定される閾値以上のmiRNA変異検出種類数であった場合に、がん罹患者である可能性が高いと判断される。
閾値の決定は、がん罹患者に由来する試料と非がん者に由来する試料とを予め分析及び比較することにより決定してもよく、対象に由来する試料を分析する度に、非がん者に由来するからの情報を分析し、比較することによって決定してもよい。例えば、閾値の例は、2、3、5、10、23、25、26又は30などであるが、これに限定されるものではない。マーカーとして使用するmiRNAの種類数を最大値としてもよい。例えば、閾値は、当該分析方法において使用される手法とRNAの種類によって決定されてもよい。
本実施形態の方法が、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。また例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。
例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、がんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。また、血清又は血漿は、そこに含まれるRNA濃度、例えば、miRNA濃度が安定しているため、より正確な検査を行うことが可能である。
(第5の実施形態)
第5の実施形態は、がん罹患者である可能性が高いと判断するために使用される閾値を設定する方法である。当該閾値設定方法は、4つの工程を含む(図9)。まず、対象又はがん罹患者に由来する試料と非がん者に由来する試料について、それぞれ含まれるRNAをその配列の参照配列に対する相同性によって、それぞれ分類する(S91)。次に、各々の参照配列に対して分類されたRNA集団において、同一の配列をもつ代表配列群を、それぞれ決定する(S92)。対象又はがん罹患者に由来する試料と対照に由来する試料とについて、代表配列群の各配列と各対応する参照配列とをそれぞれ比較し、配列変動をそれぞれ検出する(S93)。検出結果を基に、配列変動を有する代表配列の種類数をカウントする(S94)。対象又はがん罹患者と対照との間で、カウントされた代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定する(S95)。
当該閾値を設定する方法を、miRNAをRNAの1例とした場合について、閾値を設定するイメージとして図10~12に示す。図10には、24種類のmiRNAについて、がん罹患者に由来する試料と対照としての健常者とを比較する1例を示した。この例において、健常者の数は、30例とした(n=30)。がん罹患者の数は、346例であり(n=346)、がん種の内訳は、乳がん24例、肺がん18例、大腸がん24例、子宮がん24例、胃がん24例、すい臓がん24例、前立腺癌24例、卵巣癌24例、腎臓がん24例、脳腫瘍24例、子宮頸がん13例、胆管がん24例、食道がん24例、膀胱がん24例、肉腫24例及び肝臓肝3例である。
図10(a)、図11(a)及び図12(a)には、対照における代表配列の種類とがん罹患者における代表配列の数を示すグラフに示している。具体的には、健常者由来のmiRNAにおける編集に基づく配列変動のありの代表配列の数、がん罹患者由来のmiRNAにおける編集に基づく配列変動のありの代表配列の数を示している。がん罹患者由来の代表配列の数については、がんのステージ0、1、2、3、4毎に分類して示している。更にがん罹患者のうち、再発情報のないものについてもデータとして示している。
図10では、がん罹患の有無の判断への寄与率の高い変異であると考えられる24種類のmiRNAを代表配列とした。図11では、NGSデータでRNA編集に基づく変異の存在が示された310種類のmiRNAを代表配列とした。図12では、データベース上で既に報告されているRNA編集に基づく変異を有する611種類のmiRNAを代表配列とした。それぞれの場合について、健常者由来のmiRNAとがん罹患者由来のmiRNAにおける配列変動ありの代表配列の数を図10(a)、図11(a)及び図12(a)にプロットしている。
図10に示すように、24種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数(グラフ縦軸)において、健常者とがん罹患者とを分ける閾値は3と設定できる。図10(b)には、閾値3が有効であることを検証した結果を示す。検証では、閾値を3として、がん罹患者全体と健常者全体について、実際に実験を行ってがん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は292例、陰性と判定される試料は54例であった。健常者群においては、陽性と判定される試料は1例、陰性と判定される試料は29例であった。図10(c)に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度84.4%、特異度96.7%、陽性的中率99.7%となり、実用に値することが検証によって明らかになっている。
図11に示すように、310種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数(グラフ縦軸)において、健常者とがん罹患者とを分ける閾値は28と設定できる。図11(b)には、閾値28が有効であることを検証した結果を示す。検証では、閾値を28として、がん罹患者全体と健常者全体について、実際に実験を行って、がん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は266例、陰性と判定される試料は80例であった。健常者群においては、陽性と判定される試料は3例、陰性と判定される試料は27例であった。図11(c)に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度76.9%、特異度90.0%、陽性的中率98.9%となり、実用に値することが検証によって明らかになっている。
図12に示すように、611種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数(グラフ縦軸)において、健常者とがん罹患者とを分ける閾値は23と設定できる。図12(b)には、閾値23が有効であることを検証した結果を示す。検証では、閾値を23として、がん罹患者全体と健常者全体について、実際に実験を行い、がん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は293例、陰性と判定される試料は53例であった。健常者群においては、陽性と判定される試料は5例、陰性と判定される試料は25例であった。図12(c)に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度84.7%、特異度83.3%、陽性的中率98.3%となり、実用に値することが検証によって明らかになっている。
第5の実施形態によれば、第1~第4の実施形態の対象のがん罹患の可能性を分析する方法において使用できる閾値を提供することが可能である。
(第6の実施形態)
健常者とがん罹患者を識別するためのマーカーとして、RNA編集に基づく配列変動を利用することが可能である。第6の実施形態であるマーカーは、参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の種類数である。言い換えると、対象に由来する試料中の配列変動のある代表配列の数である。
血清から検出されるRNAとしては、例えばmiRNAを用いることができるが、その個数と組み合わせに制限はない。選択したmiRNAの配列変動について、被験者、即ち、対象の配列変動が発生した種類数をカウントし、その個数を用いて健常者とがん罹患者を識別する。
配列変動の要因として、A-to-I RNA編集酵素ADAR1によるAからGへの変異が候補として挙げられる。ADAR1は二本鎖RNAのアデノシン(A)を加水分解的脱アミノ化反応によりイノシンへと変換する酵素である。イノシンの構造はDNAの構成因子の1つであるグアノシン(G)と類似しているため、翻訳時にグアノシンと認識される。すなわち、遺伝子配列的にはAからGへの変異と同等の表現型となる。あるいは、CからUへの変換も知られているが、これらに限定はしない。配列変動が発生する遺伝子上の位置を特定の個所に限定することも考えられる。例えば、SNPsとして検査対象の人種などで多様性が存在することが示されている部位は、検査対象者の一定割合がその変動を有することが事前にわかっていることとなるため、がんによって発生する配列変動としてみなさないといった限定方法が考えられる。あるいは生物学的に配列変動が発生する領域あるいは発生しにくい領域が明らかになっている場合には、発生のしやすさとその理由に応じて特に注目する領域を限定することが考えられるが、これに限定されない。
miRNAの体液中の配列変動数を決定する工程は、主に(i)被験者からの試料採取、(ii)試料からのmiRNAの抽出、(iii)標的miRNAの配列解読(iV)miRNAの種類に応じた配列の分類(V)miRNAの各種類内での配列変動の有無の検出、から成ることが好ましく、その代表的な手法を下記に記すが、これらに限定されない。さらに続いて配列変動数に基づいたがん罹患有無の識別をする罹患判定工程は(VI)閾値の設定(VII)閾値との大小比較、から成ることが好ましく、その代表的な手法を下記に記すが、これらに限定されない。
(i)被験者からの試料採取
測定に用いる試料は、被検者から採取されるものであり、特に限定されるものではなく、例えば、血液、血清、血漿、白血球、尿、消化液、唾液、胃液、汗、涙、鼻水、精液、膣液、羊水、乳汁、リンパ液、組織、口腔内粘膜、喀痰などを用いることができる。試料は、遠心、沈殿、抽出および/または分離などの処理を行い、核酸の増幅に適切である状態にする。また、採取された試料が、そのままで核酸の増幅に適切である場合には、採取された試料を検体として使用してよい。
(ii)試料からのmiRNAの抽出
核酸の抽出は、これらに限定されないが、市販の核酸抽出キットである、NucleoSpin(登録商標) miRNA Plasma(タカラバイオ製)、Quick-cfRNA Serum & Plasma Kit(ザイモリサーチ製)、miRNeasy Serum/Plasma キット(キアゲン製)、miRVana PARIS isolation kit(サーモフィッシャー製)、PureLinkTM Total RNA Blood Kit(サーモフィッシャー製)、Plasma/Serum RNA Purification Kit (Norgen Biotech製)、microRNA Extractor(登録商標) SP Kit(和光純薬)、High Pure miRNA Isolation Kit(シグマアルドリッチ製)などを利用して実行することができる。また、キットによらず、試料をバッファーで希釈した上で、80~100℃の加熱処理後に遠心分離して上清を得る、という簡便な方法を使うこともできる。
(iii)miRNAの配列解読(iV)miRNAの種類に応じた配列の分類、および(V)miRNAの各種類内での配列変動の有無の検出
体液中に存在するmiRNAの配列を測定する方法として、次世代シーケンサー(NGS)を用いて、体液中のmiRNAを網羅的に配列解読する方法がある。あるいは、ターゲットとなるmiRNAのみを特異的に増幅可能なプライマーを用いて増幅しサンガーシーケンス法で配列を確認する方法も用いることができるがこれらに限定されない。
次世代シーケンサーを使用する場合、illumina社製MiSeqやNextSeq550など、あるいはPacific Biosciences社製などの1分子シーケンサーなどを使用できるがこれに限定されない。リファレンスとして例えばヒトゲノム配列を用いてアライメントを実施することでmiRNAの種類に応じた配列の分類が可能である。アライメントにはBWAやbowtie, bowtie2などを使用できるがこれに限定されない。
サンガーシーケンス法を使用する場合、miRNAの種類に応じたプライマーを設計し配列を決定する。あるいは配列変動の変動前後における配列が決定できている場合、配列変動後の配列に特異的なプライマーを設計することで、そのプライマーで配列が解読できた場合に、配列変動が発生していたと判断することもできる。その場合には、qPCR法やデジタルPCR法などを利用することができる。あるいは、配列変動に特異的なプローブを付与したマイクロアレイを利用することもできる。
(VI)閾値の設定、(VII)閾値との大小比較
閾値の設定は、例えばROC(受信者動作特性試験、receiver operating characteristic)曲線を用いて設定する方法や、偽陽性や偽陰性の影響を考慮して設定する方法などがあるが、これらに限定されず検査の設計によって異なると考えられる。
ROC曲線は、X軸に(1-特異度)、Y軸に感度をプロットするもので、理想的な検査(感度100%、特異度100%)では左上隅に位置することになる。ROC曲線の下の面積(area under the curve、AUC)によって検査の有用性を評価できる。閾値の設定はYouden Indexと呼ばれる、(感度+特異度)を最大にする閾値を選択する方法と、ROC曲線の左上隅からの距離((1-感度)+(1-特異度))が最小になる閾値を選択する方法の2種類がある。これらの手法で閾値を設定する場合、偽陽性と偽陰性の重要度が同等である場合が一般的である。一方、例えばがんが早期であれば治療法が確立されており、陽性者を確実に発見することが重要ながん種の場合、偽陽性よりも偽陰性を低くすることが重要であると考えることができる。その場合には偽陽性に対する偽陰性の重みづけを大きく考えて閾値を設定することができる。このような閾値の設定にはEZR(Bone Marrow Transplantation 2013: 48, 452-458)やJMPなどの統計ソフトを利用することができる。
(実施例1)
がん罹患者と健常者の血清中核酸の配列変動を指標とした識別について以下に示す。
検体数は健常者血清30検体とがん罹患者検体346検体とした。がん罹患者検体の内訳は、乳がん24検体、大腸がん24、胃がん24、肺がん18、卵巣がん24、膵臓がん24、胆道がん24、食道がん24、肝臓がん3、脳腫瘍24、膀胱がん24、前立腺がん24、肉腫24、子宮がん24、腎臓がん24、子宮頸がん13であった。
血清中の核酸配列は、次世代シーケンサー解析により決定した。すべての血清300μLから、miRNeasy Serum/Plasma Kit(Qiagen)を用いてmiRNAを抽出した。抽出したmiRNAはQIAseq miRNA Library Kit(Qiagen)およびQIAseq miRNA NGS 96 Index IL(Qiagen)を用いてプロトコルに従って実施した。
使用したインデックスにはUMIと呼ばれる分子バーコード技術が用いられており、ライブラリ調整に伴う遺伝子増幅によるPCR Duplicateや増幅バイアスの影響を排除でき、より正確な配列決定が可能である。NGS解析はNextSeq500(シングルエンド、75bp)を用いて実施し、全検体について1000万リード以上のデータを得た。UMI-tools(Genome Res. (2017) 27(3):491-499. PMID: 28100584)のextractコマンドを利用し、UMIを除去したFASTQファイルを得た。
さらにリード品質によるQCを実施した。miRNAの種類に応じた配列の分類として、miRBase Release 22に対するアノテーションを実施した。また、miRBase Release 22の配列を野生型、すなわち配列変動が発生していない配列とした。配列変動の候補として、特にmiRNAの5’末端側10bpに着目した。miRNAの5’末端から2~8塩基目の7bp程度には、Seed配列と呼ばれる領域が存在する。
この領域はmiRNAがその機能を発揮するために重要とされている領域で、個人の遺伝子情報に依存した配列変動の発生率が低いと考えられる。配列変動の候補としてA-to-I RNA編集酵素ADAR1によるAからGへの変異に注目した。miRNAに対するA-to-I変異が導入されうる配列はデータベース(MiREDiBase[引用])としてまとめられており、条件を満たす変異のリストを入手したところ388種類のmiRNAに対して611種類の配列変動候補が存在した。NGS解析結果のアノテーション結果から、注目するmiRNAの配列情報を抽出し、データベースと一致する配列変動が存在するかどうかを各検体について解析した。
各検体について611種類の配列変動候補のうち何種類で配列変動が発生したかをカウントし、その合計数を各検体の配列変動種類数として以降の解析に用いた。各検体の種別(がん/健常者)と配列変動種類数を用いてROC曲線を作成し、AUC値を算出した。結果を図13に示す。
ROC(受信者動作特性試験、receiver operating characteristic)曲線は、X軸に(1-特異度)、Y軸に感度をプロットするもので、理想的な検査(感度100%、特異度100%)では左上隅に位置することになる。ROC曲線の下の面積(area under the curve、AUC)によって検査の有用性を評価できる。その結果、AUC値は0.887(95%信頼区間 0.841-0.934)であった。611種類の配列変動候補のうち23種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は84.7%、特異度83.3%、陽性的中率98.3%となり(図13(c))、高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。
(実施例2)
がん罹患者と健常者の血清中核酸の配列変動を指標とした識別のうち、事前に配列変動が起きる配列の情報がない状況で実施する手法について以下に示す。実施例1に記載したNGS解析データを用いる。配列変動の候補として事前データを用いずに、実際のNGSの配列情報において配列変動が検出されたものを利用した。NGSの配列変動はmiRBase Release 22の配列を野生型、すなわち配列変動が発生していない配列とし、同じmiRNAにアライメントされた集団中で配列変動が発生しているmiRNAと変動様式を網羅的に検出し利用した。あるいは、VCFファイルを出力することで配列変動が発生しているmiRNAとその変動様式を出力した。この際、実施例1と同様にmiRNAの5’末端側10bpに着目したところ、310種類の配列変動候補が選別できた。結果を図14に示す。
実施例1と同様に配列変動が存在するかどうかを各検体について解析したところ、AUC値は0.854(95%信頼区間 0.802-0.906)であった。310種類の配列変動候補のうち28種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は76.9%、特異度90.0%、陽性的中率98.9%となり(図14(c))、高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。
(実施例3)
がん罹患者と健常者の血清中核酸の配列変動を指標とした識別のうち、選別したマーカーを利用して実施する手法について以下に示す。実施例1に記載したNGS解析データを用いる。実施例1、実施例2でがんと健常者の識別に特に寄与していた24種類に限定して同様の解析を実施したところ、AUC値は0.953(95%信頼区間 0.931-0.976)であった。結果を図11に示す。24種類の配列変動候補のうち3種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は84.4%、特異度96.7%、陽性的中率99.7%となり(図15(c))、限定したmiRNAを用いて検証した場合にも高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
以下に、本願発明の実施態様を付記する。
[1] 参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の当該RNAの種類数をカウントすること、得られた当該RNAの種類数を指標にして当該対象のがん罹患の可能性を判定することを含む、対象のがん罹患の可能性を分析する方法。
[2] 前記対象に由来する試料が体液であり、前記カウントすること及び判定することが以下の工程:
当該体液から、参照配列からの配列変動に関する情報を取得する試料データ取得工程と、
当該配列変動が存在するRNAの種類数をカウントする特徴抽出工程と、
当該配列変動が存在するRNAの種類数を指標として、がん罹患の可能性を識別する罹患判定工程と
を具備する、[1]に記載の分析する方法。
[3] 当該対象からの当該RNA種類数と、非がん者に由来する試料から得た当該RNA種類数とを比較することを更に含む、[1]又は[2]に記載の方法。
[4] 当該対象からの当該RNA種類数が、非がん者からの当該RNA種類数よりも多い場合に、当該対象ががんに罹患している可能性が高いと識別し、当該対象からの当該RNA種類数が、非がん者からの当該RNA種類数よりも少ないか、又は同等である場合に、当該対象ががんに罹患している可能性が低いと識別する、[3]に記載の方法。
[5] 前記体液が、血液、血清又は血漿である、[2]~[4]の何れか1項に記載の方法。
[6] 前記RNAが、miRNA、mRNA、tRNA又はpiRNAである、[1]~[5]の何れか1項に記載の方法。
[7] 前記RNAがmiRNAである、[1]~[5]の何れか1項に記載の方法。
[8] 前記配列変動が、RNA編集によって生じる、[1]~[7]の何れか1項に記載の方法。
[9] 前記配列変動が、RNA編集酵素によって生じる、[1]~[7]の何れか1項に記載の方法。
[10] 前記配列変動が、塩基の置換である、[1]~[9]の何れか1項に記載の方法。
[11]
対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、
各参照配列に対して分類された、RNA集団において同一の配列をもつ代表配列群を決定すること、
当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
当該配列変動を有する代表配列の種類数をカウントすること、
を含む、対象のがん罹患の可能性を分析する方法。
[12] 当該がんが、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんである、[1]~[11]の何れか1項に記載の方法。
[13] 対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるRNAをその配列の参照配列に対する相同性によって、それぞれ分類すること
各々の当該参照配列に対して分類されたRNA集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
当該対象又はがん罹患者に由来する試料と、当該対照に由来する試料とについて、当該代表配列群の各配列と各対応する参照配列とをそれぞれ比較し、当該配列変動をそれぞれ検出すること、
当該配列変動を有する代表配列の種類数をカウントすること、及び
前記対象又はがん罹患者と前記対照との間で、カウントされた代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
を更に備える、[1]~[12]に記載の対象のがん罹患の可能性を分析する方法。
[14] 当該閾値が、がん罹患者群における配列変動について得られる数の方が、非がん者群から得られる数よりも大きい、[1]~[12]に記載の対象のがん罹患の可能性を分析する方法。
[15] 閾値は2以上の整数である、[1]~[12]に記載の対象のがん罹患の可能性を分析する方法。
[16] 当該閾値は、そこにおいて使用される手法とRNAの種類によって決定される[1]~[12]に記載の対象のがん罹患の可能性を分析する方法。
[17]
対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、
各参照配列に対して分類された、RNA集団において同一の配列をもつ代表配列群を決定すること、
当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
当該配列変動の種類数をカウントすること
を備える配列変動を検出する方法。
[18] 特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な[17]に記載の方法。
[19]NGS、qPCR、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも1手法が選択されて使用される[1]~[18]の何れか1項に記載の方法。

Claims (20)

  1. 参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の当該RNAの種類数をカウントすること、得られた当該RNAの種類数を指標にして当該対象のがん罹患の可能性を判定することを含む、対象のがん罹患の可能性を分析する方法。
  2. 前記対象に由来する試料が体液であり、前記カウントすること及び判定することが以下の工程:
    当該体液から、参照配列からの配列変動に関する情報を取得する試料データ取得工程と、
    当該配列変動が存在するRNAの種類数をカウントする特徴抽出工程と、
    当該配列変動が存在するRNAの種類数を指標として、がん罹患の可能性を識別する罹患判定工程と
    を具備する、請求項1に記載の分析する方法。
  3. 当該対象からの当該RNA種類数と、非がん者に由来する試料から得た当該RNA種類数とを比較することを更に含む、請求項1又は請求項2に記載の方法。
  4. 当該対象からの当該RNA種類数が、非がん者からの当該RNA種類数よりも多い場合に、当該対象ががんに罹患している可能性が高いと識別し、当該対象からの当該RNA種類数が、非がん者からの当該RNA種類数よりも少ないか、又は同等である場合に、当該対象ががんに罹患している可能性が低いと識別する、請求項3に記載の方法。
  5. 前記体液が、血液、血清又は血漿である、請求項2に記載の方法。
  6. 前記RNAが、miRNA、mRNA、tRNA又はpiRNAである、請求項1、2及び5の何れか1項に記載の方法。
  7. 前記RNAが、miRNA、mRNA、tRNA又はpiRNAである、請求項3に記載の方法。
  8. 前記RNAが、miRNA、mRNA、tRNA又はpiRNAである、請求項4項に記載の方法。
  9. 前記配列変動が、RNA編集酵素によって生じる、請求項1に記載の方法。
  10. 前記配列変動が、塩基の置換である、請求項1に記載の方法。
  11. 対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、
    各参照配列に対して分類された、RNA集団において同一の配列をもつ代表配列群を決定すること、
    当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
    当該配列変動を有する当該代表配列の種類数をカウントすること
    を含む、対象のがん罹患の可能性を分析する方法。
  12. 前記RNAがmiRNAであり、当該がんが、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんである、請求項1、2及び5の何れか1項に記載の方法。
  13. 対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるRNAをその配列の参照配列に対する相同性によって、それぞれ分類すること
    各々の当該参照配列に対して分類されたRNA集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
    前記対象又はがん罹患者に由来する試料と、前記対照に由来する試料について、当該代表配列群の各配列と、対応する当該参照配列とを、それぞれ比較し、当該配列変動をそれぞれ検出すること、
    当該配列変動を有する代表配列の種類数をカウントすること、及び
    前記対象又はがん罹患者と前記対照との間で、カウントされた当該代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
    を更に備える、請求項1に記載の対象のがん罹患の可能性を分析する方法。
  14. 前記指標として判定することが、
    対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるRNAをその配列の参照配列に対する相同性によって、それぞれ分類すること
    各々の当該参照配列に対して分類されたRNA集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
    前記対象又はがん罹患者に由来する試料と、前記対照に由来する試料について、当該代表配列群の各配列と対応する当該参照配列とをそれぞれ比較し、当該配列変動をそれぞれ検出すること、
    当該配列変動を有する代表配列の種類数をカウントすること、及び
    前記対象又はがん罹患者と前記対照との間で、カウントされた当該代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
    により設定される閾値との比較によって行われ、
    当該閾値が、がん罹患者群における配列変動について得られる数の方が、非がん者群から得られる数よりも大きい、請求項1に記載の対象のがん罹患の可能性を分析する方法。
  15. 当該閾値は2以上の整数である、請求項14に記載の対象のがん罹患の可能性を分析する方法。
  16. 当該閾値は、そこにおいて使用される手法とRNAの種類によって決定される請求項14に記載の対象のがん罹患の可能性を分析する方法。
  17. NGS、qPCR、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも1手法が選択されて使用される請求項14に記載の対象のがん罹患の可能性を分析する方法。
  18. 対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、
    各参照配列に対して分類された、RNA集団において同一の配列をもつ代表配列群を決定すること、
    代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
    配列変動の種類数をカウントすること
    を備える配列変動を検出する方法。
  19. 特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な請求項18に記載の配列変動を検出する方法。
  20. NGS、qPCR、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも1手法が選択されて使用される請求項19に記載の配列変動を検出する方法。
JP2022149024A 2022-09-20 2022-09-20 対象のがん罹患の可能性を分析する方法 Pending JP2024043823A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022149024A JP2024043823A (ja) 2022-09-20 2022-09-20 対象のがん罹患の可能性を分析する方法
PCT/JP2023/031406 WO2024062867A1 (ja) 2022-09-20 2023-08-30 対象のがん罹患の可能性を分析する方法
US18/591,077 US20240200149A1 (en) 2022-09-20 2024-02-29 Method for analyzing probability of suffering from cancer in subject

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022149024A JP2024043823A (ja) 2022-09-20 2022-09-20 対象のがん罹患の可能性を分析する方法

Publications (1)

Publication Number Publication Date
JP2024043823A true JP2024043823A (ja) 2024-04-02

Family

ID=90454194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022149024A Pending JP2024043823A (ja) 2022-09-20 2022-09-20 対象のがん罹患の可能性を分析する方法

Country Status (3)

Country Link
US (1) US20240200149A1 (ja)
JP (1) JP2024043823A (ja)
WO (1) WO2024062867A1 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023524067A (ja) * 2020-05-01 2023-06-08 コーネル ユニバーシティー ヌクレアーゼ、ライゲーション、脱アミノ化、dna修復、およびポリメラーゼ反応と、キャリーオーバー防止との組み合わせを用いた、核酸配列、変異、コピー数、またはメチル化変化の特定および相対的定量化のための方法およびマーカー

Also Published As

Publication number Publication date
WO2024062867A1 (ja) 2024-03-28
US20240200149A1 (en) 2024-06-20

Similar Documents

Publication Publication Date Title
US11111541B2 (en) Diagnostic MiRNA markers for Parkinson's disease
CN111910004A (zh) cfDNA在早期乳腺癌无创诊断中的应用
CN106399304B (zh) 一种与乳腺癌相关的snp标记
KR20170100029A (ko) Y 염책체 메틸화 사이트의 전립선암 진단 마커로써의 응용
CN106661623A (zh) 使用miRNA生物标志物相对于多发性硬化诊断视神经脊髓炎
CN109715830A (zh) 用于使用基因表达谱诊断肺癌的组合物和方法
CN108866194B (zh) 一组用于膀胱癌检测的基因及其应用
CN104968802A (zh) 作为诊断标志物的新miRNA
CN114277143B (zh) 外泌体arpc5、cda等在肺癌诊断中的应用
CN113724862A (zh) 一种结直肠癌生物标志物及其筛选方法和应用
WO2024062867A1 (ja) 対象のがん罹患の可能性を分析する方法
CN112501295B (zh) miRNA组合、含其的试剂盒及在肺癌诊断中的应用
CN114507738A (zh) 甲基化位点、检测甲基化水平的产品的用途及试剂盒
WO2022121960A1 (zh) 泛癌症早筛预测方法
WO2023063049A1 (ja) がん検出のためのバイオマーカーセットの作製方法
CN116287252B (zh) 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用
WO2024047914A1 (en) Analysis method, kit, and detection device for cancer diagnosis by means of microrna expression
CN106520957B (zh) Dhrs7易感snp位点检测试剂及其制备的试剂盒
WO2022199570A1 (zh) 用于Basal型胰腺导管腺癌(PDAC)诊断的标志物组合及其应用
JP7299765B2 (ja) マイクロrna測定方法およびキット
CN106868191B (zh) 真核翻译延伸因子在检测乳腺癌试剂中的应用
WO2021192397A1 (ja) がん検査方法
CN106834491B (zh) 乳腺癌预后相关基因突变检测试剂盒及其使用方法
TWI676688B (zh) 辨識細胞種類型之方法及系統
CN106811528B (zh) 一种乳腺癌治病基因新突变及其应用