WO2024062867A1

WO2024062867A1 - 対象のがん罹患の可能性を分析する方法

Info

Publication number: WO2024062867A1
Application number: PCT/JP2023/031406
Authority: WO
Inventors: 友美安東; 美津子石原; 良威佐野; 拓也宮川; 幸二橋本
Original assignee: 株式会社東芝
Priority date: 2022-09-20
Filing date: 2023-08-30
Publication date: 2024-03-28
Also published as: US20240200149A1; JP2024043823A

Abstract

実施形態のがん罹患の可能性を分析する方法は、参照配列に比較して、ＲＮＡ編集に基づく配列変動が存在するＲＮＡの種類について、対象に由来する試料中の当該ＲＮＡの種類数をカウントすること、得られた当該ＲＮＡの種類数を指標にして当該対象のがん罹患の可能性を判断することを含む。

Description

対象のがん罹患の可能性を分析する方法

　本発明の実施形態は、対象のがん罹患の可能性を分析する方法に関する。

　採取が容易な体液から分離される核酸を解析することでがん罹患者と健常者を識別する系が知られている。例えば、広く検証されている系は、ｍｉＲＮＡ（ｍｉｃｒｏＲＮＡ）を用いた識別系である。ｍｉＲＮＡは、１７～２５塩基程度の一本鎖核酸であり、遺伝子発現を調節する機能を持つことが明らかにされている。その種類や発現量は、種々の疾患において、初期の段階から変化していることが報告されている。例えば、がん患者では、種々のｍｉＲＮＡ量が、がんマーカーとして使用されており、健常者と比較して増加、或いは減少していることが知られている。これらの知見は、被験者ががんか否かを知るための手段として、被検者から採取された試料中の目的とするｍｉＲＮＡを定量的に調べることを提案している。

特開２０２０－２０２７６８号

　本発明が解決しようとする課題は、より簡便に、早期段階のがんを検出することが可能な方法を提供することである。

図１は、第１の実施形態を示すスキーム図である。図２は、第１の実施形態の１例について説明する図である。図３は、第２の実施形態の１例を示すスキーム図である。図４は、第２の実施形態の更なる１例を示すスキーム図である。図５は、第３の実施形態を示すスキーム図である。図６は、第４の実施形態の１例を示すスキーム図である。図７は、第４の実施形態の１例を示す図である。図８は、第４の実施形態の１例を示す図である。図９は、第５の実施形態を示すスキーム図である。図１０は、第５の実施形態の１例を示す図である。図１１は、第５の実施形態の更なる例を示す図である。図１２は、第５の実施形態の更なる例を示す図である。図１３は、例１の結果を示す図である。図１４は、例２の結果を示す図である。図１５は、例３の結果を示す図である。

実施形態

　以下、実施形態について、添付の図面を参照して説明する。なお、各実施形態において、実質的に同一の構成部位には同一の符号を付し、その説明を一部省略する場合がある。図面は模式的なものであり、各部の厚さと平面寸法との関係、各部の厚さの比率等は現実のものとは異なる場合がある。

　（第１の実施形態）
　本願の実施形態に係る分析方法は、ＲＮＡ編集に基づく配列変動がＲＮＡ群においてどのように存在しているのかを明らかにすることによって、がん罹患者と非がん者とを識別できる知見を得たことにより達成されたものである。この発見により、対象のがん罹患の可能性を定量ではなく、定性的に分析することが可能になる。それによって、より簡便に、ひいては、より安価に、早期段階でがんを発見することが可能である。例えば、遺伝子を定量する必要がないので、定量性能を担保する必要がない。当該分析方法は、非常に独創的な発見に基づいた飛躍的且つ画期的な方法である。

　第１の実施形態について、図１を用いて説明する。この実施形態は、対象のがん罹患の可能性を分析する方法である。当該分析方法は、参照配列に比較して、ＲＮＡ編集に基づく配列変動が存在するＲＮＡの種類について、対象に由来する試料中のその数、即ち、種類数をカウントすること、得られた種類数を指標にして当該対象のがん罹患の可能性を判定することを含む。

　ＲＮＡ編集（RNA editing）とは、ＤＮＡから転写されたＲＮＡ、又は転写中のＲＮＡの塩基配列を置換したり、１～数塩基を挿入したり、削除したりする、動植物における機構である。ＲＮＡ転写後の修飾の１つとも考えられており、様々な生体プロセスの制御に係わっていることが報告されている。図２を用いて、代表的なＲＮＡ編集の例について説明する。即ち、代表的なＲＮＡ編集の例は、（１）Ａ－ｔｏ－Ｉ　ＲＮＡ編集、（２）Ｃ－ｔｏ－Ｕ　ＲＮＡ編集、（３）１～数塩基の挿入、（４）１～数塩基の削除（欠失）などである。Ａ－ｔｏ－Ｉ　ＲＮＡ編集（adenosin to inosin editing）は、ＡＤＡＲ酵素によるＲＮＡ編集である。アデノシン（Ａ）のアミノ基を加水分解し、イノシン（Ｉ）に置換するものであり、翻訳時には、化学構造が類似しているグアノシン（Ｇ）として認識される。Ｃ－ｔｏ－Ｕ　ＲＮＡ編集（cytidine to uridine editing）は、シチジン（Ｃ）からウリジン（Ｕ）に置換されるものである。当該分析方法においては、ＲＮＡ編集の機序は問わず、参照配列に照らして、配列変動が存在するＲＮＡについて、試料中の種類数がカウントされればよい。

　参照配列は、ＲＮＡ編集による配列変動が発生していない配列であればよく、例えば、対応する野生型の配列であり得る。野生型の配列の情報は、例えば、ＲＮＡの種類に応じた遺伝子バンク、例えば、Ｅｎｓｅｍｂｌ又はＮＣＢＩなどの全ての遺伝子データが集まるデータベースや、ｍｉＲＮＡのデータベースであるｍｉＲＢａｓｅなど特定の種類のＲＮＡの情報を収集しているデータベースを利用しても、参照してもよく、また情報の更新があれば所望に応じて最新の情報を参照し得る。また、参照配列は、特定の全長ＲＮＡであっても、特定のＲＮＡの部分配列であっても、その組み合わせであってもよい。

　対象由来の試料とは、対象から採取された細胞、組織及び／又は液体、或いは、それらの混合物、それらを適切に処理することにより得られた処理物等を含む。試料が体液である場合、例えば、血清又は血漿であってよく、或いはその他の体液、例えば、血液、白血球間質液、尿、便、汗、唾液、口腔内粘膜、鼻腔内粘膜、鼻水、咽頭粘膜、喀痰、消化液、胃液、リンパ液、髄液、涙液、母乳、羊水、精液、膣液又はそれらの混合物等であってもよい。或いは、試料は、組織若しくは細胞、又はそれらの混合物等であってもよい。また試料は、対象から採取された直後のもの、培養されたもの、所望の手続きで保存されたもの、或いはそれらを所望の液体中に維持した後に得られるその上清であってもよい。採取が容易であるので、血液、血清及び血漿などの体液を対象由来の試料とすることは好ましい。

　試料についてのＲＮＡに関する情報は、試料からＲＮＡを抽出した後に行われ得る。ＲＮＡの抽出方法は、それ自身公知の方法により行われてよく、例えば、市販のキットを使用することも可能である。

　対象は、本方法において分析に供される動物、即ち、試料を提供する動物である。対象は、何らかの疾患を有する動物であってもよいし、健常な動物であってもよい。例えば、対象は、がんに罹患している可能性がある動物、或いは過去にがんに罹患したことのある動物等であってもよく、特に、乳がんに罹患している可能性がある動物、或いは過去に乳がんに罹患したことのある動物等であってもよい。対象はヒトであることが好ましい。

　或いは、対象は他の動物であってもよい。他の動物は、例えば哺乳動物であり、例えば、サル等の霊長類、マウス、ラット又はモルモット等の齧歯類、イヌ、ネコ又はウサギ等の伴侶動物、ウマ、ウシ又はブタ等の家畜動物、或いは展示動物等に属する動物を含む。

　当該分析方法では、対象に由来する試料中に含まれる母集団ＲＮＡのうち、何種類のＲＮＡが、ＲＮＡ編集に基づく配列変動を有しているのか、種類数をカウントし、得られた種類数を指標にして対象のがん罹患の可能性を判断する。当該分析方法においては、配列変動を有するＲＮＡについて、特定のＲＮＡ種の発現量やコピー数を量るのではなく、対象からの試料に含まれるＲＮＡのうち、ＲＮＡ編集によって、参照配列とは異なる配列を有する、即ち、配列変動を有するＲＮＡが何種類あるのか、その数をカウントする。詳しくは後述するが、種類数のカウントは、例えば、特定のカテゴリーのＲＮＡを網羅的に調べ、カウントしてもよく、特定又は任意のＲＮＡ母集団を設定し、それらについて網羅的に調べてカウントしてもよい。例えば、ＲＮＡ母集団に含まれるＲＮＡ分子の数は、例えば、使用するデータベースに登録される数としても、或いは、そこから任意に選択してもよい。例えば、現時点のｍｉＲＢａｓｅには、２７１の生物種に対して３８５８９のｐｒｅ－ｍｉＲＮＡが、４８６０のｍｉＲＮＡが登録されている。そのうち、ヒトゲノムは、１９１７のｐｒｅ－ｍｉＲＮＡ、２６５４のｍｉＲＮＡが登録されている。これらの数をＲＮＡ母集団に含まれるＲＮＡ分子の数とし得るが、これらに限定されるものではない。例えば、特定のＲＮＡ母集団を形成する場合、例えば、対象とするｍｉＲＮＡの数を制限する方法であれば、発現量が単純に多いものから選ぶ方法や、検体間で発現量のばらつきの小さいものから選ぶ、あるいは変異の比率の高いものから選ぶ、検体間の変異の比率のばらつきが小さいものから選ぶなどの基準が考えられるが、これらに限定されるものではない。また、ＲＮＡの長さは、例えば、ｍｉＲＮＡであれば、約１７塩基長～約２５塩基長であり得るが、これらに限定されるものではない。またＰｒｅ－ｍｉＲＮＡであれば、例えば、約６０塩基対～約７０塩基対であり得る。ＲＮＡの長さは、例えば、ｍｉＲＮＡであれば、１７塩基長～２５塩基長であり得るが、これらに限定されるものではない。またＰｒｅ－ｍｉＲＮＡであれば、例えば、６０塩基対～７０塩基対であり得る。

　カウントされるＲＮＡは、ＲＮＡ編集に基づく配列変動が存在し得るＲＮＡ種であればよく、例えば、ＲＮＡ、ｍＲＮＡ、ｎｃＲＮＡ（non-coding RNA）、ハウスキーピング　ｎｃＲＮＡ、ｔＲＮＡ、スモールｎｃＲＮＡ、ｍｉＲＮＡ、ｐｉＲＮＡ、ｔｓＲＮＡ、ＩｎｃＲＮＡなどであってもよい。これらのＲＮＡは、カテゴリー包括的にカウントされてもよく、幾つかのカテゴリーが混合している状態でカウントされてもよく、特定のカテゴリーのＲＮＡについてカウントされてもよい。例えば、特定のカテゴリーのＲＮＡをカウントする場合には、ｍＲＮＡ、ｔＲＮＡ、スモールｎｃＲＮＡ、ｍｉＲＮＡ、ｐｉＲＮＡ、ｔｓＲＮＡなどであってよく、例えば、それらのうちの少なくとも２カテゴリーの混合物であってもよい。或いは、そのような特定のカテゴリーのＲＮＡは、例えば、ｍｉＲＮＡであってよい。配列変動を有するＲＮＡについて、特定のＲＮＡ種の発現量やコピー数ではなく、ＲＮＡ群に分布しているＲＮＡの種類の数をカウントし、得られた種類数に基づいて対象のがん罹患の可能性の高さが判断され得る。

　ＲＮＡ編集による配列変動をより精度よく追跡するためには、転写以前の核酸、例えば、ゲノム上で起こり得る配列変動や多様性、例えば、多型、変異、置換、欠失、挿入などの頻度が低く、影響が出にくい部位、例えば、高度に保存された配列、又は高度に保存された部位の配列若しくはそれを含む配列を選択してもよい。例えば、ｍｉＲＮＡであれば、シード配列を称される５’末端の１位～１０位には、一般的に一塩基多型などの存在確率が低く、配列変動性が低いため高い有用性があるといえる。

　対象のがん罹患の可能性を分析するとは、例えば、対象ががんを罹患している可能性があるのか否かを判定すること、対象ががんを罹患している可能性が高い又は低いことを判定すること、対象ががん罹患者であるのか、非がん者であるのかを識別することなどであってもよい。第１の実施形態によれば、対象ががんに罹患している可能性の高さを客観的な比較基準に基づいて機械的及び／又は自動的に決定することが可能である。例えば、対象のがん罹患の可能性を分析する方法は、例えば「対象ががんに罹患している可能性に関する情報を取得する方法」との言い換えることが可能である。取得された情報は、例えば、医師が医療目的で「対象」である人間の病状や健康状態等について判断、即ち、診断するために利用することが可能である。このような医師による「判断」、即ち「診断」を「対象における標的がん群の罹患の有無の判定」であるとすれば、当該実施形態は、「医師」によるこのような医療目的での「対象におけるがんの罹患の有無の判定」を「補助する分析方法」であるともいえる。

　例えば、判定は、予め設定した閾値よりも大きい数の種類数があった場合に、対象ががんを罹患している可能性が高いとすることができる。或いは、予め設定した閾値よりも小さい数の種類数があった場合に、対象ががんを罹患している可能性が低いとすることもできる。閾値の設定は、母集団ＲＮＡ及び参照配列を対応させて、非がん者に由来する試料を用いてえられた結果と代表的ながん罹患者に由来する試料を用いて得られた結果とを予め比較することにより決定されてもよい。

　本明細書においてがんは、何れの病期のものも含み、例えば、発生母地の臓器内にがんが留まった状態、更に周辺の組織までがんが及んだ状態、更にリンパ節へがんが転移した状態、及び更に離れた臓器へのがんの転移がある状態等を含む。また本明細書において乳がんは、乳腺組織に形成される悪性腫瘍（新生物）をいう。例えば、乳がんは、一般に「乳癌」又は「乳がん」と称されるものも含む。また、実施形態に従う乳がんは、何れの種類の乳がんも含み、例えば乳腺小葉がん又は乳管がんを含む。また、実施形態に従う乳がんは、例えば上皮性腫瘍、非上皮性腫瘍、並びに上皮性及び非上皮性の両方からなる悪性葉状腫瘍を含む。

　例えば、がんは、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんであり得る。

　本実施形態の方法は、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。

　例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。がんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。

　（第２の実施形態）
　第２の実施形態は、対象のがん罹患の可能性を分析する方法である。当該分析方法は、対象からの試料について第１の実施例に示したように種類数をカウントするのに加えて、対象、例えば、非がん対照からの試料についても同様に種類数をカウントする。得られた種類数を指標にして、この実施形態において、対象からの種類数と非がん対照からの種類数とを比較することで、当該対象のがん罹患の可能性を判断する。

　対照は、例えば、健常体であり得る。健常体とは、少なくともがんに罹患していない個体であってよい。健常体は、疾患や異常を有さない健康な個体であることが好ましい。対照として選択される個体は、本方法で分析される対象とは別の個体であってもよく、同じ種に属する個体、即ち対象がヒトであればヒトであることが好ましい。また、対照の年齢、性別及び身長体重等の身体的条件又は人数は特に限定されるものではないが、身体的条件は、本分析方法で検査を受ける対象のものと同じ又は類似であることが好ましい。或いは、経時的に対象由来の試料を採取し、対象が、健常体である場合の検査結果を対照、非がん者若しくは非がん対照として使用してもよい。

　図３を用いて、第２の実施形態としての当該分析方法の１例について概念的に説明する。第２の実施形態の１例として、ヒトを対象として、ＲＮＡは、特定のカテゴリーとしてのｍｉＲＮＡを選択し、カウントする例を示している（図３、Ｓ３１（ａ）、Ｓ３２Ａ、Ｓ３２Ｂ）。ここでは、対象は対象者、対照は非がん対照者、母集団ＲＮＡは母集団ｍｉＲＮＡと表している。また図３には、比較例として一般的な定量試験の１例についても概念的に示した（図３、Ｓ３１（ｆ）、Ｓ３２Ａ（ｇ）、Ｓ３２Ｂ（ｈ））。

　まず、最初に、対象者からの試料（ａ）と非がん対照者からの試料（ｆ）を準備する（Ｓ３１）。これらの試料に含まれる特定のカテゴリーのＲＮＡを母集団として、ＲＮＡ編集に基づく配列変動が存在するＲＮＡの種類について、対象者と非がん対照者に由来する試料中の種類数をカウントする（Ｓ３２Ａ（ｂ）、（ｂ１）、（ｂ２））。この例では、母集団ｍｉＲＮＡは、血清中に存在するｍｉＲＮＡを網羅的に分類して分析し、ＲＮＡ編集に基づく配列変動が存在するＲＮＡの種類をカウントした例を示す。母集団ｍｉＲＮＡのうちの５種類、ｍｉＲ－１、ｍｉＲ－２、ｍｉＲ－３、ｍｉＲ－４及びｍｉＲ－５を代表的に図３に示し、他の画分については省略している（Ｓ３２Ａ（ｂ））。この場合の判定基準は、非がん対照者よりも多くの種類のｍｉＲＮＡにＲＮＡ編集に基づく配列変動が存在した場合に、対象者はがんに罹患している可能性が高いと識別する。

　以下、便宜的にコピー数にまで言及してシミュレーションする。非がん者の試料においては、ｍｉＲ－１は３コピー、ｍｉＲ－２が２コピー、ｍｉＲ－３が６コピー、ｍｉＲ－４が０コピー、ｍｉＲ－５が２コピーとして、血清中に分泌しているとする（Ｓ３２Ａ（ｂ１））。そのうちのｍｉＲ－３の２コピーにＲＮＡ編集が見られている（それぞれｘ印）。この場合、非がん者由来の試料におけるＲＮＡ編集に基づく配列変動が存在するＲＮＡは、１種類、即ちｍｉＲ－３のみである。これに対して、対象者ががん罹患者であったことを仮定してシミュレーションした結果を示す。対象者では、ｍｉＲ－１は１２コピー、ｍｉＲ－２が９コピー、ｍｉＲ－３が１０コピー、ｍｉＲ－４が５コピー、ｍｉＲ－５が９コピーとして、血清中に分泌している（Ｓ３２Ａ（ｂ２））。そのうちのｍｉＲ－１の２コピー、ｍｉＲ－２の１コピー、ｍｉＲ－３の３コピー、ｍｉＲ－４の１コピーにＲＮＡ編集が見られる（それぞれｘ印）。従って、対象者由来の試料におけるＲＮＡ編集に基づく配列変動が存在するＲＮＡは、ｍｉＲ－１～ｍｉＲ－４の４種類である。比較すると、対照者の１種類に比べて、対象者は４種類であり、種類数が多い。この結果から、対象者はがんに罹患している可能性が高いと識別される。

　当該分析方法は、定性試験であり、ここで使用される母集団ｍｉＲＮＡに含まれる各種類のｍｉＲＮＡの配列、標的、機能及び表現型などの特性は、一切考慮することなく、単にＲＮＡ編集に基づく変異があるのか、もしくはないのか、を判定し、且つその種類について、非がん対照者と対象者との間で数を比較することによって、対象者の「がん」である可能性の高低を判定することができる。

　これに対して、一般的に知られる特定の種類のｍｉＲＮＡをがんマーカーとして使用し、対象の「がん」の可能性の高低を判定する場合には、定量試験が行われている。即ち、図３（ｇ）に示すように、対象者からの試料（ａ）と非がん対照者からの試料（ｆ）を準備し
（Ｓ３１）、その後、非がん者の試料に含まれる特定のｍｉＲＮＡ（ここでは便宜的にｍｉＲ－０と示している）の発現量（Ｓ３２Ａ（ｇ１））と、対象者の試料に含まれる対応するｍｉＲＮＡ（ここでは、ｍｉＲ－０）の発現量（Ｓ３２Ａ（ｇ２））とを比較する。そして、比較の結果、例えば、対象者からの試料のｍｉＲ－０が対照者よりもその量が多い場合に、対象者は「がん」である可能性が高いと判定される。

　本実施形態の分析方法において、ＲＮＡ編集に基づく配列変動が存在するＲＮＡの種類数をカウントすることは、例えば、Ｓ３２Ｂに示すように、がん組織中の変異頻度と血清中へのｍｉＲＮＡの分泌量との両方の情報を含んでいるともいえる。言い換えると、一般的に定量試験の場合、例えば、血清中へのｍｉＲＮＡの分泌量が、正常細胞で少なく、がん細胞で多いという情報（Ｓ３２Ｂ（ｈ））、がん組織中の変異頻度が正常細胞で少なく、がん細胞で多いという情報（Ｓ３２Ｂ（ｉ））を掛け合わせた情報が血清中のｍｉＲＮＡで変異が検出されるｍｉＲＮＡの種類数、正常細胞では（少ない×少ない）、がん細胞では（多い×多い）となる（Ｓ３２Ｂ（ｃ））。これにより、結果が強調されることにより、より見やすい結果となり得る。また、濃度ではなく個数を指標とした定性試験となり得る。

　上述のような第２の実施形態は、図４のスキーム図に示しているように、参照配列に比較し、ＲＮＡ変種に基づく配列変動が存在するＲＮＡの種類について、対象に由来する試料中の種類数をカウントする（Ｓ４１）ことと、得られた種類数と、対照に由来する試料から得られた種類数とを比較して、その結果を基に当該対象のがん罹患の可能性を判断する（Ｓ４２）ことを備えていてもよい。

　母集団となるｍｉＲＮＡは、それ自体公知の何れのｍｉＲＮＡのデータベースを利用して、或いは公知の発見ツールなどを利用して独自にデータベースを作製した後に、それらのデータベースに含まれる任意の種類のｍｉＲＮＡから任意に選択、設計及び／又は設定すればよい。ｍｉＲＮＡのデータベースの例は、ｍｉＲＮＡＢａｓｅ，Ｒｆａｍ、ｍｉＲＩＡＤ、ｄｂＤＥＭＣなどであってもよい。発見ツールの例は、ｍｉＲｓｃａｎ、ｍｉＲＮＡＦｏｌｄ、ｍｉＲＤｅｅｐ、ｍｉＲａｎａｌｙｚｅｒ、ＣｈＩＰＢａｓｅ、ｓＲＮＡｂｅｎｃｈなどであってもよい。或いは、ＭｉＲＥＤｉＢａｓｅ（ｍｉＲＮＡ　Ｅｄｉｔｉｎｇ　Ｄａｔａｂａｓｅ）などのＲＮＡ編集に基づく変異を起こし得る配列が登録されているｍｉＲＮＡのデータベースから任意に選択されてもよい。母集団に含まれるｍｉＲＮＡの数は、例えば、３００種以上、４００種類以上、５００種類以上、６００種類以上であってよい。

　第２の実施形態は、本発明者らが、低侵襲に採取できる体液から核酸を分離し、その配列変動を利用して健常者とがん罹患者を識別できることを見出したことに基づく。言い換えると、第２の実施形態により、低侵襲に採取できる体液から核酸を分離し、その配列変動を利用して健常者とがん罹患者を識別することが可能である。また、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。また例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。

　（第３の実施形態）
　第３の実施形態である対象のがん罹患の可能性を分析する方法を図５に示した。当該方法は、３つの工程、試料データ取得工程（Ｓ５１）と、特徴抽出工程（Ｓ５２）と、罹患判定工程（Ｓ５３）とを備える。試料データ取得工程では、参照配列からの配列変動に関する情報を、対象から得られた体液から取得する（Ｓ５１）。参照配列から配列変動に関する情報とは、体液中に含まれるＲＮＡについての情報である。特徴抽出工程では、配列変動が存在するＲＮＡの種類数をカウントする（Ｓ５２）。罹患判定工程では、配列変動が存在するＲＮＡの種類数を指標として、がん罹患の有無の可能性を決定する。或いは、この罹患判定工程は、当該指標を用いて、対象が、がん罹患者であるのか、非がん者であるのかを識別される工程であってもよい。

　本実施形態の方法が、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。

　例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。これによりがんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。また、血清又は血漿は、そこに含まれるＲＮＡ濃度、例えば、ｍｉＲＮＡ濃度が安定しているため、より正確な検査を行うことが可能である。

　（第４の実施形態）
　第４の実施形態である対象のがん罹患の可能性を分析する方法を図６に示す。当該分析方法は、４つの工程を含む。まず、対象に由来する試料に含まれるＲＮＡをその配列の参照配列に対する相同性によって分類する（Ｓ６１）。次に、各参照配列に対して分類されたＲＮＡ集団で同一の配列をもつ代表配列群を決定する（Ｓ６２）。代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出する（Ｓ６３）。更に、配列変動を有する当該代表配列の種類数をカウントする（Ｓ６４）。この方法はまた、配列変動を検出する方法として使用され得る。配列変動を検出する方法は、対象に由来する試料に含まれるＲＮＡをその配列の参照配列に対する相同性によって分類すること、各参照配列に対して分類されたＲＮＡ集団で同一の配列をもつ代表配列群を決定すること、代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、を備え得る。更に、特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な配列変動を検出する方法でもあり得る。

　ＲＮＡ配列の相同性によって分類するとは、情報を得ようとするＲＮＡの特定の部位の配列について、相同性の高い配列同士を１グループに分類することにより、複数のグループを作るということである。その際に、参照配列（データベースから入手した既知の配列）をグループの基準の配列として使用する。相同性による分類は、例えば、次世代シーケンサー（ＮＧＳ）、ｑＰＣＲ、サンガー、ＲＮＡ検出用のマイクロアレイ、及びハイブリダイゼーションなどを使用することによって行われ得る。或いはこれらの手法を少なくとも２つ組み合わせて使用することにより行われてもよい。

　例えば、ｍｉＲＮＡについて、次世代シーケンサーを使用して網羅的に分析する例のイメージを図７～図１１に示す。図７（ａ）に示すように、試料は、健常者３０例、乳がん２４例、肺がん１８例、大腸がん２４例、子宮がん２４例、胃がん２４例、すい臓がん２４例、前立腺癌２４例、卵巣癌２４例、腎臓がん２４例、脳腫瘍２４例、子宮頸がん１３例、胆管がん２４例、食道がん２４例、膀胱がん２４例、肉腫２４例及び肝臓肝３例から採取した血清を用いた。図７（ｂ）に示すように、分析したｍｉＲＮＡは、ｈａｓ－ｌｅｔ－７ａ－２－３ｐ、ｈａｓ－ｌｅｔ－７ａ－３ｐ、ｈａｓ－ｌｅｔ－７ａ－５ｐ、ｈａｓ－ｌｅｔ－７ｂ－３ｐ、ｈａｓ－ｌｅｔ－７ｂ－５ｐ、ｈａｓ－ｌｅｔ－７ｃ－３ｐ、ｈａｓ－ｌｅｔ－７ｃ－５ｐ、ｈａｓ－ｌｅｔ－７ｄ－３ｐ、ｈａｓ－ｌｅｔ－７ｄ－５ｐ、ｈａｓ－ｌｅｔ－７ｅ－３ｐ、ｈａｓ－ｌｅｔ－７ｅ－５ｐ、ｈａｓ－ｌｅｔ－７ｆ－３ｐ、ｈａｓ－ｌｅｔ－７ｆ－５ｐ、ｈａｓ－ｌｅｔ－７ｇ－３ｐ、ｈａｓ－ｌｅｔ－７ｇ－５ｐ、ｈａｓ－ｌｅｔ－７ｉ－３ｐ、ｈａｓ－ｌｅｔ－７ｉ－５ｐ、ｈａｓ－ｍｉＲ－１００－３ｐ、ｈａｓ－ｍｉＲ－１００－５ｐ、ｈａｓ－ｍｉＲ－１０１－３ｐ、ｈａｓ－ｍｉＲ－１０１－５ｐ、ｈａｓ－ｍｉＲ－１０３ａ－２ｐ、ｈａｓ－ｍｉＲ－１０３ａ－３ｐ、ｈａｓ－ｍｉＲ－１０３ｂ、ｈａｓ－ｍｉＲ－１０５－３ｐ、ｈａｓ－ｍｉＲ－１０３－５ｐ、ｈａｓ－ｍｉＲ－１０６ａ－３ｐ、ｈａｓ－ｍｉＲ－１０６ａ－５ｐ、ｈａｓ－ｍｉＲ－１０６ｂ－３ｐを含む２６５４種類である。まず、これらのｍｉＲＮＡについて、健常者及びがん罹患者について１例ずつ、次世代シーケンサーにより定量した。図７（ｂ）には、その結果の一部分を示している。ｍｉＲＮＡの名前をカラムＡに、カラムＣ、Ｄ、Ｅ…と、３０例の健常者、各がんの罹患者データを並べて示している。これは、対象に由来する試料に含まれるRNAが、その配列の相同性によって、分類された状態である。

　次に、分類された集団それぞれ（＝各miRNA、例えばAGCTAGCT）で参照配列に対して配列変動を持つかどうかを決定するために、分類された各集団の代表配列群（= AGCTAGCT（野生型）あるいは変異型AGCTGGCTあるいはAGCTAGTT）のうち、参照配列に対して配列変動を持つ配列（＝変異型AGCTGGCTあるいはAGCTAGTT）を１つあるいは複数選んだ。各集団から選ばれた配列変動を持つ配列を候補リストと定めた。すなわち、候補リストは集団名と配列変動を持つ配列情報から成る。候補リストと同一の集団に選ばれた配列変動を持つ配列と同一の配列（＝AGCTGGCTあるいはAGCTAGTT）を持つ場合に、その候補に対して変異を持つと判定した。図８（ｃ）の表は、図７（ｂ）からのデータの一部分であり、５例の健常者と６例のがん罹患者について、予め作製されたｍｉＲＮＡ変異候補リストに含まれる種類のｍｉＲＮＡについて変異の有無を決定する。図８（ｃ）においては、ｍｉＲＮＡ＿ｍｕｔａｎｔ＿１、ｍｉＲＮＡ＿ｍｕｔａｎｔ＿２、ｍｉＲＮＡ＿ｍｕｔａｎｔ＿３、ｍｉＲＮＡ＿ｍｕｔａｎｔ＿４、ｍｉＲＮＡ＿ｍｕｔａｎｔ＿５、ｍｉＲＮＡ＿ｍｕｔａｎｔ＿６、ｍｉＲＮＡ＿ｍｕｔａｎｔ＿７がｍｉＲＮＡ変異候補の一部分として示されている。変異があるものは「１」、変異のないものは「０」を入力し、変異リスト全体で変異が存在したｍｉＲＮＡの種類数をカウントする。予め決定された閾値又は随時決定される閾値以上のｍｉＲＮＡ変異検出種類数であった場合に、がん罹患者である可能性が高いと判断される。

　閾値の決定は、がん罹患者に由来する試料と非がん者に由来する試料とを予め分析及び比較することにより決定してもよく、対象に由来する試料を分析する度に、非がん者に由来するからの情報を分析し、比較することによって決定してもよい。例えば、閾値の例は、２、３、５、１０、２３、２５、２６又は３０などであるが、これに限定されるものではない。マーカーとして使用するｍｉＲＮＡの種類数を最大値としてもよい。例えば、閾値は、当該分析方法において使用される手法とＲＮＡの種類によって決定されてもよい。

　本実施形態の方法が、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。また例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。

　例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、がんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。また、血清又は血漿は、そこに含まれるＲＮＡ濃度、例えば、ｍｉＲＮＡ濃度が安定しているため、より正確な検査を行うことが可能である。

　（第５の実施形態）
　第５の実施形態は、がん罹患者である可能性が高いと判断するために使用される閾値を設定する方法である。当該閾値設定方法は、４つの工程を含む（図９）。まず、対象又はがん罹患者に由来する試料と非がん者に由来する試料について、それぞれ含まれるＲＮＡをその配列の参照配列に対する相同性によって、それぞれ分類する（Ｓ９１）。次に、各々の参照配列に対して分類されたＲＮＡ集団において、同一の配列をもつ代表配列群を、それぞれ決定する（Ｓ９２）。対象又はがん罹患者に由来する試料と対照に由来する試料とについて、代表配列群の各配列と各対応する参照配列とをそれぞれ比較し、配列変動をそれぞれ検出する（Ｓ９３）。検出結果を基に、配列変動を有する代表配列の種類数をカウントする（Ｓ９４）。対象又はがん罹患者と対照との間で、カウントされた代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定する（Ｓ９５）。

　当該閾値を設定する方法を、ｍｉＲＮＡをＲＮＡの１例とした場合について、閾値を設定するイメージとして図１０～１２に示す。図１０には、２４種類のｍｉＲＮＡについて、がん罹患者に由来する試料と対照としての健常者とを比較する１例を示した。この例において、健常者の数は、３０例とした（ｎ＝３０）。がん罹患者の数は、３４６例であり（ｎ＝３４６）、がん種の内訳は、乳がん２４例、肺がん１８例、大腸がん２４例、子宮がん２４例、胃がん２４例、すい臓がん２４例、前立腺癌２４例、卵巣癌２４例、腎臓がん２４例、脳腫瘍２４例、子宮頸がん１３例、胆管がん２４例、食道がん２４例、膀胱がん２４例、肉腫２４例及び肝臓肝３例である。

　図１０（ａ）、図１１（ａ）及び図１２（ａ）には、対照における代表配列の種類とがん罹患者における代表配列の数を示すグラフに示している。具体的には、健常者由来のｍｉＲＮＡにおける編集に基づく配列変動のありの代表配列の数、がん罹患者由来のｍｉＲＮＡにおける編集に基づく配列変動のありの代表配列の数を示している。がん罹患者由来の代表配列の数については、がんのステージ０、１、２、３、４毎に分類して示している。更にがん罹患者のうち、再発情報のないものについてもデータとして示している。

　図１０では、がん罹患の有無の判断への寄与率の高い変異であると考えられる２４種類のｍｉＲＮＡを代表配列とした。図１１では、ＮＧＳデータでＲＮＡ編集に基づく変異の存在が示された３１０種類のｍｉＲＮＡを代表配列とした。図１２では、データベース上で既に報告されているＲＮＡ編集に基づく変異を有する６１１種類のｍｉＲＮＡを代表配列とした。それぞれの場合について、健常者由来のｍｉＲＮＡとがん罹患者由来のｍｉＲＮＡにおける配列変動ありの代表配列の数を図１０（ａ）、図１１（ａ）及び図１２（ａ）にプロットしている。

　図１０に示すように、２４種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数（グラフ縦軸）において、健常者とがん罹患者とを分ける閾値は３と設定できる。図１０（ｂ）には、閾値３が有効であることを検証した結果を示す。検証では、閾値を３として、がん罹患者全体と健常者全体について、実際に実験を行ってがん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は２９２例、陰性と判定される試料は５４例であった。健常者群においては、陽性と判定される試料は１例、陰性と判定される試料は２９例であった。図１０（ｃ）に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度８４．４％、特異度９６．７％、陽性的中率９９．７％となり、実用に値することが検証によって明らかになっている。

　図１１に示すように、３１０種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数（グラフ縦軸）において、健常者とがん罹患者とを分ける閾値は２８と設定できる。図１１（ｂ）には、閾値２８が有効であることを検証した結果を示す。検証では、閾値を２８として、がん罹患者全体と健常者全体について、実際に実験を行って、がん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は２６６例、陰性と判定される試料は８０例であった。健常者群においては、陽性と判定される試料は３例、陰性と判定される試料は２７例であった。図１１（ｃ）に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度７６．９％、特異度９０．０％、陽性的中率９８．９％となり、実用に値することが検証によって明らかになっている。

　図１２に示すように、６１１種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数（グラフ縦軸）において、健常者とがん罹患者とを分ける閾値は２３と設定できる。図１２（ｂ）には、閾値２３が有効であることを検証した結果を示す。検証では、閾値を２３として、がん罹患者全体と健常者全体について、実際に実験を行い、がん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は２９３例、陰性と判定される試料は５３例であった。健常者群においては、陽性と判定される試料は５例、陰性と判定される試料は２５例であった。図１２（ｃ）に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度８４．７％、特異度８３．３％、陽性的中率９８．３％となり、実用に値することが検証によって明らかになっている。

　第５の実施形態によれば、第１～第４の実施形態の対象のがん罹患の可能性を分析する方法において使用できる閾値を提供することが可能である。

　（第６の実施形態）
　健常者とがん罹患者を識別するためのマーカーとして、ＲＮＡ編集に基づく配列変動を利用することが可能である。第６の実施形態であるマーカーは、参照配列に比較して、ＲＮＡ編集に基づく配列変動が存在するＲＮＡの種類について、対象に由来する試料中の種類数である。言い換えると、対象に由来する試料中の配列変動のある代表配列の数である。

　血清から検出されるＲＮＡとしては、例えばｍｉＲＮＡを用いることができるが、その個数と組み合わせに制限はない。選択したｍｉＲＮＡの配列変動について、被験者、即ち、対象の配列変動が発生した種類数をカウントし、その個数を用いて健常者とがん罹患者を識別する。

　配列変動の要因として、Ａ－ｔｏ－Ｉ　ＲＮＡ編集酵素ＡＤＡＲ１によるＡからＧへの変異が候補として挙げられる。ＡＤＡＲ１は二本鎖ＲＮＡのアデノシン（Ａ）を加水分解的脱アミノ化反応によりイノシンへと変換する酵素である。イノシンの構造はＤＮＡの構成因子の１つであるグアノシン（Ｇ）と類似しているため、翻訳時にグアノシンと認識される。すなわち、遺伝子配列的にはＡからＧへの変異と同等の表現型となる。あるいは、ＣからＵへの変換も知られているが、これらに限定はしない。配列変動が発生する遺伝子上の位置を特定の個所に限定することも考えられる。例えば、ＳＮＰｓとして検査対象の人種などで多様性が存在することが示されている部位は、検査対象者の一定割合がその変動を有することが事前にわかっていることとなるため、がんによって発生する配列変動としてみなさないといった限定方法が考えられる。あるいは生物学的に配列変動が発生する領域あるいは発生しにくい領域が明らかになっている場合には、発生のしやすさとその理由に応じて特に注目する領域を限定することが考えられるが、これに限定されない。

　ｍｉＲＮＡの体液中の配列変動数を決定する工程は、主に（ｉ）被験者からの試料採取、（ｉｉ）試料からのｍｉＲＮＡの抽出、（ｉｉｉ）標的ｍｉＲＮＡの配列解読（ｉＶ）ｍｉＲＮＡの種類に応じた配列の分類（Ｖ）ｍｉＲＮＡの各種類内での配列変動の有無の検出、から成ることが好ましく、その代表的な手法を下記に記すが、これらに限定されない。さらに続いて配列変動数に基づいたがん罹患有無の識別をする罹患判定工程は（VI）閾値の設定（VII）閾値との大小比較、から成ることが好ましく、その代表的な手法を下記に記すが、これらに限定されない。

（ｉ）被験者からの試料採取
　測定に用いる試料は、被検者から採取されるものであり、特に限定されるものではなく、例えば、血液、血清、血漿、白血球、尿、消化液、唾液、胃液、汗、涙、鼻水、精液、膣液、羊水、乳汁、リンパ液、組織、口腔内粘膜、喀痰などを用いることができる。試料は、遠心、沈殿、抽出および／または分離などの処理を行い、核酸の増幅に適切である状態にする。また、採取された試料が、そのままで核酸の増幅に適切である場合には、採取された試料を検体として使用してよい。

（ｉｉ）試料からのｍｉＲＮＡの抽出
　核酸の抽出は、これらに限定されないが、市販の核酸抽出キットである、ＮｕｃｌｅｏＳｐｉｎ（登録商標）　ｍｉＲＮＡ　Ｐｌａｓｍａ（タカラバイオ製）、Ｑｕｉｃｋ－ｃｆＲＮＡ　Ｓｅｒｕｍ　＆　Ｐｌａｓｍａ　Ｋｉｔ（ザイモリサーチ製）、ｍｉＲＮｅａｓｙ　Ｓｅｒｕｍ／Ｐｌａｓｍａキット（キアゲン製）、ｍｉＲＶａｎａ　ＰＡＲＩＳ　ｉｓｏｌａｔｉｏｎ　ｋｉｔ（サーモフィッシャー製）、ＰｕｒｅＬｉｎｋ^ＴＭ　Ｔｏｔａｌ　ＲＮＡ　Ｂｌｏｏｄ　Ｋｉｔ（サーモフィッシャー製）、Ｐｌａｓｍａ／Ｓｅｒｕｍ　ＲＮＡ　Ｐｕｒｉｆｉｃａｔｉｏｎ　Ｋｉｔ　（Ｎｏｒｇｅｎ　Ｂｉｏｔｅｃｈ製)、ｍｉｃｒｏＲＮＡ　Ｅｘｔｒａｃｔｏｒ（登録商標）　ＳＰ　Ｋｉｔ(和光純薬)、Ｈｉｇｈ　Ｐｕｒｅ　ｍｉＲＮＡ　Ｉｓｏｌａｔｉｏｎ　Ｋｉｔ（シグマアルドリッチ製）などを利用して実行することができる。また、キットによらず、試料をバッファーで希釈した上で、８０～１００℃の加熱処理後に遠心分離して上清を得る、という簡便な方法を使うこともできる。

　（ｉｉｉ）ｍｉＲＮＡの配列解読（ｉＶ）ｍｉＲＮＡの種類に応じた配列の分類、および（Ｖ）ｍｉＲＮＡの各種類内での配列変動の有無の検出
　体液中に存在するｍｉＲＮＡの配列を測定する方法として、次世代シーケンサー（ＮＧＳ）を用いて、体液中のｍｉＲＮＡを網羅的に配列解読する方法がある。あるいは、ターゲットとなるｍｉＲＮＡのみを特異的に増幅可能なプライマーを用いて増幅しサンガーシーケンス法で配列を確認する方法も用いることができるがこれらに限定されない。

　次世代シーケンサーを使用する場合、ｉｌｌｕｍｉｎａ社製ＭｉＳｅｑやＮｅｘｔＳｅｑ５５０など、あるいはＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ社製などの１分子シーケンサーなどを使用できるがこれに限定されない。リファレンスとして例えばヒトゲノム配列を用いてアライメントを実施することでｍｉＲＮＡの種類に応じた配列の分類が可能である。アライメントにはＢＷＡやｂｏｗｔｉｅ，　ｂｏｗｔｉｅ２などを使用できるがこれに限定されない。

　サンガーシーケンス法を使用する場合、ｍｉＲＮＡの種類に応じたプライマーを設計し配列を決定する。あるいは配列変動の変動前後における配列が決定できている場合、配列変動後の配列に特異的なプライマーを設計することで、そのプライマーで配列が解読できた場合に、配列変動が発生していたと判断することもできる。その場合には、ｑＰＣＲ法やデジタルＰＣＲ法などを利用することができる。あるいは、配列変動に特異的なプローブを付与したマイクロアレイを利用することもできる。

　（VI）閾値の設定、（VII）閾値との大小比較
　閾値の設定は、例えばＲＯＣ（受信者動作特性試験、ｒｅｃｅｉｖｅｒ　ｏｐｅｒａｔｉｎｇ　ｃｈａｒａｃｔｅｒｉｓｔｉｃ）曲線を用いて設定する方法や、偽陽性や偽陰性の影響を考慮して設定する方法などがあるが、これらに限定されず検査の設計によって異なると考えられる。

　ＲＯＣ曲線は、Ｘ軸に（１－特異度）、Ｙ軸に感度をプロットするもので、理想的な検査（感度１００％、特異度１００％）では左上隅に位置することになる。ＲＯＣ曲線の下の面積（ａｒｅａ　ｕｎｄｅｒ　ｔｈｅ　ｃｕｒｖｅ、ＡＵＣ）によって検査の有用性を評価できる。閾値の設定はＹｏｕｄｅｎ　Ｉｎｄｅｘと呼ばれる、（感度＋特異度）を最大にする閾値を選択する方法と、ＲＯＣ曲線の左上隅からの距離（（１－感度）^２＋（１－特異度）^２）が最小になる閾値を選択する方法の２種類がある。これらの手法で閾値を設定する場合、偽陽性と偽陰性の重要度が同等である場合が一般的である。一方、例えばがんが早期であれば治療法が確立されており、陽性者を確実に発見することが重要ながん種の場合、偽陽性よりも偽陰性を低くすることが重要であると考えることができる。その場合には偽陽性に対する偽陰性の重みづけを大きく考えて閾値を設定することができる。このような閾値の設定にはＥＺＲ（Ｂｏｎｅ　Ｍａｒｒｏｗ　Ｔｒａｎｓｐｌａｎｔａｔｉｏｎ　２０１３：　４８，　４５２－４５８）やＪＭＰなどの統計ソフトを利用することができる。

　（実施例１）
　がん罹患者と健常者の血清中核酸の配列変動を指標とした識別について以下に示す。

　検体数は健常者血清３０検体とがん罹患者検体３４６検体とした。がん罹患者検体の内訳は、乳がん２４検体、大腸がん２４、胃がん２４、肺がん１８、卵巣がん２４、膵臓がん２４、胆道がん２４、食道がん２４、肝臓がん３、脳腫瘍２４、膀胱がん２４、前立腺がん２４、肉腫２４、子宮がん２４、腎臓がん２４、子宮頸がん１３であった。

　血清中の核酸配列は、次世代シーケンサー解析により決定した。すべての血清３００μＬから、ｍｉＲＮｅａｓｙ　Ｓｅｒｕｍ／Ｐｌａｓｍａ　Ｋｉｔ（Ｑｉａｇｅｎ）を用いてｍｉＲＮＡを抽出した。抽出したｍｉＲＮＡはＱＩＡｓｅｑ　ｍｉＲＮＡ　Ｌｉｂｒａｒｙ　Ｋｉｔ（Ｑｉａｇｅｎ）およびＱＩＡｓｅｑ　ｍｉＲＮＡ　ＮＧＳ　９６　Ｉｎｄｅｘ　ＩＬ（Ｑｉａｇｅｎ）を用いてプロトコルに従って実施した。

　使用したインデックスにはＵＭＩと呼ばれる分子バーコード技術が用いられており、ライブラリ調整に伴う遺伝子増幅によるＰＣＲ　Ｄｕｐｌｉｃａｔｅや増幅バイアスの影響を排除でき、より正確な配列決定が可能である。ＮＧＳ解析はＮｅｘｔＳｅｑ５００（シングルエンド、７５ｂｐ）を用いて実施し、全検体について１０００万リード以上のデータを得た。ＵＭＩ－ｔｏｏｌｓ（Genome Res. (2017) 27(3):491-499.　PMID: 28100584）のｅｘｔｒａｃｔコマンドを利用し、ＵＭＩを除去したＦＡＳＴＱファイルを得た。

　さらにリード品質によるＱＣを実施した。ｍｉＲＮＡの種類に応じた配列の分類として、ｍｉＲＢａｓｅ　Ｒｅｌｅａｓｅ　２２に対するアノテーションを実施した。また、ｍｉＲＢａｓｅ　Ｒｅｌｅａｓｅ　２２の配列を野生型、すなわち配列変動が発生していない配列とした。配列変動の候補として、特にｍｉＲＮＡの５’末端側１０ｂｐに着目した。ｍｉＲＮＡの５’末端から２～８塩基目の７ｂｐ程度には、Ｓｅｅｄ配列と呼ばれる領域が存在する。

　この領域はｍｉＲＮＡがその機能を発揮するために重要とされている領域で、個人の遺伝子情報に依存した配列変動の発生率が低いと考えられる。配列変動の候補としてＡ－ｔｏ－Ｉ　ＲＮＡ編集酵素ＡＤＡＲ１によるＡからＧへの変異に注目した。ｍｉＲＮＡに対するＡ－ｔｏ－Ｉ変異が導入されうる配列はデータベース（ＭｉＲＥＤｉＢａｓｅ[引用]）としてまとめられており、条件を満たす変異のリストを入手したところ３８８種類のｍｉＲＮＡに対して６１１種類の配列変動候補が存在した。ＮＧＳ解析結果のアノテーション結果から、注目するｍｉＲＮＡの配列情報を抽出し、データベースと一致する配列変動が存在するかどうかを各検体について解析した。

　各検体について６１１種類の配列変動候補のうち何種類で配列変動が発生したかをカウントし、その合計数を各検体の配列変動種類数として以降の解析に用いた。各検体の種別（がん／健常者）と配列変動種類数を用いてＲＯＣ曲線を作成し、ＡＵＣ値を算出した。結果を図１３に示す。

　ＲＯＣ（受信者動作特性試験、receiver operating characteristic）曲線は、Ｘ軸に（１－特異度）、Ｙ軸に感度をプロットするもので、理想的な検査（感度１００％、特異度１００％）では左上隅に位置することになる。ＲＯＣ曲線の下の面積（ａｒｅａ　ｕｎｄｅｒ　ｔｈｅ　ｃｕｒｖｅ、ＡＵＣ）によって検査の有用性を評価できる。その結果、ＡＵＣ値は０．８８７（９５％信頼区間　０．８４１－０．９３４）であった。６１１種類の配列変動候補のうち２３種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は８４．７％、特異度８３．３％、陽性的中率９８．３％となり（図１３（ｃ））、高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。

　（実施例２）
　がん罹患者と健常者の血清中核酸の配列変動を指標とした識別のうち、事前に配列変動が起きる配列の情報がない状況で実施する手法について以下に示す。実施例１に記載したＮＧＳ解析データを用いる。配列変動の候補として事前データを用いずに、実際のＮＧＳの配列情報において配列変動が検出されたものを利用した。ＮＧＳの配列変動はｍｉＲＢａｓｅ　Ｒｅｌｅａｓｅ　２２の配列を野生型、すなわち配列変動が発生していない配列とし、同じｍｉＲＮＡにアライメントされた集団中で配列変動が発生しているｍｉＲＮＡと変動様式を網羅的に検出し利用した。あるいは、ＶＣＦファイルを出力することで配列変動が発生しているｍｉＲＮＡとその変動様式を出力した。この際、実施例１と同様にｍｉＲＮＡの５’末端側１０ｂｐに着目したところ、３１０種類の配列変動候補が選別できた。結果を図１４に示す。

　実施例１と同様に配列変動が存在するかどうかを各検体について解析したところ、ＡＵＣ値は０．８５４（９５％信頼区間　０．８０２－０．９０６）であった。３１０種類の配列変動候補のうち２８種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は７６．９％、特異度９０．０％、陽性的中率９８．９％となり（図１４（ｃ））、高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。

　（実施例３）
　がん罹患者と健常者の血清中核酸の配列変動を指標とした識別のうち、選別したマーカーを利用して実施する手法について以下に示す。実施例１に記載したＮＧＳ解析データを用いる。実施例１、実施例２でがんと健常者の識別に特に寄与していた２４種類に限定して同様の解析を実施したところ、ＡＵＣ値は０．９５３（９５％信頼区間　０．９３１－０．９７６）であった。結果を図１１に示す。２４種類の配列変動候補のうち３種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は８４．４％、特異度９６．７％、陽性的中率９９．７％となり（図１５（ｃ））、限定したｍｉＲＮＡを用いて検証した場合にも高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。

　本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

　以下に、本願発明の実施態様を付記する。
［１］　参照配列に比較して、ＲＮＡ編集に基づく配列変動が存在するＲＮＡの種類について、対象に由来する試料中の当該ＲＮＡの種類数をカウントすること、得られた当該ＲＮＡの種類数を指標にして当該対象のがん罹患の可能性を判定することを含む、対象のがん罹患の可能性を分析する方法。
［２］　前記対象に由来する試料が体液であり、前記カウントすること及び判定することが以下の工程：
当該体液から、参照配列からの配列変動に関する情報を取得する試料データ取得工程と、
当該配列変動が存在するＲＮＡの種類数をカウントする特徴抽出工程と、
当該配列変動が存在するＲＮＡの種類数を指標として、がん罹患の可能性を識別する罹患判定工程と
を具備する、［１］に記載の分析する方法。
［３］　当該対象からの当該ＲＮＡ種類数と、非がん者に由来する試料から得た当該ＲＮＡ種類数とを比較することを更に含む、［１］又は［２］に記載の方法。
［４］　当該対象からの当該ＲＮＡ種類数が、非がん者からの当該ＲＮＡ種類数よりも多い場合に、当該対象ががんに罹患している可能性が高いと識別し、当該対象からの当該ＲＮＡ種類数が、非がん者からの当該ＲＮＡ種類数よりも少ないか、又は同等である場合に、当該対象ががんに罹患している可能性が低いと識別する、［３］に記載の方法。
［５］　前記体液が、血液、血清又は血漿である、［２］～［４］の何れか１項に記載の方法。
［６］　前記ＲＮＡが、ｍｉＲＮＡ、ｍＲＮＡ、ｔＲＮＡ又はｐｉＲＮＡである、［１］～［５］の何れか１項に記載の方法。
［７］　前記ＲＮＡがｍｉＲＮＡである、［１］～［５］の何れか１項に記載の方法。
［８］　前記配列変動が、ＲＮＡ編集によって生じる、［１］～［７］の何れか１項に記載の方法。
［９］　前記配列変動が、ＲＮＡ編集酵素によって生じる、［１］～［７］の何れか１項に記載の方法。
［１０］　前記配列変動が、塩基の置換である、［１］～［９］の何れか１項に記載の方法。
［１１］　対象に由来する試料に含まれるＲＮＡをその配列の参照配列に対する相同性によって分類すること、
各参照配列に対して分類された、ＲＮＡ集団において同一の配列をもつ代表配列群を決定すること、
当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
当該配列変動を有する代表配列の種類数をカウントすること、
を含む、対象のがん罹患の可能性を分析する方法。
［１２］　当該がんが、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんである、［１］～［１１］の何れか１項に記載の方法。
［１３］　対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるＲＮＡをその配列の参照配列に対する相同性によって、それぞれ分類すること
各々の当該参照配列に対して分類されたＲＮＡ集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
当該対象又はがん罹患者に由来する試料と、当該対照に由来する試料とについて、当該代表配列群の各配列と各対応する参照配列とをそれぞれ比較し、当該配列変動をそれぞれ検出すること、
当該配列変動を有する代表配列の種類数をカウントすること、及び
前記対象又はがん罹患者と前記対照との間で、カウントされた代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
を更に備える、［１］～［１２］に記載の対象のがん罹患の可能性を分析する方法。
［１４］　当該閾値が、がん罹患者群における配列変動について得られる数の方が、非がん者群から得られる数よりも大きい、［１］～［１２］に記載の対象のがん罹患の可能性を分析する方法。
［１５］　閾値は２以上の整数である、［１］～［１２］に記載の対象のがん罹患の可能性を分析する方法。
［１６］　当該閾値は、そこにおいて使用される手法とＲＮＡの種類によって決定される［１］～［１２］に記載の対象のがん罹患の可能性を分析する方法。
［１７］　対象に由来する試料に含まれるＲＮＡをその配列の参照配列に対する相同性によって分類すること、
各参照配列に対して分類された、ＲＮＡ集団において同一の配列をもつ代表配列群を決定すること、
当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
当該配列変動の種類数をカウントすること
を備える配列変動を検出する方法。
［１８］　特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な［１７］に記載の方法。
［１９］　ＮＧＳ、ｑＰＣＲ、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも１手法が選択されて使用される［１］～［１８］の何れか１項に記載の方法。

Claims

　参照配列に比較して、ＲＮＡ編集に基づく配列変動が存在するＲＮＡの種類について、対象に由来する試料中の当該ＲＮＡの種類数をカウントすること、得られた当該ＲＮＡの種類数を指標にして当該対象のがん罹患の可能性を判定することを含む、対象のがん罹患の可能性を分析する方法。
　前記対象に由来する試料が体液であり、前記カウントすること及び判定することが以下の工程：
当該体液から、参照配列からの配列変動に関する情報を取得する試料データ取得工程と、
当該配列変動が存在するＲＮＡの種類数をカウントする特徴抽出工程と、
当該配列変動が存在するＲＮＡの種類数を指標として、がん罹患の可能性を識別する罹患判定工程と
を具備する、請求項１に記載の分析する方法。
　当該対象からの当該ＲＮＡ種類数と、非がん者に由来する試料から得た当該ＲＮＡ種類数とを比較することを更に含む、請求項１又は請求項２に記載の方法。
　当該対象からの当該ＲＮＡ種類数が、非がん者からの当該ＲＮＡ種類数よりも多い場合に、当該対象ががんに罹患している可能性が高いと識別し、当該対象からの当該ＲＮＡ種類数が、非がん者からの当該ＲＮＡ種類数よりも少ないか、又は同等である場合に、当該対象ががんに罹患している可能性が低いと識別する、請求項３に記載の方法。
　前記体液が、血液、血清又は血漿である、請求項２に記載の方法。
　前記ＲＮＡが、ｍｉＲＮＡ、ｍＲＮＡ、ｔＲＮＡ又はｐｉＲＮＡである、請求項１、２及び５の何れか１項に記載の方法。
　前記ＲＮＡが、ｍｉＲＮＡ、ｍＲＮＡ、ｔＲＮＡ又はｐｉＲＮＡである、請求項３に記載の方法。
　前記ＲＮＡが、ｍｉＲＮＡ、ｍＲＮＡ、ｔＲＮＡ又はｐｉＲＮＡである、請求項４項に記載の方法。
　前記配列変動が、ＲＮＡ編集酵素によって生じる、請求項１に記載の方法。
　前記配列変動が、塩基の置換である、請求項１に記載の方法。
　対象に由来する試料に含まれるＲＮＡをその配列の参照配列に対する相同性によって分類すること、
各参照配列に対して分類された、ＲＮＡ集団において同一の配列をもつ代表配列群を決定すること、
当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
当該配列変動を有する当該代表配列の種類数をカウントすること
を含む、対象のがん罹患の可能性を分析する方法。
　前記ＲＮＡがｍｉＲＮＡであり、当該がんが、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんである、請求項１、２及び５の何れか１項に記載の方法。
　対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるＲＮＡをその配列の参照配列に対する相同性によって、それぞれ分類すること
各々の当該参照配列に対して分類されたＲＮＡ集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
前記対象又はがん罹患者に由来する試料と、前記対照に由来する試料について、当該代表配列群の各配列と、対応する当該参照配列とを、それぞれ比較し、当該配列変動をそれぞれ検出すること、
当該配列変動を有する代表配列の種類数をカウントすること、及び
前記対象又はがん罹患者と前記対照との間で、カウントされた当該代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
を更に備える、請求項１に記載の対象のがん罹患の可能性を分析する方法。
　前記指標として判定することが、
　対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるＲＮＡをその配列の参照配列に対する相同性によって、それぞれ分類すること
各々の当該参照配列に対して分類されたＲＮＡ集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
前記対象又はがん罹患者に由来する試料と、前記対照に由来する試料について、当該代表配列群の各配列と対応する当該参照配列とをそれぞれ比較し、当該配列変動をそれぞれ検出すること、
当該配列変動を有する代表配列の種類数をカウントすること、及び
前記対象又はがん罹患者と前記対照との間で、カウントされた当該代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
により設定される閾値との比較によって行われ、
当該閾値が、がん罹患者群における配列変動について得られる数の方が、非がん者群から得られる数よりも大きい、請求項１に記載の対象のがん罹患の可能性を分析する方法。
　当該閾値は２以上の整数である、請求項１４に記載の対象のがん罹患の可能性を分析する方法。
　当該閾値は、そこにおいて使用される手法とＲＮＡの種類によって決定される請求項１４に記載の対象のがん罹患の可能性を分析する方法。
　ＮＧＳ、ｑＰＣＲ、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも１手法が選択されて使用される請求項１４に記載の対象のがん罹患の可能性を分析する方法。
　対象に由来する試料に含まれるＲＮＡをその配列の参照配列に対する相同性によって分類すること、
各参照配列に対して分類された、ＲＮＡ集団において同一の配列をもつ代表配列群を決定すること、
代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
配列変動の種類数をカウントすること
を備える配列変動を検出する方法。
　特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な請求項１８に記載の配列変動を検出する方法。
　ＮＧＳ、ｑＰＣＲ、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも１手法が選択されて使用される請求項１９に記載の配列変動を検出する方法。