WO2014175427A1

WO2014175427A1 - Ｄｎａの状態を評価する方法、装置及びプログラム

Info

Publication number: WO2014175427A1
Application number: PCT/JP2014/061701
Authority: WO
Inventors: 永典奈須; 敦美辻本; 和敏吉武; 孝五條堀
Original assignee: 日本ソフトウェアマネジメント株式会社
Priority date: 2013-04-26
Filing date: 2014-04-25
Publication date: 2014-10-30
Also published as: JPWO2014175427A1

Abstract

　核酸情報を用いてＤＮＡの評価をより容易に行う。　ＤＮＡの評価方法であって、個体の所定の組織の塩基配列の情報を取得する塩基配列情報取得手順と、塩基配列情報取得手順によって互いに異なる時期に取得した塩基配列の情報間で相違する配列部分が塩基配列に対して占める率を変異率として特定する変異率特定手順と、変異率に応じてＤＮＡを評価するＤＮＡの評価手順と、を備えることを特徴とする。

Description

ＤＮＡの状態を評価する方法、装置及びプログラム

　本発明は、環境要因等に起因するＤＮＡの変異といったＤＮＡの状態を評価する方法、装置及びプログラムに関する。

　遺伝子疾患とは、広義の遺伝子（ゲノム）の異常に起因する疾患の総称である。遺伝子疾患のなかでも、前世代から遺伝子の異常が遺伝するものを遺伝病と称する。遺伝病以外の遺伝子疾患は、放射線や紫外線といった電磁波、化学物質、大気中に浮遊する微粒子状物質、或いは食生活といった様々な要因が後天的に関与する。すなわち、これらの要因により遺伝子に異常を来たし、遺伝病以外の遺伝子疾患を発症する。

　また、遺伝子疾患の中には、特定の遺伝子における特定の変異が原因として解明されているものもあるし、様々な多数の変異が蓄積されることで発症するものもある。例えば、変異によって遺伝子の発現、構造及び/又は機能に異常をきたし、正常細胞のがん化を誘引する遺伝子をがん遺伝子と呼んでいる。すなわち、癌もまた遺伝子疾患の一例と言える。

　このように、遺伝子異常の蓄積、すなわちＤＮＡに変異が多く生じると、狭義の遺伝子（タンパク質のコーディング領域）や発現調節領域などの機能領域にも変異が生じる確率が高くなり、遺伝子疾患に罹患する確率が上がる。

　例えば、特許文献１には、ＤＮＡチップ又はＤＮＡマイクロアレイと呼ばれる装置を用いて、ＤＮＡに生じた多数の変異を効率良く検出する方法が開示されている。この方法によれば、ＤＮＡの所定の領域における変異の有無やその割合を検出することができる。この方法によれば、例えば、疾患と関連する遺伝子領域に対する変異の有無、変異の割合を迅速に検出することができ、或いは、病気の症状とその原因遺伝子の変異部位との関連を解析することができる。

　また、特許文献２には、心筋梗塞に関連する遺伝子多型が開示されている。いわゆる次世代シーケンサーと呼ばれる装置を用いれば、病気の関連遺伝子の領域全体にわたって塩基の変異の有無や変異の割合を検出し、病気の症状とその関連遺伝子の変異との関連を解析することができる。

特開2004-8037号公報特開2011-172543号公報

　しかしながら、特許文献１や２に記載された従来の方法では、検出対象として選択した所定の領域における変異の有無を評価して特定の疾患等に対するリスクなどを評価できるが、当該領域以外に生じた変異や、ゲノム全体に亘って生じた変異を評価することはできない。すなわち、従来の方法では、検出対象としているか否かに拘わらず広範な領域に蓄積された変異を検出して、ＤＮＡの状態を経時的に評価することはできなかった。ＤＮＡの状態を経時的に評価することができれば、遺伝子疾患に罹患するリスクを評価できることにもなる。現在、例えば、中国の大気・水質汚染や福島の放射能汚染などの環境下において、ＤＮＡに蓄積された変異（すなわちＤＮＡの状態）を評価することができれば、当該環境を変えるなど遺伝子疾患の予防処置ができる。

　ところで、大気・水質汚染などは汚染物質の濃度で汚染の程度を評価し、放射能汚染であれば放射性物質による空間線量等で汚染の程度を評価している。しかしながら、これら評価では、ヒトを含む動物や植物に対してどの程度の影響を及ぼす汚染であるのか定量的に解釈することができない。上述のようにＤＮＡの状態を経時的に評価することができれば、ある時点・期間に起こった環境変化について、ＤＮＡの状態に基づいた定量的な評価が可能となる。

　そこで、本発明は、環境要因等に起因するＤＮＡの変異の蓄積状態といったＤＮＡの状態を評価する方法、装置及びプログラムを提供することを目的とする。

　上述した目的を達成した本発明は以下を包含する。

　すなわち、本発明に係るＤＮＡの評価方法は、個体から採取したサンプルよりＤＮＡの塩基配列に関する情報を取得する塩基配列情報取得手順と、前記塩基配列情報取得手順によって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定手順と、前記変異率に基づいてＤＮＡを評価するＤＮＡの評価手順と、を備える。

　また、本発明に係るＤＮＡの評価装置は、個体から採取したサンプルから取得したＤＮＡの塩基配列に関する情報を入力する塩基配列情報入力手段と、前記塩基配列情報入力手段によって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定手段と、前記変異率に基づいてＤＮＡを評価するＤＮＡの評価手段とを備える。

　さらに、本発明に係るプログラムは、コンピュータに、ＤＮＡの評価手順を実行させるプログラムであって、前記コンピュータを、制御手段として機能させ、前記制御手段に対して、個体から採取したサンプルから取得したＤＮＡの塩基配列に関する情報を入力するする塩基配列入力ステップと、前記塩基配列入力ステップによって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定ステップと、前記変異率に基づいてＤＮＡを評価するＤＮＡの評価ステップとを実施させる。

　以上のように本発明に係るＤＮＡの評価方法、評価装置及びプログラムでは、サンプルに含まれるＤＮＡについて、機能領域であるか非機能領域であるかに拘わらず、ＤＮＡの変異率を評価の指標としている。

　また、本発明に係るＤＮＡの評価方法、ＤＮＡの評価装置及びプログラムは、環境評価に適用することができる。

　すなわち、本発明を適用した環境評価方法は、個体から採取したサンプルよりＤＮＡの塩基配列に関する情報を取得する塩基配列情報取得手順と、前記塩基配列情報取得手順によって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定手順と、前記変異率に基づいて環境変化を評価する環境評価手順とを備える。

　また、本発明に係る環境評価装置は、個体から採取したサンプルから取得したＤＮＡの塩基配列に関する情報を入力する塩基配列情報入力手段と、前記塩基配列情報入力手段によって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定手段と、前記変異率に基づいて環境変化を評価する環境評価手段とを備える。

　さらに、本発明に係るプログラムは、コンピュータに、環境変化の評価手順を実行させるプログラムであって、前記コンピュータを、制御手段として機能させ、前記制御手段に対して、個体から採取したサンプルから取得したＤＮＡの塩基配列に関する情報を入力する塩基配列入力ステップと、前記塩基配列入力ステップによって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定ステップと、前記変異率に基づいて環境変化を評価する環境評価ステップとを実施させる。

　本明細書は本願の優先権の基礎である日本国特許出願2013-094689号の明細書及び/又は図面に記載される内容を包含する。

　本発明に係るＤＮＡの評価方法、評価装置及びプログラムでは、サンプルに含まれるＤＮＡについて、機能領域であるか非機能領域であるかに拘わらず、ＤＮＡの変異率を評価の指標としているため、例えばゲノム全体に亘って生じた変異の程度を評価することができる。これにより、本発明に係るＤＮＡの評価方法、評価装置及びプログラムによれば、例えば、大気汚染、水質汚染及び/又は放射能汚染といった環境変化をＤＮＡに対する影響といった側面から適格に把握することができる。

本実施形態のＤＮＡの評価方法の概要を示す図である。本実施形態のＤＮＡの評価方法の経時データ取得手順を示す図である。本実施形態のＤＮＡの評価方法の経時データ評価手順を示す図である。本実施形態の差分変異率の概念を示す図である。本実施形態の積算変異率の概念を示す図である。本実施形態の核酸情報処理装置の概要を示す機能ブロック図である。本実施形態の経時データ記憶部のデータ構造を示す図である。本実施形態のフラグメント対応情報記憶部のデータ構造を示す図である。本実施形態の変異率導出テーブル記憶部のデータ構造を示す図である。本実施形態の一致配列長算出テーブル記憶部のデータ構造を示す図である。本実施形態の核酸情報処理装置のハードウェア構成を示す図である。本実施形態の変異率算出処理の処理フローを示す図である。本実施形態の一致塩基数の算出アルゴリズムを示す図である。フラグメント間の塩基配列一致率の概念を示す図である。フラグメント間一致率の算出に用いる範囲を示す図である。本実施形態の差分変異率の推移の表示画面例を示す図である。本実施形態の多数回解析差分変異率の推移の表示画面例を示す図である。本実施形態の積算変異率の推移の表示画面例を示す図である。別の実施形態におけるＤＮＡの評価方法の経時データ取得手順を示す図である。複数の切断酵素を用いた変異率の算出手順を示す図である。複数の切断酵素を用いた経時データ記憶部のデータ構造を示す図である。放射線照射後21日のシロイヌナズナにおける、変異タグ配列率と照射線量の関係を示す図である。放射線照射後21日のシロイヌナズナにおける、変異塩基率と照射線量の関係を示す図である。放射線照射後21日のシロイヌナズナにおいて、X線照射サンプルに変異の増加が見られたミトコンドリアDNAの第205,820番目の位置の塩基の出現頻度と出現率を示した表である。放射線照射後７日のシロイヌナズナにおける、変異タグ配列率と照射線量の関係を示す図である。放射線照射後７日のシロイヌナズナにおける、変異塩基率と照射線量の関係を示す図である。

　以下に、本発明の実施形態について図面を参照して詳細に説明する。

　本発明を適用した実施形態の一例として、ＤＮＡの評価方法１の概要を図１に示す。ＤＮＡの評価方法１では、図１に示すように、被検体５から採取したサンプルを用いて、ＤＮＡ情報を収集する。このＤＮＡ情報は、言い換えると、ＤＮＡの塩基配列に関する情報である。ＤＮＡの塩基配列に関する情報とは、塩基配列情報、制限酵素処理断片の電気泳動パターン情報、プローブとのハイブリダイズに関する情報等を含む意味である。

　言い換えると、ＤＮＡの塩基配列に関する情報とは、ＤＮＡの塩基配列を表すテキストデータ、制限酵素処理断片の電気泳動パターンを示す画像データ、各種プローブとのハイブリダイズの有無を示すマイクロアレイデータ等が挙げられる。また、ＤＮＡ情報とは、ＤＮＡの塩基配列に関する情報であって、比較することによって塩基配列の相違を検出できる情報である。例えば、ＤＮＡ情報が塩基配列を表すテキストデータである場合、複数のテキストデータを文字単位で比較することで塩基配列の相違、すなわち変異した塩基を特定することができる。また、ＤＮＡ情報が電気泳動パターンを示す画像データである場合、複数の画像データに含まれるバンドパターンを比較することで、塩基配列の相違の有無を特定することができる。さらに、ＤＮＡ情報がマイクロアレイデータである場合、複数のマイクロアレイデータ（各プローブスポットのシグナル強度）を比較することで、塩基配列の相違の有無を特定することができる。

　ＤＮＡの評価方法１では、図１に示すように、ＤＮＡ情報を収集する処理を経時的に複数回実施する。ＤＮＡ情報を収集する間隔としては、特に限定されないが、例えば数ヶ月～数年としたり、６ヵ月～３年としたり、１年とすることができる。ＤＮＡ情報の収集方法は、上述したようにＤＮＡ情報の内容に応じて適宜選択することができる。ここで、ＤＮＡの評価方法１において経時的に複数のＤＮＡ情報を収集する際、被検体５から採取するサンプルを同一部位からのサンプルとすることが好ましい。例えば、サンプルを採取する部位としては、血液、口腔粘膜、リンパ節、乳腺、甲状腺、前立腺、肺、食道、胃・十二指腸、大腸、気管支、皮膚・筋肉・皮下、骨(骨盤・脊椎)、眼、耳・鼻(副鼻腔)、咽頭・喉頭、直腸、精巣(精巣上体)、末梢神経、子宮膣部・内膜等を挙げることができる。なお、被検体５について、複数の部位からサンプルを採取し、それぞれの部位についてＤＮＡ情報を経時的に収集しても良い。

　ここで、被検体５とは、ヒト、マウス、ラット、メダカ、ゼブラフィッシュ、アフリカツメガエル等の動物；シロイヌナズナ、イネ、コムギ、タバコ、ポプラ等の植物；枯草菌、大腸菌、藍藻、アカパンカビ、出芽酵母、分裂酵母、Aspergillus nidulans等の微生物等を含む意味である。被検体５としては、特に限定されないが、例えば、ＤＮＡの評価方法１の目的に応じて適宜選択することができる。例えば、ＤＮＡの評価方法１を人体に対する影響、例えば遺伝子疾患のリスク評価に利用する場合には、ヒトを被検体５とすることができる。

　また、例えばＤＮＡの評価方法１を環境変化の定量的な評価に利用する場合には、当該環境変化を生じた環境下に生育した植物や動物を被検体５とすることができる。この場合、被検体５となる植物は、ゲノム解析等が完成しているシロイヌナズナ、イネ、コムギ、タバコ、ポプラ等のモデル植物とすることができる。また、ＤＮＡの評価方法１を水質における環境変化の評価に利用する場合には、ゲノム解析等が完成しているメダカやゼブラフィッシュを被検体５とすることができる。

　さらに、植物を被検体５とする場合には、採取するサンプルとしては植物体の全体としても良いが、一部の器官（葉、茎、種子、花、根）としても良い。また、植物を被検体５とする場合には、いわゆる分裂組織（茎(シュート)や根の先端）をサンプルとしてもよいし、成熟組織をサンプルとしてもよい。

　さらにまた、植物やヒト以外の動物、微生物を被検体５とする場合、野生型の植物、ヒト以外の野生型動物、野生型微生物を使用しても良いし、所定の遺伝子やＤＮＡ断片が導入された変異体（形質転換体）を使用しても良い。

　そして、ＤＮＡの評価方法１では、図１に示すように、経時的に収集した複数のＤＮＡ情報を比較して塩基配列における相違を特定することで、ＤＮＡの状態の変化を検出することができる。言い換えると、所定のＤＮＡ情報を以前に収集したＤＮＡ情報と比較して、塩基配列における相違を特定すれば、特定した相違は、これらＤＮＡ情報を収集した期間に生じた変異とみなすことができる。ＤＮＡの評価方法１では、所定の期間に生じた変異をＤＮＡ情報に含まれる塩基配列に対する割合（差分変異率）として算出することもできるし、初回に採取したＤＮＡ情報に含まれる塩基配列から差分変異率を積算して積算変異率として算出することもできる。なお、差分変異率及び積算変異率ともに、ＤＮＡ情報を比較して相違する塩基配列部分の全体に対する割合として算出した変異率から計算される。ここで、全体に対する割合とは、比較したＤＮＡ情報に含まれる塩基配列の全長を意味するが、特に全長に限定されず、当該塩基配列の一部でもよい。また、比較するＤＮＡ情報としては、被検体５のゲノム全体でも良いし、ゲノムの一部でも良い。すなわち、ＤＮＡの評価方法１では、ゲノム全体における変異率から差分変異率及び/又は積算変異率を算出しても良いし、ゲノムの一部における変異率から差分変異率及び/又は積算変異率を算出しても良い。或いは、ＤＮＡの評価方法１では、被検体５に人為的に導入した核酸における変異率から差分変異率及び/又は積算変異率を算出しても良い。

　また、変異率を計算する際には、先ず変異した塩基の数を特定するため、変異箇所の個数と変異率とは同価値である。すなわち、ＤＮＡの評価方法１では、差分変異率に変えて差分変異数としてもよいし、積算変異率に変えて積算変異数としてもよい。例えば、ゲノムの一部や人為的に導入した核酸における変異数から、差分変異数及び/又は積算変異数を計算してもよい。

　ＤＮＡの評価方法１では、算出した差分変異率及び/又は積算変異率をグラフとして表示することができる。より具体的には、図１に示すように、経時２のサンプリング時には被検体５の差分変異率の推移グラフ２Ａ、積算変異率の推移グラフ２Ｂを表示することができる。同様に、経時３のサンプリング時には被検体５の差分変異率の推移グラフ３Ａ、積算変異率の推移グラフ３Ｂを表示することができる。また、経時Ｎ（Ｎは自然数）のサンプリング時には被検体５の差分変異率の推移グラフ４Ａ、積算変異率の推移グラフ４Ｂを表示することができる。なお、特定の被検体５の複数の部位からＤＮＡ情報を収集している場合には、各部位について部位毎の差分変異率の推移グラフ、積算変異率の推移グラフを表示することができる。

　特に、本ＤＮＡの評価方法１では、差分変異率について基準範囲を予め設定し、算出した差分変異率が当該基準範囲を超える場合に、差分変異率が異常値であることを意味する情報を提供することが好ましい。同様に、本ＤＮＡの評価方法１では、積算変異率について閾値を予め設定し、算出した積算変異率が当該閾値を超える場合に、積算変異率が閾値を超えたことを意味する情報を提供することが好ましい。例えば、図１に示すように、経時Ｎ－１におけるＤＮＡ情報を基準として、経時ＮにおけるＤＮＡ情報の差分変異率が基準範囲を超えた場合「要対策」との注意表示４Ｃを表示することができる。また、図１に示すように、経時ＮにおけるＤＮＡ情報について積算変異率が閾値を超えた場合「要対策」との注意表示４Ｄを表示することができる。

　なお、被検体５における複数の部位からＤＮＡ情報を収集している場合には、各部位について差分変異率及び/又は積算変異率を算出することができる。そして、各部位についてそれぞれ算出した差分変異率の推移グラフ及び積算変異率の推移グラフに対して、それぞれ注意表示４Ｃ及び４Ｄを表示することができる。このとき、差分変異率に関する基準範囲及び積算変異率に関する閾値は、複数の部位について共通する値としても良いが、部位毎に異なる値を設定しても良い。また、差分変異率に関する基準範囲及び積算変異率に関する閾値は、被検体５の種類、すなわち生物種毎に決定することが望ましい。

　以上のように、本ＤＮＡの評価方法１によれば、被検体５についてＤＮＡ情報を経時的に収集し、ＤＮＡ情報に基づいて、当該被検体５におけるＤＮＡの状態（差分変異率や積算変異率）を評価することができる。したがって、本ＤＮＡの評価方法１を利用することによって、被検体５の遺伝子疾患のリスクを評価することができる。すなわち、遺伝子疾患のなかでも、後天的な遺伝子変異に起因する疾患（例えば癌など）へのリスクが高くなった時点を判断することができる。ただし、本ＤＮＡの評価方法１では、遺伝子の変異に起因する特定の疾患自体を診断するものではなく、遺伝子に対する後天的な変異の蓄積が遺伝子疾患の原因となるという知見に基づくリスク評価を行うものである。

　特に、上述したように、本ＤＮＡの評価方法１を被検体５における複数の部位について適用することで、各部位についてそれぞれ独立してリスク評価を行うことができる。また、本ＤＮＡの評価方法１を被検体５における複数の部位について適用した場合、上述のように部位毎にＤＮＡの状態（差分変異率や積算変異率）を評価し、差分変異率が基準範囲を超えた部位や積算変異率が閾値を超えた部位が一定数に達した段階で注意表示４Ｃ及び４Ｄを表示してもよい。

　ところで、図１に示したＤＮＡの評価方法１では、特定の一個体である被検体５についてＤＮＡ情報を経時的に収集し、ＤＮＡ情報に基づいて、当該被検体５におけるＤＮＡの状態を評価していた。しかし、ＤＮＡの評価方法１は、複数の被検体５からなる集団を評価対象とし、集団におけるＤＮＡの状態を疫学的に評価しても良い。この場合、上述のように、集団に含まれる個々の被検体５についてＤＮＡ情報を経時的に収集して差分変異率や積算変異率を算出する。そして、評価対象の集団について、差分変異率の平均値や積算変異率の平均値を集団におけるＤＮＡの状態として評価することができる。すなわち、集団における差分変異率の平均値や積算変異率の平均値を、それぞれ基準範囲や閾値と比較して、評価対象の集団について注意表示４Ｃ及び４Ｄを表示することができる。

　このように、ＤＮＡの評価方法１によれば、被検体５が単数であっても複数であっても、個人と集団との相違はあるにせよ、ＤＮＡの状態としてＤＮＡに蓄積された変異の程度を評価することができる。上述の説明から明らかなように、差分変異率や積算変異率がそれぞれ基準範囲や閾値を超えるということは、比較したＤＮＡ情報を収集した時から、差分変異率や積算変異率がそれぞれ基準範囲や閾値を超えたＤＮＡ情報を収集した時の間に、ＤＮＡに対する変異を誘発する特異的な事象が生じていたことを意味する。

　言い換えると、経時的に収集した複数のＤＮＡ情報について、時系列的に前後一組のＤＮＡ情報を比較して差分変異率や積算変異率がそれぞれ基準範囲や閾値を超えたとすると、比較した前後一組のＤＮＡ情報の間に特異的な事象があったと推察できる。ここで特異的な事象とは、ゲノムを構成するＤＮＡに変異を誘発する要因であって、通常の状態（当該要因が不存在の状況）で生じる変異率に比較して有意に高い変異率で変異を誘発する要因のことである。

　したがって、本ＤＮＡの評価方法１は、例えば、被検体５の周囲の環境において、ＤＮＡに変異を誘発する程度の変化があったことを評価する際に適用することができる。すなわち、問題となるような環境変化が、経時Ｎ－１と経時Ｎとの間で生じたとする（経時Ｎ－１及び経時Ｎは、ともにＤＮＡ情報を収集する時点）。そして、経時ＮのＤＮＡ情報と経時Ｎ－１のＤＮＡ情報とを比較して差分変異率や積算変異率がそれぞれ基準範囲や閾値を超えたとすると、経時Ｎ－１と経時Ｎとの間に生じた環境変化がＤＮＡに対して相当程度の変異を誘発するものであったと評価することができる。相当程度の変異とは、上記基準範囲や閾値で規定される程度の変異率を超える変異率という意味である。

　このように、本ＤＮＡの評価方法１によれば、問題とされた環境変化をＤＮＡに対する変異率に基づいて評価することができる。言い換えると、本ＤＮＡの評価方法１によれば、問題とされた環境変化が、被検体５のＤＮＡに対してどの程度影響するものなのか、変異率に基づいて定量的に評価することができる。すなわち、変異率が高ければ、問題とされた環境変化が被検体５のＤＮＡに対してより大きな影響を与えていると評価することができる。このように、例えば、大気汚染、水質汚染、放射能汚染などの環境変化を定量的に評価することによって、ＤＮＡに蓄積された変異に基づいて当該環境変化に対する予防処置、特に遺伝子疾患のリスクを低減するような処置を実施することができる。

　より具体的に、本ＤＮＡの評価方法１を適用して海水や淡水の環境変化を評価する場合、被検体５としては昆布などの海藻・海草や水生植物を利用することができる。昆布などの海藻・海草や水生植物を被検体５として利用することによって、評価対象の環境変化につて定点観測することができる。また、例えば、本ＤＮＡの評価方法１を適用して工場排水による環境への影響を評価する場合、排水口付近などに網籠に入れて定置したコイやメダカなどの魚類を被検体５として利用することができる。

　次に、本発明にかかるＤＮＡの評価方法１の経時データ取得手順１０の一例を、図２を参照して説明する。なお、以下の説明においては、ＤＮＡ情報として、ＤＮＡの塩基配列を表すテキストデータを取得する場合を例示する。よって、ＤＮＡ情報として、制限酵素処理断片の電気泳動パターンを示す画像データや、各種プローブとのハイブリダイズの有無を示すマイクロアレイデータ等を取得する場合には、それぞれデータの種類に応じて適宜最適な方法を採用することができる。

　経時データ取得手順１０は、図２に示すように、ＤＮＡ抽出フェイズ１０Ａと、フラグメント生成フェイズ１０Ｂと、経時データ生成フェイズ１０Ｃとを含む。

　ＤＮＡ抽出フェイズ１０Ａにおいては、検査実施者は、まず、被検体５から細胞・組織のサンプリングを行う。このとき、ＤＮＡ抽出フェイズ１０Ａにおいては、同一個体の同一部位について、細胞・組織のサンプリングを行うことが好ましい。その後、収集したサンプルからＤＮＡを抽出する。一般に、同じ生物種でも、特にヒトなどの雑種では、個体によって遺伝的背景も変異率も異なる。このため、定常状態の変異率の標準変動値の設定や特定時の変異率の評価は、同一個体から収集したＤＮＡ情報同士、望ましくは同一個体の同一部位（同一の組織や臓器を含む）のＤＮＡ情報同士で行うことが望ましい。このような同一個体のＤＮＡ情報同士を解析することで、個体差に影響されない比較及び評価が可能となる。また、同一個体の同一部位からＤＮＡ情報を収集することで、ＤＮＡの変化（変異）を、ＤＮＡ情報に基づいて算出した変異率という1つの数字で迅速に数値評価できる。

　また、ＤＮＡ抽出フェイズ１０Ａにおいては、被検体５から経時的に複数回サンプリングする際、各回のサンプリングにおいて、略同一量の細胞・組織をサンプリングすることが好ましい。これにより生物のＤＮＡ状態を同一条件で評価することができるからである。同一の生物個体でも、組織や臓器によって、細胞のターンオーバーの速度や環境変化に対する感受性が異なるため、同一個体の同一部位からサンプリングを経時的に繰り返すことにより、そのような組織や臓器の差に由来する変異率の相違を排除しやすくするためである。

　次に、フラグメント生成フェイズ１０Ｂでは、検査実施者は、ＤＮＡ抽出フェイズ１０Ａにおいて取得したサンプルのＤＮＡ６を、１種類または複数種類のエンドヌクレアーゼ、例えば１種類または複数種類の制限酵素７を用いて切断し、複数のフラグメントを有するフラグメント群８を得る。フラグメント生成フェイズ１０Ｂにおいて生成する複数のフラグメントは、後の工程において使用するＤＮＡシーケンサーが解析可能な長さとすることが好ましい。フラグメントの長さは、使用する制限酵素７の種類によって適宜調節することができる。本フラグメント生成フェイズ１０Ｂでは、ＤＮＡ抽出フェイズ１０Ａにおいて経時的にサンプリングした複数のサンプルのＤＮＡ６について、同じ制限酵素を使用してフラグメント群８を生成する。

　本フラグメント生成フェイズ１０Ｂは、例えば、上述の１種類以上の特定の制限酵素（例えば、ＥｃｏＲＩ）を所定の条件化でＤＮＡ６に作用させることで切断し、フラグメント群８を得ることができる。なお、例示したＥｃｏＲＩは、「５´－ＧＡＡＴＴＣ－３´」という６塩基配列を認識して、５´末端が「ＡＡＴＴＣ」の配列となり、３´末端が「Ｇ」となるように切断する大腸菌のＲ株由来の制限酵素である。

　フラグメント生成フェイズ１０Ｂにおいては、これに限られず、他のエンドヌクレアーゼ、例えば制限酵素（例えば、４塩基認識や８塩基認識の制限酵素）を用いるものであってもよい。制限酵素等のエンドヌクレアーゼを適宜組み合わせて使用することによって、取得したサンプルのＤＮＡ６を所望の長さのフラグメントとすることができる。なお、フラグメント生成フェイズ１０Ｂにおいては、取得したサンプルのＤＮＡ６から異なる複数のフラグメント群８を作製してもよい。すなわち、例えば、異なる制限酵素、異なる制限酵素の組み合わせで所定のＤＮＡ６をそれぞれ切断することで、異なるフラグメントを含む複数のフラグメント群８を作製することができる。

　なお、フラグメント生成フェイズ１０Ｂにおいては、望ましくは、１つの細胞のゲノムをできるだけ少ない本数のフラグメントとすることが好ましい。さらに望ましくは、染色体毎に1本のフラグメントとして塩基配列を決定できるようにするのがよい。

　また、フラグメント生成フェイズ１０Ｂにおいては、上述のように、制限酵素を用いてＤＮＡを断片化する形態に限定されず、例えば、超音波処理などの物理的方法によって断片化するものでもよい。

　次に、経時データ生成フェイズ１０Ｃにおいては、検査実施者は、フラグメント生成フェイズ１０Ｂで生成されたフラグメント群８に含まれるフラグメントについて、ＤＮＡシーケンサー２０を用いて塩基配列を解析する。なお、ＤＮＡシーケンサー２０における配列決定原理は特に限定されず、従来公知の装置を適宜使用することができる。

　経時データ生成フェイズ１０Ｃでは、フラグメント群８に含まれるフラグメントについて決定した塩基配列情報を所定の記憶装置等に格納する。なお、記憶装置には、経時的にサンプルリングしたＤＮＡについてそれぞれ塩基配列情報（図２において経時Ｘファイル、経時Ｙファイル及び経時Ｚファイルと称している）が格納されている。

　上述した説明から判るように、経時データ生成フェイズ１０Ｃでは、経時的にサンプルリングしたＤＮＡについてフラグメント化した後に塩基配列を決定している。すなわち、経時データ生成フェイズ１０Ｃにおいては、変異率を求めるために比較するサンプルのＤＮＡ塩基配列として、機能領域のＤＮＡ塩基配列であるか非機能領域のＤＮＡ塩基配列であるかを問わず、塩基配列決定により得られたデータ全体を利用している。これにより、変異率を求める基準となるデータ量が増し、より感度・精度の高い変異率が得られることになる。

　特に、経時的に採取したサンプルリングしたＤＮＡについて同じ制限酵素でフラグメント化することで、同一の個体のＤＮＡであれば、採取時期が異なるフラグメント群８を比較しても、原理的には、対応するフラグメントが互いに含まれるため、後述する経時データ評価手順において、対応するフラグメントを特定してその変異率を正確に計算することができる。

　なお、フラグメント生成フェイズ１０Ｂにおいて超音波処理などの物理的方法によってＤＮＡ６をランダムに断片化した場合には、経時データ生成フェイズ１０Ｃでは、ランダムに断片化されたフラグメントについて塩基配列を決定する。この場合、特に、ＤＮＡシーケンサーとしては、いわゆる次世代シーケンサーと呼称されるハイスループットな解析が可能である装置を使用することが好ましい。次世代シーケンサーとしては、例えば、Genome Sequencer FLXシステム（ロシュ・ダイアグノスティックス社）、HiSeq/Genome Analyzer IIx（GAIIx）/ MiSeq（イルミナ社）及びIon PGMシーケンサー（Ion PGM）（ライフテクノロジーズ社）を挙げることができる。このように解読したフラグメントの塩基配列データをアッセンブルすることによって染色体毎の塩基配列情報を取得することができる。この場合も、後述する経時データ評価手順において、対応する染色体同士を比較することで変異率を正確に計算することができる。

　本実施形態においては、詳細を後述するが、図６に示すような核酸情報処理装置１００がＤＮＡシーケンサー機能を担うことができる。上述したように決定された塩基配列の情報は、核酸情報処理装置１００の記憶部１３０に、被検体５に関する情報、サンプリングした部位に関する情報、取得時期に関する情報と対応付けるように格納される。図３に、記憶部１３０に格納された経時ファイル２１を用いた経時データ評価手順を示す。なお、経時ファイルは、同一個体の同一部位から経時的に採取されたサンプルに由来し、同じ制限酵素を用いてフラグメントを得ているため、各経時ファイルに含まれるフラグメントの数は一定の範囲に収束するものと考えられる。

　経時データ評価手順は、図３に示すように、変異率算出フェイズ１０Ｄと、結果出力フェイズ１０Ｅとを含む。

　変異率算出フェイズ１０Ｄにおいては、核酸情報処理装置１００が、互いに異なる経時ファイル２１を二つ読み出し、同一あるいは対応するフラグメント同士を比較し、変異率を算出する。

　変異率算出フェイズ１０Ｄでは、先ず、核酸情報処理装置１００が、一対の経時ファイルに含まれるフラグメントの数を比較し、フラグメント数の少ない方の経時ファイルを基準として、基準の経時ファイルに含まれるフラグメントごとに比較対象の経時ファイルの全フラグメントの各々との一致塩基数Ｍ（Ｍは０または正の整数）を算出する（ステップ３１）。すなわち、基準の経時ファイルに含まれる所定のフラグメントと、比較対象の経時ファイルに含まれるフラグメントの全てについて一致塩基数Ｍを計算する。この計算を、基準の経時ファイルに含まれるフラグメントの全てについて実施する。なお、詳細を後述するが、一致塩基数Ｍは所謂ペアワイズアライメント・アルゴリズムによって計算することができる。

　そして、核酸情報処理装置１００は、基準の経時ファイルに含まれるフラグメントごとに、一致塩基数Ｍが最大となる比較対象のフラグメントを、対応するフラグメントとして特定する（ステップ３２）。具体的には、核酸情報処理装置１００は、ステップ３１にて算出した一致塩基数Ｍを比較して、基準の経時ファイルに含まれるフラグメントごとに、Ｍの値が最大となるフラグメントを特定し、当該Ｍの値とともに対応付ける。

　そして、核酸情報処理装置１００は、基準の経時ファイルのフラグメントごとに、対応するフラグメントと配列長を比較して短い方を基準塩基配列長Ｌとして特定する（ステップ３３）。この基準塩基配列長Ｌの計算は、基準の経時ファイルに含まれるフラグメントの全てについて実施する。

　そして、核酸情報処理装置１００は、基準の経時ファイルに含まれるフラグメントの全てについて計算されている、一致塩基数Ｍ及び基準塩基配列長Ｌをそれぞれ合計して、総一致塩基数Ｍ及び総基準塩基配列長Ｌをそれぞれ算出する（ステップ３４）。

　そして、核酸情報処理装置１００は、総一致塩基数Ｍを総基準塩基配列長Ｌで除算し、総一致率を特定する（ステップ３５）。

　そして、核酸情報処理装置１００は、１００％から総一致率を減算し、変異率として算出し保存する（ステップ３６）。

　以上が、変異率算出フェイズ１０Ｄの手順である。変異率算出フェイズ１０Ｄによれば、二つの経時ファイルを比較して対応するフラグメントの相違点を特定し、対応するフラグメントについて、基準塩基配列長の総数に対する変異部分の塩基配列数の総数割合を変異率として算出することができる。なお、変異率としては、この例に限定されず、経時データ生成フェイズ１０Ｃにおいて取得した塩基配列を利用して、対応するフラグメント間の塩基配列上の相違を定量的に示す値として算出してもよい。

　例えば、経時データ生成フェイズ１０Ｃにおいていわゆる次世代シーケンサーを使用する場合、一度の操作により、リードと呼称される数百bpの断片の塩基配列情報が多数得られる。得られたリードの塩基配列に基づいて、フラグメントを作製する際に使用した制限酵素サイトを末端に有するリードを抽出する。そして、抽出した各リードのうち塩基配列決定の精度が高い領域（例えば、各リードの最初から５０～２００塩基長）を特定し、各リードにおいて特定した領域（タグ配列と称する）を変異率の算出に利用することができる。

　すなわち、所定のタグ配列について見ると、タグ配列全体に所定の出現頻度で含まれることとなる。この出現頻度は、同一個体の同一部位から採取されたサンプルであれば一定の値となる。しかし、あるタグ配列に突然変異が導入されると、当該タグ配列の出現頻度が変異導入前後において異なることとなる。したがって、一対の経時ファイル間において出現頻度が変動したタグ配列のタグ配列全体に対する割合は、対応するフラグメント間の塩基配列上の相違を定量的に示す値であり、変異率として使用することができる。

　また、出現頻度が変動したタグ配列には、例えば１個の変異が導入されたとみなすことで、出現頻度が変動したタグ配列の数に基づいて、導入された変異の数を算出することができる。算出した変異塩基数の、全タグ配列の総塩基数に対する割合は、対応するフラグメント間の塩基配列上の相違を定量的に示す値であり、変異率として使用することができる。

　結果出力フェイズ１０Ｅにおいては、核酸情報処理装置１００は、変異率算出フェイズ１０Ｄにおいて算出した変異率を出力する。当該出力時には、核酸情報処理装置１００は、求めた変異率が前回の経時ファイルとの比較を行う差分変異率である場合には、所定の基準範囲と比較して注意を要する度合いを特定し、サンプル採取時順にグラフ化して注意を要する度合いとともに出力する（ステップ４１）。

　あるいは、核酸情報処理装置１００は、求めた変異率が基準となる一定の経時ファイルとの比較を行う積算変異率である場合には、所定の閾値と比較して注意を要する度合いを特定し、サンプル採取時順にグラフ化して注意を要する度合いとともに出力する（ステップ４２）。

　図４は、差分変異率の概念を説明する図である。図４に示すように、差分変異率の算出手順５０においては、所定の被検体５について経時的に採取されたサンプルから、上述のようにＤＮＡ情報を読み取られ、経時的に前後するＤＮＡ情報について上述のように計算された変異率を差分変異率とする。
　なお、差分変異率が正常な範囲内か否か、すなわちＤＮＡの状態の評価は、定常状態の標準変動域内に含まれるか否かにより特定することができる。すなわち、過去に蓄積された差分変異率の標準変動域内にない場合には、変異率が異常である、すなわち環境変化等があった蓋然性が高くなると判断することができる。つまり、被検体５について疾患や異常の発生リスクが定常状態より高まったと判断しうる。標準変動域内にある場合には、変異率は正常範囲内の可能性が高く、環境変化等があった蓋然性は低くなるといえる。

　上述の標準変動域は、簡単には、被検体５の過去の差分変異率の最大値を上限として、最小値を下限として設定する方法が考えられる。しかし、これに限られず、例えば被検体５の過去の差分変異率の平均値を求めて、当該平均値に所定の重みづけを行い上限と下限を設定する方法も考えられる。あるいは、定常状態の標準変動域を設定するために、定常状態の複数のサンプルの差分変異率の重みづけ、中央値または平均偏差等の統計的数値を求め、これを基準として標準変動域を設定するようにしてもよい。

　以上のように算出した差分変異率は、サンプル毎に同一個体の同一部位のサンプルのＤＮＡを用いた塩基配列のデジタルデータに基づいており、保管について経時劣化の弊害はなく、容易に且つ再現性の高い値として算出することができる。なお、差分変異率の数値は、大きな環境変化がなくても偶発的な要因で多少の変動をし得ると考えられる。図４に示す方法では、例えば、差分変異率の数値に幅を持たせ、定常状態を唯一の数値ではなく範囲でとらえることにより、偶発的な原因による変異率の変動を異常事態ととらえる確率を低下させ、傾向を把握することができる。

　一方、図５は、積算変異率の概念を説明する図である。図５に示すように、積算変異率の算出手順６０においては、所定の被検体５について経時的に採取されたサンプルから、上述のようにＤＮＡ情報を読み取られ、一定の基準のサンプル（例えば、初回のサンプルや、所定期間経過内のサンプル）と比較され、積算変異率として算出される。言い換えると、時系列的に前後する１間隔のサンプルＤＮＡの変異率である差分変異率を、経時で積算することで積算変異率を計算することができる。この積算変異率を使用することで、任意の時間経過で蓄積した変異量について評価できる。

　なお、積算変異率が正常な範囲内か否か、すなわちＤＮＡの状態の評価は、一定の閾値（疾患や異常の発生リスクに鑑みた閾値であって、望ましくは、既存文献その他のできる限り多くの情報に基づいて、疾患や異常の発症リスクが見過ごせないほど高まるといえる妥当な積算変異率）を超えるか否かにより特定される。閾値を超える場合には、変異率が異常である可能性が高く、すなわち環境変化等があった蓋然性が高くなるといえる。つまり、被検体５について疾患や異常の発生リスクが定常状態より高まったと判断しうる。閾値を超えない場合には、変異率は正常範囲内の可能性が高く、環境変化等があった蓋然性は低くなるといえる。以上のように算出した積算変異率もまた、サンプル毎に同一個体の同一部位のサンプルのＤＮＡを用いた塩基配列のデジタルデータに基づいており、保管について経時劣化の弊害はなく、容易に且つ再現性の高い値として算出することができる。

　このように、ＤＮＡに生じた変異を差分変異率及び/又は積算変異率の視点で比較することで、同一個体における観測精度を上げ、より質のよいＤＮＡの状態の評価を行うことが可能となる。またさらには、環境変化後、複数回のサンプルのＤＮＡの差分変異率の推移が、増加傾向、不変、減少傾向などのいずれの傾向をどの程度示すかを解析し、環境変化によるゲノム塩基配列の変化の有無、傾向、程度などの判断、予測を行うようにしてもよい。

　以上が、ＤＮＡの評価方法１の概要である。次に、上記ＤＮＡの評価方法１において使用する核酸情報処理装置１００について説明する。図６は、核酸情報処理装置１００の構成の概要を示す図である。核酸情報処理装置１００は、制御部１１０と、記憶部１３０と、出力表示部１４０と、入力受付部１５０と、を含んで構成される。

　制御部１１０は、入力処理部１１１と、出力処理部１１２と、ＤＮＡ塩基配列特定部１１３と、経時データ管理部１１４と、経時データ比較部１１５と、変異率特定部１１６と、グラフ生成部１１７と、を含んで構成される。

　入力処理部１１１は、入力受付部１５０から入力された所定の情報の入力を受け付ける。出力処理部１１２は、出力表示部１４０に対して、出力する情報を受け渡す。出力する情報は、例えば変異率を算出する対象の経時データの指定を受け付ける画面や、算出した変異率やそのグラフ等の情報を示す画面情報等である。

　ＤＮＡ塩基配列特定部１１３は、いわゆるＤＮＡシーケンサー２０と同様の処理を行う。例えば、セットされたフラグメントを解析して塩基の種類を判別し、塩基配列を特定する。

　経時データ管理部１１４は、ＤＮＡ塩基配列特定部１１３により特定された塩基配列を、被検体５および経時に応じて格納し、読み出す。

　経時データ比較部１１５は、異なる採取時の経時データ間で塩基配列を比較し、対比対象となるべきフラグメントを特定して対応付ける。

　変異率特定部１１６は、経時データ比較部１１５により対応付けられたフラグメントの一致する部位の長さに応じて一致率を特定し、一致率にもとづいて変異率を特定する。

　グラフ生成部１１７は、変異率特定部１１６により特定された変異率を用いて、グラフの表示情報を作成する。例えば、グラフ生成部１１７は、時間の変遷を横軸とし、変異率を縦軸として構成される二次元グラフの表示情報を作成する。

　記憶部１３０には、経時データ記憶部１３１と、フラグメント対応情報記憶部１３２と、変異率導出テーブル記憶部１３３と、一致塩基数算出テーブル記憶部１３４と、が含まれる。

　なお、核酸情報処理装置１００は、ＤＮＡ塩基配列特定部１１３（ＤＮＡシーケンサー２０）を備えず、別個独立したＤＮＡシーケンサーからの塩基配列情報を入力する構成であってもよい。この場合、外部のＤＮＡシーケンサーと核酸情報処理装置１００とは、直接オンラインで接続されていても良いし、例えばインターネット等の通信回線網を介して接続されていても良い。また、核酸情報処理装置１００は、外部のＤＮＡシーケンサーで解析された塩基配列情報を、入力受付部１５０を介して入力するものであっても良い。

　ここで一例として、経時データ記憶部１３１には、図７に示すように、種識別子１３１Ａと、個体識別子１３１Ｂと、採取時識別子１３１Ｃと、が対応付けられて格納される。また、採取時識別子１３１Ｃには、部位識別子１３１Ｄと、差分変異率１３１Ｅと、積算変異率１３１Ｆと、経時データ識別子１３１Ｇと、が対応付けられて格納される。また、経時データ識別子１３１Ｇには、フラグメントＩＤ１３１Ｈと、塩基配列情報１３１Ｋと、が対応付けられて格納される。

　種識別子１３１Ａとは、経時データとなるべきＤＮＡを採取した客体すなわち被検体５の生物種を特定する情報である。例えば、「ヒト」や「イヌ」等の種を特定する情報である。なお、種識別子と命名しているが、厳密に種である必要はなく、界、門、綱、目、科、属、種、またはそれより詳細な分類のいずれの生物分類であってもよい。

　個体識別子１３１Ｂとは、被検体５の個体を特定する情報である。例えば、個人を特定する氏名等の文字列情報、社会保障番号、患者番号、加入者番号等の情報である。

　採取時識別子１３１Ｃとは、被検体５からＤＮＡを採取した時を特定する情報である。例えば、日時情報に限らず、年月を特定する情報であってもよい。

　部位識別子１３１Ｄとは、ＤＮＡを採取した被検体５の部位を特定する情報である。例えば、ほおの内側の粘膜等の部位を特定する情報である。なお、部位という概念にとらわれず、容易に同様の性質を有するＤＮＡを採取しうる血液等、部位を特定するものではなく体全体をめぐるものであってもよい。

　差分変異率１３１Ｅとは、採取時識別子１３１Ｃにより特定される採取時順において直前の経時データと比較した差分変異率を特定する情報である。

　積算変異率１３１Ｆとは、採取時識別子１３１Ｃにより特定される採取時順において、所定の基準となる採取時の経時データと比較した積算変異率を特定する情報である。

　経時データ識別子１３１Ｇとは、種識別子１３１Ａと、個体識別子１３１Ｂと、採取時識別子１３１Ｃと、部位識別子１３１Ｄと、の組み合わせに応じて割付けられるユニークな識別子である。

　フラグメントＩＤ１３１Ｈとは、経時データ識別子１３１Ｇにより特定されるフラグメント群に含まれるフラグメントを他のフラグメントから区別する情報である。

　塩基配列情報１３１Ｋとは、フラグメントＩＤ１３１Ｈにて特定されるフラグメントが有する塩基配列の配列を特定する情報である。以上が、図７に示す経時データ記憶部１３１である。

　ここで一例として、フラグメント対応情報記憶部１３２には、図８に示すように、フラグメント識別子１３２Ａと、最高一致フラグメント識別子１３２Ｂと、基準塩基配列長１３２Ｃと、一致率塩基数１３２Ｄと、塩基配列一致率１３２Ｅと、が含まれる。

　フラグメント識別子１３２Ａとは、フラグメントを識別する情報である。

　最高一致フラグメント識別子１３２Ｂとは、比較相手となる経時データに含まれるフラグメントのうちで、フラグメント識別子１３２Ａのフラグメントともっとも塩基配列一致率の高いフラグメント、すなわち対となるフラグメントを特定する情報である。

　基準塩基配列長１３２Ｃとは、フラグメント識別子１３２Ａの長さと、対となるフラグメントの長さとのうち、短い方の長さを特定する情報である。

　一致塩基数１３２Ｄとは、フラグメント識別子１３２Ａと、最高一致フラグメント識別子１３２Ｂと、の一致部分の塩基数を特定する情報である。

塩基配列一致率１３２Ｅとは、一致塩基数１３２Ｄが基準塩基配列長１３２Ｃに占める割合である。

　一例として、図９に示すように、変異率導出テーブル記憶部１３３には、総基準塩基配列長１３３Ａと、総一致塩基数１３３Ｂと、総一致率１３３Ｃと、変異率１３３Ｄと、が含まれる。

　総基準塩基配列長１３３Ａは、経時データすなわちフラグメント群内のフラグメントすべてについて、基準塩基配列長１３２Ｃを加算した値である。

　総一致塩基数１３３Ｂは、経時データすなわちフラグメント群内のフラグメントであって他の経時データとの対応づけがされたすべてのフラグメントについて、一致塩基数１３２Ｄを加算した値である。

　総一致率１３３Ｃは、総基準塩基配列長１３３Ａに対して総一致塩基数１３３Ｂが占める割合である。

　変異率１３３Ｄとは、総塩基配列長１３３Ａに対して一致しない部位の塩基が占める割合である。

　図１０に示すように、一致塩基数算出テーブル記憶部１３４とは、一対のフラグメント間において一致する塩基の数を算出するためのテーブルである。一例として、図１０に示す一致塩基数算出テーブル記憶部１３４では、縦軸１３４Ａにフラグメント数の少ない比較対象である、基準の経時ファイルに含まれるフラグメントから読み出したフラグメントの塩基配列が、塩基ごとに割付けされている。横軸１３４Ｂには、フラグメント数の多い比較対象の経時ファイルに含まれるフラグメントから読み出したフラグメントの塩基配列が塩基ごとに記載されている。そして、縦軸と横軸の交点のうち最も左上にある交点には、当該フラグメント同士の塩基が一致する部分の最大数が格納される。当該一致塩基数算出テーブル記憶部１３４は、フラグメントの対応状況を示すために用いられる作業テーブルであるともいえる。

　出力表示部１４０は、核酸情報処理装置１００のＧＵＩ（Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）あるいはＣＵＩ（Ｃｈａｒａｃｔｅｒ－ｂａｓｅｄ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）等の各種情報を出力する。入力受付部１５０は、ＧＵＩあるいはＣＵＩの操作情報の入力を受け付ける。例えば、入力受付部１５０は、ＤＮＡ塩基配列特定部１１３に対する特定処理開始の入力等の各種の操作についての情報を受け付ける。

　図１１は、核酸情報処理装置１００のハードウェア構成を示す図である。本実施形態においては、核酸情報処理装置１００は、例えば、ＰＣ（パーソナルコンピュータ）や、ワークステーション、サーバー装置、スマートフォン等を含む各種携帯電話端末、ＰＤＡ（Ｐｅｒｓｏｎａｌ　Ｄｉｇｉｔａｌ　Ａｓｓｉｓｔａｎｔ）などの計算機を主体とする処理装置である。

　核酸情報処理装置１００は、入力装置１０１と、外部記憶装置１０２と、演算装置１０３と、主記憶装置１０４と、シーケンサー１０５と、出力装置１０６と、それぞれの装置を互いに接続するバス１０７と、を有する。

　入力装置１０１は、例えばキーボードやマウス、あるいはタッチペン、感圧式タッチセンサ、静電誘導式タッチセンサ、その他ポインティングデバイスなどの入力を受け付ける装置である。

　外部記憶装置１０２は、例えばハードディスク装置やフラッシュメモリ、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｉｓｋ）などの不揮発性記憶装置である。

　演算装置１０３は、例えばＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などの演算装置である。

　主記憶装置１０４は、例えばＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などのメモリ装置である。

　シーケンサー１０５は、所定の方法でセットされたＤＮＡのフラグメントについて塩基配列の解析を行い、フラグメントに識別子を対応付けて解析の結果得られた塩基配列のデータを経時データ記憶部１３１に格納させる自動実験装置である。

　出力装置１０６は、入力情報を受け付ける画面やグラフ等を含む出力情報を含む画面を出力する装置であって、液晶ディスプレイや有機ＥＬ（Ｅｌｅｃｔｒｏ　Ｌｕｍｉｎｅｓｃｅｎｓｅ）ディスプレイ、あるいはプリンタ等である。

　核酸情報処理装置１００の入力処理部１１１と、出力処理部１１２と、ＤＮＡ塩基配列特定部１１３と、経時データ管理部１１４と、経時データ比較部１１５と、変異率特定部１１６と、グラフ生成部１１７とは、核酸情報処理装置１００の演算装置１０３に処理を行わせるプログラムによって実現される。

　このプログラムは、主記憶装置１０４または外部記憶装置１０２内に記憶され、実行にあたって主記憶装置１０４上にロードされ、演算装置１０３により実行される。

　また、核酸情報処理装置１００の記憶部１３０は、核酸情報処理装置１００の外部記憶装置１０２および主記憶装置１０４により実現される。

　また、核酸情報処理装置１００の出力表示部１４０は、出力装置１０６によって実現される。

　また、核酸情報処理装置１００の入力受付部１５０は、入力装置１０１により実現される。以上が、核酸情報処理装置１００のハードウェア構成である。

　＜処理の説明＞
　次に、核酸情報処理装置１００の処理について、説明する。

　まず、核酸情報処理装置１００が実施する変異率算出処理について図１２～図１５を用いて説明する。変異率算出処理は、変異率算出フェイズ１０Ｄのステップ３１～ステップ３６に該当する処理である。そのため、経時ファイル２１が既に生成された状態において、検査実施者から対比対象の２つの経時ファイルの指定が比較する経時データとして指定される。

　処理開始指示を受け付けると、経時データ比較部１１５は、図１２に示したように、比較する経時データのフラグメント数を比較し、少ない方の経時データをI1として、「行（縦方向インデックスＱ）」と定義し、多い方の経時データをI2として、「列（横方向インデックスＲ）」と定義する（図１０参照（Ｓ１０１））。

　具体的には、経時データ比較部１１５は、経時データ記憶部１３１を参照して指定された経時データごとに、相当するフラグメントＩＤ１３１Ｈおよび塩基配列情報１３１Ｋを取得する。そして、経時データ比較部１１５は、経時データ同士の塩基配列情報１３１Ｋのレコード数を比較して、フラグメント数の多少を特定する。そして、フラグメント数が少ない方の経時データに含まれるフラグメントＩＤ１３１Ｈを、フラグメント対応情報記憶部１３２のフラグメント識別子１３２Ａに全量格納するとともに、インデックスＱ、Ｒ（Ｑ、Ｒはともに正の整数）からなる二次元配列を割り当てて、配列のデータとしてフラグメントＩＤおよび塩基配列情報を格納する。

　そして、経時データ比較部１１５は、Ｑに１を設定して初期化する（ステップＳ１０２）。また、経時データ比較部１１５は、Ｒに１を設定して初期化する（ステップＳ１０３）。

　そして、経時データ比較部１１５は、二次元配列のうち行（Ｑ）に格納された行側のフラグメントの１つＰ１と列（Ｒ）に格納された列側のフラグメントの１つＰ２のフラグメント塩基配列長を比較し、短い方のフラグメント塩基配列長を比較塩基配列長としてP3と定義する（ステップＳ１０４）。

　そして、経時データ比較部１１５は、一致塩基数の算出の処理については、ＤＰマッチング法を応用した方法であるグループ間の塩基配列比較ルーティンを用いるが、詳細は図１３を用いて後述する。この処理により、行側のフラグメントのひとつの塩基配列Ｐ１と列側のフラグメントの１つの塩基配列Ｐ２との一致塩基数Ｏ１および塩基配列一致率Ｏ２を特定する（ステップＳ１０５）。

　一致塩基数は、行側と列側のフラグメントの塩基配列の一致部分の長さの合計であり、図１４のＯ１である。塩基配列一致率は、比較塩基配列長に対する一致塩基数の割合であり、図１４のＯ２である。

　そして、経時データ比較部１１５は、ステップＳ１０４で算出した塩基配列一致率が行（Ｑ）についての列（１）～列（Ｒ－１）との最大一致率である列（Ｒ）のフラグメント間一致率を超えるものであるか否かを判定する（ステップＳ１０６）。超えるものでない場合には、経時データ比較部１１５は、次の列（Ｒ＋１）との比較を行うべく、ステップＳ１０７に制御を進める。

　ステップＳ１０５で算出した塩基配列一致率が行（Ｑ）についての列（Ｒ）のフラグメント間一致率を超えるものである（ステップＳ１０６において「≦」の）場合には、経時データ比較部１１５は、フラグメント対応情報記憶部１３２のフラグメント識別子１３２Ａの対応するレコードに、以下の情報を格納する（ステップＳ１０７）。具体的には、列（Ｒ）のフラグメントＩＤを最高一致フラグメント識別子１３２Ｂに格納し、Ｐ３の値を基準塩基配列長として基準塩基配列長１３２Ｃに格納し、一致塩基数を一致塩基数１３２Ｄに格納し、塩基配列一致率を塩基配列一致率１３２Ｅに格納する。

　ここで、Ｏ２の値が一定値以下となった場合には、足切を行って列（Ｒ）のフラグメント間一致率との大小比較を行わず、その後の処理にもデータを用いないようにすれば、より正確なフラグメント同士の対応に基づく塩基配列一致率を算出することもできる。

　そして、経時データ比較部１１５は、Ｒをインクリメントする（ステップＳ１０８）。

　そして、経時データ比較部１１５は、Ｒが二次元配列の列数を上回ったか否かを判定する（ステップＳ１０９）。上回っていない場合には、経時データ比較部１１５は、制御をステップＳ１０５に戻す。

　Ｒが二次元配列の列数を上回った（ステップＳ１０９において「Ｙｅｓ」の）場合には、経時データ比較部１１５は、Ｑをインクリメントする（ステップＳ１１０）。

　そして、経時データ比較部１１５は、Ｑが二次元配列の行数を上回ったか否かを判定する（ステップＳ１１１）。上回っていない場合には、経時データ比較部１１５は、制御をステップＳ１０３に戻す。

　そして、変異率特定部１１６は、変異率導出テーブル記憶部１３３へ、格納する各値を算出した後に、情報を格納する（ステップＳ１１２）。具体的には、変異率特定部１１６は、総塩基配列長１３３Ａに対して、Ｈの値を格納する。例えば、図８、図９の例であれば、総塩基配列長１３３Ａの値は、フラグメント識別子１３２Ａが「１ａ」であるフラグメントの基準塩基配列長１３２Ｃである「５０」から、フラグメント識別子１３２Ａが「５ａ」であるフラグメントの基準塩基配列長１３２Ｃである「４５」までの値を累積させた値である「２３０」となる。

　そして、変異率特定部１１６は、総一致塩基数１３３Ｂに対して、Ｓを格納する。例えば、図８、図９の例であれば、総一致塩基数１３３Ｂの値は、フラグメント識別子１３２Ａが「１ａ」であるフラグメントの一致塩基数１３２Ｄである「５０」から、フラグメント識別子１３２Ａが「５ａ」であるフラグメントの一致塩基数１３２Ｄである「４５」までの値を累積させた値である「２２８」となる。

　そして、変異率特定部１１６は、総一致率１３３Ｃに対して、総塩基配列長１３３Ａの値に占める総一致塩基数１３３Ｂの割合を格納する。例えば、図８、図９の例であれば、総一致率１３３Ｃの値は、（２２８／２３０）×１００．０％）＝「９９．１％」となる。なお、当該総一致率１３３Ｃに格納する値は、本発明にかかるＤＮＡの評価方法１の変異率算出フェイズ１０Ｄにおける総一致率に対応する値である。

　そして、変異率特定部１１６は、変異率１３３Ｄに対して、全体の割合（％）から総一致率１３３Ｃが特定する割合（％）を引いた値を格納する。例えば、図８、図９の例であれば、変異率１３３Ｄの値は、「１００．０（％）－９９．１（％）＝０．９（％）」となる。なお、当該変異率１３３Ｄに格納する値は、本発明にかかるＤＮＡの評価方法１の変異率算出フェイズ１０Ｄにおける変異率に対応する値である。

　以上が、変異率算出処理の処理内容である。変異率算出処理によれば、本発明にかかるＤＮＡの評価方法１の変異率算出フェイズ１０Ｄにおけるステップ３１～３６に相当する処理を核酸情報処理装置１００を用いて計算上で行うことができる。そのため、変異率算出フェイズを正確かつ素早く、再現性を持って安価に実施することができるといえる。

　図１３は、変異率算出処理のステップＳ１０５において実施される塩基配列同士の一致塩基数の算出処理を示すフローを示す図である。当該処理は、ＤＰ（Ｄｙｎａｍｉｃ　Ｐｒｏｇｒａｍｍｉｎｇ）マッチング法を応用した技術であり、塩基配列のホモロジー解析にも応用しうる技術である。

　まず、経時データ比較部１１５は、テーブルあるいは二次元配列であるＴＡＢ１を作成する（ステップＳ１０５１）。具体的には、経時データ比較部１１５は、一致塩基数を算出する対象となる２つのフラグメント、すなわち行側の塩基配列Ｐ１および列側の塩基配列Ｐ２の塩基配列をそれぞれ読み込み、縦軸（Ｘ）に、Ｐ１のフラグメントが有する塩基配列を構成する塩基を最初から比較塩基配列長と同数だけ配列の順に並べ、他方の軸である横軸（Ｙ）にＰ２のフラグメントが有する塩基配列を構成する塩基を最初から比較塩基配列長と同数だけ配列の順に並べてＴＡＢ１とする。そして、ＴＡＢ１の各交点に、該当する縦軸上の塩基と横軸上の塩基が同一であれば「１」の値を、異なっていれば「０」の値を格納する。

　ここで、ＴＡＢ１の作成に用いる２つの塩基配列は、どちらも、図１５の１）に示すように、塩基配列情報の最初から比較塩基配列長と同数だけ用いる。これは、前述したように、フラグメント生成フェイズ１０Ｂにおいて、制限酵素などの再現性を持つ切断方法を用いて、同一の個体の採取時期が異なるサンプル間で、対応するフラグメントを特定してその変異率を正確に計算できるようにしてあるためである。

　ただし、塩基配列の情報を取得する塩基配列情報取得手順において、塩基配列が、互いの末端塩基配列が異なる手順で塩基配列を取得した場合は、塩基配列の重なっている部分を求めて変異率を計算する。

　なお、以降においては、ＴＡＢ１上の縦軸上のＳ番目の塩基と横軸上のＴ番目の塩基の交点の値を示すのに、ＴＡＢ１（Ｘ、Ｙ）と表記するものとする。ＴＡＢ２についても、同様にＴＡＢ２（Ｓ、Ｔ）と表記するものとする。なお、Ｓ、Ｔはそれぞれ正の整数であって、それぞれの最大値はともに基準配列長である。

　そして、経時データ比較部１１５は、ＴＡＢ１を複製したＴＡＢ２を一致塩基数算出テーブル記憶部１３４上に作成し、ＴＡＢ２の縦軸上の最後から二番目に位置する塩基と横軸上の最後から二番目に位置する塩基との交点ＴＡＢ２（比較塩基配列長－１、比較塩基配列長－１）から、ＴＡＢ２の縦軸上の最初に位置する塩基と横軸上の最初に位置する塩基との交点ＴＡＢ２（１、１）に向かって、すべての交点ＴＡＢ２（Ｘ、Ｙ）について処理を行う（ステップＳ１０５２）。処理の内容は、ステップＳ１０５３の処理である。

　経時データ比較部１１５は、ＴＡＢ２（Ｘ、Ｙ）について、所定の値を算出して格納する（ステップＳ１０５３）。具体的には、経時データ比較部１１５は、まず、ＴＡＢ２（Ｘ＋１，Ｙ＋１）～ＴＡＢ２（Ｘ＋１，比較配列長）とＴＡＢ２（Ｘ＋１，Ｙ＋１）～ＴＡＢ２（比較配列長，Ｙ＋１）の行列中で最大値を特定する。これを処理１とする。次に、得られた最大値をＴＡＢ１（Ｘ，Ｙ）に加算してＴＡＢ２（Ｘ，Ｙ）に格納する。これを処理２とする。処理１と処理２とを、ＴＡＢ２（比較塩基配列長－１，比較塩基配列長－１）からＴＡＢ２（１，１）まで点線の矢印の順に計算し、ＴＡＢ２を完成する。

　そして、経時データ比較部１１５は、ＴＡＢ２（１、１）の値を一致塩基数として読み取り、出力情報０１に格納する（ステップＳ１０５４）。

　そして、経時データ比較部１１５は、出力情報Ｏ１の一致塩基数の値を比較塩基配列長Ｐ３で除して１００倍した値を、塩基配列一致率として出力情報のＯ２に格納する。

　以上が、変異率算出処理のステップＳ１０５において実施される塩基配列同士の一致塩基数の算出処理である。一致塩基数の算出処理によれば、容易に最長の一致塩基数を取得することができる。

　図１６は、核酸情報処理装置１００が出力する差分変異率の出力画面２００の例である。当該出力画面２００は、本発明にかかるＤＮＡの評価方法１の結果出力フェイズ１０Ｅにおけるステップ４１の処理の結果を示す画面に相当する。出力画面２００の表示時には、核酸情報処理装置１００は、求めた変異率が前回の経時ファイルとの比較を行う差分変異率である場合には、所定の基準範囲と比較して注意を要する度合いを特定し、サンプル採取時順にグラフ化して注意を要する度合いとともに出力する。

　具体的には、グラフ生成部１１７は、差分変異率が算出されると、差分変異率を求めた対象すなわち種、個体および部位が一致する経時ファイルであって採取時識別子が過去を示す経時ファイルを所定数読み取り、その経時ファイルに含まれる差分変異率の情報を経時順に並べて折れ線グラフ等に変換し、描画情報とする。また、明確に環境変化等の時期が記憶部１３０上等に保存されている場合には、当該時期をグラフ上に示すよう描画情報を作成する。そして、グラフ生成部１１７は、過去の定常状態すなわち環境変化前の状態における差分変異率の標準変動域を算出して強調表示する描画情報を生成するとともに、算出された差分変異率が標準変動域から逸脱する場合には、所定の警告メッセージ等を併せて描画情報に埋め込んで生成する。

　なお、前述のとおり、標準変動域は、グラフ生成部１１７が、環境変化前における差分変異率の最大値を上限として、最小値を下限として設定する方法が考えられる。しかし、これに限られず、例えばグラフ生成部１１７が、環境変化前における差分変異率の平均値を求めて、当該平均値に所定の重みづけを行い上限と下限を設定することも考えられる。

　あるいは、グラフ生成部１１７が、定常状態の標準変動域を設定するために、定常状態の複数のサンプルの差分変異率の標準偏差、中央値または平均偏差等の統計的数値を求め、これを基準として標準変動域を設定するようにしてもよい。

　出力画面２００においては、種識別子、個体識別子、部位識別子を表示する対象表示領域２１０と、差分変異率を採取時に応じて数値で示す表２２０と、グラフを用いて差分変異率の経時的変遷を示すグラフ表示領域２３０と、が表示される。

　表２２０には、差分変異率表示欄２２１と、環境変化のあった時期を示す環境変化目安表示２２２とが含まれる。また、グラフ表示領域２３０には、横軸２３１に時間軸、縦軸２３２に差分変異率を配した折れ線グラフ２３３が含まれる。また、グラフ表示領域２３０には、環境変化を示す時期を明示する環境変化標識２３４と、過去の定常状態すなわち環境変化前の定常状態における差分変異率の標準変動域２３５と、差分変異率が標準変動域２３５を逸脱する場合には、警告メッセージ２３６（例えば、「要対策」の文字メッセージ等）が強調表示される。

　なお、本発明にかかる差分変異率の表示方法については、一度に採取したサンプルの全量を用いて一つの経時ファイルを作成する方法に限らず、サンプルの一部ずつについて採取時が同じである経時ファイルを作成しておき、採取時が同じである複数の経時ファイルの一部同士の差分変異率を特定してファイル間の差分変異率の平均値等を用いて差分変異率を表示する多数回解析の結果を表示するようにしてもよい。

　図１７は、このような多数回解析における、核酸情報処理装置１００が出力する差分変異率の平均値の出力画面３００の例である。当該出力画面３００は、本発明にかかるＤＮＡの評価方法１の結果出力フェイズ１０Ｅにおけるステップ４１の処理の結果を示す画面の変形例に相当する。出力画面３００の表示時には、核酸情報処理装置１００は、求めた変異率の平均値が前回の経時ファイルとの比較を行った差分変異率の平均値である場合には、差分変異率の平均値と標準変動域と比較して注意を要する度合いを特定し、サンプル採取時順にグラフ化して注意を要する度合いとともに出力する。

　具体的には、グラフ生成部１１７は、差分変異率の平均値が算出されると、差分変異率を求めた対象すなわち種、個体および部位が一致する経時ファイルであって採取時識別子が過去を示す経時ファイルを所定数読み取り、その経時ファイルに含まれる差分変異率と差分変異率の平均値との情報を経時順に並べて折れ線グラフ等に変換し、描画情報とする。

　この場合において、グラフは、平均値だけではなく、最大値と最小値、あるいは標準偏差なども併せて表示する棒足とすることが考えられる。また、明確に環境変化の時期が記憶部１３０上等に保存されている場合には、当該時期をグラフ上に示すよう描画情報を作成する。そして、グラフ生成部１１７は、過去の定常状態すなわち環境変化前の状態における差分変異率の標準変動域を算出して強調表示する描画情報を生成するとともに、算出された差分変異率の平均値が標準変動域から逸脱する場合には、所定の警告メッセージ３３６（例えば、「要対策」の文字メッセージ等）等を併せて描画情報に埋め込んで生成する。

　なお、前述のとおり、標準変動域は、グラフ生成部１１７が、環境変化前における差分変異率の最大値を上限として、最小値を下限として設定する方法が考えられる。しかし、これに限られず、例えばグラフ生成部１１７が、ＤＮＡ変化前における差分変異率の平均値を求めて、当該平均値に所定の重みづけを行い上限と下限を設定することも考えられる。またあるいは、グラフ生成部１１７が、定常状態の標準変動域を設定するために、定常状態の複数のサンプルの差分変異率の標準偏差、中央値または平均偏差等の統計的数値を求め、これを基準として標準変動域を設定するようにしてもよい。

　出力画面３００においては、種識別子、個体識別子、部位識別子を表示する対象表示領域３１０と、差分変異率を採取時に応じて数値で示す表３２０と、グラフを用いて差分変異率の経時的変遷を示すグラフ表示領域３３０と、が表示される。

　表３２０には、差分変異率表示欄３２１と、環境変化のあった時期を示す環境変化目安表示３２２とが含まれる。また、グラフ表示領域３３０には、横軸３３１に時間軸、縦軸３３２に差分変異率を配した棒足３３７付折れ線グラフ３３３が含まれる。また、グラフ表示領域３３０には、環境変化を示す時期を明示する環境変化標識３３４と、過去の定常状態すなわち環境変化前の定常状態における差分変異率の標準変動域３３５と、差分変異率が標準変動域３３５を逸脱する場合には、警告メッセージ３３６（例えば、「要対策」の文字メッセージ等）が強調表示される。

　図１８は、核酸情報処理装置１００が出力する積算変異率の出力画面４００の例である。当該出力画面４００は、本発明にかかるＤＮＡの評価方法１の結果出力フェイズ１０Ｅにおけるステップ４２の処理の結果を示す画面に相当する。出力画面４００の表示時には、核酸情報処理装置１００は、求めた変異率が、基準となる経時ファイルとの比較を行って算出する積算変異率である場合には、所定の閾値と比較して注意を要する度合いを特定し、サンプル採取時順にグラフ化して注意を要する度合いとともに出力する。

　具体的には、グラフ生成部１１７は、積算変異率が算出されると、積算変異率を求めた対象すなわち種、個体および部位が一致する経時ファイルであって採取時識別子が過去を示す経時ファイルを所定数読み取り、その経時ファイルに含まれる積算変異率の情報を経時順に並べて折れ線グラフ等に変換し、描画情報とする。また、明確に環境変化の時期が記憶部１３０上等に保存されている場合には、当該時期をグラフ上に示すよう描画情報を作成する。そして、グラフ生成部１１７は、疾患等の発症率等を考慮してあらかじめ定められた閾値を特定して強調表示する描画情報を生成するとともに、算出された積算変異率が閾値を超える場合には、所定の警告メッセージ等を併せて描画情報に埋め込んで生成する。

　なお、前述のとおり、閾値は、グラフ生成部１１７が、疾患や異常の発症リスクが見過ごせないほど高まるといえる一定の所与の値として設定する方法が考えられる。しかし、これに限られず、例えばグラフ生成部１１７が、同種の異個体の同部位の平均的な積算変異率の平均値等に応じて設定してもよい。また、同一個体であっても加齢等による閾値の変化が考えられるため、一定の法則に応じた閾値を設定するようにしてもよい。

　出力画面４００においては、種識別子、個体識別子、部位識別子を表示する対象表示領域４１０と、積算変異率を採取時に応じて数値で示す表４２１と、グラフを用いて積算変異率の経時的変遷を示すグラフ表示領域４３０と、が表示される。

　表４２１には、積算変異率表示欄４２２と、環境変化のあった時期を示す環境変化目安表示４２３とが含まれる。また、グラフ表示領域４３０には、横軸４３１に時間軸、縦軸４３２に積算変異率を配した折れ線グラフ４３３が含まれる。また、グラフ表示領域４３０には、環境変化を示す時期を明示する環境変化標識４３４と、所定の閾値を強調表示する閾値表示４３５と、積算変異率が閾値を超える場合には、警告メッセージ４３６（例えば、「要対策」の文字メッセージ等）が強調表示される。

　ところで、図１６～１８は、単独の被検体５における単独の部位を解析した核酸情報処理装置１００からの出力画面である。よって、本発明にかかるＤＮＡの評価方法１において、所定の被検体５について、複数の部位について差分変異率や積算変異率を算出した場合には、図１６～１８に示したような出力画面を各部位に対応するかたちで重ねて表示することもできるし、単一の出力画面に複数の部位毎に表２２０、３２０及び４２０並びにグラフ表示領域２３０、３３０及び４３０を表示してもよい。この場合には、問題となった環境変化が被検体５の如何なる部位に影響を及ぼしているのかを視覚的に比較して把握することができる。

　さらに、本発明にかかるＤＮＡの評価方法１において、所定の被検体５を含む集団について差分変異率や積算変異率を算出した場合には、例えば対象表示領域２１０、３１０及び４１０に当該集団の特徴を表示することができる。集団の特徴とは、集団を構成する被検体５の居住地域、性別、年齢構成及び既往歴等の情報であって、他の集団から区別することで、問題となる環境変化の影響を集団として把握することができる。すなわち、この場合、当該特徴によって定義される集団に対する警告メッセージ２３６、３３６及び４３６を出力することができる。

　以上が、本発明にかかるＤＮＡの評価方法１の第一の実施形態である。第一の実施形態によれば、機能領域あるいは非機能領域にかかわらず、両者のデータを併せて利用できるため、差分変異率及び/又は積算変異率を用いて容易に感度良く個体単位の塩基配列の変異の傾向を把握することができる。また、差分変異率あるいは積算変異率の変化の傾向を通じて、環境変化が個体に影響を与えているか否かを、ＤＮＡの評価として容易に把握できる。また、複数回のサンプルのＤＮＡの差分変異率の推移が、増加傾向、不変、減少傾向などのいずれの傾向をどの程度示すかを解析し、環境変化によるゲノム塩基配列の変化の有無、傾向、程度などの判断、予測を行う基礎として活用することができる。

　なお、本願発明は、上記実施形態に限定されるものではなく、発明の主旨を逸脱しない範囲で変形することが可能である。例えば、図１９に示すように、第二の実施形態として、経時データの作成にあたって発生しうる読み取り誤差の影響を少なくするために、複数に分割されたサンプルすなわち互いに同一となる複数のフラグメントを用いてＤＮＡシーケンサー２０により塩基配列の読み取りを行い、読み取り結果である経時１における経時ファイル２１である経時１ファイルＡ２１と経時１ファイルＡ’２１’とを比較して読み取り誤差を算出する手順２２を設け、算出した読み取り誤差２３を経時データと対応付けて保持することとする経時データ生成フェイズ１０Ｃ’を行うようにしてもよい。なお、第二の実施形態は、第一の実施形態と基本的に同様の構成を備えるものであるため、以下においては相違点を中心に説明する。

　第二の実施形態の経時データ生成フェイズ１０Ｃ’においては、まず、フラグメント生成フェイズ１０Ｂにより生成した同一の経時サンプル（例えば経時１サンプル）のフラグメント群のＤＮＡを、複数のフラグメント群ＡおよびＡ’に分割し、それぞれについてＤＮＡシーケンサー２０で塩基配列を読み取り、得られた塩基配列データを経時１ファイルＡおよび経時１ファイルＡ’に格納する。ここで、複数のフラグメント群ＡおよびＡ’は、フラグメント生成フェイズ１０Ｂにより生成した経時サンプル、すなわちフラグメントを含有する溶液を略同量となるように分割することで調整することができる。

　次に、これら２つのファイルの塩基配列情報を、前の説明中で変異率算出に用いた図１２のグループ間の塩基配列比較ルーティンの入力情報Ｉ１およびＩ２として格納し、Ｓ１０１～Ｓ１１２の各ステップをフローに従って実行して経時１ファイルＡと経時１ファイルＡ’との総フラグメント集計テーブル１３２および変異率導出テーブル１３３を作成し、経時１ファイルＡと経時１ファイルＡ’との間の変異率を求める。このようにして得られた変異率を、読み取り誤差とする。

　以上が、読み取り誤差算出処理の処理フローである。読み取り誤差算出処理によれば、経時データを作成する際に、同一の塩基配列を有するべきフラグメントを複数回シーケンス処理した結果を比較することで、読み取り誤差を算出することができる。フラグメント生成フェイズ１０Ｂにより生成したフラグメント群Ａを分割してフラグメント群Ａ’を得た場合、両群に含まれるフラグメント（ＤＮＡ）は全く同一の構成であって、各フラグメントの塩基配列は同一と考えられるため、両者に相違が見られた場合、その相違は、塩基配列決定時の実験操作によって生じたものと考えられる。このため、両群に含まれるフラグメント（ＤＮＡ）から得られた塩基配列同士の間にどれだけの相違が見られるかを調べることで、塩基配列決定の実験における読み取り誤差を、明確に検出できるためである。

　読み取り誤差を用いた変異率の算出方法としては、変異率を比較する経時データの一方に含まれるフラグメントをａとして、他方の経時データに含まれる対応するフラグメントをｂとすると、二つの経時データのそれぞれの読み取り誤差を考慮した全体の読み取り誤差を算出し、フラグメントａとｂとの基準塩基配列長に占める変異部分の長さから全体の読み取り誤差を引いた長さの割合を変異率として算出する方法が考えられる。

　すなわち、フラグメントａの属する経時データの総塩基配列長からフラグメントａとｂとの総一致塩基数を引いた長さと、フラグメントｂの属する経時データの総塩基配列長からフラグメントａとｂとの総一致塩基数を引いた長さとの和を求め、これをフラグメントａの属する経時データの総塩基配列長とフラグメントｂの属する経時データの総塩基配列長との和で除すると、全体の読み取り誤差を算出することができる。そして、ａのフラグメントとｂのフラグメントとの間で相違する部分の長さの合計から全体の読み取り誤差を引いた値がフラグメントａとｂとの間の基準塩基配列長に占める割合を変異率ととらえることができる。

　なお、読み取り誤差を考慮して経時ファイル間の変異率を求める場合に、用いる経時データの各フラグメントの塩基配列は、読み取り誤差算出の際に作成した総フラグメント集計テーブル１３２の、同一の行のフラグメント識別子１３２Ａと最高一致フラグメント識別子１３２Ｂとの組合せのうち、塩基配列長が短い方のフラグメント塩基配列を使用し、フラグメント塩基配列長は、同一の行の基準塩基配列長を使用する。

　以上が、本発明にかかるＤＮＡの評価方法１の第二の実施形態である。第二の実施形態によれば、読み取り誤差を除外して変異率を求めることができるため、より精度の高い変異率の比較が可能となる。

　また例えば、第一の実施形態にかかる変異率算出処理においては、対応フラグメントを特定する処理を行っているが、多対多のマッチングを行う原理であるから、経時ファイルに含まれるフラグメント数が多くなるほど、演算量が多くなる傾向にある。したがって、第三の実施形態として、マッチングさせるフラグメントを予めグルーピングして、マッチング範囲を区切ることで、演算量を著しく低減させることが可能となる。なお、第三の実施形態については、第一の実施形態と基本的に同様の構成を備えるものであるため、以下においては相違点を中心に説明する。

　図２０は、このような第三の実施形態に係る変異率算出処理６００の流れを示す図である。変異率特定部１１６は、対比する経時１ファイル２１と、経時２ファイル２５に属するそれぞれのフラグメントを、切断に用いた酵素に応じてグループ分けする（６０１、６０２）。具体的には、核酸情報処理装置１００は、図２１に示す経時データ記憶部１３１´を備えており、フラグメントＩＤ１３１Ｈに対応付けられたフラグメントを切断した酵素を特定する切断酵素グループ１３１Ｍの情報を含む。変異率特定部１１６は、切断酵素グループ１３１Ｍに基づいて、フラグメントごとにグループ分けを行う。なお、この切断酵素グループ１３１Ｍの情報は、制限酵素の種類を示す情報である。すなわち、フラグメントの塩基配列情報１３１Ｋの検索範囲として、所定の制限酵素による処理で末端に創出される特定の塩基配列を検索し、当該塩基配列を末端に含む塩基配列情報１３１Ｋに当該所定の制限酵素を示す情報を関連付ける。

　なお、本処理において切断に用いた制限酵素に応じてグループ分けを行うのは、切断端の塩基配列が同一の塩基配列同士を比較するためである。使用する制限酵素が異なれば、切断端の塩基配列が異なり、その場合には一致率が相対的に低くなり無駄な演算を行うこととなるためである。よって、仮に、切断端が同一となる複数の制限酵素で切断したフラグメントであれば、同一のグループとして扱ってもよいといえる。

　そして、変異率特定部１１６は、同一の酵素を用いたグループのフラグメント２１Ａとフラグメント２５Ａ間、およびフラグメント２１Ｂとフラグメント２５Ｂ間に限り、経時１ファイル２１と経時２ファイル２５に含まれるフラグメント間対応フラグメントを特定する処理を行い、グループごとに図１２のグループ間の塩基配列比較ルーティンのＳ１０１～Ｓ１１２の各ステップをフローに従って実行して、グループごとの総基準塩基配列長、変異塩基数を求める（ステップ６０３、ステップ６０４）。なお、変異塩基数は、総基準塩基配列長から総一致塩基数を引いた数である。

　そして、変異率特定部１１６は、変異率を求める（ステップ６０５）。具体的には、変異率特定部１１６は、酵素グループごとに算出した変異塩基数をグループをまとめて和し、酵素グループごとに算出した総基準塩基配列長をグループをまとめて和した値で除し、これを１００倍することで、変異率（％）を算出する。

　すなわち、第三の実施形態におけるＤＮＡの評価方法１は、別の表現を行うと、以下のように表現できるものであるともいえる。サンプルＡの酵素グループＩに対するサンプルＢの酵素グループＩの一致率をＢＩｃとして、サンプルＡの酵素グループＩのＤＮＡフラグメント群に対する、サンプルＢの酵素グループＩのＤＮＡフラグメント群の総一致塩基数をＬＩＡＢとして、酵素グループＩのＤＮＡフラグメント群の総塩基配列長をＬＩとして、サンプルＡの酵素グループＩＩに対するサンプルＢの酵素グループＩＩの一致率をＢＩＩｃとして、サンプルＡの酵素グループＩＩのＤＮＡフラグメント群に対する、サンプルＢの酵素グループＩＩのＤＮＡフラグメント群の総一致塩基数をＬＩＩＡＢとして、酵素グループＩＩのＤＮＡフラグメント群の総塩基配列長をＬＩＩとして、サンプルＡのＤＮＡ塩基配列に対するサンプルＢのＤＮＡ塩基配列の合算一致率をＳＡＢとする場合、下式（１）～（３）が成り立つ。

　ＢＩｃ　＝　ＬＩＡＢ／ＬＩ・・・式（１）
ＢＩＩｃ　＝　ＬＩＩＡＢ／ＬＩＩ・・・式（２）
ＳＡＢ　＝　（ＬＩＡＢ＋ＬＩＩＡＢ）／（ＬＩ＋ＬＩＩ）・・・式（３）
　また、変異率の算出にあたっては、サンプルＡのＤＮＡに対するサンプルＢのＤＮＡの変異率をＶＡＢとする場合、下式（４）が成り立つ。

　　　　ＶＡＢ　＝　１－ＳＡＢ・・・式（４）
　以上が、第三の実施形態に係る変異率算出処理６００のフローである。このようにすることで、変異率特定部１１６は、グループ内のマッチングを行うだけで対応するフラグメントを特定しうるため、マッチングパターンを全体として減らすことができるため、効率よく変異率の特定を行うことができる。

　以上、第三の実施形態について説明した。なお、上記酵素グループによる処理は、切断酵素が異なれば切断された端部の塩基配列が異なる組み合わせとなる特性を利用している。そのため、切断した酵素が不明なフラグメントが含まれる経時ファイルであっても、フラグメントの端部の塩基配列のパターンによりグループ分けを行うようにすることも考えられる。

　以上、本発明について、実施形態を説明した。

　なお、本願発明は、上記実施形態に限定されるものではなく、発明の主旨を逸脱しない範囲でさらに変形することが可能である。

　例えば、同種の複数個体のサンプルのＤＮＡ塩基配列を決定すれば、当該種における、サンプルＡのＤＮＡに対するサンプルＢのＤＮＡの差分変異率の幅がわかる。この結果を、サンプルＡのＤＮＡに対するサンプルＢのＤＮＡの差分変異率が変化したかどうかの判定に考慮することで、環境変化が特定の生物種のＤＮＡに及ぼす影響の評価ができるものとなる。

　また例えば、環境変化後も同一個体から継時的に反復して採取し、被検体５のＤＮＡに対する差分変異率の変化を追跡することで、環境変化が個体のゲノムに及ぼす短期的、長期的な影響度の消長が評価できるものとなる。さらに、既知の差分変異率の変化に基づいて図１６の折れ線グラフの予想としての線２３７または図１７の折れ線グラフの予想としての線３３８を引くことにより、今後の予測もできる可能性がある。

　また例えば、環境変化後も同種の複数個体から継時的に反復して採取し、種全体としての差分変異率の変化を追跡することで、環境変化が当該種のゲノムに及ぼす短期的、長期的な影響度の消長が評価できるものとなる。さらに、既知の差分変異率の変化に基づいて図１６の折れ線グラフの予想としての線２３７または図１７の折れ線グラフの予想としての線３３８を引くことにより、今後の予測もできる可能性がある。

　また例えば、環境変化後も同一個体から継時的に反復して採取し、被検体５のＤＮＡに対する積算変異率の変化を追跡することで、各採取時点における個体に対する疾病や異常の発生リスクの程度が評価できるものとなる。さらに、既知の積算変異率の変化に基づいて図１８の折れ線グラフの予想としての線４３７を引くことにより、今後の予測もできる可能性がある。

　また例えば、環境変化後も同種の複数個体から継時的に反復して採取し、種全体としての積算変異率の変化を追跡することで、各採取時点における当該種に対する疾病や異常の発生リスクの程度が評価できるものとなる。さらに、既知の積算変異率の変化に基づいて図１８の折れ線グラフの予想としての線４３７を引くことにより、今後の予測もできる可能性がある。

　また例えば、環境変化後も複数種の個体について採取と解析を行えば、環境変化が生態系に及ぼす短期的、長期的なＤＮＡへの影響度の消長が評価できるものとなる。

　なお、上記実施形態および変形例におけるＤＮＡの評価方法１および核酸情報処理装置１００は、サービスとして取引対象とするだけでなく、他の機器等と組み合わせてシステムとして取引対象としたり、機器の動作を実現するプログラム部品単位で取引対象とすることも可能である。

　以下、実施例により本発明を更に詳細に説明するが、本発明の技術的範囲は以下の実施例に限定されるものではない。

〔実施例１〕
　本実施例では、異なる時期に取得したＤＮＡの塩基配列に関する情報の一例として、異なる放射線量で被爆したシロイヌナズナから得たゲノム配列情報を使用した。すなわち、本実施例では、放射線被曝によるゲノムに対する変異導入が変異率の変化として検出できるか解析した。

　具体的に本実施例では、所定の線量の放射線をシロイヌナズナに照射し、そのゲノムDNAを制限酵素で切断した後にゲノム塩基配列を次世代シーケンサーで決定し、放射線照射を受けた個体と受けなかった個体で変異率に違いが見られるかどうかを、以下の手順で検討した。

〔1.シロイヌナズナの培養〕
　シロイヌナズナ(Columbia-0)を Murashige and Skoog Basal Medium (2% sucrose、0.75% agar含有、pH5.8、SIGMA-ALDRICH社製)に25個体/9 cmシャーレになるよう播種し、低温処理(4℃)を4日間行った後、22℃、白色光(約35 μmol/m²/s)を常時照射した状態(cW)で5日間栽培した。

〔2.シロイヌナズナへのX線照射〕
　上記1.に記載の寒天培地上に生育したシロイヌナズナ(Columbia-0)の5日目の芽生えに、X線(3.47 Gy/min、150 kV、20 mA)を照射線量10、25、50或いは100 Gyになるよう照射した。X線発生照射装置は、MBR-1520R-3（株式会社日立パワーソリューションズ社製）を用いた。X線照射後、22℃で白色光(約35 μmol/m²/s)を常時照射した状態(cW)で21日間栽培した。なお、比較のために、X線を照射しない以外は同じ条件シロイヌナズナを栽培し、比較対照のシロイヌナズナとした。

〔3.シロイヌナズナからのDNA調製〕
　X線を照射したシロイヌナズナ及び対照のシロイヌナズナについて、DNeasy Plant Maxi Kit(QIAGEN社製)を用いて、以下のプロトコルに従ってDNA抽出を行った。

　先ず、シロイヌナズナ(1.0 g以下)をバイオマッシャーSP(株式会社ニッピ社製)に量り取り、液体窒素で冷却しながらペースト状になるまですり潰した。その後、65℃に加温したBuf.AP1を5ml、RNaseA(100mg/ml)を10μl加え、ボルテックスで激しく混合した。その後、65℃で10分間インキュベートした(途中で2～3回転倒混和した)。次に、Buf.P3を1.8ml加え混合し、氷上で10分間冷却した。その後、3,500×g、25℃、5分間、スウィングローターで遠心分離した。その後、QIAshredder Maxi Spin Columnに上清を移し、3,500×g、25℃、5分間、スウィングローターで遠心分離した。

　次に、フロースルー液を新しい50mlコニカルチューブに移し、液量を測定した。そして、フロースルー液の1.5倍量のBuf.AW1を添加し、すぐにボルテックスで混合した。その後、混合した溶液をDNeasy Maxi Spin Columnに全量移し、3,500×g、25℃、5分間、スウィングローターで遠心分離した。そして、フロースルー液を捨て、カラムを戻し、Buf.AW2を12 ml加え、3,500×g、25℃、10分間、スウィングローターで遠心分離した。その後、フロースルー液を捨て、カラムを戻し、3,500×g、25℃、5分間、スウィングローターで遠心分離した。

　次に、フタを外して10分間室温で乾燥させた後、Collection Tubeにカラムを移し、Buf.AEを750μl加え、室温で5分間インキュベートした。その後、3,500×g、25℃、5分間、スウィングローターで遠心分離し、フロースルー液をシロイヌナズナDNA溶液とした。得られたシロイヌナズナDNA溶液をエタノール沈殿でDNA溶液を濃縮した(DNA溶液の濃度が100～200ng/μlになるように調製)。

〔4. シロイヌナズナDNAの制限酵素切断〕
　本実施例では、制限酵素としてHindIII-HFを使用した。シロイヌナズナDNAを9μg、10×Cut Smart Buf.(ニュー・イングランド・バイオラボ・ジャパン株式会社（NEB）製)を11μl、HindIII-HF(20,000U/ml、NEB社製)を4μl(80U)、Total:110μlの反応溶液を作成し、37℃、オーバーナイトで反応させた。65℃、20分間加温し、制限酵素反応を停止した。

〔5.シロイヌナズナDNAの制限酵素切断産物の分画回収〕
　1.2%アガロースゲル電気泳動を行い、1.0～1.5 kbpの部分のゲルの切り出しを行った(使用マーカー：NEB N3232)。切り出したゲルを、Wizard SV Gel and PCR Clean-Up System(Promega社製)で精製した。

　すなわち、先ず、ゲル片10mgに対して10μlのMembrane Binding Solutionを添加し、65℃で10分間加温しゲル片を溶解した(2～3分毎にボルテックスで混合した)。そして、ゲルを溶解した溶液を350μlずつSV Minicolumnに移し、1分間室温でインキュベートした後、16,000×g、25℃、1分間遠心分離した。そしてフロースルー液を捨て、カラムを戻し、ゲルを溶解した溶液の全てがカラムを通過するまでこの操作を繰り返し行った。

　次に、フロースルー液を捨て、カラムを戻し、Membrane Wash Solutionを700μl添加し、16,000×g、25℃、1分間遠心分離した。そして、フロースルー液を捨て、カラムを戻し、Membrane Washu Solutionを500μl加え、16,000×g、25℃、5分間遠心分離した。その後、フロースルー液を捨て、カラムを戻し、16,000×g、25℃、5分間遠心分離した。そして、カラムを新しい1.5 mlチューブに移し、Nuclease-Free Waterを50μl加え、室温で1分間インキュベートし、16,000×g、25℃、1分間遠心分離し、フロースルー液を回収した。

〔6.DNA塩基配列解析〕
　上記5.で得られたDNA溶液を用いて、次世代シーケンサー Miseq(イルミナ社製)で、標準プロトコルに従って、塩基配列を解読した。その際、DNAは、Miseqの標準プロトコル中の超音波処理によるフラグメント切断を行わずにフラグメント両端にアダプタを接続し、塩基配列解読を行った。

〔7.塩基配列解析結果からタグ配列の抽出〕
　上記6.で得られた塩基配列解析結果として、次世代シーケンサー Miseqで解読された核酸断片の塩基配列（リード）が得られる。本実施例では、MiSeqから得られたリードのうち、末端がHindIIIの切り口であるAGCTTで始まるリードを抽出した。そして、抽出したリードに対して、5’末端から150bpの長さとなるようにトリミングした。そして、トリミング後の塩基配列（5’- AGCTT……：全長150bp）をタグ配列として解析に使用した。

　なお、リードに対して5’末端から150bpの長さとなるようにトリミングすることで、3’側のクオリティの低い配列情報を削除することとなる。このようにトリミングすることによって、得られたタグ配列の平均クオリティを99%以上とすることができる。

　本実施例では、この処理の結果、表１に示すように、先頭がAGCTTで始まる150bpのタグ配列が、サンプルごとに20万配列以上ずつ得られた。総リード数に対するタグ配列数の割合は、18～25%であった。

〔8.タグ配列の出現頻度の計算〕
　上記7.で得られた全てのタグ配列について、その出現頻度を計算した。本実施例において、出現頻度は、所定のサンプルについて得られた全てのタグ配列のなかで、同一の塩基配列からなるタグ配列が出現する数とした。

　また、本実施例では、X線未照射のサンプル、X線の放射線量の異なる４種類のサンプルのそれぞれについてタグ配列の出現頻度を計算し、その後、全サンプルの計算結果を統合し、サンプル毎に各タグ配列の出現頻度が一覧で記載されたテーブルを作成した。

〔9.変異率１の算出〕
　以上のように算出したタグ配列毎の出現頻度は、放射線の照射によりDNAに変異が生じると変化することが期待される。すなわち、所定のタグ配列について、X線未照射のサンプルにおける出現頻度と、X線照射のサンプルにおける出現頻度は異なることが期待される。そこで、タグ配列毎の出現頻度をサンプル間で以下の手順に従って比較した。

　先ず、DEGseq (Wang L, Feng Z, Wang X, Zhang X. 2009. Bioinformatics)という群間比較ソフトウェアを用い、X線未照射のサンプルのデータを基準にして、各サンプルとの間で同一のタグ配列の出現頻度の統計検定を行い、基準とした未照射のサンプルと比較して出現頻度が有意に変動したタグ配列数を算出した。メソッドとしては”LRT（Likelihood Ratio Test）” を選択し、p-value 0.001以下を抽出した。

　次に、出現頻度が有意に変動したタグ配列数の全タグ配列数に対する割合を算出し、これを変異タグ配列率とした。ここで、全タグ配列数とは、上記7.で得られたタグ配列の総数とは異なり、上記7.で得られた全てのタグ配列に含まれるタグ配列の種類の総数である。この変異タグ配列率をX線未照射のサンプル、X線の放射線量の異なる４種類のサンプルのそれぞれについて計算した。なお、ここで算出した変異タグ配列率は、相違する塩基配列部分の全体に対する割合として定義される変異率の一例である。

〔10.変異率２の算出〕
　また、サンプル間で出現頻度が変動した場合、そのタグ配列には１つの塩基変異が生じたと仮定することができる。したがって、上述のように計算したタグ配列の出現頻度を使用して、サンプル毎に導入された変異数を見積もることができる。そして、導入された変異数の全塩基数に対する割合を求め、これを変異塩基率とした。この変異塩基率をX線未照射のサンプル、X線の放射線量の異なる４種類のサンプルのそれぞれについて計算した。なお、ここで算出した変異塩基率は、相違する塩基配列部分の全体に対する割合として定義される変異率の一例である。

〔11.結果〕
　上記9.で計算した変異タグ配列率及び上記10.で計算した変異塩基率を表２に纏めて示した。

　表２から分かるように、変異タグ配列率及び変異塩基率ともに、未照射サンプルと照射サンプルの間で大きな差が見られた。表２に示した変異タグ配列率と変異塩基率をそれぞれグラフ化すると、それぞれ図２２及び２３のようになり、未照射群と照射群との変異率の差が視覚的に把握できる。なお、本実施例では、照射線量と変異率の間に相関は見られないが、今回の最小照射線量10Gyでも既に変異率の最大値に達している可能性があり、照射線量を変えた実験を行うことで、変異率との量的関係が見られる可能性がある。

　また、図２４に、未照射サンプルに比して放射線照射サンプルに変異が認められた例として、抽出されたタグ配列の1つにおける、ミトコンドリアDNAの205,820番目の塩基の出現頻度と出現率の表を示す。データ最上段の未照射サンプルは、本解析において比較の基準としたサンプルである。放射線照射により、一部のミトコンドリアにこの部位でG→Tの変異が生じたことがわかる。

　本実施例の結果から、放射線照射によるゲノム変異（DNAの状態の変化）を、相違する塩基配列部分の全体に対する割合として定義される変異率に基づいて検出できることが示された。

　また、本実施例の結果から、放射線照射によりシロイヌナズナのゲノムの変異率が有意に高くなることが検出できたことから、本手法により、放射線照射に起因するゲノム変異率の変化を検出できることが明らかとなった。

　以上のように、本実施例により、相違する塩基配列部分の全体に対する割合として定義される変異率を計算することによりDNAの状態を評価すること、言い換えると、環境変化がDNAの変異率に及ぼす影響を評価できることが示された。

〔実施例２〕
　本実施例では、実施例１とは異なりin silicoで制限酵素切断を行い、放射線被曝によるゲノムに対する変異導入が変異率の変化として検出できるか解析した。具体的に本実施例では、下記の手順で、シロイヌナズナに放射線を照射してそのゲノム塩基配列を次世代シーケンサーで決定し、得られたデータをコンピュータ上の操作で仮想的に制限酵素切断した後に解析して、変異率の違いが見られるかどうかを検討した。

　なお、本実施例では、〔1.シロイヌナズナの培養〕～〔3.シロイヌナズナからのDNA調製〕までは、照射線量を5、15或いは30Gyとした以外は実施例１と同様である。

〔4.DNA塩基配列解析〕
　上記3.で得られたDNA溶液を用いて、超音波処理を含めて、次世代シーケンサー Miseq(イルミナ社製)の標準プロトコルに従って、塩基配列を解読した。

〔5.塩基配列解析結果からタグ配列の抽出〕
　上記４.で得られた全リード中から、塩基配列中に制限酵素EcoRIの認識配列であるGAATTCをもつリードを抽出した。そして、抽出したすべてのリードをin silicoでEcoRI切断し、少なくとも片方の末端がEcoRIの切断端であるAATTCを持つリードの集団を仮想的に作成した。

　そして、本実施例では、AATTCを持つリードに対して5’末端から50bpの長さとなるようにトリミングした。次に、本実施例では、トリミングした塩基配列（5’- AATTC……：全長50bp）についてそれぞれ読み取り精度を計算し、読み取り精度が99%以上のものをタグ配列として解析に使用した。

　なお、このようにタグ配列を作成することで、クオリティの低いタグ配列を除去することができる。本実施例では、この処理の結果、表３に示すように、先頭がAATTCで始まる50bpのタグ配列が、サンプルごとに20万配列以上ずつ得られた。

〔6.タグ配列の出現頻度の計算〕
　本実施例でも、実施例１と同様にして、上記5.で得られた全てのタグ配列について出現頻度を計算し、X線未照射のサンプル、X線の放射線量の異なる３種類のサンプルのそれぞれについてタグ配列の出現頻度を計算し、その後、全サンプルの計算結果を統合し、サンプル毎に各タグ配列の出現頻度が一覧で記載されたテーブルを作成した。

〔7.変異率１の算出〕
　本実施例でも、実施例１と同様にして、DEGseq (Wang L, Feng Z, Wang X, Zhang X. 2009. Bioinformatics)という群間比較ソフトウェアを用い、出現頻度が有意に変動したタグ配列数を算出し、同様にして変異タグ配列率を計算した。

〔8.変異率２の算出〕
　本実施例でも、実施例１と同様にして、出現頻度が有意に変動したタグ配列に基づいて、同様にして変異塩基率を計算した。

〔9.結果〕
　上記7.で計算した変異タグ配列率及び上記8.で計算した変異塩基率を表４に纏めて示した。

　表４から分かるように、変異タグ配列率及び変異塩基率ともに、未照射サンプルと照射サンプルの間で大きな差が見られた。表４に示した変異タグ配列率と変異塩基率をそれぞれグラフ化すると、それぞれ図２５及び２６のようになった。なお、本実施例でもまた、照射線量と変異率の間に相関は見られないが、今回の最小照射線量5Gyでも既に変異率の最大値に達している可能性があり、照射線量を変えた実験を行うことで、変異率との量的関係が見られる可能性がある。

　本実施例の結果から、シロイヌナズナから抽出したDNAを制限酵素切断せずに塩基配列決定した場合でも、放射線照射によるゲノム変異（DNAの状態の変化）を、相違する塩基配列部分の全体に対する割合として定義される変異率に基づいて検出できることが示された。ただし、実施例１の結果と比較すると、制限酵素切断後に塩基配列決定した場合の方がシーケンスデータの利用効率は高く、より感度の良い検出を行うには、制限酵素切断後に塩基配列決定を行う方がよいと考えられた。

　本明細書で引用した全ての刊行物、特許及び特許出願をそのまま参考として本明細書にとり入れるものとする。

１・・・ＤＮＡの評価方法、５・・・被検体、１０・・・経時データ取得手順、１０Ａ・・・ＤＮＡ抽出フェイズ、１０Ｂ・・・フラグメント生成フェイズ、１０Ｃ・・・経時データ生成フェイズ、１０Ｄ・・・変異率算出フェイズ、１０Ｅ・・・結果出力フェイズ、５０・・・差分変異率の算出手順、６０・・・積算変異率の算出手順、１００・・・核酸情報処理装置、１１０・・・制御部、１１１・・・入力処理部、１１２・・・出力処理部、１１３・・・ＤＮＡ塩基配列特定部、１１４・・・経時データ管理部、１１５・・・経時データ比較部、１１６・・・変異率特定部、１１７・・・グラフ生成部、１３０・・・記憶部、１３１・・・経時データ記憶部、１３２・・・フラグメント対応情報記憶部、１３３・・・変異率導出テーブル記憶部、１３４・・・一致配列長算出テーブル記憶部、１４０・・・出力表示部、１５０・・・入力受付部

Claims

　個体から採取したサンプルよりＤＮＡの塩基配列に関する情報を取得する塩基配列情報取得手順と、
　前記塩基配列情報取得手順によって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定手順と、
　前記変異率に基づいてＤＮＡを評価するＤＮＡの評価手順と、
　を備えることを特徴とするＤＮＡの評価方法。
　前記ＤＮＡの塩基配列に関する情報は、複数のフラグメントの塩基配列情報を含み、
　前記変異率特定手順では、前記異なる時期に取得したＤＮＡの塩基配列に関する情報間でフラグメントの塩基配列の一致率が高い組み合わせを特定し、当該組み合わせにおいて前記相違する塩基配列部分を特定する、
　ことを特徴とする請求項１記載のＤＮＡの評価方法。
　前記塩基配列情報取得手順では、前記サンプルに含まれるＤＮＡをエンドヌクレアーゼにより切断して１又は複数のフラグメントを作製し、前記フラグメントの塩基配列の情報を読み取る、
　ことを特徴とする請求項２記載のＤＮＡの評価方法。
　前記塩基配列情報取得手順において前記フラグメントを作製する際に、互いに異なる種類の切断端の塩基配列が得られる複数種類のエンドヌクレアーゼにより前記サンプルに含まれるＤＮＡを切断して前記フラグメントを作製する、
　ことを特徴とする請求項３記載のＤＮＡの評価方法。
　前記変異率特定手順においては、前記ＤＮＡの塩基配列に関する情報間で一致率が高い組み合わせを特定する際に、前記フラグメントの切断端が同一のフラグメント間において、一致率が高い組み合わせを特定する、
　ことを特徴とする請求項２記載のＤＮＡの評価方法。
　前記塩基配列情報取得手順では、読み取り誤差の情報を併せて取得し、
　前記変異率特定手順において、前記異なる時期に取得したＤＮＡの塩基配列に関する情報間で相違する塩基配列部分に基づいて前記変異率を算出する際に前記読み取り誤差を排除する、
　ことを特徴とする請求項１記載のＤＮＡの評価方法。
　前記変異率特定手順では、前記互いに異なる時期に取得した複数の前記ＤＮＡの塩基配列に関する情報のうち前記フラグメントの数を比較し、フラグメントの数が少ない方のＤＮＡの塩基配列に関する情報に含まれるフラグメントごとに、フラグメントの数が多い方のＤＮＡの塩基配列に関する情報に含まれるフラグメントを一つずつ対応付けて変異率を特定する、
　ことを特徴とする請求項２記載のＤＮＡの評価方法。
　前記変異率特定手順では、対応付けられた一対のフラグメント間で長さを比較し、短い方の前記フラグメントの長さの範囲内における、互いに相違する部分の塩基数を求め、求めた塩基数が当該範囲内の総塩基数に占める率を用いて変異率を算出する、
　ことを特徴とする請求項２に記載のＤＮＡの評価方法。
　前記変異率特定手順では、前記互いに異なる時期に取得したＤＮＡの塩基配列に関する情報は、一方のＤＮＡの塩基配列に関する情報の取得時期と他方のＤＮＡの塩基配列に関する情報の取得時期との期間において前記塩基配列情報取得手順によりＤＮＡの塩基配列に関する情報が取得されていないＤＮＡの塩基配列に関する情報である、
　ことを特徴とする請求項１記載のＤＮＡの評価方法。
　前記ＤＮＡの評価手順では、異なる時期に取得した複数のＤＮＡの塩基配列に関する情報を用いて前記変異率特定手順において特定された複数の変異率に基づいて算出された標準変動域を用いて、前記変異率の多寡を判定する、
　ことを特徴とする請求項１記載のＤＮＡの評価方法。
　前記ＤＮＡの評価手順では、異なる時期に取得した複数のＤＮＡの塩基配列に関する情報を用いて前記変異率特定手順において特定された複数の変異率の変動幅に応じて前記標準変動域を設定する、
　ことを特徴とする請求項１０記載のＤＮＡの評価方法。
　前記ＤＮＡの評価手順では、異なる時期に取得した複数のＤＮＡの塩基配列に関する情報を用いて前記変異率特定手順において特定された複数の変異率の標準偏差に基づいて前記標準変動域を設定する、
　ことを特徴とする請求項１０記載のＤＮＡの評価方法。
　前記ＤＮＡの評価手順では、前記変異率特定手順において算出された変異率の積算値を所定の閾値と比較することで、前記変異率の多寡を判定する、
　ことを特徴とする請求項１記載のＤＮＡの評価方法。
　前記ＤＮＡの評価手順では、前記変異率特定手順にて算出した変異率が前記標準変動域又は前記閾値を超える値である場合、当該変動率を算出したときの一対のＤＮＡの塩基配列に関する情報の間にＤＮＡの変異に影響する環境変動があったとする
　ことを特徴とする請求項１０又は１３記載のＤＮＡの評価方法。
　個体から採取したサンプルよりから取得したＤＮＡの塩基配列に関する情報を入力するする塩基配列情報入力手段と、
　前記塩基配列情報入力手段によって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定手段と、
　前記変異率に基づいてＤＮＡを評価するＤＮＡの評価手段と、
　を備えることを特徴とするＤＮＡの評価装置。
　前記サンプルよりＤＮＡの塩基配列に関する情報を取得する塩基配列情報取得手段を更に備えることを特徴とする請求項１５記載のＤＮＡの評価装置。
　コンピュータに、ＤＮＡの評価手順を実行させるプログラムであって、
　前記コンピュータを、制御手段として機能させ、
　前記制御手段に対して、
　個体から採取したサンプルよりから取得したＤＮＡの塩基配列に関する情報を入力するする塩基配列入力ステップと、
　前記塩基配列入力ステップによって互いに異なる時期に取得した、ＤＮＡの塩基配列に関する情報間を比較し、相違する塩基配列部分を特定し、相違する塩基配列部分の全体に対する割合を変異率として特定する変異率特定ステップと、
　前記変異率に基づいてＤＮＡを評価するＤＮＡの評価ステップと、
　を実施させることを特徴とするプログラム。
　塩基配列入力ステップでは、前記制御手段に対して、前記サンプルよりＤＮＡの塩基配列に関する情報を取得する塩基配列情報取得手段から前記塩基配列に関する情報を入力させることを特徴とする請求項１７記載のプログラム。