WO2006027835A2

WO2006027835A2 - ゲノム解析方法

Info

Publication number: WO2006027835A2
Application number: PCT/JP2004/013075
Authority: WO
Inventors: Junji Tanaka
Original assignee: Genesys Technologies Inc; Junji Tanaka
Priority date: 2004-09-08
Filing date: 2004-09-08
Publication date: 2006-03-16
Also published as: US20080318214A1; EP1832992A1; EP1832992A4; WO2006027835A8; JPWO2006027835A1

Description

ゲノム解析方法

技術分野

[0001] 本発明は、サンプルデータにより母集団の特徴を推定するための解析を行うゲノム解析方法に関する。

背景技術

[0002] 地球上に存在する全ての生物は細胞から構成されていて、その細胞一個一個に遺伝子情報を記録したゲノムが存在している。細胞は構造の違いにより、原核細胞と真核細胞とに分類される。バクテリアやラン藻のような原核細胞でのゲノムは細胞内に仕切りのな!ヽ状態で存在して!/ヽるが、動植物のような真核細胞でのゲノムは核膜で囲まれた核の中に存在して！/、る。

[0003] つまり、ゲノムとは生命活動を営むために欠かすことのできない染色体の一組の集まりを指すものである。また、ゲノム（genome)は、遺伝子（gene)と染色体（ chromosome)からできた複合語である。

[0004] ここで、生命の基本は細胞であり、その細胞は細胞膜で囲まれ、核は核膜で囲まれ、それぞれの単位の独立性が保たれている。ヒトの細胞は、神経細胞、筋細胞、血球，免疫系細胞、皮膚や組織の表面の細胞である上皮細胞、感覚細胞等の機能や形態が分化し、特殊化した細胞群と、それらのもとになる幹細胞といわれる未分化の細胞とからできている。細胞には重要な、時間的に変化する側面がある。それは、細胞分裂して新しい細胞を作ることである。細胞分裂は、遺伝子情報の伝達と発現を可能にする重要な仕組みである。

[0005] 核の中に染色体がある。その染色体こそが、遺伝子情報を担っているもので、遺伝子はその上に並んでいる。遺伝子は、ゲノムの中でタンパク質の作り方を定義していると!/、つても良!ヽ。染色体を構成して！/、る基本物質は DNA (デォキシリボ核酸)で、遺伝情報は DNAの中から四つの塩基、 A、 T、 G、 Cの並びに保存されている。バタテリアやウィルスのような 1倍体の生物は、一個のゲノムを持っている。

[0006] 二倍体の生物である、たとえばヒトの卵子や精子のような生殖細胞は 23種類の染色体からなる 1組のゲノムを持って、る。体細胞では 2組のゲノム（46種類の染色体）を持っている。ヒトのゲノムは約 30億個の DNAの塩基対（3000メガ塩基対、 1メガは 100万塩基対）から成り立つていて、 1本の紐にすると約 1メートルの長さになる。

[0007] ゲノムは、細胞の中に存在する遺伝子情報の総体であり、そこには遺伝子と遺伝子の発現を制御する情報等が含まれている。ここで、タンパク質及び遺伝子は、いわば製品とその設計図であり、ゲノム上には設計図の他に製品の製造を管理'制御している部分が存在することになる。また、現在ではその存在意義が不明であるが、生物の機能維持に何らかの影響を及ぼしていると考えられる領域も力なりの割合で存在している。これらを明らかにしていくことによって、生命現象のより正確な把握が可能になると考えられている。

[0008] こうしたことから、ヒトゲノムと呼ばれるヒトのゲノム全塩基配列を解析する「ヒトゲノム解析計画」や「全てのゲノムの塩基配列を決定してしまおう」というプロジェクトがヒトを含めた様々な生物を対象として研究されている。そして、遺伝子とタンパク質との 3位一体の研究により、高度な生命現象の把握が期待されることになる。

[0009] それにはまず、遺伝子間のネットワークが分力なければならないと考えられる。つまり、複数のタンパク質がネットワークを形成していて、それらのタンパク質群が特定の機能を発揮しているからである。そのため、どのような機能や情報のやり取りが行われて、るのかを研究して、けば、未知の機能を持つ遺伝子が見つ力る力もしれな!ヽ

[0010] ここで、ゲノム解析とは、生物のゲノムの持つ遺伝情報を総合的に解析することであり、ゲノムを構成する DNA分子の塩基配列（GATCの並び）を決めること力も始まる。しかし、塩基配列データ力だけでは、どこにどのような遺伝子があるのかは簡単には分力もない。そこで、転写'翻訳によって作られるメッセンジャー RNAやタンパク質等の遺伝子産物の解析、生物種間で塩基配列がどれだけ似ているか等の比較、さらに大腸菌や出芽酵母等の実験生物で解析された個々の遺伝子に関するデータ等を基に解析が進められている。

[0011] ちなみに、ヒトの場合、常染色体 44本と X染色体、 Y染色体の計 46本の染色体 (つまり DNA分子）に含まれる約 30億対の DN Aの塩基配列力ヒトゲノムである。我々の持っているゲノム情報は、一代前の親のゲノム情報を受け継いだものである。親の持つゲノム情報は、さらに一代前の先祖力も受け継いだものである。このように、さらに一代前と遺伝情報の起源をさかのぼることにより、 38億年前の最初の生物のゲノムにたどりつくことができる。

[0012] ゲノム解析を行うものとして、特許文献 1では、ゲノム配列情報を入力し、入力されたゲノム配列情報内に、同一の塩基が複数個（たとえば 10個）以上連続して配列されている配列部分があるかどうかを判断し、あった場合にその同一の塩基が複数個以上連続して配列されて!、る配列部分の前方及び後方に連続して配列されて、る所定数の塩基からなる塩基配列情報を抽出し、抽出された塩基配列情報を出力するようにしたゲノム解析方法を提案して、る。

[0013] このようなゲノム解析方法により、 SNPs (single nucleotide polymorphism)を用いることなく SNPsに近い精度で迅速にかつ効率的に疾患関連候補遺伝子を同定するための多型マーカーを見つけ出すことができるようになって!/、る。

[0014] ところで、特許文献 1に示されたものは、疾患関連候補遺伝子を同定するための多型マーカーを見つけ出すようにしたゲノム解析の一手法である力ゲノム解析では時に約 30億対の DNAの塩基配列を、ろ、ろな観点力も解析する必要がある。そのため、未だ解明されて、な、様々なゲノム解析を行う手法が存在して、るものと予測されることから、その解明が待たれている。

[0015] 本発明は、このような状況に鑑みてなされたものであり、サンプルデータより母集団の特徴を推定することができるゲノム解析方法を提供することができるようにするものである。

特許文献 1：特開 2003— 288346号公報

発明の開示

[0016] 本発明のゲノム解析方法は、サンプルデータにより母集団の特徴を推定するための解析を行うゲノム解析方法であって、前記サンプルデータを取り込む工程と、遺伝 (統計)学の知識より双対性を成す二つの第 1及び第 2の状態変数を選択し、前記第 1及び第 2の状態変数を本来あるべき値に収束させることで、前記サンプルデータが属する母集団の特徴を推定する工程と、前記母集団の特徴を推定した結果を出力する工程とを有することを特徴とする。

[0017] また、前記第 1及び第 2状態変数が互いに他で表す遺伝 (統計)学の知識を埋め込んだ変換式を演算子として互いに変換を行い、第 1及び第 2の状態変数をそれらの演算子に埋め込んだ第 3の状態変数により推定する工程を有するようにすることができる。

[0018] また、前記第 1の状態変数が各サンプルの起源母集団帰属度であり、前記第 2の状態変数が起源母集団ハプロタイプ頻度であるようにすることができる。

[0019] また、前記第 3の状態変数が各サンプルのディプロタイプ及びその頻度であるようにすることができる。

[0020] また、調査する遺伝子多型の決定を行う工程と、調査した!/、集団の遺伝子多型のウエットプロセスによるアレル情報の決定を行う工程と、前記アレル情報より個人のハプロタイプの決定、又は推定を行う工程と、集団の双対状態にある二つの特徴パラメータの決定を行う工程と、遺伝情報より前記二つの特徴パラメータ間の変換演算子を構築する工程と、所定の初期値より始め、変換演算子により前記二つの特徴パラメ一タを順番に求める工程と、前記特徴パラメータが収束するまで変換を繰り返す工程とを有し、前記二つの特徴パラメータが求まることで、前記サンプルデータより母集団の特徴が推定されるようにすることができる。

発明を実施するための最良の形態

[0021] 以下、本発明の実施の形態について説明する。

図 1は、本発明のゲノム解析方法に用いられるゲノム解析装置の概要を説明するための図、図 2は、図 1のゲノム解析装置による解析の概要を説明するための図、図 3 は、本発明のゲノム解析方法を示すフローチャートである。

[0022] 図 1に示すように、ゲノム解析装置 1は、サンプルデータより母集団の特徴を推定し

、その解析結果を出力するものである。ゲノム解析装置 1としては、後述のゲノム解析のための演算を行う解析プログラムを搭載したノートパソコン、ディスクトップパソコン等を用いることができる。

[0023] ゲノム解析装置 1による解析の概要は、たとえば図 2に示すように、双対性を成す状態で特徴付けすることができる実在をモデルィ匕したものである、第 1の状態である状態 Aと第 2の状態である状態 Bとがあり、変換演算子 φと変換演算子 φとに遺伝 (統計)学の知識を埋め込むことにより、状態 Aと状態 Bとの双対性演算が行われ、実在（母集団）が持つ値 (状態）に収束することで、母集団の特徴が推定されるようになっている。

[0024] ここで、状態 Aとは各サンプルの起源母集団帰属度であり、状態 Bとは起源母集団ハプロタイプ頻度である。そして、状態 Aと状態 Bとが互いに他で表す変換式を演算子として、互いに変換を行うようになっている力これの詳細については後述する。

[0025] また、ゲノム解析装置 1は、サンプルデータが属する母集団の特徴を表す二つの第 1及び第 2の変数が、完全に独立ではなぐ完全に従属でもない場合、これら二つの変数を観測し得る第 3の変数 (不完全データ)より二つの変数を推定する機能を有している。これは、たとえば図 2のように、状態 Aと状態 Bとが一種の双対性を成すと考えることができることに着目したものである。

[0026] そこで、サンプルデータが属する母集団をヒルベルト空間で表すことができる系と考える。また、たとえば二つの第 1及び第 2の変数を、 q , p (iは、サンプル番号、 kは、

1 k

起源母集団番号)とする。これら qととは、対象となる系を特徴付ける完全に独立

1 k

でな、 (ェンタングルメント状態）の二つ状態、 V、わゆる双対性の一種と考えることができる。そう考えると q

1と kとは、光子の粒子的側面と波動的側面とがフーリエ変換（逆フーリエ変換)できるように、相互に変換する変換演算子を考えることができる。

[0027] そして、観測され得る第 3の変数であるたとえば各サンプルのディプロタイプとその頻度 d (iは、サンプル番号）よりそれらの変換演算子を導出でき、それらの変換演算子に遺伝 (統計)学的な知識を埋め込むものとする。この際、 q

iと kとが双対性を本当に持つならば、適当な初期値を qと p とに与え、演算子による変換をすれば、本

i k

来その母集団が持つ特徴に収束することになる。

[0028] 具体例として、サンプルされた集団が、いくつかの起源母集団より構成されている場合を考え、サンプルデータのみよりその起源母集団を推定する場合を考える。ここで、

サンプル iの起源母集団への帰属度を α

起源母集団を k 起源母集団 kのハプロタイプ頻度を p

k

サンプル iのデュプロタイプ頻度を d

とする。

[0029] そして、 q、p 、d は、次のように表すことができる。

i k i

[数 1]

¾ = ∑ jC_lk|K_k> ：ただし、 ∑_kc_lk =1

[数 2]

= ∑_i a_{i n}. |h_n>|h_ir > ：ただし、 Σ^. ^. =1

[数 3]

=1

なお、 |k〉（起源母集団ベクトル）と |h >,|h > , |h > (ノヽプロタイプベクトル)とは、それ k km il il

ぞれサンプル集団が属するヒルベルト空間の基底ベクトルの一つと考える。

[0030] ここで、 pと qは、射影演算子でお互いに変換すると考えると、以下のように表すことができる。

画

q = ΦΡ ： Φは、射影演算子

[数 5]

Ρ = <i>q ： Φは、射影演算子

このとき、実際の演算子は、以下のものを考える。

[数 6]

[数 7]

⁼ ∑i^cik∑ir ^aiir

[0031] つまり、演算子である φ、 φは、サンプルが属する母集団をヒルベルト空間で表すことができる系と考え、 q iと k は、対象となる系を特徴付ける、完全に独立でない (ェンタングルメント状態の)二つの状態を表すと考えることで、、わゆる双対性の一種として扱うこととなる。 [0032] そのように考えると、 qと p とをお互いに変換する演算子を考えることが可能となり

i k

、それらの演算子を dより導出でき、 qととを順番に求めることができれば、母集

i i k

団が本来持つ値 (状態)に収束すると考えることができる。

[0033] また、 φ、ρ の演算子は、 k (起源母集団)毎に c の確率で各サンプルの |h〉と各集

k k i 団の |h〉とが一致する項目に関して加え合わせ、規格ィ匕することと同等と考えられる。

k

また、、q の演算子は、一致する |h〉と |h〉との b より、 |h 〉と |h 〉との同時確率の a

i i k k ijl ij2 i の比率で、 k毎に加え合わせ、規格ィ匕することと同等と考えられる。よって、適当な初期状態より始めれば、 qと pとが上述した手順に従って求めれ、収束する。収束したか否かの判断は、 p、 qが一定値に収束することにより判断することができる。

[0034] 次に、ゲノム解析装置 1によるゲノム解析方法について説明する。

まず、図 3に示すように、調査する遺伝子多型の決定を行う（ステップ Sl)。ここでは、まず、調査したい集団の遺伝子多型のウエットプロセスによるアレル情報の決定を行う（ステップ S 2)。また、アレル情報より個人のハプロタイプの決定、又は推定を行う (ステップ S3)。

[0035] 次、で、集団の双対状態にある二つの特徴パラメータの決定を行う（ステップ S4)。

ここでは、サンプルの起源母集団帰属度と各起源母集団のハプロタイプ頻度とを二つの特徴パラメータとする。また、遺伝情報より二つの特徴パラメータ間の変換演算子を構築する (ステップ S5)。ここでの遺伝情報は、個人のデュプロタイプとその頻度とする。

[0036] また、適当な初期値より始め、変換演算子により二つの特徴パラメータを順番に求める (ステップ S6)。そして、パラメータ力収束するまで変換を繰り返す (ステップ S 7) 。その後、二つの特徴パラメータが求まる (ステップ S8)。

[0037] (実施例）

次に、実施例について説明する。

以下に示す図 4一図 15は、起源母集団を推論し、かつ各サンプルを起源母集団に割り当てるために複数座位の遺伝子型データ及びノヽプロタイプデータを使用する双対性変換演算子によるゲノム解析方法による解析結果の一例を示す図である。

[0038] 遺伝子解析では、ケースコントロール相関解析力表現型データ (たとえば疾病遺伝子を見つける相関マッピング）に遺伝子型データをマッピングさせる強力な方法となっている。しかし、起源母集団を推定する場合、ケースコントロール相関解析では、構造ィ匕した集団からの遺伝子型データはデータのマッピングにエラーを生じて肯定的な結果に帰着する可能性がある。

[0039] そのため、ケースコントロール相関解析の前に潜在的な集団構造を検知することが望ましい。潜在的な集団構造を検知する場合、ベイズ統計に基づく MCMC法、サンプル間の距離の概念に基づくクラスタモデルのような、座位のアレルを使用する、構造ィ匕した集団を識別する方法等があるが、本実施例では双対性変換演算子アルゴリズムによる新、モデリング方法を採用した。

[0040] この場合、ハプロタイプが対立遺伝子より強力な遺伝子情報であると考え、対立遺伝子ではなくハプロタイプを採用した。また、ヒルベルト空間上のベクトルとその演算子と魏団の構造ィ匕を解析する遺伝解析のケースコントロール相関解析に採用した。つまり、サンプリングされた個人に属する隠れた実在があると仮定した力もである。

[0041] ここで、ヒルベルト空間中のベクトルは遺伝状態を表すものである。また、演算子は、一つのベクトル表現を他のベクトル表現に変形することができる。

[0042] そこで、サンプルデータが属する母集団の特徴を表す二つの変数力完全に独立ではなぐ完全に従属でもない場合の二つの変数を観測し得る第 3の変数 (不完全データ)より推定する方法を採用した。

[0043] 本実施例では、上述したように、起源母集団のハプロタイプ頻度 p とサンプルの起

k

源母集団への帰属度 q とを双対性状態にある二つの特徴付ける演算子として採用した。これにより、サンプリングされた個人の属する隠れた実在が推定されるものと考える。また、本実施例では、上述したように、観測されるデータとして個人のデュプロタイプとその頻度 dを採用した。

[0044] ここで、 qと p とを、上述したように、対象となる系を特徴付ける完全で独立でない (

i k

ェンタングルメント状態の)二つ状態、いわゆる双対性の一種と考える。そう考えると q とは、上述したように、光子の粒子的側面と波動的側面とがフーリエ変換 (逆フー k

リエ変換)変換できるように、 qととを相互に変換する演算子と考えることができる。

1 k [0045] [数 8]

q i = Φ (p_k ) · · · (1)

[数 9]

P _k = Φ (q i ) · · · (2)

そこで、 qとについて、式（1)及び式（2)を仮定し、遺伝統計知識力これらの

1 k

演算子を推定するようにした。

[0046] また、個人のデュプロタイプとその頻度を d とすると、ヒルベルト空間表現では、次の式（3)—式（5)のように表すことができる。

[数 10]

_¾ = ∑_jCik|K_k> ただし、 ∑_kc_ik =1 · . . (3)

[数 11]

h, - ∑_ir a, _ir |h_n>|h_ir > ただし、 =1 · · · (4)

[数 12]

P_k = ∑Ajh ただし、 ∑Λ„ =ι · · · ( 5 ) なお、 |k〉（起源母集団ベクトル）と |h >,|h〉， |h ,〉（ノヽプロタイプベクトル)とは、それ k km il il

[0047] また、実際の双対性変換演算子としては、次の式 (6)及び式 (7)を採用した。

[数 13]

< _k= ∑ιι' a_m' *b_kl*b_kl, · · · (6)

[数 14]

<K = ^∑i^cik^∑ir ^aiir · · · (7)

[0048] 次に、これらの式から、まず、ステップ 1)では、からの q_;に見合う適当な初期値をセットする。ただし、初期値は、 lZk以外である。また、 kは起源母集団数である。次に、ステップ 2)では、式（7)より pを求める。次に、ステップ 3)では、式（6)より qを求

k i める。ここで、 pと qとが収束するまで、演算を繰り返す。

k i

[0049] 次に、構造ィ匕された母集団の各起源母集団のハプロタイプ頻度のデータをについて説明する。 [0050] 図 4は、グループ (起源母集団)のたとえば二つのグループのハプロタイプ頻度の例を示すものである。この例において、ハプロタイプは 6つの座位力も表されている。また、各座位は二つの対立遺伝子（SNP)を持っていることが分かる。ここで、 "1"は多数の対立遺伝子を表し、 "2"は少数の対立遺伝子を表している。ここでの評価した詳細なグループ (起源母集団)情報及びそのハプロタイプ頻度は、図 10の総合データより確認することがでさる。

[0051] 図 5は、 q評価を示すものであり、その詳細は、図 10の総合データより確認することができる。ここでは、サンプルされた母集団がいくつの起源母集団より構成されている力と本発明の方法と他の方法との評価の比較を示している。ここで、起源母集団のハプロタイプ頻度が似通っているほどこれらの違いを識別することが困難となる力ハプ口タイプブロックの数を増やせば増やすほど、よりよ、結果が得られる。

[0052] たとえば、 1123は 3つのハプロタイプブロックとしての II、 12及び 13の結合したデータである。 1123456は、さらに II、 12、 13、 14、 15及び 16の結合したデータである。これら複数のハプロタイプブロックの結果は、一つのブロック単独の場合よりはるかに良い一致を示すことになる。

[0053] 図 6は、 k (起源母集団の数) = 2とした場合のサンプルの起源母集団混合比率を示し、図 7は、 k= 3とした場合のサンプルの起源母集団混合比率を示している。つまり、サンプルの起源母集団混合比率力であれば一つの集団に属することになるが、 0と 1の間の場合は、複数の起源母集団にその混合比率で属することになる。

[0054] 図 8は、 k= 2とした場合の p評価を示し、図 9は、 k= 3とした場合の p評価を示し

k k

ている。双対性変換による評価は、 MCMC法より同等又はよりよい結果が得られていることが分かる。なお、 p評価は、図 13

k —図 15の総合データより確認することができる。

[0055] ここで、図 10は、 k= 2とした場合の起源母集団 1, 2の詳細である総合データを示す図であり、図 11は、 k= 3とした場合の起源母集団 1一 3の詳細である総合データを示す図であり、図 12は、 k=4とした場合の起源母集団 1一 4の詳細である総合データを示す図である。

[0056] また、図 13及び図 14は、 k= 2とした場合の p評価の詳細である総合データを示し、図 15は、 k= 3とした場合の p評価の詳細である総合データを示している。

k

[0057] このように、本実施形態では、サンプルデータを取り込み、双対性を成す二つの第 1及び第 2の状態変数に遺伝 (統計)学の知識を埋め込み、第 1及び第 2の状態変数を本来あるべき値に収束させることで、サンプルデータが持つ母集団の特徴を推定し、母集団の特徴を推定した結果を出力するようにしたので、サンプルデータにより母集団の特徴を推定するための解析を行うことができる。

産業上の利用可能性

[0058] 以上の如く本発明によれば、サンプルデータにより母集団の特徴を推定するための解析を行うことができる。

図面の簡単な説明

[0059] [図 1]本発明のゲノム解析方法に用いられるゲノム解析装置の概要を説明するための図である。

[図 2]図 1のゲノム解析装置による解析の概要を説明するための図である。

[図 3]本発明のゲノム解析方法を示すフローチャートである。

[図 4]二つの起源母集団のハプロタイプ頻度の例を示す図である。

[図 5]q評価を示す図である。

[図 6]k= 2とした場合の個人の起源母集団混合比率を示す図である。

[図 7]k= 3とした場合の個人の起源母集団混合比率を示す図である。

[図 8]k= 2とした場合の p評価を示す図である。

k

[図 9]k= 3とした場合の p評価を示す図である。

k

[図 10]k= 2とした場合の起源母集団 1, 2の詳細である総合データを示す図である。

[図 ll]k= 3とした場合の起源母集団 1一 3の詳細である総合データを示す図である。

[図 12]k=4とした場合の起源母集団 1一 4の詳細である総合データを示す図である。

[図 13]k= 2とした場合の p評価の詳細である総合データを示す図である。

k

[図 14]k= 2とした場合の p評価の詳細である総合データを示す図である。

k

[図 15]k= 3とした場合の p評価の詳細である総合データを示す図である。

k

符号の説明

[0060] 1 ゲノム解析装置

Claims

請求の範囲

[1] サンプルデータにより母集団の特徴を推定するための解析を行うゲノム解析方法であって、

前記サンプルデータを取り込む工程と、

遺伝 (統計)学の知識より双対性を成す二つの第 1及び第 2の状態変数を選択し、前記第 1及び第 2の状態変数を本来あるべき値に収束させることで、前記サンプルデータが属する母集団の特徴を推定する工程と、

前記母集団の特徴を推定した結果を出力する工程とを有する

ことを特徴とするゲノム解析方法。

[2] 前記第 1及び第 2状態変数が互いに他で表す遺伝 (統計)学の知識を埋め込んだ変換式を演算子として互いに変換を行い、第 1及び第 2の状態変数をそれらの演算子に埋め込んだ第 3の状態変数により推定する工程を有することを特徴とする請求項 1に記載のゲノム解析方法。

[3] 前記第 1の状態変数が各サンプルの起源母集団帰属度であり、前記第 2の状態変数が起源母集団ハプロタイプ頻度であることを特徴とする請求項 1又は 2に記載のゲノム解析方法。

[4] 前記第 3の状態変数が各サンプルのディプロタイプ及びその頻度であることを特徴とする請求項 1一 3のいずれかに記載のゲノム解析方法。

[5] 調査する遺伝子多型の決定を行う工程と、

調査したい集団の遺伝子多型のウエットプロセスによるアレル情報の決定を行うェ程と、

前記アレル情報より個人のハプロタイプの決定、又は推定を行う工程と、集団の双対状態にある二つの特徴パラメータの決定を行う工程と、

遺伝情報より前記二つの特徴パラメータ間の変換演算子を構築する工程と、所定の初期値より始め、変換演算子により前記二つの特徴パラメータを順番に求める工程と、

前記特徴パラメータが収束するまで変換を繰り返す工程とを有し、

前記二つの特徴パラメータが求まることで、前記サンプルデータより母集団の特徴が推定される

ことを特徴とする請求項 1一 4のいずれかに記載のゲノム解析方法。