JP6564053B2 - 細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法 - Google Patents
細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法 Download PDFInfo
- Publication number
- JP6564053B2 JP6564053B2 JP2017550043A JP2017550043A JP6564053B2 JP 6564053 B2 JP6564053 B2 JP 6564053B2 JP 2017550043 A JP2017550043 A JP 2017550043A JP 2017550043 A JP2017550043 A JP 2017550043A JP 6564053 B2 JP6564053 B2 JP 6564053B2
- Authority
- JP
- Japan
- Prior art keywords
- genotype
- cells
- apparent
- data
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
Description
[1] 複数人に由来する可能性がある細胞または細胞群における、細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法であって、
細胞または細胞群の遺伝子多型部位に対する遺伝型データを取得して、予め設定された重み分布で重み付けして、重み付き遺伝型データを取得する工程、および
重み付き遺伝型データを用いて、細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定をする工程を含み、
予め設定された重み分布は、遺伝子多型部位について、測定される見かけの遺伝型と真の遺伝型とを対応付けることにより設定される、
同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法。
[2] 見かけの遺伝型と真の遺伝型との対応付けは、複数の細胞もしくは多量DNAを用いる実験および/またはシミュレーションによって推定される、上記[1]に記載の判定方法。
[3] 重み付き遺伝型データを用いて細胞間または細胞群間の距離を定義し、細胞間または細胞群間の遺伝的な位置関係を判断して、上記細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定をする、上記[1]または[2]に記載の判定方法。
[4] 細胞または細胞群が妊婦末梢血から単離した細胞または細胞群である、上記[1]〜[3]のいずれか1つに記載の判定方法。
[5] 重み分布を集団における遺伝型頻度を参照して補正する、上記[1]〜[4]のいずれか1つに記載の判定方法。
[6] 重み分布を父親および/または母親の確定された遺伝型を参照して補正する、上記[1]〜[4]のいずれか1つに記載の判定方法。
[7] 細胞または細胞群が、母親および胎児のいずれか一方に由来する場合において、観測された遺伝型データにY染色体の存在を示すデータが存在すれば、細胞または細胞群が胎児に由来すると推定する、上記[1]〜[6]のいずれか1つに記載の判定方法。
[8] 距離が尤度または事後確率である、上記[3]に記載の判定方法。
[9] さらに、
N人に由来する可能性がある細胞群を構成する細胞について、細胞間の距離を算出する工程、および
同一人らしさに応じて細胞のクラスタリングを実施し、最終的なクラスタ数kを求め、k=1である場合に細胞群は同一人に由来する細胞からなると判定し、k≠1かつk≦Nである場合に細胞群はN人中k人に由来する細胞からなると判定し、k≠1かつk>Nである場合に細胞群はN人以外の人を含むk人に由来する細胞からなると判定する工程
を含む、上記[1]〜[7]のいずれか1つに記載の判定方法。
ただし、ここで、Nおよびkは1以上の整数である。
特許文献1に記載された発明は、擬父および妊婦末梢血から得られた遺伝子情報を用いて、妊婦懐胎中の胎児の実父が擬父であるか否かを鑑定する方法である。具体的には、特許文献1に記載された発明は、擬父から擬父のSNP(Single Nucleotide Polymorphism;一塩基多型)等の遺伝子情報を取得し、妊婦末梢血中から妊婦と胎児のSNP等の遺伝子情報を取得し、(a)擬父が胎児の実父である確率を決定し、(b)その確率に基づいて擬父が胎児の実父であるか否かを決定する方法である。しかし、この方法は、単一細胞を対象にしているわけではないため、母親と胎児の細胞が混在する可能性がある状況において、個々の細胞を由来毎に分別することは困難である。
以下では、各工程を説明する。
適宜、図1を参照しながら説明する。
図1に示す例では、遺伝型AA、Aa、aaのそれぞれにw1、w2、w3の重みを付けている。
観測された遺伝型データ(デプス比)を予め設定された重み分布で重み付けして、重み付き遺伝型データ(デプス比)を取得する。図1に示す例では、シーケンスリードから、観測された遺伝型のデプスd1、d2、d3を算出し、観測データ行列Dとして表し、重み付き遺伝型のデプスd’1、d’2、d’3を重み付きデータ行列D’として表し、D’を重み付け行列Wと観測データ行列Dとの積WDとして計算している。
重み付き遺伝型データを用いて、細胞間または細胞群間の同一人かどうかの判定、他人かどうかの判定、親子かどうかの判定、または血縁関係かどうかの判定を行う工程では、重み付き遺伝型データを用いて、細胞間または細胞群間の距離に基づく方法、全細胞をクラスタリングする方法、尤度比の大小による評価を用いる方法などにより、同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定を行うことが例示できる。
尤度は、ある仮説またはモデルのもとで観察されたデータが生じる確率を意味する。また、ある前提条件に従って結果が出現する場合に、逆に観察結果からみて前提条件が「何々であった」と推測する尤もらしさを表す数値を、「何々」を変数とする関数として捉えたものを尤度関数という。
事後確率は、条件付確率の一種であり、ある証拠(データまたは情報)を考慮に入れた条件で、ある変数について知られている度合を確率として表現する主観確率の一種である。
本発明においては、クラスタリングは、階層的クラスタリングおよび非階層的クラスタリングのいずれを用いてもよい。
階層的クラスタリングでは、個々のデータを1つのクラスタとして設定し、クラスタ間の類似度または非類似度を計算し、最も類似しているクラスタを併合し、すべてのクラスタが1つのクラスタになるまで併合を繰り返す。クラスタ間の類似度または非類似度を求める方法としては、例えば、最も近いデータの距離を2つのクラスタの距離と定義する最近隣法、最も遠くなるデータの距離を2つのクラスタの距離と定義する最遠隣法、2つのクラスタのそれぞれの重心を求めて重心間の距離をクラスタの距離と定義する重心法などが挙げられる。データ間の距離としては、上述した尤度、事後確率などを用いてもよい。
非階層的クラスタリングでは、分割最適化手法とも呼ばれ、分割の状態を表す関数を使い、関数の値が最適解となるように探索を行うことができる。非階層的クラスタリングの方法としては、例えば、クラスタの平均を用い、与えられたクラスタ数k個に分類するk−平均法などが挙げられる。
凝集型の階層的クラスタ分析のプロセスは、一般に次のようなステップで構成される。
ステップ1: 1つずつの対象を構成単位とするn個のクラスタから出発する。
ステップ2: クラスタ間の非類似度行列(dij)を参照して、もっとも類似性の高い2つのクラスタを融合して,1つのクラスタをつくる.
ステップ3: クラスタ数が1になっていれば終了し、そうでなければ、次のステップにすすむ。
ステップ4: ステップ2で新しくつくられたクラスタと、他のクラスタとの非類似度を計算して、非類似度行列(dij)を更新し、ステップ2に戻る。
遺伝的な位置関係とは、細胞間の遺伝的なつながりをいい、近縁関係にあるほど近い位置にある。より具体的な例としては、細胞間の距離であり、距離は、尤度または事後確率であることがより好ましい。
複数人に由来する可能性がある細胞は特に限定されるものではないが、一細胞の遺伝型解析を行うものが好ましく、例えば、胎児細胞および母親細胞が混合している可能性が高いことから、妊婦末梢血中の有核細胞、特に有核赤血球細胞が挙げられる。妊婦末梢血から単離した細胞または細胞群である場合は、従来の判定方法では、アレルドロップアウト、アレルドロップインの問題は必発であるが、本発明によれば、より正確な判定をすることができる。また、細胞群は、1つ以上の細胞を含む細胞の集合を意味する。
上記遺伝子多型部位は、遺伝子多型が存在する座位を含むものであれば特に限定されない。遺伝子多型としては、特に限定されず、例えば、SNP(Single Nucleotide Polymorphism;一塩基多型)、STR(Short Tandem Repeat;縦列型反復配列)、CNV(Copy Number Variation;コピー数多様性)などが挙げられる。
上記重み分布は、上記遺伝子多型部位について、見かけの遺伝型と真の遺伝型とを対応付けることにより設定がされるものである。この設定は、好ましくは、見かけの遺伝型と真の遺伝型との対応付けは、複数の細胞もしくは多量DNAを用いる実験および/またはシミュレーションの結果から規定または推定することによって行われる。
以下に例を示しながら説明する。
あるSNP(Single Nucleotide Polymorphism;一塩基多型)部位Xについて、遺伝型はp1q1、p2q2の2通りの可能性があるものとする。また、精密な実験により、このSNP部位Xでは、真の遺伝型がp1q1である場合に見かけの遺伝型がp1q1である確率P(B1|A1)=0.90、真の遺伝型がp1q1である場合に見かけの遺伝型がp2q2 である確率P(B2|A 1 )=0.10、真の遺伝型がp2q2である場合に見かけの遺伝型がp2q2である確率P(B2|A2)=0.70、真の遺伝型がp2q2である場合に見かけの遺伝型がp1q1である確率P(B1|A2)=0.30であることが分かっている。ただし、A1は真の遺伝型がp1q1である事象、A2は真の遺伝型がp2q2である事象、B1は見かけの遺伝型がp1q1である事象、B2は見かけの遺伝型がp2q2である事象とする。また、事前確率P(A1)=P(A2)=0.50とする。
この条件の下で、見かけの遺伝型がp1q1である場合に真の遺伝型がp1q1である確率P(A1|B1)、および見かけの遺伝型がp2q2である場合に真の遺伝型がp2q2である確率P(A2|B2)を求める。
ベイズの定理によりP(Ai|Bj)={P(Ai)P(Bj|Ai)}/{ΣkP(Ak)P(Bj|Ak)}であるから、次のとおりとなる。
P(A1|B1)={P(A1)P(B1|A1)}/{ΣkP(Ak)P(B1|Ak)}=(0.50×0.90)/(0.50×0.90+0.50×0.30)=0.75
P(A2|B2)={P(A2)P(B2|A2)}/{ΣkP(Ak)P(B2|Ak)}=(0.5×0.7)/(0.5×0.1+0.5×0.7)=0.875
すなわち、見かけの遺伝型がp1q1である場合に真の遺伝型がp1q1である確率P(A1|B1)=0.75、見かけの遺伝型がp2q2である場合に真の遺伝型がp2q2である確率P(A2|B2)=0.875である。
したがって、見かけの遺伝型がp1q1,p2q2である場合、真の遺伝型と一致する確率は、それぞれ、0.75、0.875である。
P(A1|B1)およびP(A2|B2)を重み付けに用いる。
あるSNP(Single Nucleotide Polymorphism;一塩基多型)座位Yの遺伝型として、r1s1、r1s2、r2s1、r2s2の4通りの可能性があるものとする。また、SNP座位Yの遺伝型として可能性がある各遺伝型に対して得られるデプスを総デプスで正規化して得られるデータを(d1,d2,d3,d4)とする。ここで、0≦d1≦1、0≦d2≦1、0≦d3≦1、0≦d4≦1、かつ、d1+d2+d3+d4=1を満たす。
真の遺伝型がr1s1である場合、理想的には(d1,d2,d3,d4)=(1,0,0,0)であるが、特に単一細胞解析の場合には、ADO(Allelic Drop-out;アレルドロップアウト)、ADI(Allelic Drop-in;アレルドロップイン)の影響により、(d1,d2,d3,d4)=(0.8,0.05,0.05,0.1)のようにばらつきが生じる。
次のようにして、真の遺伝型と(d1,d2,d3,d4)の分布を推定する。
実験的に(d1,d2,d3,d4)の分布を推定する。
まず、多量DNA(Deoxyribonucleic Acid;デオキシリボ核酸)を用いてDNA増幅およびシーケンシングを行い、真の遺伝型を確定する。次に、単一細胞を用いてDNA増幅およびシーケンシング実験を複数回行い、(d1,d2,d3,d4)と真の遺伝型との分布を推定する。
細胞間、個体間、PCR反応の領域間の差はないものと仮定してもよいし、差を考慮してもよい。
ii)分布の推定方法−シミュレーションによる推定方法
シミュレーションにより(d1,d2,d3,d4)の分布を推定する。
まず、DNA増幅、シーケンシング等のモデルを構築する。次に、遺伝型を仮定し、その際に得られる(d1,d2,d3,d4)をモンテカルロシミュレーションにより複数取得し、分布を推定する。
モデルを構築する際には、細胞間、個体間、PCR反応の領域間等の差はないものと仮定してもよいし、差を考慮してもよい。
iii)分布の推定方法−実験およびシミュレーションによる推定方法
実験およびシミュレーションにより(d1,d2,d3,d4)の分布を推定する。
まず、上述した実験により分布を推定する方法によってパラメータを推定し、DNA増幅、シーケンシング等のモデルを構築する。
次に、遺伝型を仮定し、その際に得られる(d1,d2,d3,d4)をモンテカルロシミュレーションにより複数取得し、分布を推定する。
このようにして推定された分布を重み付けに用いる。
図2および図3を参照しながら説明する。
図2は、観測された塩基のデプス比と、その塩基が真の遺伝型としてヘテロで存在している条件付き確率との関係を示すグラフである。
例えば、あるSNP(Single Nucleotide Polymorphism;一塩基多型)位置Zにおいて塩基Cがデプス比として0.5が観測された場合、真の遺伝型としてCがヘテロで存在する条件付き確率は、図2から、約0.025である。
また、図3は、観測された塩基のデプス比と、その塩基が真の遺伝型としてホモで存在している条件付き確率との関係を示すグラフである。
例えば、あるSNP位置において塩基Cがデプス比として0.98が観測された場合、真の遺伝型としてCがホモで存在する条件付き確率は、図3から、約0.02である。
市販されているゲノムDNA(Deoxyribonucleic Acid;デオキシリボ核酸)抽出キットを用いて、大量の培養細胞(〜106個程度)に対して、細胞溶解・ゲノム抽出を行う。
得られたゲノムのうち10ng程度に対して、所望のSNP(Single Nucleotide Polymorphism;一塩基多型)を含む領域をPCR(Polymerase Chain Reaction;ポリメラーゼ連鎖反応)によって増幅し、次世代シーケンサーを用いてシーケンスする。さらに、シーケンサーの出力をリファレンスゲノムに対してBWA(Burrows-Wheeler Aligner)(Bioinformatics, 2009, 25(14): 1754-1760.; Bioinformatics, 2010, 26(5): 589-595.; http://bio-bwa.sourceforge.net/)等のアライメントツール/マッピングツールを用いてアライメント/マッピングし、所望領域のデプス情報を得る。さらに、SAMtools(SAM: Sequence Alignment/Map)(Bioinformatics, 2009, 25(16): 2078-2079;http://github.com/samtools/samtools)を用いて座位毎に数え上げ、デプス情報を取得し、BCFtools(BCF: Binary Call Format)(http://github.com/samtools/bcftools)を用いてSNPコールを行い、大量細胞に対する各SNPでの遺伝型を決定する。
同様の作業を、単離された単一細胞について100細胞分ほど実施し、デプスの分布を得る。
得られた各SNPでの真の遺伝型とデプスの分布を用いて、単一細胞でのデプスと真の遺伝型の対応付けを行う。
増幅モデルの一例を示す。あるSNP(Single Nucleotide Polymorphism;一塩基多型)位置について、r回目のPCR(Polymerase Chain Reaction;ポリメラーゼ連鎖反応)後における(A,C,G,T)の割合を(A(r),C(r),G(r),T(r))と書く。この場合、初期値(A(0),C(0),G(0),T(0))は、例えば、Aホモのとき(2,0,0,0)となり、ACヘテロのとき(1,1,0,0)となる。ここで、rは1以上の整数とする。
r+1回目のPCRでは、r回目のPCR後の各DNA(Deoxyribonucleic Acid;デオキシリボ核酸)断片に対して、変性、アニーリングおよび伸長が行われる。このとき、プライマーがDNA一本鎖にアニーリングする確率p(0≦p≦1)および正しく塩基合成を行う確率q(0≦q≦1)を考えると、r+1回目のPCR後における(A,C,G,T)の割合(A(r+1),C(r+1),G(r+1),T(r+1))は、以下のとおりである。
A(r+1)=A(r)*p*q+C(r)*p*(1−q)/3+G(r)*p*(1−q)/3+T(r)*p*(1−q)/3
C(r+1)=C(r)*p*q+A(r)*p*(1−q)/3+G(r)*p*(1−q)/3+T(r)*p*(1−q)/3
G(r+1)=G(r)*p*q+A(r)*p*(1−q)/3+C(r)*p*(1−q)/3+T(r)*p*(1−q)/3
T(r+1)=T(r)*p*q+A(r)*p*(1−q)/3+C(r)*p*(1−q)/3+G(r)*p*(1−q)/3
モデルのパラメータpおよびqは、初期値がホモである箇所は多く存在するため、初期値がホモである箇所に対して上記の大量細胞を用いた実験により真の遺伝型とデプスの対応付けを推定し、KS検定(Kolmogorov-Smirnov test;コルモゴロフ・スミルノフ検定)により最もフィットする値を推定する。得られたpおよびqを用いて初期値がヘテロである際の真の塩基型とデプスの対応付けをモンテカルロシミュレーションにより推定する。図2、図3に示すグラフは、それぞれ、初期値がヘテロである場合、初期値がホモである場合の結果例に該当する。
《集団における遺伝型頻度を参照した補正》
本発明の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法においては、重み分布を、集団における遺伝型頻度を参照して補正することが好ましい。
集団ごとの遺伝型頻度の偏りを重み付けに取り込むためである。座位および遺伝型によっては、人種、民族間での変動が特に大きい場合がある。
本発明の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法においては、重み分布を、父親および/または母親の確定された遺伝型を参照して補正することが好ましい。
父親および/または母親の遺伝型から、子の遺伝型が限定される場合があるからである。また、子の見かけの遺伝型データが父親および/または母親の遺伝型から予測される遺伝型データと大きく異なる場合には、コンタミネーションが疑われ、その後の分析を行わないという判断をすることもできる。
本発明の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法においては、重み分布を、複数の単一細胞データを用いて補正することが好ましい。より適切な重み付けを行えるようになることが期待できるからである。
また、本発明の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法では、好ましくは、複数人に由来する可能性がある細胞または細胞群が母親および胎児のいずれか一方に由来する場合において、観測された遺伝型データにY染色体の存在を示すデータが存在すれば、細胞または細胞群が胎児に由来すると推定する。
母親細胞は性染色体としてX染色体のみを持つため、Y染色体の存在は、その遺伝型データが得られた細胞が胎児に由来することを示す有力な証拠である。
また、本発明の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法は、さらに、N人に由来する可能性がある細胞群を構成する細胞について、上記細胞間の距離を算出する工程、および、同一人らしさに応じて上記細胞のクラスタリングを実施し、最終的なクラスタ数kを求め、k=1である場合に上記細胞群は同一人に由来する細胞からなると判定し、k≠1かつk≦Nである場合に上記細胞群はN人中k人に由来する細胞からなると判定し、k≠1かつk>Nである場合に上記細胞群はN人以外の人を含むk人に由来する細胞からなると判定する工程を含むことが好ましい。ただし、ここで、Nおよびkは1以上の整数である。
クラスタリングの方法は、上述したものを用いることができる。
(被験者)
家系C、DおよびEの3家系を対象とした。家系Cからは、息子(シンボル:Cson)および母(シンボル:Cmom)の2人を、家系Dからは、姉(シンボル:Dsis1)、妹(シンボル:Dsis2)および母(シンボル:Dmom)の3人を、家系Eからは息子(シンボル:Eson)、母(シンボル:Emom)および父(シンボル:Edad)の3人を、被験者として選んだ。
(実験方法)
13番染色体、18番染色体、21番染色体およびX染色体上のSNP(Single Nucleotide Polymorphism;一塩基多型)を解析した。得られた重み付き遺伝型データを用いて、階層的クラスタリングを行った。得られたデンドログラムを図4に示す。枝(リネージ)に付した数値はクラスタ間の距離を表す。距離が小さいほど、同一人らしさが大きくなる。
(結果・考察)
同一人<親子<血縁関係(親子以外の血縁関係)<他人(血縁関係が無い他人)の順に距離が大きくなっている。
X染色体を見ているため、家系Eの父(シンボル:Edad)は家系Eの息子(シンボル:Eson)および母(シンボル:Emom)と離れている。
Claims (8)
- 妊婦末梢血から単離された2つの細胞が同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかを判定する判定方法であって、
前記2つの細胞それぞれの1以上の遺伝子多型部位を含む領域をDNA増幅及びシーケンスすることにより、各遺伝子多型部位の遺伝型データを取得し、前記遺伝型データに予め設定された重み分布で重み付けして、重み付き遺伝型データを取得する工程、および
前記重み付き遺伝型データを用いて、細胞間の距離を定義し、前記細胞間の遺伝的な位置関係を判断して、前記2つの細胞が同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかを判定する工程を含み、
前記予め設定された重み分布は、前記各遺伝子多型部位について、測定される見かけの遺伝型と真の遺伝型との対応付けにより設定され、
前記真の遺伝型は、多量DNAを用いて前記DNA増幅およびシーケンシングを行い、観察される遺伝型であり、
前記見かけの遺伝型とは、単一細胞から抽出されたDNAを用いて前記DNA増幅およびシーケンシングを行い、観察される遺伝型である、
判定方法。 - 前記見かけの遺伝型と真の遺伝型との対応付けは、
大量の細胞から抽出した前記多量のDNAを用いた前記DNA増幅及シーケンシングにより前記真の遺伝型を確定し、
前記各遺伝子多型部位について、単一細胞から抽出したDNAを用いて前記DNA増幅及びシーケンシングを行うことにより取得される、前記見かけの遺伝型及び前記見かけの遺伝型のデプスの分布に基づいて推定される、請求項1に記載の判定方法。 - 前記見かけの遺伝型と真の遺伝型との対応付けは、
前記各遺伝子多型部位において、r回目のPCR後における塩基(A,C,G,T)の割合を(A(r),C(r),G(r),T(r))とし、プライマーがDNA一本鎖にアニーリングする確率p(0≦p≦1)、正しく塩基合成を行う確率q(0≦q≦1)をパラメータとして、r+1回目のPCR後における塩基(A,C,G,T)の割合(A(r+1),C(r+1),G(r+1),T(r+1))を示すDNA増幅モデルを構築し、
初期値の前記遺伝子多型部位がホモ接合体である箇所については、大量の細胞から抽出した前記多量のDNAを用いた前記DNA増幅及びシーケンシングにより前記真の遺伝型を確定し、単一細胞から抽出したDNAを用いて前記DNA増幅及びシーケンシングを行うことにより取得される、前記見かけの遺伝型と、前記見かけの遺伝型のデプスの分布、及び、コルモゴロフ・スミルノフ検定により前記パラメータp及びqを推定し、
初期値の前記遺伝子多型部位がヘテロ接合体である箇所については、推定された前記パラメータp及びqを用いて、前記見かけの遺伝型のデプスの分布をモンテカルロシミュレーションにより推定する
請求項1に記載の判定方法。 - 前記遺伝型データは、前記DNA増幅及びシーケンシングの結果、前記各遺伝子多型部位において検出される遺伝子型、及びそのデプスの分布である請求項1〜3のいずれか1項に記載の判定方法。
- 前記重み分布を集団における遺伝型頻度を参照して補正する、請求項1〜4のいずれか1項に記載の判定方法。
- 前記重み分布を父親および/または母親の確定された遺伝型を参照して補正する、請求項1〜4のいずれか1項に記載の判定方法。
- 前記細胞が、母親および胎児のいずれか一方に由来する場合において、観測された前記遺伝型データにY染色体の存在を示すデータが存在すれば、前記遺伝型データを持つ前記細胞は胎児に由来すると推定する、請求項1〜6のいずれか1項に記載の判定方法。
- 前記距離が尤度または事後確率である、請求項1〜7のいずれか1項に記載の判定方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015220598 | 2015-11-10 | ||
JP2015220598 | 2015-11-10 | ||
PCT/JP2016/081476 WO2017082034A1 (ja) | 2015-11-10 | 2016-10-24 | 細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017082034A1 JPWO2017082034A1 (ja) | 2018-08-02 |
JP6564053B2 true JP6564053B2 (ja) | 2019-08-21 |
Family
ID=58695028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017550043A Active JP6564053B2 (ja) | 2015-11-10 | 2016-10-24 | 細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20180247019A1 (ja) |
EP (1) | EP3375886A1 (ja) |
JP (1) | JP6564053B2 (ja) |
WO (1) | WO2017082034A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11900604B2 (en) | 2017-07-12 | 2024-02-13 | Ande Corporation | Adaptive expert system for analysis and classification of DNA sample data |
CN115273976B (zh) * | 2022-08-24 | 2023-05-05 | 温州医科大学 | 一种半同胞关系鉴定方法、系统、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007062164A2 (en) * | 2005-11-26 | 2007-05-31 | Gene Security Network Llc | System and method for cleaning noisy genetic data and using data to make predictions |
AU2009293232B2 (en) * | 2008-09-16 | 2015-05-14 | Sequenom Center For Molecular Medicine | Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses |
JP6328934B2 (ja) * | 2010-12-22 | 2018-05-23 | ナテラ, インコーポレイテッド | 非侵襲性出生前親子鑑定法 |
-
2016
- 2016-10-24 JP JP2017550043A patent/JP6564053B2/ja active Active
- 2016-10-24 WO PCT/JP2016/081476 patent/WO2017082034A1/ja active Application Filing
- 2016-10-24 EP EP16863998.7A patent/EP3375886A1/en not_active Withdrawn
-
2018
- 2018-04-27 US US15/964,326 patent/US20180247019A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2017082034A1 (ja) | 2017-05-18 |
US20180247019A1 (en) | 2018-08-30 |
EP3375886A4 (en) | 2018-09-19 |
JPWO2017082034A1 (ja) | 2018-08-02 |
EP3375886A1 (en) | 2018-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2321642B1 (en) | Methods for allele calling and ploidy calling | |
CN107423534B (zh) | 基因组拷贝数变异的检测方法和系统 | |
JP2021035393A (ja) | 染色体提示の決定 | |
JP6328934B2 (ja) | 非侵襲性出生前親子鑑定法 | |
CN101971178B (zh) | 核酸序列失衡的确定 | |
TWI611186B (zh) | 多重妊娠之分子檢驗 | |
US11854666B2 (en) | Noninvasive prenatal screening using dynamic iterative depth optimization | |
CN113366122B (zh) | 游离dna末端特征 | |
JP2019531700A5 (ja) | ||
US7640113B2 (en) | Methods and apparatus for complex genetics classification based on correspondence analysis and linear/quadratic analysis | |
JP2016099901A (ja) | 形質予測モデル作成方法および形質予測方法 | |
CN115798580B (zh) | 基于基因型填补和低深度测序的一体化基因组分析方法 | |
JP6564053B2 (ja) | 細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法 | |
WO2016078067A1 (zh) | 个体单核苷酸多态性位点分型方法及装置 | |
US20160371432A1 (en) | Methods for allele calling and ploidy calling | |
CN114531916A (zh) | 确定精子提供者、卵母细胞提供者和对应受孕体之间的遗传关系的系统和方法 | |
KR20220013349A (ko) | 검출 한계 기반 품질 제어 메트릭 | |
JP7446343B2 (ja) | ゲノム倍数性を判定するためのシステム、コンピュータプログラム及び方法 | |
JP2009069911A (ja) | 遺伝子関連解析装置及び遺伝子関連解析プログラム | |
EP3907739A1 (en) | Method for determining fetal fraction in maternal sample | |
EP3524687A1 (en) | Method for determining number of loci required and method for determining number of snp loci required | |
JIN | STATISTICAL CHALLENGES IN NEXT GENERATION POPULATION GENOMICS STUDY | |
Fues | Comparison of logistic and ridge regression in genetic association studies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6564053 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |