JP2021101629A - ゲノム解析および遺伝子解析用のシステム並びに方法 - Google Patents
ゲノム解析および遺伝子解析用のシステム並びに方法 Download PDFInfo
- Publication number
- JP2021101629A JP2021101629A JP2019233587A JP2019233587A JP2021101629A JP 2021101629 A JP2021101629 A JP 2021101629A JP 2019233587 A JP2019233587 A JP 2019233587A JP 2019233587 A JP2019233587 A JP 2019233587A JP 2021101629 A JP2021101629 A JP 2021101629A
- Authority
- JP
- Japan
- Prior art keywords
- human
- genome
- nucleic acid
- analysis
- sex
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
高スループットシーケンシングとも知られている次世代シーケンシングは、当業者にはよく知られた核酸断片の高スループットかつパラレルシーケンシングのありふれた方法である。次世代シーケンシングの装置およびシステムは様々なサプライヤから商業的に手に入れることができる(www.illumina.com参照)。
・ イルミナ(ソレクサ)シーケンシング(登録商標)
・ イオン トレント:プロトン/PGMシーケンシング(登録商標)
・ SOLiDシーケンシング(登録商標)
民間会社であるセレラゲノミクスとの共同のアメリカ合衆国連邦政府の試みである、ヒトゲノムプロジェクトは、2001年2月に、すべてのヒトゲノムのドラフトを完成した。このドラフトはその後何度か改訂された(Lander et al. 2001, Venter et al. 2001, Church et al. 2011参照)。多年にわたって、ゲノムアセンブリは着実に進歩し、新しいバージョン(「ビルド」)が次々リリースされ、最新のゲノムレファランスコンソーティアム(GRC)のヒトゲノムアセンブリであるGRCh38(Schneider et al. 2017参照)が、ほぼ間違いなく、存在するアセンブルされた最もよい哺乳類のゲノムである。GRCh38の残っているアセンブリのギャップは875だけであり、特定されていない「N」ヌクレオチドは1億6千万より少ない(GRCh38以降、p8)。一方、最初のバージョンは約15万のギャップがあった(Editorial (October 2010). "E pluribus unum". Nature Methods. 7 (5): 331. doi:10.1038/nmeth0510-331参照)。
1. HRGは直線状である。
人間のDNAはすべて染色体と呼ばれる物理的に分離された複数のユニットに担持される。人間は2組の遺伝情報を含む2倍体生物であり、一組は母親から受け継ぎ、もう一組は父親から受け継いでいる。その結果、体細胞の各々は22対の常染色体と呼ばれる染色体(各対の一方の染色体は一方の親からのもの)と2つの性染色体(男性はX染色体とY染色体を有し、女性は2本のX染色体を有する)。各染色体は単一の極めて長い線状のDNA分子を含む。人間の最小の染色体中のDNA分子は約5千万のヌクレオチド対からなり、人間の最大の染色体は約2億5千万のヌクレオチド対を含む。
(1)ゲノムDNAの性質および配列決定の限界のため、ゲノムのいくつかの部分の配列は決定されていないままである。
(2)ゲノムの領域の中には個人間での変化が極めて大きいため、単一の連続した配列として表すことができない領域がある。
しかし、HRGは通常の塩基(A、C,TおよびG)からなり、集合体中の間隙の位置を明示する連続する複数の「N」として表される間隙を有する24個の線状の配列として表される。
チェンとブッテは15個の稀な変異(メジャーアレル頻度<1%)を含むHRG中に3556個の病気にかかりやすくなる変異を特定した(2011年)。 専門家によって収集された高品質の定量的な人間の病気のSNPに関するデータからなるデータベースを用いて、著者らは基準ゲノムの場合に健康な人々が104の病気にかかるリスクが増大する可能性について調べた。その結果、1型の糖尿病、高血圧および他の疾患のリスクが高いことがわかった。このことは、HRGは普通の人を代表するものではなく、病気と無縁ではないことは間違いないことの証拠である。HRGはヒトのゲノムの配列決定の成果の分析を著しく加速させたが、基準ゲノムと異なる変異に集中すると稀な変異を含む病気を引き起こす多くの変異を見逃す可能性が高い(Chen & Butte 2011参照)。
従来技術のNGS解析パイプラインでHRGのアセンブリを用いることの主要な課題は、このようなHRGが欧州人の祖先よりのバイアスを有する比較的少数の匿名のドナーのDNAサンプルから抽出され、そのため人間の遺伝子の多様性からなる大きな群からの少量のサンプルを代表しているという事実である。
単一の1倍体の基準ゲノムは人間の多様性のうちのほんの少しの部分しか表していないので、人間の遺伝学およびゲノム研究用の共通の基準として不十分であるという認識が多くなっている。基準ゲノムに関して簡単に説明することができない変異や注釈がある(Horton et al. 2008, Pei et al. 2012参照)。さらに、単一の1倍体の基準ゲノムをリードマッピングおよびリード解釈の目標とすると、前記したような基準アレルのバイアスを導入してしまう。このような問題を緩和するため、本出願時のヒトゲノムアセンブリ(GRCh38、p9参照)のような最新の基準ゲノムアセンブリは、「代替遺伝子座」配列(「alts」)、すなわちヒトゲノムの領域の極めて多様な形となると考えられる余分な複数の配列を含むようにした。これらの配列の両端は「主」(1倍体)基準アセンブリの複数の位置に固定されている。そのような構造は、部分的に重複する配列経路を含み、数学的なグラフの形、すなわちゲノムグラフであると考えることができる(Novak et al. 2017参照)。
カタールはペルシャ湾岸の半島であり、その総人口は約30万人のカタール市民からなる。カタール人の血族結婚の割合は世界で最も高い部類であり、現在もなお上昇している。カタールにおける人種内の結婚の割合はほぼ100%に近い。大家族であることとともに、このような要因が相まって、カタールの予算の重荷となっている先天的な遺伝病が高い割合で発生している理由である。このような要因があることから、カタール政府は自国民を遺伝病のおそれから守る方策を見つけようとしている(Zayed 2016参照)。
2008年に世界中の少なくとも1000ヒトのゲノムの配列を決定し、それらのゲノムからヒトの遺伝的多様性(HRG GRCh37に関する)とヒトのハプロタイプのカタログを作製する1000ゲノムプロジェクトができた(そのため名称が1000ゲノムプロジェクト)。このプロジェクトの現在の第3相解析は26の地域住民集団とそれぞれが4〜7の地域住民の集団を縫合した範囲を決めた5つのいわゆる超地域住民集団からの2504人の個人を含む(1000 Genomes Project Consortium et al. 2015参照)。このより小規模でのハプロタイプの資源によって、ゲノムレベルおよび地理的レベルでの遺伝的多様性を理解するのが容易になる(Baye, 2011参照)。
a) 複数のヒト基準ゲノムからなる組を用意する。
b) 性および/または祖先を調べるためにヒトの核酸サンプルを試験する。
c) ステップb)の前記性および/または祖先を調べる試験の結果に基づいて、前記複数のヒト基準ゲノムからなる組から一つ以上の集団に特有のヒト基準ゲノム(PHREG)を選択する。
d) ステップc)で選択したPHREGに対して前記ヒトの核酸サンプルを位置決めする。
組織処理手法FFPE(ホルマリン固定されたパラフィン処理された組織またはホルムアルデヒド固定されパラフィン処理された組織)による固化によって生じた好ましくない加工物を含むものでもよい。
「InDel」という語はゲノム中の塩基対の挿入または欠失であり、代表的には1塩基対から10000塩基対までの長さの小さい遺伝子の変形を含む。挿入および欠失の周りでの再位置決めにより、後で行うデータ解析、特に変異の特定が改善される。
「塩基品質スコア」という語は、塩基ごとの誤りの評価値であり配列決定機器により決定された塩基の特定の信頼度を表す。塩基品質スコアは、例えば後で行う変異の特定の証拠を評価するのに用いてもよい。BQSRは、配列決定を行う方法の物理または化学による規則的におこる技術誤差を考慮して塩基品質スコアを修正することができる。
進化の解析による研究は、ヌクレオチドの多様性、集団ごとの相違、連鎖不平衡および一つ以上の集団からの突然変異の頻度スペクトラムを測るツールを含むものでよい。進化の解析は、通常、進化する配列の統計値を計算する計算ツールを含むものでよい。この計算ツールは染色体またはスキャフォールド全体にわたるスラディング・ウィンドウ法による解析を行うものでよい。この計算ツールは例えばヒトの核酸サンプルの系統樹を作るものでよい。
さらに、位置決めされたヒトのゲノムサンプルは野生型のバイオマーカーが存在するかどうかを確認するために試験されてもよい。野生型のバイオマーカーとは、PHREG中に含まれるため、変異特定処理の際に検出されないバイオマーカーである。そのため、位置決め後の計算ステップは既知の各バイオマーカーを見つけるための試験を含む。この試験は、対象の位置のPHREGの情報が何であるかにかかわらず、位置決めされたヒトのゲノムサンプル中にバイオマーカーがあるかどうかを示す。
a) 複数のヒト基準ゲノムの組を用意するコンピュータ命令を有する第1のモジュールと、
b) ヒトの核酸サンプルを試験して性および/または祖先を調べる第2のモジュールと、
c) 前記性および/または祖先を調べる試験の結果に基づいて前記複数のヒト基準ゲノムの組から集団に特有なヒト基準ゲノムすなわちPHREGを一つ以上選ぶためのコンピュータ命令を有する第3のモジュールと、
d) 前記ヒトの核酸サンプルを前記選択した一つ以上のPHREGに対して位置決めするためのコンピュータ命令を有する第4のモジュールと、を含む。
図1はヒトの核酸サンプルのゲノム解析および/または遺伝子解析のための通常のワークフローを図解し、このワークフローはヒトの核酸サンプルを抽出する工程と、配列ライブラリを用意する工程と、配列を決める工程と、後でデータ解析する工程を含む。本願発明の説明の中では、ヒトの核酸サンプルを抽出する工程と、配列ライブラリを用意する工程と、配列を決める工程とは周知の標準的な工程なので、詳細については説明しない。発明部分であるデータ解析の部分の詳細が図2に示されている。
(イ)のグラフ:位置決めされたリードのX染色体/Y染色体の比
(ロ)のグラフ:X染色体上の500個の普通のSNP位置で調べた0.8〜1.0の範囲のメジャーアレル頻度
(ハ)のグラフ:Y染色体上で正しく対になったリードの割合
図5は以下に記載する実施例に照らして観るべきである。
過去10年間に観られた急激なコスト低下により、大きな群の次世代シーケンシングはますます普通に行われるようになっており(Cancer Genome Atlas Research Network et al., 2013; Rand et al., 2016参照)、エクソーム全体のアップローチは大規模な研究では主要な役割を果たしている。特に、精密医療や病気の包括的な特徴づけの分野において用いられている。このような状況で、サンプルの祖先および性を正しく知ることにはいろんな利点がある。第1に、サンプルの祖先および性を正しく知ることにより、複雑な手順およびサンプル処理に必要な手作業によって起きるサンプルの取り違えを特定することを支援して品質制御が容易になる。第2に、大部分のゲノム研究で存在する、またヒト基準ゲノム中に存在する強いヨーロッパ系のバイアスを避けるため、さらに様々な祖先を有する人の臨床ケアを改善するため、祖先は変異の影響を解釈する上で極めて重要である(etrovski et al., 2016; Mersha et al., 2015; Fakhro et al., 2016参照)。最後に、祖先は遺伝との関連を調べる研究で広く用いられ、集団の層別による誤った病気との関連付けを避けている(Wu et al., 2011参照)。性および祖先の自己申告は信頼できないことが多いので(Mersha et al., 2015; Ainsworth, 2015参照)、ゲノム情報を用いた特定が必要である。
2.1 アルゴリズム
全エクソームを配列決定するペアエンドリードの位置決めに基づいて個人の最も可能性の高い性と祖先を推定する2個の分類器の組を用意した。このツールは予測のためにリードマッピングおよび個々ヒトの遺伝子型の違いを利用する。
性分類器に用いる特徴としてX染色体とY染色体の間の位置決めの違いに基づくものを用いた(図5参照)。Y染色体上で正しく対になったリードの割合だけでなくY染色体リードに対するX染色体リードの比率を用いた。さらに、X染色体上の500個のよく知られたエキソン領域のSNP位置でのメジャーアレルの頻度を組み合わせた。集団のバイアスを除くため、主要な祖先の間で頻度が高いSNPを選んだ。
多様な祖先からデータを得るために、1000ヒトゲノムプロジェクト第3段階からの1735人の個人からのゲノムデータを用いて祖先分類器を学習させた。大陸別の複数の祖先(AFR、AMR、EAS、EUR、SAS)を分類に用い、複数の個人を無差別に選んで、各分類を均衡させた。694人の個人が試験の組の一部であった。
3.1 性分類器
モレキュラーヘルス社の全癌種遺伝子パネルによって配列決定した592のデータ組を用いて性分類器を学習させた。ペアエンドリードを配列決定し、方法の章で説明したように特徴を計算した。公差検証により方法を調整した後、該方法を2個のデータ組に適用して性能評価をおこなった。用いたデータ組は、前記した遺伝子パネルによって配列決定した396人の個人と利用できる全エクソームデータによって配列決定した300人のTCGAの個人である。
祖先分類器は1000ヒトゲノムプロジェクトからの1041個のデータ組で学習させた。2.2で説明したように、個々のヒトの遺伝子型がそれぞれ特徴として用いられた。最高性能のモデルを2つの試験データ組で決めた。2つの試験データ組は、全エクソームが配列決定された300人のTCGAの個人と1000ヒトゲノムプロジェクトからののこりの694人の個人である。
全エクソームからの位置決めされたペアエンドリードに基づいて、または目標サイズが許すならば、目標とする配列決定の試験に基づいて個人の性および祖先を確実に、かつ容易に判定する新規な方法であるアンセクストリを説明する。このツールはロジスティック回帰分析に依存する2個のパイソン(Python)に基づく分類器を提供し、このツールによる祖先の予測は集団遺伝学の分野で用いられる主にPCAに基づく方法を代替する手法になる。 アンセクストリは、そのまますぐに使える基準モデルを提供し、必要とするユーザー入力は最小である。アンセクストリは、速く、正確で、使用するのが容易である。
本明細書中では、複数の異なる著者が同じ目的で複数の異なる語を用いているため、「祖先に特有の」/「民族に特有の」/「集団に特有の」という語は互いに交換可能に用いられている。
1. Lander, E. S. et al. Initial sequencing and analysis of the human genome. Nature 409: 860-921 (2001). [PMID: 11237011]
2. Church, D. M. et al. Modernizing reference genome assemblies. PLoS Biol. 9: e1001091 (2011). [PMID: 21750661]
3. Harrow, J. et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome Res. 22: 1760-1774 (2012). [PMID 22955987]
4. ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature 489: 57-74 (2012). [PMID: 22955616]
5. 1000 Genomes Project Consortium et al. A global reference for human genetic variation. Nature 526: 68-74 (2015). [PMID: 26432245]
6. Li H & Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25: 1754-1760 (2009). [PMID: 19451168]
7. DePristo, M. A. et al. A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nat. Genet. 43: 491-498 (2011). [PMID: 21478889]
8. Horton, R. et al. Variation analysis and gene annotation of eight MHC haplotypes: the MHC Haplotype Project. Immunogenetics 60: 1-18 (2008). [PMID: 18193213]
9. Pei, B. et al. The GENCODE pseudogene resource. Genome Biol.13: R51 (2012). [PMID: 22951037]
10. Degner, J. F. et al. Effect of read-mapping biases on detecting allele-specific expression from RNA-sequencing data. Bioinformatics 25: 3207-3212 (2009). [PMID: 19808877]
11. Brandt, D. Y. C. et al. Mapping Bias Overestimates Reference Allele Frequencies at the HLA Genes in the 1000 Genomes Project Phase I Data. G3 5: 931-941 (2015). [PMID: 25787242]
12. Novak A.; Hickey G.; Garrison E.; Blum S.; Connelly A.; Dilthey A; Eizenga J.; Elmohamed M.; Guthrie S.; Kahles A.; Keenan S.;e Kelleher J.; Kural D.; Li H.; Lin M.; Miga K.; Ouyang N.; Rakocevic G.; Smuga-Otto M.; Zaranek A.; Durbin R.; McVean G.; Haussler D.; (https://www.biorxiv.org/content/biorxiv/early/2017/01/18/101378.full.pdf)
13. Paten B, Novak AM, Eizenga JM, Garrison E. Genome graphs and the evolution of genome inference. Genome Res. 5: 665-676 (2017) [PMID: 28360232]
14. Snyder M., et al. Personal genome sequencing: current approaches and challenges. Genes Dev. 5, 423-431 (2010) [PMID: 20194435]
15. Young, A.L. et al. A new strategy for genome assembly using short sequence reads and reduced representation libraries. Genome Res 2: 249-256 (2010) [PMID: 20123915]
16. Flicek, P & Birney, E. Sense from sequence reads: methods for alignment and assembly. Nat Methods. 6: S6-S12 (2009) [PMID 19844229]
17. Chen R . & Butte A.J. The reference human genome demonstrates high risk of type 1 diabetes and other disorders. Pac Symp Biocomput. 2011:231-242 (2011) [PMID: 21121051]
18. International Human Genome Sequencing Consortium. 2001. Initial sequencing and analysis of the human genome. Nature 409: 860-921 (2001) [PMID: 11237011]
19. International Human Genome Sequencing Consortium. 2004. Finishing the euchromatic sequence of the human genome. Nature 431: 931-945 (2004) [PMID: 15496913]
20. Schneider V.A. et al. Evaluation of GRCh38 and de novo haploid genome assemblies demonstrates the enduring quality of the reference assembly. Genome Res. 5:849-864. (2017) [PMID: 28396521]
21. [Editorial (October 2010). "E pluribus unum". Nature Methods. 5: 331. doi:10.1038/nmeth0510-331. (2010) [PMID: 20440876]
22. Nielsen R., Paul J. S., Albrechtsen A., Song Y. S. Genotype and SNP calling from next-generation sequencing data. Nat. Rev. Genet. 12: 443-45. (2011) [PMID: 21587300]
23. Fakhro, K. A., Staudt M. R., Ramstetter M. D., Robay A., Malek J. A., Badii R., et al. The Qatar genome: a population-specific tool for precision medicine in the Middle East. Hum. Genome Var. 3:16016 Human Genome Variation (2016) 3, 16016 doi:10.1038/hgv.2016.16; published online 30 June 2016 (2016) [PMID: 27408750]
24. Zayed H. The Qatar genome project: translation of whole-genome sequencing into clinical practice. Int J Clin Pract. 10: 832-834 doi: 10.1111/ijcp.12871. Epub 2016 Sep (2016) [PMID: 27586018]
25. Sanger F., et al. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 74:5463-5467. (1977) [PMID: 271968]
26. Venter, J.C. et al. The Sequence of the Human Genome. Science 291: 1304-1351. (2001) [PMID: 11181995]
27. Petrovski S & Goldstein D.B. Unequal representation of genetic variation across ancestry groups creates healthcare inequality in the application of precision medicine. Genome Biol 2016;17:157.doi: 10.1186/s13059-016-1016-y. (2016) [PMID: 27418169]
28. Koboldt DC, Ding L, Mardis ER, Wilson RK. Challenges of sequencing human genomes. Brief Bioinform. 11:484-498. (2010) [PMID: 20519329]
29. Dewey F.E., Chen R., Cordero S.P., Ormond K.E., Caleshu C., Karczewski K.J. et al. Phased whole-genome genetic risk in a family quartet using a major allele reference sequence. PLoS Genet. 2011 Sep;7(9):e1002280. doi: 10.1371/journal.pgen.1002280. Epub 2011 Sep 15. (2011) [PMID: 21935354]
30. Cao H, Wu H, Luo R, Huang S, Sun Y, Tong X et al. De novo assembly of a haplotype-resolved human genome. Nat Biotechnol 33: 617-622. (2015) [PMID: 26006006]
31. Wu L., Yavas G., Hong H., et al. Direct comparison of performance of single nucleotide variant calling in human genome with alignment-based and assembly-based approaches. Sci Rep. 2017 Sep 8;7(1):10963. doi: 10.1038/s41598-017-10826-9. (2017) [PMID: 28887485]
32. Meyer, L. R. et al. The UCSC Genome Browser database: extensions and updates 2013. Nucleic acids research41: D64-D69 (2013). [PMID: 23155063]
33. Sudmant, P. H. et al. An integrated map of structural variation in 2,504 human genomes. Nature 526: 75-81 (2015). [PMID: 26432246]
34. Iqbal, Z., Caccamo, M., Turner, I., Flicek, P. & McVean, G. De novo assembly and genotyping of variants using colored de Bruijn graphs. Nature genetics 44: 226-232 (2012). [PMID: 22231483]
35. Cornish-Bowden A. (1985). Nomenclature for incompletely specified bases in nucleic acid sequences: recommendations 1984. Nucleic Acids Res. 13: 3021-3030. (1985) [PMID: 2582368]
36. Mersha T. B., & Abebe T. Self-reported race/ethnicity in the age of genomic research: its potential impact on understanding health disparities. Hum. Genomics 9:1. (2015) [PMID: 25563503]
37. Baye T. M. Inter-chromosomal variation in the pattern of human population genetic structure. Hum Genomics 5:220-240. (2011) [PMID: 21712187]
38. Fondevila M. et al. Revision of the SNPforID 34-plex forensic ancestry test: Assay enhancements, standard reference sample genotypes and extended population studies. Forensic Sci Int Genet 7: 63-74. (2013) [PMID: 22749789]
39. Ainsworth C. Sex redefined. Nature518: 288-291. doi: 10.1038/518288a. (2015) [PMID: 25693544]
40. Gall J. G., Pardue M.L. Formation and detection of RNA-DNA hybrid molecules in cytological preparations. Proc. Natl. Acad. Sci. USA 63, Nr. 2, 1969, S. 378-383, [PMID 4895535].
41. Kallioniemi A. et al. Comparative genomic hybridization for molecular cytogenetic analysis of solid tumors. Science Band 258, Nr. 5083, 1992, S. 818-821.
42. Goodwin S., McPherson JD, McCombie WR. Coming of age: ten years of next-generation sequencing technologies. Nat. Rev. Genet. 2016 May 17;17(6):333351
43. Al-Ali M, Osman W., Tay G.K., AlSafar H.S. A 1000 Arab genome project to study the Emirati population. J. Hum. Genet. 63(4): 533-536 (2018). [PMID: 29410509]
44. Cancer Genome Atlas Research Network et al. The Cancer Genome Atlas Pan-Cancer analysis project. Nat. Genet., 45(10), 1113-1120 (2013).
45. Rand,K.A. et al. Whole-exome sequencing of over 4100 men of African ancestry and prostate cancer risk. Hum. Mol. Genet., 25(2), 371-381 (2016).
46. Wu,C. et al. A Comparison of Association Methods Correcting for Popula-tion Stratification in Case-Control Studies. Ann. Hum. Genet., 75(3), 418-427 (2011).
47. Romanel,A. et al. EthSEQ: ethnicity annotation from whole exome sequencing data. Bioinformatics, 33(15), 2402-2404 (2017).
発明者らは全エクソーム捕捉イルミナ配列決定を用いて配列決定されたGDC/TCGA(参考文献1参照)からの741個の生殖細胞系列サンプルを用いた。このデータ組は、アフリカ人(AFR)祖先の155個のサンプル、ラテンアメリカ人/混血アメリカ人(AMR)祖先の33個のサンプル、欧州人(EUR)祖先の354個のサンプル、および南アジア人(SAS)祖先の20個のサンプルを有していた。ノヴォアライン(Novoalign)4.00.1を用いて、各サンプルは標準ヒト基準ゲノム(HRG)GRCh37(参考文献3参照)に対して、発明者らの祖先分類器が定めたPHREGに対して、さらにHSA PHREGに対して位置決めした。HSA PHREGはAFR、AMR、EAS、EURおよびSASを含むGnom v2.1の祖先(参考文献4参照)のすべてについて変異データを集めることによって作成された。
HRGと比べてPHREGに対して位置決めする場合のカバレッジの違いを示したジンコード(Gencode) CDSのエキソン中のクリンバー・バイオマーカーのリスト(遺伝子名|コンティグ|始端|終端)。
HRGに対する位置決めに基づいて計算したカバレッジに対する、祖先ごとのすべてのケースおよびすべての741のケース(HSA)についての中央値としての各PHREG(AFR、AMR、EAS、EUR、SAS、HSA)のカバレッジの差を与える。
正の数はカバレッジの増大を意味し、負の数はカバレッジの減少を意味する。
[1] https://portal.gdc.cancer.gov
[2] http://www.novocraft.com/products/novoalign
[3] https://www.ncbi.nlm.nih.gov/grc/human
[4] https://gnomad.broadinstitute.org/faq
[5] https://www.ncbi.nlm.nih.gov/clinvar
[6] https://www.gencodegenes.org/human/release_31lift37.html
chr1 36768200 rs1573020
chr1 159174683 rs2814778
chr1 204790977 rs2065160
chr2 7149155 rs896788
chr2 109513601 rs3827760
chr2 136616754 rs182549
chr3 168645035 rs1498444
chr4 38803255 rs4540055
chr4 159181963 rs2026721
chr5 33951693 rs16891982
chr7 4457003 rs917118
chr10 17064992 rs7897550
chr10 34755348 rs1978806
chr11 32424389 rs5030240
chr12 29369871 rs10843344
chr12 56603834 rs773658
chr13 20901724 rs1335873
chr13 22374700 rs1886510
chr13 34864240 rs2065982
chr14 36170607 rs10141763
chr14 101142890 rs730570
chr15 28365618 rs12913832
chr15 48426484 rs1426654
chr16 31079371 rs881929
chr16 90105333 rs3785181
chr17 75551667 rs2304925
chr18 75432386 rs1024116
chr19 42410331 rs2303798
chr20 38849642 rs1321333
chr21 16685598 rs722098
chr21 17710424 rs239031
chr21 25672460 rs2572307
chr22 26350103 rs5997008
chr22 47836412 rs2040411
Claims (16)
- ヒト核酸サンプルのゲノム解析および/または遺伝子解析をする方法であって、
(a) 複数のヒト基準ゲノムからなるグループを用意するステップと、
(b) ヒト核酸サンプルを試験して、性および/または祖先を調べるステップと、
(c) 前記ステップ(b)の性および/または祖先を調べる試験の結果に基づいて、前記複数のヒト基準ゲノムからなるグループから一つ以上の集団に特有の基準ゲノムすなわちPHREGを選ぶステップと、
(d) 前記ヒト核酸サンプルを前記選んだPHREGに位置決めするステップと、
を含む方法。 - 前記位置決めはメジャーアレルレベルまたは非稀少アレルレベルで行われる請求項1に記載する方法。
- (e) 前記選んだPHREGを基準として前記位置決めしたヒト核酸サンプルの変異の特定を行うステップを、さらに含む請求項1または2に記載する方法。
- 前記変異の特定はメジャーアレルレベルまたは非稀少アレルレベルで行われる請求項3に記載する方法。
- ステップ(a)で用意される前記複数のヒト基準ゲノムは、公表されたヒト基準ゲノムまたは公表されたヒト基準ゲノムから得られたものである請求項1乃至4のいずれかに記載する方法。
- ステップ(a)は、唯一に定まる塩基コードまたは唯一に定まらない塩基コードのいずれかを有するコード化レベルに合わせて、前記複数のヒト基準ゲノムを修正することを含む請求項1乃至5に記載する請求項1乃至5に記載する方法。
- ステップ(a)で用意される前記複数のヒト基準ゲノムはPHREGである請求項1乃至6のいずれかに記載する方法。
- 前記性を調べる試験はX染色体および/またはY染色体上の性特有の遺伝子中の少なくとも一位置を試験すること、X染色体および/またはY染色体上の複数のヒトゲノムサンプルの位置決めの違いを利用すること、細胞遺伝学的試験、FISH解析およびCGH解析のうちの一つ以上を含む請求項1乃至7のいずれかに記載する方法。
- 前記祖先を調べる試験はヒト核酸サンプルについて用いる機械学習アルゴリズム、または祖先に特有の変異を利用する別の分類スキームに基づく請求項1乃至8のいずれかに記載する方法。
- 前記祖先を調べる試験は、少なくとも一つのゲノム位置の遺伝子型を用いること、並びに/または複数のSNPアレイもしくは複数のSNPチップを試験すること、および/またはサンガー配列決定もしくは質量分析からのマーカーを試験することを含む請求項1乃至9のいずれかに記載する方法。
- 前記祖先を調べる試験はABL2、ATP1A3、CIC、CYP2C8、CYP2C9、EPHA3、EPHA7、ERBB3、ERG、ETV1、F2、FAS、HFE、IL11RA、IL2RA、ITGB6、KIF11、KIT、KLK3、LRP6、MDM4、NAT2、NTRK2、PDGFB、PIK3R1、PLA2G3、PLAU、PRKCB、RICTOR、SLC7A11、STAT3、T、TSC1、VCAM1、VDR、VEGFB、ACVRL1、AXL、CA9、CALCR、CASP9、ENG、EPHB1、ERBB4、ESR1、FGFR2、HPSE、HSP90AA1、ITK、MRE11A、PLK1、PTPRC、SERPINE1、SMC4、TERT、TLR3、WISP3、WT1、XRCC1、ANGPT2、ARID2、BARD1、CBR3、CDH2、CYP1B1、DDR2、DNMT3A、EPCAM、ERCC2、FANCG、FANCL、GSTP1、IRS2、ITGB1、JAK3、LHCGR、MSH6、NCF2、RNF43、SLC5A5、TMPRSS2、TNFRSF8、AKT1、CD248、CD4、ESR2、EZH2、IGF1R、ITGAV、ITGB2、KLHL6、MAP3K1、MET、MLL、MTHFR、NFKB1、NUP93、PARP8、RB1、RPE65、TSHR、ABL1、BLM、CYP19A1、DPP4、EPHA6、ERBB2、EWSR1、FOXP4、ITGAM、KDM5A、LPA、LTK、MLH1、PBRM1、PHLPP2、SF3B1、TNFRSF10A、ABCG2、ACPP、ADAM15、DPYD、EPHA5、EPHB6、FOLH1、KDR、MSH3、MST1R、NTRK1、ROCK2、SLC6A2、TET2、TGM2、TH、ABCB1、CD22、CD40、CD44、CDH20、CYP11B2、ERCC5、GPR124、IL7R、ITGB3、ITGB5、NCL、NOD2、NR4A1、PGR、PLCG1、PPP2R1A、PRAME、PTCH2、RET、SETD2、XPC、ASXL1、EPHB4、PLA2G6、SYK、TET1、EP300、FLT1、ITGA1、LOXL2、PDGFRB、PIK3CD、SSTR5、TEC、APC、ATR、CLU、CREBBP、CYP2D6、EML4、MMP2、PARP2、PDGFRA、TRPM8、CSF1R、DOT1L、FGFR3、FGFR4、GLP2R、IKBKE、JAK1、NOTCH2、SPEN、SPG7、BRCA1、CYP11B1、GNAS、ITGA5、LTF、NRP2、PTK2B、TNKS、ABCC1、CEACAM5、CYP4B1、EGFR、FLT3、INSR、PTCH1、SMARCA4、ZNF217、BCR、EEF2、SELP、SLCO1B1、ABCC2、FLT4、MTR、IL4R、MTOR、RPTOR、TEK、ATM、CARD11、FANCD2、MEFV、NF1、TP73、BRCA2、CD109、PTPRD、ABCC6、IGF2R、P2RX7、ROS1、ACE、PARP1、PRKDC、CENPE、TSC2、ALK、NOTCH1、TNC、NOTCH3、POLE、MLL2、MYH11、POLD1、GRIN3B、F5、FANCA、LRP1B、LRP2、VWFからなる遺伝子グループから選ばれる少なくとも一つの遺伝子を試験することを含む請求項1乃至10のいずれかに記載する方法。
- 前記ヒト核酸サンプルは次世代シーケンシングすなわちNGSから公表された複数のリードからなる組を有し、前記位置決めは前記複数のリードを前記選んだPHREGに対してマッピングすることを含む請求項1乃至11のいずれかに記載する方法。
- ヒト核酸サンプルのゲノム解析または遺伝子解析用のコンピュータシステムであって、
(a) 複数のヒト基準ゲノムからなるグループを用意するコンピュータ命令を有する第1モジュールと、
(b) ヒト核酸サンプルを試験して、性および/または祖先を調べる第2モジュールと、
(c) 前記性および/または祖先を調べる試験の結果に基づいて、前記複数のヒト基準ゲノムからなるグループから一つ以上の集団に特有の基準ゲノムすなわちPHREGを選ぶコンピュータ命令を有する第3モジュールと、
(d) 前記ヒト核酸サンプルを前記選んだPHREGに位置決めするコンピュータ命令を有する第4モジュールと、を有するコンピュータシステム。 - コンピュータによって実行されると、そのコンピュータが請求項1乃至12のいずれかの前記ステップ(a)〜ステップ(d)を実行する命令を有するコンピュータプログラム。
- コンピュータによって実行されると、そのコンピュータが請求項1乃至12のいずれかの前記ステップ(a)〜ステップ(d)を実行する命令を有するコンピュータが読み取り可能な記憶媒体。
- 患者の治療方法であって、
患者の病気の症状の特定結果を抽出し、
前記患者から核酸サンプルを得て、
請求項1の方法にしたがって前記核酸サンプルのゲノム解析および/または遺伝子解析を行い、
前記患者の前記病気の症状に合った可能な治療法を抽出し、
変異の特定および変異の解釈を行い、
前記変異の解釈に基づいて抽出した可能な治療法を分類し、各治療法が前記患者にとって望ましく推奨される治療法として、または前記患者にとって禁忌となる治療法として分類され、
前記患者にとって望ましく推奨される治療法のうちの一つを選び、
その選んだ治療法にしたがって前記患者を治療する治療方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019233587A JP2021101629A (ja) | 2019-12-24 | 2019-12-24 | ゲノム解析および遺伝子解析用のシステム並びに方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019233587A JP2021101629A (ja) | 2019-12-24 | 2019-12-24 | ゲノム解析および遺伝子解析用のシステム並びに方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021101629A true JP2021101629A (ja) | 2021-07-15 |
JP2021101629A5 JP2021101629A5 (ja) | 2022-08-23 |
Family
ID=76754409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019233587A Ceased JP2021101629A (ja) | 2019-12-24 | 2019-12-24 | ゲノム解析および遺伝子解析用のシステム並びに方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021101629A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112662645A (zh) * | 2021-01-19 | 2021-04-16 | 华南理工大学 | 一种鞘磷脂酶d突变体及其应用 |
CN113793641A (zh) * | 2021-09-29 | 2021-12-14 | 苏州赛美科基因科技有限公司 | 一种从fastq文件中快速判断样本性别的方法 |
WO2023042703A1 (ja) | 2021-09-17 | 2023-03-23 | A・Tコミュニケーションズ株式会社 | 暗号化装置及び暗号化方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130190321A1 (en) * | 2012-01-23 | 2013-07-25 | West Chester University Of Pennsylvania | Methods and compositions relating to proliferative disorders of the prostate |
US20140067280A1 (en) * | 2012-08-28 | 2014-03-06 | Inova Health System | Ancestral-Specific Reference Genomes And Uses Thereof |
JP2017510892A (ja) * | 2013-12-07 | 2017-04-13 | シーケンシング.コム | 個人のゲノムデータを使用するリアルタイムパーソナライズシステムおよび方法 |
JP2018516577A (ja) * | 2015-05-29 | 2018-06-28 | アルターゴン エスアー | 高感度cgh解析のための方法、支持体及びキット |
-
2019
- 2019-12-24 JP JP2019233587A patent/JP2021101629A/ja not_active Ceased
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130190321A1 (en) * | 2012-01-23 | 2013-07-25 | West Chester University Of Pennsylvania | Methods and compositions relating to proliferative disorders of the prostate |
US20140067280A1 (en) * | 2012-08-28 | 2014-03-06 | Inova Health System | Ancestral-Specific Reference Genomes And Uses Thereof |
JP2017510892A (ja) * | 2013-12-07 | 2017-04-13 | シーケンシング.コム | 個人のゲノムデータを使用するリアルタイムパーソナライズシステムおよび方法 |
JP2018516577A (ja) * | 2015-05-29 | 2018-06-28 | アルターゴン エスアー | 高感度cgh解析のための方法、支持体及びキット |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112662645A (zh) * | 2021-01-19 | 2021-04-16 | 华南理工大学 | 一种鞘磷脂酶d突变体及其应用 |
CN112662645B (zh) * | 2021-01-19 | 2022-04-22 | 华南理工大学 | 一种鞘磷脂酶d突变体及其应用 |
WO2023042703A1 (ja) | 2021-09-17 | 2023-03-23 | A・Tコミュニケーションズ株式会社 | 暗号化装置及び暗号化方法 |
CN113793641A (zh) * | 2021-09-29 | 2021-12-14 | 苏州赛美科基因科技有限公司 | 一种从fastq文件中快速判断样本性别的方法 |
CN113793641B (zh) * | 2021-09-29 | 2023-11-28 | 苏州赛美科基因科技有限公司 | 一种从fastq文件中快速判断样本性别的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6854272B2 (ja) | 遺伝子の変異の非侵襲的な評価のための方法および処理 | |
US11972841B2 (en) | Machine learning system and method for somatic mutation discovery | |
US20200258601A1 (en) | Targeted-panel tumor mutational burden calculation systems and methods | |
US20180119230A1 (en) | Systems and methods for analyzing nucleic acid | |
US20200270707A1 (en) | Methylation pattern analysis of haplotypes in tissues in a dna mixture | |
US11164655B2 (en) | Systems and methods for predicting homologous recombination deficiency status of a specimen | |
US20220367006A1 (en) | Methods and systems for dynamic variant thresholding in a liquid biopsy assay | |
US11211144B2 (en) | Methods and systems for refining copy number variation in a liquid biopsy assay | |
AU2016293025A1 (en) | System and methodology for the analysis of genomic data obtained from a subject | |
WO2021168146A1 (en) | Methods and systems for a liquid biopsy assay | |
JP2021101629A (ja) | ゲノム解析および遺伝子解析用のシステム並びに方法 | |
US11211147B2 (en) | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing | |
JP2021101629A5 (ja) | ||
WO2019025004A1 (en) | METHOD FOR NON-INVASIVE PRENATAL DETECTION OF FETUS SEX CHROMOSOMAL ABNORMALITY AND FETUS SEX DETERMINATION FOR SINGLE PREGNANCY AND GEEMELLAR PREGNANCY | |
EP3588506B1 (en) | Systems and methods for genomic and genetic analysis | |
CN113053460A (zh) | 用于基因组和基因分析的系统和方法 | |
US20210202037A1 (en) | Systems and methods for genomic and genetic analysis | |
JP2023526441A (ja) | 複合遺伝子バリアントの検出およびフェージングのための方法およびシステム | |
Hassouneh | Is Next-Generation Sequencing Appropriate for the Clinic? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220301 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220524 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220729 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20220815 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221129 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20230309 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20230309 |
|
C11 | Written invitation by the commissioner to file amendments |
Free format text: JAPANESE INTERMEDIATE CODE: C11 Effective date: 20230328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230322 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230407 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20230411 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230613 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20231031 |