JP2007523600A - 多重配列変異体解析を用いる遺伝子診断 - Google Patents
多重配列変異体解析を用いる遺伝子診断 Download PDFInfo
- Publication number
- JP2007523600A JP2007523600A JP2006501390A JP2006501390A JP2007523600A JP 2007523600 A JP2007523600 A JP 2007523600A JP 2006501390 A JP2006501390 A JP 2006501390A JP 2006501390 A JP2006501390 A JP 2006501390A JP 2007523600 A JP2007523600 A JP 2007523600A
- Authority
- JP
- Japan
- Prior art keywords
- spc
- polymorphism
- polymorphisms
- spcs
- subset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
本発明は、あらゆる生物種における遺伝子変異の全体的な構造への新規な洞察を開示する。その構造は、特定の遺伝子座からの遺伝子変異体のデータセットを用いて明らかにすることができる。本発明は、特定の表現型形質との相関を検索するための遺伝的マーカーとして最もふさわしい変異のサブセットを定めるのに有用である。さらに、この洞察は、遺伝子型データを成分ハプロタイプ(実験的方法で導き出すには労力とコストがかかる)に変換するアルゴリズムおよびコンピュータプログラムの開発にも有用である。本発明は、(i)ゲノムワイド関連性研究、(ii)臨床in vitro診断、(iii)植物および動物の育種、ならびに(iv)微生物の同定といった分野において有用である。
本特許または出願書類は、カラーで作成された図面を少なくとも1つ含んでいる。カラーの図面を含む本特許または特許出願公報のコピーは、依頼があれば、出願人が提供するであろう。以下の図面は本明細書の一部を構成し、本発明の態様をさらに例示するために含められる。本発明は、ここに提示される特定の実施形態の詳細な説明とともに図面を参照することで、より一層理解しやすくなろう。
本発明は、遺伝子変異の構造を明らかにして、その基本的な構造に基づいて最もインフォーマティブなマーカーを選択するための方法、アルゴリズムおよびコンピュータプログラムに関するものである。前記方法は特定の遺伝子座からの遺伝子変異のどのようなデータセットにも適用することができる。1つの態様において、遺伝子変異の解析はハプロタイプデータに基づく。第2の態様においては、前記構造が二倍体遺伝子型データを用いて明らかにされ、それにより成分ハプロタイプを実験的にまたはコンピュータの使用により推論する必要がなくなる。第3の態様においては、本方法は、存在する配列変異の記録を提供するが、実際には全配列または特に可変位置の配列を提供しない実験的手法により、標的核酸のインテロゲーション(interrogation)から得られる、特徴づけされていない対立遺伝子変異に適用することができる。遺伝子変異の基本的構造はまた、二倍体遺伝子型データから成分ハプロタイプを推論するにも有用である。
本発明においては、配列多型の組織的特徴を同定するための新規なコンピュータ操作アプローチが開発された。このアプローチはハプロタイプブロックを同定する従来のアプローチとは異なるものである。本アプローチは、連鎖不平衡にある連続する多型のブロックを探し出すものではなく、統計的に有意なクラスタ化を示す配列多型のクラスタの存在を調べるものである。したがって、本発明のクラスタそれ自体は遺伝子に沿って連続した配列のクラスタである必要はない。本発明の方法によって明らかにされる構造は配列多型クラスタ(SPC)と呼ばれる。これらは同時に出現するマーカーのグループであり、すなわち、共遺伝するかまたは共分離するマーカーのセットである(農業分野では後者の用語がより一般的である)。そのようなマーカー部位の対立遺伝子は、組換え、遺伝子変換、または繰り返し起こる突然変異によって分離されることはなく、同一の頻度(完全なまたは完璧なLDとして記載しうる状態)を有している。この場合には、4つの可能性のある2部位ハプロタイプのうち2つのみをサンプルにおいて観察する。すなわち、一方のマーカーでの観察が他方のマーカーについての完全な情報を提供する。本質的に、SPCを同定するには、最初に(2対立遺伝子)部位の対同士の同時出現パーセントを求め、続いて閾値のストリンジェンシーを次第に低くして、その閾値を上回る同時出現を示すマーカー対立遺伝子を段階的に集めて組み立てる。
r2 = (PabPAB-PaBPAb)2/PaPbPAPB
観察されたハプロタイプおよびマーカー対立遺伝子頻度についての表記を、2x2関連性を表す表1に示す。P値はいくつかの基本的な不明のパラメーターのサンプル概算値にすぎないことに留意すべきである。対立遺伝子を命名する際の取り決めにより、PA > Pa > Pbである。
d = Pab/Pa - PAb/PA
さらに、有用であると分かった別の表現は、
C* = Pab - PaPb/Pa - PaPb
である。他の多くのLD尺度と同様に、上記式の分子はLewontinのD値 [Lewontin R.C., Genetics 49: 49-67, 1964]に等しい。しかし、Dを標準化するのに役立つ分母は、より一般的に用いられる|D'|尺度とは対照的に、4つの可能性のある2遺伝子座ハプロタイプのうち2つがサンプル中に観察される場合、その場合にのみ、C* = 1となる。C*の値は正(相引)または負(相反)でありうるが、この場合には絶対値が考慮されることに注意されたい。本明細書で一貫して用いられる式は、最も頻度の高いマイナー対立遺伝子の頻度(すなわち、Pa)に対する、マイナー対立遺伝子aおよびbからなるハプロタイプの頻度(Pab)の割合(%)を単純に測定する:
C = Pab/Pa
この式は、LDの尺度として明らかな欠点がある。その理由は、主に、観察されるハプロタイプの頻度Pabが、C*におけるように予想された頻度で相殺されないことにある。例えば、連鎖平衡が存在することを必ずしも意味しない状況であるPab = 0である場合は常に、C = 0である。反対に、完全な平衡が存在する場合、例えば4つ全てのハプロタイプが等しい頻度である場合、Cは0より大きいことがある。それにもかかわらず、上記式はその透明性(すなわち、同時出現%への直接的な関係)ゆえに実用的であり、適切な閾値と組み合わせて用いる場合に適している。
上記のコンピュータ演算アプローチを使って、配列多型の構造的特徴を特定することが可能である。連続した領域にわたる比較的高いマーカー密度を報告している研究について調べると、これらのゲノム領域の多くにおいては、存在する相当数のSNP(同様にindel)は1以上の配列多型クラスタ(SPC)(すなわち、実質的に絶対連鎖にある(言い換えれば、ペアワイズC値が1または1に近い)多型のセット)に組織化されるということが言える。いくつかの解析は、一般的に、各種SPCが、研究対象のサンプルに存在する全ての多型の60%〜95%を含みうることを示している。本発明者らは、遺伝子変異について十分なデータが利用可能な全ての種(ヒト、トウモロコシ、シロイヌナズナ、ショウジョウバエ、および酵母を含む)について、このことが真実であることを見出した。典型的には、SPC中の多型は非連続的であり、異なるSPCに属する多型が混在している。この知見は、ハプロタイプブロックの考え方とは異なるものである。ハプロタイプブロックの考え方では、基本的に組換えが起こっていない(すなわち、LewontinのD’尺度で高値)および/または限られたハプロタイプ多様性を示す、連続的な多型の領域が特定される [ハプロタイプブロックの種々の定義については、Wall & Pritchard, Nature Rev. Genet. 4: 587-597, 2003を参照]。
本発明の方法は、対象のゲノム領域もしくはゲノム全体のSPCマップに、ならびにそのようなSPCマップの構築法に関するものである。SPCマップはマーカーの最適セットの選択に用いることができ、該マーカーセットの全部もしくは一部は、その後の遺伝子型判定研究において(すなわち遺伝子型と表現型/形質の間の関連性を確立するために、またはin vitro診断目的のために)アッセイすることができる。SPCマップはまた、1つの種およびその近縁種(例えば経済上重要な農作物および家畜)での遺伝的多様性の全幅を明らかにすることができ、それによりマーカー支援育種(交配)の機会を提供することができる。SPCマップは、いかなる集団サンプルに由来する遺伝子変異データを用いても構築することができる。しかしながら、SPCマップは研究対象の集団および研究の深さ(すなわちサンプルサイズ)にある程度依存すること、およびマップはそれに応じて用いられるべきであることを理解することが重要である。例えば、特に臨床診断の場面においては、あるアッセイの価値が、そのアッセイのもとになるSPCマップの有効性および包括性と直接的に相関し、従って、該マップは該集団の代表的なかつ十分に大きなサンプルから構築されなければならないことが明らかであろう。
SPCマップは、特定の表現型との関連性の発見において価値のあるインフォーマティブなSNPの選択のための理論的で優れた根拠を与える。まず、これは情報を損失することなくアッセイされる必要がある変異体の数を減らす明確な方法に相当する。あるSPCの多型間の連鎖の程度が与えられると、単一の代表的なSNP(ctSNPと呼ぶ)が関連性をテストするために選択される一方で、該SPCの他の全ての多型は余剰であるとみなされる。この基本的な考えに加えて、クラスタ化する多型とクラスタ化しない多型間の差異は、非常に意義のあることと予想される。本発明者らは、SPCが近縁の種間で共有されており、従って種形成の事象に先行しているケースを同定した(実施例4参照)。この観察は、SPCが「非常に古い」という考え方を具現化するものであり、これらの構造が、広範な自然淘汰にかけられた変異であって、それらが特定の表現型に影響しているか連鎖しているために歴史を通じて残ってきた変異の、祖先におけるグループ分けを表していることを示唆している。従って、SPCは表現型に対する関連性の単位としてテストするのに最も意義のあるものとみなすことができる。これに対して、比較的低いストリンジェンシーでさえもクラスタ化しない多型は、それらがただ1つのSPCと関連して見出される場合には、おそらくもっと最近の突然変異であり、また、該多型が1より多いSPCと部分的に関連している場合には反復突然変異を表している可能性がある。これらの非クラスタ化多型の分子的起源がいかなるものであっても、それらは遺伝的マーカーとしてはほとんどまたは全く価値がないようである。従って、本発明のクラスタ化アプローチは、生物学的(医学的または農業的)に有意義な遺伝子変異の遺伝子診断のための新規な診断方法であると考えられる。より具体的には、本発明の方法は、優れた診断的価値を有するDNAマーカーを選択するのに非常に有用であると予想される。
別の実施形態では、本発明の方法は二倍体遺伝子型データを用いたSPCおよびctSNPの同定に関する。配列多型クラスタは、実際に、ハプロタイプデータセットの代わりに二倍体遺伝子型に本発明のアルゴリズムを直接適用することにより検出される可能性がある。これは、本質的にホモ接合性の近交系がすでに利用可能になっている、大部分の経済上重要な植物種および動物種に対してはあまり重要でない。しかしながら、SPCの検出にハプロタイプデータではなく遺伝子型データを用いることが可能なことは、ヒトの場合には重要な利点を示す。これはハプロタイプの決定(これは実験的に達成することが難しく、かつコンピュータ演算アプローチのみによる場合には誤りが起きやすい)を行う必要性を回避する。
補助的な、実験によるハプロタイプの解明を必要とせずに、二倍体遺伝子型データから出発して突然変異の段階を明確に定める方法も、本発明に包含される。二倍体遺伝子型データからのハプロタイプのin silico推定は、前述の図7および8によって例示されている。代表的な遺伝子型データ(既知のハプロタイプから組み立てられた)は、遺伝子型のデコンボリューションに用いられる原理を教示する目的を果たす。上記で考察したように、SPCはすでに遺伝子型データから直接確立された(図7C/Dおよび8C/D参照)。
本発明の新規のクラスタ化アプローチは、どんなタイプの配列もしくは遺伝子変異データにも適用可能である。ここで記載するケースでは、同じ種もしくは異なる(関連する)種のいずれかの、異なる個体に由来する特定の遺伝子座のDNA配列中に同定された配列変異に対してこれを適用することができる。あるいは、本方法は最新の遺伝子型判定法を用いて多数の個体中に見つかった強く連鎖したSNPのセットに対して適用することが可能である。一般的な意味で、本方法はある特定の遺伝子座に由来する遺伝子変異のいかなるデータセットにも用いることができ、例えば問題となっている標的核酸での遺伝的差異を反映するがそれを明確に規定することができない、実験的に観察された変異に用いることが可能である。種々の実験的アプローチが、異なる核酸解析のために利用可能であり、標的の全配列、特に多様な位置の配列を実際に決定することなく標的核酸の配列を調べるために利用可能である。例えば、何千種類かのユニークなオリゴヌクレオチド(フィーチャー(feature)と呼ばれる)を含むアレイに対する試験DNAサンプルおよび基準DNAサンプルのハイブリダイゼーションは、特定のフィーチャーのハイブリダイゼーション強度についての統計学的差異を明らかにしうる(そのような異なる強度のシグナルは、特定の基礎的な配列差異に割り当てられる必要はなく、かつそれ自体、本発明の方法に用いることができる)。多型部位の正確な配列が既知の場合[上記]には同様に、本方法は問題となっているハイブリダイゼーション差異(すなわちクラスタ化した差異)および偽性のハイブリダイゼーション差異(すなわちクラスタ化していない差異)の間の区別を可能にする。ハイブリダイゼーションアプローチの実現可能性が報告されている:Winzelerら, Science 281: 1194-1197, 1998;Winzelerら, Genetics 163: 79- 89, 2003;Borewitzら, Genome Res. 13: 513-523, 2003。元々は発現解析のために設計された25 merのオリゴヌクレオチドを含むアレイが、総ゲノムDNAの直接ハイブリダイゼーションによって、対立遺伝子多型(単一フィーチャー多型もしくはSFPと呼ばれる)の検出に用いられてきた。SFPは酵母中で、および同様により複雑な120Mbのシロイヌナズナゲノム中で見出されうる。この方法の主な利点は、これが、変異検出アレイ[VDA;Halushkaら, Nat. Genet. 22: 239-247, 1999;Patilら, Science 294: 1719-1723, 2001]よりもはるかに少数のフィーチャーしか用いないことである。VDAは染色体上の各々全ての塩基対を網羅するので、膨大な数のフィーチャー(それぞれの塩基対に対して8個)を必要とし、このことがこのアプローチを費用のかかるものにしている。アレイハイブリダイゼーションは多型発見ツールであり、かつルーチンに行われる遺伝子型判定方法でもある。SFPを完全に特徴づける必要はなく、ならびにそれらを同じプラットホーム上の異なるアレイ設計もしくは全く異なる遺伝子型判定の方法論を用いた専用のアッセイに変換する必要もない。
本発明の方法は、2つの異なる適用分野において特に有用である。すなわち、ヒト遺伝学から農業および家畜におけるマーカー利用育種にわたる広範囲の領域での遺伝的解析および診断、ならびにほぼ全てのタイプの生物の遺伝的同一性決定に対して有用である。
本発明者らは、SPCが規定されるゲノム(領域)のマップを構築することの実現可能性および望ましさを示してきた。このSPCマップは、共存する対立遺伝子(例えば共分離する多型)のセットを含む。SPCマップ中には、1以上のSPCがある可能性があり、それぞれのSPCはその特定のSPCに特徴的な多型によりさらに特定されうる。そのようなSPCマップを用いると、配列変異は比較的少数のSNPによりとらえることができる。もちろん、ヒト、動物もしくは植物集団におけるSPCマップの包括的な記述は、高密度の多型マーカーを要求しうる。ヒトおよびいくつかの他の(モデル)生物種のゲノムにわたって、急速に多くの多型が利用可能になってきており、これらのデータは本明細書中に記載したSPCマップを作成するのに利用されうる。しかしながら、ある状況においては、同じかまたは異なる集団のさらなるサンプル中で、新しいSNPを同定することおよび/または既知のSNPについて遺伝子型判定を行うことが望まれる可能性がある。これは当該技術分野で公知の方法を用いて容易に達成されうる。
多型情報は、本発明のマップを作成するために、いかなるサンプル集団からでも得ることができる。「情報」は、本明細書中では、サンプル集団に関して、多型の頻度および場所に関するデータ、ならびに他のデータ(例えば遺伝子型研究、ならびに本明細書中に記載の本発明の方法およびマップ中で有用なバックグラウンドおよび表現型(例えば健康状態)の情報)を包含すると意図される。いくつかのケースでは、多様な(複数民族の)集団サンプルを利用することが望まれうる。そのようなサンプルは、(民族的な)起源についてのデータが全く知られていない、総ランダムサンプルを含みうる。一方で、そのようなサンプルは、異なる(民族的)起源を有する2以上の群に由来するサンプルを含みうる。そのような多様な(複数民族の)サンプルは、3、4、5、6かそれ以上の群に由来するサンプルを含みうる。他のケースでは、均一な(単一民族の)サンプルを利用することが望まれる可能性があり、そのようなサンプルでは、集団の全てのメンバーは同じ(民族的)起源を有する。民族性は、ヒトのケースを指し、例えばヨーロッパ、アジア、アフリカ、あるいはあらゆる他の民族的分類またはそれらのサブセットもしくは組み合わせでありうる。植物もしくは動物の遺伝的調査の場合には、集団は、繁殖中の生殖形質(germplasm)、特定の類、品種、系統、登録種、在来種、遺伝子導入系統、野生種またはそれらのいかなるサブセットもしくは組み合わせも含みうる。集団サンプルは、どのようなサイズでもよく、例えば5、10、15、20、25、30、35、40、50、75、100、125、150またはそれ以上の個体である。
多型は、解析下にある個体に由来する標的核酸から検出可能である。ヒトゲノムDNAのアッセイのためには、事実上どんな生物学的サンプルも用いることができる。例えば、便利な組織サンプルとしては全血、精液、唾液、涙液、尿、糞便材料、汗、口腔内組織、皮膚および毛髪を含み、ゲノムDNAをアッセイするためにすすんで用いられている。植物の場合には、あらゆる部位(例えば、葉、根、苗木)をゲノムDNA調製に用いることができる。cDNAもしくはmRNAのアッセイのためには、サンプルは標的核酸が発現している器官もしくは組織から得なければならない。
問題となっている多型がすでに特徴づけされているか否かによって、2つの異なるタイプの解析がある。最初の解析のタイプは、時にde novo特徴づけと呼ばれ、示差的核酸解析を利用する。この解析では、変異点、すなわち多型部位を特定するために異なる個体中の標的配列を比較する。最も大きな多様性を示した個体の群を解析することにより、対立遺伝子の特徴的パターンを特定することができ、集団中のそのような対立遺伝子の頻度が決定される。さらなる対立遺伝子頻度は、地理、人種もしくは性別のような基準により特徴づけられるサブ集団について決定することができる。2番目の解析のタイプは、特徴づけられた多型のどの様式が、試験下にある個体中に存在するかを決定する。配列に基づく遺伝子型判定のための種々の好適な方法があるが、これらについては後述する。
SNP解析のための対立遺伝子特異的プローブの設計および使用は、例えばSaikiら, Nature 324: 163 166 (1986);Dattagupta, EP 235,726;Saiki, WO 89/11548により記載されている。対立遺伝子特異的プローブは、ある個体に由来する標的DNAのセグメントにはハイブリダイズするが、別の個体に由来する対応するセグメントにはハイブリダイズしないように設計することができ、これはその2個体に由来するそれぞれのセグメント中の異なる多型様式の存在によるものである。ハイブリダイゼーション条件は、対立遺伝子間でハイブリダイゼーション強度に顕著な差異があるように、十分ストリンジェントであるべきであり、好ましくはプローブが対立遺伝子の一方にのみハイブリダイズするように選択されるべきである。いくつかのプローブは、多型部位が中央の位置(例えば15 mer中の7番目の位置、16 mer中の8番目か9番目のいずれかの位置)にそろうように、標的DNAのセグメントにハイブリダイズするべく設計される。このプローブ設計は、異なる対立遺伝子様式間の、ハイブリダイゼーションにおける良好な識別を可能にする。
SNPはまた、核酸アレイに対するハイブリダイゼーションによっても同定することができる(DNAチップ解析)。あらかじめ特徴づけされた多型の変異形態の検出のために最適化されたサブアレイも用いることができる。そのようなサブアレイは、第二の参照配列に相補的であるように設計されたプローブを含み、該参照配列は第一の参照配列の対立遺伝子変異体である。この第二の群(またはさらなる群)を含めることは、一次参照配列の短い部分配列(この配列には、複数の突然変異がプローブの長さと等しい短い距離の中に存在すると予想される(すなわち9〜21塩基中に2以上の突然変異))を解析するのに特に有用である。そのようなサブアレイを作製するための方法および構成は当業者に周知であり、例えば米国特許第6,368,799号(遺伝子多型を検出して、プローブアレイを用いて対立遺伝子発現をモニタリングする方法を記載している)を参照のこと。
本発明に用いるためのいかなるサンプルの配列の直接解析も、ジデオキシ鎖ターミネーション法またはマクサムギルバート法のいずれかを用いて達成することができる(Sambrookら, Molecular Cloning, A Laboratory Manual (第2版, CSHP, New York 1989);Zyskindら, Recombinant DNA Laboratory Manuals Lead. Press, 1988参照)。
直接配列決定に用いるための広く認識された他の選択肢は、ハイブリダイゼーションによる配列決定(SBH)の使用であり、この方法により、標的核酸の配列が、標的核酸配列がハイブリダイズするプローブの蓄積物から再構築される。ハイブリダイゼーションによる配列決定のための方法および構成は例えば以下に記載されている:米国特許第6,689,563号;同第6,670133号;同第6,451,996号;同第6,399,364号;同第6, 284,460号;同第6,007,987号;同第5,552,270号。これらの文献のそれぞれは、SBH解析のためのSBHチップの作成および使用のための方法および構成について教示を与えるものとして、参照により本明細書中に組み入れられる。
ポリメラーゼ連鎖反応を用いてつくられた増幅産物は、変性勾配ゲル電気泳動を用いて解析することができる。異なる対立遺伝子は、配列依存的な異なる融解特性および電気泳動移動度に基づいて特定することができる。Erlich編、「PCR Technology, Principles and Applications for DNA Amplification」、(W. H. Freeman and Co, New York, 1992)、第7章参照。
標的配列の対立遺伝子は、一本鎖立体構造多型解析を用いて識別することができ、これは一本鎖PCR産物の電気泳動移動度における変化により、塩基の差異を同定するものであって、Oritaら, Proc. Natl. Acad. Sci. USA 86, 2766-2770 (1989) に記載されているものと同様である。増幅されたPCR産物は上述のように生成され、加熱されるか、他の方法により変性されて、一本鎖増幅産物を形成することができる。一本鎖核酸は、再フォールディングするかまたは塩基配列に部分的に依存した二次構造を形成しうる。一本鎖増幅産物の異なる電気泳動移動性は、標的配列の対立遺伝子間の塩基配列差異に関連づけることができる。
プライマーは目的SNP部位の上流に特異的にアニールし、その後好適な検出システム上での対立遺伝子特異的伸長産物の検出の前に、適当なヌクレオチド三リン酸混合物の添加により伸長することができる。異なる染料で標識されたジデオキシヌクレオチド三リン酸を用いれば、単一塩基伸長(SBE)産物を、蛍光シークエンサー(ゲルまたはキャピラリーのいずれかに基づく)を用いた電気泳動によって解析することができる。従来の検出方法(例えば免疫化学アッセイ)もまた、SBE産物を検出するのに用いることができる。あるいはまた、マトリックス支援レーザー脱離イオン化飛行時間型質量分析計(MALDI-TOF-MS)を、いかなる標識タグも必要とせず、それぞれの分子量によって高い精度で伸長産物およびプライマーを分離するのに用いることができる[Stormら, Methods Mol. Biol. 212: 241-262, 2003]。ピロシークエンシング(pyrosequencing)[Nyrenら, Anal. Biochem. 208: 171-175, 1993]では、相補鎖合成はジデオキシヌクレオチドの非存在下で行われる。それぞれのdNTP基質は独立に添加され、ピロリン酸(ATPに変換されてルシフェラーゼ反応にエネルギーを与える)の放出によりモニターされる。dNTPは、取り込まれなければ、光の放出をもたらすことなく分解される。反応が連続して続き、変異型の配列に特異的である。
オリゴヌクレオチドライゲーションアッセイ(OLA)のために、2種類のプライマーを、問題の相補的標的DNA配列にハイブリダイズしたときに互いに直接隣り合うように設計する。この2つの隣接するプライマーは、それらがライゲーションによって共有的に結合するように、間隔を空けずに、ミスマッチもなく、互いに直接隣り合っていなければならない。これにより、SNPが存在するかどうかが区別される。多くの他の標識および検出方法があり、ELISA [Nickersonら, Proc. Natl. Acad. Sci USA 87: 8923-8927, 1990]、または電気泳動および蛍光シークエンサーでの検出が挙げられる。
このアッセイ(インベーダー(Invader)と呼ばれる)は、構造特異的5’ヌクレーゼ(もしくはflapエンドヌクレアーゼ)を、2つの段階的反応のそれぞれにおいて配列特異的な構造を切断するために用いる。2つの合成オリゴヌクレオチドプローブが標的に結合するときに、切断構造が形成される。切断されたプローブはその後、染料標識蛍光共鳴エネルギー移動(FRET)プローブが関わる第二の一般インベーダー反応に加わる。このFRETプローブの切断は、シグナルを生み出し、このシグナルは蛍光マイクロタイタープレートリーダーにより容易に解析できる。2つの段階的反応は、シグナルを顕著に増幅し、前もって標的を増幅することなしに、ゲノムDNAからの直接的な単一塩基変異の同定を可能にする[Forsら Pharmacogenomics 1: 219-229, 2000]。
本発明のゲノムマップおよび方法は、いくつかのやり方ですぐにも用いることができる。配列多型を有する不連続な領域のマッピングは、例えば、特定のSPCと関連づけられる表現型の同定、特定の表現型(例えば疾患)に関与する遺伝子座の位置の特定および、(疾患)表現型に対するin vitro診断アッセイの開発を可能にする。
本実施例は、特定の種の多数の個体において配列決定された完全な遺伝子座のSPCマップを作成するために本発明の方法が使用可能であるという発想の実証を提供する。特定の遺伝子の遺伝的多様性に関する多数の研究が、広範な植物および動物種において行われており、これらの配列はGenBank(http://www.ncbi.nlm.nih.gov)から公に入手可能である。これらの研究の大半においては、1000bp未満の比較的短い遺伝子セグメントが配列決定されており、完全な遺伝子が配列決定されているのは、ほんの少数の研究に過ぎない。本発明の様々な態様を例示するために、入手可能な完全またはほぼ完全な遺伝子配列(GenBankにおいて入手可能なもの)からトウモロコシ由来のshrunken2(sh2)遺伝子座を選択した。32個のトウモロコシ品種(Zea mays subsp. mays)からの公開shrunken2遺伝子座配列は、sh2遺伝子のプロモーターおよびコード領域を含有する7050bpの領域を含む[Whittら, Proc. Natl. Acad. Sci. USA 99: 12959-12962, 2002]。
本実施例は、広範な組換えが生じている完全な遺伝子のSPCマップを作成するために本発明の方法が使用可能であるという発想の実証を提供する。本実施例は、本発明の他の態様を例示するために、トウモロコシ由来のshrunken1(sh1)遺伝子座における多型部位の解析を記載する。32個のトウモロコシ品種(Zea mays subsp. mays)からの公開shrunken1遺伝子座配列は、sh1遺伝子のプロモーターおよびコード領域を含有する6590bpの領域を含む[Whittら, Proc. Natl. Acad. Sci. USA 99: 12959-12962, 2002]。
本実施例は、いくつかの過去の組換え事象が生じている遺伝子座のSPCマップを作成するために本発明の方法が使用可能であるという発想の実証を提供する。本実施例は、本発明の他の態様を例示するために、トウモロコシのY1フィトエンシンターゼ遺伝子座内の多型の解析を記載する。Y1フィトエンシンターゼ遺伝子は胚乳色に関与しており、41個の橙色/黄色胚乳系統および32個の白色胚乳系統を含む75個のトウモロコシ近交系において配列決定されている[Palaisaら, The Plant cell 15: 1795-1806, 2003]。
本実施例は、密接に関連した種々の種からの個体において配列決定されている遺伝子座の種間SPCマップを作成するために本発明の方法が使用可能であるという発想の実証を提供する。本実施例は、本発明の他の態様を例示するために、トウモロコシのglobulin(グロブリン)1遺伝子座内の多型部位の解析を記載する。本発明の方法により検出されたSPCが関連種の分化の前に生じた可能性があり、したがって非常に古いとみなされうるという証拠を記載する。
本実施例は、多数の遺伝子をカバーする全ゲノムセグメントのSPCマップを構築するために本発明の方法が使用可能であるという発想の実証を提供する。実施例1〜3では、本発明の方法での遺伝子座の解析が、該遺伝子座の組換え履歴に応じて種々のタイプのSPCマップを与えうることを例示した。本実施例は、ゲノム領域全体でサンプリングされた多型データを使用することにより、多数の遺伝子を含むゲノム領域に関してもSPCマップが作成されうるという発想の実証を提供するために、シロイヌナズナ(Arabidopsis thaliana)のFRI遺伝子座の周囲のゲノム領域における多型部位の解析を記載する。広く使用されるようになってきた、ゲノム領域における対立遺伝子多様性を評価するための1つのアプローチは、対象のゲノム領域全体の種々の位置に由来する短いセグメントの配列決定(500〜1000bp、典型的な配列決定実施の長さ)を含む。このタイプのいくつかの研究が最近公開されており、これらの1つを本実施例において採用した。
本実施例は、ゲノムワイド遺伝的多様性データからの全ゲノムのSPCマップを構築するために本発明の方法が使用可能であるという発想、およびSPCマップから、ゲノムワイド関連研究のためにctSNPマーカーが誘導されうるという実証を提供する。ゲノムワイド規模で遺伝的多様性を調査するためのいくつかのアプローチは現在開発されつつあり、それらは、種を代表する個体の集団に由来するゲノムDNAから増幅された500〜1000bpの短い断片を配列決定することを含む。1つのアプローチにおいては、ゲノム沿いに一定間隔(20〜50kb)でアンプリコンを選択する。一方、他のアプローチは既知遺伝子の領域の系統的配列決定に基づくものである。本実施例は、シロイヌナズナ(Arabidopsis thaliana)の1番染色体からの増幅断片のセットにおいて同定された多型部位の解析を記載する。
本実施例は、遺伝子のSPCマップを構築するため、及び遺伝的解析のためのタグSNPを選択するために、相が特定できない(unphased)二倍体遺伝子型データに関して本発明の方法が使用可能であるという発想の実証を提供する。本実施例はまた、該相が特定できない二倍体遺伝子型からハプロタイプを推測するために本発明の方法が使用可能であるという発想の実証を提供する。本実施例は、本発明の他の態様を例示するために、ヒトCYP4A11(シトクロムP450、ファミリー4、サブファミリーA、ポリペプチド11)遺伝子における多型部位の解析を記載する。本実施例において解析した遺伝子変異データはUW-FHCRC Variation Discovery Resource [SeattleSNPs; http://pga.gs.washington.edu/]により得た。UW-FHCRC Variation Discovery Resource(SeattleSNPs)はUniversity of WashingtonとFred Hutchinson Cancer Research Centerとの協力によるものであり、National Heart, Lung, and Blood Institute (NHLBI)により資金提供されたPrograms for Genomic Applications (PGAs)の1つである。SeattleSNPsの目標は、遺伝子内の単一ヌクレオチド配列相違とヒトにおける炎症応答を引き起こす経路との関連を見出しモデル化することである。
C-13に従属していることを示唆しているが、SPC-9およびSCP-12が互いに独立関係にあるのか従属関係にあるのかを、サンプルD015における1回の観察から確実に結論づけることはできない。最後に、SPC-11は、SPC-3およびSPC-5をも有するマイナーメタタイプにおいて、1回観察され(サンプルD010)、このことは、SPC-11がそれらのうちの1つに従属しているに違いないことを示している。SPC-12がSPC-9に従属していることはないという補足的推測とは別に、クラスIIIメタタイプの解析は前記従属性を確かめるものであるに過ぎない。メジャーメタタイプはインフォーマティブでないため、一般に、クラスIIIメタタイプは追加的な情報を提供しない。したがって、SPC 6、8および10の従属性は1つのサンプルで観察されたに過ぎず、確立され得ない。例えば、マイナーメタタイプD036-1はSPC 2、3、10および13を有し、そのメジャーメタタイプはSPC-0を有する。SPC-2、SPC-3およびSPC-13の従属性の序列を知ることとは別に、SPC-10を明確に特定することはできない。SPC-10はSPC-3に従属している可能性があるが、SPC-0に従属している可能性もあるであろう。結論としては、メタタイプの解析は、CYP4A11遺伝子において同定された13個のSPCのうち、それらの9個の従属性が、メタタイプにおいて観察されたSPCパターンからの論理的推論により確立されうることを示している。図15Cは、CYP4A11遺伝子の9個のSPCの間で確立された階層的関係のネットワークの視覚的表示を示す。
本実施例は、複雑な遺伝子座のSPCマップを構築するために、および遺伝的解析用の診断マーカーの開発のためのctSNPを選択するために、相が特定できない(unphased)二倍体遺伝子型データ上で本発明の方法が使用可能であるという発想の更なる実証を提供する。本実施例はまた、複雑な組換えパターンを示すヒトゲノム中の遺伝子座を解析するために本発明の方法が使用可能であるという発想の実証を提供する。本実施例は、ヒト主要組織適合性複合体(MHC)遺伝子座における多型部位の解析を記載する。MHC遺伝子座は複雑な遺伝子変異パターンを示すことが知られており、多数のヒト疾患におけるその重要性のため、現在、精力的な遺伝的研究の主要対象となっている。MHC遺伝子座は、組換えホットスポットの存在が十分に実証されているヒトゲノム内の少数の遺伝子座の1つでもあり、本実施例は、種々の組換えホットスポットがかなりの精度でマッピングされているMHCのクラスII領域の216kbのセグメントを含むものである[Jeffreysら, Nat. Genet. 29: 217-222, 2001]。
(unphased)二倍体遺伝子型データから容易に得られうるという明らかな例示を示す。
本実施例は、ヒトゲノムのSPCマップを構築するために相が特定できない(unphased)二倍体遺伝子型データ上で本発明の方法が使用可能であるという発想、および該SPCマップがゲノムワイド遺伝的関連研究のための診断マーカーとしてのctSNPの選択に特に有用であるという発想の更なる実証を提供する。本実施例は、本発明の他の態様を例示するために、国際ヒトHapMapプロジェクト(The International HapMap Consortium, Nature 426: 789-796, 2003)において最近得られた遺伝子変異データの解析を記載する。国際HapMapプロジェクトの目的は、アフリカ、アジアおよびヨーロッパの地域からの祖先を有する集団からのDNAサンプルにおいて配列変異体、それらの頻度およびそれらの間の相関性を特徴づけることにより、ヒトゲノム内のDNA配列変異の共通のパターンを決定することである。このプロジェクトは、ゲノム内の任意の機能的候補遺伝子に容易に適用される、あるいは家族に基づく連鎖解析により示唆された任意の領域に容易に適用される、あるいは最終的には疾患危険因子の精査のために全ゲノムに容易に適用される間接的関連アプローチを可能にする手段を提供するであろう。
本実施例は、本発明の方法で構築されたSPCマップと、Dalyら[Dalyら, Nat. Genet. 29: 229-232, 2001; Dalyら, 米国特許出願2003/0170665 A1]により提示されているアプローチで得られたハプロタイプブロックとの間の相違の例示を記載する。本実施例はまた、本発明の方法で選択されたタグSNP(ctSNP)と、ハプロタイプブロック法で選択されたハプロタイプタグSNP(htSNP)との間の相違の例示を記載する。本実施例は、ヒトゲノムにおけるハプロタイプブロックの存在を確認するために使用された染色体5q31上の500kbセグメントにおける多型部位の再解析を記載する[Dalyら, Nat. Genet. 29: 229-232, 2001]。記載されている解析の結果は、本発明の方法で選択されたctSNPが、ゲノムワイド遺伝的関連研究および遺伝的解析全般のための優れた診断マーカーであるという証拠を提供するものである。
本実施例は、一定の配列相違以外の遺伝子変異データ上で本発明の方法が使用可能であり、このようにして得られたSPCマップが遺伝子変異のゲノムワイドパターンの検査に特に有用であるという発想の実証を提供する。本実施例は、高密度オリゴヌクレオチドアレイを使用して得られた単一フィーチャー多型(single-feature polymorphism)(SFP)に関する発想のこの実証を提供するものであり、SPCマップから誘導された選択されたタグSFPを扱う診断用マイクロアレイを設計するために本発明の方法が使用可能であることを示す。本実施例は、高密度オリゴヌクレオチドアレイを使用して同定された酵母の一般的実験用株[Winzelerら, Genetics. 163: 79-89, 2003]の1番染色体内の多型部位解析を記載する。本研究においては、14の異なる酵母株において11,115個の単一フィーチャー多型(SFP)を見出すために、およびこの酵母集団における遺伝子変異のゲノムワイド分布を評価するために、酵母ゲノム配列に由来する285,156個の異なる25merを含有するAffymetrix S98オリゴヌクレオチドアレイ(Affymetrix Inc, Santa Clara, CA)を使用した。短い25merオリゴヌクレオチドを使用する高密度オリゴヌクレオチドアレイは、多型を見出すのに特に有用である。なぜなら、ヌクレオチド変化を検出するために、ハイブリダイゼーションシグナルの強度を用いることが可能だからである。アレイ上の1つの単一オリゴヌクレオチド(フィーチャー(feature)と称される)に対するディファレンシャルハイブリダイゼーションにより検出された多型は「単一フィーチャー多型(single-feature polymorphism)」(SFP)と称される。したがって、この長さの多数のプローブを保持するオリゴヌクレオチドアレイにより、ゲノム配列の相当な割合を検査(interrogate)することが可能であり、2つのゲノム配列間の対立遺伝子変異のおおよその位置を確認することが可能である。したがって、このタイプのマイクロアレイは、遺伝子変異の発見のための、及びゲノムワイド規模での将来の診断用遺伝子型判定のための強力な基盤を提供する。
本実施例は、細菌の多遺伝子座配列タイピング(multilocus sequence typing)(MLST)で得られた遺伝子変異データ上で本発明の方法が使用可能であり、このようにして得られたSPCマップが細菌の遺伝的同一性を決定するために特に有用であるという発想の実証を提供する。多遺伝子座配列タイピング(MLST)は、細菌の特徴づけのための標準的な技術の1つに急速になりつつある。この技術においては、ハウスキーピング遺伝子をコードする遺伝子座からの〜500bpのヌクレオチド配列の伸長を解析することにより、複数のゲノム位置からの中立遺伝子変異を示す。配列データは実験室間で容易に比較され、電子的保存および配布に適している。MLSTに関するデータおよびプロトコールの保存および交換のためのワールド・ワイド・ウェブサイトが確立されている(http://mlst.zoo.ox.ac.uk)。本実施例は、グラム陰性細菌Campylobacter jejuniの研究[Dingleら, J. Clin. Microbiol. 39:14-23, 2001]からのMLSTデータのいくつかについての解析を記載する。
Claims (48)
b.該核酸配列における複数の多型を同定し、
c.1以上のSPCを同定する、
ステップを含んでなり、各SPCが該核酸配列からの多型のサブセットを含み、該サブセットの多型が該サブセットのそれぞれ他の多型と同時発生していることを特徴とする、対象のゲノム領域のSPCマップの作成方法。
b.該相が特定できない二倍体遺伝子型において見出されるメジャーおよびマイナーメタタイプを決定し、
c.1以上のSPCを同定する、
ステップを含んでなり、各SPCが該メタタイプからの多型のサブセットを含み、該サブセットの多型が該サブセットのそれぞれ他の多型と同時発生していることを特徴とする、相が特定できない二倍体遺伝子型からの対象のゲノム領域のSPCマップの作成方法。
b.該SPCマップにおいてユニークSPCを同定する少なくとも1つのクラスタタグ多型を選択し、
c.対象のゲノム領域の遺伝子型判定研究において使用するための十分な数のクラスタタグ多型を選択する、
ステップを含んでなる、遺伝子型判定において使用するための対象のゲノム領域から1以上の多型を選択する方法。
b.該クラスタタグ多型を評価して、形質または表現型と少なくとも1つのクラスタタグ多型との間の関連性を同定する、
ことを含んでなり、該関連性の同定が、該形質または表現型のマーカーとして該クラスタタグ多型を同定することを特徴とする、形質または表現型に関するマーカーを同定する方法。
b.クラスタタグ多型のセットを同定し、ここで、クラスタタグ多型のセットの各メンバーは、前記の複数のSPCにおけるユニークSPCを同定し、
c.クラスタタグ多型のセットを評価して、形質または表現型と少なくとも1つのクラスタタグ多型との間の関連性を同定する、
ことを含んでなり、該クラスタタグ多型と該形質または表現型との間の関連性の同定が該遺伝子の位置を示すことを特徴とする、形質または表現型に関連した遺伝子の位置を同定する方法。
b.被験体から標的核酸サンプルを得、
c.該標的核酸サンプルにおける該形質または表現型に関するマーカーの存在を判定する、
ことを含んでなり、該標的核酸における該マーカーの存在が、該被験体が該形質または表現型を有することを示すことを特徴とする、被験体における形質または表現型のin vitro診断のための方法。
b.請求項13記載の方法により、該ゲノム領域に関する十分な数のクラスタタグ多型を選択し、
c.同定すべき被験体からのゲノム領域の標的核酸を得、
d.同定すべき被験体のゲノム領域のクラスタタグ多型の遺伝子型を判定し、
e.該クラスタタグ多型の遺伝子型を該基準SPCマップと比較して、対象の被験体の遺伝的同一性を決定する、
ことを含んでなる、被験体の遺伝的同一性を決定するための方法。
b.該SPCマップからSPC-ハプロタイプを決定し、ここで、各SPC-ハプロタイプはゲノム領域からのSPCのサブセットを含み、該サブセットのSPC群は同時発生しており、
c.試験被験体のSPCを、該SPCマップから決定したSPC-ハプロタイプと比較することにより、該被験体のSPC-ハプロタイプを同定する、
ことを含んでなる、被験体の対象のゲノム領域の相が特定できない二倍体遺伝子型からのSPC-ハプロタイプを決定するための方法。
複数の被験体から対象のゲノム領域の核酸配列を得ること、
該核酸配列における複数の多型を同定すること、
1以上のSPCを同定すること、
を該マシンに行わせるインストラクションを記憶しているマシンアクセス可能媒体を含んでなり、各SPCが該核酸配列からの多型のサブセットを含み、該サブセットの多型が該サブセットのそれぞれ他の多型と同時発生していることを特徴とする、物品。
複数の被験体から対象のゲノム領域の相が特定できない(unphased)二倍体遺伝子型のセットを得ること、
該相が特定できない二倍体遺伝子型のセットにおいて見出されるメジャーおよびマイナーメタタイプを決定すること、
1以上のSPCを同定すること、
を該マシンに行わせるインストラクションを記憶しているマシンアクセス可能媒体を含んでなり、各SPCが該メタタイプからの多型のサブセットを含み、該サブセットの多型が該サブセットのそれぞれ他の多型と同時発生していることを特徴とする、物品。
対象のゲノム領域のSPCマップを得ること、
該SPCマップにおいてユニークSPCを同定する少なくとも1つのクラスタタグ多型を選択すること、
対象のゲノム領域の遺伝子型判定研究において使用するための十分な数のクラスタタグ多型を選択すること、
を該マシンに行わせるインストラクションを記憶しているマシンアクセス可能媒体を含んでなる物品。
遺伝子型判定において使用するための対象のゲノム領域からの十分な数のクラスタタグ多型を得ること、
該クラスタタグ多型を評価して、形質または表現型と少なくとも1つのクラスタタグ多型との間の関連性を同定すること、
を該マシンに行わせるインストラクションを記憶しているマシンアクセス可能媒体を含んでなり、該関連性の同定が、該形質または表現型に関するマーカーとしてクラスタタグ多型を同定することを特徴とする、物品。
形質または表現型に関連した所与のゲノム領域において同定された複数のSPCを同定すること、ここで、各SPCは該ゲノム領域からの多型のサブセットを含み、該サブセットの多型は該サブセットのそれぞれ他の多型に関連していること、
クラスタタグ多型のセットを同定すること、ここで、クラスタタグ多型のセットの各メンバーは、前記の複数のSPCにおけるユニークSPCを同定すること、
クラスタタグ多型のセットを評価して、形質または表現型と少なくとも1つのクラスタタグ多型との間の関連性を同定すること、
を該マシンに行わせるインストラクションを記憶しているマシンアクセス可能媒体を含んでなり、該クラスタタグ多型と該形質または表現型との間の関連性の同定が該遺伝子の位置を示すことを特徴とする、物品。
被験体における形質または表現型に関するマーカーを得ること、
該被験体から標的核酸サンプルを得ること、
該標的核酸サンプルにおける該形質または表現型に関するマーカーの存在を判定すること、
を該マシンに行わせるインストラクションを記憶しているマシンアクセス可能媒体を含んでなり、該標的核酸における該マーカーの存在が、該被験体が該形質または表現型を有することを示すことを特徴とする、物品。
複数の被験体から1以上のゲノム領域の基準SPCマップを得ること、
該ゲノム領域に関する十分な数のクラスタタグ多型を選択すること、
同定すべき被験体からのゲノム領域の標的核酸を得ること、
同定すべき被験体のゲノム領域のクラスタタグ多型の遺伝子型を判定すること、
該クラスタタグ多型の遺伝子型を該基準SPCマップと比較して、対象の被験体の遺伝的同一性を決定すること、
を該マシンに行わせるインストラクションを記憶しているマシンアクセス可能媒体を含んでなる物品。
対象のゲノム領域のSPCマップを得ること、
該SPCマップからSPC-ハプロタイプを決定すること、ここで、各SPC-ハプロタイプはゲノム領域からのSPCのサブセットを含み、該サブセットのSPC群は同時発生していること、
試験対象のSPCを、該SPCマップから決定したSPC-ハプロタイプと比較することにより、該対象のSPC-ハプロタイプを同定すること、
を該マシンに行わせるインストラクションを記憶しているマシンアクセス可能媒体を含んでなる物品。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03447042 | 2003-02-27 | ||
PCT/BE2004/000027 WO2004076611A2 (en) | 2003-02-27 | 2004-02-27 | Genetic diagnosis using multiple sequence variant analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007523600A true JP2007523600A (ja) | 2007-08-23 |
Family
ID=32921641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006501390A Pending JP2007523600A (ja) | 2003-02-27 | 2004-02-27 | 多重配列変異体解析を用いる遺伝子診断 |
Country Status (6)
Country | Link |
---|---|
US (6) | US20050026173A1 (ja) |
EP (1) | EP1615989B1 (ja) |
JP (1) | JP2007523600A (ja) |
AU (2) | AU2004215928B2 (ja) |
CA (1) | CA2517478A1 (ja) |
WO (2) | WO2004076611A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007133476A (ja) * | 2005-11-08 | 2007-05-31 | Hitachi Software Eng Co Ltd | 遺伝子解析のためのデータ入力支援システム |
JP2017184742A (ja) * | 2011-04-14 | 2017-10-12 | コンプリート・ジェノミックス・インコーポレイテッド | 複合核酸配列データの処理および解析 |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060257888A1 (en) * | 2003-02-27 | 2006-11-16 | Methexis Genomics, N.V. | Genetic diagnosis using multiple sequence variant analysis |
US20050026173A1 (en) | 2003-02-27 | 2005-02-03 | Methexis Genomics, N.V. | Genetic diagnosis using multiple sequence variant analysis combined with mass spectrometry |
EP1848819A4 (en) * | 2005-02-16 | 2010-01-06 | Genetic Technologies Ltd | METHOD FOR GENETIC ANALYSIS WITH AMPLIFICATION OF COMPLEMENTARY DUPLICATES |
US20080163824A1 (en) * | 2006-09-01 | 2008-07-10 | Innovative Dairy Products Pty Ltd, An Australian Company, Acn 098 382 784 | Whole genome based genetic evaluation and selection process |
US7953550B1 (en) | 2007-01-04 | 2011-05-31 | Ag Sense, L.L.C. | Center pivot irrigation system position sensing system |
US7844609B2 (en) | 2007-03-16 | 2010-11-30 | Expanse Networks, Inc. | Attribute combination discovery |
EP2145180B1 (en) * | 2007-04-13 | 2013-12-04 | Sequenom, Inc. | Comparative sequence analysis processes and systems |
US7964843B2 (en) | 2008-07-18 | 2011-06-21 | The George Washington University | Three-dimensional molecular imaging by infrared laser ablation electrospray ionization mass spectrometry |
US8901487B2 (en) | 2007-07-20 | 2014-12-02 | George Washington University | Subcellular analysis by laser ablation electrospray ionization mass spectrometry |
US8067730B2 (en) | 2007-07-20 | 2011-11-29 | The George Washington University | Laser ablation electrospray ionization (LAESI) for atmospheric pressure, In vivo, and imaging mass spectrometry |
US20090049856A1 (en) * | 2007-08-20 | 2009-02-26 | Honeywell International Inc. | Working fluid of a blend of 1,1,1,3,3-pentafluoropane, 1,1,1,2,3,3-hexafluoropropane, and 1,1,1,2-tetrafluoroethane and method and apparatus for using |
US8645074B2 (en) * | 2007-11-19 | 2014-02-04 | International Business Machines Corporation | Method for reconstructing evolutionary data |
US20090299645A1 (en) * | 2008-03-19 | 2009-12-03 | Brandon Colby | Genetic analysis |
US20100049445A1 (en) * | 2008-06-20 | 2010-02-25 | Eureka Genomics Corporation | Method and apparatus for sequencing data samples |
WO2010045252A1 (en) * | 2008-10-14 | 2010-04-22 | Casework Genetics | System and method for inferring str allelic genotype from snps |
US8108406B2 (en) | 2008-12-30 | 2012-01-31 | Expanse Networks, Inc. | Pangenetic web user behavior prediction system |
EP3276526A1 (en) | 2008-12-31 | 2018-01-31 | 23Andme, Inc. | Finding relatives in a database |
EP3219813B1 (en) * | 2009-10-07 | 2020-11-18 | H. Hoffnabb-La Roche Ag | Methods for diagnosing lupus |
CA2794248C (en) * | 2010-03-24 | 2018-02-20 | Glendon John Parker | Methods for conducting genetic analysis using protein polymorphisms |
WO2011137368A2 (en) | 2010-04-30 | 2011-11-03 | Life Technologies Corporation | Systems and methods for analyzing nucleic acid sequences |
US9646134B2 (en) | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
KR102218512B1 (ko) | 2010-05-25 | 2021-02-19 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | Bambam:고처리율 서열분석 데이터의 병렬 비교 분석 |
US9268903B2 (en) | 2010-07-06 | 2016-02-23 | Life Technologies Corporation | Systems and methods for sequence data alignment quality assessment |
US8718950B2 (en) | 2011-07-08 | 2014-05-06 | The Medical College Of Wisconsin, Inc. | Methods and apparatus for identification of disease associated mutations |
WO2013085572A2 (en) | 2011-07-14 | 2013-06-13 | The George Washington University | Plume collimation for laser ablation electrospray ionization mass spectrometry |
WO2015027085A1 (en) | 2013-08-22 | 2015-02-26 | Genomoncology, Llc | Computer-based systems and methods for analyzing genomes based on discrete data structures corresponding to genetic variants therein |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
CN105868584B (zh) * | 2016-05-23 | 2019-03-26 | 厦门胜芨科技有限公司 | 通过选取极端性状个体来进行全基因组选择育种的方法 |
CN106169034B (zh) * | 2016-05-26 | 2019-03-26 | 中国农业科学院作物科学研究所 | 基因组信息辅助育种方法i-基于snp聚类信息和pav变异信息的育种亲本选择 |
US10600499B2 (en) | 2016-07-13 | 2020-03-24 | Seven Bridges Genomics Inc. | Systems and methods for reconciling variants in sequence data relative to reference sequence data |
US10620790B2 (en) * | 2016-11-08 | 2020-04-14 | Microsoft Technology Licensing, Llc | Insight objects as portable user application objects |
CN109920485B (zh) * | 2018-12-29 | 2023-10-31 | 浙江安诺优达生物科技有限公司 | 对测序序列进行变异模拟的方法及其应用 |
US20220325293A1 (en) * | 2019-09-06 | 2022-10-13 | Syngenta Crop Protection Ag | Promoters for regulation of gene expression in plants |
CN111883207B (zh) * | 2020-07-31 | 2022-08-16 | 武汉蓝沙医学检验实验室有限公司 | 一种生物学亲缘关系的鉴定方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003064600A2 (en) * | 2002-01-25 | 2003-08-07 | Interleukin Genetics, Inc. | The il-1 gene cluster and associated inflammatory polymorphisms and haplotypes |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5869242A (en) * | 1995-09-18 | 1999-02-09 | Myriad Genetics, Inc. | Mass spectrometry to assess DNA sequence polymorphisms |
EP1173622B1 (en) * | 1999-04-30 | 2005-06-15 | Methexis Genomics N.V. | Diagnostic sequencing by a combination of specific cleavage and mass spectrometry |
AU2002324649A1 (en) * | 2001-08-04 | 2003-02-24 | General Hospital Corporation | Haplotype map of the human genome and uses therefor |
US20050026173A1 (en) | 2003-02-27 | 2005-02-03 | Methexis Genomics, N.V. | Genetic diagnosis using multiple sequence variant analysis combined with mass spectrometry |
US20050027713A1 (en) * | 2003-08-01 | 2005-02-03 | Kim Cameron | Administrative reset of multiple passwords |
-
2004
- 2004-02-26 US US10/788,043 patent/US20050026173A1/en not_active Abandoned
- 2004-02-26 US US10/788,260 patent/US7584058B2/en active Active
- 2004-02-27 CA CA002517478A patent/CA2517478A1/en not_active Abandoned
- 2004-02-27 WO PCT/BE2004/000027 patent/WO2004076611A2/en active Application Filing
- 2004-02-27 JP JP2006501390A patent/JP2007523600A/ja active Pending
- 2004-02-27 EP EP04715213.7A patent/EP1615989B1/en not_active Expired - Lifetime
- 2004-02-27 AU AU2004215928A patent/AU2004215928B2/en not_active Ceased
- 2004-02-27 WO PCT/BE2004/000028 patent/WO2004076612A2/en active Application Filing
-
2005
- 2005-03-09 US US11/077,564 patent/US7593818B2/en active Active
-
2006
- 2006-03-09 US US11/908,094 patent/US20090104601A1/en not_active Abandoned
-
2009
- 2009-07-29 US US12/511,778 patent/US7974789B2/en not_active Expired - Fee Related
- 2009-09-03 US US12/553,445 patent/US7996157B2/en not_active Expired - Fee Related
-
2010
- 2010-06-25 AU AU2010202676A patent/AU2010202676A1/en not_active Ceased
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003064600A2 (en) * | 2002-01-25 | 2003-08-07 | Interleukin Genetics, Inc. | The il-1 gene cluster and associated inflammatory polymorphisms and haplotypes |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007133476A (ja) * | 2005-11-08 | 2007-05-31 | Hitachi Software Eng Co Ltd | 遺伝子解析のためのデータ入力支援システム |
JP2017184742A (ja) * | 2011-04-14 | 2017-10-12 | コンプリート・ジェノミックス・インコーポレイテッド | 複合核酸配列データの処理および解析 |
Also Published As
Publication number | Publication date |
---|---|
CA2517478A1 (en) | 2004-09-10 |
EP1615989A2 (en) | 2006-01-18 |
AU2010202676A1 (en) | 2010-07-22 |
WO2004076612A2 (en) | 2004-09-10 |
US20100082261A1 (en) | 2010-04-01 |
US20100092964A1 (en) | 2010-04-15 |
AU2004215928A1 (en) | 2004-09-10 |
WO2004076612A3 (en) | 2005-09-01 |
US7593818B2 (en) | 2009-09-22 |
WO2004076611A2 (en) | 2004-09-10 |
US20050026173A1 (en) | 2005-02-03 |
US7996157B2 (en) | 2011-08-09 |
US7584058B2 (en) | 2009-09-01 |
US20050118607A1 (en) | 2005-06-02 |
WO2004076611A3 (en) | 2005-12-01 |
US20050277135A1 (en) | 2005-12-15 |
US7974789B2 (en) | 2011-07-05 |
AU2004215928B2 (en) | 2010-03-25 |
US20090104601A1 (en) | 2009-04-23 |
EP1615989B1 (en) | 2021-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7974789B2 (en) | Genetic diagnosis using multiple sequence variant analysis | |
EP1869605B1 (en) | Genetic diagnosis using multiple sequence variant analysis | |
Mascher et al. | Anchoring and ordering NGS contig assemblies by population sequencing (POPSEQ) | |
Wall et al. | Haplotype blocks and linkage disequilibrium in the human genome | |
De Bakker et al. | A high-resolution HLA and SNP haplotype map for disease association studies in the extended human MHC | |
Tsai et al. | Discovery of rare mutations in populations: TILLING by sequencing | |
Davey et al. | Genome-wide genetic marker discovery and genotyping using next-generation sequencing | |
Ziegler et al. | Biostatistical aspects of genome‐wide association studies | |
De et al. | Bioinformatics challenges in genome-wide association studies (GWAS) | |
Bizjan et al. | Challenges in identifying large germline structural variants for clinical use by long read sequencing | |
Macgregor et al. | Analysis of pooled DNA samples on high density arrays without prior knowledge of differential hybridization rates | |
Craig et al. | Applications of whole-genome high-density SNP genotyping | |
Bourgeois et al. | Single‐nucleotide polymorphism discovery and panel characterization in the African forest elephant | |
Xie et al. | Mitochondrial genome sequence analysis: a custom bioinformatics pipeline substantially improves Affymetrix MitoChip v2. 0 call rate and accuracy | |
Kockum et al. | Overview of genotyping technologies and methods | |
Butcher et al. | The nature of nurture: A genomewide association scan for family chaos | |
Elhaik et al. | The Diversity of REcent and Ancient huMan (DREAM): a new microarray for genetic anthropology and genealogy, forensics, and personalized medicine | |
Barnes | Genetic variation analysis for biomedical researchers: a primer | |
US20220020449A1 (en) | Vector-based haplotype identification | |
Yu | Role of in silico tools in gene discovery | |
US20060259251A1 (en) | Computer software products for associating gene expression with genetic variations | |
Jenko Bizjan et al. | Challenges in identifying large germline structural variants for clinical use by long read sequencing: Mini review | |
Presson et al. | Merging microsatellite data: enhanced methodology and software to combine genotype data for linkage and association analysis | |
Chanock | Principles of high-quality genotyping | |
Iyengar et al. | The application of the HapMap to diabetic nephropathy and other causes of chronic renal failure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100413 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100707 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101013 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101124 |