JP2003052383A - ゲノム分析方法 - Google Patents

ゲノム分析方法

Info

Publication number
JP2003052383A
JP2003052383A JP2002099196A JP2002099196A JP2003052383A JP 2003052383 A JP2003052383 A JP 2003052383A JP 2002099196 A JP2002099196 A JP 2002099196A JP 2002099196 A JP2002099196 A JP 2002099196A JP 2003052383 A JP2003052383 A JP 2003052383A
Authority
JP
Japan
Prior art keywords
snp
snp haplotype
haplotype
pattern
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002099196A
Other languages
English (en)
Other versions
JP2003052383A5 (ja
Inventor
Nila Patil
パティル ニラ
David R Cox
アール. コックス デヴィッド
Anthony J Berno
ジェイ. バーノ アンソニー
David A Hinds
エー. ハインズ デヴィッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Perlegen Sciences Inc
Original Assignee
Perlegen Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Perlegen Sciences Inc filed Critical Perlegen Sciences Inc
Publication of JP2003052383A publication Critical patent/JP2003052383A/ja
Publication of JP2003052383A5 publication Critical patent/JP2003052383A5/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/14Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
    • Y10T436/142222Hetero-O [e.g., ascorbic acid, etc.]
    • Y10T436/143333Saccharide [e.g., DNA, etc.]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Signal Processing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 (修正有) 【課題】ヒトゲノム分析方法の提供。 【解決手段】本発明は、ヒトゲノムにおいて生じる変異
を同定するための方法、ならびにこれらの変異を疾患お
よび薬物応答の遺伝的根拠に関連付ける方法に関する。
特に本発明は、個々のSNPを同定し、SNPハプロタ
イプブロックおよびパターンを決定し、そして更に、該
SNPハプロタイプブロックおよびパターンを用いて疾
患および薬物応答の遺伝的根拠を詳細に分析することに
関する。本発明の方法は、全ゲノムの分析に有用であ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】(関連出願に対する相互参照)
本発明は、2001年3月30日に出願された米国仮特
許出願番号第60/280,530号、2001年8月
17日に出願された米国仮特許出願番号第60/31
3,264号、2001年10月5日に出願された米国
仮特許出願番号第60/327,006号(全て「ヒト
SNPハプロタイプの同定、情報提供SNPおよびその
使用(Identifying Human SNP
Haplotypes, Informative S
NPs and Uses Thereof)」と題す
る)、および2001年11月26日に出願された米国
仮特許出願番号第60/332,550号(「ゲノム分
析方法(Methods for Genomic A
nalysis)」と題する)を基に優先権主張を行
う。これら全ての開示内容は本明細書中に参考として特
に組み込まれるものとする。
【0002】
【従来の技術】ヒト染色体を構成するDNAは、体内の
全てのタンパク質の産生を指揮するインストラクション
を提供する。これらのタンパク質は、生命に不可欠な機
能を発揮する。タンパク質をコードするDNAの配列が
変化すると、これによりコードされるタンパク質に変化
または突然変異が生じて、細胞の正常な機能に影響を及
ぼす。環境は疾患においてしばしば大きな役割を担う
が、個体のDNAにおける変化や突然変異は、感染性疾
患、癌および自己免疫異常を含むほぼ全てのヒト疾患に
直接関係する。さらに、遺伝学(特にヒト遺伝学)の知
識により、多くの疾患は、幾つかの遺伝子もしくは遺伝
子産物の複雑な相互作用から、または1つの遺伝子内で
起こる任意の数の突然変異から生じるということが分か
った。例えば、I型糖尿病およびII型糖尿病は、多数
の遺伝子(各遺伝子は独自の突然変異パターンを有す
る)に関連付けられた。これに対し、嚢胞性線維症は、
1つの遺伝子内における300を超える様々な突然変異
のいずれかにより引き起こされ得る。
【0003】さらに、薬物応答(薬理遺伝学の分野)に
関しては、ヒト遺伝学の知識は、個体間の差異の理解の
範囲を限られたものとした。半世紀以上前、有害薬物応
答は、血漿コリンエステラーゼおよびグルコース−6−
リン酸デヒドロゲナーゼという2つの薬物代謝酵素にお
けるアミノ酸の変化と関連付けられた。それ以来、入念
な遺伝学的分析により、35を超える薬物代謝酵素、2
5の薬物標的および5つの薬物トランスポーター(dr
ug transporter)の中の配列多型(変
異)を薬物の効力または安全性の折衷レベルに関連付け
た(EvansおよびRelling, Scienc
e 296: 487−91(1999))。診療所で
は、このような情報は、薬物毒性を防ぐために使用され
ている。例えば、患者は、6−メルカプトプリンまたは
アザチオプリンの代謝を低下させるチオプリンメチルト
ランスフェラーゼ遺伝子の中の遺伝的差異について慣習
的にスクリーニングされる。しかし現在までのところ、
観察された薬物毒性のうちの僅かしか、薬理遺伝学マー
カーのセットによって十分に説明されていない。毒性の
問題よりもより一般的なのは、ある個体に対して安全且
つ/もしくは効力があることが示された薬物が、他の個
体においては十分な治療的効能を持たない、または予期
しがたい副作用を持つことが判明した事例である。
【0004】ヒトの遺伝子構成における変異の影響を理
解する重要性に加え、他の非ヒト生物(特に病原体)の
遺伝子構成における変異の影響を理解することは、これ
らのヒトへの影響またはヒトとの相互作用を理解する上
で重要である。例えば、病原性細菌またはウイルスによ
る毒性因子の発現は、このような生物に接触したヒトに
おける感染率および感染程度に多大な影響を及ぼす。さ
らに、実験動物(すなわちマウス、ラットなど)の遺伝
子構成の詳細な理解もまた大きな価値がある。例えば、
治療の評価のためのモデル系として使用される動物の遺
伝子構成の変異を理解することは、これらの系を用いて
得たテスト結果およびこれらをヒトに使用した場合の予
測値を理解するために重要である。
【0005】任意の2人のヒトはその遺伝子構成におい
て99.9%類似しているので、彼等のゲノムDNA配
列の大部分は同一である。しかし、個体間ではDNA配
列に変異がある。例えば、DNAの多数塩基ストレッチ
の欠失、DNAストレッチの挿入、および非コード領域
における反復DNAエレメントの数の変異、ならびに
「一塩基多型(SNP)」と呼ばれるゲノム内の1つの
窒素含有塩基位置における変化がある。ヒトDNA配列
変異は、個体間で観察された差異(疾患への感受性を含
む)の大部分を説明する。
【0006】大部分のSNPは稀なものではあるが、ヒ
ト間のDNA配列の違いの大部分を説明する一般的なS
NP(各SNPの頻度は10〜50%)は530万個あ
ると推定されている。このようなSNPはヒトゲノム中
に600塩基対毎に1回存在する(Kruglyakお
よびNickerson, Nature Gene
t. 27:235(2002))。物理的に近くに存
在するこのようなSNPのブロックを構成する対立遺伝
子(変異体)はしばしば相関関係を有し、その結果、遺
伝的変異性(genetic variabilit
y)は低下し、限られた数の「SNPハプロタイプ」
(各々は1つの古来先祖の染色体からの遺伝継承を反映
する:Fullertonら、Am. J. Hum.
Genet.67:881(2000))を定義す
る。
【0007】ヒトゲノムにおける局所的ハプロタイプ構
造の複雑性、および個々のハプロタイプが広がっている
距離は、殆ど定義されていない。異なる集団におけるヒ
トゲノムの異なるセグメントを調査する経験主義的な調
査により、局所的ハプロタイプ構造において大きな変異
性があることが分かった。これらの調査は、突然変異、
組換え、選択、個体群の歴史および確率的事象の、ハプ
ロタイプ構造への相互的な寄与が、予測不可能な形で変
化することを示しており、その結果、あるハプロタイプ
はわずか数千塩基(kb)の長さしかないものとなり、
またあるハプロタイプは100kbを超える長さのもの
となる(A.G. Clarkら、Am. J. Hu
m. Genet. 63:595(1998))。
【0008】これらの知見は、ヒトゲノムのハプロタイ
プ構造(一般的SNPにより定義される)を包括的に説
明するには、ヒトゲノムの沢山の独立したコピーにおけ
るSNPの稠密なセットの経験的な分析を必要とするこ
とを示唆している。このような全ゲノム分析は、かなり
精密な遺伝子マッピングを提供し、および具体的な連鎖
領域の位置を正確に示すであろう。しかし本発明以前
は、適度なサイズの個体群の各個体の3,000,00
0 を超えるSNPの遺伝子タイピングを行わなければ
ならないこと及びこれにかかるコストにより、この試み
は実行不能であった。本発明は、様々な用途の中でも特
に、SNPハプロタイプを用いた個体群の全ゲノム関連
付け分析(whole−genome associa
tionanalysis)を可能とする。
【0009】
【課題を解決するための手段】本発明は、ヒトゲノムに
おいて生じる変異を同定するための方法、およびこれら
の変異を、疾患への耐性、疾患への感受性または薬物応
答などの表現型の遺伝的根拠(genetic bas
e)に関連付けるための方法に関する。「疾患」とは、
変化が望まれる、生物の任意の状態、体質および特性を
含むが、これらに限定されない。例えば、状態とは、身
体的、生理学的または心理的なものであってもよく、ま
た症状性のものであっても無症状性のものであってもよ
い。この方法は、変異体の同定、SNPの同定、SNP
ハプロタイプブロックの決定、SNPハプロタイプパタ
ーンの決定、およびさらに各パターンの情報提供SNP
の同定(遺伝子データの圧縮を提供する)を可能とす
る。
【0010】このように、本発明の1つの態様は、デー
タ分析に有用なSNPハプロタイプパターンの選択方法
を提供する。このような選択は、複数の個体から実質的
に同じ(相同な)核酸鎖を単離し、各核酸鎖の中のSN
P位置を決定し、核酸鎖の中の連鎖したSNP位置を同
定し(連鎖したSNP位置はSNPハプロタイプブロッ
クを形成する)、孤立した(isolate)SNPハ
プロタイプブロックを同定し、各ハプロタイプブロック
中に生じるSNPハプロタイプパターンを同定し、およ
び実質的に同じ複数の核酸鎖のうちの少なくとも2つに
おいて生じる同定されたSNPハプロタイプパターンを
選択することにより、行うことができる。1つの好適な
実施形態において、少なくとも10の異なる個体または
起源から得た核酸鎖が用いられる。より好適な実施形態
において、少なくとも16の異なる起源から得た核酸鎖
が用いられる。さらに好適な実施形態において、少なく
とも25の異なる起源から得た核酸鎖が用いられ、より
更に好適な実施形態において、少なくとも50の異なる
起源から得た核酸鎖が用いられる。さらに、より好適な
実施形態は、少なくとも約100の異なる起源から得た
核酸鎖の中のSNP位置を決定する。さらに、この方法
は、実質的に同じ複数の核酸鎖中で最も頻繁に生じるS
NPハプロタイプを選択する工程、これらの実質的に同
じ複数の核酸鎖中で次に最も頻繁に生じるSNPハプロ
タイプを選択する工程、および選択されたSNPハプロ
タイプパターンがこれらの実質的に同じ複数の核酸鎖の
目的の一部分を同定するまでこの選択工程を繰返す工
程、をさらに含む。好適な実施形態において、目的の一
部分とは、該実質的に同じ核酸鎖の70%〜99%であ
り、より好適な実施形態において、目的の一部分は該実
質的に同じ核酸鎖の約80%である。あるいは、SNP
ハプロタイプパターンの選択を、1つのSNPハプロタ
イプブロックにつき約3個以下のSNPハプロタイプパ
ターンに限定したい場合もある。
【0011】さらに本発明は、データ分析のためにSN
Pハプロタイプブロックのデータセットを選択するため
の方法であって、情報提供性(informative
ness)についてSNPハプロタイプブロックを比較
する工程、高い情報提供性を有する第1のSNPハプロ
タイプブロックを選択する工程、該第1SNPハプロタ
イプブロックを該データセットに追加する工程、高い情
報提供性を有する第2のSNPハプロタイプブロックを
選択する工程、選択された該第2SNPハプロタイプブ
ロックを該データセットに追加する工程、およびDNA
鎖の目的の領域がカバーされるまでこの選択工程および
追加工程を繰返す工程を含むことを特徴とする上記方法
を提供する。好適な実施形態において、選択されるSN
Pハプロタイプブロックは重複しない。
【0012】本発明はさらに、SNPハプロタイプパタ
ーンにおける少なくとも1つの情報提供SNPを決定す
るための方法であって、まず、あるSNPハプロタイプ
ブロックのSNPハプロタイプパターンを決定し、次に
そのSNPハプロタイプブロックの中の目的の各SNP
ハプロタイプパターンをそのSNPハプロタイプブロッ
クの中の目的の他のSNPハプロタイプパターンと比較
し、そして該SNPハプロタイプブロックの中のこの目
的のSNPハプロタイプパターンを他のSNPハプロタ
イプパターンと区別する各SNPハプロタイプパターン
の中の少なくとも1つのSNPを選択する上記方法を提
供する。選択された1以上のSNPは、そのSNPハプ
ロタイプパターンの情報提供SNPである。
【0013】また本発明は、ゲノム領域の高速スキャニ
ングを可能とし、疾患に関連する遺伝子座または薬理遺
伝学に関係する遺伝子座の配列または位置についての事
前知識無しで、このような疾患に関連する遺伝子座また
は薬理遺伝学的に関係する遺伝子座を決定するための方
法を提供する。これは、対照集団の中の個体からSNP
ハプロタイプパターンを決定した後、実験集団の中の個
体(例えば疾患に罹った集団の中の個体または薬物を投
与したときに特定の反応を示す個体)からSNPハプロ
タイプパターンを決定することによって行うことができ
る。対照集団のSNPハプロタイプパターンの頻度を、
実験集団のSNPハプロタイプパターンの頻度と比較す
る。これらの頻度における差は、疾患に関連する遺伝子
座または薬理遺伝学的に関連する遺伝子剤の位置を示
す。
【0014】本発明の他の態様は、SNPハプロタイプ
パターンと目的の表現型特徴とを関連付ける方法であっ
て、本発明の方法によって対照個体のSNPハプロタイ
プパターンのベースラインを作製し、目的の共通の表現
型特徴を有する臨床集団から全ゲノムDNAをプール
し、および目的の表現型特徴に関係するSNPハプロタ
イプパターンを同定する、上記方法を提供する。このよ
うに、本発明は、表現型に関係する複数のハプロタイプ
ブロックを同定するためのゲノムスキャニングを可能と
し、これは特に多遺伝子性の特徴(polygenic
trait)を調査する際に有用である。
【0015】また本発明は、薬剤発見標的(drug
discovery target)を同定するための
方法であって、SNPハプロタイプパターンを疾患と関
連付け、関連付けられたSNPハプロタイプパターンの
染色体位置を同定し、染色体位置と前記疾患との関係の
性質を同定し、およびその染色体位置の遺伝子または遺
伝子産物を薬剤発見標的として用いることを特徴とする
上記方法を提供する。
【0016】添付の図面は本明細書の一部をなし、本発
明のある態様をさらに説明するために含まれる。本発明
は、本明細書中に提供される具体的な実施形態の詳細な
説明と一緒に、これらの図面の1以上を参照することに
よってより理解を深めることができる。
【0017】本発明は、ヒトゲノムにおいて生じる変異
を同定し、これらの変異を疾患の遺伝的根拠および薬物
応答に関連付けるための方法に関する。特に本発明は、
個々のSNPの同定、SNPハプロタイプブロックおよ
びSNPハプロタイプパターンの決定、ならびにさら
に、疾患の遺伝的根拠および薬物応答を詳細に分析する
ためのSNPハプロタイプブロックおよびSNPハプロ
タイプパターンの使用に関する。本発明の方法は、全ゲ
ノムの分析に有用である。
【0018】
【発明の実施の形態】当業者であれば、本発明の範囲お
よび精神を逸脱することなく、本願に開示された発明に
対して様々な実施形態および修正を実施することができ
ることは自明であろう。本明細書中に記載された全ての
公表文献は、本発明に関して使用され得る試薬、方法論
および概念を説明および開示するために引用される。本
明細書中に記載されるいかなる文献も、これらの参考文
献が本明細書中に記載された発明の先行技術であるとい
うことを認めるものではない。
【0019】本明細書において、特に数が指定されてい
ない場合は1以上のものを指すものとする。特許請求の
範囲において「含む」という用語に関連して記載された
物質および事柄について特に数を明記していない限り、
1以上の物質および事柄を含むことを意味する。本明細
書中において「他の」とは少なくとも2つ目以降の物質
または事柄を指す。
【0020】本明細書において、「異なる起源」という
用語が使用される場合、この用語は異なる生物から得た
DNA鎖が異なる起源に由来する事実を指す。さらに、
1つの生物のゲノム中の各DNA鎖は異なる起源に由来
する。二倍体生物において、個々の生物のゲノムは、実
質的に同じDNA鎖の複数の対からなるセットで構成さ
れる。つまり、1つの個体は2つの異なる起源に由来す
る実質的に同じDNA鎖を有する(その対の一方のDN
A鎖は母方起源に由来し、その対の他方のDNA鎖は父
方起源に由来する)。2以上の核酸配列(例えば2以上
のDNA鎖)は、これらがヌクレオチドレベルで少なく
とも約70%、好ましくは約75%、より好ましくは約
80%、さらに好ましくは約85%、もっと好ましくは
約90%、よりさらに好ましくは約95%の配列同一性
を示す場合、実質的に同じであると考えられる。またも
っとさらに好ましくは、ヌクレオチド配列は、これらが
ヌクレオチドレベルで少なくとも約98%の配列同一性
を示す場合、実質的に同じであるとみなされる。2以上
の核酸配列間に関する配列同一性の程度は、それらの核
酸の宿主起源によって異なる。例えば、同じ種の比較を
見るときは95%を超える配列同一性が適当であるが、
種間比較を行うときには70%以下の配列同一性が適当
である。もちろん、本明細書中においてDNAについて
言及する場合、このような言及はアンプリコン、RNA
転写体、核酸模倣体等のDNA誘導体を含み得る。
【0021】本明細書で使用される「個体」とは、単一
の動物、ヒト、昆虫、細菌等の特定の単一生物を指す。
【0022】本明細書で使用されるSNPハプロタイプ
ブロックの「情報提供性(informativene
ss)」とは、あるSNPハプロタイプブロックが遺伝
子領域についての情報を提供する程度として定義され
る。
【0023】本明細書で使用される「情報提供SNP
(informative SNP)」という用語は、
SNPハプロタイプブロックの中の1つのSNPハプロ
タイプパターンを他のSNPハプロタイプパターンと区
別する傾向を示すSNPまたは(2以上の)SNPから
なるサブセットなどの遺伝子変異体(geneticv
ariant)を指す。
【0024】本明細書で使用される「孤立したSNPブ
ロック(isolate SNPblock)」という
用語は、1つのSNPからなるSNPハプロタイプブロ
ックを指す。
【0025】本明細書で使用される「連鎖不均衡(li
nkage disequilibrium)」、「連
鎖した(linked)」または「LD」という用語
は、世代から世代へと一緒に受け継がれる傾向がある遺
伝子座、例えば非無作為に継承される遺伝子座等を指
す。
【0026】本明細書で使用される「シングルトンSN
Pハプロタイプ(singleton SNP hap
lotype)」または「シングルトンSNP」という
用語は、その集団のある一定の割合未満で生じる特定の
SNP対立遺伝子または変異体を指す。
【0027】本明細書で使用される「SNP」または
「単一ヌクレオチド多型」という用語は、個体間の遺伝
子変異(例えば生物のDNAの中の変異性の(vari
able)単一の窒素含有塩基位置など)を指す。本明
細書中で使用される「SNPs」とは複数のSNPであ
る。もちろん、本明細書中でDNAについて言及する場
合、このような言及はアンプリコンやRNA転写体等の
DNA誘導体を含み得る。
【0028】本明細書で使用される「SNPハプロタイ
プブロック」という用語は、別々に組換えが起こらない
と思われる変異体もしくはSNP位置のグループであっ
て、変異体もしくはSNPのブロックの中に一緒にグル
ープ化され得る上記グループを意味する。
【0029】本明細書で使用される「SNPハプロタイ
プパターン」という用語は、単一のDNA鎖の中のSN
Pハプロタイプブロック中のSNPの遺伝子型のセット
を指す。
【0030】本明細書で使用される「SNP位置」とい
う用語は、DNA配列中のSNPが生じる部位である。
【0031】本明細書で使用される「SNPハプロタイ
プ配列」とは、少なくとも1つのSNP位置を含むDN
A鎖中のDNA配列である。
【0032】分析用核酸の調製 当業者に公知である任意の手法を用いて、分析用に核酸
分子を調製することができる。好ましくはこのような手
法によって、その核酸分子中の1以上の位置における1
以上の変異の存在または不在を決定するのに十分な純度
の核酸分子を産生する。このような手法は、例えばSa
mbrookら、MolecularCloning:
A Laboratory Manual (Col
d Spring Harbor Laborator
y, New York)(1989)およびAusu
belら、Current Protocols in
Molecular Biology (John W
iley and Sons, New York)
(1997)(本明細書中に参考として組み込まれる)
に記載されている。
【0033】目的の核酸が細胞内に存在する場合、まず
その細胞の抽出物を調製した後、更なる工程(すなわち
ディファレンシャル沈降(differential
precipitation)、カラムクロマトグラフ
ィー、有機溶媒を用いた抽出など)を行って十分な純度
の核酸調製物を得ることが必要である。抽出物は、当分
野における標準的な手法、例えば細胞の化学的もしくは
機械的溶解によって調製することができる。次に抽出物
は、例えば濾過および/または遠心分離により、および
/またはカオトロピック塩(例えばグアニジニウムイソ
チオシアナートや尿素等)を用いて、または有機溶媒
(例えばフェノールおよび/またはHCCl3等)を用
いて処理を行い、任意の汚染タンパク質および邪魔にな
る可能性のあるタンパク質を変性させることができる。
カオトロピック塩を用いる場合、その核酸含有サンプル
からカオトロピック塩を除去することが望ましい。これ
は、当分野における標準的な手法、例えば沈殿法、濾過
法、サイズ排除クロマトグラフィー等を用いて行うこと
ができる。
【0034】幾つかの例では、細胞からメッセンジャー
RNAを抽出および分離することが望ましい場合があ
る。このような目的ための手法および材料は当業者に公
知であり、固相支持体(ビーズやプラスチック表面な
ど)に固定されたオリゴdTの使用などが挙げられる。
好適な条件および材料は当業者に公知であり、Samb
rookおよびAusubelの上記参考文献に記載さ
れている。例えば逆転写酵素を用いてmRNAをcDN
Aへと逆転写することが望ましい場合もある。好適な酵
素は、例えばInvitrogen(Calsbad
CA)から市販されている。その後、場合により、mR
NAから調製したcDNAを増幅してもよい。
【0035】ハプロタイプパターンおよびハプロタイプ
ブロックの調査に特に適した1つの方法は、体細胞の遺
伝学的特質を利用して染色体を二倍体状態から一倍体状
態へと分離するものである。1つの実施形態において、
二倍体であるヒトリンパ芽球細胞系を同じく二倍体であ
るハムスター線維芽細胞系に、該ヒト染色体が該ハムス
ター細胞中に導入されて細胞ハイブリッドを産生するよ
うに、融合することができる。得られた細胞ハイブリッ
ドを調べてどのヒト染色体が導入されたか、および(あ
れば)導入されたヒト染色体のどれが一倍体状態である
かを決定する(例えばPattersonら、Anna
l. N.Y. Acad. Of Science
s, 396:69−81(1982))。
【0036】この手法の概略図を図10に示す。図10
は、チミジンキナーゼ遺伝子中に突然変異を含む二倍体
ハムスター繊維芽細胞系に融合された、チミジンキナー
ゼ遺伝子について野生型である二倍体ヒトリンパ芽球細
胞系を示す。得られた細胞の部分集団において、ヒト染
色体はハイブリッド中に存在する。ヒトDNA含有ハイ
ブリッド細胞の選択は、HAT培地(選択培地)を利用
して行われる。野生型ヒトチミジンキナーゼ遺伝子を有
するヒトDNA鎖が安定に組み込まれたハイブリッド細
胞のみが、HATを含む細胞培養培地中で増殖する。得
られたハイブリッドのうち、幾つかのハイブリッドは、
幾つかのヒト染色体の両方のコピーを含むか、ヒト染色
体の1つのコピーのみを含むか、または特定のヒト染色
体のコピーを持たない。例えば、AまたはB対立遺伝子
を持つ遺伝子座を有するヒト第22番染色体の場合、得
られるハイブリッド細胞には、一方のヒト第22番染色
体変異体(例えば「A」変異体)またはその一部を含む
もの、他方のヒト第22番染色体変異体(「B」変異
体)またはその一部を含むもの、これら両方のヒト第2
2染色体変異体またはこれらの一部を含むもの、または
ヒト第22番染色体変異体のどの部分も含まないものが
ある。図10において、得られるハイブリッド集団のう
ち2つのみを示す。適当なハイブリッドを選択したら、
これらのハイブリッドから得た核酸を例えば上記に記載
した手法によって単離し、その後にSNP発見、そして
本発明のハプロタイプブロックおよびハプロタイプパタ
ーンの分析にかけることができる。
【0037】増幅手法 核酸内の1以上の変異の存在もしくは不在を決定する前
に、1以上の目的の核酸を増幅することが望ましい場合
がある。核酸増幅は目的の核酸配列のコピー数を増や
す。当業者に公知である任意の増幅手法(例えばポリメ
ラーゼ連鎖反応(PCR)手法があるがこれに限定され
ない)を本発明と一緒に用いることができる。PCRは
当業者に公知の材料および方法を用いて実施することが
できる。
【0038】PCR増幅は一般に、鋳型として核酸配列
の一方の鎖を用いてその配列に相補的な多数の相補体を
産生する。この鋳型を、その鋳型配列の一部に相補的な
配列を有するプライマーにハイブリダイズさせ、dNT
Pおよびポリメラーゼ酵素を含む好適な反応混合物に接
触させる。プライマーはポリメラーゼ酵素により伸長さ
れ、もとの鋳型に相補的な核酸が産生される。
【0039】二本鎖核酸分子の両方の鎖を増幅するため
には、2つのプライマー(各々はその核酸のそれぞれ一
方の鎖の一部に相補的な配列を有する)が用いられる。
ポリメラーゼ酵素によるプライマーの伸長により、二本
鎖核酸分子(各鎖は鋳型鎖および新しく合成された相補
的な鎖を含む)が産生される。プライマーの配列は典型
的には、該プライマーの各々の伸長方向が、その核酸分
子の中の他方のプライマーがハイブリダイズする部位に
向かうように選択される。
【0040】核酸分子の鎖を例えば加熱により変性し、
プロセスを繰返す。このとき、前回の工程で新しく合成
された鎖は後続工程において鋳型として使われる。PC
R増幅プロトコールは、変性、ハイブリダイゼーショ
ン、および伸長反応を数回以上繰返して、十分な量の所
望の核酸を産生するものである。
【0041】PCR法は、典型的には熱を用いて鎖の変
性を行い、後のプライマーのハイブリダイゼーションを
可能とするが、核酸をプライマーにハイブリダイズでき
るようにする任意の手段を用いることができる。このよ
うな手法は、物理的、化学的、または酵素による手段、
例えばヘリカーゼの封入(inclusion ofh
elicase)(Radding, Ann. Re
v. Genetics 16:405−436(19
82)を参照されたい)や電気化学手段(国際特許出願
公開番号WO92/04470号およびWO95/25
177号を参照されたい)を含むが、これらに限定され
ない。
【0042】PCRにおける鋳型依存的なプライマーの
伸長は、適当な塩、金属陰イオン、およびpH緩衝系を
含む反応培地中において、少なくとも4つのデオキシリ
ボヌクエオチド3リン酸(典型的にはdATP、dGT
P、dCTP、dUTPおよびdTTPから選択され
る)の存在下で、ポリメラーゼ酵素により触媒される。
好適なポリメラーゼ酵素は当業者に公知であり、天然起
源からクローニングまたは単離することができ、これ
は、その酵素の天然形態または突然変異形態であっても
よい。その酵素がプライマーを伸長する能力を維持する
限り、これらの酵素は本発明の増幅反応に使用すること
ができる。
【0043】本発明の方法において使用される核酸は、
後の工程での検出を容易とするために標識することがで
きる。1以上の標識したヌクレオチド3リン酸および/
または1以上の標識したプライマーを増幅配列中に組み
込むことによって、増幅反応中に標識を行うことができ
る。核酸は、増幅後に、例えば1以上の検出可能基を共
有結合させることにより標識してもよい。当業者に公知
である任意の検出可能基、例えば蛍光基、リガンドおよ
び/または放射能基を用いることができる。好適な標識
手法の例としては、末端デオキシヌクレオチジルトラン
スフェラーゼ(TdT)酵素を用いて目的の核酸中に標
識を含むヌクレオチドを導入する手法である。例えば、
標識を含むヌクレオチド(好ましくはジデオキシヌクレ
オチド)を、標識しようとする核酸および該ヌクレオチ
ドを導入するのに十分な量のTdTと一緒にインキュベ
ートする。好適なヌクレオチドは、ビオチン標識を結合
させた、ジデオキシヌクレオチドすなわちddATP、
ddGTP、ddCTP、ddTTP等である。
【0044】長い配列の増幅を最適化する手法を用いる
ことができる。このような手法はゲノム配列に対して非
常に有効である。2001年9月5日に出願された継続
中の米国特許出願番号60/317,311号、200
2年1月9日に出願された「Algorithms f
or Selection of Primer Pa
irs」と題した代理人整理番号1011N−1(出願
番号は未定)、および2002年1月9日に出願された
「Methods for Amplificatio
n of Nucleic Acids」と題した代理
人整理番号1011N1D1(出願番号は決定済み)に
開示された方法は、本発明の方法で使用されるゲノムD
NAの増幅に特に適している。
【0045】増幅された配列は、標識する前または後
に、他の増幅後処理にかけることができる。例えば、幾
つかのケースにおいて、ヌクレオチドアレイにハイブリ
ダイズさせる前に増幅配列を断片化することが望まし
い。核酸の断片化は、当分野で公知である物理的方法、
化学的方法または酵素による方法によって実施すること
ができる。好適な手法としては、該核酸を含む液体サン
プルを狭い開口部に通過させて増幅配列をせん断力にか
けるもの、またはPCR産物をヌクレアーゼ酵素で消化
するもの等が挙げられるが、これらに限定されない。好
適なヌクレアーゼ酵素の1つの例は、DNアーゼIであ
る。増幅後、適当なサイズの断片を産生するように設定
された一定時間の間、PCR産物をヌクレアーゼの存在
下でインキュベートする。断片サイズは、例えばヌクレ
アーゼの量やインキュベーション時間を増やしてより小
さな断片を産生させたり、またはヌクレアーゼの量やイ
ンキュベーション時間を減らしてより大きな断片を産生
させたりして、好きなように変えることができる。所望
のサイズの断片を産生するための消化条件の調節は、当
業者の能力の範囲内である。このように産生された断片
を上記のように標識する。
【0046】SNPの検出方法(SNP発見) 核酸中の1以上の変異の存在または不在の決定は、当業
者に公知である任意の手法を用いて行うことができる。
変異の正確な決定を可能とする任意の手法を用いること
ができる。好適な手法は、最小限のサンプルの扱いのみ
で複数の変異の迅速且つ正確な決定を可能とする。好適
な手法の幾つかの例を以下に挙げる。
【0047】幾つかのDNA配列決定法は当分野におい
て周知且つ一般に利用可能であり、ゲノム中のSNPの
位置を決定するために用いることができる。例えばSa
mbrookら、Molecular Clonin
g: A Laboratory Manual (C
old Spring Harbor Laborat
ory, New York)(1989)およびAu
subelら、Current Protocols
in Molecular Biology(John
Wiley and Sons, New Yor
k)(1997)を参照されたい(これらの文献は本明
細書中に参考として組み込まれる)。このような方法
は、異なるDNA鎖に由来する同じゲノム領域の配列を
決定するために使用され得る。次にこれらの配列は比較
され、その差(鎖間の変異)が調べられる。DNA配列
決定法は、DNAポリメラーゼIのクレノウ断片、シー
クエナーゼ(US Biochemical Cor
p, Cleveland, Ohio.)、Taqポ
リメラーゼ(Perkin Elmer)、熱安定性T
Pポリメラーゼ(Amersham, Chicag
o, Ill.)またはポリメラーゼとプルーフリーデ
ィング(校正)エキソヌクレアーゼ(例えばGibco
/BRL(Gaithersburg, Md.)によ
り市販されている伸長酵素増幅システム(Elonga
se Amplification System)に
見られるものなど)等の酵素を使用する。好ましくは、
このプロセスはHamilton Micro Lab
2200(Hamilton, Reno, Ne
v.)、Peltier Thermal Cycle
r (PTC200; MJ Research, W
atertown, Mass.)およびABI Ca
talyst、ならびに373および377DNAシー
ケンサ(Perkin Elmer, Wellesl
ey, MA)等の機械により自動化される。
【0048】さらに、市販されているキャピラリー電気
泳動システムを用いて変異もしくはSNPの分析を行う
ことができる。特にキャピラリー配列決定は、電気泳動
による分離のための流動可能なポリマー、レーザーによ
り活性化される4つの異なる蛍光染料(各ヌクレオチド
毎に1つ)、およびCCDカメラによる発光波長の検出
を用いることができる。出力/光強度は、適当なソフト
ウェア(例えばGenotyper and Sequ
ence Navigator, Perkin El
mer, Wellesley, MA)を用いて電気
信号に変換され、サンプルを入れてからコンピュータ分
析および電子データ表示までの全プロセスはコンピュー
タにより制御することができる。またこの方法は、異な
るDNA鎖に由来する同じゲノム領域の配列を決定する
ために使用することもできる。これらの配列は後に比較
され、その差(鎖間の変異)が調べられる。
【0049】選択肢として、1つの基準DNA鎖に由来
するゲノム配列を配列決定により決定したら、この基準
鎖と他のDNA鎖との配列の変異を決定するためにハイ
ブリダイゼーション手法を用いることが可能である。こ
れらの変異はSNPであり得る。好適なハイブリダイゼ
ーション手法の1つの例は、例えばAffymetri
x, Inc. Santa Clara, CAより
入手可能なもの等のDNAチップ(オリゴヌクレオチド
アレイ)の使用を含む。例えばSNP検出のためのDN
Aチップの使用についての詳細については、Lipsh
ultz等に付与された米国特許第6,300,063
号およびCheeらに付与された米国特許第5,83
7,832号、HuSNP Mapping Assa
yの試薬キットおよびユーザマニュアル、Affyme
trix Part No. 90094(Affym
etrix, Santa Clara, CA)を参
照されたい(これらは全て本明細書中に参考として組み
込まれる)。
【0050】好適な実施形態において、基準配列および
他のDNA鎖の10,000を超える塩基を、変異体に
ついて調べる。より好適な実施形態において、基準配列
および他のDNA鎖の1×106を超える塩基を変異体
について調べ、より好ましくは基準配列および他のDN
A鎖の2×106を超える塩基を調べ、さらに好ましく
は1×107を超える塩基を調べ、もっと好ましくは1
×108を超える塩基を調べ、さらに好ましくは基準配
列および他のDNA鎖の1×109を超える塩基を変異
体について調べる。好適な実施形態において、少なくと
もエキソンを変異体について調べ、より好適な実施形態
においては、イントロンおよびエキソンの両方を変異体
について調べる。さらに好適な実施形態において、イン
トロン、エキソンおよび遺伝子間配列を変異体について
調べる。好適な実施形態において、調べられる核酸はゲ
ノムDNA(コード領域および非コード領域の両方を含
む)である。最も好適な実施形態において、このような
DNAは、ヒト等の哺乳動物生物に由来する。好適な実
施形態において、その生物に由来するゲノムDNAの1
0%を超える部分について調べ、より好適な実施形態に
おいて、その生物のゲノムDNAの25%を超える部分
について調べ、さらに好適な実施形態において、その生
物に由来するゲノムDNAの50%を超える部分につい
て調べ、最も好適な実施形態において、ゲノムDNAの
75%を超える部分について調べる。本発明の幾つかの
実施形態において、ゲノムの既知の反復領域については
調べず、調べるゲノムDNAのパーセンテージには入れ
ない。このような既知の反復領域には、短い散在性の反
復配列(Single Interspersed N
uclear Elements, SINE、例えば
aluおよびMIR配列等)、長い散在性の反復配列
(Long Interspersed Nuclea
r Elements, LINE、例えばLINE1
およびLINE2配列等)、長い末端反復配列(Lon
g Terminal Repeats, LTR、例
えばMaLR、RetrovおよびMER4配列等)、
トランスポゾン、MER1配列およびMER2配列が含
まれる。
【0051】要約すると、1つの実施形態において、好
適な溶液中の標識した核酸を、例えば95℃に加熱して
変性させ、変性した核酸を含む溶液をDNAチップと共
にインキュベートする。インキュベーション後、溶液を
除去し、チップを好適な洗浄液で洗浄してハイブリダイ
ズしなかった核酸を除去し、チップ上のハイブリダイズ
した核酸の存在を検出する。洗浄条件のストリンジェン
シーは、安定なシグナル生成するのに必要なだけ調節す
ることができる。ハイブリダイズした核酸の検出は直接
行うことができる。例えば核酸が蛍光レポーター基を含
む場合、蛍光は直接検出され得る。核酸上の標識が直接
検出できないもの(例えばビオチンなど)である場合、
検出前に、検出可能標識(例えばフィコエリトリンに結
合したストレプトアビジン)を含む溶液を加えることが
できる。また、シグナルレベルを高めるよう設計された
他の試薬を検出前に加えることもできる。例えばストレ
プトアビジンに特異的なビオチン化抗体を、該ビオチン
・ストレプトアビジン−フィコエリトリン検出システム
と一緒に用いることもできる。幾つかの実施形態におい
て、本発明の方法で用いられるオリゴヌクレオチドアレ
イは、アレイ1つあたり少なくとも1×106プローブ
を含む。好適な実施形態において、本発明の方法で使用
されるオリゴヌクレオチドアレイは、アレイ1つあたり
少なくとも10×106プローブを含む。より好適な実
施形態において、本発明の方法で使用されるオリゴヌク
レオチドアレイは、アレイ1つあたり少なくとも50×
106プローブを含む。
【0052】例えば配列決定またはマイクロアレイ分析
を用いて変異体の位置を決定したら(SNP発見)、対
照集団およびサンプル集団のSNPを遺伝子タイピング
することが必要となる。上記ハイブリダイゼーション方
法は、この目的に非常に役立ち、複数サンプルにおける
SNPの検出および遺伝子タイピングのための正確且つ
高速な技術を提供する。さらに、増幅を行わないゲノム
DNA中のSNP検出に適した手法は、Third W
ave Technologies, Inc., M
adison, WIから入手可能なInvaderテ
クノロジーである。SNPを検出するためのこのテクノ
ロジーの使用については、例えばHessnerら、C
linical Chemistry 46(8):
1051−56(2000);Hallら、PNAS
97(15):8272−77(2000); Aga
rwalら、Diag. Molec. Path.
9(3):158−64(2000);およびCook
seyら、Antimicrobial and Ch
emotherapy 44(5):1296−130
1(2000)に記載されている。Invaderプロ
セスでは、2つの短いDNAプローブが標的核酸にハイ
ブリダイズして、ヌクレアーゼ酵素により認識される構
造を形成する。SNP分析のために、2つの別々の反
応、つまり各SNP変異体毎に1つの反応が行われる。
プローブのうちの一方がその配列に相補的である場合、
ヌクレアーゼはこれを切断して、「フラップ(fla
p)」と呼ばれる短いDNA断片を放出する。フラップ
は、蛍光標識したプローブに結合して、ヌクレアーゼ酵
素により認識される他の構造を形成する。この酵素が標
識プローブを切断すると、プローブは検出可能な蛍光シ
グナルを発することにより、どのSNP変異体が存在す
るかを示す。
【0053】Invaderテクノロジーの代替法であ
るローリングサークル型増幅は、環状DNA鋳型に相補
的なオリゴヌクレオチドを利用して増幅シグナルを生成
する(例えばLizardiら、Nature Gen
etics 19(3):225−32(1998);
およびZhongら、PNAS 98(7):9940
−45(2001)を参照されたい)。オリゴヌクレオ
チドの伸長により、長いコンカテマー中に該環状鋳型の
多重コピーが生成される。典型的には、検出可能標識
は、伸長反応中に伸長されたオリゴヌクレオチド中に導
入される。伸長反応は検出可能な量の伸長産物が合成さ
れるまで進められる。
【0054】ローリングサークル型増幅を用いてSNP
を検出するためには、3つのプローブおよび2つの環状
DNA鋳型を用いることができる。第1プローブ(標的
特異的プローブ)は、該プローブの5’側末端が、標的
核酸中のSNP部位の5’側に隣接したヌクレオチドに
ハイブリダイズするように、該標的核酸分子に相補的と
なるよう構築される。このSNP部位は、第1プローブ
と塩基対を形成しない。
【0055】他の2つのプローブ(ローリングサークル
型プローブ)は、2つの3’側末端を持つように構築さ
れる。これは、様々な方法で(例えばこれらのプローブ
の中央部分に5’−5’結合を導入してそのポイントで
該ヌクレオチド配列の極性を逆転させることにより)行
うことができる。これらのプローブの各々の一方の端部
は、異なる環状鋳型分子の一部分に相補的な配列を有す
るが、他方の端部は、標的核酸配列の一部分に相補的で
ある。この標的配列相補的末端は、最も3’側のヌクレ
オチドがSNP部位のヌクレオチドと揃えられるように
構築される。これらのプローブの一方は、標的配列中の
SNP部位のヌクレオチドに相補的なヌクレオチドを含
むが、他方は相補的でないヌクレオチドを含む。SNP
の2以上の変異体がその集団の中に存在する場合、プロ
ーブは、検出される変異体に相補的な3’側ヌクレオチ
ドを有するよう構築される。
【0056】プローブ(標的特異的プローブおよびロー
リングサークル型プローブの両方)を標的配列にハイブ
リダイズさせ、リガーゼ酵素に接触させる。ローリング
サークル型プローブの最も3’側のヌクレオチドがSN
P部位のヌクレオチドと塩基対を形成すると、これら2
つのプローブ(標的特異的プローブおよびローリングサ
ークル型プローブ)は効率的に連結される。ローリング
サークル型プローブの最も3’側のヌクレオチドが標的
中のSNP部位にあるヌクレオチドと塩基対を形成でき
ない場合、プローブは連結されない。連結されなかった
プローブを洗い流し、サンプルを鋳型環状体、ポリメラ
ーゼおよび標識したヌクレオチド3リン酸に接触させ
る。
【0057】SNPの検出に適した他の手法は、プロー
ブ分子を消化して蛍光標識されたヌクレオチドを放出す
ることによりシグナルを生成するDNAポリメラーゼの
5’側エキソヌクレアーゼ活性を利用する。このアッセ
イはしばしばTaqmanアッセイと呼ばれる(例えば
Arnoldら、BioTechniques 25
(1):98−106(1998);およびBecke
rら、Hum. Gene Ther. 10:255
9−66(1999)を参照されたい)。SNPを含む
標的DNAを、そのSNP部位にハイブリダイズするプ
ローブ分子の存在下で増幅する。このプローブ分子は、
5’側末端に蛍光レポーター標識ヌクレオチド、および
3’側末端に消光剤標識ヌクレオチドを両方含む。この
プローブ配列は、正しくマッチしたプローブとミスマッ
チプローブとの融解温度の差を最大とするために、標的
DNAの中のSNP部位に揃えられるそのプローブの中
のヌクレオチドができるだけそのプローブの中央に近く
なるように選択される。PCR反応が行われるとき、正
しくマッチしたプローブは標的DNA中のSNP部位に
ハイブリダイズし、PCRアッセイで用いられるTaq
ポリメラーゼによって消化される。この消化により、蛍
光標識されたヌクレオチドは消光剤から物理的に分離さ
れ、それに伴い蛍光が増大する。ミスマッチプローブは
PCR反応の伸長工程の間はハイブリダイズしたままで
はないので消化はされず、蛍光標識されたヌクレオチド
は消光されたままとなる。
【0058】ポリスチレン−ジビニルベンゼン逆相カラ
ムおよびイオン・ペアリング移動相(ion−pair
ing mobile phase)を用いた変性HP
LCを用いて、SNPを同定することができる。SNP
を含むDNAセグメントをPCR増幅する。増幅後、P
CR産物を加熱して変性させ、SNP位置に既知のヌク
レオチドを有する第2の変性PCR産物と混合する。P
CR産物をアニーリングし、高温にてHPLCにより分
析する。温度は、SNP位置にミスマッチを含む二本鎖
分子(duplex molecule)を変性させ且
つ完全にマッチした二本鎖分子を変性させないよう選択
される。このような条件下において、ヘテロ二本鎖分子
は典型的にはホモ二本鎖分子の前に溶離する。このよう
な手法の使用例については、Kotaら、Genome
44(4):523−28(2001)を参照された
い。
【0059】固相増幅および増幅産物のミクロ配列決定
を用いてSNPを検出することができる。プライマーを
共有結合させたビーズを用いて、増幅反応を行う。プラ
イマーは、II型制限酵素の認識部位を含むように設計
される。増幅(これによりPCR産物がビーズに結合す
る)後、産物を制限酵素で消化する。制限酵素による産
物の切断により、SNP部位および3’−OH(伸長さ
れてその一本鎖部分を埋めることができる)を含む一本
鎖部分が産生される。伸長反応にddNTPを含めるこ
とにより、産物の直接的な配列決定が可能となる。SN
Pを同定するためのこの手法の使用例については、Sh
aperoら、Genome Research 11
(11):1926−34(2001)を参照された
い。
【0060】データ分析 図1は、本発明の方法の1つの実施形態の工程を示す概
略図である。例えば上記方法によってSNP(変異体)
を位置付けまたは発見したら(図1のステップ11
0)、SNPハプロタイプブロック、各SNPハプロタ
イプブロックの中のSNPハプロタイプパターン、およ
びそのSNPハプロタイプパターンの情報提供SNPを
決定することができる。位置付けされた全てのSNPま
たは変異体を使用しても良いし、あるいは位置付けされ
たSNPの一部のみについて分析を行っても良い。例え
ば分析されるSNPのセットは、Cg<−>Tgまたは
cG<−>cAの転位SNP(transition
SNP)を除外してもよい。さらに、本発明の1つの実
施形態において、注目されるのは共通SNPである。共
通SNPは、そのより一般的でない形態が所与の集団に
おいて最少頻度で存在するこれらのSNPである。例え
ば、共通SNPは、その集団の少なくとも約2%〜25
%で見られるこれらのSNPである。好適な実施形態に
おいて、共通SNPは、その集団の少なくとも約5%〜
15%で見られるこれらのSNPである。より好適な実
施形態において、共通SNPは、その集団の少なくとも
約10%において見られるSNPである。共通SNP
は、ヒトの進化過程において初期に生じた突然変異から
生じたものであると思われる。共通SNPに焦点を絞る
ことにより、疾患または薬物応答に関連すると思われ且
つ移住歴(migratoryhistory)または
交配(mating practices)によっての
み生じる、実験集団および対照集団における系統的な対
立遺伝子または変異体の差を最少にする。すなわち、共
通SNPに注目することによって、近年の集団の変則性
(population anomaly)から生じる
偽陽性が減る。さらに共通SNPは、ヒト人口の大部分
に関係があり、このことは、本発明を、疾患および薬物
応答の調査により広く応用できるようにしている。これ
にならい、本発明の幾つかの実施形態(例えばシングル
トンSNPなど)において、変異体が1回だけ観察され
るSNPを分析から排除してもよい。しかし、特に移住
歴等の影響を受けた特定の部分集団または集団を見る場
合に、これらのシングルトンSNPの一部または全てを
含むある種の分析を行ってもよい。
【0061】図1のステップ120では、目的の変異体
またはSNPをハプロタイプブロックに割り当てて評価
する。全ゲノムまたは染色体から得た変異体またはSN
Pを分析し、SNPハプロタイプブロックに割り当てる
ことができる。あるいは、ある疾患または薬物応答メカ
ニズムに特異的な特定のゲノム領域のみからの変異体を
SNPハプロタイプブロックに割り当てることができ
る。
【0062】図2は、ゲノム内のハプロタイプブロック
中において変異体(通常はSNP)がどのように生じる
のか、および1以上のハプロタイプパターンが各ハプロ
タイプブロック内で起こり得ることを示す1つの例であ
る。SNPハプロタイプパターンが完全に無作為である
場合、N個のSNPからなるSNPハプロタイプブロッ
クについて観察される可能なSNPハプロタイプパター
ンの数は2N個であると推測される。しかし、本発明の
方法を実施した際に、SNPは連鎖しているため、各S
NPハプロタイプブロックにおけるSNPハプロタイプ
パターンの数は、2N個より少ないことが分かった(変
異体は最も一般的にはbiallelicである、すな
わち4つのヌクレオチド塩基の可能性全てではなく2つ
の形態のうち一方の形態でのみ生じるので、4Nではな
い)。あるSNPハプロタイプパターンは、非連鎖ケー
スで予想される頻度よりはるかに高い頻度で観察され
た。したがって、SNPハプロタイプブロックは、ユニ
ットとして継承される傾向がある染色体領域であり、比
較的少ない数の共通パターンを有する。図2中の各行
は、異なる個体の一倍体ゲノム配列の一部を表す。図2
に示すように、個体Wは、241位に「A」を、242
位に「G」を、および243位に「A」を有する。個体
Xは、241位、242位および243位に同じ塩基を
有する。これに対し、個体Yは、241位および243
位にTを有し242位にはAを有する。個体Zは241
位、242位および243位に個体Yと同じ塩基を有す
る。ブロック261における変異体は、一緒に生じる傾
向がある。同様に、ブロック262における変異体は一
緒に生じる傾向があり、ブロック263中における変異
体も同様である。もちろん、ゲノム中の少数の塩基しか
図2に表されていない。実際、多くの塩基は245位お
よび248位の塩基と同様であり、個体間でばらつきは
ない。
【0063】SNPハプロタイプブロックへのSNPの
割り当て(図1のステップ120)は、あるケースで
は、目的のゲノム領域に沿ったSNP位置からのSNP
ハプロタイプブロックの構築を含む反復プロセスであ
る。1つの実施形態において、最初のSNPハプロタイ
プブロックを構築したら、その構築されたSNPハプロ
タイプブロックの中に存在するSNPハプロタイプパタ
ーンを決定する(図1のステップ130)。幾つかの具
体的な実施形態において、ステップ130において各S
NPハプロタイプブロック毎に選択されたSNPハプロ
タイプパターンの数は、約5未満である。他の具体的な
実施形態において、各SNPハプロタイプブロック毎に
選択されたSNPハプロタイプパターンの数は、分析さ
れるDNA鎖の50%を超える中のSNPハプロタイプ
パターンを同定するのに必要なSNPハプロタイプパタ
ーンの数に等しい。言い換えると、十分なSNPハプロ
タイプパターンが選択される。例えば、分析されるDN
A鎖の少なくとも半分が、各SNPハプロタイプブロッ
クで選択された4つのパターンのうちの1つにマッチす
るSNPハプロタイプパターンを有するように、1ブロ
ックあたり4つのパターンが選択される。好適な実施形
態において、各SNPハプロタイプブロックにつき選択
されたSNPハプロタイプパターンの数は、分析される
DNA鎖の70%を超える中のSNPハプロタイプパタ
ーンを同定するのに必要なSNPハプロタイプパターン
の数に等しい。1つの好適な実施形態において、各SN
Pハプロタイプブロックにつき選択されたSNPハプロ
タイプパターンの数は、分析されるDNA鎖の80%を
超える中のSNPハプロタイプパターンを同定するのに
必要なSNPハプロタイプパターンの数に等しい。さら
に、発明の幾つかの実施形態において、分析されるDN
A鎖のある一定割合未満で生じるSNPハプロタイプパ
ターンは、分析から排除される。例えば、1つの実施形
態において、10本のDNA鎖を分析する場合、10本
のうち1本のサンプルにおいてのみ生じることが分かっ
たSNPハプロタイプパターンは、分析から排除され
る。
【0064】目的のSNPハプロタイプパターンを選択
したら、これらのSNPハプロタイプパターンのための
情報提供SNPを決定する(図1のステップ140)。
ブロックのこの最初のセットから、情報提供性について
の一定の基準を満たす候補SNPブロックのセットを作
製する(図1のステップ150)。図4および図5は、
ステップ120、130、140および150について
より詳細に記載している。
【0065】図3において、ステップ310では、評価
のためにSNPの新しいブロックが選択される。1つの
実施形態において、選択された第1ブロックは、SNP
ハプロタイプ配列の中の第1SNPのみを含む。したが
ってステップ320では、最初の1つのSNPがブロッ
クに追加される。ステップ330では、このブロックの
情報提供性が決定される。
【0066】1つの実施形態において、SNPハプロタ
イプブロックの「情報提供性」は、そのブロックが遺伝
子領域についての情報を提供する程度として定義され
る。例えば、本発明の1つの実施形態において、情報提
供性は、あるSNPハプロタイプブロックの中のSNP
位置の数を、考慮される各SNPハプロタイプパターン
をそのブロックの中の考慮される他のSNPハプロタイ
プパターンと区別するのに必要なSNPの数(情報提供
SNPの数)で割った比として計算することができる。
情報提供性の他の測度は、そのブロックの中の情報提供
SNPの数である。当業者であれば、情報提供性は、色
々な方法で決定することができることが分かるであろ
う。
【0067】再び図2を参照すると、SNPハプロタイ
プブロック261は3つのSNPおよび2つのSNPハ
プロタイプパターン(AGAおよびTAT)を含む。存
在するこの3つのSNPのどれを使用してもこれらのパ
ターンを見分けることができるので、これらのSNPの
うち任意の1つを、このSNPハプロタイプパラーンの
ための情報提供SNPとして選択することができる。例
えば、あるサンプル核酸が第1位置にTを含むと決定さ
れた場合、そのサンプルは第2位置にAおよび第3位置
にTを含む。第2サンプルにおいて第2位置のSNPが
Gであると決定された場合、第1および第3のSNPは
Aである。このように、情報提供性の1つの測度とし
て、この第1ブロックの情報提供性値は3である(全S
NPの数3を、該パターンを互いから区別するのに必要
な情報提供SNPの数1で割った)。同様に、SNPハ
プロタイプブロック262は、3つのSNP(2つの位
置は変異体を持たない)および2つのハプロタイプパタ
ーン(TCGおよびCAC)を含む。前に分析したブロ
ックを用いて、該3つのSNPのうちのどれか1つを評
価して1つのパターンを他のパターンと区別することが
できる。したがって、このブロックの情報提供性は3で
ある(全SNPの数3を、パターンを区別するのに必要
な情報提供SNPの数1で割った)。SNPハプロタイ
プブロック263は、5つのSNPおよび2つのSNP
パターン(TAACGおよびATCAC)を含む。この
場合も、5つのSNPのうちのどれか1つを用いて1つ
のパターンを他のパターンと区別することができる。し
たがって、このブロックの情報提供性は、5である(全
SNPの数5を、パターンを区別するのに必要な情報提
供SNPの数1で割った)。
【0068】図2は、遺伝子分析の単純な例を提供す
る。幾つかのSNPハプロタイプパターンが1つのブロ
ックの中に存在する場合、情報提供SNPとして2以上
のSNPを用いることが必要となる場合がある。例え
ば、1つのブロックが例えば6つのSNPを含み且つ目
的のパターンを区別するために2つのSNPが必要であ
る場合、そのブロックの情報提供性は3である(全SN
Pの数6を、パターンを区別するのに必要な情報提供S
NPの数2で割った)。一般的に言うと、適切に選択さ
れたN個のSNPの遺伝子タイプを用いて、2N個もの
異なるSNPハプロタイプパターンを区別することがで
きる。したがって、そのSNPハプロタイプブロックの
中にたった2つのSNPハプロタイプパターンしか存在
しない場合、1つのSNPはその2つを差別化できなけ
ればならない。3もしくは4つのパターンがある場合、
少なくとも2つのSNPが必要となるであろう。
【0069】図3のステップ340において、SNPハ
プロタイプブロックの情報提供性が決定されたら、テス
トが行われる。このテストは本質的に、選択された基準
(例えばあるブロックが情報提供性の閾値を満たすか否
か)に基づいてSNPハプロタイプブロックを評価し、
テスト結果は、例えば他のSNPが分析のためにそのブ
ロックに追加されるか否か、またはその分析が異なるS
NP位置で始まる新しいブロックを用いて進行するか否
かを決定する。図4は、このプロセスの1つの実施形態
を示す。
【0070】図4では、6つのSNP位置を有するDN
A配列があると想定する。上記のSNPハプロタイプブ
ロック分析は、以下のように行うことができる:SNP
位置1にあるSNPのみを含むSNPハプロタイプブロ
ックAが選択される(図3のステップ310および32
0)。このブロックの情報提供性を計算し(ステップ3
30)、このブロックの情報提供性が情報提供性の閾値
を満たすか否かを決定する(ステップ340)。この場
合、これは「合格」し、2つの事が起こる。まず第1
に、1つのSNP(SNP位置1)のこのブロックを候
補SNPハプロタイプブロックのセットに追加する(ス
テップ350)。第2に、他のSNP(ここではSNP
位置2)をこのブロックに追加し(ステップ320)、
SNP位置1および2を含む新しいブロックBを作製
し、次にこれを分析する。この例では、ブロックBも情
報提供性の閾値を満たすので(ステップ340)、候補
SNPハプロタイプブロックのセットに追加され(ステ
ップ350)、他のSNP(この場合はSNP位置3)
がこのブロックに追加されて(ステップ320)、SN
P位置1、2および3を含む新しいブロックCが作製さ
れ、次にこれを分析する。この例では、Cも情報提供性
の閾値を満たすので、候補SNPハプロタイプブロック
のセットに追加され(ステップ350)、他のSNP
(この場合はSNP位置4)がこのブロックに追加され
て(ステップ320)、SNP位置1、2、3および4
を含む新しいブロックDが作製され、次にこれを分析す
る。図4の例では、SNPブロックDは情報提供性の閾
値を満たさない。SNPブロックDは候補SNPハプロ
タイプブロックのセットに追加されず(ステップ35
0)、また他のSNPが分析のためにブロックDに追加
されることもない。その代わりに、新しいSNP位置が
選択され、これについてSNPブロック評価が行われ
る。
【0071】図4では、ブロックDが情報提供性の閾値
を満たさないと分かった後、位置2にのみSNPを含む
新しいブロックEが選択される。ブロックEの情報提供
性について評価し、閾値を満たすことが分かり、候補S
NPハプロタイプブロックのセットに追加され(ステッ
プ350)、および他のSNP(この場合SNP位置
3)がこのブロックに追加されて(ステップ320)、
SNP位置2および3を含む新しいブロックFを作製
し、次にこれが分析され、上記工程がまた繰返される。
ここで、ブロックHは情報提供性の閾値を満たさず、候
補SNPハプロタイプブロックのセットに追加されず
(ステップ350)、また他のSNPが分析のためにブ
ロックHに追加されることもない。その代わり、位置3
のSNPのみを含む新しいブロックIが選択されて、上
記工程が繰返される。
【0072】候補SNPブロックのセットが作製された
ら(図3のステップ350)、このセットに対して分析
が行われ、SNPブロックの最終セットが選択される
(図1のステップ160)。SNPブロックの最終セッ
トの選択は、様々な方法で行うことができる。例えば、
再び図4を参照すると、閾値テストを合格するSNP位
置1を含む最も大きなブロック(SNP1、2および3
を含むブロックC)を選択し、同じSNPを含むより小
さなブロック(ブロックAおよびB)を破棄することが
できる。そして、次に選択されるブロックは、情報提供
性についての閾値テストに合格する最も大きなブロック
であるSNP位置4で始まる次のブロック(ブロック
G)であり、同じSNPを含むより小さなブロック(ブ
ロックEおよびF)は破棄される。このような方法によ
り、目的のゲノム領域にまたがり、目的のSNPを含
み、且つ高レベルの情報提供性を有する、最終的な非重
複SNPハプロタイプブロックのセットが得られる。こ
のように、全ての候補SNPハプロタイプブロックが評
価されたら、結果は、好適な実施形態において、元のセ
ットの中の全てのSNPを包含する非重複SNPハプロ
タイプブロックのセットである。孤立体(isolat
e)と呼ばれる幾つかのグループはたった1つのSNP
からなり、定義により情報提供性は1である。他のグル
ープは、100以上のSNPからなり、情報提供性は3
0を超え得る。
【0073】SNPハプロタイプブロックの最終セット
を選択するための他の方法を図5Aおよび図5Bに示
す。まず図5Aのステップ510を見ると、候補SNP
ハプロタイプブロックセット(例えば本願の図3および
図4に記載された方法により作製されたもの)の情報提
供性について分析する。ステップ520において、その
候補セット全体の中で最も高い情報提供性を有する候補
SNPハプロタイプブロックを選択して、最終SNPハ
プロタイプブロックセットに追加する(ステップ53
0)。この候補SNPハプロタイプブロックを最終SN
Pハプロタイプブロックセットのメンバーとして選択し
たら、このブロックを候補ブロックセットから削除し
(ステップ540)、この選択されたブロックと重複す
る全ての他の候補SNPハプロタイプブロックをこの候
補SNPハプロタイプブロックセットから削除する(ス
テップ550)。次に、該候補セットの中に残っている
候補SNPハプロタイプブロックの情報提供性について
分析し(ステップ510)、最も高い情報提供性を有す
る候補SNPハプロタイプブロックセットを選択して最
終ハプロタイプブロックセットに追加する(ステップ5
20および530)。先に記載したように、このSNP
ハプロタイプブロックを最終SNPハプロタイプブロッ
クセットのメンバーとして選択したら、このブロックを
候補ブロックセットから削除し(ステップ540)、こ
の選択されたブロックと重複する全ての他の候補SNP
ハプロタイプブロックをこの候補SNPハプロタイプブ
ロックセットから削除する(ステップ550)。このプ
ロセスは、元のセットの中の全てのSNPを包含する非
重複SNPハプロタイプブロックの最終セットが作製さ
れるまで続けられる。
【0074】図5Bは、図5Aに記載されたSNPハプ
ロタイプブロックの最終セットの選択方法の単純な使用
例を示す。図5Bにおいて、本発明の方法に従い、配列
5’側〜3’側を、SNP、SNPハプロタイプパター
ンおよび候補SNPハプロタイプブロックについて分析
する。この配列中に含まれる候補SNPハプロタイプブ
ロックは、その配列の下のこれらの配置により示され、
文字によって指定される。さらに、文字の後に各ブロッ
クの情報提供性が示される。例えば、候補SNPハプロ
タイプブロックAは、その配列の最も5’側端部に位置
し、情報提供性は1である。候補SNPハプロタイプブ
ロックRは、その配列の最も3’側末端に位置し、情報
提供性は2である。
【0075】図5Aに従い、第1ステップ510におい
て、候補SNPハプロタイプブロックの情報提供性につ
いて分析し、ステップ520で、最も高い情報提供性を
有するSNPハプロタイプブロックを選択して、最終S
NPハプロタイプブロックセットに追加する(ステップ
520および530)。図5Bの場合、情報提供性が6
である候補SNPハプロタイプブロックMが、最終SN
Pハプロタイプブロックセットに追加するために選択さ
れた最初の候補SNPハプロタイプブロックである。S
NPハプロタイプブロックMを選択したら、このブロッ
クはSNPハプロタイプブロックの候補セットから削除
もしくは除外され(ステップ540)、SNPハプロタ
イプブロックMと重複する全ての他の候補SNPハプロ
タイプブロック(ブロックJ、N、K、L、Oおよび
P)は、候補SNPハプロタイプブロックセットから削
除される(ステップ550)。次に、候補SNPハプロ
タイプブロックセットの残りのブロック、つまりSNP
ハプロタイプブロックA、B、C、D、E、F、G、
H、I、QおよびRの情報提供性について分析し、およ
びステップ520において、最も高い情報提供性(情報
提供性5)を有する残りのSNPハプロタイプブロック
Iを選択して最終SNPハプロタイプブロックセットに
追加し(530)、SNPハプロタイプブロックの候補
セットから削除または除外する(ステップ540)。次
に、ステップ550でSNPハプロタイプブロックIと
重複する全ての他の候補SNPハプロタイプブロック
(この場合はブロックH)が、候補SNPハプロタイプ
ブロックセットから削除される。この場合も、候補SN
Pハプロタイプブロックセットの残りのブロック、つま
りSNPハプロタイプブロックA、B、C、D、E、
F、G、QおよびRの情報提供性について分析する。ス
テップ520では、最も高い情報提供性(情報提供性
4)を有する残りのSNPハプロタイプブロック(ブロ
ックF)を選択して最終SNPハプロタイプブロックセ
ットに追加し(530)、SNPハプロタイプブロック
の候補セットから削除または除外する(ステップ54
0)。次に、SNPハプロタイプブロックFと重複する
全ての他の候補SNPハプロタイプブロック(この場合
はブロックE、G、CおよびD)が、候補SNPハプロ
タイプブロックセットから削除され、候補SNPハプロ
タイプブロックセットの残りのブロック、つまりSNP
ハプロタイプブロックA、B、QおよびRの情報提供性
について分析する。このように上記工程が繰返される。
【0076】他の方法を用いて、候補SNPハプロタイ
プブロックのセットから分析用のSNPハプロタイプブ
ロックの最終セットを選択することができる(図1のス
テップ160)。例えば、当分野で公知のアルゴリズム
をこの目的で応用することができる。例えば、最短路ア
ルゴリズムを用いることができる(一般にCorme
n, LeisersonおよびRivest, In
troductionto Algorithms(M
IT Press) pp.514−78(1994)
を参照されたい)。最短路問題において、辺を実数値の
重みにマッピングする重み関数w:E→Rが重みとして
与えられた有向グラフG=(V,E)が与えられる。路
p=(v0,v1,...vk)の重みはその構成辺の重
みの総和である。
【0077】
【数1】
【0078】μからνまでの路がある場合、uからνま
での最短路の重みはδ(u,v)=min w(p)u
→vであり、そうでない場合はδ(us,v)=∞であ
る、として定義される。次に、頂点uから頂点vまでの
最短路は、重みw(p)=δ(u,v)が与えられた任
意の路pとして定義される。辺の重みは、様々な測定基
準、例えば距離、時間、費用、ペナルティ、損失、また
は最小にしたい路に沿って線形に蓄積する任意の他の数
量として解釈することができる。本発明の用途で使用さ
れる最短路アルゴリズムの実施形態において、各SNP
ハプロタイプブロックは、そのブロックの各境界毎に画
定された「辺」を有する「頂点」であると考えられる。
各SNPハプロタイプブロックは、他の各SNPハプロ
タイプブロックとの関係を有し、各エッジ毎に「費用」
を有する。費用は、一般に好まれるパラメータ、例えば
頂点の重複(もしくは重複の程度)または頂点間のギャ
ップ等により決定される。
【0079】単一出発点最短路問題は、所与の出発点で
ある頂点sεVから全ての頂点vεVまでの最短路を決
定する所与のグラフG=(V,E)に焦点を当てる。更
に、単一出発点アルゴリズムの異形を応用することもで
きる。例えば、全ての頂点vから所与の到達点である頂
点tまでの最短路を見つける単一到達点最短路解決法を
応用してもよい。グラフの中の各辺の向きを反対にする
と、この問題が単一出発点問題に還元される。あるい
は、所与の頂点uおよびvのためのuからvまでの最短
路を見つける単一ペア最短路問題を応用してもよい。出
発点が頂点uである単一出発点問題を解決すれば、単一
出発点最短路問題も解決する。また、全ペア最短路法を
使用してもよい。この場合、頂点uおよび頂点vの全て
のペアのためのuからvまでの最短路が見つかる、つま
り、単一出発点アルゴリズムは各頂点から実行される。
【0080】本発明の方法で用いることができる1つの
単一出発点最短路アルゴリズムは、ダイクストラ法であ
る。ダイクストラのアルゴリズムは、全ての辺の重みが
非負である場合、重みが与えられた有向グラフG=
(V,E)に対して単一出発点最短路問題を解決する。
ダイクストラのアルゴリズムは、出発点sから最終的な
最短路の重みが既に決定された頂点のセットSを維持す
る。つまり、全ての頂点vはS,d[v]=δ(s,
v)の要素である。このアルゴリズムは最小最短路推定
値を有するV−Sの要素として頂点uを繰返し選択し、
uをSに挿入し、uから出ている全ての辺を緩和する。
1つの処理系において、V−Sの中の全ての頂点を含む
(それらのd値によりキーイングされた)優先順位付き
待ち行列Qが維持される。この処理系は、グラフGが隣
接リストにより表されると想定する。
【0081】
【数2】
【0082】このように、この場合のGは分析されるゲ
ノム配列の線状網羅度(linear coverag
e)のグラフであり、Sは選択された頂点のセットであ
る。ゲノム配列の特定の領域を網羅する1つの頂点が選
択されたら、この配列と重複する他の頂点を破棄するこ
とができる。
【0083】SNPハプロタイプブロックを選択するた
めに使用することができる他のアルゴリズムとしては、
欲張り法アルゴリズムが挙げられる(再びCorme
n,LeisersonおよびRivest, Int
roduction toAlgorithms (M
IT Press) pp.329−55(1994)
を参照されたい)。欲張りアルゴリズムは、選択肢のシ
ーケンスを作製することにより、ある問題に対する最適
解を得る。このアルゴリズムにおける各決定ポイント毎
に、その時点で最良であると思われる選択肢が選択され
る。このヒューリスティック法は、いつも最適解をもた
らすわけではない。ダイナミックプログラミングにおい
て、選択は各ステップで行われるがその選択は部分問題
に対する解に依存するという意味において、欲張りアル
ゴリズムはダイナミックプログラミングとは異なる。欲
張りアルゴリズムにおいて、その時点でどの選択肢が最
良に見えたとしても、その選択が行われた後に生じる部
分問題は解決される。このように、欲張りアルゴリズム
によってなされた選択は、それまでになされた選択に依
存するが、将来の選択または部分問題に対する解に依存
することはできない。欲張りアルゴリズムの1つの変形
は、ハフマン記号である。ハフマンの欲張りアルゴリズ
ムは、最適な語頭条件を満足する符号を作成し、このア
ルゴリズムは、その最適符号に対応するボトムアップ式
の木Tを構築する。このアルゴリズムは|C|葉のセッ
トから始まって|C|−1「マージング」演算のシーケ
ンスを実行し、最終的な木を作成する。例えば、Cがn
個の文字からなるセットであり、各文字cεCは決めら
れた頻度(frequency)f[c]を有するオブ
ジェクトであると仮定すると、fについてキーイングさ
れた優先順位付き待ち行列Qを用いて2つの最少頻度オ
ブジェクトを同定し、これらをマージングする。2つの
オブジェクトがマージングされたもの(マージャー、m
erger)の結果は、マージングされたこれら2つの
オブジェクトの頻度の合計である頻度を有する新しいオ
ブジェクトである。例えば:
【0084】
【数3】
【0085】2行目は、Cの中の文字を用いて優先順位
付き待ち行列Qを開始する。3〜8行目のforループ
は、この待ち行列から最低頻度の2つの節点xおよびy
を繰返し抽出し、この待ち行列の中のこれらの節点を、
これらのマージャーを表す新しい節点z点に置き換え
る。zの頻度は7行目でxおよびyの頻度の総和として
算出される。節点zはその左側の子としてxをおよびそ
の右側の子としてyを有する。n−1個のマージャーの
後、9行目において、その待ち行列の中に残った1つの
節点(その符号木の根)が戻される。
【0086】また、これらの方法によっても、特定のゲ
ノム領域の中で評価された全てのSNPを包含する最終
的な非重複SNPハプロタイプブロックのセットが得ら
れる。本発明の方法に従ってSNP、SNPハプロタイ
プブロックおよびSNPハプロタイプパターンを選択し
て得られる結果として重要なのは、幾つかの実施形態に
おいてSNPハプロタイプブロックの情報提供性の計算
中に、各SNPハプロタイプブロックおよびパターン毎
の情報提供SNPが決定されることである。情報提供S
NPは、データ圧縮を可能とする。本発明の1つの実施
形態において、p個のパターンを含む各グループから少
なくともlog2p個のSNPを選択する(最も近い整
数に切り上げる)ことにより、遺伝子型/表現型の関連
を予測するのに非常に有力な情報提供SNPからなる1
つのセットが提供される。当業者であれば、他の分析に
おいて、このような部分集合を決定するために空間的に
連続的な基を用いる必要はないことが分かる。例えば、
本発明の幾つかの実施形態において、SNPハプロタイ
プブロックのそれと同じように統計学的に進められる非
隣接SNPのセットはそのDNA鎖上で空間的に連続し
ていないが、それらを同定することが望ましい。
【0087】関連付け調査で使用されるSNPハプロタ
イプブロックを正確に決定する(SNP、SNPハプロ
タイプブロックおよびSNPハプロタイプパターンの正
確なベースラインを作製する)ためには、2〜3以上の
個体DNA鎖を調べる必要がある。図6は、SNPハプ
ロタイプブロックを決定するためおよび情報提供SNP
の選択のために少なくとも約5つの異なるDNA鎖を調
べることの重要性を示す。図6の一番上の部分は、DN
Aの仮定的なストレッチの配列を示すとともに、変異体
の位置を示し、変異体ブロックの境界が引かれている。
しかし、SNPハプロタイプブロックの境界は最初から
分かっているわけではない。配列決定の結果610は、
3つの個体の一倍体DNAを配列決定した結果を表す。
図示したように、一般に、比較的少数の個体を配列決定
した後に、共通SNPの大きなフラクションを同定する
ことが可能である。図6の場合、図6の一番上の部分に
チェックマークで示した各位置のSNPを同定した。
【0088】しかし、更なる個体を評価しない場合、ブ
ロックの境界は、この段階では正しく同定されない。例
えば、この段階でブロック620とブロック630との
間にブロック境界線を引くことができるが(それぞれ最
初のCからGへの変異は最初のGからAへの変異を予言
し、最初のCからTへの変異は第2のCからTへの変異
を予言している)、この段階ではブロック630とブロ
ック640とを区別することはできない。この段階で
は、最初のCからTへの変異は第1および第2のTから
Aへの変異を予言するようである。従って、このブロッ
ク境界線を引くためには、より統計的に有意なサンプル
セットが必要となる。例えば、本発明の方法において、
SNPハプロタイプブロック、SNPハプロタイプパタ
ーンおよび/または情報提供SNPを決定するために分
析されるDNA鎖の数は、複数(例えば少なくとも約5
個または少なくとも約10個)である。好適な実施形態
において、DNA鎖の数は少なくとも16である。より
好適な実施形態において、SNPハプロタイプブロッ
ク、SNPハプロタイプパターンおよび/または情報提
供SNPを決定するために分析されるDNA鎖の数は、
少なくとも25個である。しかし、関連するSNPを同
定してしまえば(即ちSNP発見を行ってしまえば)、
ゲノムDNAの全ストレッチを配列決定しなくても、残
りのサンプル中の変異体位置のみを遺伝子タイピングし
てブロック境界を同定するプロセスを完了することが可
能となる。このような方法の例については、2002年
1月6日に出願された米国特許出願第10/042,8
19号(代理人整理番号1016N−1、発明の名称
「全ゲノムの走査」)を参照されたい。
【0089】他の仮定的なゲノムサンプルの中のSNP
のみについて遺伝子タイピングプロセスを行った結果
を、図6の650に示す。図示されるように、この追加
的な遺伝子タイピングステップを実行することによっ
て、ブロック630とブロック640とを区別すること
が可能となったことが分かる。特に、第1のCからTへ
の変異が第1および第2のTからAへの変異を伴わない
(not track with)が、その代わりに、
最初のCからTへの変異は第2のCからTへの変異のみ
を予言するのに用いることができ(またその逆も可能で
ある)、および最初のTからAへの変異は、第2のTか
らAへの変異を予言するためだけに使用することができ
る(またその逆も可能である)。
【0090】本発明の上記態様に加え、本発明の特定の
実施形態は、データ解析のために曖昧なSNPハプロタ
イプ配列を解決するために使用することができることで
ある。例えば、ゲル配列決定操作またはアレイハイブリ
ダイゼーション実験から得たデータでは、はっきりした
結果が得られないので、SNPは曖昧である。この場合
の「解決する」とは、SNPハプロタイプ配列を、その
SNPハプロタイプ配列が最も密接に関係するSNPハ
プロタイプパターンにマッチングすることにより、SN
Pハプロタイプ配列中の曖昧なSNP位置を解決するこ
とを意味する。さらに、「解決する」とは、データ分析
から曖昧なSNPハプロタイプ配列を削除することを意
味する。
【0091】曖昧なSNPハプロタイプ配列を解決する
1つの実施形態において、SNPハプロタイプ配列は、
パターンセットに追加することが可能となるようデータ
セット中に配置される。このデータセットは、SNPハ
プロタイプパターンへの可能な割当てについて評価しよ
うとする全てのSNPハプロタイプ配列を含む。ここで
図7Aを参照すると、ステップ710において、データ
セット中のSNPハプロタイプ配列は、そのパターンセ
ット中のパターン配列と1つずつ比較される。最初はそ
のパターンセットの中にパターンが1つもないこともあ
るし、幾つかまたは全てのパターン配列が予め分かって
いる場合もある。ステップ720において、「データセ
ットからのSNPハプロタイプ配列はそのパターンセッ
トの中のパターン配列と一致するか?」という問合せが
行われる。答えが「いいえ」である場合、ステップ73
0で、評価されているSNPハプロタイプ配列はそのパ
ターンセットに追加される。答えが「はい」である場
合、他の問合せ「データセットからのSNPハプロタイ
プ配列はそのパターンセットの中の2以上のパターン配
列と一致するか?」が行われる(740)。
【0092】答えが「YES」である場合、データセッ
トからのSNP配列は破棄されるか、または幾つかの実
施形態において、更なるもしくは異なる分析のために保
持される(ステップ750)。2番目の問合せに対する
答えが「NO」である場合、ステップ760において、
そのデータセットからのそのSNP配列は、パターンセ
ットからのそれが一致するパターン配列と比較される。
これらの2つの配列から、曖昧性の数が最も少ないSN
Pが選択され、そのパターンセットの中に配置される
(770)。より多い曖昧性を含むSNP配列は破棄し
てもいし、または幾つかの実施形態において、更なるも
しくは異なるタイプの分析のために保持してもよい。
【0093】解決プロセスは、図7Aおよび図7Bを参
照することにより更に理解することができる。図7Bに
おいて、最初のSNP配列TTCGAが、そのパターン
セットの中に含まれる配列と比較される(ステップ71
0)。この時点で、そのパターンセットの中にパターン
配列が1つも含まれていない場合、TTCGAはそのパ
ターンセットの中のどのパターン配列とも一致しないこ
とになる。従って、このSNP配列TTCGAの存在は
そのデータセットから削除され(または他の分析用に保
持され)、そのパターンセットに追加される(73
0)。これで、そのパターンセットは1つのパターン配
列TTCGAを有することになる。
【0094】再び図7Bを見ると、そのデータセットの
中の第2のSNP配列「T?C??」が、そのパターン
セットの中に含まれる配列と比較される(ステップ71
0)。この時、そのパターンセットの中には1つのパタ
ーン配列「TTCGA」があり、そして「T?C??」
はこの配列に一致する(ステップ720)。このときそ
のパターンセットの中には1つのパターン配列「TTC
GA」しかないので、2番目の問合せ「SNP配列「T
?C??」はそのパターンセットの中の2以上のパター
ン配列と一致するか?」(740)に対する答えは「い
いえ」である。ステップ760で、「T?C??」は
「TTCGA」と比較され、どちらの配列がより多い曖
昧性を有するかを決定する。これは明らかに「T?C?
?」なので、「TTCGA」はそのパターンセットの中
に保持され(770)、「T?C??」は破棄されるか
または更なる分析のために保持される。
【0095】図7Bのデータセットの3番目の配列は
「C????」である。「C????」はまずTTCG
Aと比較され(ステップ710)、「TTCGA」とは
一致しないことが分かったので(720)、そのパター
ンセットに追加される(730)。図7Bの中の4番目
の配列は「CTACA」である。「CTACA」は「T
TCGA」および「C????」(そのパターンセット
の中のパターン配列)と比較され(ステップ710)、
そして「C????」と一致することが分かる(72
0)。ここで2番目の問合せ「「CTACA」は「C?
???」および「TTCGA」の両方に一致するか?」
が行われる(740)。答えは「いいえ」なので、次に
「C????」および「CTACA」が比較され(76
0)、曖昧性が最も少ない配列(この場合「CTAC
A」)がそのパターンセットの中に保持され、「C??
??」は破棄(分析から削除)されるかまたは更なる分
析用に保持される(770)。
【0096】図7Bのデータセット中の5番目のSNP
配列は「?T??A」である。このSNP配列はパター
ン配列「TTCGA」および「CTACA」と比較され
(710)、「TTCGA」および「CTACA」の両
方と一致することが分かる。従って、問合せ「「?T?
?A」はそのパターンセットの中の2以上のパターン配
列と一致するか?」(740)に対する答えは「YE
S」である。ステップ750において、SNP配列「?
T??A」は、更なる分析のために保持されるか、また
は破棄(分析から削除)される。他の解決方法は、例え
ばもし1つのパターン配列が「CCATT?」でありデ
ータセットからのSNP配列が「C?ATTG」である
場合、これらの配列を曖昧性を解決するために「組み合
わせ」(CCATTG)、この「組み合わせ」た配列を
そのパターンセットに追加することを可能とする。更な
るアレイハイブリダイゼーション、配列決定法、または
当分野において公知である他の手法を用いて、曖昧なS
NPヌクレオチド位置を分析することができる。
【0097】SNPハプロタイプブロックおよびパター
ンと表現型との関連付け 同定されたSNPハプロタイプブロック、SNPハプロ
タイプパターンおよび/または情報提供SNPは、様々
な遺伝子分析に用いることができる。例えば、情報提供
SNPを同定してしまえば、これらを関連付け調査のた
めの様々なアッセイにおいて用いることができる。例え
ば、これらの情報提供SNPを尋問するマイクロアレイ
用のプローブを設計することができる。他の例示的アッ
セイとしては、例えばTaqmanアッセイおよびIn
vaderアッセイ(上記に記載)ならびに従来のPC
Rおよび/または配列決定手法が挙げられる。
【0098】幾つかの実施形態において、図1のステッ
プ170に記載したように、同定されたハプロタイプパ
ターンを上記アッセイで用いて、関連付け調査を行うこ
とができる。これは、目的の表現型を有する個体(例え
ば特定の疾患を示す個体または薬物の投与に対して特定
の反応を示す個体)においてハプロタイプパターンを決
定し、これらの個体におけるそのハプロタイプパターン
の頻度を、対照個体群における該ハプロタイプパターン
の頻度と比較することにより、達成することができる。
好ましくは、このようなSNPハプロタイプパターンの
決定は、ゲノム全体で行われるが、ゲノムの特定の領域
のみに関心がある場合は、これらの特定の領域のSNP
ハプロタイプパターンが用いられる。本発明の方法の本
明細書中に開示される他の実施形態に加え、これらの方
法はさらに、表現型の「詳細な分析(dissecti
on)」も可能とする。つまり、特定の表現型は2以上
の異なる遺伝的根拠から生じる場合がある。例えば、あ
る個体における肥満は、X遺伝子中のある欠陥により生
じたものかもしれないが、他の個体における肥満表現型
は、Y遺伝子およびZ遺伝子における突然変異により生
じたものである場合もある。このように、本発明のゲノ
ム走査能力(genome scanning cap
ability)により、類似した表現型についての様
々な遺伝的根拠の吟味を可能とする。ゲノムの特定の領
域が特定の表現型と関連性があることが同定されたな
ら、これらの領域は薬剤発見標的として(図1のステッ
プ180)、または診断マーカーとして(図1のステッ
プ190)使用することができる。
【0099】先の段落に記載したように、関連付け調査
を行う1つの方法は、目的の表現型を示す個体における
SNPハプロタイプパターンの頻度を、対照個体群にお
けるSNPハプロタイプパターンの頻度と比較すること
である。好適な実施形態において、情報提供SNPは、
SNPハプロタイプパターン比較を行うために用いられ
る。情報提供SNPを用いるアプローチは、現在までに
当分野で公知である他の全ゲノム走査もしくは遺伝子タ
イピング法よりも大きな利点を有する。というのは、各
個体のゲノムの30億個の塩基全てを読み取る(または
見つけられる300〜400万個の共通SNPを読む)
代わりに、サンプル集団からの情報提供SNPのみを決
定すれば良いからである。これらの特定の情報提供SN
Pを読み取れば、上記のような特定の実験集団からの統
計学的に正確な関連付けデータの抽出を可能するのに十
分な情報が得られる。
【0100】図8は、本発明の方法を用いて遺伝学的関
連性を決定する1つの方法のある実施形態を示す。ステ
ップ800では、対照集団のゲノムについて情報提供S
NPの頻度を決定する。ステップ810では、臨床集団
のゲノムについて情報提供SNPの頻度を決定する。ス
テップ800および810は、個体の集団において情報
提供SNPを分析するための上記SNPアッセイを用い
ることにより行うことができる。ステップ820におい
て、ステップ800および810から得た情報提供限定
SNPの頻度が比較される。頻度の比較は、例えば各集
団における各情報提供性SNP位置におけるマイナーな
対立遺伝子の頻度(特定のマイナー対立遺伝子を有する
個体数を全個体数で割った)を決定し、これらのマイナ
ー対立遺伝子頻度を比較することにより行うことができ
る。ステップ830において、対照集団および臨床集団
における発生頻度の差を示す情報提供SNPを選択して
分析する。情報提供SNPを選択したら、この情報提供
SNPを含むSNPハプロタイプブロックが同定され、
これを用いて目的のゲノム領域を同定する(ステップ8
40)。これらのゲノム領域を当分野で公知の遺伝学的
方法または生物学的方法により分析し(ステップ85
0)、そしてこれらの領域が薬剤発見標的として(ステ
ップ860)または診断マーカーとして(ステップ87
0)使用することができるかどうかについて分析する
(以下に詳細に説明する)。
【0101】同定したゲノム配列の使用 ゲノム中の1以上の遺伝子座を特定の表現型特徴、例え
ば疾患罹患性遺伝子座等に関連付けたら、その特徴に関
係のあるこれらの遺伝子または調節エレメントを同定す
ることができる。次にこれらの遺伝子または調節エレメ
ントは、疾患の治療のための治療標的として用いること
ができる(図1のステップ180または図8のステップ
860に記載)。本発明の方法により同定されたゲノム
配列は、遺伝子配列(genic sequence)
または非遺伝子配列(nongenic sequen
ce)であっても良い。「遺伝子」という用語は、特定
のポリペプチドをコードするオープンリーディングフレ
ーム(ORF)、イントロン領域、ならびに該コード領
域の範囲を超えて最長で約10kbにもなる遺伝子の発
現の調節に関与する隣接する5’および3’側の非コー
ドヌクレオチド配列(ただし、いずれかの方向にもっと
長く延びる場合もある)を意味するものとする。同定さ
れた遺伝子のORFは、タンパク質構造に影響を及ぼす
ことにより疾患の状態に影響を及ぼし得る。あるいは、
同定された遺伝子の非コード配列または非遺伝子配列
は、タンパク質の発現レベルまたは発現特異性に影響す
ることにより、疾患の状態に影響を及ぼし得る。一般
に、ゲノム配列は、同定された遺伝子を、該遺伝子配列
を含まない他の核酸配列を実質的に含まないように単離
することによって、調査される。該DNA配列は、様々
に利用することができる。例えば、該DNAを用いて生
物学的試料における該遺伝子の発現を検出または定量す
ることができる。特定のヌクレオチド配列の存在につい
て細胞を走査する方法は、文献に十分に記載されてお
り、ここで詳細に述べる必要がないが、例えばSamb
rookらのMolecular Cloning:
A Laboratory Manual (Cold
Spring Harbor Laborator
y, New York)(1989)を参照された
い。
【0102】さらに、該遺伝子の配列(フランキングプ
ロモーター領域およびコード領域を含む)を当分野で公
知である様々な方法で突然変異させて、コードされるタ
ンパク質の発現レベルまたは配列等に、意図する変化を
もたらすことができる。この配列変化は、置換、挿入、
トランスロケーションまたは欠失であってもよい。欠失
は、あるドメインまたはエキソンの全体的欠失などの大
きな変化を含み得る。クローニングされた遺伝子のイン
ビトロ突然変異誘発法は公知である。部位特異的突然変
異誘発のためのプロトコールの例は、Gustinら、
Biotechniques 14:22(199
3); Barany, Gene 37:111−2
3(1985); Colicelliら、Mol.
Gen. Genet. 199: 537−9(19
85); Prentkiら、Gene 29:303
−13(1984); Sambrookら、Mole
cular Cloning: A Laborato
ry Manual (Cold Spring Ha
rbor Press) pp. 15.3−15.1
08(1989); Weinerら、Gene 12
6:35−41(1993); Sayersら、Bi
otechniques 13:592:6(199
2); JonesおよびWinistorfer,
Biotechniques 12:528−30(1
992);およびBartonら、Nucleic A
cids Res. 18:7349−55(199
0)に記載されている。このような突然変異遺伝子を用
いて、そのタンパク質産物の構造/機能の関係を調査し
たり、またはその機能または調節に影響を及ぼす該タン
パク質の特性を変更したりすることができる。
【0103】同定された遺伝子を用いて、得られるポリ
ペプチドの全てまたは一部を産生することができる。タ
ンパク質産物を発現するために、同定された遺伝子を組
み込む発現カセットを用いても良い。発現カセットまた
はベクターは、一般には転写および翻訳開始領域(誘導
可能または構成的なもの)を提供し、この場合、コード
領域は、転写開始領域ならびに転写および翻訳停止領域
の転写制御下において機能上連結されている。これらの
制御領域は、同定された遺伝子にもともと備わっている
ものであっても良いし、また外来起源に由来するもので
あってもよい。
【0104】該ペプチドは、従来法に従って、発現の目
的に応じて原核生物または真核生物内で発現させること
ができる。該タンパク質の大規模生産を行う場合、大腸
菌、B. subtilis、S. cerevisi
ae等の単細胞生物、バキュロウイルスベクターと一緒
に用いた昆虫細胞、または脊椎動物(特に哺乳動物)等
のより高等な生物の細胞(例えばCOS7細胞)を発現
宿主細胞として用いることができる。多くの状況におい
て、真核生物中で該遺伝子を発現させることが望まし
い。なぜなら、真核生物では、該遺伝子は天然の折畳み
構造および翻訳後修飾による恩恵を得るであろうからで
ある。また、小さなペプチドは実験室で合成することも
できる。タンパク質またはその断片が入手できれば、従
来方法に従って、そのタンパク質を単離および精製する
ことができる。発現宿主のライゼートを調製し、HPL
C、排除クロマトグラフィー、ゲル電気泳動法、アフィ
ニティークロマトグラフィーまたは他の精製手法を用い
て、該タンパク質もしくはその断片を精製することがで
きる。
【0105】発現されたタンパク質を抗体産生に用いる
ことができる。この場合、短い断片は特定のポリペプチ
ドに対して特異的な抗体(モノクローナル抗体)の発現
を誘導し、より大きな断片または全タンパク質は、該ポ
リペプチドの全長に対する抗体(ポリクローナル抗体)
の産生を可能とする。抗体は従来法に従って調製され、
この場合、発現されたポリペプチドまたはタンパク質
は、そのまま、もしくは既知の免疫原性キャリア(例え
ばKLH、pre−S HBsAg、他のウイルスタン
パク質または真核生物タンパク質等)とコンジュゲート
させて、免疫原として用いられる。様々なアジュバント
を適当に、一連の注射を注射と共に用いることができ
る。モノクローナル抗体の場合、1以上の追加抗原刺激
注射後に、脾臓を単離し、リンパ球を細胞融合により不
死化させ、親和性の高い抗体結合についてスクリーニン
グする。次に、所望の抗体を産生する不死化細胞(すな
わちハイブリドーマ)を増殖する。さらに詳しいことに
ついてはMonoclonalAntibodies:
A Laboratory Manual, Har
lowおよびLane編(Cold Spring H
arbor Laboratories, Cold
Spring Harbor, N.Y.)(198
8)を参照されたい。所望により、重鎖および軽鎖をコ
ードするmRNAを単離し、大腸菌内でのクローニング
により突然変異させて、これらの重鎖および軽鎖を混合
して該抗体の親和性を更に強化することができる。イン
ビボでの免疫化に代わる抗体の作製方法としては、ファ
ージ「提示」ライブラリーへの結合(通常はインビトロ
・アフィニティー熟成を伴う)が挙げられる。
【0106】同定された遺伝子、遺伝子断片またはこれ
にコードされるタンパク質もしくはタンパク質断片は、
変性疾患および他の疾患を治療するための遺伝子療法に
おいて有用であり得る。例えば、発現ベクターを用いて
同定された遺伝子を細胞内に導入することができる。こ
のようなベクターは一般に、プロモーター配列近くに位
置する、受容者(即ち宿主)のゲノム中への核酸配列の
挿入をもたらすに便利な制限部位を有する。転写開始領
域、標的遺伝子もしくはその断片、および転写終結領域
を含む転写カセットを調製することができる。転写カセ
ットは、例えばプラスミド、レトロウイルス(レンチウ
イルス等)、アデノウイルス等の様々なベクターの中に
導入することができ、該ベクターは、細胞内で一時的ま
たは安定に維持されることができる。該遺伝子またはタ
ンパク質産物は、様々な経路(例えばウイルス感染、マ
イクロインジェクションまたは小胞の融合(fusio
nof vesicle)等)により組織または宿主細
胞中に直接導入することができる。また筋肉内投与のた
めにジェット注射を用いることもできる(Furth
ら、Anal. Biochem, 205:365−
68(1992)に記載)。あるいは、DNAを金微粒
子にコーティングして、粒子衝撃デバイス(parti
cle bombardment device)また
は「遺伝子銃」(文献記載)により皮内に送達すること
ができる(例えばTangら、Nature, 35
6:152−54(1992)を参照されたい)。
【0107】アンチセンス分子を用いて、細胞内におけ
る同定遺伝子の発現をダウンレギュレートすることがで
きる。アンチセンス試薬は、アンチセンスオリゴヌクレ
オチド、特に化学修飾を施した合成アンチセンスオリゴ
ヌクレオチド、またはこのようなアンチセンス分子を発
現する核酸構築物(RNAなど)であってもよい。アン
チセンス分子の組合せ(この組合せは多数の異なる配列
を含み得る)を投与することもできる。
【0108】アンチセンスインヒビターの代わりに、触
媒的核酸化合物(例えばリボザイムやアンチセンスコン
ジュゲートなど)を用いて遺伝子発現を阻害することが
できる。リボザイムをインビトロで合成して患者に投与
しても良いし、または発現ベクター上にコードさせて、
そこからリボザイムを標的細胞内で合成してもよい(例
えば国際特許出願公開番号WO95/23225号)お
よびBeigelmanら、Nucl. Acids
Res. 23:4434−42(1995)を参照さ
れたい)。触媒活性を有するオリゴヌクレオチドの例
は、国際特許出願公開番号第WO95/06764号に
記載されている。金属錯体とアンチセンスオリゴヌクレ
オチドとのコンジュゲート(例えばmRNAの加水分解
を媒介することができるt−ピリジルCu(II)(t
erpyridyl Cu(II))等)は、Bash
kinら、Appl. Biochem. Biote
chnol. 54:43−56(1995)に記載さ
れている。同定された遺伝子配列は遺伝子療法のために
用いる以外に、同定された核酸を用いて遺伝子修飾され
た非ヒト動物を作製して疾患動物モデルを作製したり、
またはタンパク質の機能および調節を調査するために細
胞系において部位特異的遺伝子修飾を行うことができ
る。「トランスジェニック」という用語は、宿主細胞中
に安定に送達された外来遺伝子を有する遺伝子修飾され
た動物を含むものとする。この場合、宿主細胞中におい
て、例えば、修飾タンパク質を産生するために該遺伝子
の配列を変更してもよいし、または該遺伝子は外来プロ
モーターに機能上連結されたレポーター遺伝子であって
もよい。内因性性遺伝子座を変化、置き換えまたは破壊
する相同性組換えにより、トランスゲニック動物を作製
しても良い。あるいは、核酸構築物を無作為にゲノム中
に組み込んでも良い。安定な組込みのためのベクターと
しては、プラスミド、レトロウイルスおよび他の動物ウ
イルス、YAC等が挙げられる。関心が持たれるものと
しては、トランスジェニック哺乳動物(例えばウシ、ブ
タ、ヤギ、ウマ等、および特にラットやマウス等のげっ
歯類)である。
【0109】また遺伝子機能の調査は、非哺乳動物モデ
ル、特に生物学的および遺伝学的に十分に特徴付けられ
ている非哺乳類生物(例えばC. elegans、
D.melanogasterおよびS. cerev
isiae等)を用いることもできる。タンパク質の機
能に関与する生理学的および生化学的経路を決定するた
めに、対象となる遺伝子配列を用いて、対応する遺伝子
機能をノックアウトしたり、または明らかにされた遺伝
子病変を補うことができる。例えば変性疾患の進行を調
査したり、治療法をテストしたり、または薬剤発見のた
めに、補足もしくはノックアウト調査と共に、薬物スク
リーニングを行ってもよい。
【0110】更に、改変された細胞または動物は、タン
パク質の機能および調節の調査において有用である。例
えば、同定された遺伝子の中で一連の小さな欠失および
/または置換を行い、酵素活性、細胞輸送または局在化
などにおける異なるドメインの役割を決定することがで
きる。目的の具体的な構築物としては、遺伝子発現、ド
ミナント−ネガティブ遺伝子突然変異の発現、および同
定遺伝子の過剰発現を遮断するアンチセンス構築物が挙
げられるがこれらに限定されない。また、ある細胞もし
くは組織内において通常は発現されないまたは異常な発
生時期において発現される同定遺伝子またはその変異体
を、該細胞もしくは組織内で発現させることもできる。
さらに、ある細胞の中でその細胞中では通常は産生され
ないタンパク質を発現させることにより、そのタンパク
質の正常な機能に関する情報を提供する細胞内挙動の変
化を誘導することができる。
【0111】構造/機能パラメータを調査するためにタ
ンパク質分子を分析することができる。例えば、ある同
定遺伝子のタンパク質産物を大量に産生することによ
り、そのタンパク質産物に結合するまたは該タンパク質
産物の機能をモジュレートもしくは模倣する基質または
リガンドを同定することができる。薬物スクリーニング
により、例えば影響を受けた細胞内におけるタンパク質
機能に取って代わるもしくは増強する薬剤、またはタン
パク質機能をモジュレートもしくは取り消す薬剤が同定
される。本明細書中で用いられる「薬剤」という用語
は、同定遺伝子または遺伝子産物の生理学的機能を直接
または間接的に変更、模倣またはマスキングすることが
できるあらゆる分子(例えばタンパク質や小分子等)を
指す。一般に、様々な濃度に応じて異なる反応を得るた
めに、複数のアッセイ混合物を異なる濃度の薬剤と平行
に泳動させる。典型的には、これらの濃度の1つが陰性
対照(即ちゼロ濃度または検出レベル未満)として使用
される。
【0112】この目的のために、標識インビトロタンパ
ク質/タンパク質結合アッセイ、タンパク質−DNA結
合アッセイ、電気泳動移動度シフトアッセイ、タンパク
質結合のイムノアッセイ等を含む様々なアッセイを使用
することができる。また、精製されたタンパク質の全て
またはその断片を用いて、三次元結晶構造を決定するこ
ともできる。この三次元結晶構造は、タンパク質または
その一部の生物学的機能を決定するため、分子間の相互
作用をモデリングするため、または膜融合等のために使
用することができる。
【0113】候補となる薬剤は、多くの化学クラスを包
含するが、典型的には、このような薬剤は有機分子や複
合体(好ましくは分子量が50ダルトンを超え且つ約
2,500ダルトン未満である小さな有機化合物)であ
る。候補薬剤は、タンパク質との構造的相互作用に必要
な官能基、特に水素結合を含み、典型的には、少なくと
も1つのアミン、カルボニル、ヒドロキシル、またはカ
ルボニル基、およびしばしばこれらの官能性化学基のう
ちの少なくと2つを含む。候補薬剤はしばしば、炭素環
または複素環式構造および/または芳香族もしくは多環
芳香族構造が、1以上の上記官能基で置換されている。
また候補薬剤は、生体分子(ペプチド、糖類、脂肪酸、
ステロイド、プリン、ピリミジン、およびこれらの誘導
体、構造的類似体または組合せ等を含むがこれらに限定
されない)の中にも見られる。
【0114】候補薬剤は、合成もしくは天然化合物のラ
イブラリーを含む様々な起源から得られる。例えば、種
々の有機化合物および生体分子を無作為的および特異的
に合成するためには、無作為なオリゴヌクレオチドおよ
びオリゴペプチドの発現を含む様々な手段が利用可能で
ある。あるいは、細菌、真菌、植物および動物のエキス
といった形態の天然化合物のライブラリーが入手可能で
あり、また簡単に生成することができる。更に、天然の
または合成したライブラリーおよび化合物を、従来の化
学的、物理的および生化学的手段により簡単に修飾し、
これを用いてコンビナトリアルライブラリーを作製する
ことができる。既知の薬物を、特異的もしくは無作為な
化学修飾(例えばアシル化、アルキル化、エステル化、
アミド化等)にかけて構造的類似体を作製することがで
きる。
【0115】スクリーニングアッセイが結合アッセイで
ある場合、該分子の1以上を、検出可能シグナルを直接
もしくは間接的に発することができる標識に結合させる
ことができる。様々な標識として、放射性同位体、蛍光
体、化学発光体、酵素、特異的結合分子、粒子(例えば
磁性粒子)等が挙げられる。特異的結合分子としては、
ビオチンとストレプトアビジン、ジゴキシンと抗ジゴキ
シン抗体等のペアが挙げられる。特異的結合メンバーの
場合、通常は相補的メンバーを、既知の手法によって検
出され得る分子で標識する。種々の他の試薬をスクリー
ニングアッセイに含めることができる。これらには、最
適なタンパク質−タンパク質結合を容易とするため、お
よび/または非特異的もしくはバックグラウンド相互作
用を低減するために使用される、塩、中性タンパク質
(例えばアルブミン等)、洗浄剤等の試薬が含まれる。
アッセイの効率を上げる試薬(例えばプロテアーゼイン
ヒビター、ヌクレアーゼインヒビター、抗菌剤等)を使
用してもよい。
【0116】薬剤は、薬学的に許容される担体(あらゆ
る全ての溶剤、分散媒、コーティング、抗酸化剤、等張
性剤、吸収遅延剤等と組み合わせても良い。薬学的に活
性な物質のためのこのような媒体および物質の使用は、
当分野において周知である。該活性物質に対して従来の
媒体または薬剤がいずれも適合しない場合でない限り、
本明細書中に記載される治療的組成物および治療方法に
おいて該活性物質が使用できると考えられる。また、組
成物中に補助的な活性成分を組み込むこともできる。
【0117】様々な投与法で使用するための製剤を調製
することができる。製剤は、経口投与、吸入、または注
射(例えば静脈内、腫瘍内、皮下内、腹膜内、筋肉内
等)により投与することができる。治療製剤の投薬量
は、疾患の性質、投与頻度、投与方法、宿主からの薬剤
のクリアランス等に応じて広く異なる。最初の投与量を
多くして、後により少ない維持量を投与してもよい。有
効な投薬レベルを維持するために、用量を1週間または
2週間に1回といった少ない頻度で投与しても良いし、
あるいは用量を小分けにして、毎日または週2回等で投
与してもよい。幾つかのケースにおいて、経口投与は静
脈内投与の場合とは異なる用量を必要とする。本発明の
同定薬剤は、様々な治療投与用製剤に組み込むことがで
きる。より具体的には、適切な薬学的に許容される担体
もしくは希釈剤と組合せた複合体を医薬組成物として調
製し、および固体、半固体、液体または気体状の調製物
(例えば錠剤、カプセル、粉末、顆粒、軟膏、溶液、坐
剤、注射液、吸入剤、ゲル、微小球、エアロゾル等)と
して製剤化することができる。このように、該薬剤の投
与は様々な方法で行うことができる。薬剤は、投与後に
全身をめぐるものであってもよいし、また内植した部位
に活性用量を維持する働きをするインプラントを用いて
局所化させてもよい。
【0118】以下の方法および賦形剤は単に例示的なも
のであり、限定的なものではない。経口用調製物の場
合、薬剤を単独または適当な添加物(例えばラクトー
ス、マンニトール、コーンスターチまたはポテトスター
チ等の従来添加物;結晶セルロース、セルロース誘導
体、アカシアゴム、コーンスターチまたはゼラチン等の
結合剤;コーンスターチ、ポテトスターチまたはカルボ
キシルメチルセルロースナトリウム等の崩壊剤;タルク
またはステアリン酸マグネシウム等の潤滑剤;ならび
に、場合により、希釈剤、緩衝剤、湿潤剤、保存剤およ
び着香料等)と一緒に使用して、錠剤、粉末、顆粒また
はカプセルを作製することができる。
【0119】さらに、薬剤は、水系もしくは非水系溶剤
(例えば植物油や他の類似油、合成脂肪族系酸グリセリ
ド、高級脂肪族系酸のエステルまたはプロピレングリコ
ール等)中にこれらを溶解、懸濁または乳化し、場合に
より従来添加物(例えば可溶化剤、等張剤、懸濁剤、乳
化剤、安定化剤および保存剤)を添加することによっ
て、注射用調製物として製剤化してもよい。さらに薬剤
は、吸入により投与されるエアロゾル製剤に入れて使用
してもよい。本発明により同定された物質は、圧縮され
た許容可能な推進剤(例えばジクロロジフルオロメタ
ン、プロパン、窒素等)中に製剤化することができる。
あるいは、薬剤は様々な基剤(例えば乳化基剤や水溶性
基剤等)と混合して坐剤として調製してもよい。さら
に、本発明の同定物質は、坐剤として直腸内に投与する
ことができる。坐剤は、ココアバター、カーボワックス
およびポリエチレングリコールなどのビヒクル(体温で
溶け且つ室温では固化する)を含み得る。
【0120】持続放出性製剤用のインプラントは当分野
において周知である。インプラントは、生分解性もしく
は非生分解性高分子を用いて微小球、スラブ等として製
剤化される。例えば、乳酸および/グリコール酸のポリ
マーは、宿主による寛容性が高い侵食性ポリマーを形成
する。本発明の同定薬剤を含むインプラントは、薬剤の
局所濃度が身体の他の部分に比べて高くなるように、作
用部位の近くに設置することができる。シロップ、エリ
キシルおよび懸濁液等の、経口もしくは直腸内投与用の
単位用量剤形を提供することができる。この場合、各投
与ユニット(例えばティースプーン1杯分、テーブルス
プーン1杯分、ゲルカプセル、錠剤または坐剤等)は所
定量の本発明の組成物を含む。同様に、注射または静脈
内投与用の単位用量剤形は、滅菌水、食塩水、または他
の製薬上許容可能な担体中の溶液としての組成物中に本
発明の組成物を含み得る。本発明の新規な単位用量剤形
のための仕様は、使用される具体的な化合物、達成した
い効果、ならびに宿主中における各活性薬剤に関係する
薬理学的作用に応じて異なる。
【0121】薬学的に許容される賦形剤(例えばビヒク
ル、アジュバント、担体または希釈剤等)は一般に簡単
に入手可能である。さらに、薬学的に許容される補助剤
(例えばpH調節および緩衝剤等、張度調節剤、安定化
剤、浸潤剤等)も、一般に簡単に入手可能である。
【0122】同定薬剤の治療的用量を、疾患または障害
を患う宿主に投与する。投与は、具体的な疾患に応じ
て、表面塗布または局所もしくは全身投与であってもよ
い。化合物は、適当な期間の間その疾患の進行が実質的
に抑えられるような有効用量で投与される。インビボで
使用する場合は、組成物は医師の指導にもとに獲得およ
び使用されるものとする。用量は使用される特定の薬剤
および製剤、疾患のタイプ、患者の状態等に応じて、副
作用を最小限に抑えつつその疾患もしくは症状を緩和す
るのに十分な量として選択される。治療は短期的なもの
(例えば外傷後の治療等)であっても長期的なもの(例
えば精神分裂病の予防または治療等)であってもよい。
【0123】本発明により同定されるSNPを用いて、
関連する遺伝子の発現パターンおよびその生物の表現型
特徴(例えば疾患罹患性または薬物応答性)に関係のあ
る発現パターンを分析することができる。様々な組織に
おける発現パターンを決定し、遍在的な発現パターン、
組織特異的発現パターン、一時的発現パターン、および
様々な外的刺激(例えば化学物質または電磁放射等)に
より誘導される発現パターンを同定するために使用する
ことができる。このような決定は、その遺伝子および/
またはそのタンパク質産物の機能に関する情報を提供す
る。
【0124】また新しく同定された配列は、診断マーカ
ーとして(すなわち疾患疾患罹患性または薬物応答性な
どの表現型特徴を予測するために)使用することもでき
る。さらに、本発明の方法は、臨床実験のために集団を
等級別に分類するために使用することができる。したが
って、該遺伝子またはその断片は、テストされている生
物のゲノム中に同じ核酸配列が存在するか否かを決定す
るためのプローブとして用いることができる。さらに該
プローブは、その生物の特定の表現型特徴に相関性を有
し得るマーカーの発現レベルを決定するために、テスト
される生物の体内またはその一部(例えば特定の組織や
器官等)におけるRNAもしくはmRNAレベルをモニ
ターするために用いることができる。同様に、該マーカ
ーは、免疫学的方法(ウェスタンブロットや放射線免疫
沈降法等)等の慣習的手法、または遺伝子産物に関係す
る活性を測定するための活性ベースのアッセイを用い
て、タンパク質レベルで分析することができる。さら
に、異なる遺伝的根拠を有する類似疾患の間で表現型が
明確に区別できない場合、本発明の方法を用いてその疾
患を正確に同定することができる。
【0125】また、本発明の方法をヒト以外の生物に対
して用いることができることも明白であろう。例えば、
その生物が動物である場合、本発明の方法は、例えば疾
患に対する耐性/もしくは疾患罹患性、環境耐性(en
vironmental tolerance)、薬物
応答などに関係する遺伝子座を同定するために使用する
ことができる。またその生物が植物である場合、本発明
の方法は、疾患に対する耐性/もしくは疾患罹患性、環
境耐性、および/または除草剤耐性などに関係する遺伝
子座を同定するために使用することができる。
【0126】本発明は、記載された特定の方法論、プロ
トコール、細胞系、動物の種や属、ならびに試薬に限定
されず、様々である、ということを理解されたい。ま
た、本明細書中で使用される用語は、単に特定の実施形
態を説明するためのものであって、本発明の範囲を限定
することを意図するものではなく、本発明の範囲は特許
請求の範囲によってのみ限定されるものとする。
【0127】データベース 本発明は、変異に関する情報、例えばSNP、SNPハ
プロタイプブロック、SNPハプロタイプパターンおよ
び情報提供SNPに関する情報を含むデータベースを含
む。幾つかの実施形態において、本発明のデータベース
は、1以上の表現型特性に関係のある1以上のハプロタ
イプパターンについての情報を含み得る。またデータベ
ースは、所与の変異に関する情報、例えば変異が生じる
全体的な(general)ゲノム領域についての記述
的情報(例えば変異が既知の遺伝子の中に位置するか否
か、近くに既知の遺伝子、遺伝子相同体または調節領域
があるか否か等)等も含み得る。
【0128】本発明のデータベースに含まれ得る他の情
報には、SNP配列情報、SNPハプロタイプパターン
について分析される組織サンプルの臨床状態に関する記
述的情報、またはそのサンプルが由来する患者の臨床状
態が含まれるが、これらに限定されない。データベース
は、異なるパーツ、例えば変異データベース、SNPデ
ータベース、SNPハプロタイプブロックもしくはSN
Pハプロタイプパターンデータベース、および情報提供
SNPデータベース等を含むように設計することができ
る。データベースの構成および構築法は広く入手可能で
あり、例えばAkerblomら(1999)、米国特
許第5,953,727号(本明細書中に参考として全
て組み込まれる)を参照されたい。
【0129】本発明のデータベースは、外側または外部
のデータベースにリンクされていてもよい。図9は、該
データベースに適しおよび本発明のソフトウェアを実行
するコンピュータネットワークの例を示す。コンピュー
タワークステーション902は、イーサネット(登録商
標)905等のローカルエリアネットワーク(LAN)
を介してアプリケーション/データサーバ906に接続
される。プリンタ904はワークステーションに直接ま
たはイーサネット905に接続されていてもよい。LA
Nは、ゲートウェイサーバ907(WAN908とLA
N905との間でファイアウォールとしても機能し得
る)を介してインターネット908などの広域ネットワ
ーク(WAN)に接続され得る。好適な実施形態におい
て、ワークステーションは、インターネット908を介
してThe SNP Consortium (TS
C)またはthe National Center
for Biotechnology Informa
tion 909等の外部のデータソースと通信れてい
てもよい。
【0130】任意の適当なコンピュータプラットフォー
ムを用いて、SNPハプロタイプブロックもしくはパタ
ーン、関連する表現型、そのデータベースの中の他の情
報または入力された情報の間で必要な比較を行うことが
できる。例えば、様々な製造業者から多数のコンピュー
タワークステーションが入手可能であり、例えばSil
icon Graphicsから入手可能なものがあ
る。また、クライアント・サーバ環境、データベースサ
ーバおよびネットワークも広く入手可能であり、本発明
のデータベースに適したプラットフォームである。
【0131】また、本発明のデータベースは、個体にお
けるSNPハプロタイプパターンを同定する情報を提供
するために用いることができ、このように提供された情
報は、その個体の1以上の表現型特性を予測するために
用いることができる。このような方法を用いて、個体の
疾患に対する罹患性/抵抗性および/または薬物応答を
予測することができる。さらに、本発明のデータベース
は、本発明の変異に関係がある1以上の遺伝子の発現レ
ベルに関する情報を含み得る。
【0132】以下の実施例は、本発明の具体的な実施形
態を説明するものであり、材料および方法は本発明を例
示するものであり、本発明の範囲を限定するものではな
い。
【0133】(実施例1) 体細胞ハイブリッドの調製 体細胞遺伝学における標準的な方法を用いて、ヒトDN
A鎖(染色体)を分離して二倍体の状態から一倍体の状
態とした。この場合、チミジンキナーゼ遺伝子について
野生型である二倍体ヒトリンパ芽球細胞系を、チミジン
キナーゼ遺伝子中に突然変異を含む二倍体ハムスター線
維芽細胞系に融合した。得られた細胞の部分集団は、ヒ
ト染色体を含むハイブリッド細胞であった。10%ウシ
胎児血清(FBS)+1×Pen/Strep+10%
グルタミンを加えた10ml DMEMを含む遠心分離
管の中に、ハムスター細胞系A23細胞をピペッティン
グし、5分間1500rpmにて遠心分離し、5mlの
RPMI中に再懸濁し、15mlのRPMI培地を含む
組織培養フラスコ中にピペッティングした。リンパ芽球
細胞を37℃にてコンフルエントになるまで増殖させ
た。同時に、15%FBCS+1×Pen/Strep
+10%グルタミンを加えた10ml RPMIを含む
遠心分離管の中に、ヒトリンパ芽球細胞をピペッティン
グし、5分間1500rpmにて遠心分離し、5mlの
RPMI中に再懸濁し、15mlのRPMIを含む組織
培養フラスコ中にピペッティングした。リンパ芽球細胞
を37℃にてコンフルエントになるまで増殖させた。
【0134】A23ハムスター細胞を調製するために、
増殖培地を吸引し、細胞を10mlのPBSで濯いだ。
次に細胞を2mlのトリプシンで処理し、新しい培地
(HATを含まないDMEM)を含む3〜5個のプレー
トに分け、37℃にてインキュベートした。培地を遠心
分離管に移し、5分間1500rpmにて遠心分離し、
増殖培地を吸引し、細胞を5mlのRPMI中に再懸濁
し、細胞1〜3mlを、20mlのRPMIを含む2つ
のフラスコにピペッティングすることにより、リンパ芽
球細胞を調製した。
【0135】細胞融合を行うために、約8〜10×10
6個のリンパ芽球細胞を1500rpmにて5分間遠心
分離した。次に、細胞をDMEM中に再懸濁し、再びこ
れらを遠心分離してからDMEMを吸引することによ
り、細胞ペレットをDMEMで濯いだ。次にリンパ芽球
細胞を5mlの新しいDMEM中に再懸濁した。受容者
であるA23ハムスター細胞をコンフルエントになるま
で増殖させ、融合する3〜4日前に分裂させ、この時点
で50〜80%コンフルエントであった。古い培地を除
去し、細胞をDMEMで3回濯ぎ、トリプシン処理し、
最後に5mlのDMEMに懸濁した。リンパ芽球細胞を
受容者であるA23細胞上にゆっくりピペッティング
し、合わせた培養物をゆっくりかき混ぜてから37℃に
て1時間インキュベートした。インキュベーション後、
A23細胞から培地を静かに吸引し、片手でプレートを
回しながらプレートのエッジをピペットに付けてPEG
をプレートにゆっくり加えることにより、2mlのPE
G1500(室温)を加えた。プレートを1回転させる
間に全てのPEGを加えるのに約1分かかった。次に、
プレートをゆっくり回しながら8mlのDMEMをプレ
ートのエッジに加えた。細胞からPEG/DMEM混合
物を静かに吸引した後、8mlのDMEMを用いて細胞
を濯いだ。このDMEMを除去し、10mlの新鮮なD
MEMを加えて、細胞を37℃にて30分間インキュベ
ートした。細胞から再びDMEMを吸引し、10% F
BCSおよび1×Pen/Strepを加えた10ml
のDMEMを細胞に加えた後、一晩インキュベートさせ
た。
【0136】インキュベーション後、培地を吸引し、細
胞をPBSで濯いだ。次に細胞をトリプシン処理し、各
プレートに約100,000細胞が入るように、選択培
地(10% FBS+1×Pen/Strep+1×H
ATを加えたDMEM)を含む複数のプレートに分け
た。プレートに入れた後3日目に培地を取り替えた。コ
ロニーが肉眼で見えるようになったら(9〜14日目)
コロニーを取り出して24ウェルプレートに入れた。取
り出したコロニーが5日以内にコンフルエントになった
ら、そのコロニーは健全であるとみなされ、細胞をトリ
プシン処理して6ウェルプレートに移した。
【0137】6ウェルプレート培養物から得た細胞か
ら、DNAおよびストックハイブリッド細胞培養物を調
製した。細胞をトリプシン処理し、10mlの選択培地
を含む容量100mmのプレートとエッペンドルフ試験
管とに分けた。試験管内の細胞をペレット化し、200
μlのPBX中に再懸濁し、Qiagen DNAミニ
キットを用いてスピンカラム1つあたり細胞500万未
満の濃度でDNAを単離した。該100mmプレートを
コンフルエントになるまで増殖させ、細胞を培養し続け
るかまたは冷凍した。
【0138】(実施例2) 一倍体ハイブリッドの選択 単一チップのハイブリダイゼーションにおいて1494
個のマーカーを評点することができる、Affymet
rix, HuSNP遺伝子チップ(Affymetr
ix, Inc., Santa Clara, C
A, HuSNPマッピングアッセイ、試薬キットおよ
びユーザマニュアル, Affymetrix Par
t No. 900194)を用いて、各ハイブリッド
中のヒト染色体の存在、不在および二倍体/一倍体状態
の評点を行った。HuSNPチップハイブリダイゼーシ
ョンアッセイを用いて、対照としてハムスターおよびヒ
ト二倍体リンパ芽球細胞系をスクリーニングした。親リ
ンパ芽球二倍体細胞系中でヘテロ接合性であるSNP
を、各融合細胞系中における一倍体状態(haploi
dy)について評点した。「A」および「B」は各SN
P位置における二者択一の変異体であると仮定する。親
二倍体細胞系において「AB」ヘテロ接合性として存在
するマーカーを、ハイブリッド中において「A」または
「B」(半接合性)として存在する同じマーカーと比較
することにより、各ハイブリッド系において一倍体状態
であるヒトDNA鎖を決定した。
【0139】図11は、2種類のヒト/ハムスター細胞
ハイブリッド(ハイブリッド1およびハイブリッド2)
を、ヒト第21番染色体上の選択されたマーカーについ
てテストした結果を示す。一列目は、HuSNPチップ
マーカーの名称を示す。2列目は、ハムスター細胞核酸
(融合なし)をHuSNPチップとのハイブリダイゼー
ションに用いた場合にシグナルが得られたか否かを示
す。予想通り、ハムスター細胞サンプル中のどのマーカ
ーにもシグナルは見られなかった。三列目は、二倍体親
ヒトリンパ芽球細胞系CPD17において各マーカー毎
にどの変異体が検出されたか(「A」、「B」または
「AB」)を示す。幾つかのケースでは、A変異体のみ
が存在し、幾つかのケースではB変異体のみが存在し、
また幾つかのケースではCPD17細胞がこれらの変異
体についてへテロ接合性(「AB」)であった。最後の
二列は、2種類のヒト/ハムスターハイブリッド(ハイ
ブリッド1およびハイブリッド2)から得た核酸サンプ
ルをHuSNPチップとハイブリダイズさせた結果を示
す。親CPD17細胞系中にA変異体のみが存在する場
合において、A変異体のみが融合体に伝えられたことに
留意されたい。親CPD17細胞系においてB変体のみ
が存在する場合は、B変異体のみが融合体に伝えられ
た。CPD17細胞系がヘテロ接合性である場合は、あ
る融合クローンにはA変異体は伝えられ、他の融合クロ
ーンにはB変異体が伝えられた。ただし、しばしば、こ
の融合プロセスから得られるハイブリッド細胞系の中に
おいて染色体の一部しか存在しないこと、幾つかのハイ
ブリッドは幾つかのヒト染色体もしくはその一部につい
て二倍体であること、幾つかのハイブリッドは他のヒト
染色体もしくはその一部について一倍体であること、な
らびに幾つかのハイブリッドは幾つかの染色体のいずれ
の変異体も持たない場合があること、を理解されたい。
特定のヒト染色体(例えば第21番染色体)の1つの変
異体のみを含むハイブリッドを選択して分析した。さら
に好ましくは、(染色体の一部のみではなく)ある染色
体全体を含むハイブリッドを選択して分析した。
【0140】(実施例3) 長領域PCR(long−
range PCR) ハムスター/ヒト細胞ハイブリッドから得たDNAを用
いて長領域PCRアッセイを行った。長領域PCRアッ
セイは当分野において一般公知であり、例えばベーリン
ガー・マンハイム社のExpand Long Ran
ge PCRキットの標準的な長領域PCRプロトコー
ル(参考としてまたは全ての目的のために本明細書中に
組み込まれる)に記載されている。
【0141】増幅反応に使用されるプライマーを、以下
の通り設計した:所与の配列、例えば第21番染色体上
の23×106塩基のコンティグを、ゲノム中で繰返さ
れる配列(例えばAluおよびLineエレメントな
ど)を認識する当分野で公知のソフトウェアプログラム
(本明細書中において「リピート・マスカー(repe
at masker)」と呼ぶ)に入力した(A.F.
A. SmitおよびP.Green, www. g
enome. washington. edu/uw
gc/analysistools/repeatma
skを参照されたい。これは本明細書中に参考として組
み込まれる)。このプログラムにより、反復配列の各特
定のヌクレオチド(A、T、GまたはC)を「N」に置
換することにより、反復配列を「マスキング」した。次
に、この反復マスキング置換を行った後の配列の出力結
果を、市販されているプライマー設計プログラム(Ol
igo 6.23)に供給し、長さが30ヌクレオチド
を超え且つ融解温度が65℃を超えるプライマーを選択
した。次に、Oligo 6.23から出力された設計
されプライマーを、ゲノムの所与の領域をPCR増幅し
且つ隣接するPC産物と重複する部分が最も少ないプラ
イマー対を「選択する」プログラムに供給した。市販さ
れているプロトコールおよびこのプライマー設計を用い
た長領域PCRの成功率は少なくとも80%であり、ま
たヒト染色体のある部分については95%を超える成功
率が得られた。
【0142】長領域PCRの1つの例示的なプロトコー
ルは、ベーリンガー・マンハイム社のExpand L
ong Template PCR System、カ
タログNo.1681 834、1681 842また
は1759 060を用いる。この手法では、各50μ
LのPCR反応に2つのマスターミックス(maste
r mix)を要する。ある具体的な実施例では、各反
応につき、氷上の1.5mlの微量遠心機試験管の中で
Master Mix 1を調製した。Master
Mix 1は、最終体積で19μLのMolecula
r Biology Grade Water(Bio
Whittaker、カタログNo.16−001
Y)、2.5μLの10mM dNTPセット(dAT
P、dCTP、dGTPおよびdTTPを含む、各10
mM)(Life Technologiesカタログ
No.10297−018)(各dNTPの最終濃度は
400μM)、および50ngのDNA鋳型を含む。
【0143】全ての反応のためにMaster Mix
2を調製し、氷上に維持した。各PCR反応につき、
Master Mix 2は最終体積で25μLのMo
lecular Biology Grade Wat
er(Bio Whittaker)、22.50mM
MgCl2を含む5μLの10×PCR緩衝液3(S
igma、カタログNo. M 10289)、2.5
μLの10mM MgCl2(最終MgCl2濃度は2.
75mM)、および0.75μLの酵素ミックス(最後
に加える)を含む。
【0144】予め混合した6μLのプライマー(2.5
μLのMaster Mix 1を含む)を適当な試験
管に加えた後、25μLのMaster Mix 2を
各試験管に加えた。試験管にキャップをし、混合し、短
時間遠心分離をしてから氷に戻した。この時点で、以下
のプログラムに従ってPCRサイクルを開始した:ステ
ップ1=94℃で3分間鋳型を変性させる;ステップ2
=94℃で30分間;ステップ3=使用したプライマー
に適した温度で30秒間アニーリングする;ステップ4
=68℃にて生成物1kbあたり1分間伸長を行う;ス
テップ5=ステップ2〜4までを38回繰返し、全部で
39サイクル行う;ステップ6=94℃にて30秒間;
ステップ7=30秒間アニーリングする;ステップ8=
68℃にて生成物1kbあたり1分間+さらに5分間伸
長を行う;およびステップ9=4℃に保つ。あるいは、
2段階PCRを行ってもよい:ステップ1=94℃にて
3分間鋳型を変性させる;ステップ2=94℃にて30
秒間;ステップ3=68℃にて生成物1kbあたり1分
間アニーリングおよび伸長を行う;ステップ4=ステッ
プ2〜3を38回繰返し、全部で39サイクル行う;ス
テップ5=94℃にて30秒間;ステップ6=68℃に
て生成物1kbあたり1分間+さらに5分間アニーリン
グおよび伸長を行う;およびステップ7=4℃に保つ。
【0145】ヒト第14番および22番染色体上の様々
な領域の長領域PCR増幅反応の結果を、臭化エチジウ
ムで染色したアガロースゲル上で可視化した(図1
2)。本発明の長領域PCR増幅法は、平均サイズが約
8kbである増幅断片を常套的に生成し、ゲノム領域の
増幅に失敗したのは極めて稀なケースのようであった
(第22番染色体ゲル上のG11を参照されたい)。
【0146】(実施例4) ウェハの設計、製造、ハイ
ブリダイゼーションおよび走査 オリゴヌクレオチドアレイ(チップまたはウェハ)に入
れるオリゴヌクレオチドプローブのセットは、問い合わ
せするヒトDNA鎖配列に基づいて決定した。該オリゴ
ヌクレオチド配列は、一般的に利用可能なデータベース
に報告されているコンセンサス配列に基づいて決定し
た。プローブ配列を決定したら、コンピュータアルゴリ
ズムを用いて、プローブ含有アレイを製造するために使
用される写真平版マスク(photolithogra
phic mask)を設計した。アレイは、固相化学
合成を写真平版製造手法と組み合わせた光誘導化学合成
プロセスにより製造した。例えば国際特許出願公開WO
92/10092号または米国特許第5,143,85
4号;第5,384,261号;第5,405,783
号;第5,412,087号;第5,424,186
号;第5,445,934号;第5,744,305
号;第5,800,992号;第6,040,138
号;および第6,040,193号(あらゆる目的のた
めに、本明細書中に参考として全て組み込まれる)を参
照されたい。一連の写真平版マスクを用いてガラス基板
(ウェハ)上に露光部位を画定した後、特定の化学合成
ステップを行い、このプロセスで、オリゴヌクレオチド
プローブの高密度領域をアレイ上に作製した(各プロー
ブは所定の位置にある)。多数のプローブ領域を同時且
つ平行して合成した。
【0147】この合成プロセスでは、写真平版マスクに
光を通過させて非保護領域中の化学基をこの光により活
性化させることにより、光保護されたガラス基板を選択
的に照射した。次に、選択的に活性化された基板ウェハ
を選択したヌクレオチドと共にインキュベートし、ウェ
ハ上の活性化位置において化学結合を生じさせた。結合
が起こったら、新しいマスクパターンをあてがい、他の
選択されたヌクレオチドを用いて結合ステップを繰返し
た。所望のプローブセットが得られるまでこのプロセス
を繰返した。1つの具体的な実施例において、13番目
の塩基が問い合わせしようとする塩基である場合、25
−merオリゴヌクレオチドプローブを用いた。4つの
プローブを用いて、各配列中に存在する各ヌクレオチド
に問い合わせしたところ、1つのプローブが該配列に相
補的であり、3つのミスマッチプローブは、13番目の
塩基を除いて該相補的プローブと同じであった。幾つか
のケースにおいて、少なくとも10×106個のプロー
ブが各アレイ上に存在した。
【0148】アレイを製造したら、このアレイを、ハム
スター/ヒト細胞ハイブリッドに対して行った長領域P
CR反応により得た生成物にハイブリダイズさせた。分
析しようとするサンプルを標識し、該アレイと共にイン
キュベートして、該サンプルをウェハ上のプローブにハ
イブリダイズさせた。
【0149】ハイブリダイゼーション後、アレイを共焦
高速スキャナ(confocalhigh perfo
rmance scanner)に入れて、ハイブリダ
イゼーションのパターンを検出した。そのサンプルのP
CR産物中に既に組み込まれた蛍光レポーター基(プロ
ーブに結合した)から発せられる光として、ハイブリダ
イゼーションデータを収集した。サンプル中に存在する
ウェハ上のプローブに相補的な配列は、ミスマッチを含
むこれらの配列に比べ、より強力にウェハにハイブリダ
イズし、またより強力なシグナルを生成した。アレイ上
の各プローブの配列および位置は分かっているので、相
補性により、プローブアレイに加えたサンプル核酸にお
ける変異の正体を同定した。本発明で用いられるスキャ
ナおよび走査手法は、当業者には公知であり、例えば米
国特許第5,981,956号(マイクロアレイチップ
について)、米国特許第6,262,838号および米
国特許第5,459,325に開示されている。さら
に、2000年8月3日に出願された米国特許仮出願番
号第60/223,278号および米国特許仮出願番号
第60/223,278号を基に優先権主張し2001
年8月3日に出願された非仮出願(全ウェハ走査のため
のスキャナおよび手法について)もまた、全ての目的の
ために参考として本明細書中に全て組み込まれる。
【0150】(実施例5) ヒト第21番染色体上のS
NPハプロタイプの決定 アフリカ人、アジア人およびカフカス人の染色体の第2
1番染色体の20個の独立したコピーを、SNP発見の
ためおよびハプロタイプ構造について分析した。各個体
から得た第21番染色体の2つのコピーを、げっ歯類/
ヒト体細胞ハイブリッド手法(図10)を用いて物理的
に分離した(上記記載)。この分析のための基準配列
は、32,397,439塩基からなるヒト第21番染
色体ゲノムDNA配列からなるものであった。この基準
配列の反復配列をマスキングし、得られた21,67
6,868塩基(67%)のユニーク配列を、高密度オ
リゴヌクレオチドアレイを用いて変異について分析し
た。8つのユニークオリゴヌクレオチド(各々は25塩
基長)を用いて、ユニークサンプル第21番染色体塩基
の各々(合計で1.7×108個の異なるオリゴヌクレ
オチド)を問い合わせした。これらのオリゴヌクレオチ
ドを、過去に記載されたタイリング法(tiling
strategy)(Cheeら、Science 2
74:610(1996))を用いて、全部で8個の異
なる設計のウェハに分配した。Affymetrix,
Inc.(Santa Clara, CA)より購
入した5インチ四方のガラスウェハ上で、オリゴヌクレ
オチドの光誘導化学合成を行った。
【0151】32.4Mbの第21番染色体の連続的D
NAにまたがる平均10kb長の、重複が最少である3
253個の長領域PCR(LRPCR)産物を作成する
ために、ユニークオリゴヌクレオチドを設計し、上記の
ように調製した。各ウェハのハイブリダイゼーション毎
に、対応するLRPCR産物をプールし、Qiagen
チップ500(Qiagen)を用いて精製した。37
μlの10×One−Phor−All緩衝液PLUS
(Promega)および全量370μlのDNAアー
ゼ(Life Technologies/Invit
rogen)1ユニットを用いて、37℃にて10分間
かけて、全部で280μgの精製DNAを断片化した
後、99℃にて10分間加熱により不活化した。500
ユニットのTdt(ベーリンガー・マンハイム社)およ
び20nmolのビオチン−N6−ddATP(DuP
ont NEN)を用いて37℃にて90分間かけて断
片化生成物の末端を標識し、95℃にて10分間加熱す
ることにより不活化した。標識したサンプルを、10m
M Tris−HCL(pH8)、3M塩化テトラメチ
ルアンモニウム、0.01% Tx−100、10μg
/ml変性ニシン精子DNAを含むウェハ(ウェハ1つ
あたり全量14ml)に50℃にて14〜16時間ハイ
ブリダイズさせた。ウェハを4×SSPE中で手早く濯
ぎ、6×SSPEで10分間ずつ3回洗浄し、ストレプ
トアビジンR−フィコエリトリン(SAPE、5ng/
ml)を用いて室温にて10分間染色した。ストレプト
アビジンに対する抗体(1.25ng/ml)で染色す
ることにより、およびSAPEを用いた染色ステップを
繰返すことにより、シグナルを増幅した。
【0152】1つのウェハ上に存在する塩基に対応する
PCR産物をプールし、1回の反応としてウェハにハイ
ブリダイズさせた。160個のウェハ上で合計3.4×
10 9個のオリゴヌクレオチドを合成し、ヒト第21番
染色体の20個の独立コピーをDNA配列変異について
走査した。長範囲PCRを用いてげっ歯類/ヒトハイブ
リッド細胞系から各ユニーク第21番染色体を増幅し
た。LRPCRアッセイは、Oligo6.23プライ
マー設計ソフトウェアと高〜中程度のストリンジェンシ
ーパラメータとを用いて設計した。得られたプライマー
は、典型的には30ヌクレオチド長であり、融解温度は
65℃を超えるものであった。アンプリコンサイズの範
囲は3kb〜14kbであった。その染色体全体のプラ
イマーデータベースを作製し、ソフトウェア(pPci
ker)を用いて、隣同士のアンプリコンの間の重複が
最少であり第21番染色体配列を最大限にカバーする非
冗長プライマーの最少セットを選択した。あるいは、本
明細書中の実施例3に記載したプライマー選択法を用い
た。若干の変更を加えたExpand Long Te
mplate PCR Kit(ベーリンガー・マンハ
イム社)を用いて、LRPCR反応を行った。特注の共
焦スキャナを用いてウェハを走査した。
【0153】パターン認識アルゴリズムを用いてハイブ
リダイゼーションの変化としてSNPを検出した。過去
に記載されたアルゴリズムの組合せ(Wangら、Sc
ience 280:1077(1998))を用い
て、変化したハイブリダイゼーションパターンに基づい
てSNPを検出した。20個の染色体からなる該サンプ
ルにおいて、全部で35,989個のSNPが同定され
た。これらのヒト多型の位置および配列は、GenBa
nkのSNPdbに寄託されている。ジデオキシ配列決
定を用いて、元のDNAサンプル中のこれらのSNPの
うちの227個の無作為に選んだサンプルを評価し、分
析したSNPのうち220個(97%)を確認した。こ
の3%という低い偽陽性SNP率を達成するためには、
ウェハ上でのSNP検出のために、高い偽陰性率をもた
らすストリンジェント閾値が必要であった。ウェハ上に
存在する全ての塩基の約65%は、SNP検出で使用す
るのに十分高品質なデータを生成し、35%は偽陰性と
して破棄した。分析した全てのサンプルにおいて一貫し
て失敗した長範囲PCRは、この35%の偽陰性率のう
ちの15%を占める。残りの20%の偽陰性は、高品質
データを生成しない塩基(10%)と分析した第20番
染色体の画分のみに高品質データを生成する塩基(10
%)との間に分布している。一般に、ある塩基が高品質
データを生成するか否かを指令するのはその塩基の配列
における前後関係である。全塩基のうちの約20%が一
貫して質の悪いデータをもたらすという知見は、500
塩基の1回のジデオキシ配列決定読取りにおいて塩基の
約30%が信頼性の高いSNP検出にとっては低過ぎる
品質スコアを有するという知見に非常によく似ている
(Altschulerら、Nature 407:5
13(2000))。分析されるサンプルのうちの限ら
れた数しか所与の塩基についての高品質データを生成し
ない場合、より頻繁に見られるSNPに比べて稀少なS
NPを発見するための能力は格段に低下する。その結
果、この方法によるSNP発見は、共通SNPにとって
有利なものである。
【0154】図13Aは、全体的に多様な染色体のサン
プル中で発見された35,989個全てのSNPのマイ
ナー対立遺伝子頻度の分布を表す。ヌクレオチド多様性
の2つの測度(π=1つの部位あたりの平均ヘテロ接合
性;およびθ=集団突然変異パラメータ(the po
pulation mutation paramet
er))を用いて、遺伝学的変異(サンプル中の染色体
の数について正規化した)を推定した(Hartlおよ
びClark, Principles ofPopu
lation Genetics (Sinauer,
Massachusetts, 1997)を参照さ
れたい)。配列決定が完了したゲノム第21番染色体D
NAの32,397,439塩基を200,000塩基
対セグメントに分け、各セグメントにおけるSNP発見
に使用される高品質塩基対を調べた。これらの塩基の観
察されたヘテロ接合性を用いて、各セグメント毎に平均
ヌクレオチド多様性(π)を算出した。全データセット
の平均ヌクレオチド多様性の推定(π=0.00072
3およびθ=0.000798)ならびにヌクレオチド
多様性の分布(第21番染色体の連続的な200,00
0塩基対binsで測定)(図13)は、過去に記載さ
れた値の範囲内であった(The Internati
onal SNP Map Working Grou
p, Nature 409:928−33(200
1))。
【0155】The SNP Consortium
(TSC)により発見された第21番染色体の15,5
49個のSNPの重複の度合いを、この調査で発見され
たSNPと比較した。TSC SNPのうち、5,08
7個は反復DNAの中にあることが分かり、ウェハ上で
タイリングされなかった。残りの10,462個のTS
C SNPのうち、4705個(45%)を同定した。
θの推定値は、分析した連続的DNA配列の162 2
00−kb binsの129についてπ□の推定値よ
りも大きいことが分かった。この差は、近年のヒト人口
の増大と一致し、ヒト遺伝子におけるヌクレオチド多様
性の最近の研究結果と類似している(Stephen
ら、Science 293:489(2001))。
この発見された量のヌクレオチド多様性の場合、43%
のシングルトンが得られるというニュートラルモデルの
期待値(FuおよびLi, Genetics 13
3:693(1993))と比較して、SNPのうち1
1,603個(32%)が、サンプル中において1回観
察されるマイナー対立遺伝子(シングルトン)を有して
いたことが分かった。観測値と期待値との差は、上記の
ようなこの調査における共通SNPに比べて稀少SNP
を同定する能力が低下したことによるものと思われる。
【0156】全部で、32.4Mbのヒトゲノム中に存
在すると推定される10%以上の対立遺伝子頻度を有す
る53,000個の共通SNPのうち47%が同定され
た。これは、International SNP M
apping Working Groupおよびth
e SNP Consortiumにより作製されたコ
レクション中に存在する全てのこのような共通SNPの
うちの18〜20%の推定に匹敵する。網羅度の差は、
本調査がSNP発見のためにより多数の染色体を用いた
ことにより説明される。この知見の反復可能性(rep
licability)を評価するために、元のサンプ
ルセットと同じ多様性パネルから得た第21番染色体の
さらに19個のコピーを含む1つのウェハ設計につい
て、SNP発見を行った。2つのサンプルセットを用い
て、全部で7188個のSNPを同定した。サンプルの
一方のセットで発見された全てのSNPのうち平均で6
6%が第2セットで発見されたが、これは、過去の知見
と一致するものであった(Marthら、Nature
Genet. 27:371(2001)およびYa
ngら、Nature Genet. 26:13(2
000))。予想通り、第2のサンプルセットにおける
SNPの反復(replicate)の失敗は、対立遺
伝子頻度に大きく依存する。一方のサンプルセットにお
いて2回以上存在するマイナーな対立遺伝子を有するS
NPの80%は第2のサンプルセットにおいても発見さ
れたのに対して、1回だけ存在するマイナー対立遺伝子
を有するSNPは第2サンプルセットにおいてその32
%しか発見されないことが分かった。これらの知見は、
2回以上現れるマイナー対立遺伝子を有する該コレクシ
ョン中の24,047個のSNPは、異なる総合的サン
プルにおいて反復率が高いこと、およびこのSNPセッ
トは共通総合ハプロタイプ(common globa
l haplotype)を定義するのに有用であるこ
とを示唆する。SNP発見の過程において、3以上の対
立遺伝子を有すると思われる339個のSNPを同定し
た。これらのSNPはこの分析に含めなかった。
【0157】異なるサンプル中におけるSNPの反復可
能性に加え、SNPのあるコレクションの中の連続的S
NP間の距離は、意味深いハプロタイプ構造を画定する
ために非常に重要である。ハプロタイプブロック(数k
bという短いものであってもよい)は、あるコレクショ
ンの中の連続的SNP間の距離が実際のハプロタイプブ
ロックのサイズに比べて大きい場合、認識されない場合
がある。SNP発見プロセスに反復配列を含めなかった
が、この調査におけるSNPのコレクションは、染色体
全体に非常に均一に分布されていた。図13Cは、完了
した第21番染色体DNA配列の32,397,439
塩基にまたがるSNP網羅度の分布を示す。インターバ
ルは連続的SNP間の距離である。全SNPセットでは
全部で35,988個のインターバルがあり、共通SN
P(すなわちサンプル中に2回以上存在するマイナー対
立遺伝子を有するSNP)セットでは全部で24,04
6個のインターバルがある。連続的SNP間の平均距離
は、全てのSNPを考慮した場合は900塩基であり、
24,047個の共通SNPのみを考慮した場合は13
00塩基であった。この共通SNPセットの場合、ゲノ
ムDNA(反復DNAを含む)中の連続的SNP間のイ
ンターバルのうち93%は4000塩基以下であった
(再び図13Cを参照されたい)。
【0158】二倍体データからのハプロタイプブロック
またはパターンの作製は、任意の2つのヘテロ接合性S
NPの対立遺伝子間の関係を直接観察することができな
いため、複雑になっている。第21番染色体の2つのコ
ピーおよび2つの対立遺伝子AおよびGを1つの第21
番染色体SNPに、ならびに2つの対立遺伝子Aおよび
Gを第2の第21番染色体SNPに有する個体を考え
る。このようなケースでは、第21番染色体の一方のコ
ピーが第1SNPに対立遺伝子Aおよび第2SNPに対
立遺伝子Aを含み且つ第21番染色体の他方のコピーが
第1SNPに対立遺伝子Gおよび第2SNPに対立遺伝
子Gを含むか否か、あるいは第21番染色体の一方のコ
ピーが第1SNPに対立遺伝子Aおよび第2SNPに対
立遺伝子Gを含み且つ第21番染色体の他方のコピーが
第1SNPに対立遺伝子Gおよび第2SNPに対立遺伝
子Aを含むか否か、は明らかではない。この問題を回避
するために用いられる現在の方法は、ハプロタイプ頻度
の統計的推測、ファミリーデータからの直接的な妨害、
および短いセグメントに対する対立遺伝子特異的PCR
増幅を含む。
【0159】これらの複雑性を回避するために、本発明
は、げっ歯類/ヒト体細胞ハイブリッド中で単離された
第21番染色体の一倍体コピー上のSNPを特徴付け
て、これらの染色体の完全ハプロタイプを直接決定でき
るようにした。データセットの中で2回以上現れるマイ
ナー対立遺伝子を有する24,047個のSNPからな
るセットを用いて、図14に示すハプロタイプ構造を画
定した。147個の共通ヒト第21番染色体SNPによ
り定義される20個の独立した全体的に多様な染色体の
ハプロタイプパターンが示されている。147個のSN
PがゲノムDNA配列の106kbにまたがっている。
色付きのボックスの各行は単一のSNPを表す。各行の
黒いボックスはそのSNPのメジャーな対立遺伝子を表
し、白いボックスはマイナー対立遺伝子を表す。行の中
のどこにもボックスがなければ、欠測データであること
を示す。色付きボックスの各列は、単一の染色体を表
し、その染色体上の物理的な順番に従ってSNPが並ん
でいる。連続的SNP間の不変塩基は図中に表わされて
いない。147個のSNPを18個のブロック(黒い水
平のラインにより画定されている)に分ける。第21番
染色体ゲノムDNA配列の中の、1つのブロックの始ま
りとそれに隣接するブロックの終りとを画定する塩基の
位置は、垂直な黒いラインの左側の数字で示されてい
る。図の右側の拡大ボックスは、ゲノムDNAの19k
bにまたがる26個の共通SNPにより画定されるSN
Pブロックを表す。サンプル中に現れる7つの異なるハ
プロタイプパターンのうち、4つの最も共通するパター
ンは、サンプリングした20個の染色体のうちの16個
(すなわちそのサンプルの80%)を含む。黒丸および
白丸は、2つの情報提供SNPの対立遺伝子パターン
(これはこのブロックの中の4つの共通ハプロタイプ間
を明白に区別する)を示す。どの2つの染色体も、これ
ら147個のSNPについて同一ハプロタイプパターン
を共有していなかったが、多数の染色体が共通パターン
を共有する領域が沢山ある。より詳細に分析するため
に、1つのこのような領域(19kbにまたがる26個
のSNPにより画定される)を拡大する(再び図14の
拡大領域を参照されたい)。このブロックは、第20番
染色体中の7つのユニークなハプロタイプパターンを画
定する。データ品質の閾値を合格しなかったためにある
データが欠けているにもかかわらず、全てのケースにお
いて、所与の染色体はこの7つのハプロタイプのうちの
1つに明白に割り当てることができる。4つの最も頻繁
なハプロタイプ(各々は3以上の染色体により表され
る)はそのサンプル中の全ての染色体の80%を占め
る。全部で26個のうちの2つの「情報提供」SNPの
みが、該4つの最も頻繁なハプロタイプを区別するのに
必要である。この例では、これら2つの情報提供SNP
のみから得た情報を用いることにより、頻度の低いハプ
ロタイプを有する4つの染色体が共通ハプロタイプとし
て誤って分類される。にもかかわらず、全ての総合サン
プルのハプロタイプ構造の80%がそのブロックの中の
全SNPの10%未満により定義されるということは注
目すべきことである。4つの共通ハプロタイプの各々が
単一のSNPにより唯一定義されるように3つの情報提
供SNPを選択することができる、幾つかの異なる可能
性がある。これら「3つのSNP」の選択肢のうち1つ
は、プールしたサンプルの遺伝子タイピングを含む実験
において2つのSNP組合せよりも好ましいであろう。
なぜなら、このような状況において、この2つのSNP
の組合せでは4つの共通ハプロタイプの頻度が決定でき
ないからである。従って、本発明は、無作為なSNPマ
ッピングの選択方法に比べて大幅な進歩を提供する。
【0160】まとめると、この特定のアプリケーション
は、ハプロタイプ情報を捕捉するために情報提供SNP
の選択を命令し得るが、そのサンプルの中のハプロタイ
プ情報の大半は、全てのSNPのある非常に小さなサブ
セットの中に含まれることは明白である。また、このS
NPブロックからの2つまたは3つの情報提供SNPを
無作為に選択しても、多くの場合は、該4つの共通ハプ
ロタイプのうちの1つに染色体を唯一割り当てるための
十分な情報が得られない。
【0161】1つの問題は、そのハプロタイプ構造を画
定するのに必要なSNPの合計数を最小限に抑えながら
第21番染色体の全32.4Mbに広がる連続的なSN
Pブロックのセットをどのように画定するかということ
である。1つの実施形態において、この問題を解決する
ために「欲張り」法に基づく最適化アルゴリズムを用い
た。サイズが1SNP以上である物理的に連続するSN
Pからなる全ての可能なブロックについて考慮した。曖
昧なハプロタイプパターンは欠測データとして扱い、網
羅度のパーセンテージを算出する際には含めなかった。
残りの重複ブロックを同時に考慮し、そのブロックの中
に2回以上現れるハプロタイプを唯一識別するのに必要
なSNPの最小数に対するそのブロックの中の全SNP
の比が最大であるブロックを選択した。選択されたブロ
ックと物理的に重複する残りのブロックを捨て、ギャッ
プを持たず且つ全てのSNPがブロックに割り当てられ
た、第21番染色体の32.4Mbをカバーする連続的
な非重複ブロックのセットが選択されるまで、このプロ
セスを繰返した。サンプルのサイズを染色体20個とす
ると、このアルゴリズムは、ブロック1つあたり最大で
10個の共通ハプロタイプパターン(各々は2つの独立
染色体により表される)を生成する。
【0162】このアルゴリズムを24,047個の共通
SNPからなるデータセットに適用し、第21番染色体
にまたがる4,135個のSNPブロックを画定した。
全部で589個のブロック(全ブロックの14%を占め
る)は、ブロック1つあたり11以上のSNPを含み、
全32.4Mbの44%を含む。これに対し、2,13
8ブロック(全ブロックの52%を占める)は、ブロッ
ク1つあたり3個未満のSNPを含み、該染色体の物理
的長さのたった20%しか構成しない。最も長いブロッ
クは114個の共通SNPを含み、ゲノムDNAの11
5kbにまたがる。全般的にみて、1つのブロックの平
均物理的サイズは7.8kbである。ブロックのサイズ
は染色体上におけるその順序には関係が無く、染色体の
全長に沿って、大きなブロックの間には小さなブロック
が散在している。ブロック1つあたり平均2.7個の共
通ハプロタイプパターン(複数の染色体上で観察される
ハプロタイプパターンとして定義される)がある。平均
で、あるブロックの中の最も頻度が高いハプロタイプパ
ターンは、サンプル中の20個の染色体のうち9.6個
の染色体によって表され、2番目に頻度の高いハプロタ
イプパターンは、4.2個の染色体によって表され、
(あれば)3番目に頻度の高いハプロタイプパターン
は、2.1個の染色体によって表される。全体的に多様
な染色体のこのような大きな割合は、このように限定さ
れたハプロタイプの多様性によって表されるという事実
は、注目に値する。この知見は、ハプロタイプパターン
頻度を考慮したときに、313個のヒト遺伝子からなる
コレクションの中で観察されるハプロタイプパターンの
82%が全ての人種グループにおいて観察される一方
で、ハプロタイプの8%のみは集団特異的である、とい
う観察結果と一致する(Stephensら、Scie
nce 293:489−93(2001))。得られ
たブロックパターンに対して及ぼす該ハプロタイプアル
ゴリズムのパラメータの影響を測定するために幾つかの
実験を行った。共通ハプロタイプにより網羅される必要
がある染色体の割合は様々であり、最初は80%から、
70%および90%であった。予測した通り、より完全
な網羅度を必要とすると、多少大きな数のより短いブロ
ックができる。そのサンプル中のマイナー対立遺伝子の
頻度が少なくとも20%である16,503個のSNP
のみを用いたところ、ある程度長いブロックになった
が、ブロック1つあたりのSNPの数はそれほど変わら
なかった。約3Mbの1つの領域について、この20個
染色体分析に匹敵させるために、少なくとも10%の頻
度を有する共通ハプロタイプおよびSNPについての3
8個の染色体のより奥行きのあるサンプルを分析した。
得られたブロックサイズの分布は、最初の結果とほぼ一
致していた。また、各SNPにある非曖昧対立遺伝子の
順序を変えた(permute)後にハプロタイプブロ
ック発見に使用するという無作為なテストを行った。こ
の分析では、ブロックの94%が3個未満のSNPを含
み、1つのブロックのみが6個以上のSNPを含んでい
た。これは、データ中に見られる大きなブロックは、偶
然(by chance association
s)、または本発明のブロック選択法のアーチファクト
としては生成され得ない、ということを立証するもので
ある。
【0163】大きなブロックおよび小さなブロックの両
方において遺伝子が比例的に現れるか否かを決定するた
めに、11個以上のSNP、3〜10個のSNP、およ
び3個未満のSNPをそれぞれ含むブロックにおけるエ
キソン塩基の数で決定を行った。エキソン塩基は、3〜
10個のSNPを含むブロック中の全塩基に比べてある
程度過剰に表れる(over−represente
d)(並べ替えテスト(permutation te
st)で測定したところ、p<0.05)。
【0164】共通ハプロタイプ情報(全32.4Mbに
わたる該サンプルの80%を超える部分を含み且つ該サ
ンプル内に2回以上存在するハプロタイプの完全な情報
として定義される)の所望の割合を捕捉するために、ブ
ロック内のハプロタイプ構造の知識に基づいて、24,
047個の共通SNPのサブセットを選択することがで
きる。図15は、第21番染色体の32.4Mbについ
ての共通ハプロタイプ情報を捕捉するために必要なSN
Pの数を表す。各SNPブロック毎に、2回以上存在す
るそのブロックの中のハプロタイプを明白に識別するの
に必要なSNPの最小数(すなわち共通ハプロタイプ情
報)を決定した。これらのSNPは、そのブロックによ
り画定される合計物理的距離の割合についての共通ハプ
ロタイプ情報を提供する。最も大きな物理的距離につい
ての共通ハプロタイプ情報を提供するSNPから始め
て、物理的網羅度(すなわちカバーされる割合)の累進
的増加を、追加したSNP(すなわち必要なSNP)の
数に関してプロットする。遺伝子DNA(genic
DNA)は各既知の第21番染色体遺伝子の最初のエキ
ソンの5’側の10kbから始まりその遺伝子の最後の
エキソンの3’側の10kbに延びる全てのゲノムDN
Aを含む。例えば、全ての共通ハプロタイプ情報を捕捉
するには最低でも4,563個のSNPが必要とされる
が、3個以上のSNPを含むブロック内の共通ハプロタ
イプ情報(32.4Mbの81%をカバーする)を捕捉
するためには2793個のSNPしか必要としない。遺
伝子DNA中の全ての共通ハプロタイプ情報(約220
個の異なる遺伝子を表す)を捕捉するためには、合計1
794個のSNPが必要である。
【0165】本発明は、共通疾患遺伝子(common
disease gene)等の表現型をマッピング
する全ゲノムの関連付け調査に特に適している。このア
プローチは、共通する遺伝子変異体が共通する疾患に対
する罹患性に関与するという仮説に基づく(Risch
およびMerikangas, Science 27
3:1516(1996), Lander, Sci
ence 274:536(1996))。非関連ケー
スおよび対照における遺伝子変異体の頻度を比較するこ
とにより、遺伝学的関連付け調査は、疾患において重要
な役割を果たすヒトゲノム中の特定のハプロタイプを同
定することができる。このアプローチは単一候補遺伝子
を疾患に関連付けることに成功したが(Altschu
lerら、Nature Genet. 26:76
(2000))、ヒトDNA配列が近年入手可能となっ
たことにより、全ゲノムを調査することが可能となり、
遺伝学的関連付け分析の能力を大幅に飛躍させた(Kr
uglyak, Nature Genet. 22:
139(1999))。この方法の実施を制限する主な
要因は、ヒトゲノムのハプロタイプ構造の知識(これ
は、分析用の適当な遺伝子変異体を選択するために必要
である)に乏しいことであった。本発明は、高密度オリ
ゴヌクレオチドアレイと体細胞の遺伝子サンプルの調製
とを組み合わせることにより、ヒトゲノムの共通ハプロ
タイプ構造を経験的に画定する高分解能アプローチ(h
igh−resolution approach)を
提供することを示す。
【0166】単純なハプロタイプ構造を有するゲノム領
域の長さは非常にまちまちであるが、共通SNPの稠密
セットにより、世界人口の80%がたった3つの共通ハ
プロタイプにより描写されるヒトゲノムのブロックを定
義する体系的なアプローチを可能とする。一般に、この
実施形態に用いられる特定のアルゴリズムを適用する場
合、任意のブロックの中で最も一般的なハプロタイプ
は、個体の50%において見られ、2番目に一般的なハ
プロタイプは個体の25%において見られ、および3番
目に一般的なハプロタイプは個体の12.5%において
見られる。ブロックはその遺伝子情報の内容に基づいて
定義されるのであって、この情報がどのように生じたの
かということや何故存在するのかということについての
知識に基づくものではない、ということに留意すること
は重要である。従って、ブロックは絶対的な境界を持た
ず、特定の用途に応じて様々な方法で画定することがで
きる。この実施形態におけるアルゴリズムは、沢山の可
能なアプローチのうちのたった1つを提供するに過ぎな
い。これらの結果は、全ての共通ハプロタイプ情報を捕
捉するために、SNPの非常に稠密なセットが必要であ
ることを示している。しかし一方では、この方法を用い
て、総合的な全ゲノムの関連付け調査に有用なSNPの
もっと小さな部分集合を同定することができる。
【0167】当業者であれば、ヒト第21番染色体に適
用された手法をヒトゲノムの全ての染色体に適用するこ
とができることが容易に分かるであろう。本発明の好適
な実施形態において、ヒト種(human speci
es)を多様な集団の代表の多数の全ゲノムを用いて、
ヒト種の全てまたは大部分のメンバーに共通するSNP
ハプロタイプブロックを同定する。幾つかの実施形態に
おいて、SNPハプロタイプブロックは、低い頻度で現
れるSNPを除外することにより、古来のSNP(an
cient SNP)に基づく。古来のSNPは、その
SNPを保有する生物に何らかの選択的利益を与えるた
め、ゲノム中で保存されているので重要であると思われ
る。
【0168】(実施例6) 遺伝子治療および薬剤発見
に関連遺伝子を用いる 本発明の方法を用いるための1つの例を、この予想実施
例(prophetic example)で概説す
る。20個の一倍体ゲノムに対してSNP発見を行い、
SNPハプロタイプブロック、SNPハプロタイプパタ
ーン、情報提供SNPおよび各情報提供SNPのマイナ
ー対立遺伝子の頻度を決定するための本発明の方法によ
り、50個の一倍体ゲノムを分析する。これら50個の
一倍体ゲノムは、この調査の対照ゲノムである(図13
のステップ1300を参照されたい)。
【0169】次に、肥満表現型を有する500個の個体
から得たゲノムDNAを、上記のように長距離(lon
g distance)PCRおよびマイクロアッセイ
を用いて、変異体について分析し(Lipshutzら
に付与された米国特許第6,300,063号、および
Cheeらに発行された米国特許第5,837,832
号も参照されたい)、各情報提供SNPのマイナー対立
遺伝子の頻度をこの臨床集団について決定する(図13
のステップ1310を参照されたい)。これら2つの集
団の情報提供SNPのマイナー対立遺伝子頻度を比較
し、対照集団および臨床集団が、3つの情報提供SNP
位置において統計的に有意な差を有することを決定する
(ステップ1320および1330)。対照集団および
臨床集団のマイナー対立遺伝子頻度の差が最も大きなS
NP位置を選択して分析する。
【0170】選択された情報提供位置は、レプチン遺伝
子のコード領域(4kb)および該コード領域の5’側
の非コード配列(1kb)にまたがることが判明したS
NPハプロタイプブロックの中に含まれる(ステップ1
340)。この領域内に含まれる変異の分析は、この領
域の中のあるSNP位置にあるGがレプチン遺伝子のプ
ロモーターの破壊に関与しており、レプチンタンパク質
の発現がこれに比例して低下していることを示す。
【0171】皮膚生検により被験者から繊維芽細胞を得
る。得られた組織を組織培養培地中に入れ、小片に分け
る。この組織小片を、培地を含む組織培養フラスコの湿
った表面の底に入れる。室温にて24時間後、新しい培
地(例えば10% FBS、ペニシリンおよびストレプ
トマイシンを加えたHam’s F12培地)を加え
る。次に組織を37℃にて約1週間インキュベートす
る。このとき、新しい培地を加え、続いて数日おきに新
しい培地に換える。さらに2週間培養した後、繊維芽細
胞の単層が現れる。この単層をトリプシン処理し、大き
なフラスコに移す。
【0172】モロニーネズミ白血病ウイルスから得たベ
クター(このベクターはカナマイシン耐性遺伝子を含
む)を制限酵素で消化し、発現させる断片をクローニン
グする。消化されたベクターを仔ウシ腸ホスファターゼ
で処理し、自己ライゲーションを防ぐ。脱リン酸化した
線状ベクターをアガロースゲル上で分離・精製する。レ
プチンcDNA(活性レプチンタンパク質産物を発現す
ることができる)を単離する。断片の末端を修飾し、必
要であればベクター中にクローニングする。等モル量の
モロニーネズミ白血病ウイルスの線状主鎖(backb
one)およびレプチン遺伝子断片を混ぜ合わせ、T4
DNAリガーゼを用いてつなげる。このライゲーショ
ン混合物を用いて大腸菌を形質転換した後、この細菌
を、カナマイシン含有寒天上に接種する。カナマイシン
の表現型および制限分析により、このベクターの中にレ
プチン遺伝子がきちんと挿入されたか否かを確かめる。
【0173】10%仔ウシ血清、ペニシリンおよびスト
レプトマイシンを加えたダルベッコ改変イーグル培地
(DMEM)中で組織培養を行い、パッケージング細胞
をコンフルエントな密度になるまで増殖させる。レプチ
ン遺伝子を含むベクターを標準的手法によりパッケージ
ング細胞中に導入する。このパッケージング細胞に新し
い培地を加え、適当な時間インキュベートした後、コン
フルエントなパッケージング細胞のプレートから培地を
回収する。感染性ウイルス粒子を含む培地をMilli
poreフィルタで濾過して剥離したパッケージング細
胞を除去した後、線維芽細胞を感染させるために用い
る。線維芽細胞が準コンフルエント状態のプレートから
培地を除去し、濾過した培地に素早く取り替える。形質
導入を容易とするためにポリブレン(Aldrich)
を培地に入れても良い。適当な時間インキュベートを行
った後、培地を除去して新しい培地に取り替える。ウイ
ルス力価が高ければ、事実上全ての線維芽細胞が感染し
ており、選択の必要はない。力価が低ければ、選択マー
カー(例えばneoやhis等)を有するレトロウイル
スベクターを用いて、増殖するための形質導入細胞を選
択する必要がある。
【0174】次に、遺伝子操作した線維芽細胞を、単独
で、またはマイクロキャリアビーズ(例えばcytod
ex 3ビーズなど)上でコンフルエントになるまで増
殖した後、個体中に導入する。注入された線維芽細胞は
レプチン産物を生成し、該タンパク質の生物学的作用が
その宿主に伝達される。
【0175】代替的にまたは更に、レプチン遺伝子を単
離し、発現ベクター中にクローニングして、レプチンポ
リペプチドを産生するために使用する。発現ベクターは
上記に開示したように、適切な転写および翻訳開始領域
ならびに転写および翻訳停止領域を含む。単離したレプ
チンタンパク質をこのように産生して、該タンパク質に
結合する物質を同定するか、あるいは遺伝子操作された
レプチン遺伝子およびタンパク質を発現する細胞を、物
質を同定するアッセイで用いる。このような物質は、例
えば候補物質を単離したレプチンポリペプチドに、ポリ
ペプチド/化合物複合体を形成するのに十分な時間接触
させ、そして該複合体を検出することによって同定され
る。ポリペプチド/化合物複合体が検出されたら、レプ
チンポリペプチドに結合する化合物を同定する。この方
法によって同定された物質は、レプチンの活性をモジュ
レートする化合物を含み得る。このようにスクリーニン
グされた物質は、ペプチド、炭水化物、ビタミン誘導
体、および他の小分子または医薬物質である。物質を同
定するための生物学的アッセイに加え、物質を、レプチ
ンタンパク質の立体構造に基づいて、タンパク質モデリ
ング手法を用いて選択された候補物質を選択することに
よって予めスクリーニングしてもよい。
【0176】レプチンタンパク質に結合する物質の同定
に加え、レプチン遺伝子に結合して遺伝子発現を制御す
る配列特異的またはエレメント特異的物質も同定され
る。核酸結合物質の1つのクラスは、レプチンmRNA
にハイブリダイズして翻訳を遮断する塩基残基を含む物
質である(例えばアンチセンスオリゴヌクレオチド
等)。核酸結合物質の他のクラスは、DNAと3重らせ
んを形成して転写を遮断するものである(3本鎖オリゴ
ヌクレオチド(triplex oligonucle
otides))。このような物質は通常20〜40個
の塩基を含み、古典的なホスホジエステル、リボ核酸主
鎖に基づくものであるか、或いは塩基結合能を有する種
々のスルフヒドリル誘導体またはポリマー誘導体であっ
てもよい。
【0177】更に、レプチン遺伝子に特異的にハイブリ
ダイズする対立遺伝子特異的オリゴヌクレオチドおよび
/または変異体レプチンタンパク質に特異的に結合する
物質(例えば変異体特異的抗体)を診断薬として用いる
ことができる。対立遺伝子特異的オリゴヌクレオチドを
調製および使用するための方法、ならびに抗体の調製方
法は上記に記載済みであり、当分野において公知であ
る。
【0178】この明細書中に記載した全ての特許および
出版物は、本発明が属する分野において通常の知識を有
する者のレベルを示す。全ての特許および出版物は、各
々の出版物が特に且つ個々に本明細書中に組み込まれる
ものとする旨を注記したものとして、本明細書中に組み
込まれる。
【0179】本発明は、個々の変異を同定し、SNPハ
プロタイプブロックを決定し、ハプロタイプパターンを
決定し、そしてさらにこのSNPハプロタイプパターン
を用いて情報提供SNPを同定することによってゲノム
全域の関連付け調査を行うための非常に進歩した方法を
提供する。従来公知でない実用的且つコストが低い方法
で、該情報提供SNPを用いて疾患および薬物応答の遺
伝的根拠を詳細に分析することができる。上記説明は例
示的なものであって限定的なものではないことを理解さ
れたい。上記説明を読めば当業者には多くの実施形態が
自明であろう。従って本発明の範囲は、上記説明を参照
して決定されるのではなく、特許請求の範囲を参照して
決定されるべきものであり、このような特許請求の範囲
の権利が及ぶ同等物の全ての範囲を含むものとする。
【0180】
【配列表】 SEQUENCE LISTING <110> Perlegen Sciences, Inc. PATIL, Nila COX, David R. BERNO, Anthony J. HINDS, David A. FODOR, Stephen P. A. <120> Methods for Genomic Analysis <130> 054801-5001 <150> US 60/280,530 <151> 2001-03-30 <150> US 60/313,264 <151> 2001-08-17 <150> US 60/327,006 <151> 2001-10-05 <150> US 60/332,550 <151> 2001-11-26 <160> 7 <170> PatentIn version 3.1 <210> 1 <211> 13 <212> DNA <213> Artificial sequence <220> <223> Sample SNP Haplotype: W <400> 1 agattcgata acg 13 <210> 2 <211> 13 <212> DNA <213> Artificial sequence <220> <223> Sample SNP Haplotype: X <400> 2 agactacata acg 13 <210> 3 <211> 13 <212> DNA <213> Artificial sequence <220> <223> Sample SNP Haplotype: Y <400> 3 tatttcgata acg 13 <210> 4 <211> 13 <212> DNA <213> Artificial sequence <220> <223> Sample SNP Haplotype: Z <400> 4 tatctacaat cac 13 <210> 5 <211> 13 <212> DNA <213> Artificial sequence <220> <223> SNP sequence <400> 5 agtaacccct ttt 13 <210> 6 <211> 13 <212> DNA <213> Artificial sequence <220> <223> SNP sequence <400> 6 actgacccct ttt 13 <210> 7 <211> 13 <212> DNA <213> Artificial sequence <220> <223> SNP sequence <400> 7 agtgactctt taa 13
【図面の簡単な説明】
【図1】本発明の方法の1つの実施形態の概略図であ
り、変異体の位置の同定から変異体と表現型との関連付
け、薬剤発見標的を同定するためまたは診断マーカーと
してこの関連付けの使用を示している。
【図2】本発明に従ったサンプルSNPハプロタイプブ
ロックおよびSNPハプロタイプパターンを示す。
【図3】SNPハプロタイプブロックの選択方法の一実
施形態を示す概略図である。
【図4】図3に示した方法の一実施形態の単純な使用を
示す。
【図5A】SNPハプロタイプブロックの最終セットを
選択するための方法の一実施形態の概略図である。
【図5B】図5Aに示した方法の簡単な使用であり、図
中に示した「文字:数字」は、各ブロックの「ハプロタ
イプブロックID:情報提供値」を示す。
【図6】本発明の一実施形態に従って情報提供SNPが
どのように選択されるのかを示す例である。
【図7A】変異体の曖昧性および/またはSNPハプロ
タイプパターンの曖昧性を解決する一実施形態を示す概
略図である。
【図7B】図7Aに示した方法の簡単な使用を示す。
【図8】関係付けの調査における本発明の方法の使用の
一実施形態の概略図である。
【図9】本発明の幾つかの実施形態を実行するのに適し
た例示的なコンピュータネットワークシステムを示す。
【図10】体細胞ハイブリッドの構築を示す概略図であ
る。
【図11】Affymetrix, Inc社のHuS
NP遺伝子チップを用いたハムスター/ヒト細胞ハイブ
リッドのスクリーニングにより得た結果の一部を示す表
である。
【図12】長範囲PCRを用いたヒト第22番染色体お
よびヒト第14番染色体のゲノムDNAの様々な増幅ゲ
ノム領域の例を示す。
【図13A】SNPのマイナー対立遺伝子(変異体)の
頻度に対してプロットしたSNPのパーセンテージを示
す棒グラフである。
【図13B】200kbインターバルにおけるヌクレオ
チドの多様性の関数として該インターバルのパーセンテ
ージを示すグラフである。
【図13C】インターバルの長さに対してプロットした
全てのインターバルのパーセンテージを示す棒グラフで
ある。
【図14】147個の共通ヒト第21番染色体SNPに
より定義される20個の独立した全体的に多様な染色体
のハプロタイプパターンを示す。
【図15】網羅される染色体の割合を、その網羅度に必
要なSNPの数の関数としたプロットである。
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 60/332550 (32)優先日 平成13年11月26日(2001.11.26) (33)優先権主張国 米国(US) (72)発明者 ニラ パティル アメリカ合衆国, カリフォルニア州, マウンテン ヴュー, スティアリン コ ート 2021 パーレジェン サイエンシー ズ インコーポレイテッド内 (72)発明者 デヴィッド アール. コックス アメリカ合衆国, カリフォルニア州, マウンテン ヴュー, スティアリン コ ート 2021 パーレジェン サイエンシー ズ インコーポレイテッド内 (72)発明者 アンソニー ジェイ. バーノ アメリカ合衆国, カリフォルニア州, マウンテン ヴュー, スティアリン コ ート 2021 パーレジェン サイエンシー ズ インコーポレイテッド内 (72)発明者 デヴィッド エー. ハインズ アメリカ合衆国, カリフォルニア州, マウンテン ヴュー, スティアリン コ ート 2021 パーレジェン サイエンシー ズ インコーポレイテッド内

Claims (49)

    【特許請求の範囲】
  1. 【請求項1】 SNPハプロタイプパターンを選択する
    ための方法であって、 複数の異なる起源から実質的に同じ核酸鎖を単離して分
    析する工程、 各核酸鎖の中の2以上のSNP位置を決定する工程、 SNPハプロタイプブロックを形成する、前記核酸鎖の
    中の連鎖したSNP位置を同定する工程、 孤立したSNPハプロタイプブロックを同定する工程、 各SNPハプロタイプブロックおよび孤立したSNPハ
    プロタイプブロック中に生じるSNPハプロタイプパタ
    ーンを同定する工程、ならびに異なる起源源から得た前
    記実質的に同じ核酸鎖の少なくとも2つにおいて生じる
    各同定されたSNPハプロタイプパターンを選択する工
    程、を含む、上記方法。
  2. 【請求項2】 前記第1の同定工程が、欲張りアルゴリ
    ズムまたは最短路アルゴリズムにより決定される、請求
    項1記載の方法。
  3. 【請求項3】 前記SNPハプロタイプブロックが重複
    しない、請求項1記載の方法。
  4. 【請求項4】 前記実質的に同じ核酸鎖が少なくとも約
    10〜約100個の異なる起源に由来する、請求項1記
    載の方法。
  5. 【請求項5】 前記実質的に同じ核酸鎖が少なくとも約
    16個の異なる起源に由来する、請求項4記載の方法。
  6. 【請求項6】 前記実質的に同じ核酸鎖が少なくとも約
    25個の異なる起源に由来する、請求項5記載の方法。
  7. 【請求項7】 前記実質的に同じ核酸鎖が少なくとも約
    50個の異なる起源に由来する、請求項6記載の方法。
  8. 【請求項8】 前記実質的に同じ核酸鎖がゲノムDNA
    鎖である、請求項1記載の方法。
  9. 【請求項9】 ある生物に由来するゲノムDNAの少な
    くとも10%が単離および分析される、請求項1記載の
    方法。
  10. 【請求項10】 前記実質的に同じ核酸鎖から得た少な
    くとも1×108個の塩基が単離および分析される、請
    求項1記載の方法。
  11. 【請求項11】 前記実質的に同じ核酸鎖から選択され
    た反復領域は分析されない、請求項1記載の方法。
  12. 【請求項12】 前記決定工程の後に、前記複数の同じ
    核酸鎖の中に1回しか生じないSNP位置を同定する工
    程、および前記1回しか生じないSNP位置を分析から
    除外する工程、をさらに含む、請求項1記載の方法。
  13. 【請求項13】 前記実質的に同じ核酸鎖の中で最も頻
    繁に生じるSNPハプロタイプパターンを選択する工
    程、 前記実質的に同じ核酸鎖の中で次に最も頻繁に生じるS
    NPハプロタイプパターンを選択する工程、および前記
    選択されたSNPハプロタイプパターンが前記実質的に
    同じ核酸鎖の一部分を同定するまで前記第2選択ステッ
    プを繰返す工程、をさらに含む、請求項1記載の方法。
  14. 【請求項14】 前記一部分が前記実質的に同じ核酸鎖
    の約70%〜99%である、請求項13記載の方法。
  15. 【請求項15】 前記一部分が前記実質的に同じ核酸鎖
    の少なくとも約80%である、請求項14記載の方法。
  16. 【請求項16】 約3個以下のSNPハプロタイプパタ
    ーンが選択される、請求項13記載の方法。
  17. 【請求項17】 データ分析のためのSNPハプロタイ
    プブロックのデータセットを選択するための方法であっ
    て、 情報提供性についてSNPハプロタイプブロックを比較
    する工程、 高い情報提供性を有する第1SNPハプロタイプブロッ
    クを選択する工程、 前記第1SNPハプロタイプブロックを前記データセッ
    トに追加する工程、 高い情報提供性を有する第2のSNPハプロタイプブロ
    ックを選択する工程、 前記第2の選択されたSNPハプロタイプブロックを前
    記データセットに追加する工程、および核酸鎖の目的の
    領域がカバーされるまで前記選択および追加工程を繰返
    す工程、を含む、上記選択方法。
  18. 【請求項18】 前記選択されたSNPハプロタイプブ
    ロックが重複しない、請求項17記載の方法。
  19. 【請求項19】 欲張りアルゴリズムを用いて前記選択
    工程を実行する、請求項17記載の方法。
  20. 【請求項20】 SNPハプロタイプパターンの中の情
    報提供SNPを決定するための方法であって、 SNPハプロタイプブロックのSNPハプロタイプパタ
    ーンを決定する工程、前記SNPハプロタイプブロック
    の中の目的の各SNPハプロタイプパターンを、前記S
    NPハプロタイプブロックの中の目的の他のSNPハプ
    ロタイプパターンと比較する工程、および目的の第1S
    NPハプロタイプパターンの中の少なくとも1つのSN
    Pを選択する工程であって、前記SNPハプロタイプブ
    ロックの中の他の目的のSNPハプロタイプパターンか
    らこのような目的の第1SNPハプロタイプパターンを
    識別する工程、を含み、前記選択された少なくとも1つ
    のSNPが、前記SNPハプロタイプブロックの中の前
    記第1SNPハプロタイプパターンの情報提供SNPで
    ある、上記方法。
  21. 【請求項21】 SNPハプロタイプブロックの中のS
    NPハプロタイプパターンの一部分を識別するために十
    分な数の情報提供SNPが選択されるまで前記選択工程
    を繰返す工程を更に含む、請求項20記載の方法。
  22. 【請求項22】 SNPハプロタイプパターンの前記選
    択された一部分が、前記SNPハプロタイプブロックの
    中のSNPハプロタイプパターンの約70%〜約99%
    である、請求項21記載の方法。
  23. 【請求項23】 SNPハプロタイプパターンの前記選
    択された一部分が目的の疾患の同定を可能とする、請求
    項21記載の方法。
  24. 【請求項24】 SNPハプロタイプブロックの情報提
    供性を決定するための方法であって、 前記SNPハプロタイプブロックの中のSNP位置の数
    を決定する工程、 前記SNPハプロタイプブロックの中の目的のSNPハ
    プロタイプパターンを識別するのに必要な情報提供SN
    Pの数を決定する工程、および前記SNP位置の数を前
    記情報提供SNPの数で割って商を生成する工程、を含
    み、前記商が前記SNPハプロタイプブロックの前記情
    報提供性である、上記方法。
  25. 【請求項25】 SNPハプロタイプブロックの情報提
    供性を決定する方法であって、 前記SNPハプロタイプブロックの中のSNP位置の数
    を決定する工程、および前記SNPハプロタイプブロッ
    クの中の目的のSNPハプロタイプパターンを互いに区
    別するのに必要な情報提供SNPの数を決定する工程、
    を含み、目的のSNPハプロタイプパターンを区別する
    のに必要な前記情報提供SNPの数が、前記SNPハプ
    ロタイプブロックの前記情報提供性である、上記方法。
  26. 【請求項26】 疾患関連遺伝子の配列または該遺伝子
    座の位置の事前知識もなく、該疾患関連遺伝子を決定す
    るための方法であって、対照集団の少なくとも16個体
    からSNPハプロタイプパターンを決定する工程、 疾患に罹った集団の個体からSNPハプロタイプパター
    ンを決定する工程、および前記対照集団の前記SNPハ
    プロタイプパターンの頻度を、前記疾患に罹った集団の
    前記SNPハプロタイプパターンの頻度と比較する工程
    を含み、前記頻度の差が疾患関連遺伝子座を示す、上記
    方法。
  27. 【請求項27】 前記SNPハプロタイプパターンが、
    対照集団の少なくとも50個体において決定される、請
    求項26記載の方法。
  28. 【請求項28】 前記集団からの前記SNPハプロタイ
    プパターンが情報提供SNPを用いて決定される、請求
    項26記載の方法。
  29. 【請求項29】 複数の全ゲノムを用いてSNPハプロ
    タイプブロックのマップを作製する方法であって、 前記全ゲノムの少なくとも約10%において見られるS
    NPをSNPハプロタイプブロックの中に並べる工程を
    含む、上記方法。
  30. 【請求項30】 SNPハプロタイプパターンと目的の
    表現型特性とを関連付ける方法であって、 本発明の方法によってSNPハプロタイプパターンのベ
    ースラインを作製する工程、 目的の共通表現型特性を有する集団から得た全ゲノムD
    NAをプールする工程、および前記目的の表現型特性に
    関連付けられたSNPハプロタイプパターンを同定する
    工程、を含む、上記方法。
  31. 【請求項31】 前記作製工程および前記同定工程に情
    報提供SNPが使用される、請求項30記載の方法。
  32. 【請求項32】 請求項20記載の情報提供SNPを同
    定する工程を含み、前記情報提供SNPが関連付けに基
    づく診断マーカーである、診断マーカーの同定方法。
  33. 【請求項33】 薬剤発見標的を同定するための方法で
    あって、 SNPハプロタイプパターンを疾患と関連付ける工程、 前記関連付けられたSNPハプロタイプパターンの染色
    体位置を同定する工程、 前記染色体位置と前記疾患との前記関連付けの性質を決
    定する工程、および前記疾患に関連付けられた染色体位
    置またはその染色体位置の発現産物を選択する工程、を
    含み、前記疾患に関連付けられた前記選択された染色体
    位置またはその染色体位置の発現産物が薬剤発見標的で
    ある、上記方法。
  34. 【請求項34】 高度保存領域中の位置と遺伝子間領域
    中の位置とを含む判断基準のセットに基づいた薬剤発見
    標的に対して、前記関連付けられた染色体位置が優先さ
    せられる、請求項33記載の方法。
  35. 【請求項35】 情報提供SNPが前記関連付け工程で
    使用される、請求項33記載の方法。
  36. 【請求項36】 個体のSNPハプロタイプパターンを
    決定する方法であって、少なくとも1つの情報提供SN
    Pを分析する工程を含む、上記方法。
  37. 【請求項37】 ある種または種の部分集団のSNPハ
    プロタイプパターンを画定するための方法であって、 前記種の多数の生物のゲノム中に存在するSNPを同定
    する工程、 曖昧位置の数が少ないSNPハプロタイプパターンを反
    復的に選択することにより前記SNPをSNPハプロタ
    イプブロック中に並べる工程、を含む上記方法。
  38. 【請求項38】 多数の生物のゲノムから得たSNPハ
    プロタイプブロックを含むデータベースであって、前記
    データベースが少なくとも1つの情報提供SNPを同定
    し、前記データベースがコンピュータが判読可能な媒体
    上にある、上記データベース。
  39. 【請求項39】 1以上の特定の表現型特性に関連する
    ものとして同定されるSNPハプロタイプパターンを含
    むコンピュータが判読可能な媒体上のデータベース。
  40. 【請求項40】 1以上の特定の表現型特性に関連する
    ものとして同定される情報提供SNPを含むコンピュー
    タが判読可能な媒体上のデータベース。
  41. 【請求項41】 環境要因、他の遺伝的要因、関連する
    要因からなる群より選択される1以上の要因についての
    情報をさらに含み、前記要因は生化学的マーカー、行動
    および/または他の多型を含むがこれらに限定されず、
    前記多型は例えば低頻度SNP、繰返し、挿入および欠
    失を含むがこれらに限定されない、請求項38、39ま
    たは40に記載のデータベース。
  42. 【請求項42】 疾患、疾患に対する罹患性、または治
    療応答の診断キットであって、患者から得たゲノムDN
    Aのサンプル中のSNPハプロタイプパターンまたは情
    報提供SNPの存在または不在を検出するための手段
    と、前記SNPハプロタイプパターンまたは情報提供S
    NPと1以上の特異的表現型特性との関連付けのデータ
    セットと、をコンピュータが判読可能な媒体上に含む、
    上記診断キット。
  43. 【請求項43】 少なくとも1つの情報提供SNPを含
    む単離核酸であって、前記情報提供SNPは本発明の方
    法に従って決定されたSNPハプロタイプパターンを示
    し、前記情報提供SNPが表現型特性に関連付けられ
    る、上記単離核酸。
  44. 【請求項44】 複数の個体中の遺伝学的変異を同定す
    る工程、 前記遺伝学的変異のうちの少なくともある他の変異と共
    に生じる個体中の前記遺伝学的変異の少なくとも幾つか
    を同定する工程、およびある表現型状態と相関する、前
    記遺伝学的変異のうちの少なくともある他の変異と共に
    生じる前記遺伝学的変異の全てではなく幾つかを用いる
    工程、を含む、方法。
  45. 【請求項45】 ある生物の配列を決定する工程、 前記生物の他の個体を前記配列の変異体について走査す
    る工程、 第1グループにおいて前記変異体のうちの他の変異体と
    共に生じる前記変異体の幾つかを同定する工程、 第2グループにおいて前記変異体のうちの他の変異体と
    共に生じる前記変異体の幾つかを同定する工程、および
    前記第1グループおよび第2グループにおける前記変異
    体の全てではなく幾つかを用いて、前記グループをある
    表現型状態に関係付ける工程、を含む、方法。
  46. 【請求項46】 ゲノム分析において有用なSNPハプ
    ロタイプブロックを選択するための方法であって、 少なくとも約5つの異なる起源から実質的に同じDNA
    鎖を分析用に単離する工程、 少なくとも約5つの異なる起源から得た前記実質的に同
    じDNA鎖の各々から少なくとも約1×106塩基を分
    析する工程、 各DNA鎖の中の2以上のSNP位置を決定する工程、 前記DNA鎖の中の連鎖したSNP位置を同定する工程
    であって、前記連鎖したSNP位置がSNPハプロタイ
    プブロックを形成する工程、 各SNPハプロタイプ中において生じるSNPハプロタ
    イプパターンを同定する工程、および異なる起源から得
    た前記実質的に同じDNAのいずれかにおいて生じる各
    同定されたSNPハプロタイプパターンを選択する工
    程、を含む、上記方法。
  47. 【請求項47】 薬理遺伝学に関連する遺伝子座の配列
    または位置についての事前知識も無く、前記薬理遺伝学
    に関連する遺伝子座を決定するための方法であって、前
    記方法が、 対照集団の少なくとも16個体からSNPハプロタイプ
    パターンを決定する工程、 ある物質の投与に対して変わった反応を示す個体からS
    NPハプロタイプパターンを決定する工程、および前記
    対照集団の前記SNPハプロタイプパターンの頻度を、
    ある物質の投与に対して変わった反応を示す前記個体の
    前記SNPハプロタイプパターンの頻度と比較する工程
    を含み、前記頻度の差が薬理遺伝学に関連する遺伝子座
    の位置を示す、上記方法。
  48. 【請求項48】 前記SNPハプロタイプパターンが、
    対照集団の少なくとも50個体において決定される、請
    求項47記載の方法。
  49. 【請求項49】 前記集団から得た前記SNPハプロタ
    イプパターンが情報提供SNPを用いて決定される、請
    求項47記載の方法。
JP2002099196A 2001-03-30 2002-04-01 ゲノム分析方法 Pending JP2003052383A (ja)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US28053001P 2001-03-30 2001-03-30
US60/280530 2001-03-30
US31326401P 2001-08-17 2001-08-17
US60/313264 2001-08-17
US32700601P 2001-10-05 2001-10-05
US60/327006 2001-10-05
US33255001P 2001-11-26 2001-11-26
US60/332550 2001-11-26

Publications (2)

Publication Number Publication Date
JP2003052383A true JP2003052383A (ja) 2003-02-25
JP2003052383A5 JP2003052383A5 (ja) 2008-12-04

Family

ID=27501283

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002099196A Pending JP2003052383A (ja) 2001-03-30 2002-04-01 ゲノム分析方法

Country Status (11)

Country Link
US (4) US6969589B2 (ja)
EP (1) EP1246114B1 (ja)
JP (1) JP2003052383A (ja)
KR (1) KR20020077283A (ja)
CN (1) CN1381591A (ja)
AU (1) AU785425B2 (ja)
CA (1) CA2380047A1 (ja)
IL (2) IL186298A0 (ja)
IS (1) IS6316A (ja)
MX (1) MXPA02003119A (ja)
SG (2) SG142154A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006061128A (ja) * 2004-08-30 2006-03-09 Keio Gijuku 評価方法、ヒト・エストロゲン受容体遺伝子、ゲノムdna、及び診断マーカー
WO2013191197A1 (ja) 2012-06-20 2013-12-27 東レ株式会社 核酸の検出方法および核酸検出キット
JP2018081698A (ja) * 2011-11-07 2018-05-24 キアゲン レッドウッド シティ, インコーポレイテッドQiagen Redwood City, Inc. 原因ゲノム変異の同定の方法およびシステム

Families Citing this family (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7375198B2 (en) * 1993-10-26 2008-05-20 Affymetrix, Inc. Modified nucleic acid probes
AU785425B2 (en) * 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
WO2003018835A2 (en) * 2001-08-23 2003-03-06 Hvidovre Hospital Method for rapid detection of haplotypes
US6897025B2 (en) * 2002-01-07 2005-05-24 Perlegen Sciences, Inc. Genetic analysis systems and methods
US6977162B2 (en) * 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
JP2006523082A (ja) * 2002-03-01 2006-10-12 ラブジェン, インコーポレイテッド ゲノム内の変異の迅速分析
US8725418B2 (en) * 2002-03-25 2014-05-13 Janssen Pharmaceutica, N.V. Data mining of SNP databases for the selection of intragenic SNPs
US20040023275A1 (en) * 2002-04-29 2004-02-05 Perlegen Sciences, Inc. Methods for genomic analysis
US7442506B2 (en) * 2002-05-08 2008-10-28 Ravgen, Inc. Methods for detection of genetic disorders
US20070178478A1 (en) * 2002-05-08 2007-08-02 Dhallan Ravinder S Methods for detection of genetic disorders
US7727720B2 (en) * 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
US9740817B1 (en) 2002-10-18 2017-08-22 Dennis Sunga Fernandez Apparatus for biological sensing and alerting of pharmaco-genomic mutation
WO2004061125A2 (en) 2002-12-31 2004-07-22 Mmi Genomics, Inc. Compositions, methods and systems for inferring bovine traits
US20040146870A1 (en) * 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits
EP1620536A4 (en) * 2003-03-12 2007-09-26 Univ State Cleveland MOLECULAR HAPLOTYPING OF GENOMIC DNA
EP1636730A2 (en) * 2003-06-18 2006-03-22 Applera Corporation Methods and systems for the analysis of biological sequence data
US8346482B2 (en) 2003-08-22 2013-01-01 Fernandez Dennis S Integrated biosensor and simulation system for diagnosis and therapy
WO2005030952A1 (ja) * 2003-09-30 2005-04-07 Riken ハプロタイプの解析方法
US20050266432A1 (en) * 2004-02-26 2005-12-01 Illumina, Inc. Haplotype markers for diagnosing susceptibility to immunological conditions
US20090087854A1 (en) 2007-09-27 2009-04-02 Perlegen Sciences, Inc. Methods for genetic analysis
JP4437050B2 (ja) * 2004-03-26 2010-03-24 株式会社日立製作所 診断支援システム、診断支援方法および診断支援サービスの提供方法
JPWO2006027835A1 (ja) * 2004-09-08 2008-07-31 デジタル・インフォメーション・テクノロジー株式会社 ゲノム解析方法
US20060110744A1 (en) * 2004-11-23 2006-05-25 Sampas Nicolas M Probe design methods and microarrays for comparative genomic hybridization and location analysis
EP1840212A1 (en) * 2005-01-19 2007-10-03 Genesys Technologies, Inc. Method of systematic analysis of relevant gene in relevant genome region (including relevant gene/relevant haplotype)
US20060166224A1 (en) * 2005-01-24 2006-07-27 Norviel Vernon A Associations using genotypes and phenotypes
US20060223058A1 (en) * 2005-04-01 2006-10-05 Perlegen Sciences, Inc. In vitro association studies
EP1880332A4 (en) * 2005-04-27 2010-02-17 Emiliem NOVEL METHODS AND DEVICES FOR EVALUATING TOXIC SUBSTANCES
CA2612475C (en) * 2005-06-20 2015-07-28 Decode Genetics Ehf. Genetic variants in the tcf7l2 gene as diagnostic markers for risk of type 2 diabetes mellitus
JP5394069B2 (ja) 2005-11-29 2014-01-22 ケンブリッジ エンタープライズ リミテッド 乳癌についてのマーカー
CA2632859C (en) * 2005-12-02 2014-07-15 Simons Haplomics Limited Methods for gene mapping and haplotyping
CN101365944B (zh) * 2005-12-02 2013-08-07 单倍体技术有限公司 基因作图和确定单倍型的方法
EP1975255A2 (en) * 2006-01-11 2008-10-01 Neocodex, S.L. Method and apparatus for the determination of genetic associations
EP1996733A2 (en) * 2006-03-01 2008-12-03 Perlegen Sciences, Inc. Markers for addiction
US20110143344A1 (en) * 2006-03-01 2011-06-16 The Washington University Genetic polymorphisms and substance dependence
US7702468B2 (en) 2006-05-03 2010-04-20 Population Diagnostics, Inc. Evaluating genetic disorders
US10522240B2 (en) 2006-05-03 2019-12-31 Population Bio, Inc. Evaluating genetic disorders
US20070294113A1 (en) * 2006-06-14 2007-12-20 General Electric Company Method for evaluating correlations between structured and normalized information on genetic variations between humans and their personal clinical patient data from electronic medical patient records
US8372584B2 (en) 2006-06-14 2013-02-12 The General Hospital Corporation Rare cell analysis using sample splitting and DNA tags
BRPI0716748A2 (pt) 2006-08-15 2013-09-17 Monsanto Technology Llc composiÇÕes e mÉtodos de procriaÇço de planta usando informaÇço de marcadores de densidade alta.
WO2008050356A1 (en) * 2006-10-27 2008-05-02 Decode Genetics Cancer susceptibility variants on chr8q24.21
EP2540840A3 (en) * 2007-03-26 2013-05-15 Decode Genetics EHF. Genetic variants on CHR16 as markers for use in breast cancer risk assessment, diagnosis, prognosis and treatment
RU2009146054A (ru) * 2007-05-14 2011-06-20 Инсайт Дженетикс, Инк. (Us) Способы скрининга нуклеиновых кислот для выявления одиночных нуклеотидных вариаций
US20090326832A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Graphical models for the analysis of genome-wide associations
MX2011012913A (es) 2009-06-01 2012-02-21 Genetic Technologies Ltd Métodos para evaluar el riesgo de cáncer de mama.
US8965076B2 (en) 2010-01-13 2015-02-24 Illumina, Inc. Data processing system and methods
US20130071408A1 (en) 2010-02-01 2013-03-21 Atul J. Butte Methods for Diagnosis and Treatment of Non-Insulin Dependent Diabetes Mellitus
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
PL2556171T3 (pl) 2010-04-05 2016-04-29 Prognosys Biosciences Inc Oznaczenia biologiczne kodowane przestrzennie
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
EP2601609B1 (en) 2010-08-02 2017-05-17 Population Bio, Inc. Compositions and methods for discovery of causative mutations in genetic disorders
CN102206701B (zh) * 2010-09-19 2015-01-21 深圳华大基因科技有限公司 遗传性疾病相关基因的鉴定方法
CN103314383A (zh) * 2010-11-01 2013-09-18 皇家飞利浦电子股份有限公司 包括专有测试的特许使用费的自动化代理的体外诊断测试
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
US10221454B2 (en) 2011-10-10 2019-03-05 The Hospital For Sick Children Methods and compositions for screening and treating developmental disorders
US8990250B1 (en) 2011-10-11 2015-03-24 23Andme, Inc. Cohort selection with privacy protection
US11180807B2 (en) 2011-11-04 2021-11-23 Population Bio, Inc. Methods for detecting a genetic variation in attractin-like 1 (ATRNL1) gene in subject with Parkinson's disease
DK2812452T3 (da) 2012-02-09 2020-06-29 Population Bio Inc Fremgangsmåder og sammensætninger til screening og behandling af udviklingsforstyrrelser
EP2895621B1 (en) 2012-09-14 2020-10-21 Population Bio, Inc. Methods and compositions for diagnosing, prognosing, and treating neurological conditions
US10233495B2 (en) 2012-09-27 2019-03-19 The Hospital For Sick Children Methods and compositions for screening and treating developmental disorders
WO2014098479A1 (ko) * 2012-12-18 2014-06-26 연세대학교 산학협력단 지놈 변이 또는 후생학적 변이를 분석하기 위한 컴퓨터 실행 방법
KR101538692B1 (ko) * 2012-12-18 2015-07-27 연세대학교 산학협력단 지놈 변이 또는 후생학적 변이를 분석하기 위한 컴퓨터 실행 방법
US9128861B2 (en) 2013-01-17 2015-09-08 Personalis, Inc. Methods and systems for genetic analysis
US20140249761A1 (en) * 2013-03-01 2014-09-04 DNANEXUS, Inc. Characterizing uncharacterized genetic mutations
US10322227B2 (en) * 2013-03-15 2019-06-18 410 Medical, Inc. Apparatus, kits and related methods for fluid infusion
US9868979B2 (en) 2013-06-25 2018-01-16 Prognosys Biosciences, Inc. Spatially encoded biological assays using a microfluidic device
JP2015035212A (ja) * 2013-07-29 2015-02-19 アジレント・テクノロジーズ・インクAgilent Technologies, Inc. ターゲットシークエンシングパネルから変異を見つける方法
WO2015031689A1 (en) 2013-08-30 2015-03-05 Personalis, Inc. Methods and systems for genomic analysis
US10351899B2 (en) 2013-09-25 2019-07-16 Bio-ID Diagnostics Inc. Methods for detecting nucleic acid fragments
WO2015051275A1 (en) 2013-10-03 2015-04-09 Personalis, Inc. Methods for analyzing genotypes
DK3511422T3 (da) 2013-11-12 2023-02-06 Population Bio Inc Fremgangsmåder og sammensætninger til diagnosticering, prognose og behandling af endometriose
GB2558326B (en) 2014-09-05 2021-01-20 Population Bio Inc Methods and compositions for inhibiting and treating neurological conditions
AU2015327756B2 (en) 2014-09-30 2018-01-04 Genetic Technologies Limited Methods for assessing risk of developing breast cancer
EP3212808B1 (en) 2014-10-30 2022-03-02 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
US10424396B2 (en) * 2015-03-27 2019-09-24 Sentieon Inc. Computation pipeline of location-dependent variant calls
ES2955916T3 (es) 2015-04-10 2023-12-11 Spatial Transcriptomics Ab Análisis múltiplex de especímenes biológicos de ácidos nucleicos espacialmente distinguidos
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
CN105354444B (zh) * 2015-11-24 2018-06-19 华南理工大学 基于易感snp筛查复杂疾病易感snp组合的方法
IL260777B (en) 2016-01-28 2022-09-01 Univ Melbourne Methods for assessing the risk of developing colon cancer
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
US11725232B2 (en) 2016-10-31 2023-08-15 The Hong Kong University Of Science And Technology Compositions, methods and kits for detection of genetic variants for alzheimer's disease
PT3558510T (pt) 2016-12-22 2023-01-30 Illumina Inc Matriz que inclui iniciador de sequenciação e entidade não sequenciável
JP7045086B2 (ja) * 2016-12-23 2022-03-31 オックスフォード バイオダイナミックス パブリック リミテッド カンパニー 分類法
US10240205B2 (en) 2017-02-03 2019-03-26 Population Bio, Inc. Methods for assessing risk of developing a viral disease using a genetic test
US10176296B2 (en) 2017-05-17 2019-01-08 International Business Machines Corporation Algebraic phasing of polyploids
AU2018279073A1 (en) * 2017-06-08 2020-01-16 Nantomics, Llc An integrative panomic approach to pharmacogenomics screening
CN108681658B (zh) * 2018-05-22 2021-09-21 贵州医科大学 一种优化外源基因在大肠杆菌中翻译速度的方法
US11814750B2 (en) 2018-05-31 2023-11-14 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US10801064B2 (en) 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
HRP20221504T1 (hr) 2018-08-08 2023-03-31 Pml Screening, Llc Postupci procjene rizika od razvoja progresivne multifokalne leukoencefalopatije uzrokovane john cunningham virusom pomoću genetskog testiranja
CN109979530B (zh) * 2019-03-26 2021-03-16 北京市商汤科技开发有限公司 一种基因变异识别方法、装置和存储介质
EP3976820A1 (en) 2019-05-30 2022-04-06 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
EP4158054A1 (en) 2020-06-02 2023-04-05 10X Genomics, Inc. Spatial transcriptomics for antigen-receptors
WO2021247543A2 (en) 2020-06-02 2021-12-09 10X Genomics, Inc. Nucleic acid library methods
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
US20220228200A1 (en) 2021-01-19 2022-07-21 10X Genomics, Inc. Methods and compositions for internally controlled in situ assays
EP4347880A1 (en) 2021-06-02 2024-04-10 10X Genomics, Inc. Sample analysis using asymmetric circularizable probes
CN114649055B (zh) * 2022-04-15 2022-10-21 北京贝瑞和康生物技术有限公司 用于检测单核苷酸变异和插入缺失的方法、设备和介质
CN115035948B (zh) * 2022-07-20 2023-01-24 北京阅微基因技术股份有限公司 一种str引物的设计方法和系统

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
WO1992004470A1 (en) 1990-09-12 1992-03-19 Scientific Generics Limited Electrochemical denaturation of double-stranded nucleic acid
ES2155822T3 (es) 1990-12-06 2001-06-01 Affymetrix Inc Compuestos y su utilizacion en una estrategia de sintesis binaria.
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
DE69233087T2 (de) 1991-11-22 2003-12-24 Affymetrix Inc N D Ges D Staat Verfahren zur Herstellung von Polymerarrays
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US6027880A (en) 1995-08-02 2000-02-22 Affymetrix, Inc. Arrays of nucleic acid probes and methods of using the same for detecting cystic fibrosis
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US20020048749A1 (en) 1998-04-15 2002-04-25 Robert J. Lipshutz Methods for polymorphism identifcation and profiling
US5861242A (en) 1993-06-25 1999-01-19 Affymetrix, Inc. Array of nucleic acid probes on biological chips for diagnosis of HIV and methods of using the same
WO1995006764A2 (en) 1993-09-03 1995-03-09 Vpi Holdings Ltd. Oligonucleotides with rna cleavage activity
AU8126694A (en) 1993-10-26 1995-05-22 Affymax Technologies N.V. Arrays of nucleic acid probes on biological chips
US5578832A (en) 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
EP0746614A1 (en) 1994-02-23 1996-12-11 Ribozyme Pharmaceuticals, Inc. Method and reagent for inhibiting the expression of disease related genes
US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
CN1059238C (zh) 1994-03-15 2000-12-06 科学通用有限公司 双链核酸的电化学变性
US5837810A (en) 1994-03-15 1998-11-17 The Scripps Research Institute Polypeptides of lipopolysaccharide binding protein
US5571639A (en) 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US5459325A (en) 1994-07-19 1995-10-17 Molecular Dynamics, Inc. High-speed fluorescence scanner
US5795716A (en) 1994-10-21 1998-08-18 Chee; Mark S. Computer-aided visualization and analysis system for sequence evaluation
WO1997027317A1 (en) 1996-01-23 1997-07-31 Affymetrix, Inc. Nucleic acid analysis techniques
US5599695A (en) 1995-02-27 1997-02-04 Affymetrix, Inc. Printing molecular library arrays using deprotection agents solely in the vapor phase
FI954922A (fi) 1995-10-16 1997-04-17 Picopak Oy Valmistusmenetelmä sekä kontaktinystyrakenne puolijohdepalojen tiheitä pintaliitoksia varten
US5871697A (en) 1995-10-24 1999-02-16 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US6300063B1 (en) 1995-11-29 2001-10-09 Affymetrix, Inc. Polymorphism detection
US5972614A (en) 1995-12-06 1999-10-26 Genaissance Pharmaceuticals Genome anthologies for harvesting gene variants
WO1997029212A1 (en) 1996-02-08 1997-08-14 Affymetrix, Inc. Chip-based speciation and phenotypic characterization of microorganisms
WO1997043611A1 (en) 1996-05-16 1997-11-20 Affymetrix, Inc. Systems and methods for detection of labeled materials
US6150094A (en) 1996-05-23 2000-11-21 Qiagen Gmbh Use of an osmolyte for reducing or abolishing no-covalent interactions of biological molecules to inert surfaces
US6007231A (en) 1996-08-14 1999-12-28 Academy Of Applied Science Method of computer aided automated diagnostic DNA test design, and apparatus therefor
US5953727A (en) 1996-10-10 1999-09-14 Incyte Pharmaceuticals, Inc. Project-based full-length biomolecular sequence database
US6143496A (en) 1997-04-17 2000-11-07 Cytonix Corporation Method of sampling, amplifying and quantifying segment of nucleic acid, polymerase chain reaction assembly having nanoliter-sized sample chambers, and method of filling assembly
WO1998056954A1 (en) 1997-06-13 1998-12-17 Affymetrix, Inc. Method to detect gene polymorphisms and monitor allelic expression employing a probe array
WO1999011823A2 (en) 1997-09-05 1999-03-11 Sidney Kimmel Cancer Center Selection of pcr primer pairs to amplify a group of nucleotide sequences
US6262838B1 (en) 1998-03-20 2001-07-17 Genetic Microsystems Inc Focusing in microscope systems
JP4472173B2 (ja) 1998-04-15 2010-06-02 セローノ ジェネティクス インスティテュート ソシエテ アノニム 5−リポキシゲナーゼ活性化タンパク(flap)のゲノム配列、その多型マーカーおよび喘息の検出方法
CA2348609A1 (en) * 1998-11-10 2000-05-18 Genset S.A. Methods, software and apparati for identifying genomic regions harboring a gene associated with a detectable trait
DE1233364T1 (de) 1999-06-25 2003-04-10 Genaissance Pharmaceuticals Verfahren zur herstellung und verwendung von Haplotype Daten
WO2001004270A1 (en) 1999-07-13 2001-01-18 Genaissance Pharmaceuticals, Inc. Drug target isogenes: polymorphisms in the interleukin 4 receptor alpha gene
EP1248832A4 (en) 2000-01-21 2004-07-07 Variagenics Inc IDENTIFICATION OF GENETIC COMPONENTS IN DRUG REACTION
WO2001080156A1 (en) 2000-04-18 2001-10-25 Genaissance Pharmaceuticals, Inc. Method and system for determining haplotypes from a collection of polymorphisms
US6214557B1 (en) 2000-06-06 2001-04-10 Washington University Cold sensitive mutant DNA polymerases
US6931326B1 (en) * 2000-06-26 2005-08-16 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
US6521747B2 (en) * 2000-08-28 2003-02-18 Genaissance Pharmaceuticals, Inc. Haplotypes of the AGTR1 gene
US20020098498A1 (en) 2000-09-29 2002-07-25 Bader Joel S. Method of identifying genetic regions associated with disease and predicting responsiveness to therapeutic agents
DE10062566A1 (de) 2000-12-15 2002-06-20 Genprofile Ag Verfahren und Vorrichtung zur Ermittlung von Primer-Sequenzen
AU785425B2 (en) 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
WO2003014143A2 (en) 2001-08-04 2003-02-20 Whitehead Institute For Biomedical Research Haplotype map of the human genome and uses therefor
US6740510B2 (en) 2001-09-05 2004-05-25 Perlegen Sciences, Inc. Methods for amplification of nucleic acids
US6898531B2 (en) * 2001-09-05 2005-05-24 Perlegen Sciences, Inc. Algorithms for selection of primer pairs
US20040023237A1 (en) 2001-11-26 2004-02-05 Perelegen Sciences Inc. Methods for genomic analysis
US6897025B2 (en) * 2002-01-07 2005-05-24 Perlegen Sciences, Inc. Genetic analysis systems and methods
US20040146870A1 (en) 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6009061629, Ther. Res., (2000), 21, [12], p.2749−2777 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006061128A (ja) * 2004-08-30 2006-03-09 Keio Gijuku 評価方法、ヒト・エストロゲン受容体遺伝子、ゲノムdna、及び診断マーカー
JP4696294B2 (ja) * 2004-08-30 2011-06-08 学校法人慶應義塾 評価方法、ヒト・エストロゲン受容体遺伝子、ゲノムdna、及び診断マーカー
JP2018081698A (ja) * 2011-11-07 2018-05-24 キアゲン レッドウッド シティ, インコーポレイテッドQiagen Redwood City, Inc. 原因ゲノム変異の同定の方法およびシステム
WO2013191197A1 (ja) 2012-06-20 2013-12-27 東レ株式会社 核酸の検出方法および核酸検出キット
US10443085B2 (en) 2012-06-20 2019-10-15 Toray Industries, Inc. Method for detecting nucleic acid and nucleic acid detection kit

Also Published As

Publication number Publication date
US11031098B2 (en) 2021-06-08
KR20020077283A (ko) 2002-10-11
IL148783A0 (en) 2002-09-12
CA2380047A1 (en) 2002-09-30
US6969589B2 (en) 2005-11-29
US20030099964A1 (en) 2003-05-29
AU2746002A (en) 2002-10-03
US20160371429A1 (en) 2016-12-22
EP1246114A2 (en) 2002-10-02
MXPA02003119A (es) 2003-05-27
EP1246114A3 (en) 2004-07-21
AU785425B2 (en) 2007-05-17
SG119147A1 (en) 2006-02-28
SG142154A1 (en) 2008-05-28
CN1381591A (zh) 2002-11-27
IL186298A0 (en) 2008-01-20
AU785425C (en) 2002-10-03
IS6316A (is) 2002-09-30
US20050272086A1 (en) 2005-12-08
US20110020815A1 (en) 2011-01-27
EP1246114B1 (en) 2019-05-29
IL148783A (en) 2008-04-13

Similar Documents

Publication Publication Date Title
US11031098B2 (en) Computer systems and methods for genomic analysis
US20200392579A1 (en) Compositions Containing Identifier Sequences on Solid Supports for Nucleic Acid Sequence Analysis
Snyder et al. Haplotype-resolved genome sequencing: experimental methods and applications
US20180282796A1 (en) Typing and Assembling Discontinuous Genomic Elements
US20220177961A1 (en) Whole-genome haplotype reconstruction
WO2000028080A2 (en) Methods, software and apparati for identifying genomic regions harboring a gene associated with a detectable trait
JP2004511210A (ja) 配列変動を検出する、dnaを遺伝分析するための方法
Altemose A classical revival: Human satellite DNAs enter the genomics era
Vassetzky et al. B1 and related SINEs in mammalian genomes
US20060188875A1 (en) Human genomic polymorphisms
Hanghøj et al. Ancient epigenomics
Glazko et al. Comparative study and prediction of DNA fragments associated with various elements of the nuclear matrix
US20040023237A1 (en) Methods for genomic analysis
Romanov et al. Construction of a California condor BAC library and first-generation chicken–condor comparative physical map as an endangered species conservation genomics resource
US20040023275A1 (en) Methods for genomic analysis
WO2010108143A2 (en) Global mapping of protein-dna interaction by digital genomic footprinting
US20080026367A9 (en) Methods for genomic analysis
Clément et al. Genome-wide enhancer–gene regulatory maps in two vertebrate genomes
Jeong et al. Structural polymorphism and diversity of human segmental duplications
Hager Gene mapping the world of complex diseases
Eller Relationship between repetitive sequence environment and mammalian gene expression
WO2005014853A1 (en) Comparative expression analysis for the identification of genes responsible for phenotypic differences

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080717

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080723

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080822

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080827

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080917

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080922

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20081022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100511