JP2003519829A

JP2003519829A - データベースを作成する方法および多型遺伝的マーカーを同定するためのデータベース

Info

Publication number: JP2003519829A
Application number: JP2001530799A
Authority: JP
Inventors: アンドレアス・ブラウン; フーベルト・ケスター; ディルク・バン・デン・ボーム; イップ・ピン; チャーリー・ロディ; ヘ・リヤン; ノーマン・チウ; クリスティアン・ユリンケ
Original assignee: シークエノム・インコーポレーテツド
Priority date: 1999-10-13
Filing date: 2000-10-13
Publication date: 2003-06-24
Also published as: DE60043076D1; WO2001027857A3; WO2001027857A2; IL148930A0; JP2004158005A; EP1261932A2; ATE444532T1; EP2088209B1; CA2387035A1; AU776811B2; AU776811C; KR20020064298A; EP1261932B1; WO2001027857A9; EP2088209A1; AU1084801A

Abstract

(57)【要約】健康体ヒトドナーからのゲノムサンプルのデータベースを創出するためのプロセスおよび方法、多型遺伝的マーカーおよび他のマーカーを同定し、そして疾患および状態と相関させるデータベースを使用する方法を提供する。

Description

【発明の詳細な説明】

【０００１】関連出願以下の出願の優先権の利益をここに請求する： Andreas Braun, Hubert Koster; Dirk Van den Boonの、米国仮出願番号６０／
２１７６５８、７月１０日出願、名称「データベースを作成する方法および多型
遺伝的マーカーを同定するためのデータベース」；Andreas Braun, Hubert Kost
er, Dirk Van den Boomの、米国仮出願番号６０／１５９１７６、１９９９年１
０月１３日出願、名称「データベースを作成する方法および多型遺伝的マーカー
を同定するためのデータベース」；Andreas Braunの、米国仮出願番号６０／２
１７２５１、２０００年７月１０日出願、名称「多型キナーゼアンカータンパク
質遺伝子配列、多型キナーゼアンカータンパク質および多型キナーゼアンカータ
ンパク質およびそれらをコードしている核酸を検出する方法」；およびPing Yip
の、米国出願番号０９／６６３９６８、２０００年９月１９日出願、名称「生物
学的サンプルを同定するための方法および装置」。許容される場合、前記の出願および仮出願を引用をもって、その全体をここに
含ませる。

【０００２】発明の分野健康体ヒトドナーからのゲノムサンプルのデータベースを創出するためのプロ
セスおよび方法。当該データベースを使用して多型遺伝的マーカーおよび他のマ
ーカーを同定し、そして疾患および状態と相関させる方法を提供する。

【０００３】背景すべての生物の疾患は、遺伝され、または体の環境ストレス、例えば、ウイル
スおよび毒物への応答に起因する、遺伝的コンポーネントを有する。ゲノムリサ
ーチを進める究極的目標は、この情報を使用して、これらの疾患を同定し、処置
し、そして有効に治療する新しい方法を開発することである。第一のステップは
、個体サンプルのレベルで疾患組織をスクリーニングし、そしてゲノム変化を同
定することである。

【０００４】次いで、これらの「疾患」マーカーの同定は、これらの誤りのある遺伝子また
は多型を検出する診断テストの開発および商業化を活気付ける。医学的および薬
学的コミュニティーに対する問題提起は、単一ヌクレオチド多型（ＳＮＰ）、マ
イクロサテライト、タンデムリピート、新規にマッピングされたイントロンおよ
びエキソンを含む遺伝的マーカーの数を増加させることによって、疾患を同定す
るだけでなく、また疾患の進行に従い、そして処置に対する生物の応答を予測す
る、遺伝子型を同定することである。

【０００５】現行の薬学的および生物工学的産業は、疾患を発見し、それからその疾患につ
いて、ゲノムの基礎を決定しようと試みる。このアプローチは、時間消費性で、
そして高価であり、そして多くの場合、その疾患にどの経路が関係し得るかにつ
いて、調査者は推測しなければならない。

【０００６】ゲノミクス現在、利用可能なゲノム情報を分析するときに使用される２種の主要な戦略は
、逆遺伝学的な力ずくの戦略および知識に基づく経路指向的（pathway oriented
）フォワードジェネティックス（forward genetics）戦略である。この力ずくの
アプローチによって、配列情報の大きなデータベースを得るが、医学的または配
列情報の他の使用について、わずかな情報しか得られない。ゆえに、この戦略は
、価値に疑問のある漠然とした産物をもたらす。知識に基づく戦略によれば、特
定のＤＮＡ配列およびその経路の他の産物の医学的使用についての多くの情報を
含む小さいデータベースが得られ、そして高価値の具体的な産物が得られる。

【０００７】多型多型は血液型の同定によって１９０１以来知られている。１９５０年代に、こ
れらは大集団の遺伝的研究を使用して、タンパク質のレベルで同定された。１９
８０年代および１９９０年代に、多くの既知のタンパク質多型が、ゲノムＤＮＡ
の遺伝子座と相関された。例えば、アポリポタンパク質Ｅ型の４つの対立遺伝子
の遺伝子用量（gene dose）が、遅発型ファミリーのアルツハイマー病のリスク
と相関され（例えば、Corder et al.(1993)Science 261: 921-923参照）；血液
凝第Ｖ因子の突然変異が活性化タンパク質Ｃに対する抵抗性と連関され(例えば
、Bertin et al. (1994)Nature 369:64-67参照)；ＨＩＶ−１感染に対する抵抗
性がＣＣＲ−５ケモカインレセプター遺伝子の突然変異体対立遺伝子を有する白
人個体で示され（例えば、Samson et al. (1996)Nature 382:772-725参照）；そ
して抗原提示細胞（ＡＰＣ、例えばマクロファージ）の高頻度突然変異性トラク
トがAshkenziユダヤ人バックグラウンドの個体の家族性結腸直腸癌で同定された
（例えば、Laken et al. (1997)Nature Genet. 17:79-83）。ヒトゲノムの３百
万より多い多型部位が存在し得る。多くは同定されたが、なお特徴を把握され、
またはマッピングされ、またはマーカーと連関されていない。

【０００８】単一ヌクレオチド多型（ＳＮＰ）ゲノミクスの焦点の多くは、ＳＮＰの同定にあり、それは種々の理由のために
重要である。それらは、間接的テスト（ハプロタイプの連関）および直接的テス
ト（機能変異体）をもたらす。これらは、最も豊富な、そして安定な遺伝的マー
カーである。共通の疾患は、共通する遺伝的な変化によってとくにうまく説明さ
れ、そしてヒト集団の天然の変異は、疾患、治療および環境的相互作用の理解の
助けとなる。

【０００９】現在、ＤＮＡのＳＮＰを同定するための唯一の利用可能な方法は、配列決定に
よるものであり、これは高価で、困難で、そして労働力消費性である。さらに、
ひとたびＳＮＰが発見されると、それが真の多型なのか配列決定のエラーなのか
決定するために確認しなければならない。また、次いで、発見されたＳＮＰは特
定の表現型と連関されるかどうか、評価されなければならない。したがって、疾
患についてのゲノム基礎を、およびそのマーカーを同定するための新規パラダイ
ムを開発する必要がある。したがって、疾患のゲノム基礎およびそのマーカーを
同定するための方法を提供することがここでの目的である。

【００１０】要約データベースおよびデータベースを使用する方法を、ここで提供する。このデ
ータベースは、健康であるという基礎のみに基づき選択された集団の対象と連関
するパラメータのセットを含む（すなわち、対象が哺乳動物、例えば、ヒトであ
る場合、彼らは外観上の健康および検出可能な感染症がないことに基づいて選択
される）。このデータベースは、１または２以上の選択されたパラメータに基づ
いて分類することができる。

【００１１】データベースは、好ましくはリレーショナルデータベース（relational datab
ase）であり、それはそれぞれの対象を表すインデックスが、パラメータ（それ
らはデータ、例えば、年齢、人種、性別、病歴等、そして究極的には遺伝子型情
報であり、データベースに入力され、そして蓄積された）を関連づけるのに役立
つ。次いで、このデータベースは、これらのパラメータにしたがって分類するこ
とができる。最初に、そのパラメータ情報はそれぞれの対象（そこから体組織ま
たは体液サンプルを取得する）によって回答される質問票から取得される。それ
ぞれのサンプルについてさらなる情報を取得するように、この情報をデータベー
スに入力することができ、そして分類パラメータとして役立てることができる。

【００１２】健康体個体から取得したデータベースは、多くの使用（例えば、既知の多型を
表現型または疾患と相関させること）を有する。このデータベースを使用して、
有害である、有益である、そして疾患と相関のある対立遺伝子を同定することが
できる。

【００１３】ここでの目的のために、遺伝子型情報を当業者に既知の任意の方法を使用して
取得することができるが、好ましくは質量分析法を使用して取得する。

【００１４】対象および遺伝子型および他のパラメータ、例えば、年齢、人種、種族および
性の既存のデータベースの新規の使用を、またここで提供する。任意のデータベ
ースを、ここでの方法にしたがって分類することができ、そして任意の分類パラ
メータと統計的に有意な相関を示す対立遺伝子を同定することができる。しかし
、ここで提供するデータベースおよびランダムに選択したデータベースが、これ
らの方法でよりよく機能することが注目され、なぜなら、疾患に基づくデータベ
ースは多くの限界（それらは比較的大きさが小さい点、選択された疾患集団の均
質性、およびデータベースの選択のためのマーカーと連関する多型のマスキング
効果を含む）をこうむっているからである。ゆえに、ここで提供する健康体のデ
ータベースは、これまで認識され、または開拓されていない有利な効果を提供す
る。

【００１５】しかし、ここで提供する方法は、多型の発見および相関のための分類を有する
（または有しない）、疾患に基づくデータベースを含む、選択されたデータベー
スとともに使用することができる。さらに、ここで提供するデータベースは、多
型の発見のために典型的に利用される選択されていないデータベースよりもより
大きい遺伝的多様性を表し、したがって、これにより、効率的に多型を発見し、
そして相関を得ることができる。

【００１６】ここで提供するデータベースは、同定された多型を取得するために使用し、そ
してデータを選択されたパラメータにしたがって分類するときに、それが頻度に
ついて変化するか確認することができる。

【００１７】これらの方法のある使用は、既知の遺伝的マーカーの出現後に、特定のパラメ
ータと選択されたマーカーを相関させることであり、それからこの相関を作成し
たら、疾患との相関を決定し、または同定する。この使用の例は、ｐ５３および
リポタンパク質リパーゼ多型である。ここで例示のように、既知のマーカーは、
ある種の群、例えば、特定の人種または種族またはある性別と特定の相関を有す
ることが示される。次いで、そのような相関によって、よりよい診断テストおよ
び処置養生法の開発が可能となる。

【００１８】これらの方法は、１または２以上の遺伝的マーカーの同定のために有益であり
、それらの頻度は、年齢、人種群、性別またはある他の基準の関数（function）
として集団内で変化する。これは、以前未知である多型、そして究極的には、疾
患の開始（onset）および進行に関係する遺伝子または経路の同定を可能とする
。

【００１９】ここで提供するデータベースおよび方法によって、とりわけ、その遺伝子基盤
によって疾患プロセスのコンポーネント、特にキーコンポーネントの同定が可能
となり、そしてまたプロセス、例えば個体の薬物応答の理解が可能となる。ここ
で提供するデータベースおよび方法は、また病理学的経路の解明に関係する方法
で、新規診断アッセイの開発で、新規の可能性のある薬物標的の同定、および新
規薬物候補の同定で使用することができる。

【００２０】この方法およびデータベースは、インシリコ（in cilico）ＳＮＰ同定、イン
ビトロＳＮＰ同定／明確化、大集団の遺伝的プロファイル、および生物統計的分
析および解釈を含むがこれらに限定されない実験的処理とともに使用することが
できる。

【００２１】ここで提供するデータベースおよびデータベースの対象からの生物学的サンプ
ル、および好ましくはすべての対象またはデータベース中の複数の対象からの生
物学的サンプルを含む組み合わせを、またここで提供する。組織および体液サン
プルの収集物をまた提供する。

【００２２】年齢と相関し、多型の同定を含み、そして健康体集団の年齢の増加について多
型の頻度を決定する、遺伝的マーカーを決定するための方法を、またここで提供
する。

【００２３】遺伝的マーカーが病的状態（morbidity）に対する感受性、早期死亡（early m
ortality）、または病的状態および早期死亡と相関するか否かを決定するための
方法であって、多型を同定し、そして健康体集団で年齢の増加にともなう多型の
頻度を決定することを含む方法を、またここで提供する。ここで記載の任意の方法を、マルチプレックスフォーマットで使用することが
できる。

【００２４】遺伝的情報を正確に同定するための装置およびプロセスを、またここで提供す
る。遺伝的データから高度に自動化された態様で遺伝的情報を抽出することが、
ここでのさらなる目的である。したがって、既知の通常のシステムの欠点を克服
するために、生物学的サンプルを同定するための方法および装置を提案する。

【００２５】簡単には、生物学的サンプルを同定するための方法およびシステムは、生物学
的サンプルのコンポジションを示すデータセットを作成する。特定の例では、そ
のデータセットは、質量分析計から受けとられるＤＮＡスペクトロメトリーデー
タである。このデータセットは、ノイズが除去され、そしてベースラインが削除
されている。生物学的サンプルのあり得るコンポジションが既知であり得るから
、予測ピークエリア（area）を決定し得る。予測ピークエリアを使用し、残留ベ
ースラインを作成し、データセットをさらに補正する。次いで、有り得るピーク
（probable peak）が補正されたデータセットでは同定可能であり、それを、生
物学的サンプルのコンポジションを同定するために使用する。開示の例では、統
計的方法を使用して、有り得るピークが実際のピークである、または実際のピー
クではない、またはそのデータがあまりに決定的でないため利用（call）できな
い、確率を決定する。

【００２６】生物学的サンプルを同定するための方法およびシステムは、コンポジションコ
ール（composition call(s)）を高度に自動化された態様で正確に作成すること
が、有利である。そのような態様では、例えば、完全なＳＮＰプロファイル情報
が効率的に収集され得る。収集されたデータが高度に正確な結果で分析されるこ
とがより重要である。例えば、特定のコンポジションがコールされるとき、結果
は高い信頼性で信頼し得る。そのような信頼性を、使用の確固たる（robust）コ
ンピューター的プロセスによって提供する。

【００２７】図面の説明図１は、例示的なサンプルバンクを示す。パネル１は、性別および人種の関数
としてのサンプルを示す。パネル２は、年齢の関数として白人を示す。パネル３
は、年齢の関数としてヒスパニックを示す。図２Ａおよび２Ｃは、リポタンパク質リパーゼ遺伝子の２９１Ｓ対立遺伝子の
年齢および性別分布を示し、全部で４３６人の男性および５８９人の女性を調査
した。図２Ｂは、４３６人の男性について年齢の分布を示す。

【００２８】図３は、集団に基づくサンプルバンキングのための例示的な質問票である。図４は、血液サンプルコンポーネントのプロセッシングおよびトラッキングを
示す。図５は、「病気」対立遺伝子および「健康体」対立遺伝子の対立遺伝子頻度を
年齢の関数として示す。健康体対立遺伝子の相対的頻度が年齢の増加とともに集
団中で増加することが注目される。図６は、ＡｐｏＥ遺伝子型の年齢依存性分布を示す（Schaechter et al. (199
4)Nature Genetics 6:29-32参照）。

【００２９】図７Ａ−Ｄは、データベース中の白人集団中のｐ５３（腫瘍サプレッサー）コ
ドン７２の年齢依存性および遺伝子型頻度を示す。＊Ｒ７２および＊Ｐ７２はデ
ータベース集団中の対立遺伝子の頻度を表す。Ｒ７２、Ｒ７２Ｐ、およびＰ７２
は集団中の個体の遺伝子型を表す。ホモ接合性Ｐ７２対立遺伝子の頻度は、年齢
とともに６．７％から３．７％に低下する。図８は、年齢の関数として、ｐ２１Ｓ３１Ｒ対立遺伝子の対立遺伝子および
遺伝子型頻度を示す。図９は、個体サンプルに対してプールされたＦＶＩＩ対立遺伝子３５３Ｑの頻
度を示す。

【００３０】図１０は、個体サンプルに対してプールされた、ＣＥＴＰ（コレステロールエ
ステル輸送タンパク質）対立遺伝子の頻度を示す。図１１は、個体サンプルに対してプールされた、プラスミノーゲンアクチベー
ターインヒビター−１（ＰＡＩ−１）５Ｇの頻度を示す。図１２は、ＰＡＩ−１対立遺伝子のサンプルのマススペクトルおよび人種分布
を示す。図１３は、ＣＥＴＰ４０５対立遺伝子のサンプルのマススペクトルおよび人種
分布を示す。

【００３１】図１４は、第ＶＩＩ因子３５３対立遺伝子のサンプルのマススペクトルおよび
人種分布を示す。図１５は、プールされたＤＮＡサンプルを使用する、ＰＡＩ−１、ＣＥＴＰお
よび第ＶＩＩ因子の人種分布を示す。図１６は、ｐ５３−Ｒｂ経路およびその経路の種々の因子の間の関連を示す。図１７は、ここで記載したプロセスおよびデータベースを提供する、コンピュ
ーター構築性のブロックダイヤグラムであり、これは、ここで提供するデータベ
ースを蓄積し、そして分類するための、そしてここで提供する方法を実行する、
典型的なコンピューターシステムを示す。

【００３２】図１８は、多型遺伝的マーカーを同定するためのデータベースへのアクセスを
維持し、そして提供するための、図１７に示されるコンピューターを使用して実
行される、プロセッシングステップを示すフローダイヤグラムを示す。図１９は、ＡＫＡＰ１０−１遺伝子座について、年齢および性別で層化された
、白人集団での対立遺伝子および遺伝子型分布を示すヒストグラムである。明緑
色のバーは、４０歳より若齢の個体での頻度を示す。暗緑色のバーは、６０歳よ
り高齢の個体での頻度を示す。図２０は、ＡＫＡＰ１０−５遺伝子座について、年齢および性別で層化された
、白人集団の対立遺伝子および遺伝子型分布を示すヒストグラムである。明緑色
のバーは、４０歳より若齢の個体の頻度を示す。暗緑色のバーは、６０歳より高
齢の個体の頻度を示す。

【００３３】図２１は、ｈ−ｍｓｒ−Ａ遺伝子座について、年齢および性別で層化された白
人集団の、対立遺伝子および遺伝子型分布を示すヒストグラムである。明緑色の
バーは、４０歳より若齢の個体での頻度を示す；暗緑色のバーは、６０歳より高
齢の個体での頻度を示す。図２２Ａ−Ｄは、健康体のデータベースのために使用する、サンプルデータ収
集質問票である。

【００３４】図２３は、アッセイフラグメントからのセンス鎖およびアンチセンス鎖の遺伝
子型決定をおこなうときに、図２４のコンピューティング装置によって実行され
るプロセッシングを示すフローチャートである。図２４は、本発明に従うシステムを示すブロックダイヤグラムである。図２５は、本発明に従う、生物学的サンプルを同定する方法のフローチャート
である。図２６は、質量分析計からのデータをグラフに表したものである。図２７は、質量分析法データのウェーブレット変換のダイヤグラムである。

【００３５】図２８は、ウェーブレットステージ０ｈｉデータをグラフに表したものである
。図２９は、ステージ０ノイズプロファイルをグラフに表したものである。図３０は、ステージノイズ標準偏差の作成をグラフに表したものである。図３１は、データステージのスレショルド（threshold）の適用をグラフに表
したものである。図３２は、希薄データセットをグラフに表したものである。図３３は、シグナルをシフトさせる式である。図３４は、ノイズを除去し、そしてシフトしたシグナルの、ウェーブレット変
換をグラフに表したものである。

【００３６】図３５は、ノイズを除去し、そしてシフトしたシグナルをグラフに表したもの
である。図３６は、ピークセクションの除去をグラフに表したものである。図３７は、ピークフリーシグナルの作成をグラフに表したものである。図３８は、ベースライン補正を作成する方法のブロックダイヤグラムである。図３９は、ベースラインおよびシグナルをグラフに表したものである。図４０は、ベースラインを除去したシグナルをグラフに表したものである。図４１は、圧縮したデータを示す表である。図４２は、データを圧縮する方法のフローチャートである。図４３は、マスシフティングをグラフに表したものである。

【００３７】図４４は、ピーク幅の決定をグラフに表したものである。図４５は、ピークの除去をグラフに表したものである。図４６は、ピークを除去したシグナルをグラフに表したものである。図４７は、残留ベースラインをグラフに表したものである。図４８は、残留ベースラインが除去されたシグナルをグラフに表したものであ
る。

【００３８】図４９は、ピーク高の決定をグラフに表したものである。図５０は、各ピークについて、シグナル−対−ノイズ決定をグラフに表したも
のである。図５１は、各ピークについて、残留エラーの決定をグラフに表したものである
。図５２は、ピーク確率をグラフに表したものである。図５３は、ピーク確率に対する対立遺伝子比率の適用をグラフに表したもので
ある。

【００３９】図５４は、ピーク確率の決定をグラフに表したものである。図５５は、遺伝子型のコールをグラフに表したものである。図５６は、遺伝子型をコールするための統計的処理を示すフロチャートである
。図５７は、標準を欠く遺伝子型決定をおこなうとき、図１のコンピューティン
グ装置によって実行されるプロセッシングを示すフローチャートである。そして図５８は、標準を欠く遺伝子型プロセッシングのための、ピーク確率に対する
対立遺伝子比率の適用をグラフに表したものである。

【００４０】詳細な説明特記しない限り、ここで使用するすべての技術的および科学的用語は、本発明
の属する業界の当業者に一般に理解されるのと同じ意味を有する。本開示すべて
において、ここで引用される、すべての特許、出願、公開された出願および他の
刊行物およびＧｅｎＢａｎｋおよび他のデータベースからの配列は、引用によっ
てそのすべてが含まれる。

【００４１】ここで使用するように、生体高分子は、核酸、タンパク質、多糖類、脂質およ
び他の大分子を含むがこれらに限定されない。核酸は、ＤＮＡ、ＲＮＡ、および
そのフラグメントを含む。核酸はゲノムＤＮＡ、ＲＮＡミトコンドリア核酸、ク
ロロプラスト核酸および別の遺伝的物質を有する他のオルガネラに由来し得る。

【００４２】ここで使用するように、病的状態（率）（morbidity）は、状態、例えば、疾
患または障害であって、生物、例えば、動物の健康および幸福を妥協する状態を
言う。病的状態感受性または病的状態連関性遺伝子は、例えば、ヌクレオチド配
列の変化によって変化されるとき、特異的な疾患臨床的表現型の発現を促進する
（facilitate）遺伝子である。したがって、病的状態感受性遺伝子は、変化され
るとき、生物が特定の疾患を発生させる、尤度または一般的なリスクを増加させ
るポテンシャルを有する。

【００４３】ここで使用するように、死亡（率）（mortality）は、生物、特に動物が、予
測される寿命全部を生存しない統計的尤度を意味する。ゆえに、高い死亡（率）と連関する、特徴（trait）またはマーカー、例えば
、多型は、集団のより若齢のセグメントよりもより高齢なもので、より低い頻度
で観察される。

【００４４】ここで使用するように、多型、例えば遺伝的変異は、集団中のゲノムの遺伝子
の配列の変異、例えば対立遺伝子変異および発生し、または観察される他の変異
を意味する。したがって、多型は、集団中の、２種またはより多い遺伝的に決定
される別の配列または対立遺伝子の存在を意味する。これらの相違は、ゲノムの
コードおよび非コード部分に存在することができ、そして例えば転写、プロセッ
シング、翻訳、輸送、タンパク質プロセッシング、トラフィッキング、ＤＮＡ合
成、発現されたタンパク質、他の遺伝子産物または生物学的経路のまたはポスト
翻訳修飾の産物および集団のメンバー中に明示される任意の他の相違を含む、核
酸配列、遺伝子発現での相違として明示され、または検出されることができる。
単一ヌクレオチド多型（ＳＮＰ）は、単一塩基変化、例えば、塩基の挿入、欠失
または変化の結果として生じる多型を意味する。

【００４５】多型マーカーまたは部位は、分岐が存在する遺伝子座である。そのような部位
は、一塩基対（ＳＮＰ）と同じくらい小さくてよい。多型マーカーは、制限フラ
グメント長多型、種々の数のタンデムリピート（ＶＮＴＲの）、過剰可変領域、
ミニサテライト、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラ
ヌクレオチドリピート、および他の反復パターン、単純配列リピートおよび挿入
エレメント、例えばＡｌｕを含むがこれらに限定されない。多型形態は、また遺
伝子について異なるメンデル的対立遺伝子として明示される。多型は、タンパク
質の相違、タンパク質修飾、ＲＮＡ発現修飾、ＤＮＡおよびＲＮＡメチル化、遺
伝子発現およびＤＮＡ複製を変化させる調節ファクター、およびゲノム核酸また
はオルガネラ核酸の任意の他の明示または変化によって観察され得る。

【００４６】ここで使用するように、健康体集団は、疾患フリーである、動物、バクテリア
、ウイルス、寄生生物、植物、ユーバクテリア、およびその他を含むがこれらに
限定されない生物の集団を意味する。疾患フリーの概念は、選択される生物の関
数（function）である。例えば、哺乳動物について、それは、任意の疾患状態を
明示しない対象を意味する。実際上、ヒトの場合に、健康体対象は、一般集団で
の最終的な使用のために、血液を献血する血液バンクの基準を通過するヒトドナ
ーとして定義される。これらの基準は以下の通りである：検出可能なウイルス性、バクテリア性、マイコプラズマ性、および寄生生物性感
染症フリーで；貧血性でなく；それから質問票に関連する履歴（history）に基
づいてさらに選択される（図３参照）。

【００４７】したがって、健康体集団は、血液バンク基準にしたがって血液を献血するのに
十分健康であり、任意の疾患状態についてさらに選択されていない、偏りのない
集団を表す。典型的には、そのような個体は、いずれの明示も有しない。植物に
ついて、例えば、それは植物に連関する病害病理を明示しない植物集団である。
バクテリアについて、それは環境ストレス、例えば選択物質、熱および他の病原
なく複製しているバクテリア集団である。

【００４８】ここで使用するように、健康体のデータベース（または健康な患者データベー
ス）は、任意の特定の疾患について予め選択されていない対象のプロファイルの
データベースを意味する。ゆえに、予め決定された基準にしたがって、健康であ
るように、データベースのデータのソースとして役立つ対象が選択される。特定
の疾患または他の形質（characteristic）を有する対象について予め選択された
、他のそのようなデータベースと異なり、ここで提供するデータベースのための
対象は、そのように選択されていない。

【００４９】また、対象が疾患または他の状態を明示しているならば、発見され、または特
徴付けられた任意の多型が、無関係の疾患または状態に関連付けられるべきであ
る。好ましい実施態様では、対象がヒトである場合、健康な対象は、疾患症候を
明示せず、そして基準、例えば血液ドナーのために血液バンクによってセットさ
れたものに適合する。

【００５０】したがって、データベースのための対象は、動物、植物、バクテリア、ウイル
ス、寄生生物および核酸を有する任意の他の生物または存在を含むがこれらに限
定されない、任意の生物の集団である。好ましい対象には、哺乳動物、好ましい
が必然的ではなくヒトが含まれる。そのようなデータベースは、集団の多様性を
捕捉し、こうしてまれな多型の発見をすることができる。

【００５１】ここで使用するように、プロファイルは、すべての、年齢、性別、人種、疾患
履歴、家族履歴、表現型的な形質、例えば、身長、体重および他の表れるパラメ
ータを必須でなく含むがこれらに限定されないが、これらに関連する情報を意味
する。サンプル収集情報フォームは、図２２に示され、それはプロファイルの意
図を例示している。

【００５２】ここで使用するように、疾患状態は、状態または異常または障害であって、遺
伝され、または環境ストレス、例えば、毒物、細菌、真菌およびウイルス性感染
から生じ得るものである。

【００５３】ここで使用するように、非選択的対象は、共通の疾患または他の形質を有する
予め選択されない対象を意味する。それらは、ここで定義されるように健康であ
るべきであるように選択することができる。

【００５４】ここで使用するように、表現型は、生物の任意の区別可能な特徴を含むパラメ
ータのセットを意味する。表現型は、身体的特徴であることができ、そして例え
ば、対象が動物である場合、精神的特徴、例えば感情的特徴であることができる
。幾つかの表現型は、質問票によって導いた観察によって（例えば、図３および
２２参照）または先行する医学的および他の記録を参照することによって決定す
ることができる。ここでの目的のために、表現型は、データベースが分類（sort
）されることができる周辺のパラメータである。

【００５５】ここで使用するように、パラメータはデータベースを蓄積するための基礎とし
て役立つ任意の入力データである。これらのパラメータは、表現型特徴、病歴、
家族履歴および対象から引き出され、または対象について観察される任意の他の
そのような情報を含む。パラメータは、対象、対象によって経験されるある種の
履歴または現在の環境的または社会的影響、または対象に関連する者に及ぼす状
態または環境的影響を説明し得る。パラメータは、ここで記載され、そして当業
者に既知の任意のものを含むがこれらに限定されない。

【００５６】ここで使用するように、ハプロタイプは、一本鎖ＤＮＡに位置する２または多
型を意味する意味する。ゆえに、ハプロタイピングは、一本鎖ＤＮＡ上の２また
はそれより多い多型の同定を意味する。ハプロタイプは、表現型を示すことがで
きる。幾つかの障害については、単一の多型は、特徴を表すために十分で有り得
る。その他の場合には、複数のもの（すなわちハプロタイプ）が必要とされ得る
。ハプロタイピングを、核酸を単離し、そして鎖を分離することによって行うこ
とができる。加えて、酵素、例えば、各鎖から異なるサイズのフラグメントを生
成する、ある種のヌクレアーゼを使用するとき、鎖分離はハプロタイピングに必
要ではない。

【００５７】ここで使用する、使用するように、マススペクトルまたは質量分析法的分析の
参照を有するパターンは、形質分布およびシグナルの数（そのようなピークまた
はそのデジタル表示）を意味する。

【００５８】ここで使用するように、マススペクトルのコンテクストおよびその分析におけ
るシグナルは、特定の質量を有する分子の数または相対数である、出力データを
意味する。シグナルは、「ピーク」およびそのデジタル表示を含む。

【００５９】ここで使用するように、アダプターは、ハプロタイピング使用Ｆｅｎリガーゼ
を引用して使用するとき、所望の多型に特異的にハイブリダイズする核酸を意味
する。アダプターは、部分的に二本鎖であることができる。アダプターがその標
的にハイブリダイズするとき、アダプター複合体が形成される。

【００６０】ここで使用するように、標的核酸は、サンプルの所望の任意の核酸を意味する
。それは１または２以上のヌクレオチドを含むことができる。

【００６１】ここで使用するように、標準を欠く分析は、内部標準に基づく決定を意味する
。例えば、多型の頻度は、単一のマススペクトル内のシグナルを比較することに
よってここに決定することができる。

【００６２】ここで使用するように、増幅は、生体高分子、特に核酸の量を増加させる手段
を意味する。選択される５’および３’プライマーに基づき、増幅は、そしてま
た分析の対象であるゲノムの領域を制限し、そして定義するように役立つ。増幅
は、当業界で既知の任意の手段によることができ、ポリメラーゼ連鎖反応（ＰＣ
Ｒ）等の使用を含む。多型の頻度を決定することが要求されるとき、増幅、例え
ばＰＣＲは、定量的にされなければならない。

【００６３】ここで使用するように、切断は、生体高分子の非特異的および特異的フラグメ
ント化を意味する。ここで使用するように、マルチプレックシングは、１より多い多型の同時的な
検出を意味する。マルチプレックシング反応を実施するための方法は、質量分析
法と組み合せて、実際的に既知である（例えば米国特許番号６０４３０３１、５
５４７８３５および国際ＰＣＴ出願番号９７／３７０４１参照）。

【００６４】ここで使用するように、質量分析法の引用は、当業者に既知の、任意の適当な
質量分析法形式を含む。そのような形式は、マトリックス介助レーザー脱離／イ
オン化飛行時間型（ＭＡＬＤＩ−ＴＯＦ）、エレクトロスプレー（ＥＳ）、ＩＲ
−ＭＡＬＤＩ（例えば公開された国際ＰＣＴ出願番号９９／５７３１８および米
国特許番号５１１８９３７参照）、イオンサイクロトロン共鳴（ＩＣＲ）、フー
リエ変換およびそれらの組み合わせを含むがこれらに限定されない。ＭＡＬＤＩ
、特にＵＶおよびＩＲが好ましい形式に含まれる。

【００６５】ここで使用するように、マススペクトルは、質量分析法によってグラフ的に、
または数値的にコード化された生体高分子またはそのフラグメントを分析するこ
とから取得されたデータを表したものを意味する。

【００６６】ここで使用するように、血液コンポーネントは、血液から分離されるコンポー
ネントを意味し、そして赤血球細胞および血小板、血液凝固因子、血漿、酵素、
プラスミノーゲン、免疫グロブリンを含むがこれらに限定されない。細胞性血液
コンポーネントは、血液のコンポーネント、例えば、細胞である赤血球細胞であ
る。血液タンパク質は血液中に通常見出されるタンパク質である。そのようなタ
ンパク質の例は、血液第ＶＩＩおよび第ＶＩＩＩ因子である。そのようなタンパ
ク質およびコンポーネントは、当業者に周知である。

【００６７】ここで使用するように、血漿を、当業者に既知の任意の方法によって分離する
ことができる。例えば、それは赤色細胞にペレット化する力で血液を遠心分離す
ることによって調製することができ、そして赤色細胞およびバフィーコート（bu
ffy coat）（それは白血球を含み、さらにそれは血漿である）の間の界面を形成
する。例えば、典型的な血小板濃縮物は少なくとも１０％の血漿を含む。

【００６８】血液は、そのコンポーネント（血漿、血小板および赤血球細胞を含むがこれら
に限定されない）に、当業者に既知の任意の方法によって分離することができる
。例えば、血液は、十分な時間、そして十分な加速度で遠心分離し、赤血球細胞
を含むペレットを形成することができる。白血球は、ペレットおよびバフィーコ
ート領域の上清の界面で、おもに収集する。血漿、血小板、および他の血液コン
ポーネントを含む上清は、次いで除去され、そしてより高い加速度で遠心分離さ
れ、それによって血小板ペレットが得られ得る。

【００６９】ここで使用するように、ｐ５３は、ＤＮＡ損傷を評価し、そして細胞成長、Ｄ
ＮＡ修復およびアポトーシスを制御する、転写因子調節遺伝子として働く、細胞
周期コントロールタンパク質である。ｐ５３突然変異は、種々の頻度を有するす
べての異なる型の白血球を含む、広く種々の異なる癌に見出される。通常のｐ５
３機能の喪失は、ゲノムの不安定性および宿主細胞のコントロールされない成長
を生じる。

【００７０】ここで使用するように、ｐ２１は、通常細胞のＧ１相アレストと連関する、サ
イクリン依存性キナーゼインヒビターである。発現トリガーアポトーシスまたは
プログラムされた細胞死は、またＷｉｌｌｍの腫瘍、小児性腎臓癌と連関された
。

【００７１】ここで使用するように、第ＶＩＩ因子は独特な血液凝固カスケードと関係する
セリンプロテアーゼである。この因子は、トロンビンによって活性化され、そし
て組織因子（第ＩＩＩ因子）と、第Ｘ因子の第Ｘａ因子へのプロセッシングにお
いて働く。証拠は、遺伝子の多型と、心筋梗塞を含む、虚血性心臓血管疾患の高
リスクを生じ得る第ＶＩＩ因子活性の増加の間の連関を支持した。

【００７２】ここで使用するように、リレーショナルデータベースは、データの裂およびコ
ラムを含む、例えば２次元の表、またはより高次元のマトリックスのような、マ
トリックスを表す形態で情報を蓄積する。例えば、１つの実施態様では、リレー
ショナルデータベースは、それぞれがパラメータを有する別々の表を有する。表
は、記録された数と連結され、それはまたインデックスとして作用する。データ
ベースは、表のデータを使用することによってサーチし、または分類することが
でき、そして任意の適当な蓄積媒体、例えばフロッピーディスク、ＣＤロムディ
スク、ハードドライブまたは他の適当な媒体に蓄積される。

【００７３】ここで使用するように、バーコードは、任意の望まれる大きさおよび形状の、
所望により読み取り可能なマークの任意のアレイを意味し、それらは、必ずしも
必須ではないのだが、好ましくは、１または２以上のコラムおよび１または２以
上の列の参照コンテクストまたはフレームに編成される。ここでの目的のために
、バーコードは、必ずしも「バー」である必要はないがドット、文字または任意
のシンボル（複数含む）を含み得る、任意のシンボロジーを意味する。

【００７４】ここで使用するように、シンボロジーは、サンプルに連結される、識別子（id
entifier）コードまたはシンボル、例えば、バーコードを意味する。インデック
スは、それぞれのそのようなシンボロジーに参照符を付する。シンボロジーは、
使用者によって知られ、または設計される任意のコードである。シンボルは、デ
ータベースに蓄積される情報と連関される。例えば、各サンプルを、コード化さ
れたシンボロジーで独特に同定することができる。パラメータ、例えば、質問に
対する回答および、サンプルの分析により取得される次の遺伝型および他の情報
をデータベースに含ませ、そしてシンボロジーと連関させる。データベースを、
任意の適当な記録媒体、例えば、ハードドライブ、フロッピーディスク、テープ
、ＣＤ−ＲＯＭ、ＤＶＤディスクおよび任意の他の適当な媒体に蓄積する。

【００７５】データベースヒトの遺伝子型決定は、現在は、疾患組織のサンプルを提供する、病院、組織
バンクおよびリサーチ機関との共同に依存している。このアプローチは、疾患の
開始および／または進行を、多型または他の遺伝的マーカーの存在と相関させる
ことができるという概念に基づいている。このアプローチは、疾患が特異的なマ
ーカーの存在および特異的なマーカーの不存在と相関しているべきものである、
とは考えない。

【００７６】マーカーの出現および消失の同定およびスコアー化は、これらのマーカーが健
康体対象のバックグラウンドで測定され、ここで、疾患の開始が多型の存在の変
化をマスクしないときのみ、可能であることがここで示される。疾患集団からの
情報のデータベースは、サンプルの大きさが小さい点、選択の偏り、および不均
質性をこうむっている。健康体集団からここで提供したデータベースは、サンプ
ルバンクが大きい点、簡単な選択方法および不均質性を希釈することによってこ
れらの問題を解決する。

【００７７】非選択性、特に健康な対象と連関した、パラメータの第１のデータベースをこ
こで提供する。また、データベースと、各対象から取得されるインデックス化さ
れたサンプルの組み合わせも提供する。さらに、第１のデータベースから作成さ
れるデータベースを提供する。これらは、本来のパラメータ情報に加えて、例え
ば、サンプルに由来する、ゲノム配列情報を含むがこれらに限定されない遺伝子
型情報を含む。

【００７８】ここで健康体データベースと命名したデータベースは、特定の疾患について予
め選択されない対象から取得されるため、そのように命名する。ゆえに、個々の
メンバーは疾患を有しているかもしれないが、個体の収集は特定の疾患を有する
ように選択されているわけではない。

【００７９】パラメータを取得する対象は、好ましくはすべての集団にわたり、ランダムに
選択されている対象のセット、または疾患フリーまたは健康であるように予め選
択される、対象のセットのいずれかを含む。結果として、データベースは、任意
の予め選択された表現型、遺伝子型、疾患または他の形質を表すようには選択さ
れない。典型的には、データベースが調製される対象の数は、ここで提供する方
法に使用するときに、統計的に有意な結果が得られるように選択される。

【００８０】好ましくは、対象の数は、１００より多く、より好ましくは２００より多く、
なおより好ましくは、１０００より多い。正確な数は、データベースを分類する
ために使用するべきパラメータ（複数含む）の頻度に基づいて経験的に決定する
ことができる。一般に、集団は、少なくとも５０、少なくとも１００、少なくと
も２００、少なくとも５００、少なくとも１０００、少なくとも５０００、また
は少なくとも１００００またはより多い対象を有することができる。

【００８１】対象の収集物を同定し、各対象についての情報を記録し、そしてデータベース
として各対象と連関させる。各対象と連関している情報は、対象の履歴的形質に
関連する情報、表現型的形質およびまた遺伝型形質、医学的形質および任意の他
の特徴および決定することのできる対象についての形質を含むがこれらに限定さ
れない。この情報は、データベースを蓄積するための基礎として役立つ。

【００８２】例示的実施態様では、対象は、哺乳動物、例えば、ヒトであり、そして情報は
、１または２以上のパラメータ、例えば年齢、性別、病歴、人種および任意の他
の要因と関連する情報である。そのような情報は、動物が例えばヒトであるとき
、質問票によって、そして個体についての観察、例えば髪の色、目の色、および
他の形質によって取得することができる。遺伝子伝型情報は、対象からの組織ま
たは他の体および体液サンプルから取得することができる。

【００８３】健康体ゲノムデータベースは、血液サンプルのライブラリーから健康体個体か
らのプロファイルおよび多型を含むことができ、ここでライブラリーの各サンプ
ルは、個体および分離血液または他の組織サンプルである。データベースの各サ
ンプルは、ドナーの性別、年齢、人種群、および病歴についてプロファイル化さ
れる。

【００８４】データベースは、最初に対象の健康体集団を同定し、そして各対象についてデ
ータベースのパラメータを分類するように役立つ情報を取得することによって作
成する。この情報を好ましくは蓄積媒体、例えば、コンピューターのメモリーに
入力する。

【００８５】データベースを作成するために使用する集団の各対象について取得された情報
を、コンピューターメモリーまたは他の適当な蓄積媒体に蓄積する。この情報を
各対象と連関された識別子（identifier）と連結させる。ゆえに、データベース
は、対象を、例えば、バーコードの表すデータポイントによって同定し、それか
ら個体について、すべての情報、例えば、質問票からの情報をデータポイントと
連関させる。情報が収集されるように、データベースは作成される。

【００８６】したがって、例えば、プロファイル情報、例えば、質問票から取得される対象
履歴を、データベースに収集する。得られたデータベースは、標準的ソフトウェ
アーを使用し、例えば、年齢、性別および／または人種によって、望まれるよう
に分類することができる。サンプルが取得されるべき対象のための例示的質問票
を、図２２Ａ−Ｄに示す。各質問票を、好ましくはバーコード、特にデータベー
スへの入力のため機械読み取り可能バーコードによって同定する。対象がデータ
を提供し、そして健康であると思われる後（すなわち、献血のための基準に適合
する）、質問票のデータをデータベースに入力し、そしてバーコードと連関させ
る。組織、細胞または血液サンプルを対象から取得する。

【００８７】図４は、血液サンプルコンポーネントのプロセッシングおよび追跡（tracking
）を例示する。各コンポーネントをバーコードで追跡し、日付を付し、データベ
ースに入力し、そして対象および対象のプロファイルと連関させる。典型的には
、全血を遠心分離し、血漿、赤血球細胞（ペレット性である）および間の層であ
るバフィーコートに見出される白血球を生成する。種々のサンプルを取得し、そ
してバーコードでコード化し、そして必要な使用のために蓄積する。

【００８８】サンプルを対象から収集する。サンプルは、組織、細胞、および流体、例えば
核酸、血液、血漿、羊水、滑膜液、尿、唾液、水性体液、汗、精液サンプルおよ
び脳髄液を含むがこれらに限定されない。サンプルの特定のセットは集団の生物
に依存することが理解される。

【００８９】ひとたびサンプルを取得すると、収集物を好ましい実施態様では蓄積すること
ができ、各サンプルを識別子、特に機械読み取り可能コード、例えばバーコード
でインデックスを付する。分析のために、サンプルまたはサンプルのコンポーネ
ント、特に生体高分子および小分子、例えば核酸および／またはタンパク質およ
びメタボライトを単離する。

【００９０】サンプルの分析後、この情報を蓄積媒体のメモリーにおいてデータベースに入
力し、そして各対象と連関させる。この情報は、遺伝子型情報を含むがこれらに
限定されない。特に、多型を示す核酸配列情報および他の情報、例えば、ＰＣＲ
フラグメントの質量、ペプチドフラグメント配列または質量、生体高分子および
小分子のスペクトルおよび遺伝子、遺伝子産物または集団内の多型の存在が推論
されることができる他のマーカーの構造または機能の他の印。

【００９１】例示的実施態様では、データベースは、血液サンプルの収集物に由来すること
ができる。例えば、図１（また図１０参照）は、５０００個体サンプルを超える
収集物の状態を示す。サンプルを、ＳＯＰ（標準的取り扱い処理）ガイドライン
にしたがって実験室でプロセッシングした。任意の標準的血液プロセッシングプ
ロトコルを使用し得る。

【００９２】ここで記載の例示的データベースのために、以下の基準を使用して対象を選択
した：感染性物質についてはテストはしない。年齢：少なくとも１７歳体重：最小で１１０ポンド永久に不適格：肝炎の履歴（１１歳より後）白血病リンパ腫ヒト免疫不全ウイルス（ＨＩＶ）、ＡＩＤＳ慢性腎臓疾患

【００９３】一時的不適格：妊娠−出産、流産、中絶後６週まで大きな外科手術または点滴−１年間単球増加症−完全な回復まで全血献血のまえ−８週間注射による抗生物質、１週間；口により、４８時間、皮膚複合感染のための抗生物質を除く；年繰り延べもし除去されないなら、内部癌および皮膚癌は、なおり、そして再発はないこれらは献血について血液バンク基準に対応し、そしてヒト健康体データベー
スについてここで定義されるような健康体集団を表す。

【００９４】データベースの構造当業者に既知の任意の適当なデータベース構造およびフォーマットを使用し得
る。例えば、リレーショナルデータベースは好ましいフォーマットであり、そこ
ではデータが各対象を同定するインデクサー（indexer）によって連結されたパ
ラメータのマトリックスまたは表として蓄積される。データベースを分類するこ
とを含む、調製および操作のためのソフトウェアーを、商業的に利用可能である
ソフトウェアー、例えば、マイクロソフトアクセスから容易に開発し、または適
合させることができる。

【００９５】質コントロール質コントロール処理を実行することができる。例えば、サンプルの収集の後、
バンクの収集物の質を評価することができる。例えば、混合したサンプルを、既
知のマーカー、例えば性別についてのテストによってチェックすることができる
。サンプルの人種による分離の後、サンプルを特定の人種、例えば、ＨＬＡＤ
ＱＡ１群特異的コンポーネントと連関するマーカーについてランダムにテストし
、サンプルが適当に人種群によって分類されたかどうか評価する。例示的サンプ
ルバンクを図４に示す。

【００９６】データベースのための遺伝子型データおよび他のパラメータの取得情報および履歴パラメータのデータベースへの入力の後、各対象から取得され
るサンプルからの材料を分析する。分析する材料は、タンパク質、メタボライト
、核酸、脂質および任意の他の望まれる材料の構成物を含む。例えば、核酸、例
えば、ゲノムＤＮＡを配列決定によって分析することができる。

【００９７】配列決定を当業者に任意の既知の方法を使用して、行うことができる。例えば
、多型が同定され、または既知であり、そしてデータベースの対象のその頻度ま
たは存在を評価することが望まれるなら、各サンプルからの所望の領域を、例え
ば、ＰＣＲまたは制限フラグメント、ハイブリダイゼーションまたは当業者に既
知の他の適当な方法によって単離することができ、そして配列決定する。ここで
の目的のために、配列決定分析は、好ましくは質量分析法（例えば、米国特許番
号５５４７８３５、５６２２８２４、５８５１７６５、および５９２８９０６参
照）を使用して実施する。核酸は、ハイブリダイゼーションによって、また配列
決定することができ（例えば米国特許番号５５０３９８０、５６３１１３４、５
７９５７１４参照）、これらは質量分析法による分析を含む（米国出願番号０８
／４１９９９４および０９／３９５４０９参照）。

【００９８】他の検出方法では、対立遺伝子変異体を同定する前に、まず増幅することが必
要である。増幅は、当業界で既知の方法にしたがって、例えばＰＣＲおよび／ま
たはＬＣＲによって行うことができる。ある実施態様では、細胞のゲノムＤＮＡ
を２種のＰＣＲプライマーに曝露し、そして望まれる量の増幅されたＤＮＡを生
成するのに十分な何回かのサイクルの増幅に付する。好ましい実施態様では、プ
ライマーは、１５０ないし３５０塩基対離れて位置する。

【００９９】別の増幅方法は、下記のものを含む：自己持続性配列複製（Guatelli, J. C. et al., 1990, Proc. Natl. Acad. Sci.
U.S.A. 87:1874-1878）、転写的増幅系（Kwoh, D. Y. et al., 1989, Proc. Na
tl. Acad. Sci. U.S.A.86: 1173-1177）、Q-Beta Replicase（Lizardi, P. M.et
al., 1988, Bio/Technology 6:1197）、または任意の他の核酸増幅方法、次い
で当業界で周知の方法を使用する増幅された分子の検出。これらの検出スキーム
は、そのような分子が非常に少量で存在するならば、核酸分子の検出のために特
に有用である。

【０１００】核酸は、また検出方法およびプロトコル、特に質量分析法によるものによって
分析することができる（例えば、米国特許番号５６０５７９８、６０４３０３１
、共係属している、米国出願番号０８／７４４４８１、米国出願番号０８／９９
０８５１、国際ＰＣＴ出願番号ＷＯ９９／３１２７３、国際ＰＣＴ出願番号ＷＯ
９８／２００１９参照）。これらの方法は、自動化することができる（例えば、
共係属している、米国出願番号０９／２８５４８１および公開された国際ＰＣＴ
出願番号ＰＣＴ／ＵＳ００／０８１１１であって自動化されたプロセスラインを
記載するもの参照）。

【０１０１】ここでの分析の方法の好ましいものは、検出のため質量分析法でのプライマー
オリゴ塩基伸長（ＰＲＯＢＥ）反応に関係するものを含む（ここで記載され、そ
して他に、例えば、米国特許番号６０４３０３１参照；また米国出願番号０９／
２８７６８１、０９／２８７６８２、０９／２８７１４１および０９／２８７６
７９、共係属している米国出願番号０８／７４４４８１、国際ＰＣＴ出願番号Ｗ
Ｏ９８／２００１９として公開され、そして米国出願番号０８／７４４４８１、
０８／７４４５９０、０８／７４６０３６、０８／７４６０５５、０８／７８６
９８８、０８／７８７６３９、０８／９３３７９２、０８／７４６０５５、０８
／７８６９８８および０８／７８７６３９に基づく、国際ＰＣＴ出願番号ＰＣＴ
／ＵＳ９７／２０４４４参照；また米国出願番号０９／０７４９３６、米国特許
番号６０２４９２５、および米国出願番号０８／７４６０５５および０８／７８
６９８８および公開された国際ＰＣＴ出願番号ＷＯ９８／２００２０参照）。

【０１０２】分析を実施するための好ましいフォーマットは、固体支持体、例えば、シリコ
ンまたはシリコンコート基質に生体高分子が連結されているチップに基づくフォ
ーマット、好ましくはアレイの形態である。より好ましくは、分析を、質量分析
法、特にＭＡＬＤＩを使用して実施するとき、小さいナノリットルレベルの体積
のサンプルを負荷し、こうして得られるスポットはレーザースポットのサイズく
らい、またはより小さい。これは達成されるとき、質量分析分析から得られる結
果は定量的であることが見出される。得られる質量スペクトルのシグナルの面積
は濃度に比例的である（バックグラウンドについて標準化され、そして補正され
るとき）。

【０１０３】そのようなチップを調製し、そして使用する方法は、米国特許番号６０２４９
２５、共係続している、米国出願番号０８／７８６９８８、０９／３６４７７４
、０９／３７１１５０および０９／２９７５７５に記載され；また米国出願番号
ＰＣＴ／ＵＳ９７／２０１９５であってＷＯ９８／２００２０として公開されて
いるもの参照。これらの分析を実施するためのチップおよびキットは、ＳＥＱＵ
ＥＮＯＭから商標ＭａｓｓＡＲＲＡＹで商業的に入手可能である。ＭａｓｓＡｒ
ｒａｙは、結果をより迅速に送達するために、ミニチュア化されたアレイおよび
ＭＡＬＤＩ−ＴＯＦ（マトリックス介助レーザー脱離イオン化−飛行時間型）質
量分析法と結合された酵素的プライマー伸長反応の忠実性による。それは、タグ
のない遺伝的変異体と連関したＤＮＡフラグメントのサイズの単一塩基変化を正
確に区別する。

【０１０４】ここで提供する方法は、対立遺伝子の定量的な決定を可能とする。マススペク
トルのシグナルの面積は、定量的な決定のために使用することができる。頻度は
、すべてのスペクトルの総面積に対するシグナルの比率（ratio）から決定され
、バックグラウンドについて補正される。これは前記出願に記載されたようなＰ
ＲＯＢＥ技法により可能であり、引用によりここに含ませる。

【０１０５】核酸を分析するさらなる方法は、ポリメラーゼ連鎖反応（ＰＣＲ）、リガーゼ
連鎖反応（ＬＣＲ）、ミニＰＣＲ、ローリングサークル増幅、自己触媒的方法、
例えば、Ｑβレプリカーゼ、ＴＡＳ、３ＳＲ、および当業者に既知である任意の
他の適当な方法を含む、増幅に基づく方法を含む。

【０１０６】多型の分析およぼ同定および検出のための他の方法は、対立遺伝子特異的プロ
ーブ、サザン分析、および他のそのような分析を含むがこれらに限定されない。

【０１０７】以下に記載の方法は、質量分析法がフラグメント混合物を分析するために使用
されるとき、所望の増幅され、または非増幅性ヌクレオチド配列をフラグメント
化し、それによって質量シグナルのセットを生成する方法を提供する。増幅され
たフラグメントは、標準的ポリメラーゼ連鎖反応（ＵＳ４６８３１９５および４
６８３２０２）によってもたらされる。フラグメント化方法は、ＤＮＡの一本鎖
または二本鎖を切断する酵素およびＤＮＡをライゲートする酵素の使用に関係す
る。切断酵素はグリコシラーゼ、ニッカーゼ、および部位特異的および部位非特
異的ヌクレアーゼであることができ、グリコシラーゼ、ニッカーゼ、および部位
特異的ヌクレアーゼが最も好ましい。

【０１０８】グリコシラーゼフラグメント化方法ＤＮＡグリコシラーゼはある種のタイプのヌクレオ塩基を所望のＤＮＡフラグ
メントから特異的に除去する。これらの酵素は、それによって脱塩基(abasic)部
位を生成する事ができ、それらは、脱塩基部位で特異的にさらされたフォスフェ
ート骨格を切断し、そして配列を示すヌクレオ塩基特異的フラグメントのセット
を生成する、さらなる切断酵素によって、またはアルカリ溶液およびまたは熱の
ような化学的手段によって認識することができる。ＤＮＡグリコシラーゼおよび
その標的化されたヌクレオチドのある組み合わせの使用は、任意の所望の標的領
域の塩基特異的シグナチュアパターンを生成するために十分である。

【０１０９】多くのＤＮＡグリコシラーゼが既知であり、酵素の修飾ヌクレオチドまたはヌ
クレオチドアナログ標的に対応し、例えば、ＤＮＡグリコシラーゼはウラシルＤ
ＮＡグリコシラーゼ（ＵＤＧ）、３−メチルアデニンＤＮＡグリコシラーゼ、３
−メチルアデニンＤＮＡグリコシラーゼＩＩ、ピリミジンヒドレートＤＮＡグリ
コシラーゼ、ＦａＰｙＤＮＡグリコシラーゼ、チミジンミスマッチＤＮＡグリコ
シラーゼ、ヒポキサンチンＤＮＡグリコシラーゼ、５−ヒドロキシメチルウラシ
ルＤＮＡグリコシラーゼ（ＨｍＵＤＧ）、５−ヒドロキシメチルシトシンＤＮＡ
グリコシラーゼ、または１，Ｎ６−エテノアデニンＤＮＡグリコシラーゼである
ことができる（例えば米国特許番号５５３６６４９、５８８８７９５、５９５２
１７６および６０９９５５３、国際ＰＣＴ出願番号ＷＯ９７／０３２１０、ＷＯ
９９／５４５０１参照；またEftedal et al.(1993)Nucleic Acids Res 21:2095-
2101, Bjelland and Seeberg (1987)Nucleic Acids Res. 15:2787-2801, Saparb
aev et al. (1995)Nucleic Acids Res. 23:3750-3755, Bessho(1999)Nucleic Ac
ids Res. 27:979-983参照）。好ましいグリコシラーゼはウラシルＤＮＡグリコ
シラーゼ（ＵＤＧ）である。

【０１１０】例えばウラシルは、通常のＤＮＡ前駆体ヌクレオチド（例えば、ｄＣＴＰ、ｄ
ＡＴＰ、およびｄＧＴＰ）およびｄＵＴＰの存在下で、ＤＮＡを増幅することに
よって増幅ＤＮＡ分子に組み込むことができる。増幅された産物がＵＤＧで処理
されるとき、ウラシル残基が切断される。ＵＤＧ反応からの産物の次の化学的処
理によって、フォスフェート骨格の切断およびヌクレオ塩基特異的フラグメント
の生成を得る。さらに、グリコシラーゼ処理の前に、増幅産物の相補鎖の分離に
より、生成されるべきフラグメント化の相補的パターンを得る。

【０１１１】したがって、ｄＵＴＰおよびウラシルＤＮＡグリコシラーゼの使用によって、
相補鎖のＴ特異的フラグメントの生成が可能となり、したがってこれは、所望の
配列内のＴおよびＡ位置の情報を提供する。これと同様に、両方の（相補的）鎖
（すなわちＣ特異的グリコシラーゼ）のＣ特異的反応は、もし両方の増幅鎖のフ
ラグメント化パターンが別個に分析されるならば、所望の配列内のＣおよびＧ位
置の情報をもたらす。したがって、グリコシラーゼ法および質量分析法によって
、Ａ、Ｃ、ＧおよびＴ特異的フラグメント化パターンの全シリーズが分析される
ことができる。

【０１１２】ニッカーゼフラグメント化法ＤＮＡニッカーゼ、またはＤＮアーゼを使用して、ＤＮＡ二重らせんの１の鎖
を認識し、そして切断することができる。多くのニッカーゼが既知である。これ
らのうちに、例えば、ニッカーゼＮＹ２ＡニッカーゼおよびＮＹＳ１ニッカーゼ
（Megabase）があり、以下の切断部位を有する；ＮＹ２Ａ：５’・・・ＲＮＧ・・・３’ ３’・・・ＹＴＣ・・・５’、ここで、Ｒ＝ＡまたはＧおよびＹ＝ＣまたはＴ
ＮＹＳ１：５’・・・ＣＣ〔Ａ／Ｇ／Ｔ〕・・・３’ ３’・・・ＧＧ〔Ｔ／Ｃ／Ａ〕・・・５’。

【０１１３】Ｆｅｎリガーゼフラグメント化法Ｆｅｎリガーゼ法は、２種の酵素：Ｆｅｎ−１酵素およびリガーゼに関係する
。Ｆｅｎ−１酵素は“フラップ”エンドヌクレアーゼとして知られる部位特異的
ヌクレアーゼである（米国特許５８４３６６９、５８７４２８３および６０９０
６０６）。この酵素は、標的ＤＮＡ鎖にハイブリダイズされる２種のオリゴヌク
レオチドのオバーラップによって創出されるＤＮＡ“フラップ”を認識し、そし
て切断する。この切断は高度に特異的であり、そして単一塩基対突然変異を認識
することができ、これにより所望のあるＳＮＰの個々のヘテロ接合性から単一ホ
モログの検出、それからフラグメント内に存在する他のＳＮＰのそのホモログの
遺伝子型決定を可能とする。Ｆｅｎ−１酵素は、Ｆｅｎ−１様ヌクレアーゼ、例
えばヒト、ハツカネズミ、およびツメガエル属ＸＰＧ酵素および酵母ＲＡＤ２ヌ
クレアーゼまたは例えば、M.jannaschii、P. furiosus、およびP. woeseiからの
Ｆｅｎ−１エンドヌクレアーゼであることができる。好ましい酵素には、Ｆｅｎ
−１酵素が含まれる。

【０１１４】リガーゼ酵素は、２つの二本鎖核酸フラグメントの間のホスホジエステル結合
を形成する。リガーゼは、ＤＮＡリガーゼＩまたはＤＮＡリガーゼＩＩＩである
ことができる（例えば、米国特許番号５５０６１３７、５７００６７２、５８５
８７０５および５９７６８０６参照；またWaga. et al. (1994)J. Biol. Chem.
269: 10923-10934、Li et al. (1994) Nucleic Acids Res. 22:632-638、Arrand
et al.(1986) J. Biol. Chem. 261: 9079-9082, Lehman (1974) Science 186:
790-797、Higgins and Cozzarelli(1979)Methods Enzymol. 68:50-71、Lasko et
al. (1990)Mutation Res. 236:277-287、およびLindahl and Barnes (1992)Ann
. Rev.Biochem. 61:251-281参照）。

【０１１５】熱安定性リガーゼ（Epicenter Technologies）は、ここでの使用のための好ま
しいリガーゼに含まれ、ここで“熱安定性”は、ＤＮＡの２つの鎖を分離するた
めに必要である温度への曝露の後、なお活性を保持しているリガーゼを意味する
。

【０１１６】タイプＩＩＳ酵素フラグメント化法制限酵素は、特定の認識配列内、またはそれに隣接する特異的部位で二本鎖Ｄ
ＮＡに特異的に結合し、そして切断する。これらの酵素を、当業者に知られてい
るように２種の群に分類する（例えばタイプＩ、ＩＩ、およびＩＩＩ）。タイプ
ＩおよびタイプＩＩＩ酵素の特性のために、これらは分子生物学的応用に広く使
用されていない。したがって、本発明のためにタイプＩＩ制限酵素が好ましい。
当業界で既知である何千もの制限酵素のうち、１７９種の異なるタイプＩＩ特異
性がある。１７９種の独特のタイプＩＩ制限エンドヌクレアーゼのうち、３１種
が４塩基配列を有し、１１種が５塩基認識配列を有し、１２７種が６塩基認識配
列を有し、そして１０種が６塩基より大きい認識配列を有する（米国特許５６０
４０９８）。カテゴリータイプＩＩのうち、タイプＩＩＳが好ましい。

【０１１７】タイプＩＩＳ酵素は、ＡｌｗＸＩ、ＢｂｖＩ、Ｂｃｅ８３、ＢｐｍＩ
、ＢｓｇＩ、ＢｓｍＡＩ、ＢｓｍＦＩ、ＢｓａＩ、ＢｃｃＩ、Ｂｃｇ
Ｉ、ＥａｒＩ、Ｅｃｏ５７１、Ｅｓｐ３１、ＦａｕＩ、ＦｏｋＩ、
ＧｓｕＩ、ＨｇａＩ、ＭｍｅＩ、ＭｂｏＩＩ、ＳａｐＩ、等であるこ
とができる。好ましいタイプＩＩＳ酵素はＦｏｋＩである。ＦｏｋＩ酵素エンドヌクレアーゼは、例示的な周知の、タイプＩＩＳクラス
の特徴を把握されたメンバーである（例えば、米国特許５７１４３３０、５６０
４０９８、５４３６１５０、６０５４２７６および５８７１９１１参照；またSz
ybalski et al. (1991)Gene 100:13-16、Wilson and Murray(1991)Ann. Rev. Ge
net. 25:585-627、Sugisaki et al.(981)Gene 16:73-78、Podhajskaand Szalski
(1985) Gene 40:175-182参照。ＦｏｋＩは配列５’ＧＧＡＴＧ−３’を認識し
、そしてそれによりＤＮＡを切断する。タイプＩＩＳ制限部位は、ＤＮＡ標的を
増幅するために使用されるプライマーにタイプＩＩＳ制限部位を組み込むことに
よって、ＤＮＡ標的に導入することができる。ＦｏｋＩでの消化によって生成
したフラグメントは、部位特異的であり、そして質量分析法、例えば、ＭＡＬＤ
Ｉ−ＴＯＦ質量分析法、ＥＳＩ−ＴＯＦ質量分析法、および当業者に周知である
任意の他のタイプの質量分析法によって分析することができる。

【０１１８】かつて、多型が年齢のようなパラメータと相関していることが見出された。対
立遺伝子脱落のための誤りの結果の可能性を、ゲノムの隣接領域で比較ＰＣＲを
行うことによって試験することができる。

【０１１９】分析データベースの使用では、対立遺伝子頻度を集団にわたり、集団の各サンプル
を個々に分析し、各個体サンプルの所望の対立遺伝子またはマーカーの存在また
は不存在を決定し、それから集団のマーカーの頻度を決定することによって決定
することができる。次いで、このデータベースを分類し（層化し）、標準的統計
的分析を使用して、対立遺伝子および選択されたパラメータの間の任意の相関を
同定することができる。もし相関、例えば、年齢と特定のマーカーの減少または
性別または他のパラメータとの相関が観察されるならば、そのときはそのマーカ
ーがさらなる研究、例えば、関係する遺伝子または経路を同定するための遺伝的
マッピングのための候補である。

【０１２０】次いで、例えば、マーカーは疾患と相関づけられ得る。ハプロタイピングを、
また実施することができる。遺伝的マッピングを標準的方法を使用して実施する
ことができ、そしてまた他のデータベースの使用、例えば、障害と連関されるべ
き予め決定されたデータベースを要し得る。例示的な分析を実施し、そしてこれらを図に示し、そしてここで考察する。

【０１２１】サンプルをプールするここで提供するデータベース、またはそのような情報の任意の他のデータベー
スを使用して、それぞれのサンプルを別々に試験することによって取得された実
質的に同じ頻度を、サンプルを、例えば、１０、２０、５０、１００、２００、
５００、１０００または任意の他の数のバッチでプールすることによって取得す
ることができることが見出される。正確な数を必要ならば経験的に決定し、そし
て３より小さいことができる。

【０１２２】ある実施態様では、遺伝子型の、および他のマーカーの頻度を、サンプルをプ
ールすることによって取得することができる。この標的集団を実施するために、
そして評価すべき遺伝的変異を選択し、複数の生体高分子のサンプルを集団のメ
ンバーから取得し、そしてマーカーまたは遺伝子型を推論することができる生体
高分子を決定し、または検出する。プール中のテストするサンプルを個々に比較
し、そしてその分類した結果を図９に示し、第ＶＩＩ因子対立遺伝子３５３Ｑの
頻度を示す。図１０は、プール性対個体サンプルにおける、ＣＥＴＰ対立遺伝子
ＣＥＴＰの頻度を示す。図１５は、データを取得するためにプールしたＤＮＡサ
ンプルを使用する、データベース中の種々の人種の群のなかの人種の多様性を示
す。図１２−１４はこれらのサンプルについてマススペクトルを示す。

【０１２３】テストサンプルをプールすることは、ここで提供する健康体のデータベースに
応用できるだけでなく、また疾患性集団に由来する典型的なデータベースを含む
、対象および遺伝子型の情報の任意のデータベースへの入力のためのデータを集
めるときに使用できる。ここで実証されることは、達成した結果は、もし各サン
プルを別に分析するならば達成されるのと統計的に同じ結果であるという、発見
である。方法、例えばここで提供する質量分析法によってプールしたサンプルの
分析によって、そのようなデータの解決および結果の数量化が可能となる。

【０１２４】第ＶＩＩ因子についてＲ５３Ｑ酸多型を評価する。図９では、“個体”データ
は９２個体の反応物で観察された対立遺伝子頻度を表す。プールしたデータは、
単一のプローブの反応にプールした同じ９２個体の対立遺伝子頻度を表す。個体
のドナーのサンプル中のＤＮＡの濃度は、２５０ナノグラムである。プールした
サンプルのＤＮＡの総濃度は、また２５０ナノグラムであり、ここですべての個
々のＤＮＡの濃度は、２．７ナノグラムである。

【０１２５】スペクトルの質または検出するサンプルの量を定量する能力の何らの変化なく
、２．７ナノグラムから０．２７ナノグラムに、プールしたサンプルの個体のＤ
ＮＡ濃度を減少させることが可能であることがまた示された。ゆえに、低濃度の
サンプルを、このプールする方法で使用し得る。

【０１２６】データベースおよびそれによって同定したマーカーの使用ゲノムの首尾よい使用は、科学的な仮説（すなわち一般的な遺伝的変異、例え
ば、ＳＮＰ）、研究計画（すなわち複合的な障害）、サンプルおよび技術、例え
ばチップに基づく質量分析分析（例えば、米国特許番号５６０５７９８、米国特
許番号５７７７３２４、米国特許番号６０４３０３１、共係属している米国出願
番号０８／７４４４８１、米国出願番号０８／９９０８５１、国際ＰＣＴ出願番
号ＷＯ９８／２００１９、共係属している米国出願番号０９／２８５４８１であ
って分析のための自動化されたプロセスラインを記載しているもの参照；また例
えば、米国出願番号０８／６１７２５６、０９／２８７６８１、０９／２８７６
８２、０９／２８７１４１および０９／２８７６７９、共係属している米国出願
番号０８／７４４４８１、米国出願番号０８／７４４４８１、０８／７４４５９
０、０８／７４６０３６、０８／７４６０５５、０８／７８６９８８、０８／７
８７６３９、０８／９３３７９２、０８／７４６０５５、０９／２６６４０９、
０８／７８６９８８および０８／７８７６３９に基づき、国際ＰＣＴ出願番号Ｗ
Ｏ９８／２００１９として公開された、国際ＰＣＴ出願番号ＰＣＴ／ＵＳ９７／
２０４４４参照；また米国出願番号０９／０７４９３６参照）を要求する。これ
らの態様のすべては、ここで提供するデータベースおよび収集中のサンプルと結
合させて使用することができる。

【０１２７】それによって同定したデータベースおよびマーカーを、例えば、以前同定され
ていない、または未知の遺伝的マーカーの同定のために、そして既知のマーカー
の新規な使用を同定するために、使用することができる。同定されるマーカーと
して、これらをデータベースに入力し、さらなる相関を決定し得るパラメータを
分類するように使用するため、データベースに入力し得る。

【０１２８】予め同定されていない未知の遺伝的マーカー健康体のデータベースのサンプルを使用して、またデータベースの集団の多型
を調査するときに、任意のマッピング、配列決定、増幅および他の方法論を使用
し、新規の多型および遺伝的マーカーを同定することができる。次いで、こうし
て同定した多型を、各サンプルについてデータベースに入力することができ、そ
してその多型を分類用パラメータとして使用して、データベースを分類（層化）
することができ、例えば同定したマーカーの頻度の年齢相関性変化を表す、任意
のパターンおよび相関を同定することができる。相関を同定するならば、マーカ
ーの遺伝子座をマッピングし、そしてその機能または効果を評価し、または演繹
することができる。

【０１２９】こうして、ここにデータベースは以下のための手段を提供する：集団で、年齢の増加にともなうマーカーの発生または消失を比較することによ
って、遺伝子的要因の有意に異なる対立遺伝子頻度を同定し、それからそのマー
カーと疾患または生物学的経路を連関させること；

【０１３０】男性を女性集団と比較し、または他の選択された層化された集団を比較するこ
とによって、疾患を生じる遺伝的要因の有意に異なる対立遺伝頻度を同定し、そ
してそのマーカーを疾患または生物学的経路と連関させること；

【０１３１】異なる人種群を比較することによって、疾患を生じる遺伝子的要因の有意に異
なる対立遺伝子変異を同定し、そしてそのマーカーをその人種群に高頻度で存在
すると知られている、疾患または生物学的経路と連関させること；

【０１３２】年齢、性別、および人種起源にしたがって層化された、全般に任意交配された
集団中の遺伝子の潜在的に機能的な変異体をプロファイルし、そしてそれによっ
て調査した集団の身体的状態への変異体遺伝子の寄与を実証すること；

【０１３３】年齢、性別、および人種起源にしたがって層化された、全般に任意交配された
集団内で遺伝子不平衡分析を実施することによって機能的に関連のある遺伝子変
異体を同定し、そしてそれによって調査した集団の身体的状態へのそれらの寄与
を実証すること；

【０１３４】年齢、性別、および人種起源にしたがって層化された、全般に任意交配された
集団内で連鎖不平衡分析を実施することによって、潜在的に機能的な染色体また
は染色体の部分の変異体を同定し、そしてそれによって調査した集団の身体的状
態に対するそれらの寄与を実証すること。

【０１３５】同定したマーカーおよび既知のマーカーの使用このデータベースを、また既知で蓄積したマーカーと組み合せて使用し、任意
の相関を同定し得る。例えば、データベースは、以下のために使用することがで
きる；医学的に関連のある多型マーカーの存在を、決定および評価すること；

【０１３６】医学的に関連のある遺伝的要因の診断的な特異性を決定および評価すること；医学的に関連のある遺伝的要因の肯定的な予測値を決定および評価すること；原因となる遺伝的要因に関して、全体の集団内で、例えば、糖尿病、高血圧、
自己免疫性疾患、アテローム性動脈硬化症、癌および他の疾患を含むがこれらに
限定されない、複合的な疾患の発生を決定し、および評価すること；

【０１３７】予防的な疾患処置のための適当な戦略を描くこと；原発性疾患介入のための適当なタイムラインを描くこと；これらの一般的な利用可能性に関して単離した集団で同定された関連のある遺
伝的要因を医学的に確認すること；これらの一般的な利用可能性に関して単離された集団で同定されたすべての潜
在的な標的構造を含む疾患経路を確認すること；およびこれらの一般的な利用可能性に関して単離された集団内で同定された適当な薬
物標的を確認すること。

【０１３８】多型が連鎖し得る疾患および障害には、先天性の代謝の誤りに連鎖したもの、
後天性の代謝的障害、介在性代謝、発癌経路、血液凝固経路、およびＤＮＡ合成
および修復経路ＤＮＡ修復／複製／転写因子および活性、例えば発癌、加齢およ
び血液凝固に関係する遺伝子および血栓に関連する関連性生化学的経路、塞栓、
発作、心筋梗塞、脈管形成および発癌を含み得る。

【０１３９】例えば、多くの疾患が、中間代謝の酵素の不足または欠損によって引き起こさ
れ、または関係し（例えば、以下の表１および２参照）、それは酵素基質を摂取
すると、臓器および組織（特に、幼児の脳および他の臓器に発生し、精神的遅滞
および他の発育障害を生じる）を損傷させる有害なメタボライトの蓄積を生じる
。

【０１４０】非常に興味ある障害のマーカーおよび遺伝子の同定モデル系幾つかの遺伝子系、例えば、ｐ２１、ｐ５３およびリポタンパク質リパーゼ多
型（Ｎ２９１Ｓ）を選択した。ｐ５３遺伝子は、多様な腫瘍タイプで突然変異し
ている腫瘍抑制遺伝子である。ある共通する対立遺伝子変異体がコドン７２に存
在する。ｐ５３遺伝子で同定された多型、すなわちＲ７２Ｐ対立遺伝子は、当該
遺伝子のコドン７２でアルギニンからプロリンへのアミノ酸の置換を生じる。

【０１４１】疾患性集団を使用して、米国のアフリカ系アメリカ人および白人のなかのこれ
らの対立遺伝子の対立遺伝子分布の人種間相違があることが示された。この結果
はここに、この発見を支持し、そしてまた健康体のデータベースから取得された
結果が意義深いことを実証している（図７Ｂ参照）。

【０１４２】２９１Ｓの対立遺伝子は、高密度リポタンパク質コレステロール（ＨＤＬ−Ｃ
）（これはアテローム性動脈硬化症、特に、心筋梗塞の男性の高いリスクと連関
する）を生じる（Reymer et al. (1995) Nature Genetics 10:28-34参照）。

【０１４３】両方の遺伝的多型が白人集団に基づくサンプルバンクの一部の中にプロファイ
ルされた。リポタンパク質リパーゼ遺伝子に位置する多型について、１０２５人
の非選択性個体（４３６人の男性および５８９人の女性）のすべてをテストした
。ゲノムＤＮＡを当該個体から取得した血液サンプルから単離した。

【０１４４】実施例および図面に示すように、約５０００の対象を含む、例示的データベー
スは、質問票に対する回答（図３参照）、そして遺伝子型情報を層化する。特定
の既知の対立遺伝子を選択し、そして質量分析法を使用してマーカーについてサ
ンプルをテストし、特定のＰＲＯＢＥ（実施例参照）を使用して、各サンプル中
の多型を同定した。データベース中の集団を、種々のパラメータにしたがって分
類し、そして相関を観察した。例えば、図２Ａ−Ｃは、データベース中の白人集
団のリポタンパク質リパーゼ遺伝子についての、年齢および性別によるデータの
分類を示している。結果は、男性について年齢にともなってこの対立遺伝子の頻
度は減少するが、女性ではそのような減少がないことを示している。データベー
スに対してテストした他の対立遺伝子は、ｐ５３、ｐ２１および第ＶＩＩ因子を
含む。年齢によって分類したときの結果を図に示す。

【０１４５】これらの例は、一般的な集団内の疾患を生じる遺伝的要因の変化した頻度の影
響を実証している。これらの結果の科学的な解釈によって、多型性の遺伝的変化
の医学的な関連性の予測が可能となる。さらに、これらの一貫性、診断的な特異
性、肯定的な予測値、疾患の開始、予防戦略の最も適当な開始、および任意交配
された集団について単離された集団で同定された遺伝的変化の一般的な利用可能
性について結論を引き出すことができる。

【０１４６】したがって、人種的に同質である、年齢および性別で層化された集団に基づく
サンプルバンクは、それらの潜在的な医学的有用性に関して遺伝子要因の迅速な
同定および確認のための適当なツールである。

【０１４７】データベースシステムを創出し、分類し、そしてプロセッシングするための例示
的コンピューターシステムデータベースを含む、コンピューターを含むシステムをここで提供する。コン
ピューターおよびデータベースを、例えば、ＡＰＬシステム（共係属している米
国出願番号０９／２８５４８１参照）と組み合せて使用することができる。これ
は、生体高分子、特に核酸を分析するための自動化されたシステムである。ＡＰ
Ｌシステム由来の結果をデータベースに入力することができる。

【０１４８】任意の適当なコンピューターシステムを使用し得る。コンピューターシステム
をサンプル分析、例えば、ここで記載の自動化プロセスラインのためにシステム
に組み込み得る（例えば、共係属している米国出願番号０９／２８５４８１参照
）。

【０１４９】図１７は、ここで記載のデータベースを提供し、そしてプロセッシングするた
めの、構築されたコンピューターのブロック図である。データベースを維持し、
そして方法および処理を実施するプロセッシングを、同様の構築を有するすべて
の複数コンピューター上で実施し得、または単一の、総合的なコンピューターに
よって実施し得る。例えば、データをデータベースに加えるコンピューターを、
データベースを蓄積するコンピューターから分離し得、またはそれによって総合
化し得る。別の編成では、プロセッシングを実施するコンピューターは、図１７
に例示されるような構築を有し得る。

【０１５０】図１７は、前記のデータベースを維持する例示的なコンピューター１７００の
ブロック図であり、そしてこの方法および処理を実行する。各コンピューター１
７００は、中央プロセッサーユニット（ＣＰＵ）１７０２、例えば、“ペンティ
アム”マイクロプロセッサーの制御化で作動し、そしてインテルコーポレーショ
ン（Snata Clara, California, USA）から入手可能である総合的サーキットチッ
プと連関している。コンピューター使用者は、コマンドおよびデータをキーボー
ドおよびディスプレイマウス１７０４から入力することができ、そしてディスプ
レイ１７０６で入力およびコンピューター出力を見ることができる。ディスプレ
イは、典型的には、ビデオモニターまたはフラットパネルディスプレイ装置であ
る。

【０１５１】コンピューター１７００はまた、直接的アクセス蓄積装置（ＤＡＳＤ）１７０
７、例えば、固定ハードディスクドライブをも含む。メモリー１７０８は、典型
的には、揮発性セミコンダクターランダムアクセスメモリー（ＲＡＭ）を含む。
各コンピューターは好ましくは、プログラム製品リーダーがデータを読むことが
できる（そしてそれが所望によりデータを書き込むことができる）、プログラム
製品蓄積装置１７１２を許容する、プログラム製品リーダー１７１０を含む。

【０１５２】プログラム製品リーダーは、例えば、ディスクドライブを含むことができ、そ
してプログラム製品蓄積装置は取り外し可能蓄積媒体、例えば磁気フロッピーデ
ィスク、光学的ＣＤ−ＲＯＭディスク、ＣＤ−Ｒディスク、ＣＤ−ＲＷディスク
、またはＤＶＤデータディスクを含むことができる。要すれば、コンピューター
は相互に、ネットワーク１７１３上の他の接続されたコンピューターと通信する
ことができるように、接続することができる。各コンピューター１７００は、ネ
ットワークとコンピューターの間の接続１７１６上の通信を可能とする、ネット
ワークインターフェース１７１４を経由して、ネットワーク１７１３上の接続さ
れた他のコンピューターと通信することができる。

【０１５３】コンピューター１７００は通常のコンピューター構築物にしたがう、メモリー
１７０８に一時的に蓄積される、プログラミングステップの制御下で作動する。
プログラミングステップをＣＰＵ１７０２によって実行するとき、付属システム
コンポーネントはそのそれぞれの機能を実行する。こうして、プログラミングス
テップは前記のようなシステムの機能性を履行する。プログラミングステップを
、プログラム製品リーダー１７１２を経由して、またはネットワーク接続１７１
６を経由して、ＤＡＳＤ１７０７から受け取ることができる。

【０１５４】蓄積ドライブ１７１０は、プログラム製品を受け取り、そこに記録されたプロ
グラミングステップを読み、そしてＣＰＵ１７０２による履行のためにメモリー
１７０８へプログラミングステップを送達することができる。前記のように、プ
ログラム製品蓄積装置１７１０は、磁気フロッピーディスクおよびＣＤ−ＲＯＭ
蓄積ディスクを含む、記録されたコンピューター読み取り可能指令を有する、複
数の取り外し可能媒体のいずれかを含むことができる。他の適当なプログラム製
品蓄積装置は、磁気テープ、およびセミコンダクターメモリーチップを含むこと
ができる。この方法で、作動のために必要なプロセッシングステップをプログラ
ム製品上に埋め込むことができる。

【０１５５】あるいは、プログラムステップを、ネットワーク１７１３上で作動しているメ
モリー１７０８へと受け取ることができる。このネットワーク方法では、ネット
ワーク通信がさらなる説明なくして当業者によって理解される周知の方法によっ
てネットワーク接続１７１６上に確立された後に、ネットワークインターフェー
ス１７１４を経由して、コンピューターがプログラムステップを含むデーターを
メモリー１７０８に受け取る。プログラムステップを次いで、ガーメントデータ
ベースシステムのプロセッシングを履行するために、ＣＰＵ１７０２によって実
行する。

【０１５６】システムのすべてのコンピューターが好ましくは図１７に示すのと同様の構築
物を有し、したがって図１７のコンピューター１７００に関して記載された詳細
がシステム１７００のすべてのコンピューターにあてはまることが理解されるべ
きである。このことは、ネットワーク１７１３に接続されて示される、複数のコ
ンピューター１７００によって指摘される。コンピューター１７００のいずれか
は、それらが他のコンピューターと通信することができ、そしてここで記載の機
能性を支持することができる限り、別の構築物を有する。

【０１５７】図１８は、図１７に例示したコンピューターを使用し、データベース、例えば
、多型遺伝的マーカーを同定するためのデータベースを維持し、そしてアクセス
を提供して実施されるプロセッシングステップを例示する、フロー図である。特
に、データベースに含まれる情報を、図１７に例示されるのと同様の構築を有す
るコンピューターに蓄積する。図１８に指摘のように、データベースを維持する
ための第１のステップは、集団の健康なメンバーを同定することである。前記の
様に、集団メンバーは健康であることのみを基礎に選択される対象であり、そし
てここで、対象は哺乳動物、例えば、ヒトであり、彼らは／これらは好ましくは
外観上の健康および検出可能な感染症の不存在に基づいて選択される。同定する
ステップは、１８０２の数を付したフロー図ボックスによって表す。

【０１５８】１８０４の数を付したフロー図ボックスによって表される次のステップは、同
定される集団のメンバーに関連する、同定のための、そして履歴的情報およびデ
ータを取得することである。情報およびデータは、それぞれの集団メンバー、例
えば、メンバーの年齢、人種、性別、医学的履歴、および最終的には遺伝子型情
報についてのパラメータを含む。最初に、パラメータ情報を、体組織または体液
サンプルがまた取得される、各メンバーによって回答された質問票から取得する
。これらのパラメータをコンピューターのデータベースに入力し、そして蓄積す
るステップを、１８０６の数を付したフロー図ボックスによって表す。各集団に
ついてのさらなる情報として、メンバーおよび対応するサンプルを取得し、この
情報をデータベースに入力し、そして蓄積パラメータとして役立てることができ
る。

【０１５９】１８０８の数を付したフロー図ボックスによって表した、次のステップでは、
メンバーのパラメータをインデクサーと連関させる。このステップを、例えば、
新規のデータ記録がリレーショナルデータベース構造にしたがって蓄積され、そ
してその構造にしたがって他の記録と自動的に連結されるとき、データベース蓄
積操作の一部として実行し得る。ステップ１８０６はまた、データベース入力が
入力サーチにしたがってサーチされ、またはデータの寄与を決定するためのキー
値をインデックス化する、通常のデータ分類または修復プロセスの一部として履
行し得る。

【０１６０】例えば、そのようなサーチおよび分類技術を使用し、既知の遺伝的マーカーの
存在にしたがい、それからそれらが企図していた、疾患との相関があるかどうか
決定し得る。この使用の例は、ｐ５３およびリポタンパク質リパーゼ多型の頻度
を評価するためのものである。

【０１６１】そのようなデータベースのサーチはまた、集団ないの頻度が年齢、年齢、人種
群、性別、またはある他の基準の関数として変化する、１または２以上の遺伝的
マーカーを同定するために有益であってよい。これは以前未知の多型の同定およ
び、最終的には疾患の開始および進行と関係する遺伝子または経路の同定をもた
らすことができる。

【０１６２】さらに、データベースは、同定された多型を取得するために使用することがで
き、そして選択されたパラメータにしたがってデータを分類するとき、頻度につ
いて変化するかどうか確認することができる。

【０１６３】この方法では、ここで提供するデータベースおよび方法が、とりわけ、コンポ
ーネント、特に疾患プロセスのキーコンポーネントの同定が、その遺伝的基盤の
理解、およびまたプロセス、例えば個体の薬物応答の理解によって可能となる。
ここで提供するデータベースおよび方法をまた、病理学的経路の解明に関係する
方法で、新規な診断アッセイの開発で、新規の可能性のある薬物標的の同定、お
よび新規薬物候補の同定で、使用することができる。

【０１６４】病的状態および／または早期死亡関連性多型何らの特定の疾患について選択されていない、健康な血液ドナーの集団によっ
て提供された情報を含むデータベースを使用して、存在し、年齢にともない頻度
が減少する多型および対立遺伝子を同定することができる。これらは病的状態感
受性マーカーおよび遺伝子を表し得る。

【０１６５】ゲノムの多型は遺伝子機能、タンパク質機能またはゲノム不安定性の変化につ
ながることができる。臨床的関連性／有用性を有するこれらの多型を同定するこ
とが、全世界の科学的努力の目標である。そのような多型性の発見が、疾患を治
療するための新規薬物化合物の同定および開発に基本的な影響を有することを期
待することができる。しかし、種々の多型を同定するための戦略は、煩雑であり
、そして非常に多数の患者、および疾患連関を示すためのコントロールコホート
の利用可能性に依存する。特に、任意の疾患（病的状態感受性遺伝子）に罹患し
ている集団の一般的リスクを生じる遺伝子により、これらのケース／コントロー
ル研究から完全に免れる。

【０１６６】広範な異なる疾患に存在する、病的状態感受性遺伝子を同定するためのスクリ
ーニング戦略をここに記載する。病的状態感受性遺伝子の定義は、多くの異なる
細胞型または組織に発現されている遺伝子（ハウスキーピング遺伝子）であり、
そしてその変化した機能は、この障害に特異的な経路と関係する、疾患特異的感
受性遺伝子によって生じた臨床的表現型の発現を促進することができる。換言す
ると、これらの病的状態感受性遺伝子は、この疾患についてのその遺伝子的な構
成（make-up）にしたがって、ヒトに明瞭な疾患を発生させる素因をつくる。

【０１６７】病的状態感受性遺伝子の候補は、転写、翻訳、熱ショックタンパク質、タンパ
ク質トラフィッキング（protein trafficking）、ＤＮＡ修復、細胞内構造（例
えば、ミトコンドリア、ペルオキシソームおよび他の細胞内ミクロボディー）に
ついての組みたてシステム、レセプターシグナルカスケード、免疫等に関係する
経路の根本のレベルで見出すことができる。これらの経路は、細胞内レベルで、
並びに全生物について生命の質を制御する。

【０１６８】これらの経路についてのタンパク質をコードする遺伝子に位置する突然変異／
多型は、細胞の適応性を減少させ、そして生物をより感受性にさせ、疾患特異的
感受性遺伝子の作用によって生じた、臨床的な表現型を発現させることができる
。したがって、これらの病的状態感受性遺伝子は、すべてでないにしても、広範
な種々の複合的な疾患に潜在的に関係することができる。疾患特異的感受性遺伝
子は、グルコース、脂質、ホルモン、等のような疾患特異的経路として考えるこ
とができる経路に関係する。

【０１６９】例示した方法は、とりわけ、病的状態および／または死亡に対するヒトの全般
的な感受性と関係する、遺伝子および／または遺伝子産物の同定；ヒトの疾患の
遺伝子的基盤を解明するための研究におけるこれらの遺伝子および／または遺伝
子産物の使用；疾患特異的感受性遺伝子なく、またはそれとともに組みあわせに
よる統計的分析におけるこれらの遺伝子および／または遺伝子産物の使用；疾患
感受性遺伝子の一貫性を予測するためのこれらの遺伝子および／または遺伝子産
物の使用；素因および／または急性医学的診断におけるこれらの遺伝子および／
または遺伝子産物の使用、および疾患を治療するためおよび／またはヒトの寿命
を延長するための薬物を開発するためのこれらの遺伝子および／または遺伝子産
物の使用を可能とする。

【０１７０】スクリーニングプロセス年齢、性および人種等によって層化された健康体集団は、遺伝子に連関する病
的状態についての、大変効率的で、普遍的なスクリーニング手段である。高齢な
集団と比較したときの若齢の集団中の対立遺伝子頻度の変化は、推定的な病的状
態感受性遺伝子を示すことが期待される。この健康体集団ベースの個々のサンプ
ルを、スループットをさらに増加させるためにプールすることができる。原則的
な実験の証明において、若齢および高齢な白人女性および男性のプールを適用し
て、多くの異なる遺伝子に位置する、４００より多いランダムに選択された単一
ヌクレオチド多型をスクリーニングした。

【０１７１】対立遺伝子的な相違が、両方または一方のみの性について、若齢および高齢者
の間で８％より大きいならば、候補多型が同定された。当初の結果を、少なくと
も１つの独立的な次の実験でもう一度アッセイした。反復実験は、不安定な生化
学的反応をみとめるために必要であり、そしてそれは約２−３％の頻度で存在し
、そして年齢関連性の対立遺伝子頻度の相違に似ていることができる。

【０１７２】平均の頻度の相違および標準偏差を、当初の結果の良好な再現性があった後に
算出する。最終的な対立遺伝子頻度を次いで、白人ＣＥＰＨサンプルプールの引
用集団と比較する。結果は、若齢白人集団の対立遺伝子頻度に類似することを示
すものとする。次いで、遺伝子型情報を含む、候補の正確な対立遺伝子頻度を、
すべての個々のサンプルを分析することによって取得した。この処理は、時間お
よびコストに関して単純である。それは莫大な数のＳＮＰのスクリーニングを可
能とする。したがって、年齢に対して高度に有意な連関を有する幾つかのマーカ
ーを同定し、そして以下に記載する。

【０１７３】一般に、統計的に有意な結果を得るために、スクリーニングされるべき、層化
した集団の少なくとも５の個体が必要である。年齢層化集団について、対立遺伝
子の頻度を決定する。次いで、カイ二乗分析を対立遺伝子頻度に基づいて実施し
、年齢の群の間の相違が統計的に有意かどうか決定する。０．１より小さいｐ値
は、統計的に有意な相違であることを示すと考えられる。より好ましくはｐ値は
、０．０５より小さいものとする。

【０１７４】臨床試験集団内の頻度が年齢とともに減少するマーカーの同定によって、またよりよく
設計され、そしてバランスが取れている臨床試験を得ることができる。現在では
、臨床試験が研究で重要な指標（endpoint）としてマーカーを利用し、そしてそ
のマーカーが年齢とともに消失するならば、そのときは研究の結果は不正確かも
しれない。ここで提供した方法を使用することによって、マーカーが年齢ととも
に頻度が減少するかどうか確認することができる。研究を計画するとき、この情
報を考慮し、そして管理する（control）。例えば、年齢に独立的なマーカーは
、適当な場合に置換し得る。

【０１７５】以下の実施例は、解説目的のみのために含まれ、本発明の範囲の制限を目的と
するものではない。

【０１７６】実施例１この実施例は、年齢に伴う既知遺伝的マーカーの対立遺伝子頻度の分布を測定
するための任意の特定疾患で選択されているわけではない健康体血液ドナー集団
により提供される情報を含むデータベースの使用および当該データベースの白人
部分集団における性別により提供される情報を含むデータベースの使用について
記載する。この実施例に記載の結果により、疾患関連遺伝的マーカーまたは多型
は、年齢、性別および人種のようなパラメーターまたはパラメーター群による健
康体データベースの分類より同定され得る。

【０１７７】データベースの作成血液は、提供される血液用の血液バンク基準を満たしたヒト対象から静脈穿刺
により得た。血液サンプルは、ｐＨ８．０のＥＤＴＡで保存し、ラベルした。各
ドナーから、年齢、性別、人種、病歴および家族の病歴のような情報を得た。各
サンプルを、情報の同定を提示するバーコードでラベルした。データベースは、
商業的に利用可能なソフトウエア、例えばMicrosoft Accessを用いコンピュータ
ー保存媒体のメモリ中に入れられる、各ドナーについての、相当する対象の識別
子(identifier)および情報を入力することにより、作成した。

【０１７８】モデル遺伝的マーカー幾つかのレベルで疾患を付随すると知られている多型の頻度は、データベース
で提示される対象の部分集団において測定された。これら既知多型は、ｐ２１、
ｐ５３およびリポタンパク質リパーゼ遺伝子中で生じる。特に、アミノ酸コドン
２９１でセリンとアスパラギンとの置換を生じるリポタンパク質リパーゼ遺伝子
のＮ２９１Ｓ多型(Ｎ２９１Ｓ)は、男性の動脈硬化および特に心筋梗塞の危険性
の増加を伴う高密度リポタンパク質コレステロール(ＨＤＬ−Ｃ)のレベルを低下
する(Reymer et al. (1995) Nature Genetics 10: 28-34)。

【０１７９】ｐ５３遺伝子は、ＤＮＡ損傷を評価する細胞周期制御タンパク質をコードし、
細胞増殖、ＤＮＡ修復およびアポトーシス(プログラム化された細胞死)を制御す
る転写因子制御遺伝子として作用する。ｐ５３中の突然変異は、種々の頻度を有
する、種々の型の白血病を含む広く多種の癌で見つかった。通常のｐ５３機能の
喪失は、非制御細胞増殖をゲノム的に不安定とする。ｐ５３遺伝子中で同定され
た多型、すなわち、Ｒ７２Ｐ対立遺伝子は、当該遺伝子のアミノ酸コドン７２で
プロリンとアルギニンとの置換を生じる。

【０１８０】ｐ２１遺伝子は、通常細胞のＧ１期進行停止を伴うサイクリン依存キナーゼイ
ンヒビターをコードする。ｐ２１遺伝子の発現はアポトーシスを誘発する。ｐ２
１遺伝子の多型は、Wilm's腫瘍、小児科腎臓癌を伴う。ｐ２１遺伝子の１つの多
型、Ｓ３１Ｒ多型は、アミノ酸コドン３１においてアルギニンとセリンの置換を
生じる。

【０１８１】データベース分析特定パラメーターによる対象の分類遺伝的多型は、サンプルバンクの白人部分集団のセグメント内でプロファイル
した。ｐ５３のプロファイルの場合、年齢１８−５９歳の合計１２７７人の白人
対象および年齢６０−７９歳の合計４５７人の白人対象の血液から単離したゲノ
ムＤＮＡを分析した。ｐ２１のプロファイルの場合、年齢１８−４９歳の合計９
１０白人対象および年齢５０−７９歳の合計８２４白人対象の血液から単離した
ゲノムＤＮＡを分析した。リポタンパク質リパーゼ遺伝子のプロファイルの場合
、年齢６０歳未満の合計１４６４人の白人女性および合計１４７０人の白人男性
ならびに６０歳を超える合計４７８人の白人女性および合計５６０人の白人男性
を分析した。

【０１８２】ゲノムＤＮＡの単離および分析ゲノムＤＮＡは、個体から得た血液サンプルから単離した。各個体からの全血
１０ｍｌを２０００×ｇで遠心分離した。バフィーコート(buffy coat)１ｍｌを
、１５５ｍＭＮＨ_４Ｃｌ、１０ｍＭＫＨＣＯ_３、および０．１ｍＭＮａ_２Ｅ
ＤＴＡの９ｍｌに加え、室温で１０分間インキュベーションし、１０分間２００
０×ｇで遠心分離した。上清を取り除き、白色の細胞ペレットを、１５５ｍＭ
ＮＨ_４Ｃｌ、１０ｍＭＫＨＣＯ_３および０．１ｍＭＮａ_２ＥＤＴＡ中で洗浄し
、５０ｍＭＴｒｉｓ、５ｍＭＥＤＴＡおよび１％ＳＤＳの４．５ｍｌ中に再懸
濁した。タンパク質は、６ｍＭ酢酸アンモニウム、ｐＨ７．３により細胞ライ
ゼートより沈殿させ、次いで、３０００×ｇの遠心分離により分離した。当該核
酸を、同体積の１００％イソプロパノールの添加および２０００×ｇの遠心分離
により上清から取り除いた。当該乾燥核酸ペレットを、１０ｍＭＴｒｉｓ、ｐ
Ｈ７．６および１ｍＭＮａ_２ＥＤＴＡ中で水和し、４℃で保存した。

【０１８３】既知遺伝的マーカーの存在または非存在を決定するゲノムＤＮＡのアッセイは
、ＢｉｏｍａｓｓＰＲＯＢＥ(商標)検出方法(プライマーオリゴ塩基伸張)反応を
用い開発した。当該方法は、単一の検出プライマーを用い、その後オリゴヌクレ
オチド伸張ステップを行い、質量分析法、特にＭＡＬＤＩ−ＴＯＦ質量分析法に
より容易に分解し得る産物を得た。当該産物は、多型の存在または非存在に依存
して長さが異なる。この方法では、検出プライマーは、可変ヌクレオチドまたは
ヌクレオチド配列の部位に隣接してアニーリングし、当該プライマーは、１以上
のジデオキシＮＴＰ、所望により１以上のデオキシＮＴＰの存在下ＤＮＡポリメ
ラーゼを用い伸張する。当該得られた産物を、ＭＡＬＤＩ−ＴＯＦ質量分析法に
より、分解する。ＭＡＬＤＩ−ＴＯＦ質量分析法により測定するような当該産物
の質量は、可変部位に存在するヌクレオチドの決定を可能とする。

【０１８４】最初に、各白人ゲノムＤＮＡサンプルを、ｐ２１(Ｓ３１Ｒ対立遺伝子)、ｐ５
３(Ｒ７２Ｐ対立遺伝子)およびリポタンパク質リパーゼ(Ｎ２９１Ｓ対立遺伝子)
の遺伝子の多型部位の５'および３'部位に相当するプライマーを用い核酸増幅し
た。各プライマー対の１プライマーを、固体支持体に増幅産物を固定化し得るよ
うにビオチニル化した。特に、ｐ２１、ｐ５３およびリポタンパク質リパーゼの
遺伝子の関連セグメントの増幅に用いるポリメラーゼ連鎖反応プライマーを以下
に示す：ｐ２１の遺伝子増幅のためのＵＳ４ｐ２１ｃ３１−２Ｆ(配列番号９)お
よびＵＳ５ｐ２１−２Ｒ(配列番号１０)；ｐ５３の遺伝子増幅のためのＵＳ４−
ｐ５３−ｅｘ４−Ｆ(ｐ５３−ｅｘ４ＵＳ４(配列番号２)としても示される)およ
びＵＳ５−ｐ５３／２−４Ｒ(ＵＳ５ｐ５３／４Ｒ(配列番号３)としても示され
る)；およびリポタンパク質リパーゼの遺伝子増幅のためのＵＳ４−ＬＰＬ−Ｆ
２(配列番号１６)およびＵＳ５−ＬＰＬ−Ｒ２(配列番号１７)。

【０１８５】各ＤＮＡ配列の増幅は、標準的なプロトコールにより行った。例えば、プライ
マーは濃度８ｐｍｏｌで用い得る。当該反応混合物(例えば、全体積５０μｌ)は
、１０×緩衝液およびｄＴＮＰを含むＴａｑ−ポリメラーゼを含み得る。ポリメ
ラーゼ連鎖反応増幅のサイクリング条件は、典型的には、最初に９５℃５分間、
その後、９４℃１分間、５３℃４５秒、および７２℃３０秒を４０サイクル、最
終伸張として７２℃５分間、行い得る。増幅産物は、製造者説明に従い、Qiagen
PCR精製キット(No.28106)を用い精製し得る。カラムから精製した産物の溶出は
、ＴＥ緩衝液(１０ｍＭＴｒｉｓ、１ｍＭＥＤＴＡ、ｐＨ７．５)５０μｌ中で
行うことができる。

【０１８６】精製増幅産物を、ビオチン−アビジン連結を介し、ストレプトアビジン被覆ビ
ーズに固定化し、二本鎖ＤＮＡを変性させた。次いで、検出プライマーを、例え
ば、以下のような条件を用い、固定化ＤＮＡにアニーリングさせた：５０℃の５
０μｌアニーリング緩衝液(２０ｍＭＴｒｉｓ、１０ｍＭＫＣｌ、１０ｍＭ (
ＮＨ_４)_２ＳＯ_４、２ｍＭＭｇＳＯ_２、１％ Triton X-100、ｐＨ８)で１０分間
、その後、ビーズを洗浄緩衝液(４０ｍＭＴｒｉｓ、１ｍＭＥＤＴＡ、５０ｍ
ＭＮａＣｌ、０．１％ Tween 20、ｐＨ８．８)２００μｌで３回洗浄し、ＴＥ
緩衝液２００μｌで１回洗浄した。

【０１８７】ＰＲＯＢＥ伸張反応は、例えば、ＵＳＢからのＤＮＡシーケンシングキット(
Ｎｏ．７０７７０)の幾つかの内容物およびPharmaciaのｄＮＴＰまたはｄｄＮＴ
Ｐを用いることにより、行った。典型的なプロトコールには、水２１μｌ、シー
クエナーゼ緩衝液６μｌ、１０ｍＭＤＴＴ溶液３μｌ、０．５ｍＭの３つのｄ
ＮＴＰ４．５μｌ、２ｍＭの非含有(missing)の１つのｄｄＮＴＰ４．５μｌ、
グリセロール酵素希釈緩衝液５．５μｌ、シークエナーゼ２．００．２５μｌ
、およびピロホスファターゼ０．２５μｌを含む、全反応物体積４５μｌが含ま
れ得る。次いで、当該反応物を氷上でピペッティングし、１５分間室温でそして
５分間３７℃でインキュベーションし得る。当該ビーズを洗浄緩衝液２００μｌ
で３回洗浄し、７０ｍＭＮＨ_４クエン酸溶液６０μｌで１回洗浄した。

【０１８８】当該ＤＮＡを変性し、固定化鋳型から伸張プライマーを開放させた。それぞれ
の得られた伸張産物を、マトリックスとして３−ヒドロキシピコリン酸(３−Ｈ
ＰＡ)およびＵＶレーザーを用いＭＡＬＤＩ−ＴＯＦ質量分析法により別々に分
析した。

【０１８９】特に、ＰＲＯＢＥ反応に用いるプライマーは以下のように示される：ｐ２１多
型部位のＰＲＯＢＥ分析用のＰ２１／３１−３(配列番号１２)；ｐ５３多型部位
のＰＲＯＢＥ分析用のＰ５３／７２(配列番号４)；およびリポタンパク質リパー
ゼ遺伝子多型部位のＰＲＯＢ分析用のＬＰＬ−２。ｐ２１多型部位のＰＲＯＢＥ
分析において、伸張反応は、ジデオキシＣを用い行った。“野生型”対立遺伝子
鋳型(この場合、コドン３１はセリンをコードする)で起こる反応からおよび多型
Ｓ３１Ｒ対立遺伝子鋳型(この場合、コドン３１はアルギニンをコードする)で起
こる反応から生ずる産物は、以下のように示し、それぞれ、Ｐ２１／３１−３Ｓ
ｅｒ(ｗｔ)(配列番号１３)およびＰ２１／３１−３Ａｒｇ(配列番号１４)のよう
に設計した。ＭＡＬＤＩ−ＴＯＦ質量分析法で測定できるような各産物の質量が
また、提供される(野生型産物の場合、４９００．２Ｄａおよび多型産物の場合
、５２１３．４Ｄａ)。

【０１９０】ｐ５３多型部位のＰＲＯＢＥ分析において、当該伸張反応はジデオキシＣを用
い行った。“野生型”対立遺伝子鋳型(この場合、コドン７２はアルギニンをコ
ードする)で起こる反応からおよび多型Ｒ７２Ｐ対立遺伝子鋳型(この場合、コド
ン７２はプロリンをコードする)で起こる反応から生ずる産物を、以下のように
示し、それぞれ、Ｃｏｄ７２ＧＡｒｇ(ｗｔ)およびＣｏｄ７２ＣＰｒｏのよ
うに設計した。ＭＡＬＤＩ−ＴＯＦ質量分析法により測定され得るような各産物
の質量がまた、提供される(野生型産物の場合、５７３４．８Ｄａおよび多型産
物の場合、５４０５．６Ｄａ)。

【０１９１】リポタンパク質リパーゼ遺伝子多型部位のＰＲＯＢＥ分析において、当該伸張
反応はｄｄＡおよびｄｄＴの混合物を用い行った。“野生型”対立遺伝子鋳型(
この場合、コドン２９１はアスパラギンをコードする)で起こる反応からおよび
多型Ｎ２９１Ｓ対立遺伝子鋳型(この場合、コドン２９１はセリンをコードする)
で起こる反応から生ずる産物は、以下のように示し、それぞれ、２９１Ａｓｎお
よび２９１Ｓｅｒのように設計した。ＭＡＬＤＩ−ＴＯＦ質量分析法により測定
され得るような各産物の質量がまた、提供される(野生型産物の場合、６４３８
．２Ｄａおよび多型産物の場合、６７５８．４Ｄａ)。

【０１９２】Ｐ５３−１(Ｒ７２Ｐ) ＰＣＲ産物の長さ：４０７ｂｐ(配列番号１)

【化１】プライマー(配列番号２−４)

【化２】質量

【表１】ビオチン化ＵＳ５プライマーをＰＣＲ増幅に用いる。

【０１９３】ＬＰＬ−１(Ｎ２９１Ｓ) リポタンパク質リパーゼ遺伝子のコドン２９１のアスパラギンをセリンにアミ
ノ酸置換する。

【０１９４】ＰＣＲ産物の長さ：２５１ｂｐ(配列番号１５) ＵＳ４−ＬＰＬ−Ｆ２(配列番号１６)

【化３】プライマー(配列番号１６−１８)

【化４】質量

【表２】ビオチン化ＵＳ５プライマーをＰＣＲ増幅に用いる。

【０１９５】Ｐ２１−１(Ｓ３１Ｒ) 腫瘍サプレッサー遺伝子ｐ２１のコドン３１のセリンをアルギニンにアミノ酸
置換する。産物の長さ：２０７ｂｐ(配列番号８)

【化５】プライマー(配列番号９−１１)

【化６】質量

【表３】ビオチン化ＵＳ５プライマーをＰＣＲ増幅に用いる。

【０１９６】各白人対象ＤＮＡサンプルを、ＭＡＬＤＩ−ＴＯＦ質量分析法により個々に分
析し、多型部位のヌクレオチドの同一性を測定した。各アッセイの遺伝子型結果
をデータベースに入力できる。次いで、結果を、年齢および／または性別により
分類し、年齢および／または性別の対立遺伝子頻度の分布を測定した。各ケース
の結果のヒストグラムを示す図中で示すように、ｐ２１、ｐ５３およびリポタン
パク質リパーゼ遺伝子の多型の遺伝的マーカーの対立遺伝子頻度の差異分布があ
った。

【０１９７】図８は、ｐ２１遺伝的マーカーアッセイの結果から、年齢(年齢１８−４９歳
を年齢５０−７９歳と比較した)の白人のヘテロ接合遺伝子型(Ｓ３１Ｒ)の頻度
に有意な減少(１３．３％から９．２％)が見られることを示す。２つの年代群の
ホモ接合(Ｓ３１およびＲ３１)遺伝子型の頻度もまた、２つの年代群におけるＳ
３１およびＲ３１対立遺伝子(図中、それぞれ^＊Ｓ３１および^＊Ｒ３１として設
計した)の全体的頻度であるため、示される。

【０１９８】図７Ａ−Ｃは、ｐ５３遺伝的マーカーアッセイの結果を示し、年齢(年齢１８
−５９歳を年齢６０−７９歳と比較した)の白人のホモ接合遺伝子型(Ｐ７２)の
頻度に満足できる有意な減少(６．７％から３．７％)を示す。２つの年代群のホ
モ接合“野生型”遺伝子型(Ｒ７２)およびヘテロ接合遺伝子型(Ｒ７２Ｐ)の頻度
もまた、２つの年代群におけるＲ７２およびＰ７２対立遺伝子(図中、それぞれ
^＊Ｒ７２および^＊Ｐ７２として設計した)の全体的頻度であるため、示される。
これらの結果は、ｐ５３が第二のタンパク質、細胞周期を通して細胞を動かす必
要のあるサイクリン依存キナーゼ(ＣＤＫ)を阻害するｐ２１の発現を制御する(
何れかの遺伝子の変異が細胞周期を崩壊させ、細胞分裂の増加を生ずる)ため、
対立遺伝子が良性ではないという観察からなる。

【０１９９】図２Ｃは、リポタンパク質リパーゼ遺伝子遺伝的マーカーアッセイの結果は、
年齢(またReymer et al. (1995) Nature Genetics 10: 28-34参照)の白人男性の
多型対立遺伝子(Ｓ２９１)の頻度に満足できる有意な減少(１．９７％から０．
５４％)が見られることを示す。別の年代群の白人女性のこの対立遺伝子頻度も
また示される。

【０２００】実施例２この実施例は、因子ＶＩＩ遺伝子の多型対立遺伝子(３５３Ｑ対立遺伝子)の存
在または非存在を評価する複数対象の個々サンプルおよびプールしたサンプルと
して多くの対象のＤＮＡサンプルを分析し、対象の群中の対立遺伝子頻度を決定
するＭＡＬＤＩ−ＴＯＦ質量分析法の使用について記載する。この研究結果は、
本質的に、同じ対立遺伝子頻度は、別々に各サンプルを分析するようにプールし
たＤＮＡサンプルを分析することにより得られ、それにより、核酸の分析におけ
るＭＡＬＤＩ−ＴＯＦ質量分析法の量的性質が説明されることを示す。

【０２０１】因子ＶＩＩ因子ＶＩＩは、外来的血液凝固カスケード中に含まれるセリンプロテアーゼで
ある。この因子はトロンビンにより活性化され、因子Ｘから因子Ｘａへの処理に
おいて組織因子(因子ＩＩＩ)と共に働く。因子ＶＩＩ遺伝子中の多型間の関連お
よび心筋梗塞を含む虚血性心血管疾患の危険性を増大し得る因子ＶＩＩ活性の増
加をサポートする証拠がある。本研究で調査する多型は、Ｒ３５３Ｑである(す
なわち、因子ＶＩＩ遺伝子のコドン３５３においてグルタミン酸残基からアルギ
ニン残基への置換)(表５参照)。

【０２０２】因子ＶＩＩ遺伝子の３５３Ｑ対立遺伝子の存在または非存在に関するＤＮＡサン
プルの分析ゲノムＤＮＡは、群あたり９２対象の複数の群に分けた大多数の対象から得ら
れた別々の血液サンプルから単離された。ゲノムＤＮＡの各サンプルは、実施例
１に記載するようなＢｉｏｍａｓｓＰＲＯＢＥ(商標)アッセイを用い分析し、因
子ＶＩＩ遺伝子の３５３Ｑ多型の存在または非存在を決定した。

【０２０３】最初に、各サンプル由来のＤＮＡを、以下に示すように、Ｆ７−３５３ＦＵＳ
４(配列番号２４)およびＦ７−３５３ＲＵＳ５(配列番号２６)を用い、例えば、
実施例１に記載するような標準的な条件を用いポリメラーゼ連鎖反応において増
幅した。プライマーの１つをビオチニル化し、増幅産物を固体支持体に固定化し
得た。精製増幅産物を、ストレプトアビジン被覆ビーズへのビオチン−アビジン
連結を介して固定化し、二本鎖ＤＮＡを変性した。次いで、検出プライマーを、
例えば、実施例１に記載のような条件を用い固定化ＤＮＡにアニーリングした。
検出プライマーは、以下のようにＦ７−３５３−Ｐ(配列番号２７)として示す。
ＰＲＯＢＥ伸張反応は、例えば、実施例１に示すような条件を用い行った。当該
反応は、ｄｄＧを用い行った。

【０２０４】ＤＮＡを変性し、固定化鋳型から伸張プライマーを開放した。それぞれの得ら
れた伸張産物は、ＭＡＬＤＩ−ＴＯＦ質量分析法により別々に分析した。３−ヒ
ドロキシピコリン酸(３−ＨＰＡ)のようなマトリックスおよびＵＶレーザーをＭ
ＡＬＤＩ−ＴＯＦ質量分析法分析に用いた。“野生型”対立遺伝子鋳型(この場
合、コドン３５３はアルギニンをコードする)で起こる反応からおよび多型３５
３Ｑ対立遺伝子鋳型(この場合、コドン３５３はグルタミン酸をコードする)で起
こる反応から生ずる産物は、以下のように示し、それぞれ、３５３ＣＧＧおよ
び３５３ＣＡＧのように設計した。ＭＡＬＤＩ−ＴＯＦ質量分析法により測定さ
れ得るような各産物の質量がまた、提供される(すなわち、野生型産物の場合、
５６４６．８Ｄａおよび多型産物の場合、５９６０Ｄａ)。

【０２０５】各ＤＮＡサンプルのＰＲＯＢＥ反応のＭＡＬＤＩ−ＴＯＦ質量分析法分析は、
各サンプルにおいて最初に別々に行われる(分析あたりのＤＮＡの合計濃度２５
０ｎｇ)。９２対象の群における３５３Ｑ多型の対立遺伝子頻度は、検出される
多くの各対象に基づき算出された。

【０２０６】次に、９２対象のサンプルをプールし(任意の個々ＤＮＡの濃度が２．７ｎｇ
である、ＤＮＡの合計濃度２５０ｎｇ)、ＤＮＡのプールをＭＡＬＤＩ−ＴＯＦ
質量分析法分析した。生じるスペクトルにおける３５３Ｑ多型ＰＲＯＢＥ伸張産
物の質量に相当するシグナルの下の領域が、存在するＤＮＡ量を定量するため、
組込まれた。合計ＤＮＡに対する、この量の割合が用いられ、対象の群における
３５３Ｑ多型の対立遺伝子頻度が測定された。この型の個々サンプル対プールし
たサンプルの分析を、９２種サンプルの多種の群について繰り返した。

【０２０７】９２の各群の９２種のサンプルの各ＭＡＬＤＩ−ＴＯＦ質量分析法分析に基づ
き算出される頻度を、図９において、９２サンプルからのＤＮＡのプールのＭＡ
ＬＤＩ−ＴＯＦ質量分析法分析に基づき算出したものと比較する。これらの比較
を、図中、棒グラフで“対”として示し、各対は、別々の“プール”番号、例え
ば、Ｐ１、Ｐ１６、Ｐ２などとして標識されている。そのため、例えば、Ｐ１の
場合、９２サンプルそれぞれの別々の分析により算出される多型の対立遺伝子頻
度は、１１．４１％であり、９２ＤＮＡサンプル全てのプールの分析により算出
される頻度は、１２．０９％であった。

【０２０８】別々のＤＮＡサンプルを個々に分析することによりおよびＤＮＡサンプルのプ
ールにより算出される頻度の類似性から、ＭＡＬＤＩ−ＴＯＦ質量分析法の量的
性質を通して、プールしたサンプルを分析し、正確な頻度測定を得ることが可能
となることが証明される。プールしたＤＮＡサンプルの分析能は、本明細書に記
載されたような非選択性の健康体データベースの使用を含む時間および費用を有
意に減少する。スペクトルの特質または検出されたサンプル量を図る能力を全く
変化せずにプール混合物中の個々サンプルのＤＮＡ濃度を２．７ｎｇから０．２
７ｎｇに減少させることが可能となることもまた示される。

【０２０９】因子ＶＩＩＲ３５３ＱＰＲＯＢＥアッセイコード３５３ＣＧＧ＞ＣＡＧ(Ａｒｇ＞Ｇｌｎ)、エキソン９Ｇ＞Ａのための
ＰＲＯＢＥアッセイ

【０２１０】ＰＣＲフラグメント：１３４ｂｐ(ＵＳタグを含む；配列番号２２および２３) 対立遺伝子頻度：ヨーロッパ人約０．１、日本人／中国人約０．０３−０．０
５(Thromb. Haemost. 1995, 73: 617-22; Diabetologia 1998, 41: 760-6)：

【化７】質量

【表４】

【０２１１】結論上記実施例から、一般的な群の遺伝的因子に起因する疾患の頻度を変化させる
効果が証明される。これらの結果から、多型遺伝的変化の医学的関連性が予測さ
れ得ると解釈される。加えて、結論が、浸透度、診断特異性、陽性適中率、疾患
の攻撃、予防ストラテジーの最も適する攻撃、および単離された群を任意交配し
た群と同定する遺伝的変化の一般的適用可能性を導く。そのため、人種的に同種
である、年齢および性別で分類した群に基づくサンプルバンクは、可能性ある医
療的有用性に関し、遺伝的因子の迅速な同定および確認のための適当なツールと
なる。

【０２１２】実施例３病的状態および死亡のマーカーサンプルバンドおよび初期スクリーニング健康体サンプルは、San Bernardino, CAの血液バンクを通じて取得した。ドナ
ーに、血液回収の前に同意書にサインしてもらい、血液をヒトの加齢に関する遺
伝的研究に使用することに同意してもらった。すべてのサンプルをアノミマイズ
(anomymize)した。サンプルのトラッキングバック(tracking back)は可能ではな
い。

【０２１３】健康体ドナー群の血液サンプルからのＤＮＡの単離血液を静脈穿刺により取得し、１ｍＭＥＤＴＡｐＨ８．０で保存する。各ド
ナーからの全血１０ｍｌを２０００×ｇで遠心分離した。バフィーコート(buffy
coat)１ｍｌを、１５５ｍＭＮＨ_４Ｃｌ、１０ｍＭＫＨＣＯ_３、および０．１
ｍＭＮａ_２ＥＤＴＡの９ｍｌに加え、室温で１０分間インキュベーションし、
１０分間２０００×ｇで遠心分離した。上清を取り除き、白色の細胞ペレットを
、１５５ｍＭＮＨ_４Ｃｌ、１０ｍＭＫＨＣＯ_３および０．１ｍＭＮａ_２ＥＤ
ＴＡ中で洗浄し、５０ｍＭＴｒｉｓ、５ｍＭＥＤＴＡおよび１％ＳＤＳの４．
５ｍｌ中に再懸濁した。タンパク質は、６Ｍ酢酸アンモニウム、ｐＨ７．３に
より細胞ライゼートより沈殿させ、次いで、３０００×ｇの遠心分離により核酸
から分離した。当該核酸を、同体積の１００％イソプロパノールの添加および２
０００×ｇの遠心分離により上清から取り除いた。当該乾燥核酸ペレットを、１
０ｍＭＴｒｉｓ、ｐＨ７．６および１ｍＭＮａ_２ＥＤＴＡ中で水和し、４℃で
保存した。

【０２１４】この研究では、サンプルを表１に示すようにプールした。血液ドナーの両親は
白人起源であった。表１

【表５】

【０２１５】４００を超えるＳＮＰを４つ全てのプールを用い試験した。試験を行った後、
３４アッセイを少なくとも一度、再アッセイするよう選択した。最終的に、１０
アッセイにより、幾らかの割合の対立遺伝子頻度に繰り返しの相違が見られ、そ
れによって、各サンプルを用い試験される基準を満たした。平均対立遺伝子頻度
および標準偏差を表２に表とする。表２

【表６】１０のうち７の可能性のある病的状態のマーカーが充分に分析された。これら
ＳＮＰが位置する遺伝子に関する更なる情報を、Ｇｅｎｂａｎｋのような公共の
データベースを通じて集めた。

【０２１６】ＡＫＡＰＳ候補の病的状態および死亡のマーカーには、シグナルトランスダクションに含
まれる遺伝子のようなハウスキーピング遺伝子が含まれる。その遺伝子には、タ
ンパク質リン酸化を含むシグナルトランスダクションに関係するＡキナーゼアン
カータンパク質(ＡＫＡＰ)遺伝子がある。タンパク質リン酸化は、酵素制御、お
よび真核細胞の細胞膜を通過する細胞外シグナルのトランスダクションに重要な
機構である。酵素、膜レセプター、イオンチャンネルおよび転写因子を含む広範
の種類の細胞性基質は、細胞と相互作用する細胞外シグナルに応答してリン酸化
され得る。ホルモンおよび神経伝達物質に応答する細胞性タンパク質のリン酸化
において鍵となる酵素は、サイクリックＡＭＰ(ｃＡＭＰ)依存タンパク質キナー
ゼである。そのため、ｃＡＭＰによる活性化において、ＰＫＡは、その細胞外シ
グナルに対する種々の細胞性応答を仲介する。ＰＫＡアイソザイムのアレイは、
哺乳類細胞中で発現する。ＰＫＡは、通常、制御(Ｒ)サブユニットダイマーおよ
び２つの触媒(Ｃ)サブユニットを含む不活性テトラマーとして存在する。３つの
Ｃサブユニット(Ｃα、ＣβおよびＣγ)および４つのＲサブユニット(ＲＩα、
ＲＩβ、ＲＩＩαおよびＲＩＩβ)をコードする遺伝子を同定した(Takio et al.
(1982) Proc. Natl. Acad. Sci. U.S.A. 79: 2544-2548; Lee et al. (1983) P
roc. Natl. Acad. Sci. U.S.A. 80: 3608-3612; Jahnsen et al. (1996) J. Bio
l. Chem. 261: 12352-12361; Clegg et al. (1988) Proc. Natl. Acad. Sci. U.
S.A. 85: 3703-3707;およびScott (1991) Pharmacol. Ther. 50: 123-145参照)
。型Ｉ(ＲＩ)αおよび型ＩＩ(ＲＩＩ)αサブユニットは、偏在的に分布し、この
場合、ＲＩβおよびＲＩＩβは主に脳に存在する(例えば、Miki and Eddy (1999
) J. Biol. Chem. 274: 29057-29062参照)。型ＩＰＫＡホロ酵素(ＲＩαおよび
ＲＩβ)は、細胞質中に主に存在し、一方、多数の型ＩＩＰＫＡ(ＲＩＩαおよ
びＲＩＩβ)は細胞性構造および細胞小器官に関係する(Scott (1991) Pharmacol
. Ther. 50: 123-145)。多くのホルモンおよび他のシグナルがレセプターを介し
て作用し、ＰＫＡのＲサブユニットに結合し、放出し、タンパク質をリン酸化す
るＣサブユニットを活性化するｃＡＭＰを生ずる。タンパク質キナーゼおよびそ
の基質は広く細胞全体に分布するため、異なるシグナルに対するタンパク質キナ
ーゼ仲介応答を局在化させる細胞中に存在する機構がある。その機構の１つには
、特定の細胞小器官または細胞骨格コンパートメントにきわめて接近してＰＫＡ
を位置させ、それによりより特異的なＰＫＡ相互作用および局在化応答を提供す
るＡキナーゼアンカータンパク質(ＡＫＡＰ)と呼ばれる、アンカータンパク質の
付随を介するＰＫＡの亜細胞性ターゲッティングが含まれる(例えば、Scott et
al. (1990) J. Biol. Chem. 265: 21561-21566; Bregman et al. (1991) J. Bio
l. Chem. 266: 7207-7213; およびMiki and Eddy (1999) J. Biol. Chem. 274:
29057-29062参照)。アンカーは好ましい基質に近づけてキナーゼを位置させるば
かりでなく、所望により第二メッセンジャーｃＡＭＰの揺らぎ(fluctuation)に
応答し得る部位にＰＫＡホロ酵素を位置させる(Mochly-Rosen (1995) Science 2
68: 247-251; Faux and Scott (1996) Trends Biochem. Sci. 21: 312-315; Hub
bard and Cohen (1993) Trends Biochem. Sci. 18: 172-177参照)。

【０２１７】７５％までの型ＩＩＰＫＡは、制御サブユニット(ＲＩＩ)によるＡＫＡＰと
の会合を介して様々な細胞内部位に局在する(例えば、Hausken et al. (1996) J
. Biol. Chem. 271: 29016-29022参照)。ＰＫＡのＲＩＩサブユニットは、ナノ
モーラーの親和性でＡＫＡＰと結合し(Carr et al. (1992) J. Biol. Chem. 267
: 13376-13382)、多くのＡＫＡＰ−ＲＩＩ複合体が、細胞抽出物から単離された
。ＰＫＡのＲＩサブユニットは、マイクロモーラーのみの親和性でＡＫＡＰに結
合する(Burton et al. (1997) Proc. Natl. Acad. Sci. U.S.A. 94: 11067-1107
2)。ＰＫＡＲＩサブユニットによるＡＫＡＰへの結合の証明は報告されており(
Miki and Eddy (1998) J. Biol. Chem. 273: 34384-34390)、それは、ＲＩα特
異的およびＲＩα／ＲＩＩβ二重特異性ＰＫＡアンカードメインは、ＦＳＣ１／
ＡＫＡＰ８２で同定された。ＰＫＡの型Ｉおよび型ＩＩ制御サブユニットと相互
作用するＤ−ＡＫＡＰ１およびＤ−ＡＫＡＰ２と呼ばれる、更なる二重特異的Ａ
ＫＡＰもまた報告されている(Huang et al. (1997) J. Biol. Chem. 272: 8057-
8064; Huang et al. (1997) Proc. Natl. Acad. Sci. U.S.A. 94: 11184-11189)
。

【０２１８】２０を超えるＡＫＡＰは、種々の組織および種で報告されている。ＡＫＡＰを
コードする相補ＤＮＡ(ｃＤＮＡ)は、Caenorhabditis elegansおよびDrosophili
aからヒトまでの範囲の多様な種から単離された(例えば、Colledge and Scott (
1999) Trends Cell Biol. 9: 216-221参照)。ＰＫＡのＲＩＩサブユニットとの
会合を仲介するＡＫＡＰ内の領域を同定した。約１０−１８アミノ酸残基のこれ
らの領域は、実質的に、第一の配列で変化するが、第二の構造予測から、ヘリッ
クスの面に沿って並ぶ疎水性残基および他のものに沿った荷電性残基と共に両親
媒性ヘリックスを形成するようであることが示されている(Carr et al. (1991)
J. Biol. Chem. 266: 14188-14192; Carr et al. (1992) J. Biol. Chem. 267:
13376-13382)。長い脂肪族側鎖を有する疎水性アミノ酸、例えば、バリン、ロイ
シンまたはイソロイシンは、ＲＩＩサブユニットへの結合に関連し得る(Glantz
et al. (1993) J. Biol. Chem. 268: 12796-12804)。

【０２１９】多くのＡＫＡＰがまた、他のシグナリング酵素を含む複数のタンパク質に結合
する能力を有する。例えば、ＡＫＡＰ７９は、ＰＫＡ、タンパク質キナーゼＣ(
ＰＫＣ)、およびプロテインホスファターゼカルシニュリン(ＰＰ２Ｂ)に結合す
る(Coghlan et al. (1995) Science 267: 108-112およびKlauck et al. (1996)
Science 271: 1589-1592)。そのため、ニューロン性シナプス後膜に対するＡＫ
ＡＰ７９のターゲッティングにより、単一複合体における逆触媒活性を有する酵
素が同時に得られる。

【０２２０】そのため、ＡＫＡＰは、ｃＡＭＰ仲介応答の選択性および強度を増大する可能
性ある制御機構としての役割をする。そのため、細胞の基礎となる機能において
これらのタンパク質が担う重要な役割を完全に理解するため、ＡＫＡＰの構造的
および機能的な性質を明らかにし解明する必要がある。

【０２２１】ＡＫＡＰ１０ヒトＡＫＡＰ１０ｃＤＮＡ(Ｄ−ＡＫＡＰ２とも称する)の配列はＧｅｎＢａ
ｎｋデータベースにおいて、受け入れ番号ＡＦ０３７４３９(配列番号３１)およ
びＮＭ００７２０２として利用可能である。ＡＫＡＰ１０遺伝子はクロモソーム
１７上に位置する。

【０２２２】マウスＤ−ＡＫＡＰ２ｃＤＮＡの配列もまた、ＧｅｎＢａｎｋデータベース(
受け入れ番号ＡＦ０２１８３３)において利用可能である。マウスＤ−ＡＫＡＰ
２タンパク質は、Ｇαサブユニットと相互作用しＧＴＰａｓｅ活性化タンパク質
様活性を有するタンパク質の特性であるアミノ末端近辺のＲＧＳドメインを含む
(Huang et al. (1997) Proc. Natl. Acad. Sci. U.S.A. 94: 11184-11189)。ヒ
トＡＫＡＰ１０タンパク質はまた、ＲＧＳドメインと相同な配列を有する。マウ
スＤ−ＡＫＡＰ２タンパク質のカルボキシ末端４０残基は、ＰＫＡの制御サブユ
ニットとの相互作用に応答する。この配列は、マウスＤ−ＡＫＡＰ２とヒトＡＫ
ＡＰ１０タンパク質との間で完全に保存されている。

【０２２３】ヒトＡＫＡＰ１０遺伝子の多型および多型ＡＫＡＰ１０タンパク質遺伝子発現、制御、タンパク質構造および／またはタンパク質機能を変化させ
る、ＡＫＡＰ遺伝子の多型は、遺伝子および／またはタンパク質機能を変えない
多型よりも、酵素(特にＰＫＡ)活性の制御、シグナルの細胞性形質導入およびそ
の応答においてならびに細胞の基礎機能において、より重要な効果を有するよう
である。本明細書で提供される多型ＡＫＡＰに含まれるものは、番号６４６位に
異なるアミノ酸残基を含むヒトＡＫＡＰ１０タンパク質である。

【０２２４】ヒトＡＫＡＰ１０タンパク質のアミノ酸６４６は、ＰＫＡのＲサブユニットの
結合に関係するセグメント内のタンパク質のカルボキシ末端領域に位置する。こ
のセグメントは、カルボキシ末端４０アミノ酸を含む。

【０２２５】ヒトＡＫＡＰ１０タンパク質の６４６位に関し報告されているアミノ酸残基は
イソロイシンである。本明細書で提供される多型ヒトＡＫＡＰ１０タンパク質は
、アミノ酸配列であるが、当該タンパク質の６４６位アミノ酸のイソロイシン以
外の残基を含む。本明細書で提供される多型ヒトＡＫＡＰ１０タンパク質の特定
の実施態様では、６４６位のアミノ酸は、バリン、ロイシンまたはフェニルアラ
ニン残基である。

【０２２６】ヒトＡＫＡＰ１０コーディング配列のヌクレオチド２０７３位におけるＡからＧ
への変化本明細書で記載の通り、コーディング配列の２０７３位の特異的多型を含み、
それにより、６４６位でバリンをコードするヒトＡＫＡＰ１０遺伝子の対立遺伝
子は、ヒト集団のより若齢およびより高齢のセグメント由来のＤＮＡサンプルに
おいて多様な頻度で検出された。この対立遺伝子において、ＡＫＡＰ１０遺伝子
コーディング配列の２０７３位のＡは、ＡからＧに変化させ、アミノ酸６４６の
コドンをイソロイシンのコードのＡＴＴからバリンのコードのＧＴＴへと変化さ
せて変化した配列を生じさせた。

【０２２７】病的状態マーカー１：ヒトタンパク質キナーゼＡアンカータンパク質(ＡＫＡＰ
１０−１) 健康体ドナー集団におけるＡＫＡＰ１０−１のＰＣＲ増幅およびＢｉｏｍａｓｓ
ＰＲＯＢＥアッセイ検出ＡＫＡＰ１０のドナー集団のＰＣＲ増幅ＰＣＲプライマーは、ＯＰＥＲＯＮにより、ホスホラミダイト化学を用い合成
された。ＡＫＡＰ１０標的配列の増幅は、ＰＣＲ反応物５０μｌ中に、プールし
たヒトゲノムＤＮＡ１００ｎｇ−１μｇを有する単一のＰＣＲ反応物５０μｌ中
で行った。プールしたサンプル内の各ＤＮＡ濃度は、最終濃度１−２５ｎｇの範
囲の等濃度で存在した。各反応物は、１×ＰＣＲ緩衝液(Qiagen, Valencia, CA)
、２００μＭｄＮＴＰ、１Ｕ Hotstar Ｔａｑポリメラーゼ(Qiagen, Valencia,
CA)、４ｍＭＭｇＣｌ_２、ならびにユニバーサルプライマー配列および標的特
異的配列5'-TCTCAATCATGTGCATTGAGG-3'(配列番号４５)を含む２５ｐｍｏｌフォ
ワードプライマー、および２ｐｍｏｌリバースプライマー5'-AGCGGATAACAATTTCA
CACAGGGATCACACAGCCATCAGCAG-3'(配列番号４６)、ならびにＰＣＲアンプリコン
の５’末端に相補的なビオチニル化ユニバーサルプライマー１０ｐｍｏｌ 5'-AG
CGGATAACAATTTCACACAGG-3'(配列番号４７)を含む。特異的フォワードおよびリバ
ースプライマーを用いる最初のラウンドの増幅の後、次いで、５’ビオチニル化
ユニバーサルプライマーをハイブリダイズさせ、リバースプライマーとして作用
させ、それにより、３’ビオチン捕捉部分を当該分子中に導入した。当該増幅プ
ロトコールは、５’−ビオチニル化二本鎖ＤＮＡアンプリコン中で生じ、遺伝子
型決定(genotyping)に用いる５’ビオチン標識各フォワードプライマーの必要性
を除くことによるハイスループット遺伝子型決定の費用を劇的に減少する。サー
マルサイクリングは、０．２ｍＬチューブまたは９６ウェルプレート中で、MJ R
esearch Thermal Cycler(算出温度)を用い、以下のパラメーターで行った：９４
℃５分間；４５サイクル：９４℃２０秒、５６℃３０秒、７２℃６０秒；７２℃
３分間。

【０２２８】ＤＮＡの固定化ＰＣＲ反応物５０μｌを、事前に３回洗浄し１ＭＮＨ_４Ｃｌ、０．０６ＭＮ
Ｈ_４ＯＨ中に再懸濁したストレプトアビジン被覆磁性ビーズ２５μｌに加えた。
ＰＣＲアンプリコンは、室温で１５分間でビーズに結合し得る。次いで、当該ビ
ーズを、磁石を用い回収し、非結合ＤＮＡを含む上清を取り除いた。非結合鎖は
、１００ｍＭＮａＯＨ中でインキュベーションし、１０ｍＭＴｒｉｓｐＨ８
．０でビーズを３回洗浄することにより二本鎖アンプリコンから解放した。

【０２２９】ＡＫＡＰ１０−１のドナー集団のＢｉｏｍａｓｓＰＲＯＢＥアッセイ分析(クロ
ーン４８３１９) ＢｉｏｍａｓｓＰＲＯＢＥアッセイ法を用いる遺伝子型決定は、２６ｍＭＴ
ｒｉｓ−ＨＣｌｐＨ９．５、６．５ｍＭＭｇＣｌ_２および５０ｍＭ各ｄＴＴ
Ｐおよび５０ｍＭ各ｄｄＣＴＰ、ｄｄＡＴＰ、ｄｄＧＴＰ、熱安定性ＤＮＡポ
リメラーゼ２．５Ｕ(Amersham)ならびに鋳型特異的オリゴヌクレオチドＰＲＯＢ
Ｅプライマー5'-CTGGCGCCCACGTGGTCAA-3'(配列番号４８)(Operon)にＤＮＡ被覆
磁性ビーズを再懸濁することにより行った。プライマー伸張は、オリゴヌクレオ
チドプライマーハイブリダイゼーションおよび伸張の３サイクルで生じる。当該
伸張産物は、５０ｍＭＮＨ_４Ｃｌで鋳型から変性させ、各サンプル１５０ｎＬ
を、Ｈ３ＰＡマトリックス物質１５０ｎＬで事前負荷したシリコンチップへ移し
た後、分析した。当該サンプル物質を結晶化し、ＭＡＬＤＩ−ＴＯＦ(Bruker, P
erSeptive)で分析した。ＡＫＡＰ１０中に存在するＳＮＰは、ＡＫＡＰ１０遺伝
子(ＧｅｎＢａｎｋ受け入れ番号ＡＣ００５７３０(配列番号３６)のゲノムクロ
ーンの配列のヌクレオチド番号１５６２７７においてＴをＣに変化する。配列番
号３５は、ヒトＡＫＡＰ１０遺伝子のゲノムヌクレオチド配列を含むヒトクロモ
ソーム１７のヌクレオチド配列を示し、配列番号は、ヒトＡＫＡＰ１０−１対立
遺伝子のゲノムヌクレオチド配列を含むヒトクロモソーム１７のヌクレオチド配
列を示す。ＢｉｏＭａｓｓプローブ反応に使用したプライマーの質量は、５５０
０．６ダルトンであった。ＳＮＰの存在下、当該プライマーは、質量５７７３．
８のｄｄＣの添加により伸張する。野生型遺伝子は、ｄＴおよびｄｄＧをプライ
マーに添加し、質量６１０１ダルトンを有する伸張産物を産生する。

【０２３０】ＳＮＰの頻度は、年齢で選択した健康個体の集団で測定した。年齢１８−３９
歳の五百五十二(５５２)個体(２７６女性、２７６男性)および年齢６０−７９の
５５２個体(年齢６０−６９では１８４女性、年齢６０−７９では３６８男性)を
、ＡＫＡＰ１０の非翻訳３’領域中に局在する多型の存在に関し試験した。年齢
群の増加を有するこの多型の頻度における相違が、健康個体で観察された。統計
学的な分析により、“より若齢”および“より高齢”の集団の間の対立遺伝子に
関する対立遺伝子頻度の相違の有意なレベルは、ｐ＝０．０００９および遺伝子
型の有意なレベルはｐ＝０．００３であることが示された。年齢群の間の相違は
、有意である。すべての集団対立遺伝子有意性は、ｐ＝０．０００９であり、遺
伝子型の有意性は、ｐ＝０．００３である。

【０２３１】最善の有意性を生ずるこのマーカーは、年齢分類集団における対立遺伝子およ
び遺伝子型頻度に関する結果である。図１９は、両性および集団全体における対
立遺伝子および遺伝子型を示す。対立遺伝子に関する後者の有意性は、ｐ＝０．
０００９であり、遺伝子型の有意性は、ｐ＝０．００３であった。若齢および高
齢の集団は、ハーディ-ヴァインベルグ平衡であった。ある特定の遺伝子型の好
ましい変化は、見られなかった。

【０２３２】多型は、ヒトプロテインキナーゼＡアンカータンパク質(ＡＫＡＰ１０)をコー
ドする遺伝子の非翻訳３’−領域中に局在する。当該遺伝子は、クロモソーム１
７に局在する。その構造には、１５エキソンおよび１４介在配列(イントロン)を
含む。コードタンパク質は、ｃＡＭＰ依存プロテインキナーゼの亜細胞局在に応
答し、それによって、Ｇ−プロテイン仲介レセプターシグナリング経路において
鍵の役割をする(Huang et al. (1997) PNAS 94: 11184-11189)。その局在は、コ
ーディング領域の外側であるため、この多型は、アミノ酸置換およびその後のタ
ンパク質の機能変化を誘引し得る他の非同義性多型と共に、ほぼ連鎖不平衡(Ｌ
Ｄ)であるようである。この遺伝子に関する異なるＧｅｎＢａｎｋデータベース
の配列比較により、さらに６つの可能性ある多型が示され、その２つ各アミノ酸
の変化が考えられる(表３参照)。

【表７】

【０２３３】病的状態マーカー２：ヒトプロテインキナーゼＡアンカータンパク質(ＡＫＡＰ
１０−５) ＡＫＡＰ１０−５対立遺伝子(配列番号３３)の発見ゲノムＤＮＡは、ＡＫＡＰ１０−１遺伝子配座で遺伝子型ＣＣを有する十七(
１７)個体および単一のヘテロ接合性個体(ＣＴ)(上記のように)の血液(上記のよ
うに)から単離された。Ｃ末端ＰＫＡ結合ドメインをコードするＡＫＡＰ１０−
１遺伝子中の標的配列は、ポリメラーゼ連鎖反応を用い増幅した。ＰＣＲプライ
マーは、ＯＰＥＲＯＮにより、ホスホラミダイト化学を用い合成した。ＡＫＡＰ
１０−１標的配列の増幅は、ヒトゲノムＤＮＡ鋳型２５ｎｇを有する各ＰＣＲ反
応物５０μｌで行った。各反応物は、１×ＰＣＲ緩衝液(Qiagen, Valencia, CA)
、２００μＭｄＮＴＰ、１Ｕ Hotstar Ｔａｑポリメラーゼ(Qiagen, Valencia,
CA)、４ｍＭＭｇＣｌ_２、ユニバーサルプライマー配列および標的特異的配列5
'-TCCCAAAGTGCTGGAATTAC-3'(配列番号５３)を含む２５ｐｍｏｌのフォワードプ
ライマー(Ｅｘ１３Ｆ)、および２ｐｍｏｌリバースプライマー(Ｅｘ１４Ｒ)5'-G
TCCAATATATGCAAACAGTTG-3'(配列番号５４)を含む。サーマルサイクリングは、０
．２ｍＬチューブまたは９６ウェルプレート中で、MJ Research Thermal Cycler
(MJ Research, Waltham, MA)(算出温度)を用い、以下のサイクリングパラメータ
ーで行った：９４℃５分間；４５サイクル：９４℃２０秒、５６℃３０秒、７２
℃６０秒；７２℃３分間。増幅後、当該アンプリコンは、クロマトグラフィーを
用い精製した(Mo Bio Laboratories (Solana Beachm, CA))。

【０２３４】標的領域を示す１８アンプリコンの配列は、ＰＣＲアンプリコン２５ｎｍｏｌ
、３．２μＭＤＮＡシーケンシングプライマー5'-CCCACAGCAGTTAATCCTTC-3'(配
列番号５５)、および鎖終結ローダミン標識２’，３’ジデオキシヌクレオチド(
PE Biosystems, Foster City, CA)を伴う標準的サンガーサイクルシーケンシン
グ法を用い、以下のサイクリングパラメーターに従い決定した：９６℃１５秒；
２５サイクル：５５℃１５秒、６０℃４分間。当該シーケンシング産物は、０．
３ＭＮａＯＡｃおよびエタノールにより沈殿した。当該沈殿を遠心分離し、乾
燥させた。当該ペレットを脱イオン化ホルムアミド中に再懸濁し、５％ポリアク
リルアミドゲルで分離した。当該配列は、“Sequencher”ソフトウェアを用い決
定した(Gene Codes, Ann Arbor, MI)。

【０２３５】アンプリコンのＡＫＡＰ１０−１ＳＮＰと相同性のある、１７すべてのアンプ
リコンの配列は、ＡとＧが置換えられたヌクレオチド１５２１７１位(ＡＫＡＰ
１０ゲノムクローン(配列番号３５)についてＧｅｎＢａｎｋ受け入れ番号AC0057
30)の多型を示す。このＳＮＰはまた、野生型ＡＫＡＰ１０(ＧｅｎＢａｎｋ受け
入れ番号AF037439)(配列番号３１)のｃＤＮＡクローンのヌクレオチド２０７３
位に位置するように設計できる。ヒトＡＫＡＰ１０タンパク質のアミノ酸配列は
、配列番号３２として提供する。この単一のヌクレオチド多型は、ＡＫＡＰ１０
−５(配列番号３３)として設計され、ヒトＡＫＡＰ１０タンパク質(配列番号３
２)のアミノ酸配列のアミノ酸６４６位でバリンとイソロイシンとの置換を生じ
る。

【０２３６】健康体ドナー集団におけるＡＫＡＰ１０−５のＰＣＲ増幅およびＢｉｏｍａｓｓ
ＰＲＯＢＥ年齢により分類される健康体集団は、高齢の集団と比べ若齢の集団において対
立遺伝子頻度の変化を検出し得ることにより、病的状態随伴遺伝子用の非常に有
効でユニバーサルなスクリーニングツールである。この健康体集団ベースの各サ
ンプルは、更にスループットを増加させるためプールすることができる。

【０２３７】健康体サンプルは、San Bernardino, CAの血液バンクを通じて得た。血液ドナ
ーの両親は、白人起源であった。事実上、ヒトであるとき、健康対象体は、一般
的集団における結果としての使用のため血液が提供される血液バンクの基準を有
するヒトドナーとして定義される。これらの基準は、以下の通りである：検出可
能なウイルス、細菌、マイコプラズマ、および寄生体感染がないこと；貧血症で
ないこと；および次いで更に病歴に関する質問表に基づき選択する(図３参照)。
そのため、健康体集団は、血液バンク基準に従い血液が提供された充分に健康の
先入観のない集団を示し、更に任意の疾患の状態に関して選択されることはない
。典型的にその個体は、任意の薬物療法を受けていない。

【０２３８】ＰＣＲプライマーは、ＯＰＥＲＯＮによりホスホラミダイト化学を用いて合成
した。ＡＫＡＰ１０標的配列の増幅は、ＰＣＲ反応物５０μｌにおいて、プール
したヒトゲノムＤＮＡ１００ｎｇ−１μｇを伴う単一のＰＣＲ反応物５０μｌ中
で行った。プールしたサンプル内の各ＤＮＡ濃度は、最終濃度１−２５ｎｇの範
囲の等濃度で存在した。各反応物は、１×ＰＣＲ緩衝液(Qiagen, Valencia, CA)
、２００μＭｄＮＴＰ、１Ｕ Hotstar Ｔａｑポリメラーゼ(Qiagen, Valencia,
CA)、４ｍＭＭｇＣｌ_２、ならびにユニバーサルプライマー配列および標的特
異的配列5'-AGCGGATAACAATTTCACACAGGGAGCTAGCTTGGAAGATTGC-3'(配列番号４１)
を含む２５ｐｍｏｌのフォワードプライマー、および２ｐｍｏｌリバースプライ
マー5'-GTCCAATATATGCAAACAGTTG-3'(配列番号５４)、ならびにＰＣＲアンプリコ
ンＢＩＯの５’末端に相補的なビオチニル化ユニバーサルプライマー１０ｐｍｏ
ｌ：5'-AGCGGATAACAATTTCACACAGG-3'(配列番号４３)を含む。特異的フォワード
およびリバースプライマーを用いる標的の最初のラウンドの増幅の後、次いで、
５’ビオチニル化ユニバーサルプライマーをハイブリダイズさせ、フォワードプ
ライマーとして作用させ、それにより、５’ビオチン捕捉部分を当該分子中に導
入した。当該増幅プロトコールは、５’−ビオチニル化二本鎖ＤＮＡアンプリコ
ン中で生じ、遺伝子型決定に用いる５’ビオチン標識各フォワードプライマーの
必要性を除くことによるハイスル−プット遺伝子型決定の費用を劇的に減少する
。

【０２３９】サーマルサイクリングは、０．２ｍＬチューブまたは９６ウェルプレート中で
、MJ Research Thermal Cycler(算出温度)を用い、以下のパラメーターで行った
：９４℃５分間；４５サイクル：９４℃２０秒、５６℃３０秒、７２℃６０秒；
７２℃３分間。

【０２４０】ＤＮＡの固定化ＰＣＲ反応物５０μｌを、事前に３回洗浄し１ＭＮＨ_４Ｃｌ、０．０６ＭＮ
Ｈ_４ＯＨ中に再懸濁したストレプトアビジン被覆磁性ビーズ(Dynal, Oslo, Norw
ay)２５μｌに加えた。二本鎖ＰＣＲアンプリコンの一本鎖の５’末端は、室温
で１５分間でビーズに結合し得る。次いで、当該ビーズを、磁石を用い回収し、
非結合ＤＮＡを含む上清を取り除いた。ハイブリダイズしているが非結合の鎖は
、１００ｍＭＮａＯＨ中でインキュベーションし、１０ｍＭＴｒｉｓｐＨ８
．０でビーズを３回洗浄することにより二本鎖アンプリコンから解放した。

【０２４１】ＢｉｏｍａｓｓＰＲＯＢＥ(商標)アッセイを用いるＡＫＡＰ１０−５の検出ＡＫＡＰ１０−５(配列番号３３)のドナー集団のプライマー伸張分析(米国特
許番号６，０４３，０３１)のＢｉｏｍａｓｓＰＲＯＢＥ(商標)アッセイを用い
た。これらの方法を用いる遺伝子型決定は、２６ｍＭＴｒｉｓ−ＨＣｌｐＨ９
．５、６．５ｍＭＭｇＣｌ_２、５０ｍＭｄＴＴＰおよび５０ｍＭ各ｄｄＣＴ
Ｐ、ｄｄＡＴＰ、ｄｄＧＴＰ、２．５Ｕ熱安定性ＤＮＡポリメラーゼ(Amersham
)ならびに鋳型特異的オリゴヌクレオチドＰＲＯＢＥプライマー5'-ACTGAGCCTG C
TGCATAA-3'(配列番号４４)(Operon)にＤＮＡ被覆磁性ビーズを再懸濁することに
より行った。プライマー伸張は、ハイブリダイゼーションおよび伸張を伴うオリ
ゴヌクレオチドプライマーの３サイクルで生じる。当該伸張産物は、５０ｍＭ
ＮＨ_４Ｃｌで鋳型から変性させ、各サンプル１５０ｎＬを、Ｈ３ＰＡマトリック
ス物質１５０ｎｌで事前負荷したシリコンチップへ移した後、分析した。当該サ
ンプル物質を結晶化し、ＭＡＬＤＩ−ＴＯＦ(Bruker, PerSeptive)で分析した。
当該プライマーは、質量５４８３．６ダルトンを有する。ＳＮＰはプライマーに
ｄｄＣを付加し、質量５７５６．８ダルトンの伸張産物を得た。当該野生型は、
プライマーへＴおよびｄｄＧを付加し、質量５７５６．８ダルトンの伸張産物を
得る。野生型は、プライマーへＴおよびｄｄＧを付加し、質量６１０１ダルトン
を得る。

【０２４２】ＳＮＰの頻度は、年齢で選択した健康個体の集団で測定した。年齢４０歳未満
の七百十三(７１３)個体(３６０女性、３５３男性)および６０歳を超える年齢の
７０３個体(３２２女性、３８１男性)を、ＳＮＰ、ＡＫＡＰ１０−５(配列番号
３３)の存在下、試験した。結果を以下の表１に示す。

【表８】

【表９】

【０２４３】図２０は、年齢および性別で分類された白人集団における対立遺伝子および遺
伝子型の分布の結果を描写的に示す。

【０２４４】病的状態マーカー３：ヒトメチオニンスルホキシドレダクターゼＡ(ｍｓｒＡ) 両性および集団全体におけるこのマーカーの年齢関連の対立遺伝子および遺伝
子型の頻度を図２１に示す。高齢の男性集団におけるホモ接合ＣＣ遺伝子型の減
少は、非常に重要である。

【０２４５】メチオニンスルホキシドレダクターゼＡ(＃６３３０６) ヒト健康体ドナー集団におけるヒトメチオニンスルホキシドレダクターゼＡ(ｈ
−ｍｓｒ−Ａ)のＰＣＲ増幅およびＢｉｏｍａｓｓＰＲＯＢＥアッセイ検出ｈ−ｍｓｒ−Ａのドナー集団のＰＣＲ増幅ＰＣＲプライマーは、ＯＰＥＲＯＮにより、ホスホラミダイト化学を用い合成
した。ＡＫＡＰ１０標的配列の増幅は、ＰＣＲ反応物５０μｌ中に、プールした
ヒトゲノムＤＮＡ鋳型１００ｎｇ−１μｇを有する単一のＰＣＲ反応物５０μｌ
中で行った。プールしたサンプル内の各ＤＮＡ濃度は、最終濃度１−２５ｎｇの
範囲の等濃度で存在した。各反応物は、１×ＰＣＲ緩衝液(Qiagen, Valencia, C
A)、２００μＭｄＮＴＰ、１Ｕ Hotstar Ｔａｑポリメラーゼ(Qiagen, Valenci
a, CA)、４ｍＭＭｇＣｌ_２、ならびにユニバーサルプライマー配列および標的
特異的配列5'-TTTCTCTGCACAGAGAGGGC-3'(配列番号４９)を含む２５ｐｍｏｌのフ
ォワードプライマー、および２ｐｍｏｌリバースプライマー5'-AGCGGATAACAATTT
CACACAGGGCTGAAATCCTTCGCTTTACC-3'(配列番号５０)、ならびにＰＣＲアンプリコ
ンの５’末端に相補的なビオチニル化ユニバーサルプライマー１０ｐｍｏｌ 5'-
AGCGGATAACAATTTCACACAGG-3'(配列番号５１)を含む。特異的フォワードおよびリ
バースプライマーを用いる標的の最初のラウンドの増幅の後、次いで、５’ビオ
チニル化ユニバーサルプライマーをハイブリダイズさせ、リバースプライマーと
して作用させ、それにより、３’ビオチン捕捉部分を当該分子中に導入した。当
該増幅プロトコールは、５’−ビオチニル化二本鎖ＤＮＡアンプリコン中で生じ
、遺伝子型決定に用いる５’ビオチン標識各フォワードプライマーの必要性を除
くことによるハイスル−プット遺伝子型決定の費用を劇的に減少する。サーマル
サイクリングは、０．２ｍＬチューブまたは９６ウェルプレート中で、MJ Resea
rch Thermal Cycler(算出温度)を用い、以下のパラメーターで行った：９４℃５
分間；４５サイクル：９４℃２０秒、５６℃３０秒、７２℃６０秒；７２℃３分
間。

【０２４６】ＤＮＡの固定化ＰＣＲ反応物５０μｌを、事前に３回洗浄し１ＭＮＨ_４Ｃｌ、０．０６ＭＮ
Ｈ_４ＯＨ中に再懸濁したストレプトアビジン被覆磁性ビーズ(Dynal)２５μｌに
加えた。ＰＣＲアンプリコンは、室温で１５分間でビーズに結合し得る。次いで
、当該ビーズを、磁石を用い回収し、非結合ＤＮＡを含む上清を取り除いた。非
結合鎖は、１００ｍＭＮａＯＨ中でインキュベーションし、１０ｍＭＴｒｉｓ
ｐＨ８．０でビーズを３回洗浄することにより二本鎖アンプリコンから解放し
た。

【０２４７】ｈ−ｍｓｒ−Ａのドナー集団のＢｉｏｍａｓｓＰＲＯＢＥアッセイ分析ＢｉｏｍａｓｓＰＲＯＢＥアッセイ法を用いる遺伝子型決定は、２６ｍＭＴ
ｒｉｓ−ＨＣｌｐＨ９．５、６．５ｍＭＭｇＣｌ_２、５０ｍＭｄＴＴＰおよ
び５０ｍＭ各ｄｄＣＴＰ、ｄｄＡＴＰ、ｄｄＧＴＰ、２．５Ｕ熱安定性ＤＮＡ
ポリメラーゼ(Amersham)ならびに鋳型特異的オリゴヌクレオチドＰＲＯＢＥプラ
イマー5'-CTGAAAAGGGAGAGAAAG-3'(Operon)(配列番号５２)にＤＮＡ被覆磁性ビー
ズを再懸濁することにより行った。プライマー伸張は、ハイブリダイゼーション
および伸張を伴うオリゴヌクレオチドプライマーの３サイクルで生じる。当該伸
張産物は、５０ｍＭＮＨ_４Ｃｌで鋳型から変性させ、各サンプル１５０ｎｌを
、Ｈ３ＰＡマトリックス物質１５０ｎｌで事前負荷したシリコンチップへ移した
後、分析した。当該サンプル物質を結晶化し、ＭＡＬＤＩ−ＴＯＦ(Bruker, Per
Septive)で分析した。ＳＮＰは、２つのＥＳＴの配列におけるＴからＣへの変化
として示される。野生型は、野生型ヒトｍｓｒＡ遺伝子(配列番号３９)の一部で
あるＥＳＴのヌクレオチド配列を示す、ＧｅｎＢａｎｋ受け入れ番号ＡＷ１９５
１０４の１２８位にＴを有することにより示される。ＳＮＰは、ヒトｍｓｒＡ遺
伝子(配列番号４０)の対立遺伝子の一部であるＥＳＴのヌクレオチド配列を示す
、ＧｅｎＢａｎｋ受け入れ番号ＡＷ８７４１８７の１２９位のＣとして示される
。

【０２４８】ゲノム配列において、ＳＮＰは、ＡからＧへの変化として示される。ＢｉｏＭ
ａｓｓプローブ反応で使用するプライマーは、質量５６５４．８ダルトンを有し
ていた。ＳＮＰの存在下、当該プライマーは、ｄｄＣの組込みにより伸張し、質
量５９２８を有する。野生型の存在下、当該プライマーは、ｄＴおよびＤＤＣの
添加により伸張し、質量６２３２．１ダルトンを生ずる。

【０２４９】ＳＮＰの頻度は、年齢で選択した健康個体の集団で測定した。年齢１８−３９
歳の五百五十二(５５２)個体(２７６女性、２７６男性)および年齢６０−７９の
５５２個体(年齢６０−６９では１８４女性、年齢６０−７９では３６８男性)を
、ｈ−ｍｓｒ−Ａの非翻訳３’領域中に局在する多型の存在に関し試験した。

【０２５０】健康体個体間の男性年齢群の遺伝子型の相違が有意であった。男性集団の場合
、対立遺伝子有意性は、ｐ＝０．０００９および遺伝子型有意性はｐ＝０．００
３である。両性および集団全体における、このマーカーの年齢関連の対立遺伝子
および遺伝子型の頻度を図２１に示す。高齢の男性集団におけるホモ接合ＣＣ遺
伝子型の減少は、非常に有意である。

【０２５１】多型は、ヒトメチオニンスルホキシドレダクターゼＡ(ｈ−ｍｓｒ−Ａ)をコー
ドする遺伝子の非翻訳３’−領域中に局在する。当該正確な位置は、ストップコ
ドン(ＴＡＡ)の４５１塩基部位下流である。このＳＮＰは、コーディングまたは
プロモーターの領域よりも上流の他の多型と共に連鎖不平衡(ＬＤ)となるようで
あり；そのため、直接病的状態の原因とはならない。酵素メチオニンスルホキシ
ドレダクターゼは、複数の生物学的機能を示すことが提唱されている。酸化性タ
ンパク質損傷の修復ばかりでなく、生物学的機能の活性化または不活性化による
タンパク質の制御においてまた重要な役割をする(Moskovitz et al. (1990) PNA
S 95: 14071-14075)。その活性が、アルツハイマー患者の脳組織において有意に
減少することもまた示された(Gabbita et al. (1999) J. Neurochem 73: 1660-1
666)。反応性酸素種の代謝に含まれるタンパク質が付随する疾患が、科学的に考
えられる。

【０２５２】結論健康体集団の使用は、病的状態マーカーの同定を提供する。当該タンパク質の
同定には、Ｇ−プロテイン結合シグナリング形質導入経路にまたは酸化ストレス
の緩和に含まれるタンパク質の同定は、説得力のある結果であると考えられる。
ヒトプロテインキナーゼＡアンカータンパク質をコードする遺伝子においてin s
ilicoで既に同定されている他の可能性ある多型の更なる確認および検証は、病
的状態に強力に付随し、この遺伝子産物は、適当な医薬的または診断的標的であ
ることを証明する。

【０２５３】実施例４ＭＡＬＤＩ−ＴＯＦ質量分析法分析以下に挙げた酵素アッセイの産物のすべてをＭＡＬＤＩ−ＴＯＦ質量分析法に
より分析した。水で２．５倍に希釈された１：１水：アセトニトリル中の１０
：１３−ヒドロキシピコリン酸：クエン酸アンモニウムを含む希釈マトリック
ス溶液(０．１５μＬ)は、ＳｐｅｃｔｒｏＣｈｉｐ(Sequenom, Inc.)にピペッテ
ィングし、結晶化することができた。次いで、サンプル０．１５μｌを加えた。
陽性イオンモードで操作する、直線状のPerSeptive Voyager DEマススペクトロ
メーターまたはBruker Biflex ＭＡＬＤＩ−ＴＯＦマススペクトロメーターを測
定に使用した。当該サンプルプレートを各ＵＶレーザーショット(合計約２５０
レーザーショット)後は４００ｎｍの１８．２ｋＶで維持し、次いで、標的ボル
ト数を２０ｋＶに上昇させた。オリジナルのスペクトルは、５００ＭＨｚでデジ
タル化した。

【０２５４】実施例５サンプルコンディショニング以下の実施例に示す場合、酵素消化物の産物は、ZipTip(Millipore, Bedford,
MA)で精製した。ZipTipは、５０％アセトニトリル１０μｌで事前に濡らしてお
き、０．１ＭＴＥＡＡｃ１０μｌで４回平衡化した。オリゴヌクレオチドフラ
グメントを、連続的アスピレーションおよび各サンプルをZipTipに分配すること
により、Ｃ１８に結合させた。各消化オリゴヌクレオチドを、０．１ＭＴＥＡ
Ａｃ１０μｌで洗浄し、その後、Ｈ_２Ｏ１０μＬで４回洗浄ステップを行うこと
によりコンディショニングした。ＤＮＡフラグメントは、５０％アセトニトリル
７μＬを用いZipTipから溶出させた。

【０２５５】当該サンプルのコンディションの任意の方法を用い得る。一般的にピーク分解
の増大に使用するコンディショニングの方法が、既知である(例えば、国際特許
出願番号WO98/20019参照)。

【０２５６】実施例６ＤＮＡグリコシラーゼ仲介配列分析ＤＮＡグリコシラーゼは、特異的核酸塩基がＤＮＡ中に存在する各位置におい
てＤＮＡを修飾し、それにより、脱塩基部位を生ずる。他の酵素、化学、または
熱によるその後の反応において、脱塩基部位のリン酸バックボーンが切断され得
る。

【０２５７】以下の手順に従い利用されるグリコシラーゼは、ウラシル−ＤＮＡグリコシラ
ーゼ(ＵＤＧ)であった。ウラシル塩基は、ウラシルの存在下ＤＮＡ標的配列を増
幅することによりチミン塩基が通常占める各位置においてＤＮＡフラグメント中
に組込まれた。各ウラシル置換ＤＮＡアンプリコンは、アンプリコン中の各ウラ
シル塩基を切断するＵＤＧと共にインキュベーションし、次いでＤＮＡフラグメ
ントを生ずる各脱塩基部位でバックボーン切断に効果的なコンディションにした
。ＤＮＡフラグメントをＭＡＬＤＩ−ＴＯＦ質量分析法分析した。次いで、標的
ＤＮＡの遺伝的変異性をマススペクトルを分析することにより評価した。

【０２５８】本明細書に記載のように、ヌクレオチド類似体または修飾ヌクレオチドに特異
的なグリコシラーゼが以下の手順でＵＤＧで置換され得る。下記のグリコシラー
ゼ法は、リン酸バックボーン切断およびＭＡＬＤＩと共に用いられ、ＳＮＰスキ
ャンニング、細菌型別化、メチル化分析、マイクロサテライト分析、遺伝子型決
定、およびヌクレオチド配列決定および再配列決定の目的でＤＮＡフラグメント
を分析し得る。

【０２５９】Ａ．遺伝子型決定グリコシラーゼ手順を用い、ＵＣＰ−２(非結合タンパク質２)をコードするＤ
ＮＡ配列を遺伝子型決定した。ＵＣＰ−２の配列は、受け例番号ＡＦ０９６２８
９でＧｅｎＢａｎｋに登録されいてる。以下の手順で遺伝子型決定した配列の変
化は、ヌクレオチド４７９０位におけるシトシン(Ｃ−対立遺伝子)からチミン(
Ｔ−対立遺伝子)への変化であり、その結果、ＵＣＰ−２ポリペプチドの５５位
においてアラニンからバリンへの変異を生ずる。

【０２６０】ＤＮＡは、配列5'-TGCTTATCCCTGTAGCTACCCTGTCTTGGCCTTGCAGATCCAA-3'(配列番
号９１)を有する５ｐｍｏｌビオチニル化プライマー、配列5'-AGCGGATAACAATTTC
ACACAGGCCATCACACCGCGGTACTG-3'(配列番号９２)を有する１５ｐｍｏｌ非ビオチ
ニル化プライマー、２００μＭｄＡＴＰ、２００μＭｄＣＴＰ、２００μＭ
ｄＧＴＰ、６００μＭｄＵＴＰ(完全にｄＴＴＰに置換され得る)、１．５ｍＭ
から３ｍＭＭｇＣｌ_２、１Ｕ Hotstar Ｔａｑポリメラーゼ、およびＣＥＰＨ
ＤＮＡ２５ｎｇを含む反応体積５０μＬにＰＣＲ手順を用い増幅した。増幅は、
アニーリング温度５６℃で４５サイクル行った。

【０２６１】次いで、増幅産物は、事前に洗浄したDynabeads５μＬを伴う増幅反応物５０
μＬを室温で２０分間インキュベーションすることにより、固体支持体に固定化
した。上清を取り除き、ビーズを０．１ＭＮａＯＨ５０μｌと共に室温５分間
インキュベーションし、一本鎖ＤＮＡをビーズに連結させた方法で二本鎖ＰＣＲ
産物を変性させた。次いで、当該ビーズを１０ｍＭＴｒｉｓＨＣｌ(ｐＨ８)５
０μＬで３回洗浄することにより中性化した。当該ビーズを６０ｍＭＴｒｉｓ
ＨＣｌ／１ｍＭＥＤＴＡ(ｐＨ７．９)溶液中で再懸濁し、１ＵウラシルＤＮＡ
グリコシラーゼを３７℃で４５分間、当該溶液に加え、ビーズに連結する一本鎖
ＤＮＡ中に存在するウラシルヌクレオチドを取り除いた。次いで、当該ビーズを
、１０ｍＭＴｒｉｓＨＣｌ(ｐＨ８)２５μＬで２回洗浄し、水１０μＬで１回
洗浄した。次いで、ビオチン化鎖を、６０℃で１０分間、２ＭＮＨ_４ＯＨ１２
μｌでビーズから溶出した。ＤＮＡのバックボーンを、９５℃１０分間、サンプ
ルをインキュベーションすることにより(密閉のふたと共に)、切断し、アンモニ
アを、サンプルを８０℃で１１分間インキュベーションすることによりサンプル
から蒸発させた。

【０２６２】次いで、切断フラグメントを、実施例４に記載のようにＭＡＬＤＩ−ＴＯＦ質
量分析法より分析した。Ｔ対立遺伝子は、３２５４ダルトンの特有フラグメント
を生じた。Ｃ対立遺伝子は、４７８８ダルトンの特有フラグメントを生じた。こ
れらのフラグメントは、マススペクトルで識別可能であった。そのため、上記同
定手順は、ＵＣＰ−２中のＣ対立遺伝子およびＴ対立遺伝子にヘテロ接合の個体
の遺伝子型決定に成功的に利用できた。

【０２６３】Ｂ．プールしたＤＮＡサンプルを用いるグリコシラーゼ分析グリコシラーゼアッセイを、プールしたサンプルを用い構成し、ＵＣＰ−２遺
伝子配座の遺伝的多様性を検出した。既知遺伝子型のＤＮＡを１１個体からプー
ルし、固定濃度の５ｎｇ／μＬに希釈した。実施例３Ａで提供された手順は、配
列5'-CCCAGTCACGACGTTGTAAAACGTCTTGGCCTTGCAGATCCAAG-3'(配列番号９３)を有す
るフォワードプライマー２ｐｍｏｌおよび配列5'-AGCGGATAACAATTTCACACAGGCCAT
CACACCGCGGTACTG-3'(配列番号９４)を有するリバースプライマー１５ｐｍｏｌを
用いることができた。加えて、配列5'bioCCCAGTCACGACGTTGTAAAACG-3'(配列番号
９７)を有するビオチニル化プライマー５ｐｍｏｌを、約２サイクル後にＰＣＲ
反応物に導入し得る。当該フラグメントは、ＭＡＬＤＩ−ＴＯＦ質量分析法(実
施例４)で分析した。実施例３Ａで測定したように、３２５４ダルトンの特有の
フラグメントを生じるＴ対立遺伝子は、マススペクトルで、４７８８ダルトンの
特有のフラグメントを生じるＣ対立遺伝子と区別し得る。プールしたサンプルの
対立遺伝子頻度は、対立遺伝子フラグメントに相当する各シグナルの下の領域に
組込まれることにより定量された。組込みは、当業者に既知の等式を用い手計算
で行った。１１サンプルのプールにおいて、この手順は、４０．９％の個体がＴ
対立遺伝子を保有し、５９．０９％の個体がＣ対立遺伝子を保有することを提唱
した。

【０２６４】Ｃ．グリコシラーゼ仲介マイクロサテライト分析グリコシラーゼ手順を用い、Bradykinin Receptor 2(ＢＫＲ−２)配列のマイ
クロサテライトを同定した。ＢＫＲ−２の配列は、受け入れ番号Ｘ８６１７３で
ＧｅｎＢａｎｋに登録されている。ＢＫＲ−２は、プロモーター領域にＣからＴ
への変化のＳＮＰを含み、そして繰り返し単位中にＧからＴへの変化のＳＮＰを
含む。実施例３Ａで提供された当該手順を用い、プロモーター領域中のＳＮＰ、
マイクロサテライト繰り返し単位領域中のＳＮＰ、およびＢＫＲ−２のマイクロ
サテライト領域の繰り返し単位の数を同定した。特に配列5'-CTCCAGCTGGGCAGGAG
TGC-3'(配列番号９５)を有するフォワードＰＣＲプライマーおよび配列5'-CACTT
CAGTCGCTCCCT-3'(配列番号９６)を有するリバースプライマーを用い、ウラシル
存在下、ＢＫＲ−２ＤＮＡを増幅した。当該アンプリコンは、ＵＤＧによりフラ
グメント化し、その後、バックボーン切断した。当該切断フラグメントは実施例
４で記載のようにＭＡＬＤＩ−ＴＯＦ質量分析法により分析した。

【０２６５】ＣからＴへの変化を有するＢＫＲ−２プロモーター領域中のＳＮＰに関し、Ｃ
対立遺伝子は、質量７３４２．４ダルトンを有する特有のフラグメントを生じ、
Ｔ対立遺伝子は、質量７０５３．２ダルトンを有する特有のフラグメントを生じ
た。これらフラグメントは、マススペクトルで区別できた。そのため、上記同一
手順は、ＢＫＲ−２のプロモーター領域中のＣ対立遺伝子およびＴ対立遺伝子と
ヘテロ接合の個体を遺伝子型決定に成功的に利用できた。

【０２６６】ＧからＴへの変化を有するＢＫＲ−２の繰り返し領域中のＳＮＰに関し、Ｔ対
立遺伝子は、質量１７８４ダルトンを有する特有のフラグメントを生じ、それは
、容易にマススペクトルで検出できた。それゆえ、Ｔ対立遺伝子の存在は、ＢＫ
Ｒ−２の繰り返し領域中のＧからＴへの配列変化を示唆した。

【０２６７】加えて、繰り返し領域の数は、ＢＫＲ−２中に、２つの繰り返し配列を有する
個体と３つの繰り返し配列を有する個体とを区別できた。これら個体のＤＮＡは
、各繰り返し配列がＳＮＰ遺伝子配座でＧを含んでいるため、繰り返し配列中の
ＧからＴへの配列変化を保持していなかった。繰り返し領域の数は、質量２７７
１．６ダルトンを有する特有のＤＮＡフラグメントに相当するシグナルの下の領
域を算出することにより、個体サンプルで決定された。２つの繰り返し領域を有
する個体から生ずるスペクトルにおけるこのシグナルは、３つの繰り返し領域を
有する個体から生ずるスペクトル中の同じシグナルの下の３３％未満の領域であ
る、領域を有していた。そのため、上記考察の手順を用い、ＢＫＲ−２中に存在
する繰り返し領域の数について個体の遺伝子型決定することができた。

【０２６８】Ｄ．グリコシラーゼ消化と合わせたバイサルファイトゲノムＤＮＡのバイサルファイト処置を用い、ＤＮＡ内のメチル化シトシン残
基の位置を分析することができる。バイサルファイトによる核酸処置により、シ
トシン残基をウラシル残基にジアミノ化し、その一方、メチル化シトシンは修飾
しないままである。そのため、バイサルファイトで処置していないゲノムＤＮＡ
から生ずるＰＣＲ産物の配列を、バイサルファイトで処置するゲノムＤＮＡから
生じたＰＣＲ産物の配列と比較することにより、核酸中およびシトシンがメチル
化されている位置におけるメチル化の程度を推測することができる。

【０２６９】ゲノムＤＮＡ(２μｇ)を、制限酵素１μＬで３７℃２時間インキュベーション
することにより消化した。３ＭＮａＯＨのアリコートを添加し、消化溶液中、
最終濃度０．３ＭＮａＯＨを得た。当該反応物を３７℃１５分間インキュベー
ションし、その後、５．３５Ｍ尿素、４．４４Ｍバイサルファイトおよび１０
ｍＭヒドロキノリンで処置し、この場合、ヒドロキノリンの最終濃度は０．５
ｍＭであった。

【０２７０】バイサルファイト(サンプルＡ)で処置したサンプルを、バイサルファイト処置
(サンプルＢ)していない同じ消化サンプルと比較した。サンプルＡを上記のよう
にバイサルファイトで処置した後、サンプルＡおよびサンプルＢを標準的なＰＣ
Ｒ手順により増幅した。当該ＰＣＲ手順には、各サンプルをミネラルオイルで覆
い、当該サンプルをサーマルサイクリング(５５℃１５分間、その後、９５℃３
０秒間の２０サイクル)するステップを含む。当該ＰＣＲ反応物には、４つのヌ
クレオチド塩基、Ｃ、Ａ、Ｇ、およびＵを含む。当該ミネラルオイルを各サンプ
ルから取り除き、ＰＣＲ産物をガラスミルクで精製した。ヨウ化ナトリウム(３
体積)およびガラスミルク(５μＬ)をサンプルＡおよびサンプルＢに添加した。
次いで、当該サンプルを氷上に８分間置き、冷緩衝液４２０μＬで洗浄し、１０
秒間遠心分離し、上清画分を取り除いた。この方法を２回繰り返し、次いで、水
２５μＬを添加した。サンプルを３７℃５分間インキュベーションし、２０秒間
遠心分離し、上清画分を回収し、そしてこのインキュベーション／遠心分離／上
清画分回収の手順を繰り返した。次いで、０．１ＭＮａＯＨ５０μＬを当該サ
ンプルに添加し、ＤＮＡを変性させた。当該サンプルを室温５分間インキュベー
ションし、１０ｍＭＴｒｉｓＨＣｌ(ｐＨ８)５０μＬで３回洗浄し、そして６
０ｍＭＴｒｉｓＨＣｌ／１ｍＭＥＤＴＡ、ｐＨ７．９１０μＬ中に再懸濁し
た。

【０２７１】次いで、サンプルＡおよびサンプルＢからのＰＣＲ産物の配列を２ＵＵＤＧ(
MBI Fermentas)で処理し、次いで、上記のようにバックボーンを切断した。各サ
ンプルＡおよびサンプルＢから得られたフラグメントは実施例４に記載のように
ＭＡＬＤＩ−ＴＯＦ質量分析法により分析した。サンプルＡは、サンプルＢから
得られるフラグメントの数よりも多いフラグメントの数が生じ、これは、核酸が
少なくとも１つのメチル化シトシン部分を保持することを示唆する。

【０２７２】実施例７Ｆｅｎリガーゼ仲介ハプロタイピングハプロタイピング手順により、個体の２つの相同性クロモソームの１つからフ
ラグメントを選択し得、そしてそのフラグメントにおける連結ＳＮＰを遺伝子型
決定し得る。ハプロタイプの直接決定により、情報コンテントを増加し、任意の
連結疾患遺伝子の診断を改善し、またはこれら疾患の関連を同定することができ
る。従前の研究では、ハプロタイプは、典型的には、系統分析(系統が利用可能
である場合)を介して、困難で信頼性のない対立遺伝子特異的ＰＣＲを介して、
または当分野に既知の単一分子希釈を介して、再構成された。

【０２７３】ハプロタイピング手順を用い、ＤＮＡサンプル中の一本鎖に存在する、ＳＮＰ
１およびＳＮＰ２と称せられる２つのＳＮＰの存在を決定した。ハプロタイピン
グ手順を、Ｆｅｎ−１を利用するこのアッセイに使用し、ＤＮＡ“フラップ(fla
p)”を切断する部位特異的“フラップ”エンドヌクレアーゼは、標的ＤＮＡ鎖に
ハイブリダイズする２つのオリゴヌクレオチドのオーバーラップにより作成した
。この実施例の当該２つのオーバーラッピングオリゴヌクレオチドは、短アーム
および長アーム対立遺伝子特異的アダプターであった。標的ＤＮＡは、変性しＳ
ＮＰ１およびＳＮＰ２を含む増幅核酸であった。

【０２７４】短アームアダプターには、標的ＤＮＡには見られない特有の配列を含む。短ア
ームアダプターの３'末端ヌクレオチドは、ＳＮＰ１対立遺伝子の１つと同一で
あった。更に、長アームアダプターには、２つの領域：短アームに相補的な３’
領域およびＳＮＡに隣接する目的のフラグメントに相補的な５’遺伝子特異的領
域を含む。アダプターとその相同体の１つとの間にマッチがあれば、Ｆｅｎ酵素
は、認識し、オーバーラッピングフラップを切断する。次いで、当該アダプター
の短アームを標的フラグメントの残り(ＳＮＰ部位を除く)にライゲーションした
。このライゲーションしたフラグメントを、ライゲーションした相同体のみを増
幅する第二のＰＣＲ反応のフォワードプライマーとして用いた。次いで、第二の
ＰＣＲ産物(ＰＣＲ２)を質量分析法で分析した。アダプターと標的ＤＮＡとの間
にマッチがなければ、Ｆｅｎ−１によるオーバーラップまたは切断はなく、その
ため、目的のＰＣＲ２は存在しない。

【０２７５】目的配列中に１を超えるＳＮＰが存在するならば、第二のＳＮＰ(ＳＮＰ２)は
、ＳＮＰ２に特異的なアダプターを用いることにより、および第一のＳＮＰを含
むＰＣＲ２産物にアダプターをハイブリダイズさせることにより、発見できた。
Ｆｅｎリガーゼおよび増幅手順は、第一のＳＮＰを含むＰＣＲ２産物で繰り返し
た。増幅産物が第二のＳＮＰを生ずるならば、ＳＮＰ１およびＳＮＰ２は同じフ
ラグメントにあった。

【０２７６】ＳＮＰが知られていないならば、４つの対立遺伝子特異的アダプター(例えば
、Ｃ、Ｇ、ＡおよびＴ)を用い標的ＤＮＡとハイブリダイズさせることができる
。次いで、基質を、増幅を含むＦｅｎリガーゼプロトコールで処理する。ＰＣＲ
２産物を本明細書に記載のようにＰＲＯＢＥで分析し、どのアダプターがＤＮＡ
標的にハイブリダイズするかを決定し、それにより、当該配列中のＳＮＰを同定
し得る。

【０２７７】Ｆｅｎリガーゼアッセイを用い、因子ＶＩＩ中に存在する２つのＳＮＰを検出
した。これらのＳＮＰは、お互いから８１４塩基対離れて位置している。ＳＮＰ
１は、８４０１位(ＣからＴへ)に位置し、ＳＮＰ２は、９２１５位(ＧからＡへ)
に位置する(配列番号＃)

【０２７８】Ａ．最初の増幅ステップＰＣＲ産物(ＰＣＲ１)は、ＳＮＰの５'末端から僅かに離れたＳＮＰ１におけ
る既知ヘテロ接合個体として生じた。特に、ＰＣＲ反応物１０μＬは、１．５ｍ
ＭＭｇＣｌ_２、２００μＭ各ｄＮＴＰ、０．５Ｕ Hotstar ポリメラーゼ、配
列5'-GCGCTCCTGTCGGTGCCA-3'(配列番号５６)を有するフォワードプライマー０．
１μＭ、配列5'-GCCTGACTGGTGGGGCCC-3'(配列番号５７)を有するリバースプライ
マー０．１μＭ、およびゲノムＤＮＡ１ｎｇを混合することにより行った。アニ
ーリング温度は５８℃であり、増幅処理により、長さが８６１であるフラグメン
トを得た。

【０２７９】ＰＣＲ１反応混合物を半分に分け、１．０μＬＳＡＰおよび０．１μＬエキ
ソン１を含むエキソヌクレアーゼ１／ＳＡＰ混合物(０．２２μＬ混合物／５μ
ＬＰＣＲ１反応物)で処理した。エキソヌクレアーゼ処理は、３７℃３０分間行
い、次いで、８５℃２０分間行いＤＮＡを変性させた。

【０２８０】Ｂ．アダプターオリゴヌクレオチドアダプターあたり、１つの長および１つの短オリゴヌクレオチドを含む対立遺
伝子特異的アダプター(ＣおよびＴ)の溶液を調製した。各アダプター(１０μＭ)
の長アームおよび短アームオリゴヌクレオチドを、１：１の割合で混合し、９５
℃３０秒間加熱した。当該温度を、アニーリングのため２℃の誤差で、３７℃に
下げた。Ｃアダプターは、5'-CATGCATGCACGGTC-3'(配列番号５８)の短アーム配
列および5'-CAGAGAGTACCCCTCGACCGTGCATGCATG-3'(配列番号５９)の長アーム配列
を有する。これゆえ、アダプターの長アームは３０ｂｐ(１５ｂｐ遺伝子特異的)
であり、短アームは１５ｂｐであった。Ｔアダプターは、5'-CATGCATGCACGGTT-3
'(配列番号６０)の短アーム配列および5'-GTACGTACGTGCCAACTCCCCATGAGAGAC-3'(
配列番号６１)の長アーム配列を有した。当該アダプターはまた、３から１０ヌ
クレオチド(配列番号１１８)を含むループにより短および長アームが分離される
ヘアピン構造を有し得る。

【０２８１】Ｃ．Ｆｅｎリガーゼ反応２つのチューブに(サンプルあたりの各対立遺伝子特異的アダプターとして１
チューブ)、１０ｍＭ１６％ＰＥＧ／５０ｍＭＭＯＰＳ３．５μｌ、２５ｍＭ
ＭｇＣｌ_２１．２μｌ、１０×Ampligase緩衝液１．５μｌ、および２．５μｌ
ＰＣＲ１を含む溶液(溶液Ａ)を入れた。溶液Ａを含む各チューブは、９５℃５分
間インキュベーションし、ＰＣＲ１産物を変性させた。Ampligase(熱安定性リガ
ーゼ、Epicentre Technologies)１．６５μｌ、２００ｎｇ／μｌＭＦＥＮ(Met
hanocuccus jannaschii由来)１．６５μｌおよび対立遺伝子特異的アダプター(
ＣまたはＴ)３．０μｌを含む第二の溶液(溶液Ｂ)を調製した。溶液Ｂの種々の
変化物、種々の対立遺伝子特異的アダプターを含む各変化物を作成した。溶液Ｂ
を９５℃で溶液Ａに添加し、５５℃３時間インキュベーションした。全反応物体
積をアダプター特異的反応物あたり１５．０μｌとした。二対立遺伝子システム
(bi-allelic system)では、２×１５．０μｌ反応物を必要とした。

【０２８２】次いで、各チューブにおけるＦｅｎリガーゼ反応物を、１０ｍＭＥＤＴＡ８
．０μｌを加えることにより不活性化した。次いで、エキソＩＩＩ／緩衝液(７
０％／３０％)溶液１．０μｌを各サンプルに加え、３７℃３０分間、７０℃２
０分間(エキソＩＩＩを不活性化)、および９５℃５分間(サンプルを変性させ、
使用していないアダプターを鋳型から分離した)インキュベーションした。当該
サンプルを氷スラリーで冷却し、長さ１００塩基対未満のすべてのフラグメント
を取り除くUltraClean PCR Clean-up(MoBio)スピンカラムで精製した。当該フラ
グメントはＨ_２Ｏ５０μｌで溶出した。

【０２８３】Ｄ．第二の増幅ステップ第二の増幅反応(ＰＣＲ２)を、各サンプルチューブにおいて、フォワードプラ
イマーとして短アームアダプター(ＣまたはＴ)配列を用い(ＳＮＰ１部位を除く)
、行った。ライゲーション相同体のみを増幅した。標準的ＰＣＲ反応物は、１×
緩衝液(最終濃度)、１．５ｍＭ最終濃度ＭｇＣｌ_２、２００μＭ最終濃度ｄＮ
ＴＰ、０．５Ｕ Hotstar ポリメラーゼ、０．１μＭ最終濃度フォワードプライ
マー5'-CATGCATGCACGGT-3'(配列番号６２)、０．１μＭ最終濃度リバースプラ
イマー5'-GCCTGACTGGTGGGGCCC-3'(配列番号６３)、および精製ＦＥＮリガーゼ反
応溶液１．０μｌを含む全体積１０．０μｌで行った。アニーリング温度は、５
８℃であった。ＰＣＲ２産物を実施例４で示したようにＭＡＬＤＩ−ＴＯＦ質量
分析法で分析した。ＦｅｎＳＮＰ１のマススペクトルは、質量６０８４．０８
ダルトンであり、それは、Ｃ対立遺伝子を示している。

【０２８４】Ｅ．付加ＳＮＰの遺伝子型決定第二のＳＮＰ(ＳＮＰ２)は、ＳＮＰ２に特異的なアダプターを用いることによ
り、および第一のＳＮＰを含むＰＣＲ２産物にアダプターをハイブリダイズさせ
ることにより、発見できる。Ｆｅｎリガーゼおよび増幅手順は、第一のＳＮＰを
含むＰＣＲ２産物で繰り返す。増幅産物が第二のＳＮＰを生ずるならば、ＳＮＰ
１およびＳＮＰ２は同じフラグメントにある。Ｔ対立遺伝子を示すＳＮＰ２のマ
ススペクトルは質量６３５９．８８ダルトンであった。

【０２８５】このアッセイはまた、プールしたＤＮＡで行い、本明細書で記載するようにハ
プロタイプ頻度を生ずることが可能である。Ｆｅｎリガーゼアッセイを用い、本
明細書に記載のようにマルチプレックスを分析できる。

【０２８６】実施例８ニッカーゼ仲介配列分析ＤＮＡニッカーゼまたはＤＮａｓｅを用い、ＤＮＡ二重らせんの一本鎖を認識
し切断した。使用した２つのニッカーゼはＮＹ２ＡニッカーゼおよびＮＹＳ１ニ
ッカーゼ(Megabase)であり、それらは以下の部位でＤＮＡを切断する：

【化８】

【０２８７】Ａ．ニッカーゼ消化Ｔｒｉｓ−ＨＣｌ(１０ｍＭ)、ＫＣｌ(１０ｍＭ、ｐＨ８．３)、酢酸マグネシ
ウム(２５ｍＭ)、ＢＳＡ(１ｍｇ／ｍＬ)、および６ＵＣｖｉＮＹ２ＡまたはＣ
ｖｉＮＹＳ１ニッカーゼ(Megabase Research)を、標準的ホスホラミダイト化学
を用い合成される配列5'-CGCAGGGTTTCCTCGTCGCACTGGGCATGTG-3'(配列番号９０、
Operon, Alameda, CA)を有する二本鎖オリゴヌクレオチド鋳型２５ｐｍｏｌに加
えた。全体積２０μＬを用い、当該反応混合物を３７℃５時間インキュベーショ
ンし、当該消化産物を実施例５に記載するようにZipTip(Millipore, Bedford, M
A)を用い精製した。当該サンプルを、実施例１に記載するようにＭＡＬＴＹ−Ｔ
ＯＭ質量分析法で分析した。ニッカーゼＣｖｉＮＹ２Ａは質量４０４９．７６
ダルトン、５４７３．１４ダルトンおよび９５４０．７１ダルトンの３つのフラ
グメントを生じた。ＣｖｉＮＹＳ１ニッカーゼは質量２０６３．１８ダルトン
、３０５６．４８ダルトン、６４９２．８１ダルトンおよび７４５０．１４ダル
トンのフラグメントを生じた。

【０２８８】Ｂ．プールしたサンプルのニッカーゼ消化ＤＱＡ(HLA ClassII-DQ Alpha、予想フラグメントサイズ＝２２５ｂｐ)は、１
００の健康個体のゲノムＤＮＡから増幅した。ＤＱＡは、標準的ＰＣＲ化学を用
い、１０ｍＭＴｒｉｓ−ＨＣｌ、１０ｍＭＫＣｌ(ｐＨ８．３)、２．５ｍＭ
ＭｇＣｌ_２、２００μＭ各ｄＮＴＰ、配列5'-GTGCTGCAGGTGTAAACTTGTACCAG-3'(
配列番号６４)を有するフォワードプライマー１０ｐｍｏｌ、配列5'-CACGGATCCG
GTAGCAGCGGTAGAGTTG-3'(配列番号６５)を有するリバースプライマー１０ｐｍｏ
ｌ、１ＵＤＮＡポリメラーゼ(Stoffel fragment, Perkin Elmer)、およびヒト
ゲノムＤＮＡ(２ｎｇＤＮＡ／個体)２００ｎｇを含む全体積５０μｌを有する反
応物中で増幅した。当該鋳型を９４℃５分間変性させた。サーマルサイクリング
は、９４℃２０秒、５６℃３０秒、７２℃１分間の４５サイクルおよび７２℃３
分間の最終伸張を含むタッチダウンプログラムで続けた。粗ＰＣＲ産物をその後
のニッカーゼ反応に用いた。

【０２８９】非精製ＰＣＲ産物をニッカーゼ消化した。Ｔｒｉｓ−ＨＣｌ(１０ｍＭ)、ＫＣ
ｌ(１０ｍＭ、ｐＨ８．３)、酢酸マグネシウム(２５ｍＭ)、ＢＳＡ(１ｍｇ／ｍ
Ｌ)、および５ＵＣｖｉＮＹ２ＡまたはＣｖｉＮＹＳ１ニッカーゼ(Megabase
Research)を、全反応物体積２０μＬを有する増幅鋳型２５ｐｍｏｌに加えた。
次いで、当該反応混合物を３７℃５時間インキュベーションした。当該消化産物
を実施例５に記載するようにZipTip(Millipore, Bedford, MA)を用い精製した。
当該サンプルを、実施例４に記載するようにＭＡＬＤＩ−ＴＯＦ質量分析法で分
析した。また、このアッセイを用い、本明細書に記載のように、マルチプレック
シングし、標準的遺伝子型決定を行い得る。

【０２９０】ニッカーゼマススペクトルを単純化するため、２つの相補鎖は、捕捉プローブ
として一本鎖非消化ＰＣＲ産物を用いた消化の後、分離することができる。この
プローブ(以下の実施例８Ｃで示した調製物)を、２００ｍＭクエン酸ナトリウ
ムおよび１％ブロッキング剤(Boehringer Mannheim)を含むハイブリダイゼーシ
ョン緩衝液中のニッカーゼフラグメントにハイブリダイズさせることができる。
当該反応物を、thermal cycler(PTC-200 DNA engine, MJ Research, Waltham, M
A)を用い９５℃５分間加熱し、３０分間を超えて室温で冷却する。捕捉プローブ
ニッカーゼフラグメントをストレプトアビジン被覆磁性ビーズ１４０μｇ上に固
定化した。その後、当該ビーズを７０ｍＭクエン酸アンモニウムで３回洗浄す
る。捕捉一本鎖ニッカーゼフラグメントを、５０ｍＭ水酸化アンモニウム５μ
Ｌ中で８０℃５分間加熱することにより、溶出する。

【０２９１】Ｃ．捕捉プローブの調製捕捉プローブは、ＰＣＲ法を介し、ＧｅｎｅＡｍｐ１×ＰＣＲ緩衝液ＩＩ、
１０ｍＭＴｒｉｓ−ＨＣｌ、ｐＨ８．３、５０ｍＭＫＣｌ、２ｍＭＭｇＣｌ
_２、０．２ｍＭｄＮＴＰ混合物、各プライマー(フォワードプライマー5'-ACTGG
GCATGTGGAGACAG-3'(配列番号６６))１０ｐｍｏｌおよびビオチニル化リバースプ
ライマー bio5'-GCACTTTCTTGCCATGAG-3'(配列番号６７)、２ＵＡｍｐｌｉＴａ
ｑＧｏｌｄ、およびヒトゲノムＤＮＡ２００ｎｇを含む全体積５０μＬ中でヒ
トβ‐グロブリンを増幅することにより、調製する。当該鋳型は９４℃８分間で
変性させる。サーマルサイクリングは、９４℃２０秒、６４℃３０秒、７２℃１
分間の１１サイクルおよび７２℃５分間の最終伸張を含むタッチダウンプログラ
ムで続けた。当該アンプリコンは、UltraClean(商標) PCR clean-upキット(MO B
io Laboratories, Solano Beach, CA)を用い精製する。

【０２９２】実施例９マルチプレックスＩＩＳ型ＳＮＰアッセイＩＩＳ型アッセイを用い、既知ＳＮＰを有するヒト遺伝子配列を同定した。こ
のアッセイ中で使用したＩＩＳ型酵素は、標的ＤＮＡを二本鎖切断するフォーク
Ｉであった。当該アッセイは、増幅のステップおよびアンプリコンのフォークＩ
処理を含む。増幅ステップでは、フォークＩ認識配列がアンプリコンの５’およ
び３’末端に組込まれるため、設計遺伝子標的の各ＰＣＲ産物が１００塩基未満
となるように当該プライマーを設計した。そのため、フォークＩで切断されるフ
ラグメントは、目的のＳＮＰを含む中央フラグメントを含んだ。

【０２９３】既知ＳＮＰを有する１０のヒト遺伝子標的は、このアッセイにより分析された
。１０の遺伝子標的、および標的領域の増幅に用いるプライマーの配列を表５に
示す。１０の標的は、リポタンパク質リパーゼ、プロトロンビン、因子Ｖ、コレ
ステロールエステル転移タンパク質(ＣＥＴＰ)、因子ＶＩＩ、因子ＸＩＩＩ、Ｈ
ＬＡ−Ｈエキソン２、ＨＬＡ−Ｈエキソン４、メチレンテトラヒドロフォレート
レダクターゼ(ＭＴＨＲ)およびＰ５３エキソン４コドン７２であった。

【０２９４】１０の遺伝子配列の増幅は、５ＰＣＲ反応チューブ中にヒトゲノムＤＮＡ鋳型
２０ｎｇを有する単一の５０μＬ体積ＰＣＲ反応物中で行った。各反応バイアル
は、１×ＰＣＲ緩衝液(Qiagen)、２００μＭｄＮＴＰ、１Ｕ Hotstar Ｔａｑポ
リメラーゼ(Qiagen)、４ｍＭＭｇＣｌ_２、および各プライマー１０ｐｍｏｌを
含んでいた。5'TCAGTCACGACGTT3'(配列番号６８)の配列を有するＵＳ８、および
5'CGGATAACAATTTC3'(配列番号６９)の配列を有するＵＳ９を、それぞれフォワー
ドおよびリバースプライマーとして使用した。更に、当該プライマーは、フォー
クＩ認識部位がアンプリコンの５'および３'末端に組込まれるように、設計した
。サーマルサイクリングは、０．２ｍＬチューブまたは９６ウェルプレート中で
、MJ Research Thermal Cycler(算出温度)を用い、以下のサイクリングパラメー
ターで行った：９４℃５分間；４５サイクル：９４℃２０秒、５６℃２０秒、７
２℃６０秒；および７２℃３分間。

【０２９５】ＰＣＲ後、当該サンプルを、０．２ＵエキソヌクレアーゼＩ(Amersham Pharma
cia)およびＳアルカリホスファターゼ(Amersham Pharmacia)で処理し、組込まれ
ていないプライマーおよびｄＮＴＰを取り除いた。典型的に、０．２Ｕエキソヌ
クレアーゼＩおよびＳＡＰをＰＣＲサンプル５μＬに加えた。次いで、当該サン
プルを３７℃１５分間インキュベーションした。次いで、エキソヌクレアーゼＩ
およびＳＡＰを、８５℃までの温度で１５分間サンプルを加熱することにより、
不活性化した。フォークＩ消化は、２ＵフォークＩ(New England Biolab)をＰ
ＣＲサンプル５μＬに加えることにより、および３７℃３０分間インキュベーシ
ョンすることにより、行った。フォークＩ制限酵素部位は、アンプリコンの両サ
イドに位置するため、５'および３'カットオフフラグメントはＳＮＰを含む中央
フラグメントよりも大きい質量を有する。次いで、当該サンプルを陰イオン交換
により精製し、実施例４に記載のようにＭＡＬＤＩ−ＴＯＦ質量分析法により分
析した。このマルチプレックシング実験からの遺伝子フラグメントの質量を表６
に挙げる。これら遺伝子フラグメントはマススペクトルで分解し、それにより、
この遺伝子中の配列変化をマルチプレックシング分析し得る。表５マルチプレックシングＩＩＳ型アッセイの遺伝子

【表１０】

【表１１】表６ＩＩＳアッセイによる１０種のＳＮＰの分類分けのための中央フラグメントの質
量

【表１２】

【０２９６】実施例１０健康体データベースの分類分けのための親病歴パラメーターの典型的使用健康体データベースを用い、年齢と対立遺伝子、特にホモ接合遺伝子型との間
に強力な関係が見られることが判明した特定対立遺伝子(ＳＮＰ)と疾患状態とを
関連させることができる。当該方法は、年齢に依存する関連性の同定に用いられ
る同じ健康体データベースを用いることを含むが、分類は、両親が患っている通
常疾患(ドナーの家族性の病歴)に関するドナーにより提供される情報に基づく。
ドナーが両親の健康状態に関し得られる３つの可能性ある答えがある：全く影響
はない、一方の影響を受ける、または両方の影響を受ける。ドナーの両親が臨床
的疾患の表現型が見られるぐらいにまで加齢していなければならないため、疾患
に依存して、特定の最小年齢を超えるドナーのみを用いる。これらの各群の遺伝
子型頻度が決定され、互いに比較される。ドナーのマーカーが疾患と関連すれば
、ヘテロ接合遺伝子型の頻度は増大する。ホモ接合遺伝子型の頻度は、健康体集
団において表示不足（underrepresented）が有意であるため、増大しない。

【０２９７】実施例１１生物学的サンプルを同定する方法および装置詳細本発明に従い、生物学的サンプルを同定する方法および装置を提供する。ここ
で、図２４について言及すると、生物学的サンプルを同定する装置１０を開示す
る。生物学的サンプルを同定する装置１０は、一般的に、コンピューティング装
置２０に伝達するマススペクトロメーター１５を含む。好ましい実施態様では、
マススペクトロメーターは、Bruker-Franzen Analytik GmbHにより製造されたＭ
ＡＬＤＩ−ＴＯＦマススペクトロメーターであり得る；しかし、他のマススペク
トロメーターが置換され得ることが認識される。コンピューティング装置２０は
、好ましくは汎用コンピューティング装置である。しかし、コンピューティング
装置は、他に形成され得、例えば、マススペクトロメーターに組込まれ得るか、
または巨大なネットワークシステム中のコンピューターの一部であり得ることが
認識される。

【０２９８】生物学的サンプルを同定するための装置１０は、マススペクトロメーター１５
の受入エリア３１にサンプルプレート２９を送達するよう形成したロボットアー
ム２７を有するロボット２５を有する自動化同定システムとして操作し得る。そ
の形式では、同定されるサンプルをプレート２９に置き、それは自動的にマスス
ペクトロメーター１５中へと受け取られる。次いで、生物学的サンプルをマスス
ペクトロメーター中で処理し、生物学的サンプル中でＤＮＡフラグメントの質量
を示すデータを得る。このデータをコンピューティング装置２０に直接送るか、
またはマススペクトロメーター内で行われるプレプロセッシングまたはフィルタ
リングをし得る。好ましい実施態様では、マススペクトロメーター１５は、未プ
ロセッシングおよび未フィルタリングの質量分析法データをコンピューティング
装置２０に伝達する。しかし、コンピューティング装置での分析を、マススペク
トロメーター内で行われるプレプロセッシングまたはフィルタリングに対応する
ように調節し得ることが認識される。

【０２９９】ここで、図２５について言及すると、生物学的サンプルを同定するための一般
的方法３５を示す。方法３５では、データは、ブロック４０中の試験装置からコ
ンピューティング装置中へ受け取られる。好ましくは、当該データは、未処理、
未プロセスおよび未フィルターの形態で受け取られるが、他に、適用される幾つ
かの形態のフィルタリングまたはプロセッシングであり得る。好ましい実施対応
の試験装置は、上記のようなマススペクトロメーターである。しかし、他の試験
装置がマススペクトロメーターと置換されることが認識される。

【０３００】試験装置により生ずるデータ、および特にマススペクトロメーターは、生物学
的サンプルの同定を示す情報を含む。より特に、当該データは、生物学的サンプ
ルのＤＮＡ組成物を示す。典型的に、ＤＮＡ増幅技術から得られたＤＮＡサンプ
ルから集められた質量分析法データは、例えば、典型的なタンパク質サンプル由
来のものよりもノイズが多い。これは、タンパク質サンプルがより容易により多
量に調製されること、およびタンパク質サンプルはＤＮＡサンプルと比較してよ
り容易にイオン化することに一部起因する。従って、通常のマススペクトロメー
ターデータ分析技術は、一般的に、生物学的サンプルのＤＮＡ分析に効果的では
ない。ＤＮＡ組成物データがより容易に識別できるように分析能を改善するため
、好ましい実施態様は、ＤＮＡ質量分析法データを分析するためのウェーブレッ
ト技術を用いる。ウェーブレットは、シグナルプロセッシング、数値解析、およ
び数学的モデリングのための分析ツールである。ウェーブレット技術は、データ
セットに適用される基本的な拡張機能を提供する。ウェーブレット分解を用い、
当該データセットを同時に時間および頻度の範囲内で分析し得る。ウェーブレッ
ト変換は、ＭＡＬＤＩ−ＴＯＦＤＮＡデータのような複雑な時間(質量)および
頻度の領域を示すデータの分析における選択の技術である。本明細書で述べるよ
うなウェーブレット変換は、通常のフーリエ分析技術との比較として優れたノイ
ズ除去性を有する。ウェーブレット変換は、ＤＮＡサンプルの固有のノイズＭＡ
ＬＤＩ−ＴＯＦスペクトルのインタープリティングに特に効果的であることが証
明された。ウェーブレットの使用では、“小さな波”または“スケーリング関数
”を用いステージにデータセットを変換し、各ステージはデータセット中の頻度
コンポーネントを示す。ウェーブレット変換を用い、質量分析法データをプロセ
スし、フィルターし、および生物学的サンプルのＤＮＡ組成物の同定に有用な有
意な識別で分析し得る。

【０３０１】再び、図２５について言及すると、ブロック４０で受け取るデータは、ブロッ
ク４５でノイズ除去される。次いで、ノイズが除去されたデータは、ブロック５
０で適用されるベースライン補正を有する。ベースライン補正は、試験装置、特
にマススペクトロメーター装置から来るデータとして一般的に必要であり、一般
的に、指数的減衰手法で配列されるデータを有する。この一般的な指数的減衰配
列は、生物学的サンプルの組成物には起因しないが、試験装置の物理的性質およ
び特性の結果であり、他の化学物質には、ＤＮＡサンプル調製物が含まれる。従
って、ベースライン補正は、実質的にデータを校正し、試験システムに帰するデ
ータ、およびサンプル調製物特性のコンポーネントを取り除く。

【０３０２】ブロック４５でノイズ除去し、ブロック５０でベースライン補正した後、シグ
ナルは残存し、生物学的サンプルの組成物を一般的に示す。しかし、生物学的サ
ンプルのＤＮＡ組成物の分析に必要とされる通常以上の識別のため、当該組成物
は、ノイズ除去化および校正化シグナルからは容易には明白とはならない。例え
ば、シグナルはピーク領域を含み得るが、これらの“推定”ピークが実際にＤＮ
Ａ組成物を表しているのかどうか、または推定ピークが合成的もしくは化学的な
異常型の結果であるかどうか、まだ明らかとはならない。更に、生物学的サンプ
ルの組成物の任意のコール(call)は、臨床的または治療的目的としては受け入れ
がたいエラーの可能性を有し得る。そのような危険な状態では、サンプルの任意
のコールまたは同定が正確であるという、高い程度の確実性が必要である。その
ため、更なるデータプロセッシングおよびインタープリテーションが、サンプル
を正確におよび確実に同定する前に必要となる。

【０３０３】各質量分析法試験から得られたデータの量は、典型的には数千のデータポイン
トであり、自動システムがセットされて時間あたり数百または更には数千の試験
を行うため、得られた質量分析法データの量は膨大となる。質量分析法データの
効率的伝達および保存を促進するため、ブロック５５は、ノイズ除去化およびベ
ースライン補正データが圧縮されることを示す。

【０３０４】好ましい実施態様では、生物学的サンプルを選択し、制限された範囲の可能な
組成物のみを有するよう処理をする。従って、そのため、組成物を示すピークが
どこに位置するかが、存在するならば、判る。これら予想されるピークの位置を
知る利点があるため、ブロック６０において、方法３５は、プロセスしたシグナ
ルのおける推定ピークを予想ピークの位置にマッチさせる。その方法では、生物
学的サンプルの組成物を示す実際のピークであるデータ内の各推定ピークの確率
を決定することができる。各ピークの確率をブロック６０で一旦決定すると、次
いで、ブロック６５において、方法３５は、生物学的サンプルの組成物を統計学
的に決定し、遺伝子型をコールする程度に確実性が高いならば決定する。

【０３０５】再びブロック４０について言及すると、データは、試験装置、好ましくはマス
スペクトロメーターから受け取られる。特定の説明では、図２６は、マススペク
トロメーターからのデータの例を示す。当該マススペクトロメーターデータ７０
は、ｘ軸７１およびｙ軸７２に沿って分布するデータポイントを一般に含んでい
る。ｘ軸７１は、決定された粒子の質量を示し、その一方、ｙ軸７２は、当該粒
子の数値濃度を示す。図２６に示すように、質量分析法データ７０は、ｘ軸７１
のより重い端(heavier end)７４のデータの方向へ一般的に指数的に減衰するｘ
軸７３の左端のデータに伴って、一般に指数的に減衰する。しかし、当該データ
の一般的な指数的表示は、生物学的サンプルの組成物を示さないが、合成エラー
および特性をより反映させる。更に、上記および図２６に示すように、相当なノ
イズが質量分析法ＤＮＡデータ７０に存在する。

【０３０６】再びブロック４５について言及すると、ブロック４０で受けた未処理データを
ノイズ除去化する場合、ノイズ除去化プロセスをより詳細に記載する。図２５に
示したように、ノイズ除去化プロセスは、一般に、１)未処理データにおいてウ
ェーブレット変換を行い、未処理データをウェーブレットステージ係数に分解す
ること、２)ウェーブレット係数の最も高いステージからノイズプロファイルを
作成すること、および３)ウェーブレット変換における他のステージにスケール
化ノイズプロファイルを適用することを必要とする。ノイズ除去プロセスの各ス
テップを更に以下に記載する。

【０３０７】ここで図２７について言及すると、未処理質量分析法データのウェーブレット
変換を一般的にダイアグラム化する。ウェーブレット変換技術を用い、その後、
質量分析法データ７０をステージに変換する。各ステージステップでは、当該デ
ータをＨｉステージおよびＬｏｗステージにおいて示し、Ｌｏｗステージは次の
その後のステージへの入力として作用する。例えば、質量分析法データ７０を、
ステージ０ハイデータ８２およびステージ０ローデータ８３に変換する。次いで
、ステージ０ローデータ８３を次のレベルの変換への入力として用い、ステージ
１ハイデータ８４およびステージ１ローデータ８５を得る。同様の方法で、ステ
ージ１ローデータ８５を、ステージ２ハイデータ８６およびステージ２ローデー
タ８７へ変換する入力として使用する。変換は、より有用な情報が更なるウェー
ブレット変換により得ることができるまで、続ける。例えば、好ましい実施態様
では、２４ポイントウェーブレットを用いる。より特に、Daubechies２４として
通常言及されるウェーブレットを用い、未処理データを分解する。しかし、他の
ウェーブレットがウェーブレット変換に使用できることが認識される。ウェーブ
レット変換の各ステージは前のステージのデータポイントの半分となるため、ウ
ェーブレット変換は、ステージｎローデータ８９が約５０ポイントとなるまで続
けることができる。従って、ステージｎハイ８８は、約１００データポイントを
含む。好ましいウェーブレットは２４ポイント長であるため、小さなデータまた
は情報が、約５０ポイントのデータセットにおいてウェーブレット変換続けるこ
とにより得ることができる。

【０３０８】図２８は、ステージ０ハイデータ９５の例を示す。ステージ０ハイデータ９５
は質量分析法データにおいて最も高い頻度を一般的に示すため、ステージ０ハイ
データ９５は質量分析法データにおける高頻度ノイズの量に密接に関連する。図
２９において、指数フィッティング式(exponential fitting formula)をステー
ジ０ハイデータ９５に適用し、ステージ０ノイズプロファイル９７を得る。特に
、指数フィッティング式は、式Ａ_０＋Ａ_１ＥＸＰ(−Ａ_２ｍ)である。他の指数フ
ィッティング式または他の型のカーブフィットも用い得ることが認識される。

【０３０９】ここで図３０ついて言及すると、他のＨｉステージのノイズプロファイルを決
定する。各ステージの後のデータポイントは、各ステージのノイズのレベルを示
すようであるため、各ステージの後のデータポイントのみを用い、特定ステージ
のノイズコンテントを示す標準偏差図を得る。より特に、各残りステージのノイ
ズプロファイルの作成において、各ステージの最後５％のデータポイントのみを
分析し、標準偏差数を決定する。他に多くのポイントまたは他の方法を用い、そ
の標準偏差図を得ることが認識される。

【０３１０】各ステージの標準偏差数をステージ０ノイズプロファイル(指数曲線)９７と共
に用い、各ステージのスケール化ノイズプロファイルを得る。例えば、図３０は
、ステージ１ハイデータ９８がエリア９９により示される最後５％のデータポイ
ントと共にステージ１ハイデータ１０３を有することが示される。エリア９９の
ポイントを評価し、ステージ１ハイデータ１０３のノイズコンテントを示す標準
偏差数を決定する。次いで、標準偏差数をステージ０ノイズプロファイル９７と
共に用いステージ１ノイズプロファイルを得る。

【０３１１】同様の方法で、ステージ２ハイ１００は、エリア１０１により示される最後５
％のポイントと共にステージ２ハイデータ１０４を有する。次いで、エリア１０
１のデータポイントを用い標準偏差数を算出し、次いで、それを用い、ステージ
０ノイズプロファイル９７をスケール化し、ステージ２データのノイズプロファ
イルを得る。この同じプロセスを、ステージｎハイ１０５により示されるように
各ステージハイデータについて続ける。ステージｎハイ１０５に関し、ステージ
ｎハイデータ１０８は、エリア１０６により示される最後５％のデータポイント
を有する。エリア１０６のデータポイントを用い、ステージｎの標準偏差数を決
定する。次いで、ステージｎ標準偏差数をステージ０ノイズプロファイル９７と
共に用い、ステージｎのノイズプロファイルを得る。従って、各ハイデータステ
ージはノイズプロファイルを有する。

【０３１２】図３１は、どのようにノイズプロファイルを各ステージのデータに適用するか
を示す。一般にノイズプロファイルを用い、各ステージのデータに適用するスレ
ショルド(threshold)を得る。ノイズプロファイルを既にスケール化し、各ステ
ージのノイズコンテントを調製するため、スレショルドの算出により、除かれる
ノイズの量を調節する調製が可能となる。スレショルド未満のウェーブレット係
数は無視でき、その一方、上記のようにスレショルドは維持される。従って、残
りデータは、除かれるノイズコンテントの実質的な一部を有する。

【０３１３】ウェーブレット変換の特性のため、ステージ０および１のような低いステージ
は、ステージ２またはステージｎのような後のステージよりもよりノイズコンテ
ントを有している。実際、ステージｎローデータは、殆どノイズを有してないよ
うである。そのため、好ましい実施態様では、ノイズプロファイルを、より低い
ステージではより積極的に適用し、より後のステージではあまり積極的に適用し
ない。例えば、図３１は、ステージ０ハイスレショルドがステージ０ノイズプロ
ファイルを４つの因子に掛けることにより決定されることを示す。その方法で、
ステージ０ハイデータ９５内のデータポイントの有意な数はスレショルド未満と
なり、それゆえ、除かれる。ステージ１ハイスレショルド１１２は、ステージ１
ハイデータのノイズプロファイルの２倍のセットであり、ステージ２ハイスレシ
ョルド１１４は、ステージ２ハイのノイズプロファイルと等しいセットである。
そのため、このゲノム経過の後、ステージｎハイスレショルド１１６は、(１／
２^ｎ−２)に等しい因子による各ステージｎハイのノイズプロファイルのスケー
リングにより決定される。他の因子が各ステージのノイズプロファイルのスケー
ルに適用されることが認識される。例えば、ノイズプロファイルを多かれ少なか
れ積極的にスケールし、特異的組織特性またはサンプル組成物に適応させる。上
記したように、ステージｎローデータ１１８は僅かにノイズコンテントを有する
か全く有していないと想定すると、ステージｎローデータは、適用されるノイズ
プロファイルを有してはいない。スケール化ノイズプロファイルを各ハイデータ
ステージに適用した後、質量分析法データ７０はノイズ除去され、容易に更にプ
ロセッシングされる。ノイズ除去化シグナルのウェーブレット変換は、図３１に
示すように希薄データセット１２０を生ずる。

【０３１４】図２５について再び言及すると、ブロック４０で受ける質量分析法データをブ
ロック４５でノイズ除去し、ベースライン補正のためブロック５０に移す。ベー
スライン補正を行う前に、ウェーブレット変換手順により導入されるアーテファ
クト(artifact)を好ましくは取り除く。ウェーブレット変換は、ウェーブレット
のポイントを開始点として用いることに僅かに依存する変化を生ずる。例えば、
好ましい実施態様は、２４ポイントのDaubechies２４ウェーブレットを用いる。
ウェーブレットの０ポイントの変換の開始により、僅かに異なる結果が、ウェー
ブレットのポイント１または２で開始する場合よりも得られる。そのため、ノイ
ズ除去データは、各利用可能な開始点を用い変換し、その結果を平均し最終的な
ノイズ除去化およびシフト化シグナルを決定する。例えば、図３３は、ウェーブ
レット係数を２４種の時間に適用し、次いで、その結果を平均し最終データセッ
トを得る。他の技術を用いウェーブレットシフティングにより導入される僅かな
エラーを適応させる。

【０３１５】式１２５は、図３３で一般的に示される。シグナルを、一旦、ノイズ除去およ
びシフトすると、ノイズ除去化およびシフト化シグナル１３０を図５８に示され
るように生ずる。図３４は、ノイズ除去化およびシフト化シグナル１３０からの
ウェーブレット係数１３５データセットの例を示す。

【０３１６】図３６は、推定ピークエリア１４５、１４７および１４９は、ノイズ除去化お
よびシフト化シグナル１５０に位置することを示している。推定ピークエリアを
、シグナル１５０に沿って移動平均すること、および移動平均に関連するスレシ
ョルドを超えるシグナル１５０のセクションを同定することにより組織的に同定
される。他の方法を用い、シグナル１５０における推定ピークエリアを同定し得
る。

【０３１７】推定ピークエリア１４５、１４７および１４９をシグナル１５０から取り除き
、図３７に示すようにピークフリーシグナル１５５を作成する。ピークフリーシ
グナル１５５を更に分析し、残存最小値１５７を同定し、残存最小値１５７を接
続し、ピークフリーシグナル１５５を得る。

【０３１８】図３８は、ピークフリーシグナル１５５を用い図３９に示すようにベースライ
ン１７０を得るプロセスを示す。ブロック１６２に示すように、ウェーブレット
変換をピークフリーシグナル１５５で行う。ウェーブレット変換からの全ステー
ジを、ｎＬｏｗステージを除くブロック１６４で排除する。ｎＬｏｗステージは
、一般的に、ピークフリーシグナル１５５の最も低い頻度コンポーネントを示し
、それにより、一般的に、システム指数特性を示す。ブロック１６６は、シグナ
ルはｎロー係数から再構成され、ベースラインシグナル１７０をブロック１６８
で得る。

【０３１９】図３９は、校正ベースライン１７０に隣接して位置するノイズ除去化およびシ
フト化データシグナル１７２を示す。ベースライン補正１７０は、ノイズ除去化
およびシフト化シグナル１７２から差し引かれ、図４０に示すように適用された
ベースライン補正を有するシグナル１７５を得る。そのノイズ除去化、シフト化
および校正化シグナルは、殆どの同定目的に重要であるが、シグナル１７５中の
推定ピークは、生物学的サンプルのＤＮＡ組成物をコールする有意な正確性また
は確実性を伴って同定できない。

【０３２０】再び図２５について言及すると、ベースライン補正５０のデータをブロック５
５で圧縮し、好ましい実施態様に用いる圧縮技術を図４１に詳述する。図４１で
は、ベースライン補正化データ内のデータは、連関データ値１８４を有するｘ軸
ポイント１８３と共にアレイフォーマット１８２に存在する。ｘ軸は、ゼロでは
ないウェーブレット係数による指標となり、連関する値は、ウェーブレット係数
の値である。表１８２の解説データ例では、最大値１８４は、１０００となるこ
とを示す。質量分析法データに特に利点の圧縮技術を示すが、他の圧縮技術も使
用し得ることが認識される。好ましくないが、当該データはまた、圧縮なしに保
存され得る。

【０３２１】好ましい実施態様によるデータ圧縮において、中間フォーマット１８６を得る
。中間フォーマット１８６は、一般的に、自然数部分１８８および少数部分１９
０を有する実数を含む。自然数部分は、ｘ軸ポイント１８３であり、その一方、
少数部分は、最大値で割られる値データ１８４である。例えば、データ１８２で
は、データ値“２５”は、ｘ軸ポイント“１００”で示される。このデータポイ
ントの中間値は“１００．０２５”となり得る。

【０３２２】中間圧縮データ１８６から、最終圧縮データ１９５を得る。中間データファイ
ルの最初のポイントは、圧縮データの開始点となる。その後、圧縮データ１９５
の各データポイントは、以下のように算出される：自然数部分(少数点の左)は、
現在の自然数と過去の自然数との間の違いにより置換えられる。残り部分(小数
点の右)は未処理のままである。例えば、圧縮データ１９５の開始点は、“１０
０．０２５”である中間データポイントと同じであると示されている。最初の中
間データポイント“１００．０２５”と第二の中間データポイント“１５０．２
２０”との間は、“５０．２２０”である。そのため、“５０．２２０”は圧縮
データ１９５の第二のポイントとなる。同様の方法で、第二の中間ポイントは、
“１５０．２２０”であり、第三の中間データポイントは“５００．０００１”
である。そのため、第三の圧縮データは、“３５０．０００”となる。決定され
た圧縮データポイントの算出は、データポイントの全アレイが実数の単一アレイ
に変換されるまで続ける。

【０３２３】図４２は、一般的に、質量分析法データを圧縮する方法を記載し、それは、ブ
ロック２０１のデータファイルがブロック２０２で係数のアレイとして表される
ことを示す。当該データ開始点および最大は、ブロック２０３に示すように決定
され、中間実数は、上記のようにブロック２０４で算出される。得られた中間デ
ータポイントを用い、圧縮データをブロック２０５で得る。記載された圧縮方法
は、質量分析法装置からのプロセス化データセットのような圧縮データセットに
高い利点および効果がある。当該方法は、多数使用し、ｘ軸データにおいて部分
的なギャップを有するようにプロセスする、質量分析法データのようなデータに
特に有用である。従って、プロセス化質量分析法データのｘ−ｙデータアレイは
、１０×またはそれを超える効果的な圧縮率で保存され得る。圧縮技術が質量分
析法データに適用されるが、当該方法は、他のデータセットに有利に適用される
ことが認識される。

【０３２４】再び図２５について言及すると、ピークの高さは、ブロック６０で決定される
。ピークの高さを決定する最初のステップを図４３に示し、この場合、シグナル
２１０は、左または右にシフトし、それは予測ピークの位置に相当する。質量分
析法データを生ずる前に生物学的サンプルにおいて可能性ある組成物のセットが
判るため、予測ピークの可能な位置は既に判る。これらのあり得るピークを、予
測ピーク２１２、２１４および２１６のような予測ピークとして称する。校正ま
たは試験装置データ中の他のエラーのため、全シグナルは、実際の位置から左ま
たは右にシフトし得、そのため、推定ピーク２１８、２２２および２２４のよう
なシグナルに位置する推定ピークを予測ピーク２１２、２１４および２１６とそ
れぞれ比較し得る。次いで、全シグナルを、推定ピークが予測ピークにより近づ
いて位置するようにシフトする。

【０３２５】推定ピークが一旦シフトし、予測ピークとマッチすると、最も強い推定ピーク
が図４４で同定される。好ましい実施態様では、最も強いピークを、ピークの全
体の高さおよびピークの真下のエリアの分析の組合せとして算出する。例えば、
幅の広いピークでなく適度な高さのピークは、極端に幅が狭く非常に高いよりも
強力となり得る。推定ピーク２２５のような同定される最も強力な推定ピークを
用い、ガウス２２８カーブをピーク２２５にフィットさせる。一旦、ガウスをフ
ィットさせると、ガウスの幅(Ｗ)を測定し、将来的に算出のためのピーク幅とし
て使用する。

【０３２６】一般に上記のような取り組みとして、ノイズ除去化、シフト化、およびベース
ライン補正化シグナルは、生物学的サンプルのＤＮＡ組成物を確実にコールする
ほどには充分にはプロセスされない。例えば、ベースラインは、一般に取り除か
れるが、なお、現在の残留ベースライン効果が存在する。そのため、これら残留
ベースライン効果を取り除き、同定の正確性および確実性を増大させる。

【０３２７】残留ベースライン効果を取り除くため、図４５は、推定ピーク２１８、２２２
および２２４をベースライン補正シグナルから取り除くことを示す。当該ピーク
を、推定ピーク２１８、２２２および２２４、それぞれのセンターライン２３０
、２３２、および２３４を同定することにより、および同定センターラインの左
および右にエリアを取り除くことにより、取り除く。各推定ピークの場合、ガウ
スの２倍の幅(Ｗ)に等しいエリアをセンターラインの左から取り除き、その一方
、５０ダルトンに等しいエリアをセンターラインの右から取り除く。５０ダルト
ンを示すエリアを適合させ、実際のピークに付随し得る塩付加物の効果を充分に
適当に取り除くことが発見された。その付加物は、実際のピークの右に現れ、マ
ススペクトルの取得を含む化学からの自然効果を有する。５０ダルトン緩衝液を
選択するけれども、他の範囲または方法が使用され付加物の効果を減少させるか
取り除き得ることが認識される。

【０３２８】当該ピークが取り除かれ、シグナル２４５の作成に関連する最小２４７により
図４６で示されるように位置する最小２４７が残存する。四次多項式をシグナル
２４５に適用し、図４７に示すように残留ベースライン２５０を得る。残留ベー
スライン２５０を、シグナル２２５から差し引き、図４８に示すように最終シグ
ナル２５５を得る。残留ベースラインは、シグナル２４５への四次フィットの結
果であるが、他の技術を用い残留ベースラインをスムーズにするか、フィットさ
せ得る。

【０３２９】図４９に示すようにピークの高さを決定するため、ガウス２６６、２６８およ
び２７０のようなガウスを、それぞれピーク２６０、２６２、および２６４のよ
うな各ピークにフィットさせる。従って、ガウスの高さは、高さ２７２、２７４
、および２７６として決定する。一旦、各ガウスピークの高さを決定すると、次
いで、生物学的化合物３５を同定する方法は、図２５に示すように遺伝子型決定
フェーズ６５へと移ることができる。

【０３３０】各推定ピークが実際のピークであるという確実性の現れ(indication)は、各推
定ピークについてノイズ対シグナル比率(signal to noise ratio)を算出するこ
とにより認識し得る。従って、ノイズに対する強力なシグナルの比を有する推定
ピークは、ノイズに対するより低いシグナルの比を有する推定ピークよりもより
実際のピークとなるようである。上記および図５０に示したように、高さ２７２
、２７４、および２７６のような各ピークの高さを各ピークについて決定し、こ
の場合、高さが各ピークのシグナル強度インディケーターとなる。ノイズプロフ
ァイル９７のようなノイズプロファイルを、同定ピークを通してノイズプロファ
イル２８０に外挿する。各ピークのセンターラインにおいて、ノイズ値をノイズ
値２８２、２８３、および２８４のように決定する。得られるシグナル値および
ノイズ値を用い、ノイズ対シグナル比率を各ピークで算出することができる。例
えば、図５０の最初のピークについてのノイズ対シグナル比率は、ノイズ値２８
２で割ったシグナル値２７２として算出し、同様の方法で、図５０の中央ピーク
のノイズ対シグナル比率は、ノイズ値２８３で割ったシグナル２７４として決定
し得る。

【０３３１】ノイズ対シグナル比率は、実際ピークの存在の有用な一般的なインディケータ
ーであるが、更なるプロセッシングにより、サンプルが同定され得る確実性を増
大することが発見された。例えば、好ましい実施態様において各ピークに関する
ノイズ対シグナル比率は、好ましくは、ガウスと各推定ピークとの間でのフィッ
トの長所により調節される。それは、通常の分布に一般的に従う方法でサンプル
物質を検出するマススペクトロメーターの特性である。従って、少ない通常分布
を有するシグナルよりも、よりよい確実性が、ガウス形を有する推定シグナルを
付随する。非ガウス形を有することから生ずるエラーを“残留エラー”と称する
。

【０３３２】図５１について言及すると、残留エラーは、データシグナルにおけるガウス２
９３と推定ピーク２９０との間で二乗平均を算出することにより、算出する。当
該算出は、ガウスのセンターラインの何れかの側の１つの幅内のデータで行う。
残留エラーは、：として算出される。この場合、Ｇはガウスシグナル値であり、
Ｒは推定ピーク値であり、そしてＮは−Ｗから＋Ｗまでのポイントの数である。
算出残留エラーを用い、下記のような、調節されたノイズ対シグナル比率(adjus
ted signal to noise ratio)を得る。

【０３３３】調節されたシグナルノイズ比率は、式

【化９】を用いる各推定ピークについて算出する。この場合、Ｓ／Ｎはノイズ対シグナル
比率であり、Ｒは上記で決定した残留エラーである。好ましい実施態様で、各ピ
ークの残留エラーを用いる調節されたノイズ対シグナル比率を算出するが、他の
技術を用い、ガウスと実際のシグナルとの間でのフィットの長所が説明されるこ
とが認識される。

【０３３４】図５２について言及すると、推定ピークが実際のピークとなる確率を決定する
。ピークの確率の決定において、調節されたノイズ対シグナル比率がｘ軸であり
、確率がｙ軸である、確率プロファイル３００を得る。確率は、確率０％と、１
として示される確率１００％との範囲にあることが必要である。一般的に、調節
されたノイズ対シグナル比率が高くなればなるほど、推定ピークが実際のピーク
である確実性が高くなる。

【０３３５】調節されたノイズ対シグナル比率の幾つかの標的値において、確率が１００％
であるとは、推定ピークが実際のピークであり、確実に生物学的サンプルのＤＮ
Ａ組成物同定に用い得ることであると判る。しかし、確率が１００％であるとみ
なせる場合、調節されたノイズ対シグナル比率の標的値は、適用特異的基準に従
うセットである可変パラメーターとなる。例えば、標的のノイズ対シグナル比率
は、試行実験、サンプル特性およびシステム全体の許容可能エラー耐性に応じて
、調節される。より特異的に、エラーを許容できない保存アプローチを必要とす
る状態では、標的の調節されたノイズ対シグナル比率がセットされ得、例えば実
施例１０、より高くなり得る。従って、１００％確率が、調節されたノイズ対シ
グナル比率が１０またはそれを超えないならば、ピークに割り当てられない。

【０３３６】他の状況では、サンプルデータが明白であるか、またはエラーの危険性を減少
し得るため、より積極的なアプローチを取り得る。その状況で、当該システムを
セットすると、５またはそれ以上の標的のノイズ対シグナル比率が１００％の確
率とみなされ得る。もちろん、エラーの極度の危険性がみなされるとき、中間の
ノイズ対シグナル比率標的図を、７のように選択する。標的の調節されたノイズ
対シグナル比率を、一旦当該方法にセットすると、次いで、任意の調節されたノ
イズ対シグナル比率に関し、確率により、推定ピークが実際のピークであると決
定され得る。

【０３３７】同定試験、特にＤＮＡ増幅により調製されるサンプルの質量分析法試験の実行
を含む化学により、最も高いピークのシグナル強度と二番目(または三番目など)
に高いピークのシグナル強度の間の対立遺伝子比率は、予想される比率内に含ま
れる。対立遺伝子比率が通常のガイドラインの外側に含まれるならば、好ましい
実施態様は、当該確率に対し対立遺伝子比のペナルティーを強要することとなる
。例えば、図５３は対立遺伝子ペナルティー３１５を示し、それは、最も高いピ
ークのシグナル強度で割った二番目に高いピークのシグナル強度の間の割合であ
るｘ軸を有する。ｙ軸３１９は、決定された対立遺伝子比に依存した０から１の
間のペナルティーとみなせる。好ましい実施態様では、３０％を超える対立遺伝
子比率が予測範囲内に含まれ、それにより、ペナルティーは適用されないとみな
せる。１０％と３０％との間の比において、ペナルティーは、１０％未満の対立
遺伝子比率において二番目に高いピークが現実でないとみなせるまで、直線的に
増大する。１０％と３０％との間の対立遺伝子比率の場合、対立遺伝子ペナルテ
ィーチャート３１５を用いペナルティー３１９を決定し、図５２で決定したピー
ク確率によりマルチプレックシングし、最終ピークの確率を決定する。好ましい
実施態様を、対立遺伝子比率ペナルティーに組込み、可能な化学エラーを考慮す
るが、他の技術を使用し得ることが認識される。同様の処置を他のピークに適用
する。

【０３３８】決定される各ピークのピーク確率を用い、種々組成物コンポーネントの統計学
的確率を決定し得る。実施例のように、２つのピーク、ピークＧ、ピークＣおよ
びＧＧ、ＣＣおよびＧＣの組合せのそれぞれ３つの可能な組合せの確率を決定す
るためである。図５４は、最もあり得るピーク３２５を測定すると、最終ピーク
確率９０％を有していたことを示す。ピーク３２５は、生物学的サンプル中にＧ
コンポーネントを示すように位置する。従って、Ｇが生物学的サンプル中に存在
する確率９０％が維持され得る。図５４に示す例においても、二番目に高い確率
はピーク３３０であり、２０％のピーク確率を有する。ピーク３３０はＣ組成物
を付随する位置にある。従って、Ｃが生物学的サンプル中に存在する確率２０％
が維持され得る。

【０３３９】開始点としてＧ存在の確率(９０％)およびＣ存在の確率(２０％)により、Ｇお
よびＣ存在の組合せの確率を算出し得る。例えば、図５４は、ＧＧ存在の確率３
２９が７２％として算出されることを示す。これは、ＧＧの確率が、Ｃが存在し
ない確率(１００％−２０％)を掛けたＧ存在の確率(９０％)に等しくなると、算
出される。Ｇ存在の確率が９０％であり、Ｃが存在しない確率が８０％ならば、
ＧＧの確率は７２％である。

【０３４０】同様の方法で、ＣＣが存在する確率は、Ｇが存在しない確率(１００％−９０
％)を掛けたＣ存在の確率(２０％)に等しくなる。図５４に示すように、Ｃ存在
の確率が２０％である一方、Ｇが存在しない確率は１０％であり、そのため、Ｃ
Ｃの確率は２％のみである。最終的に、ＧＣ存在の確率は、Ｃ存在の確率(２０
％)を掛けたＧ存在の確率(９０％)に等しくなる。Ｇ存在の確率が９０％であり
、Ｃ存在の確率が２０％であるならば、ＧＣ存在の確率は１８％である。略式の
形式では、次いで、生物学的サンプルの組成物の確率は、ＧＧの確率：７２％ＧＣの確率：１８％、およびＣＣの確率：２％である。

【０３４１】可能性ある組合せのそれぞれの確率を一旦決定すると、図５５は、遺伝子型を
コールする重要な確実性が存在するかどうかの決定に使用される。図５５は、最
も高い組合せ確率と二番目に高い組合せ確率との比率であるｘ軸３３７を有する
コールチャート３３５を示す。ｙ軸３３９は、当該比率が、遺伝子型のコールを
正しいとするほどに充分に高いかどうかを単に示す。当該比率の値はＭ３４０で
示し得る。Ｍ値は、試行データ、サンプル組成物およびエラー許容能に依存する
セットである。例えば、Ｍ値は、値４のように比較的高いセットとなり得、その
ため、最も高い確率は、確実性により遺伝子型のコールを確立する前に二番目に
高い確率よりも少なくとも約４倍大きくなければならない。しかし、特定レベル
のエラーが許容されるならば、Ｍ値は３のようなより積極的な値のセットであり
得、そのため、最も高い確率と二番目に高い確率との間の比率は、３のみの比ま
たはそれ以上となることが必要となる。もちろん、適度の危険性を許容できると
き、適度の値がＭに関し選択され得る。ＧＧの確率が７２％であり、ＧＣの確率
が１８％である図５４の例を用い、７２％と１８％との間の比率は、４．０であ
り、そのため、Ｍのセットは３、３．５、または４の何れかとなり、そのシステ
ムはＧＧとして遺伝子型をコールし得る。好ましい実施態様が、遺伝子型が確実
にコールするかどうかを決定する２つの最も高いピーク確率間の比を用いるが、
他の方法が置換され得ることが認識される。上記技術が、確率の算出および２を
超えるピークの組合せを含む遺伝子型(またはより一般的なＤＮＡパターン)の決
定に用いられ得る。

【０３４２】ここで図５６について言及すると、フローチャートを示しており、上記の遺伝
子型の統計学的コールのプロセスを一般的に定義している。図５６では、ブロッ
ク４０２は、各ピークの高さを決定し、ブロック４０４におけるノイズプロファ
イルが各ピークについて外挿されることを示す。当該シグナルを、ブロック４０
６の各ピークの高さから決定し、各ピークのノイズを、ブロック４０８のノイズ
プロファイルを用い決定する。ブロック４１０では、ノイズ対シグナル比率を各
ピークについて算出する。非ガウスピーク形を説明するため、残留エラーをブロ
ック４１２で決定し、調節されたノイズ対シグナル比率をブロック４０４で算出
する。ブロック４１６は、確率プロファイルを作成すること、この場合、存在す
る各ピークの確率がブロック４１８に見られることを示す。対立遺伝子ペナルテ
ィーをブロック４２０に適用し得、この場合、対立遺伝子ペナルティーを、ブロ
ック４４２の調節されたピーク確率に適用する。コンポーネントの各組み合わせ
の確率をブロック４２４で算出し、この場合、２つの最も高い確率の間の比をブ
ロック４２６で決定する。次いで、確率の比率がスレショルド値を超えるならば
、次いで、遺伝子型をブロック４２８でコールする。

【０３４３】本発明の他の実施態様では、コンピューティング装置２０(図２４)は、推定Ｓ
ＮＰを含むデータピークを同定することにより“標準”遺伝子型決定をサポート
する。例えば、標準遺伝子型決定を用い、この場合、サンプルについての情報が
充分に知られておらず、予想ピークの位置を決定し、それに対し、上記のような
対立遺伝子ペナルティーが確実性をもって算出される。これにより、標的ＤＮＡ
分子をフラグメント化する任意のアッセイにより生ずるデータから推定ＳＮＰが
含まれるピークの同定に関しコンピューティング装置を用い得る。その標準遺伝
子型決定の場合、データスペクトル中の他のピークの典型的エリアから有意に誘
導されるデータ曲線の下のエリアに付随するピークが同定され、その相当する質
量(ｘ軸に沿った位置)を決定する。

【０３４４】より特に、データ中の他のピークの平均エリアから有意に誘導されるピークを
同定し、データピーク間の予想対立遺伝子比率を、データピークの下のエリアの
比率について定義する。理論的には、各遺伝的配座が同じモル濃度のアナライト
を有する場合、各相当するピークの下のエリアは同じであり、そのため、任意の
２つのピーク間に１．０比率のピークエリアを生ずる。本発明により、データ中
の他のピークに比例してより小さくなる比を有するピークは、ピークとして認識
されない。より特に、ピークエリアの見た目の値に比例して３０％未満となるエ
リア比率を有するピークを対立遺伝子ペナルティーとする。残存ピークの質量(
当該データのｘ軸に沿った位置)をオリゴヌクレオチド標準に基づき決定する。

【０３４５】図５７は、標準遺伝子型決定を行うとき、コンピューティング装置２０(図２
４)によるプロセッシングのフローダイアグラム表示を示す。フローダイアグラ
ムボックス番号５０２により示される、最初の操作において、コンピューティン
グ装置は、マススペクトロメーターからデータを受ける。次に、データサンプル
中の各推定ピークの高さを、ブロック５０４により示されるように、決定した。
マススペクトロメーターデータ内の各ピークの高さを決定した後、ノイズ除去プ
ロセス５０５を行い、ノイズプロファイルの外挿を開始し(ブロック５０６)、そ
の後、各ピークのノイズを発見し(ブロック５０８)、そして各データサンプル(
ブロック５１０)のノイズ対シグナル比率を算出する(ブロック５１０)。各これ
らの操作は、図２５のノイズ除去操作４５のため上記により行い得る。他の適当
なノイズ除去操作が当業者により思いつく。

【０３４６】次の操作は、各データポイントに連関する残留エラーを見つけることである。
これは、図５７のブロック５１２により表されている。次のステップ、ブロック
５１４は、各同定ピークの調節されたノイズ対シグナル比率を算出することを含
む。確率プロファイルは、次(ブロック５１６)で作成され、その後、ブロック５
１８でピーク確率を決定する。好ましい実施態様では、ブロック５０２からブロ
ック５１８までを含む図５７のノイズ除去操作は、図５６と関連する相当する、
ブロック４０２からブロック４１８、それぞれのための上記操作を含む。

【０３４７】標準遺伝子型決定プロセッシングのための次の動作で、ブロック５２４により
示される各ピークの対立遺伝子ペナルティーを決定する。上記のように、図５７
の標準遺伝子決定プロセッシングは、ピークの下のエリアを比較することにより
対立遺伝子ペナルティーを決定する。そのため、上記図５３のような対立遺伝子
ペナルティーを決定する比較シグナル強度比以外では、標準プロセッシングは、
各同定ピークの下のエリアを決定し、これらエリアの比率を比較する。各ピーク
の下のエリアの決定は、実験データの曲線の下のエリアを計算するための通常の
多くの分析技術を用い計算し得る。

【０３４８】そのため、対立遺伝子ペナルティーを、０．３０(３０％)を超える予想平均エ
リア値に比例するピークエリアを有するピークに割り当てられるペナルティーは
ないことを示す図５８により割り当てる。対立遺伝子ペナルティーを、図５２に
記載のようなプロセスにより決定され得る、ピーク確率値に適用する。ピークを
３０％未満の比とする対立遺伝子ペナルティーより、ピークが更なる測定および
プロセッシングから取り除かれるということが、図５８から明白となる。しかし
、他のペナルティースキームを、当業者が決定するように、プロセスされるデー
タに関する知識により、課す。

【０３４９】対立遺伝子ペナルティーを決定し適用した後、標準遺伝子型プロセッシングは
、残存推定ピークとオリゴヌクレオチド標準の位置を比較し、ブロック５２４の
プロセッシングにおいて相当する質量を決定する。標準遺伝子型データの場合、
図３３のブロック４２４、４２６、および４２８に相当する操作を行うよりもむ
しろ、ブロック５２４のプロセッシングを行い、質量および遺伝子型を決定する
。その比較を行い、質量を測定する技術は当業者に既知である。

【０３５０】他の実施態様では、コンピューティング装置２０(図２４)により、アッセイに
おいて生ずるフラグメントのセンスおよびアンチセンス鎖の質量(当該データの
ｘ軸に沿った位置)の検出および決定が可能となる。望ましいならば、コンピュ
ーティング装置はまた、標準遺伝子型プロセッシングのための上記した同様技術
を用い、各センスおよびアンチセンス鎖の量(各ピークの下のエリア)を検出し、
決定し得る。次いで、各型の鎖を生ずるデータを合わせ、データ冗長を達成し、
それにより、決定化遺伝子型の確実性レベルを増大する。この技術により、他の
診断方法からデータ中にしばしば観察されるプライマーピークを事前に除去し、
それにより、より高いレベルのマルチプレックシングが可能となる。加えて、定
量化を、プールした実験で用いるとき、測定ピークエリアの比率は、データ冗長
のため、ピーク同定技術よりもより確実に算出される。

【０３５１】図２３は、センスおよびアンチセンスプロセッシングを行うコンピューティン
グ装置２０により実行するプロセッシングを示すフローダイアグラムである。フ
ローダイアグラムボックス番号６０２により示される最初の操作で、コンピュー
ティング装置は、マススペクトロメーターからデータを受け取る。このデータは
、アッセイフラグメントのセンス鎖およびアンチセンス鎖のデータを含む。次に
、データサンプル中の各推定ピークの高さをブロック６０４で示すように決定す
る。マススペクトロメーターデータ中の各ピークの高さを決定した後、ノイズ除
去プロセス６０５を行い、ノイズプロファイルに外挿する操作(ブロック６０６)
を開始し、その後、各ピークのノイズを発見し(ブロック６０８)、そして各デー
タサンプルのノイズ対シグナル比率を算出する(ブロック６１０)。各これらの操
作は、図２５のノイズ除去操作４５のため上記により行い得る。他の適当なノイ
ズ除去操作が当業者により思いつく。次の操作は、各データポイントに付随する
残留エラーを発見することである。これは、図３６のブロック６１２により示す
。

【０３５２】センス鎖およびアンチセンス鎖のデータのための残留エラーを行った後、遺伝
子型を同定するプロセッシングは、センス鎖で行い、また、アンチセンス鎖で行
う。そのため、図２３は、プロセッシングにはセンス鎖プロセッシング(ブロッ
ク６３０)およびアンチセンス鎖プロセッシング(ブロック６４０)が含まれるこ
とを示す。各ブロック６３０、６４０には、図５６のブロック４１４から４２６
と関連する上記するような、ノイズ対シグナル比率を調節すること、確率プロフ
ァイルを作成すること、対立遺伝子ペナルティーを決定すること、対立遺伝子ペ
ナルティーによりピーク確率を調節すること、遺伝子型決定の確率を算出するこ
と、および遺伝子型確率比を試験すること、に相当するプロセッシングが含まれ
る。各ブロック６３０、６４０のプロセッシングには、望ましいならば、図５７
と関連する上記のような標準プロセッシング操作が含まれる。標準プロセッシン
グは、図５６のプロセッシング操作に代えてまたはそれに加えて、含まれ得る。

【０３５３】遺伝子型確率プロセッシングを行った後、センス鎖およびアンチセンス鎖プロ
セッシングからのデータを合わせ、予測データベース値と比較すると、センス鎖
とアンチセンス鎖との間のデータ冗長の利点を得る。当業者ならば、技術により
、アッセイフラグメントのセンス鎖とアンチセンス鎖との間の既知のデータ冗長
が利点となることを理解し得る。このプロセッシングをブロック６５０に示して
いる。二本鎖からのデータをプロセッシングのために合わせた後、遺伝子型プロ
セッシングを行い(ブロック６６０)、遺伝子型を同定する。

【０３５４】修飾が当業者に明白であるため、本発明が添付の請求の範囲にのみによって限
定されることを意図する。

【配列表】

【図面の簡単な説明】

【図１Ａ】図１は、例示的なサンプルバンクを示す。図１Ａは、性別およ
び人種の関数としてのサンプルを示す。

【図１Ｂ】図１は、例示的なサンプルバンクを示す。図１Ｂは、年齢の関
数として白人を示す。

【図１Ｃ】図１は、例示的なサンプルバンクを示す。図１Ｃは、年齢の関
数としてヒスパニックを示す。

【図２Ａ】図２Ａは、リポタンパク質リパーゼ遺伝子の２９１Ｓ対立遺伝
子の年齢および性別分布を示し、全部で４３６人の男性および５８９人の女性を
調査した。

【図２Ｂ】図２Ｂは、４３６人の男性について年齢の分布を示す。

【図２Ｃ】図２Ｃは、リポタンパク質リパーゼ遺伝子の２９１Ｓ対立遺伝
子の年齢および性別分布を示し、全部で４３６人の男性および５８９人の女性を
調査した。

【図３】図３は、集団に基づくサンプルバンキングのための例示的な質問
票である。

【図４】図４は、血液サンプルコンポーネントのプロセッシングおよびト
ラッキングを示す。

【図５】図５は、「病気」対立遺伝子および「健康体」対立遺伝子の対立
遺伝子頻度を年齢の関数として示す。健康体対立遺伝子の相対的頻度が年齢の増
加とともに集団中で増加することが注目される。

【図６】図６は、ＡｐｏＥ遺伝子型の年齢依存性分布を示す（Schaechter
et al. (1994)Nature Genetics 6:29-32参照）。

【図７Ａ】図７Ａは、データベース中の白人集団中のｐ５３（腫瘍サプレ
ッサー）コドン７２の年齢依存性および遺伝子型頻度を示す。＊Ｒ７２および＊
Ｐ７２はデータベース集団中の対立遺伝子の頻度を表す。Ｒ７２、Ｒ７２Ｐ、お
よびＰ７２は集団中の個体の遺伝子型を表す。ホモ接合性Ｐ７２対立遺伝子の頻
度は、年齢とともに６．７％から３．７％に低下する。

【図７Ｂ】図７Ｂは、データベース中の白人集団中のｐ５３（腫瘍サプレ
ッサー）コドン７２の年齢依存性および遺伝子型頻度を示す。＊Ｒ７２および＊
Ｐ７２はデータベース集団中の対立遺伝子の頻度を表す。Ｒ７２、Ｒ７２Ｐ、お
よびＰ７２は集団中の個体の遺伝子型を表す。ホモ接合性Ｐ７２対立遺伝子の頻
度は、年齢とともに６．７％から３．７％に低下する。

【図７Ｃ】図７Ｃは、データベース中の白人集団中のｐ５３（腫瘍サプレ
ッサー）コドン７２の年齢依存性および遺伝子型頻度を示す。＊Ｒ７２および＊
Ｐ７２はデータベース集団中の対立遺伝子の頻度を表す。Ｒ７２、Ｒ７２Ｐ、お
よびＰ７２は集団中の個体の遺伝子型を表す。ホモ接合性Ｐ７２対立遺伝子の頻
度は、年齢とともに６．７％から３．７％に低下する。

【図７Ｄ】図７Ｄは、データベース中の白人集団中のｐ５３（腫瘍サプレ
ッサー）コドン７２の年齢依存性および遺伝子型頻度を示す。＊Ｒ７２および＊
Ｐ７２はデータベース集団中の対立遺伝子の頻度を表す。Ｒ７２、Ｒ７２Ｐ、お
よびＰ７２は集団中の個体の遺伝子型を表す。ホモ接合性Ｐ７２対立遺伝子の頻
度は、年齢とともに６．７％から３．７％に低下する。

【図８】図８は、年齢の関数として、ｐ２１Ｓ３１Ｒ対立遺伝子の対立
遺伝子および遺伝子型頻度を示す。

【図９】図９は、個体サンプルに対してプールされたＦＶＩＩ対立遺伝子
３５３Ｑの頻度を示す。

【図１０】図１０は、個体サンプルに対してプールされた、ＣＥＴＰ（コ
レステロールエステル輸送タンパク質）対立遺伝子の頻度を示す。

【図１１】図１１は、個体サンプルに対してプールされた、プラスミノー
ゲンアクチベーターインヒビター−１（ＰＡＩ−１）５Ｇの頻度を示す。

【図１２】図１２は、ＰＡＩ−１対立遺伝子のサンプルのマススペクトル
および人種分布を示す。

【図１３】図１３は、ＣＥＴＰ４０５対立遺伝子のサンプルのマススペク
トルおよび人種分布を示す。

【図１４】図１４は、第ＶＩＩ因子３５３対立遺伝子のサンプルのマスス
ペクトルおよび人種分布を示す。

【図１５】図１５は、プールされたＤＮＡサンプルを使用する、ＰＡＩ−
１、ＣＥＴＰおよび第ＶＩＩ因子の人種分布を示す。

【図１６】図１６は、ｐ５３−Ｒｂ経路およびその経路の種々の因子の間
の関連を示す。

【図１７】図１７は、ここで記載したプロセスおよびデータベースを提供
する、コンピューター構築性のブロックダイヤグラムであり、これは、ここで提
供するデータベースを蓄積し、そして分類するための、そしてここで提供する方
法を実行する、典型的なコンピューターシステムを示す。

【図１８】図１８は、多型遺伝的マーカーを同定するためのデータベース
へのアクセスを維持し、そして提供するための、図１７に示されるコンピュータ
ーを使用して実行される、プロセッシングステップを示すフローダイヤグラムを
示す。

【図１９】図１９は、ＡＫＡＰ１０−１遺伝子座について、年齢および性
別で層化された、白人集団での対立遺伝子および遺伝子型分布を示すヒストグラ
ムである。明緑色のバーは、４０歳より若齢の個体での頻度を示す。暗緑色のバ
ーは、６０歳より高齢の個体での頻度を示す。

【図２０】図２０は、ＡＫＡＰ１０−５遺伝子座について、年齢および性
別で層化された、白人集団の対立遺伝子および遺伝子型分布を示すヒストグラム
である。明緑色のバーは、４０歳より若齢の個体の頻度を示す。暗緑色のバーは
、６０歳より高齢の個体の頻度を示す。

【図２１】図２１は、ｈ−ｍｓｒ−Ａ遺伝子座について、年齢および性別
で層化された白人集団の、対立遺伝子および遺伝子型分布を示すヒストグラムで
ある。明緑色のバーは、４０歳より若齢の個体での頻度を示す；暗緑色のバーは
、６０歳より高齢の個体での頻度を示す。

【図２２Ａ】図２２Ａは、健康体のデータベースのために使用する、サン
プルデータ収集質問票である。

【図２２Ｂ】図２２Ｂは、健康体のデータベースのために使用する、サン
プルデータ収集質問票である。

【図２２Ｃ】図２２Ｃは、健康体のデータベースのために使用する、サン
プルデータ収集質問票である。

【図２２Ｄ】図２２Ｄは、健康体のデータベースのために使用する、サン
プルデータ収集質問票である。

【図２３】図２３は、アッセイフラグメントからのセンス鎖およびアンチ
センス鎖の遺伝子型決定をおこなうときに、図２４のコンピューティング装置に
よって実行されるプロセッシングを示すフローチャートである。

【図２４】図２４は、本発明に従うシステムを示すブロックダイヤグラム
である。

【図２５】図２５は、本発明に従う、生物学的サンプルを同定する方法の
フローチャートである。

【図２６】図２６は、質量分析計からのデータをグラフに表したものであ
る。

【図２７】図２７は、質量分析法データのウェーブレット変換のダイヤグ
ラムである。

【図２８】図２８は、ウェーブレットステージ０ｈｉデータをグラフに表
したものである。

【図２９】図２９は、ステージ０ノイズプロファイルをグラフに表したも
のである。

【図３０】図３０は、ステージノイズ標準偏差の作成をグラフに表したも
のである。

【図３１】図３１は、データステージのスレショルド（threshold）の適
用をグラフに表したものである。

【図３２】図３２は、希薄データセットをグラフに表したものである。

【図３３】図３３は、シグナルをシフトさせる式である。

【図３４】図３４は、ノイズを除去し、そしてシフトしたシグナルの、ウ
ェーブレット変換をグラフに表したものである。

【図３５】図３５は、ノイズを除去し、そしてシフトしたシグナルをグラ
フに表したものである。

【図３６】図３６は、ピークセクションの除去をグラフに表したものであ
る。

【図３７】図３７は、ピークフリーシグナルの作成をグラフに表したもの
である。

【図３８】図３８は、ベースライン補正を作成する方法のブロックダイヤ
グラムである。

【図３９】図３９は、ベースラインおよびシグナルをグラフに表したもの
である。

【図４０】図４０は、ベースラインを除去したシグナルをグラフに表した
ものである。

【図４１】図４１は、圧縮したデータを示す表である。

【図４２】図４２は、データを圧縮する方法のフローチャートである。

【図４３】図４３は、マスシフティングをグラフに表したものである。

【図４４】図４４は、ピーク幅の決定をグラフに表したものである。

【図４５】図４５は、ピークの除去をグラフに表したものである。

【図４６】図４６は、ピークを除去したシグナルをグラフに表したもので
ある。

【図４７】図４７は、残留ベースラインをグラフに表したものである。

【図４８】図４８は、残留ベースラインが除去されたシグナルをグラフに
表したものである。

【図４９】図４９は、ピーク高の決定をグラフに表したものである。

【図５０】図５０は、各ピークについて、シグナル−対−ノイズ決定をグ
ラフに表したものである。

【図５１】図５１は、各ピークについて、残留エラーの決定をグラフに表
したものである。

【図５２】図５２は、ピーク確率をグラフに表したものである。

【図５３】図５３は、ピーク確率に対する対立遺伝子比率の適用をグラフ
に表したものである。

【図５４】図５４は、ピーク確率の決定をグラフに表したものである。

【図５５】図５５は、遺伝子型のコールをグラフに表したものである。

【図５６】図５６は、遺伝子型をコールするための統計的処理を示すフロ
チャートである。

【図５７】図５７は、標準を欠く遺伝子型決定をおこなうとき、図１のコ
ンピューティング装置によって実行されるプロセッシングを示すフローチャート
である。

【図５８】図５８は、標準を欠く遺伝子型プロセッシングのための、ピー
ク確率に対する対立遺伝子比率の適用をグラフに表したものである。

【手続補正書】

【提出日】平成１４年４月２３日（２００２．４．２３）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】００５６

【補正方法】変更

【補正の内容】

【００５６】ここで使用するように、ハプロタイプは、一本鎖ＤＮＡに位置する２またはよ
り多い多型を意味する。ゆえに、ハプロタイピングは、一本鎖ＤＮＡ上の２また
はそれより多い多型の同定を意味する。ハプロタイプは、表現型を示すことがで
きる。幾つかの障害については、単一の多型は、特徴を表すために十分で有り得
る。その他の場合には、複数のもの（すなわちハプロタイプ）が必要とされ得る
。ハプロタイピングを、核酸を単離し、そして鎖を分離することによって行うこ
とができる。加えて、酵素、例えば、各鎖から異なるサイズのフラグメントを生
成する、ある種のヌクレアーゼを使用するとき、鎖分離はハプロタイピングに必
要ではない。

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】００５９

【補正方法】変更

【補正の内容】

【００５９】ここで使用するように、アダプターは、Ｆｅｎリガーゼを使用するハプロタイ
ピングを引用して使用するとき、所望の多型に特異的にハイブリダイズする核酸
を意味する。アダプターは、部分的に二本鎖であることができる。アダプターが
その標的にハイブリダイズするとき、アダプター複合体が形成される。

【手続補正３】

【補正対象書類名】明細書

【補正対象項目名】００６２

【補正方法】変更

【補正の内容】

【００６２】ここで使用するように、増幅は、生体高分子、特に核酸の量を増加させる手段
を意味する。選択される５’および３’プライマーに基づき、増幅は、そしてま
た分析の対象であるゲノムの領域を制限し、そして定義するように役立つ。増幅
は、当業界で既知の任意の手段によってなされることができ、ポリメラーゼ連鎖
反応（ＰＣＲ）等の使用を含む。多型の頻度を決定することが要求されるとき、
増幅、例えばＰＣＲは、定量的にされなければならない。

【手続補正４】

【補正対象書類名】明細書

【補正対象項目名】０１７４

【補正方法】変更

【補正の内容】

【０１７４】臨床試験集団内の頻度が年齢とともに減少するマーカーの同定によって、またよりよく
設計され、そしてバランスが取れている臨床試験を得ることができる。現在では
、臨床試験が研究で重要な指標（endpoint）としてマーカーを利用し、そしてそ
のマーカーが年齢とともに消失するならば、そのときは研究の結果は不正確かも
しれない。ここで提供した方法を使用することによって、マーカーが年齢ととも
に頻度が減少するかどうか確認することができる。研究を計画するとき、この情
報を考慮し、そして管理する（control）ことができる。例えば、年齢に独立的
なマーカーは、適当な場合に置換し得る。

【手続補正５】

【補正対象書類名】明細書

【補正対象項目名】０２２９

【補正方法】変更

【補正の内容】

【０２２９】ＡＫＡＰ１０−１のドナー集団のＢｉｏｍａｓｓＰＲＯＢＥアッセイ分析(クロ
ーン４８３１９) ＢｉｏｍａｓｓＰＲＯＢＥアッセイ法を用いる遺伝子型決定は、２６ｍＭＴ
ｒｉｓ−ＨＣｌｐＨ９．５、６．５ｍＭＭｇＣｌ_２および５０ｍＭ各ｄＴＴ
Ｐおよび５０ｍＭ各ｄｄＣＴＰ、ｄｄＡＴＰ、ｄｄＧＴＰ、熱安定性ＤＮＡポ
リメラーゼ２．５Ｕ(Amersham)ならびに鋳型特異的オリゴヌクレオチドＰＲＯＢ
Ｅプライマー5'-CTGGCGCCCACGTGGTCAA-3'(配列番号４８)(Operon)にＤＮＡ被覆
磁性ビーズを再懸濁することにより行った。プライマー伸張は、オリゴヌクレオ
チドプライマーハイブリダイゼーションおよび伸張の３サイクルで生じる。当該
伸張産物は、５０ｍＭＮＨ_４Ｃｌで鋳型から変性させ、各サンプル１５０ｎＬ
を、Ｈ３ＰＡマトリックス物質１５０ｎＬで事前負荷したシリコンチップへ移し
た後、分析した。当該サンプル物質を結晶化し、ＭＡＬＤＩ−ＴＯＦ(Bruker, P
erSeptive)で分析した。ＡＫＡＰ１０中に存在するＳＮＰは、ＡＫＡＰ１０遺伝
子(ＧｅｎＢａｎｋ受け入れ番号ＡＣ００５７３０(配列番号３６)のゲノムクロ
ーンの配列のヌクレオチド番号１５６２７７においてＴをＣに変化する。配列番
号３５は、ヒトＡＫＡＰ１０遺伝子のゲノムヌクレオチド配列を含むヒトクロモ
ソーム１７のヌクレオチド配列を示し、配列番号３６は、ヒトＡＫＡＰ１０−１
対立遺伝子のゲノムヌクレオチド配列を含むヒトクロモソーム１７のヌクレオチ
ド配列を示す。ＢｉｏＭａｓｓプローブ反応に使用したプライマーの質量は、５
５００．６ダルトンであった。ＳＮＰの存在下、当該プライマーは、質量５７７
３．８のｄｄＣの添加により伸張する。野生型遺伝子は、ｄＴおよびｄｄＧをプ
ライマーに添加し、質量６１０１ダルトンを有する伸張産物を産生する。

【手続補正６】

【補正対象書類名】明細書

【補正対象項目名】０２８７

【補正方法】変更

【補正の内容】

【０２８７】Ａ．ニッカーゼ消化Ｔｒｉｓ−ＨＣｌ(１０ｍＭ)、ＫＣｌ(１０ｍＭ、ｐＨ８．３)、酢酸マグネシ
ウム(２５ｍＭ)、ＢＳＡ(１ｍｇ／ｍＬ)、および６ＵＣｖｉＮＹ２ＡまたはＣ
ｖｉＮＹＳ１ニッカーゼ(Megabase Research)を、標準的ホスホラミダイト化学
を用い合成される配列5'-CGCAGGGTTTCCTCGTCGCACTGGGCATGTG-3'(配列番号９０、
Operon, Alameda, CA)を有する二本鎖オリゴヌクレオチド鋳型２５ｐｍｏｌに加
えた。全体積２０μＬを用い、当該反応混合物を３７℃５時間インキュベーショ
ンし、当該消化産物を実施例５に記載するようにZipTip(Millipore, Bedford, M
A)を用い精製した。当該サンプルを、実施例１に記載するようにＭＡＬＤＩ−Ｔ
ＯＦ質量分析法で分析した。ニッカーゼＣｖｉＮＹ２Ａは質量４０４９．７６
ダルトン、５４７３．１４ダルトンおよび９５４０．７１ダルトンの３つのフラ
グメントを生じた。ＣｖｉＮＹＳ１ニッカーゼは質量２０６３．１８ダルトン
、３０５６．４８ダルトン、６４９２．８１ダルトンおよび７４５０．１４ダル
トンのフラグメントを生じた。

【手続補正７】

【補正対象書類名】明細書

【補正対象項目名】０３３２

【補正方法】変更

【補正の内容】

【０３３２】図５１について言及すると、残留エラーは、データシグナルにおけるガウス２
９３と推定ピーク２９０との間で二乗平均を算出することにより、算出する。当
該算出は、ガウスのセンターラインの何れかの側の１つの幅内のデータで行う。
残留エラーは、：

【数１】として算出される。この場合、Ｇはガウスシグナル値であり、Ｒは推定ピーク値
であり、そしてＮは−Ｗから＋Ｗまでのポイントの数である。算出残留エラーを
用い、下記のような、調節されたノイズ対シグナル比率(adjusted signal to no
ise ratio)を得る。

【手続補正書】

【提出日】平成１４年８月８日（２００２．８．８）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】０００７

【補正方法】変更

【補正の内容】

【０００７】多型多型は血液型の同定によって１９０１以来知られている。１９５０年代に、こ
れらは大集団の遺伝的研究を使用して、タンパク質のレベルで同定された。１９
８０年代および１９９０年代に、多くの既知のタンパク質多型が、ゲノムＤＮＡ
の遺伝子座と相関された。例えば、アポリポタンパク質Ｅ４型の対立遺伝子の遺
伝子用量（gene dose）が、遅発型ファミリーのアルツハイマー病のリスクと相
関され（例えば、Corder et al.(1993)Science 261: 921-923参照）；血液凝第
Ｖ因子の突然変異が活性化タンパク質Ｃに対する抵抗性と連関され(例えば、Ber
tina et al. (1994)Nature 369:64-67参照)；ＨＩＶ−１感染に対する抵抗性が
ＣＣＲ−５ケモカインレセプター遺伝子の突然変異体対立遺伝子を有する白人個
体で示され（例えば、Samson et al. (1996)Nature 382:772-725参照）；そして
抗原提示細胞（ＡＰＣ、例えばマクロファージ）の高頻度突然変異性トラクトが
Ashkenziユダヤ人バックグラウンドの個体の家族性結腸直腸癌で同定された（例
えば、Laken et al. (1997)Nature Genet. 17:79-83参照）。ヒトゲノムの３百
万より多い多型部位が存在し得る。多くは同定されたが、なお特徴を把握され、
またはマッピングされ、またはマーカーと連関されていない。

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】００１７

【補正方法】変更

【補正の内容】

【００１７】これらの方法のある使用は、既知の遺伝的マーカーの出現に従うことによって
、特定のパラメータと選択されたマーカーを相関させることであり、それからこ
の相関を作成したら、疾患との相関を決定し、または同定する。この使用の例は
、ｐ５３およびリポタンパク質リパーゼ多型である。ここで例示のように、既知
のマーカーは、ある種の群、例えば、特定の人種または種族またはある性別と特
定の相関を有することが示される。次いで、そのような相関によって、よりよい
診断テストおよび処置養生法の開発が可能となる。

【手続補正３】

【補正対象書類名】明細書

【補正対象項目名】００４１

【補正方法】変更

【補正の内容】

【００４１】ここで使用するように、生体高分子は、核酸、タンパク質、多糖類、脂質およ
び他の大分子を含むがこれらに限定されない。核酸は、ＤＮＡ、ＲＮＡ、および
そのフラグメントを含む。核酸はゲノムＤＮＡ、ＲＮＡ、ミトコンドリア核酸、
クロロプラスト核酸および別の遺伝的物質を有する他のオルガネラに由来し得る
。

【手続補正４】

【補正対象書類名】明細書

【補正対象項目名】００５３

【補正方法】変更

【補正の内容】

【００５３】ここで使用するように、非選択的対象のセットは、共通の疾患または他の形質
を有する予め選択されない対象を意味する。それらは、ここで定義されるように
健康であるべきであるように選択することができる。

【手続補正５】

【補正対象書類名】明細書

【補正対象項目名】００５５

【補正方法】変更

【補正の内容】

【００５５】ここで使用するように、パラメータはデータベースを分類するための基礎とし
て役立つ任意の入力データである。これらのパラメータは、表現型特徴、病歴、
家族履歴および対象から引き出され、または対象について観察される任意の他の
そのような情報を含む。パラメータは、対象、対象によって経験されるある種の
履歴または現在の環境的または社会的影響、または対象に関連する者に及ぼす状
態または環境的影響を説明し得る。パラメータは、ここで記載され、そして当業
者に既知の任意のものを含むがこれらに限定されない。

【手続補正６】

【補正対象書類名】明細書

【補正対象項目名】００５６

【補正方法】変更

【補正の内容】

【００５６】ここで使用するように、ハプロタイプは、単一のＤＮＡ鎖に位置する２または
より多い多型を意味する。ゆえに、ハプロタイピングは、単一のＤＮＡ鎖上の２
またはそれより多い多型の同定を意味する。ハプロタイプは、表現型を示すこと
ができる。幾つかの障害については、単一の多型は、特徴を表すために十分で有
り得る。その他の場合には、複数のもの（すなわちハプロタイプ）が必要とされ
得る。ハプロタイピングを、核酸を単離し、そして鎖を分離することによって行
うことができる。加えて、酵素、例えば、各鎖から異なるサイズのフラグメント
を生成する、ある種のヌクレアーゼを使用するとき、鎖分離はハプロタイピング
に必要ではない。

【手続補正７】

【補正対象書類名】明細書

【補正対象項目名】００７６

【補正方法】変更

【補正の内容】

【００７６】マーカーの出現および消失の同定およびスコアー化は、これらのマーカーが健
康体対象のバックグラウンドで測定され、ここで、疾患の開始が多型の存在の変
化をマスクしないときのみ、可能であることがここで示される。疾患集団からの
情報のデータベースは、サンプルの大きさが小さい点、選択の偏り、および不均
質性をこうむっている。健康体集団からここで提供したデータベースは、サンプ
ルバンドが大きい点、簡単な選択方法および不均質性を希釈することによってこ
れらの問題を解決する。

【手続補正８】

【補正対象書類名】明細書

【補正対象項目名】００７８

【補正方法】変更

【補正の内容】

【００７８】ここで健康体データベースと命名したデータベースは、特定の疾患について予
め選択された対象から取得されないため、そのように命名する。ゆえに、個々の
メンバーは疾患を有しているかもしれないが、個体の収集は特定の疾患を有する
ように選択されているわけではない。

【手続補正９】

【補正対象書類名】明細書

【補正対象項目名】００８１

【補正方法】変更

【補正の内容】

【００８１】対象の収集物を同定し、各対象についての情報を記録し、そしてデータベース
として各対象と連関させる。各対象と連関している情報は、対象の履歴的形質に
関連する情報、表現型的形質およびまた遺伝型形質、医学的形質および任意の他
の特徴および決定することのできる対象についての形質を含むがこれらに限定さ
れない。この情報は、データベースを分類するための基礎として役立つ。

【手続補正１０】

【補正対象書類名】明細書

【補正対象項目名】００８９

【補正方法】変更

【補正の内容】

【００８９】ひとたびサンプルを取得すると、収集物を好ましい実施態様では貯蔵すること
ができ、各サンプルを識別子、特に機械読み取り可能コード、例えばバーコード
でインデックスを付する。分析のために、サンプルまたはサンプルのコンポーネ
ント、特に生体高分子および小分子、例えば核酸および／またはタンパク質およ
びメタボライトを単離する。

【手続補正１１】

【補正対象書類名】明細書

【補正対象項目名】０１１２

【補正方法】変更

【補正の内容】

【０１１２】ニッカーゼフラグメント化法ＤＮＡニッカーゼ、またはＤＮアーゼを使用して、ＤＮＡ二重らせんの１の鎖
を認識し、そして切断することができる。多くのニッカーゼが既知である。これ
らのうちに、例えば、ニッカーゼＮＹ２ＡニッカーゼおよびＮＹＳ１ニッカーゼ
（Megabase）があり、以下の切断部位を有する；ＮＹ２Ａ：５’・・・ＲＡＧ・・・３’ ３’・・・ＹＴＣ・・・５’、ここで、Ｒ＝ＡまたはＧおよびＹ＝ＣまたはＴ
ＮＹＳ１：５’・・・ＣＣ〔Ａ／Ｇ／Ｔ〕・・・３’ ３’・・・ＧＧ〔Ｔ／Ｃ／Ａ〕・・・５’。

【手続補正１２】

【補正対象書類名】明細書

【補正対象項目名】０１１６

【補正方法】変更

【補正の内容】

【０１１６】タイプＩＩＳ酵素フラグメント化法制限酵素は、特定の認識配列内、またはそれに隣接する特異的部位で二本鎖Ｄ
ＮＡに特異的に結合し、そして切断する。これらの酵素を、当業者に知られてい
るように２種の群に分類する（例えばタイプＩ、ＩＩ、およびＩＩＩ）。タイプ
ＩおよびタイプＩＩＩ酵素の特性のために、これらは分子生物学的応用に広く使
用されていない。したがって、本発明のためにタイプＩＩ制限酵素が好ましい。
当業界で既知である何千もの制限酵素のうち、１７９種の異なるタイプＩＩ特異
性がある。１７９種の独特のタイプＩＩ制限エンドヌクレアーゼのうち、３１種
が４塩基認識配列を有し、１１種が５塩基認識配列を有し、１２７種が６塩基認
識配列を有し、そして１０種が６塩基より大きい認識配列を有する（米国特許５
６０４０９８）。カテゴリータイプＩＩのうち、タイプＩＩＳが好ましい。

【手続補正１３】

【補正対象書類名】明細書

【補正対象項目名】０１１７

【補正方法】変更

【補正の内容】

【０１１７】タイプＩＩＳ酵素は、ＡｌｗＸＩ、ＢｂｖＩ、Ｂｃｅ８３、ＢｐｍＩ
、ＢｓｇＩ、ＢｓｍＡＩ、ＢｓｍＦＩ、ＢｓａＩ、ＢｃｃＩ、Ｂｃｇ
Ｉ、ＥａｒＩ、Ｅｃｏ５７１、Ｅｓｐ３１、ＦａｕＩ、ＦｏｋＩ、
ＧｓｕＩ、ＨｇａＩ、ＭｍｅＩ、ＭｂｏＩＩ、ＳａｐＩ、等であるこ
とができる。好ましいタイプＩＩＳ酵素はＦｏｋＩである。ＦｏｋＩ酵素エンドヌクレアーゼは、例示的な周知の、タイプＩＩＳクラス
の特徴を把握されたメンバーである（例えば、米国特許５７１４３３０、５６０
４０９８、５４３６１５０、６０５４２７６および５８７１９１１参照；またSz
ybalski et al. (1991)Gene 100:13-26、Wilson and Murray(1991)Ann. Rev. Ge
net. 25:585-627、Sugisaki et al.(1981)Gene 16:73-78、Podhajska and Szals
ki(1985) Gene 40:175-182参照。ＦｏｋＩは配列５’ＧＧＡＴＧ−３’を認識
し、そしてそれによりＤＮＡを切断する。タイプＩＩＳ制限部位は、ＤＮＡ標的
を増幅するために使用されるプライマーにタイプＩＩＳ制限部位を組み込むこと
によって、ＤＮＡ標的に導入することができる。ＦｏｋＩでの消化によって生
成したフラグメントは、部位特異的であり、そして質量分析法、例えば、ＭＡＬ
ＤＩ−ＴＯＦ質量分析法、ＥＳＩ−ＴＯＦ質量分析法、および当業者に周知であ
る任意の他のタイプの質量分析法によって分析することができる。

【手続補正１４】

【補正対象書類名】明細書

【補正対象項目名】０１２９

【補正方法】変更

【補正の内容】

【０１２９】こうして、ここにデータベースは以下のための手段を提供する：集団で、年齢の増加にともなうマーカーの発生または消失を比較することによ
って、遺伝子的要因の有意に異なる対立遺伝子頻度を同定し、それからそのマー
カーと疾患または生化学的経路を連関させること；

【手続補正１５】

【補正対象書類名】明細書

【補正対象項目名】０１３０

【補正方法】変更

【補正の内容】

【０１３０】男性を女性集団と比較し、または他の選択された層化された集団を比較するこ
とによって、疾患を生じる遺伝的要因の有意に異なる対立遺伝頻度を同定し、そ
してそのマーカーを疾患または生化学的経路と連関させること；

【手続補正１６】

【補正対象書類名】明細書

【補正対象項目名】０１３１

【補正方法】変更

【補正の内容】

【０１３１】異なる人種群を比較することによって、疾患を生じる遺伝子的要因の有意に異
なる対立遺伝子変異を同定し、そしてそのマーカーをその人種群に高頻度で存在
すると知られている、疾患または生化学的経路と連関させること；

【手続補正１７】

【補正対象書類名】明細書

【補正対象項目名】０１３５

【補正方法】変更

【補正の内容】

【０１３５】同定したマーカーおよび既知のマーカーの使用このデータベースを、また既知マーカーと組み合せて使用し、任意の相関を同
定するために分類し得る。例えば、データベースは、以下のために使用すること
ができる；医学的に関連のある多型マーカーの存在を、決定および評価すること；

【手続補正１８】

【補正対象書類名】明細書

【補正対象項目名】０１５０

【補正方法】変更

【補正の内容】

【０１５０】図１７は、前記のデータベースを維持する例示的なコンピューター１７００の
ブロック図であり、そしてこの方法および処理を実行する。各コンピューター１
７００は、中央プロセッサーユニット（ＣＰＵ）１７０２、例えば、“ペンティ
アム”マイクロプロセッサーの制御下で作動し、そしてインテルコーポレーショ
ン（Snata Clara, California, USA）から入手可能である総合的サーキットチッ
プと連関している。コンピューター使用者は、コマンドおよびデータをキーボー
ドおよびディスプレイマウス１７０４から入力することができ、そしてディスプ
レイ１７０６で入力およびコンピューター出力を見ることができる。ディスプレ
イは、典型的には、ビデオモニターまたはフラットパネルディスプレイ装置であ
る。

【手続補正１９】

【補正対象書類名】明細書

【補正対象項目名】０１６８

【補正方法】変更

【補正の内容】

【０１６８】これらの経路についてのタンパク質をコードする遺伝子に位置する突然変異／
多型は、細胞の適応性を減少させ、そして生物をより感受性にさせ、疾患特異的
感受性遺伝子の作用によって生じた、臨床的な表現型を発現させることができる
。したがって、これらの病的状態感受性遺伝子は、すべてでないにしても、広範
な種々の複合的な疾患に潜在的に関係することができる。疾患特異的感受性遺伝
子は、グルコース、脂質、ホルモン代謝、等のような疾患特異的経路として考え
ることができる経路に関係する。

【手続補正２０】

【補正対象書類名】明細書

【補正対象項目名】０１７８

【補正方法】変更

【補正の内容】

【０１７８】モデル遺伝的マーカー幾つかのレベルで疾患と連関すると知られている多型の頻度は、データベース
で提示される対象の部分集団において測定された。これら既知多型は、ｐ２１、
ｐ５３およびリポタンパク質リパーゼ遺伝子中で生じる。特に、アミノ酸コドン
２９１でセリンとアスパラギンとの置換を生じるリポタンパク質リパーゼ遺伝子
のＮ２９１Ｓ多型(Ｎ２９１Ｓ)は、男性のアテローム性動脈硬化および特に心筋
梗塞の危険性の増加と連関する、高密度リポタンパク質コレステロール(ＨＤＬ
−Ｃ)のレベルを低下することにつながる(Reymer et al. (1995) Nature Geneti
cs 10: 28-34)。

【手続補正２１】

【補正対象書類名】明細書

【補正対象項目名】０１７９

【補正方法】変更

【補正の内容】

【０１７９】ｐ５３遺伝子は、ＤＮＡ損傷を評価する細胞周期制御タンパク質をコードし、
細胞増殖、ＤＮＡ修復およびアポトーシス(プログラム化された細胞死)を制御す
る転写因子制御遺伝子として作用する。ｐ５３遺伝子中の突然変異は、種々の頻
度を有する、種々の型の白血病を含む広く多種の癌で見つかった。通常のｐ５３
機能の喪失は、非制御細胞増殖をゲノム的に不安定とする。ｐ５３遺伝子中で同
定された多型、すなわち、Ｒ７２Ｐ対立遺伝子は、当該遺伝子のアミノ酸コドン
７２でプロリンとアルギニンとの置換を生じる。

【手続補正２２】

【補正対象書類名】明細書

【補正対象項目名】０１８０

【補正方法】変更

【補正の内容】

【０１８０】ｐ２１遺伝子は、通常細胞のＧ１期進行停止を伴うサイクリン依存キナーゼイ
ンヒビターをコードする。ｐ２１遺伝子の発現はアポトーシスを誘発する。ｐ２
１遺伝子の多型は、Wilm's腫瘍、小児科腎臓癌と連関する。ｐ２１遺伝子の１つ
の多型、Ｓ３１Ｒ多型は、アミノ酸コドン３１においてアルギニンとセリンの置
換を生じる。

【手続補正２３】

【補正対象書類名】明細書

【補正対象項目名】０１９７

【補正方法】変更

【補正の内容】

【０１９７】図８は、ｐ２１遺伝的マーカーアッセイの結果から、年齢(年齢１８−４９歳
を年齢５０−７９歳と比較した)の白人のヘテロ接合遺伝子型(Ｓ３１Ｒ)の頻度
に統計的に有意な減少(１３．３％から９．２％)が見られることを示す。２つの
年代群のホモ接合(Ｓ３１およびＲ３１)遺伝子型の頻度もまた、２つの年代群に
おけるＳ３１およびＲ３１対立遺伝子(図中、それぞれ^＊Ｓ３１および^＊Ｒ３１
として命名した)の全体的頻度であるため、示される。

【手続補正２４】

【補正対象書類名】明細書

【補正対象項目名】０１９９

【補正方法】変更

【補正の内容】

【０１９９】図２Ｃは、リポタンパク質リパーゼ遺伝子遺伝的マーカーアッセイの結果は、
年齢(またReymer et al. (1995) Nature Genetics 10: 28-34参照)の白人男性の
多型対立遺伝子(Ｓ２９１)の頻度に統計的に有意な減少(１．９７％から０．５
４％)が見られることを示す。別の年代群の白人女性のこの対立遺伝子頻度もま
た示される。

【手続補正２５】

【補正対象書類名】明細書

【補正対象項目名】０２０１

【補正方法】変更

【補正の内容】

【０２０１】因子ＶＩＩ因子ＶＩＩは、外来的血液凝固カスケード中に含まれるセリンプロテアーゼで
ある。この因子はトロンビンにより活性化され、因子Ｘから因子Ｘａへのプロセ
ッシングにおいて組織因子(因子ＩＩＩ)と共に働く。因子ＶＩＩ遺伝子中の多型
間の関連および心筋梗塞を含む虚血性心血管疾患の危険性を増大し得る因子ＶＩ
Ｉ活性の増加をサポートする証拠がある。本研究で調査する多型は、Ｒ３５３Ｑ
である(すなわち、因子ＶＩＩ遺伝子のコドン３５３においてグルタミン酸残基
からアルギニン残基への置換)(表５参照)。

【手続補正２６】

【補正対象書類名】明細書

【補正対象項目名】０２１１

【補正方法】変更

【補正の内容】

【０２１１】結論上記実施例から、一般的な群の遺伝的因子に起因する疾患の頻度を変化させる
効果が証明される。これらの結果から、多型遺伝的変化の医学的関連性が予測さ
れ得ると解釈される。加えて、結論が、浸透度、診断特異性、陽性適中率、疾患
の攻撃、予防ストラテジーの最も適する攻撃、および単離された群を任意交配し
た群と同定する遺伝的変化の一般的適用可能性を導く。そのため、人種的に同種
である、年齢および性別で層化した群に基づくサンプルバンクは、可能性ある医
療的有用性に関し、遺伝的因子の迅速な同定および確認のための適当なツールと
なる。

【手続補正２７】

【補正対象書類名】明細書

【補正対象項目名】０２１６

【補正方法】変更

【補正の内容】

【０２１６】ＡＫＡＰＳ候補の病的状態および死亡のマーカーには、シグナルトランスダクションに含
まれる遺伝子のようなハウスキーピング遺伝子が含まれる。その遺伝子には、タ
ンパク質リン酸化を含むシグナルトランスダクション経路に関係するＡキナーゼ
アンカータンパク質(ＡＫＡＰ)遺伝子がある。タンパク質リン酸化は、酵素制御
、および真核細胞の細胞膜を通過する細胞外シグナルのトランスダクションに重
要な機構である。酵素、膜レセプター、イオンチャンネルおよび転写因子を含む
広範の種類の細胞性基質は、細胞と相互作用する細胞外シグナルに応答してリン
酸化され得る。ホルモンおよび神経伝達物質に応答する細胞性タンパク質のリン
酸化において鍵となる酵素は、サイクリックＡＭＰ(ｃＡＭＰ)依存タンパク質キ
ナーゼである（ＰＫＡ）。そのため、ｃＡＭＰによる活性化において、ＰＫＡは
、その細胞外シグナルに対する種々の細胞性応答を仲介する。ＰＫＡアイソザイ
ムのアレイは、哺乳類細胞中で発現する。ＰＫＡは、通常、制御(Ｒ)サブユニッ
トダイマーおよび２つの触媒(Ｃ)サブユニットを含む不活性テトラマーとして存
在する。３つのＣサブユニット(Ｃα、ＣβおよびＣγ)および４つのＲサブユニ
ット(ＲＩα、ＲＩβ、ＲＩＩαおよびＲＩＩβ)をコードする遺伝子を同定した
(Takio et al. (1982) Proc. Natl. Acad. Sci. U.S.A. 79: 2544-2548; Lee et
al. (1983) Proc. Natl. Acad. Sci. U.S.A. 80: 3608-3612; Jahnsen et al.
(1996) J. Biol. Chem. 261: 12352-12361; Clegg et al. (1988) Proc. Natl.
Acad. Sci. U.S.A. 85: 3703-3707;およびScott (1991) Pharmacol. Ther. 50:
123-145参照)。型Ｉ(ＲＩ)αおよび型ＩＩ(ＲＩＩ)αサブユニットは、偏在的に
分布し、この場合、ＲＩβおよびＲＩＩβは主に脳に存在する(例えば、Miki an
d Eddy (1999) J. Biol. Chem. 274: 29057-29062参照)。型ＩＰＫＡホロ酵素(
ＲＩαおよびＲＩβ)は、細胞質中に主に存在し、一方、多数の型ＩＩＰＫＡ(
ＲＩＩαおよびＲＩＩβ)は細胞性構造および細胞小器官に関係する(Scott (199
1) Pharmacol. Ther. 50: 123-145)。多くのホルモンおよび他のシグナルがレセ
プターを介して作用し、ＰＫＡのＲサブユニットに結合し、放出し、タンパク質
をリン酸化するＣサブユニットを活性化するｃＡＭＰを生ずる。タンパク質キナ
ーゼおよびその基質は広く細胞全体に分布するため、異なるシグナルに対するタ
ンパク質キナーゼ仲介応答を局在化させる細胞中に存在する機構がある。その機
構の１つには、特定の細胞小器官または細胞骨格コンパートメントにきわめて接
近してＰＫＡを位置させ、それによりより特異的なＰＫＡ相互作用および局在化
応答を提供するＡキナーゼアンカータンパク質(ＡＫＡＰ)と呼ばれる、アンカー
タンパク質の付随を介するＰＫＡの亜細胞性ターゲッティングが含まれる(例え
ば、Scott et al. (1990) J. Biol. Chem. 265: 21561-21566; Bregman et al.
(1991) J. Biol. Chem. 266: 7207-7213; およびMiki and Eddy (1999) J. Biol
. Chem. 274: 29057-29062参照)。アンカーは好ましい基質に近づけてキナーゼ
を位置させるばかりでなく、所望により第二メッセンジャーｃＡＭＰの揺らぎ(f
luctuation)に応答し得る部位にＰＫＡホロ酵素を位置させる(Mochly-Rosen (19
95) Science 268: 247-251; Faux and Scott (1996) Trends Biochem. Sci. 21:
312-315; Hubbard and Cohen (1993) Trends Biochem. Sci. 18: 172-177参照)
。

【手続補正２８】

【補正対象書類名】明細書

【補正対象項目名】０２２７

【補正方法】変更

【補正の内容】

【０２２７】病的状態マーカー１：ヒトタンパク質キナーゼＡアンカータンパク質(ＡＫＡＰ
１０−１) 健康体ドナー集団におけるＡＫＡＰ１０−１のＰＣＲ増幅およびＢｉｏｍａｓｓ
ＰＲＯＢＥアッセイ検出ＡＫＡＰ１０のドナー集団のＰＣＲ増幅ＰＣＲプライマーは、ＯＰＥＲＯＮにより、ホスホラミダイト化学を用い合成
された。ＡＫＡＰ１０標的配列の増幅は、ＰＣＲ反応物５０μｌ中に、プールし
たヒトゲノムＤＮＡ１００ｎｇ−１μｇを有する単一のＰＣＲ反応物５０μｌ中
で行った。プールしたサンプル内の各ＤＮＡ濃度は、最終濃度１−２５ｎｇの範
囲の等濃度で存在した。各反応物は、１×ＰＣＲ緩衝液(Qiagen, Valencia, CA)
、２００μＭｄＮＴＰ、１Ｕ Hotstar Ｔａｑポリメラーゼ(Qiagen, Valencia,
CA)、４ｍＭＭｇＣｌ_２、ならびにユニバーサルプライマー配列および標的特
異的配列5'-TCTCAATCATGTGCATTGAGG-3'(配列番号４５)を含む２５ｐｍｏｌフォ
ワードプライマー、および２ｐｍｏｌリバースプライマー5'-AGCGGATAACAATTTCA
CACAGGGATCACACAGCCATCAGCAG-3'(配列番号４６)、ならびにＰＣＲアンプリコン
の５’末端に相補的なビオチニル化ユニバーサルプライマー１０ｐｍｏｌ 5'-AG
CGGATAACAATTTCACACAGG-3'(配列番号４７)を含む。特異的フォワードおよびリバ
ースプライマーを用いる最初のラウンドの増幅の後、次いで、５’ビオチニル化
ユニバーサルプライマーをハイブリダイズさせ、リバースプライマーとして作用
させ、それにより、３’ビオチン捕捉部分を当該分子中に導入した。当該増幅プ
ロトコールは、５’−ビオチニル化二本鎖ＤＮＡアンプリコンを生じ、遺伝子型
決定(genotyping)に用いる５’ビオチン標識各フォワードプライマーの必要性を
除くことによるハイスループット遺伝子型決定の費用を劇的に減少する。サーマ
ルサイクリングは、０．２ｍＬチューブまたは９６ウェルプレート中で、MJ Res
earch Thermal Cycler(算出温度)を用い、以下のパラメーターで行った：９４℃
５分間；４５サイクル：９４℃２０秒、５６℃３０秒、７２℃６０秒；７２℃３
分間。

【手続補正２９】

【補正対象書類名】明細書

【補正対象項目名】０２３０

【補正方法】変更

【補正の内容】

【０２３０】ＳＮＰの頻度は、年齢で選択した健康個体の集団で測定した。年齢１８−３９
歳の五百五十二(５５２)個体(２７６女性、２７６男性)および年齢６０−７９の
５５２個体(年齢６０−６９では１８４女性、年齢６０−７９では３６８男性)を
、ＡＫＡＰ１０の非翻訳３’領域中に局在する多型の存在に関し試験した。増加
する年齢の群にともなってのこの多型の頻度における相違が、健康個体で観察さ
れた。統計学的な分析により、“より若齢”および“より高齢”の集団の間の対
立遺伝子に関する対立遺伝子頻度の相違の有意なレベルは、ｐ＝０．０００９お
よび遺伝子型の有意なレベルはｐ＝０．００３であることが示された。年齢群の
間の相違は、有意である。すべての集団対立遺伝子有意性は、ｐ＝０．０００９
であり、遺伝子型の有意性は、ｐ＝０．００３である。

【手続補正３０】

【補正対象書類名】明細書

【補正対象項目名】０２３１

【補正方法】変更

【補正の内容】

【０２３１】最善の有意性を生ずるこのマーカーは、年齢分類集団における対立遺伝子およ
び遺伝子型頻度に関する結果である。図１９は、両性および集団全体における対
立遺伝子および遺伝子型頻度を示す。対立遺伝子に関する後者の有意性は、ｐ＝
０．０００９であり、遺伝子型の有意性は、ｐ＝０．００３であった。若齢およ
び高齢の集団は、ハーディ-ヴァインベルグ平衡であった。ある特定の遺伝子型
の好ましい変化は、見られなかった。

【手続補正３１】

【補正対象書類名】明細書

【補正対象項目名】０２３２

【補正方法】変更

【補正の内容】

【０２３２】多型は、ヒトプロテインキナーゼＡアンカータンパク質(ＡＫＡＰ１０)をコー
ドする遺伝子の非翻訳３’−領域中に局在する。当該遺伝子は、クロモソーム１
７に局在する。その構造には、１５エキソンおよび１４介在配列(イントロン)を
含む。コードタンパク質は、ｃＡＭＰ依存プロテインキナーゼの亜細胞局在に応
答し、それによって、Ｇ−プロテイン仲介レセプターシグナリング経路において
鍵の役割をする(Huang et al. (1007) PNAS 94: 11184-11189)。その局在は、コ
ーディング領域の外側であるため、この多型は、アミノ酸置換およびその後のタ
ンパク質の機能変化を誘引し得る他の非同義性多型と共に、ほぼ連鎖不平衡(Ｌ
Ｄ)であるようである。この遺伝子に関する異なるＧｅｎＢａｎｋデータベース
の配列比較により、さらに６つの可能性ある多型が示され、その２つ各アミノ酸
の変化が考えられる(表３参照)。

【表１】

【手続補正３２】

【補正対象書類名】明細書

【補正対象項目名】０２３３

【補正方法】変更

【補正の内容】

【０２３３】病的状態マーカー２：ヒトプロテインキナーゼＡアンカータンパク質(ＡＫＡＰ
１０−５) ＡＫＡＰ１０−５対立遺伝子(配列番号３３)の発見ゲノムＤＮＡは、ＡＫＡＰ１０−１遺伝子座で遺伝子型ＣＣを有する十七(１
７)個体および単一のヘテロ接合性個体(ＣＴ)(上記のように)の血液(上記のよう
に)から単離された。Ｃ末端ＰＫＡ結合ドメインをコードするＡＫＡＰ１０−１
遺伝子中の標的配列は、ポリメラーゼ連鎖反応を用い増幅した。ＰＣＲプライマ
ーは、ＯＰＥＲＯＮにより、ホスホラミダイト化学を用い合成した。ＡＫＡＰ１
０−１標的配列の増幅は、ヒトゲノムＤＮＡ鋳型２５ｎｇを有する各ＰＣＲ反応
物５０μｌで行った。各反応物は、１×ＰＣＲ緩衝液(Qiagen, Valencia, CA)、
２００μＭｄＮＴＰ、１Ｕ Hotstar Ｔａｑポリメラーゼ(Qiagen, Valencia, C
A)、４ｍＭＭｇＣｌ_２、ユニバーサルプライマー配列および標的特異的配列5'-
TCCCAAAGTGCTGGAATTAC-3'(配列番号５３)を含む２５ｐｍｏｌのフォワードプラ
イマー(Ｅｘ１３Ｆ)、および２ｐｍｏｌリバースプライマー(Ｅｘ１４Ｒ)5'-GTC
CAATATATGCAAACAGTTG-3'(配列番号５４)を含む。サーマルサイクリングは、０．
２ｍＬチューブまたは９６ウェルプレート中で、MJ Research Thermal Cycler(M
J Research, Waltham, MA)(算出温度)を用い、以下のサイクリングパラメーター
で行った：９４℃５分間；４５サイクル：９４℃２０秒、５６℃３０秒、７２℃
６０秒；７２℃３分間。増幅後、当該アンプリコンは、クロマトグラフィーを用
い精製した(Mo Bio Laboratories (Solana Beachm, CA))。

【手続補正３３】

【補正対象書類名】明細書

【補正対象項目名】０２３５

【補正方法】変更

【補正の内容】

【０２３５】アンプリコンのＡＫＡＰ１０−１ＳＮＰについてホモ接合性である、１７すべ
てのアンプリコンの配列は、ＡとＧが置換えられたヌクレオチド１５２１７１位
(ＡＫＡＰ１０ゲノムクローン(配列番号３５)についてＧｅｎＢａｎｋ受け入れ
番号AC005730)の多型を示す。このＳＮＰはまた、野生型ＡＫＡＰ１０(ＧｅｎＢ
ａｎｋ受け入れ番号AF037439)(配列番号３１)のｃＤＮＡクローンのヌクレオチ
ド２０７３位に位置するように設計できる。ヒトＡＫＡＰ１０タンパク質のアミ
ノ酸配列は、配列番号３２として提供する。この単一のヌクレオチド多型は、Ａ
ＫＡＰ１０−５(配列番号３３)として命名され、ヒトＡＫＡＰ１０タンパク質(
配列番号３２)のアミノ酸配列のアミノ酸６４６位でバリンとイソロイシンとの
置換を生じる。

【手続補正３４】

【補正対象書類名】明細書

【補正対象項目名】０２３６

【補正方法】変更

【補正の内容】

【０２３６】健康体ドナー集団におけるＡＫＡＰ１０−５のＰＣＲ増幅およびＢｉｏｍａｓｓ
ＰＲＯＢＥアッセイ検出年齢により層化される健康体集団は、高齢の集団と比べ若齢の集団において対
立遺伝子頻度の変化を検出し得ることにより、病的状態随伴遺伝子用の非常に有
効でユニバーサルなスクリーニングツールである。この健康体集団ベースの各サ
ンプルは、更にスループットを増加させるためプールすることができる。

【手続補正３５】

【補正対象書類名】明細書

【補正対象項目名】０２４１

【補正方法】変更

【補正の内容】

【０２４１】ＢｉｏｍａｓｓＰＲＯＢＥ(商標)アッセイを用いるＡＫＡＰ１０−５の検出ＡＫＡＰ１０−５(配列番号３３)のドナー集団のプライマー伸張分析(米国特
許番号６，０４３，０３１)のＢｉｏｍａｓｓＰＲＯＢＥ(商標)アッセイを用い
た。これらの方法を用いる遺伝子型決定は、２６ｍＭＴｒｉｓ−ＨＣｌｐＨ９
．５、６．５ｍＭＭｇＣｌ_２、５０ｍＭｄＴＴＰおよび５０ｍＭ各ｄｄＣＴ
Ｐ、ｄｄＡＴＰ、ｄｄＧＴＰ、２．５Ｕ熱安定性ＤＮＡポリメラーゼ(Amersham
)ならびに鋳型特異的オリゴヌクレオチドＰＲＯＢＥプライマー5'-ACTGAGCCTG C
TGCATAA-3'(配列番号４４)(Operon)にＤＮＡ被覆磁性ビーズを再懸濁することに
より行った。プライマー伸張は、ハイブリダイゼーションおよび伸張を伴うオリ
ゴヌクレオチドプライマーの３サイクルで生じる。当該伸張産物は、５０ｍＭ
ＮＨ_４Ｃｌで鋳型から変性させ、各サンプル１５０ｎＬを、Ｈ３ＰＡマトリック
ス物質１５０ｎｌで事前負荷したシリコンチップへ移した後、分析した。当該サ
ンプル物質を結晶化し、ＭＡＬＤＩ−ＴＯＦ(Bruker, PerSeptive)で分析した。
当該プライマーは、質量５４８３．６ダルトンを有する。ＳＮＰはプライマーに
ｄｄＣを付加し、質量５７５６．８ダルトンの伸張産物を得た。当該野生型は、
プライマーへＴおよびｄｄＧを付加し、質量６１０１ダルトンを得る。

【手続補正３６】

【補正対象書類名】明細書

【補正対象項目名】０２４４

【補正方法】変更

【補正の内容】

【０２４４】病的状態マーカー３：ヒトメチオニンスルホキシドレダクターゼＡ(ｍｓｒＡ) 両性および集団全体におけるこのマーカーの年齢関連の対立遺伝子および遺伝
子型の頻度を図２１に示す。高齢の男性集団におけるホモ接合ＣＣ遺伝子型の減
少は、高度に有意である。

【手続補正３７】

【補正対象書類名】明細書

【補正対象項目名】０２４５

【補正方法】変更

【補正の内容】

【０２４５】メチオニンスルホキシドレダクターゼＡ(＃６３３０６) ヒト健康体ドナー集団におけるヒトメチオニンスルホキシドレダクターゼＡ(ｈ
−ｍｓｒ−Ａ)のＰＣＲ増幅およびＢｉｏｍａｓｓＰＲＯＢＥアッセイ検出ｈ−ｍｓｒ−Ａのドナー集団のＰＣＲ増幅ＰＣＲプライマーは、ＯＰＥＲＯＮにより、ホスホラミダイト化学を用い合成
した。ＡＫＡＰ１０標的配列の増幅は、ＰＣＲ反応物５０μｌ中に、プールした
ヒトゲノムＤＮＡ鋳型１００ｎｇ−１μｇを有する単一のＰＣＲ反応物５０μｌ
中で行った。プールしたサンプル内の各ＤＮＡ濃度は、最終濃度１−２５ｎｇの
範囲の等濃度で存在した。各反応物は、１×ＰＣＲ緩衝液(Qiagen, Valencia, C
A)、２００μＭｄＮＴＰ、１Ｕ Hotstar Ｔａｑポリメラーゼ(Qiagen, Valenci
a, CA)、４ｍＭＭｇＣｌ_２、ならびにユニバーサルプライマー配列および標的
特異的配列5'-TTTCTCTGCACAGAGAGGGC-3'(配列番号４９)を含む２５ｐｍｏｌのフ
ォワードプライマー、および２ｐｍｏｌリバースプライマー5'-AGCGGATAACAATTT
CACACAGGGCTGAAATCCTTCGCTTTACC-3'(配列番号５０)、ならびにＰＣＲアンプリコ
ンの５’末端に相補的なビオチニル化ユニバーサルプライマー１０ｐｍｏｌ 5'-
AGCGGATAACAATTTCACACAGG-3'(配列番号５１)を含む。特異的フォワードおよびリ
バースプライマーを用いる標的の最初のラウンドの増幅の後、次いで、５’ビオ
チニル化ユニバーサルプライマーをハイブリダイズさせ、リバースプライマーと
して作用させ、それにより、３’ビオチン捕捉部分を当該分子中に導入した。当
該増幅プロトコールは、５’−ビオチニル化二本鎖ＤＮＡアンプリコンを生じ、
遺伝子型決定に用いる５’ビオチン標識各フォワードプライマーの必要性を除く
ことによってハイスル−プット遺伝子型決定の費用を劇的に減少する。サーマル
サイクリングは、０．２ｍＬチューブまたは９６ウェルプレート中で、MJ Resea
rch Thermal Cycler(算出温度)を用い、以下のサイクリングパラメーターで行っ
た：９４℃５分間；４５サイクル：９４℃２０秒、５６℃３０秒、７２℃６０秒
；７２℃３分間。

【手続補正３８】

【補正対象書類名】明細書

【補正対象項目名】０２４７

【補正方法】変更

【補正の内容】

【０２４７】ｈ−ｍｓｒ−Ａのドナー集団のＢｉｏｍａｓｓＰＲＯＢＥアッセイ分析ＢｉｏｍａｓｓＰＲＯＢＥアッセイ法を用いる遺伝子型決定は、２６ｍＭＴ
ｒｉｓ−ＨＣｌｐＨ９．５、６．５ｍＭＭｇＣｌ_２、５０ｍＭｄＴＴＰおよ
び５０ｍＭ各ｄｄＣＴＰ、ｄｄＡＴＰ、ｄｄＧＴＰ、２．５Ｕ熱安定性ＤＮＡ
ポリメラーゼ(Amersham)ならびに２０ｐｍｏｌの鋳型特異的オリゴヌクレオチド
ＰＲＯＢＥプライマー5'-CTGAAAAGGGAGAGAAAG-3'(Operon)(配列番号５２)にＤＮ
Ａ被覆磁性ビーズを再懸濁することにより行った。プライマー伸張は、ハイブリ
ダイゼーションおよび伸張を伴うオリゴヌクレオチドプライマーの３サイクルで
生じる。当該伸張産物は、５０ｍＭＮＨ_４Ｃｌで鋳型から変性させ、各サンプ
ル１５０ｎｌを、Ｈ３ＰＡマトリックス物質１５０ｎｌで事前負荷したシリコン
チップへ移した後、分析した。当該サンプル物質を結晶化し、ＭＡＬＤＩ−ＴＯ
Ｆ(Bruker, PerSeptive)で分析した。ＳＮＰは、２つのＥＳＴの配列におけるＴ
からＣへの変化として示される。野生型は、野生型ヒトｍｓｒＡ遺伝子(配列番
号３９)の一部であるＥＳＴのヌクレオチド配列を示す、ＧｅｎＢａｎｋ受け入
れ番号ＡＷ１９５１０４の１２８位にＴを有することにより示される。ＳＮＰは
、ヒトｍｓｒＡ遺伝子(配列番号４０)の対立遺伝子の一部であるＥＳＴのヌクレ
オチド配列を示す、ＧｅｎＢａｎｋ受け入れ番号ＡＷ８７４１８７の１２９位の
Ｃとして示される。

【手続補正３９】

【補正対象書類名】明細書

【補正対象項目名】０２５１

【補正方法】変更

【補正の内容】

【０２５１】多型は、ヒトメチオニンスルホキシドレダクターゼＡ(ｈ−ｍｓｒ−Ａ)をコー
ドする遺伝子の非翻訳３’−領域中に局在する。当該正確な局在は、ストップコ
ドン(ＴＡＡ)の４５１塩基対下流である。このＳＮＰは、コーディングまたはプ
ロモーターの領域よりも上流の他の多型と共に連鎖不平衡(ＬＤ)となるようであ
り；そのため、直接病的状態の原因とはならない。酵素メチオニンスルホキシド
レダクターゼは、複数の生物学的機能を示すことが提唱されている。酸化性タン
パク質損傷の修復ばかりでなく、生物学的機能の活性化または不活性化によるタ
ンパク質の制御においてまた重要な役割をする(Moskovitz et al. (1990) PNAS
95: 14071-14075)。その活性が、アルツハイマー患者の脳組織において有意に減
少することもまた示された(Gabbita et al. (1999) J. Neurochem 73: 1660-166
6)。反応性酸素種の代謝に含まれるタンパク質が疾患に関係すると、科学的に考
えられる。

【手続補正４０】

【補正対象書類名】明細書

【補正対象項目名】０２５２

【補正方法】変更

【補正の内容】

【０２５２】結論健康体集団の使用は、病的状態マーカーの同定を提供する。Ｇ−プロテイン結
合シグナリング形質導入経路にまたは酸化ストレスの緩和に含まれるタンパク質
の同定は、説得力のある結果であると考えられる。ヒトプロテインキナーゼＡア
ンカータンパク質をコードする遺伝子においてin silicoで既に同定されている
他の可能性ある多型の更なる確認および検証は、病的状態に強力に付随し、この
遺伝子産物は、適当な医薬的または診断的標的であることを証明する。

【手続補正４１】

【補正対象書類名】明細書

【補正対象項目名】０２６３

【補正方法】変更

【補正の内容】

【０２６３】Ｂ．プールしたＤＮＡサンプルを用いるグリコシラーゼ分析グリコシラーゼアッセイを、プールしたサンプルを用い構成し、ＵＣＰ−２遺
伝子配座の遺伝的多様性を検出した。既知遺伝子型のＤＮＡを１１個体からプー
ルし、固定濃度の５ｎｇ／μＬに希釈した。実施例３Ａで提供された手順は、配
列5'-CCCAGTCACGACGTTGTAAAACGTCTTGGCCTTGCAGATCCAAG-3'(配列番号９３)を有す
るフォワードプライマー２ｐｍｏｌおよび配列5'-AGCGGATAACAATTTCACACAGGCCAT
CACACCGCGGTACTG-3'(配列番号９４)を有するリバースプライマー１５ｐｍｏｌを
用いることができた。加えて、配列5'bioCCCAGTCACGACGTTGTAAAACG-3'(配列番号
９７)を有するビオチニル化プライマー５ｐｍｏｌを、約２サイクル後にＰＣＲ
反応物に導入し得る。当該フラグメントは、ＭＡＬＤＩ−ＴＯＦ質量分析法(実
施例４)で分析した。実施例３Ａで測定したように、３２５４ダルトンの特有の
フラグメントを生じるＴ対立遺伝子は、マススペクトルで、４７８８ダルトンの
特有のフラグメントを生じるＣ対立遺伝子と区別し得る。プールしたサンプルの
対立遺伝子頻度は、対立遺伝子フラグメントに相当する各シグナルの下の領域を
積算することにより定量された。積算は、当業者に既知の等式を用い手計算で行
った。１１サンプルのプールにおいて、この手順は、４０．９％の個体がＴ対立
遺伝子を保有し、５９．０９％の個体がＣ対立遺伝子を保有することを提唱した
。

【手続補正４２】

【補正対象書類名】明細書

【補正対象項目名】０２６５

【補正方法】変更

【補正の内容】

【０２６５】ＣからＴへの変化を有するＢＫＲ−２プロモーター領域中のＳＮＰに関し、Ｃ
対立遺伝子は、質量７３４２．４ダルトンを有する特有のフラグメントを生じ、
Ｔ対立遺伝子は、質量７０５３．２ダルトンを有する特有のフラグメントを生じ
た。これらフラグメントは、マススペクトルで区別できた。そのため、上記特定
した手順は、ＢＫＲ−２のプロモーター領域中のＣ対立遺伝子およびＴ対立遺伝
子についてヘテロ接合の個体を遺伝子型決定するため成功的に利用できた。

【手続補正４３】

【補正対象書類名】明細書

【補正対象項目名】０２６７

【補正方法】変更

【補正の内容】

【０２６７】加えて、繰り返し領域の数は、ＢＫＲ−２中に、２つの繰り返し配列を有する
個体と３つの繰り返し配列を有する個体とを区別できた。これら個体のＤＮＡは
、各繰り返し配列がＳＮＰ遺伝子配座でＧを含んでいるため、繰り返し配列中の
ＧからＴへの配列変化を保持していなかった。繰り返し領域の数は、質量２７７
１．６ダルトンを有する特有のＤＮＡフラグメントに相当するシグナルの下の面
積を算出することにより、個々のサンプルで決定された。２つの繰り返し領域を
有する個体から生ずるスペクトルにおけるこのシグナルは、３つの繰り返し領域
を有する個体から生ずるスペクトル中の同じシグナルの下の面積の３３％未満の
領域である、領域を有していた。そのため、上記考察の手順を用い、ＢＫＲ−２
中に存在する繰り返し領域の数について個体の遺伝子型決定することができた。

【手続補正４４】

【補正対象書類名】明細書

【補正対象項目名】０２７２

【補正方法】変更

【補正の内容】

【０２７２】実施例７Ｆｅｎリガーゼ仲介ハプロタイピングハプロタイピング手順により、個体の２つの相同性クロモソームの１つからフ
ラグメントを選択し得、そしてそのフラグメントにおける連鎖したＳＮＰを遺伝
子型決定し得る。ハプロタイプの直接決定により、情報コンテントを増加し、任
意の連鎖疾患遺伝子の診断を改善し、またはこれら疾患の関連を同定することが
できる。従前の研究では、ハプロタイプは、典型的には、系統分析(系統が利用
可能である場合)を介して、困難で信頼性のない対立遺伝子特異的ＰＣＲを介し
て、または当分野に既知の単一分子希釈を介して、再構成された。

【手続補正４５】

【補正対象書類名】明細書

【補正対象項目名】０２７４

【補正方法】変更

【補正の内容】

【０２７４】短アームアダプターには、標的ＤＮＡには見られない特有の配列を含む。短ア
ームアダプターの３'末端ヌクレオチドは、ＳＮＰ１対立遺伝子の１つと同一で
あった。更に、長アームアダプターには、２つの領域：短アームに相補的な３’
領域およびＳＮＰに隣接する目的のフラグメントに相補的な５’遺伝子特異的領
域を含む。アダプターとその相同体の１つとの間にマッチがあれば、Ｆｅｎ酵素
は、認識し、オーバーラッピングフラップを切断する。次いで、当該アダプター
の短アームを標的フラグメントの残り(ＳＮＰ部位を除く)にライゲーションした
。このライゲーションしたフラグメントを、ライゲーションした相同体のみを増
幅する第二のＰＣＲ反応のフォワードプライマーとして用いた。次いで、第二の
ＰＣＲ産物(ＰＣＲ２)を質量分析法で分析した。アダプターと標的ＤＮＡとの間
にマッチがなければ、Ｆｅｎ−１によるオーバーラップまたは切断はなく、その
ため、目的のＰＣＲ２は存在しない。

【手続補正４６】

【補正対象書類名】明細書

【補正対象項目名】０２９１

【補正方法】変更

【補正の内容】

【０２９１】Ｃ．捕捉プローブの調製捕捉プローブは、ＰＣＲ法を介し、ＧｅｎｅＡｍｐ１×ＰＣＲ緩衝液ＩＩ、
１０ｍＭＴｒｉｓ−ＨＣｌ、ｐＨ８．３、５０ｍＭＫＣｌ、２ｍＭＭｇＣｌ
_２、０．２ｍＭｄＮＴＰ混合物、各プライマー(フォワードプライマー5'-ACTGG
GCATGTGGAGACAG-3'(配列番号６６))１０ｐｍｏｌおよびビオチニル化リバースプ
ライマー bio5'-GCACTTTCTTGCCATGAG-3'(配列番号６７)、２ＵＡｍｐｌｉＴａ
ｑＧｏｌｄ、およびヒトゲノムＤＮＡ２００ｎｇを含む全体積５０μＬ中でヒ
トβ‐グロビン遺伝子を増幅することにより、調製する。当該鋳型は９４℃８分
間で変性させる。サーマルサイクリングは、９４℃２０秒、６４℃３０秒、７２
℃１分間の１１サイクルおよび７２℃５分間の最終伸張を含むタッチダウンプロ
グラムで続けた。当該アンプリコンは、UltraClean(商標) PCR clean-upキット(
MO Bio Laboratories, Solano Beach, CA)を用い精製する。

【手続補正４７】

【補正対象書類名】明細書

【補正対象項目名】０２９６

【補正方法】変更

【補正の内容】

【０２９６】実施例１０健康体データベースの層化のための親病歴パラメーターの典型的使用健康体データベースを用い、年齢と対立遺伝子、特にホモ接合遺伝子型との間
に強力な関係が見られることが判明した特定対立遺伝子(ＳＮＰ)と疾患状態とを
関連させることができる。当該方法は、年齢に依存する関連性の同定に用いられ
る同じ健康体データベースを用いることを含むが、層化は、両親が患っている通
常疾患(ドナーの家族性の病歴)に関するドナーにより提供される情報に基づく。
ドナーが両親の健康状態に関し得られる３つの可能性ある答えがある：全く影響
はない、一方の影響を受ける、または両方の影響を受ける。ドナーの両親が臨床
的疾患の表現型が見られるぐらいにまで加齢していなければならないため、疾患
に依存して、特定の最小年齢を超えるドナーのみを用いる。これらの各群の遺伝
子型頻度が決定され、互いに比較される。ドナーのマーカーが疾患と関連すれば
、ヘテロ接合遺伝子型の頻度は増大する。ホモ接合遺伝子型の頻度は、健康体集
団において表示不足（underrepresented）が有意であるため、増大しない。

【手続補正４８】

【補正対象書類名】明細書

【補正対象項目名】０３０７

【補正方法】変更

【補正の内容】

【０３０７】ここで図２７について言及すると、未処理質量分析法データのウェーブレット
変換を一般的にダイアグラム化する。ウェーブレット変換技術を用い、その後、
質量分析法データ７０をステージに変換する。各ステージステップでは、当該デ
ータをＨｉステージおよびＬｏｗステージにおいて示し、Ｌｏｗステージは次の
その後のステージへの入力として作用する。例えば、質量分析法データ７０を、
ステージ０ハイデータ８２およびステージ０ローデータ８３に変換する。次いで
、ステージ０ローデータ８３を次のレベルの変換への入力として用い、ステージ
１ハイデータ８４およびステージ１ローデータ８５を得る。同様の方法で、ステ
ージ１ローデータ８５を、ステージ２ハイデータ８６およびステージ２ローデー
タ８７へ変換する入力として使用する。変換は、より有用な情報が更なるウェー
ブレット変換により得ることができなくなるまで、続ける。例えば、好ましい実
施態様では、２４ポイントウェーブレットを用いる。より特に、Daubechies２４
として通常言及されるウェーブレットを用い、未処理データを分解する。しかし
、他のウェーブレットがウェーブレット変換に使用できることが認識される。ウ
ェーブレット変換の各ステージは前のステージのデータポイントの半分となるた
め、ウェーブレット変換は、ステージｎローデータ８９が約５０ポイントとなる
まで続けることができる。従って、ステージｎハイ８８は、約１００データポイ
ントを含む。好ましいウェーブレットは２４ポイント長であるため、小さなデー
タまたは情報が、約５０ポイントのデータセットにおいてウェーブレット変換続
けることにより得ることができる。

【手続補正４９】

【補正対象書類名】明細書

【補正対象項目名】０３１２

【補正方法】変更

【補正の内容】

【０３１２】図３１は、どのようにノイズプロファイルを各ステージのデータに適用するか
を示す。一般にノイズプロファイルを用い、各ステージのデータに適用するスレ
ショルド(threshold)を得る。ノイズプロファイルを既にスケール化し、各ステ
ージのノイズコンテントを調製するため、スレショルドの算出により、除かれる
ノイズの量を調節する調製が可能となる。スレショルド未満のウェーブレット係
数は無視でき、その一方、スレショルドの上のものは維持される。従って、残り
データは、除かれるノイズコンテントの実質的な一部を有する。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｃ１２Ｑ 1/44 Ｃ１２Ｑ 1/48 Ｚ 1/48 1/68 Ａ 1/68 ＺＧ０１Ｎ 27/62 ＤＧ０１Ｎ 27/62 Ｖ 33/53 Ｍ 33/53 33/566 33/566 Ｇ０６Ｆ 17/60 １２６ＧＧ０６Ｆ 17/60 １２６ 19/00 １３０ 19/00 １３０Ｃ１２Ｎ 15/00 ＺＮＡＡ (31)優先権主張番号６０／２１７，２５１ (32)優先日平成12年７月10日(2000．7．10) (33)優先権主張国米国（ＵＳ） (31)優先権主張番号０９／６６３，９６８ (32)優先日平成12年９月19日(2000．9．19) (33)優先権主張国米国（ＵＳ） (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＭＺ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＧ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＢＺ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＤＺ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＡ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＭＺ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷ (72)発明者ディルク・バン・デン・ボームドイツ連邦共和国デー−20253ハンブルク、エッペンドルファー・ベーク205デー番 (72)発明者イップ・ピンアメリカ合衆国92116カリフォルニア州サンディエゴ、コプリー・アベニュー3641番 (72)発明者チャーリー・ロディアメリカ合衆国92014カリフォルニア州デル・マー、レクエルド・ドライブ13823番 (72)発明者ヘ・リヤンアメリカ合衆国92128カリフォルニア州サンディエゴ、クリーク・ブリッジ・プレイス10948番 (72)発明者ノーマン・チウアメリカ合衆国92126カリフォルニア州サンディエゴ、カミニト・アルバレス1128番 (72)発明者クリスティアン・ユリンケドイツ連邦共和国デー−20255ハンブルク、ロンベルクシュトラーセ22番Ｆターム(参考） 4B024 AA11 CA01 CA02 DA02 DA03 DA05 DA11 HA11 HA12 HA19 4B029 AA07 AA23 BB01 BB02 BB06 BB11 BB15 BB20 FA01 FA02 FA03 FA04 GB02 HA09 4B063 QA05 QA13 QA17 QA18 QA19 QA20 QQ03 QQ05 QQ06 QQ07 QQ08 QQ42 QQ43 QQ67 QQ70 QQ79 QR06 QR07 QR08 QR13 QR14 QR20 QR32 QR55 QR62 QS02 QS10 QS24 QS25 QS26 QS28 QS32 QS34 QS36 QS39 QX04 5B075 ND20 UU19 UU26

Claims

【特許請求の範囲】

【請求項１】血液、組織、体液、細胞、種子、微生物、病原体および生殖
組織のサンプルからなる群から選択される、複数のサンプル；および各サンプルのソースおよび／または履歴（history）を表す、サンプルを含むコ
ンテナーのシンボロジー：を含む標的集団由来のサンプルのサブコレクション；ここで、標的集団は疾患状態について選択されていない健康体集団であり；コレクションは健康体集団からのサンプルを含み；そしてサブコレクションは特異的なパラメータにしたがって該コレクションを分類する
ことにより得られる。
【請求項２】パラメータが、人種、年齢、性、身長、体重、アルコール摂
取量、妊娠回数、生児出生回数、菜食主義者、肉体的活動の型、住居の状態およ
び／または特定の状態における居住の期間、教育レベル、親の死亡年齢、親の死
亡原因、過去のまたは現在の喫煙者、喫煙者としての期間、喫煙頻度、肉親(親
、兄妹、子供)における疾患の発生、処方薬の使用および／またはその理由、入
院の期間および／または回数、および環境要因にさらされること、からなる群から選択される、請求項１のサブコレクション。
【請求項３】シンボロジーがバーコードである請求項１のサブコレクショ
ン。
【請求項４】集団の健康体のメンバーを同定すること；同定のための(identifying)情報を含むデータを取得し、同定された該集団のメ
ンバーおよびそれらの肉親に関連する、履歴情報およびデータを取得すること；該集団の各メンバーについてデータをデータベースに入力し、メンバーおよびデ
ータをインデクサー(indexer)で連関させること：を含むデータベースの作成方法。
【請求項５】体組織または体液のサンプルを取得すること、サンプル中の体組織または体液を分析すること；および各メンバーについて分析結果をデータベースに入力し、それぞれの結果を各メン
バーを表すインデクサーと連関させること：をさらに含む、請求項４の方法。
【請求項６】請求項４の方法により作成されたデータベース。
【請求項７】請求項５の方法により作成されたデータベース。
【請求項８】各データポイントが、生物型および他の同定のための情報を
表すデータと連関される、生物学的サンプルが取得される、複数の健康体の生物
を表すデータポイント；を含むデータベース。
【請求項９】データポイントが、人種、年齢、性、身長、体重、アルコー
ル摂取量、妊娠回数、生児出生回数、菜食主義者、肉体的活動の型、住居の状態
および／または特定の状態における居住の期間、教育レベル、親の死亡年齢、親
の死亡原因、過去のまたは現在の喫煙者、喫煙者としての期間、喫煙頻度、肉親
(親、兄妹、子供)における疾患の発生、処方薬の使用および／またはその理由、
入院の期間および／または回数、および環境要因にさらされること、からなる群から選択される、１または２以上のパラメータに関する質問に対する
回答である、請求項８のデータベース。
【請求項１０】生物が哺乳動物であり、かつサンプルが体液または組織で
ある、請求項９のデータベース。
【請求項１１】サンプルが血液、血液画分、細胞および亜細胞性のオルガ
ネラから選択される、請求項９のデータベース。
【請求項１２】生物由来の表現型データをさらに含む、請求項８のデータ
ベース。
【請求項１３】データが身体的形質、バックグラウンドデータ、医療デー
タ、および履歴データをうちの１つを含む、請求項１２のデータベース。
【請求項１４】生物から取得した核酸からの遺伝子型のデータをさらに含
む、請求項８のデータベース。
【請求項１５】遺伝子型データが、遺伝的マーカー、非コード領域、マイ
クロサテライト、ＲＦＬＰ、ＶＮＴＲ、生物の履歴データ、病歴、表現型の情報
を含む、請求項１４のデータベース。
【請求項１６】リレーショナルデータベースである、請求項８のデータベ
ース。
【請求項１７】データが、データを取得したそれぞれの生物を表すインデ
クサーデータポイントに関連するものである、請求項１６のデータベース。
【請求項１８】多型を同定すること；および多型の遺伝子座に連鎖した、任意の経路または遺伝子を同定すること：を含む候補遺伝的マーカーである多型を同定する方法であって、該多型が、健康体の対象を含む標的集団と連関したサンプルで同定される方法。
【請求項１９】多型が、 a)第１のオリゴヌクレオチドを標的核酸とハイブリダイズさせること； b)第２のオリゴヌクレオチドを標的核酸の隣接領域とハイブリダイズさせること
； c)ハイブリダイズしたオリゴヌクレオチドをライゲートさせること；および c)標的核酸の存在を指標として、ハイブリダイズした第１のオリゴヌクレオチド
を質量分析法により検出すること：のステップを含む方法でサンプル中の標的核酸の存在を検出することにより同定
される、請求項１８の方法。
【請求項２０】多型が、 a)第１のオリゴヌクレオチドを標的核酸とハイブリダイズさせ、第２のオリゴヌ
クレオチドを標的核酸の隣接領域とハイブリダイズさせること； b)ハイブリダイズした第１および第２のオリゴヌクレオチドを切断酵素と接触さ
せて切断生成物を形成させること；および c)標的核酸の存在を指標として質量分析法により切断生成物を検出すること：のステップを含む方法でサンプル中の標的核酸を検出することにより同定される
、請求項１８の方法。
【請求項２１】サンプルが健康体のデータベース由来のものである、請求
項２０の方法。
【請求項２２】プライマーオリゴ塩基伸長法(ＰＲＯＢＥ法)でサンプル中
の標的核酸を同定することにより多型を同定する、請求項１８の方法。
【請求項２３】プライマーオリゴ塩基伸長法が、 a)標的ヌクレオチドを含む核酸分子を取得すること； b)所望により核酸分子を固体支持体上に固定し、固定された核酸分子を作成する
こと； c)核酸分子を、標的ヌクレオチドに隣接した部位で、核酸分子に相補的なプライ
マーオリゴヌクレオチドとハイブリダイズさせること； d)ステップc)の生成物をジデオキシヌクレオシド・トリホスフェートまたは３'
−デオキシヌクレオシド・トリホスフェートおよびポリメラーゼを含むコンポジ
ションと接触させ、その結果、標的ヌクレオチドに相補的なジデオキシヌクレオ
シド・トリホスフェートまたは３'−デオキシヌクレオシド・トリホスフェート
のみをプライマー上で伸長させること；および e)伸長したプライマーを検出し、それにより標的ヌクレオチドを同定すること：を含む、請求項２２の方法。
【請求項２４】伸長したプライマーの検出を質量分析法により実施する請
求項２３の方法であって、ステップd)の生成物をイオン化し、気化させること；および質量分析法により伸長したプライマーを検出し、それにより標的ヌクレオチドを
同定すること；を含む方法。
【請求項２５】サンプルをチップ上のアレイとして質量分析計に提供し；
そして各サンプルが、マトリックス介助レーザー脱離／イオン化(ＭＡＬＤＩ)質量分析
法で使用される質量分析計におけるレーザーにより発射されたレーザースポット
ほどの大きさの体積を占める、請求項２４の方法。
【請求項２６】対象が健康体である、サンプルが取得される対象を表すデ
ータポイントと連関されるパラメータを含むデータベース；およびサンプルが取得された対象をインデックスが同定する、インデックスを付された
サンプルのコレクション；を含む組み合わせ。
【請求項２７】パラメータが人種、年齢、性、身長、体重、アルコール摂
取量、妊娠回数、生児出生回数、菜食主義者、肉体的活動の型、住居の状態およ
び／または特定の状態における居住の期間、教育レベル、親の死亡年齢、親の死
亡原因、過去のまたは現在の喫煙者、喫煙者としての期間、喫煙頻度、肉親(親
、兄妹、子供)における疾患の発生、処方薬の使用および／またはその理由、入
院の期間および／または回数、および環境要因にさらされること、からなる群から選択される、請求項２６の組み合わせ。
【請求項２８】データベースが、各対象の遺伝子型のデータをさらに含む
、請求項２６の組み合わせ。
【請求項２９】サンプルが血液である、請求項２６の組み合わせ。
【請求項３０】請求項８のデータベースを含むデータ蓄積媒体。
【請求項３１】請求項８のデータベースを含むコンピューターシステム。
【請求項３２】反応容器中に含まれる生物学的サンプルに対して、それぞ
れが処理(procedure)を実行する複数のプロセシング・ステーションを含むプロ
セスライン；プロセシング・ステーションからプロセシング・ステーションへと反応容器を運
ぶロボットシステム；プロセスラインのテスト結果を受け取り、テスト結果を自動的にプロセッシング
し、反応容器中の生物学的サンプルに関して決定をするデータ解析システム；各プロセシング・ステーションでのテストをいつ終了させるかを決定し、それに
応じて、反応容器を次のテストステーションへと移動させ、コントロールシステ
ムが停止の指示を受けるまで逐次、反応容器を連続的にプロセッシングするコン
トロールシステム；および自動化されたプロセスラインによりテストされるサンプルがデータベース内の対
象からのサンプルを含む請求項８のデータベース：を含む生物学的サンプルのハイスループットプロセシングシステム。
【請求項３３】プロセシング・ステーションのうちの１つが質量分析計を
含む、請求項３２のシステム。
【請求項３４】生物学的サンプルに関するテストデータが１または２以上
のシグナルを含むように、データ解析システムが質量分析計からのテストデータ
を受け取ることによりテスト結果をプロセッシングし、その後、データ解析シス
テムが各シグナルの曲線の下の面積を決定し、その結果を正規化し、テストされ
たサンプル中のコンポーネントの相対量を表す実質的に定量的な結果を取得する
、請求項３２のシステム。
【請求項３５】生物学的サンプルのハイスループットプロセシングのため
の方法であって：反応容器中に含まれる１または２以上の生物学的サンプルに対してそれぞれが処
理を実行する、複数のプロセシング・ステーションを有するプロセスラインを含
んだ請求項３２のシステムにしたがって反応容器を運ぶこと；各プロセシング・ステーションでのテスト処理をいつ終了させるかを決定し、そ
れに応答して、反応容器を次のプロセシング・ステーションに移動させること；プロセスラインのテスト結果を受け取り、自動的にテスト結果をプロセッシング
し、反応容器中の生物学的サンプルに関してデータ解析決定を作成すること；そ
して停止の指示を受けるまで逐次連続的に反応容器を処理すること；を含む方法；ここで、自動化されたプロセスラインによりテストされるサンプルには、データベース内
の患者由来のサンプルが含まれる。
【請求項３６】プロセシング・ステーションのうちの１つが質量分析計を
含む、請求項３５の方法。
【請求項３７】サンプルが、プライマーオリゴ塩基伸長法(ＰＲＯＢＥ法)
を含む方法により解析される、請求項３６の方法。
【請求項３８】生物学的サンプルに関するテストデータが１または２以上
のシグナルまたはシグナルを表す絶対値を含むように、質量分析計からのテスト
データを受け取ることによりテスト結果をプロセッシングし、その後、データ解
析システムが各シグナルの曲線の下の面積を決定し、その結果を正規化し、テス
トされたサンプル中のコンポーネントの相対量を表す実質的に定量的な結果を取
得すること：をさらに含む請求項３７の方法。
【請求項３９】プライマーオリゴ塩基伸長法が、 a)標的ヌクレオチドを含む核酸分子を取得すること； b)所望により核酸分子を固体支持体上に固定し、固定された核酸分子を作成する
こと； c)核酸分子を、標的ヌクレオチドに隣接した部位で核酸分子に相補的なプライマ
ーオリゴヌクレオチドとハイブリダイズさせること； d)ステップc)の生成物をジデオキシヌクレオシド・トリフォスフェートまたは３
'−デオキシヌクレオシド・トリホスフェートおよびポリメラーゼを含むコンポ
ジションと接触させ、その結果、標的ヌクレオチドに相補的なジデオキシヌクレ
オシドまたは３'−デオキシヌクレオシド・トリホスフェートのみをプライマー
上で伸長させること；および e)プライマーを検出し、それにより標的ヌクレオチドを同定すること：を含む、請求項３７の方法。
【請求項４０】伸長したプライマーの検出を質量分析法により実施する、
請求項３９の方法であって、ステップd)の生成物をイオン化し、気化させること；および質量分析法により伸長したプライマーを検出し、それにより標的ヌクレオチドを
同定すること；を含む方法。
【請求項４１】サンプル中の標的核酸が、 a)第１のオリゴヌクレオチドを標的核酸とハイブリダイズさせること； b)第２のオリゴヌクレオチドを標的核酸の隣接領域とハイブリダイズさせること
； c)次いでハイブリダイズしたオリゴヌクレオチドをライゲートさせること；およ
び c)標的核酸の存在を指標として、ハイブリダイズした第１のオリゴヌクレオチド
を質量分析法により検出すること：のステップを含む方法により検出および／または同定される、請求項３６の方法
。
【請求項４２】サンプル中の標的核酸が、 a)第１のオリゴヌクレオチドを標的核酸とハイブリダイズさせ、第２のオリゴヌ
クレオチドを標的核酸の隣接領域とハイブリダイズさせること； b)ハイブリダイズした第１および第２のオリゴヌクレオチドを切断酵素と接触さ
せて切断生成物を形成させること；および c)標的核酸の存在を指標として質量分析法により切断生成物を検出すること：のステップを含む方法により、検出および／または同定される、請求項３６の方
法。
【請求項４３】集団の中から健康体のメンバーを同定すること；該集団の同定されたメンバーに関する、同定のためのおよび履歴情報およびデー
タを取得すること；該集団の同定された各メンバーに関するデータをコンピューターメモリーデータ
ベースに入力し、メンバーおよびデータをインデクサー(indexer)で連関させる
こと：を含む、コンピューターメモリーに蓄積されたデータベースの作成方法。
【請求項４４】同定されたメンバーの体組織または体液サンプルを取得す
ること、サンプル中の体組織または体液を分析すること；および各メンバーの分析結果をコンピューターメモリーデータベースに入力し、それぞ
れの結果を各メンバーを表すインデクサーと連関させること：をさらに含む、請求項４３の方法。
【請求項４５】請求項４３の方法により作成されたデータベース。
【請求項４６】請求項４４の方法により作成されたデータベース。
【請求項４７】生物が動物、細菌、真菌、原生生物および寄生生物の中か
ら選択され、各データポイントが生物型および同定のための情報を表すパラメータと連関され
ている、請求項８のデータベース。
【請求項４８】各対象に関する表現型のデータをさらに含む、請求項４３
のデータベース。
【請求項４９】リレーショナルデータベースであり、かつパラメータが質
問票の質問に対する回答である、請求項４７のデータベース。
【請求項５０】遺伝子型データが、遺伝的マーカー、非コード領域、マイ
クロサテライト、制限フラグメント長多型(ＲＦＬＰ)、数のさまざまな縦列反復
(ＶＮＴＲ)、生物の履歴の日（historical day of the organism）、対象の病歴
、表現型の情報、および他の情報を含むが、これらに限定されない、対象の核酸
の遺伝子型のデータをさらに含む、請求項８のデータベース。
【請求項５１】データ記録が、集団の健康体メンバーを同定する情報を含
み、また、同定されたメンバーに関する、同定のための、および履歴情報および
データを含む、コンピューターメモリーに蓄積されたデータ記録を含むデータベ
ース。
【請求項５２】集団の各メンバーを、同定のための、および履歴情報およ
びデータと連関させる、それぞれ同定されたメンバーに関する、インデックス値
(index value)をさらに含む、請求項５１のデータベース。
【請求項５３】請求項５１のデータベースを含むコンピューターシステム
。
【請求項５４】請求項５１のデータベースを含む自動化されたプロセスラ
イン。
【請求項５５】多型を同定すること；および健康体集団において加齢に伴う、人種に伴う、または性に伴う多型の頻度を決
定すること：を含む年齢、人種または性と相関のある多型の決定方法。
【請求項５６】多型を同定すること；および健康体集団において加齢に関する多型の頻度を決定すること：を含む、病的状態（morbidity）に対する感受性、早期死亡（early mortality）
、または病的状態および早期死亡と多型が相関するかどうかを決定する方法。
【請求項５７】評価されるべき健康体の標的集団および遺伝的変異を選択
すること；集団のメンバーから取得した生体高分子の複数のサンプルをプールすること；変異を含む生体高分子を質量分析法により決定または検出すること；マススペクトルまたはそのデジタル表示を取得すること；および該集団の変異の頻度を決定すること：を含む遺伝的変異の頻度のハイスループット決定方法。
【請求項５８】変異が対立遺伝子変異、翻訳後修飾、核酸修飾、標識、核
酸の質量的修飾およびメチル化からなる群から選択され；そして／または関心のある生体高分子の濃度がそれぞれのサンプルにおいて同じである、生体高
分子が核酸、タンパク質、多糖類、脂質、低分子有機メタボラリトまたは中間体
であり；そして／または該頻度が、ゲノム変異を含む生体高分子の質量に対応する、マススペクトルまた
はそのデジタル表示のピークの下の面積を決定することを含む方法を評価するこ
とにより決定される；請求項５７の方法。
【請求項５９】頻度の決定方法が、バックグランドが補正されている、全
体のマススペクトルの総面積に対するシグナルまたはそのデジタル表示の比率を
決定することにより実施される、請求項５８の方法。
【請求項６０】選択されたパラメータにしたがって請求項８のデータベー
スを分類し、選択されたパラメータにマッチするサンプルを同定すること；それぞれの同定されたサンプルから生体高分子を単離すること；所望によりそれぞれ単離された生体高分子をプールすること；所望により生体高分子の量を増幅すること；プールした生体高分子を切断して、そのフラグメントを生成させること；得られるフラグメントのマススペクトルを取得し、対照のマススペクトルとマス
スペクトルを比較し、スペクトル間の相違を同定し、それによって任意の多型を
同定すること；を含む集団における多型の発見方法；ここで、該対照のマススペクトルは、コレクション中の未分類のサンプルまたは異なるパ
ラメーターに従って分類されたサンプルから取得される。
【請求項６１】切断が生体高分子を酵素と接触させることにより行われる
、請求項６０の方法。
【請求項６２】酵素がヌクレオチドグリコシラーゼ、ニッカーゼおよびII
Ｓ型制限酵素からなる群から選択される、請求項６１の方法。
【請求項６３】生体高分子が核酸またはタンパク質である、請求項６０の
方法。
【請求項６４】質量分析の形式がマトリックス介助レーザー脱離／イオン
化、飛行時間型(ＭＡＬＤＩ-ＴＯＦ)、電子スプレー(ＥＳ)、ＩＲ−ＭＡＬＤＩ
、イオンサイクロトロン共鳴(ＩＣＲ)、フーリエ変換およびそれらの組み合わせ
の中から選択される、請求項６０の方法。
【請求項６５】複数の生物から体組織または体液のサンプルを取得するこ
と；各サンプルから生体高分子を単離すること；それぞれの単離された生体高分子をプールすること；所望により生体高分子の量を増幅すること；プールした生体高分子を切断し、そのフラグメントを生成させること；得られるフラグメントのマススペクトルを取得すること；各フラグメントの頻度を比較し、平均的な頻度より少ない量で存在するフラグメ
ントを同定し、それによって任意の多型を同定すること：を含む集団における多型の発見方法。
【請求項６６】切断が生体高分子を酵素と接触させることによりおこなわ
れる、請求項６５の方法。
【請求項６７】酵素がヌクレオチドグリコシラーゼ、ニッカーゼおよびII
Ｓ型制限酵素からなる群から選択される、請求項６６の方法。
【請求項６８】生体高分子が核酸またはタンパク質である、請求項６５の
方法。
【請求項６９】質量分析の形式がマトリックス介助レーザー脱離/イオン
化、飛行時間型(ＭＡＬＤＩ-ＴＯＦ)、電子スプレー(ＥＳ)、ＩＲ−ＭＡＬＤＩ
、イオンサイクロトロン共鳴(ＩＣＲ)、フーリエ変換およびそれらの組み合わせ
の中から選択される、請求項６５の方法。
【請求項７０】サンプルが健康体の対象から取得される、請求項６５の方
法。
【請求項７１】選択されたパラメータにしたがって請求項８のデータベー
スを分類し、選択されたパラメータにマッチするサンプルを同定すること；それぞれの同定されたサンプルから生体高分子を単離すること；それぞれ単離された生体高分子をプールすること；所望により生体高分子の量を増幅すること；プールした生体高分子における多型の頻度を決定すること；を含む多型をパラメータと相関させる方法；ここで、対象と比較したときの多型の頻度の変化は、多型と選択されたパラメータとの相
関を示しており；そして該対照は、未分類のデータベースまたは異なるパラメータに従って分類されてい
るデータベースより同定されたサンプルから取得した、プールした生体高分子に
おける多型の頻度である。
【請求項７２】パラメータが、人種、年齢、性、身長、体重、アルコール
摂取量、妊娠回数、生児出生回数、菜食主義者、肉体的活動の種類、住居の状態
および／または特定の状態における居住の期間、教育レベル、親の死亡年齢、親
の死亡原因、過去のまたは現在の喫煙者、喫煙者としての期間、喫煙頻度、肉親
(親、兄妹、子供)における疾患の発生、処方薬の使用および／またはその理由、
入院の期間および／または回数、および環境要因にさらされること、からなる群から選択される、請求項７１の方法。
【請求項７３】パラメータが疾患の発生または肉親のメンバーにおける特
定の疾患であり、それによって多型を該疾患と相関させる、請求項７２の方法。
【請求項７４】プールした生体高分子がプールした核酸分子である、請求
項７１の方法。
【請求項７５】多型がプライマーオリゴ塩基伸長法(ＰＲＯＢＥ法)により
検出される、請求項７４の方法。
【請求項７６】プライマーオリゴ伸長法が、 a)所望により核酸分子を固体支持体上に固定し、固定された核酸分子を作成する
こと； b)核酸分子を、多型に隣接した部位で核酸分子に相補的なプライマーオリゴヌク
レオチドとハイブリダイズさせること； c)ステップc)の生成物をジデオキシヌクレオシド・トリホスフェートまたは３'
−デオキシヌクレオシド・トリホスフェートおよびポリメラーゼを含むコンポジ
ションと接触させ、その結果、多型に相補的なジデオキシヌクレオシド・トリホ
スフェートまたは３'−デオキシヌクレオシド・トリホスフェートのみをプライ
マー上で伸長させること；および d)伸長したプライマーを検出し、それによりプールした核酸中の核酸分子におけ
る多型を検出すること：を含む、請求項７５の方法。
【請求項７７】検出が質量分析法により行われる、請求項７６の方法。
【請求項７８】頻度が、多型を含むプールした核酸中の核酸分子のパーセ
ンテージである、請求項７１の方法。
【請求項７９】比率がプールした核酸のマススペクトルを取得することに
より決定される、請求項７８の方法。
【請求項８０】パラメータが年齢であり、それによって多型を病的状態に
対する感受性、早期死亡、または病的状態および早期死亡と相関させる、請求項
７２の方法。
【請求項８１】 (a)選択されたパラメータにしたがって請求項８のデータ
ベースを分類し、選択されたパラメータにマッチするサンプルを同定すること； (b)それぞれの同定されたサンプルから核酸を単離すること； (c)所望によりそれぞれの単離された核酸をプールすること； (d)核酸の量を増幅すること； (e)１本鎖核酸を形成させ、それぞれの１本鎖を別個の反応容器に分けること； (f)それぞれの１本鎖核酸をアダプター核酸と接触させ、アダプター複合体を形
成させること； (g)アダプター複合体をヌクレアーゼおよびリガーゼと接触させること； (h)ステップ(g)の生成物を、ライゲートしたアダプターを増幅することができる
混合物と接触させ、伸長した生成物を生成させること； (i)ステップ(h)から得られるそれぞれの核酸のマススペクトルを取得し、伸長し
た生成物に対応するシグナルを同定することにより多型を検出すること； (j)同じ鎖上の異なる配列にハイブリダイズする別のアダプター核酸とハイブリ
ダイズ可能な核酸を利用して、ステップ(f)〜(i)を繰り返すこと；を含む、核酸中の多型をハプロタイピングする方法；ここで、該多型は１より多い伸長生成物を検出することによりハプロタイピングされる。
【請求項８２】ヌクレアーゼがＦｅｎ−１である、請求項１の方法。
【請求項８３】選択されたパラメータにしたがって請求項８のデータベー
スを分類し、選択されたパラメータにマッチするサンプルを同定すること；それぞれの同定されたサンプルから核酸を単離すること；それぞれ単離された核酸をプールすること；所望により核酸の量を増幅すること；核酸を少なくとも１つの酵素と接触させ、そのフラグメントを生成させること；得られるフラグメントのマススペクトルを取得すること；を含む、集団中の多型をハプロタイピングする方法；ここで、該多型は、多型に対応するシグナルを検出することにより検出され；そして該多型は、核酸の同じ鎖に位置する多型のマススペクトルから決定することによ
りハプロタイピングされる。
【請求項８４】酵素がニッカーゼである、請求項８３の方法。
【請求項８５】ニッカーゼがＮＹ２ＡおよびＮＹＳ１からなる群から選択
される、請求項８４の方法。
【請求項８６】核酸内のメチル化されたヌクレオチドの検出方法であって
、核酸のサンプルを別個の反応容器に分けること；１つの反応容器中の核酸を亜硫酸水素塩と接触させること；各反応容器中の核酸を増幅すること；各反応容器中の核酸を切断し、そのフラグメントを生成させること；１つの反応容器から得られるフラグメントのマススペクトル、および別の反応容
器から得られるフラグメントの別のマススペクトルを取得すること；を含む方法；ここで、シトシンのメチル化はマススペクトル間のシグナルの相違を同定することにより
検出される。
【請求項８７】増幅のステップがウラシルの存在下で行われ；そして切断のステップがウラシルグリコシラーゼにより行われる：請求項８６の方法。
【請求項８８】生物学的サンプルのコンポジションを示すデータセットを
作成すること；データセットのノイズを除去し、ノイズが除去されたデータを作成すること；ノイズが除去されたデータからベースラインを削除し、中間データセット（inte
rmediate data set）を作成すること；生物学的サンプルに関して推定されるピークを定義すること；推定されるピークを用いて残留ベースライン(residual baseline)を作成するこ
と；残留ベースラインを中間データセットから除いて、補正されたデータセットを作
成すること；残留ベースラインを除去することに応じて、補正されたデータセット中で有り得
るピーク(probable peak)を位置決定すること；および位置決定した有り得るピークを用いて生物学的サンプルを同定すること；を含む、生物学的サンプルの同定方法；ここで、作成される生物学的サンプルデータセットは、アッセイ用のフラグメン
トのセンス鎖およびアンチセンス鎖からのデータを含む。
【請求項８９】同定が、センス鎖とアンチセンス鎖からのデータを組み合わせること、およびデータを予
測されるセンス鎖およびアンチセンス鎖の値と比較して生物学的サンプルを同定
することを含む、請求項８８に記載の方法。
【請求項９０】有り得るピークが、センス鎖のデータ由来であるか、アン
チセンス鎖のデータ由来であるかに従い、当該同定が、有り得るピークについて
ピーク確率を導くことを含む、請求項８８に記載の方法。
【請求項９１】当該同定が、有り得るピークについてピーク確率を導くこ
と、および有り得るピークの下の算出した面積と、データセットにおけるすべて
のピークの下の算出した予測される平均面積との比率に応じて、対立遺伝子ペナ
ルティーを適用することを含む、請求項８８に記載の方法。
【請求項９２】生物学的サンプルのコンポジションを示すデータセットを
作成すること；データセットのノイズを除去し、ノイズが除去されたデータを作成すること；ノイズが除去されたデータからベースラインを削除し、中間データセットを作成
すること；生物学的サンプルに関して推定されるピークを定義すること；推定されているピークを用いて残留ベースラインを作成すること；残留ベースラインを中間データセットから除いて、補正されたデータセットを作
成すること；残留ベースラインを除去することに応じて、補正されたデータセット中で有り得
るピークを位置決定すること；および位置決定した有り得るピークを用いて生物学的サンプルを同定すること；を含む、生物学的サンプルの同定方法；ここで、当該同定には、有り得るピークについてピーク確率を導くこと、および有り得る
ピークの下の算出した面積と、データセットにおけるすべてのピークの下の算出
される予測される面積との比率に応じて、対立遺伝子ペナルティーを適用するこ
とが含まれる。
【請求項９３】同定が、適用される対立遺伝子ペナルティーを受け取らな
かった有り得るピークからのデータを比較し、オリゴヌクレオチドの生物学的デ
ータにしたがってそれらの質量を決定することを含む、請求項９２に記載の方法
。
【請求項９４】対立遺伝子ペナルティーが、予測される面積値に対するピ
ークの下の面積の比率が３０％より大きい、有り得るピークには適用されない、
請求項９２に記載の方法。
【請求項９５】核酸の領域を増幅しアプリコンを作成すること、ここで、
得られるアプリコンには１または２以上の酵素制限部位が含まれ；アプリコンを制限酵素と接触させ、フラグメントを作成すること；得られるフラグメントのマススペクトルを取得すること、および請求項８８の方
法によりマススペクトルのシグナルを解析すること；を含む、核酸中の多型の検出方法；ここで、該多型はシグナルのパターンから検出される。
【請求項９６】核酸、胎児組織、タンパク質のサンプルからなる群から選
択される、複数のサンプル；および各サンプルのソースおよび／または履歴を表す、サンプルを含むコンテナーのシ
ンボロジー；を含む標的集団由来のサンプルのサブコレクション；ここで、該標的集団は疾患状態で選択されていない健康体集団であり；該コレクションは、健康体集団からのサンプルを含み；そして該サブコレクションは、特異的なパラメータにしたがってコレクションを分類す
ることにより得られる。
【請求項９７】サンプルが核酸、胎児組織、タンパク質、組織、体液、細
胞、種子、微生物、病原体および生殖組織のサンプルからなる群から選択される
、請求項２６の組み合わせ。
【請求項９８】請求項８のデータベースおよび質量分析計を含む組み合わ
せ。
【請求項９９】生物学的サンプルを解析するための自動化されたプロセス
ラインである、請求項９８の組み合わせ。
【請求項１００】請求項８のデータベース、ここでサンプルはデータベー
ス内の対象由来のサンプルを含む自動化されたプロセスラインによりテストされ
；およびサンプル内の生体高分子の解析のための質量分析法：を含む、生物学的サンプルのハイスループットプロセシングのためのシステム。