JP2008541696A - 毒物を評価するための新規な方法およびデバイス - Google Patents

毒物を評価するための新規な方法およびデバイス Download PDF

Info

Publication number
JP2008541696A
JP2008541696A JP2008509135A JP2008509135A JP2008541696A JP 2008541696 A JP2008541696 A JP 2008541696A JP 2008509135 A JP2008509135 A JP 2008509135A JP 2008509135 A JP2008509135 A JP 2008509135A JP 2008541696 A JP2008541696 A JP 2008541696A
Authority
JP
Japan
Prior art keywords
analysis
subset
diploid
outcome
haplotype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008509135A
Other languages
English (en)
Inventor
エドウィン ピー. チン
デール イー. ジョンソン
スーハ スダーサナム
Original Assignee
エミリーム インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エミリーム インコーポレイテッド filed Critical エミリーム インコーポレイテッド
Publication of JP2008541696A publication Critical patent/JP2008541696A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/142Toxicological screening, e.g. expression profiles which identify toxicity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Organic Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Signal Processing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)

Abstract

毒物または他の化学物質を評価するために有用な方法およびデバイス、ならびに好ましくない薬剤効果を予想するのにこのような方法を用いるために有用な方法およびデバイス。

Description

発明の分野
本発明は、毒物および他の治療物質を評価するための方法およびデバイスに関する。方法および使用法のいくつかは好ましくない薬剤効果に直接関係しており、別のものは薬効薬理(pharmacology)および治療指数の一般的評価に対してより広く適用しうると考えられる。
優先権の主張
本出願は、2006年3月1日に提出された米国仮出願第60/778,133号および2005年4月27日に提出された米国仮出願第60/675,741号に対する優先権を主張する。以上に引用した米国仮出願はすべて、その全体が参照により本明細書に組み入れられる。
発明の背景
新たな治療薬候補を初期の構想から市場での販売に至るまでに開発するには、典型的には12〜15年間にわたる研究および開発の期間が必要であり、これにはほぼ10億ドル近くの投資を要すると推測されている。例えば、UBS Warburg Report, Charles River Laboratories, Feb 28, 2003, pages 7-8;およびwww.fda.gov.を参照のこと。これらの出費のかなりの部分は前臨床動物試験中に生じ、さらに多くがヒトでの臨床的な安全性および有効性の試験に費やされる。薬物開発のより後期になるまで発見されずに残る薬理学上または毒物学上の問題は、ドル出費および時間損失のいずれの点でも極めて問題である。そして毒性の問題が市場投入後まで発見されずに残るならば状況はさらに悪い。このため、候補治療物質の安全性および有効性の早期かつ正確なアセスメントは、適切な投与および治療の方法と並んで、新たな治療物質の効率的な開発のために不可欠である。薬理学は物質の、典型的には化学物質および他の実体の、生物系に対する作用の研究を対象とする科学分野である。これには薬力学および薬物動態学の両方が含まれる。例えば、Berkow, et al. The Merck Manual Merck and Co.;Hardman, et al (eds. 2001) Goodman and Gilman's The Pharmacological Basis of Therapeutics (10th Ed.) McGraw-Hill, ISBN: 0071354697;ならびに薬理学の教育に用いられる他の学術的および専門的な教科書を参照のこと。米国食品医薬品局(US Food and Drug Administration)(FDA)は、治療的または診断的な状況における物質の使用の事実上すべての局面に関係している。例えば、www.fda.gov.を参照のこと。
密接な関係のある関連分野は毒物学であり、これは系に対して特定の定められた影響を及ぼし、典型的には悪影響または望ましくない影響を招く可能性のある物質の特徴および性質を取り扱う。例えば、Klaassen, et al.(eds. 2001) Casarett and Doull's Toxicology: The Basic Science of Poisons (6th ed.) McGraw-Hill, ISBN: 0071347216;およびHayes (ed. 2001) Principles and Methods of Toxicology (4th Ed.) CRC Press, ISBN: 1560328142;ならびに毒物学の教育に用いられる他の学術的および専門的な教科書を参照のこと。
しかし、物質、例えば治療物質または新たな治療薬となる可能性のあるものの薬効薬理および毒性を解明するには、定められた生物的状況に用いるのに最適な手段および方法を明らかにするための、かなりの量の研究が必要である。これは費用および手間がともにかかるプロセスであり、金銭および他の資源の莫大な投資を必要とする。この事実はUS FDAおよび他の国家医薬品規制当局によって認識されている。安全性モニタリングのための市販の検査薬(バイオマーカー)が至急必要であり、これらのものが依然として薬理ゲノム学的モニタリングおよび個別化された医療の最も開発が遅れた分野であることがこれまでに述べられている。
上記および以下での文書の引用は、いずれかが妥当な先行技術であることを承認することを意図してはいない。文書の日付に関するすべての記載および文書の内容に関する描写は出願人が入手しうる情報に基づいており、文書の日付または内容の正しさを承認したものではない。
発明の概要
本発明は、適切な生物的状況に対するこのような物質または治療薬の使用を導くためのこれらの特徴を明らかにするために必要な開発の速度を早め、資源の投資を減らすことに向けられている。
本発明は、毒性経路に影響を及ぼす、直接的または間接的な分析のための、バイオマーカーのリストを提供する。これらは、遺伝的、遺伝子型判定、二倍体アレルまたはハプロタイプの組み合わせ対合の評価、RNA発現、タンパク質発現、機能的活性、翻訳後分析または評価などを含む、多くのレベルで評価することができる。したがって、バイオマーカーとは、対応する遺伝情報、RNA、タンパク質、またはそれらの他の構造的態様のことを指す。そして、例えば、毒性経路の状態を評価するため、曝露または治療的介入によるさまざまな毒性経路に対する個体のリスクまたは感受性を評価するため、薬物開発のための試験系を作製するために、これらのバイオマーカーを用いるための手段はすべて、経路の進行に対する決定的および重大な寄与因子を同定することによって提供される。
本発明はさらに、霊長類における毒性経路の状態を検出するための方法であって、(a)表4、サブセット1;(b)表4、サブセット2;(c)表4、サブセット3;(d)表3Aまたは6A、サブセット2または3;表3Aまたは6A、サブセット1;表2Aまたは5A、サブセット2または3;および(e)表2Aまたは5A、サブセット1、から選択される識別用バイオマーカーの形態または機能を評価する段階を含む方法を提供する。特定のデータセットはまた、さまざまなマーカーを個別的またはさまざまな組み合わせとしても提供する。さまざまな複数のそのようなマーカーまたはその組み合わせは、肝臓または他の毒性経路において重要である。さまざまな態様において、毒性経路は薬剤の投与または治療法の組み合わせを含む治療的処置に応じて影響を受ける;霊長類はチンパンジーである;評価の形態は、前記識別用バイオマーカーの特定のアレル形態またはその二倍体アレルの特定の組み合わせの遺伝的存在の判定である;評価の形態は、前記識別用バイオマーカーのアレル二倍体の組み合わせを含む、核酸またはタンパク質のレベルでの発現である;評価の形態は、イムノアッセイ、修飾、定量、質量分析、NMR、画像化または特徴的な時間的パターンの決定を含む、タンパク質の評価である;評価の形態は、前記バイオマーカーによって影響される酵素活性の検出可能な基質または産物を含む、前記識別用バイオマーカーの機能的活性の決定である;評価の形態は、画像化または位置決定を含む、前記霊長類における前記識別用バイオマーカーの発現または機能的位置決定である;評価は、血液、毛髪、皮膚、唾液または入手しやすい体液の試料または部分からのものである;評価は、表2A/B、3A/B、4、5A/Bまたは6A/Bからのものを含む複数の異なるサブセットからのバイオマーカーを含む、前記サブセットにおける複数の識別用バイオマーカーを含む;または、評価は、造影剤または検出可能なもしくは標識された化合物を含む、非侵襲的方法である。
これらの同定されたバイオマーカーに基づき、本発明は、同定された識別用バイオマーカーを対象とする標識、診断用試薬または診断手段;ならびにそのようなもの、およびそのようなものを用いるため、および/またはそれらから結果を解釈するための説明書またはデバイスを含む種々のキットを提供する。
好ましい態様において、キットは、(i)表4からの多数のバイオマーカーを評価する;(ii)定められた複数の肝臓毒性経路を評価もしくは識別するように設計されている;(iii)肝臓以外の他の毒性経路をさらに評価するように設計されている;または(iv)治療法もしくは薬剤によって誘導される毒性経路の状態を評価するように設計されている;または、診断用試薬または手段は(i)前記識別用バイオマーカーに対応する特定のアレルの有無を評価する;(ii)前記識別用バイオマーカーに対応するアレルもしくはハプロタイプの特定の二倍体組み合わせの有無を評価する;(iii)複数の前記識別用バイオマーカーを評価する;(iv)多数の時点にわたって前記識別用バイオマーカーを評価する;または(v)少なくとも1つの他のマーカーもしくは特徴を評価する。
本発明はまた、前記化合物によって影響される毒性経路または他の経路に対する影響をスクリーニングまたは評価するための、化学的または生物的な化合物に対する試験系も提供する。好ましい態様において、試験系は、(a)同定された複数の識別用バイオマーカーを組み込んでいる;(b)前記識別用バイオマーカーの複数の異なる特徴を組み込んでいる;(c)非肝臓性の毒性経路の状態をも評価するように設計されている;または(d)同定された識別用バイオマーカーから選択されたバイオマーカーのさまざまな特徴を評価する。
以下のようなコンピュータシステムがさらに提供される:(a)毒性経路の状態と連関する少なくとも1つの同定されたバイオマーカーを含む識別用バイオマーカーのリストを提供するファイルを含む;(b)特定の患者サブクラスにおける毒性経路の状態の指標となる、同定されたバイオマーカーの特定の特徴の出力を提供することができる;または(c)筋肉、神経もしくは骨の組織における異なる毒性経路に関するバイオマーカーの適切な特徴に加えて、適切な同定されたバイオマーカーの適切な特徴を結びつけるファイルを含む。
他の態様において、本発明は、毒性経路の状態を、生物系に存在する二倍体ハプロタイプの組み合わせと相関づける方法を提供する。ある特定の態様において、毒性経路は、肝臓、筋肉、神経もしくは骨髄において著しく発現される;主として胃腸管、腎臓もしくは皮膚において発現される;治療的処置によって誘導される;または1つの薬剤もしくは薬剤の組み合わせの投与によって誘導される;または二倍体ハプロタイプの組み合わせである:米国、西欧または日本の国民に認められるアレルの組み合わせの少なくとも60%に相当する;少なくとも15個の異なる遺伝子に相当する;少なくとも7個の非連続的なハプロタイプブロックに相当する;少なくとも4個の異なる非Y染色体に相当する;少なくとも100センチモルガンの範囲に及ぶ;脊椎動物に由来するものを多数含む;例えばELISAによる、タンパク質の特徴の特性決定によって評価される;または霊長類由来のいくつかのハプロタイプを含む;または生物系が以下である:可溶性試験系;細胞系;器官系;もしくは動物;または相関づけが、データを照合して、前記毒性経路の前記状態から定められるリスクのカテゴリーを呈する、アレルの特定の同定された組み合わせのファイルを生成するコンピュータ上で行われる;または対象における毒性経路の状態を予測するのに有用なものを含む、診断用製品に組み込むために相関づけおよび妥当性確認がなされる、二倍体ハプロタイプの組み合わせのセットを開発するために用いられる。
本発明はさらに、さらなる関連遺伝子を毒性経路評価のための試験標的候補として同定する方法であって、標的候補の第1のリストを取得すること、および、(1)相互作用データベースにおいて、物理的相互作用または2-ハイブリッド物理的相互作用を含め、リスト1の前記標的と物理的に相互作用することが報告されている;(2)参考文献中にリスト1の標的とともに一般によく参照されており、前記参考文献が文献データベースに含まれる論文の要旨の中にある;(3)その遺伝子発現プロファイルが類似組織におけるリスト1のメンバーの発現プロファイルと一致する;(4)発現分析において類似組織中に共存している;または(5)染色体上で物理的に近くに位置している、さらなる標的候補の第2のリストを同定することによる方法を提供する。
さまざまな態様において、毒性経路は肝臓、筋肉、神経もしくは骨髄において著しく発現される;主として胃腸管、腎臓もしくは皮膚において発現される;治療的処置によって誘導される;または1つの薬剤もしくは薬剤の組み合わせの投与によって誘導される;または標的候補の第1のサブセットが、SNP分析、遺伝子発現プロファイリング、翻訳後修飾分析および質量分析を含む何らかのスクリーニング方法に由来する;または第2のリストが、リスト1の3倍未満の数の候補を含む;少なくとも20種の標的候補を含む;代謝酵素または輸送体を少なくとも20%含む;前記毒性経路の状態をリスクのカテゴリーに分類することができるそのメンバーを実証するためにスクリーニングされる;または相互作用データベースが、NCBIもしくはPubMedデータベースからのデータを含む;物理的相互作用の少なくとも10,000件の報告を含む;手作業での照合、遺伝子記号の指定、および/もしくはワード・用語マッチングを用いている;または文献データベースが、少なくとも200,000件の文書を含む;少なくとも100種の学術誌の1990年以来の完全な要旨を含む;完少なくとも1000種の学術誌の1970年以来の全な要旨を含む;少なくとも2万件の文書要旨を含む;少なくとも50万件の文書要旨を含む;IngenuityもしくはGeneGoから入手可能である;NCBIおよび/もしくはPubMed文献データベースを含む;または遺伝子発現プロファイルが、肝臓、筋肉、脳、骨、胃腸管、腎臓、皮膚または口腔粘膜のうち1つまたは複数で一致する;リスト1中のものと同じ臓器および生理機能におけるものである;霊長類におけるものである;またはさらなる候補が、前記第2のリストに含めるための基準のうち少なくとも2つを呈する;または同定が、診断用製品を開発するための妥当性確認に供せられる候補遺伝子のリスト2を保持しているコンピュータ上で行われる;またはそれに続いて診断用製品を開発するための取り組みにつながる可能性のある、毒物学的状態に対する分類用バイオマーカーとしての候補の妥当性の確認が行われる。
毒性経路の状態を、例えば単一の個体の内部で、多数の時点で決定された分類用バイオマーカーの特徴の時間的パターンと相関づける他の方法であって、前記特徴が、(1)選択された遺伝子のRNA発現;(2)選択された遺伝子のタンパク質発現;(3)選択された遺伝子の翻訳後の特徴;(4)選択された遺伝子の反応物もしくは産物の代謝変換;(5)生体産物またはトレーサー(核酸、タンパク質、炭水化物、リン酸化、標識または毒素を含む)の細胞、臓器もしくは組織での局在;または(6)急性肝代謝酵素もしくは輸送体の特徴から選択される方法も、本明細書で提供される。好ましい態様には、例えば以下のものが含まれる:毒性経路が、肝臓、筋肉、神経または骨髄において著しく発現される;主として胃腸管、腎臓もしくは皮膚において発現される;治療的処置によって誘導される;または1つの薬剤もしくは薬剤の組み合わせの投与によって誘導される;または時間的パターンが増加、減少、安定していた後の変化、増加した後の減少、もしくは減少した後の増加である;または分類用バイオマーカーが、霊長類を含む生物体全体において評価される;または時点が、数時間から数週間ないし数カ月の間に及ぶ;1つまたは複数の毒性症状が発現する前から後にかけてである;または分類用バイオマーカーが造影剤、検査試薬もしくは検出可能な反応物もしくは産物によってアッセイされる;または相関づけが、データを照合して、前記毒性経路の前記状態からリスクのカテゴリーを定める、特徴の特定の同定された時間的パターンのファイルを生成するコンピュータ上で行われる;または対象における毒性経路の状態を予測するのに有用なものを含む、診断用製品に組み込むために相関づけおよび妥当性確認がなされる、特徴の同定された時間的パターンのセットを開発するために用いられる。
毒性経路の状態を分類用バイオマーカーに対して相関づけるさらに他の方法であって、(1)前記マーカーが、前記毒性経路の状態と前記集団における前記バイオマーカーとの相関の作成もしくは検定を可能にするかなりの医療記録のある、遺伝的に均一な霊長類集団においてモニターされる;または(2)以下のもの(i)霊長類の生体試料;もしくは(ii)十分な数の前記集団のサブセットを、前記サブセットから分類用バイオマーカーに対する非治療関連毒性の相関を評価するために選択することを可能にするような、記録中にある十分な診断データが入手可能である、霊長類の十分に大きな集団においてモニターされる方法も提供される。さまざまな個々の態様には、毒性経路が、肝臓、筋肉、神経もしくは骨髄において著しく発現される;主として胃腸管、腎臓もしくは皮膚において発現される;治療的処置によっては誘導されない;または1つの薬剤もしくは薬剤の組み合わせの投与によって誘導される;または分類用バイオマーカーが、代謝酵素および輸送体の両方を複数含む;または数が少なくとも10個の異なる分類用バイオマーカーである;または遺伝的に均一な集団が、少なくとも3万例の個体に関する入手可能な医療記録およびインフォームドコンセントを有する;米国に所在がある;フィンランド、アイスランド、サルディニアまたはエストニア出身である;バイオマーカーの試験の前の少なくとも5年間にわたる個体に関する本質的に完全な医療記録を有する;マーカー間距離の中央値4.5KBでのLDが.80未満である;または高度に保存されたミトコンドリアDNA配列を有する;または試料が保管もしくは貯蔵されている;またはサブセットが選択基準による表現型均一性を有する;または相関づけが、データを照合して、前記毒性経路の前記状態からリスクのカテゴリーを定める、特定の遺伝子型または他の特徴のファイルを生成するコンピュータ上で行われる;または対象における毒性経路の状態を予測するのに有用なものを含む、診断用製品に組み込むために相関づけおよび妥当性確認がなされる、遺伝子型または特徴のセットを開発するために用いられる。
本発明はさらに、例えば、表現型と二倍体ハプロタイプとの間の相関分析の方法を、物理的相互作用による連関および/または公表された要旨における多くの参照による文献的結び付きが含まれうるシステム生物学の連関によって、機能的候補物質のリストをリスト1からリスト2まで広げることと組み合わせることを含む、哺乳動物の生物現象(biology)の研究のような、方法の組み合わせも提供する。例示的な態様には、(i)リスト1をリスト2に広げ、前記表現型をさらに、リスト2の少なくとも1つの機能的候補に対応する二倍体ハプロタイプの組み合わせと相関づけるもの;(ii)二倍体分析を行い、表現型をさらに、前記二倍体分析で評価した候補のリスト1を広げた結果得られたリスト2の機能的候補の別の特徴と相関づけるもの;または(iii)二倍体分析を行い、表現型をさらに、異なるパラメーターの分析の結果得られたリスト1候補に対する相関づけの結果得られたリスト2の機能的候補の別の特徴と相関づけるもの、が含まれる。
そのほかの方法、例えば、表現型と二倍体ハプロタイプの組み合わせとの間の相関分析の方法を、多数の時点で特徴を評価することと組み合わせるものも提供され、これには一倍体または組み合わせ二倍体分析が含まれうる。ある特定の態様には、例えば、前記哺乳動物における前記生物現象の間の相関が、以下のもの(i)少なくとも1つの二倍体ハプロタイプの組み合わせおよび少なくとも1つの多数の時点での特徴;または(ii)複数の二倍体ハプロタイプの組み合わせおよび多数の時点での特徴、とのものであるものが含まれる。
本発明はさらに、表現型と複数の非隣接ハプロタイプとの間の相関分析の方法を、医療記録または他の選択基準によるより大きな収集物からの遺伝的に均一なまたは表現型的に選択された「サブクラス」が含まれうる「均一な」霊長類集団の使用と組み合わせることも提供する。いくつかの態様において、集団は遺伝的に均一な集団である;または生物現象は処置に対する応答である。
他の方法は、物理的相互作用による連関および/または公表された要旨における多くの参照による文献的結び付きが含まれうるシステム生物学の連関によって、機能的候補のリストをリスト1からリスト2に広げ、それとともに多数の時点での特徴を評価し、これには一倍体または組み合わせ二倍体の追跡が含まれうる。好ましい態様には、(i)前記哺乳動物における前記生物現象の間の相関が、リスト2候補の少なくとも1つのパラメーターおよび多数の時点での1つの特徴とのものである;(ii)相関が、リスト2候補の多数の時点での特徴とのものである;または(iii)相関が、多数の時点での分析の結果得られたリスト2候補の特徴とのものであるものが含まれる。
本発明のさらにもう1つの態様は、物理的相互作用による連関および/または公表された要旨における多くの参照による文献的結び付きが含まれうるシステム生物学の連関によって、機能的候補のリストをリスト1からリスト2に広げるための方法を、医療記録または他の選択基準によるより大きな収集物からの遺伝的に均一なまたは表現型的に選択された「サブクラス」が含まれうる「均一な」霊長類集団を用いる方法と組み合わせることに起因する。好ましい形態において、これには以下のものが含まれうる:(i)リスト1候補に対する前記哺乳動物における前記生物現象の相関が前記リスト2候補をもたらし、それが前記霊長類集団における妥当性確認のために検証される;または(ii)リスト1候補を対象として前記集団から生まれた仮説が、リスト2候補を評価することによって検証される。
さらなる方法は、一倍体または組み合わせ二倍体分析が含まれうる、多数の時点での特徴を評価するための方法を、医療記録または他の選択基準によるより大きな収集物からの遺伝的に均一なまたは表現型的に選択された「サブクラス」が含まれうる「均一な」霊長類集団の使用と組み合わせることに起因する。そのような態様の中には、生物現象が、前記均一な霊長類集団において多数の時点での特徴との相関に関して検証されるものがある。
同じく提供されるのは、標的個体に対する化合物または処置の適用による治療アウトカムを予測するために標的個体動物の遺伝的構成の分析を用いる方法であり、本方法は以下を含む:治療アウトカムと、さまざまな個体動物が所有するハプロタイプまたはアレルのさまざまな組み合わせとの相関を確定する段階;標的個体が所有するハプロタイプまたはアレルの組み合わせを決定する段階;および、ハプロタイプまたはアレルの組み合わせからの相関を治療アウトカムを予測するために適用する段階。または、本方法は、標的個体が所有するアレルの組み合わせ(および治療アウトカムと相関することが以前に確定されているもの)を決定する段階;および、アレルの組み合わせからの相関を治療アウトカムを予測するために適用する段階を含む。
これらの方法のある特定の態様において、標的個体がメンバーである集団全体にわたって頻度の高いハプロタイプまたはアレルの遺伝的構成の分析は、ハプロタイプまたはアレルの遺伝子量の分析を含む、定性的または定量的な決定である;分析は、核酸(DNA、RNA)配列または多型分析、(DNA;RNA)ハイブリダイゼーション、タンパク質分析または酵素活性分析による;遺伝的構成は以下を含む:アレルまたはハプロタイプの重複または多コピー、染色体重複、遺伝子座の増幅、または少なくとも35アミノ酸の長さにわたって少なくとも90%のアミノ酸配列同一性のある多数の関連アレル;標的個体は、霊長類、齧歯動物もしくはイヌ科動物;愛玩動物、使役動物もしくは展示動物;四足、二足もしくは水生動物;外骨格を備えたものを含む脊椎動物;またはハプロタイプもしくはアレルに関してヘテロ接合性もしくはホモ接合性である;または治療アウトカムは、薬剤有害事象;薬剤有害事象の欠如;薬剤有効性;または薬剤有効性の欠如である。さらに他の方法には、投与が、1つまたは複数の精製された化学物質もしくは化合物である;局所的、経口的、非経口的、吸入性、眼に対する投与、インプラントもしくは他の手段による;または反復的である;または相関が、0.6を上回る係数である;統計学的な信頼性のある指標によって確定されている;100件を上回る有害事象の薬剤有害事象集団の検定によって確定されている;標的個体の医療記録からの別の特徴もしくは別の診断結果と組み合わされている;または少なくとも20Kの個体の均一なファウンダー集団で得られる;またはアレルが、シトクロムP450座位;輸送体/ポンプ座位;または「薬剤代謝酵素」座位にあるもの、が含まれる。さらなる方法には、レシピエントに方法の結果を伝達するものであって、伝達が、書面による、口頭による、暗号化されている、デジタル式である、アナログ式である、もしくは米国の法的管轄を経る;またはレシピエントが、米国の法的管轄下にある;医療患者もしくは罹患動物所有者である;医療専門家、医師もしくは獣医である;規制当局もしくは薬物開発組織である;または医療保険会社もしくは監査人であるものが含まれる。
もう1つの態様において、本発明は、標的二倍体個体が所有するバイオマーカーのハプロタイプまたはアレルの実質的な全要素を決定するための手段を含む診断用デバイスであって、手段が標的個体にどのハプロタイプまたはアレルが存在するかを同定することおよびそれらのハプロタイプまたはアレルの産物の生物学的機能を評価することを提供するようなデバイスを提供する。往々にして、デバイスは以下のものであると考えられる:手段が、ハプロタイプが存在するか存在しないか、およびどの生物学的機能がハプロタイプに対応するかの両方を決定する;各ハプロタイプによってコードされる完全なタンパク質配列を決定する;自動化されていて、約3時間以内の読出し結果を提供する;または動的な特徴および/もしくは多数の評価時点を含む;ハプロタイプの要素が以下を含む:ハプロタイプのヘテロ接合性対;染色体の三倍性をもたらす染色体重複を含む、染色体対とは異なる遺伝子量の違い;高い配列同一性および一部重複する生物学的機能の両方を呈する複数の密接に関連した配列(例えば、関連する酵素の要素が反応または輸送体の選択性/特異性/動態に影響を及ぼす、多数のホモログ);酵素代謝回転数が少なくとも30%異なるアレル;または定められた表現型に関して診断的であると一般に認められている代用マーカー。他の態様は、以下のようなデバイスであってよい:バイオマーカーが、複数のシトクロム、酵素、輸送体および/もしくは構造タンパク質を含む;またはその個体を含む集団で認められる少なくとも5種の異なるアレルもしくは非連続的なハプロタイプによって表される;または二倍体個体が、霊長類、齧歯動物、ネコ科動物もしくはイヌ科動物を含む哺乳動物;愛玩動物、使役動物もしくは展示動物;または線虫、ミジンコ、昆虫もしくは無脊椎動物を含む実験研究動物である;または生物学的機能の評価が、プロテオミクスもしくはメタボロミクス分析による;または、増加もしくは低下、U型、ベル型もしくはホルメシス的状況を含む、異なるタイプの薬理学的用量反応曲線を識別することができる。
このようなデバイスを用いる方法が提供され、これには例えば、記載されたデバイスを用いて個体が所有するアレルの要素を評価することによって、標的個体の定められた処置によるアウトカムを予想する段階を含む方法;または以下のもの:アウトカムが治療効果、治療上の安全性もしくは有害反応のリスクである;または評価の結果がレシピエントに伝達され、伝達が、書面による、口頭による、暗号化されている、デジタル式である、アナログ式である、もしくは米国の法的管轄を経る;またはレシピエントが、米国の法的管轄下にある;医療患者もしくは罹患動物所有者である;医療専門家、医師もしくは獣医である;規制当局もしくは薬物開発組織である;または医療保険会社もしくは監査人であるもの、が含まれる。
本発明のもう1つの代替的な態様は、治療的処置に対する個体の応答を予測するために有用なバイオマーカーを同定する方法であって、処置を受けていてその処置による記録された結果のある個体の均一な集団を収集する段階;処置による特定の記録された結果と相関するバイオマーカーを同定するために、集団内の複数の個体における遺伝的マーカーを評価する段階;および、結果の予測指標となるバイオマーカーを同定するために、遺伝的マーカーを特定の記録された結果と相関づける段階、を含む方法を提供する。包含されるさまざまな方法には、例えば、以下のものが含まれる:同定が、例えば、薬剤有害反応を予測するためにバイオマーカーを評価する、公認の診断用検査もしくはデバイスの開発を可能にする;書面により、口頭により、暗号化されて、デジタル式で、アナログ式で、もしくは米国の法的管轄を経て伝達される;または、米国の法的管轄下にある;医療患者もしくは罹患動物所有者である;医療専門家、医師もしくは獣医である;規制当局もしくは薬物開発組織である;または医療保険会社もしくは監査人である、レシピエントに対して伝達される;またはバイオマーカーが以下を含む:評価における動的もしくは時間的な構成要素;多数のエンドポイント、濃度、温度もしくは他の分析;遺伝分析;またはプロテオミクスおよび/もしくはメタボロミクス分析;または予測が定められた集団の全体にわたって少なくとも95%の精度を有する;または応答が薬理学的もしくは毒物学的な応答である。
包含される他の方法には、例えば、個体が、霊長類、ウマ科動物、ウシ属動物、ブタ属動物、イヌ科動物、ネコ科動物、齧歯動物もしくは四足動物を含む哺乳動物;愛玩動物、使役動物もしくは展示動物;線虫、ミジンコ、昆虫もしくは無脊椎動物を含む実験研究動物;または植物、真菌、原生動物もしくは原核生物である;または処置が1つもしくは複数の治療用化合物を所定の方法で投与することである;または集団が、少なくとも200万例の個体の霊長類を含む;集団内で発生頻度が少なくとも1%であるSNPが約300K未満であるという均一性を有する;集団の少なくとも30%に関して少なくとも3〜5年間に遡って医療記録が入手可能である;および/または薬剤有害反応の報告システムを有するものが含まれる。
本発明はさらに、遺伝的マーカーが、結果と相関づけられた経路から他のバイオマーカーの予測を可能にし、経路からのそうした他のバイオマーカーを、どの擾乱が結果に対するバイオマーカーの相関に影響を及ぼすかを最適化または同定し、それによって結果に関して相関性の高いバイオマーカーを同定するために擾乱によって試験することができる、このような方法を提供する。これには、以下のような方法が含まれるであろう:擾乱が、遺伝子の配列もしくは量(調節);タンパク質の配列、修飾もしくは量;基質もしくはその類似体(阻害薬または調節性サブユニットを含む);代謝中間体;エンドポイントもしくは分析の時点;温度;および/または同位体変種にある;遺伝子発現変更因子(ノックアウトまたは形質転換体を含む)、遺伝子抑制(例えば、RNAiまたはアンチセンスを用いる)、ドミナントネガティブ形態もしくは抑制因子、および突然変異体の活性化のいずれかによって達成される;化学的擾乱により、例えば低分子阻害薬、補助因子(天然または他のもの)もしくは活性化因子の濃度を変えることによって達成される;および/または、時間の関数として評価される;および/または相関性の高いバイオマーカーを、治療的処置の効果を標的個体もしくはそのサブシステムに戻してモデル化するために用いうる実験系に組み込むことができる;例えば、代用マーカーのプールとして、表現型の時期、重症度もしくはタイプを予想するために個体においてモニターすることができる;または、個体において診断され、薬剤有害反応を含め、治療的処置に対する有効性もしくは応答を予測することができる。
さらなる方法、例えば、以下のものも提供される:実験系が以下を含む:トランスジェニック性の、形質転換された、もしくは遺伝的に改変された細胞;同定され、選択された遺伝的、発生的もしくは生理的な変異細胞;疾患に関するインビトロ遺伝モデル;疾患もしくはモデルを特徴づける特徴を有する、齧歯動物を含む生物体;ヒト遺伝子を含む細胞;病状の治療のための治療物質候補;霊長類に由来する細胞を含む、哺乳動物幹細胞;または米国以外に存在する緒段階のうち少なくとも1つ。
薬物開発の状況において、本方法は、例えば前臨床評価において、開発の候補を薬効薬理または毒性に関して評価するため、または優先順位をつけるための実験系の使用を含みうる。
本発明はさらに、表現型に関して特異的な相関性の高いバイオマーカーを呈する遺伝的または生理的な変異体を含む、細胞または系の組み合わせを用いる方法であって、治療的処置に対する治療応答を評価するために細胞系の組み合わせをモニターする方法も提供する。これには、以下のような方法が含まれると考えられる:細胞または系の組み合わせが、1つまたは複数のヒト遺伝子、染色体または細胞を含むもの;1つまたは複数のハプロタイプ、遺伝子または表現型の異なる発現レベルの影響を評価するもの;例えば、集団内のさまざまな個体を表すための一連のチップを可能とする、1つまたは複数のマイクロ流体チップを利用するもの;インビトロまたはインビボのモデルを含め、疾患に関するモデルを提供するもの;毒性を含め、ヒトまたは動物の表現型に関する代用マーカーを提供するもの;または、無傷の生物体におけるもの;または、モニタリングが、多数のエンドポイント、濃度/応答、代謝回転(基質および/または産物を含む)、複数の異なるアッセイ、および/もしくは多数の遺伝的変異体を評価するもの;または表現型が、霊長類または無脊椎動物におけるもの;または定められた系もしくは動物における治療物質の治療係数の予測を可能にするもの;または細胞もしくは系が個体の集団全体にわたる個体の差異の範囲を表すもの;または治療的処置が、製品開発のための候補の優先順位づけを含む、さまざまな治療物質候補の試験もしくはスクリーニングであるもの;または評価の結果もしくはその結果得られた結論がレシピエントに伝達され、伝達が、書面による、口頭による、暗号化されている、デジタル式である、アナログ式である、もしくは米国の法的管轄を経る;またはレシピエントが、米国の法的管轄下にある;医療患者もしくは罹患動物所有者である;医療専門家、医師もしくは獣医である;規制当局もしくは薬物開発組織である;または医療保険会社もしくは監査人であるものが含まれる。
発明の詳細な説明
概要
I.序論
II.表現型と相関づけられる遺伝子およびハプロタイプの対形成
III.相関づけられた遺伝子から経路の仮説へ
IV.仮説から最適化された固有特徴へ
V.最適化された固有特徴のヒトとの関連性
VI.最適化されたバイオマーカー/固有特徴から;細胞系、実験モデルに
VII.インビトロおよびインビボの疾患モデル
VIII.成果としての製品
IX.コンピュータシステム
X.ビジネス方法
I.序論
上述したように、安全性モニタリングのための市販の検査薬(バイオマーカー)に対する需要は至急求められているものである。US FDAおよび他のグループは、この領域における新たな戦略および開発について計画を立てるために、産業界が後援している薬理ゲノム学ワーキンググループなどのブレーンストーミング討議グループを組織している。同様の懸念は外国の薬物規制当局にも存在する。薬理ゲノム学における活動は活発であり、これには、Guidance for Industry Pharmacogenomic Data Submissions (Nov. 2003);予備的な概念に関する文書の草稿「Drug-Diagnostic Co-Development Concept Paper」(April 2005)の公表;ならびにFDAから近い将来に公表が予定されている他の文書および指針が含まれる。市販の薬剤(Vioxx、Bextraおよびその他)の毒性の問題が最近注目され、新薬の開発に時間および費用がかかるようになっていることと相まって、薬理ゲノム学はより脚光を浴びる取り組みとなっている。
薬物開発の科学的体系は極めて複雑である。これには例えば、薬理学および毒物学の科学的方法を含む、さまざまな医科学、特に治療効果に関する研究の領域が、薬物化学、診断原理、統計学および妥当性確認の手順とともに含まれる。薬理学は、薬剤の特性および反応の、特にそれらの治療的価値に関しての研究を対象とする。薬理学のさまざまな局面には、製剤化、吸収、分布、代謝、排泄などが含まれる。例えば、
Figure 2008541696
を参照のこと。
毒物学の教科書には、標準的な学術的または専門的な学校での課程に用いられるものに加えて、
Figure 2008541696
が含まれる。
薬物化学は薬物開発において決定的な役割を果たすものであり、一般的には例えば、
Figure 2008541696
に記載されている。
システム生物学の分析および手法は、例えば、
Figure 2008541696
ならびにこの領域における主要な学術的または専門的な学校の学科の教育課程で用いられている他の材料に記載されている。根本的な原理には、例えば、機能的関係を示唆する同時制御、ならびに情報理論および複雑系の数学に基づく他のものが含まれ、中でも生物学は最も複雑なものの一つである。例えば、Abraham, et al.(2004) "High content screening applied to large-scale cell biology" Trends Biotechnol 22: doi:10.1016/j.tibtech.2003.10.012を参照のこと;これは細胞生物学を対象とするが、システム生物学は細胞の生物現象が臓器の生理現象およびシステム応答に影響を及ぼすことを示している。
本発明の主題と関連する他の参考文献には、例えば、
Figure 2008541696
が含まれる。一般的な医学的関連性のあるそのほかの参考文献には、例えば、Berkow(ed.)The Merck Manual of Diagnosis and Therapy Merck and Co., Rahway, NJ,;Thorn, et al. Harrison's Principles of Internal Medicine McGraw-Hill, N.Y.;およびWeatherall, et al.(eds.)Oxford Textbook of Medicine Oxford Univ. Press, Oxfordが含まれる。
II.表現型と相関づけられる遺伝子およびハプロタイプの対形成
A.表現型上の特徴
表現型は多様であり、例えば、系の生理的、代謝的、行動的、健康状態、疾病状態、発達、および他の機能的または構造的な特性と関係している。特徴は、系またはその部分のサイズ、重量、色調、機能、組織学的評価または他の鑑別的な特徴というように多様でありうる。評価は、系全体を一括したものでもよく、または例えば、特定の臓器サブシステムもしくは代謝経路の機能などのようにその部分のものでもよい。本明細書における関心対象の表現型の中には、適用された薬剤または治療法に対する標準的な吸収、分布、代謝、排泄および負の応答を含む、有効性または毒物学的応答を含む治療法に対する応答が含まれる。負の応答はしばしば薬剤有害反応(ADR)として特徴づけられる。薬理学的特徴はしばしば、治療法の、例えば化学物質の投与に対する影響または応答を評価する。特徴はしばしば、試料の入手可能性および関連性に応じて、異なる複数の臓器または試料にわたる評価を行う。例えば、肺疾患の状況においては、関連性があるとみなされる試料には一般に、血液、これには細胞、血清もしくは血漿が含まれうる;治療法の前および/もしくは後に採取した試料;生体細胞試料、これは生検試料、腫瘍試料もしくは組織試料であってよい;洗浄液もしくは誘導喀痰試料などの液体試料、または死後組織が含まれる。
発現の評価は、単一の試料部位に限定される必要はなく、例えば血液および生検試料のように関連性のある複数の試料の源にわたって、または例えば肝臓および脳の両方の画像化のように多数の臓器にわたっての、比較によるレベルの評価を行ってもよい。
B.遺伝子マーカー
特定の遺伝子に対する表現型相関は、遺伝学の、および分子生物学または分子遺伝学の関連分野の、科学的検討の対象である。例えば、
Figure 2008541696
を参照のこと。さらに、集団遺伝学および特定の遺伝子に対する表現型の相関の判定には、複雑な統計学的方法が用いられる。
典型的には、眼目は表現型と遺伝因子、典型的には特定のアレルまたは他の遺伝子ハプロタイプマーカーとの相関におかれる。相関は標準的な係数によって評定され、典型的には高度である、例えば少なくとも98%、96%、94%、91%、88%、84%、81%、78%、70%、60%、50%、40%などであると考えられる。多くのアプローチにおいて、アレルまたはハプロタイプは構造的多型によって表され、例えば、これらはヌクレオチド多型の形態で比較的容易に構造的に定義される。多くの場合、一塩基多型(SNP)の概念が、構造的(コード性)であるか、それともあまり明確でない遺伝的特徴であるかにかかわらず、遺伝子と考えられる実体の代わりに用いられる。個体の遺伝的構成または遺伝的詳細の決定は、このような分析のために有用である。例えば、
Figure 2008541696
を参照のこと。SNP以外の多型、例えば、集団内での頻度が1%未満であるものも、同様に有意義なマーカーとなりうる。
しかし、特定の遺伝子に起因する表現型は、物理的または生物学的なものを問わず、その環境の境遇によって修飾されることがある。優性または劣性アレルに関する古典的なメンデル則モデルは、表現型が単一の遺伝子によって決定されること、および表現型が主として多因性ではないことを仮定している。これとは対照的に、多因的影響がより典型的には表現型を決定すると考えられ、アレルまたはハプロタイプの優性または劣性の特徴は、アウトカムの調節的または他の機能的な決定要因を含む、存在する特定の他のアレルまたはハプロタイプによって大きく影響される可能性がある。例えば、1つのアレルがこのような他の因子によって増幅、修飾、減弱または抑制される可能性があり、その多くは存在する1つまたは他の複数のアレルであると考えられる。Yan, et al.(2002) "Allelic variation in human gene expression" Science 297:1143を参照。
多くの場合、アレルは染色体上の位置によって定義されると考えられており、このため「異なる」アレルは、染色体上に位置的に見いだされる代替的なアレルによって定義することができる。アレルという用語は、配列領域がコード性であることも、転写または翻訳の状況下で「発現される」ことも必要としない。しかし、時には遺伝子の重複が起こることがあり、その場合はその「重複したアレル」も他のものに対応するアレルととして分類されることは十分に認識されている。また別の状況では、アレルまたは遺伝子の量が影響される可能性のある、全体的または部分的な染色体重複(または欠失)の影響があることも考えられる。
または、アレルが配列の点で類縁性の高い実体であることもある。この場合には、「突然変異」は、それらが異なるものの密接に関連した配列であるにもかかわらず、代替的なアレルとみなされる。このため、配列の関連性はアレルの関連性のもう1つの特性である。このようなアレルは、例えば、適切なセグメントにわたって少なくとも約98%、95%、90%、85%、80%といった同一性を呈しうる。同一性は、Altschul et al.(1990) J. Mol. Biol. 215:403-410に記載されているBLASTアルゴリズム(非限定的な一例として、公表されているデフォールトの設定、例えば、パラメーターw=4、t=17を用いる)を非限定的に含む、任意の適切な方法を用いて決定することができる。
セグメントは多くの場合、全コード領域および隣接する調節セグメント、全コード領域、保存された配列のセグメント、例えば、ドメイン、その部分、または適切な長さの複数のセグメントを含みうる。発現に影響を及ぼす多型の例はこれまでに記載されている。そのセグメントまたは複数のセグメントは、典型的には、少なくとも約30、40、60、80、100ヌクレオチドもしくはそれ以上であるか、または少なくとも約15、20、25、30、40、70個もしくはそれ以上のアミノ酸コドンに対応すると考えられる。
機能的関連性は、代替的なアレルのもう1つの特徴でありうる。このため、1つのアレルが特定のコードされる酵素に対応するならば(例えば、「一遺伝子が一酵素に対応する」モデルに従って)、機能的または構造的に(例えば、多サブユニット複合体中で;関連性のある薬理学的結合標的として、または調節要素として)代わりになりうる別の酵素は、たとえそれが同じ遺伝子座にコードされていなくても、代替的なアレルとみなしうると考えられる。このため、それは、類似または代替的な臓器または身体位置における、共通した基質もしくは反応の特異性および/または発現を有しうるアレル的実体を評価するために有用であると考えられる。それは、例えば、類似した基質特異性、酵素の代謝回転数または速度などを共通に有する代替的実体の存在、質および/または量を評価するために特に有用であると考えられる。これらには、グリコシル化、リン酸化または調節的変異体などのプロテオミクス的な変異体が含まれうる。
このため、表現型の多因性構成要素は実際には、「因子の組み合わせ(またはハプロタイプ)」が最終的な表現型の真の決定要因である可能性が高いことを示唆する。そして、表現型の診断は、すべての関連因子の有無、量および質を決定することによってはるかにより効果的に行われると考えられる。このため、表現型の、個体の遺伝子またはハプロタイプに対する相関は、関連ハプロタイプ(典型的には、本明細書では「ハプロタイプの要素」と呼ばれる)の組み合わせに対するものよりも本来的に精度が落ちると考えられる。このため、統計的分析の目標は、表現型を、単一の遺伝子またはアレル対のみに対してではなく、「すべての関連因子」に対して相関づけることであると考えられる。そして、評価される遺伝子、コード領域または不連続的なハプロタイプセグメントの数は、約5、7、9、11、14、17、21個およびそれ以上であってもよい。表現型の診断指標となる識別用、分類用または代用マーカーのパターンは、このプロセスを用いて同定されると考えられる。
C.非遺伝的因子:浸透度;環境的;発達的;ストレス;食事;行動;医療記録
「関連因子のパターン」の浸透度も影響を及ぼすと考えられる。これらは、なぜクローン性遺伝系(双子;遺伝的に同一な個体)が、おそらくは確率的な理由から、表現型の差異を呈するのかを説明する因子であると考えられる。これらには、数ある中でも特に、生物系の発達的な局面(遠隔履歴)、系の最近の履歴(例えば、生理現象または他の生物現象に影響を及ぼす現在の環境因子、例えば、食事、ストレス、生物現象に影響を及ぼす行動因子、ホルモン因子、概日的因子、その他)、疾患プロセス、医療プロセス、生化学や生理に影響を及ぼす他の因子、または関連環境のその他の生物学的特徴が含まれる。特に、治療物質の組み合わせは、複合的な病状を来している個体では薬剤間相互作用がしばしば起こるため、重要であると考えられる。
しかし、重要な可能性のある特徴は予測できないことがしばしばであるため、そのようなものを文書化するために最も能力のあるものは、臨床医が適切であると判断するような因子である。すなわち、医療記録は、いかに生物系が作動するかに関する予断の上で、表現型を説明する統計的尤度を有する観察所見を提供することを意図している。このため、医療記録は、特定の表現型に寄与する非遺伝的因子を見いだすための取り組みにおいて非常に貴重である。または、他の研究で表現型と相関づけられている特徴も可能性の高い候補となる。例えば、Frank and Hargreaves (2004) "Clinical biomarkers in drug discovery and development" Drug Discovery 22:15-22および関連論文を参照されたい。
D.システム生物学
システム生物学は、無傷の動物における生理現象の全身的局面を理解する上で極めて適切である。特に、ほとんどの生化学現象は、時間の次元を伴う主として均一な溶液中で、ほぼ間違いなく二次元系において研究されている。しかし、生物体は、細胞内オルガネラ、内臓、ならびに循環およびリンパ液を介して相互作用しうる臓器間の相互作用を含め、顕著なトポロジー的特徴を有している。このため、身体の多様な領域が、毒性に対して、さらには疾患に対しても寄与する可能性がある。特に、毒性が特定の場所で発現しているが、その基礎をなす原因は1つまたはいくつかの他の遠隔性の臓器または場所にある場合がある。症状の発現部位を観察することは、誤った場所を観察している可能性がある。
システム生物学の第1の応用は、すでに同定されたマーカーと関連性のあるさらなるマーカーを同定することにあると考えられる。同定されたマーカーの上流または下流にある経路メンバーは、毒性経路とも関連性のある可能性の高い候補であり、進行または制御のための阻止ポイントである可能性がある。経路と関連した実体は、以下のものを含む、多くの供給源から見いだしうる:(1)候補と物理的に相互作用または共存することが報告されているバイオマーカー;(2)刊行物中に候補とともに言及されているバイオマーカー(機能的または構造的な類似性を示唆する、治療用化合物とのオフターゲット機能性または結合性相互作用の可能性が高い);(3)さまざまな臓器における遺伝子発現試験において候補と同様に調節され、真の協調的調節が示唆されるバイオマーカー;(4)さまざまな臓器において同様に局在し、同じく協調的調節が示唆されるバイオマーカー;および(5)染色体上で物理的に近くに、例えば数千、数万、数十万、数百万、数千万ヌクレオチド以内など、または0.1、0.3、1、3、10、30、100、300センチモルガン以内などに位置しているバイオマーカー。これらの指標の異なる組み合わせを用いることもできる。
または、関連性のあるマーカーと相互作用することが公知であるか報告されている他の実体も、調節的介入のための標的候補となる。マーカーの他の「関連した」局面が、そのマーカーの構造的または機能的な変異体の形態をとってもよく、それらは経路の進行の動態または特異性を変化させるのに役立つ可能性がある。DNAのコピー数、RNA発現レベル、タンパク質発現レベル、翻訳後修飾および類似の修飾(例えば、リン酸化、アセチル化、メチル化、グリコシル化、ユビキチン化など)を含む、機能に影響を及ぼす可能性の高いタンパク質の特徴、または酵素代謝回転数、半減期および他の類似の特徴を評価するための、同定されたバイオマーカーの可能性の高い局面をスクリーニングするために、スクリーニング方法を利用することができる。
既存の発現データが、どこを探すかを決定するために適切なこともある。例えば、そのバイオマーカーがそれらの部位で発現されなければ、多くの臓器を分析のために適切な部位から除外することができる。
B.時間的分析
生化学における時間的動態は往々にして十分には調査されていない。ある種の時間的動態はよく認識されている:これには神経生物学および数ミリ秒の時間幅の中でのイオン流の変化、行動および代謝の概日リズム、月単位の間隔でのホルモン変化という月経周期、ならびに冬眠および移動という季節性変化があり、その一方で、毒物学の時間的局面はほとんど調べられていない。診断アッセイの動的局面は十分には解明されておらず、多くはこのような期間にわたって劇的に変動する。遺伝子発現プロファイリングのデータは往々にしてシグナルをはるかに上回る大きなノイズ成分にさらされ、遺伝子の相対的発現レベルはこのような周期的変動に埋もれる可能性がある。このため、動的生理現象の状況において毒性経路を研究することにより、これまで認識されていなかった様相が明らかにされて解明される可能性がある。
症状の開始、進行および突発の動態は十分には解明されていない。このような進行を、特に単一の個体において追跡することにより、バイオマーカーと関係のある特徴の目印となるパターンの同定が可能となる可能性がある。遺伝子発現、タンパク質発現または代謝機能は、関連性のある可能性の高い特徴である。このような目印がひとたび認識されれば、それらの特徴は、症状の突発をモニターし、症状の発生の時期を予測するために、個々の患者における経路の進行を動的にモニターするために用いることができる。すると、経路の管理がより容易に行えるようになり、毒性の予防または対処のために必要な行動の時期を決定することができる。異なる薬剤または予防的処置への切り換えを整えておくこともできる。
動態の特定のパターンを、十分な時点および尺度に基づいて評価することができる。すなわち、毒性経路の進行に時間がかかるならば、評価は、ベースラインのレベルを確定して、それを十分な期間にわたって追跡し、おそらくは少なくとも症状の十分な発現に至るまで追うべきである。十分な数の分析を、そのウィンドウ期間にわたって、例えば数分、数十分、1時間のある割合、数時間、1日のある割合、数日、数週、数カ月またはさらには数年にわたって、行うべきである。または、期間は、1、3、10、30、100、300、1000、3000、10K分の範囲にあると考えられる。症状の発現は、不可逆的な進行の発生を示す目印の同定が可能となるように、モニタリングシステムが信頼性を伴って同定しうる目印から十分に離れていることが最適である。
典型的な動的パターンには、例えば、絶えず一定である、一定した変化(増加または減少)、増加した後に減少する、減少した後に増加する、安定していた後に変化する、変化した後に安定する、などであって、変曲の時点が特に顕著であるものが含まれる。臨床的表現型に特徴的なパターン間の違いには最も関心がもたれる。多くの場合、事象の目印には、異なるバイオマーカーのパターンの組み合わせが含まれる。
F.集団均一性:遺伝的;環境的;行動的;記録管理
考察したように、定められた遺伝的状態の浸透度は、遺伝因子または非遺伝的な因子によって影響される。意味のある遺伝的特徴を同定しうる統計分析は、干渉性ノイズが最小化される場合、すなわち、偽陽性因子または偽陰性因子が最小化される場合に最も成功すると考えられる。集団の不均一性の排除により、ノイズを上回ってシグナルを認識する見込みが最大化されると考えられる。このため、分析は、十分なサイズの均一な集団に対して行われた場合に、大きく改善され、数学的に最も効率的になると考えられる。これに対して、集団は、その中に含まれる表現型の範囲が「全体的な」集団を反映するように、十分な不均一性を呈するべきである。
非ヒトでの機構がヒトにとって妥当であるか否かという問題が排除される、ヒトにおける研究が好ましいと考えられる。ヒト遺伝学の研究では、その表現型の差異が他の集団に存在する可能性のある機構を全く反映することができない均一な集団と、もう一方の極端な物である、非遺伝的因子が遺伝学的なものの浸透度を識別できないと思われるものであるような高度に多様な集団との間で、何らかの妥協点を選択すべきである。遺伝分析における統計的方法は、例えば、上記の遺伝学に関する参考文献中、およびEwens (2004) Mathematical Population Genetics (2d ed.) Springer, ISBN: 0387201912;Fernholz, et al.(eds. 2001) Statistics in Genetics and Environmental Sciences Birkhauser, ISBN: 3764365757;Svirezhev and Passekov (1990) Fundamentals of Mathematical Evolutionary Genetics (Mathematics and its Applications) Springer, ISBN: 9027727724;およびHalloran and Geisser (eds. 1999) Statistics in Genetics (IMA Volumes in Mathematics and Its Applications) Springer-Verlag Telos, ISBN: 0387988289に記載されている。遺伝的に均一な集団を用いた研究は、例えば、Shifman and Darvasi (2001) "The value of isolated populations" Nat. Genet. 28:309-310;Kruglyak (1999) "Prospects for whole-genome linkage disequilibrium mapping of common disease genes" Nat. Genet. 22:139-144;および類似の刊行物中に記載されている。
遺伝的研究のための均一および/または大きな集団の源が有用であり、これはサブセット化を可能にする医学的詳細を伴っていることが好ましく、これには例えば、東部フィンランド集団(Jurilab);アイスランド人集団(deCODE Genetics);アシュケナジム系ユダヤ人集団(例えば、familystudy@jmhi.edu;またはJohns Hopkins School of Medicineを参照);サルディニア(Shardna Life Sciences);ケベック(Genizon Biosciences);モルモン教徒集団(Utah Population Database(UPDB)、Church of Latter Day Saints(LDS)記録もある);エストニア・ゲノム・プロジェクト(EGen);イラン人ヒト突然変異遺伝子バンクおよびデータベース(Najmabadi, et al.(2003) Hum. Mutat. 21:146-50を参照);UK Avon Longitudinal Study of Pregnancy and Childhood(ALSPAC);コスタリカ(Service, et al.(2001) Hum. Mol. Genet. 10:545-551を参照);Newfoundland(Newfound Genetics);および他のものがある。遺伝的均一性に関して特に関心がもたれる特徴には、例えば、地理的な孤立化、均一性、ファウンダー効果、遺伝的浮動、および拡大された連鎖不平衡(LD)が含まれる。Rahman, et al.(2003) Human Molecular Genetics 12:Review Issue 2 R167-R172;およびHeutink and Oostra (2002) Hum. Mol. Genet. 11:2507-2515も参照のこと。
集団の均一性を量的に定義することは往々にして困難であり、サンプル採取は、遺伝的な異端者の状態を示すより慎重な分析の結果に基づいてそのデータを無視または排除することができる外れ値を含めることにより、定義に関しての困難さにさらされる。しかし、本発明は、試験により、SNPまたは他の方法によって所望の集団に含めるための基準を確かめるための手段を可能にする。連鎖不平衡を数学的に定義するためにはさまざまなやり方があるものの、それはゲノムのうちどの程度が典型的には協調的に遺伝されるかに関係している。そのようなものを定義するための手段は、そのようなものを評価するためのマーカーの選択に基づいており、これは一般的にはゲノムの核酸配列における多型、一般的には一塩基多型(SNP)と呼ばれるものである。SNPの選択されたセットを用いることで、分析の粒状性、例えば、マーカーのばらつきがどの程度均一であるかについての指標が得られる。その両方を、量的に測定されたマーカー間距離の「中央値」または「平均」によって評価することができる。その範囲は典型的には数千KBの隔たりであり、ハイスループットのマイクロチップ技術は一般的には約90K〜500K個のSNPを単一の試料分析で提供することができる。このような分解能およびヒトゲノムのサイズにより、平均で約4KBの隔たりが得られる。しかし、用いるSNPの特定のセットに基づき、中央値の範囲は、選択されたSNPの密度がより高いまたは低いかに応じて変化しうる。
連鎖不平衡に関する値は、0(特異な連鎖がない)から1(最も高度な連鎖)までの範囲にわたり、評価しようとする領域の粒状性に応じて、.20、.25、.30、.35、.40、.45.、.50、.55、.60、.65、.70、.75、.80、.85または.90の範囲でありうる。より大きな距離にわたって局所的なLD値が大きいことは、より短い距離にわたってLD値が大きいことよりも有意である。例えば;Shifman, et al.(2003) Hum Molec Genetics 12:771-776を参照。これらの分析において最も関心がもたれる領域は、例えば、肝臓毒性マーカーを対象として表3および4に記載されている、発見されているバイオマーカーに対して物理的に特に局所的であると考えられる。
このため、集団の分析が、集団内のサブセットに由来するデータの中から選択するという形態をとってもよく、その際、「最も均一な集団」は、例えば、均一性を定義する特性の中にはないと同定された個体を排除しての選択による、遺伝的に均一と考えられる集団の選択されたサブセットである。
好ましい集団は、少数のファウンダーを有するファウンダー集団を含むものであると考えられ、いくつかの世代(好ましくは少なくとも約5、8、12、15、20またはそれ以上)を遡って追跡することができ、包括的な医学的および歴史的な情報(好ましくは、大多数にとってはいくつかの医療記録、遺伝的関係に関する他の情報、例えば、教会での結婚および家系の記録など)を有し、「近交」集団の広がりの割合が大きく、かなり大きな研究コホートが可能となる程度に十分に大きいものであると考えられる。ファウンダーの数は、好ましくは約20K、15K、3K、またはさらには約1500もしくは900例未満であり、これは多くの場合、ミトコンドリアDNAまたはY染色体の均一性を評価することによって決定しうる。実質的に追跡可能な世代の数は、好ましくは、約5、10、15、20、50世代またはそれ以上の世代であると考えられる。有用な医療記録は、好ましくは少なくとも5、10、15、20、25年またはそれ以上の年数にわたって存在する、および/または入手可能であると考えられ、家族関係は3、5、7、10、13、17または20世代にわたって実質的に追跡可能である。医療記録の詳細は、限定的な時折の事象、例えば病院入院のみといったものから、より頻繁な診療所受診までの範囲にわたると考えられる;詳細は、付随する診断検査の結果を伴う完全な医療記録から、性別、年齢、アウトカムなどに関する限定的な注釈までの範囲にわたると考えられる。往々にして、特定の試料それ自体が注釈を与えることがあり、例えば、性器は本来的にサブセットでありうるし、または試料に対する簡単な診断手順によって容易に決定することもできる(例えば、Y染色体の存在)。統計的な目的には、ファウンダーに由来する試験集団は、好ましくは少なくとも約70K、140K、220K、300K、500K、800K、1.1M、1.5Mまたはそれ以上であると考えられ、表現型の数は好ましくは大きい、例えば、少なくとも約5、7、10、13、16、20、25、50、100、150、200種またはそれ以上の例があると考えられる。有害事象の報告方式は、少なくとも約5、10、20、30、50、70、100、150、200、450件またはそれ以上の推定される事象を特定するものであってよい。
特に、遺伝的に均一な集団は、呈する偽陽性の割合が低い、例えば、有利な統計的検出力を提供する、相関性の仮説を立てることを可能にする。より大きくより不均一なサンプル集団においてそのような仮説を検証することは、より大きくより不均一な集団において初期試験を行うことよりもはるかに簡単であり、費用もかからない。後者の集団における統計的検出力は劣っており、より高度のバックグラウンドノイズ統計値の中で、より多くの偽陽性および誤ったシグナルをもたらすと考えられる。
評価のための試料を入手するための代替的な手段には、表現型的に均一なコホートを選択することができる、十分なサイズの臨床試験バイオバンクが含まれる。そのようなバイオバンクは、臨床試験の試料に由来してもよく、または臨床試験の状況以外による、相対的に均一ではないが、妥当なコホートサブセットを選択するのに十分な注釈はある試料の十分に大規模な収集物であってもよい。バイオバンクは、ヒト組織バンクまたはバイオリポジトリとしても知られており、これには、UK、エストニア、カナダ、ノルウェイ、スウェーデン、US(NIHを含む)、イラン、シンガポール、日本、スペイン、ドイツを含む、さまざまな政府の取り組み;民間のバイオバンク、例えば、deCODE、Oxagen、Galileo;組織バイオバンク、例えば、Ardais、Genomics Collaborative、Astand、ILSbio;ならびに疾患を対象としたバンキングの取り組み、例えば、心疾患、骨粗鬆症、骨髄登録、乳癌登録、基金(嚢胞性繊維症、パーキンソン病、その他)が含まれる。例えば、Zimmerman, et al.(2004) Biobanks Acclerating Molecular Medicine, IDC #4296;International Society of Biological and Environmental Respositories(www.isber.org);およびInternational Biobank and Cohort Studies Meeting, February 7-8, 2005, Atlanta, Georgiaを参照されたい。代替的な試料の供給源には、国家的な、例えば、UK、カナダまたは中国の医療システム、保健維持機構(Health 維持 Organization)の試料(例えば、試料利用に関する許可を得ている患者に関する医療記録)、健康保険会社または医療センターが含まれうる。
均一なヒトコホートは、仮説を立てるための訓練用サブセットに、および/または仮説を検証するために用いることができる。多くの場合は前者の方がはるかに困難であり、これは、それは毒性経路の活性化をもたらす生物現象に関して最少数の仮定を行うが、後者は任意の源、例えば動物モデルのデータから立てられたものでもよい仮説を確認することができるためである。遺伝的に均一な集団からの訓練セットおよび/または検証セット(別々に、または組み合わせで)のためのコホートのサンプル数は、好ましくは少なくとも5、10、15、30、45、65、80、100、120、145、170, 200、235、270、300、330、370、410、440、470、500、600件またはそれ以上である。
III.相関づけられた遺伝子から経路の仮説へ
初期に同定された遺伝子またはハプロタイプのデータセットにより、表現型と遺伝的に相関づけられると考えられる遺伝子が同定されると考えられる。例えば、構造および推定的な機能の種間比較を可能にするツールを用いた場合に、遺伝子データセットの由来である種が、そこでのバイオマーカーが望まれている種とは異なっている場合がある。1つの種における機能または経路のネットワーク(経路およびネットワークは典型的には互換的に用いられる)の理解、種間の構造的相関、および機能試験を、種の障壁を乗り越えるために用いることができる。すなわち、ラット種のデータセットで同定された遺伝子には、往々にして、構造的または機能的にヒトでの対応物があると予想される。これにより、ヒトを基にした系で直接的または間接的に試験することのできる仮説が設定される。毒物学と関連性のある可能性の高い典型的な経路には、解毒経路(例えば、シトクロムP450)、輸送体(流入/流出)、薬剤代謝経路などが含まれると考えられる。
表現型と相関づけられると考えられる同定された遺伝子のセットから、各種の遺伝子が、表現型と関係する相互作用性の遺伝的実体の経路/ネットワークを指し示すと考えられる。それらの遺伝子の多くは容易に経路を指定することができる。他の多くのものは、あまり明確には解明されていない経路、ネットワークまたは機構の同定を可能にする個体発生分析を用いることによって指定することができる。ネットワークまたは機構に対して容易には指定されない残りの少数の遺伝子は、確度の高い経路連関を指定するためのシステム生物学ならびに種間での構造的および機能的手段を用いて分析することができる。これは、1つの種、例えばマウス、ラット、イヌまたは霊長類からのデータセットを、別の種、例えばヒトに適用するための手段を提供する。しかし、1つの種におけるマーカー(またはその一連のもの)の同定は、別の種における対応マーカーに対して、その第2の種の経路および生理現象の状況において適用される必要があると考えられる。
続いて、これらの経路およびネットワークを、そのメンバーに対して、経路にとって必要な機能に関して評価する。これらには、構造構成要素の開発、種々の構成要素の創出および調節、ならびに経路またはネットワークの維持が含まれる;この際、そのそれぞれは表現型と関係している。
経路またはネットワークの構成要素の同定により、どの構成要素が、その表現型の発達を調節もしくは制御する、またはその出現を予防する決定的ポイントであるかに関する仮説が得られる。続いて、これらの仮説を、表現型に寄与する遺伝子またはバイオマーカーの組み合わせを同定するために検定する。どのバイオマーカーが表現型に対して最大の関連性を有するかを明らかにするために、擾乱分析および代用マーカーを適用することができる。
A.遺伝子セットから経路およびネットワークへ
その発現が表現型と相関づけられる同定された遺伝子のセットの内部では、遺伝子の多くを解明された代謝経路またはネットワークに容易に指定することができ、多くの場合は、その経路が結果的に生じる表現型をいかにして媒介しうるかを容易に理解することができる。この同定には、異なる経路またはネットワークが、これまで認識されないままであった表現型における関連性を有することを認識する上で劇的な影響がある。ネットワークおよび生物系の間のシステム生物学上の相互作用は、経路の関連性が一見するとかけ離れているように思われる表現型に影響を及ぼすこと、例えば、基本的な代謝経路もしくはネットワークがいかにして多数の臓器系に影響を及ぼすか、または1つの系に影響を及ぼすことが認識されている経路もしくはネットワークがいかにして実際には他の系もしくは離れた身体部位における表現型にも影響を及ぼしているか、が認められれば、より良く理解されるようになると考えられる。その反対に、多くの異なる経路が、類似または関連した様式で同一の表現型に影響を及ぼす場合もあると思われる。
しかし、同定されたマーカーのセットの中のある割合は、既知の経路またはネットワークに対して容易には指定されない、またはその内部には存在しないことが考えられる。これらの状況において、予測モデルは典型的には2つの段階で開発されると考えられる。第1の段階は、特定のデータタイプに関して「予備的」な固有特徴(signature)の初期の限定的セットを同定または開発することとして特徴づけることができる。分離可能である第2の段階は、異なるタイプの固有特徴を組み合わせた予測モデルを作成することとして特徴づけることができ、これには所望の予測とより密接に相関する、より識別性および分解能の高い特徴を組み込むことができる。
段階Iの一例として、それぞれの試料に関して、数千個の遺伝子に関する遺伝子発現(または同様に、プロテオミクスのプロファイル、メタボロミクスのプロファイル、またはさまざまな形態のプロファイルの混合物もしくは組み合わせ)の測定を考えてみる。初期の段階は、例えば、データにおける差異の大半にとっての説明となる少数の遺伝子または特徴のプロファイルに対象を絞ること、およびそれを同定することを意図した、データ削減である。例えば、Joliffe (2002) Principal Component Analysis (2d ed.) Springer, ISBN: 0387954422;Krzanowski (2000) Principles of Multivariate Analysis: A User's Perspective (Oxford Statistical Science Series) Oxford Univ. Pr. ISBN: 0198507089;Gnanadesikan (1997) Methods for Statistical Data Analysis of Multivariate Observations (2d ed.) Wiley-Interscience, ISBN: 0471161195;Ramsay and Silverman (1997) Functional Data Analysis (Springer Series in Statistics) Springer, ISBN: 0387949569;Muirhead (1982) Aspects of Multivariate Statistical Theory (Wiley Series in Probability and Statistics) Wiley-Interscience, ISBN: 0471094420;Mardia et al. (1980) Multivariate Analysis (Probability and Mathematical Statistics) Acad. Pr., ISBN: 0124712525;および多変量分析に関する他の教科書を参照のこと。
1つのアプローチは、データの規模を縮小するために主成分分析(PCA)を用いることである。最初の少数の成分(例えば、上位5つを選択する)が、データの大半(例えば90%)の説明になることがある。より多くの成分を追加すればモデルは改良されるが、それぞれの補足的な成分を含めるうちにモデルの改良はわずかにとどまるようになる(リターンの減少)。
もう1つのアプローチは、クラスター化の手法を用いてデータをグループ化することである。データを、クラスター間の距離が最大になるように複数のクラスターにまとめることを目的として(例えば、各クラスターをその近隣のものと区別するために)、数多くのこの種の手法が存在する。例えば、Anderberg (1973) Cluster Analysis for Applications Academic Press;Hoppner, et al. (1999) Fuzzy Cluster Analysis Wiley, ISBN: 0471988642;Zhao (2004) "Evolutionary Computing and Splitting Algorithms for Supervised Clustering" Masters Thesis, U. of Houston(http://www.cs.uhu.edu/~zhenzhao/zhenghongThesis.zip);およびDettling and Buhlmann (2002) "Supervised clustering of genes" Genome Biology (2002) 3:1-15を参照のこと。クラスター化の手法には幅広くさまざまなものがあり、種々のクラスターを分離する際にいくつかのものは他のものよりも奏功する。
さらにもう1つのアプローチは、教師あり(supervised)のクラスター化の手法を用いることである。この場合の目的は、データ自体に含まれるもの以外の情報を用いてデータを分類することである。例えば、同一の転写因子によって調節される遺伝子に関する知識を利用して、それらを一括してグループ化することができる;もう1つは、データをグループ化するために医療記録データを用いることである。
段階Iの最終的な結果は、より大きなデータセット中に含まれ、差異の大半の説明となる、同定された一握りの数の遺伝子またはパターンであるだろう。パターンが、複数の異なるマーカー、異なる形態の分析(遺伝子型、RNA発現、タンパク質発現、翻訳後の特徴、および/または代謝上の特徴)、異なる部位または臓器、時間的な特徴などの組み合わせであることもある。例えば、Abraham (2004) Trends in Biotechnology 22:15-22;およびFrank and Hargreaves (2003) Drug Discovery 2:566-580を参照のこと。
段階IIでは、これらのパターンのいくつかを組み合わせた予測モデルを構築することができる。これは曲線近似作業として特徴づけられるであろう。その最終点は、パターンまたは固有特徴に対して遡って相関づけられる所望の臨床的アウトカムである。
予測モデルのこうした開発のための1つのアプローチでは、逆行的な作業を行うことができる。例えば、特定の患者(データポイント)が遺伝子型パターンX、発現プロファイルY(Yはいくつかの異なるプロファイル、例えば、プロテオミクス性またはメタボロミクス性のものの組み合わせでありうると考えられる)および臨床表現型Zを有するならば、毒性事象の確率はn%(相関係数)であると言うことができる。1つの最も簡単なモデル化戦略は、データポイントの集合に適合させるために、適正な重み係数(相関係数)を有するX、YおよびZをパラメーターとするモデルを構築することであると考えられる。これらの重みは、データポイント全体にわたって既知の臨床的アウトカムの説明となるように選択(指定)されると考えられる。
または、もう1つのアプローチは、ニューラルネットを用いることであろう。例えば、Pearson, et al. (eds. 2004) Artificial Neural Nets and Genetic Algorithms Proceedings of the 6th International Conference in Roanne France 2003 Springer, ISBN: 3211007431;Kurkova (ed.), et al. (2001) Artificial Neural Nets and Genetic Algorithms Springer, ISBN: 3211836519;Bishop (1995) Neural Networks for Pattern Recognition Oxford Univ. Pr., ISBN: 0198538642;およびNelson and Illingworth (1994) Practical Guide to Neural Nets Addison Wesley Pub., ISBN: 0201633787を参照のこと。いくつかのこの種の態様において、ネットワークはデータの一部によって訓練される;その訓練は仮説を導く;そして、その仮説は残りのデータに対しての交差検証を受ける。
予測モデルを作成するためのさらにもう1つのモデル化の手法は、判断樹を用いることである。この場合、データは、データのなおいっそう多くを説明し、最終的にはクラスに到達する、その後に分枝を伴った樹状形態として反復的に分割される。例えば、Mitchell (1997) Machine Learning McGraw-Hill, ISBN: 0070428077;およびDuda, et al. (2000) Pattern Classification (2d ed.) Wiley-Interscience, ISBN: 0471056693を参照のこと。
ここでのさまざまな代替的な選択肢を適用した上での、段階IIの最終的な結果は、関係のあるネットワークまたは経路の形態に関する予測モデルを構築するためにインプットに重みづけを行う、モデル(または仮説)であると考えられる。このモデルは、データの一部(「訓練セット」)を用いて構築されると考えられる;一方、データの他の部分はモデルを検証するために用いられる。
経路の理解に達するためのさらにもう1つの手段は、ゲノム情報、進化系統発生学および関連したシステム生物学に基づくことであると考えられる。機能が不明である遺伝子が、異なる種における別のものに対して構造的、配列上または調節上の類似性を有することが往々にして起こる。これは、当初の種における機能または経路に関する洞察および試験可能な仮説を提供すると思われ、または他の種が、どのような他の特徴または構造が経路またはネットワークに存在しうるかについてさらに多くの詳細を提供する可能性もある。このため、1つの種の内部の、または複数の種にまたがったデータを結び付ける知識データベースは有用であると考えられる。数多くのこの種のデータベースが存在し、これには例えば、Ingenuity、Entelos、BioVista、Jubilant BioSystemsなどによって提供されているものに類似した製品などがある。同様の提供品は、NCBI、さまざまな欧州もしくは他での対応物、または他のウェブサイトから入手可能なはずである。さまざまな同様の経路収集物は、特定の疾病状態、生理的状態または生体サブシステム(例えば、心血管、消化性、呼吸性、ホルモン性、その他)と関連性のある経路を対象としているはずである。
B.経路の同定および解明
同定された遺伝子を、経路を同定するために表現型(例えば、治療アウトカム)と相関づけてもよいが、その経路の内部の個々の遺伝子または特徴はそれぞれ他の特徴とは異なる相関係数を呈すると考えられる。このような特徴とのアウトカムの相関は、選択された試験集団における特徴の頻度、表現型アウトカムのさまざまな機構の頻度、類似の表現型をもたらす異なる機構の数、および多くの他の因子に応じて異なると思われる。しかし、好ましいバイオマーカーは、関連性のある表現型をもたらす最も頻度の高い機構または経路を表すものであり、そのようなネットワークのそれぞれの内部では、ネットワーク内のさまざまな代替的マーカー(遺伝子または他の様式)間で最適な(例えば高い)相関係数を呈するようなバイオマーカーである。このため、最適なバイオマーカーまたは固有特徴は、複数の異なる診断測定値を含んでもよく、動的な特徴を含んでもよい。
多くの場合、経路またはネットワークの理解は、表現型に対して診断的に最も関連性のある特徴の同定を可能にし、表現型の時期、重症度および進行に対して直接的な関連性のあるパラメーターおよび特徴の同定が可能になることもある。このため、リバースエンジニアリングの形態は、表現型に適合させるための診断戦略の策定、およびその状況内で適切な診断パラメーターの選択をもたらすと考えられる。
他の状況では、経路に関してあまりよく知られておらず、いくつかの実験的な構成要素が、どのような特徴または因子が表現型とより直接的な関連性があるかを明らかにするために有用なことが考えられる。また別の状況では、経路は、関連性のあるバイオマーカー、またはその生理的機能における相互作用または調節プロセスに関して不十分にしか解明されていない。これらには、代謝経路分析およびシステム生物学分析の何らかの組み合わせによって補充が可能である。代謝経路を解明するための基本的な手段は、数十年前に中間代謝に関して行われた解明の原理に従う。システム生物学の戦略については以上で参照している。ほとんどの経路は進化をまたいで共有されているため、経路の解明は一般に任意の特定の種において行われる必要はなく、近縁種の関連性が典型的には大きいと考えられる。このため、適正な種は多くの場合、1つの種における特有な生物学的特徴、ツール、材料の入手可能性、およびその種と他のものとの関連性を確かめる容易性に基づいて選択される。基本的な経路、例えば、細胞分裂、シグナル伝達または生体異物の処理を媒介するものは、往々にして動物界全体にわたって保存されており、多くの場合には菌界と動物界との間でもそうである。
経路またはネットワークに特異的な特徴と表現型との間の相関は、典型的には、測定が、その表現型に近接した決定的な固有特徴(アウトカム結果)を直接的に評価し、隔たったものは評価しない場合に最も強い。近接していれば、典型的には、最終的な表現型を弱めうる代償性因子は、たとえあるにせよ、より少ないと考えられ、このために統計的相関係数は最も高くなる(最適化される)と考えられる。さらに、個体および時間の内部および間での測定におけるある種の閾値レベルの特徴、感度および一貫性、試料採取/測定の誤差、決定の容易さおよび速さ、局所的または集中的な分析ならびに他の特徴は技術的に好ましく、ノイズに比してよりきれいな測定シグナルを提供すると考えられる。特定の特徴の選択のためのその他の因子には、評価の経済的効率が含まれうる。以上に示したように、組み合わせ的な特徴は多くの場合、個々の特徴よりもはるかに優れている。時間的特徴を同定することもでき、それは表現型の出現の進行および動態に有用な洞察を提供すると思われる。
したがって、表現型と相関する遺伝子の分析は、共通するように思われる機構的経路の同定を導き、それによって表現型の機構に関する仮説を導くことができる。これらの仮説の検定は、生データから仮説を作るよりも、より好ましい統計学的精度および実験デザインを伴ってはるかに容易に行うことができ、歴史的または単純な実験手順により、特定のモデルを排除するためのさまざまな検定も可能であろう。このように、表現型(例えば、治療アウトカム)に対して相関づけられる遺伝子をまず同定することは、多くの場合、そのような治療アウトカム(これは薬剤有害事象であってもよい)を説明するための機構を定義および理解するための最初の、しかし不完全な段階であると考えられる。
IV.仮説から最適化された固有特徴へ
ひとたび遺伝子セットが特定の表現型と相関づけられることが同定されれば、それらのセットの分析は、その表現型と機構的に関係しているはずである特定の経路を指し示すはずである。このため、そのセットが特定の機能的経路の内部にある多くの遺伝子を含む場合には、そのデータはその経路がその表現型の原因となる重要な構成要素であることを強く指し示す。典型的には、表現型は多数の代替的な機構によって引き起こされ、それらはおそらく関係するものも無関係なものもあるが、そのような機構の収集物は、その表現型をもたらしうるさまざまな代替的な手段または経路を教示するはずである。
続いて、そのような経路の同定を導くために、システム生物学の分析手法を、相関分析によって同定された遺伝子の収集物に対して適用する。そして、その経路自体に関して公知であるもの、または推定しうるものを収集することができる。そのような経路の分析、ならびに相互作用および調節のネットワークの解明により、その表現型をもたらす経路において決定的な遺伝子および反応が明らかになると考えられる。遺伝子および相互作用の定められたネットワークから、その表現型を結果的に生じさせる状態の動的または時間的な発達に寄与すると仮定しうる特徴および固有特徴が同定されると考えられる。続いて、これらの仮説を検定することができ、それにより、アウトカム(特に有意な遺伝的寄与)との最適化された相関を有する固有特徴(単一または組み合わせで)、表現型に対する所望の時間的予測(かなり前から、中間的、または直前の)、最小限のノイズ、最大限の診断安定性、高い識別性および他の所望の特徴が得られる。
検定のための1つの手段は、関連性のある系をモニターするために診断基準を特異的に適用することによるものでありうる。すなわち、指定された経路を含むように設計された、または含むことが認識されている実験系を、系の安定性にとってボトルネック点または決定的な点であるものを明らかにするために評価することができるう。インビボ実験モデルを用いてもよく、往々にして、疾患を表すインビボモデルが存在する。ある特定の場合には、例えば、倫理的な考慮によって表現型またはその進行の直接的な観察が妨げられる可能性のあるヒトにおいては、表現型の読出しの代わりに代用マーカーを用いてもよい。
または、代用マーカーを有するインビトロモデルを用いてもよい。しかし、システム生物学の構成要素もまた、どのタイプの試料(例えば、どの臓器または組織型)が、動物の異なる臓器または系によって呈示される表現型と関連性があるかを指し示す上で有用と考えられる。そこで得られた洞察はしばしば、その表現型が観察された症状を最初に発現する、異なる位置でマーカーを探索することにつながることがある。
さらにもう1つの方法は、表現型との高い相関を呈する診断指標を提供しうるようなバイオマーカー(およびアレル変異体)を同定するための実験的な擾乱分析を含むと考えられる。
さらに、臨床的な病状または治療において関心対象の主な臓器系で発現される影響を引き起こすであろう主な経路を決定するために、経路を評価することもできる。そのような症状には、例えば、毒物学の分野では、消化器、循環器、呼吸器、神経、内分泌、ホメオスタシス、皮膚、筋骨格、血液、泌尿器および生殖器(雄性または雌性)の系がある。このような系を含む臓器を、例えば毒物学の領域で定義することもでき、対象となる主な臓器には肝臓、筋肉、胃腸管、骨髄、CNS、呼吸器、循環器および生殖器の系がある。システム生物学の分析を用いることで、特定の機構的経路が複数の異なる機能的系において表現型を引き起こしうることが明らかになると考えられ、初期症状の発現の部位またはタイプは、前述同様に個体に応じて遺伝的、環境的、生理的または他の因子によって決定されるであろう、ある種の特徴に依存すると思われる。しかし、そのような因子は、それらが特定の患者の医療記録から出てくる可能性のある特徴である場合にのみ同定される可能性が高い。
遺伝子と表現型との相関から、遺伝子の分析が、そのような遺伝子の機能的役割を明らかにするために行われると考えられる。典型的には、それらの遺伝子は、ソフトウエア、例えば、Gene Ontology(CNIOのバイオインフォマティクス用ユニット)を用いて、複数の異なる機能的ネットワークに関与することを特徴づけることができ、生物プロセス、分子機能または細胞構成要素の寸法に応じて分類することができる。例えば、遺伝子は、代謝(例えば、酵素、または酵素および代謝経路の調節)、細胞の生理的プロセス、細胞コミュニケーション、刺激に対する応答、生理的プロセスの調節、生物体としての生理的プロセス、形態形成、細胞プロセスの調節、死亡、細胞分化、ホメオスタシス、成長、タンパク質合成などに関与している可能性がある。
非ヒト種における検討は、ヒト表現型に対して適用しうる経路への多大な量の洞察を提供すると考えられる。例えば、齧歯動物における毒性に関する試験は、これらの分析を伴うことで、齧歯動物において重要な毒性経路が何であるのかに関する情報を提供する。現在はゲノム情報が入手可能であるため、齧歯動物における関連性のある経路の同定を、異なる種、例えばヒトにおける同等な関連性について検討することができる。続いて、同じ経路が第2の種においても関連性があるという仮説を検証することができる。そして、対応する種での対応物は、特に非常に多くの配列データが入手可能であることから、かなり容易に決定可能であり、これによって仮説の検証が可能となる。
表現型と相関する同定された遺伝子は、関連性のある経路においてクラスターを形成するはずであり、これは往々にして、互いに関連する機能的または構造的な特徴のネットワークである。遺伝子の機能を決定するための手段は、文献報告、遺伝子マッピング研究および他のものから得ることができる。そのようなものを結びつけている適切なデータベースには、上述したように、Ingenuity、Entelos、BiovistaおよびJubilant Biosystems知識管理システムデータベースが含まれる。データベース提供物の説明は、簡単なインターネット検索によって入手可能である。
関連性のある経路が同定されれば、擾乱分析により、単独でまたは組み合わせとして、特異的な「決定的」因子または固有特徴の同定を行うことができる。擾乱分析は、特定の構成要素が、決定的な表現型決定パラメーターに対して近接性であるか遠隔性であるかの判定を可能にすると考えられる。
表現型に対する高い相関性を与える診断手段を提供しうるバイオマーカーを同定するために、大規模な実験的擾乱分析を行うことができる。提案されたマーカー(および遺伝的変異体)に対する擾乱を、実験系において生じさせることができる。いくつかの修飾を、遺伝子の配列または量(調節);タンパク質の配列、修飾または量;基質またはその類似体(阻害薬または調節性サブユニットを含む);代謝中間体;エンドポイントまたは分析の時点;温度;および同位体変異体に導入することができる。他の変化は、遺伝子発現変更因子(ノックアウトまたは形質転換体を含む)、遺伝子抑制(例えば、RNAiまたはアンチセンスを用いる)、ドミナントネガティブ形態または抑制因子の使用、および突然変異体の活性化のいずれかによって達成可能である。擾乱が、化学的擾乱、例えば低分子阻害薬、補助因子(天然または他のもの)もしくは活性化因子の濃度を変えること、または測定における時間の関数としての擾乱によるものでもよい。例えば、疾患管理および薬物開発における基本的問題において動態学的特徴が検討されている、KineMed(www.kinemed.com)を参照されたい。
生物系が流れ(重合体が合成されて分解される;代謝産物が経路を行き来してエネルギーをもたらす;細胞が死滅して置き換えられる)によって特徴づけられることは広く認識されているが、現在、生物医学において、分子の動的な流れを測定する検査は事実上存在しない。現代の薬物開発/診断戦略は、このアプローチを無視しており、これは映画の開発以前の写真の状況、または音響の導入前の映画の状況に類似している。
この見方は、一部には、複雑な生物系における動作単位は遺伝子でもタンパク質でもなく、十分に組み立てられた生きた系における代謝経路を通じての分子の流れであるという仮説に基礎をおいている。最終的な分析において、それは、表現型の原因となる合成性、異化性および中間的な代謝経路を通じての分子の流れである。
例えば、アッセイが、高感度な質量分析と、ヒトを含む生きた生物体における安定な非放射性同位体による決定的な分子経路の標識とを組み合わせたものであってもよい。この技術の開発により、ヒトの健康および疾患にとって決定的な代謝経路における分子の流れの測定が可能となる。安定な同位体は多くの投与経路によって送達することができ、ヒトにおける使用に関して安全であり、数多くの代謝経路における同位体の濃縮度はハイスループット様式で決定することができる。これらの動態学的アッセイは、極めて多岐にわたるヒトの病状に対して幅広く適用されている。
擾乱分析は、例えば、Jansen (2003) "Studying Complex Biological Systems Using Multifactorial Perturbation" Nature Reviews Genetics 4:145-151;Bowr and Bolouri (2001) Computational Modeling of Genetic and Biochemical Networks MIT Press;Kanji (1999) 100Statistical Tests Sage; Collado-Vides, et al. (1996) Integrative Approaches to Molecular Biology MIT Press;Adriaans and Zantinge (1996) Data Mining Addison-Wesley;and Everitt and Dunn (1991) Applied Multivariate Data Analysis Arnoldに記載されている。
V.最適化された固有特徴のヒトとの関連性
最適化された固有特徴はヒトまたは非ヒト種に存在するかもしれないが、多くの場合、本質的には表現型に関する代用マーカーであると考えられる。モデル系における固有特徴がヒト系において直接的に示されていない場合には、妥当性確認を行わなければならない。しかし、システム生物学の分析およびゲノムデータが与えられれば、最適化は非ヒトまたは擬似ヒトの状況で行われるであろう。そのような固有特徴の対応するヒト系への変換のために必要なさらなる検討は、最小限にとどまると思われる。
しかし、この方法は、一般に認められている代用マーカーを用いて、ある種の実験系がヒトと直接関連しうることを実証するために後ろ向きに実行することもできる。ある実験系が生物体全体でのヒト表現型の診断指標になることが実証された場合には、続いて、その実験モデルを、治療的処置または治療物質の候補を試験するために用いることができる。続いて、その「実験的」特徴により、表現型、例えば治療応答を判定するために、ヒトにおいて承認された実体を用いることに限定されるのではなく、新たな臨床的候補を試験することが可能となる。
実験系は、例えばインビトロまたはインビボにあってよく、疾患または状態のモデルとして有用な、遺伝的、発生的、生理的または他の系でありうる。モデルは、さまざまな機能的または構造的な系が無傷であって相互作用性である、生物体全体での状況においてヒトで検出された類似の固有特徴に対して遡っての最適化された固有特徴の相関に基づいてもよい。これは実験系に対して適用しうる代用マーカーまたは固有特徴をもたらしうるが、それらは無傷のヒトアウトカムと結びついている。
さらなる入力が、計算論的モデル化(例えば、化学構造を生物学的アウトカムと組み合わせること;例えば、Leadscope技術、Multicase、DEREKなど)によって得られると考えられ、それはデータマイニング、構造的アラートの決定、統計学的相関、化学構造の断片化、エキスパートルールなどを含むと考えられる。
このため、代替的な種、またはヒトの細胞株を含む、細胞株または細胞系を用いることができる。細胞株または細胞系は、ヒト性、形質転換されたもの、トランスフェクトされたもの、または、ヒトの疾患もしくは病的状態の特徴を含むヒト表現型に特徴的な特徴を呈するように改変されたものであってよい。幹細胞からの派生物を含む、細胞株または細胞系は一般に、無傷のヒト系へと遡って有用な相関を提供しうる、記載されたプロセスを用いて同定される可読性の固有特徴を提供するように設計されると考えられる。そして、モデル構築の曲線近似の要素は、医療記録および臨床的入力とともに無傷のヒトデータに遡って本来的に関係している。共通のバイオマーカーを、さまざまな表、データセットおよびサブセットからのマーカーのリストから選択することができる。複数の異なるデータセットを通じて保存されている、または多数の臓器系で症状を呈する共通の毒性機構と関連する、特定のマーカーを選択することができる。例えば、ある種の肝臓マーカーは、肝臓内で認められ、他の部位でも認められる細胞種、例えばPBMC、粘膜または他の細胞種を評価する。このため、マーカーの保存性は、(a)類似の経路が複数の異なる標的臓器で動作していること、および/または(b)異なる部位でマーカーを評価することは、実際には両方の部位に共通して認められる細胞を評価することかもしれない、ということを反映している可能性がある。試料間での類似性、例えば生理現象、機能、構造、遺伝子発現、および/または発生起源(例えば、外胚葉、中胚葉および内胚葉)におけるものは、多くの場合、代謝経路および損害の可能性における類似性を反映しているはずである。このため、遺伝子発現の類似性は、典型的には、生化学現象および毒物学的応答における類似性を引き起こすと考えられる。例えば、高度に血管が発達した組織(これには肝臓、腎臓および多くの免疫臓器、例えば脾臓、胸腺、骨髄、リンパ節などが含まれうる)は、典型的には、遺伝子発現、ならびに血液、血管および関連粘膜といった寄与性の血管構成要素に対する生理的応答において著しい重複を示す。同様に、骨髄、免疫臓器、胃腸管および皮膚などのように急速に増殖する組織は、細胞分裂関連経路の構成要素を共通して発現すると考えられる。このため、1つの臓器と関連性があるバイオマーカーは、往々にして、関連性または関係のある経路について類似の生理現象、機能または遺伝子発現を有する他の臓器とも関連性があると予想される。
VI.最適化されたバイオマーカー/固有特徴から;細胞系、実験モデルに
上記のように、ひとたび固有特徴が同定されれば、それらの固有特徴を臓器またはサブシステムに対して適用することができる。サブシステムには、数ある中でも特に、エクスビボの臓器または系の試験、インビボの非ヒト臓器モデル、細胞株またはその収集物、例えば、その生理的または生物学的アウトカムが集団の多様性の範囲を模しているようなもの、パラメーター(固有特徴の中で同定されたもの)の試験を行うための「チップ上ラボラトリー(laboratory on a chip)」システムを含む、ロボット的または並列的なアッセイ方法、および治療に対する応答の範囲を調べるための他の手段が含まれうる。
代用マーカーおよびエンドポイントを用いた実験モデルの開発の結果は、検査、スクリーニング、および、より簡単で優れた相関モデルによる、高いコストがかかる臨床試験の正確なアウトカム予測を可能にするシステムであると考えられる。薬剤候補開発の後期になって数千万ドルもの出費をする代わりに、信頼性のある実験的フィードバックがより初期にあれば、少数の臨床開発プログラムの枠に対して、競合的な臨床的候補の優先順位づけを行うことが可能となるであろう。そして、工程の初期における信頼性のあるフィードバックは、候補が市場に投入される成功率を高めると考えられる。
さらに、分類用マーカーの固有特徴の開発により、表現型アウトカムに関する試験候補の評価をより容易に行うことができる。これは、新たな介入治療の試験に対して、または、例えば腫瘍の生理現象のターゲティングにおいて、より標的指向的な毒素を開発するために適用することができる。霊長類または他の種を用いて、一般的な環境毒性を取り扱うこともできる。
VII.インビトロおよびインビボの疾患モデル
毒性などの表現型を評価するために実験モデルを用いうるという能力の範囲を超えて、標的としての特定の疾患または病状を有するモデルを開発することもできる。また、臨床的状態に存在する生物現象および生理現象の状況下で読出しが取得されるように、疾病状態による影響を系に組み込むこともできる。所望の標的生物現象の状況を模倣するモデルにおいてアッセイを実施することには非常に大きな利点があると考えられる。
すなわち、臨床的状態の遺伝的または生理的モデルが存在する場合には、バイオマーカーは、提案されたモデルの関連性の決定を助ける上でも、どの治療が「代用」マーカーに対して正の効果を及ぼすかを判定すためにこのようなモデルを評価する上でも有用であると考えられる。さまざまな代謝系がいつどこで重要であるかを評価するために、さまざまな技術を利用することができる。有害応答をモニターもしくは他の様式で同定するため、または疾患の発生もしくは進行をモニターするために、選択された部位で固有特徴を体内的に評価することを目的として、画像化方法を開発することもできる。
同様の方法を、特定の疾患または状態の機構を対象として用いることができ、それが肝臓毒性の機構に対する適用には必ずしも限定されないことは認識されていると考えられる。このため、本方法は、診療によって一括して分類されたか、または状態の分子的定義によって一括してクラスター化されかを問わず、定められた表現型を検討するために用いることができる。その究極的な目標は、類似した症状をもたらす異なる機構を識別し、定められた状態の個別化された治療の可能性へと達する、状態の分子的定義である。
VIII.成果としての製品
A.方法および診断プラットフォーム、治療応用のためのツール
定時点的な診断用製品は、ヒト遺伝子、タンパク質およびメタボロミクス上の対応物を指し示すゲノムデータおよびシステム生物学を用いた、例えば非ヒトからのマーカーの同定の結果として得られるはずである。単一のマーカーから、例えば、さらなる遺伝的相関によって得られた減衰性因子、医療記録データ、非遺伝的マーカー、疾患または病状の因子、行動またはライフスタイルの因子、および他の相関の評価を含む、多数の組み合わせマーカーへの拡張は、より優れた品質およびより高い精度の診断パッケージにつながると考えられる。ヒト集団の表現型またはアウトカムエンドポイントの利用とともに、非ヒト種における仮説を展開することは、診断用製品および方法に対する効率的な統計学的でコスト効果の高い妥当性確認につながる仮説を立てる助けになると考えられる。ヒトでの試験もまた、新たなバイオマーカーおよびそれに由来する製品の同定を可能にすると考えられる。
動的(多数の時点での)モニタリングは、即時的な事象および遠い将来での事象の両方である、結果として表現型をもたした動的な固有特徴の認識の結果として得られるはずである。この理解により、連続的モニタリングによる診断用デバイス、およびリスク進展の経時的な進行を追跡するための方法が可能になるはずである。これは、コンビナトリアル分析と組み合わせることで、診断戦略および患者モニタリングをいかにして行うかに関する重要な新たな見通しを提供するはずである。
バイオマーカーならびに経路およびネットワーク情報を利用する方法および構築物を、実験系に組み込むことが考えられる。これらは、治療法を試験するためのインビトロおよび他のアッセイに組み込まれると考えられる。表現型に関する分類用または代用的な指標が、決定的で強固で組み合わせ的な固有特徴に対象を絞ることによって得られるより優れた精緻な指標とともに、結果として得られると考えられる。動的因子がより良く理解されるようになり、予測方法が開発されることが考えられる。
上記のように、同定された複合的な組み合わせ的および動的なバイオマーカーを用いることで、疾患または状態のモデルへの採用を、表現型と相関づけられた固有特徴に関してより良くモニターすることができる。すなわち、代用的固有特徴の妥当性を確認して、許容される表現型読出しのために実験サブシステム、インビトロ系またはインビボ構成要素を用いるための許容される手段とすることができる。このような実験系は多くの場合、ヒトの構成要素、例えば、遺伝子、調節性構造などを組み込むことができ、または動物からの他の構成要素とともにヒトの系、臓器、組織などを基にすることもできる。ある時間または濃度にわたっての力価を評価するために機械システムを組み込んでもよい。ハイスループットのスクリーニングまたは検査システムは、最適化された代用的固有特徴を評価して、ヒトの応答に関する有用な情報を提供する、または動物もしくはヒトの生物体全体での状況下で慎重にモニターする上での危険を特定すると考えられる。
代替的な系には、動物試験のためのモデルとしての動物細胞株または細胞系が含まれる。ある種のものは、ヒトのバイオマーカーの相互作用における因子を評価するために、ヒトの構成要素、例えば決定的な点であることが同定された遺伝子を組み込むことができる。ある種の動物疾患モデルはヒトの特徴を組み込むことができ、最終的には、例えばゲノム学およびシステム生物学に基づいて、ヒト疾患モデルを作製することができると考えられる。対応物であるヒト組織系またはインビトロ細胞系をコンビナトリアル的に組み合わせて、ヒトの疾患または病状と関連性のあるヒト系の挙動に関する情報を生み出すこともできる。これらの系は、単独でまたは組み合わせとして、表現型に関する診断、モニタリングまたは代用的読出しのために有用な固有特徴をもたらすと考えられる。
これらの系は、スクリーニングまたは検査に加えて、治療法の治療係数の評価にも有用であると考えられる。治療法を組み合わせて試験し、それによって併用薬剤の相互作用に関して有用な洞察を得ることができる。薬剤に関する現在の多くの問題は多数の薬剤の独特な相互作用に起因するため、これらの系は、アウトカム表現型を何らかの統計値を用いて評価またはモデル化するための実験的手段を提供する。これらは、疾患の状況をモデル化するために有用な、有用な実験モデルおよびバイオマーカーを提供する上での初期的な取り組みになると考えられる。
B.治療用製品
表現型、例えば系の相互作用の評価のためのこれらの手段は、治療を受けている個体のモニタリングに向けた応用につながるであろう。すなわち、特定の表現型に寄与する寄与性遺伝因子を知ることにより、患者または患者となる可能性のある者を、治療によるリスクが低いものまたは比較的高いものへとサブセット化すること(患者を複数のサブセットに分類すること)、さらには問題の発生の時期を予測することも可能になると考えられる。これは、どの代替的な治療法が適応となるか、それらをいつ適用すべきであるか、および/または最初の治療法による危険が収まった時に代替法による復帰が安全であるかを判定するという治療的状況において有用であると考えられる。
さらに、本発明は、臨床的な成功に関して初期の薬剤候補の評価または優先順位づけを行うための手段も提供する。薬剤候補の有効性および毒性に関するリスクの早期判定は、市場向けの薬物開発に対して資源の優先順位を付ける上で重要である。前臨床試験および臨床試験のコストは莫大であるため、早期での、信頼性のあるあらゆる情報は、どの候補を継続してどれを中止するか、または複数の選択肢の中での優先順位づけの早期判断において決定的に重要なものとなりうる。後期での中止は、経済的にも時間の損失という点でも非常にコストがかかるため、多くの薬物開発プログラムは、最上位の(第1の)候補の失敗の後に打ち切られている。多くの場合、第2または次の候補は販売承認のために必要な前臨床試験にすら進まず、このため、薬局方に掲載される機会が失われる。このため、これらの試験のアウトカムに関する信頼性のある指標があれば、開発プログラムにおいて特定の候補を他の選択肢よりも上位または下位に置くことができる。本発明はこれを可能にする。
さらに、表現型またはアウトカムを示す、より強固な診断上の固有特徴を用いることで、本発明は、市場からの引き上げというリスクのある薬剤を救済するための手段を提供する。患者または患者となる可能性のある者を、治療に対するリスクの低い患者セットおよびリスクの高い患者セットにサブセット化する、正確で信頼性のある診断上の固有特徴を同定することができれば、薬剤有害事象はさらに稀で特異体質的な状況のものになると考えられる。標的グループが同定可能であることによる、市場からの引き上げからの救済は、往々にして起こる可能性がある。薬剤の組み合わせに関するより費用のかからない試験、および薬剤有害事象の機序に関するより多くの情報は、異なる個体がいかにして特定の治療レジメンに応答するかについてのより良い理解をもたらすと考えられる。
IX.コンピュータシステム
コンピュータシステムは、莫大な量の情報の取り扱いおよび分析、ならびに結果の処理および集約を行うことができるという点で重要である。本発明は、大規模ゲノム評価のための可能性の高い候補を同定するための手段および戦略に端を発する。定められた臓器毒性および/または機構に関する検索の対象をほぼ30K種のヒト遺伝子からそのごく一部(0.2〜2%)に狭めることにより、そのようなマーカーに対応する適切な特徴を探索する作業は劇的に減少する。相関づけを行うコンピュータ手段は、本明細書および別のところで詳細に記載されている。多くの教科書および特許文献がそれらをある程度詳細に記載している。
例えば、肝臓、筋肉、神経、骨髄、胃腸、腎臓、皮膚、免疫系などを対象として、特定の機構と関連性のある標的または経路を求めて、特定の形態の毒性に対するアプローチが行われている。これらの機構のそれぞれの内部で、関連性のある遺伝的マーカーが同定されている。これらのデータをコンピュータ上のファイルとして保存すれば、それはそれぞれのタイプの毒性についてどこをいかにして探すべきかを導くことができる。異なる形態および機構の毒性のカタログおよび関連性のある分類用バイオマーカーのマップを用いることで、このシステムは、開始から進行およびアウトカムに至るまでの毒性経路の目印について、生物体の系の内部のどこを探すべきかの様式をカタログ化することに莫大な威力を発揮する。
生物学的応用に適用しうるコンピュータシステムは、例えば、Skierczynski and Schonk 米国特許第6,934,636号;Nahum and Stanislaw 米国特許第6,695,780号;Otvos 米国特許第6,653,140号;Singh 米国特許第6,560,541号;Stults, et al. 米国特許出願第20060027744号;Hall and Gordon 米国特許出願第20040253215号;ならびにHeller, et al. 米国特許出願第20040236603号に記載されており、そのそれぞれは参照により本明細書に組み入れられる。特に関連性があるのは、例えば、さまざまな治療的選択肢による個人的リスクを決定するための手段を用いて、患者をさまざまなリスク群にサブセット化することを可能にする特徴を評価することのできるコンピュータシステムである。多くの場合、いくつかの特徴には、医療記録データ、遺伝的データ、医療情報の履歴およびそのほかの診断的特徴が含まれうる。
コンピュータシステムは、毒性の形態または経路を、例えば分類用バイオマーカーの基礎をなすデータとともに、カタログ化するか結びつけるファイルを組み込むか、または利用すると考えられる。分類用バイオマーカーのセットをスキャンすることで、さまざまな臓器または位置における毒性を示しうる共通のバイオマーカーを同定することができ、これは広範囲にわたる位置の生体試料の全体にわたって毒性経路の状態を評価することのできる特徴またはパラメーターの選択につながる。試験を簡単にするために、複数の異なる臓器または位置からの試料を、共通の評価プラットフォームで評価することもできる。
別の状況では、特定の特徴の連続的モニタリングが必要かもしれない。特徴の動的パターンは、毒性作用の欠如、開始、進行および不可避な毒性応答の目印を示す可能性がある。動的モニタリングは、症状がいつ重篤になるか、および進行が不可逆性に近づいた時に特定の治療的介入をいつ代用または変更しなければならないかの同定を可能にする可能性がある。または、経路の進行が、治療的介入によって、例えば、別の承認された薬剤、または公知のインターベンション(食事、他の治療法)を用いて、阻止される可能性もある。何をいつ評価するかを同定するためのコンピュータシステムは、決定的な相関を指し示すファイルを含むか、またはそのような情報を本来的に用いるプログラムを基にしていると考えられる。
したがって、本発明は、検討される特定の毒性機構と結びつけられる、関連性のあるバイオマーカーを同定またはリスト化したファイルを提供する。これらのファイルは、ソフトウエアを介して、コンピュータシステムに直接的または間接的に組み込まれると考えられる。遺伝子型、遺伝子発現、タンパク質発現、タンパク質修飾、翻訳後修飾、RNA特徴などのパターンが、同様のファイル中に含められると考えられる。
X.ビジネス方法
SNP、他の遺伝因子または発現もしくは機能の他の特徴のいずれに基づくかを問わず、同定された分類用バイオマーカーを用いると、それに基づく診断の商業的機会があるはずである。毒性の基礎をなす遺伝的または生理的な基盤が解明されれば、診断用製品、サービスおよび関連した商業的機会が、結果として得られると考えられる。どこを、いつ、いかにして探し求めるべきかを知ることにより、さまざまなカテゴリーのリスクを経験する可能性のある者を知らせることができる。特定の試験は、標的患者を、特定の治療法または薬剤レジメンに対して負に応答する可能性が高いまたは低い者へとサブセット化しうる可能性がある。
また、毒性機構の指標となる適切なマーカーを認識することにより、例えば、有効性、リスクまたは毒性経路の活性化に応じて患者をサブセット化するための診断要素として、治療薬または薬物の開発の取り組みにおける使用も可能になると考えられる。経時的なモニタリングは、毒性経路が突発すると考えられる特徴の認識を可能にすると考えられる。無傷の系における安全性に対して高い相関を呈する同定されたマーカーを評価する試験系は、開発の取り組みの早期に化合物を試験するために有用と思われる。開発中の化合物に、それらがヒトに対して投与される前に優先順位を付けることは、早期での候補の強化、および費用のかかる臨床試験に達するはるか以前での正確な毒性評価を可能にすると考えられる。さらに、疾病状態を近似する試験系が結果として得られると考えられ、それは、背景疾患のある状況下での毒性試験、および、例えば、治療法の組み合わせまたは薬剤併用療法に対する応答といった比較的稀に起こる臨床的状況に対する応答を判定するための試験プラットフォームの両方のための、より優れた予測システムにつながる。
毒性の開始または進行の機構および/または経路の理解は、その応答を阻止するための介入の可能性を与える。例えば、除去機構を増進すること、毒性物質(一次化合物または代謝的に毒性化したもの)を分路に流すためのバイパス機構を誘導すること、または二次標的を遮断することによって、ADRの進行を阻止するための特定の治療的手段が同定される可能性がある。または、患者における進行のモニタリングは、代替的な治療法の代用の頻度が低くなるといったように、終了の前により安全な継続的な投与を可能にすると思われる。
さらに、毒性の経路のより優れた理解は、疾患の経路に関してより優れた洞察を提供すると考えられる。毒性経路を解明するための同様の戦略は、疾患経路を解明することにも適用しうる。(1)多くの場合は分類用バイオマーカーの収集物における、二倍体ハプロタイプまたはアレル性バイオマーカーの組み合わせに対する遺伝的相関づけ;(2)生理的機能の迂回または継続のための経路および代替的実体に関するシステム生物学上の理解、および生物体におけるどの場所(どの臓器)およびバイオマーカーの特徴を評価すべきかの認識;(3)経路の欠如、開始、進行または過去の状態の目印を同定するために有用と考えられる動的パターンの評価;および(4)分析のための表現型的に均一な収集物の選択を可能にする、医療記録を有する均一な遺伝的集団または大規模な試料バンクの使用、を組み合わせた、毒性経路または他の経路を分析するための方法を開発することができる。
投薬レジメンまたは薬剤併用投与を評価またはモニターすることもできる。併用療法の閾値毒性レベルを確定、モニタリングまたは同定することができ、それは併用療法が共通の標的に影響を及ぼしつつ、悪影響は閾値以下となることを可能にする。薬理学の時間的局面を、特定の患者に対して妥当なように、はるかにより適切に定めて個別に慎重にモニターすることもできる。
今日のコンピュータモデルは以前は風洞試験を必要とした空気力学的設計を可能にしているため、コンピュータシミュレーションはヒトにおける毒性応答の予測を可能にすると思われる。
本明細書における考察の多くはヒトの治療標的に言及しているが、いくつかの応用は獣医学的治療の状況でも容易に用いられるであろう。したがって、本方法はヒトの分析には限定されないと考えられ、他の群、例えば、哺乳動物、霊長類、臨床試験で典型的に用いられる種、例えば、ラット、マウス、イヌ、ネコ、チンパンジーならびに他の霊長類および亜霊長類に対して;さまざまなタイプの動物機能に対して、例えば、愛玩用(イヌ、ネコ、ウサギ、その他)、食用(鳥類、ヤギ、ヒツジ、ウシ、ブタ、ヘビ、その他)、使役用(ゾウ、ラクダ、雄ウシ、ラマ、ウマ、イヌ、その他)および展示用の動物(ウマ、水生動物、その他)など;構造的カテゴリーに対して、例えば、四足動物、二足動物、飛行性動物、水生動物など;真菌(アカパンカビ、酵母を含む)、原核生物、原生動物(例えば、マラリア、トリパノソーマ、その他)、植物、昆虫(ハエ、ミジンコ、病害虫)、虫(センチュウ、体節化したもの、またはその他)、無脊椎動物または脊椎動物、および他の生き物などからの標準的な実験種を含む、種の特定のサブセットに対しても適用しうると考えられる。特に、「病害虫」に対する本発明のいくつかの応用は、他の種に対してはほとんどまたは全く影響を及ぼさない、より有毒な物質を見いだすことであろう。
特に、本発明は、分析および診断の両方のための、さまざまな方法を対象とする。1つまたは複数の段階が、情報の収集、分析、使用が行われるか治療の判断が下される場所である国の管轄外で行われる方法を意図している。この理由から、法的管轄下にある人に対して情報が伝達される方法であって、その人が患者、医療専門家(ヒトまたは獣医学)、医療保険の会社または監査人、または薬物の販売もしくは規制の当局であるようなものを含む方法を記載している。情報は、例えば、書面で、口頭で、もしくは符号化された形態で、またはデジタル式、アナログ式、もしくは暗号化された形態で、伝えることができる。
さらに、これらの方法に用いるために設計されたデバイスも、本発明に含まれる。したがって、これらの分析に用いられる細胞株、系なども組み入れられる;手作業式の、自動化された、ロボット的なシステムに用いられるキットおよび診断システムについても同様である。好ましくは、システムは結果を迅速に、再現性を伴って提供し、手作業による取り扱いは最小限であると考えられ、これは例えば、ばらつきを最小限に抑え、診断の妥当性確認を助長するものであると考えられる。
本発明をこれまで一般的に説明してきたが、それは以下の実施例を参照することによってより容易に理解されると考えられる。ただし、これは例示として提供されるものであり、特記していない限り、本発明を限定することを意図してはいない。
実施例
I.一般的な方法
遺伝子分析のための方法は周知であり、遺伝子のマイクロアレイ分析の時代にあっては特にそうである。アレルの完全に無傷な配列の具体的な評価も同じく一般的なものであり、それには完全シークエンシング、選択されたプローブに対するハイブリダイゼーション、PCR分析などが含まれうる。分子生物学の一般的な方法は周知である。例えば、Ausubel (ed.), et al. (2002) Short Protocols in Molecular Biology (Short Protocols in Molecular Biology; 5th ed.) Current Protocols, ISBN: 0471250929);Sambrook, et al (2001) Molecular Cloning A Laboratory Manual (vol. 1-3) CSH Lab. Pr.およびオンラインラボラトリーマニュアルに発展している提携下のwww.MolecularCloning.comのサイト;
Figure 2008541696
;およびHumana Press Methods in Molecular Biology/Molecular Medicineシリーズの他の巻(www.humanapress.com;またはBioMedProtocols.comを参照);Methods in Enzymologyシリーズ;定期刊行される「Nature Methods」;などを参照のこと。
II.試料の収集(動物/ヒト)
生体試料は、適切な対象、例えば動物またはヒトから収集する。これらはヒト患者、例えば、好ましくない薬剤効果などのような表現型を呈している人であってもよい。その反対に、人を、好ましくない薬剤効果を全く経験しない人、すなわち、低リスク患者として同定することもできる。患者を好ましくない薬剤効果がある、または好ましくない薬剤効果がないという分類にサブセット化することは有用であると考えられ、統計分析は典型的にはいずれも盲検下の分析を必要とする。例えば、行動、ライフスタイルおよび付随する医学、疾患または治療の情報を含む、付随する医療データなどの収集は非常に有用である。試料は往々にして、臨床試験の一部としてバンク保管されており、付随する医療記録は注釈上大きな価値を有しうる。
ある種の試験のためには、試料採取に関する制約が少なくなることから、実験動物対象が好ましいと思われる。動物での試料採取は典型的にはより侵襲性が高いことが可能であり、一般的にはタイプおよび量に関して限定されず、一般的には費用もよりかからない。ヒトでの試験には、倫理的(タイプ、量、目的、同意)および金銭的な考慮事項の両方によって加わる制約がある。
試料採取には、1つまたは複数のタイプ、例えば、適切なバイオマーカーの遺伝学、発現、代謝などを評価するための液体、細胞、血清、組織、毛髪、皮膚、流体などの材料が含まれうる。試料は好ましくは直ちに評価され、または後の分析のために、適用しようとする分析のタイプに合わせた、例えば凍結、固定または他の保存方法などの適切な処置の後に保存される。動物試料は、評価すること、保管すること、および後日さまざまなパラメーターに関して評価することがより容易であると思われる。
好ましくは、標的または試料集団は、呈する遺伝的多様性が低く、異端者による遺伝的多様性の導入が最小限である均一な集団であると考えられる。試験の統計学的検出力が有用な結論をもたらしうるように、統計学的な考慮事項は認識されるべきである。このような集団における少数の個体の遺伝子分析により、表現型、例えば治療アウトカムに関与する可能性の高い経路を示唆すると考えられる特定のバイオマーカーが指し示されると考えられる。しかし、その相関は弱く、ノイズと識別不能である可能性がある。このため、医療記録および関連データと結びつけられた大規模な均一集団、例えばアイスランド人または類似の集団が、特に有用である。または、バンク保管されている試料の選択が、表現型または遺伝子型の類似性に基づいてもよい。
または、動物試験を用いてもよく、それは特定の表現型と相関する遺伝子マーカーを同定する上で有用であると考えられる。動物試験のヒト表現型に対する関連性は、試験デザインにおける考慮事項である。
さまざまな臓器における毒性を評価するデータセットが入手可能である。第1のものは、ラット、マウスおよびイヌで試験された肝臓毒性である。関心対象のその他の臓器毒性には、筋肉毒性(疲労、疼痛および心血管筋の問題)、CNS、骨髄(免疫系および他の影響)、胃腸管(同様に急速な細胞複製を有する)、腎臓(除去機能)、皮膚(速い複製)および肺(膨大な表面積)が含まれる。
III:試料の評価
多くの診断方法が、好ましくはGood Laboratory Practicesを用いて、生体試料を評価するために有用である。例えば、Nicoll, et al (2003) Pocket Guide to Diagnostic Tests (LANGE Clinical Science, 4th ed.) McGraw-Hill Medical, ISBN: 0071411844;Gallin (2002) Principles and Practice of Clinical Research Academic Press, ISBN: 0122740653;Daniels (2002) Delmar's Manual of Laboratory and Diagnostic Tests Thomson Delmar Learning, ISBN:.0766862356;Anderson (2002) GLP Essentials A Concise Guide to Good Laboratory Practice (2d Ed.) CRC Press, ISBN: 1574911384;Weinberg (2002) Good Laboratory Practice Regulations (Drugs and the Pharmaceutical Sciences: a Series of Textbooks and Monographs, 3d ed.) Marcel Dekker, ISBN: 0824708911;Springhouse (2001) Clinical Laboratory Tests Values and Implications (3d Ed.) Lippincott Williams and Wilkins, ISBN: 1582550816;Abraham, et al. (2004) Trends in Biotechnology 22:15-22;およびFrank and Hargreaves (2003) Drug Discovery 2:566-580を参照のこと。
例えば、Affymetrixまたは類似の技術を用いる、遺伝子の高密度マイクロアレイによる評価は、極めて魅力的である。例えば、Baldi, et al. (2002) DNA Microarrays and Gene Expression From Experiments to Data Analysis and Modeling Cambridge University Press, ISBN: 0521800226;Simon, et al (2004) Design and Analysis of DNA Microarray Investigations Springer, ISBN: 0387001352;Knudsen (2004) Guide to Analysis of DNA Microarray Data (2d ed.) Wiley-Liss, ISBN: 0471656046;Speed (ed. 2003) Statistical Analysis of Gene Expression Microarray Data Chapman and Hall/CRC, ISBN: 1584883278;Draghici (2003) Data Analysis Tools for DNA Microarrays (Bk and CD-ROM) Chapman and Hall/CRC, ISBN: 1584883154;Schena (2002) Microarray Analysis Wiley-Liss, ISBN: 0471414433;および他のものを参照のこと。さらに、低密度アレイまたは個々のビーズもしくはPCR分析用プラットフォームを用いることもできる。
本発明の1つの態様においては、ひとたび関心対象の遺伝子が同定されたところで、ヒト集団における対応アレルの「全母集団(universe)」を明らかにするためにPCR分析を行う。アレルの領域は、染色体配列の比較的短いセグメント、おそらくはほぼ「数」kbの長さに位置づけることができる。または、イントロンをスプライシングで除去した上でRNA配列を評価するというRNA分析を行うこともできる。発現される特定のアレル(可能性のある公知の全母集団の中で)の同定には、背景ノイズを減らすための「PCR型」の増幅工程も含まれうる。ゲノムの関連領域を扱うために適切なプライマーを選択して用いる。その領域を増幅して、ゲノムの他の部分は脱落させる(背景ノイズを減らす)。例えば、選択されるプライマーは、最大で10〜15種の異なる特定のアレル配列の間でさまざまであってよい。可能性のある中からどの対を用いたかを決定するためには数多くの色素が入手可能である(例えば、現在のFACSシステムは10〜15種の異なる蛍光波長を識別することができる。多型のそれぞれとハイブリダイズするプライマーを用いて、本発明者らは、組み込まれた15種の異なるプライマーを判定するために、異なるように標識されたプライマーを組み込む(またはハイブリダイズさせる)ことができる。二倍体対を形成する2つの異なるアレルは、例えば、プライマーの1つのセットを1つのアレルに対して指定し、プライマーの他のセットを他のアレルに対して指定すること(例えば、プライマー(波長による)2、6および14を1つのアレルに指定し、1、4および14を第2のものに指定する、等)によって、確かめることができる。このような「ミニシークエンシング」は、例えば、Liljedahl, et al. (2004) BMC Biotechnology 2:24 (doi: 10.1186/1472-6750-424); Shi (2001) "Enabling large-scale pharmacogenetic studies by high-throughput mutation detection and genotyping technologies" Clin. Chem. 47:164-72に記載されている。
同様の問題を対象とする例示的なデータセットは、例えば、Boess, et al. 米国特許出願第20040005547号 "Biomarkers and expression profiles for toxicology";Durham, et al. "Identification of biomarkers for liver toxicity" 米国特許出願第20040265889号;Gut, et al. "Individual drug safety" 米国特許出願第20050037366号において成し遂げられている。
他の方法を適用することもでき、それには多数の方法にまたがった分析が含まれうる。例えば、Evans (2004) A Handbook of Bioanalysis and Drug Metabolism CRC Press, ISBN: 0415275199;Matson (2004) Applying Genomic and Proteomic Microarray Technology in Drug Discovery CRC Press; ISBN: 0849314690;およびAlbala and Humphery-Smith (2003) Protein Arrays, Biochips and Proteomics Marcel Dekker, ISBN: 0824743121を参照のこと。上述したように、多くの分析手法をプロテオミクスまたはメタボロミクスに対して適用することができる。
遺伝子分析には、例えば、定量的なDNAレベル(遺伝子コピー数;遺伝子重複;遺伝子欠失;その他)、定性的なDNA特徴(多型;変異;差異;調節的な特徴;および構造的または調節的な構成要素のその他の特徴)およびその他の構造的または機能的なDNA特徴(メチル化、アセチル化、その他の修飾または特徴)の分析が含まれうる。例えば、Fuchs and Podda (2004) Encyclopedia of Medical Genomics and Proteomics (2 vols.), Marcel Dekker, ISBN: 0824755618;Redei (2003) Encyclopedic Dictionary of Genetics Genomics and Proteomics (2d ed.), Wiley-Liss, ISBN: 0471268216;およびCampbell and Heyer (2002) Discovering Genomics Proteomics and Bioinformatics (Bk and CD-Rom ed.) Benjamin Cummings, ISBN: 0805347224を参照のこと。
ハプロタイプ分析には、例えば、各個体における全ハプロタイプ分析(機能的に関連した変異形態または他の変異形態を含め、集団全体にわたって呈示される、可能性または関連のあるハプロタイプまたはアレルの全要素を考慮する)、遺伝子コピー数および発現調節上の違いの分析(遺伝子重複、遺伝子増幅分析)および特に、特定のハプロタイプが、特定の遺伝子型の生物学的機能に影響を及ぼすハプロタイプまたは関連ハプロタイプの他の組み合わせとどのように相互作用するかの分析が含まれる。例えば、「優性」ハプロタイプが「劣性」ハプロタイプの多数のコピーに対して劣性であること、および、ある種の形態の遺伝子用量効果が、遺伝子コピー数(例えば、染色体重複において)またはアレルを制御する調節性セグメントに依存することがありうる。特に、アレルの特有の組み合わせに起因する表現型は、特定のアレルの固有の「優性」または「劣性」に関する最も単純なメンデル則モデルには適合しないことがある。そして、動態学が決定的に重要な状況、例えば代謝経路においては、反応物の流れが、関連性のある(ソース/シンク)酵素の反応または代謝回転速度によって影響されることがあり、特定の反応物の最終的な蓄積は、それぞれの生成性または反応性の酵素の相対的な発現レベルまたは代謝回転数に依存することがある。多くの場合には、特定の発現アレルの代謝回転数は、異なる上流もしくは下流の酵素の機能の過剰発現/過少発現によって、調節性エフェクターの活性によって、または上流もしくは下流の機能における異なるアレルの代償性発現によって代償されうる。さらに、異なる関連(例えば、重複性)酵素機能の存在が、特定のアレルの影響力に影響を及ぼすこともある。このため、関連機能の全領域に対する相関が、個々のアレルに対する単純な遺伝的相関が往々にして最適な相関を提供できず、往々にして治療上の意志決定を効果的に助けるには十分でない乏しい相関を生じさせることを理解する上で有意義であると考えられる。
発現分析は典型的にはmRNA分子に関係しており、これには例えば、発現調節(転写;mRNA代謝回転;mRNAの寿命;翻訳エフェクター;およびスプライス変異体(それらの多くは異なる表現型機能を呈しうる))が含まれる。特定のアレル形態の定性的な定義および定量のためには、PCR法または関連した方法を用いることができる。
タンパク質の評価、例えばプロテオミクス分析によるものは、多くの場合、異なる表現型、例えば機能的な違いを呈しうる形態同士を識別すると考えられる。配列、量、修飾(グリコシル化、リン酸化、その他)、補助因子、サブユニット相互作用(特に多タンパク質複合体において)およびその種のものに関する変異体は、活性、機能またはその他の表現型の違いをもたらしうる。
機能的な生物学的実体を評価するための多くの方法が記載されており、これには例えば、
Figure 2008541696
がある。
例えば、タンパク質に対するある種の修飾(メチル化、グリコシル化、リン酸化、アセチル化、ユビキチン化、および他の多く)は、酵素の代謝回転数、生物活性、半減期、代謝回転、基質または他の(例えば、調節的な)特異性もしくは選択性、温度または他の環境的な感度、エンハンサーまたはサプレッサーの効率、および特定の状況下での最終的な生物学的機能に影響を及ぼすその他の多くの特徴に影響を及ぼす可能性がある。例えば、Lee, et al. (2003) Drug Metabolism Enzymes Marcel Dekker, ISBN: 0824742931;およびTesta and Mayer (2003) Hydrolysis in Drug and Prodrug Metabolism: Chemistry Biochemistry and Enzymology Wiley-VCH, ISBN: 390639025Xを参照のこと。シャペロンタンパク質、ならびにタンパク質のコンフォメーションおよびフォールディングスカフォールドも重要なことがあり、往々にして機能的ユニットは特定の遺伝子または遺伝子産物以外であると考えられる。例えば、リボソーム機能はおそらく、その構造に寄与する多くのタンパク質およびRNA構成要素によって劇的な影響を受ける。
インサイチューハイブリダイゼーション法は、オルガネラまたは細胞内区画の適合度、輸送の完全性および効率、ならびにアレルの種々の違いを高感度に識別するか媒介するその他の全体的な生物学的機能を評価することができる。
その他の方法も存在し、それらは直接的でも間接的でもよく、例えばPETスキャン、ガスクロマトグラフィー、他の非侵襲的もしくは侵襲的な分光法または記載することが重要と思われる他の方法のように、生物学的機能の特定の特徴を評価するための代用手段として用いることもでき、本明細書において用いうると考えられる生化学的特徴を評価するために用いることもできる。例えば、Korfmacher (2005) Using Mass Spectrometry for Drug Metabolism Studies CRC Press, ISBN: 0849319633;およびPfleger, et al (2000) Mass Spectral and GC Data of Drugs Poisons Pesticides Pollutants and Their Metabolites (2d Ed.) Wiley-VCH, ISBN: 3527288805を参照のこと。
潜在的には、入手しやすい試料が多くの場合、遺伝子分析に最も適しており、それは試料が歴史的に、または保管形態として存在する可能性があるためである。血液試料はかなり一般的であり、収集が容易である。典型的には、DNAおよび関連した方法、例えばPCR、ハイブリダイゼーション、シークエンシング、制限分析などは、分析に関して「定性的」であり、かなり高感度であってかなり明確である。さらに、試料の取り扱いは簡単であって再現性が高い傾向がある。試料は非侵襲的な方法によって収集することができ、これには例えば、毛/指の爪/皮膚/粘液の試料がある。X線、MRIまたは関連した画像化法;便/尿/唾液/粘膜試料;生殖性流体;涙液;呼気;および外部分析方法などの、他の非侵襲的な手法を用いることもできる。
IV:評価の解釈
分析を用いる表現型の統計学的相関分析は、統計学的相関を呈するマーカーを、順位を付けて同定すると考えられる。特定のハプロタイプまたはアレルがそれぞれ評価されるように、ハプロタイプの組み合わせと相関づけるために分析の拡張を行うこともできる。単純には、ハプロタイプまたはアレルが対形式のみ(例えば、二倍体のみ)であると仮定することで、特定の対との相関を表現型に関して評価することができる。これをさらに拡張すると、相関には、1つの染色体(またはその部分)が重複する可能性がある、遺伝子量もしくは劇的な調節的影響を評価しうる、または機能的に等価な代替的な遺伝子部位が表現型に対する浸透度に影響を与える可能性があるといった状況を含む、代替的な組み合わせも含めるべきである。
多くの状況において、ハプロタイプまたはマーカーは、表現型と相関する特定の代謝もしくは酵素経路またはネットワークを明らかに示すと考えられる。または、さまざまな経路が決定的なものとして現れ、それらの経路またはネットワークのメンバーをより詳しく評価しうることも考えられる。
分析においては、標的集団(例えば、特定の影響を経験している)に含まれる遺伝的差異の大半の説明となる、ある種のパターンが同定されると考えられる。例えば、多くの遺伝子、好ましくは構造ゲノム全体に関する遺伝子アレル分析の状況では、アレル対形成の有無を評価する。評価は多くの形態をとりうるが、主要な形態には、主成分分析(PCA)、さまざまなクラスター化手法、教師ありクラスター化手法、および上に言及したその他の統計的方法が含まれる。これらのデータは、どのネットワークおよびこれらのネットワークのどのメンバーが、有用な固有特徴因子として可能性の高い標的であるかを解明するために、システム生物学およびゲノムの種間相関と組み合わせることのできる情報を提供すると考えられる。これらの因子は、特徴、典型的には組み合わせ(これらは一緒になって表現型を定める)と直接相関づけられるものであると考えられる。
A.Boess肝臓毒性データセット
Boess, et al. 米国特許出願第20040005547号「Biomarkers and expression profiles for toxicology」によるラット肝臓毒性マーカーに対してGene Ontologyソフトウエアを適用することで、表1の結果が提供される。
表2Aは、Boess, et al.の特許からのデータセットに由来する霊長類対応物のバイオマーカー遺伝子に関する遺伝子ID番号をリスト化している。ヒトおよびチンパンジーの対応物が同定されており、ゲノム上での十分な情報を入手しうる他の種も同様にリスト化することができる。ヒトのサブセット1は、Entrez ID、一般に認められている記号、およびマーカーに対応する遺伝子の短い説明を明示的にリスト化して、対応物のヒト遺伝子を提供している。http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=geneを参照のこと、そのデータベースは例えば、Maglott, et al.(2005) Nucl. Acids Res. 33:database issue doi:10. 1093/nar/gki031に記載されている。ヒトのサブセット2は、ヒトまたは他の種の対応物のいずれかに関して報告されて、サブセット1のマーカーと直接的に相互作用すること(例えば、物理的会合または2-ハイブリッド相互作用による)が報告されている遺伝子のEntrez遺伝子IDである。ヒトのサブセット3は、発表された要旨においてサブセット1のマーカーの1つとともに言及されていることによって関連づけられたマーカーのEntrez遺伝子IDである。
同様に、チンパンジーの対応物もEntrez遺伝子ID番号によってリスト化されている。
表2Bは、選択された非霊長類種における対応物のEntrez遺伝子ID番号をリスト化している。これらはイヌ、ラットおよびマウスで提供されている。さらなる種のゲノム配列がより完全になり、対応物である等価物を決定しうるようになっているため、他の種に関しても同様の対応物を作製することができる。典型的には、対応物は配列の関連性、近縁種における遺伝子位置、または機能的等価物によって指定される。
(表1)Gene Oncologyによる分析
Figure 2008541696
Figure 2008541696
Figure 2008541696
(表2A)霊長類の毒物学バイオマーカー
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
(表2B)毒物学バイオマーカー「(非霊長類)」
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
(表3A)その他の毒性バイオマーカーtcdd、hl、ez、hg
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
(表3B)非霊長類マーカーtcdd、hl、ez、hg
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
(表4)特に好ましいヒト毒性マーカー
Figure 2008541696
(表5A)霊長類の毒物学バイオマーカー
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
(表5B)毒物学バイオマーカー(非霊長類)
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
(表6A)霊長類の毒物学バイオマーカー
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
(表6B)毒物学バイオマーカー(非霊長類)
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
Figure 2008541696
B.そのほかの肝臓毒性データセット
ラット、マウスおよびイヌにおいて作製されたそのほかのデータセットも同様に評価されている。これらには、Boverhof, et al. (2005) "Temporal and dose-dependent hepatic gene expression patterns in mice provide new insights into TCDD-Mediated hepatotoxicity" Toxicol. Sci. 85:1048-1063で報告されたマウス肝臓におけるTCDD(ダイオキシン)毒性に関する;Heinloth, et al. (2004) "Gene expression profiling of rat livers reveals indicators of potential adverse effects" Toxicol. Sci. 80:193202で報告されたラット肝臓におけるアセトアミノフェン(APAP)毒性(hl)に関する;Ellinger-Ziegelbauer, et al. (2004) "Characteristic expression profiles induced by genotoxic carcinogens in rat liver" Toxicol. Sci. 77:19-34で報告されたジメチルニトロソアミン、2-ニトロフルオレン、アフラトキシンB1および4-(メチルニトロソアミノ)-1-(3-ピリジル)-1-ブタノンを含むさまざまな化合物(ez)に関する;およびHiggins, et al. (2003) "Gene expression analysis of the acute phase response using a canine microarray" Toxicol. Sci. 74:470-484で報告されたイヌ肝臓におけるリポ多糖(LPS)毒性(hg)に関するデータが含まれる。
表3Aは、肝臓毒性試験に基づく、これらのデータセットに由来する霊長類対応物のバイオマーカー遺伝子に関するEntrez遺伝子ID番号をリスト化している。ヒトおよびチンパンジーの対応物は同定されており、ゲノム上で十分な情報を入手しうる他の種も同様にリスト化することができる。ヒトのサブセット1は、Entrez ID、一般に認められている記号、およびマーカーに対応する遺伝子の短い説明を明示的にリスト化して、対応物のヒト遺伝子を提供している。霊長類のサブセット2は、ヒトまたは他の種の対応物のいずれかに関して報告されて、サブセット1のマーカーと直接的に相互作用すること(例えば、物理的会合または2-ハイブリッド相互作用による)が報告されている遺伝子のEntrez遺伝子IDである。霊長類のサブセット3は、発表された要旨においてサブセット1のマーカーの1つとともに言及されていることによって関連づけられたマーカーのEntrez遺伝子IDである。
表3Bは、選択された非霊長類種における対応物に関するEntrez遺伝子ID番号をリスト化している。これらはイヌ、ラットおよびマウスで提供されている。他の種に関しても、それらのゲノム配列がより完全になり、対応物である等価物を決定しうるようになっているため、同様の対応物を作製することができる。
表4は、多数のデータセットの分析から見いだされたマーカーをリスト化している。これらのマーカーには、それらを重要なものとして指摘している独立した研究があるが、それは肝臓毒性には限定されない。同様の分析を、表5A/Bおよび6A/B中のものを含む、そのほかのマーカーに対して行うことができる。
毒性経路の評価および試験のために、特に好ましい識別用マーカーは、それらの組み合わせを含め、表4のさまざまなリストに列記されたものである。これらは、肝臓毒性における関連性のある識別用マーカーであることを異なる独立した研究が共通して示しているヒトマーカーである。霊長類の試験系は臨床試験と関連性のある可能性が最も高いため、霊長類の対応物も重要であると考えられる。
他の好ましい態様は、各々の研究のそれぞれからの霊長類マーカーに関する表3Aのサブセット2および3である。これらのマーカーは、研究の内部もしくは複数の研究にまたがって、個別にまたは組み合わせ(例えば、異なるデータセットからの1つまたは複数)として、選択することができる。これらのマーカーの1つまたは複数の組み合わせを、他の表からの他のものから作製することもできる。表2Aのサブセット2および3も同様に好ましく、これらは霊長類マーカーである。さまざまな表のサブセットにまたがっての組み合わせを含む、表2Aのサブセット1および表3Aのサブセット1からのマーカーを含む個々のマーカーまたは組み合わせが関心の対象となる。例えば表3Aのサブセット2および3からの1つまたは複数のマーカーと、表3Aのサブセット1または表2Aまたは2Bのメンバーとを含む組み合わせも有益である。
非霊長類種からのマーカー、例えば表2Bおよび3Bのものも同じく重要と思われる。サブセット2および3の内部またはそれらにまたがっての個々のものまたは組み合わせは好ましい。サブセット1にまたがっての組み合わせも同じく価値がある。
C.補足的な肝臓毒性データセット
ラットおよびマウスで作製されたそのほかのデータセットも同様に評価されているが、それらを肝臓毒性のみに対するマーカーとしては限定していない。これらには、Hamadeh, et al. (2004) "Integration of clinical and gene expression endpoints to explore furan-mediated hepatotoxicity" Mutat. Res. 549:169-183 (PMID 15120969)で報告されたラット肝臓におけるフラン毒性(f);Hamadeh, et al. (2002) "Methapyrilene toxicity: anchorage of pathologic observations to gene expression alterations" Toxicol. Pathol. 30:470-482 (PMID 1218793)で報告されたラット肝臓におけるメタピリリン毒性(mp);Iida, et al. (2005) "Unique patterns of gene expression changes in liver after treatment of mice for 2 weeks with different known carcinogens and non-carcinogens" Carcinogenesis 26:689-699 (PMID 15618236)で報告されたマウス肝臓に対する種々の発癌性化合物(i);およびLee, et al. (2004) "cDNA microarray gene expression analysis and toxicological phenotype for anticancer drug" J. Vet. Med. Sci. 66:1339-1345 (PMID 15585946)で報告されたラット肝臓に対するパクリタキセル化合物(l)に関するデータが含まれる。データは、表2A/Bおよび3A/Bに類似したように、サブセット3および2および1に由来するさまざまな好ましい態様とともに、上記のように表5A/Bおよび6A/Bに提示されている。
D.そのほかの毒性データセット
上記の肝臓毒性データセットに加えて、そのほかのデータセットも同定され、分析されている。特に、これらには、Johnson, et al. (2003) "Genomic profiles and predictive biological networks in oxidantinduced atherogenesis" Physiol. Genomics 13:263-275 (PMID: 12657712)で報告されている、酸化ストレスを誘導するタバコ煙の中に存在する多環芳香族炭化水素であるベンゾ[a]ピレン(BaP)(j)に曝露された培養下のマウス大動脈血管平滑筋細胞(VSMC)に関するデータ;Hirakawa, et al. (2005) "Method for determining cardiotoxicity" 米国特許出願第20050138675号で報告されている、ダイオキシン、ドキソルビシン、イソプロテレノールおよび/またはLPS(cd)への曝露に対する心毒性応答に関するデータ;Cargill, et al. (2005) "Genetic polymorphisms associated with cardiovascular disorders and drug response, methods of detection and uses thereof" 米国特許出願第20050272054号で報告されている心臓多型データセット(cpm)が含まれる。ラットのサリン処置による神経毒性データセット(dm)は、Damodaran, et al. (2006) "Gene expression profiles of the rat brain both immediately and 3 months following acute sarin exposure" Biochem Pharmacol 71:497-520 (PMID: 16376859)で報告されている。2つのラット腎臓毒性データセットが含まれており、これはKharasch, et al. (2006) "Gene expression profiling of nephrotoxicity from the sevoflurane degradation product fluoromethyl-2,2-difluoro-1-(trifluoromethyl)vinyl ether ("Compound A") in rats" Toxicol. Sci. 90:419-431 (PMID 16384817)によって報告されているセボフルラン生成物(k)による処置;およびLuhe, et al. (2003) "A new approach to studying ochratoxin A (OTA)induced nephrotoxicity: expression profiling in vivo and in vitro employing cDNA microarrays" Toxicol. Sci. 73:315-328 (PMID 12700408)によって報告されているオクラトキシンA(u)による処置に対する応答である。Leeuwen, et al. (2005) "Differential gene expression in human peripheral blood mononuclear cells induced by cigarette smoke and its constituents" Toxicol. Sci. 86:200-210 (PMID 15829617)で報告された、タバコ煙濃縮化合物(vl)に対するヒトPBMC応答の分析も含まれている。さまざまな化合物(ae)に対するヒトケラチノサイト培養物の応答も、Bae, et al. (2003) "Gene expression patterns as potential molecular biomarkers for malignant transformation in human keratinocytes treated with MNNG, arsenic, or a metal mixture" Toxicol. Sci. 74:32-42 (PMID 12773770)によって報告されたように、分析されている。そして、ラット肺は、Dillman, et al. (2005) "Genomic analysis of rodent pulmonary tissue following bis-(2-chloroethyl) sulfide exposure" Chem Res Toxicol. 18:28-34 (PMID: 15651846)によって報告されたデータに基づいて分析されている(d)。
これらのデータは、表2A/Bおよび3A/Bにおけるのと同じように、表5A/Bおよび6A/Bに提示されている。これらの表に記載されたマーカーは、個別的にまたは組み合わせとして、さらにさまざまなサブセットのメンバーを含め、本発明の態様である。これらのマーカーは、同定された臓器、細胞種または経路における毒性には限定されず、例えば、マーカーは他の臓器、細胞種または経路における毒性にも有益であると思われる。
表5Aは、肝臓毒性試験に基づく、これらのデータセットに由来する霊長類対応物のバイオマーカー遺伝子に関するEntrez遺伝子ID番号をリスト化している。ヒトおよびチンパンジーの対応物は同定されており、ゲノム上で十分な情報を入手しうる他の種も同様にリスト化することができる。ヒトのサブセット1は、Entrez ID、一般に認められている記号、およびマーカーに対応する遺伝子の短い説明を明示的にリスト化して、対応物のヒト遺伝子を提供している。霊長類のサブセット2は、ヒトまたは他の種の対応物のいずれかに関して報告されて、サブセット1のマーカーと直接的に相互作用すること(例えば、物理的会合または2-ハイブリッド相互作用による)が報告されている遺伝子のEntrez遺伝子IDである。霊長類のサブセット3は、発表された要旨においてサブセット1のマーカーの1つとともに言及されていることによって関連づけられたマーカーのEntrez遺伝子IDである。
表5Bは、選択された非霊長類種における対応物に関するEntrez遺伝子ID番号をリスト化している。これらはイヌ、ラットおよびマウスで提供されている。他の種に関しても、それらのゲノム配列がより完全になり、対応物である等価物を決定しうるようになっているため、同様の対応物を作製することができる。
他の好ましい態様は、各々の研究のそれぞれからの霊長類マーカーに関する表5Aのサブセット2および3である。これらのマーカーは、研究の内部もしくは複数の研究にまたがって、個別にまたは組み合わせ(例えば、異なるデータセットからの1つまたは複数)として、選択することができる。これらのマーカーの1つまたは複数の組み合わせを、他の表からの他のものから作製することもできる。表5Aのサブセット2および3も同様に好ましく、これらは霊長類マーカーである。さまざまな表のサブセットにまたがっての組み合わせを含む、表5Aのサブセット1および表6Aのサブセット1からのマーカーを含む個々のマーカーまたは組み合わせが関心の対象となる。例えば表3Aまたは6Aのサブセット2および3からの1つまたは複数のマーカーと、表3Aもしくは表6Aのサブセット1または表2Aもしくは2Bのメンバーとを含む組み合わせも有益である。さまざまな表およびサブセットからのマーカーの組み合わせが本明細書に組み入れられる。
非霊長類種からのマーカー、例えば表2B、3B、5Bおよび6Bのものも同じく重要と思われる。サブセット2および3の内部またはそれらにまたがっての個々のものまたは組み合わせは好ましい。サブセット1にまたがっての組み合わせも同じく価値がある。
V.データからのパターンID
ゲノムプロファイリング用プラットフォームにより、個々の試料から莫大な量のデータを収集することが可能になった。全ゲノムの発現プロファイリングにより、ほとんどの遺伝子の発現レベルの測定を行うことができ、例えば、試料1件につきおよそ30K個のデータポイントを得ることができる。しかし、発現データの解釈を生理的アウトカムまたは応答に対して成し遂げることは困難である。例えば、特定のアウトカムにわずか10個のみの臓器が関与しているとすれば、10個の臓器にわたるおよそ30K個ずつの遺伝子によっておよそ300K個のデータポイントが生じ、それを少数の代替的アウトカムへと「縮小する」ことになる。300K次元の空間を2〜25個のアウトカムに縮小することは、何らかの劇的なパターン認識の能力を必要とする。
30Kまたは300K次元のベクトル空間の「決定的な」3〜5個のアウトカムパターンへの数学的変換は、「固有ベクトル」の同定を可能にする数学的手法を通じて可能である。どのマーカーが特徴的パターンに関係しているかを明らかにするための数学的手段が第一段階である。その目標は、どの一握りほどの「代用マーカー」が、所望のアウトカムと再現性および信頼性を伴って相関しうるかを同定することである。
データは、遺伝子発現パターン、動的な特徴パターン、プロテオミクス的な特徴パターン、メタボロミクス的な測定パターン、SNP評価パターンまたはアレル組み合わせパターンであってよい。遺伝子に基づく分析の利点は、試料をどこで評価するかを明確に決定する必要がないことである。すなわち、遺伝子分析は、複雑さを著しく減じるほどに十分に数が少ない、可能性の高い候補マーカーを指し示すと考えられる。調査する遺伝子の範囲がはるかに小さくなることと、発現のパターン、位置、疾患の状況、システム生物学などに関する情報の量の多さが相まって、代用マーカーをどこで、いつおよびいかにして探し求めるかという困難さが大きく軽減される。
そのようなものを遺伝子発現アレイ分析に対して適用するための方法は、例えば、Najarian 米国特許第6,996,476号;Saffer, et al. 米国特許第6,990,238号;Parks and Moore 米国特許第6,954,722号;Lipshutz, et al. 米国特許第6,953,663号およびそれらに含まれる参考文献に記載されており、そのそれぞれは参照により本明細書に組み入れられる。遺伝子発現自体の状況以外で、例えば、遺伝子型、ハプロタイプもしくは他の高密度での特性決定、または他の分析手段に基づくもの(例えば、プロテオミクス分析またはメタボロミクス分析)において、引用されたものに類似した以前の一般的な数学的方法は、例えば以下のものに基づきうる:Jackson (2003) A User's Guide to Principal Components Wiley-Interscience, ISBN 0471471348; Jolliffe (2002) Principal Component Analysis (2d Ed.) Springer, ISBN 0387954422;Diamantaras and Kung (1996) Principal Component Neural Networks Theory and Applications Wiley-Interscience, ISBN 0471054364; Pearson (1901) "On Lines and Planes of Closest Fit to Systems of Points in Space" in The London Edinburgh and Dublin Philosophical Magazine and Journal of Science vol. 2:559-572, Sixth Series, Jul.-Dec. 1901;Hotelling (1933) "Analysis of a Complex of Statistical Variables into Principal Components" in The Journal of Educational Psychology 26:417-441 and 26:498-520;およびHotelling (1936) "Simplified Calculation of Principal Components" in Psychometrika 1:27-35。
次元縮小分析の2つの基本的カテゴリーに、教師あり(supervised)の形態および教師なしの形態がある。例えば、Balakrishnama and Ganapathiraju "Linear Discriminant Analysis: A Brief Tutorial" from the Department of Electrical and Computer Engineering, Institute for Signal and Information Processing, Mississippi State Universityを参照のこと。いずれの方法にも多くのアルゴリズムがある。主成分分析は教師なし方法の一例であり、例えば、データ中にいくつの「パターン」が含まれるかに関して仮定を行わない。これに対して、線形分類(または線形判別)方法は、教師あり次元縮小の一例である。例えば、正常な状況との比較による癌においては、先験的カテゴリー(癌、正常)が存在し、取り組みは、その2つを識別すると考えられる遺伝子または特徴の最少セットを同定することを目的とする。
VI.大量のゲノムパターンからの「識別性」バイオマーカーサブセットの選択
大量のゲノムワイド分析からの多次元データセットの複雑さは、多くの研究のデータ分析能力を圧倒している。このため、これらの研究からの結論は、往々にして、研究の結果得られた情報の多くを認識することができていない。特に、これらの実験形態の適切な分析により、そのほかに多くの教訓を導き出すことができる。特に、既存のデータに対する本発明の方法の使用および適用は、容易に検定しうる特定の仮説をもたらしうる。または、系の複雑さの縮小により、重要で関連性のあるマーカーにより効率的に対象を絞った、より実際的で適度な試験手順を可能にすることができる。
実際には、往々にして動物モデルはヒト疾患と相関づけることができていない。このため、動物マーカーの同定は、往々にして、ヒトにおける代用マーカーへの移行につながらない。しかし、より洗練されたデータ分析およびシステムの理解により、異なる遺伝子の間の関係をはるかに良く予測することができる。しかし、スクリーニングまたは試験の複雑さおよび規模を縮小することは極めて重要であると考えられる。
A.識別用マーカーサブセットの同定
複雑な系におけるバイオマーカーのスクリーニングは、往々にして、マーカーの決定的なサブセットを同定することに失敗する。場合によっては、分析のパラメーターに関連性がない。例えば、タンパク質産物の活性が転写手段以外、例えば翻訳後リン酸化調節によって調節されているならば、RNAレベルには関連性がないと思われる。または、測定可能なパラメーター、例えば、特定のtRNAの発現レベルは、往々にして、特定の生理的状態との関連性がわずかにしか、または全くない。また別の場合には、症状の発現が生理学的な原因の開始とは対応しないこともある。例えば、代謝的欠乏症はさまざまな異なる症状として現れること、または個体に応じて異なる形態で現れることがある。
このため、原因を仮定しないスクリーニング戦略は、根拠のない仮定に基づく集中的研究よりも幅広い網を投げかける。遺伝子分析はしばしば、複雑な系において、通常であれば影響を及ぼすとは決して推定されないようなマーカーを同定することができる。しかし、ひとたび遺伝的要素が同定されれば、そのエレメントは、相互作用が物理的なものであるか機能的なものであるかを問わず、関連したエレメントの同定につながる可能性がある。その最初のエレメントの影響を調節する実体はさらなる研究の候補であり、代替的な診断マーカー、代用マーカー、またはさらには治療法の標的ともなる。
関連性のあるマーカーの同定により、取り組みをそのようなマーカーの適切な局面をスクリーニングすることに集中させることができる。限定的な数のマーカーを、アッセイのための適正な様式に関して、例えば、遺伝子アレルの対形成、関連した重複的な機能の補完、RNA転写、タンパク質発現、翻訳後の特徴などに関してスクリーニングすることを容易に行うことができる。特に、発現または機能的活性の動的局面をモニターすることができる。例えば、Troyanskaya (2005) Brief Bioinform. 6:34-43; Abraham, et al. (2004) "High content screening applied to large-scale cell biology" Trends Biotechnol. 22:15-22;Sauer (2004) Curr. Opin. Biotechnol. 15:58-63; Daub, et al. (2003) Bioinformatics 19:2332-343; Nikitin, et al. (2003) Bioinformatics 19:2155-167;および類似の刊行物を参照のこと。
関連した分析の一例は遺伝学研究でみられる。選択可能な形質が特定の同定可能な遺伝子またはハプロタイプと相関づけられる。しかし、選択可能な形質がハプロタイプの有無とある程度の相関を有するが、ハプロタイプの「浸透度」はそれほど顕著ではないという逆の問題も想定されうる。浸透度は例えば、Houlston and Peto (2004) Oncogene 23:6471-6476; Hirschhorn, et al. (2002) Genetics in Medicine 4:45-61; Human Genome Program, U.S. Department of Energy (2003) "Genomics and Its Impact on Science and Society: A 2003 Primer"に記載されている。そのような状況では、浸透度に影響を及ぼす別の遺伝的特徴、例えば、他の「付随性」ハプロタイプまたは遺伝子を、適正なツールを用いて同定することができる。例えば、Terwilliger and Weiss (1998) Curr. Op. Biotechn. 9:578-594を参照のこと。浸透度は、単一のマーカーよりも、遺伝的マーカーの「組み合わせ」と相関づけられると思われる。本発明は、そのような付随性マーカーの形態を示唆する一助となる。
B.マーカーの「分類用」サブセットの選択
または、莫大な量のデータが生じた場合に、最も有利な特徴を提供するような特定のマーカーを選択して精査することもできる。すなわち、診断的評価の信頼性をより高めるものは、より信頼性の低い特徴よりも好ましいと考えられる。これらの特徴には、とりわけ、精度、信頼性、偽性結果の頻度が陽性または陰性を問わず最小限であること、費用、速さ、評価の容易さ、その他に関する、商業的に関連した考慮事項が含まれる。
規制上の問題、例えば、規制当局の承認の速さおよびコスト、コスト効果なども重要と思われる。
初期マーカーの同定のための小規模な均一集団を用いるこれらの2つの方法の組み合わせと、選択された部分、例えば、マーカーの80%未満、70%未満、60%未満、50%未満、40%未満または30%未満の精査とにより、スクリーニングにける効率が得られると考えられる。
最初の1つの相関づけは、多くの場合、特定のアウトカム、例えば、有効性、安全性、毒性、ADRと相関する遺伝的マーカーを同定することであると考えられる。さまざまな共通のハプロタイプまたはアレルの組み合わせを、どの組み合わせが他のものよりも不確かであるか、例えば、さまざまな特定のアレルの組み合わせがより大きなまたは小さな応答と相関するか否かを見いだすために評価することができる。マーカーの同定により、経路分析は主要な毒性機構の経路に同様に影響を及ぼす可能性の高い他のマーカーを指し示すと考えられる。そのような代替的なマーカーも、多くの場合、それらがさまざまなアウトカムと同じく相関するか否かを明らかにするために検討されると考えられ、代替物を好ましい診断上または臨床上の特性に関してスクリーニングすることができる。
好ましいバイオマーカーの興味を引く特徴には、例えば、(1)個体、時間および条件にわたって安定的なバックグラウンド、;(2)シグナルが高度でノイズが少ない;(3)試料の入手が容易(好ましくは侵襲性ができるだけ低い、おそらくは血液、尿、涙液または表面試料の採取);(4)高精度で簡単で迅速な分析用プラットフォーム;(5)高い統計学的精度およびアウトカムとの相関;(6)測定の高い再現性;(7)費用がかからず簡単な分析方法、が含まれる。
VII:決定的な点に関する経路同定
1つの種の内部の、または複数の種にまたがったデータを結びつける知識データベースは有用であると考えられる。数多くのこの種のデータベースが存在し、これには例えば、Ingenuity、Entelos、BioVista、Jubilant BioSystems、ARIADNE Genomicsなどによって提供されているものに類似した製品などがある。同様の提供品は、NCBIのウェブサイトおよび他のものから入手可能なはずである。例えば、さまざまな具体的なデータベース、例えば、Metabolic Pathways of Biochemistry(www.gwu.edu)、Kyoto Encyclopedia of Genes and Genomes(KEGG, www.genome.jp/kegg)、ExPASys(www.expasy.ch)、Enzymes and Metabolic Pathways Project(www.empproject.com)、代謝経路のmetacycエンサイクロペディア(metacyc encyclopedia of metabolic pathways)(metacyc.org)、Alliance for Cellular Signaling(AfCS, www.cellularsignaling.org)、生物経路コンソーシアム(biopathways consortium)(www.biopathvays.org)および類似のサイトを参照している、http://www.genomicglossaries.com/content/lifesciences_databasesdirectory.aspを参照のこと。
定められた経路およびネットワークと相関づけられるハプロタイプから、そのようなネットワークの他のメンバーが同定され、経路に対するそれらの関連性を同様に推測することができる。ここから、部分的には表現型の読出しの困難さに応じて、種々の戦略が適用されると考えられる。いくつかの表現型は、インビボもしくはインビトロの実験系またはサブシステムにおいて直接的に観察しうる。また別の表現型は、代用マーカー、または表現型の重要な生理的もしくは他の前駆体指標の類似の固有特徴を明らかにするために分析されると考えられる。
これらのさらなる分析は、例えば、代謝評価(メタボロミクス的エンドポイント)、構造的エンドポイント(各々の細胞内または臓器構造の構造構成要素が影響を及ぼすか否かを判定する)、調節的な影響(例えば、RNAi、アンチセンス、遺伝子ターゲティング、または遺伝子発現レベルに影響を及ぼす他の手段を用いる)、遺伝子突然変異分析、経時的な多エンドポイント分析、または他のパラメーター、溶媒効果などに向けられた数多くの形態をとりうる。これらは、どの影響が直接的であるか、間接的であるか、または表現型と高度に相関するかを判定する最も簡単な形態を提供すると考えられる。多くの異なる組み合わせを用いることができ、それらは多次元の読出しを有する代替的なパラメーターを提供すると思われる。これは一般に、より信頼性および安定性のある診断アプローチを提供すると考えられる。
擾乱分析は、擾乱に対して特に感受性が高い、または安定であるネットワーク内の特定の節を同定するために行うことができる。例えば、Ramanathan, et al. (2005) "Perturbational Profiling of a Cell Line Model of Tumorigenesis by using Metabolic Measurements" Proc. Nat'l Acad. Sci. USA 102:5992-5997を参照のこと。本明細書に記載した擾乱分析は、測定のさまざまなパラメーターを組み込んだ固有特徴に対して適用可能である。
VIII.臓器またはシステムの応答におけるバイオマーカー/固有特徴を同定するための相関づけ
表現型に対するバイオマーカーの相関づけはさまざまな状況で行われる。特に、表現型の診断指標として代用バイオマーカーが用いられ、これは例えば、動物個体全体における表現型を予測するためのインビトロ系(これはインビボの生物体全体の状況と相関づけられる)またはモデル系において有用な可能性がある。例えば、McKim, et al. (2005) "A Biochemical Approach to In Vitro Toxicity Testing" Pharmaceutical Discovery January 2005を参照のこと。臓器特異的でも種特異的でもない重要な機能的エンドポイントに対象を絞ることによって細胞と動物個体全体との間のギャップをうまくつなぐ1つのアプローチが記載されている。この能力は動物試験において検証されている。ある種のバイオマーカーまたはエンドポイントを、種間での結果を予測するために用いることもできる。
本発明において、投与された薬剤に対するヒト応答の表現型(有薬剤害反応)に遡っての固有特徴の曲線近似は、ヒトの応答を基にしている。実験系を、ヒトでの応答アウトカムに適合する代用マーカーに関して評価することができる。これにより、非ヒト種における結果がヒトに対する関連性があるか否かに関する種間問題は最小限に抑えられる。
試験系にはインビトロおよびインビボ(動物モデル)が含まれうる。これらは多くの場合、疾患または生理的な状況に対する感受性を高める、またはそれらの状況を誘発する遺伝的特徴を組み込んでいると考えられる。それらの系は、適切な分類用マーカーによる応答に関して、または毒性経路の状態の状態に関して化合物または生体化合物を試験またはスクリーニングするために用いることができる。分類用マーカーがヒト応答と高度に相関する場合、その試験系は高い信頼性を有する。このため、その試験系は、ヒトマーカーの選択的構成要素を有する異なる種のバックグラウンド、またはヒト集団内の個体と相関する特定のアレル組み合わせを有するヒトを用いることができる。さらに、応答の多様性をその試験系において評価することもできる。
その反対に、試験系が無傷の生物体におけるアウトカムに対して乏しい相関しか有しないこともある。そのような状況では、正確な予測のための特徴または適切なパラメーターを見いだすための曲線近似は、無傷の生理的状況下でのアウトカムに関するべきである。すなわち、霊長類および好ましくはヒト対象を用いることで、浸透度を向上させる遺伝的マーカーの決定が可能になると考えられる。
IX.同定されたバイオマーカーの関連した代替物への拡張
相関性のあるバイオマーカーが最初に同定されれば、それからさまざまな固有特徴を導き出すことができる。例えば、ひとたび1つの種において同定されれば、対応物である構造的または機能的な実体を近縁種で見いだしうる可能性が高い。システム生物学および/またはゲノムデータをそのような対応物を同定するために用いることができ、または異なる種における対応物を見いだすために他の実験方法を適用することもできる。
また、上流または下流の機能を含め、密接に関連している機能は表現型に対しても統計的学相関を有することは往々にして真実であると考えられ、それは決定的なチェックポイントから離れることもそれに向かうこともある。このため、ひとたびバイオマーカーが同定されれば、機能的に近いバイオマーカーが類似またはそれ以上の相関を示すか否かを詳細に確かめることは有用であると考えられる。
さらに、ハプロタイプまたはアレル対の統計量を調べることによって、どの対が表現型を弱めるか、または他の様式で影響を及ぼすかを同定することが可能なはずである。多数の実体(例えば、異なるアレル変異体)が類似または重複する反応特異性(例えば、ある基質に対して)を有する場合には、その表現型が関連した実体との同時発現にも依存するか否かを調べることが有用であると考えられる。多サブユニット複合体の状況では、各々の構成要素の代替的な組み合わせの範囲が重要なはずであり、明示的に調査される。標準的なハプロタイプまたはアレルの組み合わせに関しては、いくつかの対がより高いまたは低い浸透度を呈する可能性があり、例えば、表現型が、いずれかのアレルのみに対してよりも、対になったアレルの組み合わせに対してより直接的に相関するはずである。
重要な固有特徴が同定された場合には、相互作用または代謝変換の動態を評価すべきである(例えば、代謝フィンガープリント)。さまざまなバイオマーカーまたは代謝産物の時間的な固有特徴を、表現型の出現に重要な可能性のある時間的特徴を同定するために注意深く評価すべきである。このような特徴を認識することにより、表現型の出現の動的モニタリングも可能になると考えられる。
固有特徴は無傷の生物体におけるものでもよく、またはモデル系、例えば、インサイチュー、インビトロもしくはサブシステムにおけるものでもよい。ひとたび適切なネットワークが同定されれば、その構成要素が固有特徴に関して評価するための特徴として同定される。形質転換、欠失などによって上記のような細胞または系へのさまざまなアレル形態の置換または組込みを行うことにより、これらの特徴(特定の種の対応物または変異体)を、例えば擾乱分析の標的にすることもできる。アレル変異体は、例えば、天然の変異体、調節的な変化、酵素活性の調節因子に特徴的な特定の変化を組み込むことにより、多くの形態をとることができる。シトクロムP450経路のアレルまたは変異体を対象とした、例えば肝細胞に組み入れられた、このような細胞系が作製されている。例えば、Miners, et al. (2004) Ann. Rev. Pharmacol. Toxicol. 44:1-25;Rushmore and Kong (2002) Curr. Drug Metab. 3:481-490;Arora and Iversen (2001) Curr. Opin. Mol. Ther. 3:249-257;およびGoldstein and de Morais (1994) Pharmacogenetics 4:285-299を参照のこと。
往々にして、最も関連性のある系は、関連性のある疾患モデルの状況下におかれたサブシステムまたは細胞株でありうる。細胞株または細胞系は、例えば、異なる遺伝子、異なる調節を受ける遺伝子、ヒトまたは関連アレル形態の組み合わせなどを組み込んだ、遺伝的に改変されたものでよい。ヒトまたは他の幹細胞またはそれらの派生物、例えば、分化した臓器系が有用なことがある。それらの系には、生理的または発生的な影響を受けた細胞、細胞株、臓器、組織などが含まれうる。そして、系が「チップ上ラボラトリー」のマイクロ流体学または高度に並列的もしくはロボット的な系に関する技術を組み込んでいてもよい。個々のチップ、細胞、系統または系が、そのばらつきが集団のばらつきに類似するような異なる個体のものであってもよい。一連の細胞または系は、ある範囲にわたる発現レベル、減弱的、抑制的、競合的、選択的な作用物質などを、そのような擾乱に対する応答の範囲を評価するために組み込むことができる。
X.同定された標的分析物を用いる実験モデル
A.予測モデル
これらの「パターン」のいくつかを組み合わせた予測モデルを構築することができ、それを、無傷の動物に対する現実の投与の結果として起こると考えられる表現型を前臨床モデルから実験的に予測するために用いることができる。これはパターン特徴を効果エンドポイントと相関づける「曲線近似」の作業であり、それはヒト集団でありうる(例えば、ADR相関において)。これはモデルの妥当性確認のために用いることができ、同定された固有特徴を用いてそのモデルがヒトのアウトカムと相関することを実証するのに役立つ。
B.歴史的化合物の試験
歴史的に用いられてきた化合物の試験は、典型的には、インビトロまたは小規模の動物試験という点で単純であると考えられる。同様に、ヒトにおける使用の歴史が存在し、例えば、ADR報告におけるように、そのような人の記録または追跡が行われている場合には、ヒトのアウトカムが公知である。これらは、ADRデータベース中にあってもよく、または臨床試験において保管されていてもよい。このため、このようなデータを有する定められた集団は、以上に考察したように、および記載した方法によって、遺伝的に評価するために極めて有用となりうる。
C.NCEの試験またはスクリーニング
新たな臨床薬候補(NCE)または新規化合物を、記載した実験において、重要な臨床的アウトカムに関する正確で低コストでの読出し値を得るために試験することができる。プログラム開発の初期段階においては、これらの実験系を、候補の優先順位づけ、前臨床的もしくは臨床的アウトカムの予測、または薬物化学の取り組みによって許容される有する十分な候補が蓄積した時点の判断のために用いることができる。本明細書に記載した系は、早期の研究の取り組みに対して、情報を得た上での意志決定を可能にすることができる。早期の意志決定においてなされた前進は、確実に、臨床開発のための不適合性を確かめる、より後期の費用のかかる試験による無駄を最小限にとどめると考えられる。
XI.実験的分析物からアウトカムへの曲線近似
動物個体全体での毒性作用をインビトロ実験系を用いて予測するために、さまざまな方法が用いられている。例えば、McKim, et al. (Jan 2005) Pharmaceutical Discovery pp3O-36を参照のこと;(see www.Ceetox.comを参照)。
ラットの系においては、インビトロ方法およびさまざまな選択された化合物に対する曝露後に測定されたパラメーターが、インビボ動物試験によるアウトカムと相関づけられている。これらのパラメーターは、動物個体全体の曝露のための類似の化合物の投与のアウトカムを予測するために用いられている。
細胞インビトロアッセイにおいては、典型的には、選択された細胞種をマイクロタイタープレートに播き、一定期間にわたって増殖させて平衡に到達させる。特定の細胞を、関連性のあるバイオマーカー、例えば、膜貫通性ポンプ、シトクロム、重要な代謝酵素などの機能の増大または低下に関して選択することができる。特定の機能を欠失または過剰発現する細胞、特定の変異体もしくはアレルの多数のコピーによる形質転換を受けたもの、または重要な機能の組み合わせ、例えば、排泄の減少を伴う取込みの増大を有するものを含む、さまざまな突然変異体を評価することができる。
平衡化の期間は典型的には12〜48時間であり、これは例えば、細胞種、密度および他の要因に依存する。その後に、被験化合物を、典型的には2〜4log、一般的には1〜300マイクロMという溶解度の限界近くまでの幅広い濃度範囲にわたって細胞に対して適用する。陰性対照および陰性対照を含める。
そのような曝露の後に、細胞および上清を、典型的には一般的な細胞プロセスに関して評価する。これらには典型的には、膜の完全性、ミトコンドリア機能、細胞増殖、グルタチオンの生化学的状態、膜脂質過酸化、アポトーシス、DNAの完全性、輸送体の機能、吸収または排泄活性、および一般的な生物学的機能のいくつかまたはすべてが含まれる。そのほかの薬理学評価には、典型的には、ADME、例えば、送達媒質中での溶解度の測定、Pgp相互作用、関連化学物質との毒性の比較(構造的または機能的)、毒性の細胞内標的、および構造-毒性関係のいくつかの構成要素が含まれると考えられる。評価されるその他の影響には、酵素誘導、代謝活性化、内分泌攪乱、リピドーシスなどが含まれる。
XII.実験モデルの予測からヒトでの影響へ
本明細書に記載した方法によって得られるさまざまな診断マーカーは代用マーカーとして有用と考えられる。これらは、特定のモデル系において表現型アウトカム、例えば表現型の固有特徴として適用することができる。固有特徴が、例えば生物学的な推論によって、または実験的実証によって一般に認められている場合には、適切な固有特徴から表現型を推測することができる。その後は、それらのモデルは表現型を評価するための早期スクリーニングツールとして有用になると考えられる。
A.個体における有効性
予測を、潜在的な患者を有効な治療的処置に対して所定の尤度を有する群へとサブセット化することに向けることもできる。すなわち、例えば、診断的特徴の何らかのセットは、標的個体を、特定のアウトカム(表現型)の尤度が高い、不確かである、または低い定められた群へとサブセット化すると考えられる。これは臨床的問題のより良い定義を反映すると思われ(例えば、症候群の、または同じように定義されている症候性状態の「群」の、さまざまな「形態」を識別すること)、その一方で、提案された治療レジメンに対して反応する可能性の高い群へのサブセット化も提供すると思われる。
B.特定の薬剤の効果
同様に、予測を、潜在的な患者を、治療的処置の特定の効果に関して所定の尤度を有する群へとサブセット化することに向けることもできる。すなわち、例えば、何らかの診断的な固有特徴が、標的個体を、特定のアウトカム、特に陽性または陰性の結果(それが直接的であれ間接的であれ)の尤度が高い、不確かである、または低い定められた群へとサブセット化することが考えられる。これは、提案された特定の処置に対する有害な副作用に関する遺伝的もしくは他の素因、または不耐性を認識するという状況下では特に有益であると考えられる。これらの因子をさらに、特定の治療物質または手順の標識に組み込むことも考えられる。
本明細書において言及したすべての刊行物は、それぞれの独立した刊行物または特許出願が参照として組み入れられるように特定的および個々に示されている場合と同程度に、すべての目的に関してその全体が参照により本明細書に組み入れられる。
本発明をここまで詳細に説明してきたが、本発明の精神および範囲を逸脱することなく、さらに過度の実験も行うことなく、それを広範囲にわたる等価なパラメーター、量および状態で行うことができることは、当業者には認識されるであろう。本発明をその特定の態様に関連して説明してきたが、さらなる改変が可能であることは理解されるであろう。本出願は、本発明が属する技術の範囲内にある公知または習慣的な実践からの本開示のそのような逸脱を含む、本発明の原理に一般に準拠する発明のあらゆる変更、用途または適合物に及ぶことを意図しており、上記の本明細書における本質的な特徴に対して適用されることが理解される必要がある。
本明細書に記載された特定の態様は例示のみによって提供されており、本発明は、添付された特許請求の範囲のみによって限定されるべきであり、それとともにそのような特許請求の範囲に対する等価物の全範囲は権利の対象になるものとする。

Claims (24)

  1. ヒトまたは動物対象への薬物の投与に対する臨床的アウトカムを対象の核酸試料から推測するための方法であって、該臨床的アウトカムの指標となるハプロタイプアレルの少なくとも1つの二倍体対を核酸試料において同定する段階を含み、ハプロタイプアレルの二倍体対が(a)均一な集団から選択された個体のハプロタイプアレルの二倍体対を分析する段階、および(b)該集団の医療データからの臨床的アウトカムを段階(a)における分析と相関づける段階によって同定される方法。
  2. 核酸試料において1つまたは複数のさらなるハプロタイプを同定する段階をさらに含み、該1つまたは複数のハプロタイプおよび臨床的アウトカムの指標となるハプロタイプアレルの少なくとも1つの二倍体対の発現が発現プロファイルを規定し、該発現プロファイルを同定することが、該ハプロタイプアレルの少なくとも1つの二倍体対のみを同定することに比較して該臨床的アウトカムの推測の統計的精度を高める、請求項1記載の方法。
  3. 発現プロファイルが、同じ個体における所定の期間にわたってのハプロタイプの発現の変化を含む、請求項2記載の方法。
  4. 1つまたは複数のさらなるハプロタイプが、(1)相互作用データベースにおいて、臨床的アウトカムの指標となるハプロタイプアレルの少なくとも1つの二倍体対と物理的に相互作用することが同定されている;(2)科学参考文献中に、該臨床的アウトカムの指標となる該ハプロタイプアレルの少なくとも1つの二倍体対とともに一般によく参照されている;(3)類似組織における該臨床的アウトカムの指標となる該ハプロタイプアレルの少なくとも1つの二倍体対の発現プロファイルと一致するプロファイルを伴って発現される;(4)発現分析において、該臨床的アウトカムの指標となる該ハプロタイプアレルの少なくとも1つの二倍体対と類似した組織中に共存している;または(5)該臨床的アウトカムの指標となる該ハプロタイプアレルの少なくとも1つの二倍体対と染色体上で物理的に近くに位置している、請求項2記載の方法。
  5. 1つまたは複数のさらなるハプロタイプが、臨床的アウトカムの指標となるハプロタイプアレルの二倍体対の上流または下流にある生物学的経路において役割を果たす、請求項2記載の方法。
  6. 段階(a)が、非ヒト種から遺伝子を同定する段階、および該遺伝子を、段階(a)において分析されたハプロタイプアレルの二倍体対のメンバーであるヒトでの対応物に対してマッピングする段階を含む、請求項1記載の方法。
  7. 治療的処置に対する個体の臨床的アウトカムを予測するために有用なハプロタイプアレルの二倍体対を同定する、コンピュータを利用した方法であって、(a)処置を受けていてその処置による記録された結果のある個体の均一な集団から遺伝子発現プロファイルデータを入手する段階;(b)該均一な集団から選択された個体のハプロタイプアレルの二倍体対を分析する段階;(c)該臨床的アウトカムと相関するハプロタイプアレルの二倍体対を同定するために、該集団の医療データからの臨床的アウトカムを相関づける段階;および(d)該臨床的アウトカムの指標となる該ハプロタイプアレルの二倍体対の同定を容易にするために段階(c)の結果を考察する段階、を含む方法。
  8. 治療的処置に対する個体の臨床的アウトカムを予測するために有用なバイオマーカーのデータベースを作成するための方法であって、(a)処置を受けていてその処置による記録された結果のある個体の均一な集団を収集する段階;(b)該均一な集団から選択された個体のハプロタイプアレルの二倍体対を分析する段階;(c)該臨床的アウトカムと相関するハプロタイプアレルの二倍体対を同定するために、該集団の医療データからの臨床的アウトカムを相関づける段階;および(d)段階(c)によるハプロタイプアレルの二倍体対をコンピュータ可読データベース中に記録する段階、を含む方法。
  9. 治療的処置に対する個体の臨床的アウトカムを予測するために有用なバイオマーカーのデータベースを商業化するためのビジネス方法であって、(a)処置を受けていてその処置による記録された結果のある個体の均一な集団を収集する段階;(b)該均一な集団から選択された個体のハプロタイプアレルの二倍体対を分析する段階;(c)該臨床的アウトカムと相関するハプロタイプアレルの二倍体対を同定するために、該集団の医療データからの臨床的アウトカムを相関づける段階;(d)段階(c)によるハプロタイプアレルの二倍体対をコンピュータ可読データベース中に記録する段階;および(e)該データベースを市場に出す段階、を含む方法。
  10. 均一な集団から選択された個体のハプロタイプアレルの二倍体対の分析が、ヘテロ接合体モデルに基づいて二倍体データを分析する段階を含む、請求項1記載の方法。
  11. 均一な集団から選択された個体のハプロタイプアレルの二倍体対の分析が、二倍体対におけるアレルを分離する段階、および分離された対の分析の結果を二倍体対の分析と比較する段階を含む、請求項1記載の方法。
  12. 均一な集団から選択された個体のハプロタイプアレルの二倍体対の分析が、RNA分析、翻訳後分析、またはイムノアッセイに基づく分析を含む、請求項1記載の方法。
  13. 霊長類における毒性経路の状態を検出するための方法であって、表2Aのサブセット1、サブセット2もしくはサブセット3;表3Aのサブセット1、サブセット2もしくはサブセット3、表4のサブセット1もしくはサブセット2;表5Aのサブセット1、サブセット2もしくはサブセット3;または表6Aのサブセット1、サブセット2もしくはサブセット3、から選択される1つまたは複数の識別用バイオマーカーの形態または機能を評価する段階を含む方法。
  14. a)毒性経路が肝臓;心血管組織、神経組織、腎臓、PBMC(末梢血単核細胞)、皮膚および/または肺において発現される;
    b)評価の形態が、イムノアッセイ、修飾、定量、質量分析、NMR、画像化または特徴的時間的パターンの決定を含むタンパク質評価である;
    c)該評価が、血液、毛髪、皮膚、唾液、口腔粘膜、涙液、粘液または他の入手しやすい体液試料からのものである;
    d)識別用バイオマーカーが表3A、5Aまたは6Aのサブセット1からのものである;
    e)該識別用バイオマーカーが表3A、5Aまたは6Aのサブセット2または3からのものである;および/または
    f)該識別用バイオマーカーが表3A、4A、5Aおよび6Aからの2つまたはそれ以上のデータセットに由来する、
    請求項13記載の方法。
  15. 使用説明書と、請求項14記載の方法に用いるための、識別用バイオマーカーを評価することを対象とする診断手段とを含む、毒物学経路評価キット。
  16. 肝臓または他の毒性経路を誘導するために候補化合物を試験するための生物系であって、該系が請求項14記載の方法に用いるためのバイオマーカーに対応するアレルの共通の組み合わせを呈する多数の生体試料を含み、該組み合わせによって示される個体間の応答がそれによって表される、生物系。
  17. 霊長類における毒性経路の状態を検出するための方法であって、表3A、5Aおよび6Aのサブセット3から選択される少なくとも3つまたはそれ以上の識別用バイオマーカーの形態または機能を評価する段階を含む方法。
  18. さらなる関連遺伝子を毒性経路評価のための試験標的候補として同定する方法であって、標的候補の第1のリストを提供する段階、および;
    1)相互作用データベースにおいて、物理的相互作用または2-ハイブリッド物理的相互作用を含め、リスト1の該標的と物理的に相互作用することが報告されている;
    2)参考文献中にリスト1の標的とともに一般によく参照されており、該参考文献が文献データベースに含まれる論文の要旨の中にある;
    3)その遺伝子発現プロファイルが類似組織におけるリスト1のメンバーの発現プロファイルと一致する;
    4)発現分析において類似組織中に共存している;または
    5)染色体上で物理的に近くに位置している、
    さらなる標的候補の第2のリストを同定する段階、を含む方法。
  19. 毒性が哺乳動物において評価され、医療記録もしくは他の選択基準によって示されるように表現型的に均一である、または遺伝的に均一であるという性向に基づいてメンバーが選択される広範な霊長類群を用いて、多数の時点で複数の特徴を評価する段階を含む、請求項18記載の方法。
  20. リスト1および/またはリスト2が、1、2、3、4、5、6、7、8、9、10、15、20、25、50、75、100、200、500、1000個またはそれ以上の遺伝子を含む、請求項29記載の方法。
  21. 臨床的アウトカムが、薬物または治療的処置の適用に対する有害反応、好ましい治療結果、好ましくない治療結果、有効性の結果、または治療応答の欠如を含む、請求項1記載の方法。
  22. 臨床的アウトカムが、薬物または治療的処置の適用に対する有害反応、好ましい治療結果、好ましくない治療結果、有効性の結果、または治療応答の欠如を含む、請求項7記載の方法。
  23. 臨床的アウトカムが、薬物または治療的処置の適用に対する有害反応、好ましい治療結果、好ましくない治療結果、有効性の結果、または治療応答の欠如を含む、請求項8記載の方法。
  24. 臨床的アウトカムが、薬物または治療的処置の適用に対する有害反応、好ましい治療結果、好ましくない治療結果、有効性の結果、または治療応答の欠如を含む、請求項9記載の方法。
JP2008509135A 2005-04-27 2006-04-26 毒物を評価するための新規な方法およびデバイス Pending JP2008541696A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67574105P 2005-04-27 2005-04-27
US77813306P 2006-03-01 2006-03-01
PCT/US2006/016067 WO2006116622A2 (en) 2005-04-27 2006-04-26 Novel methods and devices for evaluating poisons

Publications (1)

Publication Number Publication Date
JP2008541696A true JP2008541696A (ja) 2008-11-27

Family

ID=37215519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008509135A Pending JP2008541696A (ja) 2005-04-27 2006-04-26 毒物を評価するための新規な方法およびデバイス

Country Status (4)

Country Link
US (2) US20060253262A1 (ja)
EP (1) EP1880332A4 (ja)
JP (1) JP2008541696A (ja)
WO (1) WO2006116622A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085214A (ja) * 2012-10-23 2014-05-12 National Institute Of Advanced Industrial & Technology 概日リズムの乱れを予測するためのバイオマーカー

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060253262A1 (en) * 2005-04-27 2006-11-09 Emiliem Novel Methods and Devices for Evaluating Poisons
JP2009520278A (ja) 2005-12-16 2009-05-21 ネクストバイオ 科学情報知識管理のためのシステムおよび方法
US9183349B2 (en) * 2005-12-16 2015-11-10 Nextbio Sequence-centric scientific information management
DE102006031979A1 (de) * 2006-07-11 2008-01-17 Bayer Technology Services Gmbh Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung
US9864835B2 (en) * 2007-10-15 2018-01-09 23Andme, Inc. Genetic comparisons between grandparents and grandchildren
US8135545B2 (en) 2007-11-09 2012-03-13 Iverson Genetic Diagnostics, Inc. System and method for collecting data regarding broad-based neurotoxin-related gene mutation association
WO2009062181A1 (en) * 2007-11-09 2009-05-14 Iverson Genetic Diagnostics, Inc. Broad-based neurotoxin-related gene mutation association from a gene transcript test
US20090177450A1 (en) * 2007-12-12 2009-07-09 Lawrence Berkeley National Laboratory Systems and methods for predicting response of biological samples
JP5428527B2 (ja) * 2008-06-03 2014-02-26 住友化学株式会社 化学物質が有する発生毒性の予測方法
US8285719B1 (en) 2008-08-08 2012-10-09 The Research Foundation Of State University Of New York System and method for probabilistic relational clustering
EP2894473B1 (en) * 2009-08-28 2016-09-21 Astute Medical, Inc. Methods and compositions for diagnosis and prognosis of renal injury and renal failure
CA2785406A1 (en) * 2009-12-23 2011-06-30 Hill's Pet Nutrition, Inc. Compositions and methods for diagnosing and treating kidney disorders in a canine
DE102010024898B4 (de) * 2010-06-24 2012-10-25 Merck Patent Gmbh Genexpressionsanalysen zur Charakterisierung und Identifizierung genotoxischer Verbindungen
CA2863184A1 (en) * 2012-02-15 2013-08-22 Basf Se Means and methods for assessing neuronal toxicity
WO2014145705A2 (en) 2013-03-15 2014-09-18 Battelle Memorial Institute Progression analytics system
US10557857B1 (en) * 2015-03-23 2020-02-11 Intelligent Optical Systems, Inc. System and method for bone loss assay
CN108334727B (zh) * 2017-08-24 2022-04-19 江苏省疾病预防控制中心 一种评价毒理学数据可靠性的方法及系统
US20190304568A1 (en) * 2018-03-30 2019-10-03 Board Of Trustees Of Michigan State University System and methods for machine learning for drug design and discovery
WO2019220445A1 (en) * 2018-05-16 2019-11-21 B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University Identification and prediction of metabolic pathways from correlation-based metabolite networks
CN109545289B (zh) * 2018-09-25 2020-10-16 南京大学 一种基于分级警示结构高通量筛查内分泌干扰物的方法
CN109727640B (zh) * 2019-01-22 2021-03-02 隆平农业发展股份有限公司 基于自动机器学习技术的全基因组预测方法及装置
US10515715B1 (en) 2019-06-25 2019-12-24 Colgate-Palmolive Company Systems and methods for evaluating compositions

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521024A (ja) * 1999-06-25 2003-07-08 ジェネサンス・ファーマシューティカルズ・インコーポレーテッド ハプロタイプデータの入手および使用のための方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6953663B1 (en) * 1995-11-29 2005-10-11 Affymetrix, Inc. Polymorphism detection
US6560541B1 (en) * 1998-04-23 2003-05-06 The Board Of Trustees Of The Leland Stanford Junior University Predicting risk of serious gastrointestinal complications in patients taking nonsteroidal anti-inflammatory drugs
US6664062B1 (en) * 1998-07-20 2003-12-16 Nuvelo, Inc. Thymidylate synthase gene sequence variances having utility in determining the treatment of disease
US6653140B2 (en) * 1999-02-26 2003-11-25 Liposcience, Inc. Methods for providing personalized lipoprotein-based risk assessments
EP1233365A3 (en) * 1999-06-25 2004-11-17 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
US6990238B1 (en) * 1999-09-30 2006-01-24 Battelle Memorial Institute Data processing, analysis, and visualization system for use with disparate data types
WO2001029257A2 (en) * 1999-10-22 2001-04-26 Genset Methods of genetic cluster analysis
US6931326B1 (en) * 2000-06-26 2005-08-16 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
AU785425B2 (en) * 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
US20040005547A1 (en) * 2002-03-14 2004-01-08 Franziska Boess Biomarkers and expression profiles for toxicology
US6695780B1 (en) * 2002-10-17 2004-02-24 Gerard Georges Nahum Methods, systems, and computer program products for estimating fetal weight at birth and risk of macrosomia
US6954722B2 (en) * 2002-10-18 2005-10-11 Leland Stanford Junior University Methods and systems for data analysis
AU2003303502A1 (en) * 2002-12-27 2004-07-29 Rosetta Inpharmatics Llc Computer systems and methods for associating genes with traits using cross species data
US20040146870A1 (en) * 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits
EP1619951B1 (en) * 2003-04-21 2011-06-22 Epeius Biotechnologies Corporation Methods and compositions for treating disorders
US7425700B2 (en) * 2003-05-22 2008-09-16 Stults John T Systems and methods for discovery and analysis of markers
US20040236603A1 (en) * 2003-05-22 2004-11-25 Biospect, Inc. System of analyzing complex mixtures of biological and other fluids to identify biological state information
US7452678B2 (en) * 2003-06-24 2008-11-18 Bristol-Myers Squibb Company Identification of biomarkers for liver toxicity
US20050037366A1 (en) * 2003-08-14 2005-02-17 Joseph Gut Individual drug safety
US20050138675A1 (en) * 2003-11-04 2005-06-23 Pfizer Inc. Method for determining cardiotoxicity
US6996476B2 (en) * 2003-11-07 2006-02-07 University Of North Carolina At Charlotte Methods and systems for gene expression array analysis
CA3048093A1 (en) * 2003-11-26 2005-06-23 Celera Corporation Single nucleotide polymorphisms associated with cardiovascular disorders and statin response, methods of detection and uses thereof
US20060253262A1 (en) * 2005-04-27 2006-11-09 Emiliem Novel Methods and Devices for Evaluating Poisons

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521024A (ja) * 1999-06-25 2003-07-08 ジェネサンス・ファーマシューティカルズ・インコーポレーテッド ハプロタイプデータの入手および使用のための方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085214A (ja) * 2012-10-23 2014-05-12 National Institute Of Advanced Industrial & Technology 概日リズムの乱れを予測するためのバイオマーカー

Also Published As

Publication number Publication date
WO2006116622A3 (en) 2009-05-14
EP1880332A2 (en) 2008-01-23
US20060253262A1 (en) 2006-11-09
US20100179765A1 (en) 2010-07-15
WO2006116622A2 (en) 2006-11-02
EP1880332A4 (en) 2010-02-17

Similar Documents

Publication Publication Date Title
JP2008541696A (ja) 毒物を評価するための新規な方法およびデバイス
Montesinos-López et al. Multi-trait, multi-environment deep learning modeling for genomic-enabled prediction of plant traits
Thomas Gene–environment-wide association studies: emerging approaches
Afshari et al. The evolution of bioinformatics in toxicology: advancing toxicogenomics
CN103649337B (zh) 使用目标基因表达的概率建模评估细胞信号传导途径活性
US7653491B2 (en) Computer systems and methods for subdividing a complex disease into component diseases
CN113597645A (zh) 用于重建药物应答和疾病网络的方法和系统以及其用途
Liu et al. Comparative analysis of predictive models for nongenotoxic hepatocarcinogenicity using both toxicogenomics and quantitative structure–activity relationships
Tusso et al. Experimental evolution of adaptive divergence under varying degrees of gene flow
Campbell et al. Improving genomic prediction for seed quality traits in oat (Avena sativa L.) using trait-specific relationship matrices
Srivastava et al. Integrative omics approaches for identification of biomarkers
Yang et al. Bioinformatics analysis of single cell sequencing data and applications in precision medicine
WO2008007630A1 (fr) Méthode et appareil de recherche de protéine
Chung et al. Population structure analysis of bull genomes of European and Western ancestry
Judson et al. Using pathway modules as targets for assay development in xenobiotic screening
Lim et al. Integrative deep learning for identifying differentially expressed (DE) biomarkers
De Maturana et al. Whole genome prediction of bladder cancer risk with the Bayesian LASSO
Laabs et al. Identification of representative trees in random forests based on a new tree-based distance measure
Cunningham et al. Workshop overview: use of genomic data in risk assessment
Yu et al. Jackknife model averaging prediction methods for complex phenotypes with gene expression levels by integrating external pathway information
Lucas et al. Cross-study projections of genomic biomarkers: an evaluation in cancer genomics
Artomov et al. Public platform with 39,472 exome control samples enables association studies without genotype sharing
Nilsson et al. Multiple generation distinct toxicant exposures induce epigenetic transgenerational inheritance of enhanced pathology and obesity
Theodosiou et al. Emerging technologies and challenges for better and safer drugs
Campbell et al. Translating insights from the seed metabolome into improved prediction for healthful compounds in oat (Avena sativa L.)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120516