JP2007535305A - Methods for molecular toxicity modeling - Google Patents

Methods for molecular toxicity modeling Download PDF

Info

Publication number
JP2007535305A
JP2007535305A JP2006541720A JP2006541720A JP2007535305A JP 2007535305 A JP2007535305 A JP 2007535305A JP 2006541720 A JP2006541720 A JP 2006541720A JP 2006541720 A JP2006541720 A JP 2006541720A JP 2007535305 A JP2007535305 A JP 2007535305A
Authority
JP
Japan
Prior art keywords
gene
score
data
toxicity
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006541720A
Other languages
Japanese (ja)
Inventor
ディガンズ,ジェームズ,シー.
エラショフ,マイケル
Original Assignee
ジーン ロジック インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US2003/037556 external-priority patent/WO2004048598A2/en
Application filed by ジーン ロジック インコーポレイテッド filed Critical ジーン ロジック インコーポレイテッド
Publication of JP2007535305A publication Critical patent/JP2007535305A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本発明は、定量的遣伝子発現情報を分析するためのアルゴリズムを用いた、毒性予測モデルを構築する方法及び検査薬の毒性予測の方法に基づいている。本発明はまた、検査薬の毒性を決定するため、遠隔の使用者によってコンピュータシステムを使用する方法と共に、その毒性予測モデルを含むコンピュータシステムを含む。
【選択図】なし
The present invention is based on a method for constructing a toxicity prediction model using an algorithm for analyzing quantitative gene expression information and a method for predicting toxicity of a test agent. The present invention also includes a computer system that includes its toxicity prediction model along with a method of using the computer system by a remote user to determine the toxicity of a test agent.
[Selection figure] None

Description

発明の詳細な説明Detailed Description of the Invention

(関連出願)
[0001] 本出願は、2004年3月22日に出願された米国仮出願60/554,981、2004年9月29日に出願された米国仮出願60/613,831の利益を主張し、これらの米国仮出願の双方は、総ての目的において、全体として関連付けにより本明細書に取り入れられる。本出願はまた、2003年11月24日に出願された国際出願PCT/US03/37556の優先権を主張し、この国際出願は、総ての目的において、全体として関連付けにより本明細書に取り入れられる。
(Related application)
[0001] This application claims the benefit of US provisional application 60 / 554,981, filed March 22, 2004, US provisional application 60 / 613,831 filed September 29, 2004; Both of these US provisional applications are hereby incorporated by reference in their entirety for all purposes. This application also claims the priority of international application PCT / US03 / 37556 filed on November 24, 2003, which is hereby incorporated by reference in its entirety for all purposes. .

(コンパクトディスクによる配列表提出)
[0002] 本明細書と同時に提出されるコンパクトディスクの配列表は、米国特許法施行規則1.821条(c)項及び1.821条(e)項に基づいて、その全体として関連付けにより本明細書中に取り入れられる。4枚のコンパクトディスクのそれぞれに1部が含まれる4部の配列表が提供される。コピー1、コピー2及びコピー3は同一である。コピー1、コピー2及びコピー3はCRFとも同一である。配列表の電子的複製物はそれぞれが2004年11月22日に作製され、ファイルサイズは2398KBである。ファイル名は下記の通りである:コピー1−gene logic 5133−wo.txt;コピー2−gene logicg 5133−wo.txt;コピー3−gene logic 5133−wo.txt;及びCRF−gene logic 5133−wo.txt。
(Submission of sequence listing on compact disc)
[0002] The compact disk sequence file submitted at the same time as this specification is based on US Patent Law Enforcement Rules Sections 1.821 (c) and 1.821 (e), and is incorporated herein by reference in its entirety. Incorporated in the specification. A four-part sequence listing is provided in which one part of each of the four compact discs is included. Copy 1, copy 2 and copy 3 are the same. Copy 1, copy 2 and copy 3 are the same for the CRF. Each electronic copy of the Sequence Listing was created on November 22, 2004 and has a file size of 2398 KB. The file names are as follows: copy 1-gene logic 5133-wo. txt; copy 2-gene logicg 5133-wo. txt; copy 3-gene logic 5133-wo. txt; and CRF-gene logic 5133-wo. txt.

(発明の背景)
[0003] 細胞又は生物体に対する、化合物、薬剤又は環境汚染物質の有毒な影響力を評価する方法の必要性により、生物学的モニターとして生物体を利用する手法の開発につながってきた。これらの系統の最も単純であり、そして最も便利なものは、酵母やバクテリアのような単細胞の微生物を利用する、というのは、それらが最も簡単に維持され、そして操作されるからである。さらに、単細胞のスクリーニング系は、細胞に対する試験化合物の効果をモニターするために、たびたび表現型の簡単に検知できる変化を使用する。しかしながら、単細胞の生物は、生体内変換を実行する能力を有しないので、複雑な多細胞の動物に対する多くの化合物の潜在的な効果を評価するための適当なモデルではない。
(Background of the Invention)
[0003] The need for methods to assess the toxic effects of compounds, drugs or environmental pollutants on cells or organisms has led to the development of techniques that utilize organisms as biological monitors. The simplest and most convenient of these strains utilize unicellular microorganisms such as yeast and bacteria because they are most easily maintained and manipulated. In addition, single cell screening systems often use easily detectable changes in phenotype to monitor the effects of test compounds on cells. However, unicellular organisms are not an appropriate model for assessing the potential effects of many compounds on complex multicellular animals because they do not have the ability to perform biotransformation.

[0004] 多細胞生物による化合物の生体内変換は、それらが曝される薬剤の全体的な毒性を決定する上での重要なファクターである。したがって、多細胞のスクリーニング系又は単離された真核生物細胞を用いたスクリーニング系が、化合物の毒作用を検知するのに、好まれるか、又は要求される。しかしながら、毒性学スクリーニングツールとして多細胞生物を使用することは、酵母又はバクテリアの系で利用できるような、便利なスクリーニングメカニズム又はエンドポイントの欠如によって、かなり阻害されてきた。さらに、毒性学的予測系を作成する以前からの試みによっては、毒性反応を正確に予測するための必要なモデリング情報及び統計情報を提供することができなかった(例えば、WO00/12760、WO00/47761、WO00/63435、WO01/32928及びWO01/38579)。  [0004] Biotransformation of compounds by multicellular organisms is an important factor in determining the overall toxicity of drugs to which they are exposed. Accordingly, multicellular screening systems or screening systems using isolated eukaryotic cells are preferred or required to detect the toxic effects of the compounds. However, the use of multicellular organisms as toxicology screening tools has been significantly hampered by the lack of convenient screening mechanisms or endpoints, such as are available in yeast or bacterial systems. Furthermore, previous attempts to create toxicological prediction systems have failed to provide the necessary modeling and statistical information to accurately predict toxic responses (eg, WO00 / 12760, WO00 / 47761, WO00 / 63435, WO01 / 32928 and WO01 / 38579).

[0005]製薬業界は、対象の治療用化合物がヒトに対して毒性がないことを保証するために多大な資源を費やしている。このプロセスは、長期にわたり、また費用もかかり、ラットをはじめとしてイヌまたはヒト以外の霊長類に至るまで一連の生物において試験することを必要とする。さらに、核酸、ペプチド、または有機化合物のライブラリーにおいて候補薬剤およびその合成を設計するモデリング法により、毒性反応を予測するための安価で、迅速で、正確な方法の必要性が高まっている。核酸ハイブリダイゼーションプラットホームに基づいた毒性モデリング法により、化合物に曝されたラットまたはラット肝細胞培養物などの動物または細胞培養試料から得られる生体試料の使用が可能となって、現在まで可能であったものよりもずっと早くヒトの器官毒性が検出されるはずである。  [0005] The pharmaceutical industry spends significant resources to ensure that the subject therapeutic compounds are not toxic to humans. This process is long-term and expensive and requires testing in a range of organisms ranging from rats to dogs or non-human primates. In addition, modeling methods that design candidate drugs and their synthesis in nucleic acid, peptide, or organic compound libraries have increased the need for inexpensive, rapid, and accurate methods for predicting toxic reactions. Toxicity modeling methods based on nucleic acid hybridization platforms have made possible the use of biological samples obtained from animals or cell culture samples such as rat or rat hepatocyte cultures exposed to the compound, and to date Human organ toxicity should be detected much earlier than that.

(発明の概要)
[0006] 本発明は、既知の毒−特に、肝臓毒又は腎臓毒−に曝された肝臓叉は腎臓の組織叉は細胞のといった動物組織叉は細胞における、曝されない組織叉は細胞と比較しての遺伝子発現の全体的な変化の解明、ならびに毒に曝すことにより、発現に差のある個々の遺伝子の同定に基づく。
(Summary of Invention)
[0006] The present invention compares to unexposed tissue or cells in animal tissues or cells, such as liver or kidney tissue or cells, which have been exposed to known toxins, particularly liver or kidney toxins. Based on the elucidation of global changes in all gene expression and the identification of individual genes that differ in expression by exposure to poisons.

[0007]様々な態様では、本発明は、薬剤に曝された試料からの遺伝子発現情報を、毒素に曝された試料および対照試料(ビヒクルに曝された試料、あるいは毒性のない化合物または低レベルの毒性化合物に曝された試料)からの遺伝子発現情報のデータベースと比較することにより、ある試験薬剤の少なくとも1種の毒作用を予測する方法を含む。こうした方法は、その試料からの定量的な遺伝子発現情報を提供または作成すること、RMA(robust multi−array averageロバストマルチアレイ平均)アルゴリズムにより、この遺伝子発現情報を変化倍率(fold−change value)の行列に変換すること、PLS(partial least square部分最小二乗)アルゴリズムにより、この試験薬剤への曝露に対して差次的に発現される各遺伝子に関する遺伝子調節スコアを作成すること、およびその試験薬剤に関する試料予測スコア(sample prediction score)を計算することを含む。次いで、この試料予測スコアを1種または複数の毒性モデルに関する参照予測スコア(referene prediction score)と比較する。この試料予測スコアが参照予測スコアに等しいか、またはそれよりも大きい場合、この試験薬剤は、少なくとも1種の毒作用を有するか、あるいはこの試験薬剤の予測スコアと比較される毒性モデルに対応する少なくとも1種の病態を引き起こすと予測することができる。  [0007] In various embodiments, the present invention provides gene expression information from samples exposed to drugs, samples exposed to toxins and control samples (samples exposed to vehicle, or non-toxic compounds or low levels). A method for predicting at least one toxic effect of a test agent by comparison with a database of gene expression information from samples exposed to toxic compounds of Such methods provide or generate quantitative gene expression information from the sample, and the RMA (robust multi-array average robust multi-array average) algorithm converts this gene expression information to a fold-change value. Transforming into a matrix, generating a gene regulatory score for each gene that is differentially expressed upon exposure to the test agent by means of a PLS (partial least square partial least squares) algorithm, and relating to the test agent Calculating a sample prediction score. This sample prediction score is then compared to a reference prediction score for one or more toxicity models. If the sample prediction score is equal to or greater than the reference prediction score, the test agent has at least one toxic effect or corresponds to a toxicity model that is compared to the prediction score of the test agent It can be predicted to cause at least one disease state.

[0008]様々な態様では、本発明は、毒性学的モデルを創製する方法を含む。こうした方法は、ある毒素に曝された少なくとも1種の細胞または組織試料およびその毒素ビヒクルに曝された少なくとも1種の細胞または組織試料の複数の遺伝子に関する定量的な核酸ハイブリダイゼーションデータを提供または作成すること、RMA(ロバストマルチアレイ平均)アルゴリズムにより、少なくとも1種の遺伝子からのこのハイブリダイゼーションデータを変化倍率などの遺伝子発現測度(gene expression measure)に変換すること、PLS(部分最小二乗)アルゴリズムにより、少なくとも1種の遺伝子に関する遺伝子発現測度から遺伝子調節スコア(gene regulationscore)を作成すること、およびその毒素に関する毒性参照予測スコアを作成し、それにより毒性学的モデルを創製することを含む。  [0008] In various aspects, the invention includes a method of creating a toxicological model. Such methods provide or generate quantitative nucleic acid hybridization data for a plurality of genes in at least one cell or tissue sample exposed to a toxin and at least one cell or tissue sample exposed to the toxin vehicle. Transforming this hybridization data from at least one gene into a gene expression measure, such as the rate of change, by an RMA (Robust Multiarray Average) algorithm, by a PLS (Partial Least Squares) algorithm Generating a gene regulation score from a gene expression measure for at least one gene, and generating a toxicity reference prediction score for the toxin, thereby producing a toxicological module Including that to create a Le.

[0009]他の態様では、本発明は、ある試験薬剤の毒性を予測するための毒性モデルを含むコンピュータ可読媒体と、ユーザーが、この試験薬剤に関する試料予測スコアを、その毒性モデルに関する毒性参照予測スコアと比較することにより、試験薬剤の少なくとも1種の毒作用を予測することを可能にするソフトウェアとを含むコンピュータシステムを含む。  [0009] In another aspect, the invention provides a computer-readable medium that includes a toxicity model for predicting the toxicity of a test agent, and a user provides a sample prediction score for the test agent and a toxicity reference prediction for the toxicity model. And a computer system that includes software that enables the prediction of at least one toxic effect of the test agent by comparison with the score.

[0010]本発明のさらなる態様では、試験薬剤に曝された組織または細胞からの遺伝子発現情報をCELファイルなどのテキストファイルまたはバイナリファイルとして準備してよく、また分析、およびリモートの中央サーバー上に格納されている毒性モデルとの比較のためにインターネット経由で伝送してよい。処理後、テキストファイルを送信したユーザーは、その試験薬剤の毒性もしくは非毒性を示したレポートを受信する。  [0010] In a further aspect of the invention, gene expression information from tissues or cells exposed to the test agent may be prepared as a text file or binary file, such as a CEL file, and analyzed and on a remote central server. It may be transmitted over the internet for comparison with stored toxicity models. After processing, the user who sent the text file receives a report indicating the toxicity or non-toxicity of the test drug.

[0011]本発明の他の態様では、ユーザーは、1種または複数の毒性モデルを、リモートの中央サーバー、ならびにユーザーのデータおよび毒性モデルを操作するためのソフトウェアから、ローカルサーバーにダウンロードしてよい。次いで、試験薬剤に曝された組織または細胞からの遺伝子発現情報を、CELファイルなどのテキストファイルとして準備してよく、またこの情報を分析し、かつローカルサーバーに格納された毒性モデルとユーザーのサイトで比較してよい。処理後、ソフトウェアにより、その試験薬剤の毒性もしくは非毒性を示すレポートが作成される。  [0011] In other aspects of the invention, a user may download one or more toxicity models to a local server from a remote central server and software for manipulating user data and toxicity models. . The gene expression information from tissues or cells exposed to the test agent may then be prepared as a text file such as a CEL file, and this information is analyzed and the toxicity model and user site stored on a local server. You can compare with. After processing, the software generates a report indicating the toxicity or non-toxicity of the test drug.

(表)
[0012]表1:表1は、表2に記載した各遺伝子断片についての配列番号およびGenBankアクセション番号に関してGLGC識別子(表2の断片名)を提供する(その全てが、参照により本明細書に、また複製により本明細書に添付の配列表に組み入れられる)。遺伝子名およびUnigeneクラスター名も含める。
(table)
[0012] Table 1: Table 1 provides GLGC identifiers (fragment names in Table 2) for SEQ ID NOS and GenBank accession numbers for each gene fragment listed in Table 2, all of which are hereby incorporated by reference. And also incorporated by replication into the sequence listing attached hereto). Include gene name and Unigene cluster name.

[0013]表2:表2は、腎臓の例示な一般毒性モデルからのPLSスコア(加重遺伝子インデックススコア(weighted gene index score))を表す。  [0013] Table 2: Table 2 presents PLS scores (weighted gene index scores) from an exemplary general toxicity model of the kidney.

(詳細な説明)
定義
[0014]本発明で使用する場合、「核酸ハイブリダイゼーションデータ」は、1種または複数の一連の参照核酸との核酸の試料のハイブリダイゼーションによって導き出された任意のデータをさす。このような参照核酸は、マイクロアレイ上のプローブまたは1組のビーズの形でよく、または試料核酸とのプライマーのハイブリダイゼーションを検出するための、PCR増幅などの重合反応で使用するプライマーの形でもよい。核酸ハイブリダイゼーションデータは、ハイブリダイゼーションの数値表現の形でよく、定量分析、半定量分析、または非定量分析の技法、あるいは技術プラットホームによって導き出してよい。核酸ハイブリダイゼーションデータには、限定されるものではないが遺伝子発現データが含まれる。このデータは、マイクロアレイ、または他のハイブリダイゼーション技術プラットホームからの、蛍光データあるいは蛍光プローブ強度の測定を含めてどんな形でもよい。核酸ハイブリダイゼーションデータは生データでよく、あるいはこのデータを正規化して、マイクロアレイの高/低強度スポット、かき傷、または局所もしくは全体での高バックグラウンドによって生じるバックグラウンド、ならびにスキャナの電気的雑音および試料の質の変動によって生じる生ノイズを含めたバックグラウンドまたは生ノイズの値を補正し、あるいはこの値を考慮に入れてよい。
(Detailed explanation)
Definitions [0014] As used herein, "nucleic acid hybridization data" refers to any data derived by hybridization of a sample of nucleic acid with one or more series of reference nucleic acids. Such a reference nucleic acid may be in the form of a probe or a set of beads on a microarray, or in the form of a primer used in a polymerization reaction, such as PCR amplification, to detect primer hybridization with a sample nucleic acid. . Nucleic acid hybridization data may be in the form of numerical representations of hybridization and may be derived by techniques of quantitative, semi-quantitative, or non-quantitative analysis, or technology platforms. Nucleic acid hybridization data includes, but is not limited to, gene expression data. This data can be in any form, including fluorescence data or fluorescence probe intensity measurements from a microarray or other hybridization technology platform. Nucleic acid hybridization data can be raw data, or this data can be normalized to produce backgrounds caused by microarray high / low intensity spots, scratches, or high local or global background, as well as scanner electrical noise and Background or raw noise values including raw noise caused by sample quality fluctuations may be corrected or taken into account.

[0015]本発明で使用する場合、「細胞または組織試料」は、ラット、マウスなどの実験動物を含めて、動物もしくは他の生物の細胞または組織を含む1種または複数の試料をさす。細胞または組織試料は、細胞または組織の混合集団を含むことができ、あるいは実質上、肝細胞または肝臓組織などの単一の細胞または組織の型でよい。本発明で使用する場合、細胞または組織試料は、初代細胞培養物、不死化細胞培養物、培養肝細胞、培養肝組織など、in vitroで増殖させた細胞または組織でもよい。細胞または組織は、限定されるものではないが、肝臓、腎臓、心臓、筋肉(骨格筋もしくは心筋)、または脳を含めて任意の器官に由来するものでよい。  [0015] As used herein, "cell or tissue sample" refers to one or more samples containing cells or tissues of animals or other organisms, including laboratory animals such as rats, mice and the like. A cell or tissue sample can comprise a mixed population of cells or tissues, or can be substantially a single cell or tissue type, such as hepatocytes or liver tissue. When used in the present invention, the cell or tissue sample may be a cell or tissue grown in vitro, such as a primary cell culture, an immortalized cell culture, a cultured hepatocyte, or a cultured liver tissue. The cell or tissue may be derived from any organ including, but not limited to, liver, kidney, heart, muscle (skeletal or cardiac muscle), or brain.

[0016]本発明で使用する場合、「試験薬剤」は、本発明の方法で試験または分析されている薬剤、化合物、または組成物をさす。例えば、試験薬剤は、毒性学的データが所望される薬剤候補でよい。  [0016] As used in the present invention, "test agent" refers to an agent, compound, or composition that is being tested or analyzed by the methods of the invention. For example, the test drug can be a drug candidate for which toxicological data is desired.

[0017]本発明で使用する場合、「試験薬剤ビヒクル」は、試験薬剤を、その中に溶解し、懸濁させ、または動物、生物、もしくは細胞に投与する希釈剤あるいは担体をさす。  [0017] As used herein, a "test drug vehicle" refers to a diluent or carrier in which a test drug is dissolved, suspended, or administered to an animal, organism, or cell.

[0018]本発明で使用する場合、「毒素ビヒクル」は、毒素を、その中に溶解し、懸濁させ、または動物、生物、もしくは細胞に投与する希釈剤あるいは担体をさす。  [0018] As used herein, "toxin vehicle" refers to a diluent or carrier in which a toxin is dissolved, suspended, or administered to an animal, organism, or cell.

[0019]本発明で使用する場合、「遺伝子発現測度」は、細胞または組織試料中での遺伝子または遺伝子断片の発現レベルの任意の数値表現をさす。「遺伝子発現測度」には、限定されるものではないが変化倍率が含まれる。  [0019] As used herein, "gene expression measure" refers to any numerical representation of the expression level of a gene or gene fragment in a cell or tissue sample. “Gene expression measure” includes, but is not limited to, rate of change.

[0020]本発明で使用する場合、「少なくとも1種の遺伝子」は、試料中で本発明の方法によって検出される核酸分子をさす。本発明で使用する場合、「遺伝子」という用語には、完全に特徴付けられたオープンリーディングフレーム、およびコードされているmRNA、ならびに本明細書に記載の通りアッセイする細胞または組織試料において、任意のハイブリダイゼーション法により検出可能な、発現されるRNA断片が含まれる。例えば、「遺伝子」には、表1の「遺伝子」など、マイクロアレイにおけるプローブとのハイブリダイゼーションによって検出可能な、任意の種の核酸が含まれる。本発明で使用する場合、少なくとも1種の遺伝子には、「複数の遺伝子」が含まれる。  [0020] As used herein, "at least one gene" refers to a nucleic acid molecule that is detected in a sample by a method of the invention. As used herein, the term “gene” refers to any fully characterized open reading frame and encoded mRNA and any cell or tissue sample assayed as described herein. RNA fragments that are expressed that can be detected by hybridization methods are included. For example, “gene” includes any type of nucleic acid that can be detected by hybridization with probes in a microarray, such as “gene” in Table 1. As used in the present invention, the at least one gene includes “a plurality of genes”.

[0021]本発明で使用する場合、「変化倍率」は、任意の基準または対照と比較しての、試験するもしくは処理された細胞または組織試料など、実験パラダイム間での1種の遺伝子、複数の遺伝子、または遺伝子断片の発現レベルの数値表現をさす。例えば、変化倍率を、曝されていない細胞または組織試料あるいはビヒクルに曝された細胞または組織試料などの対照と比較した、試験用の細胞または組織試料の1種の遺伝子または複数の遺伝子に関するマイクロアレイによって導き出した蛍光またはプローブ強度として表してよい。本明細書に記載のRMA 変化倍率は、本発明の方法によって計算される変化倍率の非限定的な一例である。  [0021] As used in the present invention, "fold change" refers to a gene, multiple, between experimental paradigms, such as a cell or tissue sample to be tested or treated compared to any reference or control. The numerical expression of the expression level of the gene or gene fragment. For example, by microarray for a gene or genes of a test cell or tissue sample compared to a control such as an unexposed cell or tissue sample or a cell or tissue sample exposed to a vehicle. It may be expressed as derived fluorescence or probe intensity. The RMA change factor described herein is a non-limiting example of the change factor calculated by the method of the present invention.

[0022]本発明で使用する場合、「遺伝子調節スコア」は、各遺伝子に関する加重インデックススコア(weighted index score)またはPLSスコアおよび対照試料に対する処理試料からの変化倍率から導き出した、1種の遺伝子または遺伝子断片に関する遺伝子発現の定量的測度をさす。  [0022] As used in the present invention, a "gene regulatory score" is a weighted index score or a PLS score for each gene and a single gene derived from the rate of change from a treated sample relative to a control sample or Refers to a quantitative measure of gene expression for a gene fragment.

[0023]本発明で使用する場合、「試料予測スコア」は、本明細書に記載の本発明の方法によって作成された数値スコアをさす。例えば、試料から作成された遺伝子発現プロファイルにおける少なくとも1種の遺伝子に関するPLS重み(PLS weight)またはPLSスコア、およびその同一の遺伝子に関するRMA 変化倍率を使用して、「試料予測スコア」を計算してよい。ある所与の試料について計算された個々の遺伝子調節スコアを総計することにより、「試料予測スコア」を導き出す。  [0023] As used in the present invention, a “sample prediction score” refers to a numerical score generated by the method of the invention as described herein. For example, using the PLS weight or PLS score for at least one gene in a gene expression profile generated from a sample, and the RMA change rate for that same gene, a “sample prediction score” can be calculated Good. By summing the individual gene regulation scores calculated for a given sample, a “sample prediction score” is derived.

[0024]本発明で使用する場合、「毒性参照予測スコア」は、毒性モデルから作成された数値スコアをさし、これは、ある試験薬剤の少なくとも1種の毒作用を予測するためのカットオフスコアとして使用することができる。例えば、試料予測スコアを毒性参照予測スコアと比較して、この試料スコアが毒性参照予測スコアを超えるか、または下回るかどうかを判定することができる。毒性参照予測スコアの値を下回る試料予測スコアは、少なくとも1種の毒作用を示さないものとしてスコア付けされ、また毒性参照予測スコアの値を超える試料予測スコアは、少なくとも1種の毒作用を示すものとしてスコア付けされる。  [0024] As used in the present invention, a “toxicity reference prediction score” refers to a numerical score generated from a toxicity model, which is a cutoff for predicting at least one toxic effect of a test agent. Can be used as a score. For example, the sample prediction score can be compared to a toxicity reference prediction score to determine whether the sample score exceeds or falls below the toxicity reference prediction score. A sample prediction score below the toxicity reference prediction score value is scored as not exhibiting at least one toxic effect, and a sample prediction score exceeding the toxicity reference prediction score value indicates at least one toxic effect. Scored as stuff.

[0025]本発明で使用する場合、対数尺度の線形加法モデルには、対数尺度のロバストマルチアレイ平均、すなわちRMAなどの任意の対数線形モデルが含まれる(Irizarry等,Nucleic Acids Research 31(4)e15(2003))。  [0025] As used in the present invention, a logarithmic scale linear additive model includes any logarithmic linear model such as a logarithmic scale robust multi-array average, ie, RMA (Irzarry et al., Nucleic Acids Research 31 (4). e15 (2003)).

[0026]本発明で使用する場合、「リモート接続」は、直接有線接続以外の手段によるサーバーへの接続をさす。この用語には、限定されるものではないが、ダイヤルアップ回線、ブロードバンド接続、Wi−Fi接続を介した、すなわちインターネットを介したサーバーへの接続が含まれる。  [0026] When used in the present invention, "remote connection" refers to connection to the server by means other than direct wired connection. This term includes, but is not limited to, connecting to a server via a dial-up line, a broadband connection, a Wi-Fi connection, i.e., via the Internet.

[0027]本発明で使用する場合、「CELファイル」は、マイクロアレイにおける座標位置、セル、または特徴に関連する平均プローブ強度を含むファイルをさす(このような情報はCDFまたはILQファイルによって提供される)。本明細書にあるAffymetrixGeneChip(登録商標)Expression Analysis Technical Manualを参照のこと。  [0027] As used in the present invention, a "CEL file" refers to a file that contains average probe intensities associated with coordinate positions, cells, or features in a microarray (such information is provided by a CDF or ILQ file). ). See Affymetrix GeneChip® Expression Analysis Technical Manual herein.

[0028]本発明で使用する場合、「遺伝子発現プロファイル」は、細胞の試料または集団における少なくとも1種のmRNA種の発現の任意の定量的な提示を含み、それには、ディフェレンシャルディスプレイ、PCR、マイクロアレイ、他のハイブリダイゼーション分析などの様々な方法によって作成されるプロファイルが含まれる。  [0028] As used herein, a "gene expression profile" includes any quantitative presentation of expression of at least one mRNA species in a sample or population of cells, including differential display, PCR Profiles generated by various methods such as microarrays, other hybridization analyses, and the like.

毒性モデルを作成する方法
[0029]毒性が予測される遺伝子発現変化を評価および同定するために、十分に特徴付けられた毒性を有する、選択された化合物を使用した検査を使用して、本発明のモデルまたはデータベースを構築してよい。本発明の方法には、毒性を予測するためのモデルおよびデータベースを創製するRMA/PLS法(部分最小二乗アルゴリズムによる予測能力の評価を伴う、ロバストマルチアレイ平均アルゴリズムによる生の遺伝子発現データの解析)が含まれる。
Method for Creating Toxicity Models [0029] The present invention uses tests using selected compounds with well-characterized toxicity to assess and identify gene expression changes for which toxicity is predicted. A model or database may be built. The method of the present invention includes an RMA / PLS method that creates a model and database for predicting toxicity (analysis of raw gene expression data with a robust multi-array average algorithm with an assessment of predictive ability with a partial least squares algorithm) Is included.

[0030]一般に、少なくとも1種の毒作用を示すことが知られている化合物への曝露の後、細胞および組織試料を分析する。低用量のこうした化合物、または化合物がその中で調製されるビヒクルを陰性対照として使用する。少なくとも1種の毒作用を示さないことが知られている化合物も陰性対照として使用する。  [0030] Generally, cell and tissue samples are analyzed after exposure to compounds known to exhibit at least one toxic effect. A low dose of such compound, or the vehicle in which the compound is prepared, is used as a negative control. Compounds known to show no at least one toxic effect are also used as negative controls.

[0031]本発明では、毒性検査すなわち「tox study」は、1種または複数の毒素に曝された1組の細胞または組織試料を含み、これには毒素ビヒクルまたは毒性のない低用量の毒素に曝された対応試料が含まれ得る。上記の通り、この細胞または組織試料をin vivoまたはin vitroで毒素および対照の処理物に曝してよい。ある検査では、細胞または組織試料への毒素および対照による曝露は、実験用ラットなどの動物モデルに適切な用量を投与することによって行われ得る。ある検査では、細胞または組織試料への毒素および対照による曝露は、初代ラットまたはヒト肝細胞などのin vitroで増殖させた細胞または組織の試料に適切な用量を投与することによって行われ得る。こうした試料は通常、試験化合物、時間(例えば、試験化合物の投与開始からラットが屠殺されるまでの時間)、および用量(投与される試験化合物の量)に応じてコホートに組織される。tox検査におけるすべてのコホートは通常、同じビヒクル対照を共有する。例えば、あるコホートは、高用量(100mg/kg)でのアシクロビルで6時間処理したラットからの1組の試料でよい。時間を一致させたビヒクルコホートは、tox検査内での処理動物に対する対照として働く1組の試料であり、例えば、6時間アシクロビル処理した高用量試料に対する、時間を一致させたビヒクルコホートは、その検査と共に6時間ビヒクル処理した試料であるはずである。  [0031] In the present invention, a toxicity test or "tox study" includes a set of cell or tissue samples that have been exposed to one or more toxins, including a toxin vehicle or a non-toxic, low-dose toxin. An exposed corresponding sample may be included. As described above, the cell or tissue sample may be exposed to toxin and control treatments in vivo or in vitro. In one test, exposure of a cell or tissue sample with toxins and controls can be performed by administering an appropriate dose to an animal model such as a laboratory rat. In some tests, exposure to a cell or tissue sample with toxins and controls can be performed by administering an appropriate dose to a sample of cells or tissue grown in vitro, such as primary rat or human hepatocytes. Such samples are usually organized in a cohort depending on the test compound, time (eg, the time from the start of administration of the test compound to the time the rat is sacrificed), and dose (amount of test compound administered). All cohorts in a tox test usually share the same vehicle control. For example, one cohort may be a set of samples from rats treated with acyclovir at a high dose (100 mg / kg) for 6 hours. A time-matched vehicle cohort is a set of samples that serve as a control for treated animals within the tox test, eg, a time-matched vehicle cohort for a high-dose sample treated for 6 hours with acyclovir And 6 hours vehicle treated sample.

[0032]毒性データベースすなわち「tox database」は、参照データベースを単独で、または組み合わせて含む1組のtox studyである。例えば、参照データベースには、様々な用量の様々な試験化合物で処理され、試験化合物に様々な長さの時間曝されたラットからのラット組織および細胞試料からのデータが含まれ得る。  [0032] A toxicity database or "tox database" is a set of tox studies that include a reference database alone or in combination. For example, a reference database can include data from rat tissue and cell samples from rats treated with various doses of various test compounds and exposed to the test compounds for various lengths of time.

[0033]RMAすなわちロバストマルチアレイ平均は、Affymetrix GeneChip(登録商標)マイクロアレイとの試料核酸のハイブリダイゼーションによって導き出したものなど、生の蛍光強度を、発現値に、すなわちチップ上の各遺伝子断片に対する1個の値(Irizarry等(2003),Nucleic Acids Res. 31(4):e15,8pp.;Irizarry等(2003)「Exploration,normalization, and summaries of high density oligonucleotide array probe.level data」Biostatistics 4(2):249−264)に変換するアルゴリズムである。RMAでは、対照レベルを有意に超えて、または下回って発現される遺伝子に関して、log2の尺度で通常4〜12の間で値が生じる。こうしたRMA値は、正または負となり得、変化倍率が約1の場合0付近を中心とする。RMAによって作成された遺伝子発現値の行列をPLSにかけて、毒性反応の予測のためのモデル、例えば肝臓または腎臓の毒性を予測するためのモデルを作成することができる。好ましい一実施形態では、このモデルを、当分野の技術者に知られている技法によって確認する。交差検定技法を使用することが好ましい。このような技法では、そのデータをランダムに訓練および試験セットに数回に分けてからモデル成功率を決定する。このような技法では、2/3 / 1/3交差検定を使用することが最も好ましく、この場合、データの1/3を落とし、その残りの2/3を使用してそのモデルを再構築する。  [0033] RMA or robust multi-array average is the raw fluorescence intensity, such as that derived by hybridization of sample nucleic acid with an Affymetrix GeneChip® microarray, to the expression value, ie 1 for each gene fragment on the chip. (Irizarry et al. (2003), Nucleic Acids Res. 31 (4): e15, 8 pp .; Irizarry et al. (2003) "Exploration, normalization, and summers of high density. ): 249-264). In RMA, values typically occur between 4 and 12 on the log2 scale for genes expressed significantly above or below control levels. Such an RMA value can be positive or negative, and is centered around 0 when the rate of change is approximately 1. The matrix of gene expression values generated by RMA can be subjected to PLS to create a model for predicting toxic response, for example, a model for predicting liver or kidney toxicity. In a preferred embodiment, this model is verified by techniques known to those skilled in the art. It is preferred to use a cross-validation technique. In such a technique, the model success rate is determined after the data is randomly divided into training and test sets. In such a technique, it is most preferred to use 2/3/1/3 cross-validation, in which case 1/3 of the data is dropped and the remaining 2/3 is used to reconstruct the model .

[0034]PLSすなわち部分最小二乗は、予測変数の行列および監視スコアのベクトルを入力として取得し、入力した各予測変数に対して1組の予測重み(predictionweight)を作成するモデリングアルゴリズムである(Nguyen等(2002),Bioinformatics 18:39−50)。次いで、こうした予測重みを使用して、遺伝子調節スコアを計算し、それにより分析された各遺伝子により毒性反応を予測できるかどうかが示される。実施例に記載の通り、次いで、この遺伝子調節スコアを使用して毒性参照予測スコアを計算してよい。  [0034] PLS or Partial Least Squares is a modeling algorithm that takes as input a matrix of predictors and a vector of monitoring scores and creates a set of prediction weights for each input predictor (Nguyen) Et al. (2002), Bioinformatics 18: 39-50). These prediction weights are then used to calculate a gene regulation score, which indicates whether each gene analyzed can predict a toxic response. As described in the Examples, this gene regulation score may then be used to calculate a toxicity reference prediction score.

[0035]核酸ハイブリダイゼーションデータから、遺伝子発現測度を、その発現のレベルが核酸ハイブリダイゼーション値において検出される1種または複数の遺伝子について計算する。上記の通り、この遺伝子発現測度は、RMA 変化倍率を含むことができる。毒性参照スコア(toxicity reference score)=ΣwFCi。「i」は、評価すべき遺伝子発現プロファイルにおける各遺伝子のインデックスナンバーである。「w」は、各遺伝子に関するPLS重み(またはPLSスコア、表2参照)である。「RFCi」は、(上記の)試料からの遺伝子発現データの正規化されたRMA行列から求めた、第i番目の遺伝子に関するRMA 変化倍率である。PLS重みにRMA 変化倍率を掛けると、各遺伝子に関する遺伝子調節スコアが得られ、その個々の遺伝子すべてに関する調節スコアを合計すると、試料または試料のコホートに関する毒性参照予測スコアが得られる。毒性参照予測スコアを、少なくとも1種の遺伝子調節スコア、あるいは少なくとも約5種、10種、25種、50種、100種、500種、または約1,000種以上の遺伝子調節スコアから計算することができる。[0035] From the nucleic acid hybridization data, a gene expression measure is calculated for one or more genes whose level of expression is detected in the nucleic acid hybridization value. As described above, this gene expression measure can include the RMA change rate. Toxicity reference score = Σw i R FCi . “I” is the index number of each gene in the gene expression profile to be evaluated. “W i ” is the PLS weight (or PLS score, see Table 2) for each gene. “R FCi ” is the RMA change rate for the i th gene determined from the normalized RMA matrix of gene expression data from the sample (above). Multiplying the PLS weight by the RMA change factor gives a gene regulation score for each gene, and summing the regulation scores for all its individual genes yields a toxicity reference prediction score for the sample or cohort of samples. To calculate a toxicity reference prediction score from at least one gene regulation score, or at least about 5, 10, 25, 50, 100, 500, or about 1,000 or more gene regulation scores Can do.

[0036]本発明の一実施形態では、(a)ある毒素に曝された少なくとも1種の細胞または組織試料およびその毒素ビヒクルに曝された少なくとも1種の細胞または組織試料の複数の遺伝子に関する核酸ハイブリダイゼーションデータを提供するステップと、(b)少なくとも1種の遺伝子からのハイブリダイゼーションデータを遺伝子発現測度に変換するステップと、(c)前記少なくとも1種の遺伝子に関する遺伝子発現測度から遺伝子調節スコアを作成するステップと、(d)その毒素に関する毒性参照予測スコアを作成し、それにより毒性学的モデルを創製するステップにより、本発明の毒性学的モデルまたは毒性モデルを準備または作成する。この遺伝子発現測度は、RMAなどの、対数尺度の線形加法モデルによって計算される遺伝子変化倍率でよく、毒性参照予測スコアを、PLSを用いて作成してよい。次いで、この毒性参照予測スコアを、毒性モデルもしくはデータベースに追加してよく、このスコアを使用して、未知の試験薬剤または化合物の少なくとも1種の毒作用を予測してよい。  [0036] In one embodiment of the invention, (a) at least one cell or tissue sample exposed to a toxin and nucleic acids for a plurality of genes of at least one cell or tissue sample exposed to the toxin vehicle Providing hybridization data; (b) converting hybridization data from at least one gene into a gene expression measure; and (c) a gene regulation score from the gene expression measure for the at least one gene. Prepare or create a toxicological model or toxicity model of the present invention by creating and (d) creating a toxicity reference prediction score for the toxin, thereby creating a toxicological model. This gene expression measure may be a gene change rate calculated by a logarithmic scale linear additive model, such as RMA, and a toxicity reference prediction score may be generated using PLS. This toxicity reference prediction score may then be added to a toxicity model or database, which may be used to predict at least one toxic effect of an unknown test agent or compound.

[0037]好ましい別の実施形態では、このモデルを当分野の技術者に知られている技法によって確認する。好ましくは、交差検定技法を使用する。このような技法では、そのデータをランダムに訓練および試験セットに数回に分けてから許容されるモデル成功率を決定する。このような技法では、2/3 / 1/3交差検定を使用することが最も好ましく、この場合、データの1/3を落とし、その残りの2/3を使用してそのモデルを再構築する。  [0037] In another preferred embodiment, this model is verified by techniques known to those skilled in the art. Preferably, cross-validation techniques are used. In such a technique, the data is randomly divided into training and test sets several times before determining the acceptable model success rate. In such a technique, it is most preferred to use 2/3/1/3 cross-validation, in which case 1/3 of the data is dropped and the remaining 2/3 is used to reconstruct the model .

毒作用を予測する方法
[0038]毒素に曝された細胞または組織試料から導き出した遺伝子調節スコアおよび毒性予測スコアを使用して、試験用の、もしくは未知の薬剤または化合物の肝毒性、腎毒性、あるいは他の組織毒性を含めた少なくとも1種の毒作用を予測してよい。毒素に曝された細胞または組織試料からの遺伝子調節スコアおよび毒性予測スコアを使用して、ある試験薬剤または化合物が、試料において肝臓壊死などの組織病態を誘導することができるか予測してもよい。本発明の毒性学的予測方法は、適切な毒性学的モデルおよび毒性学的予測スコアを利用できるかどうかによってのみ制限される。例えば、追加の毒素、または特異的な組織病態を誘導する薬剤、および適切な細胞または組織試料を使用して、本発明の新たな毒性学的検査およびモデルを単に実行することにより、本発明のコンピュータシステムもしくはデータベースなどの所与のシステムの予測方法を拡大することができる。
Methods for predicting toxic effects [0038] Gene regulatory scores and toxicity prediction scores derived from cells or tissue samples exposed to toxins can be used to test or unknown drug or compound hepatotoxicity, nephrotoxicity, Alternatively, at least one toxic effect may be predicted including other tissue toxicities. Gene regulatory scores and toxicity prediction scores from cells or tissue samples exposed to the toxin may be used to predict whether a test agent or compound can induce a tissue pathology such as liver necrosis in the sample. . The toxicological prediction methods of the present invention are limited only by the availability of appropriate toxicological models and toxicological prediction scores. For example, by simply performing the new toxicological tests and models of the present invention using additional toxins, or agents that induce specific tissue pathologies, and appropriate cell or tissue samples, The prediction method of a given system such as a computer system or database can be expanded.

[0039]本明細書で使用する場合、少なくとも1種の毒作用には、限定されるものではないが細胞または生物の生理的状態の有害な変化が含まれる。この反応は、それを必要とするわけではないが、組織壊死などの特定の病態を伴う恐れがある。したがって、この毒作用には、分子レベルおよび細胞レベルでの作用が含まれる。例えば、肝毒性は、本明細書で使用する作用であり、これには、限定されるものではないが、胆汁うっ滞、遺伝毒性/発癌、肝炎、ヒト特異的な毒性、肝腫大の誘導、脂肪症、大滴性脂肪症、微小胞脂肪症、壊死、非遺伝毒性/非発癌毒性、ペルオキシソーム増殖、ラット非遺伝毒性、および一般的な肝毒性の病態が含まれる。  [0039] As used herein, at least one toxic effect includes, but is not limited to, a detrimental change in the physiological state of a cell or organism. This reaction does not require it, but may involve certain pathologies such as tissue necrosis. Thus, this toxic effect includes effects at the molecular and cellular levels. For example, hepatotoxicity is an effect used herein, including but not limited to cholestasis, genotoxicity / carcinogenesis, hepatitis, human specific toxicity, hepatomegaly induction. , Steatosis, macroscopic steatosis, microvesicular steatosis, necrosis, non-genotoxic / non-carcinogenic toxicity, peroxisome proliferation, rat non-genotoxicity, and general hepatotoxic conditions.

[0040]一般に、ある試験薬剤(または化合物または多成分組成物)の毒性を予測するためのアッセイは、1種の細胞または組織試料、あるいは細胞または組織試料の集団をその試験薬剤または化合物に曝すステップと、例えば、表2中の遺伝子のうちの1種または複数など、遺伝子のうちの1種または複数の相対的もしくは絶対的な遺伝子発現のレベルをアッセイまたは測定することにより、その試験薬剤に曝された1種(複数)の細胞または組織試料の少なくとも1種の遺伝子に関する核酸ハイブリダイゼーションデータを提供するステップと、試料予測スコアを計算するステップと、この試料予測スコアを1種または複数の毒性学的参照スコアと比較するステップとを含む(実施例1参照)。  [0040] In general, an assay for predicting the toxicity of a test agent (or compound or multi-component composition) exposes a single cell or tissue sample, or a population of cells or tissue samples, to the test agent or compound. The test agent by assaying or measuring the level of relative or absolute gene expression of one or more of the genes, eg, one or more of the genes in Table 2 Providing nucleic acid hybridization data for at least one gene of one or more exposed cell or tissue samples, calculating a sample prediction score, and calculating the sample prediction score to one or more toxicities Comparing with a morphological reference score (see Example 1).

[0041]試料予測スコアは以下の通りに計算してよい。試料予測スコア=ΣwFCi。「i」は、評価すべき遺伝子発現プロファイルにおける各遺伝子のインデックスナンバーである。「w」は、ある毒性モデルから導き出した、各遺伝子に関するPLS重み(またはPLSスコア)である。「RFCi」は、(上記の)試料からの遺伝子発現データの正規化RMA行列から求めた、第i番目の遺伝子に関するRMA 変化倍率である。所与のモデルからのPLS重みにRMA 変化倍率を掛けると、各遺伝子に関する遺伝子調節スコアが得られ、その個々の遺伝子すべてに関する調節スコアを合計すると、その試料に関する予測スコアが得られる。[0041] The sample prediction score may be calculated as follows. Sample prediction score = Σw i R FCi . “I” is the index number of each gene in the gene expression profile to be evaluated. “W i ” is the PLS weight (or PLS score) for each gene derived from a toxicity model. “R FCi ” is the RMA change rate for the i-th gene, determined from the normalized RMA matrix of gene expression data from the sample (above). Multiplying the PLS weights from a given model by the RMA change factor gives a gene regulation score for each gene, and summing the regulation scores for all its individual genes yields a predicted score for that sample.

[0042]核酸ハイブリダイゼーションデータには、約(もしくは少なくとも)2種、3種、4種、5種、6種、7種、8種、9種、10種、15種、20種、25種、30種、50種、75種、100種、200種、500種、1000種、またはそれ以上の遺伝子、あるいはこうした数の範囲、例えば、約2〜10種、約10〜20種、約20〜50種、約50〜100種、約100〜200種、約200〜500種、または約500〜1000種の遺伝子に対応するプローブとの試料核酸の、遺伝子発現レベルを含めた、ハイブリダイゼーションの任意の測定値が含まれ得る。毒性予測のための核酸ハイブリダイゼーションデータには、ある毒性モデルにおけるほぼすべての遺伝子の測定値も含まれる。「ほぼすべての」遺伝子を、任意の1種の毒性モデルにおける遺伝子のうちの少なくとも80%を意味すると考えてよい。  [0042] The nucleic acid hybridization data includes about (or at least) 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 species. , 30, 50, 75, 100, 200, 500, 1000, or more genes, or a range of such numbers, eg, about 2-10, about 10-20, about 20 Of hybridization, including gene expression levels of sample nucleic acids with probes corresponding to -50, about 50-100, about 100-200, about 200-500, or about 500-1000 genes Any measurement can be included. Nucleic acid hybridization data for predicting toxicity includes measurements of almost all genes in a toxicity model. “Almost all” genes may be considered to mean at least 80% of genes in any one toxicity model.

[0043]ある試験薬剤または化合物の少なくとも1種の毒作用を予測する本発明の方法を、1種の個体によって、または1種の場所で実施してよく、あるいは複数の個体によって、または複数の場所で実施してもよい。例えば、本発明の方法は、ある試験薬剤または化合物の1種(複数)の細胞または組織試料への曝露が1種の場所、すなわち核酸処理において達成され、核酸ハイブリダイゼーションデータの作成が別の場所で行われ、また遺伝子調節スコアおよび試料予測スコアが別の場所で計算または作成されるステップを含む。  [0043] The methods of the invention for predicting at least one toxic effect of a test agent or compound may be performed by one individual, or at one location, or by multiple individuals, or multiple It may be implemented at the place. For example, the method of the present invention may be such that exposure of one test agent or compound to one or more cell or tissue samples is accomplished in one location, ie, nucleic acid processing, and the creation of nucleic acid hybridization data at another location. And a gene regulation score and a sample prediction score are calculated or generated elsewhere.

[0044]本発明の別の実施形態では、薬剤を実験ラットに投与することにより、細胞または組織試料をある試験薬剤または化合物に曝し、核酸を、選択された組織から処理し、マイクロアレイにハイブリッド形成させて、核酸ハイブリダイゼーションデータを作成する。次いで、この核酸ハイブリダイゼーションデータを、毒性学的参照データベース、および核酸ハイブリダイゼーションデータからの個々の遺伝子調節スコアおよび1種または複数の試料予測スコアの作成を可能にするソフトウェアを含むリモートサーバーに送信する。このソフトウェアは、ユーザーが、特異的な毒性学的モデルを事前選択すること、および作成された試料予測スコアを、このようなスコアのデータベース内に含まれている1種または複数の毒性学的参照スコアと比較することを可能にしてもよい。次いで、ユーザーは、データ解析、遺伝子調節スコアと試料予測スコアの作成、および/または1種または複数の毒性学的参照スコアとの比較の結果を提供もしくは提示する1種(複数)の適切な出力プロダクトを作成または注文してよい。  [0044] In another embodiment of the invention, by administering a drug to a laboratory rat, a cell or tissue sample is exposed to a test drug or compound, and nucleic acids are processed from the selected tissue and hybridized to a microarray. To create nucleic acid hybridization data. This nucleic acid hybridization data is then sent to a remote server containing toxicological reference databases and software that enables the creation of individual gene regulation scores and one or more sample prediction scores from the nucleic acid hybridization data. . This software allows the user to pre-select specific toxicological models, and the generated sample prediction score to one or more toxicological references contained in such a score database. It may be possible to compare with a score. The user can then provide one or more appropriate outputs that provide or present results of data analysis, generation of gene regulation scores and sample prediction scores, and / or comparison with one or more toxicological reference scores. You may create or order a product.

[0045]核酸ハイブリダイゼーションデータを含めて、データを、セキュアな直接ダイヤルアップ、またはセキュアもしくはアンセキュアなインターネット接続を含めて、利用可能ないかなる手段によってサーバーに伝送してもよい。毒性学的予測レポート、または本明細書の方法の任意の結果を、その同一の機序を介して伝送してもよい。例えば、最初のユーザーは、核酸ハイブリダイゼーションデータを、セキュアなパスワードによって保護されたインターネットリンク経由でリモートサーバーに伝送してよく、次いでその同一のインターネットリンク経由でそのサーバーから毒性学的レポートの伝送を要求してよい。  [0045] Data, including nucleic acid hybridization data, may be transmitted to the server by any available means, including secure direct dial-up or secure or unsecure internet connection. A toxicological prediction report, or any result of the methods herein, may be transmitted via that same mechanism. For example, an initial user may transmit nucleic acid hybridization data to a remote server via an internet link protected by a secure password, and then send a toxicological report from that server via that same internet link. You may request.

[0046]毒性データベースまたはモデルのリモートユーザーによって伝送されたデータは、生の、正規化されていないデータでよく、またはこのデータを、伝送前に様々なバックグラウンドパラメータから正規化してもよい。例えば、マイクロアレイからのデータを、様々なチップ、および上記のものなどのバックグラウンドパラメータについて正規化してよい。このデータは、データが利用可能なソフトウェア、またはデータベースもしくはコンピュータシステムの一環として提供されるソフトウェアによって認識、あるいは適正にフォーマットされ得るかぎり、いかなる形のものでもよい。例えば、マイクロアレイデータを、市販の技術プラットホームにおけるマイクロアレイベースのハイブリダイゼーションの分析によって作成されたcelファイルまたは他の任意の共通データファイルで提供および伝送してよい(例えば、www.affymetrix.comで利用可能なAffymetrix GeneChip(登録商標)Expression Analysis Technical Manualを参照のこと)。このようなファイルに、様々な情報、例えば、限定されるものではないが、顧客またはリモートユーザーに関係する情報、細胞もしくは組織試料のデータまたは情報、データが作成されるハイブリダイゼーション技術またはプラットホーム、ならびに/あるいは試験薬剤データまたは情報を用いて、注釈を付けても付けなくてもよい。  [0046] The data transmitted by the remote user of the toxicity database or model may be raw, unnormalized data, or this data may be normalized from various background parameters prior to transmission. For example, data from the microarray may be normalized for various chips and background parameters such as those described above. This data can be in any form as long as the data can be recognized or properly formatted by the software in which it is available or provided as part of a database or computer system. For example, the microarray data may be provided and transmitted in a cel file or any other common data file created by analysis of microarray-based hybridization on commercially available technology platforms (eg available at www.affymetrix.com) (See Affymetrix GeneChip® Expression Analysis Technical Manual). Such files contain various information, such as, but not limited to, information related to customers or remote users, cell or tissue sample data or information, the hybridization technology or platform on which the data is created, and The test drug data or information may or may not be annotated.

[0047]データを受信する場合、任意の利用可能な手段により、核酸ハイブリダイゼーションデータをデータベース互換性についてスクリーニングしてよい。一実施形態では、一般に利用可能なデータ品質管理メトリクスを適用することができる。例えば、異常値分析の方法または技法を利用して、データベースに不適合な試料、例えば、データとデータベースまたは毒性モデルとの間で共通の、対照プローブからの誤った蛍光値を示す試料を同定してよい。さらに、米国特許仮出願第60/399727号の優先権を主張する、2003年8月1日出願のPCT/US第03/24160号で開示されている1種または複数のものを含めて、様々なデータQCメトリクスを適用することができる。  [0047] When receiving data, the nucleic acid hybridization data may be screened for database compatibility by any available means. In one embodiment, commonly available data quality management metrics can be applied. For example, using outlier analysis methods or techniques to identify samples that are incompatible with the database, e.g., samples that show false fluorescence values from control probes that are common between the data and the database or toxicity model. Good. In addition, various ones, including one or more disclosed in PCT / US03 / 24160, filed Aug. 1, 2003, claiming priority from US Provisional Patent Application No. 60/399727. Data QC metrics can be applied.

細胞または組織試料の調製
[0048]上記の通り、試験薬剤、化合物、または組成物に曝される細胞集団をin vitroまたはin vivoで曝してよい。例えば、培養された、または新たに単離された肝臓細胞、特にラット肝細胞を、標準の実験室および細胞培養の条件下で薬剤に曝してよい。別のアッセイフォーマットでは、in vivoでの曝露を、生きている動物、例えば実験ラットへの薬剤の投与によって達成してよい。
Cell or Tissue Sample Preparation [0048] As described above, a cell population exposed to a test agent, compound, or composition may be exposed in vitro or in vivo. For example, cultured or freshly isolated liver cells, particularly rat hepatocytes, may be exposed to the drug under standard laboratory and cell culture conditions. In another assay format, in vivo exposure may be achieved by administration of the drug to a living animal, such as a laboratory rat.

[0049]in vitro系およびin vivo系で毒性試験を設計および実施するための手順は、周知であり、またLoomis等,Loomis’s Esstentials of Toxicology,4版,Academic Press,New York,1996;Echobichon,The Basics of Toxicity Testing,CRC Press,Boca Raton,1992;Frazier編,In Vitro Toxicity Testing,Marcel Dekker,New York.1992など、この主題に関する多数のテキストに記載されている。  [0049] Procedures for designing and conducting toxicity studies in vitro and in vivo are well known and are also known by Loomis et al., Loomis's Essentials of Toxology, 4th edition, Academic Press, New York, 1996; The Basics of Toxicity Testing, CRC Press, Boca Raton, 1992; Frazier, Ed., In Vitro Toxicity Testing, Marcel Dekker, New York. 1992 and many other texts on this subject.

[0050] インビトロ毒性試験では、2つのグループの試験生物が通常使用される。1つのグループは対照であり、他のグループは単一用量で(急性毒性試験用)、又は1つの投薬計画の用量で(遷延性又は慢性毒性試験用)、試験化合物を受ける。いくつかのケースでは、本発明の方法で要求される組織の抽出が、試験動物を犠牲にする必要があるので、実験の継続期間を通して遺伝子発現の動態を観察することが望ましいならば対照グループ及び化合物を受けているグループの両方とも、組織サンプリングのために動物を取り除くことができるように十分大きくなければならない。  [0050] Two groups of test organisms are commonly used in in vitro toxicity tests. One group is a control and the other group receives the test compound at a single dose (for acute toxicity studies) or at a dosage regimen (for prolonged or chronic toxicity studies). In some cases, tissue extraction required by the methods of the present invention requires the test animals to be sacrificed, so if it is desirable to observe the dynamics of gene expression throughout the duration of the experiment, control groups and Both groups receiving the compound must be large enough so that the animals can be removed for tissue sampling.

[0051] 毒性研究を計画するに際して、試験される化合物のために適切な試験生物を選ぶこと、投与経路、用量の範囲などについて広範囲な指針が文献で提供されている。水又は生理的食塩水(0.9%NaCl水溶液)が、試験化合物のために選択される溶質である。というのは、これらの溶剤が様々な経路による投与を許容するからである。溶解性の限界のために、これが可能でないとき、コーン油のような植物油、又はプロピレングリコールのような有機溶媒が使用できる。  [0051] In designing toxicity studies, extensive guidance is provided in the literature on selecting appropriate test organisms for the compounds to be tested, routes of administration, dosage ranges, and the like. Water or saline (0.9% NaCl aqueous solution) is the solute selected for the test compound. This is because these solvents allow administration by various routes. When this is not possible due to solubility limitations, vegetable oils such as corn oil or organic solvents such as propylene glycol can be used.

[0052] 投与経路に関係なく、所与の用量を投与するのに要する容積は、使われる動物の大きさによって制限される。動物のグループ内又はグループ間で各用量の容積を均一に保つことが望ましい。ラット又はマウスを使用するとき、一般に経口経路で投与される容積は、動物のグラム当たり0.005mLを超えてはならない。水溶液又は生理的食塩水溶液が非経口的注入のために使われるときでも、そのような溶液は通常無害であると考えられているが、許容される容積は制限される。マウスでの蒸留水の静脈LD50は、マウスグラム当たり約0.044mLであり、等張性生理食塩水のそれはマウスグラム当たり0.068mLである。ある場合には、試験動物への投与経路は、治療目的のためのヒトへの該化合物の投与経路と同一、又はできるだけ似通っているべきである。[0052] Regardless of the route of administration, the volume required to administer a given dose is limited by the size of the animal used. It is desirable to keep the volume of each dose uniform within or between groups of animals. When using rats or mice, the volume generally administered by oral route should not exceed 0.005 mL per gram of animal. Even when aqueous solutions or saline solutions are used for parenteral injection, such solutions are usually considered harmless, but the volume allowed is limited. The intravenous LD 50 of distilled water in mice is approximately 0.044 mL per gram of mouse and that of isotonic saline is 0.068 mL per gram of mouse. In some cases, the route of administration to the test animal should be the same or as similar as possible to the route of administration of the compound to humans for therapeutic purposes.

[0053] 化合物が吸入によって投与されることになっているとき、試験空気を発生する特殊な手法が必要である。その方法は、通常、化合物を含む液のエーロゾル化又は噴霧化を含む。試験される薬剤が感知できる蒸気圧を持つ液であるならば、それは制御された温度条件下で空気を溶液に通すことによって投与できる。これらの条件下で、用量は単位時間当たりに吸入される空気の容積、溶液の温度及び関与する薬剤の蒸気圧から見積もられる。ガスは、ガス溜めからメーターで測られる。溶液の粒子が投与されることになっているとき、粒径が約2μmより小さくなければ、粒子は肺で末端の肺胞嚢に達しない。吸入によって投与されるとき、様々な装置やチャンバーが、刺激物質又はその他の有毒なエンドポイントの効果を検出するための研究を実行するために利用できる。動物に薬剤を投与する好ましい方法は、挿管によるか又は飼料に薬剤を取り入れることによる、経口経路を通してある。  [0053] When the compound is to be administered by inhalation, a special technique for generating test air is required. The method typically involves aerosolizing or nebulizing a liquid containing the compound. If the drug being tested is a liquid with appreciable vapor pressure, it can be administered by passing air through the solution under controlled temperature conditions. Under these conditions, the dose is estimated from the volume of air inhaled per unit time, the temperature of the solution and the vapor pressure of the drug involved. The gas is measured with a meter from the gas reservoir. When particles of solution are to be administered, the particles will not reach the terminal alveolar sac in the lung unless the particle size is less than about 2 μm. When administered by inhalation, a variety of devices and chambers are available to perform studies to detect the effects of stimulants or other toxic endpoints. The preferred method of administering a drug to an animal is through the oral route by intubation or by incorporating the drug in the feed.

[0054] 薬剤がインビトロで、細胞又は細胞培養物に曝されるとき、薬剤に曝される細胞集団は、例えば、その集団を2つ以上の同一のアリコートに分割することによって、2つ以上の副集団に分割されるかもしれない。本発明の方法の好適ないくつかの実施の形態で、薬剤に曝される細胞は、肝臓組織に由来する。例えば、培養されたか、又は新たに単離されたラット肝細胞が使われる。  [0054] When an agent is exposed to a cell or cell culture in vitro, a cell population exposed to the agent can be divided into two or more identical aliquots, for example, by dividing the population into two or more identical aliquots. May be divided into subgroups. In some preferred embodiments of the methods of the invention, the cells exposed to the drug are derived from liver tissue. For example, cultured or freshly isolated rat hepatocytes are used.

[0055] 本発明の方法は、一般に少なくとも1つの毒性反応を予測するのに使用でき、そして、実施例に記載されているように、化合物又は試験薬剤が、胆汁鬱滞性肝炎、遺伝毒性/発癌、肝炎、ヒト特異的毒性、肝肥大の誘導、脂肪肝、大滴性脂肪肝、小滴性脂肪肝、壊死、非遺伝毒性/非発癌性毒性、ペルオキシソーム増殖、ラット非遺伝毒性的毒性、一般肝毒性、又はその他の少なくとも1つの既知の毒に関連する症状などの様々な特定の症状を誘導するという見込みを予測するのに使用できる。また、本発明の方法を用いて、1つ又はそれ以上の個々の化合物に対する毒性反応の類似性を決定できる。それに加えて、本発明の方法を用いて、上記の化合物又は試験薬剤によって影響、誘導又は調節される可能性のある細胞経路を予測するか、又は解明できる。  [0055] The methods of the present invention can generally be used to predict at least one toxic response and, as described in the Examples, the compound or test agent can be used to treat cholestatic hepatitis, genotoxicity / carcinogenesis. , Hepatitis, human specific toxicity, induction of liver hypertrophy, fatty liver, large fatty liver, small fatty liver, necrosis, nongenotoxic / noncarcinogenic toxicity, peroxisome proliferation, rat nongenotoxic toxicity, general It can be used to predict the likelihood of inducing various specific symptoms, such as liver toxicity, or symptoms associated with at least one other known toxin. The methods of the invention can also be used to determine the similarity of toxic responses to one or more individual compounds. In addition, the methods of the invention can be used to predict or elucidate cellular pathways that can be affected, induced or regulated by the compounds or test agents described above.

データベースとコンピュータシステム
[0056]本発明のデータベースおよびコンピュータシステムは通常、個々の遺伝子もしくは毒性学的マーカーの加重インデックススコアもしくはPLSスコア(表2参照)、遺伝子調節スコア、試料予測スコア、および/または毒性参照予測スコアを含むモデルなど、本明細書に記載の毒性モデルまたは毒性学的モデルを含む1種または複数のデータ構造を含む。このようなデータベースおよびコンピュータシステムは、ユーザーが、データベース内容を操作すること、あるいは核酸ハイブリダイゼーションデータからの個々の遺伝子調節スコアおよび試料予測スコアを含めて本明細書に記載のスコアを計算または作成することを可能にするソフトウェアも含む。遺伝子またはタンパク質の経路情報を含めるため、および/または可能な細胞機序および分子機序を含めて毒性の機序に関係する情報を含めるため、ソフトウェアは、ユーザーが、毒性、肝毒性、腎毒性などを含めて少なくとも1種の毒性反応を予測、アッセイ、またはスクリーニングすることを可能にするものでもよい。一例としては、ソフトウェアには、様々なプラットホームからの、例えばあるマイクロアレイプラットホームからのハイブリダイゼーションデータを別のマイクロアレイプラットホームに変換するための、少なくとも1種のアルゴリズムを含むソフトウェアなど、Gene Logic ToxShield(商標)予測モデリングシステムからの少なくとも1種のエレメントが含まれ得る。(あらゆる目的のために本明細書にその全体が参照により組み入れられる2004年9月29日出願の米国特許仮出願第60/613831号参照を参照のこと)。
Databases and Computer Systems [0056] Databases and computer systems of the present invention are typically weighted index scores or PLS scores (see Table 2), gene regulatory scores, sample prediction scores, and / or toxicity of individual genes or toxicological markers. It includes one or more data structures that include a toxicity model or toxicological model as described herein, such as a model that includes a reference prediction score. Such databases and computer systems calculate or create the scores described herein, including the user manipulating the database contents or including individual gene regulation scores and sample prediction scores from nucleic acid hybridization data. It also includes software that makes it possible. To include gene or protein pathway information and / or to include information related to toxic mechanisms, including possible cellular and molecular mechanisms, the software allows users to determine toxicity, hepatotoxicity, nephrotoxicity It may be possible to predict, assay, or screen at least one toxic response, including and the like. As an example, the software may include Gene Logic ToxShield ™, such as software that includes at least one algorithm for converting hybridization data from various platforms, eg, from one microarray platform to another. At least one element from the predictive modeling system may be included. (See U.S. Provisional Application No. 60/613831, filed Sep. 29, 2004, which is incorporated herein by reference in its entirety for all purposes).

[0057]上記の通り、本発明のデータベースおよびコンピュータシステムは、直接の、または直接ダイヤルアップアクセス、またはパスワードによって保護されたインターネットリンクを介したアクセスなどのリモートリンクを通じたアクセスを可能にする装置およびソフトウェアを含むことができる。  [0057] As noted above, the database and computer system of the present invention provides an apparatus and device that allows access through a remote link, such as direct or direct dial-up access, or access via a password-protected Internet link. Software can be included.

[0058]任意の利用可能なハードウェアを使用して、本発明のコンピュータシステムを創製してよい。任意の適切なコンピュータプラットホーム、ユーザーインターフェースなどを使用して、配列情報、遺伝子、または毒性学的マーカー情報と、データベース内の他の任意の情報、または入力として提供される情報との間の必要な比較を実行してよい。例えば、多数のコンピュータワークステーションは、様々な製造元から入手可能である。クライアント/サーバー環境、データベースサーバー、およびネットワークも、いろいろな場所から入手可能であり、本発明のデータベースのための適切なプラットホームである。  [0058] Any available hardware may be used to create the computer system of the present invention. Using any suitable computer platform, user interface, etc., necessary between sequence information, genes or toxicological marker information and any other information in the database or information provided as input A comparison may be performed. For example, many computer workstations are available from various manufacturers. Client / server environments, database servers, and networks are also available from various locations and are suitable platforms for the databases of the present invention.

[0059]このデータベースを、様々なパーツ、例えば配列データベースおよび毒性学的参照データベースを含むように設計してよい。このようなデータベース、およびこのようなデータベースを含むコンピュータ可読媒体の構成および構築のための方法は、いろいろな場所から入手可能であり、例えば、本明細書にその全体が参照により組み入れられる、2002年3月5日出願の米国特許出願公開第2003/0171876号(特許出願第10/090144号)、2002年11月23日公開のPCT出願国際公開第02/095659号パンフレット、米国特許第5953727号を参照のこと。好ましい一実施形態では、このデータベースは、Gene Logic,Inc.,Gaithersburg,MDから市販されているToxExpress(登録商標)またはBioExpress(登録商標)のデータベースである。  [0059] This database may be designed to include various parts, such as sequence databases and toxicological reference databases. Such databases and methods for the construction and construction of computer readable media containing such databases are available from a variety of locations, eg, 2002, which is incorporated herein by reference in its entirety. US Patent Application Publication No. 2003/0171876 (Patent Application No. 10/090144) filed on March 5, PCT Application Publication No. WO 02/095659 published on November 23, 2002, US Pat. No. 5,953727 See In one preferred embodiment, this database is Gene Logic, Inc. , Gaithersburg, MD, a ToxExpress® or BioExpress® database.

[0060]本発明のデータベースを、GenBank(www.ncbi.nlm.nih.gov/entrez.index.html)、KEGG(www.genome.ad.jp/kegg)、SPAR(www.grt.kyushu−u.ac.jp/spad/index.html)、HUGO(www.gene.ucl.ac.uk/hugo)、Swiss−Prot(www.expasy.ch.sprot)、Prosite(www・expasy.ch/tools/scnpsitl.html)、OMIM(www.ncbi.nlm.nih.gov/omim)、およびGDB(www.gdb.org)などの外側または外部のデータベースとリンクしてよい。好ましい一実施形態では、この外部データベースは、NCBI(National Center for Biotechnology Information国立バイオテクノロジー情報センター)(www.ncbi.nlm.nih.gov)によって維持されているGenBankおよびそれに関連するデータベースである。  [0060] Databases of the present invention are listed in GenBank (www.ncbi.nlm.nih.gov/entrez.index.html), KEGG (www.genome.ad.jp/kegg), PAR (www.grt.kyushhu-u Ac.jp/spad/index.html), HUGO (www.gene.ucl.ac.uk/hugo), Swiss-Prot (www.expasy.ch.sprot), Prosite (www.expasy.ch/tools/ may be linked to external or external databases such as snipstl.html), OMIM (www.ncbi.nlm.nih.gov/omim), and GDB (www.gdb.org). In a preferred embodiment, this external database is GenBank and its associated database maintained by NCBI (National Center for Biotechnology Information National Center for Biotechnology Information) (www.ncbi.nlm.nih.gov).

毒性または毒性学的レポート
[0061]上記の通り、本発明の方法、データベース、およびコンピュータシステムを使用して、毒性または毒性学的レポートを作成、送達、および/または送信することができる。本明細書で使用する「毒性」および「毒性学的」という用語の使用と一致して、「毒性レポートおよび「毒性学的レポート」は互換的である。
Toxicity or Toxicological Report [0061] As noted above, the methods, databases, and computer systems of the present invention can be used to generate, deliver, and / or transmit toxicity or toxicological reports. Consistent with the use of the terms “toxicity” and “toxicology” as used herein, “toxicity report” and “toxicology report” are interchangeable.

[0062]本発明の毒性レポートは通常、発明の方法の実施の結果に関係する情報またはデータを含む。例えば、本明細書に記載の、ある試験薬剤または化合物の少なくとも1種の毒作用を同定する方法の実施の結果、毒性、肝毒性、腎毒性などの少なくとも1種の毒性反応の徴候または予測を含めた、方法の結果を記載するレポートが準備または作成され得る。このレポートは、少なくとも1種の試料予測スコアをデータベースからの少なくとも1種の毒性参照予測スコアと比較することよって予測される毒作用に関係する情報、ならびに文献レビューもしくは引用リスト、および/または1種(複数)の潜在的な毒性作用の機序などに関する情報など他の関係する情報を含むことができる。このレポートは、データの完全性など、核酸ハイブリダイゼーションデータに関する情報、ならびに核酸ハイブリダイゼーションデータに注釈を付けるのに使用する情報など、データベースのユーザーおよび本発明の方法によって入力された情報を提供することもできる。  [0062] Toxicity reports of the present invention typically contain information or data relating to the results of performing the inventive method. For example, as a result of performing a method for identifying at least one toxic effect of a test agent or compound described herein, the indication or prediction of at least one toxic response, such as toxicity, hepatotoxicity, nephrotoxicity, etc. A report describing the results of the method can be prepared or created. This report includes information related to toxic effects predicted by comparing at least one sample prediction score with at least one toxicity reference prediction score from the database, as well as a literature review or citation list, and / or one Other relevant information can be included such as information on the mechanism (s) of potential toxic effects. This report provides information entered by the database user and the method of the present invention, such as information about nucleic acid hybridization data, such as data integrity, and information used to annotate nucleic acid hybridization data. You can also.

[0063]例示的な非限定的一例として、本発明の毒性レポートは、あらゆる目的のために本明細書にその両方の全体が参照により組み入れられる、2002年7月18日出願のPCT US第02/22701号、および2004年9月29日出願の米国特許仮出願第60/613831号に開示されているレポートなどの形でよい。本明細書の他の場所で記載の通り、このレポートを、ユーザーによって核酸ハイブリダイゼーションデータがロードされているサーバーまたはコンピュータシステムによって作成してよい。その核酸データに関係するレポートを作成し、インターネットを通じて利用可能な、パスワードによるセキュアな環境などのリモート手段を介して、または電子メールなどの利用可能なコンピュータ通信手段を介してユーザーに送達してよい。  [0063] As an illustrative non-limiting example, the toxicity report of the present invention is PCT US 02, filed July 18, 2002, both of which are hereby incorporated by reference in their entirety for all purposes. And the report disclosed in US Provisional Application No. 60/613831 filed on Sep. 29, 2004, and US Patent Application No. 60/613831. As described elsewhere herein, this report may be generated by a server or computer system loaded with nucleic acid hybridization data by a user. A report related to the nucleic acid data may be generated and delivered to the user via remote means such as a password-secure environment available via the Internet or via available computer communication means such as email. .

核酸ハイブリダイゼーションデータの構築
[0064] 遺伝子発現を検出するいかなるアッセイ様式を核酸のハイブリダイゼーションデータの取得に使用してもよい。例えば、伝統的なノーザンブロッティング、ドットブロット又はスロットブロット、ヌクレアーゼ保護、プライマー指示された増幅、RT−PCR、半定量的若しくは定量的PCR、分枝鎖DNA及びディファレンシャル・ディスプレイ法が、遺伝子の発現レベルの検出又は核酸のハイブリダイゼーションデータの取得のために使われるかもしれない。それらの方法は、本発明のいくつかの実施の形態に有用である。より少ない数の遺伝子が検出される場合には、ハイスループットな増幅に基づくアッセイが最も効率的であるかもしれない。しかしながら、本発明の方法及びアッセイは、多数の遺伝子の発現を検出するハイブリダイゼーションに基づく方法で、最も能率的に設計される。
Construction of Nucleic Acid Hybridization Data [0064] Any assay format that detects gene expression may be used to obtain nucleic acid hybridization data. For example, traditional Northern blotting, dot or slot blot, nuclease protection, primer-directed amplification, RT-PCR, semi-quantitative or quantitative PCR, branched DNA and differential display methods can Detection or nucleic acid hybridization data acquisition. Those methods are useful in some embodiments of the present invention. If fewer genes are detected, an assay based on high throughput amplification may be most efficient. However, the methods and assays of the present invention are most efficiently designed with hybridization-based methods that detect the expression of a large number of genes.

[0065]核酸ハイブリダイゼーションデータを作成するために、溶液ベースおよび固体支持体ベースのアッセイフォーマットを含めて、いずれのハイブリダイゼーションアッセイフォーマットを使用してもよい。本発明の差次的に発現される遺伝子用の、オリゴヌクレオチドプローブを含む固体支持体は、フィルター、ポリ塩化ビニル皿、粒子、ビーズ、微粒子、またはシリコンもしくはガラスベースのチップなどとすることができる。このようなチップ、ウェーハ、および、ハイブリダイゼーション法は、いろいろな場所、例えばBeattieによって開示されているもの(国際公開第95/11755号パンフレット)から入手可能である。  [0065] Any hybridization assay format may be used to generate nucleic acid hybridization data, including solution-based and solid support-based assay formats. The solid support comprising oligonucleotide probes for the differentially expressed genes of the present invention can be a filter, a polyvinyl chloride dish, particles, beads, microparticles, or silicon or glass based chips, etc. . Such chips, wafers, and hybridization methods are available from various locations, such as those disclosed by Beattie (WO 95/11755).

[0066] オリゴヌクレオチドが、直接的に又は間接的に、共有結合的に又は非共有結合的に、結合され得るいかなる固体の表面でも、使用することができる。好ましい固体支持体は、高密度アレイ又はDNAチップである。これらは、アレイ上で予め決められた位置に特定のオリゴヌクレオチドプローブを含んでいる。予め決められた位置は、1分子以上のプローブを含むかもしれないが、その予め決められた位置内の各分子は同一の配列を持つ。そのようなあらかじめ決められた位置は、特徴(feature)と呼ばれる。例えば、単一の固体支持体上に2、10、100、1,000から10,000、100,000個まで、又は400,000個以上のこのような特徴があるかもしれない。固体支持体又はプローブが取り付けられる範囲は、約1平方センチメートル程度である。表1〜2の遺伝子に対応するプローブ、又は上記の関連出願からのプローブは、単一の又は複数の固体支持体に取り付けることができる。例えば、それらのプローブは、単一のチップ又は1つのチップセットを構成する複数のチップに取り付けることができる。  [0066] Any solid surface to which oligonucleotides can be attached, either directly or indirectly, covalently or non-covalently, can be used. Preferred solid supports are high density arrays or DNA chips. These contain specific oligonucleotide probes at predetermined positions on the array. The predetermined position may include more than one molecule of probe, but each molecule within that predetermined position has the same sequence. Such a predetermined position is called a feature. For example, there may be from 2, 10, 100, 1,000 to 10,000, 100,000, or more than 400,000 such features on a single solid support. The range in which the solid support or probe is attached is on the order of about 1 cm2. Probes corresponding to the genes in Tables 1-2 or from the above related applications can be attached to a single or multiple solid supports. For example, the probes can be attached to a single chip or to multiple chips that make up one chip set.

[0067] ビーズアッセイ叉はビーズの収集を含む、発現モニター用のオリゴヌクレオチドプローブアレイは、当該技術で知られているいかなる手法によっても作製し、使用することができる(例えば、Lockhartら、Nat.Biotechnol.(1996)14,1675−1680;McGallら、Proc.Nat.Acad.Sci.USA(1996)93,13555−13460)。そのようなプローブアレイは、表2に記載した2個若しくはそれ以上の遺伝子に相補的であるか、又はハイブリダイズする少なくとも2個以上のオリゴヌクレオチドを含む。例えば、そのようなアレイは、本明細書に記載される少なくとも2、3、4、5、6、7、8、9、10、20、30、50、70、100、500叉は1000個若しくはそれ以上の遺伝子に相補的であるか、又はハイブリダイズするオリゴヌクレオチドを含んでよい。  [0067] Oligonucleotide probe arrays for expression monitoring, including bead assays or bead collection, can be made and used by any technique known in the art (see, eg, Lockhart et al., Nat. Biotechnol. (1996) 14,1675-1680; McGall et al., Proc.Nat.Acad.Sci.USA (1996) 93,13555-13460). Such probe arrays include at least two or more oligonucleotides that are complementary to or hybridize to the two or more genes listed in Table 2. For example, such an array has at least 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 70, 100, 500 or 1000 or 1000 as described herein, or It may contain oligonucleotides that are complementary to or hybridize to further genes.

[0068] 表2の発現マーカー遺伝子の配列は、公共のデータベースにある。表1は、その配列の各々について、配列番号及びGenBank受入番号(NCBI RefSeqID)を提供し(www.ncbi.nlm.nih.gov/を参照)、その一部の遺伝子についてはクラスターのタイトルも提供している。
本出願の出願日現在でのGenBank中の遺伝子の配列は、明示により本明細書にそれらの全体が関連付けにより組み入れられ、さらに関連する配列、例えば、異なる長さの同一遺伝子からの配列、該遺伝子の変異体配列、多型配列、ゲノム配列及び異なる種(適当な場合、ヒトの対応物を含む)からの関連配列も同様である。
[0068] The sequences of expression marker genes in Table 2 are in public databases. Table 1 provides the SEQ ID NO and GenBank accession number (NCBI RefSeqID) for each of the sequences (see www.ncbi.nlm.nih.gov/) and also provides the cluster title for some of the genes is doing.
The sequences of genes in GenBank as of the filing date of the present application are expressly incorporated herein by reference in their entirety, and further related sequences, for example, sequences from the same gene of different length, The same applies to variant sequences, polymorphic sequences, genomic sequences and related sequences from different species (including human counterparts where appropriate).

[0069] 「バックグランド」又は「バックグランドシグナル強度」という用語は、ラベルされた標的核酸とオリゴヌクレオチドアレイの成分(例えば、オリゴヌクレオチドプローブ、対照プローブ、アレイ基質等)との間の非特異的な結合又はその他の相互作用から生じるハイブリダイゼーションシグナルを指す。バックグランドシグナルは、また、アレイ成分自身の内部蛍光によって生じるかもしれない。単一のバックグランドシグナルは、全アレイのために計算することができ、或いは、異なるバックグランドシグナルを各標的核酸のために計算してもよい。好ましい実施の形態では、バックグランドはアレイ中のプローブの最も低い5%〜10%に対する平均ハイブリダイゼーションシグナル強度として計算されるか、或いは、異なるバックグランドシグナルを各標的遺伝子のため計算する場合、各遺伝子のプローブの最も低い5%〜10%に対する平均ハイブリダイゼーションシグナル強度として計算される。当然ながら、当業者は、特定の遺伝子へのプローブがよくハイブリダイズして、標的配列に特異的に結合しているようにみえる場合は、それらをバックグランドシグナル計算に使用してはならないと理解するであろう。別法として、試料中に見出されるいかなる配列にも相補的でないプローブ(例えば、反対のセンスの核酸に指向されているプローブ、又は、試料が哺乳類の核酸であるとき、バクテリア遺伝子のような試料中に見出されない遺伝子に指向されているプローブ)へのハイプリダイゼーションによって生成されるハイブリダイゼーションシグナル強度として計算してもよい。また、バックグランドは、全くプローブを欠くアレイの領域によって生じる平均シグナル強度として計算されることもできる。  [0069] The term "background" or "background signal intensity" refers to non-specific between a labeled target nucleic acid and a component of an oligonucleotide array (eg, oligonucleotide probe, control probe, array substrate, etc.) Refers to a hybridization signal that results from free binding or other interactions. The background signal may also be caused by the internal fluorescence of the array component itself. A single background signal can be calculated for the entire array, or a different background signal can be calculated for each target nucleic acid. In a preferred embodiment, the background is calculated as the average hybridization signal intensity for the lowest 5% to 10% of the probes in the array, or if a different background signal is calculated for each target gene, each Calculated as the average hybridization signal intensity for the lowest 5% to 10% of the gene probes. Of course, those skilled in the art understand that if probes to a particular gene are well hybridized and appear to bind specifically to the target sequence, they should not be used for background signal calculations. Will do. Alternatively, a probe that is not complementary to any sequence found in the sample (eg, a probe directed to a nucleic acid of the opposite sense, or in a sample such as a bacterial gene when the sample is a mammalian nucleic acid) May be calculated as the intensity of the hybridization signal generated by hybridization to a probe directed to a gene not found in The background can also be calculated as the average signal intensity produced by the area of the array that lacks any probes.

[0070] 「特異的にハイブリダイズしている」叉は「特異的にハイブリダイズする」という表現は、配列が複雑な混合物(例えば、全細胞)のDNA又はRNAに存在するとき、ストリンジェントな条件下、特定の1又は複数の核酸配列に実質的に又はそれらだけに、ある分子が結合、二本鎖形成(duplexing)又はハイブリダイズすることを指す。  [0070] The expressions "specifically hybridize" or "specifically hybridize" are stringent when the sequences are present in the DNA or RNA of a complex mixture (eg, whole cells). Under conditions, refers to the binding, duplexing or hybridization of a molecule substantially or only to a specific nucleic acid sequence or sequences.

[0071] 本明細書で使用する場合、「プローブ」は、1種類以上の化学結合を通して、通常は相補的な塩基対形成を通して、通常は水素結合形成を通して、相補配列の標的核酸に結合することができる核酸として定義される。本明細書で使用する場合、プローブは天然型の塩基(すなわち、A、G、U、C又はT)又は修飾塩基(7−デアザグアノシン、イノシン等)を含む。加えて、それがハイブリダイゼーションを妨げない限り、プローブ中の塩基は、ホスホジエステル結合以外の結合でつながれていてもよい。したがって、プローブは、構成塩基がホスホジエステル結合ではなくペプチド結合でつながれているペプチド核酸であってもよい。  [0071] As used herein, a "probe" binds to a complementary sequence target nucleic acid through one or more chemical bonds, usually through complementary base pairing, usually through hydrogen bond formation. Defined as a nucleic acid capable of As used herein, a probe comprises a natural base (ie, A, G, U, C or T) or a modified base (7-deazaguanosine, inosine, etc.). In addition, the base in the probe may be linked by bonds other than phosphodiester bonds, as long as it does not interfere with hybridization. Thus, the probe may be a peptide nucleic acid in which the constituent bases are connected by peptide bonds rather than phosphodiester bonds.

核酸サンプル
[0072] 細胞又は組織試料は、インビトロ又はインビボで試験薬剤に曝される。培養細胞又は組織が使用されるとき、肝臓抽出物のような適当な哺乳動物の細胞抽出物を試験薬剤と共に加え、毒性を示すのに生体内変換を要するかもしれない薬剤を評価してもよい。好ましい様式では、動物又はヒト肝細胞の培養細胞又は初代単離株(primary isolate)が使われる。
Nucleic Acid Sample [0072] A cell or tissue sample is exposed to a test agent in vitro or in vivo. When cultured cells or tissues are used, an appropriate mammalian cell extract, such as liver extract, may be added with the test agent to evaluate agents that may require biotransformation to show toxicity. . In a preferred manner, cultured cells of animal or human hepatocytes or primary isolates are used.

[0073] 本発明によってアッセイされる遺伝子は、典型的にはmRNA又は逆転写されたmRNAの形態である。その遺伝子は、クローン化されてもよいし、されなくてもよい。その遺伝子は、増幅されてもよいし、されなくてもよい。クローニング及び/又は増幅は、集団内での遺伝子の表現にバイアスをかけるようには見えない。しかし、いくつかのアッセイでは、より少ないプロセッシングステップで使用できるので、材料としてpolyA+RNAを用いることが好ましいかもしれない。  [0073] The genes assayed by the present invention are typically in the form of mRNA or reverse transcribed mRNA. The gene may or may not be cloned. The gene may or may not be amplified. Cloning and / or amplification does not appear to bias the expression of genes within the population. However, in some assays it may be preferable to use polyA + RNA as the material since it can be used with fewer processing steps.

[0074] 当業者にとって明らかであるように、本発明の方法及びアッセイにおいて使われる核酸試料は、いかなる利用可能な方法又はプロセスによって調製されてもよい。トータルmRNAを単離する方法は、当業者に周知である。例えば、核酸の単離と精製の方法は、「生化学と分子生物学における研究室手法(第24巻) 核酸プローブとのハイブリダイゼーション:理論と核酸プローブ、P.Tijssen編、Elsevier Press,N.Y.(1993)」の第3章に詳しく記載されている。そのような試料は、RNA試料を含むが、興味ある細胞若しくは組織から単離されるmRNA試料から合成されるcDNAをも含む。また、そのような試料は、cDNAから増幅されるDNA、及びその増幅されたDNAから転写されるRNAをも含む。当業者は、ホモジネートが使われる前に、ホモジネートに存在するRNA分解酵素を阻害又は破壊することが、望ましいと認めるだろう。  [0074] As will be apparent to those skilled in the art, the nucleic acid samples used in the methods and assays of the invention may be prepared by any available method or process. Methods for isolating total mRNA are well known to those skilled in the art. For example, a method for isolating and purifying nucleic acids is described in “Laboratory Techniques in Biochemistry and Molecular Biology (Vol. 24) Hybridization with Nucleic Acid Probes: Theory and Nucleic Acid Probes, P. Tijsssen, Elsevier Press, N. Y. (1993) "is described in detail in Chapter 3. Such samples include RNA samples, but also include cDNA synthesized from mRNA samples isolated from cells or tissues of interest. Such samples also include DNA amplified from cDNA and RNA transcribed from the amplified DNA. One skilled in the art will recognize that it is desirable to inhibit or destroy the RNase present in the homogenate before it is used.

[0075] 生物学的試料は、どんな生物並びにインビトロで育てられた細胞(例えば、株化細胞及び組織培養細胞)からのいかなる生体組織、液体又は細胞のものでもよい。しばしば、その試料は、化合物、薬剤、医薬、医薬組成物、潜在的な環境汚染物質又は他の組成物に曝された組織又は細胞試料である。ある様式では、試料は、患者に由来する試料である「臨床試料」であるだろう。典型的な臨床試料には、痰、血液、血液細胞(例えば、白血球)、組織若しくは細針バイオプシーの試料、尿、腹膜液や胸水、或いはそれらからの細胞が含まれるが、これらには限定されない。生物学的試料は、組織学的目的で取られた凍結切片又はホルマリン固定切片のような、組織の切片をも含むかもしれない。  [0075] A biological sample can be of any biological tissue, fluid, or cell from any organism and cells grown in vitro (eg, cell lines and tissue culture cells). Often, the sample is a tissue or cell sample that has been exposed to a compound, drug, medicament, pharmaceutical composition, potential environmental contaminant or other composition. In one manner, the sample will be a “clinical sample” that is a sample derived from a patient. Typical clinical samples include, but are not limited to, sputum, blood, blood cells (eg, white blood cells), tissue or fine needle biopsy samples, urine, peritoneal fluid or pleural effusion, or cells therefrom. . Biological samples may also include sections of tissue, such as frozen sections or formalin fixed sections taken for histological purposes.

ハイブリダイゼーション
[0076] 核酸ハイブリダイゼーションは、相補的な塩基対形成を通してプローブとその相補的な標的とが安定した混成二本鎖を形成することができる条件下、プローブと標的核酸とを接触させることを単に含む。WO99/32660を参照。混成二本鎖を形成しない核酸は、その後、洗い流されて、ハイブリダイズした核酸が検出されるのにまかせる(典型的には、付着した検出可能なラベルの検出を通して)。核酸を含んだ緩衝液の温度を上昇させるか、又はその塩濃度を減少させることによって、核酸が変性すると一般に認められている。低いストリンジェンシー条件下では(例えば、低温及び/又は高塩濃度)、アニールした配列が完全に相補的でない場合でも、混成二本鎖(例えば、DNA:DNA、RNA:RNA又はRNA:DNA)が形成される。このように、ハイブリダイゼーションの特異性は、低いストリンジェンシーで減少する。逆に、より高いストリンジェンシー(例えば、より高温及び/又は低塩濃度)では、うまくゆくハイブリダイゼーションは、より少ないミスマッチしか許容しない。ハイブリダイゼーション条件を選択して、いかなる程度のストリンジェンシーをも提供できると当業者は認識するであろう。
Hybridization [0076] Nucleic acid hybridization involves contacting a probe with a target nucleic acid under conditions that allow the probe and its complementary target to form a stable hybrid duplex through complementary base pairing. Simply including. See WO99 / 32660. Nucleic acids that do not form hybrid duplexes are then washed away, allowing hybridized nucleic acids to be detected (typically through detection of attached detectable labels). It is generally accepted that nucleic acids are denatured by increasing the temperature of the buffer containing the nucleic acid or decreasing its salt concentration. Under low stringency conditions (eg, low temperature and / or high salt concentration), hybrid duplexes (eg, DNA: DNA, RNA: RNA or RNA: DNA) may be present even when the annealed sequences are not perfectly complementary. It is formed. Thus, the specificity of hybridization decreases with low stringency. Conversely, at higher stringency (eg, higher temperatures and / or lower salt concentrations), successful hybridization will tolerate fewer mismatches. One skilled in the art will recognize that hybridization conditions can be selected to provide any degree of stringency.

[0077] 好ましい実施の形態では、ハイブリダイゼーションを確実にするために低いストリンジェンシー(この場合、37℃で6×SSPET(0.005% Triton X−100))でハイブリダイゼーションを実行し、それから、ミスマッチした混成二本鎖を除去するためにより高いストリンジェンシー(例えば、37℃で1×SSPET)で、続く洗浄を実行する。続く洗浄はハイブリダイゼーション特異性の要求されるレベルが得られるまで、ストリンジェンシーをより高くしながら(例えば、37℃から50℃で0.25×SSPETまで低く落として)実行されるかもしれない。ストリンジェンシーは、ホルムアミドのような薬剤の添加によっても増加することができる。存在することがありえる様々な対照(例えば、発現レベル対照、規格化対照、ミスマッチ対照など)へのハイブリダイゼーションと試験プローブへのハイブリダイゼーションを比較することによって、ハイブリダイゼーション特異性を評価できる。  [0077] In a preferred embodiment, hybridization is performed at low stringency (in this case 6x SSPET (0.005% Triton X-100) at 37 ° C) to ensure hybridization, and then Subsequent washing is performed at higher stringency (eg, 1 × SSPET at 37 ° C.) to remove mismatched hybrid duplexes. Subsequent washing may be performed with higher stringency (eg, lowering from 37 ° C. to 50 ° C. to 0.25 × SSPET) until the required level of hybridization specificity is obtained. Stringency can also be increased by the addition of agents such as formamide. By comparing hybridization to various controls that may be present (eg, expression level controls, normalization controls, mismatch controls, etc.) and hybridization to the test probe, hybridization specificity can be assessed.

[0078] 一般に、ハイブリダイゼーション特異性(ストリンジェンシー)とシグナル強度の間にはトレードオフがある。このように、好ましい実施の形態では、一貫した結果を生む、そして、バックグランド強度を超えるシグナル強度を与える最も高いストリンジェンシーで、洗浄を実行する。このように、好ましい実施の形態では、ハイブリダイズしたアレイは、継続してより高いストリンジェンシー溶液で洗浄され、各洗浄の間に読み取られる。このようにでてきたデータセットの解析により、それ以上ではハイブリダイゼーションパターンが認めうるほどに変化せず、適切なシグナルを興味ある特定のオリゴヌクレオチドプローブのために適切なシグナルを提供する洗浄ストリンジェンシーが明らかとなる。  [0078] In general, there is a trade-off between hybridization specificity (stringency) and signal intensity. Thus, in a preferred embodiment, washing is performed at the highest stringency that yields consistent results and gives a signal intensity that exceeds background intensity. Thus, in a preferred embodiment, the hybridized array is continuously washed with higher stringency solution and read during each wash. Analysis of the resulting data set results in a wash stringency that no longer changes the hybridization pattern appreciably and provides the appropriate signal for the particular oligonucleotide probe of interest. Becomes clear.

キット
[0079] 本発明は、異なる組合せで、高密度のオリゴヌクレオチドアレイ、アレイに使用する試薬、シグナル検出とアレイ−プロセッシング機器、毒物学データベースと分析と上記のデータベース管理ソフトウェアを組合せたキットをさらに含む。例えば、このキットは、試験化合物の毒性反応を予測し、モデリングするために使用できる。
Kit [0079] The present invention further provides a kit combining different combinations, high density oligonucleotide arrays, reagents used in the array, signal detection and array-processing equipment, toxicology database and analysis and the above database management software. Including. For example, the kit can be used to predict and model the toxic response of a test compound.

[0080]このキットと共にパッケージしてよいデータベースは上述している。具体的には、このデータベースソフトウェアおよびパッケージする情報は、コンピュータ可読媒体に格納され、あるいはユーザーのローカルサーバーに転送されたデータベースを含むことができる。別のフォーマットでは、データベースおよびソフトウェア情報を、ウェブサイトなどのリモートの電子フォーマットで提供してよく、またそのアドレスをキット中にパッケージしてよい。  [0080] Databases that may be packaged with this kit are described above. Specifically, the database software and information to package may include a database stored on a computer readable medium or transferred to a user's local server. In another format, the database and software information may be provided in a remote electronic format, such as a website, and its address may be packaged in a kit.

[0081] マイクロアレイと使用するように設計されたデータベースとソフトウェアは、Balabanらの米国特許第6,229,911号(少数又は多数のマイクロアレイから収集され、インデックス化された表として保存されている情報を管理するためのコンピュータで実行される方法)及び第6,185,561号(遺伝子発現レベルデータを集め、追加の特性を加え、そしてそのデータをフォーマットし直して様々な質問に対する答えを出すデータマイニング能力を有する、コンピュータベースの方法)で議論されている。Cheeらの米国特許第5,974,164号には、参照配列にハイブリダイズする野生型及び変異型配列間のプローブ蛍光強度の差異に基づいて、核酸配列中の変異を同定するためのソフトウェアベースの方法が開示されている。  [0081] Databases and software designed for use with microarrays are described in Balaban et al., US Pat. No. 6,229,911 (information collected from a few or many microarrays and stored as an indexed table. Computer-implemented method for managing data) and 6,185,561 (data that collects gene expression level data, adds additional characteristics, and reformats the data to answer various questions) Computer-based methods with mining capabilities). US Pat. No. 5,974,164 to Chee et al. Describes a software base for identifying mutations in nucleic acid sequences based on differences in probe fluorescence intensity between wild-type and mutant sequences that hybridize to a reference sequence. This method is disclosed.

[0082] さらに説明することなく、当業者は以上の記載と以下の例示的な実施例を使って、本発明の化合物を作りそして利用することができ、請求項に記載の方法を実施できると考えられる。したがって、以下の実施例は、本発明の好適な実施の形態を特定的に指摘するものであり、開示の残りをいかようにも制限するもとは解釈されるべきではない。  [0082] Without further explanation, one of ordinary skill in the art, using the foregoing description and the following illustrative examples, can make and utilize the compounds of the present invention and perform the claimed methods. Conceivable. Accordingly, the following examples specifically point out preferred embodiments of the present invention and should not be construed as limiting in any way the remainder of the disclosure.

実施例1:RMA及びLPSを用いた毒性モデルの構築
[0083]様々な腎臓毒素を、当技術分野で以前に記載され、また上記の優先出願に以前に記載されている投与希釈剤、プロトコール、および投与法を使用して、様々な時点でSprague−Dawley雄ラットに投与する。使用するプロトコールの例示の通り、この毒素を投与し、動物を屠殺し、下記の時点で腎臓試料を採取する。
Example 1: Construction of Toxicity Model Using RMA and LPS [0083] Various kidney toxins have been described in the art as described previously in the art and previously described in the above priority applications, protocols, And Sprague-Dawley male rats at various time points using and dosing methods. As illustrated by the protocol used, the toxin is administered, the animals are sacrificed, and kidney samples are taken at the following time points.

動物の観察
[0084] 1.臨床観察−毎日2回、死亡率と瀕死性をチェックする。ケージ側面観察(皮膚と毛、目と粘膜、呼吸系、循環器系、自律神経系及び中心神経系、体性運動パターン及び行動パターン)。震え、痙攣、唾液分泌、下痢、傾眠、昏睡又は異常な行動や外見を含む、毒性の可能性のある兆候が起こったときに、発症の時間、程度及び持続時間も含めて記録した。
Observation of animals [0084] Clinical observation-Check mortality and mortality twice daily. Cage lateral observation (skin and hair, eyes and mucous membranes, respiratory system, circulatory system, autonomic and central nervous system, somatic movement pattern and behavior pattern). When signs of potential toxicity, including tremors, convulsions, salivation, diarrhea, somnolence, coma, or abnormal behavior or appearance, were recorded, including the time, extent, and duration of onset.

[0085] 2.身体検査−ランダム化の前、最初の処置前に、そして犠牲(屠殺)の前に。  [0085] 2. Physical examination-before randomization, before the first treatment and before sacrifice (slaughter).

[0086] 3.体重−ランダム化の前、最初の処置前に、そして犠牲の前に。  [0086] 3. Weight-before randomization, before first treatment and before sacrifice.

臨床病理
[0087] 1.頻度−死体解剖の前に。
Clinical pathology [0087] Frequency-before autopsy.

[0088] 2.動物の数−ての生き残っている動物。  [0088] 2. Number of animals-one surviving animal.

[0089] 3.出血手順−70%CO/30%O麻酔下にあるあいだに、眼窩洞に穴を開けて血液を得た。[0089] 3. In between under anesthesia bleeding procedure -70% CO 2/30% O 2, to obtain a blood pierced orbital sinus.

[0090] 4.血液試料の採取−血液学パラメーターの評価のために、約0.5mLの血液をEDTAチューブに集めた。臨床化学分析のために、約1mLの血液を血清セパレーターチューブに集めた。試験化合物/代謝産物の推定のために、約200μLの血漿を取得して、−80℃で凍結した。追加の2mLの血液を15mL円錐状ポリプロピレン・バイアルに収集して、直ちに3mLのTrizolを加えた。内容物を直ぐにボルテックス及び繰り返し逆さまにして混合した。それらチューブを液体窒素中で凍結して、−80℃で保存した。  [0090] 4. Collection of blood samples—About 0.5 mL of blood was collected in EDTA tubes for evaluation of hematology parameters. Approximately 1 mL of blood was collected in a serum separator tube for clinical chemistry analysis. Approximately 200 μL of plasma was obtained and frozen at −80 ° C. for test compound / metabolite estimation. An additional 2 mL of blood was collected in a 15 mL conical polypropylene vial and 3 mL of Trizol was immediately added. The contents were immediately vortexed and mixed upside down repeatedly. The tubes were frozen in liquid nitrogen and stored at -80 ° C.

終結手順
終結犠牲
[0091] 上記のタイムポイントで、ラットを計量し、身体検査して、断頭によって犠牲にし、失血させた。犠牲の約5分以内に動物を死体解剖した。機器は別々に滅菌し、使い捨てのものを各々の動物のために使用した。動物の死体解剖は、 委員会に認証された病理学者に承認された手順に従って実施された。
Termination Procedure Termination Sacrifice [0091] At the above time points, the rats were weighed, examined physically, sacrificed by decapitation and blood loss. Animals were autopsied within approximately 5 minutes of sacrifice. The instrument was sterilized separately and a disposable one was used for each animal. Animal autopsy was performed according to a procedure approved by a board-certified pathologist.

[0092] 終結犠牲まで生き残っていない動物は、死体解剖(もし瀕死であるなら、二酸化炭素仮死状態による安楽死に続いて)することなく捨てられた。瀕死又は死んでいるのが見つかった動物の死のおおよその時間を記録した。  [0092] Animals that did not survive until termination were sacrificed without autopsy (following euthanasia due to carbon dioxide asphyxia if moribund). The approximate time of death of animals that were drowned or found dead was recorded.

死後手順
[0093] すべての組織は、動物の死のおよそ5分以内に回収して、凍結した。組織は、約−80℃で保存するか、又は10%中性緩衝ホルマリンに保存した。
Postmortem Procedure [0093] All tissues were harvested and frozen within approximately 5 minutes of animal death. Tissues were stored at approximately -80 ° C or stored in 10% neutral buffered formalin.

組織収集及びプロセッシング
[0094] 肝臓
1.内側右葉−液体窒素で瞬時に凍結し、そして−80℃で保存した。
2.内側左葉−10%中性緩衝ホルマリン(NBF)に保存し、全体の及び顕微鏡での病理検査のために評価した。
3.外側左葉−液体窒素で瞬時に凍結し、そして−80℃で保存した。
Tissue collection and processing [0094] Liver Inner right lobe-instantly frozen in liquid nitrogen and stored at -80 ° C.
2. Medial left lobe—stored in 10% neutral buffered formalin (NBF) and evaluated for gross and microscopic pathological examination.
3. Outer left lobe—frozen instantly in liquid nitrogen and stored at −80 ° C.

[0095] 心臓
1.2つの心房の部分及び2つの心室の部分を含んでいる矢状横断面を10%NBFに保存した。残っている心臓を液体窒素で凍結して、−80℃で保存した。
[0095] Heart 1. A sagittal cross-section containing two atrial parts and two ventricular parts was preserved in 10% NBF. The remaining heart was frozen in liquid nitrogen and stored at -80 ° C.

[0096] 腎臓(両方)
1.左−半分に切開した。半分を10%NBFに保存して、そして残っている半分を液体窒素中で凍結して、−80℃で保存した。
2.右−半分に切開した。半分を10%NBFに保存して、そして残っている半分を液体窒素中で凍結して、−80℃で保存した。
[0096] Kidney (both)
1. An incision was made in the left-half. Half was stored in 10% NBF and the remaining half was frozen in liquid nitrogen and stored at -80 ° C.
2. An incision was made in the right-half. Half was stored in 10% NBF and the remaining half was frozen in liquid nitrogen and stored at -80 ° C.

[0097] 精巣(両方)−各精巣の矢状横断面を10%NBFに保存した。残っている精巣を液体窒素中、一緒に凍結して、−80℃で保存した。  [0097] Testes (both) —Sagittal cross sections of each testis were stored in 10% NBF. The remaining testis were frozen together in liquid nitrogen and stored at -80 ° C.

[0098] 脳(全部)−大脳半球及び間脳の横断面を10%NBFに保存し、そして脳の残りを液体窒素中で凍結して−80℃で保存した。  [0098] Brain (all) —Cross section of cerebral hemisphere and diencephalon was stored in 10% NBF, and the rest of the brain was frozen in liquid nitrogen and stored at −80 ° C.

[0099] マイクロアレイ試料の調製は、アフイメトリックス ジーンチップ発現解析マニュアル(Affymetrix GeneChip Expression Analysis Manual;Affymetrix,Inc.Santa Clara,CA)に記載されているプロトコールに従って、若干修正した上で実施した。凍結した組織は、Spex Certiprep 6800 Freezer Millを使用して、粉末へすりつぶした。トータルRNAは、製造業者のプロトコールを利用してTrizol(GibcoBRL)で抽出した。Oligotex mRNA Midiキット(Qiagen)を使用してmRNAを単離し、エタノール沈殿を行った。SuperScript Choice System(Invitrogen,Carlsbad CA)を使用して、mRNAから二本鎖cDNAを生成させた。第1鎖cDNA合成をT7−(dT24)オリゴヌクレオチドでプライムした。cDNAをフェノール−クロロホルムで抽出して、終濃度1μg/mLにエタノール沈殿した。2μgのcDNAからAmbion’s T7 MegaScript invitro Transcription Kitを使用してcRNAを合成した。  [0099] The microarray sample was prepared with some modifications according to the protocol described in the Affymetrix GeneChip Expression Analysis Manual (Affymetrix GeneInc. Santa Clara, CA). Frozen tissue was ground into a powder using a Spex Certiprep 6800 Freezer Mill. Total RNA was extracted with Trizol (GibcoBRL) using the manufacturer's protocol. MRNA was isolated using an Oligotex mRNA Midi kit (Qiagen) and ethanol precipitated. Double-strand cDNA was generated from mRNA using the SuperScript Choice System (Invitrogen, Carlsbad CA). First strand cDNA synthesis was primed with T7- (dT24) oligonucleotide. The cDNA was extracted with phenol-chloroform and ethanol precipitated to a final concentration of 1 μg / mL. CRNA was synthesized from 2 μg of cDNA using Ambion's T7 MegaScript in vitro Transcribation Kit.

[0100] cRNAをビオチンラベルするために、ヌクレオチドBio−11−CTPとBiol6−UTP(Enzo Diagnostics)を反応液に加えた。6時間、37℃のインキュベーションに続いて、不純物をRneasy Mini kitプロトコール(Qiagen)に従って、ラベルされたcRNAから取り除いた。cRNAを94℃で35分間、断片化した(200mM Tris−酢酸、pH8.1、500mM 酢酸カリウム、150mM 酢酸マグネシウムからなるフラグメンテーション緩衝液)。アフィメトリックスプロトコールに従って、55μgの断片化したcRNAを45℃のハイブリダイゼーション・オーブンの中で、60rpmで24時間、アフィメトリックスラットアレイセットでハイブリダイズした。チップを洗浄して、Affymetrix fluidics station中、ストレプトアビジンフィコエリトリン(SAPE)(Molecular Probe)で染色した。染色を増幅するために、抗ストレプトアビジン ビオチン化抗体(Vector Laboratories)染色ステップを間に挟んで、SAPE溶液を2回加えた。プローブアレイへのハイブリダイゼーションは、蛍光測定スキャンニング(Hewlett Packard Gene Array Scanner)によって検出した。データは、Affymetrix GeneChipバージョン3.0及びExpression Data Mining(EDMT)ソフトウェア、GeneExpressデータベース及びS−Plus統計分析ソフトウェア(Insightful Corp)を使用して解析した。  [0100] Nucleotides Bio-11-CTP and Biol6-UTP (Enzo Diagnostics) were added to the reaction to label the cRNA with biotin. Following a 6 hour incubation at 37 ° C., impurities were removed from the labeled cRNA according to the Rneasy Mini kit protocol (Qiagen). cRNA was fragmented at 94 ° C. for 35 minutes (fragmentation buffer consisting of 200 mM Tris-acetic acid, pH 8.1, 500 mM potassium acetate, 150 mM magnesium acetate). According to the Affymetrix protocol, 55 μg of fragmented cRNA was hybridized with Affymetrix rat array set in a 45 ° C. hybridization oven at 60 rpm for 24 hours. The chips were washed and stained with streptavidin phycoerythrin (SAPE) (Molecular Probe) during the Affymetrix fluidics station. To amplify the staining, the SAPE solution was added twice with an anti-streptavidin biotinylated antibody (Vector Laboratories) staining step in between. Hybridization to the probe array was detected by fluorimetric scanning (Hewlett Packard Gene Array Scanner). Data were analyzed using Affymetrix GeneChip version 3.0 and Expression Data Mining (EDMT) software, GeneExpress database and S-Plus statistical analysis software (Insightful Corp).

RMAとPLSのアルゴリズムを用いた、毒性マーカーと毒性モデルの構築の確認
[00101]RMA/PLSモデルを下記の通り構築する。1種または複数の検査から得られたDNAマイクロアレイデータから、RMA変化倍率発現値の行列を作成する。こうした値を、例えば、次の式:T(PMij)=e+a+εijを使用して対数尺度の線形加法モデルを作成するIrizarry等(Nucl Acids Res31(4):e15,2003)の方法に従って作成する。Tは、バックグラウンドを補正し、正規化し、かつPM(パーフェクトマッチ)強度を対数尺度に変換する変換値を表す。eは、アレイi=1−1上で見出されるlog2尺度の発現値を表し、aは、プローブj=1−Jに関する対数尺度の親和作用を表し、εijは、誤差を表す(様々な強度で結合するプローブを使用する場合の分散の差を補正するため)。
Confirmation of Toxicity Markers and Toxicity Model Construction Using RMA and PLS Algorithm [00101] The RMA / PLS model is constructed as follows. A matrix of RMA change magnification expression values is created from DNA microarray data obtained from one or more tests. Such values can be derived, for example, from Irazary et al. (Nucl Acids Res31 (4): e15,2003) using the following formula: T (PM ij ) = e i + a j + ε ij Create according to the method. T represents a converted value that corrects the background, normalizes, and converts PM (perfect match) intensity to a logarithmic scale. e i represents the log2 scale expression value found on the array i = 1−1, a j represents the log scale affinity for probe j = 1−J, and ε ij represents the error (various To compensate for differences in dispersion when using probes that bind with high intensity).

[00102]RMA変化倍率行列では、行が個々の断片を表し、列が個々の試料である。次いで、ビヒクルコホートメディアン行列を計算するが、この行列では、行が断片を表し、列がビヒクルコホートを表し、検査/時点の組合せそれぞれに対して1つのコホートである。この行列における値は、こうしたコホート内の試料にわたるメディアンRMA発現値である。次に、正規化RMA発現値の行列を作成するが、この行列では、行が個々の断片を表し、列が個々の試料である。正規化RMA値は、RMA値から、時間を一致させたビヒクルコホートに対応するビヒクルコホートメディアン行列からの値を引いたものである。次いで、PLSモデリングを正規化RMA行列(ある断片を以下に記載の通りに取得することによる部分集合)に適用し、−1=非毒性、+1=毒性である監視スコアベクトルを従属変数として、また正規化RMA行列の行を独立変数として使用する。PLSは、1連のPLS成分を計算することによって機能するが、ここで各成分は断片値の加重線形結合である。PLS成分を計算するためには、非線形反復部分最小二乗法が使用される。  [00102] In the RMA change rate matrix, rows represent individual fragments and columns are individual samples. A vehicle cohort median matrix is then calculated, where the rows represent fragments and the columns represent the vehicle cohort, one cohort for each test / timepoint combination. The values in this matrix are the median RMA expression values across the samples in such a cohort. Next, a matrix of normalized RMA expression values is created, where the rows represent individual fragments and the columns are individual samples. The normalized RMA value is the RMA value minus the value from the vehicle cohort median matrix corresponding to the time matched vehicle cohort. PLS modeling is then applied to the normalized RMA matrix (subset by obtaining a fragment as described below), with the surveillance score vector -1 = non-toxic, + 1 = toxic as the dependent variable, and Use the row of the normalized RMA matrix as the independent variable. PLS works by calculating a series of PLS components, where each component is a weighted linear combination of fragment values. A non-linear iterative partial least squares method is used to calculate the PLS component.

[00103]断片を選択するために、ビヒクルコホート平均行列を作成するが、この行列では、行が断片を表し、列がビヒクルコホートを表し、検査/時点の組合せそれぞれに対して1種のコホートである。この行列における値は、こうしたコホート内の試料にわたる平均RMA発現値である。次いで、処理コホート平均行列を作成するが、この行列では、行が断片を表し、列が処理(ビヒクルでない)コホートを表し、検査/時点/化合物/用量の組合せそれぞれに対して1つのコホートである。この行列における値は、こうしたコホート内の試料にわたる平均RMA発現値である。次に、処理コホート変化倍率の行列を作成するが、この行列では、行が断片を表し、列が処理コホートを表し、検査/時点/化合物/用量の組合せそれぞれに対して1つのコホートである。この行列における値は、処理コホート平均行列における値から、時間を一致させた適切なビヒクルコホートに対応するビヒクルコホート平均行列における値を引いたものである。その後、処理コホートp値行列を作成するが、この行列では、行が断片を表し、列が処理コホートを表し、検査/時点/化合物/用量の組合せそれぞれに対して1つのコホートである。この行列における値は、処理コホート平均値を、時間を一致させた適切なビヒクルコホートに対応するビヒクルコホート平均値と比較する、2試料のt検定に基づくp値である。この行列を、0.05未満であり(1としてコード)、または0.05を超える(0としてコード)p値に基づくバイナリコードに変換する。  [00103] To select the fragments, a vehicle cohort mean matrix is created, where the rows represent the fragments and the columns represent the vehicle cohort, with one cohort for each test / timepoint combination. is there. The values in this matrix are the mean RMA expression values across the samples in such a cohort. A treatment cohort mean matrix is then created, where the rows represent the fragments and the columns represent the treatment (non-vehicle) cohort, one cohort for each test / time point / compound / dose combination. . The values in this matrix are the mean RMA expression values across the samples in such a cohort. Next, a matrix of treatment cohort rates of change is created, where the rows represent fragments and the columns represent the treatment cohort, one cohort for each test / time point / compound / dose combination. The values in this matrix are the values in the processing cohort average matrix minus the values in the vehicle cohort average matrix that correspond to the appropriate vehicle cohort matched in time. A treatment cohort p-value matrix is then created, where the rows represent the fragments and the columns represent the treatment cohort, one cohort for each test / time point / compound / dose combination. The values in this matrix are p-values based on a two-sample t-test that compares the treatment cohort mean to the vehicle cohort mean corresponding to the appropriate time matched vehicle cohort. This matrix is converted to a binary code based on p-values less than 0.05 (code as 1) or greater than 0.05 (code as 0).

[00104]バイナリ処理コホートp値行列の行の和を計算するが、この行列では、その行の和は各断片に対する「遺伝子調節スコア」を表し、時間を一致させたそのビヒクルコホートと比較して、断片が差次的調節(上方または下方調節)を示した処理コホートの総数を提示する。次いで、PLSモデリングおよび2/3 / 1/3交差検定を、上位N個の断片をその調節スコアに従って取得すること、NおよびPLS成分の数を変更すること、ならびに組合せそれぞれに対するモデル成功率を記録することに基づいて実施する。Nは、交差検定による誤差率を最小限に抑えるポイントとなるように選択される。PLSモデルでは、こうしたN個の断片のそれぞれが、このモデルにおける断片の有用性または予測能力に対応するPLS重み(PLSスコア)を受け取る(腎臓の一般毒性モデルに関するPLSスコアの例示的リストについては表2を参照のこと)。  [00104] Compute the sum of the rows of the binary processing cohort p-value matrix, where the sum of the rows represents the "gene regulation score" for each fragment, compared to the vehicle cohort that is time matched Presents the total number of treatment cohorts in which the fragment showed differential regulation (up or down regulation). Then, PLS modeling and 2/3/1/3 cross-validation, obtaining the top N fragments according to their regulatory scores, changing the number of N and PLS components, and recording the model success rate for each combination Implement based on what to do. N is selected to be a point that minimizes the error rate due to cross-validation. In the PLS model, each of these N fragments receives a PLS weight (PLS score) that corresponds to the usefulness or predictive ability of the fragment in this model (see Table for an exemplary list of PLS scores for the kidney general toxicity model). 2).

実施例2:試験薬剤の少なくとも1種の毒作用を予測する方法
[00105]ある試験薬剤または化合物で処理した動物からの試料が少なくとも1種の毒作用または毒性反応を示すか否かを判定するために、上記の実施例1に記載の通り、その薬剤に曝された細胞または組織試料からRNAを調製し、DNAマイクロアレイとハイブリッド形成させる。その核酸ハイブリダイゼーションデータから、以下の式に従って、その試料に関する予測スコアを計算し、毒性参照データベースからの参照スコアと比較する。試料予測スコア=ΣwFCi。「i」は、評価すべき遺伝子発現プロファイルにおける各遺伝子のインデックスナンバーである。「w」は、各遺伝子に関するPLS重み(またはPLSスコア、腎臓の一般毒性モデルのPLSスコアの例示リストに関する表2を参照)である。「RFCi」は、(上記の)試料からの遺伝子発現データの正規化RMA行列から求めた、第i番目の遺伝子に関するRMA 変化倍率である。PLS重みにRMA 変化倍率を掛けると、各遺伝子に関する遺伝子調節スコアが得られ、その個々の遺伝子すべてに関する調節スコアを合計すると、その試料に関する予測スコアが得られる。
Example 2: Method for predicting at least one toxic effect of a test agent [00105] Determining whether a sample from an animal treated with a test agent or compound exhibits at least one toxic or toxic response For this purpose, RNA is prepared from a cell or tissue sample exposed to the drug and hybridized with a DNA microarray as described in Example 1 above. From the nucleic acid hybridization data, a predicted score for the sample is calculated according to the following formula and compared to a reference score from a toxicity reference database. Sample prediction score = Σw i R FCi . “I” is the index number of each gene in the gene expression profile to be evaluated. “W i ” is the PLS weight for each gene (or PLS score, see Table 2 for an exemplary list of PLS scores for the kidney general toxicity model). “R FCi ” is the RMA change rate for the i-th gene, determined from the normalized RMA matrix of gene expression data from the sample (above). Multiplying the PLS weights by the RMA change rate gives a gene regulation score for each gene, and summing the regulation scores for all its individual genes gives a predicted score for that sample.

[00106]品質管理(QC)チェックとして、それぞれの入力検査について、平均相関評価を実施する。RMA行列を作成した後(試料ごとの遺伝子)、試料相互のPearson相関行列を計算する。この行列は、試料ごとのものである。各試料の行列の行について、対角項(常に1である)を除いた、行列のその行におけるすべての相関値の平均を計算する。この平均は、その試料に関する平均相関である。その平均相関がある閾値(例えば0.90)未満の場合、潜在的異常値として試料にフラグをたてる。このプロセスを検査の各行(試料)について反復する。平均相関QCチェックによってフラグをたてられた異常値を、このプロセスにおける下流での任意の正規化、予測、または化合物類似の工程から外す。  [00106] As a quality control (QC) check, an average correlation evaluation is performed for each input test. After creating the RMA matrix (gene for each sample), the Pearson correlation matrix between samples is calculated. This matrix is for each sample. For each sample matrix row, calculate the average of all correlation values in that row of the matrix, excluding the diagonal term (always 1). This average is the average correlation for that sample. If the average correlation is below a certain threshold (eg, 0.90), the sample is flagged as a potential outlier. This process is repeated for each row (sample) of inspection. Outliers flagged by the mean correlation QC check are removed from any normalization, prediction, or compound-like steps downstream in this process.

[00107]ある毒性モデルに関する毒性予測スコアのカットオフ値を確立するため、訓練セットにおけるすべての毒性および非毒性試料からのスコアを使用して、可能な各スコアのカットオフ値に関する真陽性率および偽陽性率を計算する。これによりROC曲線が作成され、この曲線を使用して、約5%の偽陽性率に相当する、ROC曲線における点でカットオフスコアを設定する。例えば、表2の腎臓毒性モデルでは、カットオフ予測スコアは約0.318である。試料スコアが約0.318以上の場合、試験化合物への曝露の後、その試料は毒性反応を示すと予測することができる。試料スコアが0.318を下回る場合、その試料は毒性反応を示さないと予測することができる。  [00107] To establish a cutoff value for the toxicity prediction score for a toxicity model, using scores from all toxic and non-toxic samples in the training set, the true positive rate for the cutoff value for each possible score and Calculate the false positive rate. This creates an ROC curve that is used to set a cutoff score at a point in the ROC curve that corresponds to a false positive rate of about 5%. For example, in the nephrotoxicity model of Table 2, the cut-off prediction score is about 0.318. If the sample score is about 0.318 or greater, after exposure to the test compound, the sample can be predicted to show a toxic response. If the sample score is below 0.318, it can be predicted that the sample will not show a toxic response.

[00108]毒性反応を予測することができない各遺伝子に対して−1のスコアを設定することにより、また毒性反応を予測することができる各遺伝子に対して+1のスコアを設定することにより、このモデルを訓練することができる。RMA/PLSモデルの交差検定を、化合物ドロップ法(compound−drop method)によって、また2/3:1/3法によって実施してよい。化合物ドロップ法では、ある特定の試験化合物で処理した動物からの試料データをあるモデルから取り出し、このモデルにより毒性を予測できるかどうかを、全データセットを含むモデルと比較する。2/3:1/3法では、モデルにおけるランダムな3分の1の遺伝子からの遺伝子発現情報を取り出し、この部分集合モデルにより毒性を予測できるかどうかを、全データセットを含むモデルと比較する。  [00108] By setting a score of -1 for each gene for which a toxic response cannot be predicted and by setting a score of +1 for each gene for which a toxic response can be predicted The model can be trained. Cross validation of the RMA / PLS model may be performed by the compound-drop method and by the 2/3: 1/3 method. In the compound drop method, sample data from animals treated with a particular test compound is taken from a model and compared to a model containing the entire data set to determine if this model can predict toxicity. The 2/3: 1/3 method takes gene expression information from a random one-third gene in the model and compares whether this subset model can predict toxicity with a model that includes the entire data set .

[00109]化合物類似を以下のように評価する。上記のものと同じようにして、検査/時点/化合物/用量の組合せそれぞれに対するコホート変化倍率ベクトルを計算する。このベクトルを、PLS予測モデルで使用する断片のみにする。次に参照データベース内の各コホートベクトルを用いて、そのコホート変化倍率ベクトルに関するPearson相関を計算する(これもPLS予測モデルで使用する断片のみにする)。最後に、こうしたPearson相関を最高から最低までに分類し、その結果を報告する。  [00109] Compound similarity is evaluated as follows. In the same manner as described above, the cohort change rate vector for each test / time point / compound / dose combination is calculated. This vector is only the fragment used in the PLS prediction model. Next, using each cohort vector in the reference database, a Pearson correlation for the cohort change magnification vector is calculated (this is also only a fragment used in the PLS prediction model). Finally, classify these Pearson correlations from highest to lowest and report the results.

[00110]少なくとも1種の毒作用を予測する方法の結果に関係する情報またはデータを含むレポートを作成してよい。このレポートは、データベースからの少なくとも1種の毒性参照予測スコアとの少なくとも1種の試料予測スコアの比較によって予測される毒作用に関係する情報を含むことができる。このレポートは、データの完全性など、核酸ハイブリダイゼーションデータに関する情報、ならびに核酸ハイブリダイゼーションデータに注釈を付けるのに使用する情報など、データベースのユーザーおよび本発明の方法によって入力された情報を提供することもできる。作成してよい毒性レポートの非限定的な一例についてはPCT US第02/22701号を参照のこと。  [00110] A report may be generated that includes information or data related to the results of a method for predicting at least one toxic effect. The report can include information related to toxic effects predicted by comparison of at least one sample prediction score with at least one toxicity reference prediction score from a database. This report provides information entered by the database user and the method of the present invention, such as information about nucleic acid hybridization data, such as data integrity, and information used to annotate nucleic acid hybridization data. You can also. See PCT US 02/22701 for a non-limiting example of a toxicity report that may be generated.

実施例3:あるプラットホームからのRMAデータを別のものに変換すること
[00111]アルゴリズムを開発して、第1のタイプのマイクロアレイからのプローブ強度データを第2のタイプのマイクロアレイのRMAデータに変換した。これは、RMA/PLS予測モデルで使用することが望まれるマイクロアレイのタイプを選択する自由が顧客に提供されるので、顧客にとって有益である。これは、市場において最新のマイクロアレイであることが多い。資金および資源を拡大して、製造中止になったマイクロアレイ上で構築された統計モデルを再構築する必要がないので、このアルゴリズムは、マイクロアレイデータ上でRMA/PLS統計モデルを構築する集団にとって有益である。
Example 3: Converting RMA data from one platform to another [00111] Developing an algorithm to convert probe intensity data from a first type of microarray to RMA data of a second type of microarray did. This is beneficial to the customer as it gives the customer the freedom to select the type of microarray that is desired to be used in the RMA / PLS prediction model. This is often the latest microarray on the market. This algorithm is beneficial for populations building RMA / PLS statistical models on microarray data, as there is no need to expand funds and resources to reconstruct statistical models built on discontinued microarrays. is there.

[00112]開発された変換アルゴリズムを、Affymetrix GeneChip(登録商標)ラットRAE2.0マイクロアレイからAffymetrix GeneChip(登録商標)ラットRGU34 Aマイクロアレイのデータまで、データ上で使用することができる。この変換により、Affymetrix RGU34 Aマイクロアレイプラットホーム上で構築されたRMA/PLS毒性ゲノミクスモデルを使用して、RAE2.0マイクロアレイプラットホーム上で作成された顧客データを予測することも可能となる。この変換アルゴリズムを、米国特許仮出願第60/559949号に記載され、本明細書に参照により組み入れられる肝臓毒性モデルを使用して試験した。  [00112] Developed transformation algorithms can be used on data, from Affymetrix GeneChip® rat RAE2.0 microarrays to Affymetrix GeneChip® rat RGU34 A microarray data. This transformation also allows for the prediction of customer data generated on the RAE 2.0 microarray platform using the RMA / PLS toxicity genomics model built on the Affymetrix RGU34 A microarray platform. This conversion algorithm was tested using the liver toxicity model described in US Provisional Patent Application No. 60/559949 and incorporated herein by reference.

[00113]変換アルゴリズムの使用への第1工程は、マイクロアレイ断片をマッピングすることである。肝臓毒性モデルを含むRGU34 Aマイクロアレイ断片をRAE2.0マイクロアレイに位置付けた。肝臓毒性モデルは、1,100個のAffymetrix GeneChip(登録商標)RGU34 Aマイクロアレイ断片に基づくものである。このモデルにおける1,100個の断片のうち、907個は、Affymetrixにより、RAE2.0マイクロアレイにおける断片と一致することが示唆された。本明細書に参照により組み入れられる、Affymetrix社の「User’s Guide to Product Comparison Spreadsheets」を参照のこと。別の105個の断片を、同一のRefSeq IDを共有している断片に位置付け、また55個の断片を、同一のUnigeneクラスターに位置付けられる断片に位置付けた。1067個の位置付け用の断片は1053個に減少した。1053個の位置付けられた断片は、16個のRGU34 Aおよび11個のRAE2.0プローブを提示した。RAE2.0マイクロアレイに位置付けられなかった47個の断片を、すべての試料に対して0のRMA 変化倍率に割り当て、この断片は予測に貢献しなかった。  [00113] The first step to the use of the conversion algorithm is to map the microarray fragments. The RGU34 A microarray fragment containing the liver toxicity model was mapped to the RAE2.0 microarray. The liver toxicity model is based on 1,100 Affymetrix GeneChip® RGU34 A microarray fragments. Of the 1,100 fragments in this model, 907 were suggested by Affymetrix to match the fragments in the RAE2.0 microarray. See Affymetrix's “User's Guide to Product Comparison Spreadsheets”, incorporated herein by reference. Another 105 fragments were located in the fragment sharing the same RefSeq ID, and 55 fragments were located in the fragments located in the same Unigene cluster. 1067 positioning fragments were reduced to 1053. The 1053 positioned fragments presented 16 RGU34 A and 11 RAE2.0 probes. The 47 fragments that were not located in the RAE2.0 microarray were assigned a RMA change factor of 0 for all samples and this fragment did not contribute to the prediction.

[00114]マイクロアレイ断片を位置付けた後、訓練試料を選択して、変換モデル重みを計算する。本発明者らは、シグナル強度に関する大きな四分位数範囲にわたる試料について、Gene Logic社のToxExpress(登録商標)参照データベース、すなわちAffymetrix RGU34 Aプラットホームにおいて構築されるデータベースを検索した。本発明者らによりこの試料選択方法は、ヒト試料変換アルゴリズムの開発において信頼できるものであると以前に判定されているので、大きな変数空間にわたる試料を選択した。試料はΣ(Max(Xij)−Min(Xij))を最大限にした。式中、iは遺伝子をさし、jは試料をさす。[00114] After locating the microarray fragment, a training sample is selected and a transform model weight is calculated. We searched Gene Logic's ToxExpress® reference database, a database built on the Affymetrix RGU34 A platform, for samples over a large quartile range for signal intensity. Since we have previously determined that this sample selection method is reliable in the development of human sample conversion algorithms, we selected samples over a large variable space. The sample maximized Σ i (Max (X ij ) −Min (X ij )). In the formula, i indicates a gene and j indicates a sample.

[00115]本発明者らは、試料サイズ計算がおよそ100個のマイクロアレイの試料採取で安定であることを見出した。この理由で、ラット肝臓組織からの100個の化合物、およびビヒクルからなる訓練セットを選択した。  [00115] The inventors have found that the sample size calculation is stable with sampling of approximately 100 microarrays. For this reason, a training set consisting of 100 compounds from rat liver tissue and vehicle was selected.

[00116]100個の訓練試料を使用して、変換アルゴリズムにおける重みを訓練した。この工程は、変換の定量的側面を提供するので重要である。重み訓練を、プローブ値を独立変数として、またRMA発現を従属変数の和として用いた多重回帰分析に基づいて実施した。  [00116] 100 training samples were used to train weights in the transformation algorithm. This step is important because it provides a quantitative aspect of the conversion. Weight training was performed based on multiple regression analysis using probe values as independent variables and RMA expression as the sum of dependent variables.

[00117]訓練された変換アルゴリズムを使用して、試験試料を評価した。多重回帰モデルを、11個のパーフェクトマッチプローブ強度に基づいて構築し、RAE2.0プローブ値の加重和から、予測されるRGU34発現値を作成した。各試験アッセイを10(対数尺度)の平均プローブ強度に調整した。使用する変換アルゴリズムは、下記の式から得られる。
RGU34=βio+ΣβijLOG(Xij RAE2.0/S)
式中、Yは、断片に対するRGU34 RMA発現値であり、i=1...1053、j=1...11の場合のXij RAE2.0は、RAE2.0マイクロアレイにおけるマーカー遺伝子に対するパーフェクトマッチプローブ強度値であり、Sは、チップスケールファクターΣijij RAE2.0/nである。プローブ強度は、30の最小強度値まで下げた。
[00117] Test samples were evaluated using a trained transformation algorithm. A multiple regression model was constructed based on 11 perfect match probe intensities and a predicted RGU34 expression value was generated from the weighted sum of RAE2.0 probe values. Each test assay was adjusted to an average probe intensity of 10 (log scale). The conversion algorithm used is obtained from the following equation.
Y i RGU34 = β io + Σβ ij LOG (X ij RAE2.0 / S)
Where Y is the RGU34 RMA expression value for the fragment, i = 1. . . 1053, j = 1. . . X ij RAE2.0 in case of 11 is the perfect match probe intensity value for the marker gene in the RAE2.0 microarray, and S is the chip scale factor Σ ij X ij RAE2.0 / n. The probe intensity was lowered to a minimum intensity value of 30.

[00118]多重回帰モデルの使用の代替手法は、RAE2.0データをRGU34 RMAデータに変換するために存在する。プローブ値に関する非線形回帰、ならびにRAE2.0プローブのRGU34 Aプローブとの正準相関を使用することができる。RAE2.0マイクロアレイにおけるRMA値を計算し、次いでRGU34 A RMA値に基準化またはその変位値に正規化することができる。さらに、本実施例で使用する多重回帰分析ではミスマッチプローブを考慮に入れないが、ミスマッチプローブを考慮に入れる分析を使用することができる。  [00118] An alternative approach to using multiple regression models exists to convert RAE2.0 data to RGU34 RMA data. Non-linear regression on probe values as well as canonical correlation of RAE2.0 probe with RGU34 A probe can be used. RMA values in the RAE2.0 microarray can be calculated and then normalized to the RGU34 A RMA value or normalized to its displacement value. Furthermore, the multiple regression analysis used in this example does not take into account mismatched probes, but an analysis that takes into account mismatched probes can be used.

[00119]肝臓予測モデルを使用して、RGU34マイクロアレイからの試験データの予測結果を、変換されたRAE2.0アレイデータから導き出した試験データと比較した。RGU34アレイ結果と変換されたRAE2.0アレイ結果との間の整合性は非常に高い。表3は、RGU34 RMAデータおよびRAE2.0変換RMAデータを使用した化合物に対する試料の総数の中で、毒性と予測される化合物あたりの試験試料の数を提供する。アミトリプチリン、エストラジオール、アミオダロン、ジフルニサル、フェノバルビタール、ダイオキシン、エチオニン、およびLPSを試験毒物として選択した。クロフィブラートはラット特異的毒物であるので、これを選択した。メトホルミン、ロシグリタゾン、クロルフェニラミン、およびストレプトマイシンを試験陰性対照として選択した。このラット特異的毒物およびすべての試験される陰性対照により、非毒性が正確に予測された。  [00119] The liver prediction model was used to compare the prediction results of the test data from the RGU34 microarray with the test data derived from the transformed RAE2.0 array data. The consistency between the RGU34 array results and the transformed RAE2.0 array results is very high. Table 3 provides the number of test samples per compound predicted to be toxic among the total number of samples for compounds using RGU34 RMA data and RAE2.0 converted RMA data. Amitriptyline, estradiol, amiodarone, diflunisal, phenobarbital, dioxin, ethionine, and LPS were selected as test toxicants. Clofibrate was chosen because it is a rat-specific toxicant. Metformin, rosiglitazone, chlorpheniramine, and streptomycin were selected as test negative controls. This rat-specific toxicant and all tested negative controls accurately predicted non-toxicity.

実施例4:データベース
[00120]RMA/PLS毒性予測モデルの集まりからなる、ToxShield(商標)Suiteと呼ばれるウェブベースのソフトウェア予測モデリングシステムを創製した。肝臓RMA/PLS予測モデルを構築して、ユーザーが、未知の化合物または試験化合物に対する様々な毒性反応および機械的反応を同定および分類することを可能にした。このモデルは、一般毒性、壊死、脂肪症、大滴性脂肪症、微小胞脂肪症、胆汁うっ滞、肝炎、発癌性、遺伝毒性による発癌性、非遺伝毒性による発癌性、ラット特異的非遺伝毒性による発癌性、ペルオキシソーム増殖、および誘発物質/肝腫大を含めて、指標となる多種多様の病態および徴候を提示する。毒性モデルの結果は、試験化合物または未知の化合物の詳細な分類を提示し、その機械的情報を推測することができる。このソフトウェアシステムの一環として利用可能な現在のモデルは、肝臓毒性に関係しているが、限定されるものではないが、肝臓初代細胞培養物、腎臓、心臓、脾臓、骨髄、および脳を含めて、他の器官の特異的毒性に関するモデルを使用することができる。
Example 4: Database [00120] A web-based software predictive modeling system called ToxShield ™ Suite consisting of a collection of RMA / PLS toxicity predictive models was created. A liver RMA / PLS prediction model was constructed to allow the user to identify and classify various toxic and mechanical responses to unknown or test compounds. This model includes general toxicity, necrosis, steatosis, macrodropleosis, microvesicular steatosis, cholestasis, hepatitis, carcinogenicity, carcinogenicity due to genotoxicity, carcinogenicity due to nongenotoxicity, rat-specific non-inheritance A wide variety of indicative pathologies and signs are presented, including carcinogenicity due to toxicity, peroxisome proliferation, and inducer / hepatomegaly. The results of the toxicity model can present a detailed classification of the test compound or unknown compound and infer its mechanical information. Current models available as part of this software system are related to liver toxicity, including but not limited to liver primary cell culture, kidney, heart, spleen, bone marrow, and brain Models for specific toxicity of other organs can be used.

[00121]実施例3に記載の変換アルゴリズムを、ToxShield(商標)Suiteなどのソフトウェアプロダクトにおいて実施することができる。顧客は、Affymetrix RAE2.0 GeneChip(登録商標)マイクロアレイプラットホームなどのマイクロアレイにおいて作成されたそのデータを入力する。ソフトウェアはアルゴリズムを利用して、顧客の遺伝子発現データを、Affymetrix RGU34 A GeneChip(登録商標)マイクロアレイなどの第2のマイクロアレイプラットホームにおいて排他的に構築された、ソフトウェアの毒性ゲノミクスモデルと適合するRMAデータに変換する。次いで、予測モデルを使用して、顧客のデータから視覚化および予測を作成することができる。  [00121] The conversion algorithm described in Example 3 can be implemented in a software product such as ToxShield ™ Suite. The customer enters that data created on a microarray, such as an Affymetrix RAE2.0 GeneChip® microarray platform. The software uses an algorithm to convert customer gene expression data into RMA data that is compatible with software toxicity genomics models built exclusively on a second microarray platform such as the Affymetrix RGU34 A GeneChip® microarray. Convert. The prediction model can then be used to create visualizations and predictions from the customer data.

[00122]本発明を、上記の実施例に関連して詳細に記載してきたが、本発明の精神から逸脱することなく様々な変更形態を実施することができることを理解されたい。したがって、本発明は、特許請求の範囲によってしか限定されない。本願明細書において言及されるすべての引用された特許、特許出願、および刊行物は、それらの全体が本明細書に参照により組み入れられる。  [00122] Although the invention has been described in detail in connection with the above examples, it should be understood that various modifications can be made without departing from the spirit of the invention. Accordingly, the invention is limited only by the claims. All cited patents, patent applications, and publications mentioned in this specification are hereby incorporated by reference in their entirety.

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Figure 2007535305
Figure 2007535305

Claims (55)

ある試験薬剤の少なくとも1種の毒作用を予測する方法であって、
(a)前記試験薬剤に曝された少なくとも1種の細胞または組織試料の複数の遺伝子に関する核酸ハイブリダイゼーションデータを提供するステップと、
(b)少なくとも1種の遺伝子からの前記ハイブリダイゼーションデータを遺伝子発現測度に変換するステップと、
(c)前記少なくとも1種の遺伝子に関する前記遺伝子発現測度から、遺伝子調節スコアを作成するステップと、
(d)前記薬剤に関する試料予測スコアを作成するステップと、
(e)前記試料予測スコアを毒性参照予測スコアと比較し、それにより前記試験薬剤の少なくとも1種の毒作用を予測するステップとを含む方法。
A method for predicting at least one toxic effect of a test agent comprising:
(A) providing nucleic acid hybridization data for a plurality of genes in at least one cell or tissue sample exposed to the test agent;
(B) converting the hybridization data from at least one gene into a gene expression measure;
(C) generating a gene regulation score from the gene expression measure for the at least one gene;
(D) creating a sample prediction score for the drug;
(E) comparing the sample prediction score to a toxicity reference prediction score, thereby predicting at least one toxic effect of the test agent.
少なくとも1種の細胞または組織試料を試験薬剤ビヒクルに曝す、請求項1に記載の方法。  The method of claim 1, wherein at least one cell or tissue sample is exposed to a test drug vehicle. ステップ(b)の変換が、バックグラウンドハイブリダイゼーションおよび試験薬剤ビヒクルによって誘導される発現に関するハイブリダイゼーションデータを正規化することを含む、請求項2に記載の方法。  3. The method of claim 2, wherein the conversion of step (b) comprises normalizing the hybridization data for background hybridization and expression induced by the test agent vehicle. 前記遺伝子発現測度が遺伝子変化倍率である、請求項2に記載の方法。  The method of claim 2, wherein the gene expression measure is a gene change rate. 前記変化倍率を対数尺度の線形加法モデルによって計算する、請求項4に記載の方法。  5. The method of claim 4, wherein the rate of change is calculated by a logarithmic scale linear additive model. 前記対数尺度の線形加法モデルがロバストマルチアレイ平均(RMA)である、請求項5に記載の方法。  6. The method of claim 5, wherein the logarithmic scale linear additive model is a robust multi-array average (RMA). 前記核酸ハイブリダイゼーションデータが、異常値データを測定する品質管理プロセスによってスクリーニングされている、請求項1に記載の方法。  The method of claim 1, wherein the nucleic acid hybridization data is screened by a quality control process that measures outlier data. ステップ(c)が、部分最小二乗(PLS)を使用した次元縮小を含む、請求項1に記載の方法。  The method of claim 1, wherein step (c) includes dimensionality reduction using partial least squares (PLS). 前記試料予測スコアを、各遺伝子に関する加重インデックススコアを用いて作成する、請求項1に記載の方法。  The method of claim 1, wherein the sample prediction score is created using a weighted index score for each gene. 前記薬剤に関する試料予測スコアを、前記少なくとも1種の遺伝子に関する遺伝子調節スコアから作成する、請求項1に記載の方法。  The method of claim 1, wherein a sample prediction score for the drug is generated from a gene regulation score for the at least one gene. 前記薬剤に関する試料予測スコアを、少なくとも約10種の遺伝子に関する遺伝子調節スコアから作成する、請求項10に記載の方法。  11. The method of claim 10, wherein a sample prediction score for the drug is generated from a gene regulation score for at least about 10 genes. 前記薬剤に関する試料予測スコアを、少なくとも約50種の遺伝子に関する遺伝子調節スコアから作成する、請求項10に記載の方法。  11. The method of claim 10, wherein a sample prediction score for the drug is generated from a gene regulation score for at least about 50 genes. 前記薬剤に関する試料予測スコアを、少なくとも約100種の遺伝子に関する遺伝子調節スコアから作成する、請求項10に記載の方法。  11. The method of claim 10, wherein a sample prediction score for the drug is generated from a gene regulation score for at least about 100 genes. 前記毒性参照予測スコアを、
(a)ある毒素に曝された少なくとも1種の細胞または組織試料およびその毒素ビヒクルに曝された少なくとも1種の細胞または組織試料の複数の遺伝子に関する核酸ハイブリダイゼーションデータを提供するステップと、
(b)少なくとも1種の遺伝子からの前記ハイブリダイゼーションデータを変化倍率に変換するステップと、
(c)前記少なくとも1種の遺伝子に関する変化倍率から遺伝子調節スコアを作成するステップと、
(d)前記毒素に関する毒性参照予測スコアを作成するステップと、を含む方法によって作成する、請求項1に記載の方法。
The toxicity reference prediction score,
(A) providing nucleic acid hybridization data for at least one cell or tissue sample exposed to a toxin and a plurality of genes of the at least one cell or tissue sample exposed to the toxin vehicle;
(B) converting the hybridization data from at least one gene into a magnification of change;
(C) creating a gene regulation score from the fold change factor for the at least one gene;
And (d) creating a toxicity reference prediction score for the toxin.
ステップ(a)が、核酸ハイブリダイゼーションデータを、リモート接続を介してサーバーにロードすることを含む、請求項1に記載の方法。  The method of claim 1, wherein step (a) comprises loading nucleic acid hybridization data to a server via a remote connection. 前記リモート接続がインターネットを通じたものである、請求項15に記載の方法。  The method of claim 15, wherein the remote connection is through the Internet. 前記毒性参照予測スコアをデータベース中に含める、請求項1に記載の方法。  The method of claim 1, wherein the toxicity reference prediction score is included in a database. 前記毒性参照予測スコアを毒性学的モデルから導き出す、請求項17に記載の方法。  The method of claim 17, wherein the toxicity reference prediction score is derived from a toxicological model. 前記毒性学的モデルが、個々の毒素モデル、毒素クラスモデル、一般的な毒性学的モデル、および組織病態モデルからなる群から選択される、請求項18に記載の方法。  19. The method of claim 18, wherein the toxicological model is selected from the group consisting of an individual toxin model, a toxin class model, a general toxicological model, and a tissue pathology model. (f)前記毒作用に関係する情報を含むレポートを作成するステップをさらに含む、請求項1に記載の方法。  The method of claim 1, further comprising: (f) generating a report that includes information related to the toxic effect. 前記レポートが、前記毒作用の機序に関係する情報を含む、請求項20に記載の方法。  21. The method of claim 20, wherein the report includes information related to the mechanism of toxic effects. 前記レポートが、前記毒性参照予測スコアを準備するのに使用する毒素に関係する情報を含む、請求項20に記載の方法。  21. The method of claim 20, wherein the report includes information related to a toxin used to prepare the toxicity reference prediction score. 前記レポートが、前記試験薬剤とある毒素との間の少なくとも1種の類似性に関係する情報を含む、請求項20に記載の方法。  21. The method of claim 20, wherein the report includes information relating to at least one similarity between the test agent and a toxin. 前記ハイブリダイゼーションデータを普通テキストファイル中に含める、請求項16に記載の方法。  The method of claim 16, wherein the hybridization data is included in a plain text file. 前記ハイブリダイゼーションデータをCELファイル中に含める、請求項16に記載の方法。  The method of claim 16, wherein the hybridization data is included in a CEL file. 前記核酸ハイブリダイゼーションデータに、顧客データ、細胞または組織試料データ、ハイブリダイゼーション技術データ、および試験薬剤データからなる群から選択される情報を用いて注釈を付ける、請求項1に記載の方法。  The method of claim 1, wherein the nucleic acid hybridization data is annotated with information selected from the group consisting of customer data, cell or tissue sample data, hybridization technology data, and test drug data. ステップ(a)が、前記少なくとも1種の毒作用を予測するための少なくとも1種の毒性モデルを選択することをさらに含む、請求項15に記載の方法。  16. The method of claim 15, wherein step (a) further comprises selecting at least one toxicity model for predicting the at least one toxic effect. ある試験薬剤の少なくとも1種の毒作用の予測を含むレポートを提供する方法であって、
(a)前記試験薬剤に曝された少なくとも1種の細胞または組織試料およびその試験薬剤ビヒクルに曝された少なくとも1種の細胞または組織試料の複数の遺伝子に関する核酸ハイブリダイゼーションデータを、リモートリンクを介してサーバーに受信するステップと、
(b)少なくとも1種の遺伝子からの前記ハイブリダイゼーションデータをRMA(ロバストマルチアレイ平均)変化倍率に変換するステップと、
(c)前記少なくとも1種の遺伝子に関するRMA 変化倍率から遺伝子調節スコアを作成するステップと、
(d)前記薬剤に関する試料予測スコアを作成するステップと、
(e)前記試料予測スコアを毒性参照予測スコアと比較するステップと、
(f)前記少なくとも1種の毒作用に関係する情報を含むレポートを提供するステップと、を含む方法。
A method for providing a report including a prediction of at least one toxic effect of a test agent comprising:
(A) Nucleic acid hybridization data relating to a plurality of genes of at least one cell or tissue sample exposed to the test agent and at least one cell or tissue sample exposed to the test agent vehicle via a remote link Receiving to the server
(B) converting the hybridization data from at least one gene into an RMA (Robust Multi-Array Average) rate of change;
(C) generating a gene regulatory score from the RMA change rate for the at least one gene;
(D) creating a sample prediction score for the drug;
(E) comparing the sample prediction score to a toxicity reference prediction score;
(F) providing a report including information relating to the at least one toxic effect.
毒性学的モデルを創製する方法であって、
(a)ある毒素に曝された少なくとも1種の細胞または組織試料の複数の遺伝子に関する核酸ハイブリダイゼーションデータを提供するステップと、
(b)少なくとも1種の遺伝子からの前記ハイブリダイゼーションデータを遺伝子発現測度に変換するステップと、
(c)前記少なくとも1種の遺伝子に関する遺伝子発現測度から遺伝子調節スコアを作成するステップと、
(d)前記毒素に関する毒性参照予測スコアを作成し、それにより毒性学的モデルを創製するステップと、を含む方法。
A method for creating a toxicological model comprising:
(A) providing nucleic acid hybridization data for a plurality of genes in at least one cell or tissue sample exposed to a toxin;
(B) converting the hybridization data from at least one gene into a gene expression measure;
(C) generating a gene regulation score from a gene expression measure for the at least one gene;
(D) creating a toxicity reference prediction score for the toxin and thereby creating a toxicological model.
少なくとも1種の細胞または組織試料が試験薬剤ビヒクルに曝される、請求項29に記載の方法。  30. The method of claim 29, wherein at least one cell or tissue sample is exposed to a test drug vehicle. ステップ(b)の変換が、バックグラウンドハイブリダイゼーション、および試験薬剤ビヒクルによって誘導される発現に関するハイブリダイゼーションデータを正規化することを含む、請求項29に記載の方法。  30. The method of claim 29, wherein the conversion of step (b) comprises normalizing hybridization data for background hybridization and expression induced by the test agent vehicle. 前記遺伝子発現測度が遺伝子変化倍率である、請求項29に記載の方法。  30. The method of claim 29, wherein the gene expression measure is a gene change rate. 前記変化倍率を対数尺度の線形加法モデルによって計算する、請求項32に記載の方法。  33. The method of claim 32, wherein the rate of change is calculated by a logarithmic scale linear additive model. 前記対数尺度の線形加法モデルがロバストマルチアレイ平均(RMA)である、請求項33に記載の方法。  34. The method of claim 33, wherein the logarithmic scale linear additive model is a robust multi-array average (RMA). ステップ(c)の作成が、部分最小二乗(PLS)を使用した次元縮小を含む、請求項29に記載の方法。  30. The method of claim 29, wherein creating step (c) includes dimensionality reduction using partial least squares (PLS). ステップ(d)が、各遺伝子に関する加重インデックススコアの作成を含む、請求項29に記載の方法。  30. The method of claim 29, wherein step (d) comprises creating a weighted index score for each gene. 前記毒素に関する毒性参照予測スコアを、前記少なくとも1種の遺伝子に関する遺伝子調節スコアから作成する、請求項29に記載の方法。  30. The method of claim 29, wherein a toxicity reference prediction score for the toxin is generated from a gene regulation score for the at least one gene. 前記薬剤に関する毒性参照予測スコアを、少なくとも約10種の遺伝子に関する遺伝子調節スコアから作成する、請求項37に記載の方法。  38. The method of claim 37, wherein a toxicity reference prediction score for the drug is generated from a gene regulation score for at least about 10 genes. 前記薬剤に関する毒性参照予測スコアを、少なくとも約50種の遺伝子に関する遺伝子調節スコアから作成する、請求項37に記載の方法。  38. The method of claim 37, wherein a toxicity reference prediction score for the drug is generated from a gene regulation score for at least about 50 genes. 前記薬剤に関する毒性参照予測スコアを、少なくとも約100種の遺伝子に関する遺伝子調節スコアから作成する、請求項37に記載の方法。  38. The method of claim 37, wherein a toxicity reference prediction score for the drug is generated from a gene regulation score for at least about 100 genes. 前記毒性学的モデルが、個々の毒素モデル、毒素クラスモデル、一般的な毒性学的モデル、および組織病態モデルからなる群から選択される、請求項29に記載の方法。  30. The method of claim 29, wherein the toxicological model is selected from the group consisting of an individual toxin model, a toxin class model, a general toxicological model, and a tissue pathology model. 前記モデルを確認するステップをさらに含む、請求項29に記載の方法。  30. The method of claim 29, further comprising validating the model. 前記確認が、交差検定手順を使用することを含む、請求項42に記載の方法。  43. The method of claim 42, wherein the confirmation comprises using a cross-validation procedure. 前記交差検定手順が、2/3 / 1/3確認手順である、請求項43に記載の方法。  44. The method of claim 43, wherein the cross-validation procedure is a 2/3/1/3 confirmation procedure. (a)請求項29に記載の方法によって作成された、ある試験薬剤の毒性を予測するための毒性モデルを含むコンピュータ可読媒体と、
(b)ユーザーが、試料予測スコアを前記毒性モデルにおける毒性参照予測スコアと比較することにより、前記試験薬剤の少なくとも1種の毒作用を予測することを可能にするソフトウェアとを含むコンピュータシステム。
(A) a computer readable medium comprising a toxicity model for predicting the toxicity of a test agent produced by the method of claim 29;
(B) a computer system including software that allows a user to predict at least one toxic effect of the test agent by comparing a sample prediction score to a toxicity reference prediction score in the toxicity model.
前記ソフトウェアにより、ユーザーが、ある試験薬剤に曝された細胞または組織試料から得られる定量的な遺伝子発現情報を、前記毒性モデルにおける定量的な遺伝子発現情報と比較して、前記試験薬剤が毒素であるかどうか予測することを可能にする、請求項45に記載のコンピュータシステム。  The software allows a user to compare quantitative gene expression information obtained from a cell or tissue sample exposed to a test agent with quantitative gene expression information in the toxicity model, so that the test agent is a toxin. 46. The computer system of claim 45, which makes it possible to predict whether there is any. ユーザーが、ある試験薬剤に曝された細胞または組織試料からの核酸ハイブリダイゼーションデータをリモートロケーションから伝送して、前記試験薬剤が毒素であるかどうか予測することを可能にするソフトウェアをさらに含む、請求項45に記載のコンピュータシステム。  Further comprising software that allows a user to transmit nucleic acid hybridization data from a cell or tissue sample exposed to a test agent from a remote location to predict whether the test agent is a toxin. Item 46. The computer system according to Item 45. 前記試料からの核酸ハイブリダイゼーションデータをインターネット経由で伝送することができる、請求項45に記載のコンピュータシステム。  The computer system according to claim 45, wherein nucleic acid hybridization data from the sample can be transmitted via the Internet. 前記核酸ハイブリダイゼーションデータがマイクロアレイハイブリダイゼーションデータである、請求項45に記載のコンピュータシステム。  46. The computer system of claim 45, wherein the nucleic acid hybridization data is microarray hybridization data. 前記核酸ハイブリダイゼーションデータがPCRデータである、請求項45に記載のコンピュータシステム。  46. The computer system of claim 45, wherein the nucleic acid hybridization data is PCR data. 少なくとも1種の毒性参照予測スコアを含むデータ構造をさらに含む、請求項45に記載のコンピュータシステム。  46. The computer system of claim 45, further comprising a data structure comprising at least one toxicity reference prediction score. 前記データ構造が、少なくとも1種の遺伝子PLSスコアをさらに含む、請求項45に記載のコンピュータシステム。  46. The computer system of claim 45, wherein the data structure further comprises at least one gene PLS score. 前記データ構造が、少なくとも1種の遺伝子調節スコアをさらに含む、請求項45に記載のコンピュータシステム。  46. The computer system of claim 45, wherein the data structure further comprises at least one gene regulation score. 前記データ構造が、少なくとも1種の試料予測スコアをさらに含む、請求項45に記載のコンピュータシステム。  46. The computer system of claim 45, wherein the data structure further comprises at least one sample prediction score. 少なくとも1種の毒性参照予測スコアを含むデータ構造および前記データ構造にアクセスするためのソフトウェアを含むコンピュータ可読媒体。  A computer readable medium comprising a data structure including at least one toxicity reference prediction score and software for accessing the data structure.
JP2006541720A 2003-11-24 2004-11-24 Methods for molecular toxicity modeling Pending JP2007535305A (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
PCT/US2003/037556 WO2004048598A2 (en) 2002-11-22 2003-11-24 Molecular nephrotoxicology modeling
US55498104P 2004-03-22 2004-03-22
US61383104P 2004-09-29 2004-09-29
PCT/US2004/039593 WO2005052181A2 (en) 2003-11-24 2004-11-24 Methods for molecular toxicology modeling

Publications (1)

Publication Number Publication Date
JP2007535305A true JP2007535305A (en) 2007-12-06

Family

ID=34637018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006541720A Pending JP2007535305A (en) 2003-11-24 2004-11-24 Methods for molecular toxicity modeling

Country Status (4)

Country Link
EP (1) EP1697873A4 (en)
JP (1) JP2007535305A (en)
CA (1) CA2546391A1 (en)
WO (1) WO2005052181A2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2891278B1 (en) * 2005-09-23 2008-07-04 Vigilent Technologies Sarl METHOD FOR DETERMINING THE STATUS OF A SET OF CELLS AND SYSTEM FOR CARRYING OUT SAID METHOD
WO2009083030A1 (en) * 2007-12-27 2009-07-09 Vereniging Voor Christelijk Hoger Onderwijs Method for predicting a toxic effect of a compound
JP6138793B2 (en) * 2011-09-09 2017-05-31 フィリップ モリス プロダクツ エス アー System and method for network-based biological activity assessment
CN104508671B (en) 2012-06-21 2018-10-19 菲利普莫里斯生产公司 It is corrected by deviation and the system and method for generating biomarker signature is predicted in classification
CA2877430C (en) 2012-06-21 2021-07-06 Philip Morris Products S.A. Systems and methods for generating biomarker signatures with integrated dual ensemble and generalized simulated annealing techniques
US10914751B2 (en) * 2018-04-06 2021-02-09 Boehringer Ingelheim Vetmedica Gmbh Method for determining an analyte, and analysis system
CN113496072A (en) * 2020-03-22 2021-10-12 杭州环特生物科技股份有限公司 Conversion method for converting zebra fish into human dosage for safety evaluation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001096866A1 (en) * 2000-06-14 2001-12-20 Vistagen, Inc. Toxicity typing using liver stem cells
WO2002010453A2 (en) * 2000-07-31 2002-02-07 Gene Logic, Inc. Molecular toxicology modeling
WO2003076660A1 (en) * 2002-03-13 2003-09-18 F.Hoffmann-La Roche Ag Method for selecting drug sensitivity-determining factors and method for predicting drug sensitivity using the selected factors

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6132969A (en) * 1998-06-19 2000-10-17 Rosetta Inpharmatics, Inc. Methods for testing biological network models
WO2002048310A2 (en) * 2000-12-15 2002-06-20 Genetics Institute, Llc Methods and compositions for diagnosing and treating rheumatoid arthritis
WO2002090979A1 (en) * 2001-05-08 2002-11-14 Histatek, Inc. Biochips and method of screening using drug induced gene and protein expression profiling
US20030083822A2 (en) * 2001-05-15 2003-05-01 Psychogenics, Inc. Systems and methods for monitoring behavior informatics

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001096866A1 (en) * 2000-06-14 2001-12-20 Vistagen, Inc. Toxicity typing using liver stem cells
WO2002010453A2 (en) * 2000-07-31 2002-02-07 Gene Logic, Inc. Molecular toxicology modeling
WO2003076660A1 (en) * 2002-03-13 2003-09-18 F.Hoffmann-La Roche Ag Method for selecting drug sensitivity-determining factors and method for predicting drug sensitivity using the selected factors

Also Published As

Publication number Publication date
EP1697873A4 (en) 2008-01-23
CA2546391A1 (en) 2005-06-09
WO2005052181A3 (en) 2006-04-27
WO2005052181A2 (en) 2005-06-09
EP1697873A2 (en) 2006-09-06

Similar Documents

Publication Publication Date Title
US9115401B2 (en) Partition defined detection methods
AU2015374259B2 (en) Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results
JP6987786B2 (en) Detection and diagnosis of cancer evolution
TWI636255B (en) Mutational analysis of plasma dna for cancer detection
Mecham et al. Increased measurement accuracy for sequence-verified microarray probes
JP2016082984A (en) Methods for genetic analysis
Garrett-Mayer et al. Cross-study validation and combined analysis of gene expression microarray data
RU2699517C2 (en) Method for assessing risk of disease in user based on genetic data and data on composition of intestinal microbiota
US20230348980A1 (en) Systems and methods of detecting a risk of alzheimer's disease using a circulating-free mrna profiling assay
WO2007084187A2 (en) Molecular cardiotoxicology modeling
US20110071767A1 (en) Hepatotoxicity Molecular Models
JP2007535305A (en) Methods for molecular toxicity modeling
Hersh et al. High-throughput sequencing in respiratory, critical care, and sleep medicine research. An Official American Thoracic Society Workshop Report
WO2007022419A2 (en) Molecular toxicity models from isolated hepatocytes
EP1412537A2 (en) Cardiotoxin molecular toxicology modeling
US20060240418A1 (en) Canine gene microarrays
US20080268443A1 (en) Broad-based disease association from a gene transcript test
McDunn et al. Physiologic genomics
US20050048463A1 (en) Systems and methods for determining cell type composition of mixed cell populations using gene expression signatures
US20230162815A1 (en) Methods and systems for accurate genotyping of repeat polymorphisms
WO2006037025A2 (en) Molecular toxicity models from isolated hepatocytes
US20080281526A1 (en) Methods For Molecular Toxicology Modeling
Ma et al. A computational framework for predicting drug Mode-of-Action
Eggle Using whole-genome wide gene expression profiling for the establishment of RNA fingerprints

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071116

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20080502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100824

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110405