JP3897086B2 - Cancer-related gene expression observation array - Google Patents

Cancer-related gene expression observation array Download PDF

Info

Publication number
JP3897086B2
JP3897086B2 JP2000255737A JP2000255737A JP3897086B2 JP 3897086 B2 JP3897086 B2 JP 3897086B2 JP 2000255737 A JP2000255737 A JP 2000255737A JP 2000255737 A JP2000255737 A JP 2000255737A JP 3897086 B2 JP3897086 B2 JP 3897086B2
Authority
JP
Japan
Prior art keywords
dna
genes
gene
sequence
immobilized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000255737A
Other languages
Japanese (ja)
Other versions
JP2002058495A (en
Inventor
裕之 富田
俊郎 斎藤
正俊 奈良原
宏一 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000255737A priority Critical patent/JP3897086B2/en
Publication of JP2002058495A publication Critical patent/JP2002058495A/en
Application granted granted Critical
Publication of JP3897086B2 publication Critical patent/JP3897086B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Automatic Analysis And Handling Materials Therefor (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、抵悪性腫瘍薬等の作用機序を解明するためのDNAアレイ、及びその製造方法に関する。
【0002】
【従来の技術】
悪性腫瘍の治療には、外科手術療法、放射線手術療法および化学療法がある。悪性腫瘍の化学療法は、抗腫瘍薬に対する正常細胞と悪性腫瘍細胞との感受性の違いを利用して、腫瘍細胞に対して選択毒性を示し、その発育や増殖を抑制することを目的とする。しかし抗悪性腫瘍薬は腫瘍細胞と正常細胞に対する影響に質的な差異が大きくないため正常細胞にも毒性を示す。そのため悪性腫瘍に対して効果の大きい薬剤ほど、正常細胞に対する影響が大きく重篤な副作用を現す可能性が大きい。しかし腫瘍細胞の耐性獲得(抗悪性腫瘍薬を連続投与していくことで、薬に抵抗性を有する腫瘍細胞が出現すること)に対抗するために、より強力で効果の大きい薬剤の開発は常に望まれている。また非小細胞肺がん、膵がん、悪性黒色腫、腎がんのように薬による治癒が困難ながんも数多く存在することも、より強力な抗悪性腫瘍薬の開発が待たれる理由である。
【0003】
良好な抗悪性腫瘍薬の開発には、その対腫瘍毒性の強さとともに、副作用の小さいことが望まれる。この相反する条件を満足するためには、薬剤が作用するメカニズム(作用機序)を把握した上で、創薬を行うことが必要である。このためには薬剤の作用機序を遺伝子レベルまで掘り下げて理解することが望ましい。
【0004】
DNA分子上の遺伝子に記述された遺伝情報は、メッセンジャーRNAに転写され、リボゾーム内でたんぱく質に翻訳される。このメッセンジャーRNAへの転写、たんぱく質への翻訳までの過程を遺伝子発現と呼ぶ。薬剤の作用機序を遺伝子レベルで理解するためには、薬剤が投与されてから、代謝され、実際の対腫瘍毒性を発揮するまでの過程で、どのような遺伝子やタンパク質が関与するかを、時間経過とともに追跡することが望ましい。この追跡により、遺伝子やタンパク質の相互作用、経路(遺伝子パスウェイ)が明らかになるためである。ひとたび、遺伝子パスウェイが明らかになれば、パスウェイ上の遺伝子に作用する他の薬剤を併用することで副作用を低減するなど、治療方針の改善を行える。また薬剤そのものを改良する指針が得られる。
【0005】
遺伝子パスウェイを明らかにするためには、(1)メッセンジャーRNAの量的変化を見る方法と(2)タンパク質の量的変化、空間分布の変化を見る方法がある。前者には、DNAアレイ(もしくはDNAチップ)、ノーザンハイブリダイゼーション、RT-PCR法がある。後者には、イーストツーハイブリッド(Yeast Two Hybrid)や、抗体染色法などがある。上記の方法のうち、薬剤の作用に関与するであろう数十から数百の遺伝子の変化を同時に見る技術としては、(1)のメッセンジャーRNAを見る方法、特にDNAアレイ法と呼ばれる技術が、簡便性、スループット、コストの見地から最も好適であり、現在盛んに研究されている。
【0006】
DNAアレイ法では数千から数万種類ものメッセンジャーRNAの量的差異を一度に測定可能である(Duggan, D.J.ら、Expression profiling using cDNA microarrays, Nature genetics supplement, vol.21, p10-14, 1999)。一般に、DNAアレイはガラススライドの上に、メッセンジャーRNAと相補的な配列を有する相補DNA(complementary DNAもしくはcDNA)をプローブとして固定化したものである(Lockhart, D.J.ら、Expression monitoring by hybridization to high-density oligonucleotide arrays, Nature biotechnology, vol.14, p.1675-1680, 1996)。実験者は、細胞や臓器等からメッセンジャーRNAを取り出した後、逆転写酵素と蛍光標識物質を用いて、メッセンジャーRNAから蛍光標識されたcDNAを合成する。その後、蛍光標識付cDNAを、DNAアレイ上にふりかける。続いて、DNAアレイを一定時間一定温度に保持して、蛍光標識付cDNAとDNAアレイとを相補結合(ハイブリダイズ)させる。その後、DNAアレイを洗浄し、非特異的に結合している蛍光標識付cDNAを洗い流す(非特異的に結合しているcDNAは、特異的に結合しているcDNAと比較して相補結合力が弱い。)最後に、DNAアレイ上に固定化された個々のプローブに対応する蛍光信号強度を測定する。メッセンジャーRNA量は対応するプローブとハイブリダイズした蛍光信号強度に比例する。こうして臓器や細胞内の種々の遺伝子に対応するメッセンジャーRNA量を測定することができる。例えば、薬剤投与後の経過時間ごとに細胞あるいは臓器からメッセンジャーRNAを取り出して、DNAアレイ法で測定することで、遺伝子ごとのメッセンジャーRNA量の時間変化を見ることができる。メッセンジャーRNA量が増加することは、DNA分子からの遺伝情報が活発に転写されることを意味し、遺伝子の働きが増加することに対応する。この遺伝子の働きの時間変化を解析することで、遺伝子パスウェイの情報が得られる。
【0007】
DNAアレイを用いて遺伝子パスウェイ情報を求める取り組みとして、近年、酵母の遺伝子のほぼ全てを1枚のアレイに固定化して、薬剤投与などの刺激を加えた場合のメッセンジャーRNAの量的変化を測定する試みが行われている(DeRisi, J. L.ら, Exploring the metabolic and genetic control of gene expression on a genomic scale, Science, vol.278, p.680-686, 1997, Roberts, C. J. ら、Signaling and circuitry of multiple MAPK pathways revealed by a matrix of global gene expression profiles, Science, vol.287, p.873-880, 2000)。また酵母の遺伝子の一部を破壊して、薬物投与後のメッセンジャーRNAの量的変化を観察することで、薬物投与と遺伝子パスウェイの関連も調べられている(Marton, M. J.ら、Drug target validation and identification of secondary drug target effects using DNA microarrays, Nature Medicine, vol.4, p.1293-1301、ないしはStoughton et al. Methods for identifying pathways of drug action, US patent 5965352)。しかし酵母における薬物の作用機序は、ヒトにおける薬物の作用機序と同一とは言えない。それは酵母とヒトとで、遺伝子の機能や数が異なるからである。特に酵母の遺伝子を破壊することによって、メッセンジャーRNA量の変化が起こるだけでなく、染色体数の変化までが併発されることが分かっている(Hughes, T. R.ら、Widespread aneupolidy revealed by DNA microarray expression profiling, Nature genetics, vol.25, p.333-337, 2000)。この染色体数の変化はヒトでは、例えばダウン症のような重篤な疾病を引き起こす原因であり、がん細胞を除いた正常細胞では、ほとんど皆無に近い現象である。この点からも酵母、特に特定の遺伝子を破壊した酵母から得られた知見を、ヒトに外挿する際には注意が必要である。酵母から得られた情報のみに頼るのではなく、ヒト細胞での知見も積み重ねていくことが望まれている。
【0008】
複数のヒトがん培養細胞を対象に、種々の抗悪性腫瘍薬を投与した場合と、投与しない場合とで、個々の遺伝子(約9700個)から転写されるメッセンジャーRNA量にどの程度の違いが現れるかを研究した例がある(Scherf, U.ら, A gene expression database fot the molecular pharmacology of canceRNAture genetics, vol.24, p.236-244, 2000)。この研究では、ある薬剤に対し、種々のヒトがん培養細胞のそれぞれでどの遺伝子のメッセンジャーRNA量が変化したのかのクラスター分析が行われた。また、あるヒトがん培養細胞に対し、種々の薬剤のそれぞれの投与時でどの遺伝子のメッセンジャーRNA量が変化したのかのクラスター分析も同時に行われたものである。
【0009】
【発明が解決しようとする課題】
しかし、前述のRNA量の相違について調べた結果について、本来、種々の薬剤への応答メカニズムが、各細胞で共通しているのであれば、両者のクラスター分析の結果は共通しなくてはならない。しかしながら、前述のScherfらの論文によると、細胞の種類とメッセンジャーRNA間のクラスター分析と、薬剤の種類とメッセンジャーRNA間のクラスター分析の結果は大変に異なっていた。結局、前述のScherfらの論文では遺伝子パスウェイに関する新たな情報は得られていない。注意すべきは、Scherfらの用いたDNAアレイにおいて、約9700個の遺伝子に対応するメッセンジャーRNA量の変化が、遺伝子ごとに高精度に分離されて測定されているか、検討されていない点である。後述のように、測定精度を確保するためのプローブ設計技術が適用されてはじめて、遺伝子ごとの高精度に分離した実験を行えると思われる。
【0010】
遺伝子数が数千から数万という既存のアレイは、後述のように、固定化する遺伝子数が多いため、各遺伝子ごとを高精度で分離することが難しくなる。このため遺伝子数が数千から数万というアレイは、探索用途(Gene Discovery)には適しているが、遺伝子パスウェイを観察するような解析用途(Analytical Use)には必ずしも好適とは言えない。
【0011】
【課題を解決するための手段】
抗悪性腫瘍薬等の作用機序を高精度に解析するためには、1種類の遺伝子とのみ相補的結合するはずのDNA断片が、他遺伝子とも結合すること(クロスハイブリダイゼーション)は避けなくてはならないことは自明である。これは1枚のアレイ上に固定化する遺伝子数が多くなるほど後述のように困難となる。従って、遺伝子数が数千から数万という探索用途のDNAアレイで各遺伝子間のクロスハイブリダイゼーションを皆無にすることも非常に困難である。この課題を解決するためには、DNAアレイを使用する目的が例えば抗悪性腫瘍薬等の作用機序の解明であれば、薬剤の作用機序に関連する遺伝子のみを可能なかぎり必要最小限(as small as reasonably achievable)集め、アレイ化することが望ましい。また、酵母を対象としたDNAアレイでは、その知見をヒトに直接反映させるには限度がある。これは、マウス、ラット等の実験動物を対象としたDNAアレイにおいても同様に問題である。この課題を解決するためには、ヒト遺伝子を用いたアレイとするのがよい。
【0012】
抗悪性腫瘍薬等の作用機序に関連する遺伝子のみを必要最小限集めるために、抗悪性腫瘍薬等の薬剤が体内に取り込まれた後の過程を考察する。体内に取り込まれた後、薬剤はほとんどの例外なく薬物代謝酵素により代謝される。また薬剤は代謝されて効力を失うもの、代謝されて初めて薬効を発揮するもの、代謝されることで好ましくない毒性を発揮するものがある。そこで、抗悪性腫瘍薬等の作用機序を遺伝子レベルで解析するためには、少なくとも薬剤代謝関連の遺伝子発現を解析する必要がある。
【0013】
また抗悪性腫瘍薬等の薬剤は、本来悪性腫瘍の殺傷、発生の抑制、浸潤の抑制、転移の抑制等の薬効を期待されている。この期待と相違する効果をもたらす場合が副作用であり、副作用は可能な限り低減しなくてはならない。このためがんに関連した遺伝子特に、がんの発生、浸潤、転移と関連した遺伝子の発現を解析する必要がある。
【0014】
すなわち、抗悪性腫瘍薬等の薬効を高精度に解析するには、(1)薬剤代謝関連遺伝子と(2)がん関連遺伝子のそれぞれを必要最小限、固定化したDNAアレイが最も適している。次にDNAアレイに固定化すべき薬物代謝関連遺伝子とがん関連遺伝子の選択理由を示す。
【0015】
(A)薬物代謝関連遺伝子の選択理由
体内摂取された薬物は必ずと言ってよいほど代謝される。この代謝には多様な代謝酵素が関与している。そして生体内代謝経路の関与している薬物代謝反応は、通常無秩序にはおこらない。またある特別の薬物代謝経路が、通常単独で機能することもない。1つの経路の活性は他の経路の活性に影響を与え、相互に代謝を制御しあっていることが分かっている。一説には、寄与の小さい(マイナー)なものを含めると約千個の遺伝子が薬物代謝に関与していると言われている。薬物代謝反応は一般に、第一相反応(官能基導入反応)および第二相反応(抱合反応)に分類される。第一相反応では酸化、還元、加水分解、水和、脱チオアセチル化、異性化などの化学反応が生じ、第二相反応では、グルクロン酸またはグルコース抱合反応、硫酸抱合、メチル抱合、アセチル抱合、アミノ酸抱合、グルタチオン抱合、脂肪酸抱合、縮合などの各化学反応が生じている。
【0016】
上記の多彩な薬物代謝関連酵素を全て網羅することは、DNA断片数の増加に帰着し、前述のようにクロスハイブリダイゼーションを無くして高精度の解析を実現することと背反する。そこで、第一相反応と第二相反応のうちで、寄与の大きい(メジャー)なものを選択する。ヒトでは、第一相反応に関連する遺伝子として、チトクローム450遺伝子(CYP)1A1、CYP1A2、CYP1B1、CYP2A6、CYP2B6、CYP2C8、CYP2C9、CYP2C19、CYP2D6、CYP2E1、CYP3A4、CYP3A5、CYP3A7および、アルコールデヒドロゲナーゼ、アルデヒドデハイドロゲナーゼ、ジヒドロキシピリミジンデヒドロゲナーゼ、NADPH-チトクロムP450レダクターゼ、DT−ジアホラーゼ、エステラーゼ、エポキシドヒドラーゼが代表的で、全体の薬剤代謝の9割以上が前記の遺伝子の働きによると言われている(Evans, W.E.とRelling, M.、Pharmacogenomics: Translating functional genomics into rational therapeutics, Science, vol.266, p.487-491, 1999)。また第二相反応に関連する遺伝子として、カテコールO-メチルトランスフェラーゼ、グルタチオーネS−トランスフェラーゼ、ヒスタミンメチルトランスフェラーゼ、N-アセチルトランスフェラーゼ、スルフォトランスフェラーゼ、チオプリンメチルトランスフェラーゼ、ウリジン5‘-トリホスフェートグルクロンシルトランスフェラーゼが、全体の8割以上の薬物代謝に関与しているとも言われている(Evans, W.E.とRelling, M.、同上)。そこで、少なくとも8割以上の薬物代謝に関して、上記の遺伝子群の遺伝子発現を見ることで、おおよその薬物代謝機構を解析することができる。
【0017】
(b)がん関連遺伝子の選択
通常細胞はその増殖が制御されているが、がん細胞は生体のコントロールを受けずに自律的に増殖するよう変異した細胞である。そのため、がん細胞では、細胞増殖や細胞周期を調整する遺伝子に異常が見られる場合が多い。例えば細胞増殖因子として、表皮増殖因子(EGF, epidermal growth factor)やその受容体(EGFレセプタ、EGFR)、血小板由来増殖因子(PDGF, platelet-derived growth factor) やその受容体(PDGFR)、インスリン様増殖因子(IGF, insulin-like growth factor)やその受容体(IGFR)、線維芽細胞増殖因子(FGF, fibroblast growth factor) やその受容体(FGFR)、血管内皮増殖因子(VEGF, vascular endotherial growth factor) やその受容体(VEGFR)、肝細胞増殖因子(HGF, hepatocyte growth factor) やその受容体(HGFR)、神経栄養因子(NT, neurotropin)、形質転換増殖因子β(TGFβ, transforming growth factor-β)ファミリー等に異常が見られる。そして各増殖因子に対応する受容体(receptor)遺伝子、例えばEGFに対してEGFレセプタ(EGFR)、に異常があることもある。また細胞の増殖と分化を誘導する因子として、リンパ球や血球細胞が分泌する生理活性ペプチドをサイトカイン(cytokines)と総称する。主なサイトカインとして、顆粒球コロニー刺激因子(G-CSF, granulocyte-colony stimulating factor)、マクロファージコロニー刺激因子(M-CSF, macrohage-colony stimulating factor)、顆粒球マクロファージコロニー刺激因子(GM-CSF, granulocyte-macrophage colony stimulating factor)、エリスロポエチン(erythropoietin)、トロンボポエチン(thrombopoietin)、幹細胞因子(SCF, stem cell factor)、インターロイキン(interleukin)1,2,3,4,5,6,7,8,9,10,11,12、腫瘍壊死因子(TNF, tumor necrosis factor)、インターフェロン(interferon)等に異常が見られる。細胞周期調節を司る遺伝子として、サイクリン(cyclin)とサイクリン依存性キナーゼ(CDK、cyclin-dependent kinase)、CDK阻害因子(CKI, CDK inhibitor)、例えばサイクリンA, サイクリンB, サイクリンD, サイクリンE、CDK1、CDK2、CDK4、CDK6、p16INK、p15、p21、p27、網膜芽細胞腫(RB, retinoblastoma)遺伝子等に異常がみられる。
【0018】
細胞死の機構に異常が生じても、その細胞はがん化する。生体においておこる細胞死はほとんどがアポトーシスと呼ばれる細胞死である。アポトーシスの起こる経路には、(a)カルシウム経路、(b)死のシグナル経路、(c)セラミド経路、(d)ミトコンドリア経路、(e)DNA障害経路がある。(a)カルシウム経路は、グルココルチコイドの作用により細胞内ホスファジルイノシトール3リン酸レセプターが活性化することにより発動する。(b)死のシグナル経路は、TNFアルファ、Fasリガンドが、細胞表面レセプター(TNFレセプタ、Fas)と結合することにより発動される。その後、レセプターの細胞内ドメインに会合するたんぱく質分子(TNFレセプタ1では、TRADD, FADD, RAIDD等、FasではFADD, RIP, RAIDDなど)が活性化する。それらたんぱく質の活性化によりカスパーゼ遺伝子(CASP)8,1、3などが活性化される。またカスパーゼ遺伝子の関連遺伝子、例えばTRAMP, TRAILなどがアポトーシスの抑制していることが知られている。(c)セラミド経路は、放射線、紫外線、熱、過酸化水素などの各種ストレスによって発動する。より詳細には、セラミド(ceramide)の増加とそれによるSAPK(stress-acivated protein kinase)/JNK(Jun terminal-N kinase)の活性化により、アポトーシスが誘導される。(d)ミトコンドリア経路は、放射線、紫外線、熱、過酸化水素などの種々の刺激により発動され、Bax2(Bcl-2 associated X protein)、Bcl-2, Bcl-xLの活性化、それに伴うカスパーゼ遺伝子の活性化がおこり、アポトーシスが誘導される。(e)DNA障害経路では、p53、p21、p51、p73、MDM2遺伝子等が関与している。がん細胞では前記アポトーシス関連遺伝子の異常が観察されている。
【0019】
その遺伝子に異常があることで、細胞のがん化を促すことが知られている遺伝子をがん遺伝子と呼ぶ。がん遺伝子をシグナル伝達の流れに沿って分類すると、(a)増殖因子群(例えばsis遺伝子)、(b)レセプター型チロシンキナーゼ群(例えばerbB, fms, ret遺伝子)、(c)非レセプター型チロシンキナーゼ群(例えばfes遺伝子)、(d)GTP/GDP結合たんぱく質(例えばras遺伝子)、(e)セリン/トレオニンキナーゼ群(例えばsrc、mos、raf遺伝子)、(f)核内たんぱく質群(例えば、myc, myb, fos, jun, erbA遺伝子)、(g)シグナル伝達アダプター分子(例えばcrk遺伝子)、融合遺伝子(例えばBcr-Abl遺伝子)がある。また主要なシグナル伝達系上の遺伝子もがん遺伝子として分類されることも多い。主要なシグナル伝達経路であるRas-MAPキナーゼ経路(例えばShc, Grb2, Sos, MEK, Rho, Rac遺伝子)、ホスホリパーゼCガンマ-プロテインキナーゼC経路(例えば、PLCγ、PKC遺伝子)、フォスファジルイノシトール3リン酸キナーゼ-Akt経路(例えば、PI3K、Akt, Bad遺伝子)、JAK-STAT経路(JAK、STAT)、GAP系経路(例えば、GAP, p180, p62)などががん遺伝子として知られている。また核内の転写因子では、Myc, Ear, Evi, Gli, Fos, Fra, jun, Maf, Ets, Myb, IRF1,IRF2, Rel, Nf-カッパB、AMLなどが発がん活性を有することが分かっている。
【0020】
細胞のがん化を抑制する遺伝子、がん抑制遺伝子の機能が失われることで細胞のがん化ステップが進行する。これまで発見された主ながん抑制遺伝子は、RB, p53, WT1, NF1, APC, VHL, NF2, CDKN/p16, BRCA1, BRCA2, TGFβRII, DPC4, PTCH, PTEN, MEN1, Eカドヘリン遺伝子、nm23などである。
【0021】
DNAが損傷した際、その細胞は時にはアポトーシスに向かうこともあれば、修復されることがある。このDNA修復の過程にエラーが入ることで、その遺伝子に突然変異(mutation)が生じる。突然変異は細胞のがん化を高確率で引き起こす。DNA修復遺伝子として、ヒトでは、MSH2, MSH3, MSH6, MLH1, PMS1, PMS2, PMS3, メチルグアニン-DNAメチルトランスフェラーゼ(MGMT)等がある。
【0022】
がん転移に関連した転移関連遺伝子として、がん細胞で一般に過剰に産生されているのが、マトリックスメタロプロテアーゼ(MMP)群である。MMPは細胞間基質の主成分であるコラーゲンを分解する。またMMPの阻害物質であるTIMP(tissue inhibitor of metalloprotease)の異常もがん細胞では散見される。また細胞同士を接着させるカドヘリンと、カドヘリンの細胞内領域としている、カテニン(αカテニン、βカテニン、γカテニン)や、ヒアルロン酸レセプターファミリ(CD44)、インテグリンファミリー、免疫グロブリンファミリー、セレクチンファミリー、シアロムチンファミリーなどの異常と、がんとの関連が指摘されている。
【0023】
前述のように、がん遺伝子(oncogenes, tumor-related genes)、がん抑制遺伝子(tumor suppressor genes)、増殖因子(growth factors)、転写因子(transcription factors)、サイトカイン(cytokines)、アポトーシス(apoptosis genes)、細胞周期調節(cell cycle regulators)、DNA修復遺伝子(DNA damage repair genes)、転写関連遺伝子等の細胞がん化の要となる遺伝子群の遺伝子発現を見ることで、抗悪性腫瘍剤作用機序の必要最小限の解析を行うことができる。
【0024】
またDNAアレイ上に固定化された各DNA断片と試料由来DNA断片間での、ハイブリダーゼーションを高精度(ないしは高ストリンジェント、highly stringent)に行うためには、ハイブリダイゼーション温度(Th, hybridization temperature)と固定化DNA断片の融解温度(Tm, melting temperature)の関係が重要である。なぜなら、DNA同士の配列相同性とTmには次の関係が知られているからである。それは、2つのDNA間での1%の塩基配列違い(ミスマッチ)により、両DNAのTmは1.4℃低下するという関係である。すなわち、固定化DNA断片のTmイコールThの時、固定化DNA断片の塩基配列と100%相同性(ホモロジー)を有する試料由来DNA断片がハイブリダイゼーションする。ThとTmが10℃異なるとき、
100%−(10℃/1.4℃)=92.9%
より、固定化DNA断片の塩基配列と約93%〜100%ホモロジーを有する試料由来DNA断片がハイブリダイゼーションする。同様にThとTmが20℃異なるときは85.7%〜100%ホモロジー、ThとTmが30℃異なるときは、78.6%〜100%ホモロジーのDNA同士がハイブリダイゼーションすることになる。高精度で分離を行う際は、少なくとも80%〜100%ホモロジーのみがハイブリダイズすることが望ましい。このため、固定化DNA断片の融解温度とハイブリダイゼーション温度との差異が30℃を超えないことが高精度で分離を行うために必要である。
【0025】
DNAアレイ上に固定化された各DNA断片と試料由来DNA断片間での、ハイブリダーゼーションを高精度に行うもう一つの重要な条件は、クロスハイブリダイゼーションを無くすことである。クロスハイブリダイゼーションは、DNA配列同士のホモロジーが高いために生じる。そこでクロスハイブリダイゼーションを防ぐためには、固定化DNA断片と、試料由来のDNA断片のうち固定化DNA断片と本来ハイブリダイズしないDNA断片との相同性が十分低いことが望まれる。この実現は、固定化されるDNA断片の種類(遺伝子数)が多いほど困難になる。表1に遺伝子数が増加した場合にどの程度クロスハイブリダイゼーションが増加するかを計算した結果をしめす。
【0026】
【表1】

Figure 0003897086
【0027】
表1の計算ではまず、GENBANKから千種類の遺伝子配列を引用した。そのうち、無作為に20、200、400、1000種類の遺伝子配列セットを作成した。それら遺伝子配列セットからTmが72℃以上82℃以下となる300塩基対のDNA配列を、各遺伝子について1個無作為に抽出した。それらの無作為抽出DNA配列を遺伝子間で総当り的に互いに比較し、ブラストアルゴリズムに従ってホモロジーを計算した。なおブラストアルゴリズムは、Altschul, S. F.ら、Basic local alignment search tool, J. Mol. Biol. Vol.215, p.403-410, 1990に記載されていたものと同一とした。ブラストアルゴリズムで計算した統計的有意水準(p値)が10%以下の場合、比較された2種類のDNA配列のホモロジーは十分に高い(危険率10%以下)とし、クロスハイブリダイゼーションが生じたとした。例えば表1で示した200遺伝子の場合、200個の遺伝子からそれぞれ無作為に抽出したDNA断片同士を比較したところ、7組の遺伝子、すなわち14個の遺伝子同士でホモロジーが十分に高い(p値<10%)という結果がえられた。この200遺伝子中7組の遺伝子でクロスハイブリダイゼーションが生じたという結果を、クロスハイブリダイゼーションの生じた確率を7%(=14遺伝子/200遺伝子)として表1に記載した。以下同様に、20遺伝子ではクロスハイブリダイゼーションの確率はゼロ、400遺伝子では28%(=112遺伝子/400遺伝子)、1000遺伝子では68%(=680遺伝子/1000遺伝子)であった。類似機能を有する遺伝子同士やアイソフォーム同士でクロスハイブリダイゼーションが高頻度に見られた。表1示した計算の結果、遺伝子数が増加することでクロスハイブリダイゼーションが起こる確率が高くなることが裏付けられた。固定化する遺伝子の種類が増加することにより、クロスハイブリダイゼーションが避けられないことが分かる。遺伝子数が数千から数万に増加した場合、固定化DNA断片の配列決定をよほど慎重に行わなければ、抗悪性腫瘍薬等の作用機序を高精度に解析することはできない。クロスハイブリダイゼーションを皆無とし、かつ融解温度を一定の範囲にそろえてハイブリダイゼーションを高ストリンジェントに行うためには、解析目的に応じて必要最小限の遺伝子数のみをアレイ上に固定化することが望ましい。例えば抗悪性腫瘍薬等の作用機序の解明を目的とする場合、ヒトがんの発生、浸潤、転移の要となる遺伝子を記述するDNA分子と相補結合するDNA断片および、薬物代謝の要となる遺伝子を記述するDNA分子と相補結合するDNA断片のみを固定化したアレイが良い。
【0028】
ここで、図4を用いて固定化断片同士のp値とクロスハイブリダイセイションとの関係を説明する。固定化DNA断片同士の配列相同性が大きくなる(p値が小さくなる)につれ、クロスハイブリダイゼーションが顕著になることは予想がつく。このp値とクロスハイブリダイゼーションとの関係を知るために、以下のような実験を行った。表2に示した遺伝子のうち、IFI56に対応するDNA断片をガラス表面に固定化した。加えてPRSMに対応するDNA断片をガラス表面に固定化した。すなわち2種類の異なるDNA断片をガラス表面に並べて固定化した。一方、蛍光標識したIFI56遺伝子断片を、ガラス表面にふりかけて、ハイブリダイズさせた。IFI56遺伝子断片がIFI56に対応する固定化DNA断片とのみハイブリダイズし、PRSMに対応するDNA断片にはハイブリダイズしなければ、クロスハイブリダイゼーションは零である。すなわち、(PRSMに対応するDNA断片とのハイブリダイズに由来する蛍光強度)と(IFI56に対応するDNA断片とのハイブリダイズに由来する蛍光強度)の比率は零となる。以後、この比率を信号強度比と呼ぶ。またIFI56遺伝子断片が、IFI56に対応するDNA断片とPRSMに対応するDNA断片の両者とハイブリダイズする場合、信号強度比は1になる。すなわちクロスハイブリダイゼーションが頻繁に起こるほど、信号強度比は1に近づく。図4に信号強度比とp値との関係をしめした。p値が小さい(すなわち2種類の固定化DNA断片同士の相同性が大きい)ほど、信号強度比が高い(クロスハイブリダイゼーションが多い)ことが分かる。但しp値が10%を超えた時点で、信号強度比率は、0.01程度まで小さくなった。この結果から、固定化DNA断片同士のp値が10%を超えるようにすれば、クロスハイブリダイゼーションを防ぐことが十分可能となることが分かる。
【0029】
一方、DNA分子同士のハイブリダイゼーションは、1本鎖DNA同士で生じる現象である。1本鎖DNAは通常、溶液中ではその一部が折れ曲がって数個の相補的な塩基対を形成している。この構造はヘアピン構造と呼ばれる。このヘアピン構造のうち、異常に熱安定性が高いヘアピン構造が存在することが分かっている(平尾と三浦、1本鎖DNAの特殊構造 異常に熱安定性が高いミニヘアピン構造、蛋白質核酸酵素、vol.40, p.1583-1592,1995)。このミニヘアピン構造、もしくは特異な高次構造をとる短配列は、例えば、
GCGAAAGC(配列番号1)
GCGAAGC(配列番号2)
である。前者の(配列番号1)のTmは76℃にも達する。この76℃という温度は一般のハイブリダイゼーション温度(40℃から62℃)と比較して有意に高い。このため、前記配列番号1が固定化DNA断片中に含まれた場合、ハイブリダイゼーション時、その配列部分ないしはより広範囲の領域で相補結合を形成しない確率が非常に高い。相補結合を形成しない状態とは、ある意味でミスマッチの状態と同一である。前述のように、2つのDNA間でミスマッチがあれば、両DNAのTmが低下し、ハイブリダイゼーション精度が低下することになる。このため例えば配列番号1や配列番号2のようなミニヘアピン構造はできる限り、固定化DNA断片中に含まれない方がよい。このミニヘアピン構造を生じる可能性のある他の配列としては、短繰り返し配列、例えば、
GGGCGGCGGG(配列番号3)
TTTCATTATTGAAA(配列番号4)
等が考えられる。
【0030】
ヒトDNAにはヒト特有の、Alu配列と呼ばれる、反復配列を多く含む配列の存在が知られている。このAlu配列はヒトDNAに数多く含まれている。またAlu配列は、メッセンジャーRNA内、特に5‘非翻訳領域または3’非翻訳領域にも存在する。仮に、測定対象のメッセンジャーRNAサンプル中にDNA分子が混入していた場合、メッセンジャーRNAを鋳型として蛍光標識をする工程中、混入DNA内もAlu配列部分の存在により蛍光標識されてしまう可能性がある。そしてAlu配列部分を含む標識された混入DNAと、固定化DNA断片とが相補結合することも考えられる。本来メッセンジャーRNAのみを測定すべきが、DNAをも測定してしまう恐れがある。この混入DNAによる誤った解析を避けるためには、固定化DNA断片中にAlu配列と相同性が有意に高い部分が含まれないことが望ましい。またAlu配列には反復構造が多く含まれるので、溶液中で、高次構造をとる可能性があり、前記のミニヘアピン構造と同様にミスマッチを引き起こすことが十分に考えられる。この意味でも固定化DNA断片中にAlu配列と相同性が有意に高い部分が含まれないことが望ましい。例えば、Alu配列と固定化DNA断片とのホモロジーがブラストアルゴリズムで算出した統計的有意水準(p値)で10%を超えるようにすれば、配列相同性が有意に低くなると考えられる。
【0031】
ここで、 Alu配列と固定化DNA断片との配列相同性とノイズ、S/N比との関係について図5を用いて説明する。 Alu配列と固定化DNA断片との配列相同性(p値)が、測定結果に及ぼす影響を観察するために、以下のような実験を行った。まずガラス表面にIFI56に対応するDNA断片を固定化した。それに対して、表2に示した10種類の遺伝子を蛍光標識し、ガラス表面にふりかけてハイブリダイズさせた。最も好ましくは、IFI56に対応する蛍光信号のみが観察されて、それ以外の信号は観察されないのが望ましい。今、Alu配列とのp値が20%以上の配列(Alu配列とのホモロジーが十分低い)での蛍光強度を1に規格化する。Alu配列とのp値が、10%、5%、1%、0.01%以下の場合の、それぞれの蛍光強度(Alu配列とのp値が20%の値を1に規格化した値)を図5に示す。すると、p値が小さくなるにつれ、蛍光強度が増加することが分かった。この増加分は本来ハイブリダイズしないはずのDNA配列がハイブリダイズするために生じたものなので、ノイズである。ノイズ(すなわち、それぞれの蛍光強度から1を引いたもの)を図5に示す。p値10%でほぼ、ノイズは0.1であるが、p値が10%以下になると増加していく。また蛍光強度÷ノイズをSN比率(S/N)と定義する。それぞれのSN比率を計算したところ、p値が10%をきるにつれ、SN比が小さく(測定感度が悪く)なった。図5から、Alu配列とのp値が10%以下の固定化DNA断片では、繰り返し配列や、サンプル中に含まれるコンタミDNA由来のAlu配列の存在により、測定感度が有意に悪化することが分かった。Alu配列と固定化DNA断片とのp値は10%以上とすることで、測定感度の悪化を防ぐことができる。
【0032】
前記、(1)クロスハイブリダイゼーション、(2)特異な高次構造をとる短配列や短繰り返し配列、(3)Aluとの類似配列等の存在が実際のハイブリダイゼーションに及ぼす影響を調べるために、10種類の遺伝子を記述するメッセンジャーRNAの相補DNA(cDNA)配列を、ガラス表面に固定化した実験を行った。この固定化DNA断片(正確にはcDNA断片だが、以後DNA断片と呼ぶ)は、GENBANKの配列から無作為に300、600、900、1200、1500、2100塩基の領域を選択して合成したものである。測定サンプルは、ヒトすい臓ガン細胞(細胞名称CFPAC1)から抽出したメッセンジャーRNA群を鋳型とし、オリゴdTプライマーを用いた逆転写反応により合成されたcDNAとした。なお逆転写して合成されたcDNAは、逆転写反応時に蛍光標識(蛍光試薬名Cy3-dCTP)された。実験で用いた10種類の遺伝子の略号、GENBANKのアクセション番号、遺伝子名称を表2に示す。
【0033】
【表2】
Figure 0003897086
【0034】
図1に、実験により得られた、固定化DNA断片の塩基長がハイブリダイゼーションに及ぼす影響を示す。図中の10個の折れ線グラフのそれぞれは表2で示した10遺伝子を用いた実験の結果である。折れ線グラフ中に遺伝子略号(表2に示す)を記した。折れ線グラフの横軸は固定化DNA断片の塩基長を示す。折れ線グラフの縦軸は蛍光強度を示す。但し縦軸の蛍光強度は300塩基長での蛍光強度を1として規格化した。蛍光強度は背景(バックグランド)の蛍光強度を差し引いた、正味の蛍光強度とした。ハイブリダイゼーション温度は62℃とした。蛍光強度が高いほど、信号強度比(SN比)が高い、すなわち検出感度が高いことに相当する。なお折れ線グラフ中の値は、3回の実験の平均値、エラーバーはその標準偏差である。また各折れ線グラフの下方の横線は、各長さのDNA断片の相対位置関係を示している。5‘末端を左に、3’末端を右にして示した。上から順番に塩基長の長いものから短いものとなっている。横線がオーバラップしているところは、それぞれのDNA断片で共通の配列部分である。
【0035】
図1の結果を見ると、IFI56, GSSの2遺伝子を対象とした場合、固定化DNA断片長が長いほど、緩やかではあるが、蛍光強度すなわち検出感度が高くなる傾向が見られた。またPRSM, UBE, AKT, ADPRT、SMRTの5遺伝子では、測定誤差(エラーバー)を考慮すると、固定化DNA断片長によらずほぼ一定の検出感度が得られた。前記のDNA断片長さが長いほど検出感度が増加する現象は、DNA分子の長さが長いほどDNA分子同士の結合力の安定性が上昇することで説明できる。DNA分子同士の結合力の安定性は、熱力学における自由エネルギー(ΔG)で見積もることができる。ΔGを計算すると塩基長が長いほど小さい値が得られる。ΔGが小さいほど熱力学的安定性が増加するのだ。なお、DNA分子同士のΔGの値は最近接塩基法により計算した(J. SantaLucia, Jr. A unified view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics, Porc. Natl. Acad. Sci. USA, vol.95, p.1460-1465, 1998)。
【0036】
しかし、CASP, PLG, GEMの3遺伝子では、統計的有意にDNA分子の長さと蛍光強度、すなわち検出感度が線形相関していない。CASPでいうと600塩基、CASPでいうと600塩基、GEMでいうと600と1200塩基で、明らかに蛍光強度が低い。この結果は(マイナス要因1)クロスハイブリダイゼーション、(マイナス要因2)特異な高次構造をとる短配列や短繰り返し配列、(マイナス要因3)Aluとの類似配列等の存在といったマイナス要因となる塩基配列部分が、該当部分に含まれているためではないかと推察し、解析を行った。その結果、CASPの600塩基、GEMの600塩基と1200塩基の配列で、その他の配列と重複しない領域において、前記マイナス要因2が存在した。具体的にはCASPの600塩基ではGCGAAAGC(配列番号1)もしくはその相補、反転、相補反転配列のいずれかが存在し、GEMの600塩基と1200塩基ではGCGAAGC(配列番号2)もしくは相補配列、反転配列、相補反転配列のいずれかが存在した。なおGCGAAAGCの相補配列はCGCTTTCG、反転配列はCGAAAGCG、相補反転配列はGCTTTCGCである。但し、PLGについては(1)から(3)のいずれにも該当しなかった。このPLGの結果から、まだ知られていないマイナス要因が存在する可能性が示唆された。図1の結果からも改めて、特異な高次構造をとる短配列や短繰り返し配列の存在が好ましくないことが確認された。また、固定化DNA断片の熱力学における自由エネルギー(ΔG)を小さくすることは、少なくともマイナスにはならず、むしろプラスに作用することも確認された。例えば塩基長を300塩基とした場合、ΔGは、マイナス140からマイナス250程度が好ましい。但しΔGの値は塩基長が長くなるほど小さくなり、塩基配列によっても異なる値をとるので、明確なしきい値を設けることは難しい。
【0037】
図1の結果等を踏まえると、1枚のアレイ上に固定化するDNA断片は、DNA断片のTmがハイブリダイゼーションの温度から30℃を超えないこと、言いかえればある一定の範囲を超えないこと、そのTm条件を満たした上で自由エネルギー(ΔG)を出来る限り小さくすることが重要である。更に加えてクロスハイブリダイゼーションの原因配列の除外、特異な高次構造をとる短配列や短繰り返し配列(以後、有害短配列と呼ぶ)の除外、Aluとの類似配列の除外を行うことが好ましい。これらの条件を全て満足するためには、例えば図2に示した計算アルゴリズムで、固定化DNA断片の配列決定を行えばよい。図2をアルゴリズムの順に従って説明する。はじめにFASTA形式等で記述されたDNAもしくは、メッセンジャーRNAの配列ファイルを読み込み工程(1)、続いて塩濃度やハイブリダイゼーション温度といった実験条件を入力する工程(2)、そして固定化DNA断片の長さ範囲を入力する工程(3)を経て、固定化DNA断片の候補となる複数のDNA配列を選択し、リストにする。続いて、そのリスト中のDNA配列候補の一つ一つについてTmを計算し、そのTmがハイブリダイゼーション温度(Th)と比較してある一定の範囲、例えばTh−αからTh−β(但しα、βの値は正負のどちらの値でもよい)を外れているDNA配列を候補リストから除外する工程(4)、特異な高次構造をとる短配列や短繰り返し配列のあるDNA配列を候補リストから除外する工程(5)、Alu配列とのホモロジーの高いDNA配列を候補リストから除外する工程(6)、他遺伝子配列とのホモロジーの高いDNA配列を候補リストから除外する工程(7)を行う。そして工程4から工程7の全ての条件を満足する配列のいずれかを固定化DNA断片配列とする。複数の配列が工程4から工程7までを満足した際は、例えば自由エネルギー(ΔG)が最小の配列を固定化DNA断片配列とすればよい。
【0038】
工程5では例えば、文字列のパターンマッチングアルゴリズムを用いる。パターンマッチングの対象としては、有害短配列の相補配列、反転配列(GCGAAAGCであれば、CGAAAGCG)、相補反転配列について対象とすることが望ましい。計算速度を向上させるために文字列をいったん数字に変換しビットシフト計算等により比較してもよい。
【0039】
工程6と工程7では、ブラスト(blast)アルゴリズム、ファスタ(FASTA)アルゴリズムなどの探索的(heuristic)アルゴリズムを用いてもよいし、スミスウォータマン(Smith-Waterman)法などのローカルアライメント(local alignment)アルゴリズムや、隠れマルコフモデル(Hidden Markov model)を用いたアルゴリズムなどを用いても良い。計算速度を向上させるために文字列をいったん数字に変換しビットシフト計算等を行ってもよい。
【0040】
また工程7では、1枚のアレイ上に固定化する遺伝子配列同士のホモロジーを計算するのみならず、DNA配列とGENBANK等のヒト遺伝子配列とのホモロジーを計算してもよい。測定対象試料には、固定化DNA断片と本来ハイブリダイズする遺伝子以外にも、数多くの別遺伝子が含まれている。それら別遺伝子がハイブリダイズした場合、本来、個々の固定化DNA断片がハイブリダイズすべき遺伝子のみの測定ができなくなる。そこで、DNAアレイ上に固定化するDNA断片候補の配列と、測定対象試料に含まれている可能性のある遺伝子群のDNA配列とを比較して、ホモロジーが有意に高いDNA配列は、固定化DNA断片としては選択しないことが望ましい。GENBANK等の遺伝子配列データベースには現在までに知られているヒトないしはげっ歯類、酵母、大腸菌などの配列が全て格納されている。固定化DNA断片と、例えばGENBANK等のヒトなどの遺伝子配列とのDNA配列相同性が、ブラスト(Blast)アルゴリズムにより算出した統計的有意水準(p値)で10%を超えることとすれば、より高精度の測定が行える。
【0041】
なおDNA配列のTmの計算には、前述の最近接塩基法(J. SantaLucia, Jr. A unified view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics, Porc. Natl. Acad. Sci. USA, vol.95, p.1460-1465, 1998)と、経験式に基づく方法(Wetmure, J.G., DNA probes: Applications of the principles of nucleic acid hybridization, Criti. Rev in Biochem. And Mol. Biol., vol.26, p.227-259, 1991)の2つがある。50塩基対以下のDNA配列については前者の最近接塩基法がよく合致し、50塩基対以上のDNA配列に対しては後者の経験式に基づく方法がよく合致するという報告もある。しかし前記J. SantaLucia, Jr.の論文によると、最近接塩基法も改良されており、配列長さによらず計算できることが示唆されている。そこで、DNA配列のTm計算には、塩基長さに応じて最近接塩基法もしくは経験式に基づく方法のいずれか片方をもちいる、あるいは両者の方法で計算して得られた値の例えば平均値などを用いれば良い。
【0042】
【発明の実施の形態】
本発明を例えば、抗悪性腫瘍剤等の薬剤の作用機序解明に用いる際の実施の形態について以下に記す。ガラス表面に固定化したヒトがんの発生、浸潤、転移の要となる遺伝子および、薬物代謝の要となる遺伝子のリストを表3から表18に示す。
【0043】
【表3】
Figure 0003897086
【0044】
【表4】
Figure 0003897086
【0045】
【表5】
Figure 0003897086
【0046】
【表6】
Figure 0003897086
【0047】
【表7】
Figure 0003897086
【0048】
【表8】
Figure 0003897086
【0049】
【表9】
Figure 0003897086
【0050】
【表10】
Figure 0003897086
【0051】
【表11】
Figure 0003897086
【0052】
【表12】
Figure 0003897086
【0053】
【表13】
Figure 0003897086
【0054】
【表14】
Figure 0003897086
【0055】
【表15】
Figure 0003897086
【0056】
【表16】
Figure 0003897086
【0057】
【表17】
Figure 0003897086
【0058】
【表18】
Figure 0003897086
【0059】
続いて、図1のアルゴリズムを用いて計算した、表3から表18に示した遺伝子の一部に対応する固定化DNA断片配列リストを表19から表38に示す。
【0060】
【表19】
Figure 0003897086
【0061】
【表20】
Figure 0003897086
【0062】
【表21】
Figure 0003897086
【0063】
【表22】
Figure 0003897086
【0064】
【表23】
Figure 0003897086
【0065】
【表24】
Figure 0003897086
【0066】
【表25】
Figure 0003897086
【0067】
【表26】
Figure 0003897086
【0068】
【表27】
Figure 0003897086
【0069】
【表28】
Figure 0003897086
【0070】
【表29】
Figure 0003897086
【0071】
【表30】
Figure 0003897086
【0072】
【表31】
Figure 0003897086
【0073】
【表32】
Figure 0003897086
【0074】
【表33】
Figure 0003897086
【0075】
【表34】
Figure 0003897086
【0076】
【表35】
Figure 0003897086
【0077】
【表36】
Figure 0003897086
【0078】
【表37】
Figure 0003897086
【0079】
【表38】
Figure 0003897086
【0080】
最後に、表3から表18に示した遺伝子をガラス表面に固定化したDNAアレイを用いて、抗悪性腫瘍剤(薬品名:5−aza−2‘−deoxy−cytidine)に対するヒト培養細胞(細胞名:HT29)の遺伝子発現分布の測定結果を図3に示す。以下、順に従って説明する。
【0081】
(1)DNAアレイ上の遺伝子リスト
表3に、本願請求項2記載の基準に従って選択したヒトがんの発生、浸潤、転移の要となる遺伝子および、本願請求項3記載の基準に従って選択した薬物代謝の要となる遺伝子のリストを示す。それぞれの遺伝子配列に対応するGENBANKのアクセション番号と、遺伝子名を記載した。
【0082】
(2)遺伝子リストのうちの一部配列リスト
表4に、表3に示した遺伝子の一部に対応する固定化DNA断片配列のリストを示す。それぞれのDNA断片配列、DNA断片配列の塩基長(length)、DNA断片配列の自由エネルギー(dG),経験式に基づく方法で計算したDNA断片配列の融解温度(Tm1)、最近接塩基法で計算したDNA断片配列の融解温度(Tm2)を併記した。ここでは融解温度(Tm)は、Tm1とTm2の平均値とした。表4のDNA断片配列のTm(=0.5*(Tm1+Tm2))が72℃から82℃となるように設計した。
【0083】
(3)実験結果の一例
図3に、ヒト結腸癌培養細胞(名称:HT29細胞)に、5−aza−2‘−deoxy−cytidine(以下5−Aza−CdR)処理した場合に、処理しない場合と比較して増加したメッセンジャーRNA量の増加率を、遺伝子ごとに示す。5−Aza−CdR処理とは、500ナノモルの5−Aza−CdRに細胞をそれぞれ2、12、24時間さらすことを意味する。それぞれの時間さらされたHT29細胞から、すぐにメッセンジャーRNAを抽出した。同様に、薬剤処理をしないHT29細胞も同一の培養機中で培養し、それぞれの時間経過後、すぐにメッセンジャーRNAを抽出した。オリゴdTプライマーを用いた逆転写反応により、薬剤処理した細胞のメッセンジャーRNAについては、Cy5−dCTPを用いて蛍光標識されたcDNAを合成した。また薬剤処理しない細胞のメッセンジャーRNAについては、Cy3−dCTPを用いて蛍光標識されたcDNAを合成した。薬剤処理した細胞由来のcDNA(Cy5標識)と薬剤処理しない細胞由来のcDNA (Cy3標識)を混合して、同一のDNAアレイとハイブリダイズさせた。ハイブリダイゼーション温度は62℃、ハイブリダイゼーション時間は12時間とした。ハイブリダイゼーション後、蛍光スキャナーによりCy5とCy3のそれぞれの蛍光強度を数値化した。
【0084】
薬剤処理した細胞由来の蛍光強度(Cy5蛍光強度)と薬剤処理しない細胞由来蛍光強度(Cy3蛍光強度)の比、すなわちCy5蛍光強度/Cy3蛍光強度を値を計算し、図3の縦軸の値、メッセンジャーRNA量の増加率としてプロットした。図3の横軸はアレイ上の遺伝子の通し番号である。この実験の結果、Cy5蛍光強度/Cy3蛍光強度が3倍以上であった遺伝子は、例えば2時間後で、SIAT4A、PRSM1、ribosomal protein S5、plasminogen、ETR103、OCTS3、integrin 4、GEM、RGS14、HsCds18、IFN-induced protein 56, INFα-inducible protein 27、INF-induced 17kDa protein, INF-induced protein IFI-6-16, INF-inducible protein 10などであった。そして2、12、24時間を通じて、常にCy5蛍光強度/Cy3蛍光強度が3倍以上であったのはインタフェロン(IFN)αに関連する遺伝子群、IFN-induced protein 56, INFα-inducible protein 27、INF-induced 17kDa protein, INF-induced protein IFI-6-16, INF-inducible protein 10などであった。この結果は、Karpfらの報告(Karpf, A.R.ら、Inhibition of DNA methyltransferase stimulates the expression of signal transducer and activator of transcription 1, 2, ad 3 genes in colon tumor cells, Proc. Natl. Acad. Sci. USA, vol.96, p.14007-14012, 1999)らの知見とも合致した。さらKarpfらの報告に対し、本発明では薬剤応答の時間依存の様子を再現性よく観察することができた。
【0085】
本発明を実施することで、抗悪性腫瘍剤の一種である5−Aza−CdRに対するヒト細胞の薬剤応答の様子の時間依存性を再現性良くかつ高精度で観察した。5−Aza−CdR以外の薬剤についても同様な結果を得ることができる。
【0086】
【発明の効果】
抵悪性腫瘍薬等の作用機序を高精度で解明するためのDNAアレイ、及びその製造方法を提供する。
【図面の簡単な説明】
【図1】固定化DNA断片の塩基長がハイブリダイゼーションに及ぼす影響。
【図2】DNA断片配列決定計算アルゴリズム。
【図3】HT29細胞に、5−aza−2‘−deoxy−cytidine処理した場合に、処理しない場合と比較して増加したメッセンジャーRNA量の増加率。
【図4】固定化DNA断片同士の配列相同性とクロスハイブリダイゼーションとの関係を示す図。
【図5】Alu配列と固定化DNA断片との配列相同性と測定結果との関係を示す図。
【符号の説明】
1.遺伝子配列ファイルの読み込み工程、2.塩濃度、ハイブリダイゼーション等の実験条件の入力工程、3.固定化DNA断片の長さ範囲の入力工程、4. 固定化DNA断片の融解温度を計算し、その融解温度がある一定の範囲を外れているDNA断片を候補リストから除外する工程、5. 特異な高次構造をとる短配列や短繰り返し配列のあるDNA DNA断片を候補リストから除外する工程、6.Alu配列とのホモロジーの高いDNA断片を候補リストから除外する工程、7.他遺伝子配列とのホモロジーの高いDNA断片を候補リストから除外する工程。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a DNA array for elucidating the mechanism of action of an anti-neoplastic agent and the like, and a production method thereof.
[0002]
[Prior art]
Treatment of malignant tumors includes surgical therapy, radiosurgery therapy and chemotherapy. Chemotherapy for malignant tumors is intended to suppress selective growth and proliferation of tumor cells by utilizing the difference in sensitivity between normal cells and malignant tumor cells for antitumor drugs. However, antineoplastic drugs are not qualitatively different in their effects on tumor cells and normal cells, and are therefore toxic to normal cells. Therefore, a drug having a greater effect on a malignant tumor has a greater influence on normal cells and a greater possibility of causing serious side effects. However, the development of more powerful and effective drugs has always been made to counter the acquisition of tumor cell resistance (the appearance of tumor cells that are resistant to the drug by the continuous administration of antineoplastic drugs). It is desired. In addition, there are many cancers that are difficult to cure with drugs such as non-small cell lung cancer, pancreatic cancer, malignant melanoma, and kidney cancer, which is why the development of more powerful antineoplastic drugs is awaited.
[0003]
In order to develop a good antineoplastic drug, it is desired that the side effect is small as well as the strength against tumor. In order to satisfy these contradictory conditions, it is necessary to perform drug discovery after understanding the mechanism (mechanism of action) of the drug. For this purpose, it is desirable to understand the mechanism of action of drugs by digging down to the gene level.
[0004]
The genetic information described in the gene on the DNA molecule is transcribed into messenger RNA and translated into protein in the ribosome. This process from transcription to messenger RNA and translation to protein is called gene expression. In order to understand the mechanism of drug action at the genetic level, what genes and proteins are involved in the process from drug administration to metabolism and actual tumor toxicity, It is desirable to track over time. This is because gene and protein interactions and pathways (gene pathways) are revealed by this tracking. Once the genetic pathway is clarified, treatment strategies can be improved, such as reducing side effects by using other drugs that act on the genes on the pathway. It also provides guidelines for improving the drug itself.
[0005]
In order to clarify the genetic pathway, there are (1) a method for observing quantitative changes in messenger RNA and (2) a method for examining quantitative changes in protein and spatial distribution. The former includes DNA array (or DNA chip), Northern hybridization, and RT-PCR method. Examples of the latter include Yeast Two Hybrid and antibody staining. Among the above methods, as a technique for simultaneously viewing changes in several tens to several hundreds of genes that will be involved in the action of a drug, a method for viewing messenger RNA of (1), particularly a technique called a DNA array method, It is most suitable from the viewpoint of simplicity, throughput, and cost, and is currently being actively researched.
[0006]
DNA array method can measure thousands to tens of thousands of messenger RNAs at once (Duggan, DJ et al., Expression profiling using cDNA microarrays, Nature genetics supplement, vol.21, p10-14, 1999) . In general, a DNA array is obtained by immobilizing a complementary DNA (complementary DNA or cDNA) having a sequence complementary to messenger RNA as a probe on a glass slide (Lockhart, DJ et al., Expression monitoring by hybridization to high- density oligonucleotide arrays, Nature biotechnology, vol.14, p.1675-1680, 1996). The experimenter extracts messenger RNA from cells, organs, etc., and then synthesizes fluorescently labeled cDNA from messenger RNA using reverse transcriptase and a fluorescent labeling substance. Thereafter, the fluorescently labeled cDNA is sprinkled on the DNA array. Subsequently, the DNA array is held at a constant temperature for a fixed time, and the fluorescently labeled cDNA and the DNA array are complementarily bound (hybridized). Thereafter, the DNA array is washed, and the non-specifically bound fluorescently labeled cDNA is washed away (the non-specifically bound cDNA has a complementary binding force compared to the specifically bound cDNA). Finally, the fluorescence signal intensity corresponding to the individual probes immobilized on the DNA array is measured. The amount of messenger RNA is proportional to the fluorescence signal intensity hybridized with the corresponding probe. In this way, the amount of messenger RNA corresponding to various genes in organs and cells can be measured. For example, by taking out messenger RNA from cells or organs at every elapsed time after drug administration and measuring it by the DNA array method, it is possible to see the time change of the amount of messenger RNA for each gene. An increase in the amount of messenger RNA means that genetic information from the DNA molecule is actively transcribed, and corresponds to an increase in the function of the gene. By analyzing the time change of the function of this gene, information on the gene pathway can be obtained.
[0007]
In recent years, DNA pathways have been used to determine gene pathway information. In recent years, almost all yeast genes have been immobilized on a single array, and quantitative changes in messenger RNA when stimuli such as drug administration are applied are measured. An attempt has been made (DeRisi, JL et al., Exploring the metabolic and genetic control of gene expression on a genomic scale, Science, vol.278, p.680-686, 1997, Roberts, CJ et al., Signaling and circuitry of multiple MAPK pathways revealed by a matrix of global gene expression profiles, Science, vol.287, p.873-880, 2000). The relationship between drug administration and gene pathway has also been investigated by observing quantitative changes in messenger RNA after drug administration by destroying part of the yeast gene (Marton, MJ et al., Drug target validation and identification of secondary drug target effects using DNA microarrays, Nature Medicine, vol.4, p.1293-1301, or Stoughton et al. Methods for identifying pathways of drug action, US patent 5965352). However, the mechanism of action of drugs in yeast is not the same as the mechanism of action of drugs in humans. This is because the function and number of genes differ between yeast and human. In particular, disruption of yeast genes has been shown not only to change messenger RNA levels but also to changes in the number of chromosomes (Hughes, TR et al., Widespread aneupolidy revealed by DNA microarray expression profiling, Nature genetics, vol.25, p.333-337, 2000). This change in the number of chromosomes is a cause of serious diseases such as Down's syndrome in humans, and almost no phenomenon in normal cells excluding cancer cells. From this point of view, care must be taken when extrapolating knowledge obtained from yeast, particularly yeast that has disrupted a specific gene, to humans. It is desirable to accumulate knowledge on human cells rather than relying solely on information obtained from yeast.
[0008]
What is the difference in the amount of messenger RNA transcribed from individual genes (about 9700) when various anticancer drugs are administered to multiple cultured human cancer cells and when not administered? There is an example of studying whether it appears (Scherf, U. et al., A gene expression database fot the molecular pharmacology of cance RNAture genetics, vol. 24, p. 236-244, 2000). In this study, a cluster analysis was performed to determine which gene messenger RNA level was changed in each of various cultured human cancer cells for a certain drug. In addition, a cluster analysis of which gene messenger RNA amount was changed at the time of administration of various drugs to a certain human cancer cultured cell was performed at the same time.
[0009]
[Problems to be solved by the invention]
However, regarding the results of examining the difference in the amount of RNA described above, if the response mechanism to various drugs is originally common to each cell, the results of both cluster analyzes must be common. However, according to the above-mentioned paper by Scherf et al., The results of cluster analysis between cell types and messenger RNA and the results of cluster analysis between drug types and messenger RNA were very different. After all, the above-mentioned paper by Scherf et al. Does not provide new information on gene pathways. It should be noted that in the DNA array used by Scherf et al., Changes in the amount of messenger RNA corresponding to about 9700 genes have been measured with high accuracy separated for each gene, and it has not been examined. . As will be described later, it is considered that experiments separated with high accuracy for each gene can be performed only after a probe design technique for ensuring measurement accuracy is applied.
[0010]
As will be described later, since an existing array having several thousand to several tens of thousands of genes has a large number of genes to be immobilized, it is difficult to separate each gene with high accuracy. For this reason, an array having thousands to tens of thousands of genes is suitable for gene discovery, but is not necessarily suitable for analysis use for observing gene pathways.
[0011]
[Means for Solving the Problems]
In order to analyze the mechanism of action of antineoplastic drugs with high accuracy, it is inevitable that a DNA fragment that should bind only to one type of gene binds to another gene (cross-hybridization). It is obvious that it must not be. This becomes more difficult as will be described later as the number of genes immobilized on one array increases. Therefore, it is very difficult to eliminate cross-hybridization between each gene in a DNA array for searching which has thousands to tens of thousands of genes. In order to solve this problem, if the purpose of using a DNA array is elucidation of the mechanism of action of, for example, antineoplastic agents, only the genes related to the mechanism of action of the drug are minimized as much as possible ( as small as reasonably achievable). In addition, in a DNA array for yeast, there is a limit in reflecting the knowledge directly on humans. This is also a problem with DNA arrays targeting experimental animals such as mice and rats. In order to solve this problem, an array using human genes is preferable.
[0012]
In order to collect only the minimum necessary genes related to the mechanism of action of anti-neoplastic agents, the process after the drugs such as anti-neoplastic agents are taken into the body will be considered. After being taken into the body, the drug is metabolized by drug metabolizing enzymes with few exceptions. Some drugs lose their efficacy after being metabolized, some drugs exhibit their efficacy only after being metabolized, and others exhibit undesirable toxicity when metabolized. Therefore, in order to analyze the mechanism of action of antineoplastic drugs and the like at the gene level, it is necessary to analyze at least gene expression related to drug metabolism.
[0013]
In addition, drugs such as antineoplastic agents are originally expected to have medicinal effects such as killing malignant tumors, suppressing occurrence, suppressing invasion, and suppressing metastasis. A side effect is a case where an effect different from the expectation is brought about, and the side effect should be reduced as much as possible. Therefore, it is necessary to analyze the expression of genes related to cancer, particularly genes related to cancer occurrence, invasion and metastasis.
[0014]
That is, in order to analyze the efficacy of antineoplastic drugs with high accuracy, a DNA array in which (1) a drug metabolism-related gene and (2) a cancer-related gene are immobilized to a minimum amount is most suitable. . Next, the reasons for selecting drug metabolism-related genes and cancer-related genes to be immobilized on the DNA array will be shown.
[0015]
(A) Reasons for selecting drug metabolism-related genes
Drugs taken by the body are metabolized as much as possible. Various metabolic enzymes are involved in this metabolism. And the drug metabolic reaction involving the metabolic pathway in the living body usually does not occur randomly. Also, certain special drug metabolism pathways usually do not function alone. It has been found that the activity of one pathway affects the activity of the other pathway and mutually controls metabolism. One theory is that about a thousand genes are involved in drug metabolism, including minor ones. Drug metabolism reactions are generally classified into first phase reactions (functional group introduction reactions) and second phase reactions (conjugation reactions). In the first phase reaction, chemical reactions such as oxidation, reduction, hydrolysis, hydration, dethioacetylation, isomerization occur, and in the second phase reaction, glucuronic acid or glucose conjugation reaction, sulfate conjugation, methyl conjugation, acetyl conjugation, Each chemical reaction such as amino acid conjugation, glutathione conjugation, fatty acid conjugation, and condensation occurs.
[0016]
Covering all the various drug metabolism-related enzymes as described above results in an increase in the number of DNA fragments, which is contrary to the achievement of high-accuracy analysis without cross-hybridization as described above. Therefore, the major (major) contribution is selected from the first phase reaction and the second phase reaction. In humans, cytochrome 450 genes (CYP) 1A1, CYP1A2, CYP1B1, CYP2A6, CYP2B6, CYP2C8, CYP2C9, CYP2C19, CYP2D6, CYP2E1, CYP3A4, CYP3A7, CYP3A7, CYP3A7, CYP3A7, CYP3A7 Typical examples include dehydrogenase, dihydroxypyrimidine dehydrogenase, NADPH-cytochrome P450 reductase, DT-diaphorase, esterase, and epoxide hydrase, and more than 90% of the total drug metabolism is said to be due to the function of the gene ( Evans, WE and Relling, M., Pharmacogenomics: Translating functional genomics into rational therapeutics, Science, vol. 266, p. 487-491, 1999). Further, catechol O-methyl transferase, glutathione S-transferase, histamine methyl transferase, N-acetyl transferase, sulfotransferase, thiopurine methyl transferase, uridine 5′-triphosphate glucuronyl transferase are genes associated with the second phase reaction. It is also said to be involved in more than 80% of drug metabolism (Evans, WE and Relling, M., ibid). Thus, with regard to drug metabolism of at least 80% or more, an approximate drug metabolism mechanism can be analyzed by looking at the gene expression of the above gene group.
[0017]
(b) Selection of cancer-related genes
Normally, the growth of cells is controlled, but cancer cells are cells that are mutated to grow autonomously without being controlled by the body. For this reason, cancer cells often have abnormalities in genes that regulate cell proliferation and cell cycle. For example, cell growth factors include epidermal growth factor (EGF) and its receptor (EGF receptor, EGFR), platelet-derived growth factor (PDGF) and its receptor (PDGFR), insulin-like Growth factor (IGF), its insulin-like growth factor (IGFR), its receptor (IGFR), fibroblast growth factor (FGF), its receptor (FGFR), vascular endothelial growth factor (VEGF, vascular endotherial growth factor) ) And its receptor (VEGFR), hepatocyte growth factor (HGF) and its receptor (HGFR), neurotrophic factor (NT, neurotropin), transforming growth factor-β (TGFβ, transforming growth factor-β ) An abnormality is seen in the family. In addition, there may be an abnormality in a receptor gene corresponding to each growth factor, for example, an EGF receptor (EGFR) with respect to EGF. As factors that induce cell proliferation and differentiation, physiologically active peptides secreted by lymphocytes and blood cells are collectively referred to as cytokines. Major cytokines include granulocyte colony stimulating factor (G-CSF), macrohage-colony stimulating factor (M-CSF), and granulocyte macrophage colony stimulating factor (GM-CSF, granulocyte). -macrophage colony stimulating factor), erythropoietin, thrombopoietin, stem cell factor, interleukin 1,2,3,4,5,6,7,8,9, Abnormalities are observed in 10, 11, 12, tumor necrosis factor (TNF), interferon, and the like. Cyclin, cyclin-dependent kinase (CDK), CDK inhibitor (CKI, CDK inhibitor) such as cyclin A, cyclin B, cyclin D, cyclin E, CDK1 CDK2, CDK4, CDK6, p16INK, p15, p21, p27, retinoblastoma (RB) gene, etc. are abnormal.
[0018]
Even if an abnormality occurs in the mechanism of cell death, the cell becomes cancerous. Most cell death that occurs in living bodies is cell death called apoptosis. Apoptotic pathways include (a) calcium pathway, (b) death signaling pathway, (c) ceramide pathway, (d) mitochondrial pathway, and (e) DNA damage pathway. (a) The calcium pathway is activated by activation of intracellular phosphazilinositol triphosphate receptors by the action of glucocorticoids. (b) The death signal pathway is triggered by binding of TNF alpha and Fas ligand to a cell surface receptor (TNF receptor, Fas). Thereafter, protein molecules associated with the intracellular domain of the receptor (TRADD, FADD, RAIDD etc. for TNF receptor 1, FADD, RIP, RAIDD etc. for Fas) are activated. Activation of these proteins activates caspase genes (CASP) 8, 1, 3 and the like. In addition, it is known that caspase gene-related genes such as TRAMP and TRAIL suppress apoptosis. (c) The ceramide pathway is activated by various stresses such as radiation, ultraviolet rays, heat and hydrogen peroxide. More specifically, apoptosis is induced by an increase in ceramide and activation of SAPK (stress-acivated protein kinase) / JNK (Jun terminal-N kinase). (d) The mitochondrial pathway is triggered by various stimuli such as radiation, ultraviolet light, heat, hydrogen peroxide, etc., and activates Bax2 (Bcl-2 associated X protein), Bcl-2, Bcl-xL, and associated caspase genes Activation occurs, and apoptosis is induced. (e) In the DNA damage pathway, p53, p21, p51, p73, MDM2 gene and the like are involved. Abnormalities of the apoptosis-related gene have been observed in cancer cells.
[0019]
A gene known to promote canceration of cells due to its abnormality is called an oncogene. The oncogenes are classified according to the signal transduction flow: (a) growth factor group (eg sis gene), (b) receptor tyrosine kinase group (eg erbB, fms, ret gene), (c) non-receptor type Tyrosine kinase group (eg fes gene), (d) GTP / GDP binding protein (eg ras gene), (e) serine / threonine kinase group (eg src, mos, raf gene), (f) nuclear protein group (eg , Myc, myb, fos, jun, erbA gene), (g) a signal transduction adapter molecule (for example, crk gene), and a fusion gene (for example, Bcr-Abl gene). In addition, genes on major signal transduction systems are often classified as oncogenes. Ras-MAP kinase pathways (eg Shc, Grb2, Sos, MEK, Rho, Rac genes), phospholipase C gamma-protein kinase C pathway (eg PLCγ, PKC genes), phosphadylinositol 3-phosphorus Acid kinase-Akt pathways (eg, PI3K, Akt, Bad genes), JAK-STAT pathways (JAK, STAT), GAP pathways (eg, GAP, p180, p62) and the like are known as oncogenes. As for nuclear transcription factors, Myc, Ear, Evi, Gli, Fos, Fra, jun, Maf, Ets, Myb, IRF1, IRF2, Rel, Nf-kappa B, AML, etc. are known to have carcinogenic activity. Yes.
[0020]
Loss of the function of a gene that suppresses canceration of a cell or a tumor suppressor gene advances the canceration step of the cell. The major tumor suppressor genes discovered so far are RB, p53, WT1, NF1, APC, VHL, NF2, CDKN / p16, BRCA1, BRCA2, TGFβRII, DPC4, PTCH, PTEN, MEN1, E-cadherin gene, nm23 Etc.
[0021]
When DNA is damaged, the cells sometimes go to apoptosis or may be repaired. When an error occurs in the DNA repair process, a mutation occurs in the gene. Mutations cause cell canceration with a high probability. Examples of DNA repair genes in humans include MSH2, MSH3, MSH6, MLH1, PMS1, PMS2, PMS3, methylguanine-DNA methyltransferase (MGMT), and the like.
[0022]
The matrix metalloproteinase (MMP) group is generally produced in excess in cancer cells as metastasis-related genes related to cancer metastasis. MMP degrades collagen, which is the main component of the intercellular matrix. In addition, abnormalities of TMP (tissue inhibitor of metalloprotease), an inhibitor of MMP, are also found in cancer cells. In addition, cadherin that allows cells to adhere to each other, catenin (α catenin, β catenin, γ catenin), hyaluronic acid receptor family (CD44), integrin family, immunoglobulin family, selectin family, sialomucin, which are the intracellular regions of cadherin It has been pointed out that the family and other abnormalities are associated with cancer.
[0023]
As mentioned above, oncogenes, tumor-related genes, tumor suppressor genes, growth factors, transcription factors, cytokines, apoptosis genes ), Cell cycle regulators, DNA damage repair genes, transcription-related genes, etc. Analyzes can be performed with the minimum necessary for the introduction.
[0024]
In order to perform hybridization between each DNA fragment immobilized on the DNA array and the sample-derived DNA fragment with high precision (or highly stringent), the hybridization temperature (Th, hybridization temperature) ) And the melting temperature (Tm, melting temperature) of the immobilized DNA fragment is important. This is because the following relationship is known between sequence homology between DNAs and Tm. The relationship is that the Tm of both DNAs decreases by 1.4 ° C. due to a 1% base sequence difference (mismatch) between the two DNAs. That is, when the immobilized DNA fragment is Tm equal Th, the sample-derived DNA fragment having 100% homology (homology) with the base sequence of the immobilized DNA fragment hybridizes. When Th and Tm differ by 10 ℃
100% − (10 ° C./1.4° C.) = 92.9%
Thus, the sample-derived DNA fragment having about 93% to 100% homology with the base sequence of the immobilized DNA fragment hybridizes. Similarly, when Th and Tm differ by 20 ° C., 85.7% to 100% homology, and when Th and Tm differ by 30 ° C., 78.6% to 100% homology will hybridize. When performing separation with high accuracy, it is desirable that only at least 80% to 100% homology hybridize. For this reason, it is necessary for the separation with high accuracy that the difference between the melting temperature of the immobilized DNA fragment and the hybridization temperature does not exceed 30 ° C.
[0025]
Another important condition for highly accurate hybridization between each DNA fragment immobilized on the DNA array and the sample-derived DNA fragment is to eliminate cross-hybridization. Cross-hybridization occurs because of the high homology between DNA sequences. Therefore, in order to prevent cross-hybridization, it is desired that the homology between the immobilized DNA fragment and a DNA fragment that does not originally hybridize with the immobilized DNA fragment among the DNA fragments derived from the sample is sufficiently low. This realization becomes more difficult as the number of DNA fragments to be immobilized (number of genes) increases. Table 1 shows the results of calculating how much cross-hybridization increases when the number of genes increases.
[0026]
[Table 1]
Figure 0003897086
[0027]
In the calculation of Table 1, first, 1000 kinds of gene sequences were cited from GENBANK. Among them, 20, 200, 400, and 1000 kinds of gene sequence sets were randomly generated. A 300 base pair DNA sequence having a Tm of 72 ° C. or higher and 82 ° C. or lower was randomly extracted from each gene sequence set for each gene. Their randomly sampled DNA sequences were compared to each other across genes and homology was calculated according to the blast algorithm. The blast algorithm was the same as that described in Altschul, SF et al., Basic local alignment search tool, J. Mol. Biol. Vol. 215, p. 403-410, 1990. When the statistical significance level (p value) calculated by the blast algorithm was 10% or less, the homology of the two kinds of DNA sequences compared was sufficiently high (risk rate 10% or less), and cross-hybridization occurred. . For example, in the case of 200 genes shown in Table 1, when DNA fragments randomly extracted from 200 genes are compared with each other, 7 genes, that is, 14 genes, have sufficiently high homology (p value). The result was <10%). Table 1 shows the result of the occurrence of cross-hybridization in 7 sets of 200 genes, with the probability of occurrence of cross-hybridization being 7% (= 14 genes / 200 genes). Similarly, the probability of cross-hybridization was zero for 20 genes, 28% for 400 genes (= 112 genes / 400 genes), and 68% for 1000 genes (= 680 genes / 1000 genes). Cross-hybridization was frequently observed between genes having similar functions and between isoforms. As a result of the calculation shown in Table 1, it was confirmed that the probability of cross-hybridization increases as the number of genes increases. It can be seen that cross-hybridization is unavoidable due to an increase in the types of genes to be immobilized. When the number of genes increases from several thousand to several tens of thousands, the action mechanism of an antineoplastic drug or the like cannot be analyzed with high accuracy unless sequencing of the immobilized DNA fragment is performed with great care. In order to eliminate cross-hybridization and perform hybridization at high stringency with the melting temperature kept within a certain range, it is necessary to immobilize only the minimum number of genes on the array according to the purpose of analysis. desirable. For example, for the purpose of elucidating the mechanism of action of antineoplastic agents, etc., DNA fragments complementary to DNA molecules that describe genes responsible for human cancer development, invasion, and metastasis, and the key to drug metabolism An array in which only a DNA fragment that complementarily binds to a DNA molecule that describes the gene is immobilized.
[0028]
Here, the relationship between the p-value between the immobilized fragments and cross-hybridization will be described with reference to FIG. As the sequence homology between immobilized DNA fragments increases (p value decreases), it can be predicted that cross-hybridization will become more prominent. In order to know the relationship between the p value and cross hybridization, the following experiment was conducted. Among the genes shown in Table 2, a DNA fragment corresponding to IFI56 was immobilized on the glass surface. In addition, a DNA fragment corresponding to PRSM was immobilized on the glass surface. That is, two kinds of different DNA fragments were immobilized on the glass surface. On the other hand, the fluorescently labeled IFI56 gene fragment was sprinkled on the glass surface and hybridized. If the IFI56 gene fragment only hybridizes with the immobilized DNA fragment corresponding to IFI56 and does not hybridize to the DNA fragment corresponding to PRSM, cross-hybridization is zero. That is, the ratio of (fluorescence intensity derived from hybridization with a DNA fragment corresponding to PRSM) and (fluorescence intensity derived from hybridization with a DNA fragment corresponding to IFI56) is zero. Hereinafter, this ratio is referred to as a signal intensity ratio. When the IFI56 gene fragment is hybridized with both the DNA fragment corresponding to IFI56 and the DNA fragment corresponding to PRSM, the signal intensity ratio is 1. That is, the signal intensity ratio approaches 1 as the cross hybridization occurs more frequently. FIG. 4 shows the relationship between the signal intensity ratio and the p value. It can be seen that the smaller the p value (that is, the greater the homology between the two types of immobilized DNA fragments), the higher the signal intensity ratio (the more cross hybridization). However, when the p value exceeded 10%, the signal intensity ratio decreased to about 0.01. From this result, it can be seen that cross-hybridization can be sufficiently prevented if the p-value between immobilized DNA fragments exceeds 10%.
[0029]
On the other hand, hybridization between DNA molecules is a phenomenon that occurs between single-stranded DNAs. Single-stranded DNA is usually bent in solution to form several complementary base pairs. This structure is called a hairpin structure. Among these hairpin structures, it is known that there are hairpin structures with unusually high thermal stability (Hirao and Miura, special structures of single-stranded DNA, mini-hairpin structures with unusually high thermal stability, protein nucleic acid enzymes, vol.40, p.1583-1592,1995). This mini hairpin structure, or a short sequence with a specific higher order structure, for example,
GCGAAAGC (SEQ ID NO: 1)
GCGAAGC (SEQ ID NO: 2)
It is. The former (SEQ ID NO: 1) has a Tm of 76 ° C. This temperature of 76 ° C. is significantly higher than the general hybridization temperature (40 ° C. to 62 ° C.). For this reason, when SEQ ID NO: 1 is contained in the immobilized DNA fragment, there is a very high probability that a complementary bond will not be formed in the sequence portion or in a wider range during hybridization. In a sense, the state where no complementary bond is formed is the same as the mismatch state. As described above, if there is a mismatch between two DNAs, the Tm of both DNAs is lowered, and the hybridization accuracy is lowered. For this reason, for example, it is better not to include a mini hairpin structure such as SEQ ID NO: 1 or SEQ ID NO: 2 in the immobilized DNA fragment as much as possible. Other sequences that can give rise to this mini hairpin structure include short repeat sequences such as
GGGCGGCGGG (SEQ ID NO: 3)
TTTCATTATTGAAA (SEQ ID NO: 4)
Etc. are considered.
[0030]
It is known that human DNA has a sequence containing many repetitive sequences called Alu sequence, which is peculiar to humans. Many Alu sequences are contained in human DNA. Alu sequences are also present in messenger RNA, particularly in the 5 ′ untranslated region or the 3 ′ untranslated region. If DNA molecules are mixed in the messenger RNA sample to be measured, during the step of fluorescent labeling using the messenger RNA as a template, the contaminated DNA may be fluorescently labeled due to the presence of the Alu sequence portion. . And it is also conceivable that the labeled contaminating DNA containing the Alu sequence portion and the immobilized DNA fragment are complementarily bound. Originally, only messenger RNA should be measured, but DNA may also be measured. In order to avoid erroneous analysis due to this contaminated DNA, it is desirable that the immobilized DNA fragment does not contain a portion having a significantly high homology with the Alu sequence. In addition, since the Alu sequence contains a large number of repetitive structures, there is a possibility that a higher-order structure may be formed in the solution, and it is fully conceivable that a mismatch is caused in the same manner as the above-described mini hairpin structure. In this sense, it is desirable that the immobilized DNA fragment does not contain a portion having a significantly high homology with the Alu sequence. For example, if the homology between the Alu sequence and the immobilized DNA fragment exceeds 10% at the statistical significance level (p value) calculated by the blast algorithm, the sequence homology is considered to be significantly reduced.
[0031]
Here, the relationship between the sequence homology between the Alu sequence and the immobilized DNA fragment, noise, and S / N ratio will be described with reference to FIG. In order to observe the influence of the sequence homology (p value) between the Alu sequence and the immobilized DNA fragment on the measurement results, the following experiment was performed. First, a DNA fragment corresponding to IFI56 was immobilized on the glass surface. In contrast, 10 kinds of genes shown in Table 2 were fluorescently labeled and sprinkled on the glass surface for hybridization. Most preferably, only the fluorescence signal corresponding to IFI56 is observed and no other signals are observed. Now, the fluorescence intensity in a sequence having a p value of 20% or more with the Alu sequence (the homology with the Alu sequence is sufficiently low) is normalized to 1. Fluorescence intensities when the p value with the Alu sequence is 10%, 5%, 1%, or 0.01% or less (value obtained by normalizing the value with the p value of 20% with the Alu sequence to 1) Is shown in FIG. Then, it was found that the fluorescence intensity increased as the p value decreased. This increase is noise because it occurs because the DNA sequence that should not hybridize originally hybridizes. Noise (ie, each fluorescence intensity minus 1) is shown in FIG. The noise is 0.1 at a p value of 10%, but increases when the p value is 10% or less. Further, fluorescence intensity ÷ noise is defined as SN ratio (S / N). When the respective SN ratios were calculated, the SN ratio was decreased (measurement sensitivity was deteriorated) as the p value reached 10%. FIG. 5 shows that the measurement sensitivity of the immobilized DNA fragment having a p value of 10% or less with the Alu sequence is significantly deteriorated due to the presence of the repetitive sequence or the Alu sequence derived from the contaminating DNA contained in the sample. It was. By setting the p value of the Alu sequence and the immobilized DNA fragment to 10% or more, deterioration in measurement sensitivity can be prevented.
[0032]
In order to examine the influence of the presence of (1) cross-hybridization, (2) short sequences and short repeat sequences having a specific higher order structure, (3) similar sequences to Alu, etc. on actual hybridization, Experiments were conducted in which the complementary DNA (cDNA) sequence of messenger RNA describing 10 genes was immobilized on the glass surface. This immobilized DNA fragment (exactly a cDNA fragment, but hereinafter referred to as a DNA fragment) was synthesized by randomly selecting regions of 300, 600, 900, 1200, 1500, 2100 bases from the GENBANK sequence. is there. The measurement sample was cDNA synthesized by reverse transcription reaction using oligo dT primer, using a messenger RNA group extracted from human pancreatic cancer cells (cell name CFPAC1) as a template. The cDNA synthesized by reverse transcription was fluorescently labeled (fluorescent reagent name Cy3-dCTP) during the reverse transcription reaction. Table 2 shows the abbreviations of the 10 genes used in the experiments, GENBANK accession numbers, and gene names.
[0033]
[Table 2]
Figure 0003897086
[0034]
FIG. 1 shows the influence of the base length of the immobilized DNA fragment obtained on the experiment on the hybridization. Each of the 10 line graphs in the figure is the result of an experiment using 10 genes shown in Table 2. Gene abbreviations (shown in Table 2) are indicated in the line graph. The horizontal axis of the line graph indicates the base length of the immobilized DNA fragment. The vertical axis of the line graph indicates the fluorescence intensity. However, the fluorescence intensity on the vertical axis was normalized assuming that the fluorescence intensity at 300 base length is 1. The fluorescence intensity was defined as the net fluorescence intensity obtained by subtracting the fluorescence intensity of the background (background). The hybridization temperature was 62 ° C. Higher fluorescence intensity corresponds to higher signal intensity ratio (SN ratio), that is, higher detection sensitivity. The values in the line graph are the average values of three experiments, and the error bars are the standard deviations. Moreover, the horizontal line below each line graph indicates the relative positional relationship of DNA fragments of each length. The 5 'end is shown on the left and the 3' end is shown on the right. In order from the top, the base length is long to short. The portions where the horizontal lines overlap are sequence portions common to the respective DNA fragments.
[0035]
From the results shown in FIG. 1, when the two IFI56 and GSS genes were targeted, the longer the immobilized DNA fragment length, the slower the fluorescence intensity, that is, the detection sensitivity tended to increase. In addition, for the five genes PRSM, UBE, AKT, ADPRT, and SMRT, when a measurement error (error bar) was taken into consideration, almost constant detection sensitivity was obtained regardless of the length of the immobilized DNA fragment. The phenomenon that the detection sensitivity increases as the DNA fragment length increases can be explained by the fact that the stability of the binding force between DNA molecules increases as the DNA molecule length increases. The stability of the binding force between DNA molecules can be estimated by free energy (ΔG) in thermodynamics. When ΔG is calculated, a smaller value is obtained as the base length is longer. The smaller the ΔG, the greater the thermodynamic stability. The value of ΔG between DNA molecules was calculated by the nearest neighbor method (J. SantaLucia, Jr. A unified view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics, Porc. Natl. Acad. Sci. USA, vol.95, p.1460-1465, 1998).
[0036]
However, in the three genes CASP, PLG, and GEM, the length of the DNA molecule and the fluorescence intensity, that is, the detection sensitivity are not statistically significantly correlated. The fluorescence intensity is clearly low at 600 bases in CASP, 600 bases in CASP, and 600 and 1200 bases in GEM. The results are negative bases such as (minus factor 1) cross-hybridization, (minus factor 2) short sequences and short repeats with specific higher order structures, (minus factor 3) the presence of similar sequences to Alu, etc. The sequence portion was inferred to be included in the corresponding portion, and analysis was performed. As a result, the negative factor 2 was present in the region of 600 bases of CASP, 600 bases of GEM and 1200 bases and not overlapping with other sequences. Specifically, at 600 bases of CASP, GCGAAAGC (SEQ ID NO: 1) or any of its complementary, inverted, and complementary inverted sequences exists, and at 600 bases and 1200 bases of GEM, GCGAAGC (SEQ ID NO: 2) or complementary sequences, inverted Either sequence or complementary inversion sequence was present. The complementary sequence of GCGAAAGC is CGCTTTCG, the inverted sequence is CGAAAGCG, and the complementary inverted sequence is GCTTTCGC. However, PLG did not fall under any of (1) to (3). The PLG results suggested that there may be negative factors that are not yet known. Again from the results of FIG. 1, it was confirmed that the presence of short sequences or short repeating sequences having a unique higher order structure was not preferable. It has also been confirmed that reducing the free energy (ΔG) in the thermodynamics of the immobilized DNA fragment does not at least become negative, but rather acts positively. For example, when the base length is 300 bases, ΔG is preferably about minus 140 to minus 250. However, since the value of ΔG becomes smaller as the base length becomes longer and takes a different value depending on the base sequence, it is difficult to provide a clear threshold value.
[0037]
Based on the results shown in FIG. 1 and the like, DNA fragments immobilized on one array must have a DNA fragment Tm not exceeding 30 ° C. from the hybridization temperature, in other words, not exceeding a certain range. It is important to reduce the free energy (ΔG) as much as possible while satisfying the Tm condition. In addition, it is preferable to exclude sequences causing cross-hybridization, exclude short sequences and short repeat sequences (hereinafter referred to as harmful short sequences) having a specific higher order structure, and exclude similar sequences to Alu. In order to satisfy all of these conditions, for example, the sequence of the immobilized DNA fragment may be determined by the calculation algorithm shown in FIG. FIG. 2 will be described in the order of the algorithm. First, read the DNA or messenger RNA sequence file described in FASTA format, etc. (1), then input the experimental conditions such as salt concentration and hybridization temperature (2), and the length of the immobilized DNA fragment Through the step (3) of inputting a range, a plurality of DNA sequences that are candidates for immobilized DNA fragments are selected and made into a list. Subsequently, Tm is calculated for each DNA sequence candidate in the list, and the Tm is compared with a hybridization temperature (Th) in a certain range, for example, Th-α to Th-β (where α , Β value may be either positive or negative) (4), removing candidate DNA sequences from the candidate list (4), candidate sequences for DNA sequences with short sequences or short repeats having a specific higher order structure (5), a step (6) for excluding DNA sequences having high homology with Alu sequences from the candidate list, and a step (7) for excluding DNA sequences having high homology with other gene sequences from the candidate list. . Any sequence that satisfies all the conditions in steps 4 to 7 is defined as an immobilized DNA fragment sequence. When a plurality of sequences satisfy Steps 4 to 7, for example, a sequence having the smallest free energy (ΔG) may be used as an immobilized DNA fragment sequence.
[0038]
In step 5, for example, a character string pattern matching algorithm is used. As a pattern matching target, it is desirable to target a complementary sequence of a harmful short sequence, an inverted sequence (CGAAAGCG in the case of GCGAAAGC), and a complementary inverted sequence. In order to improve the calculation speed, the character strings may be once converted into numbers and compared by bit shift calculation or the like.
[0039]
In step 6 and step 7, a heuristic algorithm such as a blast algorithm or a FASTA algorithm may be used, or a local alignment such as a Smith-Waterman method. An algorithm or an algorithm using a Hidden Markov model may be used. In order to improve the calculation speed, the character string may be once converted into a number and a bit shift calculation or the like may be performed.
[0040]
In step 7, not only the homology between gene sequences immobilized on one array but also the homology between a DNA sequence and a human gene sequence such as GENBANK may be calculated. The sample to be measured contains a large number of other genes in addition to the gene originally hybridized with the immobilized DNA fragment. When these different genes are hybridized, it is inherently impossible to measure only the genes to which individual immobilized DNA fragments should be hybridized. Therefore, comparing the DNA fragment candidate sequence to be immobilized on the DNA array with the DNA sequence of the gene group that may be contained in the sample to be measured, the DNA sequence with significantly high homology is immobilized. It is desirable not to select as a DNA fragment. Gene sequence databases such as GENBANK store all the sequences of humans, rodents, yeasts, Escherichia coli, etc. that have been known so far. If the DNA sequence homology between the immobilized DNA fragment and a gene sequence such as a human such as GENBANK exceeds 10% at the statistical significance level (p value) calculated by the Blast algorithm, High-precision measurement can be performed.
[0041]
For calculating the Tm of the DNA sequence, the nearest neighbor method (J. SantaLucia, Jr. A unified view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics, Porc. Natl. Acad. Sci. USA, vol. .95, p.1460-1465, 1998) and empirical methods (Wetmure, JG, DNA probes: Applications of the principles of nucleic acid hybridization, Criti. Rev in Biochem. And Mol. Biol., Vol. 26 , p.227-259, 1991). There are reports that the former closest base method is well matched for DNA sequences of 50 base pairs or less, and the latter method based on the empirical formula is well matched for DNA sequences of 50 base pairs or more. However, according to the paper by J. SantaLucia, Jr., the closest base method has also been improved, suggesting that the calculation can be performed regardless of the sequence length. Therefore, for the Tm calculation of the DNA sequence, either the nearest base method or the method based on the empirical formula is used according to the base length, or the average value of the values obtained by the both methods is calculated, for example. Etc. may be used.
[0042]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments when the present invention is used for elucidating the action mechanism of a drug such as an antineoplastic agent are described below. Tables 3 to 18 show a list of genes essential for occurrence, invasion and metastasis of human cancer immobilized on the glass surface, and genes essential for drug metabolism.
[0043]
[Table 3]
Figure 0003897086
[0044]
[Table 4]
Figure 0003897086
[0045]
[Table 5]
Figure 0003897086
[0046]
[Table 6]
Figure 0003897086
[0047]
[Table 7]
Figure 0003897086
[0048]
[Table 8]
Figure 0003897086
[0049]
[Table 9]
Figure 0003897086
[0050]
[Table 10]
Figure 0003897086
[0051]
[Table 11]
Figure 0003897086
[0052]
[Table 12]
Figure 0003897086
[0053]
[Table 13]
Figure 0003897086
[0054]
[Table 14]
Figure 0003897086
[0055]
[Table 15]
Figure 0003897086
[0056]
[Table 16]
Figure 0003897086
[0057]
[Table 17]
Figure 0003897086
[0058]
[Table 18]
Figure 0003897086
[0059]
Next, Table 19 to Table 38 show immobilized DNA fragment sequence lists corresponding to a part of the genes shown in Tables 3 to 18 calculated using the algorithm of FIG.
[0060]
[Table 19]
Figure 0003897086
[0061]
[Table 20]
Figure 0003897086
[0062]
[Table 21]
Figure 0003897086
[0063]
[Table 22]
Figure 0003897086
[0064]
[Table 23]
Figure 0003897086
[0065]
[Table 24]
Figure 0003897086
[0066]
[Table 25]
Figure 0003897086
[0067]
[Table 26]
Figure 0003897086
[0068]
[Table 27]
Figure 0003897086
[0069]
[Table 28]
Figure 0003897086
[0070]
[Table 29]
Figure 0003897086
[0071]
[Table 30]
Figure 0003897086
[0072]
[Table 31]
Figure 0003897086
[0073]
[Table 32]
Figure 0003897086
[0074]
[Table 33]
Figure 0003897086
[0075]
[Table 34]
Figure 0003897086
[0076]
[Table 35]
Figure 0003897086
[0077]
[Table 36]
Figure 0003897086
[0078]
[Table 37]
Figure 0003897086
[0079]
[Table 38]
Figure 0003897086
[0080]
Finally, using a DNA array in which the genes shown in Table 3 to Table 18 are immobilized on the glass surface, cultured human cells (cells) against an antineoplastic agent (drug name: 5-aza-2′-deoxy-cytidine) The measurement result of the gene expression distribution of name: HT29) is shown in FIG. In the following, description will be given in order.
[0081]
(1) Gene list on DNA array
Table 3 shows a list of genes that are essential for the occurrence, invasion, and metastasis of human cancer selected according to the criteria described in claim 2, and genes that are important for drug metabolism selected according to the criteria described in claim 3. Show. The GENBANK accession number and gene name corresponding to each gene sequence are described.
[0082]
(2) Partial sequence list in gene list
Table 4 shows a list of immobilized DNA fragment sequences corresponding to a part of the genes shown in Table 3. Each DNA fragment sequence, DNA fragment sequence base length (length), DNA fragment sequence free energy (dG), melting temperature of DNA fragment sequence calculated by empirical method (Tm1), calculated by nearest base method The melting temperature (Tm2) of the obtained DNA fragment sequence is also shown. Here, the melting temperature (Tm) was an average value of Tm1 and Tm2. The DNA fragment sequences in Table 4 were designed so that the Tm (= 0.5 * (Tm1 + Tm2)) was 72 ° C. to 82 ° C.
[0083]
(3) An example of experimental results
FIG. 3 shows an increased messenger when human colon cancer cultured cells (name: HT29 cells) were treated with 5-aza-2′-deoxy-cytidine (hereinafter, 5-Aza-CdR) compared with the case where they were not treated. The increase rate of RNA amount is shown for each gene. 5-Aza-CdR treatment means exposing cells to 500 nanomolar 5-Aza-CdR for 2, 12, 24 hours, respectively. Messenger RNA was immediately extracted from each time exposed HT29 cells. Similarly, HT29 cells without drug treatment were also cultured in the same incubator, and messenger RNA was extracted immediately after each time. With respect to the messenger RNA of the drug-treated cell by reverse transcription reaction using an oligo dT primer, a fluorescently labeled cDNA was synthesized using Cy5-dCTP. As for messenger RNA of cells not treated with a drug, fluorescently labeled cDNA was synthesized using Cy3-dCTP. Drug-treated cell-derived cDNA (Cy5-labeled) and non-drug-treated cell-derived cDNA (Cy3-labeled) were mixed and hybridized with the same DNA array. The hybridization temperature was 62 ° C. and the hybridization time was 12 hours. After hybridization, each fluorescence intensity of Cy5 and Cy3 was digitized by a fluorescence scanner.
[0084]
The ratio of fluorescence intensity derived from drug-treated cells (Cy5 fluorescence intensity) and cell-derived fluorescence intensity not treated with drugs (Cy3 fluorescence intensity), ie, Cy5 fluorescence intensity / Cy3 fluorescence intensity was calculated, and the value on the vertical axis in FIG. , And plotted as the rate of increase in messenger RNA amount. The horizontal axis in FIG. 3 is the serial number of the gene on the array. As a result of this experiment, a gene having a Cy5 fluorescence intensity / Cy3 fluorescence intensity of 3 times or more, for example, after 2 hours, SIAT4A, PRSM1, ribosomal protein S5, plasminogen, ETR103, OCTS3, integer4, GEM, RGS14, HsCds18 IFN-induced protein 56, INFα-inducible protein 27, INF-induced 17 kDa protein, INF-induced protein IFI-6-16, INF-inducible protein 10 and the like. Throughout 2, 12, and 24 hours, the Cy5 fluorescence intensity / Cy3 fluorescence intensity was always more than 3 times that of genes related to interferon (IFN) α, IFN-induced protein 56, INFα-inducible protein 27, INF-induced 17 kDa protein, INF-induced protein IFI-6-16, INF-inducible protein 10 and so on. This result was reported by Karpf et al. (Karpf, AR et al., Inhibition of DNA methyltransferase stimulates the expression of signal transducer and activator of transcription 1, 2, ad 3 genes in colon tumor cells, Proc. Natl. Acad. Sci. USA, vol.96, p.14007-14012, 1999). Furthermore, in response to the report of Karpf et al., The present invention was able to observe the time dependence of the drug response with good reproducibility.
[0085]
By carrying out the present invention, the time dependence of the state of drug response of human cells to 5-Aza-CdR, which is a kind of antineoplastic agent, was observed with high reproducibility and high accuracy. Similar results can be obtained for drugs other than 5-Aza-CdR.
[0086]
【The invention's effect】
Provided are a DNA array for elucidating the mechanism of action of a malignant tumor drug or the like with high accuracy and a method for producing the same.
[Brief description of the drawings]
FIG. 1 shows the influence of the base length of an immobilized DNA fragment on hybridization.
FIG. 2 shows a DNA fragment sequencing calculation algorithm.
FIG. 3 shows the rate of increase in the amount of messenger RNA increased when HT29 cells were treated with 5-aza-2′-deoxy-cytidine compared to when they were not treated.
FIG. 4 is a diagram showing the relationship between sequence homology between immobilized DNA fragments and cross-hybridization.
FIG. 5 is a diagram showing the relationship between the sequence homology between the Alu sequence and the immobilized DNA fragment and the measurement results.
[Explanation of symbols]
1. Loading process of gene sequence file 2. Input process of experimental conditions such as salt concentration and hybridization 3. Input process of length range of immobilized DNA fragment 4. Calculate melting temperature of immobilized DNA fragment 5. a step of excluding DNA fragments whose melting temperature is outside a certain range from the candidate list, 5. a step of excluding DNA DNA fragments having a short sequence having a specific higher order structure or a short repeat sequence from the candidate list 6. A step of excluding DNA fragments having high homology with Alu sequences from the candidate list, 7. A step of excluding DNA fragments having high homology with other gene sequences from the candidate list.

Claims (3)

ヒトがんの発生、浸潤、転移と関連した遺伝子を記述するDNA分子もしくはcDNA分子に対して相補結合するDNA断片および、薬物代謝関連遺伝子を記述するDNA分子もしくはcDNA分子に対して相補結合するDNA断片の両者を固体表面に固定化してなり、
前記DNA断片同士の配列相同性が相同検索(ホモロジーサーチ)アルゴリズムにより算出した統計的有意水準値(p値)で10%を超えること、かつ前記DNA断片のいずれもが、ヒトAlu配列との配列相同性統計的有意水準値(p値)で10%を超えること、かつ前記DNA断片の融解温度とハイブリダイゼーション温度との差異が30℃を超えないこと、かつ前記DNA断片が特異な高次構造をとるDNA短配列、短繰り返し配列を含まない前記DNA断片群を固定化したことを特徴としたDNAアレイ。
DNA fragments that complementarily bind to DNA molecules or cDNA molecules that describe genes associated with human cancer development, invasion, or metastasis, and DNA that complementarily bind to DNA molecules or cDNA molecules that describe drug metabolism- related genes Both fragments are immobilized on a solid surface,
The sequence homology between the DNA fragments exceeds 10% as a statistical significance level (p value) calculated by a homology search (homology search) algorithm, and any of the DNA fragments is a sequence with a human Alu sequence. The homology statistical significance level (p value) exceeds 10%, the difference between the melting temperature of the DNA fragment and the hybridization temperature does not exceed 30 ° C., and the DNA structure has a unique higher order structure A DNA array obtained by immobilizing the DNA fragment group that does not contain short DNA sequences and short repeat sequences.
請求項1記載のヒトがんの発生、浸潤、転移と関連した遺伝子を、がん遺伝子(oncogenes, tumor−related genes)、がん抑制遺伝子(tumor suppressor genes)、増殖因子(growth factors)、転写因子(transcription factors)、サイトカイン(cytokines)、アポトーシス(appoptosis genes)、細胞周期調節(cell cycle regulators)、DNA修復遺伝子(DNA damage repairgenes)、転写関連遺伝子としたことを特徴とする請求項1記載のDNAアレイ。Genes associated with the development, invasion, and metastasis of human cancer according to claim 1 are cancer genes (oncogenes, tumor-related genes), tumor suppressor genes, growth factors, transcription factors 2. A transcription factor, a cytokine, an apoptosis gene, a cell cycle regulator, a DNA repair gene, and a transcription-related gene. DNA array. 請求項1記載の薬物代謝関連遺伝子を、薬物代謝酵素関連遺伝子、特にチトクロム450遺伝子(CYP)1A1、CYP1A2、CYP1B1、CYP2A6、CYP2B6、CYP2C8、CYP2C9、CYP2C19、CYP2D6、CYP2E1、CYP3A4、CYP3A5、CYP3A7および、アルコールデヒドロゲナーゼ、アルデヒドデハイドロゲナーゼ、ジヒドロキシピリミジンデヒドロゲナーゼ、NADPH-チトクロムP450レダクターゼ、DT-ジアホラーゼ、エステラーゼ、エポキシドヒドラーゼ等の第一相薬物代謝関連遺伝子や、カテコールO-メチルトランスフェラーゼ、グルタチオーネS-トランスフェラーゼ、ヒスタミンメチルトランスフェラーゼ、N-アセチルトランスフェラーゼ、スルフォトランスフェラーゼ、チオプリンメチルトランスフェラーゼ、ウリジン5‘-トリホスフェートグルクロンシルトランスフェラーゼ等の第二相薬物代謝関連遺伝子のうち1つ以上としたことを特徴とする請求項1記載のDNAアレイ。The drug metabolism- related gene according to claim 1 is a drug-metabolizing enzyme-related gene, in particular cytochrome 450 gene (CYP) 1A1, CYP1A2, CYP1B1, CYP2A6, CYP2B6, CYP2C8, CYP2C9, CYP2C19, CYP3A4, CYP3E4, CYP3E4 , Alcohol dehydrogenase, aldehyde dehydrogenase, dihydroxypyrimidine dehydrogenase, NADPH-cytochrome P450 reductase, DT-diaphorase, esterase, epoxide hydrase and other first phase drug metabolism related genes, catechol O-methyltransferase, glutathione S-transferase , Histamine methyltransferase, N-acetyltransferase, sulfotransferase 2. The DNA array according to claim 1, wherein the DNA array is one or more of phase II drug metabolism-related genes such as lysine, thiopurine methyltransferase, and uridine 5′-triphosphate glucuronyltransferase.
JP2000255737A 2000-08-22 2000-08-22 Cancer-related gene expression observation array Expired - Fee Related JP3897086B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000255737A JP3897086B2 (en) 2000-08-22 2000-08-22 Cancer-related gene expression observation array

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000255737A JP3897086B2 (en) 2000-08-22 2000-08-22 Cancer-related gene expression observation array

Publications (2)

Publication Number Publication Date
JP2002058495A JP2002058495A (en) 2002-02-26
JP3897086B2 true JP3897086B2 (en) 2007-03-22

Family

ID=18744469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000255737A Expired - Fee Related JP3897086B2 (en) 2000-08-22 2000-08-22 Cancer-related gene expression observation array

Country Status (1)

Country Link
JP (1) JP3897086B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090011410A1 (en) * 2004-10-20 2009-01-08 Masato Mitsuhashi Method for tailoring administration of drugs by quantitation of mrna
US8268566B2 (en) 2006-04-07 2012-09-18 Hitachi Chemical Research Center, Inc. Enhanced FC receptor-mediated tumor necrosis factor superfamily MRNA expression in peripheral blood leukocytes in patients with rheumatoid arthritis
WO2012102329A1 (en) 2011-01-26 2012-08-02 株式会社日立ハイテクノロジーズ Microparticle having single-molecule nucleic acid probe, method for producing same, method for analyzing nucleic acid using same, device for nucleic acid analysis, and apparatus for analyzing nucleic acid

Also Published As

Publication number Publication date
JP2002058495A (en) 2002-02-26

Similar Documents

Publication Publication Date Title
Barrett et al. Microarrays: the use of oligonucleotides and cDNA for the analysis of gene expression
Hücker et al. Single-cell microRNA sequencing method comparison and application to cell lines and circulating lung tumor cells
de Jonge et al. Evidence based selection of housekeeping genes
Järvinen et al. Are data from different gene expression microarray platforms comparable?
Govindarajan et al. Microarray and its applications
US20050282227A1 (en) Treatment discovery based on CGH analysis
Maughan et al. An introduction to arrays
US20090221522A1 (en) Methods to correct gene set expression profiles to drug sensitivity
Gorreta et al. Genomic profiling: cDNA arrays and oligoarrays
Kunz et al. DNA microarray technology and its applications in dermatology
Jack et al. Lymphoblastoid cell lines models of drug response: successes and lessons from this pharmacogenomic model
Ragoussis et al. Affymetrix GeneChip® system: moving from research to the clinic
KR20180071299A (en) Analysis of allelic genotypes of single nucleotide polymorphisms and Indel
JP3897086B2 (en) Cancer-related gene expression observation array
Bhasker et al. Advances in pharmacogenomics technologies
Meloni et al. DNA microarrays and pharmacogenomics
Erickson et al. The spatial landscape of clonal somatic mutations in benign and malignant tissue
Warner et al. Current applications of microarrays in head and neck cancer research
Inaoka et al. Genomic-wide analysis with microarrays in human oncology
Lee et al. Using microarrays to predict resistance to chemotherapy in cancer patients
Neuvial et al. Statistical analysis of single nucleotide polymorphism microarrays in cancer studies
US20060240418A1 (en) Canine gene microarrays
Liu Expression genomics and drug development: towards predictive pharmacology
Yap Affymetrix, Inc.
Sezer A Review on Microarray technology in molecular diagnostics

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061212

LAPS Cancellation because of no payment of annual fees