JPWO2003048203A1 - Three-dimensional structure of DNA replication regulatory protein and use thereof - Google Patents
Three-dimensional structure of DNA replication regulatory protein and use thereof Download PDFInfo
- Publication number
- JPWO2003048203A1 JPWO2003048203A1 JP2003549390A JP2003549390A JPWO2003048203A1 JP WO2003048203 A1 JPWO2003048203 A1 JP WO2003048203A1 JP 2003549390 A JP2003549390 A JP 2003549390A JP 2003549390 A JP2003549390 A JP 2003549390A JP WO2003048203 A1 JPWO2003048203 A1 JP WO2003048203A1
- Authority
- JP
- Japan
- Prior art keywords
- dna
- protein
- dna replication
- compound
- hemimethylated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56911—Bacteria
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2299/00—Coordinates from 3D structures of peptides, e.g. proteins or enzymes
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Hematology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Urology & Nephrology (AREA)
- Cell Biology (AREA)
- Pathology (AREA)
- Virology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Gastroenterology & Hepatology (AREA)
- Zoology (AREA)
- Microbiology (AREA)
- Toxicology (AREA)
- Food Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本発明は、DNA複製調節タンパク質であるSeqAタンパク質とヘミメチル化DNAとの複合体の結晶、その製造方法、X線結晶構造解析による前記複合体の三次元立体構造、及びそのようにして得られた三次元立体構造情報を用いて前記複合体の形成を阻害する化合物のスクリーニング方法等を提供する。本発明の方法を用いることにより、ヘミメチル化による複製調節機構を有する細菌の増殖を阻害するような薬剤を開発することができる。The present invention provides a crystal of a complex of SeqA protein, which is a DNA replication regulatory protein, and hemimethylated DNA, a production method thereof, a three-dimensional structure of the complex by X-ray crystal structure analysis, and thus obtained Provided is a method for screening a compound that inhibits the formation of the complex using three-dimensional structure information. By using the method of the present invention, a drug that inhibits the growth of bacteria having a replication regulation mechanism by hemimethylation can be developed.
Description
技術分野
本発明は、DNA複製調節タンパク質の結晶化、該結晶を用いたX線結晶構造解析によるDNA複製調節タンパク質の三次元構造の決定、及びその使用に関し、特に、その立体構造に基づく該タンパク質への結合化合物、又はヘミメチル化DNAと特異的に結合する化合物の合理的なスクリーニングに関する。
背景技術
大腸菌の染色体DNAには約1900個のGATC配列が存在する。このGATC配列は通常Damメチラーゼによりメチル化されている。このDamメチラーゼは、メチル基供与体であるS−アデノシルメチオニンからアデニン塩基の6位のアミノ基にメチル基を転移させる。大腸菌のDamメチラーゼはdam(DNA Adenine Methyltransferase)遺伝子によってコードされており、分子量31kDaのモノマー酵素である(Boye,E.,et al.,1992,J.Bacteriol.,174,1682−1685)。
染色体DNAの複製時には新生鎖がDamメチラーゼによりメチル化されるまでヘミメチル化状態となる。すなわち、複製直後のDNAは、新生鎖のGATC配列は未だメチル化されていないが、その相補鎖(旧鎖)はメチル化されている状態(半メチル化状態)にあるが、このヘミメチル化DNAにDamメチラーゼが作用すると、両方の鎖共にメチル化されたフルメチル化DNAとなる。SeqAタンパク質は複製直後にヘミメチル化状態となったGATC配列を特異的に認識し、結合する(Brendler et al.,1995,EMBO J.,14,4083−4089、及びSlater et al.,1995,Cell,82,927−936参照)。大腸菌の複製開始点であるoriC領域にはGATC配列が11ヶ所存在しており、SeqAはヘミメチル化状態のoriC領域に結合することによって、Damメチラーゼによるメチル化を遅延させると同時に、ヘミメチル化oriCの膜への結合にも関与している。また、SeqAタンパク質はoriCからの複製開始を同調させる働きを担い、複製を負に制御すると考えられている。
この複製の負の制御(又は複製開始点の隔離)にはSeqA以外の他の因子も関与しているが、試験管内においてSeqAタンパク質は単独でヘミメチル化DNAと強く結合する活性を示し、このSeqAタンパク質の結合には少なくとも二個のヘミメチル化GATC配列の存在が必要であることが報告されている(Brendler,T.,et al.,1999,EMBO J.,18,2304−2310)。
このようなDamメチラーゼとSeqAタンパク質は、ヒトを初めとする哺乳類には存在せず、ペスト菌、コレラ菌、赤痢菌、ネズミチフス菌および大腸菌O157等の病原性細菌を含むグラム陰性菌の特殊なグループに存在するのみである(Hiraga et al.,2000,Genes to Cells,5,327−341参照)。従って、そのDNA複製調節機構、即ち、DamメチラーゼやSeqAタンパク質のヘミメチル化DNAとの結合を阻害することによって、これらの細菌の増殖を特異的に抑制できる可能性がある。また、Damメチラーゼを欠損したネズミチフス菌がマウスで生ワクチンとして働くことも報告されている(Hiraga et al.,2000,Genes to Cells,5,327−341参照)ことから、ヘミメチル化DNAに特異的に結合し、Damメチラーゼの働きを阻害する薬剤の開発によって、上記細菌の病原性を低下させ、感染した宿主を発病させることなく上記細菌に対する抗体の産生を促進できる可能性もある。
しかし、そのためにはSeqAタンパク質とヘミメチル化DNAとの詳細な結合様式やこれら複合体の結合と解離の機構についての情報が必要となるが、これまでSeqAタンパク質の立体構造、特に、ヘミメチル化DNAとの結合に関する立体構造の知見は得られていない。
本発明は、DNA複製調節タンパク質の一つである大腸菌SeqAタンパク質とヘミメチル化DNAとの複合体の単結晶を取得し、X線結晶構造解析によりその立体構造を明らかにしてSeqAタンパク質による複製の調節機構を明らかにすることを目的とする。
また、本発明はSeqAタンパク質とヘミメチル化DNAとの複合体の構造に基づいて、該複合体の形成を阻害する化合物や、ヘミメチル化DNAに特異的に結合する化合物をスクリーニングする方法を提供すること等を目的とする。
発明の開示
本発明者らは、SeqAタンパク質の機能ドメインを明らかにするために、種々の欠失変異を持つseqA遺伝子を構築し、これらを大腸菌で発現させて変異体タンパク質の種々の物性やヘミメチル化DNAとの結合能を解析したところ、C末端側にヘミメチル化DNAとの結合に関与する機能ドメインを有することを明らかにした。また、これらの機能ドメインとヘミメチル化DNAとの複合体の結晶化及び該結晶を用いたX線結晶構造解析を行い、該複合体の三次元立体構造を初めて明らかにすることによって本発明を完成した。
即ち、本発明は、DNA複製調節タンパク質であるSeqAタンパク質の結晶、その製造方法、それを用いた三次元立体構造の解析、及びそのようにして得られた三次元立体構造を用いて該複合体の形成を阻害する化合物や、ヘミメチル化DNAに特異的に結合する化合物をスクリーニングする方法等に関し、より具体的には、
(1)配列番号2に示すアミノ酸配列のうち、71位から181位までのアミノ酸配列からなるポリペプチド断片であって、115位のグリシンから118位のアルギニンまで、及び149位のスレオニンから153位のスレオニンまでのアミノ酸残基がDNA結合部位を形成することを特徴とするポリペプチド断片。
(2)配列番号2に示すアミノ酸配列のうち、71位から181位までのアミノ酸配列からなるポリペプチド断片であって、115位のグリシンから118位のアルギニンまで、及び149位のスレオニンから153位のスレオニンまでのアミノ酸残基がヘミメチル化DNAとの結合部位を形成することを特徴とするポリペプチド断片。
(3)配列番号2に示すアミノ酸配列の71位から181位までからなるポリペプチド断片と、ヘミメチル化DNAとの複合体の結晶であって、六方晶系の空間群P622、格子定数a=b=152.2±0.2Å、c=119.3±0.2Åを有する該複合体の結晶。
(4)配列番号2に示すアミノ酸配列からなるDNA複製調節タンパク質とヘミメチル化DNAとの複合体の結晶の製造方法であって、
4〜6mg/mlの濃度のDNA複製調節タンパク質と、ヘミメチル化DNAとを1:1〜2:1のモル比で混合した溶液を、1〜2Mのクエン酸3ナトリウム水和物を含有し、pH7.0〜8.0の緩衝液を用いて蒸気拡散法により結晶化する方法。
(5)(1)に記載のポリペプチド断片を用いて、これに結合する化合物を設計又は選択し、DNA複製調節能を阻害する化合物及び/又はヘミメチル化DNAと特異的に結合する化合物をスクリーニングする方法。
(6)DNA複製調節タンパク質又は該タンパク質とヘミメチル化DNAとの複合体の立体構造を決定する方法であって、
(a)DNA複製調節タンパク質又は該タンパク質とヘミメチル化DNAとの複合体の結晶を生成する工程、
(b)該結晶を用いて重原子同型置換法又は多波長異常散乱法によりX線回折データを取得する工程、及び
(c)該X線回折データに基づいて三次元構造座標を決定する工程、
を含むことを特徴とするDNA複製調節タンパク質又は該タンパク質とヘミメチル化DNAとの複合体の立体構造の決定方法。
(7)前記DNA複製調節タンパク質がエシェリヒア属、ヘモフィルス属、パスツレラ属又はビブリオ属の細菌のSeqAタンパク質であることを特徴とする(6)に記載の方法。
(8)DNA複製調節能を阻害する化合物を同定する方法であって、
(a)DNA複製調節タンパク質若しくは該タンパク質とヘミメチル化DNAとの複合体、又は(1)のポリペプチド断片若しくはそのDNA結合部位の三次元立体構造を、コンピュータモデルを用いて構築する工程、
(b)該三次元立体構造に基づいて、DNA複製調節能を阻害する候補化合物を設計又は選択する工程、
(c)該設計又は選択された候補化合物を合成又は取得する工程、
(d)該候補化合物によるDNA複製調節能の阻害活性を調べるために、該候補化合物と該DNA複製調節タンパク質とを接触させる工程、
を含むことを特徴とするDNA複製調節能を阻害する化合物を同定する方法。
(9)前記DNA複製調節タンパク質が、エシェリヒア属、ヘモフィルス属、パスツレラ属又はビブリオ属の細菌のSeqAタンパク質であることを特徴とする(8)に記載の方法。
(10)前記(d)工程におけるDNA複製調節能の阻害活性が、ゲルシフトアッセイ法により検出されることを特徴とする(8)又は(9)に記載の方法。
(11)前記三次元立体構造モデルが本明細書の表1に示す原子座標により実質的に規定されることを特徴とする(8)〜(10)何れか一に記載の方法。
(12)(5)又は(8)〜(11)の何れか一に記載の方法により同定されることを特徴とするDNA複製調節能を阻害する化合物。
(13)DNA複製調節能を阻害する化合物を含有する抗菌性組成物の製造方法であって、上記(5)又は(8)〜(11)の何れか一に記載の方法によりDNA複製調節能を阻害する化合物を同定する工程、及び該同定された化合物を安定化剤又は担体と混合する工程を含むことを特徴とする抗菌性組成物の製造方法。
(14)ヘミメチル化DNAと特異的に結合する化合物を同定する方法であって、
(a)DNA複製調節タンパク質又は(2)に記載のポリペプチド断片と、ヘミメチル化DNAとの複合体の三次元立体構造を、コンピュータモデルを用いて構築する工程、
(b)該三次元立体構造に基づいて、ヘミメチル化DNAに結合する候補化合物を設計又は選択する工程、
(c)該設計又は選択された候補化合物を合成又は取得する工程、
(d)該候補化合物のヘミメチル化DNAへの結合能を調べるために、該候補化合物とヘミメチル化DNAとを接触させる工程、
を含むことを特徴とするヘミメチル化DNAと特異的に結合する化合物を同定する方法。
(15)前記候補化合物が変異体DNA複製調節タンパク質であることを特徴とする(14)に記載の方法。
(16)配列番号2に示すアミノ酸配列からなるDNA複製調節タンパク質又は該タンパク質とヘミメチル化DNAとの複合体の三次元立体構造を出力するコンピュータシステムであって、
(a)前記DNA複製調節タンパク質のヘミメチル化DNAとの結合部位に対応するアミノ酸残基の原子座標を含むコンピュータ読み取り可能なデータを記憶保持する記憶手段と、
(b)前記記憶手段に保持されたデータを読み出して、三次元立体構造モデルを導出する導出手段と、
(c)前記導出結果を受けて、前記三次元立体構造モデルを出力する出力手段と、を含むことを特徴とするコンピュータシステム。
(17)前記DNA複製調節タンパク質のヘミメチル化DNAとの結合部位が、配列番号2に示したアミノ酸配列の115位のグリシンから118位のアルギニンまで、及び149位のスレオニンから153位のスレオニンまでの領域からなることを特徴とする(16)に記載のコンピュータシステム。
(18)有効成分として、下記一般式(I)で示される化合物又はその塩を含むことを特徴とするDNA複製調節阻害剤。
(上記式中、Aはシクロヘキセン、ジメチルシクロヘキセン、ビシクロ[2,2,1]ヘプタン、ビシクロ[2,2,1]ヘプテン、オキサ−ビシクロ[2,2,1]ヘプタンからなる群から選択される何れか1種の環を、R1及びR2は水素原子又はメチル基を、R3は水素原子又は炭素数1〜4のアルキル基を表す)。
(19)有効成分として、上記一般式(I)で示される化合物又はその塩を含むことを特徴とする抗菌性組成物。
である。
発明の実施の形態
本発明において、「DNA複製調節タンパク質」とは、複製直後の染色体DNAの複製開始領域に結合して細胞周期が同調するまで新たな複製開始を抑止することによってDNA複製を調節するタンパク質をいう。大腸菌におけるこのような調節は、seqA遺伝子の発現産物であるSeqAタンパク質により行われることが知られており、すでにその塩基配列やタンパク質の一次構造が明らかにされている(Lu,M.,et al.,1994,Cell,77,413−426,GenBank Accession No.U07651)。SeqAタンパク質は大腸菌をはじめ、Damメチラーゼを有する種々の細菌に存在し、例えば、エシェリヒア属、ヘモフィルス属、パスツレラ属又はビブリオ属等の細菌であり、特に、ペスト菌、コレラ菌、赤痢菌、ネズミチフス菌、大腸菌O157等の病原性細菌を含む。更に、少なくとそれらの一部であって、DNA複製調節機能を有するタンパク質も本発明における「DNA複製調節タンパク質」の中に実質的に含まれる。
また、本発明において「ヘミメチル化DNA」とは、GATC配列を有する二本鎖DNAにおいて、一方の鎖のアデニンのみがN6位にメチル化を受けたDNAをいい、生体由来ものであっても化学合成したものであってもどちらでも良い。生体由来のものとしては、例えば、大腸菌の複製開始領域であるoriCがある。245bpからなるoriCは、11個のGATC配列が存在し、半保存的な複製直後には、新生鎖がDamメチラーゼによりメチル化されるまで片方の鎖のみがメチル化されたヘミメチル化状態として存在する。一方、化学合成により任意の長さの二本鎖オリゴヌクレオチドを設計し、一方の鎖のGATC配列のアデニンのみがN6メチル化されたオリゴヌクレオチドを合成し、これを相補鎖とアニールさせることによっても調製することができる。
本発明において、DNA複製調節タンパク質の「変異体」とは、配列番号2に示したアミノ酸配列のアミノ酸が少なくとも1つ欠失、付加、挿入若しくは置換又は修飾されたアミノ酸配列を有し、ヘミメチル化DNAとの結合活性の少なくとも一部を保持する改変されたタンパク質をいう。
(SeqAタンパク質の機能ドメインの探索)
図1(a)は、SeqAタンパク質のN末端側及びC末端側から種々の長さのアミノ酸配列を欠失した20種類の変異体SeqAタンパク質を示す。これらをコードする変異体seqA遺伝子を有するプラスミドを構築し、大腸菌に導入してGST融合タンパク質を合成することにより、全長SeqAタンパク質とN末端欠失変異SeqAタンパク質を発現するプラスミド5種類において、それらのプラスミドのコピー数が極端に減少していることが分かった。C末端欠失変異SeqAタンパク質を発現するプラスミドに関しては、C末端を5アミノ酸残基削っただけで、seqA遺伝子が入っていないベクターのみのプラスミドと同等のコピー数に回復した。このことから、SeqAタンパク質は大腸菌の染色体oriCだけでなくコリシンE1プラスミドの複製にも関与していることが示唆される。また、SeqAタンパク質はC末端側にDNA結合ドメインを持つことも明らかになった(図1(b))。
(DNA複製調節タンパク質とヘミメチル化DNAとの複合体結晶の調製)
タンパク質の立体構造を明らかにする手法として、最も一般的に行われているのは、X線結晶構造解析の手法である。即ち、タンパク質を結晶化し、その結晶に単色化されたX線をあて、得られたX線の回折像を基に、該タンパク質の立体構造を明らかにしていくものである(Blundell,T.L.及びJohnson,L.N.,PROTEIN CRYSTALLOGRAPHY,p.1−565,(1976)Academic Press,New York)。
結晶化は、目的のタンパク質溶液に沈殿剤を添加し、または溶媒量を蒸発等によって減少させる等の操作によって、タンパク質が溶液状態から非溶液状態になる場合において、ある特定の条件において結晶として析出する性質を利用している。結晶化には高純度に精製されたタンパク質が必要である。また、結晶化する条件として、タンパク質濃度、塩濃度、水素イオン濃度(pH)、添加する沈殿剤の種類、温度等の物理的及び化学的な因子が関与している。更には、沈殿剤添加や溶媒量の調整方法として、バッチ法、透析法、蒸気拡散法などの結晶化の手法が数多く存在している(Blundell,T.L.及びJohnson,L.N.,PROTEIN CRYSTALLOGRAPHY,p.59−82,(1976)Academic Press,New York)。例えば、蒸気拡散法は、気相を通じて拡散によって揮発性の溶媒や沈殿剤が移動するようなしくみである。タンパク質溶液が沈殿剤溶液とのあいだで蒸気拡散することにより、タンパク質濃度と沈殿剤濃度が共に高まって過飽和の領域で結晶化が起こる。タンパク質溶液の液滴をどうつくるかによって、ハンギングドロップ法、シッティングドロップ法、サンドイッチドロップ法等の方法がある。このようにX線結晶解析に適したタンパク質の結晶を得るには、それぞれのタンパク質において、高純度のタンパク質を得ることと、結晶化における種々の因子や結晶化法を最適化する検討が必要になる。特に高純度のタンパク質の調製は結晶化を成功させるための重要な因子である。このために、クローン化した遺伝子を効率的な発現系で発現させることにより迅速かつ均一なタンパク質を調製することができる。
本発明のDNA複製調節タンパク質とヘミメチル化DNAとの複合体の結晶は、以下のようにして調製される。大腸菌SeqAタンパク質をコードする塩基配列は既に公知であり、組換えDNA技術を用いて本来の宿主である大腸菌やその他の種々の宿主において容易に発現させることができる。
本発明の一つの実施形態において、組換え大腸菌を用いた系により大腸菌SeqAタンパク質を大量発現させることができる。組換え大腸菌において遺伝子を大量に発現させるための種々のプラスミドベクター等が市販されている。例えば、強力なT7ファージプロモーターの下流に発現させたい遺伝子を導入し、宿主大腸菌により供給されるT7RNAポリメラーゼによって転写されるpETシステム(Novagen社)等を用いることができる。このシステムでは、T7RNAポリメラーゼ遺伝子は宿主大腸菌染色体に組み込まれており、lacUV5プロモーター下流にあるためIPTG添加による誘導で発現をコントロールすることができる。また、大腸菌SeqAタンパク質のN末端側やC末端側に種々のタグ配列を導入しておくことによって、金属キレート樹脂(ヒスチジンタグ)や抗体(T7タグ、CBDタグ等)等を使って簡単に精製することができる。精製された融合タンパク質は、エンテロキナーゼやトロンビン等のプロテアーゼを用いて更に大腸菌SeqAタンパク質部分のみを回収することが可能である。
また、大腸菌SeqAタンパク質を発現する組換え大腸菌を、重金属原子であるセレンを含有したセレノメチオニンあるいはセレノシステインを含む培地で生育、培養することにより大腸菌SeqAタンパク質中のメチオニンあるいはシステイン残基がセレノメチオニン又はセレノシステインに置換された変異体タンパク質が取得される。
更に結晶化に適するように、これらのタンパク質を高純度に精製する。精製法としては、カラムクロマトグラフィー(アフィニティー、疎水、イオン交換、ゲルろ過等)、塩析、遠心分離、電気泳動等、当業者においてタンパク質を精製する方法として一般的に行われている方法を単独で又は組み合わせて用いることができる。
次いで、DNA複製調節タンパク質とヘミメチル化DNAとの複合体の結晶を調製する。SeqAタンパク質のようなDNA結合タンパク質の機能を解析する場合には特定のオリゴヌクレオチドと複合体を形成したようなモデル化した系で結晶化することが必須である。例えば、大腸菌のSeqAタンパク質と10〜50塩基対程度のヘミメチル化二本鎖DNAとを1:1〜2:1のモル比であらかじめ混合しておくことが好ましい。
上記セレン含有培地で培養することによる重金属原子のタンパク質中への導入方法の他に、天然型のタンパク質結晶を、金、白金、イリジウム、オスミウム、水銀、鉛、ウラン、サマリウム等を含む金属塩又は有機金属化合物の溶液に浸漬することによっても重原子誘導体結晶を作製することができ、重原子同型置換法及び多波長異常分散法を適用する場合に利用される。
配列番号2に示したアミノ酸配列の71位から181位までを有するSeqAタンパク質と10塩基対のヘミメチル化DNAとの複合体の結晶は、六方晶系の空間群P622に属するもので、単位格子としてa軸、b軸の方向に152.238Å、c軸の方向に119.338Åの大きさを有する。
(DNA複製調節タンパク質とヘミメチル化DNAとの複合体結晶のX線結晶構造解析)
このようにして得たDNA複製調節タンパク質とヘミメチル化DNAとの複合体の結晶の構造を当業者に知られたX線結晶構造解析技術を用いて解析する。類縁タンパク質の立体構造が未知であり、その立体構造を利用した分子置換法による構造解析が不可能な本発明のような立体構造決定においては、重原子置換法又は多波長異常分散法(MAD法)が適用され得る。本発明の一つの実施態様に於いて、X線結晶解析は、MAD法であり、これに用いられるX線は、シンクロトロン放射光から得られる0.3〜3.0Åの波長である。MAD法は、入射X線エネルギー近傍の吸収端をもつ重原子同型置換結晶から、複数の波長によるX線回折データを得る方法である。X線と該重原子の電子殻との共鳴でX線の散乱に差を生じ、これによってタンパク質の構造解析での位相問題を解決することができる。この方法の原理はすでに古くから知られていたが、波長可変であるシンクロトロン放射光の出現によって始めてタンパク質の構造決定に使用されるようになり、Hendricksonらがこの方法によって初めてタンパク質の構造解析に成功した(Hendrickson W.A.et al.,Proteins 4,77−88,1988及び、Hendrickson W.A.et al.,EMBO J.5,1665−1672,1990参照)。
シンクロトロン放射光とは、蓄積リングに打ち込まれた電子を磁場によって加速して得られる放射光であり、通常のX線発生装置よりも極めて強いエネルギーを有する。理研播磨研究所の第三世代大型放射光設備SPring−8(8GeV)等が使用可能である。
測定した回折画像データは、プログラムDENZO(マックサイエンス)又は同様な画像処理プログラムを用いて、反射強度データに処理される。天然型結晶の反射強度データ、複数波長での重原子置換結晶の反射強度データから、差パターソン図を利用して結晶中のタンパク質に結合した重原子の位置を求めた後、プログラムPHASES若しくはCCP4又は同様の回折データ解析プログラムを用いて重原子位置パラメータを精密化することにより初期位相が決定される。決定された初期位相は、プログラムDM(CCP4パッケージ)又は同様な位相改良プログラム(電子密度改良プログラム)を用いた溶媒平滑化法に従って、信頼性の高い位相へと改良される。
DNA複製調節タンパク質とヘミメチル化DNAとの複合体の立体構造モデルは、プログラムOにより3次元グラフィックス上に表示した電子密度図から、以下の手順で構築し得る。まず、特徴的なアミノ酸配列を有する複数の領域を電子密度図上で探し出す。次に、見出した領域を起点にしてアミノ酸配列を参照しながら、電子密度に適合するアミノ酸残基の部分構造をプログラムOを用いて三次元グラフィックス上で構築する。
順次この作業を繰り返すことにより、DNA複製調節タンパク質とヘミメチル化DNAとの複合体のすべてのアミノ酸残基を相当する電子密度に適合させ、複合体全体の初期立体構造モデルを構築する。構築された立体構造モデルは、それを出発モデル構造として、構造精密化プログラムであるXPLORの精密化プロトコルに従って、立体構造を記述する三次元座標が精密化される。精密化の進行状況や分子モデルのチェックは、以下の指標により確認することができる。信頼度因子(R因子)は、回折強度測定で得られた結晶構造因子の絶対値と分子モデルから計算した結晶構造因子の絶対値の一致度を示す尺度であり、精密化が正常に進行すると小さな値となる。また、タンパク質の主鎖の二面角を計算しそれらをプロットしてそれらの値が許容される領域にあるかどうかを確認する方法(ラマチャンドランプロット)も用いられる。
このようにして本発明であるDNA複製調節タンパク質とヘミメチル化DNAとの複合体の3次元原子座標(各原子の空間的な位置関係を示す値)が初めて得られる。得られた原子座標を当業者にとって一般的に用いられている表記法であるプロテイン・データ・バンクのテキスト形式に従って表1に示す。
なお、表1に示した原子座標は、大腸菌のSeqAタンパク質(71−181)と10塩基対のヘミメチル化DNA(SeqA bsC−10)との複合体の結晶構造であるが、この情報を用いることによって大腸菌と類縁の他の細菌が有するSeqAタンパク質の立体構造も容易に決定することができる。大腸菌と類縁の細菌としては、例えば、エシェリヒア属、ヘモフィルス属、パスツレラ属及びビブリオ属等が挙げられ、図4に示したように、Haemophilus infuenzae Rd、Pasteurella multocida PM70、及びVibrio choleraeのSeqAタンパク質は、大腸菌SeqAタンパク質とアミノ酸配列の相同性が非常に高い。このような相同性の高いタンパク質の立体構造を決定する方法として、分子置換法がある。本発明と同様な方法で上記類縁菌のSeqAタンパク質とヘミメチル化DNAとの複合体の結晶を作製し、X線回折データを取得した後、分子置換法により上記類縁タンパク質の立体構造を決定することができ、これらも本発明の一形態として含まれる。
(DNA複製調節タンパク質とヘミメチル化DNAとの複合体の立体構造モデルを表示するコンピュータシステム)
本発明によるDNA複製調節タンパク質又は該タンパク質とヘミメチル化DNAとの複合体の結晶から得られる原子座標を、分子の3次元構造を表現するコンピュータ・プログラムが動作するコンピュータ又はそのコンピュータの記憶媒体に入力することで、DNA複製調節タンパク質とヘミメチル化DNAとの複合体の3次元的な構造を詳細に表現することが可能になる。
図2はこれらのコンピュータシステムの一実施形態を表した概略図である。図2を参照すると、本発明のコンピュータシステムとして、記憶手段と、導出手段と、出力手段とが示されている。記憶手段としては、DNA複製調節タンパク質のヘミメチル化DNAとの結合部位に対応するアミノ酸残基の原子座標を含むコンピュータ読み取り可能なデータを、導出手段によって読み出し可能なように記憶保持するものであれば特に限定されるものではない。例えば、フレキシブルディスク、ハードディスク、CD−ROM、光ディスク、光磁気ディスク、磁気テープ等の記憶媒体に該データを記憶保持させることで実現される。
DNA複製調節タンパク質のヘミメチル化DNAとの結合部位に対応するアミノ酸残基の原子座標を含むコンピュータ読み取り可能なデータを、記憶手段へ入力する方法は、種々の方法により行うことができる。例えば、フレキシブルディスクドライブやCD−ROMドライブからこれらの記録媒体に記録されたデータを読み込むことができる。あるいはまた、ネットワークを介して例えばPDBのようなデータベースから所望のデータを受け取ることもできる。
上記記憶手段から読み出したデータに基づいて、導出手段はDNA複製調節タンパク質とヘミメチル化DNAとの複合体の少なくとも一部を表す三次元立体構造モデルを導出する。導出手段の構成は、特に限定するものではないが、QUANTA(Molecular Simulations社)、SYBYL(Molecular Modeling Software社)、AMBER(Weiner,S.J.,et al.,(1984)J.Am.Chem.Soc.,106,765−784)或は、CHARMM(Brooks,B.R.et al.,(1983)J.Comp.Chem.4,187−217)等のプログラムを所望のコンピュータにインストールすることで実現される。更に、これらの分子モデルを生成するステップに続いて、該複合体の配座エネルギーを計算してエネルギーを最小化するプログラムとしては、上記CHARMMやAMBER等が用いられる。
上記導出手段によって導出された結果を受けて、DNA複製調節タンパク質のヘミメチル化DNAとの結合部位の三次元立体構造モデルを出力する出力手段は、従来より用いられている種々の装置を用いることができる.例えば、CRTと呼ばれるディスプレイ装置に、例えばQUANTAのようなプログラムを用いて画像的に表示することもできる。このような画像を紙に表示するプリンターや他の記憶媒体に保存するためのディスクドライブも含まれる。
図3は、このようにして3.0Åの分解能で得られた大腸菌SeqAタンパク質とヘミメチル化DNAとの複合体の立体構造をリボンモデルで示したものである。図3より明らかなように、得られた結晶は、SeqA(71−181)タンパク質と10塩基対のヘミメチル化DNAとの複合体が2回回転軸で対称な2量体の結晶である。立体構造から確認されたSeqA(71−181)タンパク質のドメイン構造を図4に示した。図4に示したように、SeqA(71−181)タンパク質は7ヶ所のα−ヘリックス構造と2ヶ所のβ−シート構造を有しており、115位のグリシンから118位のアルギニンを含むループ領域、及び149位のスレオニンから153位のスレオニンを含むループ領域で、ヘミメチル化DNAのG(m6A)TC配列部分と結合していることが分かる(図3参照)。
(立体構造の使用)
本発明が提供するDNA複製調節タンパク質とヘミメチル化DNAとの複合体の原子座標のすべて又は一部を、分子の立体構造を表現するコンピュータ・プログラムが動作するコンピュータ又はその記憶媒体に入力することで、DNA複製調節タンパク質のヘミメチル化DNAとの結合部位に結合し、該複合体の形成を阻害する化合物、又はDNA複製調節タンパク質のヘミメチル化DNAとの結合部位と類似した立体構造を有し、ヘミメチル化DNAと強く結合する化合物を同定、検索、評価又は設計することが可能となる。化合物は、天然物化合物、合成化合物の何れでもよく、高分子化合物、低分子化合物の何れでも良い。
このような方法は、まず候補化合物とDNA複製調節タンパク質とをコンピュータモデルにより表示し、視覚的観察によりDNA複製調節タンパク質のヘミメチル化DNAとの結合部位に良く適合する形状又は化学構造をもつ候補化合物(リード化合物)を見つけ出す段階が含まれる。分子モデルを作成、表示するためには、前記QUANTAやSYBYL等のプログラムが利用できる。更に、DNA複製調節タンパク質のヘミメチル化DNAとの結合部位との親和性、反発力、及び立体的障害等を推定するための種々のコンピュータプログラムが使用できる。これらのプログラムの例としては、例えば、生体高分子についてエネルギー的に好適な結合部位を決定するためのGRID(Goodford,P.J.,(1985)J.Med.Chem.,28,p.849−857)、機能的結合部位を探索するためのMCSS(Miranker,A.,et al.,(1991)Proteins:Structure,Function and Genetics,11,p.29−34)、あるいは高分子とリガンドとの相互作用を幾何学的に解析し、自動的にドッキングさせるAUTODOCK(Goodsell,D.S.,et al.,(1990)PROTEINS:Structure,Function and Genetics,8,195−202)、及びDOCK(Kuntz,I.D.,et al.,(1982)J.Mol.Biol.161,269−288)等が挙げられる。
これらの候補化合物(リード化合物)が見つけ出されると、続いて、DNA複製調節タンパク質のヘミメチル化DNAとの結合部位を表示したコンピュータ画面上で候補化合物との立体的な相互作用を視覚的に検討し、更に最適化することができる。前述したQUANTAやSYBYL等のプログラムを用いて候補化合物を最適化するためのモデルを構築することができる。これらの他に、分子モデリングの最適化のために有用な種々のプログラムが利用でき、例えば、CAVEAT(Lauri,G.,and Bartlett,P.A.,J.(1994)Comput.Aided Mol.Des.8,51−66)やHOOK(Eisen,M.B.,et al.(1994)Proteins:Struct.,Funct.,Genet.,19,199−221)等が挙げられる。
更に、上記のプログラムの他にDNA複製調節タンパク質のヘミメチル化DNAとの結合部位の立体構造から直接(de novo)、自動的に候補化合物を構築し、その構造を出力することも可能である。これらのためには、LUDI(Bohm,H.J.,(1992)J.Comp.Aid.Molec.Design.)やLEGEND(Nishibata,Y.,et al.,(1991)Tetrahedron 47,8985)等のプログラムも利用できる。
続いて、上記候補化合物又は最適化された化合物が、DNA複製調節タンパク質とヘミメチル化DNAとの結合を阻害するかどうかを種々の方法で確認する。例えば、両者を水溶液中で混合する等の方法で接触させ、その後、電気泳動等を行うことにより、DNA複製調節タンパク質がヘミメチル化DNAと結合できるか否かを確認する。上記候補化合物又は最適化された化合物がDNA複製調節タンパク質とヘミメチル化DNAとの結合を阻害することができれば、DNA複製調節タンパク質による複製調節能もまた阻害されるものと考えられる。
あるいは、上記候補化合物とDNA複製調節タンパク質との相互作用を、NMRや質量分析法等を用いて分光学的に検出することもできる。一般的に、NMRシグナルは分子の局所的環境変化(リガンドとの結合、構造変化等)を敏感に反映するから、リガンドと相互作用するタンパク質を混合してNMRスペクトルを測定した場合、リガンドシグナルのブロード化や消失、化学シフト値の変化などが確認される。反対に、リガンドと結合した状態のタンパク質の構造を特異的に検出することもできる。15Nで均一にラベルしたタンパク質を用いた15N−1HHSQCスペクトルを利用すれば、タンパク質のNMRシグナルのみを観測することができ、リガンドと相互作用するアミノ酸残基等の局所構造を見出すことができる。
次に、ヘミメチル化DNAと特異的に結合する化合物を同定するためには、DNA複製調節タンパク質のヘミメチル化DNAとの結合に関与する領域の立体構造が重要な手がかりとなる。上述したように、配列番号2に示したSeqAタンパク質の115位のグリシンから118位のアルギニンまでの領域、及び149位のスレオニンから153位のスレオニンまでの領域は、表1に示した原子座標によって規定され、図3に示した立体構造を形成することによってヘミメチル化DNAのG(m6A)TC配列部分と相互作用していることが分かる。通常の二本鎖DNAにおいては、塩基部分は相補鎖と水素結合しているため二重らせん構造の内部に存在するが、ヘミメチル化DNAではアデニンの6位のアミノ基がメチル化されることによって、アデニンとチミンとの水素結合が弱まり、二重らせん構造が部分的に開いた構造をとるものと考えられる。この微妙な構造のゆらぎをSeqAタンパク質のDNA結合部位が認識し、これと特異的に結合することが分かる。このヘミメチル化DNAとの結合に関与する立体構造情報はヘミメチル化DNAと結合する化合物を同定するための重要な手がかりとなる。
このような候補化合物の一つとして、変異体DNA複製調節タンパク質が挙げられる。例えば、ヘミメチル化DNAと結合する上記2つのループ領域(115位のグリシンから118位のアルギニンまでの領域、及び149位のスレオニンから153位のスレオニンまでの領域)を含み、その結合部分の立体構造を保持するような任意のタンパク質又はペプチドである。該結合部分の立体構造は、表1に示す原子座標により実質的に規定される。或は、SeqAタンパク質の上記DNA結合部位を形成するアミノ酸残基又はその近傍領域のアミノ酸を他のアミノ酸に置換又は化学修飾を行って、ヘミメチル化DNAとの結合能力が向上した変異体タンパク質を作製することができる。ここに、「その近傍領域」とは、該アミノ酸残基に対して、静電相互作用、疎水性相互作用、ファンデアワールス相互作用、水素結合などに関与する領域、具体的にはおよそ5Å以内にある領域をいう。
このようにして設計された変異体タンパク質は、多くの方法によって調製され得る。例えば、本発明の変異体をコードするDNAを部位特異的変異導入法やPCR、化学合成等の当業者において公知の方法により、又はこれらを組み合わせて調製することができる。これらの変異体タンパク質をコードするDNAを適当な発現ベクターに導入し、該発現ベクターを更に適当な細胞に導入して得られた形質転換体を培養し、変異体タンパク質を発現させることが可能である。
以上の手法において設計された阻害剤については、その化合物に応じて、一般的に用いられている化学合成の手法を用いることで得ることができる。また、その阻害剤をDamメチラーゼを有する病原性細菌の増殖阻害剤として用いる場合には、一般に製薬的に許容される担体と混合することによって、医薬組成物を調製することができる。医薬組成物用担体としては、特に制限はなく、例えば,乳糖、ブドウ糖、D−マンノース、澱粉、結晶セルロース、炭酸カルシウム、カオリン、ゼラチン、ヒドロキシプロピルアルコール、ポリビニルピロリドン、エタノール、カルボキシメチルセルロース、カルボキシメチルセルロースナトリウム塩、ステアリン酸マグネシウム、タルク、アセチルセルロース、白糖,酸化チタン、安息香酸、パラオキシ安息香酸エアステル、デヒドロ酢酸ナトリウム、アラビアゴム、トラガント、メチルセルロース,卵黄、界面活性剤、単シロップ、クエン酸、蒸留水、グリセリン、プロピレングリコール、マクロゴール、リン酸一水素ナトリウム、リン酸二水素ナトリウム、リン酸ナトリウム、塩化ナトリウム等があり、目的とする製剤、例えば、注射薬や錠剤等の形態に応じて、本発明の方法によって同定された阻害剤と混合して使用される。
実施例
(実施例1)大腸菌SeqAタンパク質の種々の欠失変異体の調製
配列番号1に示した大腸菌seqA遺伝子(Full length 543bp)が、プラスミドpET15b(Novagen社)に挿入されたプラスミドpMY903を鋳型としてポリメラーゼ連鎖反応(PCR)を行い、グルタチオンSトランスフェラーゼ(GST)との融合タンパク質を発現する種々の欠失変異体プラスミドを作製した。
まず、プラスミドpMY903を鋳型とし、図1(a)に示したSeqAタンパク質の種々の欠失変異体をコードするDNA断片をPCRにより増幅した。各DNA断片がコードするタンパク質のN末端側にBamHI、C末端側にEcoRIの制限酵素部位を付加したそれぞれ2種類のプライマーと組換えTaqポリメラーゼ(TOYOBO社)とを用いて各DNA断片を増幅した後、PCR purification Kit(QIAGEN社)を用いて増幅したDNA断片を精製した。この増幅された二本鎖DNA断片の各3’末端には、鋳型配列とは関係なく一塩基のデオキシアデノシン(A)が付加されることから、これと相補的な一塩基のチミジン(T)の突出末端を有するプラスミドpGEM−TEasy(登録商標、PROMEGA社)にTAクローニングした。このクローン化されたDNAの塩基配列を確認した後、EcoRI及びBamHIで切り出した各DNA断片をGST融合タンパク質発現用ベクターpGEX6P−1(アマシャムファルマシアバイオテク社)のEcoRI−BamHI部位にクローン化してSeqAタンパク質の種々の欠失変異体のN末端にGSTが融合して発現する種々のプラスミドを構築した。
完全長SeqA及び上記方法により作製した種々の欠失変異体遺伝子を有する大腸菌(XL1−blue)をLB培地で培養し、対数増殖期に最終濃度で1mMとなるようにIPTGを加えてタンパク質の発現を誘導した。その後、4〜6時間培養して菌体を集め、50mM Tris−HCl、0.5M NaCl、10%グリセロールを含む緩衝液(pH8.0)中、氷冷下で超音波により細胞を破砕して発現したタンパク質を回収した。一方、同じ培地で一晩培養した培養液3mlからプラスミドDNAを抽出し、mini−prep(QIAGEN社)を用いて精製した。このようにして得られたプラスミドを制限酵素BamHI及びEcoRIで消化したのち、アガロースゲル電気泳動してプラスミドDNAの収量を求めた。菌体破砕液から可溶性タンパク質が回収されたクローンは、そのタンパク質をコードするプラスミドの収率が著しく悪いことが分かった。この実験に用いたプラスミドはコリシンE1系(ColE1系)のプラスミドであり、大腸菌のoriCとは異なり、RNAI、RNAIIで制御される別の複製機構が存在するが、上記結果からは、SeqAタンパク質もこの複製機構に関与していることが示唆された。
(実施例2)SeqA欠失変異体の精製
実施例1で作製した欠失変異体のうち、SeqA(1−59)、SeqA(7−181)、SeqA(18−181)、SeqA(42−181)、SeqA(60−181)、SeqA(71−181)の6種類の変異体を選択してそれらのタンパク質を精製した。
上記各変異体SeqAタンパク質を発現する大腸菌(XL1−blue)を2.5リットルのLB培地で培養し、実施例1と同様の方法で発現させて菌体破砕液を調製した。これを5mlのGSTrapFFカラム(アマシャムファルマシアバイオテク社)に添加し吸着させ、開始バッファーでカラムを洗浄した後、0〜20mMのグルタチオンの濃度勾配を有する50mM Tris−HCl、0.5M NaCl、10%グリセロールを含む緩衝液(pH8.0)を用いてGST融合タンパク質を溶出した。この溶出画分を透析してグルタチオンを除去した後、GSTタグを切断するためにタンパク質100μg当たり1ユニット(U)のPreScission protease(アマシャムファルマシアバイオテク社)と、4℃で12〜18時間反応させた。続いて、GSTタグを除去するために、反応液を再び5mlのGSTrapFFカラムに添加して、非吸着画分(Flow through画分)を分取した。更に、Superdex75カラムにより6種類のタンパク質を精製した。
対照として発現させた完全長SeqAタンパク質は、上記方法によりGSTタグを切るとほとんど凝集してしまい、微量しか精製できなかった。SeqA(7−181)、SeqA(18−181)はGSTタグを切ると分解する傾向があった。SeqA(1−59)は多量体として存在することが示唆された。これらの結果より、SeqAタンパク質の二量体化はN末端領域を介して起こることが分かった。CDスペクトルの測定を行ったところ、何れのタンパク質も高次構造を保持していることが示された。
(実施例3)ゲルシフトアッセイによるヘミメチル化DNAとの結合活性の測定
実施例2で精製した種々の欠失SeqAタンパク質がヘミメチル化DNAに結合する活性をゲル電気泳動による移動度の変化(ゲルシフトアッセイ)により測定した。4μgの変異体SeqAを含む20μlの結合溶液(10mM Tris−HCl(ph7.5)、1mM EDTA、10%グリセロール)に種々のヘミメチル化、又はフルメチル化DNAを加え、25℃で30分以上静置した後に1×TBE、12%アクリルアミドゲルで50V定電圧で電気泳動を行い、ゲルをエチジウムブロマイド染色した。
まず、これまでにSeqAタンパク質は2個以上のヘミメチル化G(m6A)TC配列に結合することが分かっていたので、配列番号3〜8に示した6種類の一本鎖オリゴヌクレオチドを合成し、それぞれ相補鎖をアニールして以下の3種類の二本鎖DNAを合成した。
フルメチル化、及びヘミメチル化DNAとしては、上記GATC配列のアデニンのN6位をメチル化したオリゴヌクレオチドを合成し、アニーリングしたものを使用した。例えば、配列番号3のGATC配列(枠で囲んだ部分)のアデニンをメチル化した一本鎖オリゴヌクレオチドと配列番号4の非メチル化オリゴヌクレオチドとアニーリングさせるとヘミメチル化DNA(SeqA bsA−37(M+/M−)と表す。)が調製される。一方、配列番号6の一本鎖オリゴヌクレオチドをメチル化し、配列番号5の非メチル化オリゴヌクレオチドとアニーリングさせるとヘミメチル化DNA(SeqA bsB−26(M−/M+)と表す。)を調製することができる。SeqA bsC−14と種々の欠失変異体SeqAタンパク質を用いて行ったゲルシフトアッセイの結果を図5に示した。図中、1〜4の各レーンに用いたDNAは、1:M+/M+、2:M+/M−、3:M−/M+、4:M−/M−のフルメチル、ヘミメチル又は非メチル化DNAを添加したことを、又各電気泳動パターンの下に示した数字は変異体SeqAタンパク質を構成するアミノ酸残基を示す。図5より、SeqAタンパク質のN末端領域のみ(1〜59位)ではDNA結合能がないことが分かる。一方、N末端から7個〜70個のアミノ酸が欠失した変異体でもヘミメチル化DNAとの結合能を有する。即ち、SeqAタンパク質のDNA結合領域はN末端から71番目以降のC末端領域であることが分かった。また、ヘミメチル化部位が1ヶ所でもSeqAはヘミメチル化DNAと結合できることが分かった。
(実施例4)結晶化とX線結晶構造解析データの収集
実施例3の結果より、N末端部分を最も大きく欠失した変異体SeqA(71−181)タンパク質をX線結晶構造解析のために精製し、ヘミメチル化DNAとの複合体の結晶を作製した。
実施例2と同様の方法により、5リットルの培養液からGSTと融合した変異体SeqA(71−181)タンパク質を回収し、5mlのGSTrapFFカラムに吸着させ、0〜20mMのグルタチオン濃度勾配で溶出した後、透析によるグルタチオンの除去、及びPreScission proteaseによるGSTタグの除去を行った。続いて5mlのGSTrapFFカラムに通してGSTタグを除去した後、更にSuperdex75カラムにより変異体SeqA(71−181)タンパク質を精製した。
このタンパク質を種々の長さの二本鎖ヘミメチル化DNAと1.5:1のモル比で混合し、濃縮して結晶化を行ったところ、以下の10塩基対からなるヘミメチル化二本鎖DNAとの複合体が六角柱状の結晶を作ることが分かった。
上記SeqA(71−181)タンパク質とSeqA bsc−10(M+/M−)との複合体は、ハンギングドロップ法により、0.1M HEPES−Na(pH7.5)、1.4Mクエン酸3ナトリウム水和物を含む溶液にて結晶化した。得られた結晶は、SeqA(71−181)タンパク質と10塩基対のヘミメチル化DNAとの複合体が2回回転軸で対称な2量体であり、対称性の高い六方晶系のP622であった。なお、格子定数は、a=b=152.238Å、c=119.338Å、単位格子はα=β=90°、γ=120°であった。
天然型及びセレノメチオニン置換体結晶の両方のデータセットを、理研播磨研究所の8GeVの大型放射光施設(SPing−8)のビームラインI(BL41XU)で収集した。
セレノメチオニンによる重原子置換体結晶から得られたデータを用いて、多波長異常散乱法(MAD法)により位相決定を行い、天然型結晶のデータを用いて拡張(Phase extention)を行い、最終的に3.0Åの電子密度マップが得られた。立体構造のグラフィック表示はプログラムMOLSCRIPT及びSPOCKを用いて行った。
(実施例5)SeqAタンパク質のヘミメチル化DNAとの結合部位に結合する化合物のインシリコスクリーニング
〈データベース最適化〉
低分子化合物データベースの対照データベースとしては、SPECS社から提供されている低分子化合物カタログデータベースを用いた。1エントリーに複数分子含むものは1分子ごとに分割した上で、重複を除いたライブラリをスクリーニングの母集団(152323分子)とした。次に、”Lipinski’s Rule of 5”に基づき、上記低分子化合物データベースについてのターゲット非依存最適化を行った。ここで用いた絞込条件は以下の通りである。
1.分子量100以上500以下
2.計算LogP値(o/w)5以下(XLOGP−1アルゴリズム使用)、
3.水素結合アクセプター原子数(低分子化合物に含まれるNとOの数)10以下
4.水素結合ドナー原子数(低分子化合物に含まれるNHとOHの数)5以下
更にドッキング計算を適切に行うために以下のような分子を除外した。
1.回転可能な単結合数が21以上のもの
2.ラジカルを含むもの
3.H,C,N,O,F,S,P,Cl,Br,I以外の元素を含むもの。
絞込み後の分子数は103773となった。
〈結合部位予測〉
大腸菌のSeqAタンパク質の中で、図3に示したヘミメチル化DNAとの結合に本質的に関わっていると推察される残基群(配列番号2に示したアミノ酸配列において115位のグリシンから118位のアルギニン、及び149位のスレオニンから153位のスレオニンを含むループ領域)を結合部位とした。
〈スクリーニング〉
(1)1次スクリーニング
Dock4.0を用いて、上記結合サイトについて、先に最適化を行った低分子化合物ライブラリー全体に対してドッキングを行った。この時、Dockのエネルギースコア(energy score)に基づいて低分子化合物をランク付けした。
(2)2次スクリーニング
1次スクリーニングの結果得られた上位10000分子とデータベース内に含まれるその類似化合物(Sybyl Finger Print tanimoto similarity0.8以下)の11171分子について、AutoDock3.0.5を用いて詳細なドッキングを行った。その後、ドッキングの際に使用したスフィアーから4Å以内にある化合物に絞込み、更に計算が異常終了した分子を除去した。この結果、最終的に9961分子についてドッキング構造を得た。得られた化合物のうち、上述の結合部位との結合性が高い上位100化合物をリガンド候補化合物とした。このリガンド候補化合物のΔG(結合自由エネルギー変化)は、−9.8kcal/mol以上であった。
(実施例6)NMRによるSeqAタンパク質のヘミメチル化DNAとの結合部位に結合する化合物のスクリーニング
実施例5で得られた各リガンド候補化合物をDMSO−d6に溶解し、1mMに調整した。実施例2で調製したSeqA(71−181)タンパク質は緩衝液A(20mM Tris−d11(pH7.5)/0.5M NaClとなるように重水に溶解したもの)を用いて103.7μMの濃度に溶解した。これらを用いて、リガンド候補化合物単独と、そこにSeqA(71−181)タンパク質を1:1の比で加えたもの、との2種類の試料を用意した。
リガンド候補化合物の終濃度は50μMとなる。
リガンド候補化合物及びSeqAタンパク質の終濃度はそれぞれ50μMとなる。
上記それぞれの試料について、重水素中、298KでBrukerDRX500NMR分光計を用いて1次元1H−NMRを測定し、SeqAタンパク質を添加する前後でスペクトルに変化があるかどうか観察した。その結果、リガンド候補化合物として、試料ID:AK968−41170335、化合物名称:cis−6−[4−(4−Isopropyl−phenyl)−5−methyl−thiazol−2−ylcarbamoyl]−3,4−dimethyl−cyclohex−3−enecarboxylic acid(化合物A、−10.47kcal/mol)を用いた場合のNMRスペクトル(7.5ppm付近のシグナルを拡大したもの)を図6に示した。図6(a)は化合物A単独、図6(b)は化合物AとSeqAタンパク質とを混合したもの、図6(c)は(a)と(b)のシグナルを重ねてを比較したものである。これらの結果より、SeqAとの相互作用により化合物Aのベンゼン環の4個の水素に由来するシグナルが消失していることが認められ、該化合物がSeqAに結合していることが示唆された。
このような方法を用いて、実施例5で得られた100種類のリガンド候補化合物の中からDMSOへの溶解度及びNMRによるシグナルの検出可能なものについてNMRスペクトルを測定した結果、SeqAと相互作用が検出された化合物を以下の表4に示した。
表4に示した化合物のうち、化合物A,B,C,D,E,G,H,及びJの化学構造は互いに類似することから、これらの化合物に共通の下記一般式(I)に示す化合物は、SeqAのヘミメチル化DNA結合部位に特異的に結合することが推測される。
但し、Aはシクロヘキセン、ジメチルシクロヘキセン、ビシクロ[2,2,1]ヘプタン、ビシクロ[2,2,1]ヘプテン、オキサ−ビシクロ[2,2,1]ヘプタンからなる群から選択される何れか1種の環を、R1及びR2は水素原子又はメチル基を、R3は水素原子又は炭素数1〜4のアルキル基を表す。これらの化合物は、細胞内の生理的条件下においてSeqAタンパク質と結合することから塩の形態(ナトリウム塩、カリウム塩、アンモニウム塩等)であってもよく、分子内に不斉炭素原子を有する場合には光学活性体又はラセミ体であってもよい。
また、上記表4において、化合物Aとは比較的化学構造の異なる化合物F,Iを用いた場合のNMRスペクトルの測定をそれぞれ行い、図7に化合物Fを用いた場合の結果を示した。図7(a)は化合物F単独、図7(b)は化合物FとSeqAタンパク質とを混合したもの、図7(c)は(a)と(b)のシグナルを重ねてを比較したものである。化合物Aの場合と同様に、SeqAタンパク質と混合することによって化合物Fの特徴的なシグナルが消失していることが認められ、化合物FについてもSeqAタンパク質との相互作用が示唆された。
更に、化合物Iを用いた場合にも上述と同様の特徴をもつNMRスペクトルが得られ、SeqAタンパク質との相互作用が示唆された。
産業上の利用可能性
本発明によれば、DNA複製調節タンパク質とヘミメチル化DNAとの複合体の立体構造モデルが提供される。本複合体の立体構造は、ヘミメチル化DNAとのタンパク質の結合様式、更に、該複合体による染色体DNAの複製の調節機構を理解する上で極めて有用である。DamメチラーゼによるGATC配列のメチル化は、大腸菌近縁の特殊なグループの細菌のみが有する構造であることから、本発明のDNA複製調節タンパク質による複製制御を阻害することで、上記細菌の増殖を特異的に調節できる可能性がある。本発明により明らかとなったDNA複製調節タンパク質の立体構造は、これらの薬剤を開発するためのスクリーニング方法として利用できる。
【配列表】
【図面の簡単な説明】
図1は、本発明において合成した種々の変異体SeqAタンパク質の構造を模式的に示した図である。(a)は、20種類の変異体SeqAタンパク質の一次構造を示したものであり、(b)は、SeqAタンパク質の機能ドメインを示したものである。
図2は、DNA複製調節タンパク質とヘミメチル化DNAとの複合体の立体構造モデルを表示するコンピュータシステムの一実施形態を表した概略図である。
図3は、変異体SeqAタンパク質(71−181)と10塩基対のヘミメチル化DNAとの複合体結晶の立体構造を表したモデル図である。
図4は、大腸菌を含む種々の細菌が有するSeqAタンパク質の部分構造を、一次構造の相同性を考慮して並列して表したものである。図中、らせん構造はα−ヘリックスを矢印はβ−シートを形成する領域であることを示す。
図5は、14塩基対のオリゴヌクレオチド(SeqA bsC−14)と種々の変異体SeqAタンパク質とのゲルシフトアッセイの結果を示したものである。(a)〜(f)の各実験に用いた変異体SeqAタンパク質は、それぞれ(a):1−59、(b):7−181、(c):18−181、(d):42−181、(e):60−181、(f):71−181のアミノ酸残基から構成されている。1〜4の各レーンは、それぞれ、1:M+/M+、2:M+/M−、3:M−/M+、4:M−/M−のフルメチル、ヘミメチル又は非メチル化DNAを添加したことを示す。
図6はリガンド候補化合物AK−968−41170335(化合物A)単独(a)、及び化合物AとSeqAタンパク質との1:1の混合物(b)のプロトンNMRスペクトル(7.5ppm付近のシグナル)である。なお(c)は(a)と(b)のシグナルを重ねて比較したものである。
図7はリガンド候補化合物AN−989−14072018(化合物F)単独(a)、及び化合物FとSeqAタンパク質との1:1の混合物(b)のプロトンNMRスペクトル(7.5ppm付近のシグナル)である。なお(c)は(a)と(b)のシグナルを重ねて比較したものである。 Technical field
The present invention relates to crystallization of a DNA replication regulatory protein, determination of a three-dimensional structure of a DNA replication regulatory protein by X-ray crystal structure analysis using the crystal, and use thereof, and in particular, to the protein based on the three-dimensional structure. It relates to rational screening of binding compounds or compounds that specifically bind to hemimethylated DNA.
Background art
There are about 1900 GATC sequences in the chromosomal DNA of E. coli. This GATC sequence is usually methylated by Dam methylase. This Dam methylase transfers a methyl group from S-adenosylmethionine, which is a methyl group donor, to an amino group at the 6-position of an adenine base. The E. coli Dam methylase is encoded by the dam (DNA Adenine Methyltransferase) gene and is a monomer enzyme having a molecular weight of 31 kDa (Boye, E., et al., 1992, J. Bacteriol., 174, 1682-1685).
When replicating chromosomal DNA, the nascent strand is in a hemimethylated state until it is methylated by Dam methylase. That is, in the DNA immediately after replication, the nascent-strand GATC sequence is not yet methylated, but its complementary strand (old strand) is in a methylated state (semi-methylated state). When a Dam methylase acts on the DNA, it becomes a fully methylated DNA in which both strands are methylated. SeqA protein specifically recognizes and binds to GATC sequences that have become hemimethylated immediately after replication (Brendler et al., 1995, EMBO J., 14, 4083-4089, and Slater et al., 1995, Cell). 82, 927-936). There are 11 GATC sequences in the oriC region, which is the replication origin of Escherichia coli. SeqA binds to the oriC region in the hemimethylated state, thereby delaying methylation by Dam methylase and at the same time, the hemimethylated oriC. It is also involved in membrane binding. In addition, the SeqA protein plays a role in synchronizing the initiation of replication from oriC, and is considered to negatively control replication.
Although other factors other than SeqA are involved in this negative regulation of replication (or sequestration of the origin of replication), SeqA protein alone has an activity to bind strongly to hemimethylated DNA in vitro, and this SeqA It has been reported that protein binding requires the presence of at least two hemimethylated GATC sequences (Brendler, T., et al., 1999, EMBO J., 18, 2304-2310).
Such Dam methylase and SeqA protein are not present in mammals including humans, and are a special group of Gram-negative bacteria including pathogenic bacteria such as plague, cholera, shigella, Salmonella typhimurium and Escherichia coli O157. (See Hiraga et al., 2000, Genes to Cells, 5, 327-341). Therefore, by inhibiting the binding mechanism of DNA replication, that is, binding of Dam methylase or SeqA protein to hemimethylated DNA, the growth of these bacteria may be specifically suppressed. It has also been reported that Salmonella typhimurium deficient in Dam methylase works as a live vaccine in mice (see Hiraga et al., 2000, Genes to Cells, 5, 327-341), which is specific for hemimethylated DNA. Development of a drug that binds to and inhibits the action of Dam methylase may reduce the virulence of the bacterium and promote the production of antibodies against the bacterium without causing the infected host to become ill.
However, in order to do so, detailed information on the mode of binding between SeqA protein and hemimethylated DNA and the mechanism of binding and dissociation of these complexes is required. However, the three-dimensional structure of SeqA protein, in particular, hemimethylated DNA and The knowledge of the three-dimensional structure about the bond of is not obtained.
The present invention obtains a single crystal of a complex of E. coli SeqA protein, which is one of DNA replication regulatory proteins, and hemimethylated DNA, reveals its three-dimensional structure by X-ray crystal structure analysis, and regulates replication by SeqA protein. The purpose is to clarify the mechanism.
The present invention also provides a method for screening a compound that inhibits the formation of a complex or a compound that specifically binds to hemimethylated DNA based on the structure of the complex of SeqA protein and hemimethylated DNA. For the purpose.
Disclosure of the invention
In order to clarify the functional domain of the SeqA protein, the present inventors constructed seqA genes having various deletion mutations and expressed them in Escherichia coli so that various physical properties of the mutant protein and hemimethylated DNA As a result, the functional domain involved in the binding to hemimethylated DNA was revealed on the C-terminal side. In addition, the present invention was completed by crystallizing a complex of these functional domains and hemimethylated DNA, analyzing the X-ray crystal structure using the crystal, and clarifying the three-dimensional structure of the complex for the first time. did.
That is, the present invention relates to a crystal of SeqA protein that is a DNA replication regulatory protein, a method for producing the same, analysis of a three-dimensional structure using the same, and the complex using the three-dimensional structure thus obtained. More specifically, the present invention relates to a method for screening a compound that inhibits the formation of, or a compound that specifically binds to hemimethylated DNA.
(1) A polypeptide fragment comprising the amino acid sequence from
(2) A polypeptide fragment comprising the amino acid sequence from
(3) A crystal of a complex of a polypeptide fragment consisting of
(4) A method for producing a crystal of a complex of a DNA replication regulatory protein consisting of the amino acid sequence shown in SEQ ID NO: 2 and hemimethylated DNA,
A solution prepared by mixing a DNA replication regulatory protein having a concentration of 4 to 6 mg / ml and hemimethylated DNA in a molar ratio of 1: 1 to 2: 1 contains 1-2 M trisodium citrate hydrate, A method of crystallizing by a vapor diffusion method using a buffer solution having a pH of 7.0 to 8.0.
(5) Using the polypeptide fragment described in (1), a compound that binds to the polypeptide fragment is designed or selected, and a compound that inhibits DNA replication regulation ability and / or a compound that specifically binds to hemimethylated DNA is screened. how to.
(6) A method for determining a three-dimensional structure of a DNA replication regulatory protein or a complex of the protein and hemimethylated DNA,
(A) producing a crystal of a DNA replication regulatory protein or a complex of the protein and hemimethylated DNA;
(B) a step of obtaining X-ray diffraction data by the heavy atom isomorphous substitution method or the multiwavelength anomalous scattering method using the crystal; and
(C) determining three-dimensional structure coordinates based on the X-ray diffraction data;
A method for determining a three-dimensional structure of a DNA replication regulatory protein or a complex of said protein and hemimethylated DNA,
(7) The method according to (6), wherein the DNA replication regulatory protein is a SeqA protein of a bacterium of the genus Escherichia, Haemophilus, Pasteurella, or Vibrio.
(8) A method for identifying a compound that inhibits the ability to regulate DNA replication,
(A) constructing a DNA replication regulatory protein or a complex of the protein with hemimethylated DNA, or a three-dimensional structure of the polypeptide fragment of (1) or its DNA binding site using a computer model;
(B) designing or selecting a candidate compound that inhibits the ability to regulate DNA replication based on the three-dimensional structure;
(C) synthesizing or obtaining the designed or selected candidate compound;
(D) contacting the candidate compound with the DNA replication regulatory protein in order to examine the inhibitory activity on the ability of the candidate compound to regulate DNA replication;
A method for identifying a compound that inhibits the ability to regulate DNA replication.
(9) The method according to (8), wherein the DNA replication regulatory protein is a SeqA protein of a bacterium of the genus Escherichia, Haemophilus, Pasteurella or Vibrio.
(10) The method according to (8) or (9), wherein the inhibitory activity on the ability to regulate DNA replication in the step (d) is detected by gel shift assay.
(11) The method according to any one of (8) to (10), wherein the three-dimensional structure model is substantially defined by atomic coordinates shown in Table 1 of the present specification.
(12) A compound that inhibits the ability to regulate DNA replication, characterized by being identified by the method according to any one of (5) or (8) to (11).
(13) A method for producing an antibacterial composition containing a compound that inhibits the ability to regulate DNA replication, wherein the ability to regulate DNA replication by the method according to any one of (5) or (8) to (11) above A method for producing an antibacterial composition, comprising the steps of: identifying a compound that inhibits the activity; and mixing the identified compound with a stabilizer or carrier.
(14) A method for identifying a compound that specifically binds to hemimethylated DNA,
A step of constructing a three-dimensional structure of a complex of (a) a DNA replication regulatory protein or the polypeptide fragment according to (2) and hemimethylated DNA using a computer model;
(B) designing or selecting a candidate compound that binds to hemimethylated DNA based on the three-dimensional structure;
(C) synthesizing or obtaining the designed or selected candidate compound;
(D) contacting the candidate compound with hemimethylated DNA in order to examine the binding ability of the candidate compound to hemimethylated DNA;
A method for identifying a compound that specifically binds to hemimethylated DNA, comprising:
(15) The method according to (14), wherein the candidate compound is a mutant DNA replication regulatory protein.
(16) A computer system that outputs a three-dimensional structure of a DNA replication regulatory protein comprising the amino acid sequence shown in SEQ ID NO: 2 or a complex of the protein and hemimethylated DNA,
(A) storage means for storing and storing computer-readable data including atomic coordinates of amino acid residues corresponding to the binding site of the DNA replication regulatory protein with hemimethylated DNA;
(B) Deriving means for reading out the data held in the storage means and deriving a three-dimensional structure model;
And (c) an output unit that receives the derivation result and outputs the three-dimensional structure model.
(17) The binding site of the DNA replication regulatory protein to hemimethylated DNA is from glycine at position 115 to arginine at position 118 and threonine at position 149 to threonine at position 153 of the amino acid sequence shown in SEQ ID NO: 2. (14) The computer system according to (16), characterized in that it consists of a region.
(18) A DNA replication regulation inhibitor comprising a compound represented by the following general formula (I) or a salt thereof as an active ingredient.
Wherein A is selected from the group consisting of cyclohexene, dimethylcyclohexene, bicyclo [2,2,1] heptane, bicyclo [2,2,1] heptene, oxa-bicyclo [2,2,1] heptane. Any one ring is R1And R2Is a hydrogen atom or a methyl group, R3Represents a hydrogen atom or an alkyl group having 1 to 4 carbon atoms).
(19) An antibacterial composition comprising a compound represented by the above general formula (I) or a salt thereof as an active ingredient.
It is.
BEST MODE FOR CARRYING OUT THE INVENTION
In the present invention, “DNA replication regulatory protein” refers to a protein that regulates DNA replication by binding to the replication initiation region of chromosomal DNA immediately after replication and inhibiting new replication initiation until the cell cycle is synchronized. Such regulation in E. coli is known to be performed by the SeqA protein, which is an expression product of the seqA gene, and the nucleotide sequence and the primary structure of the protein have already been clarified (Lu, M., et al. , 1994, Cell, 77, 413-426, GenBank Accession No. U07651). SeqA protein is present in various bacteria having Dam methylase including E. coli, for example, bacteria of the genus Escherichia, Haemophilus, Pasteurella or Vibrio. And pathogenic bacteria such as Escherichia coli O157. Furthermore, at least a part of the protein having a DNA replication regulation function is substantially included in the “DNA replication regulation protein” in the present invention.
In the present invention, “hemimethylated DNA” refers to double-stranded DNA having a GATC sequence in which only adenine in one strand is N6DNA that has undergone methylation at the position may be either biologically derived or chemically synthesized. Examples of the organism-derived material include oriC, which is a replication initiation region of E. coli. OriC consisting of 245 bp has 11 GATC sequences, and immediately after semi-conservative replication, it exists as a hemimethylated state in which only one strand is methylated until the nascent strand is methylated by Dam methylase. . On the other hand, a double-stranded oligonucleotide of any length is designed by chemical synthesis, and only the adenine of the GATC sequence of one strand is N6It can also be prepared by synthesizing a methylated oligonucleotide and annealing it with a complementary strand.
In the present invention, a “mutant” of a DNA replication regulatory protein has an amino acid sequence in which at least one amino acid of the amino acid sequence shown in SEQ ID NO: 2 has been deleted, added, inserted, substituted or modified, and hemimethylated A modified protein that retains at least a part of the binding activity with DNA.
(Search for functional domain of SeqA protein)
FIG. 1 (a) shows 20 mutant SeqA proteins from which amino acid sequences of various lengths have been deleted from the N-terminal side and C-terminal side of the SeqA protein. By constructing a plasmid having a mutant seqA gene encoding these and introducing it into E. coli to synthesize a GST fusion protein, in 5 types of plasmids expressing full-length SeqA protein and N-terminal deletion mutant SeqA protein, It was found that the copy number of the plasmid was extremely reduced. With respect to the plasmid expressing the C-terminal deletion mutant SeqA protein, the copy number was restored to the same copy number as that of the vector-only plasmid without the seqA gene only by deleting the C-terminal by 5 amino acid residues. This suggests that the SeqA protein is involved not only in the Escherichia coli chromosome oriC but also in the replication of the colicin E1 plasmid. It was also revealed that SeqA protein has a DNA binding domain on the C-terminal side (FIG. 1 (b)).
(Preparation of complex crystal of DNA replication regulatory protein and hemimethylated DNA)
The most commonly used technique for clarifying the three-dimensional structure of a protein is an X-ray crystal structure analysis technique. That is, the protein is crystallized, the monochromatic X-ray is applied to the crystal, and the three-dimensional structure of the protein is clarified based on the obtained X-ray diffraction image (Blundell, TL). And Johnson, L.N., PROTEIN CRYSTALLOGRAPY, p.1-565, (1976) Academic Press, New York).
Crystallization is performed by adding a precipitant to the target protein solution or reducing the amount of the solvent by evaporation, etc., so that the protein precipitates as a crystal under certain conditions when the protein changes from a solution state to a non-solution state. The property to be used is used. Crystallization requires highly purified protein. In addition, physical and chemical factors such as protein concentration, salt concentration, hydrogen ion concentration (pH), type of precipitating agent to be added, and temperature are involved as conditions for crystallization. Furthermore, there are many crystallization methods such as batch method, dialysis method, vapor diffusion method and the like as methods for adding a precipitant and adjusting the amount of solvent (Blundell, TL and Johnson, L.N.,). PROTEIN CRYSTALLOGRAPY, p. 59-82, (1976) Academic Press, New York). For example, the vapor diffusion method is a mechanism in which a volatile solvent or a precipitant moves by diffusion through a gas phase. As the protein solution vapor diffuses with the precipitant solution, both the protein concentration and the precipitant concentration increase, and crystallization occurs in the supersaturated region. There are methods such as a hanging drop method, a sitting drop method, and a sandwich drop method, depending on how the protein solution droplet is formed. In order to obtain protein crystals suitable for X-ray crystallography in this way, it is necessary to obtain high-purity proteins for each protein and to study various factors in crystallization and optimization of crystallization methods. Become. In particular, the preparation of highly pure protein is an important factor for successful crystallization. For this reason, rapid and uniform protein can be prepared by expressing the cloned gene in an efficient expression system.
A crystal of a complex of the DNA replication regulatory protein of the present invention and hemimethylated DNA is prepared as follows. The base sequence encoding the E. coli SeqA protein is already known, and can be easily expressed in the original host E. coli and various other hosts using recombinant DNA technology.
In one embodiment of the present invention, E. coli SeqA protein can be expressed in a large amount by a system using recombinant E. coli. Various plasmid vectors and the like for expressing a large amount of genes in recombinant E. coli are commercially available. For example, a pET system (Novagen) or the like in which a gene to be expressed can be introduced downstream of a strong T7 phage promoter and transcribed by T7 RNA polymerase supplied by the host E. coli can be used. In this system, the T7 RNA polymerase gene is integrated into the host E. coli chromosome and is downstream of the lacUV5 promoter, so that expression can be controlled by induction by addition of IPTG. In addition, by introducing various tag sequences into the N-terminal side or C-terminal side of the E. coli SeqA protein, purification can be easily performed using a metal chelate resin (histidine tag), antibody (T7 tag, CBD tag, etc.), etc. can do. The purified fusion protein can further recover only the E. coli SeqA protein portion using a protease such as enterokinase or thrombin.
Further, by growing and culturing a recombinant E. coli expressing E. coli SeqA protein in a medium containing selenomethionine or selenocysteine containing selenium as a heavy metal atom, the methionine or cysteine residue in the E. coli SeqA protein is selenomethionine or A mutant protein substituted with selenocysteine is obtained.
Further, these proteins are purified to a high purity so as to be suitable for crystallization. As purification methods, methods commonly used as methods for purifying proteins by those skilled in the art such as column chromatography (affinity, hydrophobicity, ion exchange, gel filtration, etc.), salting out, centrifugation, electrophoresis, etc. are used alone. Or in combination.
Next, crystals of a complex of DNA replication regulatory protein and hemimethylated DNA are prepared. When analyzing the function of a DNA binding protein such as SeqA protein, it is essential to crystallize in a modeled system in which a complex is formed with a specific oligonucleotide. For example, it is preferable to previously mix SeqA protein of E. coli and hemimethylated double-stranded DNA of about 10 to 50 base pairs in a molar ratio of 1: 1 to 2: 1.
In addition to the method of introducing heavy metal atoms into protein by culturing in the above selenium-containing medium, natural protein crystals are converted into metal salts containing gold, platinum, iridium, osmium, mercury, lead, uranium, samarium, etc. A heavy atom derivative crystal can also be prepared by immersing in a solution of an organometallic compound, and is used when applying the heavy atom isomorphous substitution method and the multiwavelength anomalous dispersion method.
A complex crystal of a SeqA
(X-ray crystal structure analysis of complex crystal of DNA replication regulatory protein and hemimethylated DNA)
The crystal structure of the complex of the DNA replication regulatory protein and hemimethylated DNA thus obtained is analyzed using an X-ray crystal structure analysis technique known to those skilled in the art. In the determination of the three-dimensional structure as in the present invention in which the three-dimensional structure of the related protein is unknown and the structure cannot be analyzed by the molecular substitution method using the three-dimensional structure, the heavy atom substitution method or the multi-wavelength anomalous dispersion method (MAD method) is used. ) Can be applied. In one embodiment of the present invention, the X-ray crystallographic analysis is a MAD method, and the X-ray used for this is a wavelength of 0.3 to 3.0 mm obtained from synchrotron radiation. The MAD method is a method for obtaining X-ray diffraction data at a plurality of wavelengths from a heavy atom isomorphous substituted crystal having an absorption edge near incident X-ray energy. The resonance between the X-ray and the electron shell of the heavy atom causes a difference in X-ray scattering, which can solve the phase problem in protein structural analysis. Although the principle of this method has been known for a long time, it was first used for protein structure determination with the advent of synchrotron radiation, which is tunable in wavelength, and Hendrickson et al. Successful (see Hendrickson WA et al.,
The synchrotron radiation light is radiation light obtained by accelerating electrons injected into the storage ring by a magnetic field, and has much stronger energy than a normal X-ray generator. The third generation large-scale synchrotron radiation facility SPring-8 (8 GeV) of RIKEN Harima Institute can be used.
The measured diffraction image data is processed into reflection intensity data using a program DENZO (Mac Science) or a similar image processing program. After obtaining the position of the heavy atom bonded to the protein in the crystal using the difference Patterson diagram from the reflection intensity data of the natural crystal and the reflection intensity data of the heavy atom substitution crystal at a plurality of wavelengths, the program PHASES or CCP4 or The initial phase is determined by refining the heavy atom position parameters using a similar diffraction data analysis program. The determined initial phase is improved to a reliable phase according to a solvent smoothing method using program DM (CCP4 package) or similar phase improvement program (electron density improvement program).
A three-dimensional structure model of a complex of a DNA replication regulatory protein and hemimethylated DNA can be constructed from the electron density diagram displayed on the three-dimensional graphics by the program O by the following procedure. First, a plurality of regions having characteristic amino acid sequences are searched for on an electron density map. Next, a partial structure of amino acid residues suitable for the electron density is constructed on the three-dimensional graphics using the program O while referring to the amino acid sequence starting from the found region.
By sequentially repeating this operation, all amino acid residues of the complex of DNA replication regulatory protein and hemimethylated DNA are adapted to the corresponding electron density, and an initial three-dimensional structure model of the entire complex is constructed. The constructed three-dimensional structure model is used as a starting model structure, and the three-dimensional coordinates describing the three-dimensional structure are refined according to the refinement protocol of XPLOR which is a structure refinement program. The progress of refinement and the check of the molecular model can be confirmed by the following indicators. The reliability factor (R factor) is a measure of the degree of coincidence between the absolute value of the crystal structure factor obtained from the diffraction intensity measurement and the absolute value of the crystal structure factor calculated from the molecular model. Small value. In addition, a method (Ramachandran plot) of calculating dihedral angles of the protein main chain and plotting them to check whether or not those values are in an allowable region is also used.
In this way, the three-dimensional atomic coordinates of the complex of the DNA replication regulatory protein of the present invention and hemimethylated DNA (value indicating the spatial positional relationship of each atom) are obtained for the first time. The obtained atomic coordinates are shown in Table 1 according to the protein data bank text format, which is a notation commonly used by those skilled in the art.
The atomic coordinates shown in Table 1 are the crystal structure of a complex of E. coli SeqA protein (71-181) and 10 base pair hemimethylated DNA (SeqA bsC-10). Thus, the three-dimensional structure of the SeqA protein possessed by other bacteria related to E. coli can be easily determined. Examples of bacteria related to Escherichia coli include the genus Escherichia, the genus Haemophilus, the genus Pasteurella, and the genus Vibrio. As shown in FIG. The homology between the E. coli SeqA protein and the amino acid sequence is very high. As a method for determining the three-dimensional structure of such highly homologous proteins, there is a molecular replacement method. After preparing a crystal of a complex of the SeqA protein of the related bacterium and hemimethylated DNA by the same method as the present invention, obtaining X-ray diffraction data, determining the three-dimensional structure of the related protein by molecular replacement method These are also included as one embodiment of the present invention.
(Computer system that displays a three-dimensional model of a complex of DNA replication regulatory protein and hemimethylated DNA)
Atomic coordinates obtained from a crystal of a DNA replication regulatory protein according to the present invention or a complex of the protein and hemimethylated DNA are input to a computer on which a computer program that expresses a three-dimensional structure of a molecule operates or a storage medium of the computer By doing so, it becomes possible to express in detail the three-dimensional structure of a complex of a DNA replication regulatory protein and hemimethylated DNA.
FIG. 2 is a schematic diagram illustrating one embodiment of these computer systems. Referring to FIG. 2, a storage means, a derivation means, and an output means are shown as the computer system of the present invention. As the storage means, any computer-readable data including the atomic coordinates of amino acid residues corresponding to the binding site of DNA replication regulatory protein with hemimethylated DNA can be read and stored by the derivation means. It is not particularly limited. For example, it is realized by storing the data in a storage medium such as a flexible disk, a hard disk, a CD-ROM, an optical disk, a magneto-optical disk, or a magnetic tape.
Various methods can be used for inputting computer-readable data including the atomic coordinates of amino acid residues corresponding to the binding site of DNA replication regulatory protein to hemimethylated DNA into the storage means. For example, data recorded on these recording media can be read from a flexible disk drive or a CD-ROM drive. Alternatively, desired data can be received from a database such as a PDB over a network.
Based on the data read from the storage means, the derivation means derives a three-dimensional structure model representing at least a part of the complex of DNA replication regulatory protein and hemimethylated DNA. The configuration of the deriving means is not particularly limited, but QUANTA (Molecular Simulations), SYBYL (Molecular Modeling Software), AMBER (Weiner, SJ, et al., (1984) J. Am. Chem. Soc., 106, 765-784) or a program such as CHARMM (Brooks, BR et al., (1983) J. Comp. Chem. 4, 187-217) is installed on a desired computer. This is realized. Further, following the step of generating these molecular models, the above CHARMM, AMBER, etc. are used as a program for calculating the conformational energy of the complex and minimizing the energy.
In response to the result derived by the deriving means, the output means for outputting the three-dimensional structure model of the binding site of the DNA replication regulatory protein with the hemimethylated DNA may use various conventionally used devices. it can. For example, the image can be displayed on a display device called a CRT using a program such as QUANTA. Also included are printers that display such images on paper and disk drives for storing in other storage media.
FIG. 3 shows the three-dimensional structure of the complex of Escherichia coli SeqA protein and hemimethylated DNA obtained in this manner with a resolution of 3.0 mm in a ribbon model. As is clear from FIG. 3, the obtained crystal is a dimeric crystal in which a complex of SeqA (71-181) protein and 10 base pair hemimethylated DNA is symmetric about the two-fold rotation axis. The domain structure of SeqA (71-181) protein confirmed from the three-dimensional structure is shown in FIG. As shown in FIG. 4, the SeqA (71-181) protein has 7 α-helical structures and 2 β-sheet structures, and includes a loop region including glycine at position 115 to arginine at position 118. , And a loop region containing threonine at position 149 to threonine at position 153, in the hemimethylated DNA G (m6A) It turns out that it couple | bonds with the TC arrangement | sequence part (refer FIG. 3).
(Use of 3D structure)
By inputting all or part of the atomic coordinates of the complex of DNA replication regulatory protein and hemimethylated DNA provided by the present invention into a computer or a storage medium thereof, on which a computer program that expresses the three-dimensional structure of the molecule operates A compound that binds to the binding site of DNA replication regulatory protein with hemimethylated DNA and inhibits the formation of the complex, or has a three-dimensional structure similar to the binding site of DNA replication regulatory protein with hemimethylated DNA, It becomes possible to identify, search, evaluate, or design a compound that binds strongly to the immobilized DNA. The compound may be either a natural product compound or a synthetic compound, and may be either a high molecular compound or a low molecular compound.
In such a method, a candidate compound and a DNA replication regulatory protein are first displayed by a computer model, and a candidate compound having a shape or chemical structure that fits well with the binding site of the DNA replication regulatory protein to hemimethylated DNA by visual observation. The step of finding (lead compound) is included. In order to create and display a molecular model, programs such as QUANTA and SYBYL can be used. Furthermore, various computer programs for estimating affinity, repulsive force, steric hindrance, and the like of the DNA replication regulatory protein with the binding site with hemimethylated DNA can be used. Examples of these programs include, for example, GRID (Goodford, PJ, (1985) J. Med. Chem., 28, p. 849 for determining an energetically suitable binding site for a biopolymer. -857), MCSS for searching for functional binding sites (Miranker, A., et al., (1991) Proteins: Structure, Function and Genetics, 11, p. 29-34), or macromolecules and ligands. AUTODOCK (Goodsell, DS, et al., (1990) PROTEINS: Structure, Function and Genetics, 8, 195-202), and DOCK ( untz, I.D., et al., include (1982) J.Mol.Biol.161,269-288) or the like.
Once these candidate compounds (lead compounds) are found, the three-dimensional interaction with the candidate compounds is then visually examined on a computer screen displaying the binding sites of DNA replication regulatory proteins with hemimethylated DNA. Can be further optimized. A model for optimizing candidate compounds can be constructed using a program such as QUANTA or SYBYL described above. In addition to these, various useful programs for the optimization of molecular modeling are available, such as CAVEAT (Lauri, G., and Bartlett, PA, J. (1994) Compute. Aided Mol. Des. 8, 51-66) and HOOK (Eisen, MB, et al. (1994) Proteins: Struct., Funct., Genet., 19, 199-221).
Further, in addition to the above program, it is also possible to automatically construct a candidate compound directly from the three-dimensional structure of the binding site of DNA replication regulatory protein to hemimethylated DNA (de novo) and output the structure. For these, LUDI (Bohm, HJ, (1992) J. Comp. Aid. Molec. Design.), LEGEND (Nishibata, Y., et al., (1991) Tetrahedron 47, 8985), etc. Other programs are also available.
Subsequently, whether or not the candidate compound or the optimized compound inhibits the binding between the DNA replication regulatory protein and the hemimethylated DNA is confirmed by various methods. For example, it is confirmed whether or not the DNA replication regulatory protein can bind to hemimethylated DNA by bringing the two into contact with each other in an aqueous solution, followed by electrophoresis or the like. If the candidate compound or the optimized compound can inhibit the binding between the DNA replication regulatory protein and the hemimethylated DNA, it is considered that the replication regulatory ability by the DNA replication regulatory protein is also inhibited.
Alternatively, the interaction between the candidate compound and the DNA replication regulatory protein can be detected spectroscopically using NMR or mass spectrometry. In general, NMR signals sensitively reflect changes in the local environment of the molecule (ligand binding, structural changes, etc.), so when NMR spectra are measured by mixing proteins that interact with ligands, Broading and disappearance, changes in chemical shift values, etc. are confirmed. On the contrary, the structure of a protein in a state bound to a ligand can also be specifically detected.15Using proteins uniformly labeled with N15N-1By using the HHSQC spectrum, only the NMR signal of the protein can be observed, and local structures such as amino acid residues that interact with the ligand can be found.
Next, in order to identify a compound that specifically binds to hemimethylated DNA, the three-dimensional structure of the region involved in the binding of DNA replication regulatory protein to hemimethylated DNA is an important clue. As described above, the region from the glycine at position 115 to the arginine at position 118 and the region from threonine at position 149 to threonine at position 153 of the SeqA protein shown in SEQ ID NO: 2 are based on the atomic coordinates shown in Table 1. The G of hemimethylated DNA by forming the three-dimensional structure shown in FIG.m6A) It turns out that it is interacting with the TC arrangement | sequence part. In normal double-stranded DNA, the base moiety is hydrogen bonded to the complementary strand, so it exists inside the double helix structure. However, in hemimethylated DNA, the amino group at
One such candidate compound is a mutant DNA replication regulatory protein. For example, the two loop regions that bind to hemimethylated DNA (the region from glycine at position 115 to arginine at position 118, and the region from threonine at position 149 to threonine at position 153), and the three-dimensional structure of the binding portion Any protein or peptide that retains The three-dimensional structure of the bonding portion is substantially defined by the atomic coordinates shown in Table 1. Alternatively, the amino acid residue forming the DNA binding site of the SeqA protein or an amino acid in the vicinity thereof is substituted with another amino acid or chemically modified to produce a mutant protein having improved binding ability to hemimethylated DNA. can do. Here, the “vicinity region” refers to a region involved in electrostatic interaction, hydrophobic interaction, van der Waals interaction, hydrogen bonding, etc., specifically within about 5 mm with respect to the amino acid residue. An area in
Mutant proteins designed in this way can be prepared by a number of methods. For example, DNA encoding the mutant of the present invention can be prepared by methods known to those skilled in the art such as site-directed mutagenesis, PCR, chemical synthesis, or a combination thereof. It is possible to introduce a DNA encoding these mutant proteins into an appropriate expression vector, and further culture the transformant obtained by introducing the expression vector into an appropriate cell to express the mutant protein. is there.
The inhibitor designed in the above method can be obtained by using a commonly used chemical synthesis method according to the compound. In addition, when the inhibitor is used as a growth inhibitor of pathogenic bacteria having Dam methylase, a pharmaceutical composition can be generally prepared by mixing with a pharmaceutically acceptable carrier. The carrier for the pharmaceutical composition is not particularly limited. For example, lactose, glucose, D-mannose, starch, crystalline cellulose, calcium carbonate, kaolin, gelatin, hydroxypropyl alcohol, polyvinylpyrrolidone, ethanol, carboxymethylcellulose, carboxymethylcellulose sodium Salt, magnesium stearate, talc, acetylcellulose, sucrose, titanium oxide, benzoic acid, parahydroxybenzoate air steal, sodium dehydroacetate, gum arabic, tragacanth, methylcellulose, egg yolk, surfactant, simple syrup, citric acid, distilled water, There are glycerin, propylene glycol, macrogol, sodium monohydrogen phosphate, sodium dihydrogen phosphate, sodium phosphate, sodium chloride, etc. Depending on the form of and tablets such as are used in admixture with inhibitors identified by the methods of the present invention.
Example
Example 1 Preparation of various deletion mutants of E. coli SeqA protein
E. coli seqA gene (Full length 543 bp) shown in SEQ ID NO: 1 is subjected to polymerase chain reaction (PCR) using plasmid pMY903 inserted into plasmid pET15b (Novagen) as a template, and a fusion protein with glutathione S transferase (GST) A variety of deletion mutant plasmids that express the above were prepared.
First, DNA fragments encoding various deletion mutants of the SeqA protein shown in FIG. 1A were amplified by PCR using the plasmid pMY903 as a template. Each DNA fragment was amplified using two types of primers each having a BamHI restriction enzyme site added to the N-terminal side of the protein encoded by each DNA fragment and an EcoRI restriction enzyme site added to the C-terminal side, and recombinant Taq polymerase (TOYOBO). Thereafter, the amplified DNA fragment was purified using a PCR purification kit (QIAGEN). A single-base deoxyadenosine (A) is added to each 3 ′ end of the amplified double-stranded DNA fragment regardless of the template sequence, so that a single-base thymidine (T) complementary to this is added. TA was cloned into the plasmid pGEM-TEasy (registered trademark, PROMEGA) having a protruding end of After confirming the base sequence of this cloned DNA, each DNA fragment excised with EcoRI and BamHI was cloned into the EcoRI-BamHI site of GST fusion protein expression vector pGEX6P-1 (Amersham Pharmacia Biotech) and SeqA protein Various plasmids were constructed in which GST was fused and expressed at the N-terminus of various deletion mutants.
Escherichia coli (XL1-blue) having full-length SeqA and various deletion mutant genes prepared by the above method is cultured in LB medium, and IPTG is added to a final concentration of 1 mM in the logarithmic growth phase to express the protein. Induced. Thereafter, the cells were collected by culturing for 4 to 6 hours, and the cells were disrupted by sonication in a buffer solution (pH 8.0) containing 50 mM Tris-HCl, 0.5 M NaCl, and 10% glycerol under ice-cooling. The expressed protein was recovered. On the other hand, plasmid DNA was extracted from 3 ml of a culture solution cultured overnight in the same medium and purified using mini-prep (QIAGEN). The plasmid thus obtained was digested with restriction enzymes BamHI and EcoRI and then subjected to agarose gel electrophoresis to determine the yield of plasmid DNA. It was found that the clone from which the soluble protein was recovered from the cell disruption solution had a significantly poor yield of the plasmid encoding the protein. The plasmid used in this experiment is a colicin E1 (ColE1) plasmid, and unlike E. coli EriC, there is another replication mechanism controlled by RNAI and RNAII. From the above results, SeqA protein is also It was suggested to be involved in this replication mechanism.
(Example 2) Purification of SeqA deletion mutant
Among the deletion mutants prepared in Example 1, SeqA (1-59), SeqA (7-181), SeqA (18-181), SeqA (42-181), SeqA (60-181), SeqA ( 71-181) 6 mutants were selected and their proteins were purified.
Escherichia coli (XL1-blue) expressing each mutant SeqA protein was cultured in 2.5 liters of LB medium and expressed in the same manner as in Example 1 to prepare a cell disruption solution. This was added to a 5 ml GSTrapFF column (Amersham Pharmacia Biotech), adsorbed, washed with the starting buffer, and then 50 mM Tris-HCl, 0.5 M NaCl, 10% glycerol having a gradient of 0-20 mM glutathione. The GST fusion protein was eluted using a buffer solution (pH 8.0) containing. The eluted fraction was dialyzed to remove glutathione, and then reacted with 1 unit (U) of PreScission protease (Amersham Pharmacia Biotech) per 100 μg of protein at 4 ° C. for 12 to 18 hours to cleave the GST tag. . Subsequently, in order to remove the GST tag, the reaction solution was again added to a 5 ml GSTrapFF column, and a non-adsorbed fraction (Flow through fraction) was collected. Furthermore, 6 kinds of proteins were purified by Superdex 75 column.
The full-length SeqA protein expressed as a control almost aggregated when the GST tag was cut by the above method, and only a trace amount could be purified. SeqA (7-181) and SeqA (18-181) tended to decompose when the GST tag was cut. It was suggested that SeqA (1-59) exists as a multimer. From these results, it was found that dimerization of the SeqA protein occurs via the N-terminal region. When the CD spectrum was measured, it was shown that all proteins retained higher-order structures.
(Example 3) Measurement of binding activity to hemimethylated DNA by gel shift assay
The activity of the various deleted SeqA proteins purified in Example 2 to bind to hemimethylated DNA was measured by a change in mobility (gel shift assay) by gel electrophoresis. Various hemimethylated or fully methylated DNAs were added to 20 μl of a binding solution (10 mM Tris-HCl (ph7.5), 1 mM EDTA, 10% glycerol) containing 4 μg of mutant SeqA, and left at 25 ° C. for 30 minutes or more. After that, electrophoresis was performed with 1 × TBE, 12% acrylamide gel at a constant voltage of 50 V, and the gel was stained with ethidium bromide.
First, to date, SeqA protein has more than two hemimethylated G (m6A) Since it was known to bind to the TC sequence, the six types of single-stranded oligonucleotides shown in SEQ ID NOs: 3 to 8 were synthesized, and the complementary strands were annealed, respectively. Was synthesized.
As the fully methylated and hemimethylated DNA, oligonucleotides obtained by synthesizing and annealing an oligonucleotide in which the N6 position of adenine of the GATC sequence was methylated were used. For example, when the adenine of the GATC sequence of SEQ ID NO: 3 (the part enclosed by a frame) is annealed with a methylated single-stranded oligonucleotide and the unmethylated oligonucleotide of SEQ ID NO: 4, hemimethylated DNA (SeqA bsA-37 (M+/ M−). ) Is prepared. On the other hand, when the single-stranded oligonucleotide of SEQ ID NO: 6 is methylated and annealed with the unmethylated oligonucleotide of SEQ ID NO: 5, hemimethylated DNA (SeqA bsB-26 (M−/ M+). ) Can be prepared. The results of the gel shift assay performed using SeqA bsC-14 and various deletion mutant SeqA proteins are shown in FIG. In the figure, the DNA used in each lane 1-4 is 1: M+/ M+2: M+/ M−3: M−/ M+4: M−/ M−The numbers shown below for each of the electrophoresis patterns indicate the amino acid residues constituting the mutant SeqA protein. FIG. 5 shows that there is no DNA binding ability only in the N-terminal region (
(Example 4) Crystallization and collection of X-ray crystal structure analysis data
From the results of Example 3, mutant SeqA (71-181) protein lacking the largest N-terminal portion was purified for X-ray crystal structure analysis, and a complex crystal with hemimethylated DNA was prepared.
In the same manner as in Example 2, mutant SeqA (71-181) protein fused with GST was recovered from 5 liters of the culture solution, adsorbed on a 5 ml GSTrapFF column, and eluted with a 0 to 20 mM glutathione concentration gradient. Thereafter, glutathione was removed by dialysis and the GST tag was removed by PreScience protease. Subsequently, the GST tag was removed through a 5 ml GSTrapFF column, and then the mutant SeqA (71-181) protein was further purified by a Superdex75 column.
When this protein was mixed with double-stranded hemimethylated DNA of various lengths at a molar ratio of 1.5: 1, concentrated and crystallized, hemimethylated double-stranded DNA consisting of the following 10 base pairs: It has been found that the complex with the above forms a hexagonal columnar crystal.
The SeqA (71-181) protein and SeqA bsc-10 (M+/ M−) Was crystallized by a hanging drop method in a solution containing 0.1 M HEPES-Na (pH 7.5) and 1.4 M trisodium citrate hydrate. The obtained crystal was a dimer in which a complex of SeqA (71-181) protein and 10-base-pair hemimethylated DNA was symmetric about the 2-fold rotation axis, and was a highly symmetrical hexagonal P622. It was. The lattice constants were a = b = 152.238 Å, c = 119.338 Å, and the unit cell was α = β = 90 ° and γ = 120 °.
Data sets of both natural and selenomethionine substituted crystals were collected at the beamline I (BL41XU) of the 8 GeV large synchrotron radiation facility (SPing-8) at RIKEN Harima Institute.
Using data obtained from selenomethionine heavy atom substitution crystal, phase determination is performed by multi-wavelength anomalous scattering method (MAD method), and extension (Phase extension) is performed using natural crystal data. An electron density map of 3.0 mm was obtained. The graphic display of the three-dimensional structure was performed using the programs MOLSCRIPT and SPOCK.
(Example 5) In silico screening of compounds that bind to the binding site of SeqA protein to hemimethylated DNA
<Database optimization>
As a low molecular compound database, a low molecular compound catalog database provided by SPECS was used. Those containing multiple molecules in one entry were divided into molecules, and the library excluding duplicates was used as the screening population (152323 molecules). Next, based on “Lipinski's Rule of 5”, target-independent optimization for the low molecular compound database was performed. The narrowing conditions used here are as follows.
1. Molecular weight 100 to 500
2. Calculated LogP value (o / w) 5 or less (using XLOGP-1 algorithm),
3. Number of hydrogen bond acceptor atoms (number of N and O contained in low molecular weight compound) 10 or less
4). Number of hydrogen bond donor atoms (number of NH and OH in low molecular weight compound) 5 or less
Furthermore, the following molecules were excluded in order to perform docking calculation appropriately.
1. The number of rotatable single bonds is 21 or more
2. Containing radicals
3. Containing elements other than H, C, N, O, F, S, P, Cl, Br, and I.
The number of molecules after narrowing was 103773.
<Binding site prediction>
Among the SeqA proteins of E. coli, a residue group presumed to be essentially involved in the binding to hemimethylated DNA shown in FIG. 3 (from glycine at position 115 to position 118 in the amino acid sequence shown in SEQ ID NO: 2). Arginine and a loop region comprising threonine at position 149 to threonine at position 153) were used as binding sites.
<screening>
(1) Primary screening
Dock 4.0 was used to dock the entire low-molecular compound library previously optimized for the binding site. At this time, the low molecular weight compounds were ranked based on Dock's energy score.
(2) Secondary screening
Detailed docking was performed using AutoDock 3.0.5 on the 11171 molecules of the top 10,000 molecules obtained as a result of the primary screening and the similar compounds contained in the database (Sybyl Finger Print tanmoto similiarity 0.8 or less). Thereafter, the compounds within 4 mm of the sphere used for docking were narrowed down, and the molecules for which calculation was abnormally terminated were removed. As a result, a docking structure was finally obtained for 9961 molecules. Among the obtained compounds, the top 100 compounds having high binding properties to the above-mentioned binding sites were used as ligand candidate compounds. This ligand candidate compound had a ΔG (change in binding free energy) of −9.8 kcal / mol or more.
(Example 6) Screening of compounds that bind to the binding site of SeqA protein to hemimethylated DNA by NMR
Each ligand candidate compound obtained in Example 5 was dissolved in DMSO-d6 and adjusted to 1 mM. The SeqA (71-181) protein prepared in Example 2 was 103.7 μM in concentration using Buffer A (20 mM Tris-d11 (pH 7.5) /0.5 M NaCl dissolved in heavy water). Dissolved in. Using these, two types of samples were prepared: a ligand candidate compound alone and a SeqA (71-181) protein added thereto at a ratio of 1: 1.
The final concentration of the ligand candidate compound is 50 μM.
The final concentrations of the ligand candidate compound and the SeqA protein are 50 μM, respectively.
For each of the above samples, one-dimensional using a Bruker DRX500 NMR spectrometer at 298K in deuterium.1H-NMR was measured, and it was observed whether there was any change in the spectrum before and after the addition of SeqA protein. As a result, as a ligand candidate compound, sample ID: AK968-41170335, compound name: cis-6- [4- (4-Isopropyl-phenyl) -5-methyl-thiazol-2-ylcarbamoyl] -3,4-dimethyl- FIG. 6 shows an NMR spectrum (enlarged signal around 7.5 ppm) in the case of using cyclohex-3-enecarboxylic acid (compound A, 10.47 kcal / mol). FIG. 6 (a) is Compound A alone, FIG. 6 (b) is a mixture of Compound A and SeqA protein, and FIG. 6 (c) is a comparison of overlapping signals (a) and (b). is there. From these results, it was recognized that signals derived from the four hydrogens of the benzene ring of compound A disappeared due to the interaction with SeqA, suggesting that the compound was bound to SeqA.
Using such a method, the NMR spectrum of the 100 kinds of ligand candidate compounds obtained in Example 5 with respect to solubility in DMSO and detectable signals by NMR was measured. As a result, interaction with SeqA was found. The detected compounds are shown in Table 4 below.
Among the compounds shown in Table 4, the chemical structures of the compounds A, B, C, D, E, G, H, and J are similar to each other, and therefore, they are represented by the following general formula (I) common to these compounds. It is speculated that the compound specifically binds to the hemimethylated DNA binding site of SeqA.
A is any one selected from the group consisting of cyclohexene, dimethylcyclohexene, bicyclo [2,2,1] heptane, bicyclo [2,2,1] heptene, and oxa-bicyclo [2,2,1] heptane. The seed ring is R1And R2Is a hydrogen atom or a methyl group, R3Represents a hydrogen atom or an alkyl group having 1 to 4 carbon atoms. These compounds may be in the form of a salt (sodium salt, potassium salt, ammonium salt, etc.) because they bind to SeqA protein under intracellular physiological conditions, and have an asymmetric carbon atom in the molecule May be optically active or racemic.
Further, in Table 4 above, NMR spectra were measured when compounds F and I having relatively different chemical structures from compound A were used. FIG. 7 shows the results when compound F was used. FIG. 7 (a) is Compound F alone, FIG. 7 (b) is a mixture of Compound F and SeqA protein, and FIG. 7 (c) is a comparison of overlapping signals (a) and (b). is there. As in the case of Compound A, the characteristic signal of Compound F disappeared by mixing with SeqA protein, suggesting that Compound F also interacts with SeqA protein.
Furthermore, when Compound I was used, an NMR spectrum having the same characteristics as described above was obtained, suggesting an interaction with SeqA protein.
Industrial applicability
According to the present invention, a three-dimensional structure model of a complex of a DNA replication regulatory protein and hemimethylated DNA is provided. The three-dimensional structure of this complex is extremely useful for understanding the mode of protein binding to hemimethylated DNA, and further, the regulatory mechanism of chromosomal DNA replication by the complex. Since methylation of GATC sequences by Dam methylase is a structure possessed only by a special group of bacteria closely related to Escherichia coli, the growth of the bacteria is specifically identified by inhibiting the replication control by the DNA replication regulatory protein of the present invention. May be adjustable. The three-dimensional structure of the DNA replication regulatory protein revealed by the present invention can be used as a screening method for developing these drugs.
[Sequence Listing]
[Brief description of the drawings]
FIG. 1 is a diagram schematically showing the structures of various mutant SeqA proteins synthesized in the present invention. (A) shows the primary structure of 20 mutant SeqA proteins, and (b) shows the functional domain of the SeqA protein.
FIG. 2 is a schematic diagram showing an embodiment of a computer system that displays a three-dimensional structure model of a complex of a DNA replication regulatory protein and hemimethylated DNA.
FIG. 3 is a model diagram showing a three-dimensional structure of a complex crystal of a mutant SeqA protein (71-181) and 10 base pair hemimethylated DNA.
FIG. 4 shows the partial structure of the SeqA protein possessed by various bacteria including E. coli in parallel in consideration of the homology of the primary structure. In the figure, the helical structure indicates an α-helix, and the arrow indicates a region forming a β-sheet.
FIG. 5 shows the results of a gel shift assay of 14 base pair oligonucleotide (SeqA bsC-14) and various mutant SeqA proteins. The mutant SeqA proteins used in the experiments (a) to (f) are (a): 1-59, (b): 7-181, (c): 18-181, (d): 42-, respectively. 181, (e): 60-181, (f): 71-181 amino acid residues. Each lane of 1-4 is 1: M+/ M+2: M+/ M−3: M−/ M+4: M−/ M−Of full methyl, hemimethyl or unmethylated DNA.
FIG. 6 is a proton NMR spectrum (signal around 7.5 ppm) of a ligand candidate compound AK-968-41170335 (compound A) alone (a) and a 1: 1 mixture (b) of compound A and SeqA protein. . Note that (c) is a comparison of the signals (a) and (b).
FIG. 7 is a proton NMR spectrum (signal around 7.5 ppm) of the ligand candidate compound AN-989-14072018 (compound F) alone (a) and a 1: 1 mixture (b) of compound F and SeqA protein. . Note that (c) is a comparison of the signals (a) and (b).
Claims (19)
4〜6mg/mlの濃度のDNA複製調節タンパク質と、ヘミメチル化DNAとを1:1〜2:1のモル比で混合した溶液を、1〜2Mのクエン酸3ナトリウム水和物を含有し、pH7.0〜8.0の緩衝液を用いて蒸気拡散法により結晶化する方法。A method for producing a crystal of a complex of a DNA replication regulatory protein consisting of the amino acid sequence shown in SEQ ID NO: 2 and hemimethylated DNA,
A solution prepared by mixing a DNA replication regulatory protein having a concentration of 4 to 6 mg / ml and hemimethylated DNA in a molar ratio of 1: 1 to 2: 1 contains 1-2 M trisodium citrate hydrate, A method of crystallizing by a vapor diffusion method using a buffer solution having a pH of 7.0 to 8.0.
(a)DNA複製調節タンパク質又は該タンパク質とヘミメチル化DNAとの複合体の結晶を生成する工程、
(b)該結晶を用いて重原子同型置換法又は多波長異常散乱法によりX線回折データを取得する工程、及び
(c)該X線回折データに基づいて三次元構造座標を決定する工程、
を含むことを特徴とするDNA複製調節タンパク質又は該タンパク質とヘミメチル化DNAとの複合体の立体構造の決定方法。A method for determining the three-dimensional structure of a DNA replication regulatory protein or a complex of said protein and hemimethylated DNA,
(A) producing a crystal of a DNA replication regulatory protein or a complex of the protein and hemimethylated DNA;
(B) obtaining X-ray diffraction data by the heavy atom isomorphous substitution method or multi-wavelength anomalous scattering method using the crystal, and (c) determining three-dimensional structure coordinates based on the X-ray diffraction data,
A method for determining a three-dimensional structure of a DNA replication regulatory protein or a complex of said protein and hemimethylated DNA,
(a)DNA複製調節タンパク質若しくは該タンパク質とヘミメチル化DNAとの複合体、又は請求項1記載のポリペプチド断片若しくはそのDNA結合部位の三次元立体構造を、コンピュータモデルを用いて構築する工程、
(b)該三次元立体構造に基づいて、DNA複製調節能を阻害する候補化合物を設計又は選択する工程、
(c)該設計又は選択された候補化合物を合成又は取得する工程、
(d)該候補化合物によるDNA複製調節能の阻害活性を調べるために、該候補化合物と該DNA複製調節タンパク質とを接触させる工程、
を含むことを特徴とするDNA複製調節能を阻害する化合物を同定する方法。A method for identifying a compound that inhibits the ability to regulate DNA replication, comprising:
(A) constructing a DNA replication regulatory protein or a complex of the protein with hemimethylated DNA, or a three-dimensional structure of the polypeptide fragment according to claim 1 or a DNA binding site thereof using a computer model;
(B) designing or selecting a candidate compound that inhibits the ability to regulate DNA replication based on the three-dimensional structure;
(C) synthesizing or obtaining the designed or selected candidate compound;
(D) contacting the candidate compound with the DNA replication regulatory protein in order to examine the inhibitory activity on the ability of the candidate compound to regulate DNA replication;
A method for identifying a compound that inhibits the ability to regulate DNA replication.
(a)DNA複製調節タンパク質又は請求項2記載のポリペプチド断片と、ヘミメチル化DNAとの複合体の三次元立体構造を、コンピュータモデルを用いて構築する工程、
(b)該三次元立体構造に基づいて、ヘミメチル化DNAに結合する候補化合物を設計又は選択する工程、
(c)該設計又は選択された候補化合物を合成又は取得する工程、
(d)該候補化合物のヘミメチル化DNAへの結合能を調べるために、該候補化合物とヘミメチル化DNAとを接触させる工程、
を含むことを特徴とするヘミメチル化DNAと特異的に結合する化合物を同定する方法。A method for identifying a compound that specifically binds to hemimethylated DNA, comprising:
(A) a step of constructing, using a computer model, a three-dimensional structure of a complex of a DNA replication regulatory protein or the polypeptide fragment of claim 2 and hemimethylated DNA;
(B) designing or selecting a candidate compound that binds to hemimethylated DNA based on the three-dimensional structure;
(C) synthesizing or obtaining the designed or selected candidate compound;
(D) contacting the candidate compound with hemimethylated DNA in order to examine the binding ability of the candidate compound to hemimethylated DNA;
A method for identifying a compound that specifically binds to hemimethylated DNA, comprising:
(a)前記DNA複製調節タンパク質のヘミメチル化DNAとの結合部位に対応するアミノ酸残基の原子座標を含むコンピュータ読み取り可能なデータを記憶保持する記憶手段と、
(b)前記記憶手段に保持されたデータを読み出して、三次元立体構造モデルを導出する導出手段と、
(c)前記導出結果を受けて、前記三次元立体構造モデルを出力する出力手段と、を含むことを特徴とするコンピュータシステム。A computer system that outputs a three-dimensional structure of a DNA replication regulatory protein comprising the amino acid sequence shown in SEQ ID NO: 2 or a complex of the protein and hemimethylated DNA,
(A) storage means for storing and storing computer-readable data including atomic coordinates of amino acid residues corresponding to the binding site of the DNA replication regulatory protein with hemimethylated DNA;
(B) Deriving means for reading out the data held in the storage means and deriving a three-dimensional structure model;
And (c) an output unit that receives the derivation result and outputs the three-dimensional structure model.
(上記式中、Aはシクロヘキセン、ジメチルシクロヘキセン、ビシクロ[2,2,1]ヘプタン、ビシクロ[2,2,1]ヘプテン、オキサ−ビシクロ[2,2,1]ヘプタンからなる群から選択される何れか1種の環を、R1及びR2は互いに独立して水素原子又はメチル基を、R3は水素原子又は炭素数1〜4のアルキル基を表す)。A DNA replication regulation inhibitor comprising a compound represented by the following general formula (I) or a salt thereof as an active ingredient.
Wherein A is selected from the group consisting of cyclohexene, dimethylcyclohexene, bicyclo [2,2,1] heptane, bicyclo [2,2,1] heptene, oxa-bicyclo [2,2,1] heptane. Any one of the rings, R 1 and R 2 each independently represent a hydrogen atom or a methyl group, and R 3 represents a hydrogen atom or an alkyl group having 1 to 4 carbon atoms).
(上記式中、Aはシクロヘキセン、ジメチルシクロヘキセン、ビシクロ[2,2,1]ヘプタン、ビシクロ[2,2,1]ヘプテン、オキサ−ビシクロ[2,2,1]ヘプタンからなる群から選択される何れか1種の環を、R1及びR2は互いに独立して水素原子又はメチル基を、R3は水素原子又は炭素数1〜4のアルキル基を表す)。The antibacterial composition characterized by including the compound or its salt shown by the following general formula (I) as an active ingredient.
Wherein A is selected from the group consisting of cyclohexene, dimethylcyclohexene, bicyclo [2,2,1] heptane, bicyclo [2,2,1] heptene, oxa-bicyclo [2,2,1] heptane. Any one of the rings, R 1 and R 2 each independently represent a hydrogen atom or a methyl group, and R 3 represents a hydrogen atom or an alkyl group having 1 to 4 carbon atoms).
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001370148 | 2001-12-04 | ||
JP2001370148 | 2001-12-04 | ||
PCT/JP2002/012686 WO2003048203A1 (en) | 2001-12-04 | 2002-12-04 | Stereostructure of dna replication regulatory protein and use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2003048203A1 true JPWO2003048203A1 (en) | 2005-04-14 |
Family
ID=19179416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003549390A Withdrawn JPWO2003048203A1 (en) | 2001-12-04 | 2002-12-04 | Three-dimensional structure of DNA replication regulatory protein and use thereof |
Country Status (3)
Country | Link |
---|---|
JP (1) | JPWO2003048203A1 (en) |
AU (1) | AU2002349391A1 (en) |
WO (1) | WO2003048203A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006095731A1 (en) * | 2005-03-08 | 2006-09-14 | National University Corporation NARA Institute of Science and Technology | CRYSTAL OF COMPLEX OF Rho-KINASE AND SUBSTANCE CAPABLE OF INTERACTING WITH Rho-KINASE |
CN100465643C (en) * | 2007-03-19 | 2009-03-04 | 南开大学 | Novel methods for high efficiency and rapid getting fine three dimensional structure of target protein composite body and target molecule target molecule |
JP6727052B2 (en) * | 2016-07-19 | 2020-07-22 | 株式会社日立製作所 | Biomolecule analysis device and biomolecule analysis device |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10133665A1 (en) * | 2001-07-11 | 2003-01-30 | Boehringer Ingelheim Pharma | Carboxylic acid derivatives, medicaments containing these compounds, their use and preparation |
-
2002
- 2002-12-04 WO PCT/JP2002/012686 patent/WO2003048203A1/en active Application Filing
- 2002-12-04 AU AU2002349391A patent/AU2002349391A1/en not_active Abandoned
- 2002-12-04 JP JP2003549390A patent/JPWO2003048203A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
WO2003048203A1 (en) | 2003-06-12 |
AU2002349391A1 (en) | 2003-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wall et al. | The structure of the G protein heterotrimer Giα1β1γ2 | |
Lewis et al. | Structure and dynamics of NBD1 from CFTR characterized using crystallography and hydrogen/deuterium exchange mass spectrometry | |
Korolev et al. | Major domain swiveling revealed by the crystal structures of complexes of E. coli Rep helicase bound to single-stranded DNA and ADP | |
Löwe et al. | Crystal structure of the SMC head domain: an ABC ATPase with 900 residues antiparallel coiled-coil inserted | |
Sousa et al. | Structure of the universal stress protein of Haemophilus influenzae | |
US6356845B1 (en) | Crystallization and structure determination of Staphylococcus aureus UDP-N-acetylenolpyruvylglucosamine reductase (S. aureus MurB) | |
JP2003212895A (en) | Crystal structure of antibiotic bound to 30s ribosome, and its application | |
JPWO2003048203A1 (en) | Three-dimensional structure of DNA replication regulatory protein and use thereof | |
JP2003510250A (en) | Crystallization and structure determination of Staphylococcus aureus elongation factor P | |
US20090275047A1 (en) | Crystal structure of human soluble adenylate cyclase | |
US20090265114A1 (en) | Influenza virus neuraminidase crystal structure and their use thereof | |
EP1573032B1 (en) | Human il-18 crystal structure | |
Grimm et al. | Crystal structure of Bacillus subtilis S-adenosylmethionine: tRNA ribosyltransferase-isomerase | |
Kerr et al. | Overexpression, purification, crystallization and data collection of a single-stranded DNA-binding protein from Sulfolobus solfataricus | |
AU781654B2 (en) | Crystallization and structure determination of staphylococcus aureus thymidylate kinase | |
JPWO2003040361A1 (en) | Three-dimensional structure of DNA recombination repair enzyme and use thereof | |
US20070020743A1 (en) | Undecaprenyl pyrophosphate synthase (upps)enzyme and methods of use | |
US6484103B1 (en) | Crystal structure | |
Gouaux et al. | Structure of a single amino acid mutant of aspartate carbamoyltransferase at 2.5. ANG. resolution: implications for the cooperative mechanism | |
EP2050027A2 (en) | Crystal structure of p53 mutants and their use | |
US20040171050A1 (en) | Crystallization and structure determination of staphylococcus aureus thymidylate kinase | |
US20060177871A1 (en) | Murine IL-18 crystal structure | |
Wang | I. X-ray crystallographic studies of a fibrillarin homologue. II. Biochemical studies of proCaspase-3 (proCPP32) in apoptosis, and III. Selection of Zif268 variants for specific DNA sequences using phage display | |
JP2004254621A (en) | Protein derived from extreme thermophile and crystal thereof | |
JP2004077229A (en) | Three-dimensional structure coordinate of translin, and use of it |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060207 |