JP2003242153A - 塩基配列からrnaの機能性部位を同定する方法 - Google Patents

塩基配列からrnaの機能性部位を同定する方法

Info

Publication number
JP2003242153A
JP2003242153A JP2002037443A JP2002037443A JP2003242153A JP 2003242153 A JP2003242153 A JP 2003242153A JP 2002037443 A JP2002037443 A JP 2002037443A JP 2002037443 A JP2002037443 A JP 2002037443A JP 2003242153 A JP2003242153 A JP 2003242153A
Authority
JP
Japan
Prior art keywords
base sequence
rna
analyzed
base
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002037443A
Other languages
English (en)
Other versions
JP3903420B2 (ja
Inventor
Kenji Yamamoto
健二 山本
Junji Kitagawa
純次 北川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INTERNAT MEDICAL CT OF JAPAN
INTERNATIONAL MEDICAL CENTER OF JAPAN
IYAKUHIN FUKUSAYOU HIGAI KYUUS
Iyakuhin Fukusayou Higai Kyuusai Kenkyu Shinko Chosa Kiko
Original Assignee
INTERNAT MEDICAL CT OF JAPAN
INTERNATIONAL MEDICAL CENTER OF JAPAN
IYAKUHIN FUKUSAYOU HIGAI KYUUS
Iyakuhin Fukusayou Higai Kyuusai Kenkyu Shinko Chosa Kiko
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INTERNAT MEDICAL CT OF JAPAN, INTERNATIONAL MEDICAL CENTER OF JAPAN, IYAKUHIN FUKUSAYOU HIGAI KYUUS, Iyakuhin Fukusayou Higai Kyuusai Kenkyu Shinko Chosa Kiko filed Critical INTERNAT MEDICAL CT OF JAPAN
Priority to JP2002037443A priority Critical patent/JP3903420B2/ja
Publication of JP2003242153A publication Critical patent/JP2003242153A/ja
Application granted granted Critical
Publication of JP3903420B2 publication Critical patent/JP3903420B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 【課題】 RNA塩基配列に基づく高次構造の解析によ
り、機能的に重要な部位を予測する方法を提供する。 【解決手段】 本発明は、与えられた解析対象塩基配列
に対して変異を与えた変異塩基配列を人為的に生成し、
両者の高次構造の比較に基づいて、高次構造を大きく変
化させる塩基部位を見出す手法が提供される。本発明に
より、高次構造に影響を与えるRNAの機能性部位を予
測することができる。また、変異塩基配列として一塩基
置換(SNPs)を選択した場合には、SNPsがRNA
の機能に与える影響を評価することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はRNAの機能性部位
を同定する方法に関する。
【0002】
【従来の技術】RNAはリボヌクレオチドが連結した鎖
状分子である。生体内において、リボヌクレオチドを構
成する塩基には、A(アデニン)、U(ウラシル)、C
(シトシン)および、G(グアニン)の4種類が存在す
る。生体内におけるRNAは、主に蛋白質合成において
次のような重要な役割を果たしている。 mRNA:蛋白質合成において、ゲノムの塩基配列情報
に基づいて蛋白質を構成するアミノ酸配列を指示する(m
essenger RNA;mRNA) tRNA:蛋白質合成において、蛋白質を構成するアミ
ノ酸をmRNAの遺伝暗号にしたがって運ぶ(transfer
RNA;tRNA)
【0003】蛋白質合成において、RNAの塩基配列情
報が単にアミノ酸配列をコードするのみならず、RNA
自身が高次構造を形成することで複雑な機能を持つこと
が知られている。RNAが有する、アミノ酸配列をコー
ドする機能以外の機能に必要な領域を機能性部位(funct
ional region)と言う。たとえば翻訳開始領域のmRN
Aの二次構造が、蛋白質への翻訳過程を制御する要因と
なっていることが指摘されている。このような機能は、
アミノ酸配列をコードするための遺伝暗号とは異なる機
能である。
【0004】また、特定の構造を有するRNAは、塩基
配列を認識して切断する酵素のような作用を有する。こ
のような作用を有するRNAは、リボザイムと呼ばれて
いる。スプライシングにおいてリボザイムが果たす役割
も重要視されている。真核細胞においては、ゲノムの塩
基配列が転写された後に、遺伝子を構成するエキソンが
選択的に連結されて成熟mRNAを生成する。この過程
をスプライシングと呼ぶ。リボザイムを構成するRNA
の立体構造、そしてリボザイムによって切断されるRN
Aの立体構造のいずれもが、スプライシングに影響を与
える重要な要因となる。このような機能も、アミノ酸配
列をコードする遺伝暗号とは異なる機能である。
【0005】塩基配列のデータから、それがRNAの段
階でどのような機能を持ち得るかを同定することは、医
学、薬学的な研究を進める上で重要である。RNAの機
能性部位を予測する従来の技術として、対象の塩基配列
に対応する複数の系統に渡る塩基配列を集めて比較する
という方法がある。たとえば以下に示すように塩基配列
を整列(alignment)させ、比較することで、共通する塩
基部位を抽出する。以下の例では、大文字で示した配列
が、4つの種の間で保存された配列として抽出される。 種1 ...auuGCCggAUA... 種2 ...acgGCCauAUA... 種3 ...ucuGCCguAUA... 種4 ...uucGCCuaAUA...
【0006】抽出された塩基配列を含む部位は、進化的
に保存されている部位であるため、これらの部位は機能
性部位である可能性が高いと考えられる。アミノ酸配列
においてはコドンの縮重があるため、塩基配列が相違し
ていても翻訳アミノ酸配列が保存されている可能性があ
る。一方アミノ酸配列とは無関係に、RNAの塩基配列
において保存性の高い領域は、RNAの機能性部位とし
て重要である可能性が高い。この方法は、多数の種に渡
った多くのRNA塩基配列情報の集積を必要とする。し
たがってそれらの配列を得るための生物実験には多大な
時間と労力が必要となる。
【0007】単なる塩基配列の比較ではなく、塩基配列
情報に基づいてRNAの高次構造を予測することによっ
てRNAの機能性部位を見出すことが試みられている。
たとえばZuckerは、塩基配列情報に基づいて、RNAの
立体構造を予測するためのアルゴリズムを確立した(M.
Zucker & P. Stiegler Nucleic Acids Research 9, 133
-148, 1981)。
【0008】またShapiroは、RNAをステムとループ
から構成された木構造として表現し、二つの木構造の違
いを数値的な差で表した。 (Shapiro, B.A. and Zhang,
K.,Comparing multiple RNA secondary structures us
ing tree comparisons, CABIOS, 6(4), 309-318, 199
0.)。更にHofackerらは、RNAの二次構造間の距離を
グラフの差に基づいて評価する手法を用いた(Automatic
detection of conserved RNA structure elements in
complete RNA virus genomes. Nucleic Acids Res. Aug
15;26(16):3825-36, 1998.)。
【0009】このような手法を用いてRNAの立体構造
を比較すれば、単なる塩基配列の比較に基づく解析方法
に比べて、より特異的に機能性部位を推定できるはずで
ある。しかし立体構造を比較するためには、やはり実際
に塩基配列情報を得なければならない。公知のRNAの
機能性部位の推定方法は、あくまでも実際に存在する塩
基配列間の比較によって共通構造を見出し、それを機能
性部位として同定するための方法であった。つまり、機
能性部位の推定のためにRNA塩基配列情報の集積を必
要とする点においては、塩基配列を比較する方法と同じ
課題を有している。
【0010】
【発明が解決しようとする課題】本発明は、RNAの塩
基配列情報の集積を必要としない、RNAの機能性部位
を同定するための新規な方法の提供を課題とする。
【0011】
【課題を解決するための手段】本発明者らは、RNAの
有する機能と高次構造の関連に着目した。RNAは、塩
基間の相補的結合に基づいて、特徴的な高次構造を形成
することが知られている。そしてRNAの機能は、その
RNAが形成する高次構造によって維持されていると考
えられる。このような事実に基づいて、本発明者らは、
解析対象の塩基配列に対して変異を与え、得られた変異
塩基配列における高次構造の変化の度合いを指標とし
て、変異を与えた部位の機能的重要性を予測することが
できるのできると考えた。そして、このような理論に基
づいて予測されたRNAの機能性部位が、既知の方法に
よって確認された機能性部位と一致することを確認して
本発明を完成した。
【0012】更に本発明者らは、この解析方法を一塩基
置換によってもたらされる変異がRNAの機能性部位に
与える影響の評価に応用できることを見出した。より具
体的には、突然変異を一塩基の置換に限定し、その時の
高次構造が変化する度合いを測ることで、ある1つの塩
基がRNAの構造と機能に及ぼす影響を知ることができ
る。このような解析に基づいて、単塩基置換を評価する
ことも可能となる。
【0013】すなわち本発明は、以下のRNA機能性部
位を同定するための方法、コンピュータープログラム、
並びにそのための装置に関する。あるいは本発明は、本
発明によるRNA機能性部位を同定するための方法を応
用した、RNAの機能に影響を与える単塩基多型の同定
方法に関する。
【0014】〔1〕次の工程を含む、RNAの機能性部
位を同定する方法。 a)機能性部位を同定すべきRNAの解析対象塩基配列
に対して、塩基配列に変異を有する少なくとも1つの変
異塩基配列を人為的に生成する工程、 b)解析対象塩基配列を有するRNAの高次構造と、変
異塩基配列を有するRNAの高次構造を数値化する工
程、 c)b)で得られた数値を比較して、高次構造の違いを
数値の違いとして取得する工程、および d)c)において前記数値に有意な差が見られた場合
に、変異塩基配列における変異を有する個所を、解析対
象塩基配列の機能性部位の一部であると同定する工程 〔2〕変異塩基配列が、解析対象塩基配列に人為的な変
異を与えることによって生成された複数の塩基配列であ
る〔1〕に記載の方法。 〔3〕変異が、1塩基置換である〔2〕に記載の方法。 〔4〕変異塩基配列が、解析対象塩基配列を構成する全
ての塩基を、それぞれもとの塩基とは異なる3とおりの
塩基に置換した3とおりの変異塩基配列の集合である
〔2〕に記載の方法。 〔5〕高次構造が2次構造である〔1〕に記載の方法。 〔6〕構造を数値化する工程が、2次構造をループ構造
とステム構造からなる木構造として表現する工程を含む
〔4〕に記載の方法。 〔7〕1塩基置換を有する変異塩基配列として単塩基多
型によってもたらされる塩基配列を用い、単塩基多型が
RNAの立体構造に与える影響を比較する工程を含む、
〔3〕に記載の方法。 〔8〕〔7〕に記載の方法によって単塩基多型がRNA
の立体構造に与える影響を比較し、立体構造の変化をも
たらす単塩基多型を選択する工程を含む、RNAの機能
に影響を与える単塩基多型の同定方法。
〔9〕コンピュータに次の工程を実行させるためのプロ
グラムを記録した、コンピュータ読み取り可能な記録手
段。 a)機能性部位を同定すべきRNAの解析対象塩基配列
に対して、塩基配列に変異を有する少なくとも1つの変
異塩基配列を人為的に生成する工程、 b)解析対象塩基配列を有するRNAの高次構造と、変
異塩基配列を有するRNAの高次構造を数値化する工
程、 c)b)で得られた数値を比較して、高次構造の違いを
数値の違いとして取得する工程、および d)c)において前記数値に有意な差が見られた場合
に、変異塩基配列における変異を有する個所を、解析対
象塩基配列の機能性部位の一部であると同定する工程 〔10〕以下の手段を含む、RNAの機能性部位を同定
するためのシステム。 a)機能性部位を同定すべきRNAの解析対象塩基配列
に対して、塩基配列に変異を有する少なくとも1つの変
異塩基配列を人為的に生成する手段、 b)解析対象塩基配列を有するRNAの高次構造と、変
異塩基配列を有するRNAの高次構造を数値化する手
段、 c)b)で得られた数値を比較して、高次構造の違いを
数値の違いとして取得する手段、および d)c)において前記数値に有意な差が見られた場合
に、変異塩基配列における変異を有する個所を、解析対
象塩基配列の機能性部位の一部として同定する手段
【0015】
【発明の実施の形態】本発明は、上記工程a)−d)を
含むRNAの機能性部位を同定する方法に関する。本発
明において機能性部位(functional region)とは、RN
Aが有する、アミノ酸配列をコードする機能以外の機能
に必要な領域を言う。たとえば遺伝情報の発現制御機構
が、RNAが作り出す高次構造によって支えられている
例が公知である。
【0016】具体的には、大腸菌の熱ショック応答がR
NAポリメラーゼのσサブユニットの一種であるσ32
mRNAにおける翻訳開始領域の二次構造の安定性によって
制御されていることが明らかにされている。この制御機
構は、転写されたmRNAの二次構造がAUG翻訳開始コ
ドンやリボソーム結合部位に影響を与える例である。
【0017】さらに、骨格筋や中枢神経系に症状が現れ
るミトコンドリア病では、多くの場合、ミトコンドリア
DNA上のtRNA遺伝子内の特定の位置の塩基置換が原因で
あると言われている。DNAの点変異でなぜミトコンド
リアの異常が起こるのか、なぜ点変異の種類により臨床
症状が変わるのかなどといった問題はほとんど明らかに
されていない。点変異がtRNAの構造変化を引き起こ
しリボソーム上でのコドン対合能を低下させることが示
唆されており、本発明はこのようなRNAの構造変化が
直接的な形質の原因となっている例を予測するための有
用な手段と成り得る。
【0018】また、mRNAの高次構造の安定性はタン
パク質への翻訳効率と密接に関わっている。したがって
mRNAの塩基配列のどの部分への変異がmRNAの高
次構造の保持にとって重要であるかを本発明によって予
測することで、特定の遺伝子の翻訳効率を制御できる可
能性がある。例えばRNAウィルスの翻訳の抑制等とい
った、非常に重要な技術として本発明を応用できる可能
性がある。
【0019】RNAの遺伝暗号がRNAの一次構造(す
なわち塩基配列)に依存しているのに対して、RNAの
遺伝暗号以外の機能はRNAの高次構造に依存してい
る。したがって、機能性部位は、特定の高次構造の維持
に必要な部位と考えることができる。つまり、機能性部
位は、RNAが特定の高次構造を維持するのに必要な塩
基配列を含む領域と定義することもできる。
【0020】また本発明の機能性部位とは、次のように
定義することもできる。RNAは、ヌクレオシドなどの
低分子物質や蛋白質などの高分子物質と特異的に結合
し、特定の反応を触媒することなどを通して生体内で重
要な役割を果たしていると考えられている。したがって
RNAの機能性部位とは、このような役割のために不可
欠な構造部位と定義することもできる。機能性部位に障
害(変異)を持つRNAは、本来の生体内機能を発揮で
きないため、何らかの異常の原因となる可能性がある。
【0021】上記工程a)において、機能性部位を同定
すべきRNAは、任意のRNAであることができる。本
発明において、機能性部位を同定すべきRNAの塩基配
列を、解析対象塩基配列と言う。したがって、たとえば
以下に示すような塩基配列情報を、解析対象塩基配列と
することができる。実際に取得されたcDNAの塩基配
列に基づく塩基配列情報、ゲノムの解析によって予測さ
れた仮想遺伝子を構成する塩基配列情報、人為的に構築
した遺伝子の塩基配列情報、融合蛋白質をコードする遺
伝子の塩基配列情報、およびキメラ蛋白質をコードする
遺伝子の塩基配列情報等
【0022】塩基配列をDNAに求めるときには、その
まま本発明の解析を進めても良いし、あるいはRNAの
塩基配列とした上で解析を進めることもできる。一般に
RNAの塩基配列を表現する際には、それに対応するD
NAの塩基配列を用いることが多い。本明細書でも、こ
れに従い、RNAの塩基配列はそれを転写するDNAの
塩基配列で表現することがある。塩基配列情報が成熟R
NAに由来するものでありさえすれば、RNAの塩基配
列に変換することにより、本発明の解析対象塩基配列と
することができる。DNAの塩基配列は、塩基tを塩基u
に置換することによりRNAの塩基配列へ変換される。
【0023】本発明は、解析対象塩基配列に対して、塩
基配列に変異を有する少なくとも1つの変異塩基配列を
人為的に生成する工程を含む。本発明において、変異塩
基配列とは、解析対象塩基配列に任意の変異を含む塩基
配列を言う。本発明における変異を与える方法や、変異
の種類は限定されない。より具体的には、解析対象塩基
配列に対して、塩基の置換、欠失、挿入、あるいは付加
による変異を与えることによって、変異塩基配列を生成
することができる。
【0024】これらの変異を導入する塩基は、単一であ
っても良いし複数の塩基を変異の対象とすることもでき
る。さらに、塩基の置換、欠失、挿入、あるいは付加に
よる変異が、いずれか一つである場合のみならず、複数
種の変異が導入された変異塩基配列を生成することもで
きる。また塩基の置換、挿入、あるいは付加による変異
を与える場合には、1〜4種類の塩基の任意の塩基を用
いることができる。たとえば置換においては、ある塩基
に対して最大で3とおりの置換が考えられる。本発明に
おける変異は、3とおりの置換を全て生成することもで
きるし、1または2とおりの塩基へ置換することもでき
る。
【0025】特に特定の1塩基を3とおりの塩基に置換
することによって生成される3種類の塩基配列は、本発
明における望ましい変異塩基配列である。解析対象塩基
配列を構成する全ての塩基について、このような変異塩
基配列を生成することによって、解析対象塩基配列が変
異によって取りうる全ての構造を比較することができ
る。置換による変異はRNAの長さの変化を伴わない。
そのため、各塩基が構造に与える影響を、他の要因の影
響の無い条件の元で比較することができる。
【0026】本発明において、好ましい変異塩基配列
は、より少ない領域に限局された変異を含む塩基配列で
ある。本発明の解析の目的は、RNAの機能性部位を同
定することである。本発明は、変異によってもたらされ
る立体構造の変化を指標としていることから、変異塩基
配列における変異部位は、より限局された領域に配置す
ることが望ましい。変異部位を限局することによって、
結果的に、より正確なRNAの機能性部位の同定が期待
できる。
【0027】たとえば、解析対象塩基配列における1あ
るいは数個の特定の塩基配列に変異を与えることによっ
て得ることができる、複数の変異塩基配列は、本発明に
おける好ましい変異塩基配列である。変異を与えるため
の塩基の数は、少なくとも1、たとえば1〜10、ある
いは1〜5、更には1〜2を示すことができる。
【0028】本発明において、解析対象塩基配列に変異
を与えるための特定の1塩基として、単塩基多型(Sing
le Nucleotide Polymorphism、以下SNPsと省略す
る)であることが明らかにされている塩基を選択するこ
とができる。SNPsは、一塩基の挿入、欠失、置換に
よる多型を言う。ヒトゲノムの中で最も出現頻度が高い
多型であることから、疾患の診断や治療の研究対象とし
てSNPsは注目されている。なお遺伝学的には、核酸
の塩基配列上の差異のうち、ある集団内で1%以上の頻
度で存在する変異が、特に多型と呼ばれている。集団と
は、地理的な隔離や亜種によって区別される集団を意味
する。例えば日本人では1%に満たない変異であって
も、他の人種で1%以上の頻度で見出されれば、変異で
はなく多型である。
【0029】遺伝子領域における塩基配列の変異は、ス
プライシングの異常やmRNAの立体構造の変化を等を
通じて遺伝子の翻訳異常につながる可能性がある。SN
Psはヒトのゲノム上で300〜600塩基に一つの割
合で存在すると推測されている。そして、実際に膨大な
数のSNPsが次々と明らかにされつつある。これらの
SNPsには、それぞれ、RNAの立体構造の変化に影
響を与えるもの、翻訳アミノ酸配列に変化を与えるも
の、そして遺伝的な変化に結びつかないものが含まれて
いるはずである。本発明の機能性部位の同定方法を利用
すれば、膨大な数のSNPsの中から、RNAの機能性
部位に影響を与える可能性があるSNPsを容易に同定
することができる。したがって、本発明における変異を
与える塩基として、SNPsであることが明らかにされ
た塩基は、望ましい塩基の一つである。
【0030】次いで、解析対象塩基配列と、それに基づ
いて生成された変異塩基配列のそれぞれについて、各塩
基配列を有するRNAの高次構造を予測し、数値化す
る。高次構造は、二次構造以上の高次構造を含む。一般
に二次構造は、RNAを構成する塩基配列において、相
補的な塩基対間での結合によって形成されるステムとル
ープから成る平面内に配置可能な構造を言う。一方、三
次構造は、RNAの二次構造の各部位が空間内で相互作
用することで形成される立体構造のことを言う。三次構
造は、二次構造に依存している。ただし三次構造の変化
の原因の全てを、二次構造の変化のみで説明することは
できない。しかし、二次構造の変化は、多くの場合三次
構造の変化を伴う。したがって、二次構造の変化を予測
することは、三次構造の変化を予測することに他ならな
い。
【0031】RNAの塩基配列に基づいて立体構造を予
測する方法は公知である。たとえば、Zuckerの二次構造
予測プログラムは、与えられた塩基配列とエネルギーパ
ラメータに基づいて、エネルギーを最小にするようなR
NAの二次構造を総当り的に発見するアルゴリズムを利
用している。
【0032】またShapiroの方法では、RNAをステム
とループから構成された木構造として表現し、さらに、
塩基対の長さを考慮している。彼らは、これらの構造間
の距離として、独自に、Tree Edit Operationと呼ばれ
る操作を定義し、二つの木構造の間を入れ替えることが
できる最小のTree Edit Operationのステップ数を構造
間の距離として定義した (Shapiro, B.A. and Zhang,
K., Comparing multiple RNA secondary structures us
ing tree comparisons, CABIOS, 6(4), 309-318, 199
0.)。更にHofackerらは、RNAの二次構造の各塩基
を、それを囲んでいる塩基対の数で評価して、全体の構
造をMountain Plotと呼ばれる二次元グラフで表し、構
造間の距離をそれらのグラフの差で評価する手法を用い
た(Automatic detectionof conserved RNA structure e
lements in complete RNA virus genomes. Nucleic Aci
ds Res. Aug 15;26(16):3825-36, 1998.)。
【0033】RNAの二次構造を予測するアルゴリズム
として、Zuckerの手法の他に、Vienna RNA packageの手
法も公知である(Hofacker et. al., Monatsh. Chem. 12
5: 167-188 1994.)。この手法は、Zuckerと同様に、ダ
イナミックプログラミングの手法を用いている。そして
塩基対間で結合が生じる確率を考慮することで、予測精
度の向上を図った。これらの二次構造の予測アルゴリズ
ムは、数百塩基程度の短いRNA分子であれば、高い信
頼度でその二次構造を予測することができる。また予測
に必要な計算時間は、通常、数秒程度に過ぎないので、
本発明に利用することができる。
【0034】更に、RNAの三次構造の計算を目的とす
るソフトウエアも公知である。たとえばInsightやAmber
といった三次構造の計算用のソフトウェアは、分子動力
学法(MD)を用いて三次元構造を計算するためのソフトウ
エアである(Pearlman et. al., AMBER 4.0, University
of California, San Francisco. 1991.)。MDは、多体
系の運動方程式を差分法によって数値的に解く手法であ
る。これらのソフトウエアを用いた三次構造の解析は、
まず、X線結晶解析やNMR等の実験的手法により、目的の
物質の初期構造としての立体構造を測定し、そこに原子
や分子を追加しつつMDを用いて計算するという工程を含
む。これらの三次構造の予測手法を本発明に応用する場
合、対象のRNAを結晶化させ、NMRなどでその三次構
造を実験的に確認しておく必要がある。これが可能であ
れば、突然変異を入れた場合の三次構造を計算機で計算
し、その構造の変化を数値化することで、二次構造の予
測方法と同様に本発明の方法に利用することができる。
【0035】本発明において予測された高次構造は数値
化され、比較される。たとえば上記のような方法によっ
て、高次構造を数値として比較することができる。より
具体的には、実施例に示したような、RNAの二次構造
を構成する木構造に着目した比較解析方法は、本発明に
おける高次構造の数値化および比較のための方法として
好ましい。この方法は、木構造として表現した二次構造
を配列に変換しそれらを整列させ比較することで二次構
造間の距離を計算するアルゴリズムに基づいている。
【0036】上記工程b)で得られた数値を比較して、
高次構造の違いを数値の違いとして取得することができ
る(工程c)。更に工程c)において取得される前記数
値に有意な差が見られた場合に、変異塩基配列における
変異を有する個所を、解析対象塩基配列の機能性部位の
一部であると同定することができる(工程d)。
【0037】本発明において、変異を加えた時に解析対
象塩基配列の構造から変化する程度が有意な差を越えた
場合、変異を与えた部位が機能性部位であると判断され
る。本発明において、有意性は、たとえば次のようにし
て判断される。まず、解析対象塩基配列に変異を与える
ことによって生じる構造間の距離の分布が正規分布であ
ると考える。そしてその平均および標準偏差に基づい
て、有意差を検定することにより、有意な差を与える変
異個所を見出すことができる。このようにして有意な差
の原因となる変異を同定する工程を、実施例に示した。
実施例においては、有意水準30%、あるいは10%で
有意差があると判断した。本発明においては、構造の違
いを数値として表現しているため、各塩基の変異によっ
てもたらされる構造の相違を定量的に比較することがで
きる。
【0038】機能性部位におけるSNPsは、なんらか
の機能異常の原因となることが予測される。RNAにお
ける、機能異常の原因となる変異には、進化的に許容さ
れない変異も含まれる。進化的に許容されない変異は、
多くの場合致死的な異常の原因となる可能性もある。し
たがって、RNAにおける機能性部位を見出すことは、
生理機能に与える影響に基づいてSNPsを分類する上
で重要な情報を与える。逆に有意な差を越えないような
部位におけるSNPsは、有害な表現型の原因とならな
いと予測される。
【0039】本発明は、上記RNAの機能性部位の同定
方法を実施するためのプログラムを提供する。本発明の
プログラムは、次の工程をコンピュータに実行させるた
めのソースコードで構成される。本発明のプログラム
は、このプログラムを記録したコンピュータ読み取り可
能な記録手段に格納することができる。 a)機能性部位を同定すべきRNAの解析対象塩基配列
に対して、塩基配列に変異を有する少なくとも1つの変
異塩基配列を人為的に生成する工程、 b)解析対象塩基配列を有するRNAの高次構造と、変
異塩基配列を有するRNAの高次構造を数値化する工
程、 c)b)で得られた数値を比較して、高次構造の違いを
数値の違いとして取得する工程、および d)c)において前記数値に有意な差が見られた場合
に、変異塩基配列における変異を有する個所を、解析対
象塩基配列の機能性部位の一部であると同定する工程
【0040】本発明において、工程a)では、解析対象
塩基配列として入力された塩基配列をもとに、変異塩基
配列を生成する。変異塩基配列については、既に述べた
とおりである。たとえば、解析対象塩基配列として入力
された全ての塩基について、もとの塩基とは異なる3種
類の塩基に置換した塩基を有する塩基配列を変異塩基配
列として生成する。このような変異塩基配列を生成する
ためのプログラムを実施例に示した。
【0041】図3に、実施例に用いた一塩基置換を付加
する場合の変異配列作成プログラムの流れ図を示す。こ
のプログラムでは、塩基配列の全塩基に対してSNPs
を想定し、各塩基に対して、その塩基を他の三通りの塩
基に置換した配列を作成し、メモリに格納する。
【0042】本発明において、上記工程b)や工程c)
には、既に述べたような公知のアルゴリズムを応用する
ことができる。これらのアルゴリズムに基づいて、コン
ピュータ上で実際に塩基配列を解析するためのプログラ
ムも公知である(M. Zucker &P. Stiegler Nucleic Acid
s Research 9, 133-148, 1981)。なお、RNAの高次構
造計算プログラムは多くのものが知られているが、本発
明では、任意の高次構造計算プログラムを適用すること
ができる。用いる高次構造計算プログラムに応じて、高
次構造の構造の類似度を数値化するために適当な距離関
数の定義を行う。
【0043】加えて本発明は、前記RNAの機能性部位
を同定するための方法を実現するためのシステムを提供
する。すなわち本発明は、以下の手段を含む、RNAの
機能性部位を同定するためのシステムに関する。 a)機能性部位を同定すべきRNAの解析対象塩基配列
に対して、塩基配列に変異を有する少なくとも1つの変
異塩基配列を人為的に生成する手段、 b)解析対象塩基配列を有するRNAの高次構造と、変
異塩基配列を有するRNAの高次構造を数値化する手
段、 c)b)で得られた数値を比較して、高次構造の違いを
数値の違いとして取得する手段、および d)c)において前記数値に有意な差が見られた場合
に、変異塩基配列における変異を有する個所を、解析対
象塩基配列の機能性部位の一部として同定する手段
【0044】本発明によるRNAの機能性部位を同定す
るためのシステムは、たとえば前記本発明のプログラム
をコンピュータに実行させることにより、実現すること
ができる。たとえば手段a)は、上記プログラムを実行
したコンピュータに、本発明における解析対象塩基配列
を入力する手段、与えられた解析対象塩基配列にプログ
ラムにしたがって変異を与えて変異塩基配列を生成する
ための手段、そして生成された変異塩基配列を格納する
手段とで構成される。
【0045】解析対象塩基配列は、通常、キーボードや
各種の記録媒体から本発明のシステムに読みこむことが
できる。あるいは、ネットワークを介して他のコンピュ
ータや、ネットワーク上の情報格納デバイスから読み込
むこともできる。更には、シーケンサが生成する塩基配
列情報を、解析対象塩基配列として本発明のシステムに
直接読みこませることもできる。
【0046】読みこんだ塩基配列がDNAの情報である
場合には、自動的にRNAの塩基配列情報に変換させる
こともできる。塩基配列がDNAであることは、塩基t
の存在を検知することにより確認することができる。た
とえばZuckerの構造計算プログラムは、DNAの塩基配
列をRNAの塩基配列に変換した上で構造計算の対象と
するステップを装備している。しかし、この後に行う高
次構造の解析結果に影響を与えることが無ければ、必ず
しもRNAの塩基配列情報に変換する必要は無い。
【0047】本発明のためのプログラムが動作するコン
ピュータの制御ユニットは、与えられた解析対象塩基配
列にプログラムにしたがって変異を与えて変異塩基配列
を生成する。変異を与える方法は、パラメーターとして
任意に設定することができる。たとえば実施例において
は、解析対象塩基配列を構成する全ての塩基に対して変
異を与えている。この他、たとえば解析対象塩基配列に
おける特定のSNPsが機能性部位に与える影響を評価
するために、特定の塩基に対してのみ変異を与えるよう
に、プログラムを修正することもできる。制御ユニット
によって生成された変異塩基配列は、メモリユニットに
格納される。
【0048】本発明のシステムにおいて、手段b)解析
対象塩基配列を有するRNAの高次構造と、変異塩基配
列を有するRNAの高次構造を数値化する手段は、たと
えば次のような手段によって構成することができる。本
発明のプログラムが動作するコンピュータの制御ユニッ
トは、前記手段a)が生成した塩基配列情報をメモリユ
ニットから読み出し、プログラムとして与えられたアル
ゴリズムに基づいて、高次構造を予測し、数値化するた
めの手段として機能する。その結果生成された数値は、
メモリユニットに格納される。
【0049】更に本発明のシステムにおいて、手段
c):手段b)で得られた数値を比較して、高次構造の
違いを数値の違いとして取得する手段は、たとえば次の
ような手段によって構成することができる。本発明のプ
ログラムが動作するコンピュータの制御ユニットは、メ
モリユニットに格納された高次構造に対応する数値を順
次読み出して、解析対象塩基配列に基づいて生成された
数値と比較する手段として機能する。比較の結果は、メ
モリユニットに数値として格納される。
【0050】そして本発明のシステムにおいて、手段
d):手段c)において前記数値に有意な差が見られた
場合に、変異塩基配列における変異を有する個所を、解
析対象塩基配列の機能性部位の一部として同定する手段
は、たとえば次のような手段によって構成することがで
きる。本発明のプログラムが動作するコンピュータの制
御ユニットは、メモリユニットに格納された比較結果の
数値を順次読み出して、プログラムとして与えられた判
断基準と比較し、有意な差が見出されたかどうかを判定
する手段として機能する。判定の結果、有意差ありと判
定された組み合せを構成する変異塩基配列における変異
部位は、解析対象塩基配列を有するRNAにおいて、機
能性部位であると同定される。
【0051】本発明のシステムは、判定結果に基づい
て、以下のような情報を出力することができる。 1. 解析対象塩基配列において、機能性部位として同
定された塩基、およびその有意水準。(表1) 2. 解析対象塩基配列において、高次構造への影響が
少ないと推定される塩基、およびその有意水準。 3. 解析対象塩基配列を構成する各塩基に変異を与え
た場合の高次構造の変化レベル。(たとえば図7。これ
らの情報は、表形式の数値データとしても、またグラフ
としても出力することができる。) 4. 解析対象塩基配列と、各塩基に変異を有する変異
塩基配列によって構成される高次構造そのもの(たとえ
ば図6や図10など)。例えば、Zuckerのアルゴリズム
を用いる場合は二次構造が、またInsightを用いる場合
は三次構造が得られる。 5. 解析対象塩基配列と、各塩基に変異を有する変異
塩基配列によって構成される高次構造を数値化する工程
で得られる高次構造の表現形式(たとえば図6や図10
など)。例えば、本発明で用いた二次構造を木構造とし
て表現することで数値化する方法の場合、各変異塩基配
列が構成する高次構造の木構造表現を出力することがで
きる。この種の情報を参照することで、変異が構造にど
のような影響を及ぼしたのかを確認することができる。
【0052】これらの情報は、画面への表示、あるいは
紙への出力など、任意の形で出力することができる。本
発明の解析システムをネットワーク上で運用する場合に
は、ネットワークを介して異なるコンピュータの画面に
結果を出力することもできる。あるいは,出力結果をデ
ータファイルとして異なるコンピュータに伝送すること
もできる。
【0053】図1は本発明のシステムのハードウエア構
成であり、図2は本発明の手法の流れ図である。 (1)入力ユニットからRNA塩基配列が入力される。
(ステップ1) (2)制御ユニットは、ハードディスクの変異配列作成
プログラムに基づいて、配列の各塩基に対して突然変異
を付加した配列の集合を作成し、メモリに格納する。
(ステップ2) (3)制御ユニットは、任意の高次構造計算プログラム
に基づいて、メモリ内に格納された配列の集合の高次構
造を計算し、それらを再びメモリに格納する。(ステッ
プ3) (4)制御ユニットは構造距離計算プログラムに基づい
て、高次構造の構造の類似度を数値化するための距離関
数を用い、メモリ内に格納された高次構造の集合間の距
離を計算する。(ステップ4) (5)このようにして入力された塩基配列の各塩基に突
然変異が与えられた場合に元の高次構造が変化する程度
を数値化して算出し、その結果を表示ユニットへ表示す
る。(ステップ5)
【0054】
【実施例】以下実施例により本発明を具体的に説明する
が、本発明はこれらの実施例に限定されない。なお、本
明細書において引用された文献は、全て本明細書の一部
として組込まれる。
【0055】本発明の実施例として、ヒトのU2snRNAの
塩基配列を用いて、他の種の塩基配列情報との比較を行
うことなく、その機能性部位及びSNPsの重要度の予
測を行った例を示す。U2 snRNAはタンパク質の情報を持
たないRNAであり、イントロンのスプライシングにお
いて重要な機能を果たしていると考えられている。配列
番号:5に、ヒトのU2snRNAの塩基配列を示した。この
配列に対して、まず12番目の塩基gをaに(配列番号:
6)、また157番目の塩基gをaに(配列番号:7)人
為的に置換した配列を作成した。これらの3種類の塩基
配列からZuckerのアルゴリズムを用いて二次構造を計算
した結果を図4に示す。図4から明らかなように、12
番目の塩基の変異(2)は大きく全体の二次構造を変化
させているのに対し、157番目の塩基の変異(3)は
ほとんど構造変化を引き起こしていないことが分かる。
以下の実施例では、このような過程を全ての塩基の、全
ての塩基置換について実施し、それぞれの場合における
構造の変化を数値化し、それに基づいて機能性部位の評
価とSNPsの評価を行う。
【0056】図2は、本発明によるRNA機能性部位予
測手法の流れ図である。ステップ1では、解析対象塩基
配列を入力する。ここでは、ヒトのU2snRNAの塩基配列
(配列番号:1)を入力として与える。ステップ2で
は、突然変異を付加した塩基配列を作製する。この実施
例では、付加する突然変異を一塩基置換に限定するもの
とする。一つの塩基について、3通りの一塩基置換が存
在するので、ここでは、図5に示すように、それぞれの
塩基を自分自身以外の3通りの塩基に置換したものを全
ての塩基について作成する。ここでは、U2snRNAの配列
が187塩基対から成るので、各塩基を3通りに置換し
た、計187*3=561種類の塩基配列を作成する。この時用
いた変異配列作成プログラムの流れ図を図3に示した。
【0057】ステップ3では、作成した全ての塩基配列
について高次構造を計算する。本実施例では、高次構造
として二次構造を考え、高次構造計算プログラムとして
Michael Zuckerの二次構造予測アルゴリズムを用いた
(M. Zucker & P. Stiegler Nucleic Acids Research 9,
133-148, 1981)。Zuckerの二次構造予測プログラム
は、与えられた塩基配列とエネルギーパラメータに基づ
いて、エネルギーを最小にするようなRNAの二次構造
を総当り的に発見するものである。
【0058】ステップ4では、二次構造の構造間距離計
算プログラムとして、図6、および図10に示すよう
な、木構造として表現した二次構造を配列に変換しそれ
らを整列させ比較することで二次構造間の距離を計算す
るアルゴリズムを用いた。ここで、木構造とは、単一ノ
ード、または複数の木構造を左右に順序づけられた子供
として持つノードからなる構造として再帰的に定義す
る。また、木構造のルートノードとは、そのノードを子
供とするノードが存在しない木構造の中の唯一のノード
を指す。さらに、ノードのランクとは、ノードの直下に
ある子供ノードの数を指す。木構造の各ノードは、RN
Aの二次構造のループ構造に対応し、各ノードを結ぶパ
スはステム構造に対応する。木構造は、それに含まれる
全てのノードのランクを、ルートノードから、親から子
供、左から右の順で、順番に並べた配列によって一意に
表すことができる。この配列表現は、RNAの二次構造
の構造的な特徴を数値列として持っており、二次構造間
の比較は、この配列間の比較へと帰着される。
【0059】配列間の比較は、ダイナミックプログラミ
ングの手法によって行う。配列Sa(n)とSb(m)の間の距離
d(n,m)は、式1のように、二つのノードの間のコストを
各ノードのランクの差の絶対値として定義し、一方のノ
ードしかない場合のコストを1と定義した時に、式2の
ように、コストを最小にするように配列を整列させた時
のコストの総和として定義される。
【0060】
【数1】(式1)
【数2】(式2)
【0061】この過程により、二つの木構造の相同な部
分が一致するように配列を整列させ、一致しない構造間
の距離をノードのランクの差をとることで算出すること
で、二つの木構造間の距離を算出したことになる。
【0062】図7は、本発明で述べた手法をU2snRNAに
対して実施した場合に得られる、各塩基位置と、その塩
基に変異を与えた場合の構造変化の程度をグラフとして
示した図である。本手法の流れ図の図2におけるステッ
プ5の段階で、このグラフに基づいて、機能性部位の予
測とSNPsの評価を行う。これらの評価手法を以下に
解説する。
【0063】各塩基に人工的に変異を加えた時に元の構
造から変化する距離をc(i)で表す。ここで変数iは塩基
の位置を表し、U2snRNAの場合は、i=1,2,3…187の値を
とる。C(i)≠0であるようなc(i)の値の分布が正規分布
に従うと仮定した時、NをC(i)≠0であるような塩基iの
総数を表すものとすると、これらの平均値Caと標準偏差
σは以下のように定められる。
【数3】(式3)
【0064】
【数4】(式4) この時、c(i)が以下のような値をとるような塩基iを構
造を大きく変化させる部位、若しくは、構造に影響しな
い部位であると判断する。
【0065】
【数5】(式5) 有意水準10%で、塩基iは構造に影響しない
【0066】
【数6】(式6) 有意水準30%で、塩基iは構造に影響しない
【0067】
【数7】(式7) 有意水準30%で、塩基iは構造を変化させる
【0068】
【数8】(式8) 有意水準10%で、塩基iは構造を変化させる これらのうち、構造を変化させるような塩基の存在する
部位を機能性部位と判断し、このような部位におけるS
NPsはRNAの機能を妨げる可能性があると評価す
る。一方で、構造を変化させない塩基へのSNPsは、
機能に与える影響が低いと評価するものとする。
【0069】図7は、c(i)の値をグラフ化したものであ
り、加えて、平均値Ca及び、これらの判断基準となる値
もあわせて記している。図7から、5'端から数えて10か
ら30、50から60、100から110塩基までの部位に変異を与
えた場合に構造を変化させてしまうことが読み取れる。
図7において、これらの領域に丸を付けて示した。一
方、150から180塩基までの部位は変異を与えても比較的
構造が変化しないことが分かる。これらの結果は、図4
に示した12番目及び157番目の変異の場合における構造
変化の結果と合致しており、構造変化の定量的な評価が
正しく行われていることが分かる。
【0070】あるいはc(i)の値から、変異の有無によっ
て所定の有意差を示した塩基を有意水準ごとに抽出する
こともできる。表1にこのようにして抽出された塩基の
位置情報を示した。
【表1】
【0071】すなわち、図7のグラフを読み取ること
で、10-30、50-60、100-110などの塩基部位への変異(S
NPs)の方が、150-180の塩基部位への変異(SNPs)
よりも、機能に対する影響が大きく、おそらく致死的で
ある可能性が高いことが予想される。また、同様にし
て、10-30の塩基部位は、比較的柔軟な構造部位となっ
ているのに対して、150-180の塩基部位は安定でしっか
りした構造を形成していることが分かる。次に、これら
の予測結果を、実際のRNA塩基配列や構造の観測から
得られる情報と比較し、予測結果の妥当性を検討する。
【0072】図8に、複数種(ショウジョウバエ、線
虫、シロイヌナズナ、アフリカツメガエル等25種)の天
然のU2snRNAから、塩基配列間での相同性比較により、
各塩基部位における種間保存率を計算した結果を示す。
保存割合が1に近いほど、その塩基が全ての種において
保存されている傾向が強いことを意味している。これを
見ると、10-30、50-60、100-110などの塩基部位は非常
に保存されている割合が高く、150-180の塩基部位はそ
れほど保存されていないことが見て取れる。この事実
は、図7のグラフから判断される機能性部位への変異の
付加は進化的に許容されてこなかったことを示してお
り、この部位へのSNPsが致死的になるであろうとい
う本発明による予測結果は妥当であったと考えることが
できる。
【0073】さらに、生物的実験によると(Madhani H
D, Guthrie C, Annu. Rev. Genet. 28: 1-26, 199
4.)、U2snRNAを構成する四つのヘアピン部位(図4
(1)に示す)のうち、ヘアピンIはスプライシング過
程の初めの段階ではヘアピン構造を保っているが、後
に、ヘアピン構造が大きく開き、U6snRNAとの間で相補
的な塩基間の結合を行うことが知られている。この事実
は、ヘアピンIに相当する10-30の塩基部位が柔軟な構造
を形成しているという本発明による予測結果に合致して
いる。また、他の実験によると、ヘアピンIVにはRNA
結合タンパクが結合することが知られている(Scherly,
D. et.al., Nature, 345, 502-506, 1990.).。これは、
ヘアピンIVに相当する150-180の塩基部位が比較的安定
な構造を形成していることに対応すると考えられ、本発
明による予測結果の妥当性を示している。
【0074】ところで、ヒトのU2snRNAをコードする遺
伝子はDNA上の複数箇所に存在することが知られてい
る。それらのほとんどの配列は相同であるが、一つの遺
伝子では、5'端から47番目に位置する塩基Uが欠けて
いる(Hausner,T.P., Giglio,L.M.and Weiner,A.M., Evi
dence for base-pairing between mammalian U2 and U6
small nuclear ribonucleoprotein particles, Genes
Dev. 4(12A), 2146-2156,1990.)。一方で、本手法から
得られる図7より、47番目の塩基の構造変化距離はc(4
7)=0であることが読み取れる。すなわち、本手法から有
害ではないであろうと予測されたSNPsの位置に実際
に変異を持ち、なおかつ正常な機能を保持しているRN
Aが存在していることから、本手法はSNPsやその他
の突然変異の評価にも有用であると考えられる。
【0075】次に、SNPsが実際の疾患の原因となっ
ていると考えられているヒトのミトコンドリア病につい
て、本手法を適用した実施例を示す。ミトコンドリア病
は高頻度に見られる遺伝病のひとつであり、筋と中枢神
経に症状が表れ、さらに痙攣、痴呆などの症状が表れる
ことが多い。その患者はミトコンドリアのtRNA遺伝子に
変異をもつ場合が多く、さらに、変異を持つtRNAの種類
によって症状が異なることが知られている (Schon EA e
t.al., J. Bioenerg.Biomembr. 29: 131-149, 1997.)。
【0076】本実施例では、リジンのtRNA(tRNA-Lys)を
対象とする。tRNA-Lysの塩基配列を、配列番号:8に示
した。tRNA-Lysでは、その5'端から19番目に位置する塩
基gのaへの変異と、48番目に位置する塩基gのaへの変異
がそれぞれミトコンドリア病の患者で同定されている
(Verma, A. et.al., Pediatric Research 42(4): 448-4
54, 1997.)(Tiranti, V. et.al., Neuromuscular Disor
ders 9(2): 66-71, 1999)。U2snRNAの場合と全く同様
に、図2の過程により計算された、各塩基に変異を与え
た場合の構造変化の程度を表すグラフを図9に示す。図
9より、ミトコンドリア病の患者で同定された変異の位
置における構造の変化距離は、ともに3であり、これら
の位置へのSNPsは安全であるとは言えないと判断さ
れる。このように、実際に疾患を引き起こすようなSN
Psの予測手法としても、本手法が有効であることが確
認できた。
【0077】
【発明の効果】本発明は、一つの解析対象塩基配列に基
づいて、その塩基配列における機能性部位を同定するこ
とができる。たとえば種の間で保存された塩基配列を機
能性部位として同定する公知の方法では、複数の種の相
同遺伝子の塩基配列を明らかにするする必要があった。
しかも、機能性部位の同定にあたっては、ある程度塩基
配列が相違するものも求められることから、解析に必要
な塩基配列情報の集積には困難が伴う。これに対して単
一の塩基配列に基づいて、その機能性部位を同定するこ
とができる本発明の方法は、はるかに容易に実施するこ
とができる。
【0078】また本発明は、単塩基置換が機能性部位に
与える影響を評価する方法として有用である。ゲノムの
構造が明らかにされつつある現在、SNPsのRNAの
機能性部位に与える影響の予測は、重要な研究課題のひ
とつである。莫大な情報量となるヒトのSNPsについ
て、RNAの機能性部位に与える影響を評価するには、
解析能力に優れた方法が必須である。本発明によれば、
他の種の相同遺伝子の情報の有無とは無関係に、特定の
SNPsについて、RNAの機能性部位に与える影響
を、容易に評価することができる。更に本発明による評
価結果に基づいて、RNAの機能に与える影響の大きさ
にしたがって、SNPsを分類することができる。
【0079】あるいは、ある遺伝子を構成する全塩基の
それぞれについて塩基を置換し、塩基の置換が高次構造
に与える影響を評価することによって、RNA上の機能
性部位を高い解像度で特定することができる。本発明の
解析を通じて明らかにされたRNAの機能性部位に対し
て、次々と明らかにされてくるSNPsの情報を重ね合
わせることで、機能性部位に影響を与える可能性がある
SNPsを容易に同定することができる。
【0080】
【配列表】 SEQUENCE LISTING <110> President of International Medical Center of Japan. The Organization for Pharmaceutical Safety and Research. Genox Research, Inc. <120> Method for predicting functional sites of RNA from its sequence <140> <141> <160> 7 <170> PatentIn Ver. 2.0 <210> 1 <211> 11 <212> RNA <213> Unknown <220> <223> Description of Unknown Organism: species 1 <400> 1 auugccggau a 11 <210> 2 <211> 11 <212> RNA <213> Unknown <220> <223> Description of Unknown Organism: species 2 <400> 2 acggccauau a 11 <210> 3 <211> 11 <212> RNA <213> Unknown <220> <223> Description of Unknown Organism: species 3 <400> 3 ucugccguau a 11 <210> 4 <211> 11 <212> RNA <213> Unknown <220> <223> Description of Unknown Organism: species 4 <400> 4 uucgccuaau a 11 <210> 5 <211> 187 <212> DNA <213> Homo sapiens <400> 5 atcgcttctc ggccttttgg ctaagatcaa gtgtagtatc tgttcttatc agtttaatat 60 ctgatacgtc ctctatccga ggacaatata ttaaatggat ttttggagca gggagatgga 120 ataggagctt gctccgtcca ctccacgcat cgacctggta ttgcagtacc tccaggaacg 180 gtgcacc 187 <210> 6 <211> 187 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: artificially synthesized sequence <400> 6 atcgcttctc gaccttttgg ctaagatcaa gtgtagtatc tgttcttatc agtttaatat 60 ctgatacgtc ctctatccga ggacaatata ttaaatggat ttttggagca gggagatgga 120 ataggagctt gctccgtcca ctccacgcat cgacctggta ttgcagtacc tccaggaacg 180 gtgcacc 187 <210> 7 <211> 187 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: artificially synthesized sequence <400> 7 atcgcttctc ggccttttgg ctaagatcaa gtgtagtatc tgttcttatc agtttaatat 60 ctgatacgtc ctctatccga ggacaatata ttaaatggat ttttggagca gggagatgga 120 ataggagctt gctccgtcca ctccacgcat cgacctagta ttgcagtacc tccaggaacg 180 gtgcacc 187 <210> 8 <211> 70 <212> RNA <213> Homo sapiens <400> 8 cacuguaaag cuaacuuagc auuaaccuuu uaaguuaaag auuaagagaa ccaacaccuc 60 uuuacaguga 70
【図面の簡単な説明】
【図1】本発明のハードウエア構成を示す模式図であ
る。
【図2】本発明のRNA機能性部位予測のフローチャー
トである。
【図3】本発明で使用する塩基に対する突然変異付加プ
ログラムの一例を示すフローチャートである。
【図4】ヒトのU2 snRNA (1)、および 12番目の塩基をg
からaに (2)、157番目の塩基をgからaに (3) それぞれ
置換した場合の塩基配列から計算された二次構造を示す
図である。ヒトのU2 snRNAのヘアピンI〜IVの位置も
示した。
【図5】本発明において、一塩基置換の突然変異を人為
的に付加する過程を示す図。
【図6】本発明で使用する高次構造間の距離の算出方法
の一実施例を示す模式図である。
【図7】本発明によって、ヒトのU2snRNAの機能性部
位を予測した結果を示すグラフである。縦軸は変異によ
って生じた二次構造の変化の距離、横軸は5'末端を1と
する塩基の位置を示す。変異によって有意な差を生じた
塩基、および有意な差を生じなかった塩基に対応するプ
ロットを丸で囲んで示した。
【図8】複数種のU2snRNAの塩基配列間での相同性比
較を行うことで得られる、各塩基位置における種間での
保存割合を示すグラフである。
【図9】本発明をヒトのミトコンドリアのtRNA-Lysに適
用した場合に得られる結果を示すグラフである。縦軸は
変異によって生じた二次構造の変化の距離、横軸は5'末
端を1とする塩基の位置を示す。
【図10】ヒトのU2 snRNAを構成する塩基のうち、12
番目と157番目の塩基に変異を与えた場合に得られる
二次構造と、この構造に対応する木構造。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 北川 純次 東京都新宿区戸山1−21−1 国立国際医 療センター研究所内 Fターム(参考) 4B024 AA11 CA11 HA11 HA20 4B063 QA11 QA13 QA18 5B056 BB22 BB36 BB62 BB64 5B075 ND02 UU19

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】次の工程を含む、RNAの機能性部位を同
    定する方法。 a)機能性部位を同定すべきRNAの解析対象塩基配列
    に対して、塩基配列に変異を有する少なくとも1つの変
    異塩基配列を人為的に生成する工程、 b)解析対象塩基配列を有するRNAの高次構造と、変
    異塩基配列を有するRNAの高次構造を数値化する工
    程、 c)b)で得られた数値を比較して、高次構造の違いを
    数値の違いとして取得する工程、および d)c)において前記数値に有意な差が見られた場合
    に、変異塩基配列における変異を有する個所を、解析対
    象塩基配列の機能性部位の一部であると同定する工程
  2. 【請求項2】変異塩基配列が、解析対象塩基配列に人為
    的な変異を与えることによって生成された複数の塩基配
    列である請求項1に記載の方法。
  3. 【請求項3】変異が、1塩基置換である請求項2に記載
    の方法。
  4. 【請求項4】変異塩基配列が、解析対象塩基配列を構成
    する全ての塩基を、それぞれもとの塩基とは異なる3と
    おりの塩基に置換した3とおりの変異塩基配列の集合で
    ある請求項2に記載の方法。
  5. 【請求項5】高次構造が2次構造である請求項1に記載
    の方法。
  6. 【請求項6】構造を数値化する工程が、2次構造をルー
    プ構造とステム構造からなる木構造として表現する工程
    を含む請求項4に記載の方法。
  7. 【請求項7】1塩基置換を有する変異塩基配列として単
    塩基多型によってもたらされる塩基配列を用い、単塩基
    多型がRNAの立体構造に与える影響を比較する工程を
    含む、請求項3に記載の方法。
  8. 【請求項8】請求項7に記載の方法によって単塩基多型
    がRNAの立体構造に与える影響を比較し、立体構造の
    変化をもたらす単塩基多型を選択する工程を含む、RN
    Aの機能に影響を与える単塩基多型の同定方法。
  9. 【請求項9】コンピュータに次の工程を実行させるため
    のプログラムを記録した、コンピュータ読み取り可能な
    記録手段。 a)機能性部位を同定すべきRNAの解析対象塩基配列
    に対して、塩基配列に変異を有する少なくとも1つの変
    異塩基配列を人為的に生成する工程、 b)解析対象塩基配列を有するRNAの高次構造と、変
    異塩基配列を有するRNAの高次構造を数値化する工
    程、 c)b)で得られた数値を比較して、高次構造の違いを
    数値の違いとして取得する工程、および d)c)において前記数値に有意な差が見られた場合
    に、変異塩基配列における変異を有する個所を、解析対
    象塩基配列の機能性部位の一部であると同定する工程
  10. 【請求項10】以下の手段を含む、RNAの機能性部位
    を同定するためのシステム。 a)機能性部位を同定すべきRNAの解析対象塩基配列
    に対して、塩基配列に変異を有する少なくとも1つの変
    異塩基配列を人為的に生成する手段、 b)解析対象塩基配列を有するRNAの高次構造と、変
    異塩基配列を有するRNAの高次構造を数値化する手
    段、 c)b)で得られた数値を比較して、高次構造の違いを
    数値の違いとして取得する手段、および d)c)において前記数値に有意な差が見られた場合
    に、変異塩基配列における変異を有する個所を、解析対
    象塩基配列の機能性部位の一部として同定する手段
JP2002037443A 2002-02-14 2002-02-14 塩基配列からrnaの機能性部位を同定するシステム Expired - Fee Related JP3903420B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002037443A JP3903420B2 (ja) 2002-02-14 2002-02-14 塩基配列からrnaの機能性部位を同定するシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002037443A JP3903420B2 (ja) 2002-02-14 2002-02-14 塩基配列からrnaの機能性部位を同定するシステム

Publications (2)

Publication Number Publication Date
JP2003242153A true JP2003242153A (ja) 2003-08-29
JP3903420B2 JP3903420B2 (ja) 2007-04-11

Family

ID=27779038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002037443A Expired - Fee Related JP3903420B2 (ja) 2002-02-14 2002-02-14 塩基配列からrnaの機能性部位を同定するシステム

Country Status (1)

Country Link
JP (1) JP3903420B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005093632A1 (ja) * 2004-03-29 2005-10-06 The University Of Tokyo Rna配列情報処理方法、プログラムおよび装置
JP2006163546A (ja) * 2004-12-03 2006-06-22 Dainippon Printing Co Ltd 生物情報の解析装置および圧縮装置
WO2008059642A1 (fr) * 2006-11-13 2008-05-22 Nec Soft, Ltd. Procédé pour la prédiction d'une structure d'acide nucléique d'ordre supérieur, appareil pour la prédiction d'une structure d'acide nucléique d'ordre supérieur et programme pour la prédiction d'une structure d'acide nucléique d'ordre supérieur
JP2009020323A (ja) * 2007-07-12 2009-01-29 Nec Soft Ltd 自動作曲装置および自動作曲方法ならびにプログラム
JP2016513303A (ja) * 2013-01-29 2016-05-12 モレキュラー ヘルス ゲーエムベーハー 臨床判断支援のためのシステムおよび方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005093632A1 (ja) * 2004-03-29 2005-10-06 The University Of Tokyo Rna配列情報処理方法、プログラムおよび装置
JP2005284595A (ja) * 2004-03-29 2005-10-13 Kiyoshi Asai Rna配列情報処理方法、プログラムおよび装置
JP2006163546A (ja) * 2004-12-03 2006-06-22 Dainippon Printing Co Ltd 生物情報の解析装置および圧縮装置
WO2008059642A1 (fr) * 2006-11-13 2008-05-22 Nec Soft, Ltd. Procédé pour la prédiction d'une structure d'acide nucléique d'ordre supérieur, appareil pour la prédiction d'une structure d'acide nucléique d'ordre supérieur et programme pour la prédiction d'une structure d'acide nucléique d'ordre supérieur
JP2008118923A (ja) * 2006-11-13 2008-05-29 Nec Soft Ltd 核酸高次構造予測方法、核酸高次構造予測装置及び核酸高次構造予測プログラム
JP2009020323A (ja) * 2007-07-12 2009-01-29 Nec Soft Ltd 自動作曲装置および自動作曲方法ならびにプログラム
JP4506998B2 (ja) * 2007-07-12 2010-07-21 Necソフト株式会社 自動作曲装置および自動作曲方法ならびにプログラム
JP2016513303A (ja) * 2013-01-29 2016-05-12 モレキュラー ヘルス ゲーエムベーハー 臨床判断支援のためのシステムおよび方法
JP2018139111A (ja) * 2013-01-29 2018-09-06 モレキュラー ヘルス ゲーエムベーハー 臨床判断支援のためのシステムおよび方法
US10672514B2 (en) 2013-01-29 2020-06-02 Molecular Health Gmbh Systems and methods for clinical decision support

Also Published As

Publication number Publication date
JP3903420B2 (ja) 2007-04-11

Similar Documents

Publication Publication Date Title
Palkopoulou et al. Complete genomes reveal signatures of demographic and genetic declines in the woolly mammoth
Mouse Genome Sequencing Consortium Genome Sequencing Center: Chinwalla Asif T. 1 Cook Lisa L. 1 Delehaunty Kimberly D. 1 Fewell Ginger A. 1 Fulton Lucinda A. 1 Fulton Robert S. 1 Graves Tina A. 1 Hillier LaDeana W. 1 Mardis Elaine R. 1 McPherson John D. 1 Miner Tracie L. 1 Nash William E. 1 Nelson Joanne O. 1 Nhan Michael N. 1 Pepin Kymberlie H. 1 Pohl Craig S. 1 Ponce Tracy C. 1 Schultz Brian 1 Thompson Johanna 1 Trevaskis Evanne 1 Waterston Robert H. waterston@ gs. washington. edu 1 y Wendl Michael C. 1 Wilson Richard K. 1 Yang Shiaw-Pyng 1 et al. Initial sequencing and comparative analysis of the mouse genome
Mangan et al. Adaptive sequence divergence forged new neurodevelopmental enhancers in humans
Zhang et al. New genes expressed in human brains: implications for annotating evolving genomes
Strokach et al. Predicting changes in protein stability caused by mutation using sequence‐and structure‐based methods in a CAGI5 blind challenge
Dey et al. SNP-to-gene linking strategies reveal contributions of enhancer-related and candidate master-regulator genes to autoimmune disease
US20010051855A1 (en) Computationally targeted evolutionary design
Barrie et al. Elevated genetic risk for multiple sclerosis emerged in steppe pastoralist populations
Martinez-Ortiz et al. An improved method for modeling voltage-gated ion channels at atomic accuracy applied to human Cav channels
Shuler et al. Rapidly evolving viral motifs mostly target biophysically constrained binding pockets of host proteins
Aranha et al. Combining three-dimensional modeling with artificial intelligence to increase specificity and precision in peptide–MHC binding predictions
JP2003242153A (ja) 塩基配列からrnaの機能性部位を同定する方法
Moreno-Moral et al. Systems genetics as a tool to identify master genetic regulators in complex disease
Bianchetti et al. vALId: validation of protein sequence quality based on multiple alignment data
Shoaib et al. Mapping genomes by using bioinformatics data and tools
Tang et al. Vertebrate paralogous CRMPs in nervous system: evolutionary, structural, and functional interplay
WO2021192395A1 (ja) 塩基のメチル化度の算出方法及びプログラム
Lin et al. Human-specific lncRNAs contributed critically to human evolution by distinctly regulating gene expression
Ma et al. NeoHunter: Flexible software for systematically detecting neoantigens from sequencing data
Liew et al. Data mining for bioinformatics
Mou et al. In Silico Functional Annotation of VP 128 Hypothetical Protein from Vibrio parahaemolyticus
Tramontano Integral and differential form of the protein folding problem
Mohammed et al. Roles of Nucleotide Sequence Analysis in Human Genetics and Genomics
Saif et al. Sequence diversity of MAOA gene within wild and docile animal species
Bayerlová Evolution of protein structure in calcium channels

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040623

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050131

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050720

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051031

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060414

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061227

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120119

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130119

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees