JP2008250971A - マイクロrna標的遺伝子予測装置、マイクロrna標的遺伝子予測方法、および、プログラム - Google Patents

マイクロrna標的遺伝子予測装置、マイクロrna標的遺伝子予測方法、および、プログラム Download PDF

Info

Publication number
JP2008250971A
JP2008250971A JP2007121054A JP2007121054A JP2008250971A JP 2008250971 A JP2008250971 A JP 2008250971A JP 2007121054 A JP2007121054 A JP 2007121054A JP 2007121054 A JP2007121054 A JP 2007121054A JP 2008250971 A JP2008250971 A JP 2008250971A
Authority
JP
Japan
Prior art keywords
gene
microrna
correlation coefficient
genes
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007121054A
Other languages
English (en)
Inventor
Akira Taemoto
陽 妙本
Hideo Akiyama
英雄 秋山
Yasushi Okuno
恭史 奥野
Gozo Tsujimoto
豪三 辻本
Akira Kunimoto
亮 国本
Kazuya Terasawa
和哉 寺澤
Soken Tsuchiya
創健 土屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toray Industries Inc
Original Assignee
Toray Industries Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toray Industries Inc filed Critical Toray Industries Inc
Priority to JP2007121054A priority Critical patent/JP2008250971A/ja
Publication of JP2008250971A publication Critical patent/JP2008250971A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】大量の擬陽性の予測結果を排除して十分に絞り込んだ標的遺伝子の予測結果を得ることができ、マイクロRNAの転写産物分解機能に関する標的遺伝子を予測することができる装置、方法およびプログラムを提供することを目的とする。
【解決手段】アライメントに基づいてマイクロRNAの標的となる遺伝子を予測し、標的サイトを所定の複数以上有する遺伝子を抽出し、マイクロRNA−遺伝子相関係数が負の所定数以下である遺伝子を抽出し、上記標的サイト数に基づいて抽出された遺伝子と、上記相関係数に基づいて抽出された遺伝子と、の積集合を求め、積集合のうち、2つの遺伝子の組み合わせを遺伝子ペアとして選出し、選出された遺伝子ペアについて、遺伝子ペアの相関関係または共起関係と、遺伝子ペアがマイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、尤度に基づいて遺伝子ペアを抽出することを特徴とする。
【選択図】 図3

Description

本発明は、マイクロRNA標的遺伝子予測装置、マイクロRNA標的遺伝子予測方法、および、プログラムに関する。
近年、遺伝子の制御にマイクロRNAが関わっていることが知られている。ここで、図1は、マイクロRNAの機能の一例を示す図である。図1に示すように、マイクロRNAは、ゲノム配列の非コード領域(Non-Coding Region)から転写され、mRNA(messenger RNA)の3´非翻訳領域(3'UTR)に結合することにより、その遺伝子の発現を調整する。すなわち、図1に示すように、マイクロRNAによる制御メカニズムには、転写産物であるmRNAの分解と翻訳の阻害とが存在する。
また、従来、ゲノムインフォマティクスによりマイクロRNAの標的となる遺伝子を予測する方法には、主に、相補性に基づく標的遺伝子予測法と、進化的保存性に基づく標的遺伝子予測法とが存在する(非特許文献1参照)。
ここで、相補性に基づく標的遺伝子予測法は、動的計画法に基づくローカルアライメントまたはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントにより、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する方法である。
例えば、非特許文献2のアルゴリズム(miRanda)は、ゲノム配列中のマイクロRNAの標的サイトを予測するものであり、動的計画法を用いたマイクロRNAとゲノム配列とのローカルアライメントの結果、および、配列間の熱力学計算を行った熱力学的アライメントの結果を用いて標的サイトを予測する。
また、進化的保存性に基づく標的遺伝子予測法は、複数種のゲノム配列のマルチプルアライメントなどのゲノム比較に基づいて、種間で保存された配列をアライメントにより調整して、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する方法である。
また、ここで、最尤推定法を遺伝子間ネットワークの予測に用いたプログラムとして、非特許文献3が存在する。
プラベーン・セトゥパシ、モリー・メグロー、アルテミス G ハチジョージオル(Praveen Sethupathy, Molly Megraw, & Artemis G Hatzigeorgiou1)著、「ア ガイド スルー プレズント コンピューテイショナル アプローチズ フォー ザ アイデンティフィケーション オブ マンマリアン マイクロRNA ターゲッツ(A guide through present computational approaches for the identification of mammalian microRNA targets)」、ネイチャー・メソッド(NATURE METHODS)、2006年11月、第3巻、第11号、p.881−886(VOL.3 NO.11 NOVEMBER 2006 p.881-886) ジョン B、エンリヒト AJ、アラビン A、チュースキル T、サンダー C、マークス DS(John B, Enright AJ, Aravin A, Tuschl T, Sander C, Marks DS.)著、「ヒューマン マイクロRNA ターゲッツ(Human MicroRNA targets)」、プロス・バイオロジー(PLoS Biol.)、2004年11月、第2巻、e363−11号、p.1862−1879(NOVEMBER 2004 VOLUME 2 ISSUE 11 e363 p.1862-1879) インスク・リー、シャイレシュ V デイト、アレックス T アダイ、エドワード M マーコット(Insuk Lee, Shailesh V. Date, Alex T. Adai, Edward M. Marcotte)著、「ネットワーク オブ イースト ジーンズ(Network of Yeast Genes)」、サイエンス(SCIENCE)、2004年11月、第306巻、第26号、p.1555−1558(VOL 306 26 NOVEMBER 2004 p.1555-1558)
しかしながら、従来のマイクロRNAの標的遺伝子を予測する方法においては、標的遺伝子の絞込みが不十分であり、大量の擬陽性の予測結果が含まれるという問題があった。
また、従来のマイクロRNAの標的遺伝子を予測する方法では、予測された結果が、マイクロRNAの機能のうち、転写産物分解に関わるものであるのか、翻訳制御に関わるものであるのか、区別することができないという問題があった。
また、非特許文献3のプログラムは、遺伝子−遺伝子間の機能的ネットワークの予測に用いるものであり、マイクロRNAと複数遺伝子間の機能的ネットワークの予測に用いることができないという問題があった。
本発明は、上記に鑑みてなされたもので、大量の擬陽性の予測結果を排除して十分に絞り込んだ標的遺伝子の予測結果を得ることができ、マイクロRNAの転写産物分解機能に関する標的遺伝子を予測することができる、マイクロRNA標的遺伝子予測装置、マイクロRNA標的遺伝子予測方法、および、プログラムを提供することを目的とする。また、マイクロRNAと複数遺伝子間の機能的ネットワークの予測を行うことができる、マイクロRNA標的遺伝子予測装置、マイクロRNA標的遺伝子予測方法、および、プログラムを提供することを目的とする。
このような目的を達成するため、請求項1に記載のマイクロRNA標的遺伝子予測装置は、動的計画法に基づくローカルアライメントおよび/またはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する、制御部と記憶部を少なくとも備えたマイクロRNA標的遺伝子予測装置において、上記記憶部は、任意のマイクロRNAの発現量と任意の遺伝子の発現量との相関係数をマイクロRNA−遺伝子相関係数として記憶するマイクロRNA−遺伝子相関係数記憶手段、を備え、上記制御部は、上記ローカルアライメントおよび/または上記熱力学的アライメントに基づいて、上記予測された上記遺伝子のうち、上記マイクロRNAの標的サイトを所定の複数以上有する上記遺伝子を抽出する標的サイト数遺伝子抽出手段と、上記マイクロRNA−遺伝子相関係数記憶手段に記憶された上記マイクロRNA−遺伝子相関係数が負の所定数以下である上記遺伝子を抽出する逆相関遺伝子抽出手段と、上記標的サイト数遺伝子抽出手段によって抽出された上記遺伝子と、上記逆相関遺伝子抽出手段によって抽出された上記遺伝子と、の積集合を求め、上記積集合のうち、2つの上記遺伝子の組み合わせを遺伝子ペアとして選出する積集合選出手段と、上記積集合選出手段により選出された上記遺伝子ペアについて、上記遺伝子ペアの相関関係または共起関係と、当該遺伝子ペアが上記マイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、上記尤度に基づいて上記遺伝子ペアを抽出する尤度検定抽出手段と、を備えたことを特徴とする。
また、請求項2に記載のマイクロRNA標的遺伝子予測装置は、請求項1に記載のマイクロRNA標的遺伝子予測装置において、上記尤度検定抽出手段は、最尤推定法により、下記の数式1に基づいて上記尤度の対数尤度比(LLS)を求め、上記対数尤度比が正の所定数以上である上記遺伝子ペアを抽出する最尤抽出手段、を更に備えたことを特徴とする。
Figure 2008250971
(上記数式1において、P(L)は全事象において上記遺伝子ペアが上記マイクロRNAを共通とする全体確率を表し、~P(L)は全事象において上記遺伝子ペアが上記マイクロRNAを共通としない全体確率を表す。また、P(L|E)は、特定の事象(E)において上記遺伝子ペアが上記マイクロRNAを共通とする条件付確率を表し、~P(L|E)は、特定の事象(E)において上記遺伝子ペアが上記マイクロRNAを共通としない条件付確率を表す。)
また、請求項3に記載のマイクロRNA標的遺伝子予測装置は、請求項1または2に記載のマイクロRNA標的遺伝子予測装置において、上記記憶部は、任意の一方の遺伝子の発現量と他方の遺伝子の発現量との上記相関係数を遺伝子間相関係数として記憶する遺伝子間相関係数記憶手段、を更に備え、上記尤度検定抽出手段は、上記遺伝子間相関係数記憶手段に記憶された上記遺伝子間相関係数に基づく上記相関関係を用いて、上記尤度を検定すること、を特徴とする。
また、請求項4に記載のマイクロRNA標的遺伝子予測装置は、請求項1乃至3のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、上記記憶部は、複数の細胞における、遺伝子の発現パターン情報を記憶する発現パターン記憶手段、を更に備え、上記制御部は、上記発現パターン記憶手段に記憶された上記発現パターン情報に基づいて、上記遺伝子間相関係数を算出し上記遺伝子間相関係数記憶手段に格納する遺伝子間相関係数算出手段、を更に備えたことを特徴とする。
また、請求項5に記載のマイクロRNA標的遺伝子予測装置は、請求項1乃至4のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、上記発現パターン記憶手段は、更に、マイクロRNAの発現パターン情報を記憶し、上記制御部は、上記発現パターン記憶手段に記憶された上記発現パターン情報に基づいて、上記マイクロRNA−遺伝子相関係数を算出し上記マイクロRNA−遺伝子相関係数記憶手段に格納するマイクロRNA−遺伝子相関係数算出手段、を更に備えたことを特徴とする。
また、請求項6に記載のマイクロRNA標的遺伝子予測装置は、請求項4または5に記載のマイクロRNA標的遺伝子予測装置において、上記マイクロRNA−遺伝子相関係数算出手段または上記遺伝子間相関係数算出手段は、上記相関係数として、ピアソンの積率相関係数、スピアマンの順位相関係数、または、ケンドール順位相関係数を算出すること、を特徴とする。
また、請求項7に記載のマイクロRNA標的遺伝子予測装置は、請求項1乃至6のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、上記尤度検定抽出手段は、上記尤度の検定に、相互情報量または結合エントロピーを用いること、を特徴とする。
また、請求項8に記載のマイクロRNA標的遺伝子予測装置は、請求項1乃至7のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、上記記憶部は、マイクロRNAと遺伝子との上記共起関係を示すマイクロRNA−遺伝子共起指数を記憶するマイクロRNA−遺伝子共起指数記憶手段、を更に備え、上記積集合選出手段は、上記積集合に含まれる上記遺伝子と、更に、上記マイクロRNA−遺伝子共起関係記憶手段に記憶された上記マイクロRNA−遺伝子共起指数が所定値以上である上記遺伝子と、の上記積集合を求めること、を特徴とする。
また、請求項9に記載のマイクロRNA標的遺伝子予測装置は、請求項1乃至8のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、上記記憶部は、任意の一方の遺伝子と他方の遺伝子との上記共起関係を示す遺伝子間共起指数を記憶する遺伝子間共起指数記憶手段、を更に備え、上記尤度検定抽出手段は、上記遺伝子間共起指数記憶手段に記憶された上記遺伝子間共起指数に基づいて、上記対数尤度比を求めること、を特徴とする。
また、請求項10に記載のマイクロRNA標的遺伝子予測装置は、請求項1乃至9のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、上記制御部は、上記尤度検定抽出手段によって抽出された上記遺伝子ペアと、上記共通する上記マイクロRNAとに基づいて、上記マイクロRNAと上記遺伝子との機能的ネットワークを構築するネットワーク構築手段、を更に備えたことを特徴とする。
また、請求項11に記載のマイクロRNA標的遺伝子予測方法は、動的計画法に基づくローカルアライメントおよび/またはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する、制御部と記憶部を少なくとも備えたマイクロRNA標的遺伝子予測装置において実行されるマイクロRNA標的遺伝子予測方法であって、上記記憶部は、任意のマイクロRNAの発現量と任意の遺伝子の発現量との相関係数をマイクロRNA−遺伝子相関係数として記憶するマイクロRNA−遺伝子相関係数記憶手段、を備えており、上記制御部において実行される、上記ローカルアライメントおよび/または上記熱力学的アライメントに基づいて、上記予測された上記遺伝子のうち、上記マイクロRNAの標的サイトを所定の複数以上有する上記遺伝子を抽出する標的サイト数遺伝子抽出ステップと、上記マイクロRNA−遺伝子相関係数記憶手段に記憶された上記マイクロRNA−遺伝子相関係数が負の所定数以下である上記遺伝子を抽出する逆相関遺伝子抽出ステップと、上記標的サイト数遺伝子抽出ステップにおいて抽出された上記遺伝子と、上記逆相関遺伝子抽出ステップにおいて抽出された上記遺伝子と、の積集合を求め、上記積集合のうち、2つの上記遺伝子の組み合わせを遺伝子ペアとして選出する積集合選出ステップと、上記積集合選出ステップにおいて選出された上記遺伝子ペアについて、上記遺伝子ペアの相関関係または共起関係と、当該遺伝子ペアが上記マイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、上記尤度に基づいて上記遺伝子ペアを抽出する尤度検定抽出ステップと、を含むことを特徴とする。
また、請求項12に記載のマイクロRNA標的遺伝子予測方法は、請求項11に記載のマイクロRNA標的遺伝子予測方法において、上記尤度検定抽出ステップは、最尤推定法により、下記の数式1に基づいて上記尤度の対数尤度比(LLS)を求め、上記対数尤度比が正の所定数以上である上記遺伝子ペアを抽出する最尤抽出ステップ、を更に含むことを特徴とする。
Figure 2008250971
(上記数式1において、P(L)は全事象において上記遺伝子ペアが上記マイクロRNAを共通とする全体確率を表し、~P(L)は全事象において上記遺伝子ペアが上記マイクロRNAを共通としない全体確率を表す。また、P(L|E)は、特定の事象(E)において上記遺伝子ペアが上記マイクロRNAを共通とする条件付確率を表し、~P(L|E)は、特定の事象(E)において上記遺伝子ペアが上記マイクロRNAを共通としない条件付確率を表す。)
また、請求項13に記載のマイクロRNA標的遺伝子予測方法は、請求項11または12に記載のマイクロRNA標的遺伝子予測方法において、上記記憶部は、任意の一方の遺伝子の発現量と他方の遺伝子の発現量との上記相関係数を遺伝子間相関係数として記憶する遺伝子間相関係数記憶手段、を更に備えており、上記尤度検定抽出ステップは、上記遺伝子間相関係数記憶手段に記憶された上記遺伝子間相関係数に基づく上記相関関係を用いて、上記尤度を検定すること、を特徴とする。
また、請求項14に記載のマイクロRNA標的遺伝子予測方法は、請求項11乃至13のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、上記記憶部は、複数の細胞における、遺伝子の発現パターン情報を記憶する発現パターン記憶手段、を更に備えており、上記制御部において実行される、上記発現パターン記憶手段に記憶された上記発現パターン情報に基づいて、上記遺伝子間相関係数を算出し上記遺伝子間相関係数記憶手段に格納する遺伝子間相関係数算出ステップ、を更に含むことを特徴とする。
また、請求項15に記載のマイクロRNA標的遺伝子予測方法は、請求項11乃至14のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、上記発現パターン記憶手段は、更に、マイクロRNAの発現パターン情報を記憶し、上記制御部において実行される、上記発現パターン記憶手段に記憶された上記発現パターン情報に基づいて、上記マイクロRNA−遺伝子相関係数を算出し上記マイクロRNA−遺伝子相関係数記憶手段に格納するマイクロRNA−遺伝子相関係数算出ステップ、を更に含むことを特徴とする。
また、請求項16に記載のマイクロRNA標的遺伝子予測方法は、請求項14または15に記載のマイクロRNA標的遺伝子予測方法において、上記マイクロRNA−遺伝子相関係数算出ステップまたは上記遺伝子間相関係数算出ステップは、上記相関係数として、ピアソンの積率相関係数、スピアマンの順位相関係数、または、ケンドール順位相関係数を算出すること、を特徴とする。
また、請求項17に記載のマイクロRNA標的遺伝子予測方法は、請求項11乃至16のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、上記尤度検定抽出ステップは、上記尤度の検定に、相互情報量または結合エントロピーを用いること、を特徴とする。
また、請求項18に記載のマイクロRNA標的遺伝子予測方法は、請求項11乃至17のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、上記記憶部は、マイクロRNAと遺伝子との上記共起関係を示すマイクロRNA−遺伝子共起指数を記憶するマイクロRNA−遺伝子共起指数記憶手段、を更に備えており、上記積集合選出ステップは、上記積集合に含まれる上記遺伝子と、更に、上記マイクロRNA−遺伝子共起関係記憶手段に記憶された上記マイクロRNA−遺伝子共起指数が所定値以上である上記遺伝子と、の上記積集合を求めること、を特徴とする。
また、請求項19に記載のマイクロRNA標的遺伝子予測方法は、請求項11乃至18のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、上記記憶部は、任意の一方の遺伝子と他方の遺伝子との上記共起関係を示す遺伝子間共起指数を記憶する遺伝子間共起指数記憶手段、を更に備えており、上記尤度検定抽出ステップは、上記遺伝子間共起指数記憶手段に記憶された上記遺伝子間共起指数に基づいて、上記対数尤度比を求めること、を特徴とする。
また、請求項20に記載のマイクロRNA標的遺伝子予測方法は、請求項11乃至19のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、上記制御部において実行される、上記尤度検定抽出ステップにおいて抽出された上記遺伝子ペアと、上記共通する上記マイクロRNAとに基づいて、上記マイクロRNAと上記遺伝子との機能的ネットワークを構築するネットワーク構築ステップ、を更に含むことを特徴とする。
また、請求項21に記載のプログラムは、動的計画法に基づくローカルアライメントおよび/またはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する、制御部と記憶部を少なくとも備えたマイクロRNA標的遺伝子予測装置にマイクロRNA標的遺伝子予測方法を実行させるプログラムであって、上記記憶部は、任意のマイクロRNAの発現量と任意の遺伝子の発現量との相関係数をマイクロRNA−遺伝子相関係数として記憶するマイクロRNA−遺伝子相関係数記憶手段、を備えており、上記制御部において実行される、上記ローカルアライメントおよび/または上記熱力学的アライメントに基づいて、上記予測された上記遺伝子のうち、上記マイクロRNAの標的サイトを所定の複数以上有する上記遺伝子を抽出する標的サイト数遺伝子抽出ステップと、上記マイクロRNA−遺伝子相関係数記憶手段に記憶された上記マイクロRNA−遺伝子相関係数が負の所定数以下である上記遺伝子を抽出する逆相関遺伝子抽出ステップと、上記標的サイト数遺伝子抽出ステップにおいて抽出された上記遺伝子と、上記逆相関遺伝子抽出ステップにおいて抽出された上記遺伝子と、の積集合を求め、上記積集合のうち、2つの上記遺伝子の組み合わせを遺伝子ペアとして選出する積集合選出ステップと、上記積集合選出ステップにおいて選出された上記遺伝子ペアについて、上記遺伝子ペアの相関関係または共起関係と、当該遺伝子ペアがマイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、上記尤度に基づいて上記遺伝子ペアを抽出する尤度検定抽出ステップと、を含むマイクロRNA標的遺伝子予測方法を実行させることを特徴とする。
この発明によれば、大量の擬陽性の予測結果を排除して十分に絞り込んだ標的遺伝子の予測結果を得ることができ、マイクロRNAの転写産物分解機能に関する標的遺伝子を予測することができる。また、マイクロRNAと複数遺伝子間の機能的ネットワークを予測することができる。
以下に、本発明にかかる本マイクロRNA標的遺伝子予測装置、本マイクロRNA標的遺伝子予測方法、および、プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
[本発明の概要]
以下、本発明の本実施の形態について図2および図3を参照して説明する。図2は、本発明の基本原理を示す概念図である。
また、図2に示すように、本発明の基本原理は、概略的に、ローカルアライメントおよび熱力学的アライメントに基づいた通常の標的予測(conventionally target prediction)の結果、および、マイクロRNAおよび遺伝子の発現パターン情報に基づく相関係数の算出結果を統合化する。すなわち、統合化スコアスキーム(Unified scoring scheme)の一例として、以下の数式1に基づいて、対数尤度比(LLS:Log Likelihood Score)を求め標的遺伝子候補を絞り込むことにより、一例として、マイクロRNAと複数遺伝子間の機能的ネットワークを構築(create network)するものである。ここで、図3は、本発明の処理の概要を示すフローチャートである。
Figure 2008250971
すなわち、本発明の本マイクロRNA標的遺伝子予測装置は、少なくとも制御部と記憶部を少なくとも備える。まず、本マイクロRNA標的遺伝子予測装置は、マイクロRNAの発現量と遺伝子の発現量との相関係数(以下、「マイクロRNA−遺伝子相関係数」と呼ぶ。)を記憶する(ステップSA−1)。ここで、本マイクロRNA標的遺伝子予測装置は、任意の一方の遺伝子の発現量と他方の遺伝子の発現量との相関係数(以下、「遺伝子間相関係数」と呼ぶ。)を記憶してもよい。
ここで、本マイクロRNA標的遺伝子予測装置は、複数の細胞における、マイクロRNAおよび遺伝子の発現パターン情報を記憶し、記憶された発現パターン情報に基づいて、マイクロRNA−遺伝子相関係数、または、遺伝子間相関係数を算出してもよい。また、本マイクロRNA標的遺伝子予測装置は、マイクロRNAと遺伝子との共起関係を示すマイクロRNA−遺伝子共起指数を記憶してもよく、任意の一方の遺伝子と他方の遺伝子との共起関係を示す遺伝子間共起指数を記憶してもよい。
そして、本マイクロRNA標的遺伝子予測装置は、動的計画法に基づくローカルアライメントおよび/またはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する(ステップSA−2)。
そして、本マイクロRNA標的遺伝子予測装置は、ローカルアライメントおよび/または熱力学的アライメントに基づいて、予測された遺伝子のうち、マイクロRNAの標的サイトを所定の複数以上有する遺伝子を抽出する(ステップSA−3)。
そして、本マイクロRNA標的遺伝子予測装置は、記憶されたマイクロRNA−遺伝子相関係数が負の所定数以下である遺伝子を抽出する(ステップSA−4)。
そして、本マイクロRNA標的遺伝子予測装置は、ステップSA−3においてアライメントに基づいて抽出された遺伝子と、ステップSA−4においてマイクロRNAの発現との逆相関性により抽出された遺伝子と、の積集合を求め、当該積集合のうち、2つの遺伝子の組み合わせを遺伝子ペアとして選出する(ステップSA−5)。ここで、本マイクロRNA標的遺伝子予測装置は、記憶されたマイクロRNA−遺伝子共起指数が所定値以上である遺伝子との積集合を更に求めてもよい。
そして、本マイクロRNA標的遺伝子予測装置は、選出された遺伝子ペアの相関関係または共起関係と、当該遺伝子ペアがマイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、尤度に基づいて遺伝子ペアを抽出する(ステップSA−6)。ここで、本マイクロRNA標的遺伝子予測装置は、尤度の検定に、最尤推定法による対数尤度比や、相関係数、相互情報量、結合エントロピー等を用いてもよい。
ここで、本マイクロRNA標的遺伝子予測装置は、尤度に基づいて抽出された遺伝子ペアと、当該遺伝子ペアに共通するマイクロRNAとに基づいて、マイクロRNAと遺伝子との機能的ネットワークを構築するよう制御してもよい。以上が、本発明の概要である。
[本マイクロRNA標的遺伝子予測装置の構成]
まず、本マイクロRNA標的遺伝子予測装置の構成について、図4を参照しながら説明する。図4は、本発明の本実施の形態が適用される本マイクロRNA標的遺伝子予測装置の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
図4においてマイクロRNA標的遺伝子予測装置100は、概略的に、マイクロRNA標的遺伝子予測装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、入力装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。更に、このマイクロRNA標的遺伝子予測装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されている。
記憶部106に格納される各種のデータベースやテーブル(ゲノム配列データベース106a〜遺伝子間共起指数ファイル106g)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベース等を格納する。
これら記憶部106の各構成要素のうち、ゲノム配列データベース106aは、ゲノム配列情報を記憶するゲノム配列情報蓄積手段である。ここで、ゲノム配列データベース106aは、マイクロRNA配列情報やcDNA配列情報を記憶してもよい。
また、標的遺伝子候補ファイル106bは、マイクロRNAの標的遺伝子の候補として抽出または選出された遺伝子を記憶する標的遺伝子候補記憶手段である。
また、発現パターンデータベース106cは、複数の細胞における、マイクロRNAおよび遺伝子の発現パターン情報を記憶する発現パターン記憶手段である。ここで、発現パターンデータベース106cは、マイクロアレイ法または定量的PCR法を用いて得られた、複数の細胞におけるマイクロRNAおよび遺伝子の発現情報を、発現パターン情報として記憶してもよい。また、発現パターン情報は、入出力制御インターフェース部108を介して入力装置112から、発現パターンデータベース106cに格納されてもよい。
また、マイクロRNA−遺伝子相関係数ファイル106dは、任意のマイクロRNAの発現量と任意の遺伝子の発現量との相関係数をマイクロRNA−遺伝子相関係数として記憶するマイクロRNA−遺伝子相関係数記憶手段である。
また、遺伝子間相関係数ファイル106eは、任意の一方の遺伝子の発現量と他方の遺伝子の発現量との相関係数を遺伝子間相関係数として記憶する遺伝子間相関係数記憶手段である。
また、マイクロRNA−遺伝子共起指数ファイル106fは、マイクロRNAと遺伝子との共起関係をマイクロRNA−遺伝子共起指数として記憶するマイクロRNA−遺伝子共起指数記憶手段である。
また、遺伝子間共起指数ファイル106gは、任意の一方の遺伝子と他方の遺伝子との共起関係を遺伝子間共起指数として記憶する遺伝子間共起指数記憶手段である。
また、図4において、通信制御インターフェース部104は、マイクロRNA標的遺伝子予測装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
また、図4において、入出力制御インターフェース部108は、入力装置112や出力装置114の制御を行う。ここで、出力装置114としては、モニタ(家庭用テレビを含む)の他、スピーカを用いることができる(なお、以下においては出力装置114をモニタとして記載する場合がある)。また、入力装置112としては、キーボードやマウスやスキャナ等を用いることができる。
また、図4において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、アライメント予測部102a、標的サイト数遺伝子抽出部102b、マイクロRNA−遺伝子相関係数算出部102c、遺伝子間相関係数算出部102d、逆相関遺伝子抽出部102e、積集合選出部102f、尤度検定抽出部102g、ネットワーク構築部102iを備えて構成されている。
このうち、アライメント予測部102aは、ゲノム配列データベース106aに記憶されたゲノム配列情報から、動的計画法に基づくローカルアライメントおよび/またはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、マイクロRNAの標的遺伝子を予測するアライメント予測手段である。
また、標的サイト数遺伝子抽出部102bは、ローカルアライメントおよび/または熱力学的アライメントに基づいて、アライメント予測部102aにより予測された遺伝子のうち、マイクロRNAの標的サイトを所定の複数以上有する遺伝子を抽出し、標的遺伝子候補ファイル106bに格納する標的サイト数遺伝子抽出手段である。
また、マイクロRNA−遺伝子相関係数算出部102cは、発現パターンデータベース106cに記憶された発現パターン情報に基づいて、マイクロRNA−遺伝子相関係数を算出し、マイクロRNA−遺伝子相関係数ファイル106dに格納するマイクロRNA−遺伝子相関係数算出手段である。ここで、マイクロRNA−遺伝子相関係数算出部102cは、マイクロRNA−遺伝子相関係数として、ピアソンの積率相関係数、スピアマンの順位相関係数、または、ケンドール順位相関係数を算出してもよい。
また、遺伝子間相関係数算出部102dは、発現パターンデータベース106cに記憶された発現パターン情報に基づいて、遺伝子間相関係数を算出し、遺伝子間相関係数ファイル106eに格納する遺伝子間相関係数算出手段である。ここで、遺伝子間相関係数算出部102dは、遺伝子間相関係数として、ピアソンの積率相関係数、スピアマンの順位相関係数、または、ケンドール順位相関係数を算出してもよい。
また、逆相関遺伝子抽出部102eは、マイクロRNA−遺伝子相関係数ファイル106dに記憶されたマイクロRNA−遺伝子相関係数が負の所定数以下である遺伝子を抽出し、標的遺伝子候補ファイル106bに格納する逆相関遺伝子抽出手段である。
また、積集合選出部102fは、標的遺伝子候補ファイル106bに記憶された、標的サイト数遺伝子抽出部102bによって抽出された遺伝子と、逆相関遺伝子抽出部102eによって抽出された遺伝子と、の積集合を求め、当該積集合のうち、2つの遺伝子の組み合わせを遺伝子ペアとして選出する積集合選出手段である。ここで、積集合選出部102fは、上記積集合に含まれる遺伝子と、マイクロRNA−遺伝子相関係数ファイル106dに記憶されたマイクロRNA−遺伝子共起指数が所定値以上である遺伝子との積集合を更に求めてもよい。
また、尤度検定抽出部102gは、積集合選出部102fにより選出された遺伝子ペアについて、遺伝子ペアの相関関係または共起関係と、当該遺伝子ペアがマイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、上記尤度に基づいて上記遺伝子ペアを抽出する尤度検定抽出手段である。ここで、尤度検定抽出部102gは、遺伝子間相関係数ファイル106eに記憶された遺伝子間相関係数に基づく相関関係を用いて尤度を検定してもよく、遺伝子間共起指数ファイル106gに記憶された遺伝子間共起指数に基づく共起関係を用いて尤度を検定してもよい。また、尤度検定抽出部102gは、尤度を示す指標として、相関係数の他、相互情報量や結合エントロピー等を用いてもよい。
また、尤度検定抽出部102gは、図4に示すように、最尤抽出部102hを備えて構成される。すなわち、最尤抽出部102hは、最尤推定法により、下記の数式1に基づいて対数尤度比(LLS)を求め、対数尤度比が正の所定数以上である遺伝子ペアを抽出する最尤抽出手段である。
Figure 2008250971
ここで、上記数式1において、P(L)は全事象において遺伝子ペアがマイクロRNAを共通とする全体確率を表し、~P(L)は全事象において遺伝子ペアがマイクロRNAを共通としない全体確率を表す。また、P(L|E)は、特定の事象(E)において遺伝子ペアがマイクロRNAを共通とする条件付確率を表し、~P(L|E)は、特定の事象(E)において遺伝子ペアがマイクロRNAを共通としない条件付確率を表す。
また、ネットワーク構築部102iは、尤度検定抽出部102gによって抽出された遺伝子ペアと、当該遺伝子ペアに共通するマイクロRNAとに基づいて、マイクロRNAと遺伝子との機能的ネットワークを構築するネットワーク構築手段である。
以上が本マイクロRNA標的遺伝子予測装置100の内部構成である。ここで、マイクロRNA標的遺伝子予測装置100は、ネットワーク300を介して外部システム200と接続して構成されてもよい。すなわち、本マイクロRNA標的遺伝子予測システムは、概略的にマイクロRNA標的遺伝子予測装置100と、ゲノム配列情報等に関する外部データベースやマイクロRNA標的遺伝子予測プログラム等の外部プログラム等を提供する外部システム200とを、ネットワーク300を介して通信可能に接続して構成されてもよい。
ここで、図4において、ネットワーク300は、マイクロRNA標的遺伝子予測装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
また、図4において、外部システム200は、ネットワーク300を介して、マイクロRNA標的遺伝子予測装置100と相互に接続され、利用者に対してゲノム配列情報や相関係数情報等に関する外部データベースやマイクロRNA標的遺伝子予測プログラム等の外部プログラム等を提供する機能を有する。ここで、外部システム200は、WEBサーバやASPサーバ等として構成していてもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成していてもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。以上で、本マイクロRNA標的遺伝子予測装置の構成の説明を終える。
[マイクロRNA標的遺伝子予測処理]
次に、このように構成された本実施の形態における本マイクロRNA標的遺伝子予測装置100のマイクロRNA標的遺伝子予測処理について図5〜図9を参照しながら詳細に説明する。
[実施の形態1(相関関係によるマイクロRNA標的遺伝子予測処理)]
マイクロRNA標的遺伝子予測装置100のマイクロRNA標的遺伝子予測処理の一例について、以下に図5〜図7を参照して詳細に説明する。図5は、本マイクロRNA標的遺伝子予測装置100のマイクロRNA標的遺伝子予測処理の一例を示すフローチャートである。図6は、積集合の求め方の一例を示す図である。
図5に示すように、まず、アライメント予測部102aは、ゲノム配列データベース106aに記憶されたゲノム配列情報から、動的計画法に基づくローカルアライメントおよびRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、マイクロRNAの標的となる遺伝子を予測する(ステップSB−1)。
つぎに、標的サイト数遺伝子抽出部102bは、ローカルアライメントおよび熱力学的アライメントに基づいて、アライメント予測部102aによって予測された遺伝子のうち、マイクロRNAの標的サイトを所定の複数以上有する遺伝子を抽出し、標的遺伝子候補ファイル106bに格納する(ステップSB−2)。
そして、逆相関遺伝子抽出部102eは、マイクロRNA−遺伝子相関係数ファイル106dに記憶されたマイクロRNA−遺伝子相関係数が負の所定数以下である遺伝子を抽出する(ステップSB−3)。
そして、積集合選出部102fは、図6に示すように、標的サイト数遺伝子抽出部102bの処理により抽出された遺伝子と、逆相関遺伝子抽出部102eの処理により抽出された遺伝子と、の積集合を求め、当該積集合のうち2つの遺伝子の組み合わせを遺伝子ペアとして選出する(ステップSB−4)。
そして、尤度検定抽出部102gは、最尤抽出部102hの処理により、遺伝子間相関係数ファイル106eに記憶された遺伝子間相関係数に基づく相関関係を用いて、最尤推定法により、下記の数式1に基づいて対数尤度比(LLS)を求め、対数尤度比が正の所定数以上である遺伝子ペアを抽出する(ステップSB−5)。
Figure 2008250971
ここで、数式1において、P(L)は全事象において遺伝子ペアがマイクロRNAを共通とする全体確率を表し、~P(L)は全事象において遺伝子ペアがマイクロRNAを共通としない全体確率を表す。また、P(L|E)は、特定の事象(E)において遺伝子ペアがマイクロRNAを共通とする条件付確率を表し、~P(L|E)は、特定の事象(E)において遺伝子ペアがマイクロRNAを共通としない条件付確率を表す。ここで、尤度検定抽出部102gは、最尤推定法以外にも尤度検定法として、相互情報量や結合エントロピー等を用いてもよい。
そして、ネットワーク構築部102iは、尤度検定抽出部102gの処理により抽出された遺伝子ペアと、当該遺伝子ペアに共通するマイクロRNAとに基づいて、マイクロRNAと遺伝子との機能的ネットワークを構築するよう制御する(ステップSB−6)。
[相関係数算出処理]
ここで、本マイクロRNA標的遺伝子予測装置100における相関係数算出処理の一例について、図7を参照して詳細に説明する。ここで、図7は、相関係数算出処理の一例を示すフローチャートである。
図7に示すように、複数の細胞における、遺伝子の発現が、マイクロアレイや定量的PCRなどにより測定されると(ステップSC−1)、制御部102は、入出力制御インターフェース部108を介して入力装置112を制御することにより、得られた遺伝子の発現パターン情報を、発現パターンデータベース106cに格納する(ステップSC−2)。
そして、遺伝子間相関係数算出部102dは、発現パターンデータベース106cに記憶された遺伝子の発現パターン情報に基づいて、遺伝子間相関係数を算出し、遺伝子間相関係数ファイル106eに格納する(ステップSC−3)。
また、図7に示すように、複数の細胞における、マイクロRNAの発現が、マイクロアレイや定量的PCRなどにより測定されると(ステップSC−4)、制御部102は、入出力制御インターフェース部108を介して入力装置112を制御することにより、得られたマイクロRNAの発現パターン情報を、発現パターンデータベース106cに格納する(ステップSC−5)。
そして、マイクロRNA−遺伝子相関係数算出部102cは、発現パターンデータベース106cに記憶されたマイクロRNAと遺伝子との発現パターン情報に基づいて、マイクロRNA−遺伝子相関係数を算出し、マイクロRNA−遺伝子相関係数ファイル106dに格納する(ステップSC−6)。
ここで、マイクロRNA−遺伝子相関係数算出部102cまたは遺伝子間相関係数算出部102dは、相関係数として、ピアソンの積率相関係数、スピアマンの順位相関係数、または、ケンドール順位相関係数を算出してもよい。以上で相関係数算出処理の説明を終える。
[実施の形態2(共起関係によるマイクロRNA標的遺伝子予測処理)]
つぎに、共起関係によるマイクロRNA標的遺伝子予測処理の一例について、図8を参照しながら説明する。図8は、共起関係によるマイクロRNA標的遺伝子予測処理の一例を示すフローチャートである。
図8に示すように、まず、アライメント予測部102aは、ゲノム配列データベース106aに記憶されたゲノム配列情報から、動的計画法に基づくローカルアライメントおよびRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、マイクロRNAの標的となる遺伝子を予測する(ステップSD−1)。
つぎに、標的サイト数遺伝子抽出部102bは、ローカルアライメントおよび熱力学的アライメントに基づいて、アライメント予測部102aの処理により予測された遺伝子のうち、マイクロRNAの標的サイトを所定の複数以上有する遺伝子を抽出し、標的遺伝子候補ファイル106bに格納する(ステップSD−2)。
そして、逆相関遺伝子抽出部102eは、マイクロRNA−遺伝子相関係数ファイル106dに記憶されたマイクロRNA−遺伝子相関係数が負の所定数以下である遺伝子を抽出する(ステップSD−3)。
そして、積集合選出部102fは、マイクロRNA−遺伝子共起指数ファイル106fに記憶されたマイクロRNA−遺伝子共起指数が所定値以上である遺伝子と、標的サイト数遺伝子抽出部102bの処理により抽出された遺伝子と、逆相関遺伝子抽出部102eの処理により抽出された遺伝子と、の3つの遺伝子群の積集合を求め(図6参照)、当該積集合のうち2つの遺伝子の組み合わせを遺伝子ペアとして選出する(ステップSD−4)。
そして、尤度検定抽出部102gは、最尤抽出部102hの処理により、遺伝子間共起指数ファイル106gに記憶された遺伝子間共起指数に基づく共起関係を用いて、最尤推定法により、下記の数式1に基づいて対数尤度比(LLS)を求め、対数尤度比が正の所定数以上である遺伝子ペアを抽出する(ステップSD−5)。
Figure 2008250971
ここで、数式1において、P(L)は全事象において遺伝子ペアがマイクロRNAを共通とする全体確率を表し、~P(L)は全事象において遺伝子ペアがマイクロRNAを共通としない全体確率を表す。また、P(L|E)は、特定の事象(E)において遺伝子ペアがマイクロRNAを共通とする条件付確率を表し、~P(L|E)は、特定の事象(E)において遺伝子ペアがマイクロRNAを共通としない条件付確率を表す。
そして、ネットワーク構築部102iは、尤度検定抽出部102gの処理により抽出された遺伝子ペアと、当該遺伝子ペアに共通するマイクロRNAとに基づいて、マイクロRNAと遺伝子との機能的ネットワークを構築するよう制御する(ステップSD−6)。以上で、実施の形態2(共起関係によるマイクロRNA標的遺伝子予測処理)の説明を終える。
[実施の形態3(実施の形態1+実施の形態2)]
上述した実施の形態1と実施の形態2を組み合わせた実施の形態3について、以下に図9を参照して詳細に説明する。図9は、本発明の本実施の形態の一例を示すフローチャートである。
すなわち、図9に示すように、アライメント予測部102aは、ゲノム配列データベース106aに記憶されたゲノム配列情報から、動的計画法に基づくローカルアライメントおよびRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、マイクロRNAの標的となる遺伝子を予測する(ステップSE−1)。ここで、アライメント予測部102aは、当該遺伝子の予測において、文献(Enright, A.J. et al. MicroRNA targets in Drosophila. Genome Biol. 5, R1 (2003))または非特許文献1に記載の方法を用いてもよい。なお、アライメント予測部102aは、ローカルアライメントと熱力学的アライメントに基づく標的遺伝子の予測においては、マイクロRNAの機能のうち転写産物分解に関わるものと翻訳制御に関わるものとを区別しなくともよい。
そして、図9に示すように、制御部102は、入出力制御インターフェース部108を介して入力装置112を制御し、複数の細胞における、マイクロRNAおよび遺伝子の発現パターン情報を、発現パターンデータベース106cに格納する(ステップSE−2)。ここで、発現パターン情報は、定量的PCRや、マイクロアレイ等を用いて取得してもよい。
つづいて、標的サイト数遺伝子抽出部102bは、ローカルアライメントおよび熱力学的アライメントに基づいて、アライメント予測部102aによって予測された遺伝子のうち、マイクロRNAの標的サイトを所定の複数以上(例えば、3箇所以上)有する遺伝子を抽出する(ステップSE−3)。
そして、マイクロRNA−遺伝子相関係数算出部102cは、発現パターンデータベース106cに記憶された発現パターン情報に基づいて、マイクロRNA−遺伝子相関係数を算出し、逆相関遺伝子抽出部102eは、マイクロRNA−遺伝子相関係数が負の所定数以下(例えば、−0.75以下)である遺伝子を抽出する(ステップSE−4)。ここで、制御部102は、その他のマイクロRNAと遺伝子の共起関係データ(例えば、マイクロRNA−遺伝子共起指数等)を、マイクロRNA−遺伝子共起指数ファイル106fに格納してもよい(ステップSE−5)。
そして、積集合選出部102fは、標的サイト数遺伝子抽出部102bの処理により抽出された遺伝子と、逆相関遺伝子抽出部102eの処理により抽出された遺伝子と、の積集合を求め、当該積集合のうち、2つの遺伝子の組み合わせを遺伝子ペアとして選出する(ステップSE−6)。ここで、積集合選出部102fは、更に、マイクロRNA−遺伝子共起指数ファイル106fに記憶されたマイクロRNA−遺伝子共起指数が所定値以上である遺伝子と、の積集合を求めてもよい。
そして、遺伝子間相関係数算出部102dは、発現パターンデータベース106cに記憶された発現パターン情報に基づいて、任意の一方の遺伝子の発現量と他方の遺伝子の発現量との相関係数を遺伝子間相関係数として算出し、遺伝子間相関係数ファイル106eに格納する(ステップSE−7)。ここで、制御部102は、遺伝子間の共起関係データ(例えば、遺伝子間共起指数等)を遺伝子間共起指数ファイル106gに格納してもよい(ステップSE−8)。
そして、尤度検定抽出部102gは、最尤抽出部102hの処理により、遺伝子間相関係数ファイル106eに記憶された遺伝子間相関係数に基づく相関関係を用いて、最尤推定法(Maximum Likelihood Estimate Method)により、下記の数式1に基づいて対数尤度比(LLS)を求める(ステップSE−9)。ここで、最尤抽出部102hは、対数尤度比(LLS)の算出に、ステップSE−8において遺伝子間共起指数ファイル106gに記憶された遺伝子間の共起関係データ(例えば、遺伝子間共起指数等)に基づく共起関係を用いてもよい。
Figure 2008250971
ここで、数式1において、P(L)は全事象において遺伝子ペアがマイクロRNAを共通とする全体確率を表し、~P(L)は全事象において遺伝子ペアがマイクロRNAを共通としない全体確率を表す。また、P(L|E)は、特定の事象(E)において遺伝子ペアがマイクロRNAを共通とする条件付確率を表し、~P(L|E)は、特定の事象(E)において遺伝子ペアがマイクロRNAを共通としない条件付確率を表す。ここで、本実施の形態において、一例として、上記数式1において、P(L)、~P(L)、P(L|E)、および、~P(L|E)は、以下の数式2のように表される。すなわち、数式1において、P(L)は、条件(L:積集合のうちマイクロRNAを共通とすること)を満たす遺伝子ペアの確率であり、~P(L)は、条件(L)を満たさない遺伝子ペアの確率である。また、P(L|E)は、特定の事象(E)における、条件(L)を満たす遺伝子ペアの確率であり、~P(L|E)は、特定の事象における、条件(L)を満たさない遺伝子ペアの確率である。ここで、特定の事象(E)は、例えば、遺伝子間相関係数に基づく相関関係や、遺伝子間共起指数に基づく共起関係等である。
Figure 2008250971
そして、尤度検定抽出部102gは、最尤抽出部102hの処理により、積集合選出部102fの処理により選出された遺伝子ペアのうち、対数尤度比(LLS)が正の所定数以上である遺伝子ペアを抽出する。
そして、ネットワーク構築部102iは、尤度検定抽出部102gの処理により抽出された遺伝子ペアと、当該遺伝子ペアに共通するマイクロRNAとを関連付けて格納し、マイクロRNAと遺伝子との機能的ネットワークを構築(create network)する(ステップSE−10)。
以上が本実施の形態3の説明である。上述のように、最尤推定法において、尤度は、積集合のうちマイクロRNAを共通とする遺伝子ペアと、相関関係または共起関係と、の間には関連性があるという仮説の尤もらしさを表す。すなわち、対数尤度比(LLS)が0以上であることは、その仮説に信頼性(confident)があるということを表すので、比較的、対数尤度比(LLS)が高い遺伝子ペアを抽出することにより、大量の擬陽性の予測結果を排除して十分に絞り込んだ標的遺伝子の予測結果を得ることができる。また、発現パターン情報を予測に用いることにより、マイクロRNAの機能のうち転写産物分解機能に関する標的遺伝子を予測することができる。また、抽出された遺伝子ペアとマイクロRNAの組み合わせにより、マイクロRNAによって共通して統合的に制御を受ける標的遺伝子群を、ネットワーク(クラスター)として抽出することができる。なお、本実施の形態3の処理の順序は、上記に限られず、ステップSE−1〜5は、ステップSE−6以前に完了していればよく、ステップSE−7〜8は、ステップSE−9以前に完了していればよい。
以上で、本実施の形態1〜3におけるマイクロRNA標的遺伝子予測処理の説明を終える。
次に、本実施の形態における本マイクロRNA標的遺伝子予測装置100の実施例について、以下に図10〜図18を参照して詳細に説明する。
はじめに、本実施例の目的を述べる。マイクロRNAは、3´UTRの配列相補性に基づいてmRNAと結合することにより、その遺伝子の発現を調節することが知られている。その遺伝子調節機能は腫瘍形成、発生、ウイルス感染などに関与することが示唆されている。しかし、多くのマイクロRNAは未だその標的となる遺伝子が明らかにされておらず、現存するマイクロRNA標的遺伝子予測プログラムは短い配列の相補性に基づいたものであり、その確度を上げることは困難である。そこで、本実施例では、細胞ごとの遺伝子およびマイクロRNAの発現プロファイル(発現パターン)と、既存のマイクロRNA標的遺伝子予測プログラムとを組み合わせて新規方法論を確立し、マイクロRNAによる制御遺伝子ネットワークの構築(create network)を行う。
つぎに、本実施例の原理について説明する。ここで、図10は、本実施の形態における本実施例の原理を示す概念図である。マイクロRNAは遺伝子発現を抑制することから、マイクロRNAと標的遺伝子の発現プロファイルは逆相関にある。また、本願発明者は、種々の解析結果から発現プロファイルの相関(例えば、遺伝子間相関係数)が高い遺伝子ペアは統計的に共通のマイクロRNAの標的遺伝子候補となる傾向があることを発見した。あわせて、本願発明者は、遺伝子の共発現性と標的サイト数との相関性についても見出した。従って、共通するマイクロRNAの標的サイトを複数有し発現プロファイルの相関が高い遺伝子ペアは、共通のマイクロRNAの標的遺伝子候補であり、更にそのマイクロRNAと遺伝子ペアのプロファイル(発現パターン)が逆相関の関係を示すとき、その遺伝子ペアはマイクロRNAの標的となる可能性が高いものと考えられる。本実施例においては、当該仮説を対数尤度比(LLS)によって評価する。以上が、本実施例の基本的原理であり、図10に示すように、遺伝子-遺伝子間の相関とマイクロRNA-遺伝子間の逆相関及び標的サイト数情報を含む標的遺伝子予測によって、統合化スコア(Unified score)として対数尤度比(LLS)を求め、ネットワーク化を行う。ここで、図11は、本実施の形態における本実施例の一例を示すフローチャートである。なお、本実施例においては、ステップSE−5およびステップSE−8における処理は行わない。
図11に示すように、本実施例においては、マイクロRNA153種、および、遺伝子13523種を対象とする。まず、図11に示すように、本マイクロRNA標的遺伝子予測装置100のアライメント予測部102aは、動的計画法に基づくローカルアライメントおよびRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、ゲノム配列データベース106aに記憶されたゲノム配列情報から、マイクロRNAの標的となる遺伝子を予測する(ステップSE−1)。ここで、アライメント予測部102aの処理は、文献(Enright, A.J. et al. MicroRNA targets in Drosophila. Genome Biol. 5, R1 (2003))または非特許文献1に記載のプログラム(miRanda)に基づき実行される。これにより、マイクロRNAのmiR−221については、7919種の標的遺伝子候補が予測され、マイクロRNAのmiR−373については、8280種の標的遺伝子候補が予測された。なお、本実施例において、本マイクロRNA標的遺伝子予測装置は、進化的保存性に基づく標的遺伝子予測法は用いていない。
そして、図11に示すように、制御部102は、16種の細胞における、マイクロRNAおよび遺伝子の発現パターン情報を、発現パターンデータベース106cに格納する(ステップSE−2)。ここで、遺伝子とマイクロRNAの発現パターン(プロファイル)の測定には、各々DNAチップ、定量的PCR法を用いた。
そして、本マイクロRNA標的遺伝子予測装置は、ローカルアライメントおよび熱力学的アライメントに基づいて、予測された遺伝子のうち、マイクロRNAの標的サイトを所定の複数以上(本実施例において、3箇所以上)有する遺伝子を抽出する(ステップSE−3)。ここで、当該標的サイト数の閾値(所定の複数)について、図12を参照して説明する。図12は、標的サイト数において、横軸に遺伝子間相関係数、縦軸に対数尤度比(LLS)をプロットしたグラフである。
図12に示すように、本実施例では、標的サイト数が2以上の場合(図12の菱形で表す)、遺伝子間相関係数の全範囲に対し、対数尤度比が低いが、標的サイト数が3以上の場合(図12の四角で表す)、対数尤度比が約0以上である遺伝子間相関係数の範囲が広く、信頼性(confident)がある。さらに、標的サイト数が4以上の場合(図12の三角で表す)、遺伝子間相関係数のほぼ全ての範囲において対数尤度比が0以上であり、特に、正の遺伝子相関係数において高い信頼性(confident)があることが分かる。よって、標的サイト数が多いほど対数尤度比が高まり、仮説の信頼性(confident)が増すので、本実施例の本マイクロRNA標的遺伝子予測装置100においては、標的サイト数遺伝子抽出部102bの処理による標的サイト数の閾値を3以上に設定している。これにより、図11に示すように、マイクロRNAのmiR−221については、2206種の標的遺伝子候補に絞り込まれ、マイクロRNAのmiR−373については、2510種の標的遺伝子候補に絞り込まれた。
そして、マイクロRNA−遺伝子相関係数算出部102cは、発現パターンデータベース106cに記憶された発現パターン情報に基づいて、マイクロRNAの発現量と遺伝子の発現量との相関係数(マイクロRNA−遺伝子相関係数)を算出し、マイクロRNA−遺伝子相関係数が負の所定数以下(例えば、−0.75以下)である遺伝子を抽出する(ステップSE−4)。ここで、相関係数の算出方法について、説明を行う。
本実施例では偏差の正規分布が見られたのでピアソンの積率相関係数を用いる。すなわち、ピアソンの積率相関係数は、以下の数式で求められる。
Figure 2008250971
ここで、遺伝子−マイクロRNA相関係数を求める場合、遺伝子の発現量をx={xi}、マイクロRNAの発現量をy={yi}とおく。また、遺伝子間相関係数を求める場合は、一方の遺伝子の発現量をx={xi}、他方の遺伝子の発現量をy={yi}とおく。本実施例においては、16種類の細胞を用いたので、iの最大値は16(i=16)とする。xバー、yバーは、それぞれデータx={xi}、y={yi}の相加平均である。ここで、マイクロRNA−遺伝子相関係数算出部102cまたは遺伝子間相関係数算出部102dによる相関係数の算出は、偏差の正規分布という仮定を置かないノンパラメトリックな方法として、スピアマンの順位相関係数やケンドール順位相関係数を用いてもよい。
また、ここで、逆相関遺伝子抽出部102eの処理によるマイクロRNA−遺伝子相関係数の閾値(負の所定数)について、図13を参照して説明する。図13は、マイクロRNA−遺伝子相関係数の各範囲において、横軸に遺伝子間相関係数、縦軸に対数尤度比(LLS)をプロットしたグラフである。ここで、図13のプロットは、それぞれ、マイクロRNA−遺伝子相関係数の範囲が、−1〜−0.75の遺伝子(菱形で示す)、−0.61〜−0.6の遺伝子(四角で示す)、−0.402〜−0.4の遺伝子(三角で示す)、−0.201〜−0.2の遺伝子(×印で示す)、−0.001〜−0.0001の遺伝子(*印で示す)を表している。なお、各相関係数の範囲は、それぞれに含まれる遺伝子数が、およそ同じくらいになるように設定している。
図13に示すように、マイクロRNA−遺伝子相関係数が低ければ低いほど、遺伝子間相関係数に対して、高い対数尤度比(LLS)が得られ、信頼性(confident)が増すことが分かる。ここで、マイクロRNA−遺伝子相関係数の閾値の目安は、相関係数の有意性検定により行ってもよい。すなわち、16細胞の発現プロファイル(発現パターン)情報に基づいて相関係数を求めた場合、マイクロRNA−遺伝子相関係数が−0.75以下の場合、P値=0.0008であり、0.1%の有意性が保証される。例えば、相関係数が−0.5以下の場合、P値=0.049となり、5%有意となるため、マイクロRNA−遺伝子相関係数の閾値を−0.5以下に設定すれば、5%有意の相関が期待できる。
本実施例においては、マイクロRNA−遺伝子相関係数の閾値を−0.75と設定したので、ステップSE−4における逆相関遺伝子抽出部102eの処理により、マイクロRNAのmiR−221については、61種の標的遺伝子候補が予測され、マイクロRNAのmiR−373については、41種の標的遺伝子候補が予測された。
そして、積集合選出部102fは、標的サイト数遺伝子抽出部102bの処理により標的サイト数に基づいて抽出された遺伝子と、逆相関遺伝子抽出部102eの処理により抽出された遺伝子と、の積集合を求め、求めた積集合のうち、2つの遺伝子の組み合わせを遺伝子ペアとして選出する(ステップSE−6)。
そして、遺伝子間相関係数算出部102dは、発現パターンデータベース106cに記憶された発現パターン情報に基づいて、任意の一方の遺伝子の発現量と他方の遺伝子の発現量との相関係数を遺伝子間相関係数として算出する(ステップSE−7)。
そして、尤度検定抽出部102gは、最尤抽出部102hの処理により、遺伝子間相関係数ファイル106eに記憶された遺伝子間相関係数に基づく相関関係を用いて、最尤推定法(Maximum Likelihood Estimate Method)により、以下の数式1に基づいて対数尤度比(LLS)を求める(ステップSE−9)。
Figure 2008250971
ここで、相関関係を示す遺伝子間相関係数の範囲(E)と対数尤度比(LLS)について図14を参照して説明する。図14は、横軸に遺伝子間相関係数、縦軸に対数尤度比(LLS)をプロットした図である。
図14に示すように、本実施例において、最尤抽出部102hは、遺伝子間相関係数の範囲(E)を、所定の遺伝子ペア数を有する遺伝子間相関係数の範囲として設定し、設定した範囲において、対数尤度比(LLS)を算出する。
そして、最尤抽出部102hは、積集合選出部102fの処理により選出された遺伝子ペアのうち、対数尤度比(LLS)が正の所定数以上である遺伝子ペアを抽出する。ここで、対数尤度比(LLS)の閾値(正の所定数)について、図15を参照して説明する。図15は、横軸に遺伝子間相関係数、縦軸に対数尤度比(LLS)をプロットした図である。
図15に示すように、本実施例において、最尤抽出部102hは、正の遺伝子間相関係数が大きい範囲では、対数尤度比(LLS)が十分高く、信頼性(confident)のある結果が得られることが期待されるので、対数尤度比(LLS)の閾値を3と設定する。これにより、マイクロRNAのmiR−221については、9種の標的遺伝子にまで絞り込まれ、マイクロRNAのmiR−373については、15種の標的遺伝子にまで絞り込まれた。
そして、ネットワーク構築部102iは、最尤抽出部102hの処理により抽出された遺伝子ペアと、共通するマイクロRNAとを関連付けて標的遺伝子候補ファイル106bに格納する(ステップSE−10)。すなわち、マイクロRNAと複数遺伝子間の機能的ネットワークを構築(create network)することができる。ここで、図16は、ネットワーク構築部102iの処理により構築された機能的ネットワークの一例を示す図である。ここで、閾値は、Z−score>0.8、cc(マイクロRNA−遺伝子相関係数)<−0.75、LLS>3である。
図16に示すように、ネットワーク構築部102iは、クラスター化されたネットワークを構築(create network)し、構築したネットワークが出力装置114に表示されるよう入出制御インターフェース部108を制御する。ここで、図16の右図の各円は、共通するマイクロRNA(miR−302b、miR−371、miR−372、miR−373)により制御される範囲を示す。また、マイクロRNA名以外は、遺伝子記号(遺伝子名)である。図16に示すように、本マイクロRNA標的遺伝子予測装置100は、ネットワーク構築部102iの処理により、miR−373の標的遺伝子として、PHPT1、PRMT2、GUK1,SDCCAG3、CFL1、LEMD2を予測したことがわかる。ここで、図17は、本実施例で用いた16種類の細胞における、miR−373と遺伝子の発現状態を示す図である。
図17に示すように、miR−373が高発現している細胞株Caco.2においては、一部の遺伝子に発現の低下が観測され、miR−373による遺伝子の転写産物分解制御との因果関係が示唆される。
[予測結果の検証]
次に、本実施例における本マイクロRNA標的遺伝子予測装置100により予測されたマイクロRNAの標的遺伝子が、実際にマイクロRNAによりmRNAレベルで発現を制御しているかを検証するため、ヒト肝癌由来細胞株であるHepG2細胞に、上記マイクロRNA、has−miR−373を導入し、予測された標的遺伝子の発現変動を定量的PCRを用いて解析した(図18)。ここで、図18は、HepG2細胞にhas−miR−373を導入した結果を示す図である。
図18の各グラフにおいて、左のバーはコントロールを導入した場合の発現量、右のバーはhas−miR−373を導入した場合の発現量を表し、縦軸は、コントロールを導入した場合の発現を1とした場合の比率を表す。ここで、P値は、mean±S.E.(n=6)である。図18に示すように、解析を行った6遺伝子のうち、2遺伝子(PHPT1,PRMT2)においてhas−miR−373の導入により有意に発現が低下し、さらに2遺伝子(GUK1,SDCCAG3)において発現低下傾向が確認された。残りの2遺伝子(CFL1,LEMD2)においては発現の低下は検出されなかった。次に、本マイクロRNA標的遺伝子予測装置100の有用性を検証するため、has−miR−373と発現において逆相関の関係にあり(r<−0.75)、かつ、has−miR−373の標的サイトを有していない2遺伝子(AP2M1,HNRPK)においても同様の解析を行ったところ、これらの遺伝子においてはいずれもhas−miR−373の導入による発現の減弱は検出されなかった。以上のことから、本マイクロRNA標的遺伝子予測装置が実際に高精度にマイクロRNAの標的遺伝子を予測していることが示された。なお、以下の[細胞培養]、[RNAの導入]、[RNAの抽出]、[1st strand cDNA合成]、[定量的 PCRによる発現解析]、および、[プライマー・リスト]の項において、検証実験に用いた試料および条件を示す。
[細胞培養]
ヒト肝癌由来細胞株HepG2細胞は、非動化処理(56℃,30min)された10%牛胎児血清(FBS)を含むDulbecco's Modified Eagle's Medium(DMEM)培地(Sigma−Aldrich(会社名),Saint Louis, MO)を用いて5%CO2、湿度100%の条件下37℃の培養器内で培養する。
[RNAの導入]
非動化処理を行った10%FBSを含むDMEM培地中、コラーゲンコートされた3.5cmの培養ディッシュ(旭テクノグラス(会社名),Tokyo, Japan)にHepG2細胞(1.0x105cells)を播種し、5%CO2、湿度100%の条件下37℃の培養器内で培養する。24時間後、CodeBreaker siRNA Transfection Reagent(商品名)(Promega(会社名),Madison,WI)を用い、Pre−miR miRNA Precursor Molecule−hsa−miR−373(商品名)(Applied Biosystems(会社名),Foster City,CA,USA)300pmolを定法に従いHepG2細胞に導入する。また、実験のネガティブコントロールとして、Pre−miR miRNA Precursor Molecules−Negative Control #1(商品名)(Applied Biosystems(会社名))をHepG2細胞に導入する。
[RNAの抽出]
RNAを導入した細胞を48時間後に回収し、ISOGEN(日本ジーン(会社名),Tokyo,Japan)を用いて定法に従いtotal RNAを抽出する。RNAの純度はAgilent 2100 Bioanalyzer(商品名)とRNA 6000 Nano LabChip(商品名)(Agilent Technologies(会社名),Palo Alto,CA)を用いて確認する。
[1st strand cDNA合成]
total RNA,2μgにrandom primer(商品名)(タカラバイオ株式会社(会社名),Kyoto,Japan),1nmolを加え、70℃で10分間インキュベートした後に氷冷する。5x1st strand buffer(商品名)(invitrogen(会社名),SanDiego,CA),6μl、DTT(invitrogen(会社名)),300nmol、dNTPs(タカラバイオ株式会社(会社名)),1.25nmolとSuperscriptII reverse transcriptase(商品名)(invitrogen(会社名)),200unitsを加えて25℃で10分間インキュベートし、続いて42℃で90分間反応させ、その後70℃で15分間インキュベートする。
[定量的 PCRによる発現解析]
各遺伝子のプライマーは全てイントロンを挟み込み、かつ、特異的PCR増幅産物が約200−400bpになるように設計する(以下の[プライマー・リスト]の項参照)。定量的 PCRの検量線にはHepG2細胞のcDNAを段階希釈したものを用いた。定法に従い、ABsolute QPCRSYBR Green ROX Mix(商品名)(ABgene(会社名),Epsom,UK)とDNA Engine Opticon2 System(商品名)(Bio−Rad Laboratories(会社名),Hemel Hempstead,UK)を用いて定量的 PCRを行う。増幅されたPCR産物は、Tm値と電気泳動によるサイズの同定により、その特異性を確認する。各遺伝子の発現量についてはGAPDH(glyceraldehyde-3-phosphate dehydrogenase)を用いてサンプル間の補正を行う。有意差検定はStudent t検定を用いて行う。
[プライマー・リスト]
PCRプライマーには、以下の表1に示す配列のオリゴヌクレオチドを用いる。なお、配列表において、それぞれ対応する配列を示す。すなわち、AP2M1センス配列(配列番号1)、AP2M1アンチセンス配列(配列番号2)、CFL1センス配列(配列番号3)、CFL1アンチセンス配列(配列番号4)、GAPDHセンス配列(配列番号5)、GAPDHアンチセンス配列(配列番号6)、GUK1センス配列(配列番号7)、GUK1アンチセンス配列(配列番号8)、HNRPKセンス配列(配列番号9)、HNRPKアンチセンス配列(配列番号10)、LEMD2センス配列(配列番号11)、LEMD2アンチセンス配列(配列番号12)、PHPT1センス配列(配列番号13)、PHPT1アンチセンス配列(配列番号14)、PRMT2センス配列(配列番号15)、PRMT2アンチセンス配列(配列番号16)、SDCCAG3センス配列(配列番号17)、SDCCAG3アンチセンス配列(配列番号18)である。
[表1](プライマー・リスト)
遺伝子記号 センス配列 アンチセンス配列 PCR産物(bp)
AP2M1 5' AGCAAGAGCGGGAAGCAATC 3' 5' GAGCCAGCAGTGAGGGTTTA 3' 253
CFL1 5' GGCTGTCTCTGATGGTGTC 3' 5' GCTTCTTCTTGATGGCGTC 3' 368
GAPDH 5' TCAAGATCATCAGCAATGCC 3' 5' TTGAAGTCAGAGGAGACCAC 3' 440
GUK1 5' AGCACAGCGGCATCTTTGG 3' 5' TCTCCTCGGTTTCAGTGTTG 3' 351
HNRPK 5' AGAATGGCAGATGGCTTATG 3' 5' CTGTAATGGTAATGATCCGA 3' 251
LEMD2 5' TAGCCAATGTGACCAGCAG 3' 5' CTTCTAACTTTCGCCACCG 3' 291
PHPT1 5' GACCTCGCTCTCATTCCTG 3' 5' TCAGTAGCCGTCGTTAGCC 3' 366
PRMT2 5' GCCACGAACAACTAAATACC 3' 5' CCCCATCCACTCAGACACC 3' 286
SDCCAG3 5' CTGAAGACCAAGAACCTCG 3' 5' CCTCATCCTCCTCCTCATC 3' 199
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
特に、本実施の形態においては、上記数式1を用いた検定法以外に、他の尤度検定方法を用いてもよい。例えば、対数尤度比(LLS)の指標を用いる他に、相関係数や、相互情報量や、結合エントロピーなど共起性を示す指標を用いてもよい。
また、マイクロRNA標的遺伝子予測装置100は、記憶部106に記憶されたデータベースおよびプログラムを用いて処理を行うよう説明したが、これに限られず、マイクロRNA標的遺伝子予測装置100は、外部システム200の記憶装置に格納された発現パターン情報等のデータベースやマイクロRNA標的遺伝子予測プログラムを参照して、処理を行ってもよい。
また、マイクロRNA標的遺伝子予測装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、マイクロRNA標的遺伝子予測装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データやパラメータを含む情報、データベース構成については、特記する場合を除いて任意に変更することができる。
また、マイクロRNA標的遺伝子予測装置100の各装置が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。尚、プログラムは、後述する記録媒体に記録されており、必要に応じてマイクロRNA標的遺伝子予測装置100に機械的に読み取られる。すなわち、ROMまたはHDなどの記憶部106などは、OS(Operating System)として協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
また、このコンピュータプログラムは、マイクロRNA標的遺伝子予測装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」、あるいは、LAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
記憶装置に格納される各種のデータベース等は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやデータベースやウェブページ用ファイル等を格納する。
また、マイクロRNA標的遺伝子予測装置は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。
以上詳述に説明したように、本発明によれば、大量の擬陽性の予測結果を排除して十分に絞り込んだ標的遺伝子の予測結果を得ることができ、マイクロRNAの転写産物分解機能に関する標的遺伝子を予測することができる、マイクロRNA標的遺伝子予測装置、マイクロRNA標的遺伝子予測方法、および、プログラムを提供することができる。
また、マイクロRNAと複数遺伝子間の機能的ネットワークの予測を行うことができる、マイクロRNA標的遺伝子予測装置を提供することができる。
マイクロRNAの機能の一例を示す図である。 本発明の基本原理を示す概念図である。 本発明の処理の概要を示すフローチャートである。 本発明の本実施の形態が適用される本マイクロRNA標的遺伝子予測装置の構成の一例を示すブロック図である。 本マイクロRNA標的遺伝子予測装置100のマイクロRNA標的遺伝子予測処理の一例を示すフローチャートである。 積集合の求め方の一例を示す図である。 相関係数算出処理の一例を示すフローチャートである。 共起関係によるマイクロRNA標的遺伝子予測処理の一例を示すフローチャートである。 本発明の本実施の形態の一例を示すフローチャートである。 本実施の形態における本実施例の原理を示す概念図である。 本実施の形態における本実施例の一例を示すフローチャートである。 標的サイト数において、横軸に遺伝子間相関係数、縦軸に対数尤度比(LLS)をプロットしたグラフである。 マイクロRNA−遺伝子相関係数の範囲において、横軸に遺伝子間相関係数、縦軸に対数尤度比(LLS)をプロットしたグラフである。 横軸に遺伝子間相関係数、縦軸に対数尤度比(LLS)をプロットした図である。 横軸に遺伝子間相関係数、縦軸に対数尤度比(LLS)をプロットした図である。 ネットワーク構築部102iの処理により構築された機能的ネットワークの一例を示す図である。 本実施例で用いた16種類の細胞における、miR−373と遺伝子の発現状態を示す図である。 HepG2細胞にhas−miR−373を導入した結果を示す図である。
符号の説明
100 マイクロRNA標的遺伝子予測装置
102 制御部
102a アライメント予測部
102b 標的サイト数遺伝子抽出部
102c マイクロRNA−遺伝子相関係数算出部
102d 遺伝子間相関係数算出部
102e 逆相関遺伝子抽出部
102f 積集合選出部
102g 尤度検定抽出部
102h 最尤抽出部
102i ネットワーク構築部
104 通信制御インターフェース部
106 記憶部
106a ゲノム配列データベース
106b 標的遺伝子候補ファイル
106c 発現パターンデータベース
106d マイクロRNA−遺伝子相関係数ファイル
106e 遺伝子間相関係数ファイル
106f マイクロRNA−遺伝子共起指数ファイル
106g 遺伝子間共起指数ファイル
108 入出力制御インターフェース部
112 入力装置
114 出力装置
200 外部システム
300 ネットワーク

Claims (21)

  1. 動的計画法に基づくローカルアライメントおよび/またはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する、制御部と記憶部を少なくとも備えたマイクロRNA標的遺伝子予測装置において、
    上記記憶部は、
    任意のマイクロRNAの発現量と任意の遺伝子の発現量との相関係数をマイクロRNA−遺伝子相関係数として記憶するマイクロRNA−遺伝子相関係数記憶手段、
    を備え、
    上記制御部は、
    上記ローカルアライメントおよび/または上記熱力学的アライメントに基づいて、上記予測された上記遺伝子のうち、上記マイクロRNAの標的サイトを所定の複数以上有する上記遺伝子を抽出する標的サイト数遺伝子抽出手段と、
    上記マイクロRNA−遺伝子相関係数記憶手段に記憶された上記マイクロRNA−遺伝子相関係数が負の所定数以下である上記遺伝子を抽出する逆相関遺伝子抽出手段と、
    上記標的サイト数遺伝子抽出手段によって抽出された上記遺伝子と、上記逆相関遺伝子抽出手段によって抽出された上記遺伝子と、の積集合を求め、上記積集合のうち、2つの上記遺伝子の組み合わせを遺伝子ペアとして選出する積集合選出手段と、
    上記積集合選出手段により選出された上記遺伝子ペアについて、上記遺伝子ペアの相関関係または共起関係と、当該遺伝子ペアが上記マイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、上記尤度に基づいて上記遺伝子ペアを抽出する尤度検定抽出手段と、
    を備えたことを特徴とするマイクロRNA標的遺伝子予測装置。
  2. 請求項1に記載のマイクロRNA標的遺伝子予測装置において、
    上記尤度検定抽出手段は、
    最尤推定法により、下記の数式1に基づいて上記尤度の対数尤度比(LLS)を求め、上記対数尤度比が正の所定数以上である上記遺伝子ペアを抽出する最尤抽出手段、
    Figure 2008250971
    (上記数式1において、P(L)は全事象において上記遺伝子ペアが上記マイクロRNAを共通とする全体確率を表し、~P(L)は全事象において上記遺伝子ペアが上記マイクロRNAを共通としない全体確率を表す。また、P(L|E)は、特定の事象(E)において上記遺伝子ペアが上記マイクロRNAを共通とする条件付確率を表し、~P(L|E)は、特定の事象(E)において上記遺伝子ペアが上記マイクロRNAを共通としない条件付確率を表す。)
    を更に備えたことを特徴とするマイクロRNA標的遺伝子予測装置。
  3. 請求項1または2に記載のマイクロRNA標的遺伝子予測装置において、
    上記記憶部は、
    任意の一方の遺伝子の発現量と他方の遺伝子の発現量との上記相関係数を遺伝子間相関係数として記憶する遺伝子間相関係数記憶手段、
    を更に備え、
    上記尤度検定抽出手段は、
    上記遺伝子間相関係数記憶手段に記憶された上記遺伝子間相関係数に基づく上記相関関係を用いて、上記尤度を検定すること、
    を特徴とするマイクロRNA標的遺伝子予測装置。
  4. 請求項1乃至3のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、
    上記記憶部は、
    複数の細胞における、遺伝子の発現パターン情報を記憶する発現パターン記憶手段、
    を更に備え、
    上記制御部は、
    上記発現パターン記憶手段に記憶された上記発現パターン情報に基づいて、上記遺伝子間相関係数を算出し上記遺伝子間相関係数記憶手段に格納する遺伝子間相関係数算出手段、
    を更に備えたことを特徴とするマイクロRNA標的遺伝子予測装置。
  5. 請求項1乃至4のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、
    上記発現パターン記憶手段は、
    更に、マイクロRNAの発現パターン情報を記憶し、
    上記制御部は、
    上記発現パターン記憶手段に記憶された上記発現パターン情報に基づいて、上記マイクロRNA−遺伝子相関係数を算出し上記マイクロRNA−遺伝子相関係数記憶手段に格納するマイクロRNA−遺伝子相関係数算出手段、
    を更に備えたことを特徴とするマイクロRNA標的遺伝子予測装置。
  6. 請求項4または5に記載のマイクロRNA標的遺伝子予測装置において、
    上記マイクロRNA−遺伝子相関係数算出手段または上記遺伝子間相関係数算出手段は、
    上記相関係数として、ピアソンの積率相関係数、スピアマンの順位相関係数、または、ケンドール順位相関係数を算出すること、
    を特徴とするマイクロRNA標的遺伝子予測装置。
  7. 請求項1乃至6のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、
    上記尤度検定抽出手段は、
    上記尤度の検定に、相互情報量または結合エントロピーを用いること、
    を特徴とするマイクロRNA標的遺伝子予測装置。
  8. 請求項1乃至7のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、
    上記記憶部は、
    マイクロRNAと遺伝子との上記共起関係を示すマイクロRNA−遺伝子共起指数を記憶するマイクロRNA−遺伝子共起指数記憶手段、
    を更に備え、
    上記積集合選出手段は、
    上記積集合に含まれる上記遺伝子と、更に、上記マイクロRNA−遺伝子共起関係記憶手段に記憶された上記マイクロRNA−遺伝子共起指数が所定値以上である上記遺伝子と、の上記積集合を求めること、
    を特徴とするマイクロRNA標的遺伝子予測装置。
  9. 請求項1乃至8のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、
    上記記憶部は、
    任意の一方の遺伝子と他方の遺伝子との上記共起関係を示す遺伝子間共起指数を記憶する遺伝子間共起指数記憶手段、
    を更に備え、
    上記尤度検定抽出手段は、
    上記遺伝子間共起指数記憶手段に記憶された上記遺伝子間共起指数に基づいて、上記対数尤度比を求めること、
    を特徴とするマイクロRNA標的遺伝子予測装置。
  10. 請求項1乃至9のいずれか一つに記載のマイクロRNA標的遺伝子予測装置において、
    上記制御部は、
    上記尤度検定抽出手段によって抽出された上記遺伝子ペアと、上記共通する上記マイクロRNAとに基づいて、上記マイクロRNAと上記遺伝子との機能的ネットワークを構築するネットワーク構築手段、
    を更に備えたことを特徴とするマイクロRNA標的遺伝子予測装置。
  11. 動的計画法に基づくローカルアライメントおよび/またはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する、制御部と記憶部を少なくとも備えたマイクロRNA標的遺伝子予測装置において実行されるマイクロRNA標的遺伝子予測方法であって、
    上記記憶部は、
    任意のマイクロRNAの発現量と任意の遺伝子の発現量との相関係数をマイクロRNA−遺伝子相関係数として記憶するマイクロRNA−遺伝子相関係数記憶手段、
    を備えており、
    上記制御部において実行される、
    上記ローカルアライメントおよび/または上記熱力学的アライメントに基づいて、上記予測された上記遺伝子のうち、上記マイクロRNAの標的サイトを所定の複数以上有する上記遺伝子を抽出する標的サイト数遺伝子抽出ステップと、
    上記マイクロRNA−遺伝子相関係数記憶手段に記憶された上記マイクロRNA−遺伝子相関係数が負の所定数以下である上記遺伝子を抽出する逆相関遺伝子抽出ステップと、
    上記標的サイト数遺伝子抽出ステップにおいて抽出された上記遺伝子と、上記逆相関遺伝子抽出ステップにおいて抽出された上記遺伝子と、の積集合を求め、上記積集合のうち、2つの上記遺伝子の組み合わせを遺伝子ペアとして選出する積集合選出ステップと、
    上記積集合選出ステップにおいて選出された上記遺伝子ペアについて、上記遺伝子ペアの相関関係または共起関係と、当該遺伝子ペアが上記マイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、上記尤度に基づいて上記遺伝子ペアを抽出する尤度検定抽出ステップと、
    を含むことを特徴とするマイクロRNA標的遺伝子予測方法。
  12. 請求項11に記載のマイクロRNA標的遺伝子予測方法において、
    上記尤度検定抽出ステップは、
    最尤推定法により、下記の数式1に基づいて上記尤度の対数尤度比(LLS)を求め、上記対数尤度比が正の所定数以上である上記遺伝子ペアを抽出する最尤抽出ステップ、
    Figure 2008250971
    (上記数式1において、P(L)は全事象において上記遺伝子ペアが上記マイクロRNAを共通とする全体確率を表し、~P(L)は全事象において上記遺伝子ペアが上記マイクロRNAを共通としない全体確率を表す。また、P(L|E)は、特定の事象(E)において上記遺伝子ペアが上記マイクロRNAを共通とする条件付確率を表し、~P(L|E)は、特定の事象(E)において上記遺伝子ペアが上記マイクロRNAを共通としない条件付確率を表す。)
    を更に含むことを特徴とするマイクロRNA標的遺伝子予測方法。
  13. 請求項11または12に記載のマイクロRNA標的遺伝子予測方法において、
    上記記憶部は、
    任意の一方の遺伝子の発現量と他方の遺伝子の発現量との上記相関係数を遺伝子間相関係数として記憶する遺伝子間相関係数記憶手段、
    を更に備えており、
    上記尤度検定抽出ステップは、
    上記遺伝子間相関係数記憶手段に記憶された上記遺伝子間相関係数に基づく上記相関関係を用いて、上記尤度を検定すること、
    を特徴とするマイクロRNA標的遺伝子予測方法。
  14. 請求項11乃至13のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、
    上記記憶部は、
    複数の細胞における、遺伝子の発現パターン情報を記憶する発現パターン記憶手段、
    を更に備えており、
    上記制御部において実行される、
    上記発現パターン記憶手段に記憶された上記発現パターン情報に基づいて、上記遺伝子間相関係数を算出し上記遺伝子間相関係数記憶手段に格納する遺伝子間相関係数算出ステップ、
    を更に含むことを特徴とするマイクロRNA標的遺伝子予測方法。
  15. 請求項11乃至14のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、
    上記発現パターン記憶手段は、
    更に、マイクロRNAの発現パターン情報を記憶し、
    上記制御部において実行される、
    上記発現パターン記憶手段に記憶された上記発現パターン情報に基づいて、上記マイクロRNA−遺伝子相関係数を算出し上記マイクロRNA−遺伝子相関係数記憶手段に格納するマイクロRNA−遺伝子相関係数算出ステップ、
    を更に含むことを特徴とするマイクロRNA標的遺伝子予測方法。
  16. 請求項14または15に記載のマイクロRNA標的遺伝子予測方法において、
    上記マイクロRNA−遺伝子相関係数算出ステップまたは上記遺伝子間相関係数算出ステップは、
    上記相関係数として、ピアソンの積率相関係数、スピアマンの順位相関係数、または、ケンドール順位相関係数を算出すること、
    を特徴とするマイクロRNA標的遺伝子予測方法。
  17. 請求項11乃至16のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、
    上記尤度検定抽出ステップは、
    上記尤度の検定に、相互情報量または結合エントロピーを用いること、
    を特徴とするマイクロRNA標的遺伝子予測方法。
  18. 請求項11乃至17のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、
    上記記憶部は、
    マイクロRNAと遺伝子との上記共起関係を示すマイクロRNA−遺伝子共起指数を記憶するマイクロRNA−遺伝子共起指数記憶手段、
    を更に備えており、
    上記積集合選出ステップは、
    上記積集合に含まれる上記遺伝子と、更に、上記マイクロRNA−遺伝子共起関係記憶手段に記憶された上記マイクロRNA−遺伝子共起指数が所定値以上である上記遺伝子と、の上記積集合を求めること、
    を特徴とするマイクロRNA標的遺伝子予測方法。
  19. 請求項11乃至18のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、
    上記記憶部は、
    任意の一方の遺伝子と他方の遺伝子との上記共起関係を示す遺伝子間共起指数を記憶する遺伝子間共起指数記憶手段、
    を更に備えており、
    上記尤度検定抽出ステップは、
    上記遺伝子間共起指数記憶手段に記憶された上記遺伝子間共起指数に基づいて、上記対数尤度比を求めること、
    を特徴とするマイクロRNA標的遺伝子予測方法。
  20. 請求項11乃至19のいずれか一つに記載のマイクロRNA標的遺伝子予測方法において、
    上記制御部において実行される、
    上記尤度検定抽出ステップにおいて抽出された上記遺伝子ペアと、上記共通する上記マイクロRNAとに基づいて、上記マイクロRNAと上記遺伝子との機能的ネットワークを構築するネットワーク構築ステップ、
    を更に含むことを特徴とするマイクロRNA標的遺伝子予測方法。
  21. 動的計画法に基づくローカルアライメントおよび/またはRNA二重鎖の熱力学的安定性を基準にした熱力学的アライメントに基づいて、ゲノム配列からマイクロRNAの標的となる遺伝子を予測する、制御部と記憶部を少なくとも備えたマイクロRNA標的遺伝子予測装置にマイクロRNA標的遺伝子予測方法を実行させるプログラムであって、
    上記記憶部は、
    任意のマイクロRNAの発現量と任意の遺伝子の発現量との相関係数をマイクロRNA−遺伝子相関係数として記憶するマイクロRNA−遺伝子相関係数記憶手段、
    を備えており、
    上記制御部において実行される、
    上記ローカルアライメントおよび/または上記熱力学的アライメントに基づいて、上記予測された上記遺伝子のうち、上記マイクロRNAの標的サイトを所定の複数以上有する上記遺伝子を抽出する標的サイト数遺伝子抽出ステップと、
    上記マイクロRNA−遺伝子相関係数記憶手段に記憶された上記マイクロRNA−遺伝子相関係数が負の所定数以下である上記遺伝子を抽出する逆相関遺伝子抽出ステップと、
    上記標的サイト数遺伝子抽出ステップにおいて抽出された上記遺伝子と、上記逆相関遺伝子抽出ステップにおいて抽出された上記遺伝子と、の積集合を求め、上記積集合のうち、2つの上記遺伝子の組み合わせを遺伝子ペアとして選出する積集合選出ステップと、
    上記積集合選出ステップにおいて選出された上記遺伝子ペアについて、上記遺伝子ペアの相関関係または共起関係と、当該遺伝子ペアがマイクロRNAを共通とすることと、の間には関連があるとの尤度を検定し、上記尤度に基づいて上記遺伝子ペアを抽出する尤度検定抽出ステップと、
    を含むマイクロRNA標的遺伝子予測方法を実行させることを特徴とするプログラム。
JP2007121054A 2007-03-02 2007-05-01 マイクロrna標的遺伝子予測装置、マイクロrna標的遺伝子予測方法、および、プログラム Pending JP2008250971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007121054A JP2008250971A (ja) 2007-03-02 2007-05-01 マイクロrna標的遺伝子予測装置、マイクロrna標的遺伝子予測方法、および、プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007053322 2007-03-02
JP2007121054A JP2008250971A (ja) 2007-03-02 2007-05-01 マイクロrna標的遺伝子予測装置、マイクロrna標的遺伝子予測方法、および、プログラム

Publications (1)

Publication Number Publication Date
JP2008250971A true JP2008250971A (ja) 2008-10-16

Family

ID=39975784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007121054A Pending JP2008250971A (ja) 2007-03-02 2007-05-01 マイクロrna標的遺伝子予測装置、マイクロrna標的遺伝子予測方法、および、プログラム

Country Status (1)

Country Link
JP (1) JP2008250971A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012523645A (ja) * 2009-04-13 2012-10-04 キヤノン ユー.エス. ライフ サイエンシズ, インコーポレイテッド 動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法
WO2015194655A1 (ja) * 2014-06-20 2015-12-23 国立大学法人東北大学 TagSNPの選択方法、選択用コンピュータシステム、及び、選択用ソフトウエア、並びに、当該選択方法を用いて選択されたTagSNPに対応する核酸プローブを搭載したDNAマイクロアレイ
JP2016184185A (ja) * 2014-06-20 2016-10-20 国立大学法人東北大学 TagSNPの選択方法、選択用コンピュータシステム、及び、選択用ソフトウエア、並びに、当該選択方法を用いて選択されたTagSNPに対応する核酸プローブを搭載したDNAマイクロアレイ

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012523645A (ja) * 2009-04-13 2012-10-04 キヤノン ユー.エス. ライフ サイエンシズ, インコーポレイテッド 動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法
WO2015194655A1 (ja) * 2014-06-20 2015-12-23 国立大学法人東北大学 TagSNPの選択方法、選択用コンピュータシステム、及び、選択用ソフトウエア、並びに、当該選択方法を用いて選択されたTagSNPに対応する核酸プローブを搭載したDNAマイクロアレイ
JP2016184185A (ja) * 2014-06-20 2016-10-20 国立大学法人東北大学 TagSNPの選択方法、選択用コンピュータシステム、及び、選択用ソフトウエア、並びに、当該選択方法を用いて選択されたTagSNPに対応する核酸プローブを搭載したDNAマイクロアレイ
JP2019041767A (ja) * 2014-06-20 2019-03-22 国立大学法人東北大学 特定のTagSNPが選択されたDNAマイクロアレイの生産方法、及び、DNAマイクロアレイ

Similar Documents

Publication Publication Date Title
Begik et al. Quantitative profiling of pseudouridylation dynamics in native RNAs with nanopore sequencing
Ji et al. Expanded expression landscape and prioritization of circular RNAs in mammals
Johnson et al. Improved placement of multi-mapping small RNAs
Bentwich et al. Identification of hundreds of conserved and nonconserved human microRNAs
Kelsic et al. RNA structural determinants of optimal codons revealed by MAGE-Seq
Carlile et al. Pseudouridine profiling reveals regulated mRNA pseudouridylation in yeast and human cells
Baras et al. miRge-a multiplexed method of processing small RNA-seq data to determine microRNA entropy
Sabarinathan et al. RNA snp: efficient detection of local RNA secondary structure changes induced by SNP s
Derti et al. A quantitative atlas of polyadenylation in five mammals
Nam et al. Human microRNA prediction through a probabilistic co-learning model of sequence and structure
Tang et al. Deterministic and stochastic allele specific gene expression in single mouse blastomeres
Zhang Large-scale gene expression data analysis: a new challenge to computational biologists
Zhang et al. Expression in aneuploid Drosophila S2 cells
Sumazin et al. An extensive microRNA-mediated network of RNA-RNA interactions regulates established oncogenic pathways in glioblastoma
Risso et al. GC-content normalization for RNA-Seq data
Pradervand et al. Impact of normalization on miRNA microarray expression profiling
Sánchez-Navarro et al. Comparison of gene expression profiling by reverse transcription quantitative PCR between fresh frozen and formalin-fixed, paraffin-embedded breast cancer tissues
Xiang et al. RNAMethPre: a web server for the prediction and query of mRNA m6A sites
Yilmazel et al. Online GESS: prediction of miRNA-like off-target effects in large-scale RNAi screen data by seed region analysis
Faigenbaum-Romm et al. Hierarchy in Hfq chaperon occupancy of small RNA targets plays a major role in their regulation
Qing et al. mRNA enrichment protocols determine the quantification characteristics of external RNA spike-in controls in RNA-Seq studies
Xu et al. Alternative polyadenylation of mammalian transcripts is generally deleterious, not adaptive
Etebari et al. Dengue virus infection alters post-transcriptional modification of microRNAs in the mosquito vector Aedes aegypti
Sabarinathan et al. Transcriptome-wide analysis of UTRs in non-small cell lung cancer reveals cancer-related genes with SNV-induced changes on RNA secondary structure and miRNA target sites
Krasovec et al. Immediate dosage compensation is triggered by the deletion of Y-linked genes in Silene latifolia