JP2005352590A - スプライスバリアント配列のマッピング表示方法 - Google Patents

スプライスバリアント配列のマッピング表示方法 Download PDF

Info

Publication number
JP2005352590A
JP2005352590A JP2004170276A JP2004170276A JP2005352590A JP 2005352590 A JP2005352590 A JP 2005352590A JP 2004170276 A JP2004170276 A JP 2004170276A JP 2004170276 A JP2004170276 A JP 2004170276A JP 2005352590 A JP2005352590 A JP 2005352590A
Authority
JP
Japan
Prior art keywords
sequence
cdna
cdna sequences
variant
expression information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004170276A
Other languages
English (en)
Other versions
JP4557609B2 (ja
Inventor
Koichi Kimura
宏一 木村
Tetsuo Nishikawa
哲夫 西川
Keiichi Nagai
啓一 永井
Tomohiro Yasuda
知弘 安田
Junichi Uechi
潤一 上地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004170276A priority Critical patent/JP4557609B2/ja
Publication of JP2005352590A publication Critical patent/JP2005352590A/ja
Application granted granted Critical
Publication of JP4557609B2 publication Critical patent/JP4557609B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】スプライスバリアントのタイプや転写開始位置と発現情報との関連を理解しやすく表示する。
【解決手段】大量のcDNA配列に対して、ゲノム配列へのマッピング結果に基づきエクソン・イントロン構造を決め、それらの構造を互いに比較して、同じスプライスバリアントに由来すると推定されるタイプにcDNAを分類し、各バリアントタイプごとにそのエクソン・イントロン構造をゲノム配列に沿って表示し、併せて、タイプごとに発現情報の内訳107を表示し、また、転写開始位置ごとに発現情報の内訳111を表示する。
【選択図】 図1

Description

本発明は、遺伝子配列の情報解析に係わり、特に、大量のスプライスバリアント配列のエクソン・イントロン構造と、発現情報、及び、転写開始位置との相関関係の解析にかかわる。
ヒトを含む真核生物では、ゲノム上の一つの遺伝子領域からの同じ一次転写産物が、互いに異なるスプライシング過程を経ることにより、互いに異なる配列をもつ種々のmRNAが生成される。それらはスプライスバリアントとよばれる。それらは、互いに異なる配列を持つ蛋白質を生成し、従って互いに異なる機能を生体内で果たす。また、ゲノム配列上で遺伝子領域の上流側にはプロモータ領域や調節領域があり、それらの領域は、その遺伝子をいつどのような条件下でどの塩基位置から転写を開始するかを制御している。一つの遺伝子は、その転写開始位置を変化させることにより、異なった配列を持つ蛋白質を生成し、異なった機能を生体内で果たすことがある。これらは、発現する組織の違い、または、発達段階の違いなどにより、その遺伝子に多様性を持たせるための一つの大切な生体内の機構となっている。
生体内で発現しているmRNAの配列データは、cDNAライブラリを作成し、シーケンサで塩基配列を読み取ることによって得られる。シーケンサで一度に読むことができる塩基数には限度があるため、通常、mRNA全長に渡る配列を得るためには繰り返しシーケンシングを行い、コストがかかる。そこで、発現する組織の違い、または、発達段階の違いなどにより、どのような遺伝子が発現しているかに関する情報を簡便に得るために、mRNA配列の一部分だけをシーケンサで一度だけ読み取って得られたEST(Expressed Sequence Tags)配列、またはワンパス (single-pass) 配列が大量に知られている。
互いにスプライスバリアントとして異なるmRNA配列どうしは、異なるエクソン・イントロン構造を持ち、また、場合によっては、異なる転写開始位置をもつこともある。mRNA配列のエクソン・イントロン構造や転写開始位置は、配列類似性検索プログラムを用いて、その配列をゲノム配列上にマッピングすることにより求められる(非特許文献4)。エクソン配列はゲノム配列とmRNA配列との相同な区間として、また、イントロン部分はエクソン配列に挟まれたゲノム配列内の区間として、それぞれ、同定される。また、転写開始位置は、mRNA配列の5’末端側がゲノム上にマッピングされた位置として同定される。
mRNA配列のゲノム配列へのマッピングの結果は、通常、ゲノム配列上に沿ってエクソン配列を並べることにより表示される(非特許文献1、2、3)。この表示は、スプライスバリアントとしての違いを理解するために役立っている。また、一般に、イントロン配列はエクソン配列に比べ非常に長いので、より効果的にスプライスバリアントとしての違いを可視化するために、共通のイントロン配列を圧縮した上で、ゲノム配列上に沿ってエクソン配列を並べる表示法もある(特許文献1)。
特開2003−256434号公報 The NCBI Handbook, 2002 Nov. Part3, chapter 20, p20-16http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Books A User's Guide to the Human Genome. Wolfsberg, T.G., Wetterstrand, K.A., Guyer, M.S., Collins, F.S., and Baxevanis, A.D. (2004). Nature Genetics35(supplement):1-79 Yutaka Suzuki, Riu Yamashita, Sumio Sugano, and Kenta Nakai, DBTSS, DataBase of Transcriptional Start Sites: progress report 2004, Nucl. Acids. Res. 2004 32: D78-D81 Florea, L. et al., A Computer Program for Aligning a cDNA Sequence with a Genomic DNA Sequence, Genome Research 8:967-974, 1998.
生体内の多くの組織、病気の有無、発達段階、外的刺激を加えた場合の経過時間、などの違いにより、遺伝子の発現の仕方がどのように変化するかを調べるために、既に数百万本以上の大量のEST配列データが知られている。これらをゲノム上にマッピングすると、ゲノム上の特定の箇所に数千本から数万本のEST配列がマッピングされることがある。このような箇所では、従来のマッピング結果の可視化法では、EST配列の数に比例して大量の線分を描かなければならず、表示コストがかさむ上に、人が大量に表示されたデータを見て、どのようなスプライスバリアントのタイプがあるかを理解することが困難になる。また、生物学的な解釈のためには、遺伝子の発現の条件の違いにより、スプライシングまたは転写開始位置が異なることを調べることが重要であるが、従来の可視化法では、スプライスバリアントとしての分類や転写開始位置と発現情報との関連が明示されていないため、そのような関連を発見することが困難であった。
本発明は、スプライスバリアントのタイプや転写開始位置と発現情報との関連を理解しやすく表示することのできるスプライスバリアント表示方法を提供することを目的とする。
本発明は、大量のEST配列や全長mRNA配列に対して、スプライスバリアントとしてのタイプの違いを可視化し、各タイプ別の発現情報を可視化し、また、転写開始位置別の発現情報を可視化する、以下の処理ステップから構成される。以後、EST配列または全長mRNA配列を、纏めてcDNA配列とよぶ。
cDNA配列とゲノム配列との配列類似性検索によりマッピングを行い、各cDNA配列のエクソン・イントロン構造と転写開始位置を決めるステップ。
cDNA配列どうしのエクソン・イントロン構造を比較し、同じスプライスバリアントに由来すると推定されるタイプに、cDNA配列を分類するステップ。
同じタイプに属するcDNA配列を纏めて、タイプごとにエクソン・イントロン構造をゲノム配列に沿って可視化するステップ。
同じタイプに分類されたcDNA配列の発現情報を集め、タイプごとに発現情報の内訳を表示するステップ。
5’末端を含むcDNA配列の転写開始位置を求め、ゲノム配列上の各位置で、そこを転写開始位置とするcDNA配列を集めるステップ。
ゲノム配列上の各位置で、そこを転写開始位置とするcDNA配列の発現情報を集め、転写開始位置ごとに発現情報の内訳を表示するステップ。
マッピング結果を可視化する際の描画量が、cDNA配列の数ではなくcDNA配列を分類したタイプの数に比例するため、例えば数百万本のcDNA配列データに対しては、従来の表示法による描画量の数十分の一程度に抑えられる。その結果、大量の配列データに対する解析結果をコンパクトに表示でき、人が見るべきデータ量が抑えられ理解しやすくなる。また、タイプごとに発現情報の違い及び転写開始位置ごとの発現情報の違いが明示的に示されるため、生物学的な解釈を行うこと、即ち、遺伝子の発現の条件の違いによりスプライシングまたは転写開始位置が変化することを調べることが容易になる。
以下、本発明の実施の形態を、図を用いて詳細に説明する。
図1に、大量のcDNA配列に対して、本発明によりスプライスバリアント解析した結果を表示した例を示す。
図1において、101は一つの遺伝子領域に由来するcDNA配列をスプライスバリアントとして分類したときの、その各々のタイプのエクソン・イントロン構造を、公知の方法(特許文献1)に従って可視化したものである。102は、スプライスバリアントに共通のイントロン配列を、ゲノム配列内から除去することにより圧縮されたゲノム配列座標である。103は、スプライスバリアントとして分類された各々のタイプを並べるための座標である。104は、一つのタイプに含まれる一つのエクソンを表す線分である。一つのタイプのエクソン・イントロン構造は、エクソンを表す104の線分を幾つか、座標102に沿って並べることにより表現される。その際、連結された線分同士を区別できるように、線分の両端には端点を明示する。105のような、線分104に挟まれた間隙は、他のタイプのスプライスバリアントでは、そこに別のエクソンが挿入されるか、または、左右の線分104で表されるエクソンの一方または両方でスプライスサイトの変化が生じることにより、塩基配列が挿入されうることを示している。全てのタイプに対するこのような表示は、座標103に沿って並べられる。スプライスサイトを全く持たないcDNA配列は纏めて、座標102に沿って取り得る範囲を106で示す。
107は各タイプ別の発現情報を、103の座標に沿って表す。108は、発現強度を表す座標である。109は、一つのタイプに対する発現情報を表す。網掛けまたは色により発現情報の分類ごとの発現強度の内訳を示すと同時に、その総計によりそのタイプの発現強度を示す。同様に、110はスプライスサイトを持たないcDNA配列全体に対する発現情報を表す。
111は各転写開始位置別の発現情報を、102の座標に沿って表す。112は、発現強度を表す座標である。113は、一つの転写開始位置に対する発現情報を表す。網掛けまたは色により発現情報の分類ごとの発現強度の内訳を示すと同時に、その総計によりその転写開始位置の発現強度を示す。
114は、101内に表示される一つの遺伝子領域を選択するためのリストボックスである。リストの各要素には、115で示す遺伝子領域名(クラスタ名)と116で示す遺伝子領域アノテーション情報を表示する。遺伝子領域アノテーションとしては、その遺伝子領域の染色体上での詳細な位置情報、その遺伝子領域(クラスタ)に属する全長mRNA配列に対するアノテーションを集めたもの、などがある。117は現在選択しているリストボックスの要素を示すマーカーである。リストボックス114には、118に示す検索ウィンドウ内に記述した条件により、絞込み、並べ替え、または選択を行ったクラスタを表示する。検索の条件としては、染色体番号や染色体上の位置、または、クラスタに含まれるべき遺伝子の名前やそのアノテーション情報の一部、或いは、クラスタまたは転写開始位置の発現情報に関する条件などがある。117の選択は、ユーザが検索ウィンドウ118に入力した結果表示されるリストボックス114の内容を見て、必要に応じてさらにユーザがリストボックスの項目を再選択することで、決定される。117で選択された遺伝子領域が101に表示される。
図5は、発明によるスプライスバリアント解析・表示装置の概略構成図である。このスプライスバリアント解析・表示装置は、処理部503に対する操作や入力を行う操作・入力部501、処理結果を表示する表示部502、処理部503で処理するためのデータや情報を格納した記憶部504を備える。
記憶部504には、多数のcDNA配列を集めたcDNA配列データ202、ゲノム配列データ203、各cDNA配列の配列末端に関する情報を集めたcDNA配列の端点情報207、各cDNA配列の発現に関する情報を集めたcDNA配列の発現情報209、各cDNA配列のアノテーションに関する情報を集めた配列アノテーション情報212が格納されている。
処理部503は、cDNA配列データ202の各cDNA配列をゲノム配列データ203で示されるゲノム配列へのマッピングを行うマッピング処理部511、マッピングの結果に基づいてcDNA配列のクラスタを構成するクラスタリング処理部512、スプライトサイトの組み合わせが同じcDNア配列を一つのバリアントタイプとして纏めるバリアントタイプ分類処理部513、転写開始位置が同じcDNA配列同士をまとめる転写開始位置分類処理部514、各バリアントタイプに属するcDNA配列の発現情報を集めて分類するバリアントタイプ別の発現情報分類処理部515、各転写開始位置に属するcDNAの発現情報を集めて分類する転写開始位置別の発現情報分類処理部516、処理部503による解析結果を表示部502の表示画面に例えば図1に示したようにして表示する表示処理部517を備える。
図2を用いて、図1に示した表示を得るための処理手順を説明する。201では、公知のゲノムマッピング技術(非特許文献4)を用いて、記憶部504から処理部503に入力されたcDNA配列データ202とゲノム配列データ203より、各cDNA配列のゲノム配列へのマッピング処理を行う。この処理はマッピング処理部511によって行われる。その結果、各cDNA配列がゲノム配列上のどの位置にある塩基から転写されたものであるかが確定する。そこで、クラスタリング処理部512は、ゲノム上で塩基位置を1塩基または数塩基共有するようなcDNA配列を全て纏めてクラスタ(遺伝子領域に相当する)を構成することにより、cDNA配列のクラスタリング処理204を行う。このクラスタリング処理を効率的に行うためには、cDNA配列を構成する各エクソンの両端点のゲノム配列上での座標を求めておき、それらのゲノム配列座標をソートして、その座標を含むエクソン、さらに、それを含むcDNA配列を同じクラスタに入れて行けばよい。
また、201のマッピング処理の結果により、各cDNA配列のエクソン・イントロン構造が確定するので、ゲノム上のスプライスサイトの位置が確定する。バリアントタイプ別分類処理部513は、スプライスサイトの組み合わせが同じcDNA配列を一つのバリアントタイプとして纏めることにより、cDNA配列のバリアントタイプ分類処理205を行う。一般に各cDNA配列はスプライスサイトを複数もつが、その全てのスプライスサイトのゲノム配列上での座標が一致するか若しくは予め指定した数塩基程度以下の違いに収まるとき、スプライスサイトの組み合わせが同じとする。また、スプライスサイトを持たないcDNA配列は纏めて一つのタイプとして分類する。
また、cDNA配列には、シーケンシングを行った際の手順の違いにより、(1)全長をシーケンシングしたもの、(2)5’末端側のみシーケンシングしたもの、(3)3’末端側のみシーケンシングしたもの、(4)任意の一部の断片をシーケンシングしたものなどがあり、このうち、(1)と(2)は完全な5’末端を持ち、(1)と(3)は完全な3’末端を持つ。転写開始位置分類処理部514は、このような配列末端に関する情報を集めた、cDNA配列の端点情報207を読み込む。完全な5’末端を持つcDNA配列であって、マッピング処理201においてその5’末端がゲノム配列上にマッピングされるとき、そのcDNA配列に対しては、転写開始位置が決まる。206では、転写開始位置分類処理部514は、転写開始位置が決まるcDNA配列を集め、それらを転写開始位置が同じグループに分類する。ここで、転写開始位置が同じとは、ゲノム配列座標上で完全に一致するか、または、予め指定した塩基数以下の違いに収まることとする。
各cDNA配列には、その元となるmRNAをどのような条件下のどのような個体のどのような器官・組織のどのような部位から採取したかの様々な情報がある。これをcDNA配列の発現情報209とよぶ。バリアントタイプ別の発現情報分類処理部515によるバリアントタイプ別の発現情報分類処理208では、205で得られた各バリアントタイプに対して、そのタイプに属するcDNA配列の発現情報を209から集め、それらを調べようとする観点に従って分類する。例えば、組織別に分類したり、正常細胞由来か癌細胞由来か或いは他の病気に罹患しているかで分類したり、胎児や成人などの発達段階の違いで分類したり、薬剤投与などの外的刺激の有無とその後の経過時間の違いなどにより分類する。転写開始位置別の発現情報分類処理部516による転写開始位置別の発現情報分類処理210では、206で得られた各転写開始位置に対して、その位置に属するcDNA配列の発現情報を209から集め、それらを調べようとする観点に従って208と同様に分類する。
表示処理部517による表示・GUI(Graphic User Interface)処理211では、ユーザによって選択された一つの遺伝子領域(クラスタ)に対して、公知のスプライスバリアント比較表示法(特許文献1)によって、図1の101に示した表示を行う。ただし、一つのバリアントタイプに属するcDNA配列どうしは、スプライスサイトは共通であっても配列の両端には違いがあるため、最も伸びている端点を使って表示する。また、各タイプに対して208で求めた発現情報の分類結果を、103の座標に従って107内に110に示すように表示する。分類結果を、発現強度を示す座標108に沿って数値化する際は、例えば、その分類に属するEST配列の数を用いる。ただし、全EST配列に対して発現情報に偏りがある場合には、その偏りを補正するために、一つのクラスタの一つの分類に属するEST配列数を全ESTの中でその分類に属するEST配列の数で正規化して、発現強度とする。同様に、各転写開始位置に対して210で求めた発現情報の分類結果を、102の座標に従って111内に113に示すように表示する。
また、表示・GUI処理211では、配列アノテーション情報212を読み込んで、各クラスタに属する配列のアノテーション情報を纏めてリストボックス114内に表示し、ユーザが遺伝子領域(クラスタ)を選択するための支援情報とする。
以下、本発明の第2の実施の形態を、図を用いて説明する。
図3に、大量のcDNA配列に対して、本発明によりスプライスバリアント解析した結果を表示した例を示す。
図3において、101〜113は図1と同様である。301は、101内に表示されるcDNA配列を選択するためのリストボックスである。リストの各要素には、302で示す配列名と303で示す配列アノテーション情報を表示する。304は現在選択しているリストボックスの要素を指し示すマーカーである。リストボックス301には、305に示す検索ウィンドウ内に記述した条件により、絞込み、並べ替え、または選択を行ったcDNA配列を表示する。304の選択は、ユーザが検索ウィンドウ305に入力した結果表示されるリストボックス301の内容を見て、必要に応じてさらにユーザがリストボックスの項目を再選択することで、決定される。306と307は、304で選択されたcDNA配列が属するバリアントタイプを示すと同時に、それらの転写開始位置と転写終結位置を示すマーカーである。308は、タイプ別の発現情報を示すウィンドウ107の中で、304で選択されたcDNA配列が属するバリアントタイプの発現情報を指し示すマーカーである。309は、転写開始位置別の発現情報を表すウィンドウ111の中で、304で選択されたcDNA配列の転写開始位置における発現情報を指し示すマーカーである。
以下、本発明の第3の実施の形態を、図を用いて説明する。
図4に、大量のcDNA配列に対して、本発明によりスプライスバリアント解析した結果を表示した例を示す。101、103、106〜113は図1と同様である。401は、一つのタイプに含まれる一つのエクソンを表すボックスである。一つのタイプのエクソン・イントロン構造は、エクソンを表す401のボックスを幾つか、ゲノム配列座標402に沿って並べることにより表現される。ボックス401を連結する折れ線403はイントロンを表す。ただし、一つのタイプの両端にあるエクソンを表すボックスは、そのタイプに属するその端点側のエクソンの中で最も伸びているものを表す。これは、一つのタイプに属するcDNA配列どうしは、スプライスサイトは共通であっても両端点は異なるためである。
以上説明したように、本発明は、スプライスバリアントの異常を伴う病気に対する診断、スプライスバリアントの異常を引き起こす薬剤に対する薬効・毒性の評価などへの応用が可能である。
大量のcDNA配列に対するスプライスバリアントとしての分類結果と、分類別の発現情報、および、転写開始位置ごとの発現情報を、統合的に表示する方法を示す図。 図1に示す表示を行うための計算手順を示す図。 大量のcDNA配列に対するスプライスバリアントとしての分類結果と、分類別の発現情報、および、転写開始位置ごとの発現情報を、統合的に表示する第2の方法を示す図。 大量のcDNA配列に対するスプライスバリアントとしての分類結果と、分類別の発現情報、および、転写開始位置ごとの発現情報を、統合的に表示する第3の方法を示す図。 発明によるスプライスバリアント解析・表示装置の概略構成図。
符号の説明
102:ゲノム配列座標
104:エクソンを表す線分
107:各タイプ別の発現情報
111:各転写開始位置別の発現情報
114:遺伝子領域を選択するためのリストボックス
118:検索ウィンドウ
301:リストボックス
305:検索ウィンドウ
401:エクソンを表すボックス
403:イントロンを表す折れ線

Claims (4)

  1. cDNA配列をゲノム配列へマッピングするマッピング処理、ゲノム配列上で塩基を共有するcDNA配列を纏めてクラスタを構成するクラスタリング処理、スプライトサイトの組み合わせが同じcDNA配列を一つのバリアントタイプとして纏めるバリアントタイプ分類処理、処理結果を表示部に表示する処理を行う処理部を用いたスプライスバリアント表示方法であって、
    前記処理部が、入力されたゲノム配列と複数のcDNA配列を用いて、
    前記複数のcDNA配列の各々を前記ゲノム配列にマッピングする工程、
    マッピングの結果に基づいて前記複数のcDNA配列を複数のクラスタに分けるクラスタリング工程、
    クラスタ毎に、前記マッピング処理の結果得られたcDNA配列のスプライトサイトの情報を用いて、前記複数のcDNA配列をスプライスサイトの組み合わせを共有するバリアントのタイプ別に纏める工程、
    表示部に、クラスタ毎に、前記バリアントのタイプ別にエクソン・イントロン構造を表示する工程、
    を実行することを特徴とするスプライスバリアント表示方法。
  2. cDNA配列をゲノム配列へマッピングするマッピング処理、ゲノム配列上で塩基を共有するcDNA配列を纏めてクラスタを構成するクラスタリング処理、スプライトサイトの組み合わせが同じcDNA配列を一つのバリアントタイプとして纏めるバリアントタイプ分類処理、各バリアントタイプに属するcDNA配列の発現情報を集めて分類する発現情報分類処理、処理結果を表示部に表示する処理を行う処理部を用いたスプライスバリアント表示方法であって、
    前記処理部が、入力されたゲノム配列、複数のcDNA配列、各cDNA配列の発現情報を用いて、
    前記複数のcDNA配列の各々を前記ゲノム配列にマッピングする工程、
    マッピングの結果に基づいて前記複数のcDNA配列を複数のクラスタに分けるクラスタリング工程、
    クラスタ毎に、前記マッピング処理の結果得られたcDNA配列のスプライトサイトの情報を用いて、前記複数のcDNA配列をスプライスサイトの組み合わせを共有するバリアントのタイプ別に纏める工程、
    前記バリアントのタイプ別にそれらの発現情報を纏める工程、
    表示部に、クラスタ毎に、前記バリアントのタイプ別にエクソン・イントロン構造の表示と一対一に対応するように、各バリアントのタイプの発現情報の内訳を表示する工程、
    を実行することを特徴とするスプライスバリアント表示方法。
  3. cDNA配列をゲノム配列へマッピングするマッピング処理、ゲノム配列上で塩基を共有するcDNA配列を纏めてクラスタを構成するクラスタリング処理、スプライトサイトの組み合わせが同じcDNA配列を一つのバリアントタイプとして纏めるバリアントタイプ分類処理、転写開始位置が同じcDNA配列同士を纏める転写開始位置分類処理、各転写開始位置に属するcDNAの発現情報を集めて分類する発現情報分類処理、処理結果を表示部に表示する処理を行う処理部を用いたスプライスバリアント表示方法であって、
    前記処理部が、入力されたゲノム配列、複数のcDNA配列、各cDNA配列の発現情報、各cDNA配列の配列末端に関する情報を用いて、
    前記複数のcDNA配列の各々を前記ゲノム配列にマッピングする工程、
    マッピングの結果に基づいて前記複数のcDNA配列を複数のクラスタに分けるクラスタリング工程、
    クラスタ毎に、前記マッピング処理の結果得られたcDNA配列のスプライトサイトの情報を用いて、前記複数のcDNA配列をスプライスサイトの組み合わせを共有するバリアントのタイプ別に纏める工程、
    前記マッピングの結果と前記各cDNA配列の配列末端に関する情報とから求められた転写開始位置を共有するcDNA配列同士を纏める工程、
    各cDNA配列の発現情報を用いて前記纏めた転写開始位置ごとにそれらの発現情報を纏める工程、
    表示部に、クラスタ毎に、前記バリアントのタイプ別にエクソン・イントロン構造を表示すると共に、エクソン・イントロン構造を表示する際に用いたゲノム配列座標に沿って、各転写開始位置における発現情報の内訳を表示する工程、
    を実行することを特徴とする、スプライスバリアント表示方法。
  4. cDNA配列をゲノム配列へマッピングするマッピング処理、ゲノム配列上で塩基を共有するcDNA配列を纏めてクラスタを構成するクラスタリング処理、スプライトサイトの組み合わせが同じcDNA配列を一つのバリアントタイプとして纏めるバリアントタイプ分類処理、各バリアントタイプに属するcDNA配列の発現情報を集めて分類するバリアントタイプ別発現情報分類処理、転写開始位置が同じcDNA配列同士を纏める転写開始位置分類処理、各転写開始位置に属するcDNAの発現情報を集めて分類する転写開始位置別発現情報分類処理、処理結果を表示部に表示する処理を行う処理部を用いたスプライスバリアント表示方法であって、
    前記処理部が、入力されたゲノム配列、複数のcDNA配列、各cDNA配列の発現情報、各cDNA配列の配列末端に関する情報を用いて、
    複数のcDNA配列の各々を前記ゲノム配列にマッピングする工程、
    マッピングの結果に基づいて前記複数のcDNA配列を複数のクラスタに分けるクラスタリング工程、
    クラスタ毎に、前記マッピング処理の結果得られたcDNA配列のスプライトサイトの情報を用いて、前記複数のcDNA配列をスプライスサイトの組み合わせを共有するバリアントのタイプ別に纏める工程、
    前記バリアントのタイプ別にそれらの発現情報を纏める工程、
    前記マッピングの結果と前記各cDNA配列の配列末端に関する情報とから求められた転写開始位置を共有するcDNA配列同士を纏める工程、
    各cDNA配列の発現情報を用いて前記纏めた転写開始位置ごとにそれらの発現情報を纏める工程、
    表示部に、クラスタ毎に、前記バリアントのタイプ別にエクソン・イントロン構造の表示と一対一に対応するように、各タイプの発現情報の内訳を表示すると共に、エクソン・イントロン構造を表示する際に用いたゲノム配列座標に沿って、各転写開始位置における発現情報の内訳を表示する工程、
    を実行することを特徴とするスプライスバリアント表示方法。
JP2004170276A 2004-06-08 2004-06-08 スプライスバリアント配列のマッピング表示方法 Expired - Fee Related JP4557609B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004170276A JP4557609B2 (ja) 2004-06-08 2004-06-08 スプライスバリアント配列のマッピング表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004170276A JP4557609B2 (ja) 2004-06-08 2004-06-08 スプライスバリアント配列のマッピング表示方法

Publications (2)

Publication Number Publication Date
JP2005352590A true JP2005352590A (ja) 2005-12-22
JP4557609B2 JP4557609B2 (ja) 2010-10-06

Family

ID=35587049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004170276A Expired - Fee Related JP4557609B2 (ja) 2004-06-08 2004-06-08 スプライスバリアント配列のマッピング表示方法

Country Status (1)

Country Link
JP (1) JP4557609B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008027244A (ja) * 2006-07-21 2008-02-07 Univ Of Tokyo エクソンアレイ発現プロファイルに基づく疾患特異的選択的スプライシング同定法
JP2012094149A (ja) * 2010-10-28 2012-05-17 Samsung Sds Co Ltd 協業基盤の塩基配列データの管理、表示およびアップデート方法
WO2012096016A1 (ja) * 2011-01-11 2012-07-19 日本ソフトウェアマネジメント株式会社 核酸情報処理装置およびその処理方法
JP2013509198A (ja) * 2009-10-30 2013-03-14 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 細菌メタ構造および使用方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6009064854, 木村宏一, "ヒト完全長cDNAとバイオインフォマティクス", 現代医療 2004年5月号, 20040510, Vol.36,No.5, pages.29−34, JP, 株式会社 現代医療社 *
JPN6009064856, Kouichi Kimura et. al., "Intris:A Viewer for cDNA−Genome Alignments Enabling Efficient Detection of Splicing Variants and Exp", Genome Informatics, 2002, Vol.13, 548−550, JP, 日本バイオインフォマティクス学会 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008027244A (ja) * 2006-07-21 2008-02-07 Univ Of Tokyo エクソンアレイ発現プロファイルに基づく疾患特異的選択的スプライシング同定法
JP2013509198A (ja) * 2009-10-30 2013-03-14 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 細菌メタ構造および使用方法
JP2012094149A (ja) * 2010-10-28 2012-05-17 Samsung Sds Co Ltd 協業基盤の塩基配列データの管理、表示およびアップデート方法
WO2012096016A1 (ja) * 2011-01-11 2012-07-19 日本ソフトウェアマネジメント株式会社 核酸情報処理装置およびその処理方法
JP2012146067A (ja) * 2011-01-11 2012-08-02 Nippon Software Management Kk 核酸情報処理装置およびその処理方法

Also Published As

Publication number Publication date
JP4557609B2 (ja) 2010-10-06

Similar Documents

Publication Publication Date Title
EP0935210A2 (en) Computer aided visualisation of expression comparison
US6532462B2 (en) Gene expression and evaluation system using a filter table with a gene expression database
US9898578B2 (en) Visualizing expression data on chromosomal graphic schemes
Sindi et al. A geometric approach for classification and comparison of structural variants
Rosa et al. VAMP: visualization and analysis of array-CGH, transcriptome and other molecular profiles
US7750908B2 (en) Focus plus context viewing and manipulation of large collections of graphs
US20090125248A1 (en) System, Method and computer program product for integrated analysis and visualization of genomic data
KR20020075265A (ko) 임상 진단 서비스를 제공하는 방법
JP2015089364A (ja) 体細胞多重変異によるがん診断方法、がん医薬開発方法及びがん診断装置
CN112292730B (zh) 具有用于解释和可视化数据的改进的用户界面的计算设备
KR20170087508A (ko) 게놈 해석 장치 및 게놈 가시화 방법
US6502039B1 (en) Mathematical analysis for the estimation of changes in the level of gene expression
Poszewiecka et al. TADeus2: a web server facilitating the clinical diagnosis by pathogenicity assessment of structural variations disarranging 3D chromatin structure
Holzhüter et al. Visualizing uncertainty in biological expression data
US20040024532A1 (en) Method of identifying trends, correlations, and similarities among diverse biological data sets and systems for facilitating identification
Pendergrass et al. Visual integration of results from a large DNA biobank (BioVU) using synthesis-view
JP4557609B2 (ja) スプライスバリアント配列のマッピング表示方法
US20160357906A1 (en) Biological data annotation and visualization
KR101003175B1 (ko) 상호 연관 지도 작성법을 이용한 다목적 활용 가능 유전자 판별법
CN114730610A (zh) 试剂盒和使用试剂盒的方法
Hunt et al. The visual language of synteny
KR102161511B1 (ko) 담도암 진단용 바이오마커의 추출 방법, 이를 위한 컴퓨팅 장치, 담도암 진단용 바이오마커 및 이를 포함하는 담도암 진단 장치
CN111508563A (zh) 一种长非编码rna的癌症相关可变剪接数据库系统
Besse et al. EGIDExpress: an interactive shiny Web app to visualize and share large biological datasets
US10672505B2 (en) Biological data annotation and visualization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100204

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100517

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100713

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100720

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees