JP2013140420A - 塩基配列解析装置、塩基配列解析方法及び塩基配列解析プログラム - Google Patents
塩基配列解析装置、塩基配列解析方法及び塩基配列解析プログラム Download PDFInfo
- Publication number
- JP2013140420A JP2013140420A JP2011289652A JP2011289652A JP2013140420A JP 2013140420 A JP2013140420 A JP 2013140420A JP 2011289652 A JP2011289652 A JP 2011289652A JP 2011289652 A JP2011289652 A JP 2011289652A JP 2013140420 A JP2013140420 A JP 2013140420A
- Authority
- JP
- Japan
- Prior art keywords
- numerical value
- sequence
- base
- codon
- amino acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
【解決手段】塩基配列に含まれる各塩基を、塩基毎に決められた数値へ変換する数値変換部10が変換した数値に基づいて、転写開始位置を抽出する転写開始位置抽出部20が抽出した転写開始位置とイントロンの開始アミノ酸配列とイントロンの終了アミノ酸配列とに基づいて、前記塩基配列からエキソンの塩基配列を抽出するエキソン配列抽出部30を備え、さらにエキソン配列抽出部が抽出したエキソン塩基配列に相当する数値配列を構成する各数値にコドンにおける重み付けした値に基づいて分類番号を生成する分類番号生成部40を備え、エキソンの塩基配列に基づいて、アミノ酸配列生成部50がアミノ酸配列を生成し、分類番号をアミノ酸配列の順に表示装置に表示する。
【選択図】図1
Description
以下、本発明の実施形態について、図面を参照して詳細に説明する。図1は、第1の実施形態における塩基配列解析装置1の構成を示す概略ブロック図である。塩基配列解析装置1は、数値変換部10と、転写開始位置抽出部20と、エキソン配列抽出部30と、分類番号生成部40と、アミノ酸配列生成部50と、表示制御部60と、記憶部70とを備える。
転写開始位置抽出部20は、数値変換部10から入力された数値配列から転写開始位置Sを抽出する。転写開始位置抽出部20は、抽出した転写開始位置Sをエキソン配列抽出部30へ出力する。転写開始位置抽出部20の処理の詳細は、後述する。
アミノ酸配列生成部50は、分類番号生成部40から入力された分類番号に基づいて、アミノ酸配列を生成する。具体的には、例えば、アミノ酸配列生成部50は、分類番号生成部40から入力された分類番号に対応するアミノ酸配列情報を記憶部70から順次読み出す。これにより、アミノ酸配列生成部50は、アミノ酸配列を生成する。そして、アミノ酸配列生成部50は、生成したアミノ酸配列と分類番号とを表示制御部60に出力する。
なお、特定の番号領域は、親水性のアミノ酸を示す番号領域であってもよい。
そして、第1の共通配列判定部210は、全ての塩基を比較した結果、数値が異なる数が3以下であるか否か判定する。第1の共通配列判定部210は、判定した結果を位置抽出部270に出力する。
そして、第2の共通配列判定部230は、全ての塩基を比較した結果、数値が異なる数が3以下であるか否か判定する。第2の共通配列判定部230は、判定した結果を位置抽出部270に出力する。
加算器218は、XOR回路213から入力された数値と、XOR回路214から入力された数値とを加算する。そして、加算器218は、加算後の数値を加算器220へ出力する。
加算器220は、加算器217から入力された数値、加算器218から入力された数値及び加算器219から入力された数値を加算する。加算器220は、加算後の値を第1判定部221に出力する。ここで、加算後の値は、塩基保持部200から入力された六つの数値が、第1の共通配列(TTGACA)に相当する数値配列と何個異なっているかを示す数値である。
XOR回路231は、塩基保持部200から入力された第24の数値と、第2の共通配列の1番目の塩基Tに相当する数値−1とを入力として、排他的論理和を算出する。すなわち、XOR回路231は、第24の数値と数値−1とが一致する場合に0を選択し、一致しない場合に1を選択する。そして、XOR回路231は、選択した数値を加算器237へ出力する。
加算器238は、XOR回路233から入力された数値と、XOR回路234から入力された数値とを加算する。そして、加算器238は、加算後の数値を加算器240へ出力する。
加算器240は、加算器237から入力された数値、加算器238から入力された数値及び加算器239から入力された数値を加算する。加算器240は、加算後の値を第2判定部241に出力する。ここで、加算後の値は、塩基保持部200から入力された六つの数値(第24の数値〜第29の数値)が、第2の共通配列に相当する数値配列と何個異なっているかを示す数値である。
XOR回路251は、塩基保持部200から入力された第36の数値と、開始コドンの第1コドンAに相当する1との排他的論理和をとる。XOR回路251は、第36の数値と開始コドンの第1コドンAとが一致する場合に0を選択し、一致しない場合に1を選択する。そして、XOR回路251は、選択した数値をXOR回路254へ出力する。
判定部271は、第1の共通配列判定部210から入力された判定結果と、第2の共通配列判定部230から入力された判定結果と、開始コドン判定部250から入力された判定結果とに基づいて、第36の数値の位置が転写開始位置か否か判定する。
これにより、判定部271は、開始コドンの配列が一致し、かつ第1の共通配列が第1の許容範囲であり、かつ第2の共通配列が第2の許容範囲である場合のみ、1を判定結果とし、それ以外の場合に0を判定結果とする。そして、判定部271は、判定結果を転写開始位置生成部272に出力する。
一方、判定部271から入力された判定結果が、第36の数値の位置が転写開始位置Sでないことを示す場合(例えば、判定結果が0の場合)、転写開始位置生成部272は、エキソン配列抽出部30へ何も出力しない。
基準信号生成部310は、転写開始位置抽出部20が抽出した転写開始位置Sに基づいて、三塩基毎に読み取りを指示する基準信号Xを生成する。具体的には、例えば、基準信号生成部310は、不図示のクロック信号を受信しているものとする。そして、基準信号生成部310は、転写開始位置Sから2クロック後に入力されるクロック信号がハイに遷移すると同時に、基準信号Xをハイに遷移させる。基準信号生成部310は、以後3クロック毎に、数値変換部10から数値が入力されるのと同時に、基準信号Xをハイに遷移させる。そして、基準信号生成部310は、その次の数値が入力されるのと同時に、基準信号Xをローに遷移させる。この基準信号生成部310は、例えば、3進カウンタを備えることにより実現される。基準信号生成部310は、生成した基準信号を抽出部330へ出力する。
まず、エキソン識別信号生成部320は、数値変換部10が変換した数値において、対象塩基に相当する数値anを10倍した値に、その対象塩基の次の塩基に相当する数値an+1を加算し、加算後の値をbn(=an×10+an+1)とする。
また、エキソン識別信号生成部320は、加算後の値bnがイントロンの終了アミノ酸配列AGに相当する数値12の場合に、2クロック後(2塩基分遅延後)にエキソン識別信号Yをハイに遷移させる。但し、エキソン識別信号生成部320は、例えば、加算後の値bnが12の時点で、エキソン識別信号Yが既にハイの場合、2クロック後(2塩基分遅延後)にエキソン識別信号Yをそのままにする。これにより、エキソン識別信号生成部320は、エキソン識別信号Yを生成する。エキソン識別信号生成部320は、生成したエキソン識別信号Yを抽出部330へ出力する。
同図の第8行目にエキソン塩基配列98が示されている。このエキソン塩基配列98は、コドン読取信号Zがハイのときに、その2つ前の塩基からその時点までの塩基をmRNAの塩基配列97から抽出したものである。
同図の第9行目に、同図の第8行目のエキソン塩基配列98に対応するエキソン数値配列99が示されている。このエキソン数値配列99は、数値変換部10が同図の第8行目のエキソン塩基配列98を変換した数値を表している。
アミノ酸配列生成部50は、分類番号生成部40から分類番号Cnが入力される毎に、分類番号生成部40から入力された分類番号Cnに対応するアミノ酸の名前を記憶部70から読み出す。これにより、アミノ酸配列生成部50は、アミノ酸配列を生成することができる。
また、C951は、アミノ酸を構成する第2コドンが数値変換された数値C942であり、C952は、アミノ酸を構成する第1コドンが数値変換された数値C941であり、C953は、アミノ酸を構成する第3コドンが数値変換された数値C943である。
このように、塩基配列解析装置1は、親水性または疎水性を数値の領域で分類することができ、ユーザは、分類番号の数値を参照することにより、DNA配列から疎水性同士が折りたたまれる現象などを推定することができる。
以上で、本フローチャートの処理を終了する。
また、塩基配列解析装置1がこのように分類番号を付して、コドンを分類することにより、あるまとまった分類番号の範囲が疎水性のアミノ酸を示し、また別のまとまった分類番号の範囲が親水性のアミノ酸を示すようになる。これにより、ユーザは分類番号からそのコドンが示すアミノ酸が疎水性か親水性かを判断することができるので、塩基配列解析装置1は塩基配列を解読する場合におけるユーザの利便性を向上させることになる。
続いて、本発明の第2の実施形態について説明する。図15は、第2の実施形態における塩基配列解析装置1bの構成を示す概略ブロック図である。なお、図1と共通する要素には同一の符号を付し、その具体的な説明を省略する。図15の塩基配列解析装置1bの構成は、図1の塩基配列解析装置1の構成に対して、正常配列取得部80が追加され、表示制御部60が表示制御部60bに、記憶部70が記憶部70bに変更されたものとなっている。
正常配列取得部80は、正常なアミノ酸配列と、該正常なアミノ酸配列に含まれるアミノ酸に対応する分類番号を取得する。具体的には、例えば、正常配列取得部80は、記憶部70bから正常なアミノ酸配列と、そのアミノ酸配列に含まれるアミノ酸に対応する分類番号とを読み出すことにより取得する。そして、正常配列取得部80は、正常なアミノ酸配列と、該正常なアミノ酸配列に含まれるアミノ酸に対応する分類番号を表示制御部60bに出力する。
また、表示制御部60bは、正常配列取得部80から入力された正常なアミノ酸配列と、アミノ酸配列生成部50から入力されたアミノ酸配列を比較し、一致するか否か判定する。表示制御部60bは、一致しないと判定した場合、一致しないアミノ酸を抽出し、その抽出したアミノ酸が一致していない旨を表示装置2に表示させる。
また、グルタミン酸(Glu)P153からバリン(Val)P154へと変わることにより、アミノ酸の性質が親水性から疎水性に変わることが示されている。これにより、ユーザは、親水性から疎水性に変わることで、赤血球が鎌状になる傾向があるということを把握することができる。
このように、1塩基の変更でも分類番号が大きく変わる場合には、ユーザは、分類番号の変化からアミノ酸が変化することを予測することができる。一方、1塩基の変更で分類番号があまり変わらない場合には、ユーザは、分類番号の変化からアミノ酸が変化しないことを予測することができる。
また、ユーザは、どういうコドンからアミノ酸ができたのかを分類番号から把握できるため、実際にDNA配列がどの程度の塩基の変化による危険を持っているのかを把握することができる。
続いて、本発明の第3の実施形態について説明する。図17は、第3の実施形態における塩基配列解析装置1cの構成を示す概略ブロック図である。なお、図1と共通する要素には同一の符号を付し、その具体的な説明を省略する。図17の塩基配列解析装置1cの構成は、図1の塩基配列解析装置1の構成に対して、コドン番号取得部91と低頻度コドン抽出部92とが追加され、分類番号生成部40が分類番号生成部40cに、表示制御部60bが第2表示制御部61に変更されたものとなっている。
記憶部70cは、第1の実施形態の記憶部70と同様の機能を有するが、以下の点で異なる。記憶部70cには、ある生物で予め決められた頻度より高い頻度で使用される高頻度コドンの分類番号と、その生物で予め決められた頻度以下の頻度で使用される低頻度コドンの分類番号とが記憶されている。
これにより、表示装置2の画面を見たユーザは、一見しただけで、2番目のロイシン、4番目のプロリン及び10番目のバリンP194が、低頻度コドンから生成されていることを知ることができる。
これにより、表示装置2の画面を見たユーザは、アミノ酸配列だけでなく、どのアミノ酸が低頻度コドンから生成されているかを知ることができ、塩基配列を解読する場合におけるユーザの利便性を向上させることができる。
また、本実施形態の塩基配列解析装置(1、1b、1c)の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、塩基配列解析装置(1、1b、1c)に係る上述した種々の処理を行ってもよい。
2 表示装置
10 数値変換部
20 転写開始位置抽出部
30 エキソン配列抽出部
40 分類番号生成部
50 アミノ酸配列生成部
60 表示制御部
61 第2表示制御部
70 記憶部
80 正常配列取得部
91 コドン番号取得部
92 低頻度コドン抽出部
200 塩基保持部
210 第1の共通配列判定部
211〜216、231〜236、251〜255 XOR回路
217〜220、237〜240 加算器
221 第1判定部
230 第2の共通配列判定部
241 第2判定部
250 開始コドン判定部
270 位置抽出部
271 判定部
272 転写開始位置生成部
310 基準信号生成部
320 エキソン識別信号生成部
330 抽出部
Claims (9)
- 塩基配列に含まれる各塩基を、塩基毎に決められた数値へ変換する数値変換部と、
前記数値変換部が変換した数値に基づいて、転写開始位置を抽出する転写開始位置抽出部と、
を備えることを特徴とする塩基配列解析装置。 - 前記転写開始位置抽出部が抽出した転写開始位置とイントロンの開始アミノ酸配列とイントロンの終了アミノ酸配列とに基づいて、前記塩基配列からエキソンの塩基配列を抽出するエキソン配列抽出部を備えることを特徴とする請求項1に記載の塩基配列解析装置。
- 前記エキソン配列抽出部が抽出したエキソンの塩基配列に基づいて、アミノ酸配列を生成するアミノ酸配列生成部を備えることを特徴とする請求項2に記載の塩基配列解析装置。
- 前記数値変換部が変換した各数値にコドンにおける該数値の順番に応じた重み付けをし、重み付けした値に基づいて前記コドンを分類する分類番号を生成する分類番号生成部を備えることを特徴とする請求項1から請求項3のいずれか一項に記載の塩基配列解析装置。
- 前記エキソン配列抽出部が抽出したエキソン塩基配列に相当する数値配列を構成する各数値にコドンにおける該数値の順番に応じた重み付けをし、重み付けした値に基づいて前記コドンを分類する分類番号を生成する分類番号生成部を備えることを特徴とする請求項3に記載の塩基配列解析装置。
- 前記分類番号生成部は、前記コドンに含まれる第2コドン、第1コドン、第3コドンの順に重みづけを小さくすることを特徴とする請求項4または請求項5に記載の塩基配列解析装置。
- 前記分類番号生成部が生成した分類番号をアミノ酸配列の順に表示装置に表示させる表示制御部を備えることを特徴とする請求項4から請求項6のいずれか一項に記載の塩基配列解析装置。
- 数値変換部が、塩基配列に含まれる各塩基を、塩基毎に決められた数値へ変換する手順と、
転写開始位置抽出部が、前記数値変換部が変換した数値に基づいて、転写開始位置を抽出する手順と、
を有することを特徴とする塩基配列解析方法。 - コンピュータに、
塩基配列に含まれる各塩基を、塩基毎に決められた数値へ変換する数値変換ステップと、
前記数値変換ステップにより変換された数値に基づいて、転写開始位置を抽出する転写開始位置抽出ステップと、
を実行させるための塩基配列解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011289652A JP5957884B2 (ja) | 2011-12-28 | 2011-12-28 | 塩基配列解析装置、塩基配列解析方法及び塩基配列解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011289652A JP5957884B2 (ja) | 2011-12-28 | 2011-12-28 | 塩基配列解析装置、塩基配列解析方法及び塩基配列解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013140420A true JP2013140420A (ja) | 2013-07-18 |
JP5957884B2 JP5957884B2 (ja) | 2016-07-27 |
Family
ID=49037826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011289652A Active JP5957884B2 (ja) | 2011-12-28 | 2011-12-28 | 塩基配列解析装置、塩基配列解析方法及び塩基配列解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5957884B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5450910B1 (ja) * | 2012-06-22 | 2014-03-26 | 興和株式会社 | ロキソプロフェンを含有する医薬組成物 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000157271A (ja) * | 1998-11-27 | 2000-06-13 | Hitachi Ltd | シグナル配列検出方法 |
JP2001109753A (ja) * | 1999-10-14 | 2001-04-20 | Hitachi Ltd | データ列相同部分検索処理方法及び装置 |
US20040067514A1 (en) * | 2002-07-17 | 2004-04-08 | Tabaska Jack E. | Methods for detecting translation initiation codons in nucleic acid sequences |
JP2004310688A (ja) * | 2003-04-10 | 2004-11-04 | Genaris Inc | 原核生物の遺伝子構造同定方法及びdna断片が由来した微生物の推定方法 |
JP2007520782A (ja) * | 2003-05-20 | 2007-07-26 | カウンシル・オブ・サイエンティフィック・アンド・インダストリアル・リサーチ | Dnaに基づいた数値表現体系及び算術 |
US20110040488A1 (en) * | 2005-04-15 | 2011-02-17 | Mascon Global Limited | System and method for analysis of a dna sequence by converting the dna sequence to a number string and applications thereof in the field of accelerated drug design |
-
2011
- 2011-12-28 JP JP2011289652A patent/JP5957884B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000157271A (ja) * | 1998-11-27 | 2000-06-13 | Hitachi Ltd | シグナル配列検出方法 |
JP2001109753A (ja) * | 1999-10-14 | 2001-04-20 | Hitachi Ltd | データ列相同部分検索処理方法及び装置 |
US20040067514A1 (en) * | 2002-07-17 | 2004-04-08 | Tabaska Jack E. | Methods for detecting translation initiation codons in nucleic acid sequences |
JP2004310688A (ja) * | 2003-04-10 | 2004-11-04 | Genaris Inc | 原核生物の遺伝子構造同定方法及びdna断片が由来した微生物の推定方法 |
JP2007520782A (ja) * | 2003-05-20 | 2007-07-26 | カウンシル・オブ・サイエンティフィック・アンド・インダストリアル・リサーチ | Dnaに基づいた数値表現体系及び算術 |
US20110040488A1 (en) * | 2005-04-15 | 2011-02-17 | Mascon Global Limited | System and method for analysis of a dna sequence by converting the dna sequence to a number string and applications thereof in the field of accelerated drug design |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5450910B1 (ja) * | 2012-06-22 | 2014-03-26 | 興和株式会社 | ロキソプロフェンを含有する医薬組成物 |
Also Published As
Publication number | Publication date |
---|---|
JP5957884B2 (ja) | 2016-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240120021A1 (en) | Methods and systems for large scale scaffolding of genome assemblies | |
Ou et al. | LTR_retriever: a highly accurate and sensitive program for identification of long terminal repeat retrotransposons | |
Dohm et al. | SHARCGS, a fast and highly accurate short-read assembly algorithm for de novo genomic sequencing | |
Song et al. | Rcorrector: efficient and accurate error correction for Illumina RNA-seq reads | |
Henson et al. | Next-generation sequencing and large genome assemblies | |
Zhao et al. | EDAR: an efficient error detection and removal algorithm for next generation sequencing data | |
EP2377949B1 (en) | Construction method and system of fragments assembling scaffold | |
Klein et al. | LOCAS–a low coverage assembly tool for resequencing projects | |
Saberkari et al. | Prediction of protein coding regions in DNA sequences using signal processing methods | |
Taher et al. | AGenDA: homology-based gene prediction | |
Behera et al. | Plant transcriptome assembly: review and benchmarking | |
US20180060484A1 (en) | Extending assembly contigs by analyzing local assembly sub-graph topology and connections | |
JP5957884B2 (ja) | 塩基配列解析装置、塩基配列解析方法及び塩基配列解析プログラム | |
WO2020115580A1 (en) | System and method for promoter prediction in human genome | |
Zhao et al. | Multitrans: an algorithm for path extraction through mixed integer linear programming for transcriptome assembly | |
Luo et al. | Computational approaches for transcriptome assembly based on sequencing technologies | |
US20230073973A1 (en) | Deep learning based system and method for prediction of alternative polyadenylation site | |
Marri et al. | Advances in sequencing and resequencing in crop plants | |
Perco et al. | Detection of coregulation in differential gene expression profiles | |
WO2016003283A1 (en) | A method for finding associated positions of bases of a read on a reference genome | |
Axelson-Fisk et al. | Comparative gene finding | |
Tang et al. | Integration of hybrid and self-correction method improves the quality of long-read sequencing data | |
Chen et al. | Analysis and comparison of RNA pseudouridine site prediction tools | |
Zribi et al. | Microsatellite‟ s Detection using the S-Transform Analysis based on the Synthetic and Experimental Coding | |
Hatzigeorgiou | Artificial neural networks based systems for recognition of genomic signals and regions: a review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5957884 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |