JP4991287B2 - 特異的塩基配列探索方法 - Google Patents
特異的塩基配列探索方法 Download PDFInfo
- Publication number
- JP4991287B2 JP4991287B2 JP2006511480A JP2006511480A JP4991287B2 JP 4991287 B2 JP4991287 B2 JP 4991287B2 JP 2006511480 A JP2006511480 A JP 2006511480A JP 2006511480 A JP2006511480 A JP 2006511480A JP 4991287 B2 JP4991287 B2 JP 4991287B2
- Authority
- JP
- Japan
- Prior art keywords
- base sequence
- base
- specific
- sequences
- exons
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 73
- 239000002773 nucleotide Substances 0.000 title claims description 24
- 125000003729 nucleotide group Chemical group 0.000 title claims description 24
- 108090000623 proteins and genes Proteins 0.000 claims description 124
- 108700024394 Exon Proteins 0.000 claims description 70
- 238000009825 accumulation Methods 0.000 claims description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 11
- 238000003491 array Methods 0.000 claims description 2
- 108091008053 gene clusters Proteins 0.000 claims 1
- 230000010354 integration Effects 0.000 description 32
- 238000009826 distribution Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 20
- 238000002493 microarray Methods 0.000 description 13
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 12
- 108020004459 Small interfering RNA Proteins 0.000 description 12
- 238000004891 communication Methods 0.000 description 12
- 230000009368 gene silencing by RNA Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 11
- 239000004055 small Interfering RNA Substances 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 10
- 230000006978 adaptation Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000005304 joining Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 229920002477 rna polymer Polymers 0.000 description 4
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 3
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N aldehydo-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Angela Reynolds他著、"Rational siRNA design for RNA interference"、Nature Biotechnology、Published online 1 February 2004. 杉本直己著、"遺伝子化学"、19ページ、株式会社化学同人発行、2002年
実施形態について説明する前に、本発明の概要をいくつかの節に分けて説明する。
図4(A)は、エクソンの塩基配列の和集合を説明するための図である。図4(A)には、図3(A)のように、4本のDNA配列の部分が示されているが、これらは、一つのDNA配列全体の一部を示しており、同じ部分の塩基配列が、上下に対応するように示されている。エクソン301、302、303、304、305、306が図のような関係にあるとする。すなわち、エクソン301と重なり、又は、包含関係にあるエクソンは他になく、エクソン302の一部として、エクソン304があり、エクソン303の一部にエクソン305、306があるとする。このような場合に、これらのエクソンの和集合として、配列401、402、403が得られる。すなわち、配列401は、エクソン301そのものであり、配列402は、エクソン302とエクソン304との和である。このエクソン304は、エクソン302の一部であるので、配列402は、エクソン302そのものとなる。同様に、配列403は、エクソン303そのものとなる。図4においては、エクソン302とエクソン304との関係のように、あるエクソンが他のエクソンを包含している関係にある場合が示されている。他の関係としては、包含ではなく、二つのエクソンの塩基配列の一部だけ重なっている場合がある。この場合については、後に図6、図7などを用いて説明する。
図4の下部は、境界塩基配列を説明するための図である。エクソン301とエクソン302とが接合して発現遺伝子を構成する場合、その接合における境界の左右の部分404と405とを接合した塩基配列が、境界塩基配列となる。同様に、エクソン302とエクソン303とが接合する場合、部分406と407を接合した塩基配列が、境界塩基配列となる。なお、ここでの境界塩基配列の長さは、発現遺伝子配列に特異的に現れるかどうかを調べるための検索が行なわれる塩基配列の長さである。その長さをNとすると、境界塩基配列は、N−1通りあることになる。
図6は、塩基配列の統合を説明するための図である。すなわち、塩基配列601と塩基配列602とが、部分603の重なっている関係にある場合、塩基配列601と塩基配列602とを統合して、塩基配列604が得られることが示されている。塩基配列604は、塩基配列601から部分603を除いた部分、部分603、塩基配列602から部分603を除いた部分の3つを接合することにより得られる。
図7は、統合を正確に説明するための図である。図7の上部に示すように、DNAの塩基配列を構成する塩基は、DNAの端(例えば、DNAの化学構造により、「5´末端」と呼ばれる端)の塩基を1として順に番号を付けることができる。例えば、端点701を5´末端とし、端点702を3´末端として、端点701の塩基より、1、2、3、…のように塩基に番号をつけることができる。このような番号を、塩基位置ということにする。図7の下部703において、例えば、塩基配列704に現れる塩基Aの上に1024が付されているのは、その塩基Aは、DNAの5´末端より、1024番目に現れることを示す。塩基配列704と705とが、一部だけが重なっている関係にあるとする。すなわち、塩基配列1026番目と1027番目との部分重なっている。この場合、塩基配列704と705とを統合することにより、塩基配列706が得られる。
図10は、二つのエクソンが接合して発現遺伝子を構成する場合におけるN−1通りの境界塩基配列を統合した塩基配列の求め方を例示する。エクソン1001とエクソン1002とが接合して発現遺伝子を構成するとする。この場合、エクソン1001とエクソン1002との境界における境界塩基配列を統合した塩基配列は、エクソン1001の右端のN−1merの塩基配列1003と、エクソン1002の左端のN−1merの塩基配列1004を接合した2N−2merの塩基配列となる。ただし、図10においては、エクソン1001とエクソン1002のそれぞれの長さがN−1mer以上である必要がある。
図11は、長さがN−1mer未満のエクソンが存在する場合を例示する。図11において、符号1101、1102、1103、1104を付した部分がエクソンであるとし、エクソン1101、1102、1103が接合して一つの発現遺伝子を構成し、エクソン1101、1102、1104が接合して別の発現遺伝子を構成するとする。また、エクソン1102の長さはN−1mer未満とし、エクソン1103とエクソン1104は、一部が重なった関係にあるとする。符合1105、1106、1107、1108を付した部分はイントロンであるとする。
図12は、統合の操作を行なうために使用するテーブルを例示する。テーブルは、「発現遺伝子」、「左端位置」、「右端位置」の列からなっている。「発現遺伝子」の列は、境界塩基配列が現れる発現遺伝子を識別する識別子を格納する。図12では、発現遺伝子を構成するエクソンの符号を並べたものにより、そのような識別子が表わされている。「左端位置」と「右端位置」とは、図8のテーブルにおける意味と同じ意味を持ち、境界塩基配列の左端の塩基の位置と、右端の塩基の位置と、を格納する。なお、統合の操作も、計算機でプログラムを動作させることにより実行することが可能である。その場合、テーブルは、データベース管理システムにより管理されて操作が行なわれるようになっていてもよい。また、そのようなプログラムはフレキシブルディスク、光ディスク、メモリスティックなどの媒体に記録することもできる。
図14は、本発明の実施形態1に係る塩基配列集合生成方法の処理のフローチャートを例示する。本実施形態に係る塩基配列集合生成方法は、候補塩基長取得ステップと、エクソン塩基配列集合取得ステップと、境界塩基配列集合生成ステップと、和集合生成ステップと、を含む。これらのステップは、図14に例示されたフローチャートのS1401、S1402、S1403、S1404にそれぞれ対応する。以下の説明から分かるように、これらのステップは、計算機にプログラムを動作させて実行させることが可能である。また、そのようなプログラムをフレキシブルディスク、光ディスク、メモリスティックなどの媒体に記録することも可能である。
図16は、本発明の実施形態2に係る特異的塩基配列探索方法のフローチャートを例示する。本実施形態に係る特異的塩基配列探索方法は、特異的塩基配列候補取得ステップと、塩基配列検索ステップと、判断ステップと、を含む。以下の説明から分かるように、これらのステップは、プログラムによって計算機に実行させることが可能である。また、そのようなプログラムをフレキシブルディスク、光ディスク、メモリスティックなどの媒体に記録することも可能である。
本発明の実施形態3は、実施形態2に係る特異的塩基配列探索方法において、境界塩基配列の集合を、第四節、第七節にあるように塩基配列の統合をして得られる集合としたものである。
本発明の実施形態4は、実施形態2または3に係る特異的塩基配列探索方法に、適合許容数取得ステップを含ませた特異的塩基配列探索方法である。
本発明の実施形態5として、塩基配列検索ステップにて不適合と判断する塩基の対を取得するステップを含む特異的塩基配列探索方法について説明する。
本発明の実施形態6として、塩基の不適合の発生の分布を指定して検索を行なう特異的塩基配列探索方法について説明する。
本発明の実施形態7に係る特異的塩基配列探索方法は、実施形態2から6のいずれか一の特異的塩基配列探索方法において、特異的塩基配列候補を、マイクロアレイのオリゴDNAの塩基配列の候補とした方法である。
本発明の実施形態8に係る特異的塩基配列探索方法は、実施形態2から6のいずれか一の特異的塩基配列探索方法において、特異的塩基配列候補を、siRNAの塩基配列の候補とした特異的塩基配列探索方法である。
図19は、本発明の実施形態9に係る特異的塩基配列探索装置の機能ブロック図を例示する。本実施形態に係る特異的塩基配列探索装置は、例えば実施形態2に係る特異的塩基配列探索方法を使用するための装置である。
本発明の実施形態10は、実施形態9の特異的塩基配列探索装置において、境界塩基配列集合を、複数のエクソンから構成される発現遺伝子におけるエクソンの境界にまたがって存在する塩基配列を示す情報であって、前記特異的塩基配列候補の塩基配列の長さと同じ長さの塩基配列を示す情報、からなる集合に対して、発現遺伝子が同じで、塩基配列の位置が重複する塩基配列を示す情報を統合することにより得られる集合に基づいて得られるものとした特異的塩基配列探索装置である。本実施形態に係る特異的塩基配列探索装置は、例えば実施形態3に係る特異的塩基配列探索方法を使用するための装置である。
図20は、本発明の実施形態11に係る特異的塩基配列探索装置の機能ブロック図を例示する。特異的塩基配列探索装置2000は、塩基配列集合蓄積部1901と、特異的塩基配列候補取得部1902と、塩基配列検索部1903と、適合許容数取得部2001と、を有する。したがって、本実施形態に係る特異的塩基配列探索装置は、実施形態9または10に係る特異的塩基配列探索装置が適合許容数取得部を有した構成となっている。なお、本明細書においては、同じ定義が適用できる部には、同じ符号を割り当てることとする。ただし、実際の製造においては、同じ符号が割り当てられているからといって、つくりなどが同じになるとは限らない。なお、本実施形態に係る特異的塩基配列探索装置は、例えば実施形態4に係る特異的塩基配列探索方法を使用するための装置である。
図21は、本発明の実施形態12に係る特異的塩基配列探索装置の機能ブロック図を例示する。特異的塩基配列探索装置2100は、塩基配列集合蓄積部1901と、特異的塩基配列候補取得部1902と、塩基配列検索部1903と、適合許容数取得部2001と、不適合塩基対取得部2101と、を有する。したがって、本実施形態に係る特異的塩基配列探索装置は、実施形態11に係る特異的塩基配列探索装置が、さらに、不適合塩基対取得部2101を有する構成となっている。本実施形態に係る特異的塩基配列探索装置は、例えば実施形態5に係る特異的塩基配列探索方法を使用するための装置である。
図22は、本発明の実施形態13に係る特異的塩基配列探索装置の機能ブロック図を例示する。特異的塩基配列探索装置2200は、塩基配列集合蓄積部1901と、特異的塩基配列候補取得部1902と、塩基配列検索部1903と、適合許容数取得部2001と、不適合分布情報取得部2201と、を有する。また、特異的塩基配列探索装置2200は、さらに、不適合塩基対取得部を有していてもよい。したがって、本実施形態に係る特異的塩基配列探索装置は、実施形態9から12のいずれかに係る特異的塩基配列探索装置が、不適合分布情報取得部2201を有した構成となっている。本実施形態に係る特異的塩基配列探索装置は、例えば実施形態6に係る特異的塩基配列探索方法を使用するための装置である。
本発明の実施形態14は、塩基配列集合保持装置である。すなわち、エクソンの塩基配列の和集合と、複数のエクソンから構成される発現遺伝子におけるエクソンの境界にまたがって存在する塩基配列である境界塩基配列の集合と、の和集合を含む集合である塩基配列集合を、検索可能に保持する装置である。
本発明の実施形態15は、実施形態14の塩基配列集合保持装置において、保持される境界塩基配列の集合を、複数のエクソンから構成される発現遺伝子におけるエクソンの境界にまたがって存在する塩基配列を示す情報であって、検索の入力となる塩基配列の長さと同じ長さの塩基配列を示す情報、からなる集合に対して、発現遺伝子が同じで、塩基配列の位置が重複する塩基配列を示す情報を統合することにより得られる集合に基づいて得られるものとした、塩基配列集合保持装置である。すなわち、実施形態10に係る特異的塩基配列探索装置の塩基配列集合蓄積部を、別の装置とした形態である。例えば、実施形態10に係る特異的塩基配列探索装置の塩基配列集合蓄積部に蓄積されるデータを、NAS(Network Attached Storage)やSAN(Storage Area Network)に蓄積させることにより得られる形態である。
302 エクソン
303 エクソン
304 エクソン
305 エクソン
306 エクソン
401 エクソンの和集合の一要素
402 エクソンの和集合の一要素
403 エクソンの和集合の一要素
404 境界塩基配列の一部
405 境界塩基配列の一部
406 境界塩基配列の一部
407 境界塩基配列の一部
Claims (16)
- 特異的塩基配列探索装置が、所定の遺伝子群を構成する塩基配列の集合において特異的塩基配列を探索する特異的塩基配列探索方法であって、
前記特異的塩基配列探索装置は、塩基配列集合蓄積部と特異的塩基配列探索部とを有し、
前記塩基配列集合蓄積部は、前記遺伝子群のエクソン内の塩基配列の集合と、前記遺伝子群の中で複数のエクソンから構成される遺伝子において、隣接する当該エクソンの境界にまたがって存在する境界塩基配列の集合と、を含む和集合を格納し、
前記特異的塩基配列探索部が、
前記塩基配列集合蓄積部から、当該和集合を得るステップと、
当該和集合において、前記特異的塩基配列を検索する特異的塩基配列検索ステップと、
を含む特異的塩基配列探索方法。 - 前記和集合に含まれる塩基配列には、当該塩基配列が含まれる各エクソンの配列位置を示す情報または当該塩基配列が含まれる遺伝子を識別する情報を含む属性情報が関連付けられている請求項1に記載の特異的塩基配列探索方法。
- 前記和集合において、前記境界塩基配列が重複している場合、前記特異的塩基配列探索装置が、当該重複する塩基配列を示す情報を統合するステップをさらに含む、請求項1または2に記載の特異的塩基配列探索方法。
- 塩基の不適合を許容して、前記特異的塩基配列が検索される、請求項1から3のいずれか1項に記載の特異的塩基配列探索方法。
- 前記特異的塩基配列探索装置が、前記検索によって複数の塩基配列が同定されるかどうかに基づいて、当該塩基配列が一つの遺伝子にのみ存在するかどうか決定するステップをさらに含む、請求項1から4のいずれか1項に記載の特異的塩基配列探索方法。
- 所定の遺伝子群を構成する塩基配列の集合において特異的塩基配列を探索する特異的塩基配列探索装置であって、
前記遺伝子群のエクソン内の塩基配列の集合と、
前記遺伝子群の中で複数のエクソンから構成される遺伝子において、隣接する当該エクソンの境界にまたがって存在する境界塩基配列の集合と、
を含む塩基配列の和集合を保持する塩基配列集合蓄積部と、
前記塩基配列集合蓄積部に蓄積された塩基配列の和集合を得て、当該和集合において前記特異的塩基配列を検索する塩基配列検索部と、
を有する特異的塩基配列探索装置。 - 前記和集合に含まれる塩基配列には、当該塩基配列が含まれるエクソンの配列位置を示す情報または当該塩基配列が含まれる遺伝子を識別する情報を含む属性情報が関連付けられている請求項6に記載の特異的塩基配列探索装置。
- 前記境界塩基配列が重複している場合、当該重複する塩基配列を示す情報を統合する、請求項6または7に記載の特異的塩基配列探索装置。
- 塩基の不適合を許容して、前記特異的塩基配列が検索される、請求項6から8のいずれか1項に記載の特異的塩基配列探索装置。
- 塩基配列集合蓄積部を有する計算機であって、
所定の遺伝子群のエクソン内の塩基配列の集合と、
前記遺伝子群の中で複数のエクソンから構成される遺伝子において、隣接する当該エクソンの境界にまたがって存在する境界塩基配列の集合と、をそれぞれ作製し、
前記塩基配列の集合と前記境界塩基配列の集合との和集合を作製し、
前記塩基配列集合蓄積部が、
前記和集合を検索可能に保持する計算機。 - 前記和集合に含まれる塩基配列には、当該塩基配列が含まれるエクソンの配列位置を示す情報または当該塩基配列が含まれる遺伝子を識別する情報を含む属性情報が関連付けられている請求項10に記載の計算機。
- 前記境界塩基配列が重複している場合、当該重複する塩基配列を示す情報を統合する、請求項10または11に記載の計算機。
- 塩基配列集合蓄積部を有する計算機が、塩基配列の集合を生成する方法であって、
前記計算機が、所定の遺伝子群のエクソンの塩基配列の集合を取得する塩基配列集合取得ステップと、
前記計算機が、前記遺伝子群の中で複数のエクソンから構成される遺伝子において、隣接する当該エクソンの境界にまたがって存在する境界塩基配列の集合を取得する境界塩基配列集合取得ステップと、
前記計算機が、前記塩基配列集合取得ステップで取得された塩基配列の集合と、前記境界塩基配列集合生成ステップで取得された塩基配列の集合との和集合を生成する和集合生成ステップと、
前記塩基配列集合蓄積部が、前記和集合生成ステップで生成された和集合を格納する格納ステップと、を含む塩基配列集合生成方法。 - 所定の遺伝子群において特異的塩基配列を探索する特異的塩基配列探索装置に、
前記遺伝子群のエクソン内の塩基配列の集合と、
前記遺伝子群の中で複数のエクソンから構成される遺伝子において、隣接する当該エクソンの境界にまたがって存在する境界塩基配列の集合と、
を含む塩基配列の和集合の中から、前記特異的塩基配列を検索する特異的塩基配列検索ステップと、
を実行させるための特異的塩基配列探索プログラム - 計算機に、
所定の遺伝子群のエクソンの塩基配列の集合を取得する塩基配列集合取得ステップと、
前記遺伝子群の中で複数のエクソンから構成される遺伝子において、隣接する当該エクソンの境界にまたがって存在する境界塩基配列の集合を取得する境界塩基配列集合取得ステップと、
前記塩基配列集合取得ステップで取得された塩基配列の集合と、前記境界塩基配列集合生成ステップで生成された塩基配列の集合との和集合を生成する和集合生成ステップと、
を実行させるための塩基配列集合生成プログラム。 - 複数の塩基配列が同定されるかどうかに基づいて、当該塩基配列が特定の遺伝子にのみ存在するかどうか決定するステップを、さらに実行させるための請求項14に記載の特異的塩基配列探索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006511480A JP4991287B2 (ja) | 2004-03-26 | 2005-03-23 | 特異的塩基配列探索方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004093301 | 2004-03-26 | ||
JP2004093301 | 2004-03-26 | ||
PCT/JP2005/005290 WO2005093631A1 (ja) | 2004-03-26 | 2005-03-23 | 特異的塩基配列探索方法 |
JP2006511480A JP4991287B2 (ja) | 2004-03-26 | 2005-03-23 | 特異的塩基配列探索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2005093631A1 JPWO2005093631A1 (ja) | 2008-02-14 |
JP4991287B2 true JP4991287B2 (ja) | 2012-08-01 |
Family
ID=35056388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006511480A Active JP4991287B2 (ja) | 2004-03-26 | 2005-03-23 | 特異的塩基配列探索方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20070202504A1 (ja) |
EP (1) | EP1732021A4 (ja) |
JP (1) | JP4991287B2 (ja) |
WO (1) | WO2005093631A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080250016A1 (en) * | 2007-04-04 | 2008-10-09 | Michael Steven Farrar | Optimized smith-waterman search |
US9430526B2 (en) * | 2008-09-29 | 2016-08-30 | Teradata Us, Inc. | Method and system for temporal aggregation |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001258568A (ja) * | 2000-03-22 | 2001-09-25 | Hitachi Ltd | プライマー設計システム |
JP2003256434A (ja) * | 2002-02-28 | 2003-09-12 | Hitachi Ltd | スプライスバリアント比較表示方法 |
US20040018506A1 (en) * | 2002-01-25 | 2004-01-29 | Koehler Ryan T. | Methods for placing, accepting, and filling orders for products and services |
-
2005
- 2005-03-23 US US10/593,753 patent/US20070202504A1/en not_active Abandoned
- 2005-03-23 EP EP05721340A patent/EP1732021A4/en not_active Withdrawn
- 2005-03-23 JP JP2006511480A patent/JP4991287B2/ja active Active
- 2005-03-23 WO PCT/JP2005/005290 patent/WO2005093631A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001258568A (ja) * | 2000-03-22 | 2001-09-25 | Hitachi Ltd | プライマー設計システム |
US20040018506A1 (en) * | 2002-01-25 | 2004-01-29 | Koehler Ryan T. | Methods for placing, accepting, and filling orders for products and services |
JP2005516300A (ja) * | 2002-01-25 | 2005-06-02 | アプレラ コーポレイション | 製品およびサービスに対する注文を発注し、受理し、および充足する方法 |
JP2003256434A (ja) * | 2002-02-28 | 2003-09-12 | Hitachi Ltd | スプライスバリアント比較表示方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2005093631A1 (ja) | 2008-02-14 |
EP1732021A1 (en) | 2006-12-13 |
US20070202504A1 (en) | 2007-08-30 |
WO2005093631A1 (ja) | 2005-10-06 |
EP1732021A4 (en) | 2009-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Avsec et al. | Effective gene expression prediction from sequence by integrating long-range interactions | |
Hsu et al. | Integrating high dimensional bi-directional parsing models for gene mention tagging | |
Pliatsika et al. | MINTbase: a framework for the interactive exploration of mitochondrial and nuclear tRNA fragments | |
Prüfer et al. | PatMaN: rapid alignment of short sequences to large databases | |
Li et al. | Fast and accurate long-read alignment with Burrows–Wheeler transform | |
Siragusa et al. | Fast and accurate read mapping with approximate seeds and multiple backtracking | |
Chu et al. | Innovations and challenges in detecting long read overlaps: an evaluation of the state-of-the-art | |
Kamal et al. | De-Bruijn graph with MapReduce framework towards metagenomic data classification | |
WO2015061099A1 (en) | Systems and methods for transcriptome analysis | |
Panigrahi et al. | FusionHub: a unified web platform for annotation and visualization of gene fusion events in human cancer | |
US20200135301A1 (en) | Systems and methods for aligning sequences to graph references | |
Liu et al. | Fast detection of maximal exact matches via fixed sampling of query K-mers and Bloom filtering of index K-mers | |
Kumar et al. | PresRAT: a server for identification of bacterial small-RNA sequences and their targets with probable binding region | |
Machné et al. | Similarity-based segmentation of multi-dimensional signals | |
Frid et al. | A simple, practical and complete O-time Algorithm for RNA folding using the Four-Russians Speedup | |
Vineetha et al. | SPARK-MSNA: Efficient algorithm on Apache Spark for aligning multiple similar DNA/RNA sequences with supervised learning | |
Sadiq et al. | NvPD: novel parallel edit distance algorithm, correctness, and performance evaluation | |
JP4614949B2 (ja) | 塩基配列検索装置及び塩基配列検索方法 | |
Monsu et al. | Fast alignment of reads to a variation graph with application to SNP detection | |
Salmela et al. | Fast and accurate correction of optical mapping data via spaced seeds | |
Tsybulskyi et al. | ShapeSorter: a fully probabilistic method for detecting conserved RNA structure features supported by SHAPE evidence | |
JP4991287B2 (ja) | 特異的塩基配列探索方法 | |
Mann et al. | Memory-efficient RNA energy landscape exploration | |
Choyon et al. | PRESa2i: incremental decision trees for prediction of adenosine to inosine RNA editing sites | |
Yamamoto et al. | dsRID: in silico identification of dsRNA regions using long-read RNA-seq data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071201 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100219 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101116 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110117 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111014 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4991287 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |