JP2022519786A - 生物学的配列情報の取り扱い - Google Patents
生物学的配列情報の取り扱い Download PDFInfo
- Publication number
- JP2022519786A JP2022519786A JP2021569592A JP2021569592A JP2022519786A JP 2022519786 A JP2022519786 A JP 2022519786A JP 2021569592 A JP2021569592 A JP 2021569592A JP 2021569592 A JP2021569592 A JP 2021569592A JP 2022519786 A JP2022519786 A JP 2022519786A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- biological
- characteristic
- repository
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000036961 partial effect Effects 0.000 claims abstract description 137
- 238000000034 method Methods 0.000 claims description 118
- 229920001222 biopolymer Polymers 0.000 claims description 24
- 239000003550 marker Substances 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 abstract description 2
- 230000008901 benefit Effects 0.000 description 39
- 108090000623 proteins and genes Proteins 0.000 description 32
- 102000004169 proteins and genes Human genes 0.000 description 32
- 108020004414 DNA Proteins 0.000 description 22
- 102000053602 DNA Human genes 0.000 description 22
- 229920002477 rna polymer Polymers 0.000 description 21
- 238000013459 approach Methods 0.000 description 20
- 150000001413 amino acids Chemical class 0.000 description 16
- 239000012634 fragment Substances 0.000 description 14
- 238000002869 basic local alignment search tool Methods 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 238000013507 mapping Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000002887 multiple sequence alignment Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- AZUYLZMQTIKGSC-UHFFFAOYSA-N 1-[6-[4-(5-chloro-6-methyl-1H-indazol-4-yl)-5-methyl-3-(1-methylindazol-5-yl)pyrazol-1-yl]-2-azaspiro[3.3]heptan-2-yl]prop-2-en-1-one Chemical compound ClC=1C(=C2C=NNC2=CC=1C)C=1C(=NN(C=1C)C1CC2(CN(C2)C(C=C)=O)C1)C=1C=C2C=NN(C2=CC=1)C AZUYLZMQTIKGSC-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/10—Ontologies; Annotations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/50—Compression of genetic data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
Abstract
Description
実施例1a:タンパク質データバンクの分析-そこで発見されたHYFT(商標)フィンガープリントに関して
生物学的配列データベースにおけるHYFT(商標)フィンガープリントの広範な存在を例示するために、タンパク質データバンク(PDB)を、大規模で一般に利用可能な生物学的配列データベースの例として取り上げ、本発明に従って、上に記載のように得られたフィンガープリントデータストリングのリポジトリを使用して、処理した。様々な指標に関して結果を分析し、その選択を以下に提示する。
本発明に従って生物学的配列を処理する際に異なる戦略を用いることができるため、2つの異なるアプローチの違いを調べた。第1のアプローチでは、PDBデータベースの生物学的配列を、HYFT(商標)フィンガープリントの重複を含むHYFT(商標)フィンガープリントのすべての出現について、HYFT(商標)フィンガープリントが重要でなくなる順序で、検索した。第2のアプローチでは、PDBデータベースの生物学的配列を、より厳密な様式を使用して検索した。検索は、最長から最短へのHYFT(商標)フィンガープリントの順序で、同じ長さの場合、最小から最大への組み合わせ数の順序で実行され、HYFT(商標)の重複は許されない(すなわち、HYFT(商標)に対応していることが見出される部分は、その後、さらなるHYFT(商標)の検索では除外される)。第2のアプローチの目標は、オーバーラップを許容せず、余り厳しくないHYFT(商標)(すなわち、組み合わせ数がより大きく、長さがより短い)に対して、よりもより厳しいHYFT(商標)(すなわち、組み合わせ数がより小さく、長さがより長い)を優先することによって、良好なカバレッジを確保しながら、処理された生物学的配列を記述する最小の数のHYFT(商標)を特定することである。
実施例2a:短い検索ストリングを使用すること
検索ストリング「AVFPSIVGRPRHQGVMVGMGQKDSY」に基づいて、2つの別個の検索を行った。これは、25配列単位の長さを有する比較的短いタンパク質配列に対応し、例えば、タンパク質配列決定におけるタンパク質断片であり得る。
前の実施例の繰り返しになるが、今度は、完全なタンパク質配列である3MN5_A(359配列単位の長さを有する)を検索した。
+4641474444415052415646_1、+495647525052485147564d_1、
+4949544e5744444d454b49_1、+494d464554464e5650414d_1、
+494b454b4c435956414c44_1、および+49474d4553414749484554_1。
ここで、例えば、「49474d4553414749484554」は、それぞれの16進数形式での部分配列に対応する。したがって、第2の検索は、前の実施例と同じ処理された生物学的配列のリポジトリにおいて、同じ順序で同じ6つの特徴的な生物学的部分配列を含むそれらのタンパク質配列を見つけるために実行された。この検索では、661件の結果が返された。
Claims (16)
- 生物学的配列データベースのためのフィンガープリントデータストリングのリポジトリ(100)であって、各フィンガープリントデータストリングは、配列単位から構成される特徴的な生物学的部分配列を表し、各特徴的な生物学的部分配列は、前記生物学的配列データベース中に、それに利用可能な異なる配列単位の総数よりも少ない組み合わせ数を有し、生物学的部分配列の前記組み合わせ数は、前記生物学的配列データベース中に、前記生物学的部分配列の連続した配列単位として現れる異なる配列単位の数として定義される、リポジトリ。
- 前記リポジトリが、少なくとも、
-第1の長さの第1の特徴的な生物学的部分配列を表す第1のフィンガープリントデータストリングと、
-第2の長さの第2の特徴的な生物学的部分配列を表す第2のフィンガープリントデータストリングと、を含み、
前記第1の長さおよび前記第2の長さが、4以上であり、前記第1の長さおよび前記第2の長さが、互いに異なる、請求項1に記載のフィンガープリントデータストリングのリポジトリ(100)。 - 前記フィンガープリントデータストリングのうちの少なくとも1つに関して、
-前記特徴的な生物学的部分配列が生物学的配列に存在する場合、前記特徴的な生物学的部分配列に連続し得る1つ以上の配列単位に関連するデータ、ならびに/または
-前記特徴的な生物学的部分配列がバイオポリマーに存在する場合、前記特徴的な生物学的部分配列の二次構造、および/もしくは三次構造、および/もしくは四次構造に関連するデータ、ならびに/または
-前記特徴的な生物学的部分配列と1つ以上のさらなる特徴的な生物学的部分配列との間の関係に関連するデータ、をさらに含む、請求項1または2に記載のフィンガープリントデータストリングのリポジトリ(100)。 - 請求項1~3のいずれかで定義されるフィンガープリントデータストリングのリポジトリ(100)を構築および/または更新するためのコンピュータ実装方法であって、
a.生物学的配列データベースの特徴的な生物学的部分配列を識別することであって、前記特徴的な生物学的部分配列が、それに利用可能な異なる配列単位の総数よりも少ない組み合わせ数を有し、生物学的部分配列の前記組み合わせ数が、前記生物学的配列データベース中に、前記生物学的部分配列の連続した配列単位として現れる異なる配列単位の数として定義される、識別することと、
b.任意選択的に、前記識別された特徴的な生物学的部分配列を、1つ以上のさらなる特徴的な生物学的部分配列に翻訳することと、
c.前記リポジトリ(100)に、前記識別された特徴的な生物学的部分配列および/または前記1つ以上のさらなる特徴的な生物学的部分配列を表す1つ以上のフィンガープリントデータストリングを入力することと、を含む、コンピュータ実装方法。 - 生物学的配列(200)を処理するためのコンピュータ実装方法であって、
a.請求項1~3のいずれかで定義されるフィンガープリントデータストリングのリポジトリから、1つ以上のフィンガープリントデータストリングを取得することと、
b.前記1つ以上のフィンガープリントデータストリングによって表される前記特徴的な生物学的部分配列の出現について、前記生物学的配列を検索することと、
c.ステップbにおける各出現について、前記出現する特徴的な生物学的部分配列を表す前記フィンガープリントデータストリングと関連付けられたフィンガープリントマーカーを含む、処理された生物学的配列(210)を構築することと、を含む、コンピュータ実装方法。 - 前記生物学的配列(200)が、
i.1つ以上の第1の部分であって、各第1の部分が、前記1つ以上のフィンガープリントデータストリングによって表される前記特徴的な生物学的部分配列のうちの1つに対応する、1つ以上の第1の部分と、
ii.1つ以上の第2の部分であって、各第2の部分が、前記1つ以上のフィンガープリントデータストリングによって表される前記特徴的な生物学的部分配列のいずれにも対応しない、1つ以上の第2の部分と、を含み、
ステップcにおいて前記処理された生物学的配列(210)を構築することが、少なくとも1つの第1の部分を、対応するマーカーによって置き換えることを含む、請求項5に記載のコンピュータ実装方法。 - ステップbにおける前記特徴的な生物学的部分配列の出現についての前記検索が、最長から最短への特徴的な生物学的部分配列の順序で実行され、同じ長さの特徴的な生物学的部分配列の場合、最小から最大への組み合わせ数の順序で実行される、請求項5または6に記載のコンピュータ実装方法。
- フィンガープリントデータストリングが、本質的に方向付けられ、位置情報を含み、ステップcが、前記処理された生物学的配列(210)を有向グラフとして構築することを含む、請求項5または6に記載のコンピュータ実装方法。
- 請求項5~8のいずれかに記載のコンピュータ実装方法により得ることが可能な、処理された生物学的配列(210)。
- 処理された生物学的配列のリポジトリ(220)を構築および/または更新するためのコンピュータ実装方法であって、前記リポジトリ(220)に、請求項9で定義される処理された生物学的配列(210)を入力することを含む、コンピュータ実装方法。
- 請求項10に記載のコンピュータ実装方法によって得ることが可能な、処理された生物学的配列のリポジトリ(220)。
- 第1の生物学的配列を第2の生物学的配列と比較するためのコンピュータ実装方法であって、
a.請求項5~8のいずれかに記載のコンピュータ実装方法によって、前記第1の生物学的配列を処理して、第1の処理された生物学的配列(211)を得ること、または請求項11で定義される処理された生物学的配列のリポジトリ(220)から、前記第1の処理された生物学的配列(211)を取得することと、
b.請求項5~8のいずれかに記載のコンピュータ実装方法によって、前記第2の生物学的配列を処理して、第2の処理された生物学的配列(212)を得ること、または請求項11で定義される処理された生物学的配列のリポジトリ(220)から、前記第2の処理された生物学的配列(212)を取得することと、
c.少なくとも、前記第1の処理された生物学的配列(211)の前記フィンガープリントマーカーを、前記第2の処理された生物学的配列(212)の前記フィンガープリントマーカーと比較することと、を含む、コンピュータ実装方法。 - ステップcが、前記第1の処理された生物学的配列(211)の前記フィンガープリントマーカーを、前記第2の処理された生物学的配列(212)の前記フィンガープリントマーカーと整列させることをさらに含む、請求項11に記載のコンピュータ実装方法。
- 請求項1もしくは3に記載のフィンガープリントデータストリングのリポジトリ(100)、および/または請求項11に記載の処理された生物学的配列のリポジトリ(220)を備える、記憶デバイス。
- 請求項4~8、10、または12~13のいずれかに記載のコンピュータ実装方法を実行するように適合されたデータ処理システム(310、320、330)。
- コンピュータによって実行された場合、前記コンピュータに、請求項4~8、10、または12~13のいずれかに記載のコンピュータ実装方法を実行させる命令を含む、コンピュータプログラムまたはコンピュータ可読媒体。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BE20195077A BE1027035B1 (nl) | 2019-02-07 | 2019-02-07 | Depot van vingerafdruk-datastrings |
EP19156085.3 | 2019-02-07 | ||
EP19156085.3A EP3693970A1 (en) | 2019-02-07 | 2019-02-07 | Biological sequence information handling |
BEBE2019/5077 | 2019-02-07 | ||
EP19190899 | 2019-08-08 | ||
EP19190899.5 | 2019-08-08 | ||
PCT/EP2020/053220 WO2020161344A1 (en) | 2019-02-07 | 2020-02-07 | Biological sequence information handling |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022519786A true JP2022519786A (ja) | 2022-03-24 |
JPWO2020161344A5 JPWO2020161344A5 (ja) | 2023-02-14 |
JP7352985B2 JP7352985B2 (ja) | 2023-09-29 |
Family
ID=69570650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021569592A Active JP7352985B2 (ja) | 2019-02-07 | 2020-02-07 | 生物学的配列情報の取り扱い |
Country Status (10)
Country | Link |
---|---|
US (1) | US20220199199A1 (ja) |
EP (2) | EP4250300A3 (ja) |
JP (1) | JP7352985B2 (ja) |
KR (1) | KR102614401B1 (ja) |
CN (1) | CN113454727A (ja) |
AU (1) | AU2020218104B2 (ja) |
CA (1) | CA3129108C (ja) |
IL (1) | IL285393A (ja) |
WO (1) | WO2020161344A1 (ja) |
ZA (1) | ZA202106380B (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060020397A1 (en) * | 2004-07-21 | 2006-01-26 | Kermani Bahram G | Methods for nucleic acid and polypeptide similarity search employing content addressable memories |
JP2007334769A (ja) * | 2006-06-16 | 2007-12-27 | Institute Of Physical & Chemical Research | 配列抽出装置、配列抽出方法、プログラムおよび記録媒体 |
JP2015197899A (ja) * | 2014-04-03 | 2015-11-09 | 株式会社日立ハイテクノロジーズ | 配列データ解析装置、dna解析システムおよび配列データ解析方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140089328A1 (en) | 2012-09-27 | 2014-03-27 | International Business Machines Corporation | Association of data to a biological sequence |
-
2020
- 2020-02-07 CA CA3129108A patent/CA3129108C/en active Active
- 2020-02-07 KR KR1020217027414A patent/KR102614401B1/ko active IP Right Grant
- 2020-02-07 WO PCT/EP2020/053220 patent/WO2020161344A1/en unknown
- 2020-02-07 EP EP23164752.0A patent/EP4250300A3/en active Pending
- 2020-02-07 CN CN202080015463.9A patent/CN113454727A/zh active Pending
- 2020-02-07 JP JP2021569592A patent/JP7352985B2/ja active Active
- 2020-02-07 US US17/428,357 patent/US20220199199A1/en active Pending
- 2020-02-07 AU AU2020218104A patent/AU2020218104B2/en active Active
- 2020-02-07 EP EP20704821.6A patent/EP3881326B1/en active Active
-
2021
- 2021-08-04 IL IL285393A patent/IL285393A/en unknown
- 2021-09-01 ZA ZA2021/06380A patent/ZA202106380B/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060020397A1 (en) * | 2004-07-21 | 2006-01-26 | Kermani Bahram G | Methods for nucleic acid and polypeptide similarity search employing content addressable memories |
JP2007334769A (ja) * | 2006-06-16 | 2007-12-27 | Institute Of Physical & Chemical Research | 配列抽出装置、配列抽出方法、プログラムおよび記録媒体 |
JP2015197899A (ja) * | 2014-04-03 | 2015-11-09 | 株式会社日立ハイテクノロジーズ | 配列データ解析装置、dna解析システムおよび配列データ解析方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4250300A2 (en) | 2023-09-27 |
EP4250300A3 (en) | 2023-12-06 |
JP7352985B2 (ja) | 2023-09-29 |
US20220199199A1 (en) | 2022-06-23 |
KR102614401B1 (ko) | 2023-12-14 |
AU2020218104B2 (en) | 2024-03-28 |
EP3881326B1 (en) | 2023-04-05 |
CA3129108A1 (en) | 2020-08-13 |
EP3881326A1 (en) | 2021-09-22 |
ZA202106380B (en) | 2023-08-30 |
AU2020218104A1 (en) | 2021-08-12 |
KR20210126031A (ko) | 2021-10-19 |
CA3129108C (en) | 2023-09-05 |
IL285393A (en) | 2021-09-30 |
CN113454727A (zh) | 2021-09-28 |
WO2020161344A1 (en) | 2020-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Canzar et al. | Short read mapping: an algorithmic tour | |
Berger et al. | Computational solutions for omics data | |
CA2839802A1 (en) | Methods and systems for data analysis | |
WO2008156773A1 (en) | Biological database index and query searching | |
Sternberg | PROMOT: a FORTRAN program to scan protein sequences against a library of known motifs | |
Soares et al. | Sequence comparison alignment-free approach based on suffix tree and L-words frequency | |
JP2022519686A (ja) | 生物学的配列決定 | |
JP2022519786A (ja) | 生物学的配列情報の取り扱い | |
JP2022521052A (ja) | 生物学的情報の取り扱い | |
EP3693970A1 (en) | Biological sequence information handling | |
Esmat et al. | A parallel hash‐based method for local sequence alignment | |
Nicolas et al. | Finding and characterizing repeats in plant genomes | |
Runge et al. | RnaBench: A Comprehensive Library for In Silico RNA Modelling | |
Pavesi et al. | Methods for pattern discovery in unaligned biological sequences | |
Shih et al. | BiMFG: Bioinformatics tools for marine and freshwater species | |
Chen et al. | Comparative Analysis on Alignment-Based and Pretrained Feature Representations for the Identification of DNA-Binding Proteins | |
Caldonazzo Garbelini et al. | biomapp:: chip: Large-Scale Motif Analysis | |
Hřivňák et al. | Fast Hybrid Data Structure for a Large Alphabet K-Mers Indexing for Whole Genome Alignment | |
Rabea et al. | SuffixAligner: A Python-based Aligner for Long Noisy Reads | |
Vanitha et al. | An Improved Alignment-Free Method for Oculocutaneous Albinism Sequence Analysis | |
Wu | Kmer-based sequence representations for fast retrieval and comparison | |
Sanghvi | IFREE: An indexed forest of representer expressions extractor for position frequency matrices to rapidly detect sequence motifs | |
KUMAR | Finding Sequential Patterns From Biological Sequences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230206 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230206 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230911 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7352985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |