JP2005190427A - 配列を同定するための変異要素のセット抽出方法 - Google Patents
配列を同定するための変異要素のセット抽出方法 Download PDFInfo
- Publication number
- JP2005190427A JP2005190427A JP2003434554A JP2003434554A JP2005190427A JP 2005190427 A JP2005190427 A JP 2005190427A JP 2003434554 A JP2003434554 A JP 2003434554A JP 2003434554 A JP2003434554 A JP 2003434554A JP 2005190427 A JP2005190427 A JP 2005190427A
- Authority
- JP
- Japan
- Prior art keywords
- elements
- calculation
- information
- sequence
- processing method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
Abstract
【解決手段】 複数の配列データにおいて特定配列を識別可能な要素(配列部位)に関する情報を取得するための情報処理方法であって、類似の配列を持つ共通領域においてアライメントされたデータを取得するステップと、前記アライメントされたデータそれぞれに同一の演算を行い、該演算結果に基づいて識別可能な要素の候補を取得するステップと、を有することを特徴とする情報処理方法。
【選択図】 図1
Description
類似の配列を持つ共通領域においてアライメントされたデータを取得するステップと、
前記アライメントされたデータそれぞれに同一の演算を行い、該演算結果に基づいて識別可能な要素の候補を取得するステップと、
を有することを特徴とする。
(1)共通領域においてアライメントされたデータを取得するステップ。
(2)前記アライメントされたデータに所定の演算を行い、該演算結果に基づいて識別可能な要素の候補を取得するステップ。
まず、共通領域においてアライメントされたデータを取得する。対象となる複数の配列データに対してそれぞれアライメント処理を行い、共通領域においてアライメント処理がされた配列情報データを取得する。この共通領域は、予め範囲を指定しても良いし、アライメント処理が行なわれた後で、共通領域部分のデータのみを抽出してもよい。
ここでPは、ある任意の塩基配列mをもった文字列の行ベクトルbをたとえば
bm=(A,T,T,T,C,G,G,T,A,A,……)
のように定義するとき、行m=1,2,3…はそれぞれの塩基配列に対応し、
{P∈b1,b2,b3,……}
このとき定まるアライメント位置iにおける列ベクトルbi(列i=1,2,3…)も同じく
{P∈b1,b2,b3,……}
である。なおここでは個々の配列情報を行、アライメント位置情報を列として定義したが、行と列を入れ替えて、以降すべての取り扱いを逆にしても差し支えない。
今アライメントされた配列数が4つである場合について、本発明の具体例を示す。次のように、いずれの行から見ても、その行の要素と異なる要素が少なくとも1つ以上、同一列内に含まれるところをわかりやすく□で囲んだ。
次に、抽出された□の列のみに対して、演算処理を行なう。
上記に示した演算方法をより具体的に説明する。本実施形態においては、「異なる要素を識別排除する処理」を行なう。
この演算を記号@を使って表すと、
b1−set=(TACCTGGACAGATACTTCCATGAC)
次に同様に、b2行の配列に基づいて識別排除する処理を行なう。
同様に演算@を行うと、
b2−set=(TACCTGGACAGATCCTTCCATAAC)
b3−set=(TACCTGGACAGATCCTTCCATAAC)
選ばれたこのb2、b3の領域にはもともとお互いを識別できる要素がなかったことが判定できる。お互いを比較するする方法は、プログラミング言語上では文字列比較関数や、1文字ごとの論理比較を行えばよい。尚演算によって初期値として選択された列22のAは少なくともb1、b4と識別可能なことを示しており、無駄とはならない。
b4−set=(TAGCTGGACAGATACTTCCATGAC)…11
となり、より少ない要素数で変異要素のセットを表現できる。
ちなみに
iアッセイのさまざまな条件に対して、やや丈夫であるということ、
ii順番に演算を行えばなるべく狭い範囲に変異要素のセットを探せるかもしれないこと、
iiiアッセイが定量PCR法であれば、3’→5’方向の演算(例では左方向)とすれば5’上流に多くの変異要素を抱えることになりやすいこと(プログラムコーディング上においても有利)などが上げられ、必要に応じて設定することが好ましい。
また「異なる要素を識別排除する処理」とは、次のような形態も可能である。いま行列Pにb0行を加え、b0行に対して識別排除すると、
さて、これまでの説明は配列として最も単純なA、C、T、Gの4つの表記をもつ塩基配列について述べてきた。本発明はこれに限らず、単なる文字の羅列であっても抽出が可能である。たとえば行列Pに、よくあるように塩基の欠失を表す記号として、*を一つ加えても適用可能である。(下記参照)
本発明においては、取得した識別要素に対して、評価を行なう工程を更に有するとよい。
本実施形態においては、さらに効率的に候補数を減少させるための評価ステップとして、部分的和を考慮して評価をおこなっている。
b3−set=(GAG CTG GGA CGG CCT AGC GCC GAG TAC TGG)(右方向へ演算)
となるであろうし、分離同定のためのプローブとして、より優れたものとなるよう、評価条件を設定してなんら問題ない。もしも評価条件によって、最終的に要素数が1にならなくとも、条件を順次緩和して、要素数が1に到達するよう、再帰的アルゴリズムを用意すればよい。
b1−set=(−AC−−−−−−−−−−A−T−−−−−G−−)
となるため、自動的に貴重な情報を付加してくれる。たとえば定量PCR用のプローブとして末端にミスマッチを含むものを、Tmが53℃を超えないように選んだとする。b0の配列を参照して比較を行い、−記号を塩基に置き換える際に、小文字を使用すると、
上述の方法を具体的に実現するシステムについて更に詳細に説明する。図1のフローは本発明の1実施形態を表すもので、インターネット1を介して(またはもともと存在して)遺伝子情報配列のデータベースがネットワークドライブ2上にある。
i 同定のための変異要素セットを探す範囲をexon2の113から345までとする。
ii 3’末端に変異要素をもつプローブとする。
iii iiのプローブはTmが55℃を超えないものとする。
iv DRB1*010101に対する変異を大文字で表す。
とした。次に出力結果を示す。
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
2 ネットワークドライブ
3 キーボード
4 アライメント処理ルーチン
5 演算ルーチン
6 演算の評価条件
7 プローブ抽出ルーチン
8 出力
9 外部記憶装置
10 中央処理装置(CPU)
11 メモリ
12 入出力装置
Claims (9)
- 複数の配列データにおいて特定配列を識別可能な要素(配列部位)に関する情報を取得するための情報処理方法であって、
類似の配列を持つ共通領域においてアライメントされたデータを取得するステップと、
前記アライメントされたデータそれぞれに同一の演算を行い、該演算結果に基づいて識別可能な要素の候補を取得するステップと、
を有することを特徴とする情報処理方法。 - 前記演算が、アライメント位置におけるそれぞれの配列情報の要素が同じである場合に、該要素を排除する演算である請求項1に記載の情報処理方法。
- 前記演算が、前記排除する演算処理がなされた後に、排除されなかった要素をもつアライメント位置の要素同士をさらに演算するものである請求項2に記載の情報処理方法。
- 前記演算が、少なくとも一つ以上の他の配列データとは異なる要素を有するアライメント位置のそれぞれの要素と、選択された要素とを対比し、同じまたは異なる要素を排除する演算と、
前記排除する演算により取得された第一のアライメント位置のそれぞれの配列要素と、前記演算により取得された第二のアライメント位置のそれぞれの配列要素と、をさらに対比する演算である請求項1に記載の情報処理方法。 - 前記得られた候補の評価を行うステップを更に有することを特徴とする請求項1〜4のいずれかに記載の情報処理方法。
- 前記演算が、前記アライメントされた個々の配列情報(bm)を行の情報として配置し、前記アライメント位置情報をn列の情報として配置した行列の集合情報Pとして保持し、該行列における任意に選ばれた二つの列の同一行の要素に対して行われる演算である請求項1〜5のいずれかに記載の情報処理方法。
- 請求項1〜6の方法を用いて導き出される変異要素を少なくとも1つ以上含むことを特徴とした、プローブまたはプローブセット。
- 請求項1〜6のいずれかに記載の方法を実現するためのコンピュータに実行させるための制御プログラム。
- 請求項1〜6のいずれかに記載の方法をコンピュータに実行させるための制御プログラムを格納した記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003434554A JP2005190427A (ja) | 2003-12-26 | 2003-12-26 | 配列を同定するための変異要素のセット抽出方法 |
US11/015,003 US8041512B2 (en) | 2003-12-26 | 2004-12-20 | Method of acquiring a set of specific elements for discriminating sequence |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003434554A JP2005190427A (ja) | 2003-12-26 | 2003-12-26 | 配列を同定するための変異要素のセット抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005190427A true JP2005190427A (ja) | 2005-07-14 |
JP2005190427A5 JP2005190427A5 (ja) | 2007-02-08 |
Family
ID=34697766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003434554A Pending JP2005190427A (ja) | 2003-12-26 | 2003-12-26 | 配列を同定するための変異要素のセット抽出方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8041512B2 (ja) |
JP (1) | JP2005190427A (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004337042A (ja) * | 2003-05-14 | 2004-12-02 | Canon Inc | 核酸アレイ |
US8193331B2 (en) * | 2003-12-25 | 2012-06-05 | Canon Kabushiki Kaisha | Probe set and method for identifying HLA allele |
JP4592060B2 (ja) * | 2004-04-26 | 2010-12-01 | キヤノン株式会社 | Pcr増幅反応装置、ならびに、該装置を利用するpcr増幅反応方法 |
JP2008228585A (ja) * | 2007-03-16 | 2008-10-02 | Canon Inc | 細胞培養容器および細胞培養装置 |
LU92525B1 (en) * | 2014-08-19 | 2016-02-22 | Wurth Paul Sa | Blast furnace plant |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002010443A1 (en) * | 2000-07-27 | 2002-02-07 | The Australian National University | Combinatorial probes and uses therefor |
JP2002296279A (ja) * | 2001-03-29 | 2002-10-09 | Hitachi Software Eng Co Ltd | バイオチップ及びプローブ設計方法 |
JP2003000280A (ja) * | 2001-02-28 | 2003-01-07 | Canon Inc | プローブ設計方法及び情報処理装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6040138A (en) * | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
JP2003038160A (ja) | 2001-07-17 | 2003-02-12 | Hitachi Software Eng Co Ltd | プローブ設計装置及びプローブ設計方法 |
JP2004313181A (ja) * | 2003-04-02 | 2004-11-11 | Canon Inc | 感染症起炎菌検出用プローブ及びプローブセット、ならびに担体及び遺伝子検査方法 |
-
2003
- 2003-12-26 JP JP2003434554A patent/JP2005190427A/ja active Pending
-
2004
- 2004-12-20 US US11/015,003 patent/US8041512B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002010443A1 (en) * | 2000-07-27 | 2002-02-07 | The Australian National University | Combinatorial probes and uses therefor |
JP2003000280A (ja) * | 2001-02-28 | 2003-01-07 | Canon Inc | プローブ設計方法及び情報処理装置 |
JP2002296279A (ja) * | 2001-03-29 | 2002-10-09 | Hitachi Software Eng Co Ltd | バイオチップ及びプローブ設計方法 |
Also Published As
Publication number | Publication date |
---|---|
US8041512B2 (en) | 2011-10-18 |
US20050143930A1 (en) | 2005-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11898206B2 (en) | Systems and methods for clonotype screening | |
JP6314091B2 (ja) | Dna配列のデータ分析 | |
CN110257547B (zh) | 基于kasp技术开发的玉米核心snp标记及其应用 | |
US20150310165A1 (en) | Efficient comparison of polynucleotide sequences | |
US20050221353A1 (en) | Data processing and display method for gene expression analysis system and gene expression analysis system | |
WO2007119779A1 (ja) | 個体識別方法および装置 | |
KR101770962B1 (ko) | 유전자 서열 기반 개인 마커에 관한 정보를 제공하는 방법 및 이를 이용한 장치 | |
JP2005190427A (ja) | 配列を同定するための変異要素のセット抽出方法 | |
WO2008007630A1 (fr) | Méthode et appareil de recherche de protéine | |
Vai et al. | DNA sequencing in cultural heritage | |
Ludwig et al. | The use of rRNA gene sequence data in the classification and identification of prokaryotes | |
JP2005284964A5 (ja) | ||
WO2014119914A1 (ko) | 유전자 서열 기반 개인 마커에 관한 정보를 제공하는 방법 및 이를 이용한 장치 | |
CN110310699A (zh) | 基于全基因组序列挖掘目标基因序列的分析工具及应用 | |
KR20170046315A (ko) | 차세대 시퀀싱을 이용한 분자마커 개발 방법 | |
KR20190061771A (ko) | Geo에 공개된 차세대 염기서열 데이터를 이용한 유전체 분석 방법 | |
AU780824B2 (en) | DNA marker profile data analysis | |
JP2004139254A (ja) | 近傍遺伝子情報検索装置及び方法 | |
CN113284552B (zh) | 一种微单倍型的筛选方法及装置 | |
US20220076790A1 (en) | Incorporating variant information into omics | |
WO2022168195A1 (ja) | 遺伝情報解析システム、及び遺伝情報解析方法 | |
Tammi et al. | ReDiT: Repeat Discrepancy Tagger—a shotgun assembly finishing aid | |
JP2008165375A (ja) | 塩基配列を識別する変異セットの選別法 | |
Liu et al. | SNP array development, genotyping, data analysis, and applications | |
US20030187591A1 (en) | Method of and apparatus for genomic analysis, and computer product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091228 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20100630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100823 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110222 |