JPWO2016157473A1 - 遺伝子型判定装置及び方法 - Google Patents
遺伝子型判定装置及び方法 Download PDFInfo
- Publication number
- JPWO2016157473A1 JPWO2016157473A1 JP2017509089A JP2017509089A JPWO2016157473A1 JP WO2016157473 A1 JPWO2016157473 A1 JP WO2016157473A1 JP 2017509089 A JP2017509089 A JP 2017509089A JP 2017509089 A JP2017509089 A JP 2017509089A JP WO2016157473 A1 JPWO2016157473 A1 JP WO2016157473A1
- Authority
- JP
- Japan
- Prior art keywords
- genotype
- cluster
- representative value
- clusters
- snps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Physiology (AREA)
- Probability & Statistics with Applications (AREA)
- Signal Processing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
以下、第1実施形態について、図7〜図39を参照して説明する。
まず、ステップS1における、代表値の算出処理について説明する。図22は、代表値の算出処理を示すフローチャートである。以下では、代表値は、信号強度平面上の原点を通る近似曲線の傾きであるものとする。
CLU(i,j)=tan-1*(averege B(i,j))/(average A(i,j))・・・(1)
次に、ステップS2における、3クラスタのSNP(3つのクラスタに分類されたSNP)に対する遺伝子型の割当処理について説明する。図28は、3クラスタのSNPに対する遺伝子型の割当処理を示すフローチャートである。
次に、ステップS3における、確率分布モデルの構築処理について説明する。図34は、確率分布モデルの構築処理を示すフローチャートである。以下では、確率分布モデルは、正規分布を利用して構築されるものとする。
次に、ステップS4における、1又は2クラスタのSNP(1つのクラスタに分類されたSNP又は2つのクラスタに分類されたSNP)に対する遺伝子型の割当処理について説明する。図37は、1又は2クラスタのSNPに対する遺伝子型の割当処理を示すフローチャートである。
以下、第2実施形態について、図40〜図45を参照して説明する。本実施形態では、第2ラベリング部9が割当てた遺伝子型の信頼性が高いか判定する。信頼性が低い場合には、遺伝子型を再割当てする。判定及び再割当のために、生物学的な知見が利用される。
まず、割当方法Aについて説明する。割当方法Aによる再割当が行われるのは、SNPiの2つのクラスタ1,2に遺伝子型AA,BBが割当てられた場合である。
次に、割当方法Bについて説明する。割当方法Bによる再割当が行われるのは、SNPiの2つのクラスタ1,2にいずれも遺伝子型ABが割当てられた場合である。2つのクラスタに同一の遺伝子型が割当てられていることから、この割当結果の信頼性は低いと判定される。
次に、割当方法Cについて説明する。割当方法Cによる再割当が行われるのは、SNPiの2つのクラスタ1,2にいずれも遺伝子型AA又は遺伝子型BBが割当てられた場合である。2つのクラスタに同一の遺伝子型が割当てられていることから、この割当結果の信頼性は低いと判定される。
次に、割当方法Dについて説明する。割当方法Dによる再割当が行われるのは、1クラスタのSNPiに遺伝子型ABが割当てられた場合である。
以下、第3実施形態について、図46〜図48を参照して説明する。本実施形態では、第3ラベリング部12は、第2の代表値を利用して、遺伝子型の再割当を行う。第2の代表値とは、第1ラベリング部6及び第2ラベリング部9が利用する代表値(以下、「第1の代表値」という)とは異なる種類の代表値のことである。したがって、本実施形態では、第1の代表値と、第2の代表値と、を含む少なくとも2種類の代表値が算出される。
まず、割当方法Aについて説明する。割当方法Aによる再割当が行われるのは、SNPiの2つのクラスタ1,2に遺伝子型AA,BBが割当てられた場合である。
次に、割当方法Bについて説明する。割当方法Bによる再割当が行われるのは、SNPiの2つのクラスタ1,2にいずれも遺伝子型ABが割当てられた場合である。
次に、割当方法Cについて説明する。割当方法Cによる再割当が行われるのは、SNPiの2つのクラスタ1,2にいずれも遺伝子型AA又は遺伝子型BBが割当てられた場合である。
以下、第4実施形態について、図49〜図52を参照して説明する。第4実施形態では、表示部11が表示装置103に表示させる画面について説明する。図49〜図52は、画面の一例を示す図である。
Claims (18)
- DNAマイクロアレイにより計測された複数のSNPにおける複数の検体の信号強度に基づいて分類された前記SNP毎の検体のクラスタについて、前記各クラスタに含まれる検体の信号強度に基づいて当該各クラスタの代表値を算出する代表値算出部と、
前記SNPのうち3つのクラスタに分類されたSNPの各クラスタに、当該各クラスタの代表値に基づいて遺伝子型を割当てる第1ラベリング部と、
前記SNPのうち3つのクラスタに分類されたSNPの各クラスタの遺伝子型と、当該各クラスタの代表値と、の関係を示すモデルを構築するモデル構築部と、
前記SNPのうち1つ又は2つのクラスタに分類されたSNPの各クラスタに、当該各クラスタの代表値及び前記モデルに基づいて遺伝子型を割当てる第2ラベリング部と、
を備える遺伝子型判定装置。 - 前記信号強度は、蛍光強度又は電流強度、若しくはそれらの値に基づいて変換された変換値である
請求項1に記載の遺伝子型判定装置。 - 前記代表値は、前記クラスタに含まれる前記検体の回帰直線の回帰係数、前記回帰係数の逆正接、原点を通る近似直線の傾き、相関係数、クラスタ中心値、クラスタ中央値、クラスタ分散、比の平均値、又は差の平均値である
請求項1又は請求項2に記載の遺伝子型判定装置。 - 前記第1ラベリング部は、前記クラスタの前記代表値の順に、一方のホモ接合体の遺伝子型、ヘテロ接合体の遺伝子型、他方のホモ接合体の遺伝子型を割当てる
請求項1乃至請求項3のいずれか1項に記載の遺伝子型判定装置。 - 前記モデルは、前記遺伝子型毎の前記代表値の確率分布に従う確率密度関数である
請求項1乃至請求項4のいずれか1項に記載の遺伝子型判定装置。 - 前記確率分布は、混合ガウシアン分布、正規分布、ベータ分布、又はF分布である
請求項5に記載の遺伝子型判定装置。 - 前記第2ラベリング部は、前記クラスタに、前記代表値の確率密度が最大の前記遺伝子型を割当てる
請求項1乃至請求項6のいずれか1項に記載の遺伝子型判定装置。 - 2つの前記クラスタに分類された前記SNPの前記各クラスタに、ホモ接合型の異なる前記遺伝子型がそれぞれ割当てられた場合、前記各クラスタの前記代表値に基づいて、一方の前記クラスタにヘテロ接合型の前記遺伝子型を再割当てする第3ラベリング部を更に備える
請求項1乃至請求項7のいずれか1項に記載の遺伝子型判定装置。 - 2つの前記クラスタに分類された前記SNPの前記各クラスタに、ヘテロ接合型の前記遺伝子型がそれぞれ割当てられた場合、前記各クラスタの前記代表値に基づいて、一方の前記クラスタにホモ接合型の前記遺伝子型を再割当てする第3ラベリング部を更に備える請求項1乃至請求項8のいずれか1項に記載の遺伝子型判定装置。
- 2つの前記クラスタに分類された前記SNPの前記各クラスタに、ホモ接合型の同一の前記遺伝子型がそれぞれ割当てられた場合、前記各クラスタの前記代表値に基づいて、一方の前記クラスタにヘテロ接合型の前記遺伝子型を再割当てする第3ラベリング部を更に備える
請求項1乃至請求項9のいずれか1項に記載の遺伝子型判定装置。 - 1つの前記クラスタに分類された前記SNPの前記クラスタに、ヘテロ接合型の前記遺伝子型が割当てられた場合、ホモ接合型の前記遺伝子型を再割当てする第3ラベリング部を更に備える
請求項1乃至請求項10のいずれか1項に記載の遺伝子型判定装置。 - 前記代表値算出部は、前記SNP毎に前記各クラスタの第2の代表値を算出する
請求項1乃至請求項11のいずれか1項に記載の遺伝子型判定装置。 - 前記第2の代表値は、前記各クラスタに含まれる前記検体の数である
請求項12に記載の遺伝子型判定装置。 - 2つの前記クラスタに分類された前記SNPの前記各クラスタに、ホモ接合型の異なる前記遺伝子型がそれぞれ割当てられた場合、前記第2の代表値に基づいて、一方の前記クラスタにヘテロ接合型の前記遺伝子型を再割当てする第3ラベリング部を更に備える
請求項12又は請求項13に記載の遺伝子型判定装置。 - 2つの前記クラスタに分類された前記SNPの前記各クラスタに、ヘテロ接合型の前記遺伝子型がそれぞれ割当てられた場合、前記第2の代表値に基づいて、一方の前記クラスタにホモ接合型の前記遺伝子型を再割当てする第3ラベリング部を更に備える
請求項12乃至請求項14のいずれか1項に記載の遺伝子型判定装置。 - 2つの前記クラスタに分類された前記SNPの前記各クラスタに、ホモ接合型の同一の前記遺伝子型がそれぞれ割当てられた場合、前記第2の代表値に基づいて、一方の前記クラスタにヘテロ接合型の前記遺伝子型を再割当てする第3ラベリング部を更に備える
請求項12乃至請求項15のいずれか1項に記載の遺伝子型判定装置。 - 前記モデル、前記判定結果、及び前記代表値の少なくとも1つを表示する表示部を更に備える
請求項1乃至請求項16のいずれか1項に記載の遺伝子型判定装置。 - DNAマイクロアレイにより計測された複数のSNPにおける複数の検体の信号強度に基づいて分類された前記SNP毎の検体のクラスタについて、前記各クラスタに含まれる検体の信号強度に基づいて当該各クラスタの代表値を算出する工程、
前記SNPのうち3つのクラスタに分類されたSNPの各クラスタに、当該各クラスタの代表値に基づいて遺伝子型を割当てる工程と、
前記SNPのうち3つのクラスタに分類されたSNPの各クラスタの遺伝子型と、当該各クラスタの代表値と、の関係を示すモデルを構築する工程と、
前記SNPのうち1つ又は2つのクラスタに分類されたSNPの各クラスタに、当該各クラスタの代表値及び前記モデルに基づいて遺伝子型を割当てる工程と、
を含む遺伝子型判定方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/060368 WO2016157473A1 (ja) | 2015-04-01 | 2015-04-01 | 遺伝子型判定装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016157473A1 true JPWO2016157473A1 (ja) | 2017-12-21 |
JP6367473B2 JP6367473B2 (ja) | 2018-08-01 |
Family
ID=57004114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017509089A Active JP6367473B2 (ja) | 2015-04-01 | 2015-04-01 | 遺伝子型判定装置及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20170364632A1 (ja) |
JP (1) | JP6367473B2 (ja) |
CN (1) | CN107533591A (ja) |
GB (1) | GB2551091A (ja) |
WO (1) | WO2016157473A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033829B (zh) * | 2019-04-11 | 2021-07-23 | 北京诺禾心康基因科技有限公司 | 基于差异snp标记物的同源基因的融合检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005531853A (ja) * | 2002-06-28 | 2005-10-20 | アプレラ コーポレイション | Snp遺伝子型クラスタリングのためのシステムおよび方法 |
JP2006107396A (ja) * | 2004-10-08 | 2006-04-20 | Institute Of Physical & Chemical Research | Snp遺伝子型分類方法、snp遺伝子型分類装置およびsnp遺伝子型分類プログラム |
JP2008533558A (ja) * | 2005-02-10 | 2008-08-21 | アプレラ コーポレイション | 遺伝子型分析のための正規化方法 |
WO2013073929A1 (en) * | 2011-11-15 | 2013-05-23 | Acgt Intellectual Limited | Method and apparatus for detecting nucleic acid variation(s) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005071594A1 (en) * | 2004-01-23 | 2005-08-04 | King Faisal Specialist Hospital & Research Center | Estimation of signal thresholds for microarray data using mixture modeling |
CN101570788A (zh) * | 2009-06-09 | 2009-11-04 | 华东师范大学 | 一种通过寡核苷酸多态性芯片识别基因型的方法 |
CN102952854B (zh) * | 2011-08-25 | 2015-01-14 | 深圳华大基因科技有限公司 | 单细胞分类和筛选方法及其装置 |
-
2015
- 2015-04-01 CN CN201580077795.9A patent/CN107533591A/zh active Pending
- 2015-04-01 GB GB1713894.2A patent/GB2551091A/en not_active Withdrawn
- 2015-04-01 WO PCT/JP2015/060368 patent/WO2016157473A1/ja active Application Filing
- 2015-04-01 JP JP2017509089A patent/JP6367473B2/ja active Active
-
2017
- 2017-08-31 US US15/693,268 patent/US20170364632A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005531853A (ja) * | 2002-06-28 | 2005-10-20 | アプレラ コーポレイション | Snp遺伝子型クラスタリングのためのシステムおよび方法 |
JP2006107396A (ja) * | 2004-10-08 | 2006-04-20 | Institute Of Physical & Chemical Research | Snp遺伝子型分類方法、snp遺伝子型分類装置およびsnp遺伝子型分類プログラム |
JP2008533558A (ja) * | 2005-02-10 | 2008-08-21 | アプレラ コーポレイション | 遺伝子型分析のための正規化方法 |
WO2013073929A1 (en) * | 2011-11-15 | 2013-05-23 | Acgt Intellectual Limited | Method and apparatus for detecting nucleic acid variation(s) |
Also Published As
Publication number | Publication date |
---|---|
JP6367473B2 (ja) | 2018-08-01 |
WO2016157473A1 (ja) | 2016-10-06 |
CN107533591A (zh) | 2018-01-02 |
US20170364632A1 (en) | 2017-12-21 |
GB201713894D0 (en) | 2017-10-11 |
GB2551091A (en) | 2017-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alirezaie et al. | ClinPred: prediction tool to identify disease-relevant nonsynonymous single-nucleotide variants | |
Neale et al. | Testing for an unusual distribution of rare variants | |
Lee et al. | Rare-variant association analysis: study designs and statistical tests | |
Verma et al. | Human-disease phenotype map derived from PheWAS across 38,682 individuals | |
Brownstein et al. | An international effort towards developing standards for best practices in analysis, interpretation and reporting of clinical genome sequencing results in the CLARITY Challenge | |
Hejblum et al. | Time-course gene set analysis for longitudinal gene expression data | |
Chakravorty et al. | Gene and variant annotation for Mendelian disorders in the era of advanced sequencing technologies | |
Schadt et al. | A new paradigm for drug discovery: integrating clinical, genetic, genomic and molecular phenotype data to identify drug targets | |
Porubsky et al. | A fully phased accurate assembly of an individual human genome | |
Salas et al. | A transdisciplinary approach to understand the epigenetic basis of race/ethnicity health disparities | |
Shevchenko et al. | Clinical versus research sequencing | |
Flassig et al. | An effective framework for reconstructing gene regulatory networks from genetical genomics data | |
JP6367473B2 (ja) | 遺伝子型判定装置及び方法 | |
Deleye et al. | Massively parallel sequencing of micro-manipulated cells targeting a comprehensive panel of disease-causing genes: A comparative evaluation of upstream whole-genome amplification methods | |
CN114334078A (zh) | 用于推荐药物的方法、电子设备和计算机存储介质 | |
Cox | Utility and limitations of animal models for the functional validation of human sequence variants | |
JP6623774B2 (ja) | パスウェイ解析プログラム、パスウェイ解析方法、及び、情報処理装置 | |
US20160171151A1 (en) | Method for determining read error in nucleotide sequence | |
Walsh | The trouble with trabeculation: how genetics can help to unravel a complex and controversial phenotype | |
Steuerman et al. | Exploiting gene-expression deconvolution to probe the genetics of the immune system | |
JPWO2019132010A1 (ja) | 塩基配列における塩基種を推定する方法、装置及びプログラム | |
Li et al. | On epistasis: a methodological review for detecting gene-gene interactions underlying various types of phenotypic traits | |
Holm et al. | From sequence data to returnable results: ethical issues in variant calling and interpretation | |
US20170364631A1 (en) | Genotype estimation device, method, and program | |
Ramachandran et al. | CONDEX: Copy number detection in exome sequences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A5211 Effective date: 20170825 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180704 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6367473 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |