JP2017091277A - 細胞を分類可能な遺伝子の選出方法 - Google Patents
細胞を分類可能な遺伝子の選出方法 Download PDFInfo
- Publication number
- JP2017091277A JP2017091277A JP2015221656A JP2015221656A JP2017091277A JP 2017091277 A JP2017091277 A JP 2017091277A JP 2015221656 A JP2015221656 A JP 2015221656A JP 2015221656 A JP2015221656 A JP 2015221656A JP 2017091277 A JP2017091277 A JP 2017091277A
- Authority
- JP
- Japan
- Prior art keywords
- gene
- distribution
- principal component
- cells
- expression level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 122
- 238000010187 selection method Methods 0.000 title abstract description 6
- 238000009826 distribution Methods 0.000 claims abstract description 112
- 230000014509 gene expression Effects 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000004458 analytical method Methods 0.000 claims abstract description 29
- 238000000513 principal component analysis Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 abstract description 14
- 230000008569 process Effects 0.000 abstract description 7
- 108020004999 messenger RNA Proteins 0.000 description 14
- 238000003860 storage Methods 0.000 description 10
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000003068 pathway analysis Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000011222 transcriptome analysis Methods 0.000 description 2
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
この方法は,発現量分布算出工程(S101)と,分布分析工程(S102)と,分類可能遺伝子初期候補選出工程(S103)とを含む。
発現量分布算出工程(S101)は,複数の細胞のトランスクリプトームデータから,複数の遺伝子について複数の個別細胞の発現量分布を求める工程である。
分布分析工程(S102)は,複数の個別細胞の発現量分布が複数の分布の山を有するか判定する工程である。
分類可能遺伝子初期候補選出工程(S103)は,分布分析工程で複数の分布の山を有すると判定された遺伝子を,細胞を分類可能な遺伝子の初期候補として選出する工程である。
この選出装置は,コンピュータを含む細胞を分類可能な遺伝子の選出装置である。そして,コンピュータは,発現量分布算出手段11と,分布分析手段13と,分類可能遺伝子初期候補選出手段15とを含む。
発現量分布算出手段11は,複数の細胞のトランスクリプトームデータから,複数の遺伝子について複数の個別細胞の発現量分布を求めるための手段である。
分布分析手段13は,複数の個別細胞の発現量分布が複数の分布の山を有するか判定するための手段である。
分類可能遺伝子初期候補選出手段は,分布分析手段が複数の分布の山を有すると判定した遺伝子を,細胞を分類可能な遺伝子の初期候補として選出するための手段である。
前記第1の山と第2の山とが分離可能な場合は,前記遺伝子を細胞を分類可能な遺伝子の候補として選出する,分類可能遺伝子候補選出手段19を更に含むものである。
この方法は,発現量分布算出工程と,分布分析工程と,分類可能遺伝子初期候補選出工程とを含む。
発現量分布算出工程は,複数の細胞のトランスクリプトームデータから,複数の遺伝子について複数の個別細胞の発現量分布を求める工程である。
分布分析工程は,複数の個別細胞の発現量分布が複数の分布の山を有するか判定する工程である。
分類可能遺伝子初期候補選出工程は,分布分析工程で複数の分布の山を有すると判定された遺伝子を,細胞を分類可能な遺伝子の初期候補として選出する工程である。
分類可能遺伝子候補選出手段は,第1の山と第2の山とが分離可能な場合に,その遺伝子を,細胞を分類可能な遺伝子の候補として選出するための手段である。
定量的分類において分離可能か否か判定する手段(17)が,細胞を分類可能な遺伝子の初期候補の定量的分類を行い,複数の分布の山に含まれる第1の山と第2の山とが定量的分類において分離可能か否か判定する。定量的分類の例は,主成分分析,回帰分析,及び因子分析である。これらは,たとえば,ソフトウェアRを用いることで容易に行うことができる。また,トランスクリプトームデータにおける主成分分析は公知であり,公知のプログラムを用いて主成分分析を行うことができる。トランスクリプトームデータにおける主成分分析の例は,たとえば,以下の文献に記載されている。
Jackson, J. Edward (1991), A User’s Guide to Principal Components (New York: John Wiley & Sons, Inc),
Shaw, Peter J. A. (2003), Multivariate Statistics for the Environmental Sciences (London: Hodder Arnold).
主成分分析では行列の次元をあらわす軸を新しく設定する。それらの新たな軸はそれぞれ直交している。また第一の軸は要素群の中心に添い,また第二の軸は第一の軸で表されなかった残渣の中心に沿う。こうすることで,それぞれの新しく設定された軸はオリジナルの行列よりも少ない次元でデータを効率よく近似することとなる。
13 分布分析手段
15 分類可能遺伝子初期候補選出手段
17 分離可能か否か判定する手段
19 分類可能遺伝子候補選出手段
21 分類可能遺伝子選出手段
Claims (8)
- 複数の細胞のトランスクリプトームデータから,複数の遺伝子について複数の個別細胞の発現量分布を求める発現量分布算出工程と,
前記複数の個別細胞の発現量分布が複数の分布の山を有するか判定する分布分析工程と,
を含み,前記分布分析工程で複数の分布の山を有すると判定された遺伝子を,細胞を分類可能な遺伝子の初期候補として選出する,分類可能遺伝子初期候補選出工程とを含む,
細胞を分類可能な遺伝子の選出方法。 - 請求項1に記載の方法であって,
細胞を分類可能な遺伝子の初期候補の定量的分類を行い,前記複数の分布の山に含まれる第1の山と第2の山とが前記定量的分類において分離可能か否か判定し,分離可能なものを,細胞を分類可能な遺伝子の候補として選出する,分類可能遺伝子候補選出工程を更に含む,
細胞を分類可能な遺伝子の選出方法。 - 請求項2に記載の方法であって,
前記定量的分類は,主成分分析を含む,方法。 - 請求項1又は2に記載の方法であって,
前記複数の分布の山に含まれる第1の山と第2の山に含まれる細胞群をそれぞれ主成分1及び主成分2としたときに,主成分1及び主成分2のMAプロットにおいて,Aの所定値以上の位置において,主成分1及び主成分2を分離することができるか否か判定し,分離可能なものを,細胞を分類可能な遺伝子として選出する,方法。 - コンピュータを含む細胞を分類可能な遺伝子の選出装置であって,
前記コンピュータは,
複数の細胞のトランスクリプトームデータから,複数の遺伝子について複数の個別細胞の発現量分布を求める発現量分布算出手段11と,
前記複数の個別細胞の発現量分布が複数の分布の山を有するか判定する分布分析手段13と,
前記分布分析手段が複数の分布の山を有すると判定した遺伝子を,細胞を分類可能な遺伝子の初期候補として選出する,分類可能遺伝子初期候補選出手段15を含む,
装置。 - 請求項5に記載の装置であって,
細胞を分類可能な遺伝子の初期候補の定量的分類を行い,前記複数の分布の山に含まれる第1の山と第2の山とが前記定量的分類において分離可能か否か判定する手段17と,
前記第1の山と第2の山とが分離可能な場合は,前記遺伝子を細胞を分類可能な遺伝子の候補として選出する,分類可能遺伝子候補選出手段19を更に含む
装置。 - 請求項5に記載の装置であって,
前記複数の分布の山に含まれる第1の山と第2の山に含まれる細胞群をそれぞれ主成分1及び主成分2としたときに,主成分1及び主成分2のMAプロットにおいて,主成分1及び主成分2を分離することができるか否か判定し,分離可能なものを,細胞を分類可能な遺伝子として選出する手段21を更に有する装置。 - コンピュータを,
複数の細胞のトランスクリプトームデータから,複数の遺伝子について複数の個別細胞の発現量分布を求める発現量分布算出手段11と,
前記複数の個別細胞の発現量分布が複数の分布の山を有するか判定する分布分析手段13と,
前記分布分析手段が複数の分布の山を有すると判定した遺伝子を,細胞を分類可能な遺伝子の初期候補として選出する,分類可能遺伝子初期候補選出手段15を含む,
ように機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015221656A JP6788961B2 (ja) | 2015-11-11 | 2015-11-11 | 細胞を分類可能な遺伝子の選出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015221656A JP6788961B2 (ja) | 2015-11-11 | 2015-11-11 | 細胞を分類可能な遺伝子の選出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017091277A true JP2017091277A (ja) | 2017-05-25 |
JP6788961B2 JP6788961B2 (ja) | 2020-11-25 |
Family
ID=58770534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015221656A Active JP6788961B2 (ja) | 2015-11-11 | 2015-11-11 | 細胞を分類可能な遺伝子の選出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6788961B2 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003028862A (ja) * | 2001-07-12 | 2003-01-29 | Pharma Design Inc | Dnaマイクロアレイデータの補正方法 |
JP2006101733A (ja) * | 2004-10-01 | 2006-04-20 | Canon Inc | 遺伝子の転写に起因するmRNA量の変動現象の確率論的モデル化手法と、該モデル化手法を利用し、生細胞群中におけるmRNA量を高い確度で推定する方法 |
JP2007140694A (ja) * | 2005-11-15 | 2007-06-07 | Nippon Steel Corp | 製造プロセスにおける操業と品質の関連解析装置、方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 |
JP2007156721A (ja) * | 2005-12-02 | 2007-06-21 | Yamaguchi Univ | 有効因子抽出システム |
JP2012039994A (ja) * | 2010-07-21 | 2012-03-01 | Akita Prefectural Univ | 主成分算出方法、トランスクリプトーム解析方法、遺伝子、老化判定方法、コンピュータプログラム、記憶媒体、及び解析装置 |
JP2014075995A (ja) * | 2012-10-09 | 2014-05-01 | Norichika Ogata | トランスクリプトームを用いた、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法 |
JP2015049681A (ja) * | 2013-08-30 | 2015-03-16 | Kddi株式会社 | 類似移動経路をとるユーザを検索する装置、プログラム及び方法 |
-
2015
- 2015-11-11 JP JP2015221656A patent/JP6788961B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003028862A (ja) * | 2001-07-12 | 2003-01-29 | Pharma Design Inc | Dnaマイクロアレイデータの補正方法 |
JP2006101733A (ja) * | 2004-10-01 | 2006-04-20 | Canon Inc | 遺伝子の転写に起因するmRNA量の変動現象の確率論的モデル化手法と、該モデル化手法を利用し、生細胞群中におけるmRNA量を高い確度で推定する方法 |
JP2007140694A (ja) * | 2005-11-15 | 2007-06-07 | Nippon Steel Corp | 製造プロセスにおける操業と品質の関連解析装置、方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 |
JP2007156721A (ja) * | 2005-12-02 | 2007-06-21 | Yamaguchi Univ | 有効因子抽出システム |
JP2012039994A (ja) * | 2010-07-21 | 2012-03-01 | Akita Prefectural Univ | 主成分算出方法、トランスクリプトーム解析方法、遺伝子、老化判定方法、コンピュータプログラム、記憶媒体、及び解析装置 |
JP2014075995A (ja) * | 2012-10-09 | 2014-05-01 | Norichika Ogata | トランスクリプトームを用いた、発現変動遺伝子抽出又はパスウェイ解析にかける実験区の選定方法 |
JP2015049681A (ja) * | 2013-08-30 | 2015-03-16 | Kddi株式会社 | 類似移動経路をとるユーザを検索する装置、プログラム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6788961B2 (ja) | 2020-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dernoncourt et al. | Analysis of feature selection stability on high dimension and small sample data | |
Cano et al. | Automatic selection of molecular descriptors using random forest: Application to drug discovery | |
Gudyś et al. | HuntMi: an efficient and taxon-specific approach in pre-miRNA identification | |
JP5454827B1 (ja) | 文書評価装置、文書評価方法、及びプログラム | |
JP2008546046A (ja) | マハラノビスの距離の遺伝的アルゴリズムの方法及びシステム | |
US8812503B2 (en) | Information processing device, method and program | |
CN109891508A (zh) | 单细胞类型检测方法、装置、设备和存储介质 | |
JP2017004123A (ja) | 判定装置、判定方法および判定プログラム | |
Famili et al. | Evaluation and optimization of clustering in gene expression data analysis | |
Moussa et al. | Locality sensitive imputation for single cell RNA-seq data | |
Lusa | The class-imbalance problem for high-dimensional class prediction | |
CN107832584B (zh) | 宏基因组的基因分析方法、装置、设备及存储介质 | |
Zehnder et al. | Predicting enhancers in mammalian genomes using supervised hidden Markov models | |
JP5873764B2 (ja) | 欠陥画像の提示方法 | |
CN106610977A (zh) | 一种数据聚类方法和装置 | |
JP2016031629A (ja) | 特徴選択装置、特徴選択システム、特徴選択方法、および、特徴選択プログラム | |
Chuang et al. | A two-stage feature selection method for gene expression data | |
KR102543757B1 (ko) | 이종 플랫폼의 dna 메틸레이션 데이터를 이용한 암의 예후 예측용 바이오마커 발굴 방법 및 장치 | |
WO2008007630A1 (fr) | Méthode et appareil de recherche de protéine | |
KR100734430B1 (ko) | 마이크로어레이 데이터의 클래스 판별 유전자 셋 탐색 방법및 저장 매체 | |
JP6788961B2 (ja) | 細胞を分類可能な遺伝子の選出方法 | |
CN115527610B (zh) | 一种单细胞组学数据的聚类分析方法 | |
WO2013075000A1 (en) | Clustering copy-number values for segments of genomic data | |
Feng et al. | Sequence repetitiveness quantification and de novo repeat detection by weighted k-mer coverage | |
Alexander et al. | Capturing discrete latent structures: choose LDs over PCs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200501 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201027 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6788961 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |