JP6558754B2 - 情報処理装置、指標次元抽出方法、および指標次元抽出プログラム - Google Patents
情報処理装置、指標次元抽出方法、および指標次元抽出プログラム Download PDFInfo
- Publication number
- JP6558754B2 JP6558754B2 JP2015156703A JP2015156703A JP6558754B2 JP 6558754 B2 JP6558754 B2 JP 6558754B2 JP 2015156703 A JP2015156703 A JP 2015156703A JP 2015156703 A JP2015156703 A JP 2015156703A JP 6558754 B2 JP6558754 B2 JP 6558754B2
- Authority
- JP
- Japan
- Prior art keywords
- dimension
- dimensions
- index
- clustering
- substance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2264—Multidimensional index structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2272—Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Description
〔第1の実施の形態〕
まず、第1の実施の形態について説明する。第1の実施の形態は、構造が変化する物質の構造解析を行う際に、解析に重要な指標となる次元を漏らさずに選択可能な情報処理装置である。
記憶部11は、構造が変化する物質の複数の構造(物質構造11a−1,11a−2,・・・)と、物質の構造を表す複数の次元のうちの、構造解析の指標とする次元の集合である次元集合11bとを記憶する。次元集合11bには、初期値として、例えば予め重要であることが既知の次元が設定されている。
次に第2の実施の形態について説明する。第2の実施の形態は、解析対象物質をタンパク質として、第1の実施の形態をより具体化したものである。
図3は、隠れ次元を用いたタンパク質構造解析機能を示すブロック図である。コンピュータ100は、隠れ次元を用いたタンパク質構造解析を行うため、記憶部110、クラスタリング部120、隠れ次元判定部130、およびOFLOOD部140を有する。
次に、記憶部110に格納される情報について詳細に説明する。
タンパク質構造解析処理では、まずMDシミュレーションにより生成されたトラジェクトリが、記憶部110に格納される。
なお、第2の実施の形態に係る技術を適用せずにOFLOODを実施すると、経験的にある程度分かっている重要な次元のみを用いて構造リサンプリングが実行される。実際問題として、予め興味のあるタンパク質構造変化に重要な次元は自明でないことがほとんどであり、最適な次元を設定することができない場合には、効率的にタンパク質構造変化を抽出できない。
図7は、FlexDiceによるクラスタリングの一例を示す図である。FlexDiceは、高次元かつ大規模なデータベースから規則性や特徴を見つけ出すためのクラスタリング手法の1つである。FlexDiceでは、データ要素を分類する指標を軸とする多次元空間に、データ要素が配置される。タンパク質構造をデータ要素とする場合、例えば特定の原子のある軸の座標、所定の2つの原子間距離などが、分類の指標となる。図7の例では、2つの指標で分類した場合を想定した例が示されている。
図10は、タンパク質構造解析処理の手順の一例を示すフローチャートである。以下、図10に示す処理をステップ番号に沿って説明する。
[ステップS104]クラスタリング部120は、タンパク質ダイナミクスを記述する次元のうち、既知の重要次元または既に隠れ次元と判定されている次元以外のi番目の次元di(ここでiは1以上n−2以下の整数)を、1つ選択する。なお、クラスタリング部120は、記憶部110内の重要次元情報112を参照して、どの次元が重要次元なのかを認識し、隠れ次元情報113を参照して、どの次元が隠れ次元なのかを認識する。
[ステップS112]クラスタリング部120は、さらに隠れ次元を追加するか否かを判断する。例えばクラスタリング部120は、隠れ次元と判定した次元数が、所定数に達していなければ、さらに隠れ次元を追加すると判断する。隠れ次元と判定した次元数が所定数に達した場合、これ以上の隠れ次元は追加しないと判断する。さらに隠れ次元を追加する場合、処理をステップS104に進める。隠れ次元を追加しない場合、処理が終了する。
11 記憶部
11a−1,11a−2,・・・ 物質構造
11b 次元集合
12 演算部
Claims (6)
- 構造が変化する物質の複数の構造と、前記物質の構造を表す複数の次元のうちの、前記物質の構造解析の指標とする指標次元の集合である次元集合とを記憶する記憶部と、
前記複数の次元のうちの、前記次元集合に含まれていない複数の候補次元それぞれについて、候補次元と前記次元集合に含まれるすべての前記指標次元とを座標軸とする多次元空間において前記複数の構造のクラスタリングを行い、最も多くのクラスタを生成させることができた特定の候補次元を、前記指標次元として前記次元集合に追加する演算部と、
を有する情報処理装置。 - 前記演算部は、さらに、
前記特定の候補次元が前記指標次元として前記次元集合に追加されると、前記次元集合に含まれるすべての前記指標次元を指標として、前記複数の構造に基づく前記物質の構造解析を行う、
請求項1記載の情報処理装置。 - 前記演算部は、さらに、
前記構造解析の過程で生成された物質の構造を前記記憶部に格納し、前記記憶部に該構造が格納されるごとに、前記クラスタリング、前記追加、および前記構造解析を繰り返し実行する、
請求項2記載の情報処理装置。 - 前記演算部は、構造解析において、前記次元集合に含まれるすべての前記指標次元それぞれを座標軸とする多次元空間において前記複数の構造のクラスタリングを行い、いずれのクラスタにも含まれないはずれ値となった構造を初期構造とする分子動力学シミュレーションを行う、
請求項2または3記載の情報処理装置。 - コンピュータが、
構造が変化する物質の構造を表す複数の次元のうちの、前記物質の構造解析の指標とする指標次元の集合である次元集合に含まれない複数の候補次元それぞれについて、候補次元と前記次元集合に含まれるすべての前記指標次元とを座標軸とする多次元空間において、前記物質の複数の構造のクラスタリングを行い、
最も多くのクラスタを生成させることができた特定の候補次元を、前記指標次元として前記次元集合に追加する、
指標次元抽出方法。 - コンピュータに、
構造が変化する物質の構造を表す複数の次元のうちの、前記物質の構造解析の指標とする指標次元の集合である次元集合に含まれない複数の候補次元それぞれについて、候補次元と前記次元集合に含まれるすべての前記指標次元とを座標軸とする多次元空間において、前記物質の複数の構造のクラスタリングを行い、
最も多くのクラスタを生成させることができた特定の候補次元を、前記指標次元として前記次元集合に追加する、
処理を実行させる指標次元抽出プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015156703A JP6558754B2 (ja) | 2015-08-07 | 2015-08-07 | 情報処理装置、指標次元抽出方法、および指標次元抽出プログラム |
US15/228,873 US10275512B2 (en) | 2015-08-07 | 2016-08-04 | Information processing apparatus and index dimension extracting method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015156703A JP6558754B2 (ja) | 2015-08-07 | 2015-08-07 | 情報処理装置、指標次元抽出方法、および指標次元抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017037378A JP2017037378A (ja) | 2017-02-16 |
JP6558754B2 true JP6558754B2 (ja) | 2019-08-14 |
Family
ID=58047284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015156703A Active JP6558754B2 (ja) | 2015-08-07 | 2015-08-07 | 情報処理装置、指標次元抽出方法、および指標次元抽出プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10275512B2 (ja) |
JP (1) | JP6558754B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4002383A3 (en) | 2020-11-13 | 2022-08-03 | Tokyo Institute of Technology | Information processing device, information processing method, recording medium recording information processing program, and information processing system |
US20220199204A1 (en) * | 2020-12-18 | 2022-06-23 | International Business Machines Corporation | Iterative state detection for molecular dynamics data |
JP7057003B1 (ja) | 2021-02-26 | 2022-04-19 | 国立大学法人東京工業大学 | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム |
JP7057004B1 (ja) | 2021-03-05 | 2022-04-19 | 国立大学法人東京工業大学 | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002536301A (ja) * | 1999-01-27 | 2002-10-29 | ザ スクリプス リサーチ インスティテュート | タンパク質モデリングツール |
IL152683A0 (en) | 2000-05-19 | 2003-06-24 | Glycominds Ltd | System and method for carbohydrate sequence presentation, comparison and analysis |
CA2485732A1 (en) | 2002-05-20 | 2003-12-04 | Abmaxis, Inc. | Generation and selection of protein library in silico |
SG177012A1 (en) | 2002-05-20 | 2012-01-30 | Abmaxis Inc | Generation and selection of protein library in silico |
US8374828B1 (en) * | 2007-12-24 | 2013-02-12 | The University Of North Carolina At Charlotte | Computer implemented system for protein and drug target design utilizing quantified stability and flexibility relationships to control function |
JP5582433B2 (ja) | 2009-03-24 | 2014-09-03 | 国立大学法人名古屋大学 | 機能性ペプチドを表すルールの抽出法、機能性ペプチドの設計法及び調製法、ポリペプチド又はポリペプチド含有組成物の評価法、並びに機能性ペプチド |
US20130304432A1 (en) * | 2012-05-09 | 2013-11-14 | Memorial Sloan-Kettering Cancer Center | Methods and apparatus for predicting protein structure |
-
2015
- 2015-08-07 JP JP2015156703A patent/JP6558754B2/ja active Active
-
2016
- 2016-08-04 US US15/228,873 patent/US10275512B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017037378A (ja) | 2017-02-16 |
US20170039268A1 (en) | 2017-02-09 |
US10275512B2 (en) | 2019-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Karagiorgi et al. | Machine learning in the search for new fundamental physics | |
US10546245B2 (en) | Methods for mapping data into lower dimensions | |
Higham et al. | Fitting a geometric graph to a protein–protein interaction network | |
WO2019129060A1 (zh) | 自动生成机器学习样本的特征的方法及系统 | |
JP6558754B2 (ja) | 情報処理装置、指標次元抽出方法、および指標次元抽出プログラム | |
Song et al. | Combining Models from Multiple Sources for RGB-D Scene Recognition. | |
Zhu et al. | Developing a pattern discovery method in time series data and its GPU acceleration | |
Bhardwaj et al. | Classification of clusters in collision cascades | |
Sarumathiy et al. | Improvement in Hadoop performance using integrated feature extraction and machine learning algorithms | |
JP2017037377A (ja) | 情報処理装置、シミュレーション方法、およびシミュレーションプログラム | |
US10671917B1 (en) | System for mapping extracted Neural activity into Neuroceptual graphs | |
Kang et al. | Interactive hierarchical tag clouds for summarizing spatiotemporal social contents | |
Boutsinas | A new biclustering algorithm based on association rule mining | |
Barlowe et al. | WaveMap: Interactively Discovering Features From Protein Flexibility Matrices Using Wavelet‐based Visual Analytics | |
Shi et al. | VNGEP: Filter pruning based on von Neumann graph entropy | |
JP7404705B2 (ja) | 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム | |
Huang et al. | VINCENT: towards efficient exploratory subgraph search in graph databases | |
Li et al. | A real-time machine learning and visualization framework for scientific workflows | |
Barbieri et al. | PALLADIO: a parallel framework for robust variable selection in high-dimensional data | |
Vandromme et al. | A scalable biclustering method for heterogeneous medical data | |
Riba et al. | Error-tolerant coarse-to-fine matching model for hierarchical graphs | |
Lakshmi et al. | Review on density based clustering algorithms for big data | |
Baker et al. | Parallel hybrid quantum-classical machine learning for kernelized time-series classification | |
Prasad | Multiscale graph-based framework for efficient multi-sensor integration and event detection | |
Steed et al. | Extreme scale visual analytics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190709 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6558754 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |