JP7349454B2 - 錯体分子下部構造を識別する切断頂点方法 - Google Patents
錯体分子下部構造を識別する切断頂点方法 Download PDFInfo
- Publication number
- JP7349454B2 JP7349454B2 JP2020568209A JP2020568209A JP7349454B2 JP 7349454 B2 JP7349454 B2 JP 7349454B2 JP 2020568209 A JP2020568209 A JP 2020568209A JP 2020568209 A JP2020568209 A JP 2020568209A JP 7349454 B2 JP7349454 B2 JP 7349454B2
- Authority
- JP
- Japan
- Prior art keywords
- graph
- molecular weight
- vertex
- selected molecule
- edge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 63
- 239000002207 metabolite Substances 0.000 claims description 58
- 239000011159 matrix material Substances 0.000 claims description 55
- 239000000126 substance Substances 0.000 claims description 38
- 230000036983 biotransformation Effects 0.000 claims description 34
- 229920002521 macromolecule Polymers 0.000 claims description 26
- 238000003776 cleavage reaction Methods 0.000 claims description 20
- 230000007017 scission Effects 0.000 claims description 20
- 238000010845 search algorithm Methods 0.000 claims description 20
- 238000010586 diagram Methods 0.000 claims description 19
- 150000003384 small molecules Chemical class 0.000 claims description 15
- 102000004169 proteins and genes Human genes 0.000 claims description 14
- 108090000623 proteins and genes Proteins 0.000 claims description 14
- 238000013467 fragmentation Methods 0.000 claims description 8
- 238000006062 fragmentation reaction Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 6
- 239000000470 constituent Substances 0.000 claims description 5
- 108091034117 Oligonucleotide Proteins 0.000 claims description 4
- 230000001925 catabolic effect Effects 0.000 claims description 4
- 239000003795 chemical substances by application Substances 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 150000004676 glycans Chemical class 0.000 claims description 4
- 108020004707 nucleic acids Proteins 0.000 claims description 4
- 102000039446 nucleic acids Human genes 0.000 claims description 4
- 150000007523 nucleic acids Chemical class 0.000 claims description 4
- 108091033319 polynucleotide Proteins 0.000 claims description 4
- 102000040430 polynucleotide Human genes 0.000 claims description 4
- 239000002157 polynucleotide Substances 0.000 claims description 4
- 229920001282 polysaccharide Polymers 0.000 claims description 4
- 239000005017 polysaccharide Substances 0.000 claims description 4
- 229920001059 synthetic polymer Polymers 0.000 claims 3
- 230000001939 inductive effect Effects 0.000 claims 1
- 239000000178 monomer Substances 0.000 description 84
- 108090000765 processed proteins & peptides Proteins 0.000 description 21
- 230000008569 process Effects 0.000 description 16
- 230000005055 memory storage Effects 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 12
- 102000004196 processed proteins & peptides Human genes 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 239000000539 dimer Substances 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- 150000002500 ions Chemical class 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000002503 metabolic effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 102000001189 Cyclic Peptides Human genes 0.000 description 3
- 108010069514 Cyclic Peptides Proteins 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 238000009510 drug design Methods 0.000 description 3
- 238000009509 drug development Methods 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 241000380131 Ammophila arenaria Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010504 bond cleavage reaction Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 229940126586 small molecule drug Drugs 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- AYEKOFBPNLCAJY-UHFFFAOYSA-O thiamine pyrophosphate Chemical compound CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N AYEKOFBPNLCAJY-UHFFFAOYSA-O 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 240000005020 Acaciella glauca Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 238000010847 SEQUEST Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- -1 antibodies Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Description
本発明は、切断頂点(cut vertex)手法を使用することにより錯体分子(特に生体分子などの巨大分子)の下部構造を識別するためのシステム、装置及び方法に関する。
医薬化合物の下部構造(代謝物など)を識別し特徴付けることは創薬の重要部分である。このような代謝物の構造を理解すること及び代謝変換の特定部位を定義することは、例えばそれらの化合物にしばしば伴う安定性及び毒性問題を克服するために薬候補の主化合物の合成最適化を誘導する際に有用である。
一般的に、本発明のいくつかの実施形態は、錯体分子の代謝物及び他の下部構造を識別しそしてこのような代謝物及び他の下部構造の関連化学構造を判断するために化学者及び生化学者などの科学者により使用され得る。したがって、本発明のいくつかの実施形態は薬剤開発及び設計において極めて有用であると考えられ得る。この目的を達成するために、本発明のいくつかの実施形態は検討中の分子(選択分子)を表すための独特なシステムを採用する。具体的には、選択分子は、規定最小切断可能ユニットのグラフ(最小切断可能ユニットグラフ(MCU(minimum cleavable unit graph)グラフ)と呼ばれる)の観点で説明される。本明細書で列挙される最小切断可能ユニットはいかなる切断(cut/cleavage)(代謝過程の無い)も発生することが許容されない分子の一部分である。最小切断可能ユニットは選択分子の隣接代謝切断部位間の原子団を含み得る。一例として、蛋白質又はペプチド分子の最小切断可能ユニットは例えば単一アミノ酸又は一続きのアミノ酸を含み得る。例えば、環状ペプチドの最小切断可能ユニットは環状ペプチドの中核領域を含み得る。最小切断可能ユニット手法は当該分子をより単純なやり方で(例えば複合蛋白質構造を直鎖ペプチド領域に変換することを試みることにより複合蛋白質構造の複雑性を低減することにより)定義することを容易にする。最小切断可能ユニット手法は、MCU内に切断を有する代謝物をたどることを無くすモジュールをユーザが定義することを許容し、したがって機能的ではない。選択分子中の各MCUはMCUグラフ内の頂点に対応する。MCUグラフはコンピュータシステムのメモリ内のデータ構造内に格納されるデータにより表される。
本発明の一実施形態の動作の第1段階では、ユーザは、(A)選択分子の1つ又は複数組の構成要素の最小切断可能ユニット、(B)選択分子の構成要素内の一組の最小切断可能ユニットを接続する1つ又は複数組の結合、(C)各最小切断可能ユニットの分子量、及び(D)選択分子の接続プロファイルを含む選択分子データを入力する。接続プロファイルは、最小切断可能ユニットと結合との相対位置、及び最小切断可能ユニットと結合との間の接続を指示するように配置される。選択分子データは選択分子のMCUグラフ又は選択分子の別の表現の形式、例えば頂点及び辺注釈(MCUの識別子、MCUを接続する結合のタイプ、及びMCUの各MCUの分子量を含む)を有する化学構造又は図の形式で提供され得る。
第2段階の動作では、本システムはユーザ(選択分子データを提供したユーザであってもなくてもよい)から照会分子量を受信する。ここで、入力される照会分子量は実験によりユーザにより予め判断される又は質量分析計などの別のソース又は別のデバイスから取得されるかのいずれかである。本システムは、照会分子量に整合する分子量フィールド内の全分子量を有する選択分子の第1の構成要素及び第2の構成要素のICS記録のすべてを発見するために、メモリ内に格納されたICS(各ICSは、分子量、頂点配列値、辺配列値及び生体変換カウントを含む)記録を検索する。このようなICS記録が発見されると、本システムは、発見された各ICS記録の各誘導連結サブグラフの頂点及び辺データを生成してユーザへ表示するためにICS記録内の情報を使用する。任意選択的に、本システムはまた、各記録内の頂点及び辺データに基づき、整合誘導連結サブグラフの構造のグラフィック表現を表示、印刷、又は送信し得る。
動作の第3段階では、本システムは、組み合わせられると照会分子量に整合する全分子量を有する2つのICS記録(選択分子の構成要素毎に1つの記録)の組み合わせを発見するためにメモリ内のICS記録を再び検索する。分子量のこのような組み合わせが発見されれば、これは、切断頂点を跨ぎ(含み)そして第1の構成要素と第2の構成要素の両構成要素内に存在する頂点を有する誘導連結サブグラフ内の頂点及び結合の構造及び物理的配置に対応する選択分子の下部構造が存在するということを意味する。好ましいいくつかの実施態様では、本発明はまた、切断頂点を跨ぐとともにそれを含む選択分子の下部構造の頂点データ、辺データ(及び任意選択的にグラフィック表現)をディスプレイデバイス上に表示及び/又は送信するように構成される。
1)(A)選択分子内の一組の最小切断可能ユニット、(B)選択分子内の一組の最小切断可能ユニットを接続する一組の結合、(C)各最小切断可能ユニットの分子量、(D)選択分子の接続プロファイルであって最小切断可能ユニットと結合とその間の接続との相対位置を指示する接続プロファイル、及び(E)選択分子内の切断頂点であって切断頂点の除去が選択分子を第1の構成要素及び第2の構成要素へ分離するだろう切断頂点を表す選択分子データを受信しメモリ内に格納すること、
2)選択分子データに基づき選択分子の第1の構成要素の第1の最小切断可能ユニットグラフデータ構造を生成しメモリ内に格納することであって、第1の最小切断可能ユニットグラフデータ構造には第1の構成要素の第1のMCUグラフを表す第1のMCUグラフデータが取り込まれ、第1のMCUグラフは複数の第1のMCUグラフ頂点及び複数の第1のMCUグラフ辺を有し、各第1のMCUグラフ頂点は第1の構成要素の最小切断可能ユニットに対応し、各第1のMCUグラフ辺は第1の構成要素内の第1の結合接続最小切断可能ユニットに対応する、格納すること、
3)第1のMCUグラフデータに基づき選択分子の第1の構成要素の第1の線グラフデータ構造を生成しメモリ内に格納することであって、第1の線グラフデータ構造には第1のMCUグラフの第1の線グラフを表す第1の線グラフデータが取り込まれ、第1の線グラフは複数の第1の線グラフ頂点及び複数の第1の線グラフ辺を有し、各第1の線グラフ頂点(「LG頂点」)は第1のMCUグラフ内の第1のMCUグラフ辺に対応しそして各第1の線グラフ辺(「LG辺」)は前記第1のMCUグラフ辺により連結される第1のMCUグラフ内の一対の第1のMCUグラフ頂点に対応する、格納すること、
4)第1の線グラフの複数の第1の誘導連結サブグラフを判断するために選択分子の第1の構成要素の第1の線グラフデータ構造内の第1の線グラフデータに対してグラフトラバースアルゴリズムを実行することであって、各第1の誘導連結サブグラフは、第1の線グラフ内の第1のLG頂点及び第1のLG辺の第1の接続サブセットと、第1のLG頂点及び第1のLG辺の前記第1の接続サブセットの第1の物理的配置とを含み、第1のLG頂点及び第1のLG辺の接続サブセットはその第1の物理的配置と併せて、一組の最小切断可能ユニット及び結合の第1の接続サブセットと選択分子内の最小切断可能ユニット及び結合の前記第1の接続サブセットの相対位置とに一意的に対応する、実行すること、
5)選択分子の第1の構成要素の第1の線グラフデータ構造で表される第1の誘導連結サブグラフ毎に、第1の分子量フィールド、第1の頂点データフィールド及び第1の辺データフィールドを含む第1のICS記録を生成しデータベース内に格納することであって、第1の頂点データフィールドには第1の誘導連結サブグラフ内のあらゆる第1のLG頂点の第1の頂点位置を指示するように構成された第1の頂点値が取り込まれ、第1の辺データフィールドには第1のLG頂点に対する第1の誘導連結サブグラフ内のあらゆる第1のLG辺の第1の辺位置を指示するように構成された第1の辺値が取り込まれる、格納すること、
6)選択分子の第1の構成要素の第1の線グラフデータ構造内の第1のICS記録毎に、選択分子の選択分子データと第1のICS記録内の第1の頂点値及び第1の辺値とに基づき当該の第1のICS記録の第1の誘導連結サブグラフの第1の全分子量を計算し第1の分子量フィールド内に格納すること、
7)選択分子データに基づき選択分子の第2の構成要素の第2の最小切断可能ユニットグラフデータ構造を生成しメモリ内に格納することであって、第2の最小切断可能ユニットグラフデータ構造には第2の構成要素の第2のMCUグラフを表す第2のMCUグラフデータが取り込まれ、第2のMCUグラフは複数の第2のMCUグラフ頂点及び複数の第2のMCUグラフ辺を有し、各第2のMCUグラフ頂点は第2の構成要素の最小切断可能ユニットに対応し、各第2のMCUグラフ辺は第2の構成要素内の第2の結合接続最小切断可能ユニットに対応する、格納すること、
8)第2のMCUグラフデータに基づき選択分子の第2の構成要素の第2の線グラフデータ構造を生成しメモリ内に格納することであって、第2の線グラフデータ構造には第2のMCUグラフの第2の線グラフを表す第2の線グラフデータが取り込まれ、第2の線グラフは複数の第2のLG頂点及び複数の第2のLG辺を有し、各第2の線グラフ頂点は第2のMCUグラフ内の第2のMCUグラフ辺に対応し、各第2の線グラフ辺は前記第2のMCUグラフ辺により連結される第2のMCUグラフ内の一対の第2のMCUグラフ頂点に対応する、格納すること、
9)第2の線グラフの複数の第2の誘導連結サブグラフを判断するために選択分子の第2の構成要素の第2の線グラフデータ構造内の第2の線グラフデータに対してグラフトラバースアルゴリズムを実行することであって、各第2の誘導連結サブグラフは第2の線グラフ内の第2のLG頂点及び第2のLG辺の第2の接続サブセットと第2のLG頂点及び第2のLG辺の前記第2の接続サブセットの第2の物理的配置とを含み、これらは併せて、一組の最小切断可能ユニット及び結合の第2の接続サブセットと、選択分子内の最小切断可能ユニット及び結合の前記第2の接続サブセットの相対位置に一意的に対応する、実行すること、
10)選択分子の第2の構成要素の第2の線グラフデータ構造で表される第2の誘導連結サブグラフ毎に、第2の分子量フィールド、第2の頂点データフィールド及び第2の辺データフィールドを含む第2のICS記録をデータベース内に生成することであって、第2の頂点データフィールドには第2の誘導連結サブグラフ内のあらゆる第2のLG頂点の第2の頂点位置を指示するように構成された第2の頂点値が取り込まれ、第2の辺データフィールドには第2のLG頂点に対する第2の誘導連結サブグラフ内のあらゆる第2のLG辺の第2の辺位置を指示するように構成された第2の辺値が取り込まれる、生成すること、
11)選択分子の第2の構成要素の第2の線グラフデータ構造内の第2のICS記録毎に、選択分子の選択分子データと第2のICS記録内の第2の頂点値及び第2の辺値とに基づき当該の第2のICS記録の第2の誘導連結サブグラフの第2の全分子量を計算し第2の分子量フィールド内に格納すること。
(i)エンドユーザから照会分子量を受信すること、
(ii)照会分子量に整合する第1の分子量フィールド内の第1の全分子量を有する第1のICS記録を識別するためにデータベースを検索すること、
(iii)照会分子量に整合する第2の分子量フィールド内の第2の全分子量を有する第2のICS記録を識別するためにデータベースを検索すること、
(iv)照会分子量に整合する第1の全分子量を有する第1のICS記録に対応する第1の誘導連結サブグラフの第1のグラフィック表現を生成しディスプレイデバイス上に表示するために、第1の頂点データフィールド内の第1の頂点値と、識別された第1のICS記録の第1の辺データフィールド内の第1の辺値とを使用すること、
(v)照会分子量に整合する第2の全分子量を有する第2のICS記録に対応する第2の誘導連結サブグラフの第2のグラフィック表現を生成しディスプレイデバイス上に表示するために、第2の頂点データフィールド内の第2の頂点値と、識別された第2のICS記録の第2の辺データフィールド内の第2の辺値とを使用すること、
(vi)照会分子量から切断頂点の分子量を減じることにより調整照会分子量を計算すること、
(vii)選択分子の第1の構成要素に関し第1の部分的ICS記録を識別することであって、第1の部分的ICS記録は、第1の構成要素のすべての他の分子量フィールド内のすべての他の分子量に対して最低の第1の分子量を第1の分子量フィールド内に有する、識別すること、
(viii)調整照会分子量から選択分子の第1の構成要素の第1の部分的ICS記録の最低の第1の分子量を減じることにより修正照会分子量を計算すること、
(ix)選択分子の第2の構成要素のICS記録を検索するために選択分子の第2の構成要素の第2の部分的ICS記録を識別するために修正照会分子量を使用することであって、第2の部分的ICS記録は、第1の構成要素の第1の部分的ICS記録の第1の分子量と組み合わせられると修正照会分子量と整合する第2の分子量フィールド内の第2の分子量を有する、使用すること、
(x)選択分子の第1の構成要素と第2の構成要素との組み合わせ誘導連結サブグラフのグラフィック表現を生成しディスプレイデバイス上に表示するために、第1及び第2の部分的ICS記録の頂点データフィールド内の頂点値、第1及び第2の部分的ICS記録の辺データフィールド内の辺値、切断頂点及び選択分子データを使用することであって、組み合わせ誘導連結サブグラフは第1の部分的ICS記録の誘導連結サブグラフと第2の部分的ICS記録の誘導連結サブグラフとを連結することにより生成される、使用すること、
(xi)第1の部分的ICS記録を別の第1のICS記録により置換することであって、前記別の第1のICS記録は、第1の部分的ICS記録の分子量フィールド内の分子量に対する次の最低の第1の分子量を第1の分子量フィールド内に含む、置換すること、
(xii)選択分子の第1の構成要素の第1のICS記録の第1の分子量フィールド内の第1の分子量のそれぞれが工程viii)~xi)を行うために使用されてしまうまで上記工程viii)~xi)を繰り返すこと。
i)G1\{v}のサブグラフ、
ii)G2\{v}のサブグラフ、又は、
(iii)サブグラフC1∪{v}∪C2、
ここで、C1及びC2はそれぞれG1\{v}及びG2\{v}のサブグラフであり、頂点vに隣接する。
本明細書において説明される切断頂点方法は、全分子内の下部構造のすべてを一斉に解析し識別することを試みる代わりに、選択分子を別々に表す線グラフの2つの個別サブセクション内に発見される下部構造を解析及び識別し、そして次に2つの解析の結果を集約することにより複雑な構造を有するコンピュータを完全にダウンさせる問題を低減しそして多数の代謝物を識別することを容易にし、これにより巨大錯体分子の薬剤開発及び設計を容易にする。しかし本発明のいくつかの実施形態はすべてのタイプの分子の下部構造を識別するために適用可能であり且つ有用であるということに留意すべきである。下部構造が属する分子は「選択分子」と呼ばれる。選択分子は巨大分子、高分子、又は小分子であり得る。巨大分子は、限定しないが、ペプチドなどのアミノ酸ベース分子だけでなくポリペプチド、抗体、蛋白質、酵素、免疫グロブリン、脂質、核酸、炭水化物、オリゴヌクレオチド、ポリヌクレオチド、多糖、及び高分子を含む。選択分子はまた共役分子及び交差結合分子であり得る。
アラニンAla A、アルギニンArg R、アスパラギンAsn N、アスパラギン酸Asp D、システインCys C、グルタミン酸Glu E、グルタミンGln Q、グリシンGly G、ヒスチジンHi H、イソロイシンIle I、ロイシンLeu L、リジンLys K、メチオニンMet M、フェニルアラニンPhe F、プロリンPro P、セリンSer S、トレオニンThr T、トリプトファンTrp W、チロシンTyr Y、バリンVal V
工程305-ICSデータベース内の第1のICS記録を選択する、
工程310-選択されたICS記録内の辺配列を識別する、
工程315-辺配列内のすべての0を識別することにより喪失辺を識別する、
工程320-その初期値を零に設定することにより、選択されたICS記録の生体変換カウントフィールドを初期化する、
工程325-辺配列内の喪失辺毎に、喪失辺が下部構造内の少なくとも1つの頂点に隣接すれば、生体変換カウントフィールド内の値を1だけ増分する、
工程330-ICSデータベース内の次のICS記録を選択する、及び
工程335-生体変換カウント値が計算されICSデータベース内のあらゆるICS記録内に格納されてしまうまで工程310~330を繰り返す。
Claims (39)
- 選択分子の下部構造を識別するためのシステムであって、前記システムは、
a)マイクロプロセッサ、
b)メモリ、
c)前記メモリ内のアプリケーションプログラムであって、前記マイクロプロセッサにより実行されると前記マイクロプロセッサに、
i)(A)前記選択分子内の一組の最小切断可能ユニット、(B)前記選択分子内の一組の最小切断可能ユニットを接続する一組の結合、(C)各最小切断可能ユニットの分子量、(D)前記選択分子の接続プロファイルであって最小切断可能ユニットと結合とその間の接続との相対位置を指示する接続プロファイル、及び(E)前記選択分子内の切断頂点であって前記切断頂点の除去は前記選択分子を第1の構成要素及び第2の構成要素へ分離する切断頂点を表す選択分子データを受信し前記メモリ内に格納すること、
ii)前記選択分子データに基づき前記選択分子の前記第1の構成要素の第1の最小切断可能ユニットグラフデータ構造を生成し前記メモリ内に格納することであって、前記第1の最小切断可能ユニットグラフデータ構造には前記第1の構成要素の第1のMCUグラフを表す第1のMCUグラフデータが取り込まれ、前記第1のMCUグラフは複数の第1のMCUグラフ頂点及び複数の第1のMCUグラフ辺を有し、各第1のMCUグラフ頂点は前記第1の構成要素の最小切断可能ユニットに対応し、各第1のMCUグラフ辺は前記第1の構成要素内の第1の結合接続最小切断可能ユニットに対応する、前記第1の最小切断可能ユニットグラフデータ構造を生成し格納すること、
iii)前記第1のMCUグラフデータに基づき前記選択分子の前記第1の構成要素の第1の線グラフデータ構造を生成し前記メモリ内に格納することであって、前記第1の線グラフデータ構造には前記第1のMCUグラフの第1の線グラフを表す第1の線グラフデータが取り込まれ、前記第1の線グラフは複数の第1のLG頂点及び複数の第1のLG辺を有し、各第1のLG頂点は前記第1のMCUグラフ内の第1のMCUグラフ辺に対応し、各第1のLG辺は前記第1のMCUグラフ辺により連結される前記第1のMCUグラフ内の一対の第1のMCUグラフ頂点に対応する、前記第1の構成要素の第1の線グラフデータ構造を生成し格納すること、
iv)前記第1の線グラフの複数の第1の誘導連結サブグラフを判断するために前記選択分子の前記第1の構成要素の前記第1の線グラフデータ構造内の前記第1の線グラフデータに対してグラフトラバースアルゴリズムを実行することであって、各第1の誘導連結サブグラフは、前記第1の線グラフ内の第1のLG頂点及び第1のLG辺の第1の接続サブセットと、第1のLG頂点及び第1のLG辺の前記第1の接続サブセットの第1の物理的配置とを含み、これらは併せて、前記一組の最小切断可能ユニット及び結合の第1の接続サブセットと、前記選択分子内の前記最小切断可能ユニット及び結合の前記第1の接続サブセットの相対位置とに一意的に対応する、前記グラフトラバースアルゴリズムを実行すること、
v)前記選択分子の前記第1の構成要素の前記第1の線グラフデータ構造で表される第1の誘導連結サブグラフ毎に、第1の分子量フィールド、第1の頂点データフィールド及び第1の辺データフィールドを含む第1のICS記録を生成しデータベース内に格納することであって、前記第1の頂点データフィールドには前記第1の誘導連結サブグラフ内のあらゆる第1のLG頂点の第1の頂点位置を指示するように構成された第1の頂点値が取り込まれ、前記第1の辺データフィールドには前記第1のLG頂点に対する前記第1の誘導連結サブグラフ内のあらゆる前記第1のLG辺の第1の辺位置を指示するように構成された第1の辺値が取り込まれる、前記第1のICS記録を生成し格納すること、
vi)前記選択分子の前記第1の構成要素の前記第1の線グラフデータ構造内の第1のICS記録毎に、前記選択分子の前記選択分子データと前記第1のICS記録内の前記第1の頂点値及び前記第1の辺値とに基づき前記第1のICS記録の前記第1の誘導連結サブグラフの第1の全分子量を計算し前記第1の分子量フィールド内に格納すること、
vii)前記選択分子データに基づき前記選択分子の前記第2の構成要素の第2の最小切断可能ユニットグラフデータ構造を生成し前記メモリ内に格納することであって、前記第2の最小切断可能ユニットグラフデータ構造には前記第2の構成要素の第2のMCUグラフを表す第2のMCUグラフデータが取り込まれ、前記第2のMCUグラフは複数の第2のMCUグラフ頂点及び複数の第2のMCUグラフ辺を有し、各第2のMCUグラフ頂点は前記第2の構成要素の最小切断可能ユニットに対応し、各第2のMCUグラフ辺は前記第2の構成要素内の第2の結合接続最小切断可能ユニットに対応する、前記第2の最小切断可能ユニットグラフデータ構造を生成し格納すること、
viii)前記第2のMCUグラフデータに基づき前記選択分子の前記第2の構成要素の第2の線グラフデータ構造を生成し前記メモリ内に格納することであって、前記第2の線グラフデータ構造には前記第2のMCUグラフの第2の線グラフを表す第2の線グラフデータが取り込まれ、前記第2の線グラフは複数の第2のLG頂点及び複数の第2のLG辺を有し、各第2のLG頂点は前記第2のMCUグラフ内の第2のMCUグラフ辺に対応し各第2のLG辺は前記第2のMCUグラフ辺により連結される前記第2のMCUグラフ内の一対の第2のMCUグラフ頂点に対応する、前記第2の線グラフデータ構造を生成し格納すること、
ix)前記第2の線グラフの複数の第2の誘導連結サブグラフを判断するために前記選択分子の前記第2の構成要素の前記第2の線グラフデータ構造内の前記第2の線グラフデータに対してグラフトラバースアルゴリズムを実行することであって、各第2の誘導連結サブグラフは、前記第2の線グラフ内の第2のLG頂点及び第2のLG辺の第2の接続サブセットと、第2のLG頂点及び第2のLG辺の前記第2の接続サブセットの第2の物理的配置とを含み、これらは併せて、前記一組の最小切断可能ユニット及び結合の第2の接続サブセットと、前記選択分子内の最小切断可能ユニット及び結合の前記第2の接続サブセットの相対位置に一意的に対応する、前記グラフトラバースアルゴリズムを実行すること、
x)前記選択分子の前記第2の構成要素の前記第2の線グラフデータ構造で表される第2の誘導連結サブグラフ毎に、第2の分子量フィールド、第2の頂点データフィールド及び第2の辺データフィールドを含む第2のICS記録を生成し前記データベース内に格納することであって、前記第2の頂点データフィールドには前記第2の誘導連結サブグラフ内のあらゆる第2のLG頂点の第2の頂点位置を指示するように構成された第2の頂点値が取り込まれ、前記第2の辺データフィールドには前記第2のLG頂点に対する前記第2の誘導連結サブグラフ内のあらゆる前記第2のLG辺の第2の辺位置を指示するように構成された第2の辺値が取り込まれる、前記第2のICS記録を生成し格納すること、及び
xi)前記選択分子の前記第2の構成要素の前記第2の線グラフデータ構造内の第2のICS記録毎に、前記選択分子の前記選択分子データと前記第2のICS記録内の前記第2の頂点値及び前記第2の辺値とに基づき前記第2のICS記録の前記第2の誘導連結サブグラフの第2の全分子量を計算し前記第2の分子量フィールド内に格納することをさせるプログラム命令を前記メモリ内に含むアプリケーションプログラム、及び、
d)前記マイクロプロセッサにより実行されると、前記マイクロプロセッサに、
i)エンドユーザから照会分子量を受信すること、
ii)前記照会分子量に整合する前記第1の分子量フィールド内の第1の全分子量を有する第1のICS記録を識別するために前記データベースを検索すること、
iii)前記照会分子量に整合する前記第2の分子量フィールド内の第2の全分子量を有する第2のICS記録を識別するために前記データベースを検索すること、
iv)前記照会分子量に整合する前記第1の全分子量を有する前記第1のICS記録に対応する前記第1の誘導連結サブグラフの第1のグラフィック表現を生成しディスプレイデバイス上に表示するために、前記第1の頂点データフィールド内の前記第1の頂点値と前記識別された第1のICS記録の前記第1の辺データフィールド内の前記第1の辺値とを使用すること、
v)前記照会分子量に整合する前記第2の全分子量を有する前記第2のICS記録に対応する前記第2の誘導連結サブグラフの第2のグラフィック表現を生成し前記ディスプレイデバイス上に表示するために、前記第2の頂点データフィールド内の前記第2の頂点値と前記識別された第2のICS記録の前記第2の辺データフィールド内の前記第2の辺値とを使用すること、
vi)前記照会分子量から前記切断頂点の分子量を減じることにより調整照会分子量を計算すること、
vii)前記選択分子の前記第1の構成要素に関し第1の部分的ICS記録を識別することであって、前記第1の部分的ICS記録は、前記第1の構成要素のすべての他の分子量フィールド内のすべての他の分子量に対して最低の第1の分子量を前記第1の分子量フィールド内に有する、前記第1の部分的ICS記録を識別すること、
viii)前記調整照会分子量から前記選択分子の前記第1の構成要素の前記第1の部分的ICS記録の前記最低の第1の分子量を減じることにより修正照会分子量を計算すること、
ix)前記選択分子の前記第2の構成要素の前記ICS記録を検索するために前記選択分子の前記第2の構成要素の第2の部分的ICS記録を識別するために前記修正照会分子量を使用することであって、前記第2の部分的ICS記録は、前記第1の構成要素の前記第1の部分的ICS記録の前記第1の分子量と組み合わせられると前記修正照会分子量と整合する前記第2の分子量フィールド内の第2の分子量を有する、前記修正照会分子量を使用すること、
x)前記選択分子の前記第1及び第2の構成要素の組み合わせ誘導連結サブグラフのグラフィック表現を生成し前記ディスプレイデバイス上に表示するために、前記第1及び第2の部分的ICS記録の前記頂点データフィールド内の前記頂点値、前記第1及び第2の部分的ICS記録の前記辺データフィールド内の前記辺値、前記切断頂点及び前記選択分子データを使用することであって、前記組み合わせ誘導連結サブグラフは、前記第1の部分的ICS記録の誘導連結サブグラフと前記第2の部分的ICS記録の誘導連結サブグラフとを連結することにより生成される、使用すること、
xi)前記第1の部分的ICS記録を別の第1のICS記録により置換することであって、前記別の第1のICS記録は前記第1の部分的ICS記録の前記分子量フィールド内の分子量に対する前記第1の分子量フィールド内の次の最低の第1の分子量を含む、前記第1の部分的ICS記録を置換すること、及び
xii)前記選択分子の前記第1の構成要素の前記第1のICS記録の前記第1の分子量フィールド内の前記第1の分子量のそれぞれが工程viii)~xi)を行うために使用されてしまうまで前記工程viii)~xi)を繰り返すことをさせるプログラム命令を含むユーザインターフェース、を含むシステム。 - 前記マイクロプロセッサにより実行されると前記マイクロプロセッサに、
a)前記照会分子量の規定公差を受信すること、
b)前記データベースの前記検索のための一範囲の分子量を計算し定義するために前記規定公差を使用すること、
c)前記一範囲の分子量内に入る前記分子量フィールド内の全分子量を有する前記データベース内の各ICS記録を識別するために前記照会分子量及び前記一範囲に基づき前記データベースを検索すること、及び
d)前記識別されたICS記録毎に、前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値を前記エンドユーザへ提示するために前記ユーザインターフェースへ送信することをさせるプログラム命令を前記アプリケーションプログラム内にさらに含む請求項1に記載のシステム。 - 前記選択分子データは、連結リスト、又は配列、又は隣接行列、又はグラフィック画像ファイル、又は化学図ファイル、又はスプレッドシートファイル、又はテキストファイル、又はCSVファイル、又は.CDXファイル、.CDXMLファイル、又は.MOLファイル、又は.SDMファイル、CADファイル、又はバイナリデータファイル内に格納された情報を解析することにより受信される、請求項1に記載のシステム。
- 前記一組の最小切断可能ユニット及び結合の前記接続サブセットは前記選択分子の代謝物、又は前記選択分子の異化生成物、又は前記選択分子の気相断片化、又は前記選択分子の分解剤、又は前記選択分子の下部構造である、請求項1に記載のシステム。
- 前記第1のMCUグラフデータ及び前記第2のMCUグラフデータの少なくとも一方は配列、隣接行列、隣接リスト、結合行列又は結合リストである、請求項1に記載のシステム。
- 前記線グラフデータ構造は配列、隣接行列、隣接リスト、結合行列又は結合リストである、請求項1に記載のシステム。
- 前記グラフトラバースアルゴリズムは深さ優先検索アルゴリズム、又は幅優先検索アルゴリズム、又は逆検索アルゴリズム、又はツリー検索アルゴリズム、又はこれらの2つ以上の組み合わせである、請求項1に記載のシステム。
- 前記選択分子は小分子である、請求項1に記載のシステム。
- 前記選択分子は巨大分子である、請求項1に記載のシステム。
- 前記巨大分子は、蛋白質、核酸、オリゴヌクレオチド、ポリヌクレオチド、多糖又は合成高分子である、請求項9に記載のシステム。
- a)前記選択分子データは、(A)各最小切断可能ユニット内の一組の基本ユニット、(B)前記最小切断可能ユニット内の前記一組の基本ユニットを連結する一組の基本結合、(C)各基本ユニットの基本分子量、及び(D)前記最小切断可能ユニットのMCU接続プロファイルであって前記最小切断可能ユニット内の前記基本ユニットと前記基本結合との相対位置及びその間の接続を指示するMCU接続プロファイルを表す基本組成データを含み、
b)前記データベース内に生成される前記ICS記録はさらに、1つ又は複数の基本ユニット識別子が取り込まれる基本ユニットフィールドを含み、
c)前記アプリケーションプログラムはさらに、前記マイクロプロセッサにより実行されると前記マイクロプロセッサに:
i)前記エンドユーザから照会基本ユニットを受信すること、
ii)前記照会基本ユニットに整合する前記基本ユニットフィールド内の基本ユニット識別子を有するICS記録を識別するために前記照会基本ユニットに基づき前記データベースを検索すること、及び
iii)前記識別されたICS記録の前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値を前記エンドユーザにより操作されるディスプレイデバイス上の提示のために前記ユーザインターフェースへ送信することをさせるプログラム命令を含む、請求項1に記載のシステム。 - a)前記データベース内で生成される各ICS記録は生体変換カウントフィールドをさらに含み、
b)前記ユーザインターフェースはさらに、前記マイクロプロセッサにより実行されると前記マイクロプロセッサに、i)前記エンドユーザから最大生体変換カウントを受信すること、及びii)照会質量に整合する前記分子量フィールド内の分子量値を有するICS記録及び前記生体変換カウント最大値を越えない前記生体変換カウントフィールド内の生体変換カウント値を識別するために前記照会質量及び前記最大生体変換カウントに基づき前記データベースを検索することをさせるプログラム命令を含む、請求項1に記載のシステム。 - a)前記データベース内で生成される各ICS記録は生体変換カウントフィールドをさらに含み、
b)前記ユーザインターフェースは、前記マイクロプロセッサにより実行されると前記マイクロプロセッサに:
i)前記第1の誘導連結サブグラフ、前記第2の誘導連結サブグラフ、及び前記組み合わせ誘導連結サブグラフ間のランク順を前記各ICS記録の前記生体変換カウントフィールドに基づき判断すること、及び
ii)前記第1の誘導連結サブグラフの前記第1のグラフィック表現、前記第2の誘導連結サブグラフの前記第2のグラフィック表現及び前記組み合わせ誘導連結サブグラフの前記グラフィック表現を前記ランク順に従って前記ディスプレイデバイス上に表示することをさせるプログラム命令をさらに含む、請求項1に記載のシステム。 - マイクロプロセッサを使用して選択分子の下部構造を識別することを容易にするためにデータベースを生成するためのシステムであって、前記システムは、
a)メモリ、
b)マイクロプロセッサ、
c)(A)前記選択分子内の一組の最小切断可能ユニット、(B)前記選択分子内の前記一組の最小切断可能ユニットを接続する一組の結合、(C)各最小切断可能ユニットの分子量、(D)前記選択分子内に在る切断頂点であって、除去されると前記選択分子を第1の構成要素と第2の構成要素とへ分離する、切断頂点、及び(E)前記選択分子内の前記最小切断可能ユニット及び結合の接続プロファイルであって最小切断可能ユニットと結合とその間の接続との相対位置を指示する接続プロファイルを表す選択分子データを受信して格納するための入力モジュール、
d)
i)前記選択分子の前記第1の構成要素の第1の最小切断可能ユニットグラフデータ構造であって、前記第1の最小切断可能ユニットグラフデータ構造には前記第1の構成要素の第1のMCUグラフを表す第1のMCUグラフデータが取り込まれ、前記第1のMCUグラフは複数の第1のMCUグラフ頂点及び複数の第1のMCUグラフ辺を有し、各第1のMCUグラフ頂点は前記第1の構成要素の最小切断可能ユニットに対応し、各第1のMCUグラフ辺は前記第1の構成要素内の第1の結合接続最小切断可能ユニットに対応する、第1の最小切断可能ユニットグラフデータ構造、及び
ii)前記選択分子の前記第2の構成要素の第2の最小切断可能ユニットグラフデータ構造であって、前記第2の最小切断可能ユニットグラフデータ構造には前記第2の構成要素の第2のMCUグラフを表す第2のMCUグラフデータが取り込まれ、前記第2のMCUグラフは複数の第2のMCUグラフ頂点及び複数の第2のMCUグラフ辺を有し、各第2のMCUグラフ頂点は前記第2の構成要素の最小切断可能ユニットに対応し、各第2のMCUグラフ辺は前記第2の構成要素内の第2の結合接続最小切断可能ユニットに対応する、第2の最小切断可能ユニットグラフデータ構造を生成し前記メモリ内に格納するように構成されたMCUグラフデータ構造生成器、
e)
i)前記第1のMCUグラフデータに基づき前記選択分子の前記第1の構成要素の第1の線グラフデータ構造を生成し前記メモリ内に格納することであって、前記第1の線グラフデータ構造には前記第1のMCUグラフの第1の線グラフを表す第1の線グラフデータが取り込まれ、前記第1の線グラフは複数の第1のLG頂点及び複数の第1のLG辺を有し、各第1のLG頂点は前記第1のMCUグラフ内の第1のMCUグラフ辺に対応し、各第1のLG辺は前記第1のMCUグラフ辺により連結される前記第1のMCUグラフ内の一対の第1のMCUグラフ頂点に対応する、前記第1の線グラフデータ構造を生成し格納すること、及び
ii)前記第2のMCUグラフデータに基づき前記選択分子の前記第2の構成要素の第2の線グラフデータ構造を生成し前記メモリ内に格納することであって、前記第2の線グラフデータ構造には前記第2のMCUグラフの第2の線グラフを表す第2の線グラフデータが取り込まれ、前記第2の線グラフは複数の第2のLG頂点及び複数の第2のLG辺を有し、各第2の線グラフ頂点は第2のMCUグラフ内の第2のMCUグラフ辺に対応し各第2の線グラフ辺は前記第2のMCUグラフ辺により連結される第2のMCUグラフ内の一対の第2のMCUグラフ頂点に対応する、前記第2の線グラフデータ構造を生成し格納することをするように構成された線グラフデータ構造生成器、
f)
i)前記第1の線グラフの複数の第1の誘導連結サブグラフを判断するために前記選択分子の前記第1の構成要素の前記第1の線グラフデータ構造内の前記第1の線グラフデータに対してグラフトラバースアルゴリズムを実行することであって、各第1の誘導連結サブグラフは、前記第1の線グラフ内の第1のLG頂点及び第1のLG辺の第1の接続サブセットと、第1のLG頂点及び第1のLG辺の前記第1の接続サブセットの第1の物理的配置とを含み、これらは併せて、前記一組の最小切断可能ユニット及び結合の第1の接続サブセットと、前記選択分子内の前記最小切断可能ユニット及び結合の前記第1の接続サブセットの相対位置に一意的に対応する、前記グラフトラバースアルゴリズムを実行すること、
ii)前記第2の線グラフの複数の第2の誘導連結サブグラフを判断するために前記選択分子の前記第2の構成要素の第2の線グラフデータ構造内の前記第2の線グラフデータに対して前記グラフトラバースアルゴリズムを実行することであって、各第2の誘導連結サブグラフは、前記第2の線グラフ内の第2のLG頂点及び第2のLG辺の第2の接続サブセットと、第2のLG頂点及び第2のLG辺の前記第2の接続サブセットの第2の物理的配置とを含み、これらは併せて、前記一組の最小切断可能ユニット及び結合の第2の接続サブセットと、前記選択分子内の最小切断可能ユニット及び結合の前記第2の接続サブセットの前記相対位置に一意的に対応する、前記グラフトラバースアルゴリズムを実行することをするように構成されたグラフトラバースモジュール、
g)
i)前記選択分子の前記第1の構成要素の前記の第1の線グラフデータ構造で表される第1の誘導連結サブグラフ毎に、第1の分子量フィールド、第1の頂点データフィールド及び第1の辺データフィールドを含む第1のICS記録を生成しサブグラフデータベース内に格納することであって、前記第1の頂点データフィールドには前記第1の誘導連結サブグラフ内のあらゆる第1のLG頂点の第1の頂点位置を指示するように構成された第1の頂点値が取り込まれ、前記第1の辺データフィールドには前記第1のLG頂点に対する前記第1の誘導連結サブグラフ内のあらゆる前記第1のLG辺の第1の辺位置を指示するように構成された第1の辺値が取り込まれる、前記第1のICS記録を生成し格納すること、
ii)前記選択分子の前記第2の構成要素の前記第2の線グラフデータ構造で表される第2の誘導連結サブグラフ毎に、第2の分子量フィールド、第2の頂点データフィールド及び第2の辺データフィールドを含む第2のICS記録を前記サブグラフデータベース内に生成することであって、前記第2の頂点データフィールドには前記第2の誘導連結サブグラフ内のあらゆる第2のLG頂点の第2の頂点位置を指示するように構成された第2の頂点値が取り込まれ、前記第2の辺データフィールドには前記第2のLG頂点に対する前記第2の誘導連結サブグラフ内のあらゆる第2のLG辺の第2の辺位置を指示するように構成された第2の辺値が取り込まれる、前記第2のICS記録を生成することを行うサブグラフデータベース生成器、及び
h)
i)前記選択分子の前記第1の構成要素の前記第1の線グラフデータ構造内の第1のICS記録毎に、前記選択分子の前記選択分子データと前記第1のICS記録内の前記第1の頂点値及び前記第1の辺値とに基づき前記第1のICS記録の前記第1の誘導連結サブグラフの第1の全分子量を計算し前記第1の分子量フィールド内に格納すること、
ii)前記選択分子の前記第2の構成要素の前記第2の線グラフデータ構造内の第2のICS記録毎に、前記選択分子の前記選択分子データと前記第2のICS記録内の前記第2の頂点値及び前記第2の辺値とに基づき前記第2のICS記録の前記第2の誘導連結サブグラフの第2の全分子量を計算し前記第2の分子量フィールド内に格納することを行う分子量計算器、を含むシステム。 - 前記選択分子データは、連結リスト、又は配列、又は隣接行列、又はグラフィック画像ファイル、又は化学図ファイル、又はスプレッドシートファイル、又はテキストファイル、又はCSVファイル、又は.CDXファイル、.CDXMLファイル、又は.MOLファイル、又は.SDMファイル、CADファイル、又はバイナリデータファイル内に格納された情報を解析することにより受信される、請求項14に記載のシステム。
- 前記一組の最小切断可能ユニット及び結合の前記接続サブセットは、前記選択分子の代謝物、又は前記選択分子の異化生成物、又は前記選択分子の気相断片化、又は前記選択分子の分解剤、又は前記選択分子の下部構造である、請求項14に記載のシステム。
- 前記第1のMCUグラフデータ及び前記第2のMCUグラフデータの少なくとも一方は配列、隣接行列、隣接リスト、結合行列又は結合リストである、請求項14に記載のシステム。
- 前記線グラフデータ構造は、配列、隣接行列、隣接リスト、結合行列又は結合リストである、請求項14に記載のシステム。
- 前記グラフトラバースアルゴリズムは、深さ優先検索アルゴリズム、又は幅優先検索アルゴリズム、又は逆検索アルゴリズム、又はツリー検索アルゴリズム、又はこれらの2つ以上の組み合わせである、請求項14に記載のシステム。
- a)エンドユーザとの通信のためのユーザインターフェース、及び
b)前記マイクロプロセッサにより実行されると前記マイクロプロセッサに、
i)前記エンドユーザから照会分子量を受信すること、
ii)前記照会分子量に整合する全分子量を前記分子量フィールド内に有するICS記録を識別するために前記照会分子量に基づき前記データベースを検索すること、
iii)前記識別されたICS記録の前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値を前記エンドユーザにより操作されるディスプレイデバイス上の提示のために前記ユーザインターフェースへ送信すること、
iv)前記照会分子量から前記切断頂点の分子量を減じることにより調整照会分子量を計算すること、
v)前記選択分子の前記第1の構成要素に関し、最も低い分子量を有するICS記録を識別すること、
vi)前記調整照会分子量から前記選択分子の前記第1の構成要素の前記ICS記録の最も低い分子量を減じることにより修正照会分子量を計算すること、
vii)前記第1の構成要素の前記ICS記録の分子量と組み合わせられると前記修正照会分子量に整合するICS記録を識別するために前記選択分子の前記第2の構成要素の前記ICS記録のバイナリサーチを前記修正照会分子量を使用して行うこと、
viii)前記識別された前記ICS記録の前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値を前記エンドユーザにより操作されるディスプレイデバイス上の提示のために前記ユーザインターフェースへ送信すること、
ix)次に最も低い分子量を有する前記選択分子の前記第1の構成要素の前記ICS記録を識別すること、及び
x)前記選択分子の前記第1の構成要素の前記ICS記録の前記分子量のそれぞれが工程vi)~viii)において使用されてしまうまで工程vi)~ix)を繰り返すこと、をさせるプログラム命令を有する前記メモリ内の検索エンジンをさらに含む請求項14に記載のシステム。 - 前記マイクロプロセッサにより実行されると前記マイクロプロセッサに、
a)前記選択分子の前記第1の構成要素及び前記第2の構成要素の前記線グラフの誘導連結サブグラフのグラフィック表現を生成するために前記頂点データフィールド内の前記頂点値、前記辺データフィールド内の前記辺値、及び前記選択分子データを使用すること、及び
b)前記グラフィック表現をエンドユーザにより操作されるディスプレイデバイスへ送信することを行わせるプログラム命令をユーザインターフェース内にさらに含む請求項14に記載のシステム。 - 前記マイクロプロセッサにより実行されると前記マイクロプロセッサに、
a)分子量の規定公差を受信すること、
b)前記データベースの検索の一範囲の分子量を計算し定義するために前記規定公差を使用すること、
c)前記一範囲の分子量内に入る前記分子量フィールド内の全分子量を有する前記データベース内の各ICS記録を識別するために照会分子量及び前記一範囲に基づき前記データベースを検索すること、
d)前記識別されたICS記録毎に、前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値をエンドユーザへ提示するためにユーザインターフェースへ送信すること、
e)前記照会分子量から前記切断頂点の前記分子量を減じることにより調整照会分子量を計算すること、
f)前記選択分子の第1の構成要素に関し、最も低い分子量を有するICS記録を識別すること、
g)前記調整照会分子量から前記選択分子の前記第1の構成要素の前記ICS記録の最も低い分子量を減じることにより前記修正照会分子量を計算すること、
h)前記第1の構成要素の前記ICS記録の分子量と組み合わせられると修正照会分子量に整合するICS記録を識別するために前記選択分子の前記第2の構成要素の前記ICS記録のバイナリサーチを、前記修正照会分子量を使用して行うこと、
i)前記識別されたICS記録の前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値を前記エンドユーザにより操作されるディスプレイデバイス上の提示のために前記ユーザインターフェースへ送信すること、
j)次に最も低い分子量を有する前記選択分子の前記第1の構成要素の前記ICS記録を識別すること、及び
k)前記選択分子の前記第1の構成要素の前記ICS記録の前記分子量のそれぞれが工程g)~j)において使用されてしまうまで工程f)~j)を繰り返すことを行わせるプログラム命令をアプリケーションプログラム内にさらに含む請求項14に記載のシステム。 - 前記グラフトラバースアルゴリズムは、深さ優先検索アルゴリズム、幅優先検索アルゴリズム、逆検索アルゴリズム、ツリー検索アルゴリズム、又はこれらの2つ以上の組み合わせである、請求項14に記載のシステム。
- 前記選択分子は小分子である、請求項14に記載のシステム。
- 前記選択分子は巨大分子である、請求項14に記載のシステム。
- 前記巨大分子は、蛋白質、核酸、オリゴヌクレオチド、ポリヌクレオチド、多糖又は合成高分子である、請求項25に記載のシステム。
- マイクロプロセッサ及びメモリデバイスを使用して選択分子の下部構造のデータベースを生成する方法であって、前記方法は、
a)(A)選択分子内の一組の最小切断可能ユニット、(B)前記選択分子内の一組の最小切断可能ユニットを接続する一組の結合、(C)各最小切断可能ユニットの分子量、(D)前記選択分子の接続プロファイルであって最小切断可能ユニットと結合とその間の接続との相対位置を指示する接続プロファイル、及び(E)前記選択分子内の切断頂点であって前記切断頂点の除去は前記選択分子を第1の構成要素及び第2の構成要素へ分離する切断頂点を表す選択分子データを受信し前記メモリ内に格納すること、
b)前記選択分子データに基づき前記選択分子の前記第1の構成要素の第1の最小切断可能ユニットグラフデータ構造であって、前記第1の最小切断可能ユニットグラフデータ構造には前記第1の構成要素の第1のMCUグラフを表す第1のMCUグラフデータが取り込まれ、前記第1のMCUグラフは複数の第1のMCUグラフ頂点及び複数の第1のMCUグラフ辺を有し、各第1のMCUグラフ頂点は前記第1の構成要素の最小切断可能ユニットに対応し、各第1のMCUグラフ辺は前記第1の構成要素内の第1の結合接続最小切断可能ユニットに対応する、第1の最小切断可能ユニットグラフデータ構造を生成し前記メモリ内に格納すること、
c)前記第1のMCUグラフデータに基づき前記選択分子の前記第1の構成要素の第1の線グラフデータ構造を生成し前記メモリ内に格納することであって、前記第1の線グラフデータ構造には前記第1のMCUグラフの第1の線グラフを表す第1の線グラフデータが取り込まれ、前記第1の線グラフは複数の第1のLG頂点及び複数の第1のLG辺を有し、各第1のLG頂点は前記第1のMCUグラフ内の第1のMCUグラフ辺に対応し、各第1のLG辺は前記第1のMCUグラフ辺により連結される前記第1のMCUグラフ内の一対の第1のMCUグラフ頂点に対応する、前記第1の線グラフデータ構造を生成し格納すること、
d)前記第1の線グラフの複数の第1の誘導連結サブグラフを判断するために前記選択分子の前記第1の構成要素の前記第1の線グラフデータ構造内の前記第1の線グラフデータに対してグラフトラバースアルゴリズムを実行することであって、各第1の誘導連結サブグラフは、前記第1の線グラフ内の第1のLG頂点及び第1のLG辺の第1の接続サブセットと、第1のLG頂点及び第1のLG辺の前記第1の接続サブセットの第1の物理的配置とを含み、これらは併せて、前記一組の最小切断可能ユニット及び結合の第1の接続サブセットと、前記選択分子内の前記最小切断可能ユニット及び結合の前記第1の接続サブセットの相対位置に一意的に対応する、前記グラフトラバースアルゴリズムを実行すること、
e)前記選択分子の前記第1の構成要素の前記第1の線グラフデータ構造で表される第1の誘導連結サブグラフ毎に、第1の分子量フィールド、第1の頂点データフィールド及び第1の辺データフィールドを含む第1のICS記録をデータベース内に生成することであって、前記第1の頂点データフィールドには前記第1の誘導連結サブグラフ内のあらゆる第1のLG頂点の第1の頂点位置を指示するように構成された第1の頂点値が取り込まれ、前記第1の辺データフィールドには前記第1のLG頂点に対する前記第1の誘導連結サブグラフ内のあらゆる第1のLG辺の第1の辺位置を指示するように構成された第1の辺値が取り込まれる、前記第1のICS記録を生成すること、
f)前記選択分子の前記第1の構成要素の前記第1の線グラフデータ構造内の第1のICS記録毎に、前記選択分子の前記選択分子データと前記第1のICS記録内の前記第1の頂点値及び前記第1の辺値とに基づき前記第1のICS記録の前記第1の誘導連結サブグラフの第1の全分子量を計算し前記第1の分子量フィールド内に格納すること、
g)前記選択分子データに基づき前記選択分子の前記第2の構成要素の第2の最小切断可能ユニットグラフデータ構造を生成し前記メモリ内に格納することであって、前記第2の最小切断可能ユニットグラフデータ構造には前記第2の構成要素の第2のMCUグラフを表す第2のMCUグラフデータが取り込まれ、前記第2のMCUグラフは複数の第2のMCUグラフ頂点及び複数の第2のMCUグラフ辺を有し、各第2のMCUグラフ頂点は前記第2の構成要素の最小切断可能ユニットに対応し、各第2のMCUグラフ辺は第2の構成要素内の第2の結合接続最小切断可能ユニットに対応する、前記第2の最小切断可能ユニットグラフデータ構造を生成し格納すること、
h)前記第2のMCUグラフデータに基づき前記選択分子の前記第2の構成要素の第2の線グラフデータ構造を生成し前記メモリ内に格納することであって、前記第2の線グラフデータ構造には前記第2のMCUグラフの第2の線グラフを表す第2の線グラフデータが取り込まれ、前記第2の線グラフは複数の第2のLG頂点及び複数の第2のLG辺を有し、各第2のLG頂点は第2のMCUグラフ内の第2のMCUグラフ辺に対応し各第2のLG辺は前記第2のMCUグラフ辺により連結される第2のMCUグラフ内の一対の第2のMCUグラフ頂点に対応する、前記第2の線グラフデータ構造を生成し格納すること、
i)前記第2の線グラフの複数の第2の誘導連結サブグラフを判断するために前記選択分子の前記第2の構成要素の前記第2の線グラフデータ構造内の前記第2の線グラフデータに対して前記グラフトラバースアルゴリズムを実行することであって、各第2の誘導連結サブグラフは、前記第2の線グラフ内の第2のLG頂点及び第2のLG辺の第2の接続サブセットと、第2のLG頂点及び第2のLG辺の前記第2の接続サブセットの第2の物理的配置とを含み、これらは併せて、一組の最小切断可能ユニット及び結合の第2の接続サブセットと、前記選択分子内の最小切断可能ユニット及び結合の前記第2の接続サブセットの相対位置に一意的に対応する、前記グラフトラバースアルゴリズムを実行すること、
j)前記選択分子の前記第2の構成要素の前記第2の線グラフデータ構造で表される第2の誘導連結サブグラフ毎に、第2の分子量フィールド、第2の頂点データフィールド及び第2の辺データフィールドを含む第2のICS記録をデータベース内に生成することであって、前記第2の頂点データフィールドには前記第2の誘導連結サブグラフ内のあらゆる第2のLG頂点の第2の頂点位置を指示するように構成された第2の頂点値が取り込まれ、前記第2の辺データフィールドには前記第2のLG頂点に対する前記第2の誘導連結サブグラフ内のあらゆる第2のLG辺の第2の辺位置を指示するように構成された第2の辺値が取り込まれる、前記第2のICS記録を生成すること、及び
k)前記選択分子の前記第2の構成要素の前記第2の線グラフデータ構造内の第2のICS記録毎に、前記選択分子の前記選択分子データと前記第2のICS記録内の前記第2の頂点値及び前記第2の辺値とに基づき前記第2のICS記録の前記第2の誘導連結サブグラフの第2の全分子量を計算し前記第2の分子量フィールド内に格納すること、を含む方法。 - 前記グラフトラバースアルゴリズムは、深さ優先検索アルゴリズム、又は幅優先検索アルゴリズム、又は逆検索アルゴリズム、又はツリー検索アルゴリズム、又はこれらの2つ以上の組み合わせである、請求項27に記載の方法。
- a)前記マイクロプロセッサにより照会分子量を受信すること、
b)前記マイクロプロセッサにより、前記照会分子量に整合する全分子量を前記分子量フィールド内に有するICS記録を識別するために前記照会分子量に基づき前記データベースを検索すること、
c)前記識別されたICS記録の前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値の表現をディスプレイデバイスへ送信すること、
d)前記照会分子量から前記切断頂点の分子量を減じることにより調整照会分子量を計算すること、
e)前記選択分子の第1の構成要素に関し、最も低い分子量を有するICS記録を識別すること、
f)前記調整照会分子量から前記選択分子の前記第1の構成要素の前記ICS記録の最も低い分子量を減じることにより修正照会分子量を計算すること、
g)前記修正照会分子量を使用することにより、記第1の構成要素の前記ICS記録の前記分子量と組み合わせられると前記修正照会分子量に整合するICS記録を識別するために前記選択分子の前記第2の構成要素の前記ICS記録のバイナリサーチを行うこと、
h)前記識別された前記ICS記録の前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値をエンドユーザにより操作されるディスプレイデバイス上の提示のためにユーザインターフェースへ送信すること、
i)次に最も低い分子量を有する前記選択分子の前記第1の構成要素のICS記録を識別すること、及び
前記選択分子の前記第1の構成要素の前記ICS記録の前記分子量のそれぞれが工程f)~h)において使用されてしまうまで工程f)~h)を繰り返すこと、をさらに含む請求項27に記載の方法。 - a)前記マイクロプロセッサにより、前記選択分子の前記第1の構成要素及び前記第2の構成要素の前記線グラフの誘導連結サブグラフのグラフィック表現を前記選択分子の前記接続プロファイル、前記頂点データフィールド内の前記頂点値及び前記辺データフィールド内の前記辺値に基づき生成すること、及び、
b)前記グラフィック表現を前記ディスプレイデバイスへ送信すること、をさらに含む請求項29に記載の方法。 - 前記選択分子は小分子である、請求項27に記載の方法。
- 前記選択分子は巨大分子である、請求項27に記載の方法。
- 前記巨大分子は、蛋白質、核酸、オリゴヌクレオチド、ポリヌクレオチド、多糖又は合成高分子である、請求項32に記載の方法。
- 前記一組の最小切断可能ユニット及び結合の前記接続サブセットは、前記選択分子の代謝物、又は前記選択分子の異化生成物、又は前記選択分子の気相断片化、又は前記選択分子の分解剤、又は前記選択分子の下部構造である、請求項27に記載の方法。
- マイクロプロセッサを使用して、選択分子の化学的下部構造の一組の構成要素を記述する情報及び前記構成要素の物理的配置を発見しディスプレイデバイスへ送信するためにデータベースを検索するための装置であって、前記装置は、
a)それぞれが分子量フィールド、頂点データフィールド及び辺データフィールドを含む複数のICS記録を含むデータベースへの電子ユーザインターフェースであって、前記頂点データフィールドには前記選択分子の接続プロファイルを表す線グラフの誘導連結サブグラフ内のあらゆる頂点の頂点位置を指示するように構成された頂点値が取り込まれ、前記辺データフィールドには前記誘導連結サブグラフ内のあらゆる辺の辺位置を指示するように構成された辺値が取り込まれる、電子ユーザインターフェース、
b)エンドユーザから規定分子量を受信するように構成されるとともに電子ユーザインターフェースにより動作可能な入力モジュール、
c)前記マイクロプロセッサにより実行されると前記マイクロプロセッサに前記分子量フィールド内の全分子量が前記規定分子量に等しい少なくとも1つのICS記録を前記データベース内で発見するようにさせるプログラム命令を有する検索エンジン、及び
d)前記メモリ内に格納された視覚化器であって、前記少なくとも1つのICS記録の前記頂点データフィールドの前記頂点値及び前記辺データフィールドの前記辺値を前記ディスプレイデバイスへ送信するように構成された視覚化器を含む装置。 - マイクロプロセッサ及びメモリデバイスを使用して選択分子の下部構造を識別し表示する方法であって、前記方法は、
a)(A)選択分子内の一組の最小切断可能ユニット、(B)前記選択分子内の一組の最小切断可能ユニットを接続する一組の結合、(C)各最小切断可能ユニットの分子量、(D)前記選択分子の接続プロファイルであって最小切断可能ユニットと結合とその間の接続との相対位置を指示する接続プロファイル、及び(E)前記選択分子内の切断頂点であって前記切断頂点の除去は前記選択分子を第1の構成要素及び第2の構成要素へ分離する切断頂点を表す選択分子データを受信し前記メモリ内に格納すること、
b)前記選択分子データに基づき前記選択分子の前記第1の構成要素の第1の最小切断可能ユニットグラフデータ及び前記選択分子の前記第2の構成要素の第2の最小切断可能ユニットグラフデータを生成し前記メモリ内に格納すること、
c)前記第1及び第2の最小切断可能ユニットグラフデータに基づき前記選択分子の前記第1の構成要素の第1の線グラフデータ及び前記選択分子の前記第2の構成要素の第2の線グラフデータを生成し前記メモリ内に格納すること、
d)前記第1の線グラフデータの複数の第1の誘導連結サブグラフ及び前記第2の線グラフデータの複数の第2の誘導連結サブグラフを表す誘導連結サブグラフ(ICS)記録を判断し前記メモリ内に格納するために前記第1の線グラフデータ及び前記第2の線グラフデータに対してグラフトラバースアルゴリズムを実行することであって、各ICS記録は分子量フィールド、頂点データフィールド及び辺データフィールドを含み、前記頂点データフィールドには前記選択分子の接続プロファイルを表す線グラフの誘導連結サブグラフ内のあらゆる頂点の頂点位置を指示するように構成された頂点値が取り込まれ、前記辺データフィールドには前記誘導連結サブグラフ内のあらゆる辺の辺位置を指示するように構成された辺値が取り込まれる、前記グラフトラバースアルゴリズムを実行すること、及び
e)前記メモリ内のICS記録毎に、前記選択分子の前記選択分子データに基づき前記ICS記録により表される前記第1又は第2の誘導連結サブグラフの全分子量を計算し前記分子量フィールド内に格納することを含む方法。 - a)前記最小切断可能ユニットグラフデータ構造には前記第1の構成要素の第1のMCUグラフを表す第1のMCUグラフデータが取り込まれ、前記第1のMCUグラフは複数の第1のMCUグラフ頂点及び複数の第1のMCUグラフ辺を有し、各第1のMCUグラフ頂点は前記第1の構成要素の最小切断可能ユニットに対応し、各第1のMCUグラフ辺は前記第1の構成要素内の第1の結合接続最小切断可能ユニットに対応し、
b)前記第2の線グラフデータ構造には前記第2のMCUグラフの第2の線グラフを表す第2の線グラフデータが取り込まれ、前記第2の線グラフは複数の第2のLG頂点及び複数の第2のLG辺を有し、各第2のLG頂点は第2のMCUグラフ内の第2のMCUグラフ辺に対応し、各第2のLG辺は前記第2のMCUグラフ辺により連結される第2のMCUグラフ内の一対の第2のMCUグラフ頂点に対応する、請求項36に記載の方法。 - 各第1の誘導連結サブグラフは、前記第1の線グラフ内の第1のLG頂点及び第1のLG辺の第1の接続サブセットと、第1のLG頂点及び第1のLG辺の前記第1の接続サブセットの第1の物理的配置とを含み、これらは併せて、前記一組の最小切断可能ユニット及び結合の第1の接続サブセットと、前記選択分子内の最小切断可能ユニット及び結合の前記第1の接続サブセットの相対位置とに一意的に対応する、請求項36に記載の方法。
- a)規定分子量を受信し前記メモリ内に格納すること、
b)前記マイクロプロセッサに前記分子量フィールド内の全分子量が前記規定分子量に等しい少なくとも1つのICS記録をデータベース内で発見するようにさせること、及び
c)前記少なくとも1つのICS記録の前記頂点データフィールドの前記頂点値及び前記辺データフィールドの前記辺値をディスプレイデバイスへ送信することをさらに含む請求項36に記載の方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862683582P | 2018-06-11 | 2018-06-11 | |
US62/683,582 | 2018-06-11 | ||
US201862752152P | 2018-10-29 | 2018-10-29 | |
US62/752,152 | 2018-10-29 | ||
US201862770252P | 2018-11-21 | 2018-11-21 | |
US62/770,252 | 2018-11-21 | ||
PCT/US2019/036467 WO2019241191A1 (en) | 2018-06-11 | 2019-06-11 | Cut vertex method for identifying complex molecule substructures |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021527254A JP2021527254A (ja) | 2021-10-11 |
JP7349454B2 true JP7349454B2 (ja) | 2023-09-22 |
Family
ID=68842307
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020568247A Active JP7349455B2 (ja) | 2018-06-11 | 2019-06-11 | 錯体分子下部構造識別システム、装置及び方法 |
JP2020568209A Active JP7349454B2 (ja) | 2018-06-11 | 2019-06-11 | 錯体分子下部構造を識別する切断頂点方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020568247A Active JP7349455B2 (ja) | 2018-06-11 | 2019-06-11 | 錯体分子下部構造識別システム、装置及び方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US12068058B2 (ja) |
EP (2) | EP3794597A4 (ja) |
JP (2) | JP7349455B2 (ja) |
CN (2) | CN112534508B (ja) |
CA (2) | CA3103229A1 (ja) |
WO (2) | WO2019241178A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112534508B (zh) * | 2018-06-11 | 2024-03-01 | 默沙东有限责任公司 | 用于标识复杂分子子结构的割点法 |
CN114090834A (zh) * | 2021-11-09 | 2022-02-25 | 支付宝(杭州)信息技术有限公司 | 一种图搜索方法、装置及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060085142A1 (en) | 2004-10-14 | 2006-04-20 | Robert Mistrik | Determination of molecular structures using tandem mass spectrometry |
JP2007508637A (ja) | 2003-10-14 | 2007-04-05 | バーセオン | 分子を区分するための方法および装置 |
US20180011899A1 (en) | 2016-07-05 | 2018-01-11 | Zymergen, Inc. | Complex chemical substructure search query building and execution |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1317765A2 (en) | 2000-09-08 | 2003-06-11 | Oxford GlycoSciences (UK) Limited | Automated identification of peptides |
JP2008504531A (ja) * | 2004-06-24 | 2008-02-14 | ザ スクリップス リサーチ インスティテュート | 切断可能なリンカーを有するアレイ |
EP2084638A2 (en) * | 2006-11-13 | 2009-08-05 | N.V. Organon | A system and method to identify the metabolites of a drug |
US20090006002A1 (en) * | 2007-04-13 | 2009-01-01 | Sequenom, Inc. | Comparative sequence analysis processes and systems |
US9149309B2 (en) * | 2012-03-23 | 2015-10-06 | Yale University | Systems and methods for sketching designs in context |
US20130325354A1 (en) | 2012-05-18 | 2013-12-05 | Marshall Siegel | Computerized method for correlating and elucidating chemical structures and substructures using mass spectrometry |
WO2014025378A1 (en) | 2012-08-09 | 2014-02-13 | Perkinelmer Health Sciences, Inc. | Methods and apparatus for identification of polymeric species from mass spectrometry output |
KR20140145753A (ko) | 2013-06-14 | 2014-12-24 | 주식회사 켐에쎈 | 기준 분자들의 물성 값 및 분자 표현자에 기반한 분자간 근원적 상관성을 이용하여 혼합물을 구성하는 각 분자들의 물성 값을 예측하는 방법 |
US20160153060A1 (en) * | 2013-07-09 | 2016-06-02 | Tech-Knowhow Corp. | Method for species identification by using molecular weights of nucleic acid cleavage fragments |
CN107077592B (zh) * | 2014-03-28 | 2021-02-19 | 威斯康星校友研究基金会 | 高分辨率气相色谱-质谱数据与单位分辨率参考数据库的改进谱图匹配的高质量精确度滤波 |
WO2015187095A1 (en) * | 2014-06-02 | 2015-12-10 | Agency For Science, Technology And Research | A diagnostic and therapeutic tool for cancer |
AU2015352625B2 (en) * | 2014-11-25 | 2019-07-25 | Ventana Medical Systems, Inc. | Proximity assays using chemical ligation and hapten transfer |
EP3234805A4 (en) | 2014-12-19 | 2017-10-25 | Microsoft Technology Licensing, LLC | Graph processing in database |
CN104765984B (zh) * | 2015-03-20 | 2017-07-11 | 同济大学 | 一种生物质谱数据库快速建立与搜索的方法 |
CN107923888A (zh) | 2015-05-29 | 2018-04-17 | 沃特世科技公司 | 代谢途径和代谢物鉴定 |
EP3368056A4 (en) * | 2016-01-26 | 2019-06-05 | Raghoottama Pandurangi | COMPOSITIONS AND METHODS FOR SENSITIZING TUMORS WITH LOW CARACTERIUM THERAPY REACTION |
CN112534508B (zh) * | 2018-06-11 | 2024-03-01 | 默沙东有限责任公司 | 用于标识复杂分子子结构的割点法 |
-
2019
- 2019-06-11 CN CN201980052328.9A patent/CN112534508B/zh active Active
- 2019-06-11 WO PCT/US2019/036449 patent/WO2019241178A1/en unknown
- 2019-06-11 JP JP2020568247A patent/JP7349455B2/ja active Active
- 2019-06-11 CN CN201980054026.5A patent/CN112567465B/zh active Active
- 2019-06-11 CA CA3103229A patent/CA3103229A1/en active Pending
- 2019-06-11 WO PCT/US2019/036467 patent/WO2019241191A1/en unknown
- 2019-06-11 CA CA3103253A patent/CA3103253A1/en active Pending
- 2019-06-11 US US16/973,197 patent/US12068058B2/en active Active
- 2019-06-11 JP JP2020568209A patent/JP7349454B2/ja active Active
- 2019-06-11 EP EP19819375.7A patent/EP3794597A4/en active Pending
- 2019-06-11 US US16/973,175 patent/US11854664B2/en active Active
- 2019-06-11 EP EP19820431.5A patent/EP3794599A4/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007508637A (ja) | 2003-10-14 | 2007-04-05 | バーセオン | 分子を区分するための方法および装置 |
US20060085142A1 (en) | 2004-10-14 | 2006-04-20 | Robert Mistrik | Determination of molecular structures using tandem mass spectrometry |
US20180011899A1 (en) | 2016-07-05 | 2018-01-11 | Zymergen, Inc. | Complex chemical substructure search query building and execution |
Non-Patent Citations (2)
Title |
---|
Gary D Bader et al.,An automated method for finding molecular complexes in large protein interaction networks,BMC Bioinformatics,英国,2003年01月13日,vol. 4, no. 2,pp. 1-27,online, <URL:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC149346/>, 検索日:2023年6月30日 |
Sitao Wu et al.,Recognizing protein substructure similarity using segmental threading,Structure,米国,2010年07月14日,vol. 18, no. 7,pp. 858-867,online, <URL:https://www.sciencedirect.com/science/article/pii/S0969212610001863>, 検索日:2023年6月30日 |
Also Published As
Publication number | Publication date |
---|---|
EP3794597A1 (en) | 2021-03-24 |
CN112567465B (zh) | 2024-02-20 |
US11854664B2 (en) | 2023-12-26 |
CA3103229A1 (en) | 2019-12-19 |
JP2021527255A (ja) | 2021-10-11 |
EP3794597A4 (en) | 2022-02-23 |
CA3103253A1 (en) | 2019-12-19 |
CN112534508A (zh) | 2021-03-19 |
CN112567465A (zh) | 2021-03-26 |
JP2021527254A (ja) | 2021-10-11 |
WO2019241178A1 (en) | 2019-12-19 |
JP7349455B2 (ja) | 2023-09-22 |
CN112534508B (zh) | 2024-03-01 |
US12068058B2 (en) | 2024-08-20 |
US20210265024A1 (en) | 2021-08-26 |
EP3794599A4 (en) | 2022-02-23 |
WO2019241191A1 (en) | 2019-12-19 |
EP3794599A1 (en) | 2021-03-24 |
US20210257046A1 (en) | 2021-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eguchi et al. | Ig-vae: generative modeling of immunoglobulin proteins by direct 3d coordinate generation | |
US20080281818A1 (en) | Segmented storage and retrieval of nucleotide sequence information | |
Braga et al. | The solution space of sorting by DCJ | |
JP7349454B2 (ja) | 錯体分子下部構造を識別する切断頂点方法 | |
Estrada et al. | A scalable and accurate method for classifying protein–ligand binding geometries using a MapReduce approach | |
EP3602362B1 (en) | Genomic data analysis system and method | |
Olson et al. | Enhancing sampling of the conformational space near the protein native state | |
Huang et al. | VINCENT: towards efficient exploratory subgraph search in graph databases | |
Hutter | Graph-based similarity concepts in virtual screening | |
Santoni | Peptide Hamming Graphs: A network representation of peptides presented through specific HLAs to identify potential epitope clusters | |
Cho | COMBINE: a novel drug discovery platform designed to capture insight and experience of users | |
Wang | Using PhyloCon to identify conserved regulatory motifs | |
Martins-José et al. | NEQUIM Contact System (NCS): A tool for generation and analysis of protein-ligand interaction fingerprint | |
Martin et al. | Using product kernels to predict protein interactions | |
Ellingson et al. | Accelerating virtual high-throughput ligand docking: screening one million compounds using a petascale supercomputer | |
Grant | BGGN-213: FOUNDATIONS OF BIOINFORMATICS (Lecture 12) | |
Giray et al. | Building phylogenetic trees from frequent subgraph mining techniques on reaction hypergraphs | |
Razvi | Market opportunity in computational proteomics | |
Koh et al. | Database warehousing in bioinformatics | |
Bhattacharya | Probabilistic graphical models for protein structure prediction | |
Zoubarev | Tools for visual analysis of biological networks | |
Liao | Comparison of clustering algorithms for gene expression microarray data | |
Grant | BIMM-143: INTRODUCTION TO BIOINFORMATICS (Lecture 11) | |
Strunk et al. | Benchmarking the POEM@ HOME Network for Protein Structure Prediction. | |
Jean et al. | 1Computational Biology, Sandia National Laboratories, PO Box 5800, Albuquerque, NM 87185-1316, USA smartin@ sandia. gov 2Computational Bioscience, Sandia National Laboratories, PO Box 5800 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220517 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20230510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230911 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7349454 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |