EA005460B1 - Способ генерирования молекулярно-функциональной сети - Google Patents

Способ генерирования молекулярно-функциональной сети Download PDF

Info

Publication number
EA005460B1
EA005460B1 EA200300362A EA200300362A EA005460B1 EA 005460 B1 EA005460 B1 EA 005460B1 EA 200300362 A EA200300362 A EA 200300362A EA 200300362 A EA200300362 A EA 200300362A EA 005460 B1 EA005460 B1 EA 005460B1
Authority
EA
Eurasian Patent Office
Prior art keywords
biological
information
molecules
molecule
molecular
Prior art date
Application number
EA200300362A
Other languages
English (en)
Other versions
EA200300362A1 (ru
Inventor
Акико Итаи
Original Assignee
Институт Оф Медисинал Молекьюлар Дизайн, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Институт Оф Медисинал Молекьюлар Дизайн, Инк. filed Critical Институт Оф Медисинал Молекьюлар Дизайн, Инк.
Publication of EA200300362A1 publication Critical patent/EA200300362A1/ru
Publication of EA005460B1 publication Critical patent/EA005460B1/ru

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations

Landscapes

  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Molecular Biology (AREA)
  • Business, Economics & Management (AREA)
  • Physiology (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tourism & Hospitality (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Child & Adolescent Psychology (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Способ генерирования молекулярно-функциональной сети, включающей в себя биологические события, путем осуществления связанного поиска с использованием базы данных о связях между биологическими молекулами, включая информацию о биологических событиях, и способ прогнозирования пути между произвольной биологической молекулой и произвольным биологическим событием в указанной сети, или способ прогнозирования биологических событий, с которыми связана произвольная биологическая молекула в указанной сети.

Description

Настоящее изобретение относится к способу генерирования и к использованию базы данных о биологических молекулах, включая информацию о биологических событиях.
Предпосылки изобретения
В организме существуют различные молекулы, такие как аминокислоты, нуклеиновые кислоты, липиды, углеводы и общие малые молекулы, а также такие биологические молекулы, как ДНК, РНК, белки и полисахариды, и каждая из них несет свою функцию. Характеристики биологической системы заключаются не только в том, что она состоит из различных биологических молекул, но также и в том, что все явления в организме, такие как проявление функции, осуществляются посредством специфичного связывания между биологическими молекулами. При таком специфичном связывании ковалентной связи не образуется, вместо этого с помощью межмолекулярных сил формируется стабильный комплекс. Следовательно, биологическая молекула существует в равновесии между изолированным состоянием и состоянием комплекса, и среди определенных биологических молекул стабильность состояния комплекса является более высокой, и равновесие заметным образом сдвинуто в сторону комплекса. В результате, в присутствии многих других молекул молекула может различать и связывать специфичного партнера, практически, даже при очень разбавленной концентрации. При ферментативных реакциях субстрат высвобождается в виде продукта реакции после осуществления специфичного химического преобразования в состоянии комплекса вместе с ферментом, и при передаче внеклеточный сигнал передается внутрь клетки с помощью структурного изменения целевой биологической молекулы, которое происходит при связывании медиаторной молекулы с целевой биологической молекулой.
В последнее время наблюдается заметный прогресс в исследовании генома, выяснены геномные последовательности различных видов, включая человека, и осуществляются систематические геномные исследования для генов и последовательностей белков, которые являются продуктами генов, экспрессия белков в каждом органе, взаимодействия белок-белок и другие. Большинство результатов этих исследований доступны для всеобщего пользования в виде баз данных и доступны для использования по всему миру. Постепенно накапливаются знания относительно функций генов и белков, предсказания гена, который вызывает заболевание или является его основой, и связи с полиморфизмом генов в качестве базы для разработки медицинского лечения и лекарственных средств на основе генетической информации.
С другой стороны, хотя носителем генетической информации является нуклеиновая аминокислота, большинство биологических функций, таких как метаболизм энергии, преобразование вещества и передача сигнала порождаются молекулами, иными чем нуклеиновая кислота. Белок отличается от молекул других категорий в том, что он непосредственно продуцируется на основе конструкционной схемы, называемой геном, и существует множество видов белков. Ферменты, целевые биологические молекулы низкомолекулярного внутреннего физиологически активного соединения, целевые биологические молекулы (модифицированные с помощью сахара во многих случаях) внутреннего физиологически активного белка, все они являются белками. При рассмотрении первичных причин заболевания считается, что многие заболевания и симптомы являются результатами отклонения количества или равновесия белка или малой молекулы от нормы или, в некоторых случаях, качества (функционирования) этих молекул. Большая часть существующих лекарственных средств представляет собой соединения, которые воздействуют на белки в качестве мишени и контролируют их функции. В отличие от белка существует причина, по которой стерической структуре нуклеиновой кислоты сложно продемонстрировать ее специфичность как мишени для низкомолекулярного лекарственного средства, тем не менее мишенями антибиотиков и антибактериальных агентов, а также агрохимикалиев, таких как инсектициды и антимикотические агенты, являются белки.
По этой причине в порядке осуществления медицинского лечения или разработки лекарственных средств на основе генетической информации является необходимым выяснение функций каждого белка и малой молекулы в организме и конкретной связи между этими молекулами. Более того, поскольку различные ферменты играют свои партии одну за другой при биосинтезе необходимой молекулы и поскольку различные молекулы связываются друг с другом, в свою очередь, при передаче сигнала, эти молекулы имеют прямую или косвенную, функциональную или биосинтетическую, взаимную связь, и по этой причине информация о связи (молекулярно-функциональная сеть) является важной. Более того, в проведенных исследованиях было открыто множество молекул, таких как медиаторы и гормоны, которые непосредственно участвуют в проявлениях различных клинических симптомов, физиологических явлений и биологических реакций, и для соответствующего лечения необходимо устанавливать корреляции между такими молекулами в молекулярно-функциональной сети. С другой стороны, в стратегии разработки лекарственного средства необходимо принимать во внимание молекулярно-функциональную сеть, включающую в себя целевые молекулы, чтобы выбрать соответствующую целевую молекулу для разработки лекарственного средства с учетом риска побочных эффектов.
Что касается баз данных, относящихся к белкам, то известны 8\νί5δΡΐΌΐ (111с 8^155 1п8Й1и1е οΓ ΒίοίηΓοηηαΙίοδ (8ΙΒ), Еигореап ВюшГогшайек 1п8Й1и1е (ΕΒΙ)) и ΡΙΚ (Ναΐίοηαΐ Вюшеб1еа1 Кекеагсй ΓοιιηάαΙίοη (ΝΒΚΡ)), и обе они содержат аннотированную информацию о видах, функции, функциональном механизме, первооткрывателе, литературе и тому подобном, а также информацию о последовательности.
-1005460
Среди баз данных о сетях молекул, фокусирующихся на связи молекул, КЕОС (Капейка с! а1., Куо!о итуегкйу). ВюсНепйса1 Ра111\уаук (ВоеНппдег МаппНейп). ЭДТГ (Рпкк1ап Асабету оГ 8с1епсек). ΒίοГгопПег (КигеНа СНет1са1 Тпби81гу), Рго1еш Ра111\уау (АхСе11), Ью8СОИТ (ΜΟΝ). ЕсоСус (ОоиЫеТ\у|к1). и ИМ-ΒΒΌ (МтпекоЮ Ищу.) являются известными как базы данных о путях метаболизма.
База данных РАТНХУАУ в КЕОС содержит пути метаболизма и пути передачи сигнала. где первая относится к путям метаболизма общих малых молекул. вовлеченных в метаболизм вещества и в метаболизм энергии. а последняя относится к белкам из системы передачи сигнала. В обеих определенные заранее молекулярные сети созданы в виде статических ОТЕ файлов. В последней информация о ферментах и лигандах импортируется из отдельных молекулярных баз данных в стиле текстовых файлов. ΕΤΟΑΝΏ (КапеЫка е! а1. . Куо!о Ишу.) и ΕΝΖΥΜΕ (ГОРАС-ГОВМВ). Информация о ферментах. участвующих в процессе синтеза физиологически активных пептидов. и информация о целевых биологических молекулах не включены.
ЕсоСус представляет собой базу данных о метаболизме вещества в ЕксйепсЫа сой. и она представляет путь схематически. на основании данных об индивидуальных ферментативных реакциях и данных об известных путях (представленных в виде коллекции ферментативных реакций. принадлежащих к указанному пути). В качестве функции поиска ЕсоСус предусматривается поиск по строке символов или по сокращенному символу. наименования молекулы или наименования пути. однако невозможно осуществить поиск нового пути путем указания произвольной молекулы.
Известны базы данных. относящиеся к передаче сигналов. ί’8ΝΌΒ (№1Нопа1 Iпк! 11 и1е оГ НеаЙН 8аепсек. 1арап). 8ΡΑΌ (КиНага е! а1.. КуикНи Ип1у.). Оепе №1 (Тпкб1и1е оГ СуЮ1оду & Оепебск ЖуоаЫгкк. Рпкк1а) и Ое№1 (Мала О. 8аткопоуа).
В качестве баз данных о взаимодействии белок-белок известны ΌΤΡ (иСЬА). Ра1йСа1йпд (СигаОеп) и Рго№1 (Мупаб).
В качестве баз данных об экспрессии гена или белка известны ВобуМар (Ип1у. оГ Токуо и Окака Ишу.). 8^Т88-2ИРАОЕ (8у1кк I пкШШе оГ ВюшГогтабск). Нитап апб тоике 2Ό РАСЕ ба1аЬаке (ЭаткН С’егИге Гог Нитап Оепоте РекеагсН). НЕАК.Т-2ПРАОЕ (ОегтапНеап). РИИ Рго1ет Иекеаке ЭаЮЬакек (№МН-Ж.4). \Уак1ипд1оп Ишуегкйу Тппег Еаг Рго1ет Иа!аЬаке (\Уак1ипд1оп Иту.). РММА-2ИРАОЕ (Ригкупе Мбйагу Меб1са1 Асабету). Мйо-Ркк (СЕА. Егапсе). Мо1еси1аг А паю ту ЬаЬога1огу (Тпб1апа итуегкйу) апб Нитап Со1оп Сагсшота Рго1ет Иа!аЬаке (Ьибу1д 1пк111и(е Гог Сапсег РекеагсН).
В качестве примеров молекулярной сети для моделирования биологической реакции известны ЕСе11 (Тотйа е! а1.. Кею Иту.). Е.сой (В. Ра1ккоп). Се11 (Ό. ЕаиГГепЬигдег. МТТ). У1пиа1 Се11 (Ь. Бео\у. Соппесбси! ишу.) и У1пиа1 Рабеп! (Еп!е1ок. Тпс.).
Относительно взаимосвязей между биологическими молекулами и функциями 8\у|ккРго1 содержит всеобъемлющую информацию по белку. а СОРЕ (итуегкйу оГ Мишсб) обеспечивает информацию по функциям цитокинов в текстовом формате. АР18 Паран ТпТогшабоп Ргосеккшд 8егу1се Со. Ыб.) регистрирует информацию из литературы по побочных эффектам и взаимодействиям лекарственных средств и по токсикации агрохимикалиями и химикалиями. собираемую приблизительно из 400 журналов внутри страны и 20 иностранных журналов. в основном из области медицины и фармакологии. однако базы данных по физиологическим воздействиям и реакциям биологических молекул выше клеточного уровня до настоящего времени недоступны. Относительно генов и заболеваний ОМТМ (N14) собирает информацию о генетических заболеваниях и мутациях аминокислот белков. Данные описаны в текстовом формате и могут быть найдены по ключевому слову.
Проблема существующих баз данных. сосредотачивающихся на связях между молекулами. состоит в следующем. Базы данных молекулярных сетей подготавливаются для систем. в которых включаемые молекулы и связи между молекулами известны. и поскольку возможно упорядочить молекулы заранее. с учетом взаимосвязи между молекулами. статическое представление. такое как ОТЕ. является достаточным. Однако при таком способе сложно добавлять новые молекулы и связи между молекулами. Существует более чем 100000 молекул. включая молекулы. которые будут обнаружены в будущем (число молекул. которые рассматривает КЕОО. составляют примерно 10000. включая молекулы лекарственных средств). и. когда связи между этими молекулами будут выясняться в будущих исследованиях. ожидается. что сложность молекулярной сети будет возрастать все быстрее и быстрее. Необходим новый способ. который хорошо адаптирован к добавлениям новых молекул и может генерировать частичную молекулярную сеть. содержащую необходимую информацию. при этом сохраняя информацию об очень большом количестве молекул и о взаимосвязях между молекулами.
По состоянию на 7 сентября 2001 г.. КЕОО хранит связи между молекулами как информацию о парах из двух молекул. и возможен поиск пути. который соединяет две произвольные молекулы в путях метаболизма. с использованием этой информации. Однако задача поиска пути. подобная этой. содержит ту проблему. что при увеличении пути. связывающего две молекулы. время компьютерных вычислений увеличивается экспоненциально.
С другой стороны. предела для добавлений данных о молекулах в текстовую базу данных не существует. Однако трудно генерировать молекулярную сеть. представляющую связи множества молекул. путем повторения процедур поиска одна за другой для функционально или биосинтетически взаимосвя
-2005460 занных молекул, исходя из данных о каждой молекуле. Необходима разработка таких способов хранения и поиска данных, что связи для необходимых молекул получаются динамически и автоматически во время поиска. Более того, для того чтобы понимать заболевания и патологические состояния на молекулярном уровне, существует необходимость в новом изобретении для описания взаимосвязей между сетью биологических молекул/молекул и биологическими реакциями/физиологическими воздействиями.
Описание изобретения
Задачей настоящего изобретения является создание схем и способов для понимания различных биологических реакций и явлений в свете функций биологических молекул и взаимосвязей между этими молекулами и, более конкретно, создание баз данных и способов поиска, которые смогут связать информацию о биологических молекулах с биологическими реакциями. Также задачей настоящего изобретения является создание способа извлечения, быстрого и эффективного, из очень большого количества информации, только путей передачи сигналов и биосинтетических путей, связанных с произвольной биологической реакцией или биологической молекулой, и предсказание перспективных мишеней для лекарственных средств и риска побочных эффектов.
В результате интенсивных попыток решения указанной выше проблемы авторы обнаружили, что эта проблема может быть решена путем перекрывания связей между биологическими молекулами с помощью аккумулирования информации, где берется в качестве части пара биологических молекул, связывающихся напрямую путем присоединения информации о биологических событиях, содержащей физиологические воздействия, биологические реакции, клинические симптомы и тому подобное, к паре из ключевой молекулы, непосредственно участвующей в экспрессии биологической реакции, и ее целевой биологической молекулы, и путем генерирования молекулярно-функциональной сети с помощью автоматического поиска связей, одной за другой, которые включают в себя указанную одну или несколько произвольных биологических молекул или биологических событий.
То есть, настоящее изобретение предусматривает способ генерирования молекулярнофункциональной сети путем использования базы данных о связях биологических молекул, которые аккумулируют информацию о паре непосредственно связывающихся биологических молекул. В предпочтительных вариантах осуществления настоящего изобретения предусматривается указанный выше способ, в котором генерируется молекулярно-функциональная сеть, связанная с информацией о биологических событиях, с использованием базы данных о биомолекулярных связях, содержащей информацию о биологических событиях; причем упомянутый способ использует базу данных с информацией о биологических молекулах, содержащую информацию о самих биологических молекулах; и упомянутый способ генерирует молекулярно-функциональную сеть, включающую в себя молекулы лекарственных средств, сопоставленные с информацией о биологическом событии. Кроме того, настоящее изобретение также предусматривает способ прогнозирования биологических событий, прямо или косвенно соотнесенных с произвольной биологической молекулой или молекулой лекарственного средства, с использованием базы данных о биомолекулярных связях, которая аккумулирует информацию о биологических событиях, относящихся к непосредственно связывающейся биологической молекуле. Кроме того, настоящее изобретение предусматривает способ анализа информации о полиморфизме или экспрессии генов с использованием молекулярно-функциональной сети путем генерирования базы данных, которая связывает идентификатор (ГО) молекулы, для биологической молекулы, с именем, ГО или сокращенным именем гена, когда биологическая молекула представляет собой белок, кодируемый геном, во внешней базе данных или в литературе.
В более предпочтительных вариантах осуществления настоящего изобретения предусматривается упомянутый способ, характеризующийся распределением по иерархиям молекулярно-функциональной сети на основе принадлежащей к ней подсети и включения в нее взаимосвязей между подсетями, причем пары биологических молекул, сгруппированные в сети на основе связи, рассматриваются как подсеть; выше упомянутый способ характеризуется иерархическим хранением информации о парах биологических молекул на основе имени принадлежащего им пути, имени принадлежащей подсети и другого; вышеупомянутый способ характеризуется иерархическим хранением информации о самих биологических молекулах, на основе конфигураций экспрессии из генов и конфигураций экспрессии на поверхности клетки, и другого; и вышеупомянутый способ характеризуется иерархическим хранением информации о биологических событиях на основе классификации с помощью видового понятия указанного события и/или на основе взаимосвязи с патологическими событиями. Кроме того, настоящим изобретением также предусматривается вышеупомянутый способ, характеризующийся хранением информации о взаимосвязи и зависимости между хранимыми элементами с высшей иерархией, содержащей высшую иерархию пар биологических молекул, высшую иерархию биологических молекул, самих по себе, и высшую иерархию биологических событий; упомянутый способ характеризуется упрощением генерирования молекулярнофункциональной сети с использованием иерархической информации, хранимой в базе данных информации о биологических молекулах или в базе данных о биомолекулярных связях; и упомянутый способ характеризуется контролем детальных особенностей при представлении молекулярно-функциональной сети с использованием иерархической информации, хранимой в базе данных информации о биологических молекулах или в базе данных о биомолекулярных связях.
-3005460
Кроме того, настоящим изобретением предусматриваются следующие способы и базы данных.
1. Способ сопоставления информации о биологических событиях с биологическими молекулами.
2. Способ генерирования молекулярно-функциональной сети, связанной с информацией о биологических событиях.
3. Способ генерирования молекулярно-функциональной сети, включающей в себя молекулы лекарственных средств, связанной с информацией о биологических событиях.
4. Способ прогнозирования биологических событий, с которыми произвольная биологическая молекула связана прямо или косвенно.
5. Способ прогнозирования биологических событий, с которыми произвольная биологическая молекула связана прямо или косвенно, с использованием базы данных о биомолекулярных связях, содержащей информацию о биологических событиях.
6. Способ прогнозирования молекулярно-функциональной сети, с которой связывается произвольная биологическая молекула, и биологических событий, с которыми указанная молекула связывается прямо или косвенно, с использованием базы данных о биомолекулярных связях, содержащей информацию о биологических событиях.
7. База данных о биомолекулярных связях, в которой пары ключевых молекул, непосредственно участвующие в экспрессии биологических событий, и их целевых биологических молекул, и информация об указанных биологических событиях добавляется к информации о парах непосредственно связывающихся биологических молекул.
8. База данных о биомолекулярных связях, содержащая информацию о биологических событиях, обусловленных ключевыми молекулами.
9. База данных о биомолекулярных связях, содержащая ключевые молекулы, содержащая информацию о биологических событиях.
10. Молекулярно-функциональная сеть, получаемая с помощью связанного поиска в базе данных о биомолекулярных связях.
11. Способ прогнозирования молекулярно-функциональной сети и биологических событий, с которыми связана произвольная биологическая молекула, с использованием одной из указанных выше баз данных о биомолекулярных связях, описанных в пп.7-9.
12. Способ прогнозирования молекулярно-функциональной сети и биологических событий, с которыми связана произвольная биологическая молекула или молекула лекарственного средства, с использованием одной из указанных выше баз данных о биомолекулярных связях, описанных в пп.7-9, и базы данных о связях молекул лекарственных средств.
13. Способ или база данных о биомолекулярных связях, или молекулярно-функциональная сеть, описанная в пп.1-12, причем информация о биологических событиях содержит информацию типа «больше-меньше», соответствующую количественным или качественным изменениям ключевых молекул.
14. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанная в пп.1-12, причем информация о биологических событиях содержит информацию об органах происхождения ключевой молекулы и об органах экспрессии биологического события.
15. Способ или база данных о биомолекулярных связях, или молекулярно-функциональная сеть, описанные в пп.1-12, причем информация о биологических событиях содержит информацию типа «больше-меньше», соответствующую количественным или качественным изменениям ключевой молекулы, и информацию об органах происхождения ключевых молекул и об органах экспрессии биологических событий.
16. Способ генерирования молекулярно-функциональной сети, с которой одна или несколько произвольных биологических молекул связаны прямо или косвенно/функционально или биосинтетически путем хранения информации, описывающей пары непосредственно связывающихся биологических молекул, и взаимосвязь указанного связывания.
17. Способ поиска ключевых молекул, которые связаны прямо или косвенно с произвольной биологической молекулой, функционально или биосинтетически, с использованием коллекции информации о парах биологических молекул, связывающихся напрямую.
18. Способ прогнозирования биологических событий, с которыми произвольная биологическая молекула связана прямо или косвенно, на основе способа, описанного в п.17.
19. Способ генерирования молекулярно-функциональной сети, которая показывает функциональную или биосинтетическую связь между биологическими молекулами, путем хранения информации, описывающей пары непосредственно связывающихся биологических молекул, и отношение указанного связывания.
20. Способ генерирования молекулярно-функциональной сети, связанной с одной или несколькими произвольными биологическими молекулами, путем хранения информации, описывающей пары непосредственно связывающихся биологических молекул, и отношение указанного связывания, в виде частей, и выполнения связанного поиска.
21. Способ извлечения группы биологических молекул, которые связаны прямо или косвенно с одной или несколькими указанными биологическими молекулами, биосинтетически или функционально,
-4005460 путем хранения информации, описывающей пары непосредственно связывающихся биологических молекул, и отношение указанного связывания в виде частей и выполнения связанного поиска.
22. Способ прогнозирования связанной с заболеваниями молекулярно-функциональной сети на основе группы биологических событий, связанных с указанным заболеванием.
23. Способ прогнозирования связанной с заболеваниями молекулярно-функциональной сети и прогнозирования возможной мишени для лекарственного средства на основе группы биологических событий, связанных с указанным заболеванием.
24. Способ прогнозирования риска побочных эффектов, когда биологическая молекула в связанной с заболеваниями молекулярно-функциональной сети выбирается в качестве мишени для лекарственного средства, на основе группы биологических событий, связанных с указанным заболеванием.
25. Способ прогнозирования оценок типа «больше-меньше», биологических событий путем контроля функции произвольной биологической молекулы в связанной с заболеваниями молекулярнофункциональной сети.
26. Способ поддержки выбора мишени для лекарственного средства, с использованием информации о количественных изменениях ключевых молекул и оценки типа «больше-меньше» биологических событий.
27. База данных о биомолекулярных связях для использования в способе, описанном в п.26.
28. База данных о биомолекулярных связях, содержащая информацию о парах из молекулы лекарственного средства и ее целевой биологической молекулы.
29. База данных о биомолекулярных связях, содержащая информацию о парах из молекулы лекарственного средства и ее целевой биологической молекулы и информацию о. действиях и побочных эффектах.
30. Способ прогнозирования или исключения риска побочных эффектов молекулы лекарственного средства или взаимодействия между лекарственными средствами с использованием базы данных о биомолекулярных связях, содержащей информацию о парах из молекулы лекарственного средства и ее целевой биологической молекулы и информацию о действиях и побочных эффектах.
31. Способ выбора соединения лекарственного средства и определения дозы для медицинского лечения с использованием базы данных о биомолекулярных связях, содержащей информацию о парах из молекулы лекарственного средства и ее целевой биологической молекулы и информацию о действиях и побочных эффектах, и, при необходимости, путем связывания с информацией по полиморфизму генов.
32. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-31, характеризующиеся тем, что белки в базе данных о биомолекулярных связях или в молекулярно-функциональной сети связаны с базой данных о генах.
33. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-31, характеризующиеся тем, что база данных о биомолекулярных связях или молекулярно-функциональная сеть связана с информацией о генах, приведенной в соответствие с геномными последовательностями.
34. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-31, характеризующиеся тем, что база данных о биомолекулярных связях или молекулярно-функциональная сеть связана с информацией по генам, приведенной в соответствие с информацией об экспрессии белка в органах.
35. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-31, характеризующиеся тем, что база данных о биомолекулярных связях или молекулярно-функциональная сеть связана с информацией о генах, участвующих в генном полиморфизме.
36. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-31, характеризующиеся тем, что база данных о биомолекулярных связях или молекулярно-функциональная сеть связана с информацией о геноме или генах, приведенной в соответствие с геномными или генными последовательностями других видов.
37. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-31, для прогнозирования механизма заболевания с использованием информации об изменениях экспрессии белков в конкретных органах при введении молекулы лекарственного средства.
38. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-31, для использования при анализе информации о группе генного полиморфизма, наблюдаемого с высокой частотой при конкретном заболевании.
39. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.16-21, характеризующиеся тем, что связь пары биологических молекул распределяется по категориям.
40. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-31, характеризующиеся тем, что биологическое событие распределяется по категориям.
-5005460
41. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.13-15, характеризующиеся тем, что информация о биологическом событии типа «больше-меньше», при количественном изменении ключевой молекулы распределяется по категориям.
42. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-41, характеризующиеся тем, что две или более биологические молекулы интерпретируются при необходимости как одна виртуальная биологическая молекула.
43. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-41, характеризующиеся тем, что одна или несколько распределенных баз данных о биомолекулярных связях используется посредством передачи данных.
44. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-41, характеризующиеся тем, что база данных, содержащая информацию о биологических молекулах, непосредственно участвующих в экспрессии биологических событий, подготавливается и используется с помощью базы данных молекулярно-функциональных сетей, которые не обязательно содержат информацию о биологических событиях.
45. Способ или база данных о биомолекулярных связях или молекулярно-функциональная сеть, описанные в пп.1-41, характеризующиеся тем, что частичная молекулярно-функциональная сеть, связанная с произвольной молекулой, извлекается из базы данных молекулярно-функциональных сетей, которые необязательно содержат информацию о биологических событиях, и поиск в базе данных, содержащих информацию о биологических молекулах, непосредственно участвующих в экспрессии биологических событий, производится на основе молекул, составляющих указанную сеть.
46. База данных о биомолекулярных связях, где биологическая молекула или пары биологических молекул, которые должны интерпретироваться, фильтруются на основе информации об органах происхождения или органах действия и другого, или молекулярно-функциональная сеть, генерируемая с использованием этой базы данных, или способ генерирования молекулярно-функциональной сети с использованием этой базы данных.
47. Способ дополнительной фильтрации молекулярно-функциональных сетей, которые генерируются заранее, путем связанного поиска в базе данных «биологическая молекула-функция» на основе информации о биологических молекулах или биологических событиях или иной информации, включенной в каждую сеть, или молекулярно-функциональные сети, генерируемые посредством дополнительной фильтрации.
48. Способ дополнительной фильтрации молекулярно-функциональных сетей, которые генерируются с использованием базы данных о биомолекулярных связях, где биологическая молекула или пары биологических молекул, которые должны интерпретироваться, фильтруются на основе информации об органах происхождения или об органах действия и иного, на основе информации о биологических молекулах или биологических событиях или иной информации, включенной в каждую сеть, или молекулярно-функциональные сети, генерируемые с помощью дополнительной фильтрации.
49. Компьютерная система, содержащая программы и базы данных для осуществления способов, описанных в пп.1-48.
50. Считываемый компьютером носитель записи для записи баз данных, описанных в пп.1-48.
51. Считываемый компьютером носитель записи для записи информации о молекулярнофункциональной сети, описанной в пп.1-48.
52. Считываемые компьютером носители записи для записи баз данных, описанных в пп.1-48, и программ для осуществления способов, описанных в пп.1-48.
53. Способ установления корреляций в информации о распределенных по иерархиям биологических событиях с биологическими молекулами.
54. Способ генерирования молекулярно-функциональной сети, с установлением корреляций с распределенными по иерархиям биологическими событиями.
55. Способ генерирования молекулярно-функциональной сети, характеризуемой иерархическим хранением информации о парах биологических молекул.
56. Способ генерирования молекулярно-функциональной сети, характеризуемой иерархическим хранением состояний биологических молекул в виде комплексов.
57. Способ установления корреляций между биологическими событиями и иерархически хранимой информацией о парах биологических молекул.
58. Способ установления корреляций между биологическими событиями и иерархически хранимой информацией о состояниях биологических молекул в виде комплексов.
59. Способ генерирования молекулярно-функциональной сети, характеризующийся иерархическим хранением информации о транскрипции группы генов.
60. Способ генерирования молекулярно-функциональной сети, характеризующийся иерархическим хранением информации об экспрессии белков.
61. Способ генерирования молекулярно-функциональной сети на основе результата поиска, полученного путем осуществления поиска на основе ключевого слова и/или числового параметра, и/или мо
-6005460 лекулярной структуры, и/или последовательности аминокислот, и/или последовательности оснований, и/или иного, для произвольных элементов данных в базе данных.
62. Способ получения подсети указанной молекулярно-функциональной сети путем осуществления поиска на основе ключевого слова, и/или числового параметра, и/или молекулярной структуры, и/или последовательности аминокислот, и/или последовательности оснований, и/или иного, для данных о биологических молекулах, и/или парах биологических молекул, и/или биологических событиях, включенных в генерируемую молекулярно-функциональную сеть.
63. Способ выделения информации о биологических молекулах, и/или парах биологических молекул, и/или биологических событиях путем осуществления поиска на основе ключевого слова и/или числового параметра, и/или молекулярной структуры, и/или последовательности аминокислот, и/или последовательности оснований, и/или чего-либо подобного, для данных о биологических молекулах, и/или парах биологических молекул, и/или биологических событиях, включенных в генерируемую молекулярно-функциональную сеть.
Краткое описание чертежей
Фиг. 1 - основная концепция способа согласно настоящему изобретению.
Фиг. 2 - концепция, когда в способе по настоящему изобретению используется база данных о связях молекул лекарственных средств.
Фиг. 3 - концепция, когда в способе по настоящему изобретению используется база данных генетической информации.
Фиг. 4 - концепция ренин-ангиотензиновой системы, которая рассматривается в примере 1.
Фиг. 5 - содержание базы данных информации о биологических молекулах для примера 1.
Фиг. 6 - содержание базы данных о биомолекулярных связях для примера 1.
Фиг. 7 - молекулярно-функциональная сеть, полученная с помощью поиска биологических молекул для примера 1. Биологическая молекула и биологическое событие, используемые для запроса, указаны в жирных рамках.
Фиг. 8 - содержание базы данных информации о молекулах лекарственных средств для примера 1.
Фиг. 9 - содержание базы данных о связях молекул лекарственных средств для примера 1.
Фиг. 10 - молекулярно-функциональная сеть, полученная посредством поиска молекулы лекарственного средства в примере 1. Молекула лекарственного средства и биологическое событие, используемые в качестве запросов, показаны в жирных рамках.
Фиг. 11 - блок-схема программы для поиска и визуального отображения молекулярнофункциональной сети в примере 2.
Фиг. 12 - входные элементы для связанного поиска (указана одна точка) в примере 2.
Фиг. 13 - входные элементы для связанного поиска (указаны две точки) в примере 2.
Подробное описание предпочтительных вариантов осуществления
В настоящем описании использованы следующие понятия или определения терминов.
Организм представляет собой концепцию, включающую в себя, например, органеллу, клетку, ткань, орган, индивидуума, группу индивидуумов, а также паразита.
Биологическое событие представляет собой концепцию, включающую в себя все явления, отклики, реакции и симптомы, проявляющиеся эндогенно или экзогенно в организме. Транскрипция, миграция клеток, адгезия клеток, деление клеток, нервное возбуждение, сужение сосудов, повышение давления крови, понижение уровня глюкозы в крови, повышение температуры, конвульсии, инфицирование паразитом, таким как гетерогенный организм и вирус, могут быть указаны в качестве конкретных примеров. Кроме того, реакции на физические стимулы, такие как свет и тепло, поступающие извне организма, могут быть включены в концепцию биологического события.
Патологическое событие представляет собой концепцию, которая может быть включена в биологическое событие, и обозначает состояние, когда биологическое событие превосходит определенный порог, количественно или качественно, и может быть определено как заболевание или патологическое состояние. Например, как следствие экстраординарно увеличенного биологического события повышение давления крови, высокое давление крови или гипертония могут быть определены как патологические события, и когда сахар в крови не контролируется в нормальных пределах, гипергликемия или диабет могут быть определены как патологические события. Кроме того, существуют патологические события, которые связаны со многими видами биологических событий, а также указанные выше примеры, которые связаны с единственным биологическим событием.
Биологическая молекула обозначает органические молекулы с различными структурами, существующие в организме, и группы из таких молекул, такие как нуклеиновые кислоты, белки, липиды, углеводы, общие малые молекулы, и могут содержать ионы металлов, воду, а также протон.
Ключевая молекула, главным образом, обозначает такие молекулы, как медиаторы, гормоны, нейротрансмиттеры и физиологически активные вещества. В большинстве случаев, в организме находится конкретная целевая биологическая молекула, и известно, что прямое связывание с этой молекулой действует как инициатор упомянутого биологического события. Хотя эти молекулы генерируются и оказывают свои воздействия в организме, биологическое событие, как правило, экспрессируется в соот
-7005460 ветствии с заданным количеством, даже когда они вводятся извне организма. Адреналин, ангиотензин II, инсулин, эстроген и тому подобное могут быть приведены в качестве конкретных примеров.
Целевая биологическая молекула обозначает конкретную биологическую молекулу, которая может воспринимать такую биологическую молекулу, как медиатор, гормон, нейротрансмиттер и физиологически активное вещество, или молекулу лекарственного средства. Прямое связывание с ней вызывает экспрессию конкретного события.
Информация биологического события типа больше-меньше представляет собой информацию о превышении/увеличении или подавлении/уменьшении в ответ на количественное или качественное изменение ключевой молекулы или целевой биологической молекулы. Сюда включается случай, когда биологическое событие происходит только после того, как количество ключевых молекул превосходит определенный порог.
ГО (идентификатор) молекулы приводится для цели идентификации или обозначения молекулы вместо наименования молекулы и должно соответствовать каждой молекуле однозначно определенным образом. Сокращенный символ наименования молекулы или буквенно-цифровая последовательность, не связанная напрямую с наименованием молекулы, может быть приемлема, однако желательно использовать короткую последовательность символов. Если существует ГО молекулы, используемый повсеместно, то желательно его использовать. Можно использовать множество ГО молекулы, присваиваемых различными способами одной молекуле, и распределять их по иерархиям посредством структурной группы или функции.
Прямое связывание обозначает образование стабильного комплекса с помощью межмолекулярных сил, но не ковалентной связи, или обозначает возможность образования комплекса. В редких случаях образуется ковалентная связь, и такие случаи включаются в эту концепцию. Это также определяют как взаимодействие, однако термин «взаимодействие» имеет более широкий объем.
Пара биологических молекул обозначает пару биологических молекул, способных к прямому связыванию, или таких, которые могут, в принципе, осуществлять прямое связывание в организме. Эстрадиол и рецептор эстрогена, ангиотензин - преобразующий фермент и ангиотензин I могут быть приведены в качестве конкретных примеров. В случае пары молекул из фермента и продукта ферментативной реакции, их комплекс, хотя и был не очень стабильным, тем не менее рассматривается как включенный в пары биологических молекул. Более того, как в случае двух белковых молекул, о которых известно, что они взаимодействуют с помощью экспериментальной методики парной гибридизации, могут быть включены пары молекул, у которых взаимные роли не ясны. Для физических или химических стимулов извне организма, таких как свет, звук, изменения температуры, магнитное поле, сила тяжести, давление и вибрация, эти стимулы могут рассматриваться как виртуальные биологические молекулы, и может быть определена пара биологических молекул вместе с соответствующей целевой биологической молекулой.
Структурный код представляет собой код классификации, представляющий структурные особенности, является ли биологическая молекула ДНК, РНК, белком, пептидом или общей малой молекулой и тому подобное.
Код функции представляет собой код классификации, представляющий функцию биологической молекулы на молекулярном уровне, например, в случае биологической молекулы, где структурный код представляет собой белок, он представляет классификацию мембранного рецептора/ядерного рецептора/ переносчика/медиатора/гидролазы/киназы/фосфорилазы и тому подобное, и в случае биологической молекулы, где структурный код представляет собой малую молекулу, он представляет собой классификацию субстрата/продукта/предшественника/активного пептида/метаболита и тому подобное.
Код взаимосвязи представляет собой код классификации, представляющий взаимосвязь между двумя молекулами, составляющими пару биологических молекул. Он может быть разбит на категории, например 10 - для агониста и рецептора, 21 - для фермента и субстрата, 22 - для субстрата и продукта. Как и в случае двух белковых молекул, которые, как считается, имеют взаимодействия, с помощью экспериментальной методики парной гибридизации, когда взаимная роль двух молекул не ясна, желательно использовать код, представляющий такую ситуацию.
Код взаимосвязь-функция представляет собой код классификации, представляющий явление или изменение, сопровождаемое прямым связыванием двух молекул, составляющих пару биологических молекул, и может быть использована, например, классификация, такая как гидролиз, фосфорилирование, дефосфорилирование, активирование, инактивирование.
Код надежности представляет собой код для указания уровня надежности прямого связывания для каждой пары биологических молекул и/или экспериментального метода, с помощью которого доказывается прямое связывание.
Связанный поиск обозначает автоматический поиск связи функционально или биосинтетически связанных молекул, которые включают в себя одну или несколько обозначенных произвольных биологических молекул или биологических событий.
Молекулярно-функциональная сеть обозначает связь функционально или биосинтетически взаимосвязанных молекул, полученных в результате объединенного поиска, с помощью использования базы
-8005460 данных о биомолекулярных связях, где обозначаются одна или несколько произвольных биологических молекул или биологических событий.
Молекула лекарственного средства обозначает молекулу соединения, полученного и используемого для медицинского лечения в качестве лекарственного средства, а также включает соединение с известной физиологической активностью, такое как соединение, используемое для медицинского и/или фармацевтического исследования, и соединение, описанное в патентах или в литературе.
Устанавливать корреляцию информации о биологическом событии обозначает показывать или обнаруживать, что экспрессия определенного биологического события связана с определенной биологической молекулой, молекулой лекарственного средства, генетической информацией или молекулярнофункциональной сетью.
Распределение по категориям обозначает классификацию информации о биологических молекулах, парах биологических молекул, биологических событиях и тому подобное по заданным категориям, и описание такой информации с помощью обозначений, представляющих относящиеся к делу категории, вместо хранения данной информации целиком, когда информация хранится в базе данных. Указанные выше примеры структурного кода, кода функции, кода взаимосвязи и кода взаимосвязь - функция являются примерами распределения по категориям.
Орган происхождения обозначает орган, ткань, область в органе или ткани, конкретную клетку в органе или ткани, область в клетке и тому подобное, откуда происходит биологическая молекула.
Орган существования обозначает орган, ткань, область в органе или ткани, конкретную клетку в органе или ткани, область в клетке и тому подобное, где биологическая молекула хранится после ее генерирования.
Орган действия обозначает орган, ткань, область в органе или ткани, конкретную клетку в органе или ткани, область в клетке и тому подобное, где биологическая молекула или ключевая молекула вызывают биологическое событие.
В качестве одного из вариантов осуществления настоящего изобретения предусматривается следующий способ (фиг. 1). Сначала создается база данных о биомолекулярных связях, хранящая информацию о парах биологических молекул, связывающихся напрямую. Информация о самих биологических молекулах, такая как присвоение биологической молекуле ГО молекулы, может быть включена сюда, однако желательно хранить их в отдельной базе данных, в базе данных информации о биологических молекулах. Затем, одна или несколько произвольных молекул выделяются из указанной выше базы данных о биомолекулярных связях, и осуществляется связанный поиск для получения молекулярнофункциональной сети, которая представляет собой представление функциональной или биосинтетической связи одной или нескольких биологических молекул.
Путем установления корреляции информации о биологических событиях, по меньшей мере, с теми парами биологических молекул, которые состоят из ключевой молекулы и ее целевой биологической молекулы среди пар биологических молекул, является возможным предсказать вместе с молекулярнофункциональной сетью биологические события, с которыми молекулы в молекулярно-функциональной сети связаны прямо или косвенно. Кроме того, путем добавления информации о взаимосвязи между количественным или качественным изменением ключевой молекулы и биологическим событием типа «больше-меньше» можно предсказать, работает ли количественное или качественное изменение произвольной молекулы в молекулярно-функциональной сети на превышение/увеличение биологического события или на подавление/уменьшение биологического события.
Принципиальной ролью баз данных информации о биологических молекулах является определение ГО молекулы или ГО для формального наименования каждой биологической молекулы, и желательно хранить необходимую информацию о самих биологических молекулах. Например, желательно хранить информацию о наименовании молекулы, ГО молекулы, структурном коде, функциональном коде, виде, органе происхождения, органе существования и тому подобном. Кроме того, даже для биологической молекулы, которая не выделена экспериментально или ее существование не подтверждено, можно присвоить временный ГО молекулы и другую информацию, например молекуле, существование которой предсказывается по экспериментам с другими видами.
Информация об аминокислотной последовательности и/или о структуре каждой биологической молекулы может быть включена в базу данных информации о биологических молекулах, однако желательно сохранять такую информацию в базе данных последовательностей или в базе структурных данных и извлекать информацию, основывающуюся на ГО молекулы, при необходимости. Для тех биологических молекул, которые имеют низкую молекулярную массу, желательно хранить не только формальное наименование молекулы, но и данные, необходимые для отображения химической структуры, в базе данных информации о биологических молекулах или в отдельной базе данных с тем, чтобы химические структуры могли быть приложены к представлению молекулярно-функциональной сети, если это необходимо.
Если более удобно рассматривать множество биологических молекул коллективно, например две или более биологических молекул, демонстрирующих активность или функционирующих в олигомере или группе, можно определить их как одну виртуальную биологическую молекулу и зарегистрировать ее
-9005460 в базе данных информации о биологических молекулах, присваивая ГО молекулы. В этом случае предпочтительно присвоить и зарегистрировать ГО молекулы для каждой составляющей молекулы и установить в записи данных виртуальной биологической молекулы поле, которое описывает ГО молекул для составляющих молекул, если составляющие молекулы известны. Даже, когда составляющие биологические молекулы неизвестны, можно определить виртуальную биологическую молекулу, имеющую конкретную функцию, в виде группы и использовать ее для определения пары биологических молекул.
Кроме того, когда биологическая молекула состоит из двух или более доменных структур, можно рассматривать каждый домен как независимую молекулу, если окажется более благоприятным рассматривать каждый домен независимо, например, по тем причинам, что домены имеют функции, отличающиеся друг от друга. Например, предпочтительно присваивать ГО молекулы каждому домену и регистрировать его в базе данных информации о биологических молекулах вместе с исходной биологической молекулой. Путем создания поля, описывающего ГО молекул отдельных доменов, в записи данных об исходной биологической молекуле можно описать, что одна биологическая молекула имеет две или более различные функции. Когда конкретная последовательность в геномной последовательности, которая не является геном, имеет определенную функцию или распознается конкретной биологической молекулой, можно рассматривать часть последовательности в качестве независимой биологической молекулы и присваивать ей ГО молекулы для определения пары биологических молекул.
Информация о паре биологических молекул хранится в базе данных о биомолекулярных связях. Для каждой пары биологических молекул регистрируются ГО молекул, для двух биологических молекул, образующих пару, код взаимосвязи, код взаимосвязь-функция, код надежности, биологические события, органы действия, конъюгирующиеся молекулы и другая дополнительная информация. Для пары молекул из ключевой молекулы и ее целевой биологической молекулы желательно ввести биологические события, информацию типа «больше-меньше» о биологических событиях, соответствующих количественному или качественному изменению любой молекулы, патологические события и тому подобное, насколько это возможно. Для пары биологических молекул без ключевой молекулы желательно ввести биологические события и патологические события, если существуют биологические события или патологические события, с которыми указанная пара биологических молекул является прямо связанной. Информация типа «больше-меньше» для от биологического события, соответствующего количественному или качественному изменению ключевой молекулы, может быть описана как упрощенная информация, например, что биологическое событие увеличивается или уменьшается по сравнению с нормальными пределами, в соответствии с увеличением, например, ключевой молекулы. Когда один фермент катализирует реакцию двух или более видов субстратов и генерирует различные продукты реакции, соответственно, может быть добавлено представление, описывающее связь между ферментом, субстратом и продуктом реакции.
Поскольку база данных информации о биологических молекулах и база данных о биомолекулярных связях различные по своему содержанию и составляющим, они рассматриваются как концептуально независимые базы данных в настоящем описании, однако понятно, что эти два вида данных могут храниться в одной базе данных, объединяющей обе, в свете цели настоящего изобретения. Более того, могут существовать две или более базы данных информации о биологических молекулах и две или более базы данных о биомолекулярных связях, и в этом случае можно использовать эти базы данных путем их соответствующего выбора и объединения. Например, данные для различных видов, различаемых по конкретному полю, могут храниться в одной и той же базе данных информации о биологических молекулах и в базе данных о биомолекулярных связях, или, альтернативно, данные для человека и мыши могут храниться в отдельных базах данных.
В качестве кода взаимосвязи можно вводить слова, например, о том, что две молекулы, составляющие пару биологических молекул, являются, например, агонистом и рецептором, или ферментом и субстратом. Однако желательно вводить, например, распределение по категориям, 10 - для взаимосвязи между агонистом и рецептором, 21 - для взаимосвязи между ферментом и субстратом, 22 - для взаимосвязи между ферментом и продуктом. Кроме того, в качестве кода взаимосвязь-функция удобно хранить класс таких функций, как гидролиз, фосфоризация, дефосфоризация, активирование и инактивирование, когда желательно вводить их с распределением по категориям.
Отношения между парами биологических молекул не всегда ясны, как в случае фермента и субстрата. Например, подобно двум белковым молекулам, которые рассматриваются как имеющие взаимодействие типа белок-белок с помощью экспериментальной методики парной гибридизации, существуют случаи, в которых взаимные роли обеих молекул не ясны. В порядке осуществления объединенного поиска, включающего в себя такие пары биологических молекул, удобно рассматривать, является ли взаимосвязь между двумя молекулами, составляющими пару биологических молекул, ориентированной или нет. Для каждой пары биологических молекул желательно использовать код взаимосвязи, который различен, в зависимости от случая, к которому относится. Первый случай рассматривается в качестве фиксированного направления действия и рассматривается только порядок ввода двух молекул при представлении пары молекул, в то время как последний случай рассматривается как неизвестное направление действия, и взаимосвязь с обратным действием также учитывается во время поиска.
-10005460
Существуют различные виды информации о парах биологических непосредственно связывающихся молекул от определенной информации, которая экспериментально доказана, до тех, которые временно предположительно рассматриваются в качестве пар биологических молекул. Более того, в некоторых экспериментальных способах существуют случаи, когда некоторые пары биологических молекул включаются по ошибке, из-за ложных положительных сигналов. Как следствие, желательно добавить к информации о каждой паре биологических молекул код надежности, который показывает уровень надежности и экспериментальный метод. Когда молекулярно-функциональные сети, генерируемые с помощью поиска, являются слишком большими, можно фильтровать сеть с использованием этого кода.
Если сохраняется информация об органах, где хранится биологическая молекула, и информация об органах, на которые она действует, в добавление к информации об органах, где биологическая молекула генерируется, можно легко описать во время генерирования сети «биологическая молекула-функция» такое явление, когда молекула, генерируемая в определенном органе и выходящая из клетки, действует на целевую биологическую молекулу на мембране другой клетки, снаружи. Желательно вводить информацию об органах происхождения и органах существования биологической молекулы в базу данных информации о биологических молекулах и вводить информацию об органах действия в базу данных о биомолекулярных связях. Здесь описание органов происхождения, органов существования и органов действия не является конкретно ограниченным органами и может включать в себя информацию о ткани, области органа или ткани, конкретной клетке в органе или в ткани, внутриклеточной области и тому подобное.
Любые описания приемлемы для описания экспериментального метода или метода прогнозирования, доказывающего прямое связывание, вида биологического события, информации типа «большеменьше» для биологического события, соответствующего количественному изменению ключевой молекулы, внутриклеточной области, ткани, органа, области в органе постольку, поскольку они представляют собой упрощение. Однако желательно разбить их на категории и преобразовать их в короткие буквенноцифровые обозначения и тому подобное. Если определить их в виде словаря синонимов, то можно обрабатывать синонимы одновременно и сводить к минимуму ошибки во время ввода.
Концепция связанного поиска, который генерирует молекулярно-функциональная сеть из базы данных о биомолекулярных связях, демонстрируется ниже. Любой способ может быть использован для связанного поиска по настоящему изобретению, если эта концепция реализуется. Например, может быть использован алгоритм бер1Н ЙГ81 юатей («поиск сначала в глубину»), описанный в Сйар1ет 29 о1 А1доп11ип ίη С (Абб180п-\Уе81еу РиЬ Со, 1990), 8ебде\\зск.
Если предположить, что каждая пара биологических молекул, состоящая из биологических молекул, представленных с помощью ГО молекул а-ζ, описывается как (п, т), база данных о биомолекулярных связях описывается как группа пар биологических молекул следующим образом.
(а, с) (а, д) (Ь, 1) (Ь, к) (с, ф (с, г) (б, ν) (б, у) (е, к) (е, 8) (д, и) (], р) (к, 1) (к, у) (р, ф (р, у) (х, ζ)
Если обозначить генерирование молекулярно-функциональной сети, содержащей, например, с и е, при связанном поиске, то пары биологических молекул (с, _)) (). р) (р, у) (у, к) (к, е), имеющие по одной общей молекуле в паре, ищутся последовательно, и с-ур-у-к-е, которая представляет собой связь молекул с, у р, у, к, е, получается в качестве молекулярно-функциональной сети.
На основе полученной молекулярно-функциональной сети можно прогнозировать биологические события следующим образом. Если биологическая молекула е представляет собой ключевую молекулу и содержит информацию о биологическом событии Е, можно предсказать, что биологические молекулы с, у р, у, к прямо или косвенно связаны с экспрессией биологического события Е. Более того, когда существует информация, типа «больше-меньше» о биологическом событии, например о том, что уменьшение молекулы е повышает экспрессию биологического события Е, можно предсказать воздействие количественных или качественных изменений произвольных молекул из с, у р, у, к на экспрессию биологического события Е, рассматривая связи (с, .)) О, р) (р, у) (у, к) (к, е).
Далее, можно прогнозировать воздействия на количество экспрессии биологического события ОЕ, оказываемое N биологическими молекулами в молекулярно-функциональной сети со стороны определенной биологической молекулы на ключевую молекулу, например, по следующей формуле. Здесь, 81 значение качественной оценки состояния ί-й биологической молекулы, Р, - значение, представляющее количество ί-той биологической молекулы, V, - значение оценки окружения, где существует ί-я биологическая молекула, и 1 - функция с множеством значений, с 3 х N значениями на входе.
Ωε = 1(8ί,Κ;,νί, ...δΝ,ΒΝΝ)
Поскольку виды биологических событий, связанных с входной сетью «биологическая молекулафункция», не ограничиваются одним видом и ожидается, что существуют несколько молекулярнофункциональных сетей, связанных с одним видом биологического события, можно осуществлять скрининг (фильтрацию) связанных молекулярно-функциональных сетей со стороны биологических событий. Например, если молекулярно-функциональная сеть, содержащая необычно большие количества биологических молекул, генерируется путем обозначения одной или нескольких биологических молекул, можно фильтровать пределы молекулярно-функциональной сети путем добавления информации о биологических событиях. В том числе, также можно генерировать молекулярно-функциональную сеть при
-11005460 условии, что в нее включается некоторый вид медиаторной молекулы или связь между указанной молекулой и целевой биологической молекулой.
Кроме того, можно генерировать «молекулярно-функциональную сеть» в необходимых пределах, путем разделения, фильтрования данных, извлечения подсети данных и/или распределения по иерархиям данных базы данных о биомолекулярных связях соответствующим образом. Разделение, фильтрование и извлечение подсети может быть осуществлено с помощью таких способов поиска, как поиск элементов данных, специфичных по отношению к базе данных по настоящему изобретению, общего поиска по тексту с использованием ключевых слов, поиск гомологов к последовательностям аминокислот или последовательностям нуклеиновых кислот, поиска субструктур к химическим структурам. Путем предварительного осуществления этих типов поиска в базе данных о биомолекулярных связях или в базе данных информации о биологических молекулах можно генерировать ограниченную молекулярнофункциональную сеть или характеризованную молекулярно-функциональную сеть. Например, можно генерировать молекулярно-функциональную сеть с ограниченными пределами путем генерирования частичной базы данных, просмотренной с таких точек зрения, как биологическая молекула, генерируемая в печени, и биологические события, происходящие в коже, используя информацию об органах происхождения или органах действия и осуществляя объединенный поиск. Кроме того, можно генерировать молекулярно-функциональную сеть с желаемыми характеристиками или с желаемыми пределами разделения, фильтрования и/или извлечения подсети из молекулярно-функциональной сети, генерируемой путем связанного поиска, путем осуществления указанного выше поиска биологических молекул или пар биологических молекул, включенных в нее. Такое ограничение и характеризация не только облегчают поиск, но и являются эффективными, способствуя пониманию молекулярно-функциональной сети, путем выделения конкретной группы биологических молекул или пар биологических молекул в молекулярнофункциональной сети.
С помощью разделения, фильтрования и/или извлечения подсети из базы данных о биомолекулярных связях, основываясь, соответствующим образом, на связи в цепи, и путем хранения и использования информации, показывающей ее взаимосвязь при включении, можно осуществлять распределение по иерархиям молекулярно-функциональной сети. Даже если имеются какие-то неизвестные молекулы или неизвестные связи между молекулами можно генерировать временную молекулярнофункциональную сеть путем объединения их в одну виртуальную биологическую молекулу и определения пары с другой молекулой. Когда генерируется исключительно сложная сеть, из-за очень большого количества молекул, включенных в нее, возможно описание сети путем простого определения двух или более биологических молекул, связанных в сети, в качестве одной виртуальной биологической молекулы, соответственно.
Использование таких иерархий позволяет ускорить связанный поиск и избежать излишней сложности, делая точность описания сети настраиваемой. В настоящем описании такая частичная сеть, состоящая из двух или более пар биологических молекул, связанных в сети, называется подсеть.
Любая частичная сеть может быть обозначена как подсеть, однако предпочтительно удобно рассматривать в качестве подсети систему, путь и/или цикл, которые хорошо известны исследователям, подобные циклу ТСА и пентозафосфатному циклу в системе метаболизма. Кроме того, определенная подсеть может быть включена в другую подсеть, например, сама система метаболизма может рассматриваться как высшая подсеть, включающая множество подсетей.
Хотя существует способ рассмотрения каждой подсети в качестве одной виртуальной биологической молекулы, удобно хранить информацию о парах биологических молекул, составляющих подсеть, и информацию об иерархии подсети в базе данных о биомолекулярных связях. Более того, можно образовать высшую иерархию данных, чтобы представить подсеть в базе данных о биомолекулярных связях и хранить там информацию об указанной подсети. Распределение по иерархиям пар биологических молекул с помощью подсети не ограничивается двумя уровнями, и можно хранить группу из множества подсетей в более высокой подсети. В порядке облегчения перекрестных ссылок между данными о парах молекул и данными подсети высшей иерархии во время генерирования сети желательно хранение информации, показывающей взаимосвязь между парой молекул и подсетью, соответственно, в данных о парах молекул и в данных подсети. Ясно, что одна пара биологических молекул может быть связана с множеством подсетей.
Желательно включение не только связей с парами биологических молекул в низшую иерархию, но также и информации о связи между подсетями в данных о подсетях распределенной по иерархиям базы данных о биомолекулярных связях. Например, гликолитический путь и цикл ТСА представляют собой подсети, работающие по порядку в метаболической системе, и возможно хранение связи между этими подсетями как пары в высшей иерархии. В этом случае желательно добавление информации о биологических молекулах, которые становятся точками контакта между подсетями, в дополнение к информации о паре подсетей.
Более того, кроме распределения по иерархиям сетей сами биологические молекулы могут быть распределены по иерархиям, и информация о них может храниться и использоваться в базе данных информации о биологических молекулах, которая представляет собой одну из особенностей настоящего
-12005460 изобретения. Для быстрого поиска и удобного и разнообразного отображения сети желательно распределение по иерархиям информации как о биологических молекулах, так и о парах биологических молекул. Примерами элементов, которые должны быть распределены по иерархиям для биологических молекул, являются следующие. Среди биологических молекул существуют случаи, в которых множество различных молекул собираются конкретно для экспрессии определенной функции, и существует также множество случаев, в которых состояние экспрессии и вид функций контролируются в зависимости от различия в состояниях молекул в виде комплексов. Более того, как наблюдается для иммуноцитов, существуют случаи, в которых связи с биологическими событиями или функциями клеток определяются сочетанием из множества молекул, экспрессируемых на поверхности клеток. В таких случаях, существует способ рассмотрения состояния молекул в виде комплексов как одной виртуальной биологической молекулы, как описано выше, но в качестве другого способа можно установить высшую иерархию данных, чтобы представить состояние молекул в виде комплексов в базе данных информации о биологических молекулах и хранить там информацию об указанном состоянии в виде комплекса. В порядке облегчения перекрестных ссылок между данными биологических молекул и данными из высшей иерархии во время генерирования молекулярно-функциональной сети желательно хранение информации, представляющей взаимную связь между данными биологических молекул и высшей иерархией данных, соответственно, в данных биологических молекул и в данных высшей иерархии. Ясно, что одна биологическая молекула может быть взаимосвязана с множеством данных высшей иерархии.
Среди биологических событий и патологических событий существуют многие такие, которые не могут быть связаны с конкретной парой биологических молекул. Например, существуют случаи, в которых взаимосвязь между биологическим событием или патологическим событием и образованием определенной подсети является известной, но пара биологических молекул, с которыми указанное событие связано непосредственно, неизвестна. В таких случаях возможно описание взаимосвязи между указанным событием и сетью биологических молекул, путем связывания биологического события или патологического события с данными подсети, которая представляет собой высшую иерархию для пары биологических молекул, используя указанное выше распределение по иерархиям данных о парах биологических молекул.
Кроме того, когда состояние в виде комплекса для конкретных молекул или состояние экспрессии для определенных молекул на поверхности клетки связано с экспрессией определенного биологического события или патологического события, возможно описание взаимосвязи между указанным событием и сетью биологических молекул, путем связывания биологического события или патологического события с состоянием молекулы в виде комплекса или с состоянием экспрессии молекул, используя указанное выше распределение по иерархиям состояний молекул в виде комплексов или состояний экспрессии молекул.
Кроме того, среди биологических событий и патологических событий, существуют те, которые не могут быть связаны ни с конкретной парой биологических молекул, ни с подсетью. Примером таких случаев является патологическое событие воспаление, которое вызывается сочетанием различных биологических событий, таких как высвобождение воспалительных цитокинов, инфильтрация лейкоцитов в ткань и увеличение проницаемости капиллярных сосудов. Чтобы иметь возможность обработки такого события, предпочтительно распределить по иерархиям биологические события и патологические события, описать события, которые могут быть связаны с парами биологических молекул и подсетями в более низкой иерархии, и описать событие, которое происходит в связи с событиями в более низкой иерархии, в высшей иерархии. Ясно, что более чем два уровня иерархии могут быть использованы для такого распределения по иерархиям. В порядке облегчения перекрестных ссылок на события между иерархиями, желательно хранение информации, показывающей взаимосвязи данных в высшей и низшей иерархиях, в данных о событиях, в каждой иерархии.
Путем такого распределения по иерархиям данных биологических событий и патологических событий возможно описание взаимосвязи с молекулярно-функциональными сетями для таких событий, которые не могут быть связаны непосредственно с конкретной парой биологических молекул или подсетью.
Как показано выше, путем распределения по иерархиям и хранения данных в базе данных информации о биологических молекулах и в базе данных о биомолекулярных связях возможно генерирование молекулярно-функциональных сетей, эффективно соответствующих различным целям.
Когда исследуется взаимосвязь между определенными биологическими молекулами (молекула А) в гликолитическом пути и определенным белком (молекула В) в соответствующей киназной системе, необходимо осуществить связанный поиск с очень большим количеством пар молекул, если используются данные без распределения по иерархиям, и этот поиск является практически невозможным, когда путь между молекулой А и молекулой В слишком велик. С другой стороны, используя распределенные по иерархиям данные, можно осуществить связанный поиск между подсетью гликолитический путь и подсетью определенная киназная система в высшей иерархии именно подсетями, и, если путь обнаруживается в высшей иерархии, можно осуществить связанный поиск этого пути в более низкой иерархии каждой подсети, если это необходимо. Таким образом, путем разделения проблемы поиска пути на про
-13005460 блемы в различных иерархиях возможна генерация молекулярно-функциональной сети, невозможная без распределения по иерархиям.
Кроме того, когда конкретная подсеть часто упоминается при связанном поиске с использованием указанных выше распределенных по иерархиям данных, рекомендуется осуществление предварительного связанного поиска внутри указанной подсети и хранение информации о молекулярно-функциональной сети в указанной подсети.
С помощью этого процесса возможна более эффективная генерация молекулярно-функциональной сети в целом.
Кроме того, когда генерируется, например, молекулярно-функциональная сеть, связанная с патологическим событием воспаление, возможно, например, генерирование более широкой молекулярнофункциональной сети путем поиска событий в более низкой иерархии, связанных с событием воспаление из более высокой иерархии, и путем осуществления связанных поисков, начинающихся с пар биологических молекул или подсетей, с которыми взаимосвязаны указанные события в более низкой иерархии.
Как описано выше, с помощью настоящего изобретения возможно генерирование молекулярнофункциональных сетей, относящихся к произвольным молекулам, на основе информации о взаимосвязях биологических молекул, связывающихся напрямую, и легкое прогнозирование биологических событий и патологических событий, которые взаимосвязаны прямо или косвенно. Кроме того, настоящее изобретение может быть использовано инверсным методом для целей выбора молекулярно-функциональной сети с высокой возможностью взаимосвязи с заболеванием на основе характерных особенностей для заболеваний, таких как биологические события, патологические события и изменения в количествах биологических молекул, и для прогнозирования молекулярного механизма заболевания. Кроме того, с помощью настоящего изобретения возможно создание стратегий для разработки лекарственных средств, так что ингибирование какого-либо процесса в сети является эффективным при лечении конкретного заболевания или симптома, для выяснения того, какая молекула в сети является перспективной в качестве мишени для лекарственного средства (белок или иная биологическая молекула, которая должна служить мишенью при разработке лекарственного средства), какой вид побочных эффектов ожидается от мишеней для лекарственного средства и какой вид системы для анализа является соответствующим при выборе кандидатов для лекарственных средств, при этом устраняя побочные эффекты.
Молекула лекарственного средства, как правило, прилагает свою фармакологическую активность путем связывания с биополимером, таким как белок, в организме и путем контроля его функции. Воздействие таких молекул изучено более точно по сравнению с воздействиями биологических молекул, внося вклад в понимание молекулярных механизмов целевых заболеваний. Таким образом, можно заметить, что полезность способов по настоящему изобретению повышается путем добавления взаимосвязей для пар из молекулы лекарственного средства, одобренной для производства и используемой для медицинского лечения, или молекулы лекарственного средства, используемой для фармакологических исследований, и ее целевой биологической молекулы, к указанной выше информации о биологических молекулах и парах биологических молекул. В большинстве случаев целевые биологические молекулы представляют собой белки или белки, модифицированные сахарами. Становится возможным прогнозирование биологических событий, которые, вероятно, должны быть побочными эффектами, на основе молекулярно-функциональной сети, включающей целевую биологическую молекулу, и также становится возможным прогнозирование взаимодействия между лекарственными средствами по пересечениям в сетях молекула-функция, относящихся к лекарственным средствам, вводимых совместно. В результате, возможно выбирать и определять дозу лекарственного средства, при этом учитывая риск побочных эффектов и риск взаимодействия между лекарственными средствами.
Примеры способов по настоящему изобретению, где добавлены взаимосвязи между молекулой лекарственного средства и целевой биологической молекулой, описаны ниже. ГО молекулы определяется для формальной номенклатуры каждой молекулы лекарственного средства, и создается база данных информации о молекулах лекарственных средств, которая хранит всю информацию о самой указанной молекуле. Для каждой молекулы лекарственного средства здесь хранятся наименование, ГО молекулы, указание, доза, целевые биологические молекулы и другая информация. Как и в случае базы данных информации о биологических молекулах такая информация, как химическая структура, аминокислотная последовательность (в случае пептидов или белков) и стерическая структура молекул лекарственных средств, может быть включена в базу данных информации о молекулах лекарственных средств, но предпочтительно хранить их в отдельной базе данных. Для целей дискриминации среди молекул лекарственных средств и биологических молекул или среди белков и малых молекул можно использовать дискриминацию по структурному коду и тому подобное или использовать правила присвоения ГО молекулы, где, например, первая буква говорит о различиях. Кроме того, если такая информация, как заметные побочные эффекты, взаимодействие с другими лекарственными средствами и участвующие в метаболизме ферменты, вводится из информации предписания или другой литературы о лекарственных средствах, она была бы полезной для цели соответствующего выбора лекарственного средства в связи с генным полиморфизмом на основе молекулярно-функциональной сети.
-14005460
Кроме того, может быть создана база данных связей молекул лекарственных средств, которая представляет собой базу данных, содержащую информацию о парах молекулы лекарственного средства и целевого белка, а также информацию об их взаимосвязи. В ней хранятся ГО молекулы для молекулы лекарственного средства, ГО молекулы для целевой биологической молекулы, код взаимосвязи, фармакологическое действие, показания и другая информация, относящаяся к молекулам лекарственного средства. Что касается ГО молекулы для целевых биологических молекул, необходимо использовать те, которые определены в базе данных информации о биологических молекулах. Относительно элементов данных, общих с базой данных биомолекулярных связей, таких как код взаимосвязи, предпочтительно использовать правила описания, совпадающие с правилами базы данных биомолекулярных связей.
Создавая базу данных информации о молекулах лекарственных средств и базу данных связей молекул лекарственных средств и импортируя в них информацию о молекулах лекарственных средств и парах молекул лекарственных средств, способ по настоящему изобретению может быть расширен, как показано на фиг. 2. Здесь генерирование молекулярно-функциональной сети и прогнозирования биологических событий путем связанного поиска может быть осуществлено с помощью способа, подобного способу, указанному выше, где используется только база данных о биомолекулярных связях и база данных информации о биологических молекулах, а также может быть получена информация об известных молекулах лекарственных средств, которые нацелены на молекулы в указанной сети. Кроме того, это полезно для цели выделения молекулярно-функциональной сети, с которой связана указанная молекула лекарственного средства, из молекулярно-функциональных сетей, которые были генерированы с использованием только базы данных о биомолекулярных связях и базы данных информации о биологических молекулах.
С другой стороны, исследование генетической информации в различных аспектах, быстро развиваются, включая анализ последовательности генома человека. цДНК выделяются в масштабе всего генома, изучение ОКБ (открытых рамок считывания) и генных последовательностей находятся в процессе их получения и осуществляется позиционирование генов в геноме. При этом в качестве дополнительных вариантов осуществления настоящего изобретения настоящее изобретение может быть распространено на создание базы данных «биологическая молекула-ген», которая связывает ГО молекул для белков среди биологических молекул с информацией о генах, кодирующих указанные белки, содержащей их наименования, сокращенные наименования, ГО и тому подобное. То есть, установление корреляции между генами и биологическими молекулами делает возможным понимание значимости генов и белков, которые являются маркерами заболевания, и обнаружение такой взаимосвязи между заболеванием и генным полиморфизмом, по отношению к молекулам и биологическим событиям в молекулярно-функциональной сети. В базу данных «биологическая молекула-ген» предпочтительно включение такой информации, как мутация аминокислот и сокращенное обозначение генного полиморфизма, и взаимосвязь с функциями, а также с видами, с расположением на геноме, генной последовательности и функции, и является приемлемым создание двух или более баз данных, если это необходимо.
На основе наименования генов, соответствующих геномным последовательностям или конфигурациям генов, идентифицируются белки, которые транслируются под действием конкретной ключевой молекулы к ядерному рецептору, делая возможными отражения взаимосвязей взаимного контроля между биологическими молекулами в молекулярно-функциональной сети. Кроме того, известно, что экспрессия генов и белков различается в зависимости от органов, и с помощью способа, соответствующего настоящему изобретению, импортирование такой информации об экспрессии в базу данных информации о биологических молекулах позволяет генерировать отдельную молекулярно-функциональную сеть для каждого органа и объяснять явление, состоящее в том, что молекула лекарственного средства, нацеленная на ядерный рецептор, оказывает различные или противоположные воздействия в различных органах. Более того, поскольку известно, что экспрессия белков изменяется при введении молекулы лекарственного средства, интерпретация увеличения или уменьшения величины экспрессии белка в молекулярнофункциональной сети, связанной с целевым белком, с помощью способа по настоящему изобретению, является полезной для выбора лекарственных средств при рассмотрении генного полиморфизма.
Также при рассмотренном выше хранении информации о генной транскрипции и экспрессии белка использование концепции распределения по иерархиям делает возможным генерирование сетей молекула-функция более эффективным и широким образом. Например, для множества генов и/или белков, которые транскриптируются или экспрессируются с помощью конкретного ядерного рецептора, является предпочтительным создание высшей иерархии, представляющей транскрипцию группы генов и/или экспрессию группы белков в базе данных информации о биологических молекулах и хранение в ней данных об указанной группе генов и/или группе белков. Когда существуют биологические события и/или патологические события, связанные с транскрипцией указанной группы генов и/или с экспрессией указанной группы белков, описание связей между данными об указанной группе генов и/или об указанной группе белков в высшей иерархии и указанным событием в базе данных о биомолекулярных связях делает возможным генерирование молекулярно-функциональных сетей, которые не могут быть описаны с помощью связи между индивидуальным геном или молекулой и указанным событием.
-15005460
В указанном выше способе иерархического хранения информации по транскрипции генов и экспрессии белков, если количественная информация о транскрипции или экспрессии индивидуального гена из указанной группы генов или индивидуального белка из указанной группы белков является доступной, является предпочтительным хранение этой информации в виде численных параметров в базе данных информации о биологических молекулах. Используя эти численные параметры, становится возможным описание случаев, в которых связи биологических событий и/или изменение патологических событий зависят от различий величины экспрессии индивидуального гена или величины экспрессии индивидуального белка.
Кроме того, стали ясными различия между индивидуумами относительно генома и генов, и связывание такой информации со способами по настоящему изобретению способствует пониманию различий между индивидуумами и делает возможным медицинское лечение на основе этих различий. Для такого генного полиморфизма, когда функция конкретной биологической молекулы (белка) ослабляется, интерпретация этого в молекулярно-функциональной сети позволяет прогнозировать его влияние на биологические события. Это полезно для понимания, для связывания информации о симптомах и аномалиях биологических событий при генетическом заболевании, вызываемом дефектом или аномалией одного гена, в способах согласно настоящему изобретению.
При некоторых типичных заболеваниях, как сообщалось, существуют гены, часто наблюдаемые у пациентов с этим заболеванием, а именно гены, связанные с заболеванием. В предположении, что существует генетический тип, склонный конкретному заболеванию, могут существовать две или более молекулярно-функциональные сети, связанные, например, с установлением давления крови, и, вне всякого сомнения, значительное количество генов, которые могут быть связаны с высоким давлением крови, зависят от аномалии одной из молекул в одной из сетей. При интерпретации такой проблемы полигенных генов способы по настоящему изобретению являются незаменимыми.
Кроме того, анализы геномов и генов животных, например мыши и крысы, быстро развиваются в последние годы, и сегодня можно сопоставить их с геномом и генами человека. Ожидается, что белки, связанные с регуляцией физиологических функций, являются в значительной степени сходными у этих животных и человека. Однако существование заметных различий является препятствием при разработках лекарственных средств. Известно много случаев, когда белки и функции белков существенно различаются у этих животных и человека, и для разработки лекарственных средств полезно выяснить отличие от молекулярно-функциональной сети для человека путем связывания их способами, согласно настоящему изобретению. Более того, для лекарственных средств, предназначенных для животных, которые во многих случаях были получены из лекарственных средств, изначально разработанных для человека, эти способы также являются полезными для определения соответствующего их использования.
При разработке лекарственных средств при наличии животного, являющегося моделью болезни и имеющего патологические симптомы, подобные заболеванию человека, разработка осуществляется с помощью фармакологических действий, направленных на этих животных. Ведутся исследования геномов таких животных, являющихся моделями болезней, и их связывание с генетической информацией человека с помощью способов по настоящему изобретению будет полезным для выяснения механизма указанного заболевания человека.
Кроме того, для целей выяснения функции гена бывают случаи, когда создается опытное («выбитое») животное, в котором конкретный ген выключается, или трансгенное животное, в котором ген заменяется на ген с более слабой функцией или на сверхэспрессивный ген. Они могут оказаться нежизнеспособными и не способными к воспроизведению или не обнаруживается воздействия на биологические функции или поведение, и даже в случаях, когда определенная аномалия обнаруживается у новорожденного животного, очень сложно анализировать результат этих экспериментов на животных. В таких экспериментах удобно осуществлять функциональный анализ после прогнозирования воздействий указанной генной операции, используя способы по настоящему изобретению.
Попытки объединения информации, связанной с генами, в аспектах ГО последовательностей продолжаются вместе с продолжением анализа генома, и, кроме того, попытки позиционирования генов в геномной последовательности также продолжаются. Можно построить базу данных исходной генетической информации, рассматривающей взаимодействие с указанной выше базой данных биомолекулярных связей, и ее использование для указанной выше цели; принимая, однако, во внимание тот факт, что объем такой информации очень велик, и ее стараются сделать открытой для всеобщего пользования, очень возможно, что указанные выше способы могут быть осуществлены путем включения такой открытой для всеобщего пользования информации в способы согласно настоящему изобретению в будущем (фиг. 3).
Базы данных о биомолекулярных связях, используемые в способах по настоящему изобретению, не обязательно должны управляться и/или храниться на одном и том же сайте, и путем унификации ГО молекулы можно соответственно выбрать одну или несколько баз данных о биомолекулярных связях, управляемых и/или хранимых на различных сайтах, и использовать их путем объединения с помощью средств коммуникации и тому подобного. Понятно, что подобное размещение возможно не только для базы данных о биомолекулярных связях, но также и для базы данных информации о биологических мо
-16005460 лекулах, базы данных о связях молекул лекарственных средств, базы данных информации о молекулах лекарственных средств и базы данных информации о генах, используемых в способах по настоящему изобретению.
Еще в одном воплощении настоящего изобретения также предусматривается способ создания базы данных, содержащей информацию о биологических молекулах, непосредственно связанных с экспрессией биологических событий и с указанными биологическими событиями (база данных биологическое событие-биологическая молекула), и ее использование вместе с базами данных молекулярных сетей, которые необязательно содержат информацию о биологических событиях. Еще в одном воплощении, также предусматривается способ извлечения частичных сетей молекул, связанных с произвольными молекулами, из баз данных молекулярных сетей, которые не обязательно содержат информацию о биологических событиях, и поиска указанной выше базы данных «биологическое событие-биологическая молекула», на основе молекул, составляющих указанные сети.
В качестве еще одного воплощения настоящего изобретения, предусматривается способ поиска, на основе ключевого слова, и/или цифрового параметра, и/или молекулярной структуры, и/или аминокислотной последовательности, и/или последовательности оснований и тому подобного, среди элементов данных в базе данных информации о биологических молекулах, в базе данных о биомолекулярных связях, в базе данных информации о молекулах лекарственных средств, в базе данных связей молекул лекарственных средств, в базе данных «биологическая молекула-ген» и т.п., и генерирования молекулярнофункциональной сети на основе результата указанного поиска. Примеры генерирования молекулярнофункциональной сети на основе такого поиска описаны ниже, однако понятно, что объем настоящего изобретения не ограничивается этими примерами.
В каждой базе данных различная информация, такая как наименования молекул, 10 молекул, виды, органы происхождения и органы существования, хранится в виде текстов. Путем поиска в этих текстах на основе полного совпадения или частичного совпадения буквенных строк возможна фильтрация биологических молекул, пар биологических молекул, биологических событий, патологических событий, молекул лекарственных средств, пар молекула лекарственного средства-биологическая молекула, данных о соответствии ген-белок и тому подобное. На основе этой отфильтрованной информации можно определить одну или нескольких исходных точек и/или конечных точек связанного поиска или пределов пар молекул, используемых при связанном поиске, что позволяет генерировать молекулярнофункциональные сети в соответствии с их применением.
Когда химические структуры и/или стерические структуры молекул лекарственных средств хранятся в базе данных информации о молекулах лекарственных средств, осуществление поиска, основанного на полном совпадении структур или на совпадении субструктуры, или на сходстве структур, делает возможным фильтрацию молекул лекарственных средств. На основе просматриваемых молекул лекарственных средств можно генерировать молекулярно-функциональные сети, связанные с указанными молекулами лекарственных средств, и осуществлять поиск биологических событий и/или патологических событий, связанных с указанными молекулами лекарственных средств.
Когда цифровые параметры, например, для транскрипции гена и экспрессии белка хранятся в базе данных информации о биологических молекулах, осуществление поиска на основе этих цифровых параметров позволяет генерировать молекулярно-функциональные сети, соответствующие величинам транскрипции гена и/или экспрессии белка.
Когда аминокислотные последовательности белков хранятся в базе данных информации о биологических молекулах или в связанной с ней базе данных, осуществление поиска на основе гомологии последовательностей или совпадения частичной структуры последовательности с этими аминокислотными последовательностями делает возможным фильтрацию биологических молекул и генерирование молекулярно-функциональных сетей на основе указанных биологических молекул. Этот способ эффективен по отношению к белку с неизвестной функцией или частичной информацией о его последовательности для прогнозирования молекулярно-функциональных сетей, с которыми указанный белок, вполне возможно, имеет связи, и для дальнейшего прогнозирования функций указанного белка.
Когда последовательности оснований генов, соответствующие белкам, хранятся в базе данных информации о биологических молекулах, в базе данных биологическая молекула-ген или в связанной с ними базе данных, осуществление поиска на основе гомологии последовательностей или совпадения частичной структуры последовательности с этими последовательностями оснований делает возможным фильтрацию биологических молекул и генерирование молекулярно-функциональной сети на основе указанных биологических молекул. Этот способ эффективен по отношению к гену с неизвестной функцией или с частичной информацией о его последовательности для прогнозирования молекулярнофункциональных сетей, с которыми белок, транслированный из указанного гена, вполне возможно, имеет взаимосвязь, и для дальнейшего прогнозирования функций указанного белка.
В дополнительных вариантах осуществления настоящего изобретения предусматриваются компьютерная система, состоящая из программы и баз данных, для осуществления способов согласно настоящему изобретению; считываемый компьютером носитель записи, хранящий программы и базы данных, для осуществления способов согласно настоящему изобретению; считываемый компьютером носитель запи
-17005460 си, хранящий базы данных, которые должны использоваться с помощью способов согласно настоящему изобретению; считываемый компьютером носитель записи, хранящий информацию о молекулярнофункциональных сетях, генерируемым с помощью способов согласно настоящему изобретению.
Характеристики способов, соответствующих настоящему изобретению, являются следующими.
Путем аккумулирования информации о парах непосредственно связывающихся биологических молекул, имеющих информацию о биологических событиях, генерируется база данных взаимосвязей между молекулами в организме.
Путем связанного поиска в указанной выше базе данных, которая представляет собой коллекцию из частей, генерируется молекулярно-функциональная сеть, взаимосвязанная с одной или несколькими произвольными биологическими молекулами или биологическими событиями.
На основе молекулярно-функциональной сети прогнозируются биологические события, с которыми непосредственно связана одна или несколько произвольных молекул.
С помощью молекулярно-функциональной сети с информацией об одном или нескольких биологических событиях прогнозируются механизм заболевания, возможная мишень для лекарственного средства, риск побочного эффекта и тому подобное.
По количественным или качественным изменениям биологических молекул прогнозируются соотношения типа «больше-меньше» для одного или нескольких биологических событий.
Молекулярно-функциональная сеть, содержащая информацию об органах происхождения, органах существования и органах действия биологических молекул.
Прогнозирование побочных эффектов и взаимодействия между лекарственными средствами с использованием информации о молекуле лекарственного средства и молекулярно-функциональной сети.
Интерпретация изменений экспрессии белка при введении молекулы лекарственного средства из молекулярно-функциональной сети.
Анализ воздействий генного полиморфизма на молекулярно-функциональную сеть, гена, связанного с заболеванием, и тому подобное, путем связи с генетической информацией.
Примеры
Далее настоящее изобретение объясняется более подробно на примерах, не ограничивающих объем настоящего изобретения.
Пример 1.
Представлен пример генерирования молекулярно-функциональных сетей для ренинангиотензиновой системы. Ренин-ангиотензиновая система представляет собой один из главных механизмов установления давления крови в организме, и обнаружено множество связанных с ней биологических молекул (фиг. 4). Для биологических молекул, связанных с ренин-ангиотензиновой системой, известных в настоящее время, генерируются база данных информации о биологических молекулах (фиг. 5) и база данных о биомолекулярных связях (фиг. 6), и генерирование молекулярно-функциональных сетей пытаются осуществлять, задавая в качестве запросов биологические молекулы и биологические события.
Фиг. 7 показывает молекулярно-функциональную сеть, которая генерируется путем задания ангиотензина I, который представляет собой одну из биологических молекул, и увеличение давления крови, которое представляет собой одно из биологических событий, в виде запросов. Путем осуществления связанного поиска в базе данных о связях биологических молекул получают биологические молекулы, связанные с ангиотензином I через увеличение давления крови, и генерируемую молекулярнофункциональную сеть.
Далее, генерируются база данных информации о молекулах лекарственных средств (фиг. 8) и база данных связей молекул лекарственных средств (фиг. 9) для молекул лекарственных средств, имеющих гипотоническое действие, и осуществляют попытку генерирования молекулярно-функциональной сети, с которой связана молекула лекарственного средства, путем использования этих баз данных вместе с базой данных информации о биологических молекулах (фиг. 5) и базой данных о биомолекулярных связях (фиг. 6).
На фиг. 10, представлена молекулярно-функциональная сеть, генерируемая путем задания эналаприл, который представляет собой одну из молекул лекарственных средств, и увеличение давления крови, которое представляет собой одно из биологических событий, в качестве запросов. Поскольку эналаприл имеет взаимосвязь с ингибированием прямого связывания ангиотензин-преобразующего фермента, связь с ангиотензином II, имеющим взаимосвязь прямого связывания (взаимосвязь ферментсубстрат) с ангиотензин-преобразующим ферментом, разрывается, и показано, что событие увеличение давления крови, существующее в сети, получаемой как следствие, подавляется (прекращается).
Пример 2.
Представлен пример применения настоящего изобретения в качестве программы для поиска и визуального отображения молекулярно-функциональных сетей. Фиг. 11 показывает блок-схему поиска и визуального отображения настоящего примера, но эти процессы только показывают пример применения настоящего изобретения в виде программы, и понятно, что объем настоящего изобретения не ограничивается этим примером.
-18005460
Эта программа содержит стадии от 1101 до 1103, где осуществляется поиск для получения наименований молекул, наименований подсетей или наименований биологических событий, необходимых для осуществления связанного поиска, стадии от 1104 до 1108, где осуществляется связанный поиск и визуально отображается молекулярно-функциональная сеть, и дополнительные стадии от 1109 до 1110, где генерированная молекулярно-функциональная сеть обрабатывается дополнительно.
Сначала пользователь на стадии 1101 указывает способ поиска относительно наименования молекул, ГО молекулы, наименования подсети, наименования биологического события, наименования патологического события, наименования заболевания, аминокислотной последовательности, последовательности нуклеиновых кислот, ГО внешней базы данных, структуры молекулы лекарственного средства и т.п. и вводит строку символов запроса. Относительно способа поиска пользователь может выбирать между способом осуществления поиска индивидуально по отношению к указанным выше элементам, способом осуществления поиска с помощью общей строки символов запроса относительно множества элементов и т.п. Строка символов запроса не обязательно является строкой, точно совпадающей с элементом данных в базе данных, но приемлемой является и строка, представляющая некоторую часть наименования, или строка, содержащая так называемые символы-заменители. Когда в качестве элемента запроса аминокислотная последовательность белка или последовательность нуклеиновых кислот, пользователь вводит строку символов, представляющую аминокислотную последовательность или последовательность оснований, с помощью 1-буквенного кода (например: аланин=А, глицин=С. гуанин=д, цитозин=с и тому подобное) в виде строки символов запроса. Когда в качестве элемента запроса обозначается структура молекулы лекарственного средства, пользователь вводит данные, представляющие запрос о молекулярной структуре в формате МОЬНЬЕ и тому подобное.
По отношению к элементам поиска, которые вводит пользователь, программа осуществляет поиск на стадии 1102 относительно элементов данных из базы данных информации о биологических молекулах, базы данных о биомолекулярных связях и связанных с ними баз данных с помощью способов поиска по ключевым словам, поиска молекулярной структуры, поиска последовательности и тому подобное. При поиске по ключевым словам могут быть приемлемыми не только полные совпадения строки символов, но и частичное совпадение строки символов, или совпадение множества строк символов по шаблонам. Когда аминокислотная последовательность или последовательность оснований обозначается как элемент запроса на стадии 1101, программа осуществляет поиск на идентичность или гомологию строки символов запроса (последовательности) с аминокислотными последовательностями или последовательностями оснований в базе данных информации о биологических молекулах или связанных с ними базах данных о последовательностях и выдает в ответ как результат поиска ГО или наименования соответствующих молекул из последовательностей с высокими степенями идентичности или гомологии. Когда в качестве элемента запроса обозначается структура молекулы лекарственного средства, программа осуществляет поиск молекул лекарственных средств, у которых частичные структуры являются идентичными или подобными, с помощью способа сравнения субструктуры и выдает в качестве результата поиска соответствующие наименования молекул лекарственных средств.
Релевантные элементы, полученные в результате поиска на стадии 1102, визуально отображаются в виде списка на стадии 1103. Программа визуально отображает релевантные элементы в списке по отдельности независимо от того, являются ли они наименованиями молекул, наименованиями подсетей или наименованиями биологических событий, разделяя их положения в списке или добавляя иконки.
Затем, пользователь указывает способ связанного поиска и наименования молекул, наименования подсетей или наименования биологических событий (включая патологические события), которые будут конечными пунктами на стадии 1104. В этом примере способ поиска сети, связанной вокруг одной указанной точки, и способ поиска сети, соединяющей две указанные точки, предусматриваются в качестве способов связанного поиска. Входные элементы, необходимые для этих двух видов способов поиска, представлены на фиг. 12 и 13, соответственно. Пользователь вводит одно или несколько наименований молекул, наименований подсетей или наименований биологических событий путем выбора соответствующих элементов из списка, отображаемого на стадии 1103. Если в указанном списке нет соответствующего элемента, пользователь может вернуться к вводу элементов запроса на стадии 1101 и может повторить процесс поиска от стадии 1101 до стадии 1103, пока не будет найден соответствующий элемент.
На стадии 1105 пользователь вводит одно или несколько ограничивающих условий для связанного поиска. В качестве ограничивающих условий пользователь может обозначить верхний предел количества молекул, включенных в молекулярно-функциональную сеть, которая должна генерироваться, верхний предел количества связей (количество путей), которые связывают две указанные точки, когда осуществляется поиск между двумя точками, и тому подобное. На стадии 1106 пользователь указывает способ визуального отображения молекулярно-функциональной сети, получаемой в результате поиска. В качестве способа визуального отображения пользователь может выбирать между способом визуального отображения всех молекул, составляющих сеть полностью (отображение сети молекул), способом визуального отображения молекул, принадлежащих к подсети, пересекающихся в одной точке пересечения (отображение подсети), и т. п.
-19005460
В соответствии с условиями, указанными от стадии 1104 до стадии 1105, программа на стадии 1107 осуществляет связанный поиск в базе данных биомолекулярных связей. Молекулярно-функциональная сеть, полученная в результате поиска, визуально отображается в виде графа, содержащего молекулы, подсети или биологические события, в виде точек пересечения на стадии 1108 в соответствии со способом визуального отображения, указанным пользователем на стадии 1106.
Пользователь визуально проверяет молекулярно-функциональную сеть, визуально отображенную на стадии 1108, и может вернуться назад к стадии 1104 для изменения условий связанного поиска и повторения поисков, если это необходимо, и может вернуться назад к стадии 1101 для повторения поиска наименований молекул, наименований подсетей или наименований биологических событий.
Кроме того, генерируемая молекулярно-функциональная сеть может дополнительно обрабатываться в этой программе с помощью дополнительной стадии 1109 или 1110. На стадии 1109 пользователь может осуществлять логические операции между множеством сетей «молекула-функция». Для осуществления стадии 1109 необходимо генерировать множество молекулярно-функциональных сетей путем многократного осуществления процессов до стадии 1108. Для этого множества молекулярнофункциональных сетей программа может получить общую часть (операция ΆΝΏ) или несовпадающие части (операция ΧΟΚ) сетей и может получить логическую сумму (операция ΟΚ) множества сетей. Эта функция является полезной для исследования различий молекулярно-функциональных сетей для различных видов, органов и т.п.
На стадии 1110 пользователь может дополнительно осуществлять фильтрующий поиск генерируемой молекулярно-функциональной сети и может выделять или извлекать молекулы или частичные сети из указанной молекулярно-функциональной сети. В этом фильтрующем поиске может быть использован любой способ поиска, используемый на стадиях 1101-1103. С помощью стадии 1110 можно, например, выделять биологические молекулы, экспрессируемые в конкретном органе, в молекулярнофункциональной сети, извлекать и визуально отображать только те части, которые принадлежат к указанным подсетям в широкой молекулярно-функциональной сети.
Промышленное применение
База данных о биомолекулярных связях, соответствующая настоящему изобретению, представляющая собой массив данных о парах биологических молекул, включая биологические события, пригодна для генерирования молекулярно-функциональной сети в необходимых пределах, которая представляет собой функциональную или биосинтетическую связь между молекулами, и для прогнозирования биологических событий, с которыми произвольная биологическая молекула связана прямо или косвенно, и, кроме того, путем связывания их с информацией о молекулах лекарственных средств или с генетической информацией возможно получение необходимых знаний для разработки лекарственных средств и медицинских способов лечения с учетом различий индивидуумов.

Claims (21)

1. Способ генерирования молекулярно-функциональной сети, содержащей биологическое событие (события), путем осуществления связанного поиска с использованием базы данных о биомолекулярных связях, содержащей информацию о биологическом событии (событиях).
2. Способ генерирования молекулярно-функциональной сети, содержащей биологическое событие (события), путем осуществления связанного поиска с использованием базы данных о биомолекулярных связях, содержащей информацию о биологическом событии (событиях), и прогнозирования пути между произвольной биологической молекулой и произвольным биологическим событием в упомянутой сети.
3. Способ генерирования молекулярно-функциональной сети, содержащей биологическое событие (события), путем осуществления связанного поиска с использованием базы данных о биомолекулярных связях, содержащей информацию о биологическом событии (событиях), и прогнозирования биологического события (событий), с которым связана произвольная биологическая молекула в упомянутой сети.
4. Способ генерирования молекулярно-функциональной сети путем связанного поиска с использованием базы данных о связях биологических молекул, где информация о паре биологических молекул хранится иерархически.
5. Способ по любому из пп.1-3, отличающийся тем, что информация о паре биологических молекул хранится иерархически.
6. Способ по любому из пп.1-5, отличающийся тем, что используют базы данных, где информация о биологической молекуле и/или биологическом событии (событиях) хранится иерархически.
7. Способ по любому из пп.1-6, отличающийся тем, что осуществляют один, или два, или более из видов поиска по ключевому слову, поиска молекулярной структуры или поиска гомологии к последовательности среди элементов в базе данных.
8. Способ по любому из пп.1-6, отличающийся тем, что осуществляют фильтрацию данных, используемую при связанном поиске, путем осуществления одного, или двух, или более из видов поиска по ключевому слову, поиска молекулярной структуры или поиска гомологии к последовательности среди элементов в базе данных и генерированием ограниченной молекулярно-функциональной сети.
-20005460
9. Способ по любому из пп.1-6, отличающийся тем, что дополнительно осуществляется один, или два, или более из видов поиска по ключевому слову, поиска молекулярной структуры или поиска гомологии к последовательности в генерируемой молекулярно-функциональной сети для генерирования частичной сети от указанной сети.
10. Способ по любому из пп.1-6, отличающийся тем, что информация о биологическом событии (событиях) включает в себя информацию о повышении или уменьшении, соответствующую количественному или качественному изменению ключевой молекулы.
11. Способ по любому из пп.1-6, отличающийся тем, что информация о биологическом событии (событиях) включает в себя один или более видов информации, включая наименование заболевания, болезненное состояние, диагностический критерий и терапевтический агент.
12. Способ по любому из пп.1-6, отличающийся тем, что дополнительно используют информацию о молекуле лекарственного средства, где мишенью указанной молекулы лекарственного средства является конкретная биологическая молекула.
13. Способ по любому из пп.1-6, отличающийся тем, что дополнительно используют информацию о соответствии между биологической молекулой и геном.
14. Способ по любому из пп.1-6, отличающийся тем, что дополнительно используют информацию об экспрессии белка и/или об экспрессии гена в каждом органе.
15. Способ по любому из пп.1-6, отличающийся тем, что биологическая молекула связана с информацией о гене, вовлеченном в генный полиморфизм.
16. Способ по любому из пп.1-6, отличающийся тем, что дополнительно используют информацию о гене или о белке, экспрессия которого регулируется с помощью конкретной ключевой молекулы.
17. Способ прогнозирования побочного эффекта молекулы лекарственного средства, характеризуемый использованием способа по п.12.
18. Способ прогнозирования мишени для лекарственного средства, характеризуемый использованием способа по любому из пп.1-16.
19. Способ прогнозирования риска побочного эффекта, когда конкретная биологическая молекула выбирается в качестве мишени для лекарственного средства, характеризуемый использованием способа по любому из пп.1-16.
20. Компьютерная система, содержащая программу и базу данных, для осуществления способа по любому из пп.1-19.
21. Считываемый компьютером носитель записи, хранящий программу и/или базу данных для осуществления способа по любому из пп.1-19.
Фиг. 1
-21005460
Фиг. 2
Фиг. 3
Фиг. 4
-22005460
Наименование молекулы Символ Код молекулы Код функции Зитзз РгоТ Код Орган происхождения Орган существования Ренин НЕЙ Белок Фермент ΚΕΝΙ_ΗϋΜΑΝ Почки (юкстагломерулярная клетка} В крови Ангиотенэинпреобразующий фермент АСЕ Белок Фермент АСЕ_НиМАЙ Сосудистый эндотелий Сосудистый эндотелий, в крови Ангиотензинава ркср Белок Фермент рср нимАй (Лизосома) (Лизосома) Химаза СМА1 Белок Фермент мст1_нимАй, Мастоцит, сердце В крови Ангиопептидаэа АРА Белок Фермент АМРЕ НиМАЫ Почки и т.п. Почки и т.п. Ангиотензиноген АЙСТ30 Пептид Предшественник АЙСТ НиМАИ Печень В крови Ангиотензин I АЙСТ31 Пептид Предшественник - В крови В крови Ангиотензин II АМСТ32 Пептид АКТИВНЫЙ пептид В крови В крови Ангиотензин III АЙСТЗЗ Пептид Активный пептид * В крови В крови Ангиотензин II метаболит АЫСТХ2 Пептид Метаболит В крови Ангиотензин III метаболит АГКЭТХЗ Пептид Метаболит В крови Ангиотензин рецептор I АСТР1 ' Белок Мембранный рецептор АС2Н ΗϋΜΑΝ Кровеносный сосуд, Надпочечник Кровеносный сосуд, Надпочечник Ангиотензин рецептор II А6ТН2 ' Белок Мембранный рецептор АС22_НЦМАЙ Мозг, Надпочечник Мозг, Надпочечник
EA200300362A 2000-09-12 2001-09-10 Способ генерирования молекулярно-функциональной сети EA005460B1 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000276699 2000-09-12
PCT/JP2001/007830 WO2002023395A1 (fr) 2000-09-12 2001-09-10 Procede de formation d'un reseau a fonction moleculaire

Publications (2)

Publication Number Publication Date
EA200300362A1 EA200300362A1 (ru) 2003-08-28
EA005460B1 true EA005460B1 (ru) 2005-02-24

Family

ID=18762122

Family Applications (1)

Application Number Title Priority Date Filing Date
EA200300362A EA005460B1 (ru) 2000-09-12 2001-09-10 Способ генерирования молекулярно-функциональной сети

Country Status (10)

Country Link
US (3) US20040024772A1 (ru)
EP (1) EP1326177A4 (ru)
JP (1) JPWO2002023395A1 (ru)
KR (1) KR20030045067A (ru)
CN (2) CN1479900A (ru)
AU (1) AU2001286190A1 (ru)
CA (1) CA2422021A1 (ru)
EA (1) EA005460B1 (ru)
TW (1) TWI334089B (ru)
WO (1) WO2002023395A1 (ru)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1479900A (zh) * 2000-09-12 2004-03-03 ��ʽ����ҽҩ��������о��� 分子功能网络的生成方法
CA2431655A1 (en) * 2000-11-15 2002-05-23 Akiko Itai Method of profiling protein
CN1653454B (zh) * 2002-03-11 2010-05-05 株式会社医药分子设计研究所 分子功能网络的生成方法
WO2004088564A1 (ja) * 2003-03-31 2004-10-14 Institute Of Medicinal Molecular Design. Inc. 分子機能ネットワークの表示方法
JPWO2004088564A1 (ja) * 2003-03-31 2006-07-06 株式会社医薬分子設計研究所 分子機能ネットワークの表示方法
US20050042663A1 (en) * 2003-08-19 2005-02-24 Blinov Michael L. Rule-based modeling of biochemical networks
US20050114527A1 (en) * 2003-10-08 2005-05-26 Hankey Michael R. System and method for personal communication over a global computer network
US20050117544A1 (en) * 2003-12-02 2005-06-02 Agere Systems, Incorporated System and method for evaluating candidate networks for mobile communication device data throughput
JP2005352878A (ja) * 2004-06-11 2005-12-22 Hitachi Ltd 文書検索システム、検索サーバ、及び検索クライアント
US20080281864A1 (en) * 2004-09-29 2008-11-13 Institute Of Medicinal Molecular Design. Inc. Method of Displaying Molecule Function Network
WO2007016703A2 (en) * 2005-08-01 2007-02-08 Mount Sinai School Of Medicine Of New York University Methods to analyze biological networks
US20070212719A1 (en) * 2006-03-10 2007-09-13 Los Alamos National Security Graphical rule based modeling of biochemical networks
JP5028847B2 (ja) * 2006-04-21 2012-09-19 富士通株式会社 遺伝子間相互作用ネットワーク分析支援プログラム、該プログラムを記録した記録媒体、遺伝子間相互作用ネットワーク分析支援方法、および、遺伝子間相互作用ネットワーク分析支援装置
JP4895689B2 (ja) * 2006-05-30 2012-03-14 株式会社理論創薬研究所 大規模化学構造データベースから高速に化学構造を検索するシステム及び方法
US7853626B2 (en) 2006-09-29 2010-12-14 The Invention Science Fund I, Llc Computational systems for biomedical data
US10503872B2 (en) * 2006-09-29 2019-12-10 Gearbox Llc Computational systems for biomedical data
US20080082359A1 (en) * 2006-09-29 2008-04-03 Searete Llc, A Limited Liability Corporation Of State Of Delaware Computational systems for biomedical data
US10095836B2 (en) * 2006-09-29 2018-10-09 Gearbox Llc Computational systems for biomedical data
US20080082584A1 (en) * 2006-09-29 2008-04-03 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US10068303B2 (en) 2006-09-29 2018-09-04 Gearbox Llc Computational systems for biomedical data
US10546652B2 (en) 2006-09-29 2020-01-28 Gearbox Llc Computational systems for biomedical data
US20080109484A1 (en) * 2006-09-29 2008-05-08 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US20080091730A1 (en) * 2006-09-29 2008-04-17 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US8122073B2 (en) * 2006-09-29 2012-02-21 The Invention Science Fund I Computational systems for biomedical data
WO2016118513A1 (en) * 2015-01-20 2016-07-28 The Broad Institute, Inc. Method and system for analyzing biological networks
EP3642748A4 (en) * 2017-06-19 2021-03-10 Jungla LLC INTERPRETATION OF GENETIC AND GENOMIC VARIANTS VIA AN INTEGRATED COMPUTING AND EXPERIMENTAL FRAMEWORK FOR DEEP MUTATION LEARNING
CN109493925B (zh) * 2018-11-20 2020-09-15 北京晶派科技有限公司 一种确定药物和药物靶点关联关系的方法
CN114121166B (zh) * 2021-11-19 2024-04-19 北京交通大学 一种基于复杂网络的感认知行为与分子网络机制关联方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188768A (ja) * 1999-12-28 2001-07-10 Japan Science & Technology Corp ネットワーク推定方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US24772A (en) * 1859-07-12 Improvement in attaching the heads of metallic powder-kegs
US72865A (en) * 1867-12-31 Improvement in oar-loses
US4706A (en) * 1846-08-22 Improvement in icardlng-engines
US5911138A (en) * 1993-06-04 1999-06-08 International Business Machines Corporation Database search facility having improved user interface
EP0642270A1 (en) * 1993-09-01 1995-03-08 Siemens Rolm Communications Inc. (a Delaware corp.) Method and apparatus for instantaneous in-band document exchange during a video conference
US5787279A (en) * 1995-12-22 1998-07-28 International Business Machines Corporation System and method for conformationally-flexible molecular recognition
US5764644A (en) * 1996-01-02 1998-06-09 Lucent Technologies Inc. Method and apparatus for transport of communication signals over a public network
US5991765A (en) * 1997-05-06 1999-11-23 Birdstep Technology As System and method for storing and manipulating data in an information handling system
US5965352A (en) * 1998-05-08 1999-10-12 Rosetta Inpharmatics, Inc. Methods for identifying pathways of drug action
US6132969A (en) * 1998-06-19 2000-10-17 Rosetta Inpharmatics, Inc. Methods for testing biological network models
US6218122B1 (en) * 1998-06-19 2001-04-17 Rosetta Inpharmatics, Inc. Methods of monitoring disease states and therapies using gene expression profiles
US6146830A (en) * 1998-09-23 2000-11-14 Rosetta Inpharmatics, Inc. Method for determining the presence of a number of primary targets of a drug
US6203987B1 (en) * 1998-10-27 2001-03-20 Rosetta Inpharmatics, Inc. Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns
US6222093B1 (en) * 1998-12-28 2001-04-24 Rosetta Inpharmatics, Inc. Methods for determining therapeutic index from gene expression profiles
AU2529500A (en) * 1999-02-12 2000-08-29 Mount Sinai Hospital Corporation System for electronically managing, finding, and/or displaying biomolecular interactions
US6745204B1 (en) * 1999-02-12 2004-06-01 Mount Sinai Hospital System for electronically managing, finding, and/or displaying biomolecular interactions
CA2363020A1 (en) * 1999-02-19 2000-08-24 Jian Wang Method and system for dynamic storage retrieval and analysis of experimental data with determined relationships
AU6611900A (en) * 1999-07-30 2001-03-13 Agy Therapeutics, Inc. Techniques for facilitating identification of candidate genes
CN1479900A (zh) * 2000-09-12 2004-03-03 ��ʽ����ҽҩ��������о��� 分子功能网络的生成方法
CN1653454B (zh) * 2002-03-11 2010-05-05 株式会社医药分子设计研究所 分子功能网络的生成方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188768A (ja) * 1999-12-28 2001-07-10 Japan Science & Technology Corp ネットワーク推定方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
GOTO, S. et al. "Organizing and Computing metabolic pathway data in terms of binary relations", Pacific Symposium on Biocomputing, (2nd), Maui, (1996), pages 175 to 186, especially, page 179 *
HIRAYAMA "Bunshi Sekkei no tameno Chishiki Data System no Koujika-hou no Kaihatsu; Lead Kagoubutsu Hakken no tameno Keiken-soku no Riron-ka ni kansuru Kenkyuu", Seitai Seigyo Busshitsu no Bunshi Sekkei to Seimitsu Gousei no tameno Kiban Gijutsu no Kaihatsu ni kansuru Kenkyuu (1<ST> period) Seika Houkokusho, Heisei 5-7 nendo (1993-1995) ed., (1996), pages 210 to 221 *
KANEHISA, M. "Pathway Database and Logical Simulation of Genes and Molecules", Genome Science: Hito Genome Kaiseki ni motozuku Bio-Science no Shin-Tenkai, Heisei 8 nendo (1996), 08283101, March, 1997, pages 218 to 221 *
KANEHISA, M. "Pathway Databases and Higher Order Function", Advances in Protein Chemistry, 06 June, 2000, (received at JICST), Vol. 51, pages 381 to 408 *
NAKAI "Genome Kinou Kenkyuu Protocol Micro Array, PCR, Bio-informatics no Saishin Gijutsu kara SNP, Model Seibutsu no Kaiseki made; Chapter 3, Hito Genome Bio-informatics; 1. Genome Informatics", Jikken Igaku separate volume, Post Genome Jidai no Jikken Kouza 1, 10 April, 2000, pages 163 to 167 *
OKUBO et al. "Rensai Genome Data Base Keisan-ki ni Kakunou sareta Seimei no Sugata; Dai 6kai, Hatsugen Joho Database to Clustering; Idenshi no Furumai no Hyougen to sore ni motozuku Idenshi no Bunrui", bit, 01 December, 1999, Vol. 399, pages 80 to 86 *
SHIBAGAKI, Y. et al. "A graphical representation system assisting at gene regulatory network construction", Proceedings of the 14<TH> Annual Conference of JSAI, (2000), 03 July, 2000, pages 543 to 544 *

Also Published As

Publication number Publication date
US20110196858A1 (en) 2011-08-11
EP1326177A1 (en) 2003-07-09
CN1479900A (zh) 2004-03-03
JPWO2002023395A1 (ja) 2004-01-22
EP1326177A4 (en) 2005-09-14
CN101382971A (zh) 2009-03-11
TWI334089B (ru) 2010-12-01
KR20030045067A (ko) 2003-06-09
EA200300362A1 (ru) 2003-08-28
AU2001286190A1 (en) 2002-03-26
US20080059513A1 (en) 2008-03-06
US20040024772A1 (en) 2004-02-05
WO2002023395A1 (fr) 2002-03-21
CA2422021A1 (en) 2003-03-11

Similar Documents

Publication Publication Date Title
EA005460B1 (ru) Способ генерирования молекулярно-функциональной сети
Bemis et al. Properties of known drugs. 2. Side chains
Schuffenhauer et al. An ontology for pharmaceutical ligands and its application for in silico screening and library design
Doncheva et al. Cytoscape stringApp 2.0: analysis and visualization of heterogeneous biological networks
Klipp et al. Biochemical network-based drug-target prediction
JP2012027939A (ja) 分子機能ネットワークの生成方法
Bajikar et al. Multiscale models of cell signaling
Rodriguez-Bussey et al. Decoding allosteric communication pathways in cyclophilin a with a comparative analysis of perturbed conformational ensembles
Gunalan et al. Understanding the dual mechanism of bioactive peptides targeting the enzymes involved in Renin Angiotensin System (RAS): An in-silico approach
Shi et al. Bioinformatics toolbox for exploring protein phosphorylation network
US8082109B2 (en) Computer-aided discovery of biomarker profiles in complex biological systems
Lengauer Bioinformatics—From genomes to therapies
Amaravadhi et al. Revisiting de novo drug design: receptor based pharmacophore screening
CA2700558A1 (en) Software assisted methods for probing the biochemical basis of biological states
KR19990067566A (ko) 생리활성화합물의 설계방법
Fauman et al. Structural bioinformatics in drug discovery
EP1008572A1 (en) Method for inferring protein functions with the use of ligand data base
Pan et al. Using endophenotypes for pathway clusters to map complex disease genes
JP4305878B2 (ja) 医薬分子の副作用の推定方法及び創薬ターゲットの推定方法
Gura Reaping the plant gene harvest
JP2005509933A (ja) 細胞成分の生物活性を予測するための方法
Freeman et al. 2 Computational approaches to drug target identification
National Research Council et al. Health and medicine: challenges for the chemical sciences in the 21st century
Abbott Pharmaceutical futures: A fiendish puzzle.
Oliveira et al. On the requirements of biomedical information tools for health applications: the INFOGENMED case study

Legal Events

Date Code Title Description
MM4A Lapse of a eurasian patent due to non-payment of renewal fees within the time limit in the following designated state(s)

Designated state(s): AM AZ BY KZ KG MD TJ TM

MM4A Lapse of a eurasian patent due to non-payment of renewal fees within the time limit in the following designated state(s)

Designated state(s): RU