KR101881398B1 - 생물학적 시스템 정보 처리 장치 및 방법 - Google Patents

생물학적 시스템 정보 처리 장치 및 방법 Download PDF

Info

Publication number
KR101881398B1
KR101881398B1 KR1020160043057A KR20160043057A KR101881398B1 KR 101881398 B1 KR101881398 B1 KR 101881398B1 KR 1020160043057 A KR1020160043057 A KR 1020160043057A KR 20160043057 A KR20160043057 A KR 20160043057A KR 101881398 B1 KR101881398 B1 KR 101881398B1
Authority
KR
South Korea
Prior art keywords
biological
information
phenomenon
ecological
index
Prior art date
Application number
KR1020160043057A
Other languages
English (en)
Other versions
KR20170115406A (ko
Inventor
김선중
이지현
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020160043057A priority Critical patent/KR101881398B1/ko
Publication of KR20170115406A publication Critical patent/KR20170115406A/ko
Application granted granted Critical
Publication of KR101881398B1 publication Critical patent/KR101881398B1/ko

Links

Images

Classifications

    • G06F19/28
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • G06F17/30613
    • G06F17/30684
    • G06F17/30734

Abstract

컴퓨터 기반의 생물학적 시스템 정보 처리 장치 및 방법이 제공된다. 여기서, 장치는 컴퓨터 기반의 생물학적 시스템 정보 처리 장치로서, 자연어로 이루어진 생물학적 문서를 수집하는 수집부, 상기 생물학적 문서를 파싱하는 구문 분석부, 그리고 상기 파싱된 생물학적 문서로부터 생물학적 시스템을 나타내는 색인 어휘를 추출하고, 상기 색인 어휘들을 온톨로지 구조화하여 저장하는 색인 처리부를 포함하고,
상기 생물학적 시스템은, 생물체가 가진 특징, 형태, 사회적 기능, 생물체 내부의 조직이 가지는 내부적 프로세스 및 기능 중에서 적어도 하나를 포함한다.

Description

생물학적 시스템 정보 처리 장치 및 방법{APPARATUS AND METHOD FOR PROCESSING BIOLOGICAL SYSTEM INFORMATION}
본 발명은 생물학적 시스템 정보 처리 장치 및 방법에 관한 것이다.
최근 생물학 분야에서 폭발적으로 증가하는 문헌으로부터 공학자(설계자)가 원하는 생물학적 지식을 빠르고 정확하게 추출하거나 검색할 수 있기 위한 방안이 요구되고 있다.
그런데, 종래에 검색 알고리즘은 설계자의 인지적 탐색(cognitive search) 과정을 지원하기에 아직 부족한 면이 많은 실정이다.
종래에 인터넷을 통한 생물 정보 검색 서비스를 구현하고, 유전자서열 등 생물체에 관한 통합적 정보를 제공하는 기술이 개시되어 있다. 그러나 이 기술은 생물체의 생물학적 관계만을 담고 있고, 물리적 관계는 제외되어 있다.
또한, 생물학적 개체명을 이용해 생물학적 문서로부터 생물학적 개체명들의 관계를 추출하는 기술이 개시되어 있다. 그러나 이 기술 역시 생물체의 생물학적 관계만을 담고 있고, 물리적 관계는 제외되어 있다.
이처럼, 기존의 기술은 소수의 생물학적 시스템들을 대상으로 매우 제한적인 검색 환경만을 제공한다는 한계가 있다.
본 발명이 이루고자 하는 기술적 과제는 물리적 관계, 생태적 관계 및 생물학적 관계로 구성된 생물학적 시스템을 종합적 인과 모형으로 구현하고 온톨로지로 구축한 생물학적 시스템 정보 처리 장치 및 방법을 제공하는 것이다.
본 발명의 하나의 특징컴퓨터 기반의 생물학적 시스템 정보 처리 장치로서, 자연어로 이루어진 생물학적 문서를 수집하는 수집부, 상기 생물학적 문서를 파싱하는 구문 분석부, 그리고 상기 파싱된 생물학적 문서로부터 생물학적 시스템을 나타내는 색인 어휘를 추출하고, 상기 색인 어휘들을 온톨로지 구조화하여 저장하는 색인 처리부를 포함하고, 상기 생물학적 시스템은, 생물체가 가진 특징, 형태, 사회적 기능, 생물체 내부의 조직이 가지는 내부적 프로세스 및 기능 중에서 적어도 하나를 포함한다.
상기 생물학적 시스템은,
하나의 생물체에 대한 메커니즘(mechanism) 및 상기 메커니즘을 통해 발현되는 기능을 인과 관계로 표현한 물리적 관계, 생태학적 현상 및 생태학적 효과를 나타내는 생태적 관계, 그리고 생물학적 현상과 연관된 생물체, 생물체의 조직 및 기관 간의 관계를 나타내는 생물학적 관계를 포함하고,
상기 색인 처리부는, 생물학적 현상과 관련된 어휘들이 기능, 물질, 에너지, 신호 및 학명을 포함하는 카테고리로 분류화하여 저장된 색인 어휘 사전을 이용하여 상기 생물학적 시스템을 나타내는 색인 어휘를 추출하고, 추출한 색인 어휘를 상기 물리적 관계, 상기 생태적 관계 및 상기 생물학적 관계 별로 구분하여 색인할 수 있다.
상기 색인 처리부는,
상기 색인 어휘들을 생물학적 현상의 상 변화 정보, 상기 생물학적 현상의 물리적 현상 정보 및 상기 생물학적 현상의 물리적 효과 정보로 분류하여 색인 처리하고,
상기 상 변화 정보는,
임의의 생물학적 현상의 초기 조건과 최종 조건에 발생한 물리적 변화를 표현하며,
상기 초기 조건과 상기 최종 조건은 물질, 에너지 및 신호 각각의 증가 또는 감소를 나타내는 정보가 색인되며,
상기 물리적 현상 정보는,
온톨로지의 오브젝트 노드 및 술어 노드를 포함하고, 상기 오브젝트 노드는 상기 물리적 현상을 일으키는 물질, 에너지 및 신호 중에서 선택된 하나의 정보가 색인되고, 상기 술어 노드는 생물학적 현상을 나타내는 기능 어휘가 색인되며, 생물학적 현상과 관련된 이론 또는 주제를 나타내는 어휘가 색인될 수 있다.
상기 색인 처리부는,
상기 색인 어휘들을 생물학적 현상의 기능적 특징을 의미하는 생태학적 현상 정보 및 생태학적 효과 정보로 분류하여 색인하고,
상기 생태학적 현상 정보는,
온톨로지의 오브젝트 노드 및 술어 노드를 포함하며,
상기 오브젝트 노드에는 상기 생태학적 현상을 일으키는 물질, 에너지 및 신호 중에서 선택된 하나의 정보가 색인되고, 상기 술어 노드에는 생태학적 기능을 나타내는 어휘가 색인되며,
상기 생태학적 효과 정보는,
상기 생물학적 현상을 유발하는 생태학적 행동 또는 관련된 이론을 표현하는 어휘가 색인될 수 있다.
상기 색인 처리부는,
상기 색인 어휘들을 기관, 조직 및 엔티티로 구성된 생물학적 관계 정보로 분류하여 색인하고,
상기 생물학적 관계 정보는,
생물학적 현상이 생물체의 조직 및 기관과 연관되어 있는지를 나타내는 정보이며,
상기 엔티티는 상기 조직 및 기관의 소유자인 생물체를 나타내는 어휘가 색인되고,
상기 조직 및 기관은 상기 생물학적 현상을 야기하는 생물체의 조직 및 기관을 각각 나타내는 어휘가 색인될 수 있다.
상기 색인 처리부는,
상기 기관, 조직 및 엔티티를 국제 분류 정보 시스템(International Taxonomic Information System, ITIS)의 체계에 따른 학명으로 색인할 수 있다.
상기 수집부는,
전문가에 의해 정리된 자연어 기반의 텍스트로 구성된 생물학적 문서를 웹 상에서 수집할 수 있다.
생물학적 시스템 쿼리가 입력되면, 물리적 관계에 해당하는 어휘 검색, 생태적 관계에 해당하는 어휘 검색 및 생물학적 관계에 해당하는 어휘 검색을 수행하고, 각각 검색된 어휘들간의 단어 유사성 평가값을 합산하여 가장 유사도가 높은 생물학적 시스템을 출력하는 유사성 평가부를 더 포함할 수 있다.
본 발명의 다른 특징에 따르면, 컴퓨터 기반의 생물학적 시스템 정보 처리 방법으로서, 자연어로 이루어진 생물학적 문서를 수집하여 상기 생물학적 문서를 파싱하는 단계, 상기 파싱된 생물학적 문서로부터 생물학적 시스템을 나타내는 색인 어휘를 추출하는 단계, 그리고 상기 색인 어휘들을 온톨로지 구조화하여 저장하는 단계를 포함하고,
상기 생물학적 시스템은, 생물체가 가진 특징, 형태, 사회적 기능, 생물체 내부의 조직이 가지는 내부적 프로세스 및 기능 중에서 적어도 하나를 포함한다.
상기 추출하는 단계는,
생물학적 현상과 관련된 어휘들이 기능, 물질, 에너지 및 신호를 포함하는 카테고리로 분류화하여 저장된 색인 어휘 사전을 이용하여 상기 생물학적 시스템을 나타내는 색인 어휘를 추출하고,
상기 저장하는 단계는,
추출한 색인 어휘들을 하나의 생물체에 대한 메커니즘(mechanism) 및 상기 메커니즘을 통해 발현되는 기능을 인과 관계로 표현한 물리적 관계 정보, 생태학적 현상 및 생태학적 효과를 나타내는 생태적 관계 정보, 및 생물학적 현상과 연관된 생물체, 생물체의 조직 및 기관 간의 관계를 나타내는 생물학적 관계 정보로 분류하여 색인하는 단계, 그리고 색인 데이터를 저장하는 단계를 포함할 수 있다.
상기 색인하는 단계는,
상기 추출한 색인 어휘들을 생물학적 현상의 상 변화 정보, 상기 생물학적 현상의 물리적 현상 정보 및 상기 생물학적 현상의 물리적 효과 정보로 분류하여 색인 처리하고,
상기 상 변화 정보는,
임의의 생물학적 현상의 초기 조건과 최종 조건에 발생한 물리적 변화를 표현하며, 상기 초기 조건과 상기 최종 조건은 물질, 에너지 및 신호 각각의 증가 또는 감소를 나타내는 정보가 색인되며,
상기 물리적 현상 정보는,
온톨로지의 오브젝트 노드 및 술어 노드를 포함하고,
상기 오브젝트 노드는 상기 물리적 현상을 일으키는 물질, 에너지 및 신호 중에서 선택된 하나의 정보가 색인되고, 상기 술어 노드는 생물학적 현상을 나타내는 기능 어휘가 색인되며,
상기 물리적 효과 정보는,
생물학적 현상과 관련된 이론 또는 주제를 나타내는 어휘가 색인될 수 있다.
상기 색인하는 단계는,
상기 색인 어휘들을 생물학적 현상의 기능적 특징을 의미하는 생태학적 현상 정보 및 생태학적 효과 정보로 분류하여 색인하고,
상기 생태학적 현상 정보는,
온톨로지의 오브젝트 노드 및 술어 노드를 포함하며,
상기 오브젝트 노드에는 상기 생태학적 현상을 일으키는 물질, 에너지 및 신호 중에서 선택된 하나의 정보가 색인되고, 상기 술어 노드에는 생태학적 기능을 나타내는 어휘가 색인되며,
상기 생태학적 효과 정보는,
상기 생물학적 현상을 유발하는 생태학적 이론 또는 주제를 나타내는 어휘가 색인될 수 있다.
상기 색인하는 단계는,
상기 색인 어휘들을 기관, 조직 및 엔티티로 구성된 생물학적 관계 정보로 분류하여 색인하고,
상기 생물학적 관계 정보는,
생물학적 현상이 생물체의 조직 및 기관과 연관되어 있는지를 나타내는 정보이며,
상기 엔티티는 상기 조직 및 기관의 소유자인 생물체를 나타내는 어휘가 색인되고,
상기 조직 및 기관은 상기 생물학적 현상을 야기하는 생물체의 조직 및 기관을 각각 나타내는 어휘가 색인될 수 있다.
상기 색인하는 단계는,
상기 기관, 조직 및 엔티티를 국제 분류 정보 시스템(International Taxonomic Information System, ITIS)의 체계에 따른 학명으로 색인할 수 있다.
상기 파싱하는 단계는,
사전에 지정된 웹 사이트로 접속하여 상기 웹 사이트에 등록된 전문가에 의해 정리된 자연어 기반의 텍스트로 구성된 생물학적 문서를 수집할 수 있다.
본 발명의 실시예에 따르면, 단순히 생물체의 생물학적 개체명(학명 혹은 통속명), 혹은 연관된 구조(structure - 유전자, 질병명 등)를 이용하여 검색하는 종래와 달리 생물체에 관련한 종합적 또는 생태학적 정보를 이용할 수 있다.
도 1은 본 발명의 실시예에 따른 생물학적 시스템 정보 처리 장치의 구성을 나타낸 블록도이다.
도 2는 본 발명의 실시예에 따른 인과 관계에 기인한 온톨로지 구조를 나타낸 예시도이다.
도 3 ~ 도 6은 본 발명의 실시예에 따른 생물학적 시스템을 나타내는 비순환 지향성 그래프의 예시도이다.
도 7은 본 발명의 실시예에 따른 생물학적 시스템 정보 처리 방법을 나타낸 순서도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
또한, 명세서에 기재된 "…부", "…모듈"의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
생체모방 설계에서는 하나의 생물체 그 자체를 모방할 수도 있지만, 생물체가 가지고 있는 생물학적 현상 또는 복수의 생물체들의 상호 작용으로 인해 일어나는 생물학적 현상을 모방한다. 따라서, 생물학적 시스템은 생물체와는 의미적 차이가 있다.
여기서, 생물학적 시스템은 생체모방 설계에서 모방(mimicking) 및 활용(reuse)의 대상이 되는 시스템(system)을 말한다.
생물학적 시스템은 생체모방 설계에서 설계자가 초점을 둔 생물학적 현상(biological phenomena)을 대표한다. 생물학적 시스템은 특정 생물체(organism)가 가진 특징(trait), 형태, 사회적 기능, 생물체 내부의 조직이 가지는 내부적 프로세스(internal process) 및 기능(function) 중에서 적어도 하나를 포함한다.
이러한 생물학적 시스템은 미시 단위의 박테리아(bacteria)의 개별 기능(individual function)으로부터 다수 개체에 의해 발현되는 생물권(biosphere) 특징에 이르기까지 그 스케일(scale)이 다양하다.
이제, 생물학적 시스템 정보 처리 장치에 대해 설명하기로 한다. 생물학적 시스템 정보 처리 장치는 컴퓨터 기반의 장치로서, 생체모방 설계(Bio-inspired Design)의 근간이 될 수 있는 생물학적 시스템(Biological System) 정보를 구축하고 처리하는 장치이다.
하나의 실시예에 따르면, 생물학적 시스템 정보 처리 장치는 서버 컴퓨터로 구현되어 네트워크를 통해 접속된 사용자 단말로 웹 기반의 생물학적 시스템 검색 서비스를 제공할 수 있다.
다른 실시예에 따르면, 생물학적 시스템 정보 처리 장치는 사용자 컴퓨터 또는 사용자 서버에 설치되어 생물학적 시스템 검색 서비스를 제공할 수 있다.
도 1은 본 발명의 실시예에 따른 생물학적 시스템 정보 처리 장치의 구성을 나타낸 블록도이고, 도 2는 본 발명의 한 실시예에 따른 인과 관계에 기인한 온톨로지 구조를 나타낸 예시도이며, 도 3 ~ 도 6은 본 발명의 실시예에 따른 생물학적 시스템을 나타내는 비순환 지향성 그래프의 예시도이다.
도 1을 참조하면, 생물학적 시스템 정보 처리 장치(100)는 수집부(101), 수집 데이터베이스(103), 구문 분석부(105), 색인 어휘 사전 데이터베이스(107), 색인 처리부(109), 색인 데이터베이스(111), 유사성 평가부(113) 및 유저인터페이스부(115)를 포함한다.
수집부(101)는 자연어로 이루어진 생물학적 문서를 수집한다. 예를 들면, 1,234개의 생물학적 시스템을 수집할 수 있다.
수집부(101)는 생물학자들이 정리한 자연어 자료(natural-language based text)를 자동으로 수집한다.
수집 데이터베이스(103)는 수집부(101)가 수집한 생물학적 문서를 저장한다. 이때, 생물학적 문서는 웹 페이지 형태의 문서일 수 있다. 예를들면, HTML 문서일 수 있다.
구문 분석부(105)는 수집부(101)가 수집한 생물학적 문서를 파싱한다. 생물학적 문서의 문장 구조를 분석하고, 문장을 트리로 구성한다. 이때, 구문 분석부(105)는 스크래피(Scrapy) 파서를 이용할 수 있다.
색인 어휘 사전 데이터베이스(107)는 생물학적 시스템의 물리적 관계, 생태적 관계, 생물학적 관계를 색인하는데 필요한 색인 어휘들을 저장한다.
여기서, 물리적 관계, 생태적 관계를 색인하는데, 기능, 물질, 에너지, 신호 어휘가 필요하므로, 기능, 물질, 에너지 신호 사전을 저장한다. 이때, 생물학적 현상(biological phenomena)과 연관있는 어휘들을 기능, 물질, 에너지, 신호의 카테고리에 맞춰 분류 관계를 정의한 자료로 구성된다. 구체적으로, 생물학적 현상에 관한 기능, 물질, 에너지, 신호 사전(dictionary)의 어휘(thesaurus), 즉, 기능을 나타내는 어휘, 물질을 나타내는 어휘, 에너지를 나타내는 어휘, 신호를 나타내는 어휘를 저장한다. 이 기능, 물질, 에너지, 신호 어휘들은 색인 처리부(109)에서 생물학적 시스템의 물리적 관계, 생태적 관계를 색인하는 어휘로 사용된다. 그리고 생물학적 현상에 관한 기능 사전(dictionary)의 어휘(thesaurus)를 포함한다. 이러한 색인 어휘 사전은 외부에 공개된 Stone의 2014년 논문에서 발췌된 자료를 사용할 수 있다.
또한, 색인 어휘 사전 데이터베이스(107)는 ITIS(International Taxonomy Information Systems) 기준에 따른 학명(scientific name) 어휘가 수록된 학명 사전을 저장한다. 이때, 종래 검색 시스템들은 대부분 학명이 아닌 통속명(common name)으로 생물학적 정보를 색인(indexing)하고 있는데, 이와 차별되는 점이다.
또한, 학명 어휘를 이용함으로써, ITIS 기준에 따라 약 2만 1천 개의 속(Genus)에 대한 생물학적 시스템 정보를 수집할 수 있도록 한다.
색인 처리부(109)는 파싱된 생물학적 문서로부터 생물학적 시스템을 나타내는 색인 어휘를 추출하고, 추출한 색인 어휘들을 온톨로지 구조화하여 저장한다.
색인 처리부(109)는 인과 관계에 기반한 생물학적 시스템을 표현한 온톨로지 구조를 구축할 수 있는데, 한 예로 SAPPhIRE 모델을 이용하여 후술할 색인 방법을 사용할 수 있다. 즉, 모든 기능 어휘들이 메커니즘의 작동 원리에 맞춰 색인하도록 구현할 수 있다. 이러한 인과 모형 온톨로지 구조는 도 2와 같다.
색인 처리부(109)는 색인 어휘 사전 데이터베이스(107)에 저장된 기능, 물질, 에너지, 신호를 각각 나타내는 어휘 들을 토대로 생물학적 시스템의 물리적 관계, 생태적 관계를 색인하고, 색인 어휘 사전 데이터베이스(107)에 저장된 학명 어휘를 토대로 생물학적 시스템의 생물학적 관계를 색인하는데 사용한다.
이렇게 하면, 종래에 학명이 아닌 일반 이름(common name)으로 생물학적 시스템을 색인함으로써, 불가능하던 연관 검색이 가능하게 된다.
여기서, 온톨로지 구조화에 따르면, 색인(indexing)의 최소 단위는 노드이다. 그리고 관계 정보는 각 노드의 연결 정보로 구성되는데, 자세한 사항은 도 2와 같다. 색인 처리부(109)는 인과 관계에 기반한 생물학적 시스템을 표현한 온톨로지 구조를 구축할 수 있는데, 한 예로 SAPPhIRE 모델을 수정하여 사용할 수 있다.
주어(subject)-서술어(predicate)-목적어(object)의 트리플 형태에 기인하되, 생물학적 시스템이 갖는 메커니즘의 물리적 관계, 생태적 관계, 생물학적 관계를 고려하여 도 2의 관계를 갖도록 구조화하였다.
생물학적 시스템은 생물체가 가진 특징, 형태, 사회적 기능, 생물체 내부의 조직이 가지는 내부적 프로세스 및 기능 중에서 적어도 하나를 포함한다.
이때, 생물학적 시스템은 하나의 생물체에 대한 메커니즘(mechanism) 및 상기 메커니즘을 통해 발현되는 기능을 인과 관계로 표현한 물리적 관계, 생태학적 현상 및 생태학적 효과를 나타내는 생태적 관계, 생물학적 현상과 연관된 생물체, 생물체의 조직 및 기관 간의 관계를 나타내는 생물학적 관계로 구분된다.
구체적으로, 생물학적 시스템 정보는 생물학적 현상을 대표하는 정보이다. 하나의 생물학적 시스템 정보는 하나의 생물체에 대한 물리적 관계 정보, 생태적 관계 정보 및 생물학적 관계 정보가 조합된 정보로 구성된다.
여기서, 물리적 관계 정보는 하나의 생물체에 대하여 어떤 기작(mechanism)으로 어떠한 기능(Function)이 발현되는지가 인과 관계로 표현된 정보이다. 구체적으로, 하나의 생물체가 특정 목적(goal)을 달성하기 위하여 어떤 물리적 변화(change of state)를 겪으며, 어떤 물리적 효과(physical effects)를 통해서 어떤 물리적 현상(physical phenomena)을 초래하는지 등을 인과 관계 방식으로 표현한 정보이다.
물리적 관계 정보는 공학 설계(engineering design)에서 활용되는 인과 모형(causal model)을 통해 생성된다. 물리적 관계 정보는 상 변화(Change of State) 정보, 물리적 현상(Physical Phenomena) 정보, 물리적 효과(Physical Effects) 정보, 액션(Action) 정보 및 인풋 정보(Input)로 구성된다.
이때, 상 변화 정보는 생물학적 현상(biological phenomena)의 초기 조건과 최종 조건에 어떠한 물리적 변화가 발생하였는지를 표현한다. 즉, 어떤 물질(material)이 증가하였는지 혹은 감소하였는지, 어떤 에너지(energy)가 증가하였는지 혹은 감소하였는지, 어떤 신호(signal)가 증가하였는지 혹은 감소하였는지를 나타낸다. 따라서, 사전 조건(pre_condition)과 사후 조건(post_condition)을 각각 색인함으로써, 그 변화를 표현한다. 따라서, 물리적 변화 정보는 사전 조건 정보와 사후 조건 정보로 구성된다.
색인 처리부(109)가 상 변화 정보(Change of state, COS)를 색인하는 방법은 다음과 같다.
수학식 1에서
Figure 112016033860359-pat00001
은 생물학적 시스템의 상변화 정보를 지칭하고, 생물학적 시스템의 상변화 정보는 전술한 것처럼,
Figure 112016033860359-pat00002
로 색인된다.
Figure 112016033860359-pat00003
는 사전 조건(pre_condition)을 나타내고,
Figure 112016033860359-pat00004
는 사후 조건(post_condition)을 나타낸다.
Figure 112016033860359-pat00005
를 보면,
Figure 112016033860359-pat00006
에 대한 내용이
Figure 112016033860359-pat00007
로 색인되고,
Figure 112016033860359-pat00008
를 보면,
Figure 112016033860359-pat00009
에 대한 내용이
Figure 112016033860359-pat00010
로 색인되는 것을 알 수 있다. 여기서,
Figure 112016033860359-pat00011
,
Figure 112016033860359-pat00012
는 '양(quantity)'을 나타내는 일반 형용사 어휘로 색인되며,
Figure 112016033860359-pat00013
,
Figure 112016033860359-pat00014
은 '에너지, 물질, 신호 사전'의 '에너지, 물질, 신호' 어휘 중 하나로 색인된다. 사전은 색인 어휘 사전 데이터베이스(107)에 포함되어 있다.
Figure 112016033860359-pat00015
인과 모형에서 본 노드로부터 출발하는 온톨로지 관계는 다음과 같다.
Figure 112016033860359-pat00016
여기서,
Figure 112016033860359-pat00017
은 조직의 정보(Part) 노드를 의미한다.
Figure 112016033860359-pat00018
은 액션의 정보(Action) 노드를 의미한다. 여기서,
Figure 112016033860359-pat00019
는 시스템 인풋 정보(Input) 노드를 의미한다. 위 수학식에서 interpreted as는 본 노드가 지칭된 노드로 해석될 수 있음(interpret)을 의미한다.
또한, 물리적 현상 정보는 생물학적 현상(biological phenomena)의 기능적 특징을 의미한다. 물리적 현상 정보는 '무엇을', '어떻게' 하는지에 대한 정보로 구현된다.
'무엇을'에 대한 정보는 온톨로지의 '오브젝트(object)'의 노드에 색인된다. '어떻게'에 대한 정보는 온톨로지의 '술어(predicate)' 노드에 색인된다.
'무엇을'에 대한 정보는 물질(material), 에너지(energy) 및 신호(signal) 증에서 택일된 정보로 표현된다. 이때, 생물학적 현상에 관한 물질, 에너지, 신호 사전(dictionary)의 어휘(thesaurus)를 이용하여 색인한다.
'어떻게'에 대한 정보는 어떤 기능을 수행하는지를 나타내는 정보이다. 이때, 생물학적 현상에 관한 기능 사전(dictionary)의 어휘(thesaurus)를 이용하여 색인한다.
여기서, 사전은 색인 어휘 사전 데이터베이스(107)에 포함되어 있다.
색인 처리부(109)가 물리적 현상 정보(PPH)를 색인하는 방법은 다음과 같다.
수학식 3의
Figure 112016033860359-pat00020
은 생물학적 시스템의 물리적 현상 정보를 나타낸다.
Figure 112016033860359-pat00021
를 보면,
Figure 112016033860359-pat00022
에 대한 내용이
Figure 112016033860359-pat00023
로 색인됨을 알 수 있다.
여기서,
Figure 112016033860359-pat00024
는 '기능 어휘 사전'의 '기능 어휘' 중 하나로 색인되며,
Figure 112016033860359-pat00025
는 '에너지, 물질, 신호 사전'의 '에너지, 물질, 신호' 어휘 중 하나로 색인된다. 사전은 색인 어휘 사전 데이터베이스(107)에 포함되어 있다.
Figure 112016033860359-pat00026
Figure 112016033860359-pat00027
위 수학식에서 create는 본 노드가 지칭된 노드를 발생함(create)을 의미한다.
또한, 물리적 효과 정보(PEF)는 생물학적 현상을 물리적 관점에서 대표하는 정보이다. 물리적 효과 정보(PEF)는 어떠한 '이론'이나 '주제'와 관련되어 있는지를 색인한다. 예를 들어, 'capillary action(삼투 효과)'를 이용하여 가문 땅에서도 물을 흡수할 수 있는 생물학적 시스템은 'capillary action'이라는 물리적 효과를 갖고 있다.
수학식 5의
Figure 112016033860359-pat00028
은 생물학적 시스템의 물리적 효과 정보를 나타낸다.
Figure 112016033860359-pat00029
를 보면,
Figure 112016033860359-pat00030
에 대한 내용이
Figure 112016033860359-pat00031
로 색인됨을 알 수 있다. 여기서,
Figure 112016033860359-pat00032
는 보편적으로 정의(definition) 되어있는 물리적 효과의 하나로 색인된다. 물리적 효과들의 유사성 평가에서는 LAS(Latent Semantic Analysis, 잠재 의미 분석) 의미 분석 방법이 사용된다. 이를 위해서는 해당 물리적 효과의 정의 텍스트가 필요하다.
이때, 정의 텍스트는 위키피디아에서 해당 물리적 효과에 대하여 정의된 Summary 텍스트를 이용한다.
Figure 112016033860359-pat00033
인과 모형에서, 본 노드로부터 출발하는 온톨로지 관계는 아래와 같다.
Figure 112016033860359-pat00034
다음, 생물학적 시스템 정보를 구성하는 생태적 관계 정보는 생태학적 현상(Ecological Phenomena) 정보 및 생태학적 행동(Ecological Behavior) 정보로 구성된다.
생태학적 현상은 생물학적 현상의 기능적 특징을 의미한다. 물리적 현상이 생물학적 현상에 대한 물리적 측면의 기능이라면, 생태학적 현상은 생물학적 현상에 대한 생태학적 측면의 기능을 의미한다.
생태학적 현상 정보(EPH)도 물리적 현상 정보와 마찬가지로 '무엇을', '어떻게' 하는지에 대한 정보로 구현된다. 그리고 '무엇을'에 대한 정보는 'object'의 노드에 색인되고, '어떻게'에 대한 정보는 'predicate' 노드에 색인된다. 기능 사전(dictionary) 및 물질/에너지/신호 사전(dictionary)을 통해 색인한다.
일례로 적(foe)의 착시를 일으켜 적으로부터 발각되지 않도록 하는 생물학적 현상(camouflage)은 적(body - material)을 avoid(회피)하는 생태학적 기능을 갖는다.
수학식 7의
Figure 112016033860359-pat00035
는 생물학적 시스템의 생태학적 현상 정보를 나타낸다.
Figure 112016033860359-pat00036
를 보면,
Figure 112016033860359-pat00037
에 대한 내용이
Figure 112016033860359-pat00038
로 색인됨을 알 수 있다.
여기서,
Figure 112016033860359-pat00039
는 기능 어휘 사전의 기능 어휘 중 하나로 색인되며,
Figure 112016033860359-pat00040
는 에너지, 물질, 신호 사전의 에너지, 물질, 신호 어휘 중 하나로 색인된다. 사전은 색인 어휘 사전 데이터베이스(107)에 포함되어 있다.
Figure 112016033860359-pat00041
인과 모형에서, 본 노드로부터 출발하는 온톨로지 관계는 없다.
또한, 생태학적 행동(Ecological Behavior)은 생물학적 시스템이 가진 생물학적 현상을 대표할 수 있는 생태적 행동을 의미한다. 물리적 효과와 마찬가지로 어떠한 생태적 행동이나 이론과 관련되어있는지를 색인한다. 예를 들어, 적(foe)의 착시를 일으켜 적으로부터 발각되지 않도록 하는 생물학적 현상은'Camouflage(위장)'라는 생태적 행동을 갖고 있다.
수학식 8의
Figure 112016033860359-pat00042
은 생물학적 시스템의 생태학적 행동 정보(EBH)를 나타낸다.
Figure 112016033860359-pat00043
를 보면,
Figure 112016033860359-pat00044
에 대한 내용이
Figure 112016033860359-pat00045
로 색인됨을 알 수 있다. 여기서,
Figure 112016033860359-pat00046
는 보편적으로 정의(definition) 되어있는 생태적 행동의 하나로 색인된다.
생태적 행동들의 유사성 평가에서는 LAS(Latent Semantic Analysis, 잠재 의미 분석) 의미 분석 방법이 사용되며, 이를 위해서는 해당 생태적 행동의 정의 텍스트가 필요하다. 이 때, 정의 텍스트는 위키피디아에서 해당 물리적 효과에 대하여 정의된 Summary 텍스트를 이용한다.
Figure 112016033860359-pat00047
인과 모형에서 본 노드로부터 출발하는 온톨로지 관계는 아래와 같다.
Figure 112016033860359-pat00048
다음, 생물학적 시스템 정보를 구성하는 생물학적 관계 정보는 기관(Organ), 조직(Part), 엔티티(Entity)로 구성된다. 생물학적 관계 정보는 생물학적 시스템이 가진 생물학적 현상이 생물체(organism)의 어떤 조직(Part)의 어떤 기관(Organ)과 연관되어 있는지를 나타낸다. 그리고 조직(Part)은 기관(Organ)이 속한 조직(Part)을 의미한다.
엔티티(Entity)는 생물학적 시스템이 어떤 생물체(organism)와 관련되어있는지를 색인하는 요소이다. 즉, 엔티티(Entity)는 기관(Organ)과 조직(Part)의 소유자로서, 바로 그 생물학적 현상을 관찰할 수 있는 생물체이다.
예를들어, 무지갯빛(iridescent color)을 생성해내는 풍뎅이에서 풍뎅이가 엔티티(Entity)로 색인된다. 그리고 큐티클(cuticle)은 풍뎅이의 쉘(shell)에 속한 부분이므로, 생물학적 시스템의 조직(Part)은 쉘(shell)로 색인되고, 쉘(shell)의 큐티클이 연관된 기관(Organ)으로 색인된다.
기관의 정보(ORG) 색인 방법은 다음과 같다.
수학식 10의
Figure 112016033860359-pat00049
를 보면,
Figure 112016033860359-pat00050
에 대한 내용이
Figure 112016033860359-pat00051
로 색인됨을 알 수 있다. 여기서,
Figure 112016033860359-pat00052
는 '물질 어휘 사전'의 '물질 어휘' 중 하나로 색인된다. 사전은 색인 어휘 사전 데이터베이스(107)에 포함되어 있다.
Figure 112016033860359-pat00053
인과 모형에서, 본 노드로부터 출발하는 온톨로지 관계는 아래와 같다.
Figure 112016033860359-pat00054
여기서, Activate는 해당 노드가 지칭된 노드를 촉발시킴(activate)을 나타낸다.
조직의 정보(PRT) 색인 방법은 다음과 같다.
수학식 12의
Figure 112016033860359-pat00055
를 보면,
Figure 112016033860359-pat00056
에 대한 내용이
Figure 112016033860359-pat00057
로 색인됨을 알 수 있다. 여기서,
Figure 112016033860359-pat00058
는 '물질 어휘 사전'의 '물질 어휘' 중 하나로 색인된다. 사전은 색인 어휘 사전 데이터베이스 (107)에 포함되어 있다.
Figure 112016033860359-pat00059
인과 모형에서, 본 노드로부터 출발하는 온톨로지 관계는 아래와 같다.
Figure 112016033860359-pat00060
엔티티의 정보(ENT) 색인 방법은 다음과 같다.
엔티티(Entity)는 최종적으로 생물학적 시스템(Biological System)이 어떤 생물체(Organism)와 관련되어 있는지를 색인하는 요소이다. 즉, 엔티티(Entity)는 조직(Organ)과 기관(Part)의 소유자이다. 바로 그 생물학적 현상(Biological Phenomena)를 관찰할 수 있는 생물체이다.
예를 들어 앞의 무지갯빛(Iridescent Color)의 예에서는 해당 '풍뎅이'가 Entity의 값으로 색인된다. 구체적으로 색인할 때는 ITIS의 체계에 따라 적합한 학명(Scientific Name)으로 색인한다. 대부분의 다른 시스템들은 학명이 아닌 일반이름(Common Name)으로 생물학적 시스템을 색인해왔기 때문에, 연관 검색이 불가능하다.
수학식 14의
Figure 112016033860359-pat00061
를 보면,
Figure 112016033860359-pat00062
에 대한 내용이
Figure 112016033860359-pat00063
로 색인됨을 알 수 있는데, 여기서,
Figure 112016033860359-pat00064
는 'ITIS 학명 사전'으로부터 생물체의 고유 ID 번호(숫자)를 색인하고,
Figure 112016033860359-pat00065
는 학명(텍스트)을 색인,
Figure 112016033860359-pat00066
는 통속명(텍스트)을 색인한다. 사전은 색인 어휘 사전 데이터베이스(107)에 포함되어 있다.
Figure 112016033860359-pat00067
인과 모형에서, 본 노드로부터 출발하는 온톨로지 관계는 아래와 같다.
Figure 112016033860359-pat00068
여기서, Has는 지칭된 노드가 해당 노드를 구성하는 구성 요소임을 나타낸다.
액션의 정보(ACT) 색인 방법은 다음과 같다.
액션(Action)은 하나의 생물학적 시스템이 COS, PPH, PEF 등의 복잡한 물리적 관계를 통하여 궁극적으로 구현해내는 물리적 전략을 대표한다.
수학식 16의
Figure 112016033860359-pat00069
를 보면,
Figure 112016033860359-pat00070
에 대한 내용이
Figure 112016033860359-pat00071
로 색인됨을 알 수 있는데, 여기서
Figure 112016033860359-pat00072
에는 설계자가 생물학적 시스템으로부터 얻어낼 수 있는 설계 전략을 요약하여 저장한다.
Figure 112016033860359-pat00073
인과 모형에서, 본 노드로부터 출발하는 온톨로지 관계는 아래와 같다.
Figure 112016033860359-pat00074
인풋의 정보(INP) 색인 방법은 다음과 같다.
Input은 하나의 생물학적 시스템에 필요한 물질, 에너지, 신호 인풋을 대표한다.
수학식 18의
Figure 112016033860359-pat00075
를 보면,
Figure 112016033860359-pat00076
에 대한 내용이
Figure 112016033860359-pat00077
로 색인됨을 알 수 있는데, 여기서
Figure 112016033860359-pat00078
에는 생물학적 시스템이 필요로 하는 물질, 에너지, 신호 인풋을 저장한다. 인풋 물질, 에너지, 신호는 '물질', '에너지' 및 '신호' 사전으로부터 색인된다. 색인 어휘 사전 데이터베이스 (107)에 포함되어있다.
Figure 112016033860359-pat00079
인과 모형에서, 본 노드로부터 출발하는 온톨로지 관계는 아래와 같다.
Figure 112016033860359-pat00080
이러한 내용에 따르면, 색인 처리부(109)는 생물학적 현상과 관련된 어휘들이 기능, 물질, 에너지, 신호 및 학명을 포함하는 카테고리로 분류화하고, 색인 어휘 사전 데이터베이스(107)에 저장된 색인 어휘 사전을 이용하여 생물학적 시스템을 나타내는 색인 어휘를 추출한다. 그리고 추출한 색인 어휘를 물리적 관계, 생태적 관계 및 생물학적 관계 별로 구분하여 색인한다.
색인 데이터베이스(111)는 색인 처리부(109)에 의해 생성된 색인 데이터를 저장한다.
이처럼, 생물학적 시스템 정보 처리 장치(100)는 생물학적 시스템을 물리적 관계, 생태적 관계 및 생물학적 관계로 표현 및 색인함으로써, 설계자가 관련된 생물학적 시스템을 검색하는데 유용하다.
또한, 생물학적 시스템이 특정 ‘기능’ 및 ‘물리적 관계’를 발휘하는데 연관되어있는 종합적 생태학 정보들, 즉 ‘물리적 관계’ + ‘생태적 관계’ + ‘생물학적 관계’의 인과모형으로 구현함으로써, 생물학적 시스템들은 각기 '물리적 관계', '생태적 관계', '생물학적 관계' 패턴의 유사성으로 각각 연결되어있다. 그리고 이러한 연결 구조를 온톨로지 구조로 구현하였다. 따라서, 추후, ‘물리적 관계’ + ‘생태적 관계’ + ‘생물학적 관계' 패턴을 검색함으로써, 전체 생물계로부터 ‘물리적 관계’ + ‘생태적 관계’ + ‘생물학적 관계' 패턴과 유사한 패턴을 가지는 생물체들을 검색할 수 있다. 이렇게 하면, 생물학적 시스템 검색 과정에서 생태학적 문맥(context)을 활용할 수 있게 된 것을 의미한다.
또한, 대표화된 구조 내에서 [‘물리적 관계’ + ‘생태적 관계’] 패턴들의 유사성을 계산할 수 있게 되므로, 설계자[사용자]가 선택한 [‘물리적 관계’ + ‘생태적 관계’] 패턴과 유사한 패턴들을 함께 추천할 수 있다. 설계자[사용자]가 미처 생각해내지 못한 관련된 다른 아이디어들도 함께 추천할 수 있다.
또한, 선택적으로‘물리적 관계’+‘생태적 관계’를 이용한 검색도 가능하다.
또한, 생물 계통분류학에서 사용되는 생물 동정(identification) 키(key) 리스트를 이용하면, 전체 생물계를 대상으로, 물리적 관계’ + ‘생태적 관계’ + ‘생물학적 관계’ 패턴으로 대표되는 특정 특질(character)을 갖는 생물체들을 찾아낼 수 있다.
유사성 평가부(113)는 Python 언어 형태로 색인 데이터를 관리한다. 그리고 생물학적 시스템 정보 들간의 유사성을 평가한다. 이때, 온톨로지 구조화된 생물학적 시스템 정보는 연결 관계(지향성)을 갖추고 있고, 이를 그래프로 표현하면, 비순환 지향성 그래프(DAG: Directed Acyclic Graph)를 구성한다.
유사성 평가부(113)는 Causal Model의 구조에 따른 유사성 비교와 색인된 어휘에 따른 유사성 비교를 함께 수행할 수 있다. 유사성 비교는 도 3 ~ 도 6과 같은 비순환 지향성 그래프를 이용할 수 있다.
도 3은 기능 어휘 사전의 구조를 나타내고, 도 4는 물질 어휘 사전의 구조를 나타내며, 도 5는 신호 어휘 사전의 구조를 나타내고, 도 6은 에너지 어휘 사전의 구조를 나타낸다. 학명 사전은 ITIS에서 정립한 보편적인 생물계통수 구조를 갖으므로 나타내지 않았다.
여기서, 도 3, 4, 5, 6의 그래프에서 각 원은 원은 사전 내부의 어휘 카테고리들을 나타낸다. 카테고리 이하 어휘들은 방대한 양으로 인해, 숨겨서 카테고리들만 플로팅한 것이다.
또한, X축, Y축은 트리 그래프의 Laplacian Matrix를 Cartesian Coordinates로 표현한 것이다. 엣지의 번호는 엣지의 id를 나타낸다.시스템 사용자(설계자)는 생물학적 시스템 검색을 위해 쿼리로 '물리적 관계' + '생태적 관계' + '생물학적 관계'를 모두 입력하거나, '물리적 관계' + '생태적 관계'를 입력(INPPUT)할 수 있다.
여기서, 물리적 관계'는 물리적으로 '무엇(object)'을 '어떻게(predicate)' 하는지 입력되어야 한다.
유저 인터페이스부(115)는 쿼리를 '어떻게'와 '무엇'의 조
Figure 112016033860359-pat00081
합으로 입력받는다. 사용자는 '어떻게'에 동사(verb)를 입력한다. '무엇'은 명사(noun)가 입력된다.
그러면, 유사성 평가부(113)는 직접적으로 '색인 처리부(109)'에 저장되어있는 인과 모형의 Physical Phenomena(PPH)와 유사성을 비교한다.
'생태적 관계'는 생태적으로 '무엇(object)'을 '어떻게(predicate)' 하는지 입력되어야 한다.
유저 인터페이스부(115)는 쿼리를 '어떻게'와 '무엇'의 조합으로 입력받는다
Figure 112016033860359-pat00082
. 사용자는 '어떻게'에 동사(verb)를 입력한다. '무엇'은 명사(noun)가 입력된다.
유사성 평가부(113)는 직접적으로 '색인 처리부(109)'에 저장되어있는 인과 모형의 Physical Phenomena(PPH)와 유사성을 비교한다. 생물학적 관계'는 학명의 텍스트 스트링으로 입력받는다.
그러면, 유사성 평가부(113)는 '물리적 관계' + '생태적 관계' + '생물학적 관계' 패턴(related patterns)을 이용한 검색의 경우, '물리적 관계'를 이용하여 평가된 유사도, '생태적 관계'를 이용하여 평가된 유사도, '생물학적 관계'를 이용하여 평가된 유사도를 합산하여, 가장 유사도가 높은 생물학적 시스템을 출력한다.
'물리적 관계' + '생태적 관계' 패턴을 이용한 검색의 경우, '물리적 관계'를 이용하여 평가된 유사도, '생태적 관계'를 이용하여 평가된 유사도를 합산하여, 가장 유사도가 높은 생물학적 시스템을 출력한다.
세부적으로 '물리적 관계', '생태적 관계, '생물학적 관계' 각각의 유사성 평가 방법은 아래 알고리즘과 같다. 아래 알고리즘에서 LCA는 Lowest Common Ancestor의 유사성 평가 방법을 의미하며, WordNet은 WordNet 시스템을 이용한 단어간 유사성 평가 알고리즘을 의미한다.
먼저, 물리적 관계의 유사성 평가는 다음 표 1과 같다.
Input:
Figure 112016033860359-pat00083
: set of biological systems (represented as ontology of causal models)
Figure 112016033860359-pat00084
: set of dictionaries
Figure 112016033860359-pat00085
: set of query
Output:
Figure 112016033860359-pat00086
Initialization: set initial values for variables
Figure 112016033860359-pat00087
A Step
Figure 112016033860359-pat00088

end-for
B Step
Figure 112016033860359-pat00089

end-for
C Step
Figure 112016033860359-pat00090
다음, 생태적 관계의 유사성 평가는 다음 표 2와 같다.
Input:
Figure 112016033860359-pat00091

Output:
Figure 112016033860359-pat00092
Initialization: set initial values for variables
Figure 112016033860359-pat00093
A Step
Figure 112016033860359-pat00094

end-for
B Step
Figure 112016033860359-pat00095

end-for
C Step
Figure 112016033860359-pat00096
마지막으로, 생물학적 관계의 유사성 평가는 다음 표 3과 같다.
Input:
Figure 112016033860359-pat00097

Output:
Figure 112016033860359-pat00098
Initialization: set initial values for variables
Figure 112016033860359-pat00099
Figure 112016033860359-pat00100

end-for
도 7은 본 발명의 실시예에 따른 생물학적 시스템 정보 처리 방법을 나타낸 순서도로서, 도 1의 생물학적 시스템 정보 처리 장치(100)의 일련의 동작을 나타낸다.
도 7을 참조하면, 생물학적 시스템 정보 처리 장치(100)는 정해진 웹 사이트로부터 자연어로 이루어진 생물학적 문서를 수집(S101)하여 파싱한다(S103). 그리고 파싱된 생물학적 문서로부터 생물학적 시스템을 나타내는 색인 어휘를 추출(S105)하고, 상기 색인 어휘들을 온톨로지 구조화하여 저장한다.
이때, 색인 어휘들을 각각 물리적 관계, 생태학적 관계 및 생물학적 관계로 구분하여 색인한다.
구체적으로, 추출한 색인 어휘들을 생물학적 현상의 상 변화 정보, 생물학적 현상의 물리적 현상 정보 및 생물학적 현상의 물리적 효과 정보로 분류하여 색인한다(S107).
또한, 추출한 색인 어휘들을 생물학적 현상의 기능적 특징을 의미하는 생태학적 현상 정보 및 생태학적 효과 정보로 분류하여 색인한다(S109).
또한, 추출한 색인 어휘들을 생물학적 현상이 생물체의 조직 및 기관과 연관되어 있는지를 나타내는 정보와, 조직 및 기관의 소유자인 생물체를 나타내는 어휘를 각각 색인한다(S111).
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (15)

  1. 컴퓨터 기반의 생물학적 시스템 정보 처리 장치로서,
    자연어로 이루어진 생물학적 문서를 수집하는 수집부,
    상기 생물학적 문서를 파싱하는 구문 분석부, 그리고
    상기 파싱된 생물학적 문서로부터 생물학적 시스템을 나타내는 색인 어휘를 추출하고, 상기 색인 어휘들을 온톨로지 구조화하여 저장하는 색인 처리부를 포함하고,
    상기 생물학적 시스템은,
    생물체가 가진 특징, 형태, 사회적 기능, 생물체 내부의 조직이 가지는 내부적 프로세스 및 기능 중에서 적어도 하나와,
    하나의 생물체에 대한 메커니즘(mechanism) 및 상기 메커니즘을 통해 발현되는 기능을 인과 관계로 표현한 물리적 관계, 생태학적 현상 및 생태학적 효과를 나타내는 생태적 관계, 그리고 생물학적 현상과 연관된 생물체, 생물체의 조직 및 기관 간의 관계를 나타내는 생물학적 관계를 포함하며,
    상기 색인 처리부는,
    생물학적 현상과 관련된 어휘들이 기능, 물질, 에너지, 신호 및 학명을 포함하는 카테고리로 분류화하여 저장된 색인 어휘 사전을 이용하여 상기 생물학적 시스템을 나타내는 색인 어휘를 추출하고, 추출한 색인 어휘를 상기 물리적 관계, 상기 생태적 관계 및 상기 생물학적 관계 별로 구분하여 색인하는 생물학적 시스템 정보 처리 장치.
  2. 삭제
  3. 제1항에서,
    상기 색인 처리부는,
    상기 색인 어휘들을 생물학적 현상의 상 변화 정보, 상기 생물학적 현상의 물리적 현상 정보 및 상기 생물학적 현상의 물리적 효과 정보로 분류하여 색인 처리하고,
    상기 상 변화 정보는,
    임의의 생물학적 현상의 초기 조건과 최종 조건에 발생한 물리적 변화를 표현하며,
    상기 초기 조건과 상기 최종 조건은 물질, 에너지 및 신호 각각의 증가 또는 감소를 나타내는 정보가 색인되며,
    상기 물리적 현상 정보는,
    온톨로지의 오브젝트 노드 및 술어 노드를 포함하고,
    상기 오브젝트 노드는 상기 물리적 현상을 일으키는 물질, 에너지 및 신호 중에서 선택된 하나의 정보가 색인되고, 상기 술어 노드는 생물학적 현상을 나타내는 기능 어휘가 색인되며,
    상기 물리적 효과 정보는,
    생물학적 현상과 관련된 이론 또는 주제를 나타내는 어휘가 색인되는 생물학적 시스템 정보 처리 장치.
  4. 제1항에서,
    상기 색인 처리부는,
    상기 색인 어휘들을 생물학적 현상의 기능적 특징을 의미하는 생태학적 현상 정보 및 생태학적 효과 정보로 분류하여 색인하고,
    상기 생태학적 현상 정보는,
    온톨로지의 오브젝트 노드 및 술어 노드를 포함하며,
    상기 오브젝트 노드에는 상기 생태학적 현상을 일으키는 물질, 에너지 및 신호 중에서 선택된 하나의 정보가 색인되고, 상기 술어 노드에는 생태학적 기능을 나타내는 어휘가 색인되며,
    상기 생태학적 효과 정보는,
    상기 생물학적 현상을 유발하는 생태학적 행동 또는 관련된 이론을 표현하는 어휘가 색인되는 생물학적 시스템 정보 처리 장치.
  5. 제1항에서,
    상기 색인 처리부는,
    상기 색인 어휘들을 기관, 조직 및 엔티티로 구성된 생물학적 관계 정보로 분류하여 색인하고,
    상기 생물학적 관계 정보는,
    생물학적 현상이 생물체의 조직 및 기관과 연관되어 있는지를 나타내는 정보이며,
    상기 엔티티는 상기 조직 및 기관의 소유자인 생물체를 나타내는 어휘가 색인되고,
    상기 조직 및 기관은 상기 생물학적 현상을 야기하는 생물체의 조직 및 기관을 각각 나타내는 어휘가 색인되는 생물학적 시스템 정보 처리 장치.
  6. 제5항에서,
    상기 색인 처리부는,
    상기 기관, 조직 및 엔티티를 국제 분류 정보 시스템(International Taxonomic Information System, ITIS)의 체계에 따른 학명으로 색인하는 생물학적 시스템 정보 처리 장치.
  7. 제1항에서,
    상기 수집부는,
    전문가에 의해 정리된 자연어 기반의 텍스트로 구성된 생물학적 문서를 웹 상에서 수집하는 생물학적 시스템 정보 처리 장치.
  8. 제1항에서,
    생물학적 시스템 쿼리가 입력되면, 물리적 관계에 해당하는 어휘 검색, 생태적 관계에 해당하는 어휘 검색 및 생물학적 관계에 해당하는 어휘 검색을 수행하고, 각각 검색된 어휘들간의 단어 유사성 평가값을 합산하여 가장 유사도가 높은 생물학적 시스템을 출력하는 유사성 평가부
    를 더 포함하는 생물학적 시스템 정보 처리 장치.
  9. 컴퓨터 기반의 생물학적 시스템 정보 처리 방법으로서,
    자연어로 이루어진 생물학적 문서를 수집하여 상기 생물학적 문서를 파싱하는 단계,
    상기 파싱된 생물학적 문서로부터 생물학적 시스템을 나타내는 색인 어휘를 추출하는 단계, 그리고
    상기 색인 어휘들을 온톨로지 구조화하여 저장하는 단계를 포함하고,
    상기 생물학적 시스템은,
    생물체가 가진 특징, 형태, 사회적 기능, 생물체 내부의 조직이 가지는 내부적 프로세스 및 기능 중에서 적어도 하나를 포함하며,
    상기 추출하는 단계는,
    생물학적 현상과 관련된 어휘들이 기능, 물질, 에너지 및 신호를 포함하는 카테고리로 분류화하여 저장된 색인 어휘 사전을 이용하여 상기 생물학적 시스템을 나타내는 색인 어휘를 추출하고,
    상기 저장하는 단계는,
    추출한 색인 어휘들을 하나의 생물체에 대한 메커니즘(mechanism) 및 상기 메커니즘을 통해 발현되는 기능을 인과 관계로 표현한 물리적 관계 정보, 생태학적 현상 및 생태학적 효과를 나타내는 생태적 관계 정보, 및 생물학적 현상과 연관된 생물체, 생물체의 조직 및 기관 간의 관계를 나타내는 생물학적 관계 정보로 분류하여 색인하는 단계, 그리고
    색인 데이터를 저장하는 단계
    를 포함하는, 생물학적 시스템 정보 처리 방법.
  10. 삭제
  11. 제9항에서,
    상기 색인하는 단계는,
    상기 추출한 색인 어휘들을 생물학적 현상의 상 변화 정보, 상기 생물학적 현상의 물리적 현상 정보 및 상기 생물학적 현상의 물리적 효과 정보로 분류하여 색인 처리하고,
    상기 상 변화 정보는,
    임의의 생물학적 현상의 초기 조건과 최종 조건에 발생한 물리적 변화를 표현하며,
    상기 초기 조건과 상기 최종 조건은 물질, 에너지 및 신호 각각의 증가 또는 감소를 나타내는 정보가 색인되며,
    상기 물리적 현상 정보는,
    온톨로지의 오브젝트 노드 및 술어 노드를 포함하고,
    상기 오브젝트 노드는 상기 물리적 현상을 일으키는 물질, 에너지 및 신호 중에서 선택된 하나의 정보가 색인되고, 상기 술어 노드는 생물학적 현상을 나타내는 기능 어휘가 색인되며,
    상기 물리적 효과 정보는,
    생물학적 현상과 관련된 이론 또는 주제를 나타내는 어휘가 색인되는 생물학적 시스템 정보 처리 방법.
  12. 제9항에서,
    상기 색인하는 단계는,
    상기 색인 어휘들을 생물학적 현상의 기능적 특징을 의미하는 생태학적 현상 정보 및 생태학적 효과 정보로 분류하여 색인하고,
    상기 생태학적 현상 정보는,
    온톨로지의 오브젝트 노드 및 술어 노드를 포함하며,
    상기 오브젝트 노드에는 상기 생태학적 현상을 일으키는 물질, 에너지 및 신호 중에서 선택된 하나의 정보가 색인되고, 상기 술어 노드에는 생태학적 기능을 나타내는 어휘가 색인되며,
    상기 생태학적 효과 정보는,
    상기 생물학적 현상을 유발하는 생태학적 이론 또는 주제를 나타내는 어휘가 색인되는 생물학적 시스템 정보 처리 방법.
  13. 제9항에서,
    상기 색인하는 단계는,
    상기 색인 어휘들을 기관, 조직 및 엔티티로 구성된 생물학적 관계 정보로 분류하여 색인하고,
    상기 생물학적 관계 정보는,
    생물학적 현상이 생물체의 조직 및 기관과 연관되어 있는지를 나타내는 정보이며,
    상기 엔티티는 상기 조직 및 기관의 소유자인 생물체를 나타내는 어휘가 색인되고,
    상기 조직 및 기관은 상기 생물학적 현상을 야기하는 생물체의 조직 및 기관을 각각 나타내는 어휘가 색인되는 생물학적 시스템 정보 처리 방법.
  14. 제13항에서,
    상기 색인하는 단계는,
    상기 기관, 조직 및 엔티티를 국제 분류 정보 시스템(International Taxonomic Information System, ITIS)의 체계에 따른 학명으로 색인하는 생물학적 시스템 정보 처리 방법.
  15. 제9항에서,
    상기 파싱하는 단계는,
    사전에 지정된 웹 사이트로 접속하여 상기 웹 사이트에 등록된 전문가에 의해 정리된 자연어 기반의 텍스트로 구성된 생물학적 문서를 수집하는 생물학적 시스템 정보 처리 방법.
KR1020160043057A 2016-04-07 2016-04-07 생물학적 시스템 정보 처리 장치 및 방법 KR101881398B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160043057A KR101881398B1 (ko) 2016-04-07 2016-04-07 생물학적 시스템 정보 처리 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160043057A KR101881398B1 (ko) 2016-04-07 2016-04-07 생물학적 시스템 정보 처리 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20170115406A KR20170115406A (ko) 2017-10-17
KR101881398B1 true KR101881398B1 (ko) 2018-07-24

Family

ID=60298211

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160043057A KR101881398B1 (ko) 2016-04-07 2016-04-07 생물학적 시스템 정보 처리 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101881398B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102448275B1 (ko) * 2019-07-05 2022-09-28 (주)호모미미쿠스 생물 종 동정을 활용한 생물학적 정보 추론 장치 및 방법
US20220293220A1 (en) * 2019-07-05 2022-09-15 Homo Mimicus Co., Ltd Biological information inference apparatus and method utilizing biological species identification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100575495B1 (ko) * 2003-12-17 2006-05-03 엄재홍 생물학 관련 텍스트에서 생물학개체들간의 상호작용 추출및 추론 방법, 그 방법을 실행하기 위한 프로그램 및 그프로그램을 저장한 기록매체
KR101400946B1 (ko) 2013-12-27 2014-05-29 한국과학기술정보연구원 생물학적 네트워크 분석 장치 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103501859B (zh) * 2011-03-02 2017-08-25 博格有限责任公司 基于细胞的探询式分析及其应用
KR101624307B1 (ko) * 2014-07-17 2016-05-25 한국과학기술원 네트워크 조절 모티프 발굴 시스템 및 그 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100575495B1 (ko) * 2003-12-17 2006-05-03 엄재홍 생물학 관련 텍스트에서 생물학개체들간의 상호작용 추출및 추론 방법, 그 방법을 실행하기 위한 프로그램 및 그프로그램을 저장한 기록매체
KR101400946B1 (ko) 2013-12-27 2014-05-29 한국과학기술정보연구원 생물학적 네트워크 분석 장치 및 방법

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BMC Bioinformatics (2007) 8:243
BMC Systems Biology (2013) 7(Suppl 3):S9
Journal of Biomedical Informatics (2011) 44:163-179
Journal of the American Medical Informatics Association (2011) 8:544-551

Also Published As

Publication number Publication date
KR20170115406A (ko) 2017-10-17

Similar Documents

Publication Publication Date Title
CN103229162B (zh) 使用候选答案逻辑综合提供问题答案
JP5904559B2 (ja) シナリオ生成装置、及びそのためのコンピュータプログラム
Yang et al. Extract conceptual graphs from plain texts in patent claims
CN108563620A (zh) 文本自动写作方法和系统
CN109937417A (zh) 用于电子记录的上下文检索的系统和方法
CN103229223A (zh) 使用多个候选答案评分模型提供问题答案
JP2013502643A (ja) 構造化データ翻訳装置、システム及び方法
Zouaq An overview of shallow and deep natural language processing for ontology learning
Hazman et al. Ontology learning from domain specific web documents
Altheneyan et al. Big data ML-based fake news detection using distributed learning
Safee et al. Hybrid search approach for retrieving Medical and Health Science knowledge from Quran
De Melo et al. UWN: A large multilingual lexical knowledge base
KR101881398B1 (ko) 생물학적 시스템 정보 처리 장치 및 방법
CN110199354B (zh) 生物体系信息检索系统以及方法
Garrido et al. The GENIE project-a semantic pipeline for automatic document categorisation
Alruily Using text mining to identify crime patterns from arabic crime news report corpus
KR102363131B1 (ko) 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템
Seneviratne et al. Inductive logic programming in an agent system for ontological relation extraction
Kumar et al. An Algorithm for Automatic Text Annotation for Named Entity Recognition using spaCy Framework
Pertsas et al. Ontology-driven information extraction from research publications
Lauser Semi-automatic ontology engineering and ontology supported document indexing in a multilingual environment
KR102448275B1 (ko) 생물 종 동정을 활용한 생물학적 정보 추론 장치 및 방법
Polpinij Ontology-based knowledge discovery from unstructured and semi-structured text
JP4938298B2 (ja) テキストの要約に含める文の候補を出力する方法およびプログラム
Hamoud A Question Answering System Design about the Holy Quran

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant