KR101145983B1 - 심혈관계 질환 온톨로지 구축 장치 및 방법 - Google Patents

심혈관계 질환 온톨로지 구축 장치 및 방법 Download PDF

Info

Publication number
KR101145983B1
KR101145983B1 KR1020090086812A KR20090086812A KR101145983B1 KR 101145983 B1 KR101145983 B1 KR 101145983B1 KR 1020090086812 A KR1020090086812 A KR 1020090086812A KR 20090086812 A KR20090086812 A KR 20090086812A KR 101145983 B1 KR101145983 B1 KR 101145983B1
Authority
KR
South Korea
Prior art keywords
ontology
cardiovascular disease
disease
cardiovascular
symptoms
Prior art date
Application number
KR1020090086812A
Other languages
English (en)
Other versions
KR20110029230A (ko
Inventor
최호진
김수경
강동엽
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020090086812A priority Critical patent/KR101145983B1/ko
Publication of KR20110029230A publication Critical patent/KR20110029230A/ko
Application granted granted Critical
Publication of KR101145983B1 publication Critical patent/KR101145983B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

본 발명은 기계 판독 및 해석 가능한 심혈관계 질환 온톨로지를 모델링하고, 심혈관계 질환과 관련된 의학 지식을 수집하여 자동적으로 심혈관계 질환 온톨로지를 증식할 수 있는 심혈관계 질환의 온톨로지 구축 방법에 관한 것으로, 심혈관계 질환의 종류, 증상, 치료법을 포함하는 질병 정보 및 심전도 정보를 분석하여 심혈관계 질환 온톨로지를 모델링하는 단계 및 문서로부터 심혈관계 질환과 관련된 온톨로지를 추출하여 상기 심혈관계 질환 온톨로지를 증식하는 단계를 포함한다.
심혈관계 질환, 온톨로지, 모델링, 기계 판독

Description

심혈관계 질환 온톨로지 구축 장치 및 방법{APPARATUS AND MEHTOD FOR CONSTRUCTING ONTOLOGY OF HEART DISEASE DOMAIN}
본 발명은 심혈관계 질환의 온톨로지 구축 시스템 및 방법에 관한 것으로서, 특히, 기계 판독/해석 가능한 심혈관계 질환 온톨로지를 모델링하고, 심혈관계 질환과 관련된 의학 지식을 수집하여 자동적으로 심혈관계 질환 온톨로지를 증식할 수 있는 심혈관계 질환의 온톨로지 구축 시스템 및 방법에 관한 것이다.
바이오 정보 분야에서 질병의 진단 등에 활용하기 위한 정보를 구축하는 방법에 대한 연구가 진행되어 왔다. 그렇지만 특정 질병의 진단을 위한 정보를 구축하기 위해서는 해당 분야의 전문가가 일일이 관련된 정보를 수집, 분석해야 하고 그 질병과 연관된 정보 요소에 따라 분류하고, 그들 사이의 관계를 추론해야 한다. 따라서, 이러한 정보의 구축에는 많은 노력을 필요로 한다.
현재, 이러한 노력의 결과로, 의학 분야의 용어들을 정리한 시소러스인 UMLS (Unified Medical Language System)과, MeSH (Medical Subject Heading)가 있다. 그러나, 이러한 시소러스들의 개발에 많은 노력이 들었음에도 불구하고, 주석자들에 의해 수작업으로 개발되고 개체들이 생성되었다는 한계가 있다. 더욱이, 이러한 시소러스들은 의학 분야 전반에 걸친 지식을 일반적인 형태로 표현하고 있으므로, 어떤 구체적인 세부 분야, 특정 질병의 지식을 표현하는데는 사용되지 못한다.
한편, 최근 기존의 텍스트 기반의 정보의 구축 방법의 한계를 극복하기 위한 방법으로써, 온톨로지(Ontology)를 기반으로 다양한 데이터를 관리하는 방안이 널리 연구되어 이용되고 있다.
여기서, 온톨로지(ontology)는 공유된 개념화(shared conceptualization)에 대한 정형화되고 명시적인 명세서(formal and explicit specification)를 일컫는 말이다. 즉, 온톨로지는 단어와 관계들로 구성된 일종의 사전으로서 생각할 수 있으며, 그 속에는 특정 도메인에 관련된 단어들이 계층적으로 표현되어 있고, 추가적으로 이를 확장할 수 있는 추론 규칙이 포함되어 있어, 웹 기반의 지식 처리나 응용 프로그램 사이의 지식 공유, 재사용 등이 가능토록 되어 있다. 이러한 온톨로지는 시맨틱 웹 응용의 가장 중심적 개념으로서, 이를 표현하기 위해 스키마와 구문 구조 등을 정의한 언어가 온톨로지 언어(ontology language)이며, 현재 DSML+OIL, OWL, Ontolingun 등이 있다.
이러한 온톨로지를 이용하여 다양한 특정 분야에 대한 온톨로지 지식 베이스를 구축하는 시도들이 있었다. 하지만, 현재까지 심혈관계 질병 분야에 대한 온톨로지 구축한 시도는 없었다.
본 발명은 특정 질병, 특히 심혈관계 질환에 관련된 온톨로지를 모델링하고, 상기 심혈관계 질환 온톨로지만을 추출하여 수집하고, 이를 이용하여 심혈관계 질환의 진단에 적합한 데이터베이스를 구축할 수 있는 심혈관계 질환 온톨로지 구축 장치를 제공하는데 그 목적이 있다.
또한, 본 발명은 상기 심혈관계 질환 온톨로지를 구축하는 방법을 제공하는데 그 목적이 있다.
상기와 같은 목적을 달성하기 위한, 본 발명의 제 1 실시예에 의한 심혈관계 질환 온톨로지 구축 방법은 심혈관계 질환의 종류, 증상, 치료법을 포함하는 질병 정보 및 심전도 정보를 분석하여 심혈관계 질환 온톨로지를 모델링하는 단계; 및 문서로부터 심혈관계 질환과 관련된 온톨로지를 추출하여 상기 심혈관계 질환 온톨로지를 증식하는 단계를 포함한다.
이때, 상기 심혈관계 질환 온톨로지를 모델링하는 단계는, 상기 심혈관계 질환의 종류, 증상, 치료법을 포함하는 질병 정보를 분석하여 질병 온톨로지를 설정하는 단계 및 상기 심전도 정보를 분석하여 심전도 온톨로지를 설정하는 단계를 포함할 수 있다.
또한, 상기 질병 온톨로지는, 상기 심혈관계 질환의 종류에 관련된 정보를 정의한 질병 종류 온톨로지와, 상기 심혈관계 질환의 종류에 의해 나타나는 증상들에 관련된 정보를 정의한 증상 온톨로지와, 상기 심혈관계 질환을 치료할 수 있는 방법을 정의한 치료법 온톨로지를 포함할 수 있다.
또한, 상기 심전도 온톨로지는, 파동 온톨로지, 구획 온톨로지, 간격 온톨로지 및 심박동수 변이 온톨로지를 포함하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 방법.
한편, 상기 심혈관계 질환 온톨로지를 증식하는 단계는, 문서로부터 심혈관계 질환과 관련된 용어를 추출하여 군집화하는 단계; 및 상기 군집화한 용어를 상기 심혈관계 질환 온톨로지에 매핑하는 단계;를 포함할 수 있다.
이때, 상기 군집화 단계는, 키워드를 제공받는 단계, 구문 분석을 통해 상기 문서로부터 후보 용어를 추출하는 단계, 상기 키워드와 상기 후보 용어의 상관관계를 분석하는 단계 및 상기 상관관계 분석 결과, 상관관계 수치가 높은 용어를 추출하는 단계;를 포함하고, 상기 단계들을 군집이 생성될 때까지 반복할 수 있다.
또한, 상기 매핑 단계는, 상기 군집화된 후보 용어가 온톨로지의 클래스인지 서브클래스인지 판단하는 단계; 및 상기 판단된 후보 용어를 상기 심혈관계 질환 온톨로지에 포함된 복수의 클래스 중에서 대응하는 특정 클래스에 매핑하여 상기 심혈관계 질환 온톨로지를 증식하는 단계;를 포함할 수 있다.
또한, 상기 각각의 단계를 실행하기 위한 프록그램을 기록하는 컴퓨터로 판독 가능한 기록매체로 구현될 수 있다.
상기와 같은 목적으로 달성하기 위한, 본 발명의 제 2 실시예에 의한 심혈관계 질환 온톨로지 구축 장치는 심혈관계 질환의 종류, 증상, 치료법을 포함하는 질병 정보 및 심전도 정보를 분석하여 심혈관계 질환 온톨로지를 모델링하는 온톨로지 모델링 모듈; 문서로부터 심혈관계 질환과 관련된 온톨로지를 추출하여 상기 심혈관계 질환 온톨로지를 증식하는 온톨로지 증식 모듈; 및 상기 심혈관계 질환 온톨로지를 저장하는 온톨로지 데이터베이스를 포함한다.
여기서, 상기 온톨로지 모델링 모듈은, 상기 질병 정보를 분석하여 질병 온톨로지를 설정하는 질병 온톨로지 정의부; 및 상기 심전도 정보를 분석하여 심전도 온톨로지를 설정하는 심전도 온톨로지 정의부;를 포함할 수 있다.
이때, 상기 질병 온톨로지는, 상기 심혈관계 질환의 종류에 관련된 정보를 정의한 질병 종류 온톨로지와, 상기 심혈관계 질환의 종류에 의해 나타나는 증상들에 관련된 정보를 정의한 증상 온톨로지와, 상기 심혈관계 질환을 치료할 수 있는 방법을 정의한 치료법 온톨로지를 포함한다.
또한, 상기 심전도 온톨로지는, 파동 온톨로지, 구획 온톨로지, 간격 온톨로지 및 심박동수 변이 온톨로지를 포함한다.
한편, 상기 온톨로지 증식 모듈은, 구문 분석을 통해 문서로부터 심혈관계 질환과 관련된 용어를 추출하는 구문 분석기; 및 상기 추출된 용어를 상기 심혈관계 질환 온톨로지에 매핑하는 온톨로지 매퍼;를 포함할 수 있다.
상기와 같은 목적으로 달성하기 위한, 본 발명의 제 3 실시예에 의한 심혈관계 질환 진단 서비스 제공 시스템은 심혈관계 질환 증상을 포함하는 정보를 전송하는 적어도 하나 이상의 클라이언트; 및 심혈관계 질환의 종류, 증상, 치료법을 포함하는 질병 정보 및 심전도 정보를 분석하여 심혈관계 질환 온톨로지를 모델링하고, 문서로부터 심혈관계 질환과 관련된 온톨로지를 추출하여 상기 심혈관계 질환 온톨로지를 증식하고, 상기 수신되는 심혈관계 질환 증상을 포함하는 정보를 분석하여 결과를 상기 클라이언트에 전송하는 심혈관계 질환 진단 서버를 포함한다.
여기서, 상기 적어도 하나 이상의 클라이언트는 개인 사용자, 학교, 연구소 또는 병원 중 적어도 하나일 수 있다.
본 발명에 따른 심혈관계 질환 온톨로지 구축 장치가 심혈관계 질환의 진단 및 치료법과 같은 서비스를 제공할 수 있는 진단 지원 시스템에 적용됨으로써, 인터넷을 통하여 가정, 직장, 학교, 연구소, 병원 등에서 사용될 수 있고, 이에 의해, 전문가들의 지식을 공유하고, 환자에 대한 빠르고 정확한 진단을 가능하게 하는 협력적인 지식 공유를 가능하게 한다.
또한, 본 발명에 따른 심혈관계 질환 온톨로지 구축 장치가 진단 지원 시스템에 적용됨으로써, 환자들과 일반인들에게 건강상태에 대한 정보를 주고, 의료 서비스에 대한 의사결정을 도와 줄 수 있다.
이하 본 발명에 따른 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명에서는 구체적인 구성 요소 등과 같은 특정 사항들이 나타나고 있는데 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐 이러한 특정 사항들이 본 발명의 범위 내에서 소정의 변형이나 혹은 변경이 이루어질 수 있음은 이 기술분야에서 통상의 지식을 가진 자에게는 자명하다 할 것이다.
본 발명에 따른 일 실시 형태에 따른 심혈관계 질환 온톨로지 구축 장치 및 방법은 심혈관계 질병 발견을 위한 임상 의사 결정 지원 시스템의 한 부분으로써 활용될 수 있다. 따라서 상기 시스템의 신뢰성을 높이기 위해서는, 정교한 온톨로지 구축이 요구된다. 이에 본 발명에 따른 심혈관계 질환 온톨로지 구축 장치 및 방법은 심혈관계 질환의 관련 지식을 수집하고, 이를 기계 판독 및 기계에 의한 해석이 가능한 형태로 온톨로지가 모델링된다.
즉, 본 발명에 따른 심혈관계 질환 온톨로지 구축 장치 및 방법은, 먼저, 심혈관계 질환 진단을 위한 특정 분야의 지식을 제공하기 위해 심혈관계 질환 온톨로지를 모델링한다. 이때, 심혈관계 질환 온톨로지는 기계에 의한 판독과 해석이 용이한 형태로 정의된다. 그리고, 의학 문서들로부터 수집되는 새로운 심혈관계 질환 관련 지식들로부터 자동으로 온톨로지의 개체들을 증식한다. 특히, 의학 문서들로부터 지식을 추출하기 위해 지도 군집화 알고리즘을 사용한다.
이러한 본 발명의 일 실시 형태에 따른 심혈관계 질환 온톨로지 구축 장치 및 방법에 대하여 도면을 참조하여 상세하게 설명하도록 한다.
도 1은 본 발명의 일 실시예에 따른 심혈관계 질환 온톨로지 구축 장치의 대략적인 구성을 도시하는 블록도이다.
도 1을 참조하면, 심혈관계 질환 온톨로지 구축 장치(100)는 온톨로지 모델링 모듈(110), 온톨로지 DB(120) 및 온톨로지 증식 모듈(130)를 구비한다.
먼저, 온톨로지 모델링 모듈(110)은 심혈관계 질환 발견을 위한 진단 서비스를 제공하기 위해 필요한 정보들, 예컨대 심혈관계 질환의 종류, 증상 및 치료법 등을 분석하여 서비스 구축에 요구되는 온톨로지의 종류와 구조, 모델 등을 설계하고, 그에 따라 구축되어 있는 바이오 정보 온톨로지를 활용하거나 전문가의 분석을 통해 세부적으로 온톨로지를 구축하는 기능을 제공한다. 즉, 심혈관계 질환에 대해 온톨로지 기반의 기계 판독과 해석이 가능한 지식의 표현을 제공한다.
이러한 온톨로지 모델링 모듈(110)은 외부의 데이터베이스 또는 전문적 지식을 습득한 사용자가 별도로 생성하는 온톨로지를 수신할 수 있으며, 수신한 온톨로지를 편집할 수 있도록 프로그래밍된 편집 툴을 제공하고, 또는 사용자로부터의 입력에 대응하여 온톨로지를 생성하여 온톨로지 DB(120)에 저장하거나, 온톨로지 DB(120)에 저장된 온톨로지를 수정할 수 있다.
여기서, 온톨로지 DB(120)에 저장된 온톨로지는 도 2에 도시된 구조와 같이 예시될 수 있다. 도 2는 온톨로지 DB(120)에 저장된 온톨로지의 구성요소를 나타낸 블로도이다.
온톨로지 DB(120)에는 질병 온톨로지(Disease Ontology) 및 심전도 온톨로지(Electrocardiogram Ontology)를 포함하는 온톨로지가 저장될 수 있다.
그리고, 질병 온톨로지는 심혈관계 질병의 종류, 그에 따른 증상의 종류 및 치료법의 종류로 각각 모형화되며, 심전도 온톨로지는 파동(waves), 구획(segment), 간격(interval) 및 심박동수 변이로 모형화될 수 있다.
이러한 온톨로지 DB(120)에 저장된 온톨로지 형태에 대한 상세한 설명은 도 3 내지 5를 참조하여 설명하도록 한다. 도 3 내지 도 5는 온톨로지에 따른 클래스와 서브클래스의 관계를 예시한 도면이다.
다시 도 1을 참조하면, 온톨로지 모델링 모듈(110)은 먼저, 질병 온톨로지, 즉, 심혈관계 질병의 종류, 심혈관계 질병에 따른 증상의 종류 및 심혈관계 질병에 따른 치료법의 종류에 관련된 개념들을 정의한다.
사람의 몸에서 심장은 혈액, 혈관과 기타 조직들로 이루어진 가장 큰 순환계의 한 부분이다. 따라서 의학 분야에서 심혈관계 질병은 순환계 장애로 분류되고, 순환계 장애는 일반적인 질병으로 분류된다. 이러한 관계는 도 3에 도시된 바와 같이, 온톨로지 클래스들의 서브클래스 관계로 기술되며, 예컨대, Disease, Circulatory_System_Disorder 및 Heart_Disease이다.
그리고, 본 발명의 일실시 형태에서는, 심혈관계 질병의 종류가 많으나, 일반적인 질병만을 모형화한다. 예를 들어, 국소빈혈(Ischemia)은 조직의 혈액 공급 결핍과 관련된 아주 일반적인 심혈관계 질병으로써 Type A, Type B, Type C와 같이 여러 개의 종류로 이루어진다. 이들의 관계는 Heart_Disease, Ischemia, Ischemia_Type_A, Ischemia_Type_B, Ischemia_Type_C의 클래스들과 그들의 서브클래스 관계로 모형화된다. 다른 모든 종류의 심혈관계 질병들은 Other_form_of_Heart_Disease 클래스로 표현된다.
이처럼 정의된 심혈관계 질환의 종류는 질병 종류 온톨로지로 온톨로지 DB(120)에 저장된다.
그리고, 심혈관계 질환의 대부분은 각각 특정한 증상들을 가지고 있기 때문에 질병의 증상 규명 작업은 질병 진단의 중요한 부분이다. 따라서 온톨로지 모델 링 모듈(110)은 심혈관계 질환에 따른 증상들을 온톨로지로 모형화한다.
심혈관계 질환과 관련된 증상들을 온톨로지로 모형화하기에는 그 수가 너무 많지만, 모두 소화기 증상(digestive organ symptoms), 호흡기 증상(respiratory organ symptom) 및 신경기 증상(neurology respiratory organ symptoms)의 세 가지의 종류로 나누어진다.
세 가지 종류의 증상들은, 도 4에 도시된 바와 같이, 각각 Digestive_Organ_Symptom, Respiratory_Organ_Symptom, Neurology_Organ_Symptom과 같은 온톨로지 클래스들로 모형화 된다. 그리고, 이 세 가지 범주로 분류되지 않는 증상들은 General_Symptom 클래스로 모형화 된다. 그리고, Digestive_Organ_Symptom, Respiratory_Organ_Symptom, Neurology_Organ_Symptom, 및 General_Symptom의 증상 관련 온톨로지 클래스들은 일반적인 클래스인 Symptom의 서브클래스 관계로 기술된다. 이 경우, 본 발명의 일실시 형태에 따른 온톨로지는 모든 증상을 모형화하는 것이 아니라 아주 일반적이고, 도 3에서 모형화된 질병들과 관련된 증상들만을 모형화한다.
그리고, 온톨로지 모델링 모듈(110)은 정교한 질병 온톨로지를 모형화하기 위해서 심혈관계 질병에 따른 치료 방법들을 모형화한다. 즉, 질병 진단을 위해 가능한 치료 시술을 포함한다.
즉, 온톨로지 모델링 모듈(110)에 의해 정의된 치료법 온톨로지는 도 5에 도시된 바와 같이, Action 클래스의 서브클래스 TakingMechicine으로 모형화된다. 하지만, 본 발명에서는 온톨로지 클래스인 TakingMechicine을 이용해 의약품에 의한 치료법만을 구체적으로 기술하였지만, 차후에 가능한 치료법들의 문헌 조사와 전문가들의 도움을 통해 치료법 온톨로지를 증식시킬 수 있다.
그리고, 온톨로지 모델링 모듈(110)은 심전도 기반의 진단을 위해 핵심적인 부분으로써 심전도의 주요 특징들을 심전도 온톨로지로 모형화한다.
도 6은 심전도 신호의 기본적인 구조와 특징들을 나타낸 그래프이며, 이러한 심전도 신호의 기본적인 구조와 특징들을 온톨로지 모델링 모듈(110)에서는 모형화한다.
심전도 신호는 파동(wave), 구획(segment), 간격(interval)과 같은 구성 성분으로 이루어지며, 파동(waves), 구획(segment) 및 간격(interval)은 각각 여러 개의 요소들로 이루어질 수 있다.
도 7은 파동, 도 8는 구획, 도 9는 간격을 각각 모형화한 것을 예시한 도면이다. 심전도 신호는 도 7에 도시된 바와 같이, 파동 P, 파동 Q, 파동 R, 파동 S, 파동 T 및 파동 U의 6개의 파동으로 이루어진다. 이러한 파동들은 여러 종류의 구획과 간격을 형성한다. 예를 들어, 파동 p와 파동 R은 PR 간격과 PR 구획을 형성한다.
이러한 심전도 신호의 구성 성분은 Wave, Segment, Interval의 온톨로지 클래스들로 모형화되며, 그리고, 모든 개체들은 이러한 구성 요소 클래스들의 서브클래스로 모형화된다. 예를 들어, Wave_P로 모형화된 파동 P는 Wave 클래스의 서브클래스이다. 또한, 각각의 구성 요소들의 개체들은 비정상(abnormal)과 정상(normal)으로 분류된다. 예를 들어 Wave_P는 Normal_P와 Abnormal_P의 개체로 이루어진다.
이외에도 심전도는 그 구조로부터 파생되지 않은 다른 특징, 심박동수 변이(HRV, heart rate variability)을 갖는다. HRV는 심장의 박동 사이의 변화량이다. 심혈관계 질병은 HRV를 극단적으로 높거나 낮게 만든다. HRV와 그 변이들이 도 10과 같이 묘사되어 있다. HRV는 HRV 클래스로, 그들의 변이는 HRV 클래스의 서브클래스로 모형화된다.
이와 같이, 온톨로지 모델링 모듈(110)은 심혈관계 질환에 관련된 정보들을 기계 판독 및 해석 가능한 형태의 온톨로지로 모형화한다.
그리고, 심혈관계 질환 온톨로지 구축 장치(100)는 온톨로지 증식 모듈(130) 을 구비한다. 온톨로지 증식 모듈(130)은 의학 관련 문서들로부터 자동적으로 온톨로지의 개체를 생성하는 기능을 제공한다. 즉, 온톨로지 증식 모듈(130)은 의학 관련 문서들로부터 온톨로지를 추출할 수 있으며, 온톨로지 추출은 지도 군집화와 외부 지식 베이스를 이용한 구문 분석과정을 통해 이루어진다.
이러한 온톨로지 증식 모듈(130)은 도 1 및 도 11에 도시된 바와 같이, 문서 분석기(document analysis, 131)와 온톨로지 매퍼(ontology mapper, 132)를 구비한다.
문서 분석기(131)는 주어진 의학 문서들과 사용자가 제공한 키워드들에 기반하여 지도 군집화를 수행하여 온톨로지를 추출하기 위한 후보 용어들을 추출한다. 구체적으로, 문서 분석기(131)는 의학 관련 문서들로부터 후보 용어들을 추출한다. 그리고, 사용자로부터 제공된 키워드들과 추출한 후보 용어들의 상관관계를 측정하여 추출된 용어들을 군집화한다.
문서 분석기(131)의 지도 군집화 과정은 아래와 같은 기본적인 절차를 수행한다. 먼저, 사용자로부터 관심 분야에서 가장 중요하다고 생각되는 주요 용어들을 키워드로 제공받는다. 키워드가 입력되면, 의학 관련 문서를 구문 분석하고, 주어진 주요 키워드들과 가장 상호 관련된 후보 용어들을 추출한다. 그리고, 추출된 후보 용어들과 가장 상호 관련된 용어들을 다시 추출한다. 이러한 과정을 군집이 생 성될 때까지 반복한다.
문서 분석기(131)는 후보 용어를 추출하기 위해, 키워드와 후보 용어의 상관관계 수치를 측정할 수 있다. 기본적인 상관관계 분석은 통계학적이고 어휘적 분석을 통해 이루어진다.
문서 분석기(131)는 두 개의 용어들이 서로 높은 상관(Co-occurrence)값을 가질 때, 상관관계가 있다고 간주한다. 이러한 상관관계 분석 과정은, 입력된 키워드와 의학 관련 문서에서 구문 분석을 통해 추출된 용어의 상관값을 측정한다. 두 개의 용어들은 시소러스에서 특정한 관계가 있을 때 관계가 있다고 간주된다. 예를 들어, 본 과정은 유의어와 동음이의어를 확인하기 위해 WordNet을 효과적으로 사용할 수 있다. 그런 다음, 두 개의 용어들은 특정한 종류의 문장 구조를 따르면서 동시에 발생시에 그 문장에서 관계가 있다고 간주된다. 이 과정은 문장들을 해부하고 그들의 구조를 규명한다. 예를 들어, 분석과정이 "용어 A는 용어 B의 부분" 혹은 "용어 A는 용어 B와 C로 구성"과 같은 구조를 찾는다. 이러한 경우 용어 A, B, 그리고 C는 상관관계가 있다고 간주된다. 문서 분석기(131)는 이러한 상관관계 측정 방법 이외에도 언어 모델링과 같은 고급 언어 처리 기술을 사용할 수 있다.
문서 분석기(131)에서 후보 용어들의 군집화가 완료되면, 온톨로지 매퍼(ontology mapper)(132)는 생성된 군집들의 용어들을 온톨로지 모델링 모듈(110) 에 의해 정의된 온토롤지 요소에 매핑한다.
온톨로지 매퍼(132)는 해당 용어가 온톨로지의 개념인지 속성인지를 규명한다. 이러한 매핑 작업 이후에 온톨로지 개념들은 분류학적 계층 구조로 체계화되거나 속성의 분야 혹은 범위로 변환된다. 이 과정은 UMLS 메타시소러스와 UMLS 의미 네트워크와 같은 외부 지식 자원에 의존한다. UMLS 메타시소러스는 용어들 간의 분류학적 계층 관계를 찾기 위해 사용되고, UMLS 의미 네트워크는 속성 용어들을 규명하고 그러한 용어들을 속성의 분야와 범위에 매핑하는데 사용된다.
이와 같이, 온톨로지 증식 모듈(130)은 의학 관련 문서들로부터 추출된 용어들을 온톨로지 개념들로 조직화되고 분류학적 계층 관계나 개념들의 속성으로 매핑한다. 이러한 지식들은 기존에 미리 생성되었던 심혈관계 질환 온톨로지와 합쳐지게 되어 온톨로지가 증식되게 된다.
도 12은 본 발명의 일 실시예에 따른 심혈관계 온톨로지 구축 장치를 이용한 심혈관계 질환 진단 서비스 제공 시스템의 대략적인 구성을 도시하는 블록도이다.
심혈관계 질환 진단 서비스 제공 시스템은 통신망(200)을 통해 연결된 다수의 클라이언트(100) 및 심혈관계 질환 진단 서버(300)를 포함한다.
다수의 클라이언트(100)는 개인 사용자, 학교, 연구소 또는 병원일 수 있으 며, 사용자 단말(미도시)을 이용하여 심혈관계 질환 진단 서버(300)에 접속할 수 있으며, 이때, 증상을 포함하는 정보를 심혈관계 질환 진단 서버(300)에 전송하고, 이에 대한 분석결과를 제공받을 수 있다. 여기서, 사용자 단말은 통신망을 통해 심혈관계 질환 진단 서버(300)에 접속할 수 있는 통신장치를 구비한 개인용 컴퓨터, PDA, 이동통신 단말 등일 수 있다.
심혈관계 질환 진단 서버(300)는 서비스 제공을 위한 특화된 데이터베이스를 구축하고, 구축된 데이터베이스를 기반으로 심혈관계 질환 진단 서버를 제공한다. 이를 위하여, 심혈관계 질환 진단 서버(300)는 심혈관계 질환 온톨로지 구축부(310)를 구비한다.
심혈관계 질환 온톨로지 구축부(310)는 온톨로지 모델링 모듈(311), 온톨로지 DB(312) 및 온톨로지 증식 모듈(313)을 구비한다. 여기서, 심혈관계 질환 온톨로지 구축부(310)는 도 1 및 도 11과 관련하여 설명한 심혈관계 질환 온톨로지 구축 장치(100)와 동일하므로, 상세한 설명은 생략한다.
온톨로지 모델링 모듈(311)은 진단 서비스를 제공하기 위해 필요한 정보들, 예컨대 심혈관계 질환의 종류, 증상 및 치료법 등을 분석하여 서비스 구축에 요구되는 온톨로지의 종류와 구조, 모델 등을 모형화고, 이를 온톨로지 DB(312)에 저장한다.
온톨로지 DB(312)는 질병 온톨로지(Disease Ontology) 및 심전도 온톨로지(Electrocardiogram Ontology)를 포함하는 온톨로지가 저장될 수 있다. 그리고, 질병 온톨로지에는 심혈관계 질병의 종류, 그에 따른 증상의 종류 및 치료법의 종류로 모형화되며, 심전도 온톨로지는 파동(waves), 구획(segment), 간격(interval) 및 심박동수 변이로 모형화될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명이 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이와 균등하거나 또는 등가적인 변형 모두는 본 발명 사상의 범주에 속한다 할 것이다.
또한, 본 발명에 따른 장치는 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
도 1은 본 발명의 일 실시예에 따른 심혈관계 질환 온톨로지 구축 장치의 대략적인 구성을 도시하는 블록도이다.
도 2는 온톨로지 DB(120)에 저장된 온톨로지의 구성요소를 나타낸 블로도이다.
도 3 내지 도 5는 심혈관계 질환 온톨로지의 각 구성에 따른 클래스와 서브클래스의 관계를 예시한 도면이다.
도 6은 심전도 신호의 기본적인 구조와 특징들을 나타낸 그래프이다.
도 7은 심전도 신호의 파동, 도 8는 심전도 신호의 구획, 도 9는 심전도 신호의 간격 및 도 10은 심선도 신호의 HRV의 각각 클래스와 서브클래스의 관계로 모형화한 예시도이다.
도 11은 반자동 온톨리지 개체 생성 과정을 나타내는 구성도이다.
도 12는 심혈관계 질환 진단 서비스 제공 시스템의 대략적인 구성을 나타내는 도면이다.

Claims (22)

  1. 심혈관계 질환의 종류, 증상, 치료법을 포함하는 질병 정보 및 심전도 정보를 분석하여 심혈관계 질환 온톨로지를 모델링하는 단계; 및
    문서로부터 심혈관계 질환과 관련된 온톨로지를 추출하여 상기 심혈관계 질환 온톨로지를 증식하는 단계;를 포함하고,
    상기 심혈관계 질환 온톨로지를 모델링하는 단계는,
    상기 심혈관계 질환의 종류, 증상, 치료법을 포함하는 질병 정보를 분석하여 질병 온톨로지를 설정하는 단계; 및
    상기 심전도 정보를 분석하여 심전도 온톨로지를 설정하는 단계;를 포함하며,
    상기 질병 온톨로지는, 상기 심혈관계 질환을 순환계 장애로 분류한 질병 종류 온톨로지와, 상기 심혈관계 질환의 종류에 의해 나타나는 증상들에 관련된 정보를 정의한 증상 온톨로지와, 상기 심혈관계 질환을 치료할 수 있는 방법을 정의한 치료법 온톨로지를 포함하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 심전도 온톨로지는, 파동 온톨로지, 구획 온톨로지, 간격 온톨로지 및 심박동수 변이 온톨로지를 포함하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 방법.
  5. 제1항에 있어서,
    상기 심혈관계 질환 온톨로지를 증식하는 단계는,
    문서로부터 심혈관계 질환과 관련된 용어를 추출하여 군집화하는 단계; 및
    상기 군집화한 용어를 상기 심혈관계 질환 온톨로지에 매핑하는 단계;를 포함하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 방법.
  6. 제5항에 있어서,
    상기 군집화 단계는, 키워드를 제공받는 단계;
    구문 분석을 통해 상기 문서로부터 후보 용어를 추출하는 단계;
    상기 키워드와 상기 후보 용어의 상관관계를 분석하는 단계; 및
    상기 상관관계 분석 결과, 시소러스에 의해 관계가 있다고 판단되는 용어를 추출하는 단계;를 포함하며, 상기 단계들을 군집이 생성될 때까지 반복하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 방법.
  7. 제5항에 있어서,
    상기 매핑 단계는, 상기 군집화된 후보 용어가 온톨로지의 클래스인지 서브클래스인지 판단하는 단계; 및
    상기 판단된 후보 용어를 상기 심혈관계 질환 온톨로지에 포함된 복수의 클래스 중에서 대응하는 특정 클래스에 매핑하여 상기 심혈관계 질환 온톨로지를 증식하는 단계;를 포함하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 방법.
  8. 삭제
  9. 제1항에 있어서,
    상기 증상 온톨로지는 소화기 증상, 호흡기 증상, 신경기 증상 및 일반적인 증상으로 분류한 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 방법.
  10. 제1항에 있어서,
    상기 치료법 온톨로지는 의약품에 의한 치료로 분류한 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 방법.
  11. 청구항 제 1 항, 제 4 항 내지 제 7 항, 제 9 항 내지 제 10 항 중 어느 하나의 항에 의한 각각의 단계를 실행하기 위한 프로그램을 기록한 것을 특징으로 하는 컴퓨터로 판독 가능한 기록매체.
  12. 심혈관계 질환의 종류, 증상, 치료법을 포함하는 질병 정보 및 심전도 정보를 분석하여 심혈관계 질환 온톨로지를 모델링하는 온톨로지 모델링 모듈;
    문서로부터 심혈관계 질환과 관련된 온톨로지를 추출하여 상기 심혈관계 질환 온톨로지를 증식하는 온톨로지 증식 모듈; 및
    상기 심혈관계 질환 온톨로지를 저장하는 온톨로지 데이터베이스;를 포함하고,
    상기 온톨로지 모델링 모듈은, 상기 질병 정보를 분석하여 질병 온톨로지를 설정하는 질병 온톨로지 정의부; 및
    상기 심전도 정보를 분석하여 심전도 온톨로지를 설정하는 심전도 온톨로지 정의부;를 포함하며,
    상기 질병 온톨로지는, 상기 질병 온톨로지는, 상기 심혈관계 질환을 순환계 장애로 분류한 질병 종류 온톨로지와, 상기 심혈관계 질환의 종류에 의해 나타나는 증상들에 관련된 정보를 정의한 증상 온톨로지와, 상기 심혈관계 질환을 치료할 수 있는 방법을 정의한 치료법 온톨로지를 포함하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 장치.
  13. 삭제
  14. 삭제
  15. 제12항에 있어서,
    상기 심전도 온톨로지는, 파동 온톨로지, 구획 온톨로지, 간격 온톨로지 및 심박동수 변이 온톨로지를 포함하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 장치.
  16. 제12항에 있어서,
    상기 온톨로지 증식 모듈은, 구문 분석을 통해 문서로부터 심혈관계 질환과 관련된 용어를 추출하는 구문 분석기; 및
    상기 추출된 용어를 상기 심혈관계 질환 온톨로지에 매핑하는 온톨로지 매퍼;를 포함하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 장치.
  17. 제16항에 있어서,
    상기 구문 분석기는, 지도 군집화 알고리즘을 이용하는 것을 특징으로 하는 심혈관계 질환 온톨로지 구축 장치.
  18. 청구항 제12항, 제15항 내지 제17항 중 어느 한 항에 따른 심혈관계 질환 온톨로지 구축 장치; 및
    심혈관계 질환 증상을 포함하는 정보를 전송하는 적어도 하나 이상의 클라이언트를 포함하는 심혈관계 질환 진단 서비스 제공시스템.
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
KR1020090086812A 2009-09-15 2009-09-15 심혈관계 질환 온톨로지 구축 장치 및 방법 KR101145983B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090086812A KR101145983B1 (ko) 2009-09-15 2009-09-15 심혈관계 질환 온톨로지 구축 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090086812A KR101145983B1 (ko) 2009-09-15 2009-09-15 심혈관계 질환 온톨로지 구축 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110029230A KR20110029230A (ko) 2011-03-23
KR101145983B1 true KR101145983B1 (ko) 2012-05-15

Family

ID=43935139

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090086812A KR101145983B1 (ko) 2009-09-15 2009-09-15 심혈관계 질환 온톨로지 구축 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101145983B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102193272B1 (ko) * 2018-09-11 2020-12-22 인하대학교 산학협력단 당뇨병 치료를 위한 시맨틱스 지능형 임상결정 지원 시스템
KR20220153455A (ko) 2021-05-11 2022-11-18 한국전자통신연구원 표준 의학용어 및 비정형 텍스트 의학지식을 통한 의학 온톨로지 자동 증강 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070094188A1 (en) 2005-08-25 2007-04-26 Pandya Abhinay M Medical ontologies for computer assisted clinical decision support
US20080201280A1 (en) 2007-02-16 2008-08-21 Huber Martin Medical ontologies for machine learning and decision support
KR20090031017A (ko) * 2007-09-21 2009-03-25 삼성전자주식회사 데이터베이스 구축하는 방법 및 상기 데이터베이스를이용한 질병분석 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070094188A1 (en) 2005-08-25 2007-04-26 Pandya Abhinay M Medical ontologies for computer assisted clinical decision support
US20080201280A1 (en) 2007-02-16 2008-08-21 Huber Martin Medical ontologies for machine learning and decision support
KR20090031017A (ko) * 2007-09-21 2009-03-25 삼성전자주식회사 데이터베이스 구축하는 방법 및 상기 데이터베이스를이용한 질병분석 방법

Also Published As

Publication number Publication date
KR20110029230A (ko) 2011-03-23

Similar Documents

Publication Publication Date Title
Altaf et al. Applications of association rule mining in health informatics: a survey
Rector et al. A framework for modelling the electronic medical record
Saeed et al. Multiparameter Intelligent Monitoring in Intensive Care II: a public-access intensive care unit database
Chatterjee et al. An automatic ontology-based approach to support logical representation of observable and measurable data for healthy lifestyle management: Proof-of-concept study
CA2465706A1 (en) Patient data mining
Alonso et al. Evaluation of semantic similarity metrics applied to the automatic retrieval of medical documents: An UMLS approach
US20100094874A1 (en) Method and an apparatus for retrieving additional information regarding a patient record
Ambica et al. An efficient expert system for diabetes by naive Bayesian classifier
Choi et al. Longitudinal Healthcare Data Management Platform of Healthcare IoT Devices for Personalized Services.
Chen et al. Using data mining strategies in clinical decision making: a literature review
Yousef Big data analytics in health care: a review paper
Giuntini et al. Tracing the emotional roadmap of depressive users on social media through sequential pattern mining
Baglioni et al. A new framework for distilling higher quality information from health data via social network analysis
Qin et al. Improving early sepsis prediction with multi modal learning
KR101145983B1 (ko) 심혈관계 질환 온톨로지 구축 장치 및 방법
Promkot et al. The personalized traditional medicine recommendation system using ontology and rule inference approach
Canino et al. Feature selection model for diagnosis, electronic medical records and geographical data correlation
Ning et al. Evaluating semantic similarity between Chinese biomedical terms through multiple ontologies with score normalization: An initial study
Sampathkumar et al. Ontology-based visualization of healthcare data mined from online healthcare forums
Chignell et al. Nonconfidential patient types in emergency clinical decision support
El-Sappagh et al. A proposed SNOMED CT ontology-based encoding methodology for diabetes diagnosis case-base
Baralis et al. Digging deep into weighted patient data through multiple-level patterns
Anbarasi et al. Ontology based medical diagnosis decision support system
Safari et al. Complex analyses on clinical information systems using restricted natural language querying to resolve time-event dependencies
Landi et al. The evolution of mining electronic health records in the era of deep learning

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150429

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee