KR20110108998A - 개념격자에 기반한 의료용어 매핑 시스템 및 방법 - Google Patents

개념격자에 기반한 의료용어 매핑 시스템 및 방법 Download PDF

Info

Publication number
KR20110108998A
KR20110108998A KR1020100028524A KR20100028524A KR20110108998A KR 20110108998 A KR20110108998 A KR 20110108998A KR 1020100028524 A KR1020100028524 A KR 1020100028524A KR 20100028524 A KR20100028524 A KR 20100028524A KR 20110108998 A KR20110108998 A KR 20110108998A
Authority
KR
South Korea
Prior art keywords
term
node
medical
query
concept
Prior art date
Application number
KR1020100028524A
Other languages
English (en)
Inventor
김홍기
김응희
송승재
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020100028524A priority Critical patent/KR20110108998A/ko
Publication of KR20110108998A publication Critical patent/KR20110108998A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Child & Adolescent Psychology (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

다수의 의료기관에서 서로 관련 있게 사용되는 의료용어들에 대한 개념격자를 형성하여, 질의용어를 서로 관련 있는 의료용어로 매핑하는 개념격자 기반 의료용어 매핑 시스템 및 방법에 관한 것으로서, 각 의료기관에서 서로 관련 있게 사용되는 의료용어를 집합으로 입력받는 의료용어 수집부; 용어집합과 용어집합을 공통적으로 사용하는 의료기관 집합을 노드(이하 개념노드)로 구성하는 개념격자 그래프를 형성하되, 하위 개념노드의 용어 집합은 상위 개념노드의 용어 집합을 모두 상속하는 개념격자 형성부; 및 질의용어를 입력받아 상기 질의용어에 대하여 용어노드로 구성하는 관련용어 그래프를 생성하되, 용어노드는 개념격자 그래프의 개념노드 중 하나와 대응되는 질의그래프 생성부를 포함하고, 용어노드와 대응되는 개념노드는 질의용어를 포함하는 구성을 마련한다.
상기와 같은 개념격자 기반 의료용어 매핑 시스템 및 방법에 의하여, 의료기관에서 서로 관련 있게 사용되는 의료용어를 취합하여 의료용어 간의 사용관계를 자동으로 분석하여 그래프로 표시함으로써 의료용어 간에 내재되어 있는 관계를 직관적으로 추출할 수 있다.

Description

개념격자에 기반한 의료용어 매핑 시스템 및 방법 { A medical term mapping system based on the concept lattice and the method thereof }
본 발명은 다수의 의료기관에서 서로 관련 있게 사용되는 의료용어들에 대한 개념격자를 형성하여, 질의용어를 서로 관련 있는 의료용어로 매핑하는 개념격자 기반 의료용어 매핑 시스템 및 방법에 관한 것이다.
또한, 본 발명은 질의용어와 관련된 용어들을 용어노드로 표시되는 계층구조의 그래프로 구성하고, 질의용어를 루트노드로 하여 각 용어노드에 상위 용어노드의 관련성을 지지도 또는 확신도로 표시하는 개념격자 기반 의료용어 매핑 시스템 및 방법에 관한 것이다.
일반적으로 우리나라에서 사용되고 있는 상당수의 의학 용어가 외래어 또는 복잡한 한자어 상태로 사용되고 있다. 또한 의료인들 사이에서도 동일한 개념에 대해 여러 가지 용어를 사용함으로써 원활한 정보 소통에 문제가 발생하고 있다.
이점 때문에 의학이 일반인에게는 이해하기 어렵고 쉽게 접근하기 어려운 학문으로 인식되고 있으며 환자와 의료인 사이의 원활한 정보 전달에도 많은 어려움이 있다. 이러한 문제와 함께 의학 용어가 표준화되어 있지 않아 병원 간의 진료정보 교류가 쉽지 않은 문제가 대두되고 있다.
한편, 국제적으로도 의학 용어(또는 의료용어)에 대한 표준화가 많이 이루어지고 있으나, 의료분야가 가지는 복잡성으로 인해 표준화가 쉽지 않은 실정이다.
동일한 개념(질환)을 진료과 별로 다른 의학용어를 사용하여 표현하기도 하며, 같은 의학용어를 사용하더라도 사용처에 따라 다른 의미를 가지는 경우가 있다. 예를 들어, 우리가 ‘맹장염’이라 흔히 일컫는 질병은 ‘Appendicitis’라는 의학용어가 있음에도 상황에 따라 ‘충수돌기염’, ‘충수염’, ‘막창자꼬리염’, ‘맹장염’으로 일컬어지며, ‘Myocardial Infarction(심근경색)’ 역시 상황에 따라 ‘cardiac infarction’, ‘infarction of heart’, ‘MI’, ‘Heart Attack’ 등으로 일컬어진다. 반면에 ‘주소’의 경우, 원무과에서는 ‘Address’의 의미로 사용하지만, 진료실에서는 ‘Chief Complain(주호소)’의 의미로 사용한다.
상기와 같이 의료용어가 복잡한 것은 의료분야 자체의 복잡성에 기인한 것으로, 이러한 의료용어를 구분하고 의료진 사이의 의사소통이나 서로 다른 분야의 의사소통을 위하여 기준이 되는 참조용어체계(Reference Terminology)와 인터페이스 용어체계(Interface Terminology)가 필요하다.
더 나아가서, 각 임상 영역에서 필요로 하는 정보를 적시에 효율적으로 수집, 분석하기 위해서는 해당 임상영역에서 필요로 하는 지식을 정의하고, 도메인 특화된 규칙을 통하여 필요 지식들을 수집하는 용어 모형을 통하여 의미적 상호운용성을 확보하는 것이 필수적이다.
의료분야에서 사용되는 용어체계(Terminology System)란 특정 분야에서 사용되는 의학 개념의 집합이며, 개념에 대한 정의, 개념을 일컫는 용어, 개념 간의 관계 등을 포함하는 시스템이다. 의학용어 체계는 그 목적성과 특징에 따라, 참조용어(Reference terminology), 인터페이스용어(Interface terminology), 분류체계(Classification) 등으로 구분할 수 있으며, 임상현장에서 사용하는 의학용어를 로컬용어(Local Term)라 한다.
참조용어 체계(Reference terminology)는 의학개념과 그들 간의 관계(Inter-relationships)의 정형화된 표현의 집합을 말한다. 참조용어체계에는, SNOMED CT, RxNorm, NCI Thesaurus, ICNP 등이 있다.
인터페이스 용어 체계(Interface terminology)의 경우 의료전문가 및 임상지원 전문가가 임상문서 내 정보를 보다 수월하게 획득 및 수집하여 전달, 처리할 수 있도록 제안된 용어체계로, 의료진이 진료 기록 작성 시점에서 사용하는 모든 용어와 진료서식지 상에 있는 모든 용어들이 이에 해당한다. 인터페이스 용어체계는 특정 병원의 의료진이 특정 의학개념을 일컬을 때 사용하는 여러 형태의 용어들과 지식의 집합이라 할 수 있으며, 이는 의료진과 참조용어체계를 인터페이스 해주는 역할을 한다.
분류체계(Classification)는 특정 목적에 맞게 미리 정해진 분화 수준에서 자료를 통합하기 위해 모든 것을 망라하는 상호 배반적인 범주, 분류의 목적은 의료서비스의 통계나 연구를 수행하는데 사용하며, ICD(Internatioanl Classification of Disease), KCD(Korean Standard Classification of Disease) 등이 있다.
의학개념에 대한 정형화된 표현들의 집합인 참조용어체계가 있다고 하더라도, 각각 병원에서 다양한 분야의 의료진이 사용하는 로컬용어는 상이할 수밖에 없기 때문에 그 차이를 매워 주기 위해 매핑이라는 작업이 필요하다.
그러나 매핑 작업에서 가장 큰 걸림돌은 의료 현장에서 사용되는 로컬용어의 다양성이다. 즉, 한 병원 내에서도 진료과별로 의사별로 사용되는 로컬용어가 다르고 각 병원에서 관리되고 있는 로컬 용어들도 병원마다 다르다. 로컬용어는 직접 의사 등 의료진이 사용하고 있는 용어이고, 인터페이스 용어 체계는 로컬용어들을 모아서 의미를 부여하고 개념별로 정의하여 의학개념에 대한 상황정보를 탑재할 수 있도록 하는 용어체계 시스템으로서, 모두 의료현장에서 사용되는 용어이기 때문에 그 영향력이 매우 크다.
따라서 참조용어 체계가 의료개념을 아무리 잘 표현할 수 있도록 구성되었더라도 현장에서 사용되는 의학용어와의 차이는 현저하다. 한편, 참조용어 체계를 이용하고자 하는 궁극적 목표 중 하나는 의료현장에서 난립하는 용어들 간의 의미전달을 위한 것이다.
의료현장에서 사용되는 용어를 포괄할 수 있는 의료용어체계를 만드는 가장 좋은 방법 중 하나는 의료현장에서 사용되는 가장 지배적인 용어로 점차 통일화시켜 나가는 것이고, 이를 위해서 현재 의료현장에서 사용되는 용어들의 사용 현황을 알아야 하는 것이 매우 중요하다.
의료현장에서 가장 많이 사용되는 용어들이 무엇인지 알게 되면, 각 의료진 또는 의료기관들은 지배적인 용어들을 점차 이용하려고 할 것이고 쏠림현상에 의해 하나 또는 소수의 최적 용어로 수렴될 수 있을 것이다.
그러나 단순히 얼마나 많은 의료진이 사용한다는 것보다 더 중요한 것은 어떤 의미로 사용되고 있는지를 파악하는 것이다. 의료용어는 동일한 용어라도 다르게 사용될 수 있기 때문이다.
의료현장에서 사용되는 각 용어들의 의미를 일일이 파악하는 것은 거의 불가능하므로, 의료현장 용어들의 관계를 정량적으로 분석하여 의료용어 간에 내재되어 있는 관계를 직관적으로 추출할 수 있는 자동화된 분석기술이 절실하다.
본 발명의 목적은 상술한 바와 같은 문제점을 해결하기 위한 것으로, 서로 관련 있게 사용되는 의료용어들로부터 용어들 간의 관계를 분석함으로써 현장에서 사용되는 의료용어 간에 내재되어 있는 관계를 직관적으로 파악할 수 있는 개념격자 기반 의료용어 매핑 시스템 및 방법을 제공하는 것이다.
또, 본 발명의 목적은 다수의 의료기관에서 서로 관련 있게 사용되는 의료용어들에 대한 개념격자를 형성하여, 주어진 질의용어를 서로 관련 있는 의료용어로 매핑하는 개념격자 기반 의료용어 매핑 시스템 및 방법을 제공하는 것이다.
또, 본 발명의 목적은 질의용어와 관련된 용어들을 용어노드로 표시되는 계층구조의 그래프로 구성하고, 질의용어를 루트노드로 하여 각 용어노드에 상위 용어노드의 관련성을 지지도 또는 확신도로 표시하는 개념격자 기반 의료용어 매핑 시스템 및 방법을 제공하는 것이다.
상기 목적을 달성하기 위해 본 발명은 다수의 의료기관에서 사용되는 의료용어들에 대한 개념격자를 형성하여, 질의용어에 대한 특정관계를 가지는 의료용어로 매핑하는 것을 지원하는 개념격자 기반 의료용어 매핑 시스템에 관한 것으로서, 각 의료기관에서 서로 관련 있게 사용되는 의료용어를 집합으로 입력받는 의료용어 수집부; 용어집합과 상기 용어집합을 공통적으로 사용하는 의료기관 집합을 노드(이하 개념노드)로 구성하는 개념격자 그래프를 형성하되, 하위 개념노드의 용어 집합은 상위 개념노드의 용어 집합을 모두 상속하는 개념격자 형성부; 및 질의용어를 입력받아 상기 질의용어에 대하여 용어노드로 구성하는 관련용어 그래프를 생성하되, 상기 용어노드는 상기 개념격자 그래프의 개념노드 중 하나와 대응되는 질의그래프 생성부를 포함하고, 상기 용어노드와 대응되는 개념노드는 상기 질의용어를 포함하는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 시스템에 있어서, 상기 관련용어 그래프의 루트노드(이하 질의노드)는 상기 질의용어를 포함하는 최상위 개념노드와 대응되고, 자신의 용어로서 상기 질의용어를 포함하고, 상기 최상위 개념노드와 대응되지 않는 용어노드(이하 연관노드)는 자신에 대응되는 개념노드의 용어집합에서 자신의 모든 상위노드에 포함되는 용어들을 제외한 용어를 포함하고, 상기 연관노드 또는 상기 질의노드 사이의 상하위 노드 관계는 대응되는 개념노드 간의 상하위 노드 관계와 같은 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 시스템에 있어서, 상기 관련용어 그래프는 의료기관 집합이 적어도 하나의 원소를 가지는 개념노드에 대해서만 대응되는 용어노드로 구성하는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 시스템에 있어서, 상기 질의노드에 대응되는 개념노드의 용어집합이 상기 질의용어 이외 다른 의료용어를 포함하면, 상기 관련용어 그래프는 상기 다른 의료용어를 포함하는 용어노드(이하 함의노드)를 상기 질의노드의 하위노드로서 구성하되, 상기 함의노드는 상기 질의노드에 대응되는 개념노드와 대응되는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 시스템에 있어서, 상기 용어노드는 자신과 대응되는 개념노드의 의료기관 집합개수를 이용하여 계산된 지지도 또는 확신도를 가지는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 시스템에 있어서, 질의용어를 입력받고 상기 질의용어에 대한 관련 의료용어 간의 관계를 상기 질의용어의 관련용어 그래프로 표시하고, 각 용어노드의 상위 노드와의 관계 정도를 지지도 또는 확신도로 표시해주는 질의용어 표시부를 더 포함하는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 시스템에 있어서, 상기 질의용어 표시부는 상기 관련용어 그래프의 깊이에 따라 단계적으로 각 용어노드에 해당하는 의료용어 및 지지도 또는 확신도를 표시해주는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 시스템에 있어서, 상기 질의용어 표시부는 상기 관련용어 그래프에서 지지도 또는 확신도가 최소 지지도 또는 최소 확신도 이상인 용어노드만을 표시해주는 것을 특징으로 한다.
또한, 본 발명은 다수의 의료기관에서 사용되는 의료용어들에 대한 개념격자를 형성하여, 질의용어에 대한 특정관계를 가지는 의료용어로 매핑하는 것을 지원하는 개념격자 기반 의료용어 매핑 방법에 관한 것으로서, (a) 각 의료기관에서 서로 관련 있게 사용되는 의료용어를 집합으로 입력받는 단계; (b) 용어집합과 상기 용어집합을 공통적으로 사용하는 의료기관 집합을 노드(이하 개념노드)로 구성하는 개념격자 그래프를 형성하되, 하위 개념노드의 용어 집합은 상위 개념노드의 용어 집합을 모두 상속하는 단계; 및 (c) 질의용어를 입력받아 상기 질의용어에 대하여 용어노드로 구성하는 관련용어 그래프를 생성하되, 상기 용어노드는 상기 개념격자 그래프의 개념노드 중 하나와 대응되는 단계를 포함하고, 상기 용어노드와 대응되는 개념노드는 상기 질의용어를 포함하는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 방법에 있어서, 상기 관련용어 그래프의 루트노드(이하 질의노드)는 상기 질의용어를 포함하는 최상위 개념노드와 대응되고, 자신의 용어로서 상기 질의용어를 포함하고, 상기 최상위 개념노드와 대응되지 않는 용어노드(이하 연관노드)는 자신에 대응되는 개념노드의 용어집합에서 자신의 모든 상위노드에 포함되는 용어들을 제외한 용어를 포함하고, 상기 연관노드 또는 상기 질의노드 사이의 상하위 노드 관계는 대응되는 개념노드 간의 상하위 노드 관계와 같은 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 방법에 있어서, 상기 질의노드에 대응되는 개념노드의 용어집합이 상기 질의용어 이외 다른 의료용어를 포함하면, 상기 관련용어 그래프는 상기 다른 의료용어를 포함하는 용어노드(이하 함의노드)를 상기 질의노드의 하위노드로서 구성하되, 상기 함의노드는 상기 질의노드에 대응되는 개념노드와 대응되는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 방법에 있어서, 상기 용어노드는 자신과 대응되는 개념노드의 의료기관 집합개수를 이용하여 계산된 지지도 또는 확신도를 가지는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 방법에 있어서, 상기 방법은, (d) 질의용어를 입력받고 상기 질의용어에 대한 관련 의료용어 간의 관계를 상기 질의용어의 관련용어 그래프로 표시하고, 각 용어노드의 상위 노드와의 관계 정도를 지지도 또는 확신도로 표시해주는 질의용어 단계를 더 포함하는 것을 특징으로 한다.
또, 본 발명은 개념격자 기반 의료용어 매핑 방법에 있어서, 상기 (d)단계는 상기 관련용어 그래프의 깊이에 따라 단계적으로 각 용어노드에 해당하는 의료용어 및 지지도 또는 확신도를 표시해주는 것을 특징으로 한다.
또한, 본 발명은 상기 개념격자 기반 의료용어 매핑 방법을 수행하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
상술한 바와 같이, 본 발명에 따른 개념격자 기반 의료용어 매핑 시스템 및 방법에 의하면, 의료기관에서 서로 관련 있게 사용되고 있는 의료용어를 취합하여 의료용어 간의 사용관계를 자동으로 분석함으로써 의료용어 간에 내재되어 있는 관계를 직관적으로 추출할 수 있는 효과가 얻어진다.
한편, 현재 의료현장에서 사용되는 용어들의 사용 현황, 즉, 사용분포를 내포하여 관련 용어들의 관계를 표시해주거나 추천해주면, 의료현장에서 각 의료진 또는 의료기관들은 지배적인 용어를 선택하여 사용할 뿐만 아니라, 자신들이 판단하기에 의료개념을 가장 잘 표현하는 용어를 선택하게 될 것이다. 또한, 이들의 선택은 현장에서 사용되는 용어들의 관계에 영향(피드백)을 줄 것이다.
따라서 시간이 지남에 따라 용어간 적자생존에 의해 하나 또는 소수의 최적 용어로 쏠림현상이 일어날 것이고, 결과적으로, 다수의 의료진들이 서로 협력 혹은 경쟁을 통하여 얻게 되는 지적 능력에 의한 결과로 얻어진 집단적 능력인 집단지성(集團知性, Collective Intelligence)에 의해 최적 용어가 결정될 것이다. 이러한 과정은 향후 의료용어 표준화에도 크게 기여할 수 있다.
또한, 본 발명에 따른 개념격자 기반 의료용어 매핑 시스템 및 방법에 의하면, 각 의료기관에서 사용하고 있는 의료용어로 개념격자 그래프를 형성하고, 이를 기반으로 하여, 각 질의용어에 대한 관련용어 관계를 보다 빠르고 정확하게 도출할 수 있는 효과가 얻어진다. 즉, 의료용어의 개수와 의료기관의 수가 매우 많으므로 관련용어를 도출하는 과정이 매우 복잡하고 많은 시간이 소요될 수 있으나, 개념격자의 그래프 특성을 이용함으로써 계산량을 상당히 줄일 수 있다.
도 1은 본 발명을 실시하기 위한 전체 시스템의 구성을 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 개념격자 기반 의료용어 매핑 시스템의 구성에 대한 블록도이다.
도 3은 본 발명의 제1 실시예에 따른 의료기관에서 서로 관련 있게 사용하는 의료용어에 대한 형식문맥을 예시한 도면이다.
도 4는 본 발명의 제1 실시예에 따라 도 3의 형식문맥으로부터 추출한 개념을 예시한 도면이다.
도 5는 본 발명의 제1 실시예에 따른 개념격자 그래프를 예시도이다.
도 6은 본 발명의 제1 실시예에 따른 관련용어 그래프를 예시도이다.
도 7은 본 발명의 제1 실시예에 따라 생성된 관련용어 그래프를 이용하여 질의용어에 대한 관련용어의 지지도를 예시한 표이다.
도 8은 본 발명의 일실시예에 따른 개념격자 기반 의료용어 매핑 방법을 설명하는 흐름도이다.
도 9 본 발명의 일실시예에 따라 관련용어 그래프를 생성하는 알고리즘을 예시한 도면이다.
* 도면의 주요 부분에 대한 부호의 설명 *
10 : 의료기관 단말 20 : 네트워크
30 : 의료용어 매핑 시스템 31 : 의료용어 수집부
32 : 개념격자 형성부 33 : 질의그래프 생성부
34 : 질의용어 표시부 40 : 데이터베이스
41 : 개념격자DB 42 : 관련용어DB
이하, 본 발명의 실시를 위한 구체적인 내용을 도면에 따라서 설명한다.
또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.
먼저, 본 발명을 실시하기 위한 전체 시스템의 구성의 예들에 대하여 도 1을 참조하여 설명한다.
도 1a 또는 도 1b에서 보는 바와 같이, 본 발명에 따른 의료용어 매핑 시스템은 네트워크 상의 서버 시스템 또는 컴퓨터 단말 상의 프로그램 시스템으로 실시될 수 있다.
도 1a와 같이, 본 발명의 실시를 위한 전체 시스템의 일례는 의료기관 단말(10)과 의료용어 매핑 시스템(30)으로 구성되고 서로 네트워크(20)로 연결된다. 또, 필요한 데이터를 저장하기 위한 데이터베이스(40)를 더 구비할 수 있다.
의료기관 단말(10)은 의료인 또는 의료기관 관리자가 이용하는 PC, 노트북, 넷북, PDA, 모바일 등의 통상의 컴퓨팅 단말기이다. 의료인 등은 의료기관 단말(10)을 이용하여 자신의 의료기관에서 서로 관련 있게 사용하고 있는 다수의 의료용어들을 매핑 시스템(30)으로 전송하거나, 특정 의료용어(또는 질의용어)에 대한 관련용어들을 참조해줄 것을 매핑 시스템(30)에 요청한다.
의료용어 매핑 시스템(30)은 통상의 서버로서 네트워크(20)에 연결되어 질의된 용어에 대하여 관련 용어들을 검색하여 관련성을 보여주는 서비스를 제공하는 서버이다. 또, 매핑 시스템(30)은 각 의료기관들이 서로 관련 있게 사용되는 다수의 의료용어들을 등록할 수 있는 등록서비스를 제공한다. 매핑 시스템(30)은 상기 각 서비스들을 인터넷 상의 웹페이지로 제공하는 웹서버 또는 웹어플리케이션 서버 등으로 구현될 수 있다.
데이터베이스(40)는 매핑 시스템(30)에서 필요한 데이터를 저장하는 통상의 저장매체로서, 각 의료기관으로부터 수신한 의료용어로부터 형성한 개념격자 그래프, 또는 각 의료용어별로 이와 관련된 다른 관련 의료용어들을 계층구조의 관련용어 그래프 등을 저장한다.
도 1b와 같이, 본 발명의 실시를 위한 전체 시스템의 다른 예는 컴퓨터 단말(13)에 설치되는 프로그램 형태의 의료용어 매핑 시스템(30)으로 구성된다. 즉, 매핑 시스템(30)의 각 기능들은 컴퓨터 프로그램으로 구현되어 컴퓨터 단말(13)에 설치되어, 사용자(14)에 의해 각 의료기관들이 서로 관련 있게 사용되는 다수의 의료용어들을 컴퓨터 단말(13)의 입력장치를 통해 입력받아 등록하거나, 질의용어에 대한 관련용어들을 참조해줄 것을 요청받으면 그 결과를 컴퓨터 단말(13)의 출력장치를 통해 출력한다. 한편, 매핑 시스템(30)에서 필요한 데이터들은 컴퓨터 단말(13)의 하드디스크 등 저장공간에 저장되어 이용된다.
다음으로, 본 발명의 일실시예에 따른 개념격자 기반 의료용어 매핑 시스템의 구성을 도 2를 참조하여 설명한다.
도 2에서 보는 바와 같이, 본 발명의 일실시예에 따른 개념격자 기반 의료용어 매핑 시스템(30)은 의료용어 수집부(31), 개념격자 형성부(32), 및 질의그래프 생성부(33)를 포함하여 구성된다. 추가적으로, 질의용어 표시부(32)를 더 포함하여 구성될 수도 있다. 또한, 데이터를 저장하기 위한 데이터베이스(또는 저장공간)(40)를 더 포함하여 구성될 수 있다.
먼저, 의료용어 수집부(31)는 각 의료기관으로부터 서로 관련 있게 사용되는 의료용어를 집합으로 입력받는다. 동일한 의미로 사용되는 의료용어들도 하나의 서로 관련 있게 사용하는 의료용어들이다.
도 3a에서 보는 바와 같이, 병원A, B, C는 맹장염의 의미로, 맹장염(t-1), 어펜디시티스(Appendicitis)(t-2), 및 충수돌기염(t-4)으로 3가지를 사용하고 있고, 병원D는 맹장염(t-1) 및 어펜디시티스(t-2)의 2가지만 사용하고, 병원E는 맹장염(t-1) 및 막창꼬리염(t-3)의 2가지만 사용하고 있다. 즉, 의료용어 수집부(31)는 각 의료기관으로부터 도3a와 같은 의료용어 집합을 입력받는다.
다음으로, 개념격자 형성부(32)는 용어집합과 상기 용어집합을 공통적으로 사용하는 의료기관 집합을 노드(이하 개념노드)로 표시하고, 하위 개념노드의 용어 집합은 상위 개념노드의 용어 집합을 모두 상속하는 개념격자 그래프를 형성한다.
이하에서, 개념격자 그래프를 형성하는 방법과 그 특성들을 보다 구체적으로 설명한다.
각 의료기관에서 서로 관련 있게 사용되는 의료용어들은 다음 정의 1과 같이 형식문맥(Formal context)으로 정의할 수 있다.
[정의 1]
형식문맥 K=(G, M, I)는 의료기관 집합 G와 용어집합 M, 그리고 G와 M사이의 이항관계 I⊆G×M로 구성된다. 즉, G와 M의 원소들은 각각 해당 형식문맥의 의료기관들과 각 의료기관들이 사용할 수 있는 의료용어들을 나타낸다. 또한, 어떤 의료기관 g가 의료용어 m을 사용하는 경우, gIm 또는 (g, m) ∈ I 로 나타내며, g는 m을 사용한다는 것을 의미한다.
도 3b에서 보는 바와 같이, 형식문맥(Formal context)은 데이터 테이블 형태로 나타낼 수 있으며, 해당 표의 행과 열의 헤드부분은 각각 형식문맥를 구성하는 의료기관들과 의료용어들로 구성된다. 또한, 데이터 테이블의 각 셀에 대해서는, 해당 셀에 관련된 의료기관과 의료용어가 이항관계 I를 만족할 경우에는 X표시하고, 이외의 경우에는 빈 공란으로 남겨둔다.
이와 같은 형식문맥으로부터 서로 관련 있는 의료용어를 갖는 의료기관들을 클러스터링(Clustering)하여, 정보의 기본단위로서 연관개념들(Concepts)을 추출할 수 있다. 각 개념들은 (O, T)와 같은 형태의 쌍(pair)으로 정의되며, 보다 정형적인 정의는 정의 2와 같다.
[정의 2]
임의의 형식문맥 K=(G, M, I)에 대하여, O⊆G, T⊆M일 때, intent(O)=T ∧ extent(T)=O를 만족하는 (O, T)를 개념(formal concept)이라고 한다.
단, intent(O):={t∈M|∀o∈O:(o, t)∈I}=O',extent(T):={o∈G|∀t∈T:(o, t)∈I}=T'.
임의의 O⊆G에 대하여, intent(O)에 의해 O의 모든 의료기관들이 공통적으로 갖는 용어집합을 구할 수 있다. 예를 들면, 위의 도 3b의 형식문맥에 있어서, O={D, E}에 대하여, intent(O)={t-1, t-2, t3}이다. 한편, 임의의 T⊆M에 대하여, extent(T)에 의해 T의 의료용어들을 사용하는 의료기관들의 집합을 구할 수 있다. 예를 들면, T={t-1, t-2, t-4}에 대하여, extent(T)={A, B, C}이다.
즉, 각 개념들은 (O, T)와 같은 형태의 쌍(pair)으로 정의되며 특히, 의료기관 집합 O는 용어집합 T의 extent이며, 동시에, 용어집합 T는 의료기관 집합 O의 intent가 된다. 이와 같은 방법으로 형식문맥 K=(G, M, I)로부터 추출한 모든 개념들의 집합을 B(K):={(O, T)∈2G×2M|intent(O)=T∧ extent(T)=O}로 나타낸다. 도 3b의 형식문맥로부터 추출한 모든 개념들 B(K)는 도4와 같다. 이하에서, c1 내지 c5는 도 3b에 표기된 개념을 나타낸다.
위와 같이 주어진 형식문맥로부터 추출된 개념들은 extent 또는 intent를 토대로 상위-하위개념관계를 정의 3과 4 같이 정의할 수 있다.
[정의 3]
주어진 형식문맥의 임의의 개념 (O1, T1), (O2, T2)∈B(K)에 대하여, 상하위관계(Superconcept-Subconcept relation) (O1, T1)≤(O2, T2)는 일종의 반순서관계(partial order relation)로서 다음과 같이 정의된다.
(O1, T1)≤(O2, T2) ⇔ O1⊆O2(⇔ T1⊇T2).
[정의 4]
형식문맥 K=(G, M, I)에 존재하는 모든 개념 집합을 B(K)라 하고, 개념 (X1,Y1),(X2,Y2)∈B(K)에 대하여, (X1,Y1)<(X2,Y2)를 만족하고, (X1,Y1)<(X3,Y3)<(X2,Y2)를 만족하는 (X3,Y3)가 B(K)에 존재하지 않을 때, (X1,Y1)을 (X2,Y2)의 근접 하위 이웃(lower neighbor)이라 하고, (X2,Y2)를 (X1,Y1)의 근접 상위 이웃(upper neighbor)이라 하며 (X1,Y1)
Figure pat00001
(X2,Y2)라 표기한다.
형식문맥 K=(G, M, I)로부터 만들어진 모든 개념들 간의 상위-하위개념관계≤는 일종의 반순서관계(partial order relation)에 해당하며, 개념들 사이의 상하위관계에 의해 만들어진 계층적 개념구조를 개념격자(Concept Lattice 또는 Galois Lattice)라고 부르고 L:=(B(K), E≤)과 같이 표현한다.
도 3b에 기술된 형식문맥로부터 추출된 개념과 개념간의 상하위관계 정보를 담고 있는 개념격자를 그래프를 사용하여 도 5와 같이 표시할 수 있다. 그래프의 각 노드는 개념노드를 표시하고, 개념노드의 상위에 위치한 레이블은 개념노드의 의료용어(또는 intent)를, 하위에 위치한 레이블은 개념노드의 의료기관(또는 extent)을 각각 나타낸다. 즉, 개념격자 그래프는 용어집합과 상기 용어집합을 공통적으로 사용하는 의료기관 집합을 노드(이하 개념노드)로 표시한다.
상기 정의 3과 4에서 보는 바와 같이, 하위 개념노드는 자신의 상위 개념노드의 의료용어들을 모두 포함한다. 즉, 하위 개념노드의 용어 집합은 상위 개념노드의 용어 집합을 모두 상속한다. 반대로 상위 개념노드는 자신의 하위 개념노드의 의료기관을 모두 포함한다.
다음으로, 형식문맥(Formal Context)에서의 용어집합(또는 속성집합) 간의 관계 및 관계에 대한 특성을 설명한다.
먼저, 용어집합 간의 함의관계는 정의 5와 같이 정의된다.
[정의 5]
주어진 형식문맥 K=(G, M, I)의 임의의 두 의료용어 Q, R⊆M 이, extent(Q)⊆extent(R)를 만족하는 경우, "Q는 R을 함의한다."라고 부르며, Q⇒R로 표기한다.
임의의 Q, R⊆M에 대하여, extent(Q)와 extent(R)에 의해서 의료용어 Q와 R을 사용하는 병원들을 각각 구할 수 있다. 예를 들어, 도 3b의 형식문맥에 있어서, Q={t-4}, R={t-1, t-2}이라 하면 extent(Q)={A, B, C}, extent(R)={A, B, C, D}를 각각 구할 수 있으며, 이는 extent(Q)⊆extent(R)를 만족하므로, Q⇒R, 즉 {t-4}⇒{t-1, t-2}가 성립함을 알 수 있다. 다시 말해, 도 3b에 주어진 형식문맥의 데이터로부터 "충수돌기염을 사용하는 병원은 맹장염과 어펜티시티스도 역시 사용한다."라는 추가적인 정보를 추출해 낼 수 있다.
형식문맥에서의 용어집합 간의 연관관계를 지지도 및 확신도에 의해 정의 6과 같이 정의된다.
[정의 6]
주어진 형식문맥 K=(G, M, I)의 임의의 두 의료용어 Q, R⊆M 이,
Figure pat00002
≥minsup 와
Figure pat00003
≥minconf 를 만족하는 경우
Q는 R과 연관된다 라고 하며, Q→Rminsup,minconf 로 표기한다. 단 minsup, miconf∈[0, 1].
정의6에서 언급된
Figure pat00004
Figure pat00005
는, 각각 연관관계 Q→R의 지지도(support)와 확신도(confidence)라고 부르며, 특히, minsup(Minimum Support: 최소 지지도)와 minconf(Minimum Confidence: 최소 확신도)는 집합 Q가 R과 갖는 연관관계를 바라보는 분석가의 주관적인 경계값(Threshold)이다. 먼저 minsup는 Q와 R 사이에 존재하는 관계가 전체 의료기관들 중 적어도 얼마나 되는 의료기관 사이에서 성립할 경우에, 이 두 집합 간의 연관관계를 인정할 것인가에 대한 경계 값이다. 그리고 minconf는 Q라는 의료용어를 사용하는 병원 중 적어도 얼마나 되는 병원이 R이라는 의료용어 역시 가질 때, Q는 R과 연관관계에 있다고 판단 할 것인지에 대한 경계 값이다.
예를 들어, 표 2의 context에 있어서, Q={t-2}, R={t-4}이라 하고, minsup=0.5, minconf=0.7이라 하면, |extent({t-2, t-4})|/|G|=0.6≥minsup, |extent({t-2, t-4})|/|extent({t-2})|=0.75≥minconf 이므로, Q→R 즉, 50%이상의 지지도와 70%이상의 확신도에서 {t-4}→{t-2}는 성립한다고 할 수 있다. 이를 문맥상 '어펜티시티스를 사용하는 병원 중 70% 이상이 충수돌기염을 사용하는 경향을 보이며, 이러한 현상은 전체 병원 중 50% 이상의 병원으로부터 관찰된다' 라고 해석할 수 있다. 특히, minsup=0, minconf=1인 경우의 연관관계는 곧 함의관계를 나타내므로, 함의관계는 연관관계의 특수한 경우라 할 수 있다.
다음으로, 질의그래프 생성부(33)는 용어노드로 구성하는 관련용어 그래프를 생성하되, 상기 용어노드는 상기 개념격자 그래프의 개념노드 중 하나와 대응된다. 이때, 상기 용어노드와 대응되는 개념노드는 상기 질의용어를 포함한다. 질의용어는 사용자(또는 의료인)에 의해 질의되는 용어로서, 관련용어 그래프는 질의용어 마다 별도로 생성된다.
도 6은 도 5의 개념격자 그래프를 이용하여 생성한 관련용어 그래프로서, 도 6a는 질의용어 t-1에 대한 관련용어 그래프이고, 도 6b는 질의용어 t-2에 대한 관련용어 그래프이다.
관련용어 그래프는 개념격자 그래프를 활용하여 질의용어에 대한 함의관계 및 연관관계를 추출하고, 가중치가 부여된 비순환 유방향성 그래프(또는 트리구조의 그래프)로 가시화하여 표현되는 그래프이다. 즉, 주어진 질의 Q에 대해서, 적합한 함의관계 Q⇒R과 연관관계 Q→Rminsup, minconf를 만족하는 'R'에 관련된 제반 정보를 개념격자 그래프로부터 추출하여 표시하는 그래프이다.
관련용어 그래프에서, 루트노드(이하 질의노드)는 상의 질의용어를 포함하고 상기 질의용어를 포함하는 최상위 개념노드와 대응된다. 상기 질의노드는 정의 7에 의하여 구해진다.
[정의 7]
형식문맥 K=(G, M, I)에 대한 질의Q⊆M이 주어졌을 때, Q⊆Y를 만족하는 임의의 개념(X, Y)∈B(K)에 대해서, {(X1, Y1)∈B(K)|(X, Y)
Figure pat00006
(X1,Y1)∧Q⊆Y1}=
Figure pat00007
인 경우, 개념(X, Y)을 질의 Q에 적합한 개념이라고 부르고, (Q, (X, Y))를 질의 Q에 대한 질의노드라고 정의한다.
이하에서 보듯이, 관련용어 그래프의 용어노드는 정의 7의 질의노드와 같이 "(Q, (X, Y))"의 형태로 표현된다. 이하에서, 용어노드가 (Q, (X, Y))인 경우, "용어노드는 개념노드 (X, Y)에 대응된다."라고 표현하기로 한다. 또, "용어노드의 용어는 Q이다." 또는 "용어노드는 (용어로서) Q를 포함한다."라고 표현하기로 한다. 또한, "용어노드 (Q, (X, Y))"를 간단하게 "용어노드 Q"로도 표시하기로 한다.
예를 들어 도 3b의 형식문맥에 대하여, 질의 Q={t2}라 할 때, (X, Y)=({A, B, C}, {t-1, t-2, t-4})=c2라 하면, Q⊆Y는 만족하지만, {(X1, Y1)∈B(K)|c2
Figure pat00008
(X1,Y1)∧Q⊆Y1}={c3}≠
Figure pat00009
이므로 c2는 질의 {t2}에 적합한 개념이라 할 수 없다. 반면 (X, Y)=({A, B, C, D}, {t-1, t-2})=c3라 하면, Q⊆Y를 만족하고 {(X1, Y1)∈B(K)|c4
Figure pat00010
(X1,Y1)∧Q⊆Y1}=
Figure pat00011
이므로, 개념 c3을 질의 {t2}에 적합한 개념이라 할 수 있으며 ({t2}, ({A, B, C, D}, {t-1, t-2))를 질의 {t2}에 대한 질의노드라 할 수 있다.
도 6a에서 용어노드 {t-1}이 질의노드이고, 용어노드 {t-1}은 개념노드 c4=({A, B, C, D, E}, {t-1})에 대응된다. 또, 6b에서 용어노드 {t-2}가 질의노드이고, 개념노드 ({A, B, C, D}, {t-1, t-2})에 대응된다.
한편, 관련용어 그래프에서 질의노드는 네모로 표시하기로 한다.
또한, 상기 질의노드에 대응되는 개념노드의 용어집합이 상기 질의용어 이외 다른 의료용어를 포함하면, 상기 관련용어 그래프는 상기 다른 의료용어를 포함하는 용어노드(이하 함의노드)를 상기 질의노드의 하위노드로서 구성하되, 상기 함의노드는 상기 질의노드에 대응되는 개념노드와 대응된다. 상기 함의노드를 다음 정의 8에 의해 구해진다.
[정의 8]
형식문맥 K=(G, M, I)에서, 임의로 주어진 질의 Q⊆M에 대한 질의노드(Q, (X, Y))에 대하여, Q≠Y ∧
Figure pat00012
≥minsup∈[0, 1]인 경우, (Y\Q, (X, Y))를 질의 Q에 대한 함의노드라 정의한다.
함의관계를 표현하는 함의노드를 정의함에 있어 경계 값인 minsup을 반영하는 이유는, 앞서 개념격자의 설명에서 언급했듯이, 함의관계는 연관관계의 특수한 경우이기 때문이다. 즉 고유한 의미의 함의관계를 반영하는 함의노드는 minsup=0인 경우라 할 수 있다. 반면 함의관계를 표현하는 함의노드를 정의함에 있어, minconf를 반영하지 않은 이유는 다음과 같다. 질의 Q에 적합한 개념을 (X, Y)∈B(K)라 할 때, Q≠Y가 성립하여 함의노드가 존재할 경우, 정의2에 의하여, 항상 extent(Q)⊆extent(Q\Y), 다시 말해 Q⇒Q\Y를 만족하므로, 즉 minconf=1이므로 고려하지 않는다.
예를 들어 도 3b의 형식문맥에 대하여, 질의 Q={t2}, minsup=0.4일 때, 질의 Q에 적합한 개념은 c3이며, 질의노드는 ({t2}, c3)이다. 또한 질의 {t2}가 c3의 intent인 {t1, t2}와 같지 않으며, |{A, B, C, D}|/|G|=0.8≥minsup이므로, 질의 {t2}에 대한 함의노드는 ({t1}, ({A, B, C, D}, {t1, t2}))라고 할 수 있다.
도 6b에서 용어노드 {t-1}이 함의노드이고, 이 용어노드는 개념노드 ({A, B, C, D}, {t1, t2})에 대응된다.
또한, 질의용어를 포함하되 최상위가 아닌 개념노드와 대응되는 용어노드(이하 연관노드)는 자신에 대응되는 개념노드의 용어집합에서 자신의 모든 상위노드에 포함되는 용어들을 제외한 용어를 포함한다. 그리고 상기 연관노드 또는 상기 질의노드 사이의 상하위 노드 관계는 대응되는 개념노드 간의 상하위 노드 관계와 같다. 이때, 관련용어 그래프는 의료기관 집합이 적어도 하나의 원소를 가지는 개념노드에 대해서만 대응되는 용어노드로 구성한다. 구체적으로, 상기 연관노드는 정의 9에 의해 구해진다.
[정의 9]
형식문맥 K=(G, M, I)에 대한 주어진 질의 Q⊆M에 적합한 개념이 (X, Y)∈B(K) 일 때, 임의의 (X1, Y1), (X2, Y2)∈B(K)가, (X1, Y1)<(X, Y) ∧ (X2, Y2)≤(X, Y) ∧ (X1, Y1)
Figure pat00013
(X2, Y2)를 만족하고,
Figure pat00014
≥minsup,
Figure pat00015
≥minconf 이면, (Y1\Y2, (X1, Y1))를 질의Q에 대한 연관노드이다 라고 정의한다. 단 minsup, minconf∈[0, 1].
주어진 질의 Q에 적합한 개념이 (X, Y)라면, (X1, Y1)<(X, Y) 관계에 있는 개념 (X1, Y1)의 extent인 X1은, 정의 3에 의해, Y⊃Q를 의료용어로 가지면서 Y1\Y를 추가 의료용어를 사용하는 의료기관의 집합이라 할 수 있다. 이때, 정의 3(상하위관계)과 정의 4(근접하위이웃 및 근접상위이웃)를 활용하여, 주어진 질의Q와 연관관계에 있는 의료용어를 도출해 낼 수 있다. 즉, 관련용어 그래프의 용어노드 간의 상하위 노드 관계는 대응되는 (개념노드 그래프의) 개념노드 간의 상하위 노드 관계와 같다.
예를 들어 도 3b의 형식문맥에 대하여, 질의 Q={t1}, 경계 값 minsup=0.1, minconf=0.25이라 하면, 질의 {t1}에 적합한 개념은 c4가 된다. 이때 (X1, Y1)=c2, (X2, Y2)=c3이라 하면, c3<c4, c2≤c4, c2
Figure pat00016
c3을 만족하며, |X1|/|G|=0.6≥minsup, |X1|/|X|=0.6≥minconf가 성립하므로, Y1\Y2={t-1, t-2, t-4}\{t-1, t-2}={t-4}가 된다. 즉, Q={t1}이고, minsup=0.1, minconf=0.25인 경우, ({t-4}, ({A, B, C}, {t-1, t-2, t-4}))를 연관노드라 할 수 있다.
지금까지 정의한, 형식문맥 K(G, M, I)에 주어진 질의 Q⊆M, 각 경계 값 minsup, minconf에 대한, 질의노드, 함의노드 및 연관노드는, (Y*,(X,Y))와 같은 형태로 일반화하여 나타낼 수 있다(단, (X, Y)∈B(K), Y*⊆Y).
이 때, Y*를 용어노드의 용어(또는 레이블), (X, Y)를 용어노드에 대응되는 개념(Concept) 또는 개념노드라 하며, 모든 노드들의 집합을 N(KQ)minsup,minconf라 표기하며, 이들 노드로부터 구성되는 그래프를 관련용어 그래프라 한다. 이하에서 용어노드를 표시하는 방식 중 하나로 레이블(또는 용어노드의 용어)로 표시한다.
도 6a 및 도 6b는 각각 질의용어 {t1}과 {t2}에 대한 관련용어 그래프이고, 질의노드는 네모난 노드로, 함의노드는 마름모꼴 노드로, 연관노드는 원형 노드로 표시된다.
다음으로, 질의용어 표시부(34)는 질의용어를 입력받고 상기 질의용어에 대한 관련 의료용어 간의 관계를 상기 질의용어의 관련용어 그래프로 표시하고, 각 용어노드의 상위 노드와의 관계 정도를 지지도로 표시한다. 바람직하게는, 각 용어노드에 포함된 의료용어 및 가중치를 표시해준다. 바람직하게는 가중치는 지지도를 표시해준다.
바람직하게는, 용어노드에 전체 사용주체의 개수 대비 대응되는 개념노드의 사용주체들의 개수(사용주체 집합의 원소 개수)의 비율을 지지도로 표시한다. 또, 질의노드에 대응되는 개념노드의 사용주체들의 개수 대비 자신과 대응되는 개념노드의 사용주체들의 개수의 비율을 확신도로 표시한다.
용어노드 간의 연관관계를 정의 10에 의해 구해진다.
[정의 10]
형식문맥 K=(G, M, I)에 주어진 질의 Q⊆M, minsup, minconf에 관한 두 노드 n1=(Y1*,(X1,Y1)), n2=(Y2*,(X2,Y2))∈N(KQ)minsup,minconf 에 대하여 수학식 1과 같은 조건을 만족하면 n1은 n2와 질의 Q에 대해 연관관계에 있다고 정의하고 r(n1,n2)로 표기한다.
[수학식 1]
Figure pat00017

또한, 용어노드 간의 연관관계에 대한 관계 가중치는 정의 11과 같이 정의된다.
[정의 11]
형식문맥 K=(G, M, I)에 주어진 질의 Q⊆M, minsup, minconf에 관한 두 노드 n1=(Y1*,(X1,Y1)),n2=(Y2*,(X2,Y2))∈N(KQ)minsup,minconf에 대하여, 관계 r=(n1,n2)∈R이 존재할 때, 관계 r의 가중치를 W(r) = (
Figure pat00018
,
Figure pat00019
)라 정의하며,
Figure pat00020
를 관계 r의 지지도(support),
Figure pat00021
를 관계 r의 확신도(confidence)라 각각 정의한다.
정의 11에 의한 관계 가중치인 지지도 또는 확신도를 용어관련 그래프에 각 용어노드에 표시한다. 관련용어 그래프는 트리형태의 비선형 그래프이므로 n2는 항상 하나의 관계 r=(n1,n2)만을 갖는다. 따라서 r=(n1,n2)의 가중치를 노드 n2에 기재한다.
도 6a 또는 도 6b는 관련용어 그래프에 가중치로서 지지도를 표시하고 있다(확신도는 생략함). 즉, 용어노드 {t-1}에서 용어노드 {t-2}로의 연관관계의 지지도(또는 노드 t-2에서 지지도)는 |{A, B, C, D}|/|G|=80%이고, 용어노드 {t-1}에서 용어노드 {t-3}로의 연관관계의 지지도(또는 노드 t-3에서 지지도)는 |{E}|/|G|=20%이다.
도 6a의 관련용어 그래프에서, 용어노드 {t-1} 표로 나타낸 것이 도 7과 같다.
한편, 바람직하게는, 질의용어 표시부(34)는 관련용어 그래프의 깊이에 따라 단계적으로 각 용어노드에 해당하는 의료용어 및 지지도를 표시해준다. 예를 들어, 도 7과 같이, 도 6a의 관련용어 그래프를 깊이 순서에 따라 순위를 두어 순차적으로 의료용어 및 지지도를 표시해준다.
[정의 12]
형식문맥 K=(G, M, I), Q⊆M, minsup, minconf∈[0, 1]에 대한 용어관련그래프 (N(KQ)minsup,minconf, R)에 대하여, 임의의 순서집합(Ordered set)을 P={n1,n2,n3,…,nm}⊆N(KQ)minsup,minconf라 할 때, n1∈P의 용어는 Q이고, 1≤k≤m-1를 만족하는 k에 대하여, 모든 nk, nk+1∈P에 있어, r(nk,nk+1)∈R을 만족할 때, 순서집합 P를 관련용어 그래프의 해석 경로라 정의하며, 'n1의 용어→ n2의 용어∧...∧nm의 용어' 이라 해석한다. 또한 해석 경로 P의 가중치는 r(nm-1,nm)∈R 의 가중치라 정의한다.
도 6a에 표현된 관련용어 그래프의 해석 경로의 한 예를 살펴보면 다음과 같다. 용어노드는 각각 n1=({t-1},({A,B,C,D,E}, {t-1})), n2=({t-2},({A,B,C,D}, {t-1, t-2})), n3=({t-4},({A,B,C}, {t-1, t-2, t-4}))이다. 이를 보다 문맥에 맞게 해석하면, '맹장염을 사용하는 의료기관은 어펜티시티스와 충수돌기염을 사용하는 경향이 있다' 라고 해석할 수 있다.
또한 수치정보인 가중치 정보를 부과하여 해석하면 '맹장염를 사용하는 병원 중 25% 이상(정확히 60%)의 병원이 어펜티시티스와 충수돌기염을 사용하는 경향이 있다.' 라고 해석할 수 있다.
다음으로, 본 발명의 일실시예에 따른 개념격자 기반 의료용어 매핑 방법을 도 8과 도 9을 참조하여 설명한다.
도 8에서 보는 바와 같이, 먼저, 각 의료기관에서 서로 관련 있게 사용되는 의료용어를 집합으로 입력받아(S10), 용어집합과 상기 용어집합을 공통적으로 사용하는 의료기관 집합을 노드(이하 개념노드)로 구성하는 개념격자 그래프를 형성한다(S20). 이때, 하위 개념노드의 용어집합은 상위 개념노드의 용어집합을 모두 상속한다.
다음으로, 질의용어를 입력받아(S30), 질의용어에 대하여 용어노드로 구성하는 관련용어 그래프를 생성한다(S40). 이때, 상기 용어노드는 상기 개념격자 그래프의 개념노드 중 하나와 대응되도록 구성하고, 상기 용어노드와 대응되는 개념노드는 상기 질의용어를 포함하도록 관련용어 그래프를 구성한다. 관련용어 그래프를 생성하는 구체적인 방법은 도 9에서 보는 바와 같다.
상기 관련용어 그래프는 다음과 같이 형성한다. 상기 관련용어 그래프의 루트노드(이하 질의노드)는 상기 질의용어를 포함하는 최상위 개념노드와 대응되고, 자신의 용어로서 상기 질의용어를 포함하도록 구성한다. 상기 최상위 개념노드와 대응되지 않는 용어노드(이하 연관노드)는 자신에 대응되는 개념노드의 용어집합에서 자신의 모든 상위노드에 포함되는 용어들을 제외한 용어를 포함한다. 그리고 상기 연관노드 또는 상기 질의노드 사이의 상하위 노드 관계는 대응되는 개념노드 간의 상하위 노드 관계와 같이 구성한다.
또한, 상기 질의노드에 대응되는 개념노드의 용어집합이 상기 질의용어 이외 다른 의료용어를 포함하면, 상기 관련용어 그래프는 상기 다른 의료용어를 포함하는 용어노드(이하 함의노드)를 상기 질의노드의 하위노드로서 구성하되, 상기 함의노드는 상기 질의노드에 대응되는 개념노드와 대응되게 구성한다.
또한, 상기 용어노드의 지지도는 전체 의료기관의 개수 대비 대응되는 개념노드의 의료기관 집합개수의 비율로 구해진다. 또, 상기 용어노드의 확신도는 질의노드에 대응되는 개념노드의 사용주체들의 개수 대비 자신과 대응되는 개념노드의 사용주체들의 개수의 비율로 구해진다.
그리고 질의용어를 입력받고 상기 질의용어에 대한 관련 의료용어 간의 관계를 상기 질의용어의 관련용어 그래프로 표시하고, 각 용어노드의 상위 노드와의 관계 정도를 지지도로 표시한다(S50). 바람직하게는, 상기 관련용어 그래프의 깊이에 따라 단계적으로 각 용어노드에 해당하는 의료용어 및 지지도를 표시한다.
상기 개념격자 기반 의료용어 매핑 방법 중 생략된 부분은 앞서 설명한 개념격자 기반 의료용어 매핑 시스템의 설명을 참조한다.
이상, 본 발명자에 의해서 이루어진 발명을 상기 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시 예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.
본 발명은 다수의 의료기관에서 서로 관련 있게 사용되는 의료용어들에 대한 개념격자를 형성하여, 질의용어를 서로 관련 있게 사용되는 의료용어로 매핑하는 의료용어 매핑 시스템을 개발하는 데 적용이 가능하다.
특히, 본 발명은 질의용어와 관련된 용어들을 용어노드로 표시되는 계층구조의 그래프로 구성하고, 질의용어를 루트노드로 하여 각 용어노드에 상위 용어노드의 관련성을 지지도로 표시하는 의료용어 매핑 시스템을 개발하는 데 유용하다.

Claims (15)

  1. 다수의 의료기관에서 사용되는 의료용어들에 대한 개념격자를 형성하여, 질의용어를 관련 있는 의료용어로 매핑하는 것을 지원하는 개념격자 기반 의료용어 매핑 시스템에 있어서,
    각 의료기관에서 서로 관련 있게 사용되는 의료용어를 집합으로 입력받는 의료용어 수집부;
    용어집합과 상기 용어집합을 공통적으로 사용하는 의료기관 집합을 노드(이하 개념노드)로 구성하는 개념격자 그래프를 형성하되, 하위 개념노드의 용어 집합은 상위 개념노드의 용어 집합을 모두 상속하는 개념격자 형성부; 및
    질의용어를 입력받아 상기 질의용어에 대하여 용어노드로 구성하는 관련용어 그래프를 생성하되, 상기 용어노드는 상기 개념격자 그래프의 개념노드 중 하나와 대응되는 질의그래프 생성부를 포함하고,
    상기 용어노드와 대응되는 개념노드는 상기 질의용어를 포함하는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 시스템.
  2. 제1항에 있어서,
    상기 관련용어 그래프의 루트노드(이하 질의노드)는 상기 질의용어를 포함하는 최상위 개념노드와 대응되고, 자신의 용어로서 상기 질의용어를 포함하고,
    상기 최상위 개념노드와 대응되지 않는 용어노드(이하 연관노드)는 자신에 대응되는 개념노드의 용어집합에서 자신의 모든 상위노드에 포함되는 용어들을 제외한 용어를 포함하고,
    상기 연관노드 또는 상기 질의노드 사이의 상하위 노드 관계는 대응되는 개념노드 간의 상하위 노드 관계와 같은 것을 특징으로 하는 개념격자 기반 의료용어 매핑 방법.
  3. 제1항에 있어서,
    상기 관련용어 그래프는 의료기관 집합이 적어도 하나의 원소를 가지는 개념노드에 대해서만 대응되는 용어노드로 구성하는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 시스템.
  4. 제2항에 있어서,
    상기 질의노드에 대응되는 개념노드의 용어집합이 상기 질의용어 이외 다른 의료용어를 포함하면, 상기 관련용어 그래프는 상기 다른 의료용어를 포함하는 용어노드(이하 함의노드)를 상기 질의노드의 하위노드로서 구성하되, 상기 함의노드는 상기 질의노드에 대응되는 개념노드와 대응되는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 시스템.
  5. 제2항에 있어서,
    상기 용어노드는 자신과 대응되는 개념노드의 의료기관 집합개수를 이용하여 계산된 지지도 또는 확신도를 가지는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 시스템.
  6. 제5항에 있어서, 상기 시스템은,
    질의용어를 입력받고 상기 질의용어에 대한 관련 의료용어 간의 관계를 상기 질의용어의 관련용어 그래프로 표시하고, 각 용어노드의 상위 노드와의 관계 정도를 지지도 또는 확신도로 표시해주는 질의용어 표시부를 더 포함하는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 시스템.
  7. 제6항에 있어서,
    상기 질의용어 표시부는 상기 관련용어 그래프의 깊이에 따라 단계적으로 각 용어노드에 해당하는 의료용어 및 지지도 또는 확신도를 표시해주는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 시스템.
  8. 제6항에 있어서,
    상기 질의용어 표시부는 상기 관련용어 그래프에서 지지도 또는 확신도가 최소 지지도 또는 최소 확신도 이상인 용어노드만을 표시해주는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 시스템.
  9. 다수의 의료기관에서 사용되는 의료용어들에 대한 개념격자를 형성하여, 질의용어에 대한 특정관계를 가지는 의료용어로 매핑하는 것을 지원하는 개념격자 기반 의료용어 매핑 방법에 있어서,
    (a) 각 의료기관에서 서로 관련 있게 사용되는 의료용어를 집합으로 입력받는 단계;
    (b) 용어집합과 상기 용어집합을 공통적으로 사용하는 의료기관 집합을 노드(이하 개념노드)로 구성하는 개념격자 그래프를 형성하되, 하위 개념노드의 용어 집합은 상위 개념노드의 용어 집합을 모두 상속하는 단계; 및
    (c) 질의용어를 입력받아 상기 질의용어에 대하여 용어노드로 구성하는 관련용어 그래프를 생성하되, 상기 용어노드는 상기 개념격자 그래프의 개념노드 중 하나와 대응되는 단계를 포함하고,
    상기 용어노드와 대응되는 개념노드는 상기 질의용어를 포함하는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 방법.
  10. 제9항에 있어서,
    상기 관련용어 그래프의 루트노드(이하 질의노드)는 상기 질의용어를 포함하는 최상위 개념노드와 대응되고, 자신의 용어로서 상기 질의용어를 포함하고,
    상기 최상위 개념노드와 대응되지 않는 용어노드(이하 연관노드)는 자신에 대응되는 개념노드의 용어집합에서 자신의 모든 상위노드에 포함되는 용어들을 제외한 용어를 포함하고,
    상기 연관노드 또는 상기 질의노드 사이의 상하위 노드 관계는 대응되는 개념노드 간의 상하위 노드 관계와 같은 것을 특징으로 하는 개념격자 기반 의료용어 매핑 방법.
  11. 제10항에 있어서,
    상기 질의노드에 대응되는 개념노드의 용어집합이 상기 질의용어 이외 다른 의료용어를 포함하면, 상기 관련용어 그래프는 상기 다른 의료용어를 포함하는 용어노드(이하 함의노드)를 상기 질의노드의 하위노드로서 구성하되, 상기 함의노드는 상기 질의노드에 대응되는 개념노드와 대응되는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 방법.
  12. 제10항에 있어서,
    상기 용어노드는 자신과 대응되는 개념노드의 의료기관 집합개수를 이용하여 계산된 지지도 또는 확신도를 가지는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 방법.
  13. 제12항에 있어서, 상기 방법은,
    (d) 질의용어를 입력받고 상기 질의용어에 대한 관련 의료용어 간의 관계를 상기 질의용어의 관련용어 그래프로 표시하고, 각 용어노드의 상위 노드와의 관계 정도를 지지도 또는 확신도로 표시해주는 질의용어 단계를 더 포함하는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 방법.
  14. 제13항에 있어서,
    상기 (d)단계는 상기 관련용어 그래프의 깊이에 따라 단계적으로 각 용어노드에 해당하는 의료용어 및 지지도 또는 확신도를 표시해주는 것을 특징으로 하는 개념격자 기반 의료용어 매핑 방법.
  15. 제9항 내지 제14항 중 어느 한 항의 개념격자 기반 의료용어 매핑 방법을 수행하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020100028524A 2010-03-30 2010-03-30 개념격자에 기반한 의료용어 매핑 시스템 및 방법 KR20110108998A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100028524A KR20110108998A (ko) 2010-03-30 2010-03-30 개념격자에 기반한 의료용어 매핑 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100028524A KR20110108998A (ko) 2010-03-30 2010-03-30 개념격자에 기반한 의료용어 매핑 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20110108998A true KR20110108998A (ko) 2011-10-06

Family

ID=45026375

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100028524A KR20110108998A (ko) 2010-03-30 2010-03-30 개념격자에 기반한 의료용어 매핑 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20110108998A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018084682A1 (ko) * 2016-11-07 2018-05-11 경희대학교 산학협력단 의료 데이터의 매핑 방법, 장치 및 컴퓨터 프로그램
CN109804437A (zh) * 2016-10-11 2019-05-24 皇家飞利浦有限公司 以患者为中心的临床知识发现系统
WO2021015360A1 (ko) * 2019-07-23 2021-01-28 에스케이씨코오롱피아이 주식회사 폴리이미드 분말의 제조방법 및 이를 통해 제조된 폴리이미드 분말
CN115964472A (zh) * 2021-12-03 2023-04-14 奥码哈(杭州)医疗科技有限公司 一种icd编码方法、icd编码查询方法、编码系统和查询系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109804437A (zh) * 2016-10-11 2019-05-24 皇家飞利浦有限公司 以患者为中心的临床知识发现系统
CN109804437B (zh) * 2016-10-11 2024-06-11 皇家飞利浦有限公司 以患者为中心的临床知识发现系统
WO2018084682A1 (ko) * 2016-11-07 2018-05-11 경희대학교 산학협력단 의료 데이터의 매핑 방법, 장치 및 컴퓨터 프로그램
KR20180050885A (ko) * 2016-11-07 2018-05-16 경희대학교 산학협력단 의료 데이터의 매핑 방법, 장치 및 컴퓨터 프로그램
KR101878217B1 (ko) * 2016-11-07 2018-07-13 경희대학교 산학협력단 의료 데이터의 매핑 방법, 장치 및 컴퓨터 프로그램
JP2020504355A (ja) * 2016-11-07 2020-02-06 ユニバーシティ−インダストリー コーポレーション グループ オブ キョンヒ ユニバーシティ メディカルデータのマッピング方法、装置およびコンピュータプログラム
US11366822B2 (en) 2016-11-07 2022-06-21 University-Industry Cooperation Group Of Kyung Hee University Method, apparatus and computer program for mapping medical data
WO2021015360A1 (ko) * 2019-07-23 2021-01-28 에스케이씨코오롱피아이 주식회사 폴리이미드 분말의 제조방법 및 이를 통해 제조된 폴리이미드 분말
CN115964472A (zh) * 2021-12-03 2023-04-14 奥码哈(杭州)医疗科技有限公司 一种icd编码方法、icd编码查询方法、编码系统和查询系统

Similar Documents

Publication Publication Date Title
Gutiérrez-Salcedo et al. Some bibliometric procedures for analyzing and evaluating research fields
Wang et al. A novelty detection patent mining approach for analyzing technological opportunities
Altaf et al. Applications of association rule mining in health informatics: a survey
Arvor et al. Ontologies to interpret remote sensing images: why do we need them?
Zenuni et al. State of the art of semantic web for healthcare
WO2022116430A1 (zh) 基于大数据挖掘的模型部署方法、装置、设备及存储介质
Ferrari et al. Pragmatic ambiguity detection in natural language requirements
Dalrymple et al. Quantifying the contribution of Plasmodium falciparum malaria to febrile illness amongst African children
US20120221589A1 (en) Method and system for selecting, retrieving, visualizing and exploring time-oriented data in multiple subject records
JP6830068B2 (ja) 意味的にカテゴライズされたタイムラインを表示するための装置、システム及び方法
CN106068509A (zh) 患者发现的以发现为中心的纵视图的自动创建
US20160070751A1 (en) Database management system
CN109074858A (zh) 没有明显准标识符的去识别的健康护理数据库的医院匹配
Khan et al. Development of national health data warehouse for data mining.
KR20110108998A (ko) 개념격자에 기반한 의료용어 매핑 시스템 및 방법
Qudsi et al. Predictive data mining of chronic diseases using decision tree: A case study of health insurance company in Indonesia
Liang et al. PF2RM: a power fault retrieval and recommendation model based on knowledge graph
Shigarov Table understanding: Problem overview
Safaei Text-based multi-dimensional medical images retrieval according to the features-usage correlation
Al-Ani et al. Artificial intelligence guidance of advanced heart failure therapies: A systematic scoping review
Yu et al. Temporal case matching with information value maximization for predicting physiological states
Saleem Durai et al. An intelligent knowledge mining model for kidney cancer using rough set theory
Albogamy et al. Decision support system for predicting survivability of hepatitis patients
Dai et al. Exploring the emerging trends of spatial epidemiology: a scientometric analysis based on CiteSpace
Lou et al. Low-cost similarity calculation on ontology fusion in knowledge bases

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application