KR20170135333A - 공통 용어체계 기반 의료용어 번역 시스템 - Google Patents

공통 용어체계 기반 의료용어 번역 시스템 Download PDF

Info

Publication number
KR20170135333A
KR20170135333A KR1020160067096A KR20160067096A KR20170135333A KR 20170135333 A KR20170135333 A KR 20170135333A KR 1020160067096 A KR1020160067096 A KR 1020160067096A KR 20160067096 A KR20160067096 A KR 20160067096A KR 20170135333 A KR20170135333 A KR 20170135333A
Authority
KR
South Korea
Prior art keywords
term
concept
medical
target
language
Prior art date
Application number
KR1020160067096A
Other languages
English (en)
Other versions
KR102385531B1 (ko
Inventor
송승재
Original Assignee
주식회사 라이프시맨틱스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 라이프시맨틱스 filed Critical 주식회사 라이프시맨틱스
Priority to KR1020160067096A priority Critical patent/KR102385531B1/ko
Publication of KR20170135333A publication Critical patent/KR20170135333A/ko
Application granted granted Critical
Publication of KR102385531B1 publication Critical patent/KR102385531B1/ko

Links

Images

Classifications

    • G06F17/289
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F17/2809
    • G06F17/3066
    • G06F19/32
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

원시 언어로 표시된 질의용어를 목적 언어로 표시되는 대역용어로 번역하는, 공통 용어체계 기반 의료용어 번역 시스템에 관한 것으로서, 적어도 1개의 표시용어를 포함하는 개념과, 상기 개념들간의 관계로 구성되는 참조 용어체계를 구성하여 저장하되, 상기 표시용어는 중간 언어로 표시되는 참조용어 관리부; 원시 언어의 용어(이하 원시용어) 또는 목적 언어의 용어(이하 목적용어)를 개념의 표시용어로 대응시킨 문서를 참조하여, 상기 원시용어 또는 목적용어와 해당 개념 사이를 매핑시키는 대역관계 설정부; 원시 언어로 표시된 질의용어에 대하여 목적 언어로 표시된 대역용어를 선정하되, 상기 질의용어와 매핑되는 개념(이하 중간 개념)을 추출하고, 상기 중간 개념 또는 상기 중간 개념과 관계를 갖는 개념과 매핑되는 목적용어를 검색하여, 검색된 목적용어를 상기 대역용어로 선정하는 대역용어 검색부; 및, 상기 질의용어에 대한 대역용어를 상기 대역용어 검색부를 통해 선정하게 하고, 상기 대역용어를 제공하는 질의용어 처리부를 포함하는 구성을 마련한다.
상기와 같은 시스템에 의하여, 질의용어의 대역용어로 사용할 목적용어가 의학용어 번역사전에 나타나지 않더라도, 질의용어에 가장 적절하게 대역될 수 있는 대역용어를 찾아 번역할 수 있다.

Description

공통 용어체계 기반 의료용어 번역 시스템 { A translation system for for medical terms based on the common terminology }
본 발명은 개념들을 구조적으로 구성한 참조 용어체계를 이용하여 원시 언어로 작성된 의료용어(또는 원시 의료용어)를 목적 언어로 기재되는 의료용어(또는 목적 의료용어)로 번역하는 공통 용어체계 기반 의료용어 번역 시스템에 관한 것이다.
특히, 본 발명은 참조 용어체계를 개념과 그들간의 관계로 구성되도록 온톨로지 형태로 구성하고, 원시 의료용어 또는 목적 의료용어와 개념 사이에 매핑관계를 의학용어 번역사전과 웹 문서를 참조하여 구성하는, 공통 용어체계 기반 의료용어 번역 시스템에 관한 것이다.
의학지식도 언어로 표현되며, 이때 사용되는 것이 의학용어이다. 우리가 사용하는 언어와 같이, 의학용어는 의학지식을 체계화하고 규칙을 만들고, 또 한정 짓는다. 모든 의료행위는 기록을 남기게 되는데, 그것이 진료기록이다. 진료기록은 의학용어의 집합이다. 진료기록은 환자가 내원하면서부터, 내원한 이유가 해소될 때까지의 환자 상태, 의료진이 행한 검사, 진단, 처치, 수술 등 모든 행위와 그에 따른 환자의 신체 반응 내지는 상태를 담고 있을 뿐 아니라, 임상적으로 유의한 내원 전 과거 이력까지 포함하고 있다. 이러한 이유로, 의료 현장에서 진료기록이 가지는 의미는 상당하다.
한편, 진료기록은 의료진이 사용하는 의료용어를 기반으로 구성되어 있다. 하지만 의료진이 사용하는 의료용어는 국가별, 지역별, 병원별, 학파별로 상이한 것이 현실이다. 이에 대한 기준을 제시하는 것이 참조용어체계로, 특정 사실에 대한 명확한 개념을 정하고, 이 개념을 표현하는 다양한 의료용어들을 속성값으로 포함하고 있다. 또한, 일부 참조용어체계는 용어들 간의 관계 정의 정보까지 제공하는 특징을 가진다.
이러한 진료기록은 하나의 국가 내에 다수의 의료기관들 사이에 서로 전달되기도 한다. 예를 들어, 환자가 1차 의료기관에서 진료를 받다가 3차 의료기관으로 옮기는 경우, 1차 의료기관에서 작성된 진료된 진료기록이 1차 의료기관에서 3차 의료기관으로 전달되기도 한다. 또한, 3차 의료기관 간에도 진료기록 전달이 이루어지고 있다.
한편, 최근에는, 의료관광객의 수가 폭발적으로 증가하면서 관련 산업의 규모도 의미 있는 증가 곡선을 그리고 있다. 의료관광객의 경우, 의료관광을 마치고 귀국한 후에 의료관광 시의 진료기록을 확인하기가 매우 어려운 것이 현실이다. 진료기록을 확보하지 못할 경우, 의료사고나 귀국 후 부작용 발생 시 대처하기가 곤란하다. 여러 이유로, 적지 않은 국가에서 의료관광사증 발급 시에 본국의 진료기록을 요구하고 있고, 의료관광 후 본국의 귀국심사 시에도 진료기록을 요구하는 경우가 적지 않다.
이와 같이 진료기록 번역에 대한 현장의 요구는 지속적으로 증가하고 있으나, 일부 건강검진기관이나 국제진료센터를 제외하고, 진료기록 번역은 번역회사에 용역을 주어 진행하는 수준을 넘지 못하고 있는 것이 현실이다. 자동번역시스템이나 번역한 상용구 세트를 활용한 진료기록 번역이 시도되고 있으나, 일선 의료기관에서 사용되고 있는 의료용어의 다양성을 지원하는데, 많은 기술적 어려움을 겪고 있다.
진료기록 번역은 단순히 의료용어 사전 또는 의학 전문용어 사전을 이용하여 원시 의료용어를 목적 의료용어로 단순히 전환하여 번역할 수 없다. 그 이유는 의료용어는 국가별로 서로 다르게 사용될 수 있기 때문이다. 또한, 의료용어가 세부적으로 매우 방대하고 복잡하기 때문에, 원시 의료용어에 해당하는 목적 의료용어가 일대일로 대칭되지 않는다. 뿐만 아니라, 의료용어가 일반적으로 사용되는 것이 아닐 경우 해당되는 목적 의료용어 자체가 존재하지 않을 수도 있다.
상기와 같은 문제점을 해결하고자, 의료용어 등 전문용어를 번역하는 기술들이 제시되고 있다. 의료번역 데이터를 의뢰 종류별로 미리 저장하여 의료용어를 번역하는 기술[특허문헌 1], 빈번히 등장하는 용어를 사전에 구축하여 번역을 수행하는 기술[특허문헌 2] 등이 제시되고 있다. 또한, 원시언어 또는 목적언어로 작성된 대량의 문서인 코퍼스에 기반해서 고빈도 중복 어휘 문자열 및 용례에 따른 해당 도메인의 구문 번역 패턴 및 문장 번역 패턴을 추출하여 번역하는 기술도 제시되고 있다[특허문헌 3]. 또한, 중간언어를 이용하여 원시언어-목적언어 용어 리스트를 작성하여 번역하는 기술 등이 제시되고 있다[특허문헌 4].
그러나 상기 선행기술들은 전문용어 사전을 이용하여 번역하거나, 단순히 원시언어와 목적언의 의료용어 간에 매칭되는 리스트를 구비하여 의료용어를 번역한다. 따라서 상기 선행기술들은 모든 의료용어들을 원시언어에서 목적언어로 매칭하는 것이 어렵고 이로인해 사실상 정확한 번역이 어렵다. 이것은 의료용어가 세부적으로 보면 그 내용이 너무 방대하고 다양하게 사용되고 있기 때문이다.
한편, 진료기록 문서에 기재되는 의료용어의 개념을 명확히 하기 위해 참조용어체계(Reference terminology)들이 개발되어 사용되고 있다. 즉, 의료인들 사이에서도 동일한 개념에 대해 여러 가지 용어를 사용함으로써 원활한 정보 소통에 문제가 발생한다. 이를 위해, 특정 의료분야에서 사용되는 의학 개념의 집합, 개념에 대한 정의, 개념을 일컫는 용어, 개념 간의 관계 등을 포함하는 용어체계(Terminology System)가 개발되고 있으며, 그 목적성과 특징에 따라, 참조용어체계(Reference terminology), 인터페이스용어체계(Interface terminology) 등이 있다. 참조용어체계(Reference terminology)는 의학개념과 그들 간의 관계(Inter-relationships)의 정형화된 표현의 집합으로서, SNOMED CT, RxNorm, NCI Thesaurus, ICNP 등이 있다.
의학개념에 대한 정형화된 표현들의 집합인 참조용어체계가 있다고 하더라도, 각 국가의 의료기관에서 다양한 분야의 의료진이 사용하는 해당 국가의 용어는 상이할 수밖에 없기 때문에 그 차이를 매워 주기 위해 매핑이라는 작업이 필요하다.
또한, 의료용어에 대한 개념들이 체계화되더라도 의료 데이터(또는 진료기록)를 명확하게 이해하기 위해서는, 그 개념들이 어떻게 사용되고 있는지를 파악해야 한다. 예를 들어, 임상문서의 혈압이 동맥혈압이고 수축기 혈압인지 이완기 혈압인지가 파악되었다면, 그 혈압이 어떤 상태에서 측정된 데이터인지 기술해야 한다. 또, 환자의 증상 또는 진단의 내용을 보다 명확하게 기술하기 위해서는 그 경중, 위치 등을 보다 상세히 표현해야 한다.
즉, 하나의 의료 데이터는 의료용어(또는 개념) 뿐만 아니라 그 데이터가 만들어진 상황정보도 알아야 한다. 그러나 동일한 의료용어라도 의료진 또는 의료기관에 따라 상황정보는 매우 달라질 수 있다. 1차 의료기관에서는 혈압을 측정하여 단지 수축기 혈압과 이완기 혈압의 수치만 기재하면 되나, 3차 의료기관은 수축기 혈압과 이완기 혈압의 수치뿐만 아니라, 측정수단, 측정부위, 측정자세 등에 대해 세부적으로 기재할 수도 있다. 측정 상황에 따라 그 측정결과는 미세한 차이가 있을 수 있기 때문이다.
따라서 의료전문가 및 임상지원 전문가가 임상문서 내 정보를 보다 수월하게 보다 정확하게 번역할 수 있도록 이러한 상황정보도 포함하여 처리할 수 있어야 한다.
한국공개특허 10-22011-0112495 (2011.10.13.공개) 한국공개특허 10-2007-0059869 (2007.06.12.공개) 한국공개특허 10-2007-0058950 (2007.06.11.공개) 한국공개특허 10-2011-0062867 (2011.06.10.공개)
본 발명의 목적은 상술한 바와 같은 문제점을 해결하기 위한 것으로, 공통 언어로 작성된 참조 용어체계를 구성하고, 원시 의료용어와 가장 높게 매칭되는 참조 용어체계의 개념을 검색하고, 검색된 개념과 매칭되는 목적 의료용어를 검색하여, 상기 원시 의료용어를 상기 목적 의료용어로 번역하는, 공통 용어체계 기반 의료용어 번역 시스템을 제공하는 것이다.
또, 본 발명의 목적은 참조 용어체계를 개념과 그들간의 관계로 구성되도록 온톨로지 형태로 구성하고, 원시 의료용어 또는 목적 의료용어와 개념 사이에 매핑관계를 의학용어 번역사전과 웹 문서를 참조하여 구성하는, 공통 용어체계 기반 의료용어 번역 시스템을 제공하는 것이다.
특히, 본 발명의 목적은 원시 언어 또는 목적 언어와 참조 용어체계의 중간 언어 간의 의학용어 번역사전에서 대역 관계로 나타나면 원시/목적 의료용어와 참조 용어 사이에 동일 매핑을 설정하고, 의료 웹 문서 등에 동시에 나타나면 유사 매핑을 설정하여, 유사 매핑의 용어가 동일 매핑의 개념와 계층 관계가 있는 경우 유사 매핑의 용어를 대역용어로 사용하는, 공통 용어체계 기반 의료용어 번역 시스템을 제공하는 것이다.
상기 목적을 달성하기 위해 본 발명은 원시 언어로 표시된 질의용어를 목적 언어로 표시되는 대역용어로 번역하는, 공통 용어체계 기반 의료용어 번역 시스템에 관한 것으로서, 적어도 1개의 표시용어를 포함하는 개념과, 상기 개념들간의 관계로 구성되는 참조 용어체계를 구성하여 저장하되, 상기 표시용어는 중간 언어로 표시되는 참조용어 관리부; 원시 언어의 용어(이하 원시용어) 또는 목적 언어의 용어(이하 목적용어)를 개념의 표시용어로 대응시킨 문서를 참조하여, 상기 원시용어 또는 목적용어와 해당 개념 사이를 매핑시키는 대역관계 설정부; 원시 언어로 표시된 질의용어에 대하여 목적 언어로 표시된 대역용어를 선정하되, 상기 질의용어와 매핑되는 개념(이하 중간 개념)을 추출하고, 상기 중간 개념 또는 상기 중간 개념과 관계를 갖는 개념과 매핑되는 목적용어를 검색하여, 검색된 목적용어를 상기 대역용어로 선정하는 대역용어 검색부; 및, 상기 질의용어에 대한 대역용어를 상기 대역용어 검색부를 통해 선정하게 하고, 상기 대역용어를 제공하는 질의용어 처리부를 포함하는 것을 특징으로 한다.
또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 관계는 관계되는 2개의 개념이 동일한 개념을 나타내는 동일 관계와, 2개의 개념 간의 상위 또는 하위 개념을 나타내는 계층 관계를 포함하는 것을 특징으로 한다.
또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 중간 개념과 관계를 갖는 개념은 상기 중간 개념과 동일관계 또는 계층관계로 연속되어 관계를 갖는 개념을 포함하되, 계층관계인 경우 상위 개념만을 포함하는 것을 특징으로 한다.
또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 매핑은 동일 매핑과 유사 매핑의 2가지로 구분하되, 상기 유사 매핑은 가중치가 부여되고, 상기 대역용어 검색부는 상기 중간 개념과 동일 매핑되는 목적용어가 없으면 상기 중간 개념의 상위 개념과 동일 매핑되는 목적용어를 검색하거나, 상기 중간 개념과 유사 매핑되는 목적용어를 검색하는 것을 특징으로 한다.
또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 대역용어 검색부는 상기 질의용어와 동일 매핑되는 개념이 있으면, 동일 매핑되는 개념의 하위 개념 중에서 가중치가 가장 높은 개념도 중간 개념으로 추출하는 것을 특징으로 한다.
또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 질의용어 처리부는 상기 질의용어와 상기 중간 개념이 동일 매핑이 아니거나, 상기 대역용어와 상기 중간 개념이 동일 매핑이 아니면, 상기 중간 개념의 표시용어를 상기 대역용어와 함께 제공하는 것을 특징으로 한다.
또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 대역관계 설정부는 원시 언어 또는 목적 언어와 중간 언어 간의 번역사전을 참조하여, 원시용어 또는 목적용어가 개념의 표시용어로 대역하는 용어이면, 해당 원시용어 또는 목적용어와 해당 개념 사이를 동일 매핑시키고, 원시 언어 또는 목적 언어의 웹 문서에서 원시용어와 개념의 표시용어를 병기하면 해당 원시용어 또는 목적용어와 해당 개념 사이를 유사 매핑시키는 것을 특징으로 한다.
또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 원시용어, 상기 목적용어, 또는 개념의 표시용어는 의료용어인 것을 특징으로 한다.
상술한 바와 같이, 본 발명에 따른 공통 용어체계 기반 의료용어 번역 시스템에 의하면, 질의용어의 대역용어로 사용할 목적용어가 의학용어 번역사전에 나타나지 않더라도, 질의용어에 가장 적절하게 대역될 수 있는 대역용어를 찾아 번역할 수 있는 효과가 얻어진다.
또한, 본 발명에 따른 공통 용어체계 기반 의료용어 번역 시스템에 의하면, 인터넷 웹 상 등에 원시 의료용어의 대역용어로서 나타나는 목적 의료용어를 이용하되, 해당 도메인의 의료용어인지를 판단하여 번역의 오류를 방지할 수 있는 효과가 얻어진다.
도 1은 본 발명을 실시하기 위한 전체 시스템의 구성을 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 공통 용어체계 기반 의료용어 번역 시스템의 구성에 대한 블록도이다.
도 3과 도4는 본 발명의 일실시예에 따른 참조 용어체계의 구성 및 구조를 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 원시/목적 의료용어, 및, 참조 용어체계, 및, 그 매핑을 도시한 예제 도면.
도 6은 본 발명의 일실시예에 따른 질의용어에 대한 대역용어를 검색하는 과정을 도시한 도면.
이하, 본 발명의 실시를 위한 구체적인 내용을 도면에 따라서 설명한다.
또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.
먼저, 본 발명을 실시하기 위한 전체 시스템의 구성의 예들에 대하여 도 1을 참조하여 설명한다.
도 1a 또는 도 1b에서 보는 바와 같이, 본 발명에 따른 공통 용어체계 기반 의료용어 번역 시스템은 네트워크 상의 서버 시스템 또는 컴퓨터 단말 상의 프로그램 시스템으로 실시될 수 있다.
도 1a와 같이, 본 발명의 실시를 위한 전체 시스템의 일례는 사용자 단말(10), 의료용어 번역 시스템(30), 및, 웹 서버(60)로 구성되고 서로 네트워크(20)로 연결된다. 또, 필요한 데이터를 저장하기 위한 데이터베이스(40)를 더 구비할 수 있다. 또한, 추가적으로 별도의 번역 서버(50)를 더 포함하여 구성될 수 있다.
사용자 단말(10)은 사용자가 이용하는 PC, 노트북, 넷북, PDA, 모바일 등의 통상의 컴퓨팅 단말기이다. 사용자는 사용자 단말(10)을 이용하여 진료기록 문서를 번역 서버(50) 또는 의료용어 번역 시스템(30)으로 전송하여, 진료기록 문서를 번역 요청을 한다.
의료용어 번역 시스템(30)은 통상의 서버로서 네트워크(20)에 연결되어 의료 용어를 원시 언어(원시 의료용어)에서 목적 언어(목적 의료용어)로 번역하는 서비스를 제공한다. 의료용어 번역 시스템(30)은 상기 각 서비스들을 인터넷 상의 웹페이지로 제공하는 웹서버 또는 웹어플리케이션 서버 등으로 구현될 수 있다.
이하에서 설명의 편의를 위해, 원시 의료용어를 원시용어로도 표시하고, 목적 의료용어를 목적용어로도 기재한다. 또한, 원시 의료용어 또는 목적 의료용어를 모두 지칭하는 말로서, 번역 대상인 용어라는 의미로 대상 용어 또는 대상 의료용어로도 기재한다. 또한, 번역할 원시 의료용어를 질의용어라 하고, 질의용어를 번역할 목적 의료용어를 대역용어라 부르기로 한다.
한편, 의료용어 번역 시스템(30)은 원시 의료용어에서 목적 의료용어로 단순히 의료용어만을 번역하도록 구현한다. 다른 실시예로서, 의료용어 번역 시스템(30)은 일반 번역 기능을 탑재하여, 의료용어가 포함된 문장을 번역하도록 구현될 수 있다. 그러나 이하에서 의료용어 번역 시스템(30)은 의료용어만을 대역어로 번역하고, 일반적인 번역 기능은 의료용어 번역 시스템(30) 외에 다른 시스템 또는 서버로 구현되는 것으로 설명한다.
일반 번역기능은 사용자 단말(10) 상에 구현될 수 있다. 즉, 사용자 단말(10)에 일반 번역 시스템(프로그램 시스템)이 설치되고, 의료용어가 포함된 문장을 번역하다가 의료용어에 대한 번역을 의료용어 번역 시스템(30)에 요청할 수 있다. 또 다른 실시예로서, 사용자 단말(10)은 번역 서버(50)에 의료용어가 포함된 문장을 번역 요청하면, 번역 서버(50)가 의료용어 외 다른 문장을 번역하고 의료용어에 대하여 의료용어 번역 시스템(30)에 요청할 수 있다.
한편, 원시 언어는 번역을 하고자 하는 대상인 의료용어를 표현한 언어를 말하고, 원시 의료용어는 번역하고자 하는 용어를 말한다. 또한, 목적 언어는 번역의 결과로 얻고자 하는 의료용어(대역어)를 표현하는 언어를 말하고, 목적 의료용어는 번역결과로서 얻는 번역된 의료용어를 말한다. 예를 들어, 원시 언어는 한국어이고, 목적 언어는 중국어일 수 있다. 또한, 중간 언어는 참조 용어체계를 표현하는 언어로서, 통상 영어를 말한다.
웹 서버(60)는 인터넷 상에 웹 문서 등을 제공하는 통상의 서버로서, 주로 의료용어를 포함하는 문서를 제공한다. 특히, 웹 서버(60)는 원시 언어 또는 목적 언어로 문서를 제공하는 서비스 서버를 말한다. 의료용어 번역 시스템(30)은 웹 서버(60)의 문서들을 수집하여, 해당 문서에 표현된 대상 의료용어(원시 의료용어 또는 목적 의료용어)와, 이들 의료용어와 함께 기재된 중간 언어의 의료용어(개념)들을 추출한다. 의료용어 번역 시스템(30)은 추출된 원시/목적 의료용어 및, 중간 의료용어(개념) 간의 대역후보 관계들을 설정한다.
데이터베이스(40)는 의료용어 번역 시스템(30)에서 필요한 데이터를 저장하는 통상의 저장매체로서, 의료용어의 참조 용어체계를 저장하는 참조용어DB(41), 원시 언어 또는 목적 언어와, 중간 언어 간의 의학용어 사전를 저장하는 용어사전DB(42), 참조 용어체계의 용어들과 원시/목적 의료용어 들간의 대역관계 등을 저장하는 대역관계DB(43) 등으로 구성된다. 상기 데이터베이스(40)의 구성은 일례일 뿐, 데이터베이스 구축이론에 따라 다양하게 구축될 수 있다.
또한, 도 1b와 같이, 본 발명의 실시를 위한 전체 시스템의 다른 예는 컴퓨터 단말(10)에 설치되는 프로그램 형태의 의료용어 번역 시스템(30)으로 구성된다. 즉, 의료용어 번역 시스템(30)의 각 기능들은 컴퓨터 프로그램으로 구현되어 컴퓨터 단말(10)에 설치되어, 사용자(11)에 의해 번역하고자 하는 원시 의료용어를 컴퓨터 단말(10)의 입력장치를 통해 입력받나, 번역된 의료용어(목적 의료용어) 등을 컴퓨터 단말(10)의 출력장치를 통해 출력한다. 한편, 의료용어 번역 시스템(30)에서 필요한 데이터들은 컴퓨터 단말(10)의 하드디스크 등 저장공간에 저장되어 이용된다.
다음으로, 본 발명의 일실시예에 따른 공통 용어체계 기반 의료용어 번역 시스템의 구성을 도 2를 참조하여 설명한다.
도 2에서 보는 바와 같이, 본 발명의 일실시예에 따른 공통 용어체계 기반 의료용어 번역 시스템(30)은 참조용어 관리부(31), 대역관계 설정부(32), 질의용어 처리부(33), 및 대역용어 검색부(34)를 포함하여 구성된다. 추가적으로, 데이터를 저장하기 위한 데이터베이스(또는 저장공간)(40)를 더 포함하여 구성될 수 있다.
참조용어 관리부(31)는 개체 및 관계로 구조화된 참조 용어체계를 구축하여 저장한다.
참조 용어체계(common terminology)는 의료용어를 개념(concept)으로 정립하고, 동일한 용어(term)들을 개념에 포함시키고, 개념들간의 관계를 설정하여, 체계화시킨 용어개념들의 체계를 의미한다. 바람직하게는, 개념(concepat)에는 해당 의료용어를 사용하게 된 상황을 기술하는 상황정보(context)가 포함된다.
참조 용어체계(또는 개념체계)는 종래 만들어진 참조 용어체계를 기반으로 구성될 수 있다. 참조 용어체계는 의학 개념(Medical Concept)이나 의학용어(Medical Term)을 기반으로 그들 간의 관계(Inter-relationships)와 속성을 정형화하여 표현한 것으로서. SNOMED CT, RxNorm, NCI Thesaurus, ICNP 등이 상용화되어 사용되고 있다. 본 발명의 참조 용어체계는 종래의 참조 용어체계를 이용하여 구성하나, 종래의 참조 용어체계와는 다르게 구현된다. 대량의 의료용어를 한번에 작성하기 어렵기 때문에, 종래의 참조 용어체계의 용어들과 관계들을 이용할 뿐이다. 즉, 참조 용어체계의 의료용어 개체 및, 그 관계는 변화될 수 있고, 참조용어체계에는 통상 상황정보가 없는 경우도 많다.
참조 용어체계는 개념(Concept)을 기반으로 하는 표시용어(Term)나 관계정보 등과 같이 개념들에 대한 관련 정보 저장소이다. 표시용어(Term)는 해당 의료 개념을 중간 언어로서 표시되는 의료용어를 말한다. 표시용어(Term)는 자신이 "대표용어(preferred term)"가 될 수도 있고, 이미 등록된 대표용어에 대한 동의어, 혹은 약어가 될 수도 있다. 즉, 개체(또는 개념)는 적어도 하나의 표시용어(term) 속성을 포함하되, 상기 표시용어 속성 중 하나가 대표용어로 설정될 수 있다. 대표용어는 개체의 이름으로도 사용될 수도 있다. 이하에서 표시용어는 개체의 용어(개체 용어) 또는 개념의 용어(개념 용어), 또는 그냥 "용어(의료용어)" 등으로도 혼용한다.
참조 용어체계는 개념(Concepts)과 연관(association)으로 표시할 수 있고, 각각은 개체(entity)와 관계(relation)로 구조화시킬 수 있다. 개체와 개념, 연관(association)과 관계(relation)는 각각 대응되는 개념이므로, 이하에서는 혼용한다.
도 3의 참조 용어체계의 일례를 참조하여 보다 구체적으로 설명한다.
도 3에서 보는 바와 같이, 참조 용어체계는 개체(61)와 관계(62)로서 도식화 할 수 있다. 도 3에서 개체(61)는 C1, C2, ..., C6이고, 표시용어(term)는 T11, T21, ..., T61이다. 개체 C4의 표시용어는 T41, T42, T43, T44를 갖는다. 그 중에서 표시용어 T42는 대표용어이다. 도 3에서 대표용어를 굵은 원으로 표시되고 있다.
관계(62)는 상기 개체들을 연결하는 R12, R23, ..., R56으로 표시된다. 관계 R12는 개체 C1과 개체 C2 사이의 관계이고, 관계 R35는 개체 C3과 개체 C5 사이의 관계이다.
관계는 크게 계층관계와 동일관계로 구분된다. 계층관계는 두 개체의 개념들간에 상위와 하위 개념의 관계를 갖는다. 즉, 상위 개념이 하위 개념을 포괄한다. 계층관계는 두 개체에 대한 부모와 자식의 관계를 규정하는 상하 관계 및 두 개체의 포함관계를 규정하는 도메인 관계를 포함한다. 이하에서 계층 관계에서 포괄하는 개념을 상위 개념 또는 상위 개체라 하고, 상위 개념에 속하는 개념을 하위 개념 또는 하위 개체라 부르기로 한다.
동일관계는 두 개체가 동일한 개념으로 서로 대응되는 관계를 말한다.
도 3에서, 계층관계는 한줄 직선으로 표시하고, 동일관계는 두줄 직선으로 표시한다. 즉, 개체 < C1, C2 >, < C1, C3 >, < C3, C4 >, < C5, C6 > 등은 서로 계층관계를 갖고, 각각 R12, R13, R34, R56으로 표시되고 있다. 개체 < C3, C5 >는 서로 동일관계를 갖고 R35로 표시되고 있다.
이때, R12의 계층관계에서 앞의 개체인 C1이 상위 개체이고, C2가 하위 개체라고 하면, 개념 C1이 개념 C3을 포괄하고, 개념 C3가 개념 C4를 포괄한다. 따라서 개념 C1이 개념 C4를 포괄한다고 볼 수 있다. 따라서 계층 구조에서 상위에 위치한 개념은 그 계층 구조에 직접적으로 계층관계로 연결된 하위 개념들을 모두 포괄한다. 즉, 개념 C1의 하위 개념들은 C2, C3, C4 등을 포함한다.
또한, 개념 C3과 C5는 동일관계를 갖는 동일한 개념이기 때문에 개념 C1은 개념 C3를 포함하고 당연히 개념 C5를 포함한다. 따라서 개념 C1은 C3, C5, C6의 개념을 모두 하위 개념으로 갖는다. 반대로, 개념 C3, C5, C6들은 개념 C1을 상위 개념으로 갖는다.
이때 직접적인 계층관계에 의한 상위 개념 또는 하위 개념을 인접 상위 개념 또는 인접 하위 개념이라고 부르기로 한다. 즉, C1과 C3는 인접 상위관계로서, 각각 인접 상위 개념과 인접 하위 개념이다. 그러나 C1과 C4는 상위 개념과 하위 개념이긴 하나, 인접 상위 또는 하위 개념은 아니다.
도 4는 의료 용어에서 상하위 개념, 즉, 계층관계를 가지는 개념들을 예시하고 있다. 즉, 도 4와 같이, 혈압의 개념을 개체와 관계로 표시할 수 있다. 즉, 혈압이란 혈관의 이름에 따라 동맥혈압, 모세관혈압, 정맥혈압 등으로 구별되는데, 보통 혈압이라고 하면 동맥혈압을 말한다. 동맥혈압은 심장박동에 의하여 변동한다. 또, 동맥혈압은 수축기 혈압(systolic pressure), 확장기 혈압(diastolic pressure), 맥압(pulse pressure), 평균동맥압(mean arterial pressure) 등 여러 가지로 분류된다. 수축기 혈압은 심근의 수축에 의해서 심실내의 혈액이 대동맥으로 박출될 때의 혈관 내 최고압력을 말하며, 확장기혈압은 심장이 수축한 다음에 이어서 확장될 때의 혈관 내 압력을 말한다. 또, 맥압은 수축기혈압과 확장기혈압의 차이를 의미하고, 평균동맥압은 최고동맥혈압과 최저동맥혈압의 평균치를 의미한다. 특히, 평균동맥압은 공식에 의해 수축기 혈압과 확장기 혈압으로부터 구할 수도 있으나, 엄밀하게는 컴퓨터화한 혈압측정장치를 통해서 얻어야 한다.
또한, 각 개념 또는 개체는 상황정보(context)를 표시하는 상황 속성(context)을 가질 수 있으며, 특히, 복수의 상황 속성(context)을 가질 수 있다. 이하에서 상황 속성과 상황정보를 혼용한다. 상황정보(context)는 개념을 묘사하거나 그 개념이 사용되는 상황을 나타내는 용어로 구성된다.
다음으로, 대역관계 설정부(32)를 설명한다.
대역관계 설정부(32)는 중간 언어로 구성된 참조 용어체계 내의 개념들과, 원시 의료용어(또는 원시용어) 및 목적 의료용어(또는 목적용어)를 매핑시킨다. 즉, 매핑은 원시언어 또는 목적언어로 표시되는 대상 용어와, 참조 용어체계의 개념과의 대응을 나타낸다.
바람직하게는, 매핑은 동일 매핑과 유사 매핑으로 구분된다. 한편, 개념과 원시/목적용어 사이의 매핑에 가중치(이하 매핑 가중치)를 부여할 수 있다. 이때 매핑 가중치를 0 ~ 1 사이의 범위의 실수로 정하고, 가중치가 0이면 개념과 용어(원시용어 또는 목적용어) 사이에는 매핑이 형성되지 않는 것을 의미하고, 가중치가 1이면 동일 매핑을 의미하고, 가중치가 0 초과이고 1 미만이면 유사 매핑을 의미한다.
동일 매핑(또는 가중치가 1인 매핑)은 원시/목적 용어(대상 용어)와 개념이 서로 동일한 의미를 갖는 매핑으로서, 완전한 대역을 할 수 있는 관계를 의미한다. 즉, 매핑되는 대상 용어를 개념의 표시용어로 표시할 수 있다는 의미이고, 대상 용어를 개념의 표시용어로 번역하여 표시할 수 있다.
또한, 유사 매핑(또는 가중치 w가 0 < w < 1 인 매핑)은 대상 용어와 개념이 동일한 의미라고 볼 수 없으나, 대상 용어를 개념의 표시용어로 표현하여도 의미는 통할 수 있다는 의미이다. 또한, 매핑 가중치가 높을수록 유사성이 높고, 대역성이 높다는 것을 의미한다.
도 5는 원시 의료용어 또는 목적 의료용어와, 개념 간의 매핑을 한 일례를 도시하고 있다. 도 5에서 보는 바와 같이, 원시 용어 S1과 개념 C1은 가중치가 1.0으로서 동일 매핑을 의미한다. 그 외에도 원시 의료용어에 대한 동일 매핑은 (S2,C3), (S3,C6)이 있고, 목적 의료용어에 대한 동일 매핑은 (D1,C1), (D2,C5)가 있다. 또한, 원시 용어의 유사 매핑은 (S2,C4), (S2,C6)가 있고 각각의 가중치는 0.5와 0.3이다. 또한, 목적 용어의 유사 매핑은 (D3,C4)가 있고 가중치는 0.7이다.
한편, 대역관계 설정부(32)는 의학용어 번역사전을 이용하여, 원시/목적 용어와 개념간의 동일 매핑을 설정한다. 의학용어 번역사전은 원시 언어와 중간 언어, 또는 목적 언어와 중간 언어 간의 번역사전이다.
원시 언어(또는 목적 언어)와 중간 언어 간의 의학용어 번역사전을 참조하여, 해당 번역사전에서 원시 의료용어(또는 목적 의료용어)의 대역어로서 개념의 표시용어가 있으면, 해당 원시 의료용어(또는 목적 의료용어)와 개념 사이에 동일 매핑이 형성된다.
예를 들어, 원시 의학용어 번역사전(원시 언어와 중간 언어 간의 번역사전)에서, 원시 용어 S1의 대역어로서 개념 C1의 표시용어(term) T11이 나타나면, 원시 용어 S1과 개념 C1 사이에는 동일 매핑을 설정한다. 이때 원시 용어 또는 목적 용어에 대하여, 개념에 포함된 다수의 표시용어 중 적어도 하나만 나타나도 된다. 예를 들어, 도 3의 예에서, 개념 C4는 표시용어(term)로서 T41, T42, T43, T44가 있는데, 이 중 1개라도 대상 용어의 대역어로 번역사전에 나타나면, 개념 C4와 동일 매핑을 설정한다.
다음으로, 대역관계 설정부(32)는 웹 문서 등을 수집하여 웹 문서에 대상 용어(원시/목적 의료용어)와 개념의 표시용어가 인접한 위치에서 동시에 나타나는지(또는 병기되어 있는지)를 검색하여, 그 발생빈도(병기되는 빈도)에 따라 가중치를 설정하고 유사 매핑을 설정한다. 바람직하게는, 수집하는 웹 문서는 원시 언어 또는 목적 언어로 작성된 문서이다.
일반적으로 영어 등 중간 언어외의 언어로 작성된 문서에는 전문 용어를 해당 국가의 언어로 작성하면서 괄호 등으로 영어 등 중간 언어로 병기하는 경우가 많다. 따라서 원시 의료용어가 개념의 표시용어와 병기되면, 해당 원시 의료용어는 개념의 표시용어로 대역할 수 있을 가능성이 있다. 그러나 번역 사전 처럼 공식적으로 확인된 것이 아니기 때문에, 대역어로 사용할 가능성만 갖는다. 이를 가중치로 표시하고, 웹 문서에 병기가 많이 나타날수록 가중치를 높여 그 유사성의 정도를 표시한다.
다음으로, 대역용어 검색부(34)에 대하여 설명한다.
대역용어 검색부(34)는 번역할 질의용어에 대한 대역용어를 검색하되, 앞서 참조 용어체계와, 원시/목적 용어와 개념들간의 매핑을 참조하여 검색한다. 즉, 대역용어 검색부(34)는 질의용어와 매핑되는 개념들을 검색하고, 검색된 개념들과 매핑되는 목적 용어를 검색하여, 검색된 목적용어를 대역용어로 설정한다. 바람직하게는, 대역용어 검색부(34)는 대역용어 외에도 검색된 개념들의 표시용어도 대역용어와 함께 병기한다.
이하 설명에서 앞서 도 3의 참조 용어체계와, 도 5의 매핑을 참조하여 설명한다.
먼저, 대역용어 검색부(34)는 질의용어와 동일 매핑을 갖는 개념(참조 용어체계의 개념)을 검색한다. 이때, 동일 매핑을 갖는 개념이 검색되는 경우와 검색되지 않는 경우가 있는데, 이를 나누어 설명한다.
질의용어와 동일 매핑을 갖는 개념이 검색되지 않는 경우, 대역용어 검색부(34)는 유사 매핑을 갖는 개념을 검색한다. 검색된 유사 매핑의 개념 중에서 가중치가 가장 높은 개념을 선정한다. 이 경우는 유사 매핑의 개념만 선정되는 경우이다. 도 5의 예에서, 질의용어가 원시용어 S3인 경우, 동일 매핑을 갖는 개념이 없다. 이 경우, 유사 매핑을 검색하는데, 가중치가 0.2인 유사 매핑 (S3,C6)이 존재한다. 유사 매핑의 개념 C6만 존재하므로 가장 큰 가중치이고, 개념 C6이 선정된다.
다음으로, 질의용어와 동일 매핑을 갖는 개념이 검색되는 경우, 대역용어 검색부(34)는 유사 매핑을 갖는 개념을 추가적으로 검색하되, 동일 매핑의 개념의 하위 개념에서만 유사 매핑의 개념을 검색한다. 즉, 동일 매핑의 개념이 있으면, 하위 개념 중에서 유사 매핑이 있는지를 검색한다. 바람직하게는, 유사 매핑의 가중치가 사전에 정해진 최소 가중치 이상인 개념만을 추출한다. 또한, 최소 가중치 이상인 개념 중에서 가장 가중치가 큰 개념을 선정한다.
도 3의 예에서, 질의용어가 원시용어 S2인 경우, 동일 매핑의 개념으로서, 개념 C3이 존재한다. 또한, 동일 매핑의 개념의 하위 개념으로서 개념 C4와 개념 C6이 존재한다. 개념 C4는 직접적으로 개념 C3과 계층관계를 형성하여, 개념 C3의 하위 개념이다. 개념 C6은 개념 C5와의 계층관계와 R35의 동일관계에 의해, 개념 C3의 하위 개념이다.
만약 최소 가중치가 0.6이면, 개념 C4와 C6은 최소 가중치 보다 낮은 가중치(0.5, 0.3)를 갖기 때문에, 모두 유사 개념으로 추출되지 않는다. 최소 가중치가 0.5이면, 개념 C4만 추출된다. 최소 가중치가 0.3이면 개념 C4와 C6이 모두 해당되나, 그 중 가장 큰 가중치를 갖는 개념은 C4이므로, 개념 C4가 추출된다. 이하에서 최소 가중치가 0.5로 가정한다. 이때, 동일 매핑의 개념으로 개념 C3이 선정되고, 유사 매핑의 개념으로 개념 C4가 추출된다.
하위 개념은 상위 개념 보다 더 구체적인 개념이다. 따라서 질의용어와 많이 유사한 개념이 동일 매핑의 개념의 하위 개념이라면, 유사 매핑의 개념이 질의용어를 더 잘 표현할 수 있다. 따라서 질의용어를 보다 잘 표현하기 위하여, 동일 매핑의 개념 외에도 가중치가 높은 유사 매핑의 개념을 추가적으로 추출한다.
대역용어 검색부(34)는 질의용어에 대한 동일 매핑의 개념 또는 유사 매핑의 개념을 추출하면, 추출된 동일 매핑의 개념 또는 유사 매핑의 개념(이하 추출된 개념)과 매핑되는 목적 의료용어를 대역용어로 선정한다.
대역용어 검색부(34)는 먼저 추출된 개념과 동일 매핑되는 목적용어를 검색한다. 이때 대역용어는 추출된 개념과 직접적으로 동일 매핑되는 목적용어이거나, 추출된 개념과 동일관계를 갖는 개념과 직접적으로 동일 매핑되는 목적용어이다.
만약 추출된 개념과 동일 매핑되는 목적용어가 존재하지 않으면, 추출된 개념과 유사 매핑되는 목적용어를 검색하고, 추출된 개념의 상위 개념 중에서 목적용어와 동일 매핑되는 개념을 검색한다. 특히, 추출된 개념의 상위 개념을 검색할 때, 동일 매핑되는 목적용어가 존재하는 상위 개념 중에서 가장 가까운 상위 개념을 대역용어로 선정한다. 이 경우, 유사 매핑되는 목적용어와, 상위 개념과 동일 매핑되는 목적용어가 대역용어로서 모두 선정되거나, 둘 중 하나만 선정될 수도 있다.
도 5의 예에서, 추출된 개념이 개념 C3인 경우, 개념 C3과 동일 매핑되는 목정용어는 D2가 있다. 개념 C3과 개념 C5는 동일관계이고, 개념 C5와 목적용어 D2는 서로 동일 매핑이다. 따라서 C3와 D2는 동일 매핑을 갖는다. 따라서 목적용어 D2가 대역용어로서 선정된다.
또한, 추출된 개념이 C4인 경우, 개념 C4와 동일 매핑되는 목적용어가 존재하지 않는다. 따라서 개념 C4와 유사 매핑되는 목적용어나, 상위 개념 중에서 동일매핑되는 목적용어를 검색한다. 각각 목적용어 D3와, D2가 검색되어, 이들이 대역용어로 선정된다.
개념 C4를 목적 언어로 표현하는 목적용어는 D2와 D3 두가지 이다. 이때 목적용어 D2는 개념 C4를 표현하는 상위 개념으로서, 포괄적이나 공식적인 용어로서 표현된다. 대신, 목적용어 D3는 개념 C4를 공식적인 용어로 표현되지는 않으나 관례적으로 보다 정확하게 표현하는 용어이다.
다음으로, 도 5의 예에서, 추출된 개념 C6의 경우, 상위 개념의 동일 매핑의 목적용어 D2만 존재한다.
다음으로, 본 발명의 일실시예에 따른 대역용어 검색부(34)가 질의용어에 대한 대역용어를 검색하는 예들을 도 6을 참조하여 설명한다.
도 6a의 예에서, 질의용어가 원시 의료용어 S1인 경우이다. 이 경우, 원시용어 S1과 동일 매핑되는 개념이 C1이다. 개념 C1과 동일 매핑되는 목적 의료용어는 목적용어 D1이다. 따라서 목적용어 D1이 질의용어 S1의 대역용어이다.
다음으로, 도 6b의 예에서, 질의용어가 원시용어 S2인 경우이다. 이 경우, 원시용어 S2와 동일 매핑되는 개념이 C3이고, 또, 원시용어 S2와 유사 매핑되는 개념은 C4이다. 유사 매핑되는 개념이 C6도 있으나 가중치가 작기 때문에 제외된다. 따라서 추출된 개념은 C3과 C4가 있다. 추출된 개념 C3과 동일 매핑되는 목적용어는 D2이다. 또한, 추출된 개념 C4와 동일 매핑되는 목적용어는 없고, 대신, 유사 매핑되는 목적용어 D3와, 상위 개념 중에서 동일 매핑되는 목적용어 D2가 있다. 결과적으로, 추출된 개념 C3 및 C4에 의해 추출된 대역용어는 D2와 D3이다.
다음으로, 도 6c의 예에서, 질의용어가 원시용어 S3인 경우이다. 이 경우, 원시용어 S3와 동일 매핑되는 개념은 없고 유사 매핑되는 개념 C6만 있다. 개념 C6과 동일 매핑되는 목적용어는 없고, 상위 개념 C5와 동일 매핑되는 목적용어 D2만 있다. 따라서 목적용어 D2가 대역용어로서 추출된다.
다음으로, 질의용어 처리부(33)에 대하여 설명한다.
질의용어 처리부(33)는 번역할 원시 의료용어(질의용어)를 수신하여(입력받아), 상기 질의용어의 대역어 또는 대역용어를 전송한다(출력한다). 이때, 질의용어 처리부(33)는 상기 질의용어에 대한 대역용어 검색을 대역용어 검색부(34)에 요청하고, 대역용어를 수신하여 출력하거나, 사용자 단말(10)에 전송한다.
이때, 질의용어 처리부(33)는 대역용어를 검색할 때 이용된 개념의 표시용어도 함께 제공(출력)한다. 바람직하게는, 질의용어 처리부(33)는 질의용어와 중간의 개념이 동일 매핑이 아니거나, 대역용어와 상기 중간 개념이 동일 매핑이 아닌 경우에, 중간 개념의 표시용어를 함께 제공한다.
앞서 도 6a의 예에서, 질의용어 S1과 대역용어 D1은 모두 중간 개념 C1과 동일 매핑이므로, 대역용어 D1만 제공한다. 따라서 "D1"로 표시된다.
도 6b의 예에서는 질의용어 S2와 대역용어 D2만 모두 동일 매핑이고, 질의용어 S2와 대역용어 D3는 동일 매핑이 아니다. 이 경우, 대역용어 D2와 D3를 제공하되, D3는 C4의 표시용어를 함께 제공한다. 더욱 바람직하게는, 개념의 표시용어 중에서 대표용어를 제공한다. C4의 대표용어는 T42이다.
또한, 질의용어 처리부(33)는 대역용어 중에서 상위 개념과 매핑되는 대역용어를 우선순위를 높게 하여 제공한다. 바람직하게는, 우선순위가 낮은 대역용어 및 개념의 표시용어는 괄호로 표시한다. 앞서의 도 6b의 예에서, D3와 C4의 표시용어는 괄호로 표시한다. 즉, 질의용어 S2의 번역문은 "D2(D3, T42)"로 표시된다.
또한, 도 6c의 예에서는, 질의용어 S3의 대역용어는 D2이나 원시용어와 개념이 동일 매핑이 아니므로, 개념의 표시용어를 함께 제공한다. 대역용어는 1개 밖에 없으므로, D2가 우선순위가 가장 높다. 따라서 "D2(T61)"로 표시된다.
이상, 본 발명자에 의해서 이루어진 발명을 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 실시 예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.
10 : 사용자 단말 20 : 네트워크
30 : 의료용어 번역 시스템 31 : 참조용어 관리부
32 : 대역관계 설정부 33 : 질의용어 처리부
34 : 대역용어 검색부
40 : 데이터베이스 41 : 참조용어DB
42 : 용어사전DB 43 : 대역관계DB

Claims (8)

  1. 원시 언어로 표시된 질의용어를 목적 언어로 표시되는 대역용어로 번역하는, 공통 용어체계 기반 의료용어 번역 시스템에 있어서,
    적어도 1개의 표시용어를 포함하는 개념과, 상기 개념들간의 관계로 구성되는 참조 용어체계를 구성하여 저장하되, 상기 표시용어는 중간 언어로 표시되는 참조용어 관리부;
    원시 언어의 용어(이하 원시용어) 또는 목적 언어의 용어(이하 목적용어)를 개념의 표시용어로 대응시킨 문서를 참조하여, 상기 원시용어 또는 목적용어와 해당 개념 사이를 매핑시키는 대역관계 설정부;
    원시 언어로 표시된 질의용어에 대하여 목적 언어로 표시된 대역용어를 선정하되, 상기 질의용어와 매핑되는 개념(이하 중간 개념)을 추출하고, 상기 중간 개념 또는 상기 중간 개념과 관계를 갖는 개념과 매핑되는 목적용어를 검색하여, 검색된 목적용어를 상기 대역용어로 선정하는 대역용어 검색부; 및,
    상기 질의용어에 대한 대역용어를 상기 대역용어 검색부를 통해 선정하게 하고, 상기 대역용어를 제공하는 질의용어 처리부를 포함하는 것을 특징으로 하는 의료용어 번역 시스템.
  2. 제1항에 있어서,
    상기 관계는 관계되는 2개의 개념이 동일한 개념을 나타내는 동일 관계와, 2개의 개념 간의 상위 또는 하위 개념을 나타내는 계층 관계를 포함하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
  3. 제2항에 있어서,
    상기 중간 개념과 관계를 갖는 개념은 상기 중간 개념과 동일관계 또는 계층관계로 연속되어 관계를 갖는 개념을 포함하되, 계층관계인 경우 상위 개념만을 포함하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
  4. 제2항에 있어서,
    상기 매핑은 동일 매핑과 유사 매핑의 2가지로 구분하되, 상기 유사 매핑은 가중치가 부여되고,
    상기 대역용어 검색부는 상기 중간 개념과 동일 매핑되는 목적용어가 없으면 상기 중간 개념의 상위 개념과 동일 매핑되는 목적용어를 검색하거나, 상기 중간 개념과 유사 매핑되는 목적용어를 검색하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
  5. 제4항에 있어서,
    상기 대역용어 검색부는 상기 질의용어와 동일 매핑되는 개념이 있으면, 동일 매핑되는 개념의 하위 개념 중에서 가중치가 가장 높은 개념도 중간 개념으로 추출하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
  6. 제4항에 있어서,
    상기 질의용어 처리부는 상기 질의용어와 상기 중간 개념이 동일 매핑이 아니거나, 상기 대역용어와 상기 중간 개념이 동일 매핑이 아니면, 상기 중간 개념의 표시용어를 상기 대역용어와 함께 제공하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
  7. 제1항에 있어서,
    상기 대역관계 설정부는 원시 언어 또는 목적 언어와 중간 언어 간의 번역사전을 참조하여, 원시용어 또는 목적용어가 개념의 표시용어로 대역하는 용어이면, 해당 원시용어 또는 목적용어와 해당 개념 사이를 동일 매핑시키고, 원시 언어 또는 목적 언어의 웹 문서에서 원시용어와 개념의 표시용어를 병기하면 해당 원시용어 또는 목적용어와 해당 개념 사이를 유사 매핑시키는 것을 특징으로 하는 의료용어 번역 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    상기 원시용어, 상기 목적용어, 또는 개념의 표시용어는 의료용어인 것을 특징으로 하는 의료용어 번역 시스템.
KR1020160067096A 2016-05-31 2016-05-31 공통 용어체계 기반 의료용어 번역 시스템 KR102385531B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160067096A KR102385531B1 (ko) 2016-05-31 2016-05-31 공통 용어체계 기반 의료용어 번역 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160067096A KR102385531B1 (ko) 2016-05-31 2016-05-31 공통 용어체계 기반 의료용어 번역 시스템

Publications (2)

Publication Number Publication Date
KR20170135333A true KR20170135333A (ko) 2017-12-08
KR102385531B1 KR102385531B1 (ko) 2022-04-13

Family

ID=60919952

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160067096A KR102385531B1 (ko) 2016-05-31 2016-05-31 공통 용어체계 기반 의료용어 번역 시스템

Country Status (1)

Country Link
KR (1) KR102385531B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763197A (zh) * 2018-05-10 2018-11-06 杭州依图医疗技术有限公司 一种医疗术语库的形成方法和装置
KR20210041719A (ko) * 2019-10-08 2021-04-16 주식회사 미디컴퍼니 블록체인 기반의 개인의료데이터 제공 시스템
KR20220090333A (ko) * 2020-12-22 2022-06-29 연세대학교 원주산학협력단 공통 데이터 모델 단어를 추천하는 방법 및 이를 수행하는 전자 장치

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2974698B2 (ja) * 1989-10-13 1999-11-10 富士通株式会社 機械翻訳装置における単語間関係編集/学習装置
KR20070058950A (ko) 2005-12-05 2007-06-11 한국전자통신연구원 제한적인 도메인의 문서를 대상으로 특화된 자동 번역 장치및 방법
KR20070059869A (ko) 2005-12-07 2007-06-12 한국전자통신연구원 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법
US20080306926A1 (en) * 2007-06-08 2008-12-11 International Business Machines Corporation System and Method for Semantic Normalization of Healthcare Data to Support Derivation Conformed Dimensions to Support Static and Aggregate Valuation Across Heterogeneous Data Sources
KR20110062867A (ko) 2009-12-04 2011-06-10 한국전자통신연구원 원시언어-목적언어 용어 리스트 구축 장치 및 방법
KR20110112495A (ko) 2010-04-07 2011-10-13 주식회사 인아웃정보기술 의료용 자료의 의료분석 시스템
KR101097195B1 (ko) * 2010-04-01 2011-12-21 서울대학교산학협력단 참조용어에 기반하는 용어체계 저작지원 시스템
KR101239140B1 (ko) * 2011-03-07 2013-03-11 경북대학교 산학협력단 의학 표준 용어체계 매핑 방법 및 시스템

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2974698B2 (ja) * 1989-10-13 1999-11-10 富士通株式会社 機械翻訳装置における単語間関係編集/学習装置
KR20070058950A (ko) 2005-12-05 2007-06-11 한국전자통신연구원 제한적인 도메인의 문서를 대상으로 특화된 자동 번역 장치및 방법
KR20070059869A (ko) 2005-12-07 2007-06-12 한국전자통신연구원 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법
US20080306926A1 (en) * 2007-06-08 2008-12-11 International Business Machines Corporation System and Method for Semantic Normalization of Healthcare Data to Support Derivation Conformed Dimensions to Support Static and Aggregate Valuation Across Heterogeneous Data Sources
KR20110062867A (ko) 2009-12-04 2011-06-10 한국전자통신연구원 원시언어-목적언어 용어 리스트 구축 장치 및 방법
KR101097195B1 (ko) * 2010-04-01 2011-12-21 서울대학교산학협력단 참조용어에 기반하는 용어체계 저작지원 시스템
KR20110112495A (ko) 2010-04-07 2011-10-13 주식회사 인아웃정보기술 의료용 자료의 의료분석 시스템
KR101239140B1 (ko) * 2011-03-07 2013-03-11 경북대학교 산학협력단 의학 표준 용어체계 매핑 방법 및 시스템

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763197A (zh) * 2018-05-10 2018-11-06 杭州依图医疗技术有限公司 一种医疗术语库的形成方法和装置
CN108763197B (zh) * 2018-05-10 2021-11-09 上海依智医疗技术有限公司 一种医疗术语库的形成方法和装置
KR20210041719A (ko) * 2019-10-08 2021-04-16 주식회사 미디컴퍼니 블록체인 기반의 개인의료데이터 제공 시스템
KR20220090333A (ko) * 2020-12-22 2022-06-29 연세대학교 원주산학협력단 공통 데이터 모델 단어를 추천하는 방법 및 이를 수행하는 전자 장치

Also Published As

Publication number Publication date
KR102385531B1 (ko) 2022-04-13

Similar Documents

Publication Publication Date Title
CN110990579B (zh) 跨语言的医学知识图谱构建方法、装置与电子设备
US8108381B2 (en) System and method for analyzing electronic data records
US7395222B1 (en) Method and system for identifying expertise
US9390160B2 (en) Systems and methods for providing improved access to pharmacovigilance data
CN108920453A (zh) 数据处理方法、装置、电子设备及计算机可读介质
CN107408156A (zh) 用于从临床文档进行语义搜索和提取相关概念的系统和方法
Bednarek et al. Computer-assisted digital text analysis for journalism and communications research: introducing corpus linguistic techniques that do not require programming
KR101799448B1 (ko) 질의 응답형 질병분류코드 제공 시스템
US20080281812A1 (en) Method and system for identifying expertise
KR20170135333A (ko) 공통 용어체계 기반 의료용어 번역 시스템
Adekkanattu et al. Evaluating the portability of an NLP system for processing echocardiograms: a retrospective, multi-site observational study
Montyne The importance of formal ontologies: a case study in occupational health
JP5151412B2 (ja) 表記ゆれ解析装置
Kiran et al. An approach towards establishing reference linking in desktop reference manager
Chung et al. Concept-value pair extraction from semi-structured clinical narrative: a case study using echocardiogram reports
Vreeman et al. A comparison of Intelligent Mapper and document similarity scores for mapping local radiology terms to LOINC
US20110119277A1 (en) Method and System for Identifying Expertise
KR101097195B1 (ko) 참조용어에 기반하는 용어체계 저작지원 시스템
Arnold et al. Local lexicon extraction and language processing in facilitating language awareness and informing user-centered design in the health care environment
Zhou et al. Testing and Evaluating SNOMED CT Web Browsers' Textual Search Feature
US11681700B1 (en) Methods and apparatuses for clustered storage of information
KR20170135331A (ko) 이기종 건강측정기기 데이터 교환 의미적 상호운용성 처리 시스템 및 방법
Chang et al. On bridging consumer health search across languages using cross-lingual word space
Hamm et al. Harmonizing clinical terminologies: driving interoperability in healthcare
Toews An evaluation methodology for clinical vocabularies and evaluation of the read codes

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right