KR102385531B1 - A translation system for for medical terms based on the common terminology - Google Patents

A translation system for for medical terms based on the common terminology Download PDF

Info

Publication number
KR102385531B1
KR102385531B1 KR1020160067096A KR20160067096A KR102385531B1 KR 102385531 B1 KR102385531 B1 KR 102385531B1 KR 1020160067096 A KR1020160067096 A KR 1020160067096A KR 20160067096 A KR20160067096 A KR 20160067096A KR 102385531 B1 KR102385531 B1 KR 102385531B1
Authority
KR
South Korea
Prior art keywords
term
concept
medical
band
language
Prior art date
Application number
KR1020160067096A
Other languages
Korean (ko)
Other versions
KR20170135333A (en
Inventor
송승재
Original Assignee
주식회사 라이프시맨틱스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 라이프시맨틱스 filed Critical 주식회사 라이프시맨틱스
Priority to KR1020160067096A priority Critical patent/KR102385531B1/en
Publication of KR20170135333A publication Critical patent/KR20170135333A/en
Application granted granted Critical
Publication of KR102385531B1 publication Critical patent/KR102385531B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

원시 언어로 표시된 질의용어를 목적 언어로 표시되는 대역용어로 번역하는, 공통 용어체계 기반 의료용어 번역 시스템에 관한 것으로서, 적어도 1개의 표시용어를 포함하는 개념과, 상기 개념들간의 관계로 구성되는 참조 용어체계를 구성하여 저장하되, 상기 표시용어는 중간 언어로 표시되는 참조용어 관리부; 원시 언어의 용어(이하 원시용어) 또는 목적 언어의 용어(이하 목적용어)를 개념의 표시용어로 대응시킨 문서를 참조하여, 상기 원시용어 또는 목적용어와 해당 개념 사이를 매핑시키는 대역관계 설정부; 원시 언어로 표시된 질의용어에 대하여 목적 언어로 표시된 대역용어를 선정하되, 상기 질의용어와 매핑되는 개념(이하 중간 개념)을 추출하고, 상기 중간 개념 또는 상기 중간 개념과 관계를 갖는 개념과 매핑되는 목적용어를 검색하여, 검색된 목적용어를 상기 대역용어로 선정하는 대역용어 검색부; 및, 상기 질의용어에 대한 대역용어를 상기 대역용어 검색부를 통해 선정하게 하고, 상기 대역용어를 제공하는 질의용어 처리부를 포함하는 구성을 마련한다.
상기와 같은 시스템에 의하여, 질의용어의 대역용어로 사용할 목적용어가 의학용어 번역사전에 나타나지 않더라도, 질의용어에 가장 적절하게 대역될 수 있는 대역용어를 찾아 번역할 수 있다.
A common terminology-based medical term translation system that translates a query term expressed in a source language into a cross term expressed in a target language, a concept including at least one display term, and a reference consisting of a relationship between the concepts a reference term management unit configured and stored in a terminology system, wherein the display term is displayed in an intermediate language; a band relationship setting unit for mapping between the source language term (hereinafter referred to as the source term) or the term of the target language (hereinafter referred to as the object term) with reference to a document corresponding to the expression term of the concept; For the query term expressed in the source language, select a term in the target language, extract a concept mapped to the query term (hereinafter referred to as an intermediate concept), and map the intermediate concept or a concept having a relationship with the intermediate concept a band term search unit that searches for a term and selects the searched target term as the band term; and a query term processing unit that selects a band term for the query term through the band term search unit and provides the band term.
With the system as described above, even if the target term to be used as a cross-word of the query term does not appear in the medical term translation dictionary, it is possible to find and translate a cross-word that can be most appropriately translated into the query term.

Description

공통 용어체계 기반 의료용어 번역 시스템 { A translation system for for medical terms based on the common terminology }A translation system for for medical terms based on the common terminology }

본 발명은 개념들을 구조적으로 구성한 참조 용어체계를 이용하여 원시 언어로 작성된 의료용어(또는 원시 의료용어)를 목적 언어로 기재되는 의료용어(또는 목적 의료용어)로 번역하는 공통 용어체계 기반 의료용어 번역 시스템에 관한 것이다.The present invention is a medical term translation based on a common terminology that translates a medical term written in a source language (or a source medical term) into a medical term (or target medical term) written in a target language using a reference terminology that structurally constitutes concepts. It's about the system.

특히, 본 발명은 참조 용어체계를 개념과 그들간의 관계로 구성되도록 온톨로지 형태로 구성하고, 원시 의료용어 또는 목적 의료용어와 개념 사이에 매핑관계를 의학용어 번역사전과 웹 문서를 참조하여 구성하는, 공통 용어체계 기반 의료용어 번역 시스템에 관한 것이다.In particular, the present invention configures the reference terminology system in the form of an ontology so that it is composed of concepts and relationships between them, and a mapping relationship between a source medical term or a target medical term and a concept is constructed by referring to a medical term translation dictionary and a web document, It relates to a medical term translation system based on a common terminology.

의학지식도 언어로 표현되며, 이때 사용되는 것이 의학용어이다. 우리가 사용하는 언어와 같이, 의학용어는 의학지식을 체계화하고 규칙을 만들고, 또 한정 짓는다. 모든 의료행위는 기록을 남기게 되는데, 그것이 진료기록이다. 진료기록은 의학용어의 집합이다. 진료기록은 환자가 내원하면서부터, 내원한 이유가 해소될 때까지의 환자 상태, 의료진이 행한 검사, 진단, 처치, 수술 등 모든 행위와 그에 따른 환자의 신체 반응 내지는 상태를 담고 있을 뿐 아니라, 임상적으로 유의한 내원 전 과거 이력까지 포함하고 있다. 이러한 이유로, 의료 현장에서 진료기록이 가지는 의미는 상당하다.Medical knowledge is also expressed in language, and medical terms are used at this time. Like the language we use, medical terminology organizes, rules, and defines medical knowledge. Every medical action leaves a record, which is a medical record. A medical record is a set of medical terms. Medical records contain not only the patient's status from the time the patient visits the hospital to the time the reason for the visit is resolved, the examination, diagnosis, treatment, surgery, etc. performed by the medical staff, as well as the patient's physical reaction or status. A history of significant prior visitation is also included. For this reason, the meaning of medical records in the medical field is significant.

한편, 진료기록은 의료진이 사용하는 의료용어를 기반으로 구성되어 있다. 하지만 의료진이 사용하는 의료용어는 국가별, 지역별, 병원별, 학파별로 상이한 것이 현실이다. 이에 대한 기준을 제시하는 것이 참조용어체계로, 특정 사실에 대한 명확한 개념을 정하고, 이 개념을 표현하는 다양한 의료용어들을 속성값으로 포함하고 있다. 또한, 일부 참조용어체계는 용어들 간의 관계 정의 정보까지 제공하는 특징을 가진다.On the other hand, medical records are constructed based on medical terminology used by medical staff. However, the reality is that medical terminology used by medical staff differs by country, region, hospital, and school. It is a reference term system that provides standards for this, sets a clear concept for a specific fact, and includes various medical terms expressing this concept as attribute values. In addition, some reference terminology systems have a feature of providing relationship definition information between terms.

이러한 진료기록은 하나의 국가 내에 다수의 의료기관들 사이에 서로 전달되기도 한다. 예를 들어, 환자가 1차 의료기관에서 진료를 받다가 3차 의료기관으로 옮기는 경우, 1차 의료기관에서 작성된 진료된 진료기록이 1차 의료기관에서 3차 의료기관으로 전달되기도 한다. 또한, 3차 의료기관 간에도 진료기록 전달이 이루어지고 있다.These medical records are sometimes transferred between multiple medical institutions within a country. For example, when a patient receives treatment from a primary medical institution and then moves to a tertiary medical institution, the medical records prepared at the primary medical institution are sometimes transferred from the primary medical institution to the tertiary medical institution. Also, medical records are transferred between tertiary medical institutions.

한편, 최근에는, 의료관광객의 수가 폭발적으로 증가하면서 관련 산업의 규모도 의미 있는 증가 곡선을 그리고 있다. 의료관광객의 경우, 의료관광을 마치고 귀국한 후에 의료관광 시의 진료기록을 확인하기가 매우 어려운 것이 현실이다. 진료기록을 확보하지 못할 경우, 의료사고나 귀국 후 부작용 발생 시 대처하기가 곤란하다. 여러 이유로, 적지 않은 국가에서 의료관광사증 발급 시에 본국의 진료기록을 요구하고 있고, 의료관광 후 본국의 귀국심사 시에도 진료기록을 요구하는 경우가 적지 않다.Meanwhile, recently, as the number of medical tourists has exploded, the scale of related industries is also drawing a meaningful increase curve. In the case of medical tourists, it is very difficult to check the medical records of medical tourism after returning home from medical tourism. If medical records cannot be secured, it is difficult to deal with medical accidents or side effects after returning to Korea. For various reasons, not a few countries require medical records from their home country when issuing a medical tourism visa, and there are many cases where medical records are also required for return to their home country after medical tourism.

이와 같이 진료기록 번역에 대한 현장의 요구는 지속적으로 증가하고 있으나, 일부 건강검진기관이나 국제진료센터를 제외하고, 진료기록 번역은 번역회사에 용역을 주어 진행하는 수준을 넘지 못하고 있는 것이 현실이다. 자동번역시스템이나 번역한 상용구 세트를 활용한 진료기록 번역이 시도되고 있으나, 일선 의료기관에서 사용되고 있는 의료용어의 다양성을 지원하는데, 많은 기술적 어려움을 겪고 있다.As such, the field demand for medical record translation is continuously increasing, but the reality is that, with the exception of some health check-up institutions and international medical centers, the translation of medical records does not go beyond the level of providing services to translation companies. Translation of medical records using an automatic translation system or translated boilerplate set is being attempted, but there are many technical difficulties in supporting the diversity of medical terminology used in frontline medical institutions.

진료기록 번역은 단순히 의료용어 사전 또는 의학 전문용어 사전을 이용하여 원시 의료용어를 목적 의료용어로 단순히 전환하여 번역할 수 없다. 그 이유는 의료용어는 국가별로 서로 다르게 사용될 수 있기 때문이다. 또한, 의료용어가 세부적으로 매우 방대하고 복잡하기 때문에, 원시 의료용어에 해당하는 목적 의료용어가 일대일로 대칭되지 않는다. 뿐만 아니라, 의료용어가 일반적으로 사용되는 것이 아닐 경우 해당되는 목적 의료용어 자체가 존재하지 않을 수도 있다.Medical record translation simply cannot be translated by simply converting a source medical term into a target medical term using a medical terminology dictionary or medical terminology dictionary. This is because medical terms may be used differently in different countries. In addition, since the medical term is very large and complex in detail, the target medical term corresponding to the original medical term is not symmetrical one-to-one. In addition, if the medical term is not commonly used, the corresponding purpose medical term itself may not exist.

상기와 같은 문제점을 해결하고자, 의료용어 등 전문용어를 번역하는 기술들이 제시되고 있다. 의료번역 데이터를 의뢰 종류별로 미리 저장하여 의료용어를 번역하는 기술[특허문헌 1], 빈번히 등장하는 용어를 사전에 구축하여 번역을 수행하는 기술[특허문헌 2] 등이 제시되고 있다. 또한, 원시언어 또는 목적언어로 작성된 대량의 문서인 코퍼스에 기반해서 고빈도 중복 어휘 문자열 및 용례에 따른 해당 도메인의 구문 번역 패턴 및 문장 번역 패턴을 추출하여 번역하는 기술도 제시되고 있다[특허문헌 3]. 또한, 중간언어를 이용하여 원시언어-목적언어 용어 리스트를 작성하여 번역하는 기술 등이 제시되고 있다[특허문헌 4].In order to solve the above problems, techniques for translating technical terms such as medical terms have been proposed. Techniques for translating medical terms by storing medical translation data in advance for each type of request [Patent Document 1], and constructing frequently appearing terms in advance for translation [Patent Document 2], etc. have been proposed. In addition, a technique for extracting and translating a phrase translation pattern and a sentence translation pattern of a corresponding domain according to a high frequency overlapping vocabulary string and usage based on a corpus, which is a large amount of documents written in a source language or a target language, is also proposed [Patent Document 3] ]. Also, a technique for preparing and translating a list of terms in a source language-object language using an intermediate language has been proposed [Patent Document 4].

그러나 상기 선행기술들은 전문용어 사전을 이용하여 번역하거나, 단순히 원시언어와 목적언의 의료용어 간에 매칭되는 리스트를 구비하여 의료용어를 번역한다. 따라서 상기 선행기술들은 모든 의료용어들을 원시언어에서 목적언어로 매칭하는 것이 어렵고 이로인해 사실상 정확한 번역이 어렵다. 이것은 의료용어가 세부적으로 보면 그 내용이 너무 방대하고 다양하게 사용되고 있기 때문이다.However, the prior art translates medical terms using a terminology dictionary or simply by providing a list matching between the source language and the medical term of the object language. Therefore, in the prior art, it is difficult to match all medical terms from the source language to the target language, and thus, it is difficult to translate accurately. This is because medical terminology is used too extensively and in various ways if you look at it in detail.

한편, 진료기록 문서에 기재되는 의료용어의 개념을 명확히 하기 위해 참조용어체계(Reference terminology)들이 개발되어 사용되고 있다. 즉, 의료인들 사이에서도 동일한 개념에 대해 여러 가지 용어를 사용함으로써 원활한 정보 소통에 문제가 발생한다. 이를 위해, 특정 의료분야에서 사용되는 의학 개념의 집합, 개념에 대한 정의, 개념을 일컫는 용어, 개념 간의 관계 등을 포함하는 용어체계(Terminology System)가 개발되고 있으며, 그 목적성과 특징에 따라, 참조용어체계(Reference terminology), 인터페이스용어체계(Interface terminology) 등이 있다. 참조용어체계(Reference terminology)는 의학개념과 그들 간의 관계(Inter-relationships)의 정형화된 표현의 집합으로서, SNOMED CT, RxNorm, NCI Thesaurus, ICNP 등이 있다.Meanwhile, reference terminology has been developed and used to clarify the concept of medical terms written in medical record documents. In other words, even among medical professionals, problems arise in smooth communication of information by using various terms for the same concept. To this end, a terminology system is being developed that includes a set of medical concepts used in a specific medical field, definitions of concepts, terms referring to concepts, and relationships between concepts. There are reference terminology and interface terminology. Reference terminology is a set of standardized expressions of medical concepts and inter-relationships between them. There are SNOMED CT, RxNorm, NCI Thesaurus, and ICNP.

의학개념에 대한 정형화된 표현들의 집합인 참조용어체계가 있다고 하더라도, 각 국가의 의료기관에서 다양한 분야의 의료진이 사용하는 해당 국가의 용어는 상이할 수밖에 없기 때문에 그 차이를 매워 주기 위해 매핑이라는 작업이 필요하다.Even if there is a reference terminology system, which is a set of standardized expressions for medical concepts, the national terminology used by medical staff in various fields at medical institutions in each country is inevitably different. Do.

또한, 의료용어에 대한 개념들이 체계화되더라도 의료 데이터(또는 진료기록)를 명확하게 이해하기 위해서는, 그 개념들이 어떻게 사용되고 있는지를 파악해야 한다. 예를 들어, 임상문서의 혈압이 동맥혈압이고 수축기 혈압인지 이완기 혈압인지가 파악되었다면, 그 혈압이 어떤 상태에서 측정된 데이터인지 기술해야 한다. 또, 환자의 증상 또는 진단의 내용을 보다 명확하게 기술하기 위해서는 그 경중, 위치 등을 보다 상세히 표현해야 한다.In addition, even if the concepts of medical terms are systematized, in order to clearly understand medical data (or medical records), it is necessary to understand how the concepts are being used. For example, if the blood pressure in the clinical document is arterial blood pressure and whether it is systolic or diastolic blood pressure, it should be described in which condition the blood pressure is measured. In addition, in order to more clearly describe the contents of the patient's symptoms or diagnosis, the severity, location, etc. should be expressed in more detail.

즉, 하나의 의료 데이터는 의료용어(또는 개념) 뿐만 아니라 그 데이터가 만들어진 상황정보도 알아야 한다. 그러나 동일한 의료용어라도 의료진 또는 의료기관에 따라 상황정보는 매우 달라질 수 있다. 1차 의료기관에서는 혈압을 측정하여 단지 수축기 혈압과 이완기 혈압의 수치만 기재하면 되나, 3차 의료기관은 수축기 혈압과 이완기 혈압의 수치뿐만 아니라, 측정수단, 측정부위, 측정자세 등에 대해 세부적으로 기재할 수도 있다. 측정 상황에 따라 그 측정결과는 미세한 차이가 있을 수 있기 때문이다.That is, one piece of medical data needs to know not only the medical term (or concept) but also the context information in which the data was created. However, even with the same medical term, contextual information can be very different depending on the medical staff or medical institution. In primary medical institutions, blood pressure is measured and only the values of systolic and diastolic blood pressure are recorded, but in tertiary medical institutions, not only the values of systolic and diastolic blood pressure, but also measurement means, measurement site, measurement posture, etc. can be described in detail. there is. This is because there may be slight differences in the measurement results depending on the measurement conditions.

따라서 의료전문가 및 임상지원 전문가가 임상문서 내 정보를 보다 수월하게 보다 정확하게 번역할 수 있도록 이러한 상황정보도 포함하여 처리할 수 있어야 한다.Therefore, it should be possible to include and process such situational information so that medical professionals and clinical support specialists can translate information in clinical documents more easily and more accurately.

한국공개특허 10-22011-0112495 (2011.10.13.공개)Korean Patent Publication No. 10-22011-0112495 (published on October 13, 2011) 한국공개특허 10-2007-0059869 (2007.06.12.공개)Korean Patent Publication No. 10-2007-0059869 (published on Jun. 12, 2007) 한국공개특허 10-2007-0058950 (2007.06.11.공개)Korean Patent Publication No. 10-2007-0058950 (published on June 11, 2007) 한국공개특허 10-2011-0062867 (2011.06.10.공개)Korean Patent Publication No. 10-2011-0062867 (published on June 10, 2011)

본 발명의 목적은 상술한 바와 같은 문제점을 해결하기 위한 것으로, 공통 언어로 작성된 참조 용어체계를 구성하고, 원시 의료용어와 가장 높게 매칭되는 참조 용어체계의 개념을 검색하고, 검색된 개념과 매칭되는 목적 의료용어를 검색하여, 상기 원시 의료용어를 상기 목적 의료용어로 번역하는, 공통 용어체계 기반 의료용어 번역 시스템을 제공하는 것이다.An object of the present invention is to solve the problems described above, to construct a reference terminology written in a common language, to search for a concept of a reference terminology that is most highly matched with a raw medical term, and to match the searched concept An object of the present invention is to provide a medical term translation system based on a common terminology that searches for a medical term and translates the source medical term into the target medical term.

또, 본 발명의 목적은 참조 용어체계를 개념과 그들간의 관계로 구성되도록 온톨로지 형태로 구성하고, 원시 의료용어 또는 목적 의료용어와 개념 사이에 매핑관계를 의학용어 번역사전과 웹 문서를 참조하여 구성하는, 공통 용어체계 기반 의료용어 번역 시스템을 제공하는 것이다.In addition, it is an object of the present invention to construct a reference terminology system in the form of an ontology so as to be composed of concepts and relationships between them, and a mapping relationship between a source medical term or a target medical term and a concept by referring to a medical term translation dictionary and a web document. To provide a medical term translation system based on a common terminology.

특히, 본 발명의 목적은 원시 언어 또는 목적 언어와 참조 용어체계의 중간 언어 간의 의학용어 번역사전에서 대역 관계로 나타나면 원시/목적 의료용어와 참조 용어 사이에 동일 매핑을 설정하고, 의료 웹 문서 등에 동시에 나타나면 유사 매핑을 설정하여, 유사 매핑의 용어가 동일 매핑의 개념와 계층 관계가 있는 경우 유사 매핑의 용어를 대역용어로 사용하는, 공통 용어체계 기반 의료용어 번역 시스템을 제공하는 것이다.In particular, it is an object of the present invention to establish the same mapping between the source/object medical term and the reference term when it appears as a band relation in the medical term translation dictionary between the source language or the target language and the intermediate language of the reference terminology system, and simultaneously in a medical web document, etc. If it appears, the similar mapping is set, and when the term of the similar mapping has a hierarchical relationship with the concept of the same mapping, the term of the similar mapping is used as a broad term, and a common terminology-based medical term translation system is provided.

상기 목적을 달성하기 위해 본 발명은 원시 언어로 표시된 질의용어를 목적 언어로 표시되는 대역용어로 번역하는, 공통 용어체계 기반 의료용어 번역 시스템에 관한 것으로서, 적어도 1개의 표시용어를 포함하는 개념과, 상기 개념들간의 관계로 구성되는 참조 용어체계를 구성하여 저장하되, 상기 표시용어는 중간 언어로 표시되는 참조용어 관리부; 원시 언어의 용어(이하 원시용어) 또는 목적 언어의 용어(이하 목적용어)를 개념의 표시용어로 대응시킨 문서를 참조하여, 상기 원시용어 또는 목적용어와 해당 개념 사이를 매핑시키는 대역관계 설정부; 원시 언어로 표시된 질의용어에 대하여 목적 언어로 표시된 대역용어를 선정하되, 상기 질의용어와 매핑되는 개념(이하 중간 개념)을 추출하고, 상기 중간 개념 또는 상기 중간 개념과 관계를 갖는 개념과 매핑되는 목적용어를 검색하여, 검색된 목적용어를 상기 대역용어로 선정하는 대역용어 검색부; 및, 상기 질의용어에 대한 대역용어를 상기 대역용어 검색부를 통해 선정하게 하고, 상기 대역용어를 제공하는 질의용어 처리부를 포함하는 것을 특징으로 한다.In order to achieve the above object, the present invention relates to a common terminology-based medical term translation system that translates a query term expressed in a source language into a broad term expressed in a target language, a concept including at least one display term; a reference term management unit for constructing and storing a reference terminology composed of the relationship between the concepts, wherein the display term is displayed in an intermediate language; a band relationship setting unit for mapping between the source language term (hereinafter referred to as the source term) or the term of the target language (hereinafter referred to as the object term) with reference to a document in which the term of the target language (hereinafter referred to as the target term) is mapped to the term of the concept; For the query term expressed in the source language, select a term in the target language, extract a concept mapped to the query term (hereinafter referred to as an intermediate concept), and map the intermediate concept or a concept having a relationship with the intermediate concept a band term search unit that searches for a term and selects the searched target term as the band term; and a query term processing unit that selects a band term for the query term through the band term search unit and provides the band term.

또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 관계는 관계되는 2개의 개념이 동일한 개념을 나타내는 동일 관계와, 2개의 개념 간의 상위 또는 하위 개념을 나타내는 계층 관계를 포함하는 것을 특징으로 한다.Further, in the present invention, in the common terminology-based medical term translation system, the relationship includes an identical relationship in which two related concepts indicate the same concept and a hierarchical relationship in which two concepts represent a higher or lower concept. do it with

또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 중간 개념과 관계를 갖는 개념은 상기 중간 개념과 동일관계 또는 계층관계로 연속되어 관계를 갖는 개념을 포함하되, 계층관계인 경우 상위 개념만을 포함하는 것을 특징으로 한다.In addition, in the present invention, in a medical term translation system based on a common terminology, the concept having a relationship with the intermediate concept includes a concept having a relationship with the intermediate concept in the same relationship or hierarchical relationship, but in the case of a hierarchical relationship, a higher concept It is characterized in that it contains only.

또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 매핑은 동일 매핑과 유사 매핑의 2가지로 구분하되, 상기 유사 매핑은 가중치가 부여되고, 상기 대역용어 검색부는 상기 중간 개념과 동일 매핑되는 목적용어가 없으면 상기 중간 개념의 상위 개념과 동일 매핑되는 목적용어를 검색하거나, 상기 중간 개념과 유사 매핑되는 목적용어를 검색하는 것을 특징으로 한다.In addition, in the present invention, in the common terminology-based medical term translation system, the mapping is divided into two types: the same mapping and the similar mapping, the similar mapping is given a weight, and the band term search unit is the same as the intermediate concept If there is no object term to be mapped, an object term that is identically mapped to the upper concept of the intermediate concept is searched for, or an object term that is similarly mapped to the intermediate concept is searched.

또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 대역용어 검색부는 상기 질의용어와 동일 매핑되는 개념이 있으면, 동일 매핑되는 개념의 하위 개념 중에서 가중치가 가장 높은 개념도 중간 개념으로 추출하는 것을 특징으로 한다.In addition, in the present invention, in a medical term translation system based on a common terminology, if there is a concept that is mapped identically to the query term, the broad term search unit extracts the concept with the highest weight among the subconcepts of the same mapped concept as an intermediate concept. characterized in that

또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 질의용어 처리부는 상기 질의용어와 상기 중간 개념이 동일 매핑이 아니거나, 상기 대역용어와 상기 중간 개념이 동일 매핑이 아니면, 상기 중간 개념의 표시용어를 상기 대역용어와 함께 제공하는 것을 특징으로 한다.In addition, in the present invention, in a common terminology-based medical term translation system, the query term processing unit determines that the query term and the intermediate concept are not the same mapping or the broad term and the intermediate concept are not the same mapping, the intermediate concept It is characterized in that the expression term of the concept is provided together with the band term.

또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 대역관계 설정부는 원시 언어 또는 목적 언어와 중간 언어 간의 번역사전을 참조하여, 원시용어 또는 목적용어가 개념의 표시용어로 대역하는 용어이면, 해당 원시용어 또는 목적용어와 해당 개념 사이를 동일 매핑시키고, 원시 언어 또는 목적 언어의 웹 문서에서 원시용어와 개념의 표시용어를 병기하면 해당 원시용어 또는 목적용어와 해당 개념 사이를 유사 매핑시키는 것을 특징으로 한다.In addition, in the present invention, in a medical term translation system based on a common terminology system, the band relationship setting unit refers to a translation dictionary between a source language or a target language and an intermediate language, and a term in which the source term or the target term is translated into a concept display term. In this case, the same mapping is made between the source term or object term and the concept, and if the source term and the display term of the concept are added together in the web document of the source language or the object language, a similar mapping between the source term or the object term and the concept is performed. characterized in that

또, 본 발명은 공통 용어체계 기반 의료용어 번역 시스템에 있어서, 상기 원시용어, 상기 목적용어, 또는 개념의 표시용어는 의료용어인 것을 특징으로 한다.In addition, the present invention is characterized in that, in the common terminology-based medical term translation system, the source term, the object term, or the term indicating the concept is a medical term.

상술한 바와 같이, 본 발명에 따른 공통 용어체계 기반 의료용어 번역 시스템에 의하면, 질의용어의 대역용어로 사용할 목적용어가 의학용어 번역사전에 나타나지 않더라도, 질의용어에 가장 적절하게 대역될 수 있는 대역용어를 찾아 번역할 수 있는 효과가 얻어진다.As described above, according to the medical term translation system based on the common terminology according to the present invention, even if the target term to be used as a cross term of the query term does not appear in the medical term translation dictionary, a term that can be translated most appropriately to the query term. The effect of finding and translating is obtained.

또한, 본 발명에 따른 공통 용어체계 기반 의료용어 번역 시스템에 의하면, 인터넷 웹 상 등에 원시 의료용어의 대역용어로서 나타나는 목적 의료용어를 이용하되, 해당 도메인의 의료용어인지를 판단하여 번역의 오류를 방지할 수 있는 효과가 얻어진다.In addition, according to the medical term translation system based on the common terminology system according to the present invention, a target medical term that appears as a broad term of a source medical term on the Internet web or the like is used, but it is determined whether it is a medical term of the corresponding domain to prevent translation errors. possible effects are obtained.

도 1은 본 발명을 실시하기 위한 전체 시스템의 구성을 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 공통 용어체계 기반 의료용어 번역 시스템의 구성에 대한 블록도이다.
도 3과 도4는 본 발명의 일실시예에 따른 참조 용어체계의 구성 및 구조를 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 원시/목적 의료용어, 및, 참조 용어체계, 및, 그 매핑을 도시한 예제 도면.
도 6은 본 발명의 일실시예에 따른 질의용어에 대한 대역용어를 검색하는 과정을 도시한 도면.
1 is a diagram showing the configuration of an entire system for implementing the present invention.
2 is a block diagram of a configuration of a medical term translation system based on a common terminology according to an embodiment of the present invention.
3 and 4 are diagrams illustrating the configuration and structure of a reference terminology system according to an embodiment of the present invention.
5 is an exemplary diagram illustrating a source/purpose medical term, a reference terminology, and a mapping thereof according to an embodiment of the present invention.
6 is a diagram illustrating a process of searching for a broad term for a query term according to an embodiment of the present invention.

이하, 본 발명의 실시를 위한 구체적인 내용을 도면에 따라서 설명한다.Hereinafter, specific contents for carrying out the present invention will be described with reference to the drawings.

또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.In addition, in demonstrating this invention, the same part is attached|subjected by the same code|symbol, and the repetition description is abbreviate|omitted.

먼저, 본 발명을 실시하기 위한 전체 시스템의 구성의 예들에 대하여 도 1을 참조하여 설명한다.First, examples of the configuration of the entire system for implementing the present invention will be described with reference to FIG. 1 .

도 1a 또는 도 1b에서 보는 바와 같이, 본 발명에 따른 공통 용어체계 기반 의료용어 번역 시스템은 네트워크 상의 서버 시스템 또는 컴퓨터 단말 상의 프로그램 시스템으로 실시될 수 있다.1A or 1B , the medical term translation system based on the common terminology according to the present invention may be implemented as a server system on a network or a program system on a computer terminal.

도 1a와 같이, 본 발명의 실시를 위한 전체 시스템의 일례는 사용자 단말(10), 의료용어 번역 시스템(30), 및, 웹 서버(60)로 구성되고 서로 네트워크(20)로 연결된다. 또, 필요한 데이터를 저장하기 위한 데이터베이스(40)를 더 구비할 수 있다. 또한, 추가적으로 별도의 번역 서버(50)를 더 포함하여 구성될 수 있다.As shown in FIG. 1A , an example of an overall system for implementing the present invention is composed of a user terminal 10 , a medical term translation system 30 , and a web server 60 , and is connected to each other by a network 20 . In addition, a database 40 for storing necessary data may be further provided. In addition, it may be configured to further include a separate translation server 50 .

사용자 단말(10)은 사용자가 이용하는 PC, 노트북, 넷북, PDA, 모바일 등의 통상의 컴퓨팅 단말기이다. 사용자는 사용자 단말(10)을 이용하여 진료기록 문서를 번역 서버(50) 또는 의료용어 번역 시스템(30)으로 전송하여, 진료기록 문서를 번역 요청을 한다.The user terminal 10 is a general computing terminal such as a PC, a notebook computer, a netbook, a PDA, and a mobile device used by a user. The user transmits the medical record document to the translation server 50 or the medical term translation system 30 using the user terminal 10 to request translation of the medical record document.

의료용어 번역 시스템(30)은 통상의 서버로서 네트워크(20)에 연결되어 의료 용어를 원시 언어(원시 의료용어)에서 목적 언어(목적 의료용어)로 번역하는 서비스를 제공한다. 의료용어 번역 시스템(30)은 상기 각 서비스들을 인터넷 상의 웹페이지로 제공하는 웹서버 또는 웹어플리케이션 서버 등으로 구현될 수 있다.The medical term translation system 30 is a normal server and is connected to the network 20 to provide a service for translating medical terms from a source language (source medical term) to a target language (target medical term). The medical term translation system 30 may be implemented as a web server or a web application server that provides each of the services as a web page on the Internet.

이하에서 설명의 편의를 위해, 원시 의료용어를 원시용어로도 표시하고, 목적 의료용어를 목적용어로도 기재한다. 또한, 원시 의료용어 또는 목적 의료용어를 모두 지칭하는 말로서, 번역 대상인 용어라는 의미로 대상 용어 또는 대상 의료용어로도 기재한다. 또한, 번역할 원시 의료용어를 질의용어라 하고, 질의용어를 번역할 목적 의료용어를 대역용어라 부르기로 한다.Hereinafter, for convenience of explanation, the source medical term is also indicated as the source term, and the target medical term is also described as the object term. In addition, as a term referring to both the source medical term and the target medical term, it is also described as a target term or a target medical term in the sense of a term to be translated. In addition, the source medical term to be translated will be referred to as a query term, and the medical term for which the query term is to be translated will be referred to as an alternate term.

한편, 의료용어 번역 시스템(30)은 원시 의료용어에서 목적 의료용어로 단순히 의료용어만을 번역하도록 구현한다. 다른 실시예로서, 의료용어 번역 시스템(30)은 일반 번역 기능을 탑재하여, 의료용어가 포함된 문장을 번역하도록 구현될 수 있다. 그러나 이하에서 의료용어 번역 시스템(30)은 의료용어만을 대역어로 번역하고, 일반적인 번역 기능은 의료용어 번역 시스템(30) 외에 다른 시스템 또는 서버로 구현되는 것으로 설명한다.Meanwhile, the medical term translation system 30 is implemented to simply translate only medical terms from a source medical term to a target medical term. As another embodiment, the medical term translation system 30 may be implemented to translate a sentence including a medical term by mounting a general translation function. However, hereinafter, it will be described that the medical term translation system 30 translates only medical terms into the full language, and a general translation function is implemented as a system or server other than the medical term translation system 30 .

일반 번역기능은 사용자 단말(10) 상에 구현될 수 있다. 즉, 사용자 단말(10)에 일반 번역 시스템(프로그램 시스템)이 설치되고, 의료용어가 포함된 문장을 번역하다가 의료용어에 대한 번역을 의료용어 번역 시스템(30)에 요청할 수 있다. 또 다른 실시예로서, 사용자 단말(10)은 번역 서버(50)에 의료용어가 포함된 문장을 번역 요청하면, 번역 서버(50)가 의료용어 외 다른 문장을 번역하고 의료용어에 대하여 의료용어 번역 시스템(30)에 요청할 수 있다.The general translation function may be implemented on the user terminal 10 . That is, a general translation system (program system) is installed in the user terminal 10 , and while translating a sentence including a medical term, a translation of the medical term may be requested from the medical term translation system 30 . As another embodiment, when the user terminal 10 requests the translation server 50 to translate a sentence containing a medical term, the translation server 50 translates a sentence other than the medical term and translates the medical term for the medical term The system 30 may be requested.

한편, 원시 언어는 번역을 하고자 하는 대상인 의료용어를 표현한 언어를 말하고, 원시 의료용어는 번역하고자 하는 용어를 말한다. 또한, 목적 언어는 번역의 결과로 얻고자 하는 의료용어(대역어)를 표현하는 언어를 말하고, 목적 의료용어는 번역결과로서 얻는 번역된 의료용어를 말한다. 예를 들어, 원시 언어는 한국어이고, 목적 언어는 중국어일 수 있다. 또한, 중간 언어는 참조 용어체계를 표현하는 언어로서, 통상 영어를 말한다.On the other hand, the source language refers to a language in which a medical term, which is an object to be translated, is expressed, and the source medical term refers to a term to be translated. In addition, the target language refers to a language expressing a medical term (translation language) to be obtained as a result of the translation, and the target medical term refers to a translated medical term obtained as a result of the translation. For example, the source language may be Korean and the target language may be Chinese. In addition, the intermediate language is a language expressing a reference terminology, and usually refers to English.

웹 서버(60)는 인터넷 상에 웹 문서 등을 제공하는 통상의 서버로서, 주로 의료용어를 포함하는 문서를 제공한다. 특히, 웹 서버(60)는 원시 언어 또는 목적 언어로 문서를 제공하는 서비스 서버를 말한다. 의료용어 번역 시스템(30)은 웹 서버(60)의 문서들을 수집하여, 해당 문서에 표현된 대상 의료용어(원시 의료용어 또는 목적 의료용어)와, 이들 의료용어와 함께 기재된 중간 언어의 의료용어(개념)들을 추출한다. 의료용어 번역 시스템(30)은 추출된 원시/목적 의료용어 및, 중간 의료용어(개념) 간의 대역후보 관계들을 설정한다.The web server 60 is a normal server that provides web documents and the like on the Internet, and mainly provides documents including medical terms. In particular, the web server 60 refers to a service server that provides documents in a source language or a target language. The medical term translation system 30 collects the documents of the web server 60, the target medical term (original medical term or target medical term) expressed in the document, and the medical term of an intermediate language written along with these medical terms ( concepts) are extracted. The medical term translation system 30 establishes band candidate relationships between the extracted source/purpose medical term and the intermediate medical term (concept).

데이터베이스(40)는 의료용어 번역 시스템(30)에서 필요한 데이터를 저장하는 통상의 저장매체로서, 의료용어의 참조 용어체계를 저장하는 참조용어DB(41), 원시 언어 또는 목적 언어와, 중간 언어 간의 의학용어 사전를 저장하는 용어사전DB(42), 참조 용어체계의 용어들과 원시/목적 의료용어 들간의 대역관계 등을 저장하는 대역관계DB(43) 등으로 구성된다. 상기 데이터베이스(40)의 구성은 일례일 뿐, 데이터베이스 구축이론에 따라 다양하게 구축될 수 있다.The database 40 is a general storage medium for storing data required by the medical term translation system 30, and includes a reference term DB 41 that stores a reference terminology of medical terms, a source language or an object language, and an intermediate language. It is composed of a term dictionary DB 42 for storing a medical term dictionary, a band relation DB 43 for storing a band relation between terms in a reference terminology system and source/purpose medical terms, and the like. The configuration of the database 40 is only an example, and may be constructed in various ways according to the database construction theory.

또한, 도 1b와 같이, 본 발명의 실시를 위한 전체 시스템의 다른 예는 컴퓨터 단말(10)에 설치되는 프로그램 형태의 의료용어 번역 시스템(30)으로 구성된다. 즉, 의료용어 번역 시스템(30)의 각 기능들은 컴퓨터 프로그램으로 구현되어 컴퓨터 단말(10)에 설치되어, 사용자(11)에 의해 번역하고자 하는 원시 의료용어를 컴퓨터 단말(10)의 입력장치를 통해 입력받나, 번역된 의료용어(목적 의료용어) 등을 컴퓨터 단말(10)의 출력장치를 통해 출력한다. 한편, 의료용어 번역 시스템(30)에서 필요한 데이터들은 컴퓨터 단말(10)의 하드디스크 등 저장공간에 저장되어 이용된다.In addition, as shown in FIG. 1B , another example of the entire system for implementing the present invention is composed of a medical term translation system 30 in the form of a program installed in the computer terminal 10 . That is, each function of the medical term translation system 30 is implemented as a computer program and installed in the computer terminal 10 , and the raw medical term to be translated by the user 11 is transmitted through the input device of the computer terminal 10 . It receives an input, but outputs a translated medical term (purpose medical term) through the output device of the computer terminal 10 . Meanwhile, data necessary for the medical term translation system 30 are stored and used in a storage space such as a hard disk of the computer terminal 10 .

다음으로, 본 발명의 일실시예에 따른 공통 용어체계 기반 의료용어 번역 시스템의 구성을 도 2를 참조하여 설명한다.Next, a configuration of a medical term translation system based on a common terminology according to an embodiment of the present invention will be described with reference to FIG. 2 .

도 2에서 보는 바와 같이, 본 발명의 일실시예에 따른 공통 용어체계 기반 의료용어 번역 시스템(30)은 참조용어 관리부(31), 대역관계 설정부(32), 질의용어 처리부(33), 및 대역용어 검색부(34)를 포함하여 구성된다. 추가적으로, 데이터를 저장하기 위한 데이터베이스(또는 저장공간)(40)를 더 포함하여 구성될 수 있다.As shown in FIG. 2 , a medical term translation system 30 based on a common terminology according to an embodiment of the present invention includes a reference term management unit 31 , a band relationship setting unit 32 , a query term processing unit 33 , and It is configured to include a band term search unit 34 . Additionally, it may be configured to further include a database (or storage space) 40 for storing data.

참조용어 관리부(31)는 개체 및 관계로 구조화된 참조 용어체계를 구축하여 저장한다.The reference term management unit 31 builds and stores a reference term system structured with entities and relationships.

참조 용어체계(common terminology)는 의료용어를 개념(concept)으로 정립하고, 동일한 용어(term)들을 개념에 포함시키고, 개념들간의 관계를 설정하여, 체계화시킨 용어개념들의 체계를 의미한다. 바람직하게는, 개념(concepat)에는 해당 의료용어를 사용하게 된 상황을 기술하는 상황정보(context)가 포함된다.A common terminology refers to a system of terminology that has been systematized by establishing medical terms as concepts, including the same terms in concepts, and establishing relationships between concepts. Preferably, the concept includes context describing the circumstances in which the medical term was used.

참조 용어체계(또는 개념체계)는 종래 만들어진 참조 용어체계를 기반으로 구성될 수 있다. 참조 용어체계는 의학 개념(Medical Concept)이나 의학용어(Medical Term)을 기반으로 그들 간의 관계(Inter-relationships)와 속성을 정형화하여 표현한 것으로서. SNOMED CT, RxNorm, NCI Thesaurus, ICNP 등이 상용화되어 사용되고 있다. 본 발명의 참조 용어체계는 종래의 참조 용어체계를 이용하여 구성하나, 종래의 참조 용어체계와는 다르게 구현된다. 대량의 의료용어를 한번에 작성하기 어렵기 때문에, 종래의 참조 용어체계의 용어들과 관계들을 이용할 뿐이다. 즉, 참조 용어체계의 의료용어 개체 및, 그 관계는 변화될 수 있고, 참조용어체계에는 통상 상황정보가 없는 경우도 많다.The reference terminology (or conceptual system) may be constructed based on a previously created reference terminology. The reference term system is a standardized expression of inter-relationships and properties based on a medical concept or medical term. SNOMED CT, RxNorm, NCI Thesaurus, and ICNP have been commercialized and used. The reference terminology of the present invention is constructed using the conventional reference terminology, but is implemented differently from the conventional reference terminology. Since it is difficult to write a large number of medical terms at once, only the terms and relationships of the conventional reference terminology are used. That is, the medical term entities and their relationships in the reference terminology system may change, and there are usually no contextual information in the reference terminology system.

참조 용어체계는 개념(Concept)을 기반으로 하는 표시용어(Term)나 관계정보 등과 같이 개념들에 대한 관련 정보 저장소이다. 표시용어(Term)는 해당 의료 개념을 중간 언어로서 표시되는 의료용어를 말한다. 표시용어(Term)는 자신이 "대표용어(preferred term)"가 될 수도 있고, 이미 등록된 대표용어에 대한 동의어, 혹은 약어가 될 수도 있다. 즉, 개체(또는 개념)는 적어도 하나의 표시용어(term) 속성을 포함하되, 상기 표시용어 속성 중 하나가 대표용어로 설정될 수 있다. 대표용어는 개체의 이름으로도 사용될 수도 있다. 이하에서 표시용어는 개체의 용어(개체 용어) 또는 개념의 용어(개념 용어), 또는 그냥 "용어(의료용어)" 등으로도 혼용한다.The reference terminology is a repository of information related to concepts, such as term or relational information based on a concept. A term refers to a medical term in which a corresponding medical concept is expressed as an intermediate language. A term may be a "preferred term" itself, or it may be a synonym or an abbreviation for a previously registered representative term. That is, the entity (or concept) includes at least one display term attribute, and one of the display term attributes may be set as a representative term. Representative terms can also be used as names of entities. Hereinafter, the terminology is used interchangeably as an entity term (individual term) or concept term (concept term), or simply a “term (medical term)”.

참조 용어체계는 개념(Concepts)과 연관(association)으로 표시할 수 있고, 각각은 개체(entity)와 관계(relation)로 구조화시킬 수 있다. 개체와 개념, 연관(association)과 관계(relation)는 각각 대응되는 개념이므로, 이하에서는 혼용한다.The reference terminology can be expressed in terms of Concepts and associations, and each can be structured as entities and relationships. Entity and concept, association and relationship are respectively corresponding concepts, so they are used interchangeably below.

도 3의 참조 용어체계의 일례를 참조하여 보다 구체적으로 설명한다.It will be described in more detail with reference to an example of the reference terminology of FIG. 3 .

도 3에서 보는 바와 같이, 참조 용어체계는 개체(61)와 관계(62)로서 도식화 할 수 있다. 도 3에서 개체(61)는 C1, C2, ..., C6이고, 표시용어(term)는 T11, T21, ..., T61이다. 개체 C4의 표시용어는 T41, T42, T43, T44를 갖는다. 그 중에서 표시용어 T42는 대표용어이다. 도 3에서 대표용어를 굵은 원으로 표시되고 있다.As shown in FIG. 3 , the reference terminology can be schematized as entities 61 and relationships 62 . In FIG. 3, the entities 61 are C1, C2, ..., C6, and display terms are T11, T21, ..., T61. The terminology for entity C4 has T41, T42, T43, and T44. Among them, the display term T42 is a representative term. In FIG. 3, representative terms are indicated by thick circles.

관계(62)는 상기 개체들을 연결하는 R12, R23, ..., R56으로 표시된다. 관계 R12는 개체 C1과 개체 C2 사이의 관계이고, 관계 R35는 개체 C3과 개체 C5 사이의 관계이다.Relationship 62 is denoted by R12, R23, ..., R56 connecting the entities. Relationship R12 is a relationship between entity C1 and entity C2, and relationship R35 is a relationship between entity C3 and entity C5.

관계는 크게 계층관계와 동일관계로 구분된다. 계층관계는 두 개체의 개념들간에 상위와 하위 개념의 관계를 갖는다. 즉, 상위 개념이 하위 개념을 포괄한다. 계층관계는 두 개체에 대한 부모와 자식의 관계를 규정하는 상하 관계 및 두 개체의 포함관계를 규정하는 도메인 관계를 포함한다. 이하에서 계층 관계에서 포괄하는 개념을 상위 개념 또는 상위 개체라 하고, 상위 개념에 속하는 개념을 하위 개념 또는 하위 개체라 부르기로 한다.Relationships are broadly classified into hierarchical and homogeneous relationships. The hierarchical relationship has a relationship of a parent and a child concept between the concepts of two entities. That is, the upper concept encompasses the lower concept. The hierarchical relationship includes a subordinate relationship defining a parent-child relationship with respect to two entities and a domain relationship defining an inclusion relationship between the two entities. Hereinafter, a concept encompassed by a hierarchical relationship will be referred to as an upper-level concept or upper-level entity, and a concept belonging to the upper-level concept will be referred to as a lower-level concept or lower-level entity.

동일관계는 두 개체가 동일한 개념으로 서로 대응되는 관계를 말한다.The same relationship refers to a relationship in which two entities correspond to each other with the same concept.

도 3에서, 계층관계는 한줄 직선으로 표시하고, 동일관계는 두줄 직선으로 표시한다. 즉, 개체 < C1, C2 >, < C1, C3 >, < C3, C4 >, < C5, C6 > 등은 서로 계층관계를 갖고, 각각 R12, R13, R34, R56으로 표시되고 있다. 개체 < C3, C5 >는 서로 동일관계를 갖고 R35로 표시되고 있다.In Fig. 3, the hierarchical relationship is indicated by a single straight line, and the same relationship is indicated by a two-line straight line. That is, the entities <C1, C2>, <C1, C3>, <C3, C4>, <C5, C6> have a hierarchical relationship with each other and are denoted by R12, R13, R34, and R56, respectively. The entities <C3, C5> have the same relationship and are denoted by R35.

이때, R12의 계층관계에서 앞의 개체인 C1이 상위 개체이고, C2가 하위 개체라고 하면, 개념 C1이 개념 C3을 포괄하고, 개념 C3가 개념 C4를 포괄한다. 따라서 개념 C1이 개념 C4를 포괄한다고 볼 수 있다. 따라서 계층 구조에서 상위에 위치한 개념은 그 계층 구조에 직접적으로 계층관계로 연결된 하위 개념들을 모두 포괄한다. 즉, 개념 C1의 하위 개념들은 C2, C3, C4 등을 포함한다.At this time, in the hierarchical relationship of R12, if C1, which is the preceding entity, is the upper entity, and C2 is the lower entity, concept C1 encompasses concept C3, and concept C3 encompasses concept C4. Therefore, it can be said that concept C1 encompasses concept C4. Therefore, a concept located at a higher level in the hierarchical structure includes all of the lower concepts directly connected to the hierarchical structure in a hierarchical relationship. That is, the sub-concepts of concept C1 include C2, C3, C4, and the like.

또한, 개념 C3과 C5는 동일관계를 갖는 동일한 개념이기 때문에 개념 C1은 개념 C3를 포함하고 당연히 개념 C5를 포함한다. 따라서 개념 C1은 C3, C5, C6의 개념을 모두 하위 개념으로 갖는다. 반대로, 개념 C3, C5, C6들은 개념 C1을 상위 개념으로 갖는다.Also, since concepts C3 and C5 are the same concept having the same relation, concept C1 includes concept C3 and, of course, includes concept C5. Therefore, concept C1 has all the concepts of C3, C5, and C6 as sub-concepts. Conversely, concepts C3, C5, and C6 have concept C1 as a superordinate concept.

이때 직접적인 계층관계에 의한 상위 개념 또는 하위 개념을 인접 상위 개념 또는 인접 하위 개념이라고 부르기로 한다. 즉, C1과 C3는 인접 상위관계로서, 각각 인접 상위 개념과 인접 하위 개념이다. 그러나 C1과 C4는 상위 개념과 하위 개념이긴 하나, 인접 상위 또는 하위 개념은 아니다.In this case, a higher-level concept or a lower-level concept due to a direct hierarchical relationship will be referred to as an adjacent upper-level concept or an adjacent lower-level concept. That is, C1 and C3 are an adjacent parent relationship, respectively, an adjacent parent concept and an adjacent child concept. However, although C1 and C4 are superconcepts and subconcepts, they are not adjacent superconcepts or subconcepts.

도 4는 의료 용어에서 상하위 개념, 즉, 계층관계를 가지는 개념들을 예시하고 있다. 즉, 도 4와 같이, 혈압의 개념을 개체와 관계로 표시할 수 있다. 즉, 혈압이란 혈관의 이름에 따라 동맥혈압, 모세관혈압, 정맥혈압 등으로 구별되는데, 보통 혈압이라고 하면 동맥혈압을 말한다. 동맥혈압은 심장박동에 의하여 변동한다. 또, 동맥혈압은 수축기 혈압(systolic pressure), 확장기 혈압(diastolic pressure), 맥압(pulse pressure), 평균동맥압(mean arterial pressure) 등 여러 가지로 분류된다. 수축기 혈압은 심근의 수축에 의해서 심실내의 혈액이 대동맥으로 박출될 때의 혈관 내 최고압력을 말하며, 확장기혈압은 심장이 수축한 다음에 이어서 확장될 때의 혈관 내 압력을 말한다. 또, 맥압은 수축기혈압과 확장기혈압의 차이를 의미하고, 평균동맥압은 최고동맥혈압과 최저동맥혈압의 평균치를 의미한다. 특히, 평균동맥압은 공식에 의해 수축기 혈압과 확장기 혈압으로부터 구할 수도 있으나, 엄밀하게는 컴퓨터화한 혈압측정장치를 통해서 얻어야 한다.4 exemplifies the concept of upper and lower level in medical terms, that is, concepts having a hierarchical relationship. That is, as shown in FIG. 4 , the concept of blood pressure can be expressed in relation to an entity. That is, blood pressure is divided into arterial blood pressure, capillary blood pressure, venous blood pressure, and the like according to the name of the blood vessel. In general, blood pressure refers to arterial blood pressure. Arterial blood pressure fluctuates with the heartbeat. In addition, arterial blood pressure is classified into various types, such as systolic pressure, diastolic pressure, pulse pressure, and mean arterial pressure. The systolic blood pressure refers to the maximum intravascular pressure when blood in the ventricle is ejected into the aorta due to the contraction of the myocardium, and the diastolic blood pressure refers to the intravascular pressure when the heart contracts and then expands. In addition, the pulse pressure means the difference between the systolic and diastolic blood pressure, and the mean arterial pressure means the average value of the diastolic blood pressure and the diastolic blood pressure. In particular, the mean arterial pressure can be obtained from the systolic blood pressure and the diastolic blood pressure according to the formula, but strictly, it must be obtained through a computerized blood pressure measuring device.

또한, 각 개념 또는 개체는 상황정보(context)를 표시하는 상황 속성(context)을 가질 수 있으며, 특히, 복수의 상황 속성(context)을 가질 수 있다. 이하에서 상황 속성과 상황정보를 혼용한다. 상황정보(context)는 개념을 묘사하거나 그 개념이 사용되는 상황을 나타내는 용어로 구성된다.In addition, each concept or entity may have a context for displaying context, and in particular, may have a plurality of context attributes. Hereinafter, context attributes and context information are used interchangeably. Context consists of terms that describe a concept or the context in which the concept is used.

다음으로, 대역관계 설정부(32)를 설명한다.Next, the band relationship setting unit 32 will be described.

대역관계 설정부(32)는 중간 언어로 구성된 참조 용어체계 내의 개념들과, 원시 의료용어(또는 원시용어) 및 목적 의료용어(또는 목적용어)를 매핑시킨다. 즉, 매핑은 원시언어 또는 목적언어로 표시되는 대상 용어와, 참조 용어체계의 개념과의 대응을 나타낸다.The band relationship setting unit 32 maps the concepts in the reference terminology composed of the intermediate language with the source medical term (or source term) and the target medical term (or object term). That is, the mapping represents the correspondence between the target term expressed in the source language or the target language and the concept of the reference terminology system.

바람직하게는, 매핑은 동일 매핑과 유사 매핑으로 구분된다. 한편, 개념과 원시/목적용어 사이의 매핑에 가중치(이하 매핑 가중치)를 부여할 수 있다. 이때 매핑 가중치를 0 ~ 1 사이의 범위의 실수로 정하고, 가중치가 0이면 개념과 용어(원시용어 또는 목적용어) 사이에는 매핑이 형성되지 않는 것을 의미하고, 가중치가 1이면 동일 매핑을 의미하고, 가중치가 0 초과이고 1 미만이면 유사 매핑을 의미한다.Preferably, the mappings are divided into identical mappings and similar mappings. Meanwhile, a weight (hereinafter, mapping weight) may be assigned to the mapping between the concept and the source/object term. At this time, the mapping weight is set as a real number in the range of 0 to 1, and if the weight is 0, it means that no mapping is formed between the concept and the term (source term or object term), and if the weight is 1, it means the same mapping, If the weight is greater than 0 and less than 1, it means similar mapping.

동일 매핑(또는 가중치가 1인 매핑)은 원시/목적 용어(대상 용어)와 개념이 서로 동일한 의미를 갖는 매핑으로서, 완전한 대역을 할 수 있는 관계를 의미한다. 즉, 매핑되는 대상 용어를 개념의 표시용어로 표시할 수 있다는 의미이고, 대상 용어를 개념의 표시용어로 번역하여 표시할 수 있다.Equal mapping (or mapping with a weight of 1) is a mapping in which a source/object term (target term) and a concept have the same meaning, and refers to a relationship capable of full bandwidth. That is, it means that the target term to be mapped can be displayed as the expression term of the concept, and the target term can be translated and displayed as the expression term of the concept.

또한, 유사 매핑(또는 가중치 w가 0 < w < 1 인 매핑)은 대상 용어와 개념이 동일한 의미라고 볼 수 없으나, 대상 용어를 개념의 표시용어로 표현하여도 의미는 통할 수 있다는 의미이다. 또한, 매핑 가중치가 높을수록 유사성이 높고, 대역성이 높다는 것을 의미한다.In addition, similar mapping (or mapping in which the weight w is 0 < w < 1) does not mean that the target term and the concept have the same meaning. Also, the higher the mapping weight, the higher the similarity and the higher the bandwidth.

도 5는 원시 의료용어 또는 목적 의료용어와, 개념 간의 매핑을 한 일례를 도시하고 있다. 도 5에서 보는 바와 같이, 원시 용어 S1과 개념 C1은 가중치가 1.0으로서 동일 매핑을 의미한다. 그 외에도 원시 의료용어에 대한 동일 매핑은 (S2,C3), (S3,C6)이 있고, 목적 의료용어에 대한 동일 매핑은 (D1,C1), (D2,C5)가 있다. 또한, 원시 용어의 유사 매핑은 (S2,C4), (S2,C6)가 있고 각각의 가중치는 0.5와 0.3이다. 또한, 목적 용어의 유사 매핑은 (D3,C4)가 있고 가중치는 0.7이다.5 shows an example of mapping between a source medical term or a target medical term and a concept. As shown in FIG. 5 , the primitive term S1 and the concept C1 have a weight of 1.0 and mean the same mapping. In addition, there are (S2,C3) and (S3,C6) identical mappings for raw medical terms, and (D1,C1) and (D2,C5) identical mappings for target medical terms. Also, similar mappings of primitive terms are (S2,C4) and (S2,C6), and their weights are 0.5 and 0.3, respectively. Also, the similar mapping of the target term is (D3,C4) and the weight is 0.7.

한편, 대역관계 설정부(32)는 의학용어 번역사전을 이용하여, 원시/목적 용어와 개념간의 동일 매핑을 설정한다. 의학용어 번역사전은 원시 언어와 중간 언어, 또는 목적 언어와 중간 언어 간의 번역사전이다.Meanwhile, the band relationship setting unit 32 sets the same mapping between the source/object term and the concept by using the medical term translation dictionary. The medical term translation dictionary is a translation dictionary between a source language and an intermediate language, or a target language and an intermediate language.

원시 언어(또는 목적 언어)와 중간 언어 간의 의학용어 번역사전을 참조하여, 해당 번역사전에서 원시 의료용어(또는 목적 의료용어)의 대역어로서 개념의 표시용어가 있으면, 해당 원시 의료용어(또는 목적 의료용어)와 개념 사이에 동일 매핑이 형성된다. Refer to the medical term translation dictionary between the source language (or the target language) and the intermediate language, and if there is a term indicating the concept as an alternate word for the source medical term (or the target medical term) in the translation dictionary, the source medical term (or the medical term for the purpose) The same mapping is formed between terms) and concepts.

예를 들어, 원시 의학용어 번역사전(원시 언어와 중간 언어 간의 번역사전)에서, 원시 용어 S1의 대역어로서 개념 C1의 표시용어(term) T11이 나타나면, 원시 용어 S1과 개념 C1 사이에는 동일 매핑을 설정한다. 이때 원시 용어 또는 목적 용어에 대하여, 개념에 포함된 다수의 표시용어 중 적어도 하나만 나타나도 된다. 예를 들어, 도 3의 예에서, 개념 C4는 표시용어(term)로서 T41, T42, T43, T44가 있는데, 이 중 1개라도 대상 용어의 대역어로 번역사전에 나타나면, 개념 C4와 동일 매핑을 설정한다.For example, in a translation dictionary of primitive medical terms (a translation dictionary between a source language and an intermediate language), if the term T11 of the concept C1 appears as a substitute for the source term S1, the same mapping is performed between the source term S1 and the concept C1. set At this time, with respect to the source term or the target term, at least one of a plurality of display terms included in the concept may appear. For example, in the example of FIG. 3, concept C4 has T41, T42, T43, and T44 as terminology. set

다음으로, 대역관계 설정부(32)는 웹 문서 등을 수집하여 웹 문서에 대상 용어(원시/목적 의료용어)와 개념의 표시용어가 인접한 위치에서 동시에 나타나는지(또는 병기되어 있는지)를 검색하여, 그 발생빈도(병기되는 빈도)에 따라 가중치를 설정하고 유사 매핑을 설정한다. 바람직하게는, 수집하는 웹 문서는 원시 언어 또는 목적 언어로 작성된 문서이다.Next, the band relationship setting unit 32 collects web documents, etc., and searches whether the target term (original/purpose medical term) and the display term of the concept appear at the same time (or are written together) in an adjacent position in the web document, Weights are set according to the frequency of occurrence (the frequency of simultaneous occurrence) and similar mapping is set. Preferably, the web document to be collected is a document written in a source language or a target language.

일반적으로 영어 등 중간 언어외의 언어로 작성된 문서에는 전문 용어를 해당 국가의 언어로 작성하면서 괄호 등으로 영어 등 중간 언어로 병기하는 경우가 많다. 따라서 원시 의료용어가 개념의 표시용어와 병기되면, 해당 원시 의료용어는 개념의 표시용어로 대역할 수 있을 가능성이 있다. 그러나 번역 사전 처럼 공식적으로 확인된 것이 아니기 때문에, 대역어로 사용할 가능성만 갖는다. 이를 가중치로 표시하고, 웹 문서에 병기가 많이 나타날수록 가중치를 높여 그 유사성의 정도를 표시한다.In general, in documents written in a language other than an intermediate language such as English, technical terms are often written in the language of the country concerned and written in an intermediate language such as English in parentheses. Therefore, if the original medical term is used together with the term indicating the concept, there is a possibility that the primitive medical term can be translated into the term indicating the concept. However, since it is not officially confirmed like a translation dictionary, it has only the possibility of using it as a substitute language. This is displayed as a weight, and as more weapons appear in the web document, the weight is increased to indicate the degree of similarity.

다음으로, 대역용어 검색부(34)에 대하여 설명한다.Next, the band term search unit 34 will be described.

대역용어 검색부(34)는 번역할 질의용어에 대한 대역용어를 검색하되, 앞서 참조 용어체계와, 원시/목적 용어와 개념들간의 매핑을 참조하여 검색한다. 즉, 대역용어 검색부(34)는 질의용어와 매핑되는 개념들을 검색하고, 검색된 개념들과 매핑되는 목적 용어를 검색하여, 검색된 목적용어를 대역용어로 설정한다. 바람직하게는, 대역용어 검색부(34)는 대역용어 외에도 검색된 개념들의 표시용어도 대역용어와 함께 병기한다.The broad term search unit 34 searches for a broad term with respect to the query term to be translated, and searches by referring to the previous reference terminology and the mapping between source/object terms and concepts. That is, the band term search unit 34 searches for concepts mapped with the query term, searches for a target term mapped with the searched concepts, and sets the searched target term as a band term. Preferably, the band term retrieval unit 34 writes the term for display of the searched concepts together with the band term in addition to the band term.

이하 설명에서 앞서 도 3의 참조 용어체계와, 도 5의 매핑을 참조하여 설명한다.In the following description, it will be described with reference to the reference terminology of FIG. 3 and the mapping of FIG. 5 .

먼저, 대역용어 검색부(34)는 질의용어와 동일 매핑을 갖는 개념(참조 용어체계의 개념)을 검색한다. 이때, 동일 매핑을 갖는 개념이 검색되는 경우와 검색되지 않는 경우가 있는데, 이를 나누어 설명한다.First, the broad term search unit 34 searches for a concept (concept of a reference terminology) having the same mapping as a query term. In this case, there are cases in which concepts having the same mapping are searched and cases in which they are not searched, which will be described separately.

질의용어와 동일 매핑을 갖는 개념이 검색되지 않는 경우, 대역용어 검색부(34)는 유사 매핑을 갖는 개념을 검색한다. 검색된 유사 매핑의 개념 중에서 가중치가 가장 높은 개념을 선정한다. 이 경우는 유사 매핑의 개념만 선정되는 경우이다. 도 5의 예에서, 질의용어가 원시용어 S3인 경우, 동일 매핑을 갖는 개념이 없다. 이 경우, 유사 매핑을 검색하는데, 가중치가 0.2인 유사 매핑 (S3,C6)이 존재한다. 유사 매핑의 개념 C6만 존재하므로 가장 큰 가중치이고, 개념 C6이 선정된다.When a concept having the same mapping as the query term is not searched for, the broad term search unit 34 searches for a concept having a similar mapping. Among the searched similar mapping concepts, the concept with the highest weight is selected. In this case, only the concept of similar mapping is selected. In the example of FIG. 5 , when the query term is the source term S3, there is no concept having the same mapping. In this case, similar mappings are searched for, and similar mappings (S3, C6) with a weight of 0.2 exist. Since only concept C6 of similar mapping exists, it has the greatest weight, and concept C6 is selected.

다음으로, 질의용어와 동일 매핑을 갖는 개념이 검색되는 경우, 대역용어 검색부(34)는 유사 매핑을 갖는 개념을 추가적으로 검색하되, 동일 매핑의 개념의 하위 개념에서만 유사 매핑의 개념을 검색한다. 즉, 동일 매핑의 개념이 있으면, 하위 개념 중에서 유사 매핑이 있는지를 검색한다. 바람직하게는, 유사 매핑의 가중치가 사전에 정해진 최소 가중치 이상인 개념만을 추출한다. 또한, 최소 가중치 이상인 개념 중에서 가장 가중치가 큰 개념을 선정한다.Next, when a concept having the same mapping as the query term is searched for, the broad term search unit 34 additionally searches for a concept having a similar mapping, but searches for a similar mapping concept only in a sub-concept of the same mapping concept. That is, if there is a concept of the same mapping, it is searched for whether there is a similar mapping among the sub-concepts. Preferably, only concepts whose weight of similar mapping is greater than or equal to a predetermined minimum weight are extracted. In addition, the concept with the greatest weight is selected from among the concepts with the minimum weight or more.

도 3의 예에서, 질의용어가 원시용어 S2인 경우, 동일 매핑의 개념으로서, 개념 C3이 존재한다. 또한, 동일 매핑의 개념의 하위 개념으로서 개념 C4와 개념 C6이 존재한다. 개념 C4는 직접적으로 개념 C3과 계층관계를 형성하여, 개념 C3의 하위 개념이다. 개념 C6은 개념 C5와의 계층관계와 R35의 동일관계에 의해, 개념 C3의 하위 개념이다.In the example of FIG. 3 , when the query term is a source term S2, a concept C3 exists as a concept of the same mapping. Also, a concept C4 and a concept C6 exist as sub-concepts of the concept of the same mapping. Concept C4 directly forms a hierarchical relationship with concept C3, and is a sub-concept of concept C3. Concept C6 is a sub-concept of concept C3 due to the hierarchical relationship with concept C5 and the same relationship with R35.

만약 최소 가중치가 0.6이면, 개념 C4와 C6은 최소 가중치 보다 낮은 가중치(0.5, 0.3)를 갖기 때문에, 모두 유사 개념으로 추출되지 않는다. 최소 가중치가 0.5이면, 개념 C4만 추출된다. 최소 가중치가 0.3이면 개념 C4와 C6이 모두 해당되나, 그 중 가장 큰 가중치를 갖는 개념은 C4이므로, 개념 C4가 추출된다. 이하에서 최소 가중치가 0.5로 가정한다. 이때, 동일 매핑의 개념으로 개념 C3이 선정되고, 유사 매핑의 개념으로 개념 C4가 추출된다.If the minimum weight is 0.6, concepts C4 and C6 are not extracted as similar concepts because they have lower weights (0.5, 0.3) than the minimum weight. If the minimum weight is 0.5, only concept C4 is extracted. If the minimum weight is 0.3, both concepts C4 and C6 apply, but the concept having the largest weight among them is C4, so concept C4 is extracted. Hereinafter, it is assumed that the minimum weight is 0.5. At this time, the concept C3 is selected as the concept of the same mapping, and the concept C4 is extracted as the concept of the similar mapping.

하위 개념은 상위 개념 보다 더 구체적인 개념이다. 따라서 질의용어와 많이 유사한 개념이 동일 매핑의 개념의 하위 개념이라면, 유사 매핑의 개념이 질의용어를 더 잘 표현할 수 있다. 따라서 질의용어를 보다 잘 표현하기 위하여, 동일 매핑의 개념 외에도 가중치가 높은 유사 매핑의 개념을 추가적으로 추출한다.A sub-concept is a more specific concept than a higher-level concept. Therefore, if a concept that is very similar to a query term is a sub-concept of the same mapping concept, the similar mapping concept can better express the query term. Therefore, in order to better express the query term, the concept of similar mapping with high weight is additionally extracted in addition to the concept of identical mapping.

대역용어 검색부(34)는 질의용어에 대한 동일 매핑의 개념 또는 유사 매핑의 개념을 추출하면, 추출된 동일 매핑의 개념 또는 유사 매핑의 개념(이하 추출된 개념)과 매핑되는 목적 의료용어를 대역용어로 선정한다.When the band term search unit 34 extracts the concept of the same mapping or the concept of similar mapping for the query term, the target medical term mapped with the extracted concept of the same or similar mapping (hereinafter, the extracted concept) is searched for in the band. Choose a term

대역용어 검색부(34)는 먼저 추출된 개념과 동일 매핑되는 목적용어를 검색한다. 이때 대역용어는 추출된 개념과 직접적으로 동일 매핑되는 목적용어이거나, 추출된 개념과 동일관계를 갖는 개념과 직접적으로 동일 매핑되는 목적용어이다.The broad term search unit 34 searches for an object term that is mapped to the same concept as the first extracted concept. In this case, the broad term is an object term that is directly identically mapped to the extracted concept, or an object term that is directly identically mapped to a concept that has the same relation to the extracted concept.

만약 추출된 개념과 동일 매핑되는 목적용어가 존재하지 않으면, 추출된 개념과 유사 매핑되는 목적용어를 검색하고, 추출된 개념의 상위 개념 중에서 목적용어와 동일 매핑되는 개념을 검색한다. 특히, 추출된 개념의 상위 개념을 검색할 때, 동일 매핑되는 목적용어가 존재하는 상위 개념 중에서 가장 가까운 상위 개념을 대역용어로 선정한다. 이 경우, 유사 매핑되는 목적용어와, 상위 개념과 동일 매핑되는 목적용어가 대역용어로서 모두 선정되거나, 둘 중 하나만 선정될 수도 있다.If there is no object term that is identically mapped to the extracted concept, an object term that is similarly mapped to the extracted concept is searched for, and a concept that is identically mapped to the object term is searched among higher-level concepts of the extracted concept. In particular, when searching for a higher-order concept of an extracted concept, the closest higher-order concept is selected as a band term among higher-order concepts having the same mapped object term. In this case, both an object term that is similarly mapped and an object term that is mapped identically to a higher concept may be selected as a band term, or only one of the two may be selected.

도 5의 예에서, 추출된 개념이 개념 C3인 경우, 개념 C3과 동일 매핑되는 목정용어는 D2가 있다. 개념 C3과 개념 C5는 동일관계이고, 개념 C5와 목적용어 D2는 서로 동일 매핑이다. 따라서 C3와 D2는 동일 매핑을 갖는다. 따라서 목적용어 D2가 대역용어로서 선정된다.In the example of FIG. 5 , when the extracted concept is concept C3, there is a target term D2 that is identically mapped to concept C3. Concept C3 and concept C5 are identical, and concept C5 and object term D2 are identical mappings. Therefore, C3 and D2 have the same mapping. Therefore, the object term D2 is selected as a band term.

또한, 추출된 개념이 C4인 경우, 개념 C4와 동일 매핑되는 목적용어가 존재하지 않는다. 따라서 개념 C4와 유사 매핑되는 목적용어나, 상위 개념 중에서 동일매핑되는 목적용어를 검색한다. 각각 목적용어 D3와, D2가 검색되어, 이들이 대역용어로 선정된다.Also, when the extracted concept is C4, there is no object term that is identically mapped to the concept C4. Therefore, an object term that is similarly mapped to concept C4 or an object term that is identically mapped among higher-level concepts is searched for. Object terms D3 and D2 are searched for, respectively, and these are selected as a band term.

개념 C4를 목적 언어로 표현하는 목적용어는 D2와 D3 두가지 이다. 이때 목적용어 D2는 개념 C4를 표현하는 상위 개념으로서, 포괄적이나 공식적인 용어로서 표현된다. 대신, 목적용어 D3는 개념 C4를 공식적인 용어로 표현되지는 않으나 관례적으로 보다 정확하게 표현하는 용어이다.There are two object terms for expressing concept C4 as object language: D2 and D3. In this case, the object term D2 is a higher level concept expressing the concept C4, and is expressed as an inclusive but official term. Instead, the object term D3 is a more accurate representation of concept C4 by convention, although it is not expressed in official terms.

다음으로, 도 5의 예에서, 추출된 개념 C6의 경우, 상위 개념의 동일 매핑의 목적용어 D2만 존재한다. Next, in the example of FIG. 5 , in the case of the extracted concept C6, only the object term D2 of the same mapping of the higher concept exists.

다음으로, 본 발명의 일실시예에 따른 대역용어 검색부(34)가 질의용어에 대한 대역용어를 검색하는 예들을 도 6을 참조하여 설명한다.Next, examples in which the band term search unit 34 searches for a band term for a query term according to an embodiment of the present invention will be described with reference to FIG. 6 .

도 6a의 예에서, 질의용어가 원시 의료용어 S1인 경우이다. 이 경우, 원시용어 S1과 동일 매핑되는 개념이 C1이다. 개념 C1과 동일 매핑되는 목적 의료용어는 목적용어 D1이다. 따라서 목적용어 D1이 질의용어 S1의 대역용어이다.In the example of FIG. 6A , the query term is a raw medical term S1. In this case, the concept that is mapped the same as the source term S1 is C1. The object medical term that is mapped identically to concept C1 is object term D1. Therefore, the object term D1 is a broad term of the query term S1.

다음으로, 도 6b의 예에서, 질의용어가 원시용어 S2인 경우이다. 이 경우, 원시용어 S2와 동일 매핑되는 개념이 C3이고, 또, 원시용어 S2와 유사 매핑되는 개념은 C4이다. 유사 매핑되는 개념이 C6도 있으나 가중치가 작기 때문에 제외된다. 따라서 추출된 개념은 C3과 C4가 있다. 추출된 개념 C3과 동일 매핑되는 목적용어는 D2이다. 또한, 추출된 개념 C4와 동일 매핑되는 목적용어는 없고, 대신, 유사 매핑되는 목적용어 D3와, 상위 개념 중에서 동일 매핑되는 목적용어 D2가 있다. 결과적으로, 추출된 개념 C3 및 C4에 의해 추출된 대역용어는 D2와 D3이다.Next, in the example of FIG. 6B , the query term is the source term S2. In this case, a concept that is identically mapped to the source term S2 is C3, and a concept that is similarly mapped to the source term S2 is C4. C6 also has a similarly mapped concept, but it is excluded because the weight is small. Therefore, the extracted concepts are C3 and C4. The object term that is identically mapped to the extracted concept C3 is D2. In addition, there is no object term that is identically mapped to the extracted concept C4. Instead, there is an object term D3 that is similarly mapped and an object term D2 that is identically mapped among higher-level concepts. Consequently, the broad terms extracted by the extracted concepts C3 and C4 are D2 and D3.

다음으로, 도 6c의 예에서, 질의용어가 원시용어 S3인 경우이다. 이 경우, 원시용어 S3와 동일 매핑되는 개념은 없고 유사 매핑되는 개념 C6만 있다. 개념 C6과 동일 매핑되는 목적용어는 없고, 상위 개념 C5와 동일 매핑되는 목적용어 D2만 있다. 따라서 목적용어 D2가 대역용어로서 추출된다.Next, in the example of FIG. 6C , the query term is the source term S3. In this case, there is no concept that is identically mapped to the source term S3, only the concept C6 that is similarly mapped. There is no object term that is identically mapped with concept C6, only object term D2 that is identically mapped with higher concept C5. Therefore, the object term D2 is extracted as a band term.

다음으로, 질의용어 처리부(33)에 대하여 설명한다.Next, the query term processing unit 33 will be described.

질의용어 처리부(33)는 번역할 원시 의료용어(질의용어)를 수신하여(입력받아), 상기 질의용어의 대역어 또는 대역용어를 전송한다(출력한다). 이때, 질의용어 처리부(33)는 상기 질의용어에 대한 대역용어 검색을 대역용어 검색부(34)에 요청하고, 대역용어를 수신하여 출력하거나, 사용자 단말(10)에 전송한다.The query term processing unit 33 receives (receives input) a raw medical term (query term) to be translated, and transmits (outputs) a new word or a broad term of the query term. At this time, the query term processing unit 33 requests the band term search unit 34 to search for a band term for the query term, and receives and outputs the band term, or transmits it to the user terminal 10 .

이때, 질의용어 처리부(33)는 대역용어를 검색할 때 이용된 개념의 표시용어도 함께 제공(출력)한다. 바람직하게는, 질의용어 처리부(33)는 질의용어와 중간의 개념이 동일 매핑이 아니거나, 대역용어와 상기 중간 개념이 동일 매핑이 아닌 경우에, 중간 개념의 표시용어를 함께 제공한다.At this time, the query term processing unit 33 also provides (outputs) the display term of the concept used when searching for the band term. Preferably, when the query term and the intermediate concept do not have the same mapping or the broad term and the intermediate concept do not have the same mapping, the query term processing unit 33 provides the display term of the intermediate concept together.

앞서 도 6a의 예에서, 질의용어 S1과 대역용어 D1은 모두 중간 개념 C1과 동일 매핑이므로, 대역용어 D1만 제공한다. 따라서 "D1"로 표시된다.In the example of FIG. 6A, since both the query term S1 and the band term D1 have the same mapping as the intermediate concept C1, only the band term D1 is provided. Therefore, it is marked as "D1".

도 6b의 예에서는 질의용어 S2와 대역용어 D2만 모두 동일 매핑이고, 질의용어 S2와 대역용어 D3는 동일 매핑이 아니다. 이 경우, 대역용어 D2와 D3를 제공하되, D3는 C4의 표시용어를 함께 제공한다. 더욱 바람직하게는, 개념의 표시용어 중에서 대표용어를 제공한다. C4의 대표용어는 T42이다.In the example of FIG. 6B , only the query term S2 and the band term D2 have the same mapping, and the query term S2 and the band term D3 do not have the same mapping. In this case, the band terms D2 and D3 are provided, and D3 is provided with the indication term of C4. More preferably, a representative term is provided among terms indicating a concept. The representative term for C4 is T42.

또한, 질의용어 처리부(33)는 대역용어 중에서 상위 개념과 매핑되는 대역용어를 우선순위를 높게 하여 제공한다. 바람직하게는, 우선순위가 낮은 대역용어 및 개념의 표시용어는 괄호로 표시한다. 앞서의 도 6b의 예에서, D3와 C4의 표시용어는 괄호로 표시한다. 즉, 질의용어 S2의 번역문은 "D2(D3, T42)"로 표시된다.In addition, the query term processing unit 33 provides high-priority band terms that are mapped to higher-order concepts among band terms. Preferably, the low-priority band term and the term indicating the concept are indicated by parentheses. In the example of FIG. 6B above, the display terms of D3 and C4 are indicated by parentheses. That is, the translation of the query term S2 is expressed as "D2(D3, T42)".

또한, 도 6c의 예에서는, 질의용어 S3의 대역용어는 D2이나 원시용어와 개념이 동일 매핑이 아니므로, 개념의 표시용어를 함께 제공한다. 대역용어는 1개 밖에 없으므로, D2가 우선순위가 가장 높다. 따라서 "D2(T61)"로 표시된다.In addition, in the example of FIG. 6C , since the broad term of the query term S3 does not have the same mapping as D2 or the source term, the term indicating the concept is also provided. Since there is only one band term, D2 has the highest priority. Therefore, it is expressed as "D2(T61)".

이상, 본 발명자에 의해서 이루어진 발명을 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 실시 예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.As mentioned above, although the invention made by the present inventors has been described in detail according to the embodiments, the present invention is not limited to the embodiments, and various changes can be made without departing from the gist of the present invention.

10 : 사용자 단말 20 : 네트워크
30 : 의료용어 번역 시스템 31 : 참조용어 관리부
32 : 대역관계 설정부 33 : 질의용어 처리부
34 : 대역용어 검색부
40 : 데이터베이스 41 : 참조용어DB
42 : 용어사전DB 43 : 대역관계DB
10: user terminal 20: network
30: medical term translation system 31: reference term management unit
32: band relationship setting unit 33: query term processing unit
34: Band term search unit
40: database 41: reference term DB
42: Glossary DB 43: Band relation DB

Claims (8)

원시 언어로 표시된 질의용어를 목적 언어로 표시되는 대역용어로 번역하는, 공통 용어체계 기반 의료용어 번역 시스템에 있어서,
적어도 1개의 표시용어를 포함하는 개념과, 상기 개념들간의 관계로 구성되는 참조 용어체계를 구성하여 저장하되, 상기 표시용어는 중간 언어로 표시되는 참조용어 관리부;
원시 언어의 용어(이하 원시용어) 또는 목적 언어의 용어(이하 목적용어)를 개념의 표시용어로 대응시킨 문서를 참조하여, 상기 원시용어 또는 목적용어와 해당 개념 사이를 매핑시키는 대역관계 설정부;
원시 언어로 표시된 질의용어에 대하여 목적 언어로 표시된 대역용어를 선정하되, 상기 질의용어와 매핑되는 개념(이하 중간 개념)을 추출하고, 상기 중간 개념 또는 상기 중간 개념과 관계를 갖는 개념과 매핑되는 목적용어를 검색하여, 검색된 목적용어를 상기 대역용어로 선정하는 대역용어 검색부; 및,
상기 질의용어에 대한 대역용어를 상기 대역용어 검색부를 통해 선정하게 하고, 상기 대역용어를 제공하는 질의용어 처리부를 포함하고,
상기 관계는 관계되는 2개의 개념이 동일한 개념을 나타내는 동일 관계와, 2개의 개념 간의 상위 또는 하위 개념을 나타내는 계층 관계를 포함하고,
상기 매핑은 동일 매핑과 유사 매핑의 2가지로 구분하되, 상기 유사 매핑은 가중치가 부여되고,
상기 대역용어 검색부는 상기 중간 개념과 동일 매핑되는 목적용어가 없으면 상기 중간 개념의 상위 개념과 동일 매핑되는 목적용어를 검색하거나, 상기 중간 개념과 유사 매핑되는 목적용어를 검색하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
A medical term translation system based on a common terminology system that translates a query term expressed in a source language into an alternate term expressed in a target language, the system comprising:
a reference term management unit for constructing and storing a concept including at least one display term and a reference term system composed of a relationship between the concepts, wherein the display term is displayed in an intermediate language;
a band relationship setting unit for mapping between the source language term (hereinafter referred to as the source term) or the term of the target language (hereinafter referred to as the object term) with reference to a document corresponding to the expression term of the concept;
For the query term expressed in the source language, select a term in the target language, extract a concept mapped to the query term (hereinafter referred to as an intermediate concept), and map the intermediate concept or a concept having a relationship with the intermediate concept a band term search unit that searches for a term and selects the searched target term as the band term; and,
and a query term processing unit that selects a band term for the query term through the band term search unit and provides the band term,
The relationship includes a same relationship in which two related concepts represent the same concept, and a hierarchical relationship in which two concepts represent a higher or lower concept,
The mapping is divided into two types of identical mapping and similar mapping, wherein the similar mapping is weighted;
If there is no object term identically mapped to the intermediate concept, the broad term search unit searches for an object term that is identically mapped to a higher concept of the intermediate concept, or searches for an object term that is similarly mapped to the intermediate concept. A system-based medical terminology translation system.
삭제delete 제1항에 있어서,
상기 중간 개념과 관계를 갖는 개념은 상기 중간 개념과 동일관계 또는 계층관계로 연속되어 관계를 갖는 개념을 포함하되, 계층관계인 경우 상위 개념만을 포함하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
According to claim 1,
The concept having a relationship with the intermediate concept includes a concept having a continuous relationship with the intermediate concept in the same relationship or a hierarchical relationship, but includes only a higher concept in the case of a hierarchical relationship.
삭제delete 제1항에 있어서,
상기 대역용어 검색부는 상기 질의용어와 동일 매핑되는 개념이 있으면, 동일 매핑되는 개념의 하위 개념 중에서 가중치가 가장 높은 개념도 중간 개념으로 추출하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
According to claim 1,
The common terminology-based medical term translation system, characterized in that if there is a concept that is identically mapped to the query term, the broad term search unit extracts a concept having the highest weight among sub-concepts of the same mapped concept as an intermediate concept.
제1항에 있어서,
상기 질의용어 처리부는 상기 질의용어와 상기 중간 개념이 동일 매핑이 아니거나, 상기 대역용어와 상기 중간 개념이 동일 매핑이 아니면, 상기 중간 개념의 표시용어를 상기 대역용어와 함께 제공하는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
According to claim 1,
When the query term processing unit does not have the same mapping between the query term and the intermediate concept, or if the band term and the intermediate concept do not have the same mapping, the display term of the intermediate concept is provided together with the band term, characterized in that Medical term translation system based on common terminology.
제1항에 있어서,
상기 대역관계 설정부는 원시 언어 또는 목적 언어와 중간 언어 간의 번역사전을 참조하여, 원시용어 또는 목적용어가 개념의 표시용어로 대역하는 용어이면, 해당 원시용어 또는 목적용어와 해당 개념 사이를 동일 매핑시키고, 원시 언어 또는 목적 언어의 웹 문서에서 원시용어와 개념의 표시용어를 병기하면 해당 원시용어 또는 목적용어와 해당 개념 사이를 유사 매핑시키는 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
According to claim 1,
The band relationship setting unit refers to the translation dictionary between the source language or the target language and the intermediate language, and if the source term or the object term is a term that is inflected as the display term of the concept, the same is mapped between the source term or the object term and the concept. , A medical term translation system based on a common terminology, characterized in that when a source term and a term indicating a concept are added together in a web document of the source language or the target language, a similar mapping is performed between the source term or the object term and the corresponding concept.
제1항, 제3항, 제5항 내지 제7항 중 어느 한 항에 있어서,
상기 원시용어, 상기 목적용어, 또는 개념의 표시용어는 의료용어인 것을 특징으로 하는 공통 용어체계 기반 의료용어 번역 시스템.
According to any one of claims 1, 3, 5 to 7,
A medical term translation system based on a common terminology, characterized in that the source term, the object term, or the term indicating the concept is a medical term.
KR1020160067096A 2016-05-31 2016-05-31 A translation system for for medical terms based on the common terminology KR102385531B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160067096A KR102385531B1 (en) 2016-05-31 2016-05-31 A translation system for for medical terms based on the common terminology

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160067096A KR102385531B1 (en) 2016-05-31 2016-05-31 A translation system for for medical terms based on the common terminology

Publications (2)

Publication Number Publication Date
KR20170135333A KR20170135333A (en) 2017-12-08
KR102385531B1 true KR102385531B1 (en) 2022-04-13

Family

ID=60919952

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160067096A KR102385531B1 (en) 2016-05-31 2016-05-31 A translation system for for medical terms based on the common terminology

Country Status (1)

Country Link
KR (1) KR102385531B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763197B (en) * 2018-05-10 2021-11-09 上海依智医疗技术有限公司 Method and device for forming medical term library
KR102360700B1 (en) * 2019-10-08 2022-02-10 장철호 Blockchain-based Personal Medical Data Provision System
KR102568274B1 (en) * 2020-12-22 2023-08-17 연세대학교 원주산학협력단 Apparatus and method for recommending common data model word

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2974698B2 (en) * 1989-10-13 1999-11-10 富士通株式会社 Editing / learning device for relations between words in a machine translation device
US20080306926A1 (en) 2007-06-08 2008-12-11 International Business Machines Corporation System and Method for Semantic Normalization of Healthcare Data to Support Derivation Conformed Dimensions to Support Static and Aggregate Valuation Across Heterogeneous Data Sources
KR101097195B1 (en) * 2010-04-01 2011-12-21 서울대학교산학협력단 A terminology editing system based on the reference terminology
KR101239140B1 (en) 2011-03-07 2013-03-11 경북대학교 산학협력단 Mapping method and its system of medical standard terminologies

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100792204B1 (en) 2005-12-05 2008-01-08 한국전자통신연구원 Apparatus for automatic translation customized for restrictive domain documents, and method thereof
KR100792203B1 (en) 2005-12-07 2008-01-08 한국전자통신연구원 Apparatus and Method of Construction for Single Noun Korean-English Technical Word Dictionary Using Compound Noun's Target Word Notation in Patent Documents
KR20110062867A (en) 2009-12-04 2011-06-10 한국전자통신연구원 Apparatus and method for constructing terms list of source language-target language
KR20110112495A (en) 2010-04-07 2011-10-13 주식회사 인아웃정보기술 Medical analysis serve system for medical data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2974698B2 (en) * 1989-10-13 1999-11-10 富士通株式会社 Editing / learning device for relations between words in a machine translation device
US20080306926A1 (en) 2007-06-08 2008-12-11 International Business Machines Corporation System and Method for Semantic Normalization of Healthcare Data to Support Derivation Conformed Dimensions to Support Static and Aggregate Valuation Across Heterogeneous Data Sources
KR101097195B1 (en) * 2010-04-01 2011-12-21 서울대학교산학협력단 A terminology editing system based on the reference terminology
KR101239140B1 (en) 2011-03-07 2013-03-11 경북대학교 산학협력단 Mapping method and its system of medical standard terminologies

Also Published As

Publication number Publication date
KR20170135333A (en) 2017-12-08

Similar Documents

Publication Publication Date Title
Fatehi et al. Telemedicine, telehealth or e-health? A bibliometric analysis of the trends in the use of these terms
US8239216B2 (en) Searching an electronic medical record
US8108381B2 (en) System and method for analyzing electronic data records
CN108694177A (en) Knowledge mapping construction method and system
US7395222B1 (en) Method and system for identifying expertise
CN108920453A (en) Data processing method, device, electronic equipment and computer-readable medium
WO2009032287A1 (en) Management and processing of information
KR102385531B1 (en) A translation system for for medical terms based on the common terminology
KR101799448B1 (en) Providing system for classification of diseases using questions and answer
CN111460095A (en) Question and answer processing method and device, electronic equipment and storage medium
KR20170133692A (en) Method and Apparatus for generating association rules between medical words in medical record document
US20080281812A1 (en) Method and system for identifying expertise
AU2020407062A1 (en) Unsupervised taxonomy extraction from medical clinical trials
Eika et al. Assessing the reading level of web texts for WCAG2. 0 compliance—can it be done automatically?
Gonçalo Oliveira A survey on Portuguese lexical knowledge bases: Contents, comparison and combination
Adekkanattu et al. Evaluating the portability of an NLP system for processing echocardiograms: a retrospective, multi-site observational study
Chen et al. Semantic analysis of free text and its application on automatically assigning ICD-9-CM codes to patient records
JP5392120B2 (en) Information processing apparatus, determination program, and determination method
JP7324058B2 (en) SENTENCE ANALYSIS METHOD, SENTENCE ANALYSIS PROGRAM, AND SENTENCE ANALYSIS SYSTEM
CN112349367A (en) Method and device for generating simulation medical record, electronic equipment and storage medium
JP2009128968A (en) Orthographic variant analyzing device
KR101097195B1 (en) A terminology editing system based on the reference terminology
Zhou et al. Testing and Evaluating SNOMED CT Web Browsers' Textual Search Feature
Liu et al. Constructing large scale cohort for clinical study on heart failure with electronic health record in regional healthcare platform: challenges and strategies in data reuse
Weale et al. Use of acronyms in anaesthetic and associated investigations: appropriate or unnecessary?–the UOAIAAAIAOU Study

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right