KR101799448B1 - 질의 응답형 질병분류코드 제공 시스템 - Google Patents

질의 응답형 질병분류코드 제공 시스템 Download PDF

Info

Publication number
KR101799448B1
KR101799448B1 KR1020150153878A KR20150153878A KR101799448B1 KR 101799448 B1 KR101799448 B1 KR 101799448B1 KR 1020150153878 A KR1020150153878 A KR 1020150153878A KR 20150153878 A KR20150153878 A KR 20150153878A KR 101799448 B1 KR101799448 B1 KR 101799448B1
Authority
KR
South Korea
Prior art keywords
query
index word
classification code
disease
disease classification
Prior art date
Application number
KR1020150153878A
Other languages
English (en)
Other versions
KR20170052020A (ko
Inventor
김영진
Original Assignee
김영진
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김영진 filed Critical 김영진
Priority to KR1020150153878A priority Critical patent/KR101799448B1/ko
Publication of KR20170052020A publication Critical patent/KR20170052020A/ko
Application granted granted Critical
Publication of KR101799448B1 publication Critical patent/KR101799448B1/ko

Links

Images

Classifications

    • G06F19/32
    • G06F17/2735
    • G06F17/274
    • G06F17/2755
    • G06F17/277
    • G06F17/30321
    • G06F17/30389
    • G06F19/326
    • G06F19/327
    • G06F19/328
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Medical Informatics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Child & Adolescent Psychology (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 질의를 통해 입력된 자연어로부터 색인어를 추출하고, 추출된 색인어에 근거하여 공개 데이터 및 질병분류코드를 매칭하여 최적의 질병분류코드를 제공할 수 있는 질의 응답형 질병분류코드 제공 시스템에 관한 것이다.
상기의 과제를 해결하기 위하여 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템은 사용자 클라이언트로부터 요청된 질의를 질병분류코드에 근거하여 질병분류코드를 제공하는 관리서버를 포함하고, 상기 관리서버는 질병, 의료기관, 의약품 및 보험 정보를 수집하는 수집부; 상기 수집부에서 수집된 정보에 근거하여 상기 클라이언트로부터 전송된 질의로부터 색인어를 검출하는 질의 색인어 검출부; 및 상기 질의 색인어 검출부에서 검출된 질의 색인어와 질병분류코드에서 검출된 질병 색인어를 매칭하여 질병분류코드를 검출하는 질병분류코드 검출부를 포함하는 구성되는 것을 특징으로 한다.

Description

질의 응답형 질병분류코드 제공 시스템{PROVIDING SYSTEM FOR CLASSIFICATION OF DISEASES USING QUESTIONS AND ANSWER}
본 발명은 질의 응답형 질병분류코드 제공 시스템에 관한 것으로서, 더욱 상세하게는 질의를 통해 입력된 자연어로부터 색인어를 추출하고, 추출된 색인어에 근거하여 공개 데이터 및 질병분류코드를 매칭하여 최적의 질병분류코드를 제공할 수 있는 질의 응답형 질병분류코드 제공 시스템에 관한 것이다.
질병·사인분류는 의무기록자료 및 사망원인통계조사 등 질병이환 및 사망자료를 그 성질의 유사성에 따라 체계적으로 유형화한 것으로서, 모든 형태의 보건 및 인구동태 기록에 기재되어 있는 질병 및 기타 보건문제를 분류하는데 이용하기 위하여 설정하고 있다.
세계보건기구(WHO) 헌장 및 세계보건총회(WHA) 협약에 따라 국제질병분류(ICD: International Classification of Diseases) 체계에 의한 보건 관련 통계를 작성·공표하고 있으며, 한국에서도 보건정책수립의 기초자료인 질병 및 사인(死因)에 관한 통계를 작성함에 있어 국제적인 비교를 위하여 세계보건기구(WHO)가 작성한 국제질병분류(ICD) 체계를 근간으로 한국표준질병·사인(死因)분류(KCD: Korean Standard Classification of Diseases)를 작성하고 있다.
상기의 한국표준질병·사인분류는 이환 병태의 전 영역을 포함할 수 있는 상호 독립적인 항목으로 유행성 질환, 체질적 또는 전신적 질환, 부위에 따른 국소질환, 발육 질환 및 손상으로 분류하여 구성된다.
도 1은 한국표준질병·사인분류에 따른 대분류 구조도를 나타낸 것이다.
첨부된 도 1을 참조하면, 대분류 구조는 상기에서 설명한 바와 같이 상호 독립적인 항목으로 분류되며, 대분류의 하위 구조로 중·소·세·세세 분류의 단계적 분류체계로 구성되어 있다. 예를 들어, 특정 감염성 및 기생충성 질환(A00-B99) 중에서 콜레라(Cholera)는 A00을 갖는 코드로 설정되어 있으며, 장티푸스 및 파라티푸스(Typhoid and paratyphoid fevers)는 A01의 코드로 설정되어 있다.
이와 같은 질병분류코드는 다양한 보건의료 현상을 파악하는 통계를 작성함에 있어 표준화된 기준을 적용함으로써 일관성 및 비교성을 갖춘 자료를 확보하기 위한 중요한 자료로 활용된다.
이에 더하여, 질병분류코드는 환자(일반 사용자), 의료관계자 및 보험관계자 등을 포함한 일반인에게도 병원비의 정산 및 보험금을 산정하는 기준이 되고 있으며, 병원EMR시스템과도 연계되어 의료정보를 취급하는데 중요한 정보로 활용되고 있다.
한편, 질병분류코드를 이용한 서비스 제공시스템으로서, 등록특허공보 제10-1234455호에 질병분류코드를 이용한 운동처방정보 제공시스템 및 그 운동처방정보 제공방법이 개시되어 있다.
상기 기술은 입력부를 통해 질병의 내용 및 상기 질병의 국제질병분류코드 또는 양한방 질병분류코드가 포함된 처방전을 입력받고, 사용자의 위치로부터 일정한 거리 내에 있는 전문가에 대한 정보와 상기 전문가의 일정내용 및 상기 전문가의 운동처방의 이력을 상기 표시부에 표시하고, 상기 입력부를 통해 사용자가 원하는 일정을 예약하거나 예약된 일정을 취소하는 제어부를 포함하는 것을 특징으로 한다.
즉, 상기의 기술은 의료관계자(의사)의 견해에 의해 작성된 질병분류코드를 이용하여 질병분류코드에 근거한 운동처방을 제공하는 것인데, 이러한 질병분류코드는 위에서 살펴본 바와 같이 상당히 복잡한 구조로 이루어져 있으며, 의사의 견해에 따라 질병분류코드가 다르게 도출될 수 있는 문제점이 발생된다. 아울러, 질병분류코드에 따라 병원비 및 보험금 등이 다르게 책정됨에 따라 불이익이 발생될 수 있는 문제점이 있다.
KR 10-1234455 B1 (2013. 02. 12.)
본 발명은 상기 종래기술이 갖는 문제점을 해결하기 위하여 창출된 것으로서, 본 발명에서 해소하고자 하는 과제는, 질병의 증상에 대한 질의를 통해 입력된 자연어로부터 색인어를 추출하고, 추출된 색인어에 근거하여 링크된 데이터 및 질병분류코드를 매칭하여 최적의 질병분류코드를 검출할 수 있는 질의 응답형 질병분류코드 제공 시스템을 제공하는 데 있다.
또한, 개정된 질병분류코드에 대응할 수 있는 질의 응답형 질병분류코드 제공 시스템을 제공하는 데 있다.
상기의 과제를 해결하기 위하여 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템은 사용자 클라이언트로부터 요청된 질의를 질병분류코드에 근거하여 질병분류코드를 제공하는 관리서버를 포함하고, 상기 관리서버는 질병, 의료기관, 의약품 및 보험 정보를 수집하는 수집부; 상기 수집부에서 수집된 정보에 근거하여 상기 클라이언트로부터 전송된 질의로부터 색인어를 검출하는 질의 색인어 검출부; 및 상기 질의 색인어 검출부에서 검출된 질의 색인어와 질병분류코드에서 검출된 질병 색인어를 매칭하여 질병분류코드를 검출하는 질병분류코드 검출부를 포함하는 구성되는 것을 특징으로 한다.
여기서, 상기 질의 색인어 검출부는 상기 클라이언트로부터 전송된 질의에 따른 형태소, 체언 및 용언을 분석하는 질의 분석 모듈(210); 문법, 어휘, 분야별 용어, 사용자 정의 및 분석 사전을 저장 관리하는 사전 DB모듈; 상기 사전 DB모듈에 근거하여 상기 질의 분석모듈에서 검출된 단어에서 조사 생략하여 명사 및 줄임 단어를 도출하여 상기 질의에 대한 색인어를 추출하는 질의 색인어 추출모듈; 및 상기 질의 색인어 추출모듈에서 추출된 질의 색인어에 대한 평가를 수행하는 질의 색인어 평가모듈을 포함하는 것을 특징으로 한다.
또한, 상기 질병분류코드 검출부는 질병분류코드를 저장 관리하는 질병분류코드 DB모듈; 상기 질병분류코드 DB모듈에서 각각 질병분류코드에 대한 색인어를 검출하는 질병 색인어 검출모듈; 상기 질의 색인어 검출부에서 검출된 질의 색인어와 상기 질병 색인어 검출모듈에서 검출된 질병 색인어를 매칭하는 색인어 매칭모듈; 및 상기 색인어 매칭모듈에서 매칭된 매칭률에 근거하여 상기 질의에 대한 질병분류코드를 검출하는 질병분류코드 검출모듈을 포함하는 것을 특징으로 한다.
상기 질병분류코드 검출부는 상기 질병분류코드 DB모듈을 갱신할 수 있도록 질병분류코드 갱신모듈이 더 포함될 수 있으며, 상기 수집부에서 수집하는 정보는 의료기관에서 저장 관리하는 공개된 의료정보, 의료기관 정보 및 의약품 정보와 의료 보험사에서 저장 관리하는 공개된 보험 정보인 것을 특징으로 한다.
본 발명에 의하면, 질의를 통해 입력된 자연어에서 색인어를 추출하고, 추출된 색인어에 근거하여 질병분류코드를 제공함에 따라 질병분류코드의 검출이 용이할 뿐만 아니라 표준화된 질병분류코드를 제공할 수 있는 장점이 있다.
또한, 질병분류코드의 갱신(업데이트)을 통해 개정된 질병분류코드를 신속히 제공할 수 있으며, 질병분류코드의 조회 및 관리가 수월한 장점이 있다.
도 1은 한국표준질병·사인분류에 따른 대분류구조.
도 2는 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템의 개략적인 구성도.
도 3은 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템에서 관리서버의 구성을 개략적으로 나타낸 도면.
도 4는 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템에서의 질병분류코드.
도 5는 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템에서 일 실시 예의 질의에 따른 질병분류코드가 도출되는 과정을 나타낸 도면.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 더욱 상세하게 설명한다.
본 발명은 질의를 통해 입력된 자연어로부터 색인어를 추출하고, 추출된 색인어에 근거하여 공개 데이터 및 질병분류코드를 매칭하여 최적의 질병분류코드를 제공할 수 있는 질의 응답형 질병분류코드 제공 시스템에 관한 것이다.
도 2는 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템의 개략적인 구성도를 나타낸 것이다.
첨부된 도 2를 참조하면, 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템은 사용자 클라이언트(10), 의료기관 정보제공 서버(20) 및 관리서버(30)를 포함하여 구성된다.
상기 사용자 클라이언트(10)는 관리서버(30)에 접속하여 질의를 요청하는 단말기로서, PC 및 모바일기기 등의 인터넷을 통해 상기 관리서버(30)에 접속할 수 있는 장치로 이루어질 수 있다.
여기서, 사용자는 의료기관의 종사자(의사, 간호사 및 의무기록사 등) 및 질병분류코드에 검색하고자 하는 당사자(변호사, 손해 사정사, 보험사 직원 등)를 포함하는 다양한 계층으로 이루어질 수 있다.
상기 의료기관 정보제공 서버(20)는 의료기관에 연계되어 공개된 의료 정보를 제공하는 서버로서, 병원, 통계청, 질병관리본부, 식약청, 건강보험관리공단, 건강보험심사평가원, 보험사, 대한의약회 및 WHO 등에서 관리하는 서버로 구성될 수 있다.
상기의 병원 관련 서버는 개인 정보를 제외한 질병 유형, 질병에 대한 환자수, 유행성 질병 정보 및 병원 규모 등의 정보를 제공하고, 통계청 관련 서버는 한국표준질병·사인분류(KCD), 사망원인 코드 및 통계를 제공하며, 질병관리본부 관련 서버는 질병정보, 질병유형, 질병관리방안 및 질병 예방법 등을 제공한다.
또한, 식약청 관련 서버는 의약품 관련 정보를 제공하고, 건강보험관리공단 관련 서버는 개인별 건강검진, 문진, 진료 및 투약 정보 등을 제공하며, 건강보험심사평가원 관련 서버는 병원 및 약국 정보 등을 제공한다.
또한, 보험사 관련 서버는 보험 판례 및 보험 약관 등의 정보를 제공하고, 대한의약회 관련 서버는 진단별 의학정보를 제공하며, WHO 관련 서버는 국제표준질병 및 사인분류 정보를 제공한다.
즉, 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템에서 의료관련 기관으로부터 공개된 링크 데이터(Linked data)를 종합적으로 취합하고, 취합된 링크 데이터를 분석하여 질의에 따른 질병분류코드를 제공하게 된다.
다음으로, 요청된 질의와 공개된 링크 데이터에 근거하여 질병분류코드를 제공하는 관리서버(30)에 대해서 설명한다.
상기 관리서버(30)는 상기 사용자 클라이언트(10)로부터 요청된 질의를 질병분류코드에 근거하여 질병분류코드를 제공하는 것으로서, 도 3은 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템에서 관리서버(30)의 구성을 개략적으로 나타낸 도면이다.
첨부된 도 3을 참조하면, 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템에서 관리서버(30)는 수집부(100), 질의 색인어 추출부(200), 질병분류코드 검출부(300) 및 평가부(400)를 포함하여 구성된다.
상기 수집부(100)는 질병, 의료기관, 의약품 및 보험 정보를 수집하는 기능을 수행하는 것으로서, 상기 의료기관 정보제공 서버(20)로부터 공개된 링크 데이터(Linked data)를 수집한다.
상기 수집된 링크 데이터는 파싱을 통해 질병별로 분류하고, 질병에 따른 증상, 처방법, 약학 정보, 병원, 약국 및 보험 등의 세부정보를 가지는 데이터 테이블로 저장 관리된다.
상기 질의 색인어 추출부(200)는 상기 수집부(100)에서 수집된 정보에 근거하여 상기 클라이언트(10)로부터 전송된 질의로부터 색인어를 검출하는 기능을 수행한다. 이에 따라 상기 질의 색인어 추출부(200)는 질의 분석모듈(210), 사전 DB모듈(220), 질의 색인어 추출모듈(230) 및 질의 색인어 평가모듈(240)을 포함하여 구성될 수 있다.
상기 질의 분석모듈(210)은 상기 클라이언트(10)로부터 전송된 질의의 내용을 분석하여 색인어로 활용될 수 있는 유효 단어를 분석하는 기능을 수행한다.
사용자의 질의는 문장형태로 구성될 수 있다. 예를 들면, "고열을 동반하고 기침과 가래가 발생하며, 구토가 있음"으로 질의 된 경우, "고열, 동반, 기침, 가래, 발생, 구토 및 있음"의 단어는 유효 단어로 판단할 수 있다.
이에 따라, 질의로부터 유효 단어를 검출하기 위해 상기 질의 분석모듈(210)은 질의로부터 형태소, 체언 및 용언을 분석하여 유효 단어를 검출한다.
상기 사전 DB모듈(220)은 문법, 어휘, 분야별 용어, 사용자 정의 및 분석 사전을 저장 관리하는 기능을 수행하는 것으로서, 문법 사전, 어휘 사전, 분야별 용어 사전, 사용자 정의 사전 및 분석 사전 등으로 구성될 수 있다.
문법 사전은 문법에 대해 정의한 사전으로 맞춤법, 표준어, 외래어 표기법 및 띄어쓰기 등에 대한 문법을 정의한 사전이며, 어휘 사전은 용어에 대한 정의 또는 설명을 기재한 사전이며, 분야별 용어 사전은 해당 분야(의료, 보험 및 기관)에서 사용하는 용어를 정의한 사전이다.
또한, 사용자 정의 사전은 사용자가 임의의 단어를 사용자의 노하우에 따라 정의한 사전이며, 분석 사전은 선행 학습된 분석 결과를 정의한 사전이다.
이때, 상기 질의 분석모듈(210)은 상기 사전 DB모듈(220) 중에서 문법 사전, 어휘 사전, 분야별 용어 사전 및 사용자 정의 사전에 근거하여 색인어로 판단될 수 있는 유효 단어를 검출한다.
상기 질의 색인어 추출모듈(230)은 상기 사전 DB모듈(220)에 근거하여 상기 질의 분석모듈(210)에서 검출된 단어에서 조사 생략하여 명사 및 줄임 단어를 도출하여 상기 질의에 대한 색인어를 추출하는 기능을 수행한다.
즉, 상기 질의 색인어 추출모듈(230)은 상기 사전 DB모듈(220)의 분야별 용어 사전, 사용자 정의 사전 및 분석 사전에 정의된 용어에 근거하여 질의 색인어를 추출한다.
상기 질의 색인어 평가모듈(240)은 상기 질의 색인어 추출모듈(230)에서 추출된 색인어에 대한 유효성을 평가한다.
유효성 평가는 검출된 색인어가 질의에 포함된 단어인지 또는 질의의 내용으로부터 유추될 수 있는 단어인지를 평가하는 것으로서, 검출된 색인어가 질의 내용에 없는 단어이거나 또는 질의 내용으로부터 유추될 수 없는 단어로 평가된 경우에 검출된 색인어는 그 가중치를 낮게 책정하거나 삭제하는 방식으로 색인어에 대한 유효성을 평가한다.
아울러, 질의로부터 도출된 색인어는 질병분류코드를 결정함에 있어서, 더욱 세분화하여 도출될 수 있다. 즉, 색인어는 단일 단어 또는 단어의 조합으로 이루어질 수 있는데, 검출된 색인어가 단어의 조합으로 이루어진 경우 상기 색인어는 단어를 분리하여 각각의 색인어에 대한 유효성을 판단하도록 구성될 수 있다.
예를 들어, "뇌손상"이라는 색인어가 추출된 경우, 상기 색인어 "뇌손상"은 "뇌"와 "손상"이라는 색인어로 각각 분리하여 색인어로 추출될 수 있으며, 이에 따라 분리된 색인어에 대한 유효성을 평가하여 질의에 대한 질병분류코드를 결정하는 데 가중치를 부여하도록 구성될 수 있다.
상기의 과정은 질의 내용에서 문법, 어휘, 분야별 용어, 사용자 정의 및 분석 사전을 이용하여 색인어를 검출하는 과정을 설명하였으나, 상기 색인어 검출과정은 시맨틱 웹을 통한 상황추론분석을 이용하여 검출되도록 구성될 수 있다.
상기 시맨틱 웹을 설명하기에 앞서서, 먼저, 온톨로지(Ontology)에 대해 설명하면, 온톨로지란 사람들이 세상에 대하여 보고 듣고 느끼고 생각하는 것에 대하여 서로 간의 토론을 통하여 합의를 이룬 바를 개념적이고 컴퓨터에서 다룰 수 있는 형태로 표현한 모델로서 개념의 타입이나 사용상의 제약조건들을 명시적으로 정의한 기술이다.
이러한 온톨로지는 일단 합의된 지식을 나타내므로 어느 개인에게 국한되는 것이 아니라 그룹 구성원이 모두 동의하는 개념이다. 그리고 프로그램이 이해할 수 있어야 하므로 여러 가지 정형화가 존재한다. 이는 전산학과 정보과학에서, 특정한 영역을 표현하는 데이터 모델로서 특정한 영역(domain)에 속하는 개념과 개념 사이의 관계를 기술하는 정형 어휘의 집합으로 정의된다.
정형 언어(Formal Language)로 기술된 어휘의 집합인 온톨로지는 추론을 하는데 사용된다. 웹의 등장은 전통적인 정보검색을 비롯하여 지식관리와 일반 상거래 등 사회 전 분야의 변혁을 초래하였다. 특히 웹 정보 검색은 소장 자료를 대상으로 하는 제한된 검색에서 웹을 통해 접근할 수 있는 전자자원을 대상으로 하는 검색을 가능하게 하였다. 웹의 급속한 발달로 인해 검색 대상 범위의 확대는 보다 정교한 검색을 필요로 하게 되었으며, 지능화된 정보 검색 시스템 개발을 촉진하는 계기가 되었다.
이런 계기를 바탕으로 웹 자원을 효과적으로 관리할 수 있는 정보 검색의 새로운 도구의 필요성이 대두되었다.
즉, 온톨로지는 시맨틱 웹을 구현할 수 있는 도구로서 지식개념을 의미적으로 연결할 수 있는 도구이다.
시맨틱 웹(Semantic Web) 기술은 사람의 머릿속에 있는 언어에 대한 이해를 컴퓨터 언어로 표현하고 이것을 컴퓨터가 사용할 수 있게 하는 것인데, 특별한 분산환경을 갖춘 웹에 구현하자는 것이다. 이것은 기계가 정보검색과 같은 사람의 요구를 더 잘 이해하고 적절하게 반응하기 위해서이다. 사람과 기계 사이에 진정한 커뮤니케이션이 가능하기 위해서는 사람이 이해하는 수준으로 기계도 언어를 이해할 수 있어야 한다. 그러나 HTML 형태의 문서들로 이루어진 현재의 웹은 사람에게 정보를 주는 역할은 하고 있지만 컴퓨터 프로그램이 각 문서의 내용을 정확히 파악할 수는 없다.
온톨로지는 이러한 문제의식에서 출발한다. 세상에 있는 각각의 사물이나 사건들을 경험하면서 이들 속에 들어있는 특징을 파악해서 이해하는 방식을 개념화라고 하는데, 온톨로지는 컴퓨터에서도 사람이 갖고 있는 개념과 같은 것을 일종의 데이터베이스와 같은 형태로 만드는 기술이라 할 수 있다. 프로그램과 인간이 지식을 공유하는데 도움을 주기 위한 온톨로지는 정보시스템의 대상이 되는 자원의 개념을 명확하게 정의하고 상세하게 기술하여 더욱 정확한 정보를 찾을 수 있도록 하는데 목적이 있다. 온톨로지 기반의 시스템은 정보 콘텐츠 구조에 대한 명세서로서의 역할, 해당 분야의 지식 공유와 재사용, 해당 영역의 제약과 가정에 대한 명시, 지식과 프로세스의 분리 등의 장점을 가진다.
이러한 온톨로지의 구성원소는 객체(class), 인스턴스(instance), 속성(property)으로 구분할 수 있다.
객체는 일반적으로 우리가 사물이나 개념 등에 붙이는 이름을 말하며, 인스턴스(instance)는 사물이나 개념의 구체물이나 사건 등의 실질적인 형태로 나타난 그 자체를 의미한다. 또한, 상기한 객체와 인스턴스의 특정한 성질과 성향 그리고 인스턴스 사이의 관계를 나타내기 위해서 인스턴스를 특정 값 또는 다른 인스턴스들과 연결시킨 것이 속성(property)이다.
웹 온톨로지 언어(Ontology Web Language, OWL)를 이용해서 상기와 같이 객체, 인스턴스 및 속성을 정의할 수 있다.
이에 따라, 질의로부터 문법, 어휘 및 분야별 용어 등의 사전을 이용한 자연어 추론분석으로 색인어를 검출할 수도 있으나, 시맨틱 웹을 이용한 상황추론분석을 통해서도 색인어를 검출하도록 구현할 수 있으며, 자연어 추론분석과 시맨틱 웹 상황추론분석을 혼용하여 사용하는 경우 더욱 복잡한 질의에 대한 정밀한 색인어 추출이 가능할 수 있다.
상기 질병분류코드 검출부(300)는 상기 질의 색인어 검출부(200)에서 검출된 질의 색인어와 질병분류코드에서 검출된 질병 색인어를 매칭하여 질병분류코드를 검출하는 기능을 수행한다.
이에, 상기 질병분류코드 검출부(300)는 질병분류코드 DB모듈(310), 질병 색인어 검출모듈(320), 색인어 매칭모듈(330), 질병분류코드 검출모듈(340), 질병분류코드 갱신모듈(350) 및 색인어 저장모듈(360)을 포함하여 구성된다.
상기 질병분류코드 DB모듈(310)은 세계보건기구(WHO)가 작성한 국제질병분류(ICD) 체계를 근거로 하는 한국표준질병·사인(死因)분류(KCD: Korean Standard Classification of Diseases)에 의한 질병분류코드가 저장 관리된다.
이러한 KCD에는 질병분류코드, 일반원칙(general principle), 질병의 인과관계 및 증상 등이 함께 저장 관리된다.
도 4는 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템에서 질병분류코드 DB모듈에 저장된 KCD의 일부를 발췌하여 나타낸 도면이다.
첨부된 도 4를 참조하면, 좌측 맨 처음에 시작되는 선도어(Lead term)와 점진적으로 우측으로 나아가는 여러 단계의 대시표시(-)로 구성되는 계단모양을 이루고 완결된 색인의 용어는 여러 개의 대시표시(-)로 이루어지며, 최후단에는 질병분류코드가 기재된다. 또한, 첨부된 도 4는 일 예를 나타낸 것으로, 다방면으로 증상이 도출되거나 질병의 인과관계가 복잡한 경우에는 더욱 상세히 분류될 수 있다.
상기 질병 색인어 검출모듈(320)은 상기 질병분류코드 DB모듈(310)에서 질병분류코드 각각에 대한 색인어를 검출하는 기능을 수행한다.
위의 설명에서 상기 질병분류코드 DB모듈(310)에 저장된 KCD에는 질병분류코드에 대한 일반원칙, 질병의 인과관계 및 증상 등이 저장되어 있고, 상기 질병 색인어 검출모듈(320)은 질의로부터 검출된 색인어와 비교 판단하기 위한 질병 색인어를 검출하게 된다. 예를 들면, 첨부된 도 4에서 질병분류코드 E05.1은 "갑상선독증의 갑상선 발증 또는 급성 발작을 동반"으로 저장될 수 있으며, 상기 질병 색인어 검출모듈(320)에 의해 검출된 질병 색인어는 '갑상선독증', '갑상선', '발증', '급성', 발작' 및 '동반'으로 구성될 수 있다.
상기 색인어 매칭모듈(330)은 상기 질의 색인어 검출부(200)에서 검출된 질의 색인어와 상기 질병 색인어 검출모듈(320)에서 검출된 질병 색인어를 매칭하여 매칭률을 산출하는 기능을 수행한다. 즉, 매칭률은 질의 색인어와 질병 색인어의 매칭되는 색인어의 개수 및 유사정도에 따라 산출될 수 있으며, 산출된 매칭률은 % 또는 점수로 표시될 수 있다.
상기 질병분류코드 검출모듈(340)은 상기 색인어 매칭모듈(330)에서 산출된 매칭률에 근거하여 상기 질의에 대한 질병분류코드를 검출한다.
이때, 검출되는 질병분류코드는 매칭률에 따라 복수 개로 검출될 수 있다.
도 5는 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템에서 일 실시 예의 질의에 따른 질병분류코드가 도출되는 과정을 나타낸 도면이다.
첨부된 도 5를 참조하면, "급성 심근경색으로 인한 저산소성 뇌손상의 분류코드가 어떻게 되나요?"라는 질의에 대하여 형태소를 분석하여 검출된 질의 색인어는 '급성, '심근경색', '저산소성', '뇌손상', '뇌손' 및 '뇌'로 도출되었다. 이와 같이 검출된 질의 색인어와 상기 질병분류코드 DB모듈(310)에서 질병분류코드 각각에 대한 질병 색인어를 매칭한 결과가 코드리스트에 후보 코드로 표시되며, 후보코드에는 평가점수가 함께 표시되도록 구성될 수 있다.
이에 따라, 상기 질의자는 코드리스트에 표시되는 후보코드에 대한 질병분류코드를 참조하여 질병분류코드를 판단하거나 선택할 수 있게 된다.
상기 질병분류코드 갱신모듈(350)은 상기 질병분류코드 DB모듈(310)을 갱신하기 위한 것이다.
세계보건기구(WHO) 헌장 및 세계보건총회(WHA) 협약에 따라 국제질병분류 체계에 의한 보건 관련 통계를 작성하여 발표하고 있으며, 우리나라도 보건정책수립의 기초자료인 질병 및 사인(死因)에 관한 통계를 작성함에 있어 국제적인 비교를 위하여 세계보건기구(WHO)가 작성한 국제질병분류(ICD) 체계를 근간으로 한국표준질병·사인(死因)분류(KCD)를 작성하고 있다.
이에, 세계보건기구(WHO)는 국제질병분류(ICD) 및 종양학국제질병분류(ICD-O) 업데이트 사항을 반영함에 따라 KCD도 개정될 수 있으며, 개정된 KCD의 갱신을 통해 개정된 질병분류코드를 신속히 제공할 수 있으며, 질병분류코드의 조회 및 관리가 수월한 장점이 있다.
상기 색인어 저장모듈(360)은 상기 질병 색인어 검출모듈(320)에서 검출된 질병 색인어를 저장 관리한다. 상기 색인어 저장모듈(360)은 사용자에 의해서 편집가능하게 구성될 수 있다. 또한, 상기 질병분류코드 갱신모듈(350)에 의해 상기 질병분류코드 DB모듈(310)이 갱신된 경우에 상기 질병 색인어 검출모듈(320)에 검출된 질병 색인어가 변경됨에 따라 갱신되도록 구성된다.
상기 평가부(400)는 질의 내용, 질의에서 검출된 질의 색인어, 질병 색인어 및 검출된 질병분류코드에 대한 데이터를 저장 관리하여 본 발명에 따른 질의 응답형 질병분류코드 제공 시스템을 평가하기 위한 것으로서, 전문가들의 자문을 통해 질의 색인어, 질병 색인어 등을 수정하기 위한 것이다.
본 발명에 의하면, 질의를 통해 입력된 자연어에서 색인어를 추출하고, 추출된 색인어에 근거하여 질병분류코드를 제공함에 따라 질병분류코드의 검출이 용이할 뿐만 아니라 표준화된 질병분류코드를 제공할 수 있고, 질병분류코드의 갱신(업데이트)을 통해 개정된 질병분류코드를 신속히 제공할 수 있으며, 질병분류코드의 조회 및 관리가 수월한 장점이 있다.
이상에서 본 발명의 바람직한 실시 예를 설명하였으나, 본 발명의 권리범위는 이에 한정되지 아니하며 본 발명의 실시 예와 실질적으로 균등한 범위에 있는 것까지 본 발명의 권리범위가 미치는 것으로 이해되어야 하며, 본 발명의 정신을 벗어나지 않는 범위 내에서 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형 실시가 가능하다.
10: 클라이언트 20: 의료기관 정보제공 서버
30: 관리서버
100: 수집부
200: 질의 색인어 추출부 210: 질의 분석모듈
220: 사전 DB모듈 230: 질의 색인어 추출모듈
240: 색인어 평가모듈
300: 질병분류코드 검출부 310: 질병분류코드 DB모듈
320: 질병 색인어 검출모듈 330: 색인어 매칭모듈
340: 질병분류코드 검출모듈 350: 질병분류코드 갱신모듈
360: 색인어 저장모듈
400: 평가부

Claims (5)

  1. 사용자 클라이언트(10)로부터 요청된 질의를 질병분류코드에 근거하여 질병분류코드를 제공하는 관리서버(30)를 포함하는 질병분류코드 제공 시스템에 있어서,
    상기 관리서버(30)는,
    질병, 의료기관, 의약품 및 보험 정보를 수집하는 수집부(100);
    상기 수집부(100)에서 수집된 정보에 근거하여 상기 클라이언트(10)로부터 전송된 문장 형태의 질의로부터 색인어를 검출하는 질의 색인어 검출부(200); 및
    상기 질의 색인어 검출부(200)에서 검출된 질의 색인어와 질병분류코드에서 검출된 질병 색인어를 매칭하여 질병분류코드를 검출하는 질병분류코드 검출부(300);
    를 포함하여 구성되되,
    상기 질의 색인어 검출부(200)는,
    상기 클라이언트(10)로부터 전송된 질의에 따른 형태소, 체언 및 용언을 분석하는 질의 분석모듈(210);
    맞춤법, 표준어, 외래어 표기법 및 띄어쓰기에 대한 문법을 정의한 문법 사전, 용어에 대한 정의 또는 설명을 기재한 어휘 사전, 의료/보험/기관에서 사용하는 용어를 정의한 분야별 용어 사전, 사용자가 임의의 단어를 정의한 사용자 정의 사전 및 선행 학습된 분석 결과를 정의한 분석 사전을 저장 관리하는 사전 DB모듈(220);
    상기 사전 DB모듈(220)에 근거하여 상기 질의 분석모듈(210)에서 검출된 단어에서 조사를 생략하고 명사 및 줄임 단어를 도출하여 상기 질의에 대한 색인어를 추출하는 자연어 추론분석과; 객체와 인스턴스의 성질, 성향, 인스턴스 사이의 관계를 나타내기 위해서 인스턴스를 특정 값 또는 다른 인스턴스들과 연결시키는 속성으로 구성되는 웹 온톨로지 언어를 이용한 시멘틱 웹을 통한 상황추론분석을 혼용하여 상기 질의에 대한 색인어를 추출하는 질의 색인어 추출모듈(230); 및
    상기 질의 색인어 추출모듈(230)에서 검출된 질의 색인어가 질의 내용에 없는 단어이거나 또는 질의 내용으로부터 유추될 수 없는 단어로 평가된 경우에, 검출된 상기 색인어는 그 가중치를 낮게 책정하거나 삭제하여 검출된 색인어에 대한 유효성 평가를 수행하며, 검출된 상기 색인어가 단어의 조합으로 이루어진 경우 상기 색인어는 단어를 분리하여 각각의 색인어에 대한 유효성을 판단하는 질의 색인어 평가모듈(240);
    을 포함하며,
    상기 질병분류코드 검출부(300)는,
    질병분류코드를 저장 관리하는 질병분류코드 DB모듈(310);
    상기 질병분류코드 DB모듈(310)에서 각각 질병분류코드에 대한 색인어를 검출하는 질병 색인어 검출모듈(320);
    상기 질의 색인어 검출부(200)에서 검출된 질의 색인어와 상기 질병 색인어 검출모듈(320)에서 검출된 질병 색인어를 매칭하여 매칭률을 산출하는 색인어 매칭모듈(330); 및
    상기 색인어 매칭모듈(330)에서 매칭된 매칭률에 근거하여 상기 질의에 대한 복수 개의 질병분류코드를 검출하되, 검출된 상기 질병분류코드 각각에 대한 질병 색인어를 매칭한 결과가 코드리스트에 후보 코드로 표시되며, 상기 후보 코드에는 평가점수가 함께 표시되도록 하는 질병분류코드 검출모듈(340);
    을 포함하는 것을 특징으로 하는 질의 응답형 질병분류코드 제공 시스템.
  2. 삭제
  3. 삭제
  4. 청구항 1에 있어서,
    상기 질병분류코드 검출부(300)는,
    상기 질병분류코드 DB모듈(310)을 갱신할 수 있도록 질병분류코드 갱신모듈(350)이 더 포함된 것을 특징으로 하는 질의 응답형 질병분류코드 제공 시스템.
  5. 청구항 1에 있어서,
    상기 수집부(100)에서 수집하는 정보는,
    의료기관에서 저장 관리하는 공개된 의료정보, 의료기관 정보 및 의약품 정보와 의료 보험사에서 저장 관리하는 공개된 보험 정보인 것을 특징으로 하는 질의 응답형 질병분류코드 제공 시스템.
KR1020150153878A 2015-11-03 2015-11-03 질의 응답형 질병분류코드 제공 시스템 KR101799448B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150153878A KR101799448B1 (ko) 2015-11-03 2015-11-03 질의 응답형 질병분류코드 제공 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150153878A KR101799448B1 (ko) 2015-11-03 2015-11-03 질의 응답형 질병분류코드 제공 시스템

Publications (2)

Publication Number Publication Date
KR20170052020A KR20170052020A (ko) 2017-05-12
KR101799448B1 true KR101799448B1 (ko) 2017-11-20

Family

ID=58740200

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150153878A KR101799448B1 (ko) 2015-11-03 2015-11-03 질의 응답형 질병분류코드 제공 시스템

Country Status (1)

Country Link
KR (1) KR101799448B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200082474A (ko) * 2018-12-28 2020-07-08 아주대학교산학협력단 허혈성 심장질환 진단 방법
KR20210074440A (ko) 2019-12-11 2021-06-22 (주)피트케어 질병분류코드를 이용한 운동처방정보 시스템

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101950112B1 (ko) * 2017-10-17 2019-02-19 순천향대학교 산학협력단 진단코드를 의학적인 분류 중심으로 재구성하는 방법 및 시스템
KR102000221B1 (ko) * 2017-11-02 2019-07-15 (주)중외정보기술 자연어 처리 기반 요양급여 심사지원 서비스 시스템 및 방법
CN112115240A (zh) * 2019-06-21 2020-12-22 百度在线网络技术(北京)有限公司 分类处理方法、装置、服务器和存储介质
KR102350145B1 (ko) * 2021-07-14 2022-01-12 주식회사 원스글로벌 의약품 코드 매칭 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083783A (ja) * 2006-09-26 2008-04-10 Oki Electric Ind Co Ltd レセプト処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008083783A (ja) * 2006-09-26 2008-04-10 Oki Electric Ind Co Ltd レセプト処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200082474A (ko) * 2018-12-28 2020-07-08 아주대학교산학협력단 허혈성 심장질환 진단 방법
KR102211240B1 (ko) 2018-12-28 2021-02-01 아주대학교산학협력단 허혈성 심장질환에 대한 보조 의사 시스템에 의해 수행되는 허혈성 심장질환 진단 방법
KR20210074440A (ko) 2019-12-11 2021-06-22 (주)피트케어 질병분류코드를 이용한 운동처방정보 시스템

Also Published As

Publication number Publication date
KR20170052020A (ko) 2017-05-12

Similar Documents

Publication Publication Date Title
KR101799448B1 (ko) 질의 응답형 질병분류코드 제공 시스템
Meystre et al. Automation of a problem list using natural language processing
CA2747669C (en) Method and system for validation of claims against policy with contextualized semantic interoperability
Madkour et al. Temporal data representation, normalization, extraction, and reasoning: A review from clinical domain
Duftschmid et al. The EHR-ARCHE project: Satisfying clinical information needs in a Shared Electronic Health Record System based on IHE XDS and Archetypes
Moreno-Schneider et al. Orchestrating NLP services for the legal domain
Reeves et al. Adaptation of an NLP system to a new healthcare environment to identify social determinants of health
Rodrigues et al. Advanced applications of natural language processing for performing information extraction
Naz et al. Ontology-driven advanced drug-drug interaction
CN112328856A (zh) 公共事件追踪方法、装置、计算机设备及计算机可读介质
Cherednichenko et al. Collection and Processing of a Medical Corpus in Ukrainian.
Gaur et al. “Who can help me?”: Knowledge Infused Matching of Support Seekers and Support Providers during COVID-19 on Reddit
Wijeratne et al. Natural language processing for government: Problems and potential
Zhang et al. Psychiatric stressor recognition from clinical notes to reveal association with suicide
Derbas et al. Eventfully safapp: hybrid approach to event detection for social media mining
Ning [Retracted] Natural Language Processing Technology Used in Artificial Intelligence Scene of Law for Human Behavior
Pan et al. The positive energy of netizens: development and application of fine-grained sentiment lexicon and emotional intensity model
Alves et al. Information extraction applications for clinical trials: A survey
Harber et al. Feasibility and utility of lexical analysis for occupational health text
da Silva Ferreira Medical information extraction in European Portuguese
Megerdoomian et al. Automated Narrative Extraction from Administrative Records.
Chamorro-Padial et al. Finding answers to COVID-19-specific questions: An information retrieval system based on latent keywords and adapted TF-IDF
Efimenko et al. Anticipating Future Pathways of Science, Technologies, and Innovations:(Map of Science) 2 Approach
Onnoom et al. An ontology framework for recommendation about a crime scene investigation
Shamoug et al. SEmHuS: a semantically embedded humanitarian space

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
N231 Notification of change of applicant
X701 Decision to grant (after re-examination)