KR20160145978A - 건강 정보 제공 시스템 및 방법 - Google Patents

건강 정보 제공 시스템 및 방법 Download PDF

Info

Publication number
KR20160145978A
KR20160145978A KR1020150082423A KR20150082423A KR20160145978A KR 20160145978 A KR20160145978 A KR 20160145978A KR 1020150082423 A KR1020150082423 A KR 1020150082423A KR 20150082423 A KR20150082423 A KR 20150082423A KR 20160145978 A KR20160145978 A KR 20160145978A
Authority
KR
South Korea
Prior art keywords
information
symptom
disease
database
symptoms
Prior art date
Application number
KR1020150082423A
Other languages
English (en)
Other versions
KR101785780B1 (ko
Inventor
이시우
진희정
이영섭
김유정
Original Assignee
한국 한의학 연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국 한의학 연구원 filed Critical 한국 한의학 연구원
Priority to KR1020150082423A priority Critical patent/KR101785780B1/ko
Publication of KR20160145978A publication Critical patent/KR20160145978A/ko
Application granted granted Critical
Publication of KR101785780B1 publication Critical patent/KR101785780B1/ko

Links

Images

Classifications

    • G06F19/34
    • G06F17/20
    • G06F17/30401
    • G06F19/363
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services

Landscapes

  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Child & Adolescent Psychology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

본 발명은 건강 정보 제공 시스템 및 방법에 관한 것으로서, 입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출하는 처리부, 상기 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑하는 맵핑부, 질환 별로 부여된 증상의 가중치를 고려하여, 상기 적어도 하나 이상의 증상 정보에 맵핑된 상기 적어도 하나 이상의 질환 정보의 진단율을 계산하는 계산부, 및 상기 계산된 진단율을 고려하여 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공하는 결과 전송부를 포함한다.

Description

건강 정보 제공 시스템 및 방법{SYSTEM AND METHOD OF PROVIDING HEALTH INFORMATION}
건강 정보를 제공하는 시스템에 연관되며, 보다 특정하게는 온라인 검색 인터페이스를 통해 사용자가 쿼리를 입력하는 것에 대응하여 건강 관련 정보를 제공하는 기술에 연관된다.
의료 진단 보조하는 기존의 의사결정 보조 시스템들에서는 미리 설정해둔 증상리스트에서 사용자가 호소하는 증상들을 의료인이 선택 입력하고, 선택된 증상들과 가장 유사한 진단명을 우선순위별로 제공한다. 이러한 일반적인 시스템들은 한정된 데이터를 활용하여 전문가의 진단을 보조하는 기능을 제공하며, 일반인의 접근이나 활용은 제한적이다.
한편, 구글, 네이버, 다음, 야후 등의 검색 엔진에서는 자연어 검색 기능을 제공한다. 자연어는 인간이 통상 사용하는 언어 및/또는 문장으로서, 프로그래밍 언어, 잡(job)제어 언어등과 구별되고, 또한 검색 쿼리로서 정제된 키워드에 대비되는 의미이다. 자연어 검색은 정제되지 않은 문장 형태의 쿼리에서 의미어들을 파싱하고 이들에 적어도 하나의 연산자를 부여하여 검색 엔진에 입력하는 과정을 수반하는데, 사용자가 쉽고 직관적으로 활용할 수 있으면서도, 검색하고자 하는 바를 지능적으로 판단해 내어 검색 엔진의 활용도를 높여주고 있다.
대한민국 특허공개공보 제2014-0097516호
검색 엔진에 사용자가 자연어 검색 형태로 의학적 및/또는 한의학적 증상이나 병증을 입력하는 경우, 의학적 및/또는 한의학적 증상 정보, 질병/병증 정보, 미병 정보, 및 연관되는 건강 정보를 검색하여 제공하는 시스템이 제시된다.
또한, 이러한 검색에 이용되는 데이터가 한정되고 고정되는 것이 아니라 사용자의 검색 및 결과 피드백에 의해 학습 및 진화하는 시스템이 제시된다.
나아가, 제공되는 정보에 사용자가 액세스 할 수 있는 의학적 및/또는 한의학적 광고 정보가 함께 제시되어 별도의 수익 창출이 가능한 시스템이 제시된다.
일실시예에 따른 건강 정보 제공 시스템은 입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출하는 처리부, 상기 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑하는 맵핑부, 질환 별로 부여된 증상의 가중치를 고려하여, 상기 적어도 하나 이상의 증상 정보에 맵핑된 상기 적어도 하나 이상의 질환 정보의 진단율을 계산하는 계산부, 및 상기 계산된 진단율을 고려하여 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공하는 결과 전송부를 포함한다.
일실시예에 따른 상기 처리부는, 상기 파싱된 자연어로부터 적어도 하나 이상의 유사어 집합을 생성하고, 상기 생성된 적어도 하나 이상의 유사어 집합에 기초하여 상기 적어도 하나 이상의 증상 정보를 추출한다.
일실시예에 따른 건강 정보 제공 시스템은 질환에 따른 증상을 기록하는 데이터베이스를 더 포함하고, 상기 맵핑부는, 상기 데이터베이스를 참고하여 상기 추출된 적어도 하나 이상의 증상 정보를 상기 적어도 하나 이상의 질환 정보에 맵핑한다.
일실시예에 따른 상기 데이터베이스는 상기 증상에 따른 유사 증상을 더 기록하고, 상기 맵핑부는 상기 추출된 적어도 하나 이상의 증상 정보와 상기 데이터베이스에 기록된 상기 증상 및 유사 증상을 고려하여 적어도 하나 이상의 질환 정보에 맵핑한다.
일실시예에 따른 상기 데이터베이스는, 상기 질환에 상응하는 상기 증상의 중요도를 고려하여, 상기 증상에 대한 가중치를 더 기록한다.
일실시예에 따른 상기 처리부는, 상기 계산된 진단율 또는 상기 진단율에 대한 사용자의 만족도에 기초하여, 상기 데이터베이스를 학습한다.
일실시예에 따른 상기 계산부는, 상기 추출된 적어도 하나 이상의 증상 정보의 개수와 상기 적어도 하나 이상의 질환 정보에 맵핑된 증상 정보의 개수를 고려하여 상기 진단율을 계산한다.
일실시예에 따른 상기 결과 전송부는, 상기 질환 정보에 상응하는 건강 관리 정보를 더 제공한다.
일실시예에 따른 상기 결과 전송부는, 상기 질환 정보에 상응하는 광고 정보를 더 제공한다.
일실시예에 따른 건강 정보 제공 방법은 처리부에서, 입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출하는 단계, 맵핑부에서, 상기 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑하는 단계, 계산부에서, 질환 별로 부여된 증상의 가중치를 고려하여, 상기 증상 정보에 맵핑된 상기 적어도 하나 이상의 질환 정보의 진단율을 계산하는 단계, 및 결과 전송부에서, 상기 계산된 진단율을 고려하여 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공하는 단계를 포함한다.
일실시예에 따른 상기 적어도 하나 이상의 증상 정보를 추출하는 단계는, 상기 파싱된 자연어로부터 적어도 하나 이상의 유사어 집합을 생성하는 단계, 및 상기 생성된 적어도 하나 이상의 유사어 집합에 기초하여 상기 적어도 하나 이상의 증상 정보를 추출하는 단계를 포함한다.
일실시예에 따른 건강 정보 제공 방법은 데이터베이스에서, 질환에 따른 증상을 유지하는 단계를 더 포함하고, 상기 맵핑하는 단계는, 상기 데이터베이스를 참고하여 상기 추출된 적어도 하나 이상의 증상 정보를 상기 적어도 하나 이상의 질환 정보에 맵핑하는 단계를 포함한다.
일실시예에 따른 상기 질환에 따른 증상을 유지하는 단계는, 상기 증상에 따른 유사 증상을 더 기록하는 단계를 포함하고, 상기 맵핑하는 단계는 상기 추출된 적어도 하나 이상의 증상 정보와 상기 데이터베이스에 기록된 상기 증상 및 유사 증상을 고려하여 적어도 하나 이상의 질환 정보에 맵핑하는 단계를 포함한다.
일실시예에 따른 자연어 검색을 통한 건강 판별 프로그램은 입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출하는 명령어 세트, 상기 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑하는 명령어 세트, 상기 질환 별로 부여된 증상의 가중치를 고려하여, 상기 증상 정보에 맵핑된 상기 적어도 하나 이상의 질환 정보의 진단율을 계산하는 명령어 세트, 상기 계산된 진단율을 고려하여 우선 순위를 결정하는 명령어 세트, 및 상기 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공하는 명령어 세트를 포함한다.
실시예들에 따르면, 질병의 검색에 있어 자연어를 사용함으로써 실제 사용자의 증상에 적합한 질병을 효율적으로 검색할 수 있다.
도 1은 일실시예에 따른 건강 정보 제공 시스템을 설명하는 블록도이다.
도 2는 추출된 증상 정보를 질환 정보에 맵핑하는 실시예를 설명하는 도면이다.
도 3은 추출된 증상 정보 및 유사 증상 정보를 질환 정보에 맵핑하는 실시예를 설명하는 도면이다.
도 4는 일실시예에 따른 증상 유사어를 매핑 하는 실시예를 설명하는 도면이다.
도 5는 일실시예에 따른 건강 정보 제공 시스템을 통해 유사어 증상 집합과 데이터베이스의 증상을 매핑하는 실시예를 도시하는 도면이다.
도 6은 일실시예에 따른 건강 정보 제공 방법을 도시하는 흐름도이다.
이하에서, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 이러한 실시예들에 의해 권리범위가 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
아래 설명에서 사용되는 용어는, 연관되는 기술 분야에서 일반적이고 보편적인 것으로 선택되었으나, 기술의 발달 및/또는 변화, 관례, 기술자의 선호 등에 따라 다른 용어가 있을 수 있다. 따라서, 아래 설명에서 사용되는 용어는 기술적 사상을 한정하는 것으로 이해되어서는 안 되며, 실시예들을 설명하기 위한 예시적 용어로 이해되어야 한다.
또한 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 설명 부분에서 상세한 그 의미를 기재할 것이다. 따라서 아래 설명에서 사용되는 용어는 단순한 용어의 명칭이 아닌 그 용어가 가지는 의미와 명세서 전반에 걸친 내용을 토대로 이해되어야 한다.
도 1은 일실시예에 따른 건강 정보 제공 시스템(100)을 설명하는 블록도이다.
일실시예에 따른 건강 정보 제공 시스템(100)은 질병의 검색에 있어 자연어를 사용함으로써 실제 사용자의 증상에 적합한 질병을 효율적으로 검색할 수 있다.
이를 위해, 일실시예에 따른 건강 정보 제공 시스템(100)은 처리부(110), 매핑부(120), 제1 계산부(130), 및 결과 전송부(140)를 포함할 수 있다.
일실시예에 따른 처리부(110)는 입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출할 수 있다.
예를 들어, 자연어로서, "자주 아프고, 계속 목이 마르고, 몸이 떨립니다."가 입력되는 경우, 처리부(110)는 입력된 자연어를 파싱하여 "자주 아프다.", "목이 마르다.", "몸이 떨린다."를 증상 정보로서 추출할 수 있다.
일실시예에 따른 매핑부(120)는 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑할 수 있다.
이를 위해, 일실시예에 따른 건강 정보 제공 시스템(100)은 질환 별 증상이 기록된 데이터베이스를 더 포함할 수 있고, 매핑부(120)는 데이터베이스를 참조할 수 있다.
질환 별 증상이 기록된 데이터베이스의 데이터 구조는 도 2 및 도 3을 통해 상세히 설명한다.
일실시예에 따른 제1 계산부(130)는 질환 별로 부여된 증상의 가중치를 고려하여, 증상 정보에 맵핑된 적어도 하나 이상의 질환 정보의 진단율을 계산할 수 있다.
일례로, 제1 계산부(130)는 추출된 적어도 하나 이상의 증상 정보의 개수와 상기 적어도 하나 이상의 질환 정보에 맵핑된 증상 정보의 개수를 고려하여 상기 진단율을 계산할 수 있다.
구체적인 예로, '열증'의 질환에 해당하는 증상들은 '몸에 열이 나는 특징', '손발 바닥에 열이 나는 특징', '변비가 생기는 특징' 등을 포함한다. 그러나, 이들 특징들 중에서도 '몸에 열이 나는 특징'이 '열증'의 질환 중 대표적인 증상으로 볼 수 있다. 따라서, 입력된 자연어로부터 파싱된 증상 정보들에 대해 질환 별로 부여된 증상의 가중치를 고려하여 질환 정보에 대한 진단율을 계산할 수 있다.
일실시예에 따른 결과 전송부(140)는 계산된 진단율을 고려하여 우선 순위를 결정하고, 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공할 수 있다.
다른 예로, 결과 전송부(140)는 리스팅된 질환 정보 이외에도 의학적 또는 한의학적 증상 정보, 질병/병증 정보, 미병 정보, 및 연관되는 건강 관리 정보를 더 제공할 수 있다.
예를 들어, 자연어로 "기침이 심하고, 가래가 생긴다"가 입력되면, 결과 전송부(140)는 이 증상에 해당하는 질환 정보를 제공할 뿐만 아니라, 이 병증을 완화하는 한의학적 요법/정보/음식물을 제공할 수 있다. 뿐만 아니라, 결과 전송부(140)는 연관되는 병증을 같이 제공하거나, 추가 문의를 객관식이나 예/아니오의 형태로 제공하면서 추가 정보를 수집하여 결과를 제공할 수도 있다.
또 다른 예로, 결과 전송부(140)는 리스팅된 질환 정보 이외에도 의학적 및/또는 한의학적 광고 정보를 더 제공할 수 있다. 예를 들어, 리스팅된 질환 정보와 함께 수익 모델로 삼을 수 있는 정보로서, 해당 질환 예를 들어 목감기 잘 다스리는 OOO한의원, 목감기에 좋은 OO탕, 등 병원이나 건강기능식품 등과 관련된 정보를 광고 정보로서 더 제공할 수 있다.
본 발명의 일실시예에 따른 건강 정보 제공 시스템(100)은 확인부(150)와 제2 계산부(160)를 더 포함할 수 있다.
확인부(150)는 자연어로부터 파싱된 증상 정보들 중에서 질환을 결정하기 위한 필수의 증상을 확인할 수 있다. 또한, 제2 계산부(160)는 확인된 필수의 증상에 대한 가중치를 고려하여 질환 정보에 대한 진단율을 계산할 수 있다. 이 때의 필수 증상이라 함은 증상의 가중치가 미리 지정된 기준 이상으로 높은 증상을 의미하거나, 필수 증상을 포함한다.
제1 계산부(130)나 제2 계산부(160)가 계산하는 가중치의 일례는 다음과 같다.
첫 번째 예로, 각 질환 Di의 증상들 S={si1, si2, si3, ...}은 해당 질환 Di가 되기 위한 필수적인 정보인지에 따라 가중치 Wij가 부여될 수 있다. 이러한 경우, 각 질환에 포함된 증상들의 가중치 합 ∑Wij = 1이고, 사용자가 입력한 문장에서 추출한 증상 리스트와 각 질환별 매핑되는 증상들의 가중치의 합이 해당 질환이 될 가중치가 될 수 있다.
다른 예로, 각 질환/변증에서 사용자가 호소하는 증상과 매핑이 되는 증상의 수를 n이라하고, 각 질환/변증의 전체 증상 수를 m이라 할 때, 해당 질환이 될 가능성, 즉 진단율은 n/m으로 산출할 수 있다.
만약, 질환/변증 별로 특정 증상이 있으면, 일실시예에 따른 건강 정보 제공 시스템(100)은 그 질환/변증으로 볼 수 있는 것이 있다면, 해당 증상이 선택된 경우 질환의 진단율을 100%로 본다.
또 다른 예로, 제1 계산부(130) 또는 제2 계산부(160)는 선택된 증상들의 가중치를 합하거나, 증상들의 수를 각 질환/변증의 증상 수로 나누어 각 질환/변증의 확률을 계산할 수도 있다.
일실시예에 따른 처리부(110)는 계산된 진단율 또는 진단율에 대한 사용자의 만족도 등에 기초하여, 데이터베이스를 학습할 수 있다.
예를 들어, 데이터베이스는 한정되고 고정되는 것이 아니라 처리부(110)에 의해 사용자의 검색 및 결과 피드백을 참고하여 학습 및 진화될 수 있다. 예를 들어, 검색엔진이 제공한 정보에 대해 사용자가 만족하면 해당 정보의 정확도를 높게 평가할 수 있고, 사용자가 불만족하면 해당 정보의 정확도를 낮게 평가할 수 있는데, 처리부(110)는 이러한 사용자의 평가에 기초하여 데이터베이스에 기록 및 유지되는 정보를 갱신할 수 있다. 또한, 처리부(110)는 전문가(예를 들어, 한의사 등)가 내용을 보완하는 것을 입력하면 보완된 내용에 대한 검증을 거쳐서 데이터베이스에 반영시킬 수도 있다.
도 2는 추출된 증상 정보를 질환 정보에 맵핑하는 실시예를 설명하는 도면이다.
먼저, 도 2a의 표(200)에서 보는 바와 같이 데이터베이스는 질환 별 증상을 연관 지어 기록하고 이를 유지한다.
예를 들어, 질환 D1에 대응되는 증상은 S11, S12를 포함하고, 질환 D2에 대응되는 증상은 S21을 포함할 수 있다.
도 2b를 참고하면, 처리부(210)는 자연어를 입력 받아 파싱을 수행할 수 있다. 또한, 파싱 결과 자연어로부터 다양한 증상 정보들을 추출하고, 추출된 증상 정보들에 상응하는 유사어 집합을 생성할 수 있다(단계 220). 예를 들어, '목이 마르다.'의 유사어는 '갈증이 있다.', '물을 자주 마시고 싶다.' 등을 포함할 수 있다.
일례로, 처리부(210)는 이전에 입력된 자연어로부터 추출했던 증상 정보들을 데이터베이스에 누적하고, 현재 추출된 증상정보들에 상응하는 유사어 집합을 생성하는데 이용할 수 있다.
다음으로, 일실시예에 따른 건강 정보 제공 시스템은 증상 문장 집합(230)을 데이터베이스(240)에 매핑할 수 있다. 예를 들어, 증상 문장 집합(230)은 "자주 아프다.", "목이 마르다.", "몸이 떨린다."와 같은 증상들의 집합으로서, 데이터베이스(240)에 기록된 질환 별 증상에 맵핑될 수 있다.
도 2c를 살펴보면, 표(250)는 자연어로부터 추출되는 증상 정보들을 데이터베이스(260)에 기록된 질환 별 증상에 매핑할 수 있다.
구체적으로, 데이터베이스(260)에 기록된 질환 중에서 D1의 질환은 S11, S12를 포함하는데, 자연어로부터 추출된 증상 중 Input_S'1과 Input_S'2이 D1의 질환 중 S11과 S12에 각각 매핑될 수 있고, 질환 중에서 D2의 질환은 S21을 포함하는데, 자연어로부터 추출된 증상 중 Input_S'2가 D2의 질환 중 S21에 매핑될 수 있다.
즉, 데이터베이스(260)에 기록된 질환들 중에서 증상 중 일부가 매핑되는 D1과 D2가 자연어로부터 진단될 수 있는 질환이다. 이때, 일실시예에 따른 건강 정보 제공 시스템은 증상별 가중치를 고려하여 D1 또는 D2가 진단될 확률, 즉 진단율을 산출할 수 있다.
도 3은 추출된 증상 정보 및 유사 증상 정보를 질환 정보에 맵핑하는 실시예를 설명하는 도면이다.
도 3에서는 도 2에 더해 유사 증상 정보를 더 고려할 수 있다.
이를 위해, 데이터베이스는 증상에 따른 유사 증상을 더 기록하고, 맵핑부는 추출된 적어도 하나 이상의 증상 정보와 데이터베이스에 기록된 증상 및 유사 증상을 고려하여 적어도 하나 이상의 질환 정보에 맵핑할 수 있다.
먼저 도 3a의 표(300)에서 보는 바와 같이 데이터베이스는 질환 별 증상을 연관 지어 기록하고 이를 유지한다.
예를 들어, 질환 D1에 대응되는 증상은 S11, S12와 증상(S11, S12)에 상응하는 유사증상 S'11 _1, S'11 _2, S'11 _3, S'12 _1, 및 S'12 _2를 포함할 수 있다. 또한, 질환 D2에 대응되는 증상은 S21와 이에 상응하는 유사증상 S'21 _1, S'21 _2, S'21 _3을 포함할 수 있다. 또한,
도 3b를 참고하면, 처리부(310)는 자연어를 입력 받아 파싱을 수행할 수 있다. 또한, 파싱 결과 자연어로부터 다양한 증상 정보들을 추출하고, 추출된 증상 정보들에 상응하는 증상 문장 집합을 생성할 수 있다(단계 320).
다음으로, 일실시예에 따른 건강 정보 제공 시스템은 증상 문장 집합(320)을 데이터베이스(330)에 매핑할 수 있다. 이때, 데이터베이스(330)는 질환 별 증상뿐만 아니라, 증상에 상응하는 유사 증상을 더 포함할 수 있다. 예를 들어, 데이터베이스(330)는 "목이 마르다."의 증상과 함께 '갈증이 있다.', '물을 자주 마시고 싶다.' 등의 유사 증상을 기록하고 이를 유지할 수 있다. 이에, 일실시예에 따른 건강 정보 제공 시스템은 증상 문장 집합(320)과 증상 및 유사 증상을 맵핑할 수 있다.
도 3c를 참고하면, 일실시예에 따른 건강 정보 제공 시스템은 자연어로부터 추출되는 증상 정보들인 표(340)를 데이터베이스(350)에 기록된 질환 별 증상에 매핑할 수 있다.
구체적으로, 데이터베이스(350)에 기록된 질환 중에서 D1의 질환은 S11, S12, S21을 포함하는데, 자연어로부터 추출된 증상 중 Input_S'1, Input_S'2, Input_S'3이 D1의 질환 중 S'11과 S'12에 각각 매핑될 수 있고, 질환 중에서 D2의 질환은 S'21을 포함하는데, 자연어로부터 추출된 증상 중 Input_S'2가 D2의 질환 중 S'21와 S'21 _1, S'21_2, S'21 _3에 매핑될 수 있다.
데이터베이스(350)에 기록된 질환들 중에서 증상과 유사 증상 중 일부가 매핑되는 D1과 D2가 자연어로부터 진단될 수 있는 질환이다. 이때, 일실시예에 따른 건강 정보 제공 시스템은 증상별 가중치와 유사 증상별 가중치를 고려하여 D1 또는 D2가 진단될 확률, 즉 진단율을 산출할 수 있다.
이를 위해, 데이터베이스는 질환에 상응하는 증상의 중요도를 고려하여, 질환에 상응하는 증상의 가중치를 더 기록할 수 있다.
도 4는 일실시예에 따른 증상 유사어를 매핑 하는 실시예를 설명하는 도면이다.
증상의 유사어를 생성하여 증상 문항을 매핑하는 방법에는 다양한 방법이 존재할 수 있다. 이 중에서, 도 4에 개시된 실시예를 통해 증상 유사어 매핑의 성능을 점차 개선시킬 수 있다.
먼저, 일실시예에 따른 건강 정보 제공 시스템은 증상 문항을 매핑하고(단계 410), 매핑한 결과를 사용자에게 보여준다(단계 420). 또한, 일실시예에 따른 건강 정보 제공 시스템은 매핑이 완료되면, 사용자 확인을 통해 매핑에 수정이 필요한지 여부를 판단할 수 있다(430). 만약, 매핑에 수정이 필요한 경우라면, 증상을 선택하는 기능을 추가동작 시킬 수 있다(440).
이 때 일실시예에 따른 건강 정보 제공 시스템은 입력된 증상 문항과 유사한 증상 문항 리스트를 보여주고, 사용자의 선택을 입력 받을 수 있다. 이때, 증상 문항 리스트 중 사용자가 선택한 문항이 있는 경우, 추후 증상 유사어 생성시 사용자가 선택한 문항이 포함될 수 있다. 또한, 사용자가 선택할 문항이 없는 경우, 일실시예에 따른 건강 정보 제공 시스템은 증상 추가 요구를 접수하고 증상 문항을 확인하여 데이터베이스에 유사어 증상 리스트를 추가할 수 있다.
이로써, 증상 매핑의 성능이 점차 향상될 수 있다.
도 5는 일실시예에 따른 건강 정보 제공 시스템을 통해 증상 집합과 데이터베이스의 증상을 매핑하는 실시예를 도시하는 도면이다.
도 5a를 살펴보면, 데이터베이스는 도면부호 510와 같이 질환(factor) 별 증상을 기록하고 이를 유지한다. 또한, 데이터베이스는 각 질환 별 증상의 가중치를 더 기록할 수 있다.
일례로, 입력된 자연어가 "자주 아프고, 계속 목이 마르고, 몸이 떨립니다."인 경우, 파싱되는 증상 정보로서 "목이 마르다.", "몸이 떨린다.", "자주 아프다."가 추출될 수 있다.
한편, 건강 정보 제공 시스템은 "목이 마르다."의 유사어로 "갈증이 있다.", "몸이 떨린다. "의 유사어로 "전신 통증이 있다.", "자주 아프다."의 유사어로 "잔병치레가 많다." 등의 집합을 생성할 수 있다.
이에, 건강 정보 제공 시스템은 추출된 증상정보들과 이에 상응하는 유사 증상을 이용하여 도면부호 520과 같이 표에 매핑할 수 있다.
가중치를 고려하여 진단율을 계산해보면, 질환 중 '한증'에 맵핑된 증상은 '몸이 떨린다'로서 가중치가 '0.2'이다. 따라서, '한증'의 가중치는 '0.2'로 계산될 수 있다.
또한, 질환 중 '열증'에 맵핑된 증상은 '전신 통증이 있다.'와 '갈증이 있다'로서 가중치가 각각 '0.1' 및 '0.2'이다. 따라서, '열증'의 가중치는 '0.1+0.2=0.3'으로 계산될 수 있다.
또한, 질환 중 '허증'에 맵핑된 증상은 '자주 아프다.'로서 가중치가 각각 '0.2'이다. 따라서, '허증'의 가중치는 '0.2'로 계산될 수 있다.
즉, 진단율을 고려하면 입력된 자연어에 의해 사용자가 현재 '열증'일 확률이 가장 높다.
도 5b를 살펴보면, 입력된 자연어에 더해 중요 증상을 더 확인할 수 있다.
가중치 계산을 통해, 가중치가 높은 상위 n개의 질환에서 사용자 입력 증상에 포함되지 않는 주요 증상이 있는 경우, 사용자에게 해당 증상이 있는지를 확인하는 작업이 추가될 수 있다. 이는, 증상이 많은 질환의 경우, 증상이 적은 질환에 비해 각 증상들이 상대적으로 작은 가중치를 가질 수 있고, 사용자가 호소하는 증상을 포함하더라도, 가중치 계산 결과 질환/변증이 작은 가중치를 가질 수 있는 경우를 보완할 수 있다.
이를 위해, 건강 정보 제공 시스템은 도면부호 530의 설문 정보를 제공하고, 사용자로부터 입력되는 증상을 중요 증상으로 확인하여 진단율의 산출에 반영할 수 있다.
구체적으로, 사용자가 '몸에 열이 난다.'를 선택하는 경우, 이에 해당하는 증상의 가중치를 앞서 생성한 가중치에 추가할 수 있다.
즉, 사용자가 '몸에 열이 난다.'를 선택하는 경우라면 이는 열증에 해당하는 증상으로서, 열증에 생성했던 가중치 '0.3'에 '몸에 열이 난다.'의 증상에 해당하는 가중치 '0.3'을 더해 '열증'의 가중치는 '0.3+0.3=0.6'으로 계산될 수 있다.
결국, 증상과 유사 증상을 모두 고려하여 자연어로부터 추출된 증상 정보의 가중치를 고려한 진단율은 도 5c의 표(540)와 같이 산출될 수 있다.
즉, 열증에 해당하는 진단율은 60%, 한증 및 허증에 해당하는 진단율은 각각 20%로서, 사용자가 현재 '열증'에 해당하는 질환을 나타내는 것으로 분석할 수 있다.
도 6은 일실시예에 따른 건강 정보 제공 방법을 도시하는 흐름도이다.
일실시예에 따른 건강 정보 제공 방법은 입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출할 수 있다(단계 601).
예를 들어, 건강 정보 제공 방법은 적어도 하나 이상의 증상 정보를 추출하기 위해, 파싱된 자연어로부터 적어도 하나 이상의 유사어 집합을 생성하고, 생성된 적어도 하나 이상의 유사어 집합에 기초하여 적어도 하나 이상의 증상 정보를 추출할 수 있다.
또한, 일실시예에 따른 건강 정보 제공 방법은 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑할 수 있다(단계 602). 일례로, 일실시예에 따른 건강 정보 제공 방법은 데이터베이스에 질환 별 증상을 유지할 수 있다. 이에, 데이터베이스를 참고하여 상기 추출된 적어도 하나 이상의 증상 정보를 상기 적어도 하나 이상의 질환 정보에 맵핑할 수 있다.
일례로, 데이터베이스는 질환에 따른 증상과 함께, 증상에 따른 유사 증상을 더 기록하고 이를 유지할 수 있다. 이에, 일실시예에 따른 건강 정보 제공 방법은 맵핑을 위해, 추출된 적어도 하나 이상의 증상 정보와 데이터베이스에 기록된 증상 및 유사 증상을 고려하여 적어도 하나 이상의 질환 정보에 맵핑할 수 있다.
또한, 일실시예에 따른 건강 정보 제공 방법은 질환 별로 부여된 증상의 가중치를 고려하여, 상기 증상 정보에 맵핑된 상기 적어도 하나 이상의 질환 정보의 진단율을 계산하고(단계 603), 계산된 진단율을 고려하여 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공할 수 있다(단계 604).
본 발명의 일실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims (14)

  1. 적어도 하나의 프로세서를 포함하는 건강 정보 제공 시스템에 있어서, 상기 적어도 하나의 프로세서에 의해 적어도 일시적으로 구현되는:
    입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출하는 처리부;
    상기 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑하는 맵핑부;
    질환 별로 부여된 증상의 가중치를 고려하여, 상기 적어도 하나 이상의 증상 정보에 맵핑된 상기 적어도 하나 이상의 질환 정보의 진단율을 계산하는 계산부; 및
    상기 계산된 진단율을 고려하여 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공하는 결과 전송부
    를 포함하는 건강 정보 제공 시스템.
  2. 제1항에 있어서,
    상기 처리부는,
    상기 파싱된 자연어로부터 적어도 하나 이상의 유사어 집합을 생성하고, 상기 생성된 적어도 하나 이상의 유사어 집합에 기초하여 상기 적어도 하나 이상의 증상 정보를 추출하는 건강 정보 제공 시스템.
  3. 제1항에 있어서,
    질환에 따른 증상을 기록하는 데이터베이스
    를 더 포함하고,
    상기 맵핑부는,
    상기 데이터베이스를 참고하여 상기 추출된 적어도 하나 이상의 증상 정보를 상기 적어도 하나 이상의 질환 정보에 맵핑하는 건강 정보 제공 시스템.
  4. 제3항에 있어서,
    상기 데이터베이스는 상기 증상에 따른 유사 증상을 더 기록하고,
    상기 맵핑부는 상기 추출된 적어도 하나 이상의 증상 정보와 상기 데이터베이스에 기록된 상기 증상 및 유사 증상을 고려하여 적어도 하나 이상의 질환 정보에 맵핑하는 건강 정보 제공 시스템.
  5. 제3항에 있어서,
    상기 데이터베이스는,
    상기 질환에 상응하는 상기 증상의 중요도를 고려하여, 상기 증상에 대한 가중치를 더 기록하는 건강 정보 제공 시스템.
  6. 제3항에 있어서,
    상기 처리부는,
    상기 계산된 진단율 또는 상기 진단율에 대한 사용자의 만족도에 기초하여, 상기 데이터베이스를 학습하는 건강 정보 제공 시스템.
  7. 제1항에 있어서,
    상기 계산부는, 상기 추출된 적어도 하나 이상의 증상 정보의 개수와 상기 적어도 하나 이상의 질환 정보에 맵핑된 증상 정보의 개수를 고려하여 상기 진단율을 계산하는 건강 정보 제공 시스템.
  8. 제1항에 있어서,
    상기 결과 전송부는,
    상기 질환 정보에 상응하는 건강 관리 정보를 더 제공하는 건강 정보 제공 시스템.
  9. 제1항에 있어서,
    상기 결과 전송부는,
    상기 질환 정보에 상응하는 광고 정보를 더 제공하는 건강 정보 제공 시스템.
  10. 처리부에서, 입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출하는 단계;
    맵핑부에서, 상기 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑하는 단계;
    계산부에서, 질환 별로 부여된 증상의 가중치를 고려하여, 상기 증상 정보에 맵핑된 상기 적어도 하나 이상의 질환 정보의 진단율을 계산하는 단계; 및
    결과 전송부에서, 상기 계산된 진단율을 고려하여 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공하는 단계
    를 포함하는 건강 정보 제공 방법.
  11. 제10항에 있어서,
    상기 적어도 하나 이상의 증상 정보를 추출하는 단계는,
    상기 파싱된 자연어로부터 적어도 하나 이상의 유사어 집합을 생성하는 단계; 및
    상기 생성된 적어도 하나 이상의 유사어 집합에 기초하여 상기 적어도 하나 이상의 증상 정보를 추출하는 단계
    를 포함하는 건강 정보 제공 방법.
  12. 제10항에 있어서,
    데이터베이스에서, 질환에 따른 증상을 유지하는 단계
    를 더 포함하고,
    상기 맵핑하는 단계는,
    상기 데이터베이스를 참고하여 상기 추출된 적어도 하나 이상의 증상 정보를 상기 적어도 하나 이상의 질환 정보에 맵핑하는 단계
    를 포함하는 건강 정보 제공 방법.
  13. 제12항에 있어서,
    상기 질환에 따른 증상을 유지하는 단계는,
    상기 증상에 따른 유사 증상을 더 기록하는 단계
    를 포함하고,
    상기 맵핑하는 단계는 상기 추출된 적어도 하나 이상의 증상 정보와 상기 데이터베이스에 기록된 상기 증상 및 유사 증상을 고려하여 적어도 하나 이상의 질환 정보에 맵핑하는 단계
    를 포함하는 건강 정보 제공 방법.
  14. 기록매체에 저장되는 자연어 검색을 통한 건강 판별 프로그램으로서, 상기 프로그램은 컴퓨팅 시스템에서 실행되는:
    입력되는 자연어를 파싱하여 적어도 하나 이상의 증상 정보를 추출하는 명령어 세트;
    상기 추출된 적어도 하나 이상의 증상 정보를 적어도 하나 이상의 질환 정보에 맵핑하는 명령어 세트;
    상기 질환 별로 부여된 증상의 가중치를 고려하여, 상기 증상 정보에 맵핑된 상기 적어도 하나 이상의 질환 정보의 진단율을 계산하는 명령어 세트;
    상기 계산된 진단율을 고려하여 우선 순위를 결정하는 명령어 세트; 및
    상기 우선 순위에 따라 상기 적어도 하나 이상의 질환 정보를 리스팅하여 제공하는 명령어 세트
    를 포함하는 건강 정보 제공 프로그램.
KR1020150082423A 2015-06-11 2015-06-11 건강 정보 제공 시스템 및 방법 KR101785780B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150082423A KR101785780B1 (ko) 2015-06-11 2015-06-11 건강 정보 제공 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150082423A KR101785780B1 (ko) 2015-06-11 2015-06-11 건강 정보 제공 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20160145978A true KR20160145978A (ko) 2016-12-21
KR101785780B1 KR101785780B1 (ko) 2017-10-16

Family

ID=57734674

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150082423A KR101785780B1 (ko) 2015-06-11 2015-06-11 건강 정보 제공 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101785780B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190066683A (ko) * 2017-12-06 2019-06-14 주식회사 쓰리빌리언 질병 유전자 발병 확률 보정 방법 및 그 장치
KR102088980B1 (ko) * 2019-04-19 2020-03-13 이정의 사용자 맞춤형 의료정보 제공 시스템 및 이의 구동방법
CN112700838A (zh) * 2020-12-30 2021-04-23 平安科技(深圳)有限公司 基于大数据的用药方案推荐方法、装置及相关设备
KR102444460B1 (ko) * 2021-08-30 2022-09-19 주식회사 초메디신 인공지능 기반의 증상 및 질환 매칭을 위한 챗봇 서비스 제공방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102297466B1 (ko) * 2019-07-25 2021-09-03 한국로봇융합연구원 문진 장치 및 문진 방법
US12019980B2 (en) 2019-11-19 2024-06-25 Click Therapeutics, Inc. Apparatus, system, and method for adaptive parsing and processing of text to facilitate user engagement
KR102605009B1 (ko) 2021-07-29 2023-11-23 주식회사 메드올스 머신러닝을 이용한 의료정보 분류 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140097516A (ko) 2011-12-28 2014-08-06 인텔 코포레이션 데이터 스트림들의 실시간 자연어 처리

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101404503B1 (ko) * 2013-10-01 2014-06-10 배형준 환자 처방전으로부터 관련 질병의 추출 및 추출된 질병 관련 정보를 제공하는 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140097516A (ko) 2011-12-28 2014-08-06 인텔 코포레이션 데이터 스트림들의 실시간 자연어 처리

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190066683A (ko) * 2017-12-06 2019-06-14 주식회사 쓰리빌리언 질병 유전자 발병 확률 보정 방법 및 그 장치
KR102088980B1 (ko) * 2019-04-19 2020-03-13 이정의 사용자 맞춤형 의료정보 제공 시스템 및 이의 구동방법
WO2020213843A1 (ko) * 2019-04-19 2020-10-22 이정의 사용자 맞춤형 의료정보 제공 시스템 및 이의 구동방법
CN112700838A (zh) * 2020-12-30 2021-04-23 平安科技(深圳)有限公司 基于大数据的用药方案推荐方法、装置及相关设备
CN112700838B (zh) * 2020-12-30 2024-03-01 平安科技(深圳)有限公司 基于大数据的用药方案推荐方法、装置及相关设备
KR102444460B1 (ko) * 2021-08-30 2022-09-19 주식회사 초메디신 인공지능 기반의 증상 및 질환 매칭을 위한 챗봇 서비스 제공방법

Also Published As

Publication number Publication date
KR101785780B1 (ko) 2017-10-16

Similar Documents

Publication Publication Date Title
KR101785780B1 (ko) 건강 정보 제공 시스템 및 방법
Ni et al. Mandy: Towards a smart primary care chatbot application
US11514114B2 (en) User-centric contextual information for browser
US9690861B2 (en) Deep semantic search of electronic medical records
US10740704B2 (en) User-centric browser location
US9589231B2 (en) Social medical network for diagnosis assistance
US10685052B2 (en) Method of and system for information retrieval
US20100076786A1 (en) Computer System and Computer-Implemented Method for Providing Personalized Health Information for Multiple Patients and Caregivers
EP2656274B1 (en) Creating an access control policy based on consumer privacy preferences
JP2021507350A (ja) 複雑な回答の補強証拠取り出し
US11847411B2 (en) Obtaining supported decision trees from text for medical health applications
US10127271B2 (en) Generating a query
US11532387B2 (en) Identifying information in plain text narratives EMRs
US20200211709A1 (en) Method and system to provide medical advice to a user in real time based on medical triage conversation
US20220114346A1 (en) Multi case-based reasoning by syntactic-semantic alignment and discourse analysis
US20170192948A1 (en) Form filling engine to populate fields of an electronic form
CN111144658A (zh) 医疗风险预测方法、装置、系统、存储介质与电子设备
US20180101652A1 (en) Medical risk factors evaluation
JP5266975B2 (ja) 個人検索システム、情報処理装置、個人検索方法、プログラムおよび記録媒体
US20210272038A1 (en) Healthcare Decision Platform
Jin et al. Using electronic medical records and physician data to improve information retrieval for evidence-based care
KR102666450B1 (ko) 디지털 트윈 기반의 가상 세계에서 가상 의료 서비스를 제공하는 방법 및 학습 방법과 이를 이용한 컴퓨팅 장치
US20230170092A1 (en) Medical indication determination using heterogeneous data in a clinical decision support system
US20230043849A1 (en) Answer generation using machine reading comprehension and supported decision trees
US20230335299A1 (en) Translation of medical evidence into computational evidence and applications thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right