KR101700327B1

KR101700327B1 - 빅데이터의 분석 결과를 제공하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체

Info

Publication number: KR101700327B1
Application number: KR1020160000994A
Authority: KR
Inventors: 안동욱; 이용희
Original assignee: (주)미소정보기술; 에스케이텔레콤 주식회사
Priority date: 2016-01-05
Filing date: 2016-01-05
Publication date: 2017-01-26

Abstract

본 발명은 빅데이터의 분석 결과를 제공하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다. 본 발명의 일 태양에 따르면, 빅데이터의 분석 결과를 제공하기 위한 방법으로서, (a) 쿼리 입력이 사용자 단말로부터 발생하면, 서버는, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하는 단계; (b) 상기 서버가, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 단계; 및(c) 상기 서버가, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말을 통해 상기 사용자에게 제공하는 단계를 포함하는 방법이 제공된다.

Description

빅데이터의 분석 결과를 제공하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체{METHOD, SERVER AND COMPUTER-READABLE RECORDING MEDIA FOR PROVIDING RESULT BY ANALYZING BIG DATA}

본 발명은 빅데이터의 분석 결과를 제공하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체에 관한 것으로, 보다 상세하게는, 사용자 단말로부터 비정형 데이터를 검색하기 위한 쿼리 입력이 획득되면, 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하고, 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단한 후 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 사용자에게 제공하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다.

컴퓨터, 스마트폰, 통신 등의 IT 관련 기술이 비약적으로 발달함에 따라 다양한 분야에서 대량의 정보가 발생하고 있으며, 정보의 양은 계속적으로 증가할 것으로 예측되고 있다. 이러한 대량의 정보는, 가까운 미래를 예측하거나 새로운 비즈니스를 창출하는 등 다양한 분야에서 활용되어 새로운 가치를 창출할 수 있는 자원이기 때문에 단순한 데이터가 아니라 빅데이터 산업이라는 독립적인 산업 분야로서 자리매김을 하고 있다.

현재, 빅데이터를 효율적으로 이용하기 위한 다양한 정보 검색 시스템 또는 기술이 존재하고 있으나, 이러한 기술들은 정형화된 데이터를 대상으로 정보를 검색하고 분석하는 것에 집중되어 있어, 빅데이터 중 형식없이 작성된 비정형 데이터에 대한 분석은 상대적으로 부족한 상태이다.

특히, 의료 분야에서는, 의사가 환자를 진료하고 검사한 후 작성하는 EMR(Electronic Medical Record)에 핵심적인 의료 정보가 포함되어 있어 이를 의료 연구 개발에 이용하고자 하는 요구는 존재했었지만, EMR에서 진료 내용이나 검사 결과 등은 텍스트 데이터로 작성되기 때문에 비정형 데이터로 저장되어 진료 내용이나 검사 결과를 효율적으로 검색하는 것이 어려웠다.

이에 본 발명자는 빅데이터의 비정형 데이터를 대상으로 검색 가능하게 하여 원하는 데이터를 검색한 후 분석할 수 있는 기술을 제안하고자 한다.

본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.

또한, 본 발명은 대량의 연구 데이터의 정형 데이터뿐만 아니라 비정형 데이터를 대상으로 검색이 가능하게 함으로써 연구 데이터를 획득하고 분석하는 시간을 단축시키는 것을 다른 목적으로 한다.

또한, 본 발명은 장기간 축적된 데이터를 기반으로 과거와 현재의 규칙성 및 상관관계를 통계적으로 분석한 결과를 사용자에게 제공하는 것을 또 다른 목적으로 한다.

상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한, 본 발명의 특징적인 구성은 하기와 같다.

본 발명의 일 태양에 따르면, 빅데이터의 분석 결과를 제공하기 위한 방법으로서, (a) 쿼리 입력이 사용자 단말로부터 발생하면, 서버는, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하는 단계; (b) 상기 서버가, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 단계; 및(c) 상기 서버가, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말을 통해 상기 사용자에게 제공하는 단계를 포함하는 방법이 제공된다.

본 발명의 다른 태양에 따르면, 빅데이터의 분석 결과를 제공하기 위한 서버로서, 통신부; 쿼리 입력이 상기 통신부를 통해 사용자 단말로부터 획득되면, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하고, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 프로세서를 포함하되, 상기 통신부는, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말에 제공하는 것을 특징으로 하는 서버가 제공된다.

본 발명에 의하면, 대량의 연구 데이터의 정형 데이터뿐만 아니라 비정형 데이터를 대상으로 검색이 가능하게 함으로써 연구 데이터를 획득하고 분석하는 시간을 단축시킬 수 있다.

또한, 본 발명에 의하면, 장기간 축적된 데이터를 기반으로 과거와 현재의 규칙성 및 상관관계를 통계적으로 분석한 결과를 사용자에게 제공할 수 있다.

도 1은 본 발명의 일 실시예에 따라 빅데이터를 분석하기 위한 전체 시스템의 개략적인 구성을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 서버의 내부 구성을 상세하게 도시하는 도면이다.
도 3a 내지 도 3b는 본 발명의 일 실시예에 따라 의료 정보의 비정형 데이터를 색인 처리하는 것을 예시적으로 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 의료정보 분석시스템을 예시적으로 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따라 의료 정보를 제공하기 위한 사용자 인터페이스를 예시적으로 나타내는 도면이다.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.

이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따라 빅데이터를 분석하기 위한 전체 시스템의 개략적인 구성을 나타내는 도면이다.

도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 전체 시스템은 사용자 단말(100), 서버(200) 및 저장 장치(300)를 포함하여 구성될 수 있다.

먼저, 본 발명의 일 실시예에 따른 사용자 단말(100)은, 서버(200)에 접속한 후 통신할 수 있는 기능을 포함하는 디지털 기기로서, 데스크탑 컴퓨터, 노트북 컴퓨터, 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기라면 얼마든지 본 발명에 따른 사용자 단말(100)로서 채택될 수 있다. 특히, 사용자 단말(100)에는 서버(200)가 제공하는 빅데이터를 검색하고 분석하기 위한 사용자 인터페이스를 제공 받을 수 있도록 하는 브라우저(browser) 관련 프로그램이 포함되어 있을 수 있다.

다음으로, 본 발명의 일 실시예에 따른 서버(200)는, 통신망을 통하여 사용자의 단말로부터 쿼리 입력이 획득되면, 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하고, 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 기능과 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 저장 장치(300)로부터 획득하여 사용자 단말(100)에 제공하는 기능을 수행할 수 있다. 여기서, 속성 정보는, 데이터 형식 또는 데이터 값일 수 있으며, 쿼리 입력은, 빅데이터에서 원하는 데이터를 찾기 위한 사용자의 입력이며, 다양한 형태로 발생할 수 있을 것이다. 가령, 특정 키워드를 포함하는 데이터를 찾기 위해 입력한 검색 키워드(문자열)일 수 있으며, 특정 범위에 속하는 데이터를 찾기 위해 범위를 한정하는 특정 템플릿을 선택하는 선택 입력일 수도 있을 것이다.

본 발명에 따른 서버(200)의 구성과 기능에 관하여는 아래의 상세한 설명을 통하여 자세하게 알아보기로 한다.

한편, 본 발명에 따른 저장 장치(300)에는 빅데이터 정보가 저장되며, 빅데이터 정보의 정형 데이터와 비정형 데이터는 서로 연관되어 저장되어 있을 수 있을 것이다. 또한, 서버(200)가 비정형 데이터를 대상으로 색인 처리하여 생성한 색인 데이터(제2 색인 데이터)와 사용자의 쿼리 입력을 색인 처리하여 생성한 색인 데이터(제1 색인 데이터)가 저장될 수도 있고, 사용자 단말(100)을 통해 입력되는 정보가 저장될 수도 있다.

도 1에는, 저장 장치(300)가 사용자 단말(100) 및 서버(200)와 연동하는 외부에 위치하는 것으로 도시하였지만, 저장 장치(300)는 물리적으로 서버(200)에 포함될 수도 있을 것이다.

도 2는 본 발명의 일 실시예에 따른 서버(200)의 내부 구성을 상세하게 도시하는 도면이다.

도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 서버(200)는 통신부(210) 및 프로세서(220)를 포함하여 구성될 수 있다. 여기서, 통신부(210) 및 프로세서(220)가 전부 서버(200)에 물리적으로 포함되어 있어야 하는 것은 아니며, 서버(200)와 연동하는 외부에 위치할 수도 있을 것이다.

본 발명의 일 실시예에 따른 프로세서(220)는, 저장 장치(300)에 포함된 비정형 데이터에 대한 색인 데이터(제2 색인 데이터)를 주기적으로 생성할 수도 있고, 저장 장치(300)에 새로운 비정형 데이터가 적재될 때마다 새로운 비정형 데이터의 색인 데이터를 생성할 수도 있다. 또한, 사용자의 쿼리 입력이 통신부(210)를 통해 획득되면 쿼리 입력에 대한 색인 데이터(제1 색인 데이터)를 생성할 수도 있다.

본 발명의 일 실시예에 따른 프로세서(220)는, 색인 데이터를 생성하기 위해 형태소 분석기 같은 자연어 처리 프로그램을 포함할 수 있으며, 특정 분야의 비정형 데이터를 대상으로 자연어 처리를 수행하기 위해 메타시소러스 같은 특정 분야의 개념(용어) 정보를 참조할 수도 있을 것이다. 가령, 빅데이터가 의료 정보인 경우, 프로세서(220)는, 색인 데이터(제1 색인 데이터 및 제2 색인 데이터 중 적어도 하나의 색인 데이터임)를 생성할 때 UMLS(Unified Medical Language System)를 참조하여 동일한 의미를 가지는 문자열(용어)을 서로 연계시켜 색인어를 생성할 수 있고, 이를 통해, 빅데이터를 분석하고자 하는 사용자는 검색 키워드에 구애받지 않고 원하는 데이터를 검색할 수 있다. 예를 들면, 사용자가 '항문 질환' 을 검색 키워드로 입력하면, 프로세서(220)가 'hemorrhoid',' 치질' 같이 '항문 질환' 과 연계되는 용어를 UMLS를 참조하여 획득한 후 색인 데이터(제1 색인 데이터)로 생성함으로써, '항문 질환', 'hemorrhoid',' 치질' 등을 색인 데이터로 가지는 모든 비정형 데이터를 추출하여 사용자에게 제공할 수도 있을 것이다.

또한, 본 발명의 일 실시예에 따른 프로세서(220)는, 사용자의 쿼리 입력에 대한 색인 데이터(제1 색인 데이터)와 속성 정보가 일치하는 비정형 데이터에 대한 색인 데이터(제2 색인 데이터)를 판단할 수 있으며, 본 발명의 일 실시예 따른 통신부(210)는, 색인 데이터의 속성 정보가 일치하는 비정형 데이터를 사용자 단말(100)로 전송함으로써 사용자가 검색하고자 하는 정보를 확인하도록 지원할 수 있다. 이 때, 통신부(210)는 비정형 데이터에 대응되는 정형 데이터를 함께 사용자 단말(100)로 전송할 수도 있을 것이다. 가령, 도 3a를 참조하여 설명하면, 환자의 의료 데이터(310) 중 진단결과나 검사결과는 구조화되지 않은 비정형 데이터(312)에 속하며, 환자명, 환자 번호, 성별, 나이, 도착시간, 질병구분, 진료과 등의 정보는 정형 데이터(311)에 속한다. 사용자가 '대장' 이라는 키워드를 입력하여 '대장' 이라는 텍스트 데이터를 포함한 비정형 데이터(312)를 검색하면, 비정형 데이터(진단결과)가 사용자에게 제공될 수 있으며, 이 때, 환자명, 성별, 진료과 등 정형 데이터도 사용자에게 같이 제공될 수도 있을 것이다.

만약, 사용자 단말(100)로부터 쿼리 입력이 발생하여 쿼리 입력에 따라 검색된 비정형 데이터를 사용자에게 제공한 후에 빅데이터에 포함된 정형 데이터 중 적어도 하나의 정형 데이터를 선택하는 입력이 통신부(210)를 통해 추가적으로 획득되면, 프로세서(220)는, 검색된 비정형 데이터 중에서 적어도 하나의 정형 데이터에 대응되는 비정형 데이터를 획득할 수 있으며, 이를 통신부(210)를 통해 사용자 단말(100)로 제공할 수 있을 것이다. 가령, 의사가 진료한 환자 중 'lung cancer(폐암)' 으로 진단받은 환자의 진료데이터를 필요로 하는 사용자가 쿼리 입력으로서 'lung cancer' 를 입력하여 진료데이터를 제공받은 상태에서 여성 환자의 데이터만 선택적으로 보기 위한 입력을 추가적으로 입력하면, 프로세서(220)는 제공된 진료데이터에 대응되는 성별 정보(정형 데이터)를 참조하여 여성 환자의 진료데이터만 추출하여 통신부(210)를 통해 사용자에게 제공할 수 있을 것이다.

이와 비슷하게, 정형 데이터를 선택하는 입력(제1 쿼리 입력)과 비정형 데이터에 포함된 텍스트 데이터를 검색하기 위한 입력(제2 쿼리 입력)이 같이 발생할 수도 있을 것이며, 이 때, 쿼리 입력은 제1 쿼리 입력 및 제2 쿼리 입력으로 구성될 수 있을 것이다. 만약, 제1 쿼리 입력이 제2 쿼리 입력보다 먼저 발생하면(즉, 정형 데이터를 선택한 후 비정형 데이터를 검색하는 키워드가 입력되면), 프로세서(220)는, 제2 색인 데이터 중 적어도 하나의 정형 데이터에 대응되는 비정형 데이터의 색인 데이터인 특정 제2 색인 데이터를 획득하여, 특정 제2 색인 데이터와 제2 쿼리 입력의 적어도 하나의 제1 색인 데이터의 속성 정보가 일치하는지 여부를 판단할 수 있을 것이다. 가령, 사용자가 '여성' 이라는 정형 데이터를 선택한 후 'lung cancer'를 입력하면, 프로세서(220)는, 여성 환자의 진료 데이터에 대응되는 색인 데이터(특정 제2 색인 데이터)만을 대상으로 하여 'lung cancer' 의 색인 데이터(제1 색인 데이터)와 속성 정보를 비교할 수 있을 것이다.

한편, 본 발명의 일 실시예에 따른 통신부(210)는, 비정형 데이터에 대한 분석 요청 입력이 사용자 단말(100)로부터 획득되면, 검색된 비정형 데이터(사용자가 입력한 쿼리 입력의 색인 데이터와 속성 정보가 일치하는 색인 데이터에 대응된 비정형 데이터)에 대한 적어도 하나의 통계 분석 결과를 프로세서(220)를 통해 획득한 후 사용자 단말(100)로 전송할 수 있다. 여기서, 통계 분석 결과는, 프로세서(220)가 비정형 데이터에 대응되는 정형 데이터를 참조로 하여 분석한 결과일 수 있으며, 이에 관하여는 도 5를 통해 자세히 설명하기로 한다.

또한, 통신부(210)는, 빅데이터에 포함된 정형 데이터 중 적어도 하나의 정형 데이터를 선택하는 입력이 사용자 단말(100)로부터 추가적으로 획득되면, 적어도 하나의 정형 데이터에 대응되는 비정형 데이터에 대한 적어도 하나의 통계 분석 결과를 프로세서(220)를 통해 획득한 후 사용자에게 제공할 수도 있을 것이다.

아래에서는, 도 3a 내지 도 3b, 도 4, 도 5를 참조하여 본 발명의 일 실시예로 의료 데이터를 분석하는 것을 설명한다.

도 3a 내지 도 3b는 본 발명의 일 실시예에 따라 의료 정보의 비정형 데이터를 색인 처리하는 것을 예시적으로 설명하기 위한 도면이다.

도 3a에는 전자적으로 기록된 환자의 의료 데이터(310)를 예시적으로 나타내었으며, 환자명, 환자 번호, 성별, 나이, 도착시간, 질병구분, 진료과 등의 정보는 정형 데이터(311)에 속하고, 진단결과나 검사결과는 구조화되지 않은 비정형 데이터(312)에 속한다.

본 발명에 따른 서버(200)는, 비정형 데이터(312)를 대상으로 하여 색인 데이터를 추출할 수 있으며, 이 때, 형태소 분석과 UMLS(국제의료사전)을 참조할 수 있을 것이다.

한편, 비정형 데이터(312)에 소정 패턴이 존재하는 경우, 서버(200)는, 비정형 데이터(312)가 포함되어 있는 기록 문서의 특정 부분을 참조로 하여, 특정 부분에 기재된 특정 비정형 데이터를 소정 패턴에 의해 분류하도록 지원할 수 있으며, 특정 부분에 기재된 특정 비정형 데이터를 소정 패턴에 의해 분류함에 있어서, 특정 비정형 데이터의 문자 및 숫자의 배열이 소정 패턴의 문자 및 숫자의 배열과 일치하는지 여부를 판단할 수 있을 것이다. 가령, 의료 데이터(310) 중 검사 결과는 소정 패턴에 의해 텍스트로 작성될 수 있는데, 도 3a에 도시한 비정형 데이터(312) 중 검사 결과에 나타낸 “Intact anal sphincter mm. 12h 3h 6h 9h int sphincter: 1.8mm 1.7mm 2.0mm 1.6mm Subepitheial space; 1.0mm 1.6mm 1.6mm 2.3mm” 는 항문괄약근 검사 결과를 정리한 것으로, “Intact anal sphincter mm. 12h 3h 6h 9h” 는 검사 방향을 뜻하고, “int sphincter: 1.8mm 1.7mm 2.0mm 1.6mm” 는 검사 방향에 따른 괄약근의 사이즈를 뜻하고, “Subepitheial space; 1.0mm 1.6mm 1.6mm 2.3mm” 는 검사 방향에 따른 상피하의 사이즈를 뜻하며, 각각이 패턴에 따라 작성된 것을 확인할 수 있다. 서버(200)는, 검사 결과의 특정 부분(도 3a에 나타낸 검사 결과 같이 소정의 패턴이 있는 부분)을 분류하여 사용자가 소정의 패턴에 따라 검색할 수 있도록 지원할 수 있을 것이다.

도 3b에는, 본 발명의 일 실시예에 따른 서버(200)가 저장 장치(300)에 포함된 의료 데이터 중 비정형 데이터에 대한 색인 데이터(제2 색인 데이터)를 생성하는 것을 예시적으로 나타내었다.

도 3b의 왼쪽에는, 환자 A의 의료 데이터(310a), 환자 B의 의료 데이터(310b) 등 복수의 EMR 의료 데이터가 존재하는 것을 예시적으로 나타내었으며, 도 3b의 오른쪽에는, 복수의 EMR 의료 데이터 중 비정형 데이터(312a, 312b 등)를 색인 처리하여 생성되는 색인 데이터(제2 색인 데이터)를 예시적으로 나타내었다. 구체적으로, 복수의 비정형 데이터에서 '항문','내시경','sphincter' 등의 색인어가 추출되면, 서버(200)는, EMR 의료 데이터와 EMR 의료 데이터에 대응되는 해당 색인어를 맵핑하여 저장할 수 있는데, 가령, EMR 의료 데이터의 특정 정형 데이터를 해당 색인어와 맵핑하여 저장할 수 있을 것이다. 즉, 도 3b에 나타낸 바와 같이, '항문','내시경','sphincter' 같은 색인어를 추출한 후 각각의 색인어를 포함하고 있는 의료 데이터를 가리키는 키 값(도 3b에는 환자 정보 A,B,C 등을 예시적으로 나타내었음)과 맵핑할 수 있을 것이다. 참고로, 설명의 편의를 위해 도 3b에서는 색인 데이터를 테이블 형태로 나타내었지만, 색인 데이터는 계층 구조, 트리 구조, 네트워크 구조 등 다양한 구조로 형성될 수 있다는 것은 당연하다 할 것이다.

이와 같이, 빅데이터에 포함된 정형 데이터의 적어도 일부가 키 값으로서 비정형 데이터의 색인 데이터와 맵핑되어 있는 상태에서, 사용자의 쿼리 입력의 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터가 추출되는 경우, 서버(200)는, 적어도 하나의 제2 색인 데이터의 키 값과 동일한 키 값을 갖는 적어도 하나의 비정형 데이터를 사용자 단말(100)로 제공할 수 있을 것이다.

도 4는 본 발명의 일 실시예에 따른 의료정보 분석시스템을 예시적으로 나타낸 도면이다.

도 4를 참조하면, 본 발명의 일 실시예에 따른 의료정보 분석시스템은 의료데이터(EMR, 검사결과), 데이터웨어하우스(DW), 검색엔진(Lucene), 분석엔진(QlickView, R분석엔진)으로 구성될 수 있는데, 의료데이터 및 데이터웨어하우스는 저장 장치(300)에 대응되고, 검색엔진 및 분석엔진이 서버(200)에 대응될 수 있을 것이다. 여기서, 의료데이터, 데이터웨어하우스, 검색엔진, 분석엔진 중 적어도 일부는 프로그램 모듈일 수 있으며, 이러한 프로그램 모듈은 운영 시스템, 응용 프로그램 모듈 또는 기타 프로그램 모듈의 형태로 의료정보 분석시스템에 포함될 수 있고, 물리적으로는 여러 가지 공지의 기억 장치에 저장될 수도 있다.　또한, 이러한 프로그램 모듈은 의료정보 분석시스템과 통신 가능한 원격 기억 장치에 저장될 수도 있다.　한편, 이러한 프로그램 모듈은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.

본 발명의 일 실시예에 따른 의료정보 분석시스템의 프로세스를 개략적으로 설명하면, 분석엔진은 주기적으로 의료 데이터를 데이터웨어하우스에 로드시킬 수 있으며, 검색엔진은 데이터웨어하우스의 비정형 데이터를 대상으로 주기적으로 색인 처리를 수행할 수 있다. 사용자 단말(100)로부터 쿼리 입력이 발생하면, 검색 엔진은, 쿼리 입력에 대응하는 비정형 데이터를 추출할 수 있으며, 추출한 비정형 데이터에 맵핑되어 있는 키 값을 분석엔진에게 전달할 수 있을 것이다. 키 값을 전달받은 분석엔진은 키 값을 이용하여 데이터웨어하우스에 저장된 의료 데이터를 획득한 후 사용자에게 제공할 수 있으며, 사용자 단말(100)로부터 분석 요청 입력이 발생하면, 분석 엔진은 추출한 비정형 데이터를 대상으로 통계 분석한 결과를 사용자에게 제공할 수 있을 것이다.

도 5는 본 발명의 일 실시예에 따라 의료 정보를 제공하기 위한 사용자 인터페이스를 예시적으로 나타내는 도면이다.

도 5를 참조하면, 본 발명의 일 실시예에 따른 의료 정보를 제공하는 사용자 인터페이스에는, 정형 데이터를 선택할 수 있는 데이터 필드 선택 템플릿(511a, 511b), 비정형 데이터를 검색할 수 있는 검색 템플릿(512), 검색된 비정형 데이터를 출력하는 출력 템플릿(520) 및 분석 결과를 제공하는 분석 템플릿(530)이 포함될 수 있다.

본 발명의 일 실시예에 따르면, 사용자는 검색 템플릿(512)에 키워드를 입력하여 원하는 의료 데이터를 검색할 수 있는데, 가령, '진단결과' 필드를 선택한 후 'lung'을 키워드로 입력하면, 출력 템플릿(520)에는 'lung'이라는 문자열을 포함하는 진단결과가 출력될 수 있다. 이 때, 진단결과뿐만 아니라 검사결과, 환자 아이디, 진료일 등 검색된 진단결과에 대응되는 정보가 같이 출력될 수 있을 것이다. 한편, 사용자는 데이터 필드 선택 템플릿(511a, 511b)을 이용하여 검색하고자 하는 의료 데이터의 범위를 선택할 수도 있는데, 가령, 데이터 필드 선택 템플릿(511a)에서 수진 년도로 '2011'을 선택하면, 2011년에 수진된 의료 데이터를 대상으로만 검색을 수행할 수 있을 것이다. 또한, 사용자는 출력 템플릿(520)의 오른쪽 상단에 있는 선택분석 또는 전체분석 템플릿을 선택함으로써, 검색한 의료 데이터의 분석 결과를 분석 템플릿(530)을 통해 확인할 수 있을 것이다.

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

100: 사용자 단말
200: 서버
300: 저장 장치

Claims

빅데이터의 분석 결과를 제공하기 위한 방법으로서,
(a) 쿼리 입력이 사용자 단말로부터 발생하면, 서버는, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하는 단계;
(b) 상기 서버가, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 단계;
(c) 상기 서버가, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말을 통해 상기 사용자에게 제공하는 단계; 및
(d) 상기 적어도 하나의 비정형 데이터에 대한 분석 요청 입력이 발생하면, 상기 서버는, 상기 적어도 하나의 비정형 데이터에 대한 적어도 하나의 통계 분석 결과를 상기 사용자 단말을 통해 상기 사용자에게 제공하는 단계;
를 포함하는 방법.
삭제
제1항에 있어서,
상기 적어도 하나의 통계 분석 결과는, 상기 서버가, 상기 적어도 하나의 비정형 데이터에 대응되는 정형 데이터를 참조로 하여 분석한 결과인 것을 특징으로 하는 방법.
빅데이터의 분석 결과를 제공하기 위한 방법으로서,
(a) 쿼리 입력이 사용자 단말로부터 발생하면, 서버는, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하는 단계;
(b) 상기 서버가, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 단계;
(c) 상기 서버가, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말을 통해 상기 사용자에게 제공하는 단계;
를 포함하되,
(e) 상기 빅데이터에 포함된 정형 데이터 중 적어도 하나의 정형 데이터를 선택하는 입력이 상기 사용자 단말로부터 발생하면, 상기 서버는, 상기 적어도 하나의 정형 데이터에 대응되는 비정형 데이터에 대한 적어도 하나의 통계 분석 결과를 상기 사용자 단말을 통해 사용자에게 제공하는 것을 특징으로 하는 방법.
빅데이터의 분석 결과를 제공하기 위한 방법으로서,
(a) 쿼리 입력이 사용자 단말로부터 발생하면, 서버는, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하는 단계;
(b) 상기 서버가, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 단계;
(c) 상기 서버가, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말을 통해 상기 사용자에게 제공하는 단계;
를 포함하되,
상기 쿼리 입력은 제1 쿼리 입력 및 제2 쿼리 입력으로 구성되며, 상기 빅데이터에 포함된 정형 데이터 중 적어도 하나의 정형 데이터를 선택하는 입력을 제1 쿼리 입력이라 하고, 상기 비정형 데이터에 포함된 텍스트 데이터를 검색하기 위한 입력을 제2 쿼리 입력이라고 할 때, 상기 제1 쿼리 입력이 상기 제2 쿼리 입력보다 먼저 발생하면,
상기 서버는, 상기 제2 색인 데이터 중 상기 적어도 하나의 정형 데이터에 대응되는 상기 비정형 데이터의 색인 데이터인 특정 제2 색인 데이터를 획득하여, 상기 특정 제2 색인 데이터와 상기 제2 쿼리 입력의 적어도 하나의 제1 색인 데이터의 속성 정보가 일치하는지 여부를 판단하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 빅데이터가 의료 정보인 경우, 상기 서버는, 상기 제1 색인 데이터 및 상기 제2 색인 데이터 중 적어도 하나의 색인 데이터를 생성할 때 UMLS(Unified Medical Language System)를 참조하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 서버는, 상기 비정형 데이터가 포함되어 있는 기록 문서의 특정 부분을 참조로 하여, 상기 특정 부분에 기재된 특정 비정형 데이터를 소정 패턴에 의해 분류하도록 지원하는 것을 특징으로 하는 방법.
제7항에 있어서,
상기 특정 부분에 기재된 상기 특정 비정형 데이터를 상기 소정 패턴에 의해 분류함에 있어서, 상기 특정 비정형 데이터의 문자 및 숫자의 배열이 상기 소정 패턴의 문자 및 숫자의 배열과 일치하는지 여부를 판단하는 것을 특징으로 하는 방법.
빅데이터의 분석 결과를 제공하기 위한 방법으로서,
(a) 쿼리 입력이 사용자 단말로부터 발생하면, 서버는, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하는 단계;
(b) 상기 서버가, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 단계;
(c) 상기 서버가, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말을 통해 상기 사용자에게 제공하는 단계;
를 포함하되,
상기 빅데이터에 포함된 정형 데이터의 적어도 일부가 키 값으로서 상기 제2 색인 데이터 또는 상기 비정형 데이터 각각에 맵핑되어 있는 상태에서, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 상기 적어도 하나의 제2 색인 데이터가 추출되는 경우, 상기 서버는, 상기 적어도 하나의 제2 색인 데이터의 상기 키 값과 동일한 상기 키 값을 갖는 상기 적어도 하나의 비정형 데이터를 획득하여 상기 사용자에게 제공하는 것을 특징으로 하는 방법.
빅데이터의 분석 결과를 제공하기 위한 서버로서,
통신부;
쿼리 입력이 상기 통신부를 통해 사용자 단말로부터 획득되면, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하고, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 프로세서를 포함하되,
상기 통신부는, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말에 제공하고, 상기 적어도 하나의 비정형 데이터에 대한 분석 요청 입력이 상기 사용자 단말로부터 획득되면, 상기 적어도 하나의 비정형 데이터에 대한 적어도 하나의 통계 분석 결과를 상기 프로세서를 통해 획득한 후 상기 사용자에게 제공하는 것을 특징으로 하는 서버.
삭제
제10항에 있어서,
상기 적어도 하나의 통계 분석 결과는, 상기 프로세서가, 상기 적어도 하나의 비정형 데이터에 대응되는 정형 데이터를 참조로 하여 분석한 결과인 것을 특징으로 하는 서버.
빅데이터의 분석 결과를 제공하기 위한 서버로서,
통신부;
쿼리 입력이 상기 통신부를 통해 사용자 단말로부터 획득되면, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하고, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 프로세서를 포함하되,
상기 통신부는, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말에 제공하고, 상기 빅데이터에 포함된 정형 데이터 중 적어도 하나의 정형 데이터를 선택하는 입력이 상기 사용자 단말로부터 추가적으로 획득되면, 상기 적어도 하나의 정형 데이터에 대응되는 비정형 데이터에 대한 적어도 하나의 통계 분석 결과를 상기 프로세서를 통해 획득한 후 사용자에게 제공하는 것을 특징으로 하는 서버.
빅데이터의 분석 결과를 제공하기 위한 서버로서,
통신부;
쿼리 입력이 상기 통신부를 통해 사용자 단말로부터 획득되면, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하고, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 프로세서를 포함하되,
상기 통신부는, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말에 제공하고,
상기 쿼리 입력은 제1 쿼리 입력 및 제2 쿼리 입력으로 구성되며, 상기 빅데이터에 포함된 정형 데이터 중 적어도 하나의 정형 데이터를 선택하는 입력을 제1 쿼리 입력이라 하고, 상기 비정형 데이터에 포함된 텍스트 데이터를 검색하기 위한 입력을 제2 쿼리 입력이라고 할 때, 상기 제1 쿼리 입력이 상기 제2 쿼리 입력보다 먼저 발생하면,
상기 프로세서는, 상기 제2 색인 데이터 중 상기 적어도 하나의 정형 데이터에 대응되는 상기 비정형 데이터의 색인 데이터인 특정 제2 색인 데이터를 획득하여, 상기 특정 제2 색인 데이터와 상기 제2 쿼리 입력의 적어도 하나의 제1 색인 데이터의 속성 정보가 일치하는지 여부를 판단하는 것을 특징으로 하는 서버.
제10항에 있어서,
상기 빅데이터가 의료 정보인 경우, 상기 프로세서는, 상기 제1 색인 데이터 및 상기 제2 색인 데이터 중 적어도 하나의 색인 데이터를 생성할 때 UMLS(Unified Medical Language System)를 참조하는 것을 특징으로 하는 서버.
제10항에 있어서,
상기 프로세서는, 상기 비정형 데이터가 포함되어 있는 기록 문서의 특정 부분을 참조로 하여, 상기 특정 부분에 기재된 특정 비정형 데이터를 소정 패턴에 의해 분류하도록 지원하는 것을 특징으로 하는 서버.
제16항에 있어서,
상기 특정 부분에 기재된 상기 특정 비정형 데이터를 상기 소정 패턴에 의해 분류함에 있어서, 상기 특정 비정형 데이터의 문자 및 숫자의 배열이 상기 소정 패턴의 문자 및 숫자의 배열과 일치하는지 여부를 판단하는 것을 특징으로 하는 서버.
빅데이터의 분석 결과를 제공하기 위한 서버로서,
통신부;
쿼리 입력이 상기 통신부를 통해 사용자 단말로부터 획득되면, 상기 쿼리 입력에 대한 적어도 하나의 제1 색인 데이터를 생성하고, 상기 빅데이터에 포함된 비정형 데이터를 대상으로 색인 처리함으로써 생성되는 제2 색인 데이터를 참조로 하여, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 적어도 하나의 제2 색인 데이터를 판단하는 프로세서를 포함하되,
상기 통신부는, 상기 적어도 하나의 제2 색인 데이터에 대응되는 적어도 하나의 비정형 데이터를 상기 사용자 단말에 제공하고,
상기 빅데이터에 포함된 정형 데이터의 적어도 일부가 키 값으로서 상기 제2 색인 데이터와 상기 비정형 데이터 각각에 맵핑되어 있는 상태에서, 상기 적어도 하나의 제1 색인 데이터와 속성 정보가 일치하는 상기 적어도 하나의 제2 색인 데이터가 추출되는 경우, 상기 통신부는, 상기 적어도 하나의 제2 색인 데이터의 상기 키 값과 동일한 상기 키 값을 갖는 상기 적어도 하나의 비정형 데이터를 상기 프로세서를 통해 획득한 후 상기 사용자에게 제공하는 것을 특징으로 하는 서버.