KR102183815B1 - 데이터 관리 시스템 및 데이터 관리 방법 - Google Patents

데이터 관리 시스템 및 데이터 관리 방법 Download PDF

Info

Publication number
KR102183815B1
KR102183815B1 KR1020190017804A KR20190017804A KR102183815B1 KR 102183815 B1 KR102183815 B1 KR 102183815B1 KR 1020190017804 A KR1020190017804 A KR 1020190017804A KR 20190017804 A KR20190017804 A KR 20190017804A KR 102183815 B1 KR102183815 B1 KR 102183815B1
Authority
KR
South Korea
Prior art keywords
tag
input data
data
text
assigning
Prior art date
Application number
KR1020190017804A
Other languages
English (en)
Other versions
KR20200099771A (ko
Inventor
정인호
Original Assignee
리걸테크 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 리걸테크 주식회사 filed Critical 리걸테크 주식회사
Priority to KR1020190017804A priority Critical patent/KR102183815B1/ko
Publication of KR20200099771A publication Critical patent/KR20200099771A/ko
Application granted granted Critical
Publication of KR102183815B1 publication Critical patent/KR102183815B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Abstract

본 발명은 입력 데이터를 구성하는 텍스트나 태그를 저장하고, 입력 데이터를 분석 등에 필요한 텍스트를 정확히 참조할 수 있는 데이터 관리 시스템 및 데이터 관리 방법을 제공하기 위한 것이다. 본 발명은 데이터 관리 시스템을 제공하는 서비스 서버(1)는 API를 갖추고, 서비스 서버에서는 API를 이용한 클라이언트 측의 단말(2)에서 입력 데이터를 수신하는 구성이며, 수신된 입력 데이터에서 소정의 검색 조건에 따라 텍스트를 추출하고, 추출된 각 텍스트에 대해 소정의 부여조건에 따라 태그를 부여하는 부여수단과, 태그가 부여된 입력 데이터를 복수의 저장수단(5)에 저장하는 저장수단과, 복수의 저장수단에 저장된 입력 데이터를 부여수단에 의해 부여된 태그와 함께 사용자 단말로 참조할 수 있게 출력할 수 있는 출력수단을 포함한다.

Description

데이터 관리 시스템 및 데이터 관리 방법{Data Management System and Data Management Method}
본 발명은 입력 데이터를 분석 가능한 저장 데이터 관리 시스템 및 데이터 관리 방법에 관한 것이다.
종래부터 다양한 업종에서 서비스 제공자와 피 제공자 간에 상호 작용, 예를 들어 의료 기관에서 개인의 의료 기록이, 금융 기관은 고객의 거래 내역이, 법률관계 기관에서는 판례 등이 관리 되고 있다. 이러한 관리 자료는 나중에 참조할 수 있게 관리되고 있으며, 개인 단위와 사건 단위로 기록 조회 및 비교에 사용되며, 이후의 진찰이나 거래, 재판 등에 유용하게 사용되고 있다. 최근에는 이러한 관리 자료는 컴퓨터 등으로 입력하여 전자 데이터화시켜 서버 등의 기록매체에 저장되고 있다.
또한, 최근에는 컴퓨터의 처리 능력 향상에 따라 대량의 입력 데이터를 포괄적으로 분석하는데, 예를 들어 사업자가 보유하고 있는 모든 기존 입력 데이터에서, 소비 경향이나 질병 추이 등의 유익한 지식을 얻는 소위 데이터 분석이 주목받고 있다. 예를 들어, 특허문헌1(일본 특허공개공보 특개2003-196471호)은 입력 데이터에 소정의 규칙으로 구분된 텍스트에 태그를 추가한 상태에서 기록매체에 저장해 두었다가 나중에 임의의 태그를 여러 개 선택하는 것으로, 저장한 대량의 입력 데이터가 전체적으로 분석되어 선택한 여러 태그에 대한 정보를 추출할 수 있도록 하는 것이 제안되어 있다.
특허문헌1과 같이, 나중에 분석된 유익한 지식을 얻기 위해 관리되는 데이터는 주로 일상 업무에서 복수의 담당자에 의해 이용되는 거래 정보 등이기 때문에 정정이나 보충을 위해 내용을 편집하는 경우가 있다. 그러나 내용의 편집이 이루어진 후 덮어씌워 버리면 내부의 정보가 입력 데이터의 작성 당시의 내용과 다른 것이 되어 버려, 정확한 데이터 분석에 사용할 수 없는 경우가 있다. 한편, 입력 데이터의 편집을 제한하는 것을 생각할 수도 있지만, 편집 제한을 설정하는 것 같은 보안 기능을 이용하면 데이터 분석 시 참조가 어려워질 우려가 있었다. 또한, 데이터를 등록, 마이닝 하기 위한 컴퓨터를 이용한 환경은 전문 지식을 가진 자에 의해 구축되어 있다.
일본 특허공개공보 특개2003-196471호
따라서 본 발명은 상기와 같은 문제점을 해결하기 위해 안출한 것으로서, 입력 데이터를 구성하는 텍스트나 태그를 저장하고, 입력 데이터의 분석 등에 필요한 텍스트를 정확하게 참조할 수 있는 데이터 관리 시스템 및 데이터 관리 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 데이터 관리 시스템은 데이터 관리 시스템을 제공하는 서비스 서버 API를 갖추고, 상기 서비스 서버는 상기 API를 사용하여 클라이언트 단말로부터 입력 데이터를 수신하는 구성이고, 상기 수신된 입력 데이터로부터 소정의 검색 조건에 따라 텍스트를 추출하고 추출된 각 텍스트에 대하여 소저의 부여조건에 따라 태그를 부여하는 부여수단과, 상기 태그가 부여되는 입력 데이터를 복수의 저장수단에 저장하는 저장지시수단과, 상기 복수의 저장수단에 저장되는 입력 데이터를 상기 부여수단에 부여되는 태그와 함께 사용자 단위로 참조할 수 있도록 출력되는 출력수단을 포함한다.
바람직하게 상기 서비스 서버는 상기 저장지시수단에서 상기 태그가 부여된 입력 데이터를 블록체인에 저장시키는 것을 특징으로 한다.
바람직하게 상기 서비스 서버는 상기 태그와 상기 태그가 의미하는 항목정보가 연결된 대응표를 구비하고, 상기 출력수단은 상기 대응표를 이용하여 상기 태그의 의미 항목정보를 출력하는 것을 특징으로 한다.
바람직하게 상기 부여수단은 소정의 변환 규칙에 따라 함수로 변환한 태그를 상기 입력 데이터에 부여하고, 상기 출력수단은 상기 소정의 변환 규칙에 따라 변환된 태그를 복원하여 출력하는 것이 가능한 것을 특징으로 한다.
바람직하게 상기 소정의 변환 규칙은 상기 입력 데이터마다 각각 설정 가능한 것을 특징으로 한다.
바람직하게 상기 부여수단은 상기 입력 데이터 하나의 텍스트에 대해 각 입력 데이터에 공통 태그를 부여하는 것이 가능한 것을 특징으로 한다.
바람직하게 상기 부여수단은 상기 출력수단에 의해 출력된 태그가 부여된 입력 데이터를 복원하고, 소정의 검색 조건에 기반한 텍스트를 추출하고, 추출된 각 텍스트에 대해 소정의 부여조건에 기반하여 태그의 재부여가 가능하고, 상기 저장수단은 상기 재부여 태그가 부여된 입력 데이터를 상기 블록체인에서 현재 블록의 마지막에 연결하여 저장하는 것을 특징으로 한다.
바람직하게 상기 태그의 부여조건은 변경이 가능하며, 상기 저장지시수단은 변경 전의 태그의 부여조건과 변경 후 태그의 부여조건의 대응관계를 나타내는 데이터를 상기 복수의 저장수단에 저장지시 하는 것을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 데이터 관리 방법은 API를 사용하여 클라이언트 단말기로부터 입력 데이터를 수신하는 단계와, 상기 수신된 입력 데이터로부터 소정의 검색 조건에 따른 텍스트를 추출하고, 상기 추출된 각 텍스트에 대한 소정의 부여조건에 따른 태그를 부여하는 단계와, 상기 태그 부여된 입력 데이터를 복수의 저장수단에 저장하는 단계와, 상기 복수의 저장수단에 저장된 입력 데이터를 전술한 부여수단에 의해 부여된 태그와 함께 사용자 단위로 참조할 수 있게 출력하는 단계를 포함한다.
이상에서 설명한 바와 같은 본 발명에 따른 데이터 관리 시스템 및 데이터 관리 방법은 다음과 같은 효과가 있다.
첫째, 태그가 부여된 입력 데이터는 블록체인에 저장되므로 태그가 부여된 입력 데이터의 편집을 할 수 없으며, 보안 기능이 뛰어나다. 또한 입력 데이터의 작성 당시의 내용을 분석에 사용할 수 있으며, 사업 활동에 유용한 지식을 정확하게 얻을 수 있다. 또한 이러한 데이터 관리 시스템을 블록체인의 지식을 가지지 않은 사용자도 쉽게 사용할 수 있게 된다.
둘째, 서비스 서버가 준비된 대응표를 이용하지 않으면 저장매체에 저장된 입력 데이터에 부여된 태그의 의미를 한눈에 파악할 수 없는 것이 되어 분석할 수 있는 정보의 유출을 막을 수 있다.
셋째, 입력 데이터를 입력한 사용자가 개별적으로 소정의 변환 규칙을 설정할 수 있으므로, 분석 가능한 정보의 유출을 막을 수 있다.
넷째, 서로 다른 입력 데이터 간에 서로 공통되는 하나의 텍스트를 이용하여 분석에 사용할 수 있다.
다섯째, 이전에 저장한 입력 데이터를 편집 또는 파기하지 않고, 태그를 부여해 정정하는 것이 되어 정확한 분석이 가능해진다.
여섯째, 구분된 텍스트와 유사한 속성에 대해 부여된 태그가 시기나 담당자에 따라 다른 경우가 있을 때도, 비슷한 속성으로써 분석에 이용하는 것이 가능하다.
일곱째, API를 사용하여 클라이언트로부터 수신된 입력 데이터에 대하여 소정의 검색 조건을 기반으로 텍스트 추출 및 소정의 부여조건에 따른 태그를 부여하기 위해, 관계 데이터베이스 같은 기존 태그의 부여조건에서 적절하게 분류할 수 없는 텍스트에 대해서도 적절한 분류 태그를 설정하여 부여할 수 있다. 따라서 이 데이터 관리 방법을 사용함으로써, 입력 데이터의 분석 등에 필요한 텍스트를 정확하게 참조할 수 있다. 또한 태그가 부여된 입력 데이터는 저장지시에 따라 여러 저장수단에 저장되는 동시에 입력 데이터의 분석 등에서는 사용자 단위로 참조할 수 있게 출력되므로, 여러 저장수단을 이용하여 내결함성이 뛰어난 시스템을, 이러한 시스템의 지식을 가지지 않은 사용자도 쉽게 이용할 수 있는 환경을 API를 통해 실현할 수 있다.
도 1은 본 발명의 실시예에 있어서 데이터 관리 시스템 및 데이터 관리 방법을 나타내는 개념도이다.
도 2는 도 1의 API 서버에서 제공되는 컴퓨터에 표시되는 초기 화면을 나타낸 도면이다.
도 3은 도 1의 API 서버에서 제공되는 컴퓨터에 표시되는 사용자 페이지를 나타낸 도면이다.
도 4는 도 1의 API 서버에서 제공되는 컴퓨터에 표시되는 데이터 입력 페이지를 나타낸 도면이다.
도 5는 도 1에서 변환 전의 진료기록을 나타낸 도면이다.
도 6은 도 1에서 태그 부여가 완료된 XML 형식의 파일을 나타낸 도면이다.
도 7은 도 1에서 태그가 함수화된 상태의 XML 형식의 파일을 나타낸 도면이다.
도 8은 도 1에서 출력 시 중요도 부여화면을 나타낸 일 실시예이다.
본 발명의 다른 목적, 특성 및 이점들은 첨부한 도면을 참조한 실시예들의 상세한 설명을 통해 명백해질 것이다.
본 발명에 따른 데이터 관리 시스템 및 데이터 관리 방법의 바람직한 실시예에 대하여 첨부한 도면을 참조하여 설명하면 다음과 같다. 그러나 본 발명은 이하에서 개시되는 실시예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예는 본 발명의 개시가 완전하도록하며 통상의 지식을 가진자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
도 1은 본 발명의 실시예에 있어서 데이터 관리 시스템 및 데이터 관리 방법을 나타내는 개념도이다. 그리고 도 2는 도 1의 API 서버에서 제공되는 컴퓨터에 표시되는 초기 화면을 나타낸 도면이다. 도 3은 도 1의 API 서버에서 제공되는 컴퓨터에 표시되는 사용자 페이지를 나타낸 도면이다. 도 4는 도 1의 API 서버에서 제공되는 컴퓨터에 표시되는 데이터 입력 페이지를 나타낸 도면이다. 도 5는 도 1에서 변환 전의 진료기록을 나타낸 도면이다. 도 6은 도 1에서 태그 부여가 완료된 XML 형식의 파일을 나타낸 도면이다. 도 7은 도 1에서 태그가 함수화된 상태의 XML 형식의 파일을 나타낸 도면이다. 도 8은 도 1에서 출력 시 중요도 부여화면을 나타낸 일 실시예이다.
도 1 내지 도 8을 참조하여 실시예에 따른 데이터 관리 시스템 및 데이터 관리 방법을 설명한다.
데이터 관리 시스템은, 다양한 업종에서 서비스 제공자와 피제공자간의 교환, 예를 들면 의료 기관에서는 개인의 진료기록이, 금융 기관에서는 고객의 입출력내역이, 법률관계 기관에서는 판례 등이 전자 데이터화하여 나중에 참조할 수 있도록 서버로 관리하고 있다.
본 발명의 실시예에서는, 의료 기관의 의료 기록을 병원 단위로 관리하는 것을 예로 설명한다.
도 1은 본 발명의 실시예에 있어서 데이터 관리 시스템 및 데이터 관리 방법을 나타내는 개념도이다.
도 1에서 도시하고 있는 것과 같이, 본 발명의 데이터 관리 시스템은 관리 회사(관리자)가 데이터 관리 시스템을 제공하기 위한 서비스 서버(1), 클라이언트 및 출력수단으로 개인용 컴퓨터(이하 “PC”로 칭함)(2)를 구비하고, 인터넷을 통해 상호 통신할 수 있게 연결되어 있다. 이때, PC(2)는 입력 수단으로서, 스캐너(3), 키보드(4), 마우스(5) 등이 접속되어 있다. 그 외, 입력 수단으로 펜 태블릿과 스타일러스펜 등도 이용할 수 있다.
그리고 상기 PC(2)는 하드 디스크 등의 기록수단이 생략되어 있고, RAM 등이 더해져, 전자화 처리부를 이루고 있다. 스캐너(3)에 의해 이미지화된 종이 매체의 관리서류는 전자화 처리부에 기재되어 있는 문자정보가 문자인식되어, 문자정보가 텍스트 데이터로 변환된다.
상기 서비스 서버(1)는 후술하는 블록체인 동작 환경인 복수의 컴퓨터(기록수단)(6)와, API(Application Program Interface) 서버(기록수단)(7)와, 이용관리서버(기록수단)(8)와, 처리서버(기록수단)(9)가 네트워크로 접속되어 구성되어 있으며, 클라이언트 측 PC(2)에서 관리서류의 텍스트 데이터로 입력 데이터를 수신하고, 이 입력 데이터를 관리한다.
본 실시예에 있어서, 데이터 관리 시스템으로, 입력 데이터는 블록체인의 기술을 이용하여 저장된다. 서비스 서버(1)를 구성하는 복수의 컴퓨터(6)는 블록체인의 블록을 생성하는 복수의 노드이다.
API 서버(7)는 데이터 관리 시스템을 제공하는 관리 회사가 운영하는 서버로써, 클라이언트 측의 PC(2)에서 수신되는 입력 데이터를 블록체인 상에 저장하는 데 필요한 데이터의 변환이나, 후술할 태그의 부여를 블록체인에 대한 지식이 없는 클라이언트에게도 간단히 사용할 수 있도록 API를 제공하는 인터넷상의 서버이다. 또한, AP 서버(7)에서 구현되어 동작하는 API는 클라이언트 측의 PC(2)에서 기동되는 웹브라우저에서 동작한다.
데이터 관리 시스템을 이용하는 사용자는, 데이터 관리 시스템의 관리 회사가 공개하는 홈페이지로써, 미리 고유의 사용자 ID와 패스워드를 등록해 둔다. 이용자 관리서버(8)는 홈페이지에 입력된 사용자 ID와 패스워드와, 해당 사용자의 ID에 할당된 블록체인 링크 정보와 대응관계를 보유하는 대응 테이블을 갖추고 있다.
사용자가 데이터 관리 시스템에 입력 데이터를 입력할 때에는, 먼저 PC(2)에서 기동한 웹브라우저를 사용하여 관리 회사가 공개한 홈페이지를 방문한다. 도 2에서 나타낸 바와 같이, 홈페이지의 초기화면(10)에는 사용자 ID의 입력란(11)과, 패스워드 입력란(12)과, 로그인 버튼(13)이 표시되고, 접속한 사용자에 대해 사용자 ID와 패스워드가 요구된다.
사용자는 이 사용자 ID 입력단(11)과 패스워드 입력란(12)에 입력하고, 로그인 버튼(13)을 선택한다. 로그인 버튼(13)이 선택되면, 입력된 사용자 ID와 패스워드는 도 1에서 도시된 사용자 관리서버(8)에 보내 입력된 사용자 ID와 패스워드의 조합이 대응 테이블을 참조하여 올바르다고 판단되면, 도 3에 나타낸 사용자 페이지(14)가 표시된다.
사용자 페이지(14)에서는 데이터 입력버튼(15)과 데이터 참조버튼(16)이 선택할 수 있게 표시되어 있다. 사용자는 새로운 진료기록의 전자 데이터를 업로드 할 때에는 데이터 입력버튼(15)을 선택하고, 기존에 관리되고 있는 진료기록의 전자 데이터를 참조할 때는 데이터 참조버튼(16)을 선택한다.
데이터 입력버튼(15)이 선택되면, 도 4에서 도시하고 있는 데이터 입력 페이지(17)가 표시된다. 데이터 입력 페이지(17)에서는 파일 선택버튼(18)과 업로드 버튼(19)이 표시되어 있다. 사용자가 파일 선택버튼(18)을 선택하면 클라이언트 측의 PC(2)에서 저장매체에 저장된 진료기록의 전자 데이터를 선택할 수 있는 윈도우가 표시된다. 그리고 사용자가 업로드 버튼(19)을 선택하면 해당 선택된 진료기록의 전자 데이터가 도 1에서 도시하고 있는 API 서버(7)의 API를 통해 처리 서버(9)로 전송된다.
처리 서버(9)에서는 진료기록의 전자 데이터를 파일형식 등에 따라 전체 검색 가능한 텍스트 데이터 여부를 판별한다. 텍스트 데이터이면, 다음의 태그를 부여하는 단계(부여수단)로 이동하고, 텍스트 데이터가 아니라면, 클라이언트 측 PC(2)에 에러를 반환한다. 즉, 사용자는 업로드 시에 전문검색 가능한 텍스트 데이터를 준비하게 된다.
태그를 부여하는 단계에서, 먼저 API가 가진 검색 기능을 통해 텍스트 데이터가 전문 검색된다. 태그를 부여하는 단계에서는 미리 설정한 소정의 부여조건에서 명사 등의 문자 데이터(예를 들어, 항목명에 있는 입력)을 텍스트 데이터에서 발견하여, 태그를 부여하여 XL 형식의 파일로 변환한다.
변환된 후의 XML 형식의 파일에서 각 태그는 소정의 변수로 함수화된다. 도 5는 XML 형식의 파일에 변환된 이전 진료기록의 전자 데이터고, 도 6은 진료기록 데이터가 변환된 XML 형식의 파일에서 부여된 각 태그를 함수에서 시각적으로 단어를 판별할 수 있게 복원한 것이다.
예를 들어, 도 5의 진료기록 전자 데이터에서 항목을 나타내는 “병력”이라는 단어의 문자 데이터와, 이 “병력”이라는 단의 근접 단어인 “독감”과 “맹장염”이라는 문자 데이터가 발견된다면, “독감”과 “맹장염” 같은 것이 “병력”에 해당하는 것으로 판단한다. 그리고 도 6의 XML 형식의 파일에서 <병력>과 </병력> 사이에 “독감”과 “맹장염”의 문자 데이터를 각각 배치한다.
이와 같이, “병력”, “독감”, “맹장염” 등의 단어를 인식하는 것으로, 이러한 “독감”, “맹장염”이 “병력”에 대응하는 것은 소정의 태그 부여조건으로 미리 관리 회사와 사용자로 처리 서버(9)에 설정되어 있다.
또한, 본 실시예에서 API는 태그 부여조건으로 “독감”이라는 문자 데이터가 “호흡기”의 질환이며, “맹장염”이라는 문자 데이터가 “순환기”의 질환으로써 판정하는 것이 가능한 부여조건도 갖추고 있다. 그리고 XML 형식의 파일에서 “독감”을 <호흡기>와 </호흡기> 태그에 넣고, “맹장염”을 <순환기>와 </순환기> 태그에 각각 배치한다. 즉, “독감”이라는 문자 데이터는 하위의 서브 태그로서 <호흡기>, </호흡기>의 태그와 상위의 메인 태그로써 <병력>, </병력>이라는 태그가 부여되고, 이러한 여러 태그가 계층으로 나뉘어 판정 가능해지고 있다. 또한 하나의 문자 데이터에 여러 태그가 부여될 수 있다. 예를 들어, “독감”이라는 문자열에 “호흡기”와 “바이러스”라는 2개의 태그가 부여될 수 있다.
처리 서버(9)는 태그를 부여하는 단계가 완료되면, 태그 부여가 완료된 XML 형식의 파일을 저장하는 단계(저장지시수단)로 옮긴다. 이때, 각 태그는 데이터 관리 시스템을 제공하는 소정의 처리 서버(9)에 따라 소정의 변수로 함수화되어 있다. 저장하는 단계는 태그 부여가 완료된 XML 형식의 파일을 서비스 서버 버전 1을 구성하는 하나의 컴퓨터(6)에서 블록체인 형식에 따라 해시값 화하여 전술의 대응 테이블에서 조회되는 사용자 ID에 대응하는 블록체인에 대한 링크를 이용해 복수의 블록체인 중에 해당하는 블록체인을 특정하여, 서비스 서버(1)를 구성하는 복수의 노드로서 기능하는 컴퓨터(6)의 환경에서 동작하는 블록체인에 저장한다.
또한, 각 태그는 데이터 관리 시스템을 제공하는 소정의 처리 서버(9)에 따라 소정의 변수로 함수화되어 있기 때문에, 입력 데이터가 블록체인 해시값으로 복원된 상태에서는 도 7에서 도시하고 있는 것과 같이 시각적으로 단어를 판별할 수 없다.
처리 서버(9)는 API를 사용하여 블록체인에 저장된 복수의 입력 데이터를 참조하는 기능(출력수단)이 있다. 사용자는 PC(2)를 기동하여 웹브라우저를 이용하여 관리 회사가 공개하는 홈페이지에 접속하여 로그인을 시행한다.
사용자는 로그인 후 클라이언트 측의 PC(2)에 표시되어 있는 사용자 페이지(14)의 데이터 참조버튼(16)을 선택한다. 관리서버(9)는 API에서 데이터 참조버튼(16)의 선택에 따라 입력 데이터를 참조하는 단계를 개시한다. 상세하게, 처리 서버(9)는 사용자가 로그인 시에 수신된 사용자 ID를 대응 테이블에서 참조하여 대응하는 블록체인의 링크를 이용하여 해당 블록체인으로 저장하고 있는 입력 데이터를 추출한다. 이어서 해시값에서 XML 형식의 파일을 복원하며, 동시에 태그를 함수에서 복원하고, 상기 XML 형식의 파일과 태그를 클라이언트 측 PC(2)에서 참조 가능한 상태로 처리한다.
이와 같이, 소정의 검색 조건에 의해 추출된 텍스트와 그 텍스트에 부여된 태그를 사용하는 것으로, 사업 활동에 유용한 지식을 얻기 위해 데이터 분석에 이용할 수 있다. 예를 들어, 의료분야에서는 사용자로서 어떤 병원의 환자 전체의 의료 기록의 입력 데이터를 분석하여 유사한 병력 환자들의 진료기록 입력 데이터에서 질병 경향이나 효과적인 치료법의 연구 등에 도움이 되는 지식을 얻을 수 있다.
도 8은 데이터 분석 시에 출력화면의 일 실시예로서, 여기에서는 법원의 판례를 검색할 때 화면을 보여주고 있다.
서비스 서버(1)는 여기에서는 나타내지 않은 태그가 고를 수 있는 선택화면을 클라이언트 PC(2)에 표시한다. 그리고 여러 태그의 선택을 강제하여 복수의 태그가 선택되면, 도 8에서와같이, 선택된 복수의 태그에 대해서 검색 시에 가중치 부여가 가능한 중요도 부여화면을 표시한다.
중요도 부여화면에는 색 분할된 복수의 라인(31)이 연속하여 증감이 가능한 중요도 게이지(gauge)(30)가 표시되어 있다. 중요도 게이지(3)의 복수라인(31)에는 선택된 모든 태그가 각각 대응되고, 인접한 라인(31)마다 경계에 표시되는 슬라이더(32)를 마우스(5) 등의 조작으로 좌우로 이동되는 것으로, 인접한 라인(31)마다 길이를 조정할 수 있게 되어 있다. 처리 서버(9)에서는 라인(31)의 상단에 각각의 라인(310)의 길이가 수치로 환산되어 표시되어 있다. 이러한 수치의 합계는 100이며, 사용자는 중요도 부여화면에서 선택한 태그의 중요도를 라인의 길이와 수치를 이용하여 시각적으로 파악하여 조정이 가능하게 되어 있다. 또한 중요도 게이지(30)는 직선이 아니더라도 원형 고리 등의 시각적으로 인식이 쉬운 형태일 수 있다.
또한, 처리 서버(9)에서 텍스트 태그를 부여할 때 부여조건은 관리 회사나 사용자에 의해 적절히 설정되어 있고, 또한 적절히 변경할 수 있다. 또한 저장지시수단은 변경 전 태그의 부여조건과 변경 후 태그의 부여조건과 대응관계를 나타내는 데이터를 블록체인에 저장하라고 지시할 수 있다. 이에 따라 구별되는 텍스트 데이터끼리의 속성에 대하여, 부여되는 태그가 시기나 담당자, 예를 들어 어떤 병원의 직원에 따라 다른 경우라도 비슷한 속성으로써 분석에 사용하는 것이 가능하다.
이상 설명한 바와 같이, 서비스 서버(1)는 클라이언트 측의 PC(2)에서 수신한 입력 데이터에 대해, 처리 서버(9)를 이용하여 조정의 검색 조건에 기반한 텍스트를 추출할 수 있다. 그리고 소정의 부여조건에 기반한 태그 부여를 하기 위해, 종래의 관계 데이터베이스와 같은 기존의 태그 부여조건에서 적절하게 분류할 수 없는 텍스트에 대해서도, 적절한 분류 태그를 설정하여 부여할 수 있다.
따라서, 이 데이터 관리 시스템을 사용함으로써, 입력 데이터의 분석 시 필요한 텍스틀 정확하게 볼 수 있다. 또한 태그가 부여된 입력 데이터는 처리 서버(9)의 저장지시수단으로 복수 컴퓨터(6)에 저장된다. 또한 입력 데이터의 분석 등에서, 사용자 ID에 할당된 블록체인 링크 정보와 대응관계를 보유하는 대응 테이블을 이용하는 것으로, 사용자 단위로 참조할 수 있게 출력할 수 있다. 또한 사용자가 API의 조작으로 처리 서버(9)에 상기 처리를 실행하는 것이 가능하고, 복수의 컴퓨터(6)를 이용하여 내결합성이 뛰어난 시스템을 쉽게 이용할 수 있는 환경은 API를 통해 실현할 수 있다.
또한, 처리 서버(9)는 태그가 부여된 입력 데이터를 블록체인에 저장한다. 이에 따라, 태그가 부여된 입력 데이터의 편집을 할 수 없고, 내용이 변경되지 않기 때문에 보안 기능이 뛰어나다. 또한 악성 변조에 한정하지 않고, 입력 데이터의 작성 당시 내용과 저장 시 타임스탬프가 유지되므로, 입력 데이터 작성 당시의 내용을 분석에 사용할 수 있으며, 사업 활동에 유용한 지식을 정확하게 얻을 수 있다. 또한 상기한 API 및 처리 서버(9) 기능을 사용하여 블록체인의 지식이 없는 사용자도 내결함성 및 보안 기능이 우수하며, 적절한 분류 태그를 설정, 부여하고 참조할 수 있는 시스템을 활용할 수 있다.
또한, 처리 서버(9)에서는 입력 데이터의 입력 시에 소정의 변수에 의해 태그를 함수화, 출력 시에는 같은 소정의 변수를 사용하여 태그를 함수에서 복원하기 위해 소정의 변수를 파악하고 있는 관리 회사의 처리 서버(9)를 통해서만, 태그의 의미가 판명되어, 출력이 가능하기 때문에, 분석 가능한 지식의 누출을 막을 수 있다.
또한, 태그의 부여수단은 입력 데이터 가운데 한 텍스트에 대해, 각 입력 데이터에 공통되는 태그를 부여하는 것이 가능하기 때문에, 복수의 다른 입력 데이터 간에 상호 공통되는 하나의 텍스트를 이용하여 분석하는 것도 가능하다.
또한, 태그 부여수단으로는 출력수단에 의해 출력된 태그가 부여된 입력 데이터를 블록체인의 현재 블록의 마지막에 나란히 저장할 수 있다. 이에 따르면, 이전에 저장했던 입력 데이터를 편집 또는 파기하지 않고, 태그를 정정하여 정확한 분석을 하는 것이 가능하다.
이상, 본 발명의 실시예를 도면에 의해 설명했지만, 구체적인 구성은 이러한 실시예에 한정되는 것이 아니고, 본 발명의 요지를 벗어나지 않는 범위에서 변경이나, 추가가 있도록 본 발명에 포함된다.
예를 들어, 전술한 실시예에서는 처리 서버(9)는 저장 지시수단으로 태그를 부여한 입력 데이터를 블록체인에 저장하도록 되어있지만, 블록체인에 한정되지 않고, 복수의 컴퓨터에 데이터를 저장하는 소위 분산형 데이터베이스 등에서 해당 입력 데이터를 저장하는 구성일 수 있다.
또는, 전술한 실시예에서 블록체인은 관리 회사가 제공하는 서비스 서버(1)를 구성하는 복수의 컴퓨터(6) 환경에서 동작하는 소위 개인의 블록체인으로 설명하고 있지만, 퍼블릭 블록체인의 사양일 수 있다.
또한, 태그를 한눈에 태그 의미가 판명되지 않는 것을 변환하는 사양으로써, 전술한 실시예에서는 소정의 변수로 함수화하는 것을 설명하고 있으나, 이에 한정되지 않고, 다른 변환 규칙이 이용될 수 있다. 이외에 특정 규칙을 사용하지 않고, API를 태그와 태그의 의미 항목정보로써 연관된 대응 테이블을 구비하여 변환을 할 수 있다. 이 경우, 입력 데이터의 출력 시 비슷한 대응 테이블을 사용하여 태그를 복원한다. 이에 따르면, 소정의 대응 테이블을 사용하지 않으면 분산 서버에 저장된 입력 데이터에 부여된 태그의 의미를 한눈에 파악할 수 없는 것으로, 분석할 수 있는 정보의 유출을 방지할 수 있다.
또한, 태그를 함수화하는 소정의 변수는 입력 데이터마다, 또는 사용자마다 각각 설정될 수 있다. 이에 따르면 사용자에 대해 개별적으로 소정의 변환 규칙을 설정할 수 있으므로, 분석할 수 있는 정보의 유출을 방지할 수 있다.
또한, 태그뿐만 아니라 텍스트도 변수로 함수화된 수에 해시값으로 변환될 수 있으며, 텍스트만 함수화하고 태그는 함수화되지 않을 수 있다. 그리고 입력 데이터를 유출을 방지하지 않는다면, 태그도 텍스트도 함수화하지 않을 수 있다.
또한, 관리 회사가 제공하는 서비스 서버(1)를 구성하는 API를 포함하는 API 서버(7)와, 대응 테이블을 갖춘 이용자 관리서버(8)와, 관리서버(9)는 각각의 기능을 수행하는 1대의 컴퓨터로 구성할 수 있다.
또한, 사용자가 이용하는 클라이언트 측의 기기는 PC로 한정되지 않고, 태블릿이나 스마트폰으로 구성할 수 있다.
또한, 진료기록 등의 입력 데이터는 업로드하는 사용으로 한정되지 않고, API가 카르테(karte)의 입력화면을 제공하거나, 클라이언트 측의 PC(2)의 웹브라우저상에서 직접 문자 데이터를 입력하는 구성일 수 있다.
또한, 전술한 실시예에서 스캐너(3)에서 스캔했던 그대로 전문검색이 되지 않는 파일은 PC(2)에서 텍스트 데이터로 변환되는 구성으로 설명했지만, 이에 한정되지 않는다. 예를 들면, 처리 서버(9)에 문자인식 기능과 텍스트 변환기능을 구비하고, 처리 서버(9)에서 스캐너(3)에서 스캔한 파일에 태그를 부여한 XML 형식의 파일을 작성 가능하도록 할 수 있다.
또한, XML 형식의 파일에 부여된 태그는 그 정보가 종래의 RDM 태그 정보와 공통된 것일 수 있다. 이에 따르면, 서비스 서버(1)에서 저장되는 입력 데이터로 서비스 서버(1) 이외의 기록매체로 기본의 RDB 형식으로 저장된 진료기록 등의 입력 데이터와 쌍방을 이용하여 분석하는 것도 가능하다.
1 : 서비스 서버 2 : PC
3 : 스캐너 4 : 키보드
5 : 마우스 6 : 컴퓨터(저장수단)
7: API 서버(저장수단) 8 : 이용자 관리서버(저장수단)
9 : 처리수단(저장수단) 10 : 초기화면
14 : 사용자 페이지 15 : 데이터 입력버튼
16 : 데이터 참조버튼 17 : 데이터 입력페이지
18 : 파일 선택버튼 19 : 업로드 버튼

Claims (9)

  1. 데이터 관리 시스템을 제공하는 서비스 서버 API를 갖추고, 상기 서비스 서버는 상기 API를 사용하여 클라이언트 단말로부터 입력 데이터를 수신하는 구성이고,
    상기 수신된 입력 데이터로부터 소정의 검색 조건에 따라 텍스트를 추출하고 추출된 각 텍스트에 대하여 소정의 부여조건에 따라 태그를 부여하는 부여수단과,
    상기 태그가 부여되는 입력 데이터를 복수의 저장수단 및 블록체인에 저장하는 저장지시수단과,
    상기 복수의 저장수단에 저장되는 입력 데이터를 상기 부여수단에 부여되는 태그와 함께 사용자 단위로 참조할 수 있도록 출력되는 출력수단을 포함하고,
    상기 서비스 서버는 태그가 고를 수 있는 선택화면을 클라이언트 단말에 표시하고, 여러 태그의 선택을 강제하여 복수의 태그가 선택되면, 선택된 복수의 태그에 대해서 검색 시에 가중치 부여가 가능한 중요도 부여화면을 표시하고,
    상기 중요도 부여화면에는 색 분할된 복수의 라인이 연속하여 증감이 가능한 중요도 게이지(gauge)가 표시되고, 상기 중요도 게이지의 복수라인에는 선택된 모든 태그가 각각 대응되고, 인접한 라인마다 경계에 표시되는 슬라이더를 마우스의 조작으로 좌우로 이동되는 것으로, 인접한 라인마다 길이를 조정할 수 있도록 구성하고, 상기 라인의 상단에 각각의 라인의 길이가 수치로 환산되어 표시되고, 이러한 수치의 합계는 100이며, 사용자는 중요도 부여화면에서 선택한 태그의 중요도를 라인의 길이와 수치를 이용하여 시각적으로 파악하여 조정이 가능하도록 표시하며,
    상기 API는 클라이언트 측의 PC에서 수신되는 입력 데이터를 블록체인 상에 저장하는 데 필요한 데이터의 변환이나, 태그의 부여를 블록체인에 대한 지식이 없는 클라이언트에게도 간단히 사용할 수 있도록 제공하고, 상기 태그를 부여할 때, 상기 API가 가진 검색 기능을 통해 텍스트 데이터가 전문 검색되도록 구성하는 것을 특징으로 하는 데이터 관리 시스템.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 서비스 서버는 상기 태그와 상기 태그가 의미하는 항목정보가 연결된 대응표를 구비하고,
    상기 출력수단은 상기 대응표를 이용하여 상기 태그의 의미 항목정보를 출력하는 것을 특징으로 하는 데이터 관리 시스템.
  4. 제 1 항에 있어서,
    상기 부여수단은 소정의 변환 규칙에 따라 함수로 변환한 태그를 상기 입력 데이터에 부여하고,
    상기 출력수단은 상기 소정의 변환 규칙에 따라 변환된 태그를 복원하여 출력하는 것이 가능한 것을 특징으로 하는 데이터 관리 시스템.
  5. 제 4 항에 있어서,
    상기 소정의 변환 규칙은 상기 입력 데이터마다 각각 설정 가능한 것을 특징으로 하는 데이터 관리 시스템.
  6. 제 1 항에 있어서,
    상기 부여수단은 상기 입력 데이터 하나의 텍스트에 대해 각 입력 데이터에 공통 태그를 부여하는 것이 가능한 것을 특징으로 하는 데이터 관리 시스템.
  7. 제 1 항에 있어서,
    상기 부여수단은 상기 출력수단에 의해 출력된 태그가 부여된 입력 데이터를 복원하고, 소정의 검색 조건에 기반한 텍스트를 추출하고, 추출된 각 텍스트에 대해 소정의 부여조건에 기반하여 태그의 재부여가 가능하고,
    상기 저장수단은 상기 재부여 태그가 부여된 입력 데이터를 상기 블록체인에서 현재 블록의 마지막에 연결하여 저장하는 것을 특징으로 하는 데이터 관리 시스템.
  8. 제 1 항에 있어서,
    상기 태그의 부여조건은 변경할 수 있으며,
    상기 저장지시수단은 변경 전의 태그의 부여조건과 변경 후 태그의 부여조건의 대응관계를 나타내는 데이터를 상기 복수의 저장수단에 저장지시 하는 것을 특징으로 하는 데이터 관리 시스템.
  9. 서비스 서버를 이용하여 API를 사용하여 클라이언트 단말기로부터 입력 데이터를 수신하는 단계와,
    부여수단을 이용하여 상기 수신된 입력 데이터로부터 소정의 검색 조건에 따른 텍스트를 추출하고, 상기 추출된 각 텍스트에 대한 소정의 부여조건에 따른 태그를 부여하는 단계와,
    저장지시 수단을 이용하여 상기 태그 부여된 입력 데이터를 복수의 저장수단 및 블록체인에 저장하는 단계와,
    출력수단을 이용하여 상기 복수의 저장수단에 저장된 입력 데이터를 전술한 부여수단에 의해 부여된 태그와 함께 사용자 단위로 참조할 수 있게 출력하는 단계를 포함하고,
    상기 서비스 서버는 태그가 고를 수 있는 선택화면을 클라이언트 단말에 표시하고, 여러 태그의 선택을 강제하여 복수의 태그가 선택되면, 선택된 복수의 태그에 대해서 검색 시에 가중치 부여가 가능한 중요도 부여화면을 표시하고,
    상기 중요도 부여화면에는 색 분할된 복수의 라인이 연속하여 증감이 가능한 중요도 게이지(gauge)가 표시되고, 상기 중요도 게이지의 복수라인에는 선택된 모든 태그가 각각 대응되고, 인접한 라인마다 경계에 표시되는 슬라이더를 마우스의 조작으로 좌우로 이동되는 것으로, 인접한 라인마다 길이를 조정할 수 있도록 구성하고, 상기 라인의 상단에 각각의 라인의 길이가 수치로 환산되어 표시되고, 이러한 수치의 합계는 100이며, 사용자는 중요도 부여화면에서 선택한 태그의 중요도를 라인의 길이와 수치를 이용하여 시각적으로 파악하여 조정이 가능하도록 표시하며,
    상기 API는 클라이언트 측의 PC에서 수신되는 입력 데이터를 블록체인 상에 저장하는 데 필요한 데이터의 변환이나, 태그의 부여를 블록체인에 대한 지식이 없는 클라이언트에게도 간단히 사용할 수 있도록 제공하고, 상기 태그를 부여하는 단계에서, 상기 API가 가진 검색 기능을 통해 텍스트 데이터가 전문 검색되도록 하는 단계를 포함하는 는 데이터 관리 방법.
KR1020190017804A 2019-02-15 2019-02-15 데이터 관리 시스템 및 데이터 관리 방법 KR102183815B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190017804A KR102183815B1 (ko) 2019-02-15 2019-02-15 데이터 관리 시스템 및 데이터 관리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190017804A KR102183815B1 (ko) 2019-02-15 2019-02-15 데이터 관리 시스템 및 데이터 관리 방법

Publications (2)

Publication Number Publication Date
KR20200099771A KR20200099771A (ko) 2020-08-25
KR102183815B1 true KR102183815B1 (ko) 2020-11-27

Family

ID=72242114

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190017804A KR102183815B1 (ko) 2019-02-15 2019-02-15 데이터 관리 시스템 및 데이터 관리 방법

Country Status (1)

Country Link
KR (1) KR102183815B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005321849A (ja) * 2004-05-06 2005-11-17 Fujitsu Ltd データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置
JP5400344B2 (ja) * 2008-10-07 2014-01-29 株式会社プロフィールド ドキュメント変換装置、およびプログラム
KR101763827B1 (ko) * 2016-04-07 2017-08-02 주식회사 라이프시맨틱스 블록체인 기반 의료데이터전송시스템, 방법 및 프로그램

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU781901B2 (en) * 2000-03-31 2005-06-23 International Business Machines Corporation Aggregation of content as a personalized document
JP2003196471A (ja) 2001-12-28 2003-07-11 Dainippon Printing Co Ltd 情報収集方法およびシステム
KR101927450B1 (ko) * 2016-12-29 2018-12-10 주식회사 와이즈넛 대용량 비정형 데이터를 처리하는 rest api 서비스 제공 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005321849A (ja) * 2004-05-06 2005-11-17 Fujitsu Ltd データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置
JP5400344B2 (ja) * 2008-10-07 2014-01-29 株式会社プロフィールド ドキュメント変換装置、およびプログラム
KR101763827B1 (ko) * 2016-04-07 2017-08-02 주식회사 라이프시맨틱스 블록체인 기반 의료데이터전송시스템, 방법 및 프로그램

Also Published As

Publication number Publication date
KR20200099771A (ko) 2020-08-25

Similar Documents

Publication Publication Date Title
US11841879B2 (en) Content discovery systems and methods
US10963513B2 (en) Data system and method
US11263273B2 (en) Systems and methods for graphical exploration of forensic data
JP2023532669A (ja) 文書処理および応答生成システム
US9104709B2 (en) Cleansing a database system to improve data quality
US9658848B2 (en) Stored procedure development and deployment
US20140365555A1 (en) Method and system of cloud-computing based content management and collaboration platform with content blocks
US11243989B1 (en) Configurable, streaming hybrid-analytics platform
US9984108B2 (en) Database joins using uncertain criteria
US11604783B2 (en) System having a content consistency service for a collaboration tool
US20230196002A1 (en) Document processing method, and information processing device
KR102532216B1 (ko) Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
KR102183815B1 (ko) 데이터 관리 시스템 및 데이터 관리 방법
US20200226162A1 (en) Automated Reporting System
JP2002014971A (ja) 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体
JP7221665B2 (ja) データ管理システム
Kumar et al. Implementation of MVC (Model-View-Controller) design architecture to develop web based Institutional repositories: A tool for Information and knowledge sharing
KR102113680B1 (ko) 빅 데이터 비식별화 처리 시스템 및 방법
US11880392B2 (en) Systems and methods for associating data with a non-material concept
US20230143597A1 (en) Methods to infer content relationships from user actions and system automations
KR102640194B1 (ko) 딥러닝 분석으로 연관 키워드의 대표 단어를 치환하여문서의 현황 정보를 제공하는 방법
WO2023286340A1 (ja) 情報処理装置および情報処理方法
CN114328947A (zh) 一种基于知识图谱的问答方法和装置
SE1451100A1 (sv) A system and method of designating documents to associate with a search record
KR20230103997A (ko) 프로젝트 문서 관리 방법, 프로젝트 관리 서버, 이를 위한 컴퓨터 프로그램

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant