WO2021137359A1

WO2021137359A1 - 임상시험 데이터 매칭 방법 및 장치

Info

Publication number: WO2021137359A1
Application number: PCT/KR2020/005672
Authority: WO
Inventors: 정지희
Original assignee: (주)메디아이플러스
Priority date: 2019-12-30
Filing date: 2020-04-29
Publication date: 2021-07-08
Also published as: KR102521961B1; KR20220070398A; KR20210084909A

Abstract

본 발명은 임상시험 데이터 매칭 방법 및 장치에 관한 것으로, 사용자에게 일 임상시험 결과와 매칭되는 다른 임상시험 결과를 제공하는 것을 일 목적으로 한다. 이러한 목적을 달성하기 위한 본 발명은 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 a 단계, 상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 b 단계, 상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하는 c 단계, 상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하여 상기 제1 임상시험 데이터와 상기 제2 임상시험 데이터를 매칭하는 d 단계 및 상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 수정하는 e 단계를 포함하는 것을 특징으로 한다.

Description

임상시험 데이터 매칭 방법 및 장치

본 발명은 임상시험 데이터 매칭 방법 및 장치에 관한 것으로, 보다 자세하게는 데이터베이스에서 임상시험 데이터와 유사한 데이터를 매칭하고, 사용자에게 제공하는 임상시험 데이터 매칭 방법 및 장치에 관한 것이다.

임상시험은 의약품을 개발, 시판하기에 앞서 그 의약품의 안전성, 약동학 및 약리효과, 임상적 효과를 확인하기 위하여 사람을 대상으로 실시하는 시험이다. 임상시험을 통해 얻어진 자료를 관리하는 일은 임상시험 데이터의 신뢰도와 정도를 높이는 데 있어 중요한 요소이다.

일반적으로 임상시험 데이터는 업로드 되는 플랫폼에 따라 그 양식을 달리 하기 때문에, 여러 플랫폼에 포진되어 있는 임상시험 결과를 한눈에 파악하기가 어려워 데이터의 공유가 용이하지 않다. 따라서, 복수 개의 플랫폼에 게재된, 선행된 임상시험의 데이터를 기반으로 유사한 결과를 매칭하여 특정 의약품에 대한 다양한 임상시험 데이터를 제공하는 기술의 개발이 필요한 실정이다.

본 발명은 전술한 문제점을 해결하기 위한 것으로서, 사용자에게 일 임상시험 데이터와 매칭되는 다른 임상시험 데이터를 제공하는 것을 일 목적으로 한다.

또한 본 발명은 복수 개의 플랫폼에 산재해 있는 임상시험 데이터를 수집하여 임상시험 데이터에 대한 데이터베이스를 구축하는 것을 일 목적으로 한다.

또한 본 발명은 임상시험 데이터의 매칭에 있어서 인덱스 별로 가중치를 부가함으로써 임상시험 데이터 사이의 유사도를 더 정확하게 측정하는 것을 일 목적으로 한다.

이러한 목적을 달성하기 위한 본 발명은 서버가 임상시험 데이터를 유사도에 따라 매칭하는 방법에 있어서, 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 a 단계, 상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 b 단계, 상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하는 c 단계, 상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하여 상기 제1 임상시험 데이터와 상기 제2 임상시험 데이터를 매칭하는 d 단계 및 상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 수정하는 e 단계를 포함하는 것을 일 특징으로 한다.

또한 본 발명은 임상시험 데이터를 유사도에 따라 매칭하는 장치에 있어서, 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 데이터 수신부, 상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 데이터 추출부, 상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하고, 상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하는 연산부 및 상기 제1 임상시험 데이터와 유사한 상기 제2 임상시험 데이터를 매칭하며, 상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 변경하는 데이터 매칭부를 포함하는 것을 일 특징으로 한다.

전술한 바와 같은 본 발명에 의하면, 일 임상시험 데이터와 매칭되는 다른 임상시험 데이터를 제공하여 사용자가 보다 다양한 임상시험 데이터를 제공받을 수 있다.

또한 본 발명은 복수 개의 플랫폼에 산재해 있는 임상시험 데이터를 수집하여 임상시험 데이터에 대한 데이터베이스를 구축할 수 있다.

또한 본 발명은 임상시험 데이터의 매칭에 있어서 인덱스 별로 가중치를 부가함으로써 임상시험 데이터 사이의 유사도를 더 정확하게 측정하여, 임상시험 결과의 매칭 정확도를 향상시킬 수 있다.

도 1은 본 발명의 일 실시 예에 의한 임상시험 데이터 매칭 장치의 구성을 도시한 구성도,

도 2는 본 발명의 일 실시 예에 의한 임상시험 데이터 매칭 방법의 순서도,

도 3은 본 발명의 일 실시 예에 의한 유사도 연산 방법의 순서도,

도 4는 본 발명의 일 실시 예에 의한 필드 별 가중치를 연산하는 방법의 순서도,

도 5 내지 도 7는 본 발명의 일 실시 예에 의한 디스플레이부에 표시되는 임상시험 데이터를 도시한 도면이다.

전술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되며, 이에 따라 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 상세한 설명을 생략한다.

도면에서 동일한 참조부호는 동일 또는 유사한 구성요소를 가리키는 것으로 사용되며, 명세서 및 특허청구의 범위에 기재된 모든 조합은 임의의 방식으로 조합될 수 있다. 그리고 다른 식으로 규정하지 않는 한, 단수에 대한 언급은 하나 이상을 포함할 수 있고, 단수 표현에 대한 언급은 또한 복수 표현을 포함할 수 있음이 이해되어야 한다.

본 명세서에서 사용되는 용어는 단지 특정 예시적 실시 예들을 설명할 목적을 가지고 있으며 한정할 의도로 사용되는 것이 아니다. 본 명세서에서 사용된 바와 같은 단수적 표현들은 또한, 해당 문장에서 명확하게 달리 표시하지 않는 한, 복수의 의미를 포함하도록 의도될 수 있다. 용어 "및/또는," "그리고/또는"은 그 관련되어 나열되는 항목들의 모든 조합들 및 어느 하나를 포함한다. 용어 "포함한다", "포함하는", "포함하고 있는", "구비하는", "갖는", "가지고 있는" 등은 내포적 의미를 갖는 바, 이에 따라 이러한 용어들은 그 기재된 특징, 정수, 단계, 동작, 요소, 및/또는 컴포넌트를 특정하며, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 컴포넌트, 및/또는 이들의 그룹의 존재 혹은 추가를 배제하지 않는다. 본 명세서에서 설명되는 방법의 단계들, 프로세스들, 동작들은, 구체적으로 그 수행 순서가 확정되는 경우가 아니라면, 이들의 수행을 논의된 혹은 예시된 그러한 특정 순서로 반드시 해야 하는 것으로 해석돼서는 안 된다. 추가적인 혹은 대안적인 단계들이 사용될 수 있음을 또한 이해해야 한다.

또한, 각각의 구성요소는 각각 하드웨어 프로세서로 구현될 수 있고, 위 구성요소들이 통합되어 하나의 하드웨어 프로세서로 구현될 수 있으며, 또는 위 구성요소들이 서로 조합되어 복수 개의 하드웨어 프로세서로 구현될 수도 있다.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시 예를 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시 예에 의한 임상시험 데이터 매칭 장치의 구성을 도시한 도면이다. 도 1을 참조하면, 임상시험 데이터 매칭 장치는 데이터 수신부(110), 데이터 추출부(130), 연산부(150), 데이터 매칭부(170), 그리고 디스플레이부(190)를 포함할 것이다.

데이터 수신부(110)는 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서 제1 임상시험 데이터를 수신할 수 있다. 보다 구체적으로 데이터 수신부(110)는 식품의약품안전처에서 식약처 임상시험 승인 정보를, CRIS(Clinical Research Information Service)에서 임상연구 등록 정보를, Clinical Trials.gov(A Service of the U.S. National Institutes of Health)에서 글로벌 임상연구 등록 정보를 수신할 수 있다.

데이터 수신부(110)는 정기적 혹은 비정기적으로 상기 사이트에 업로드 된 제1 임상시험 데이터를 수신할 수 있다.

데이터 추출부(130)는 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하고, 이를 데이터베이스에 저장할 수 있다. 데이터 추출부(130)는 제1 임상시험 데이터를 크롤링하여 데이터에서 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구 또는 생체조직 정보를 포함하는 제1 유효 데이터를 추출할 수 있다.

예를 들어, 데이터 추출부(130)는 시험 단계에 대한 유효 데이터를 추출함에 있어서 시험 단계의 값이 존재하지 않으면 생동|연구자 임상시험을 유효 데이터로 하고, 'Phase 3'의 값이 존재하면 문자열을 제거하고 숫자만 추출하여 3을 유효 데이터로 할 수 있다. 또한 이 외의 다른 유효 데이터의 경우 값이 없으면 None을 설정할 수 있다.

데이터 추출부(130)는 임상시험 데이터 관리를 효율적으로 수행하기 위하여, 제1 유효 데이터를 표준화할 수 있다. 데이터 추출부(130)는 기 생성된 임상시험 용어 데이터베이스를 이용하여 제1 유효 데이터를 표준화할 수 있다. 임상시험 용어 데이터베이스는 임상시험 용어에 대한 한/영 변환 정보, 동의어, 약어, 주요 키워드 등을 포함하여 동일한 의미를 갖는 다른 용어를 균일화시켜 임상시험 데이터의 통일성을 향상시킬 수 있다.

또한 임상시험 데이터, 논문, 특허와 같이 다양한 데이터에 명시되는 기관, 연구자, 소속, 그리고 연락처가 표준화되어 있지 않아 데이터 추출부(130)는 현재 공개되어 있는 기관명, 연구자 정보가 저장된 데이터베이스를 이용하여 기관, 연구자, 소속, 그리고 연락처를 표준화할 수 있다.

데이터 추출부(130)는 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구, 생체조직 정보를 필드로 하는 인덱스 테이블을 생성하고, 제1 유효 데이터를 인덱싱하여 인덱스 테이블을 업데이트하며, 이를 데이터베이스에 저장할 것이다. 이 때 인덱스 테이블은 데이터베이스에 저장되는 데이터 관리를 효율적으로 하기 위한 것으로 기본적으로 데이터베이스에 저장된다. 데이터 추출부(130)는 제1 유효 데이터에 대한 인덱스 테이블을 업데이트할 때, 매칭 상태를 더 저장할 수 있다. 매칭 상태는 매칭 필요 상태, 매칭 완료 상태, 매칭 없음 상태를 포함할 수 있다.

연산부(150)는 제1 유효 데이터와 데이터베이스에 기 저장된 다른 제2 유효 데이터 사이의 제1 유사도를 연산할 수 있다. 연산부(150)는 유사도를 연산하기 위해 먼저 유효 데이터를 자연어 처리할 수 있다. 자연어 처리는 컴퓨터와 같은 기계가 인간의 언어를 분석함으로써 해석하고 모사하는 기술로, 단어들을 DTM, Word2Vec 등과 같은 방법으로 수치화하여 표현하고, 단어 간의 차이를 유클리드 거리, 코사인 유사도 등으로 연산하여 유사도를 연산할 수 있다.

연산부(150)는 제1 유효 데이터와 제2 유효 데이터의 필드 값에 대한 제1 유사도를 연산할 수 있다. 연산부(150)는 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구, 생체조직 정보에 대한 필드 값에 대한 제1 유사도를 각각 연산할 것이다. 연산부(150)는 제1 유사도를 연산함에 있어서 종래의 방법을 따른다.

연산부(150)는 제1 및 제2 유효 데이터에서 필드 값 별로 연산된 제1 유사도에 필드 별 가중치를 적용하여 제2 유사도를 산출할 수 있다. 가중치는 임상시험 데이터의 유사도를 결정하는 데 중요한 필드 값에서 높게 설정될 것이다. 예를 들어 임상시험 데이터의 타이틀은 특정 포맷을 기준으로 작성되어 타이틀이 포함하는 정보의 종류가 명확하며, 상기 정보는 임상시험에 대한 정보가 축약된 것이기 때문에 타이틀에 대한 가중치가 가장 크게 설정될 수 있다.

연산부(150)는 가중치로 관리자가 기 설정한 값을 이용할 수도 있고, 강화학습을 통해 가중치를 설정할 수도 있다. 강화학습은 특정 환경 내에서 정의된 에이전트(Agent)가 현재의 상태(State)를 인식하여, 선택 가능한 행동(Action) 중 보상을 최대화하는 행동 또는 행동 순서를 선택하는 방법이다.

연산부(150)는 데이터베이스에 저장된 이미 매칭된 임상시험 데이터에 대응하는 유효 데이터의 필드 값에 대한 제1 유사도와 해당 임상시험 데이터의 매칭 과정에 있어서 사용자의 검증 정보를 이용하여 가중치 설정 환경을 생성할 수 있다.

연산부(150)는 제1 임상시험 데이터에 대응하는 유효 데이터의 필드 값의 제1 유사도를 현재 상태(State)로, 각 필드 값에 대한 가중치를 행동(Action)으로 하여, 에이전트가 필드 값에 대하여 보상을 최대로 하는 가중치를 선택했을 때, 제1 유사도에 가중치를 적용하여 제2 유사도를 연산한 결과, 가장 높은 유사도 또는 기 설정된 임계 값 이상의 값을 갖는 유사도에 대응하는 적어도 하나의 제2 임상시험 데이터에 대한 사용자의 검증 결과를 이용하여 에이전트에게 보상을 제공할 수 있다.

연산부(150)는 상기 과정을 수행하기 위해 강화학습 모델을 생성하는 모델 생성부(151), 행동 선택부(153), 그리고 보상 제공부(155)를 포함할 수 있다.

모델 생성부(151)는 데이터베이스에 저장된 임상시험 데이터에 대응하는 적어도 하나의 유효 데이터의 필드 값에 대한 제1 유사도를 이용하여 강화학습 모델을 생성할 수 있다. 모델 생성부(151)는 유효 데이터의 필드 값에 대한 제1 유사도에 필드 별 가중치를 적용하여 생성되는 제2 유사도에 따라, 기준이 되는 제1 임상시험 데이터와 가장 높은 유사도를 갖거나 기 설정된 임계 값 이상의 유사도를 갖는 제2 임상시험 데이터에 대한 사용자의 검증 결과에 따른 보상을 통해 강화학습 모델을 생성할 수 있다. 나아가 모델 생성부(151)는 행동 선택부(153)가 보상을 최대로 하는 가중치를 설정할 수 있도록 반복적인 학습을 수행하여 강화학습 모델을 강화할 수 있다.

행동 선택부(153)는 보상을 최대로 하는 필드 별 가중치를 설정할 수 있다.

보상 제공부(155)는 행동 선택부(153)에서 제1 임상시험 데이터의 제1 유효 데이터의 필드 값의 제1 유사도에, 설정된 필드 별 가중치를 반영하여 제2 유사도를 연산하고, 제2 유사도를 통해 추출된 적어도 하나의 제2 임상시험 데이터에 대한 사용자의 검증 결과를 이용하여 보상을 산정할 수 있다. 따라서 보상 제공부(155)는 사용자의 피드백을 기반으로 보상을 산정할 것이다.

데이터 매칭부(170)는 제1 임상시험 데이터와 유사하다고 판단된 제2 임상시험 데이터를 매칭할 수 있다. 데이터 매칭부(170)는 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 변경할 것이다.

디스플레이부(190)는 제1 임상시험 데이터, 그리고 제1 임상시험 데이터와 매칭된 적어도 하나의 제2 임상시험 데이터를 화면에 표시할 것이다. 디스플레이부(190)는 제1 및 제2 임상시험 데이터를 도 5 내지 도 7과 같이 표시할 수 있다.

이하에서는 도 2 내지 도 4를 이용하여, 임상시험 데이터 매칭 방법을 설명한다. 임상시험 데이터 매칭 방법에 관한 설명에 있어서 전술한 임상시험 데이터 매칭 장치와 중복되는 세부 실시 예는 생략될 수 있다. 또한 임상시험 데이터 매칭 방법의 주체인 임상시험 데이터 매칭 장치는 서버로 구현될 수 있는 바, 이하에서는 설명의 편의를 위하여 서버로 명명한다.

단계 100에서, 서버는 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서 제1 임상시험 데이터를 수신할 수 있다. 보다 구체적으로 데이터 수신부(110)는 식품의약품안전처에서 식약처 임상시험 승인 정보를, CRIS(Clinical Research Information Service)에서 임상연구 등록 정보를, Clinical Trials.gov(A Service of the U.S. National Institutes of Health)에서 글로벌 임상연구 등록 정보를 수신할 수 있다.

단계 200에서, 서버는 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하고, 이를 데이터베이스에 저장할 수 있다. 서버는 제1 임상시험 데이터를 크롤링하여 데이터에서 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구 또는 생체조직 정보를 포함하는 제1 유효 데이터를 추출할 수 있다.

또한 서버는 임상시험 데이터 관리를 효율적으로 수행하기 위하여, 제1 유효 데이터를 표준화할 수 있다. 서버는 기 생성된 임상시험 용어 데이터베이스를 이용하여 제1 유효 데이터를 표준화할 수 있다. 임상시험 용어 데이터베이스는 임상시험 용어에 대한 한/영 변환 정보, 동의어, 약어, 주요 키워드 등을 포함하여 동일한 의미를 갖는 다른 용어를 균일화시켜 임상시험 데이터의 통일성을 향상시킬 수 있다.

또한 임상시험 데이터, 논문, 특허와 같이 다양한 데이터에 명시되는 기관, 연구자, 소속, 그리고 연락처가 표준화되어 있지 않아 서버는 현재 공개되어 있는 기관명, 연구자 정보가 저장된 데이터베이스를 이용하여 기관, 연구자, 소속, 연락처를 표준화할 수 있다.

서버는 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구, 생체조직 정보를 필드로 하는 인덱스 테이블을 생성하고, 제1 유효 데이터를 인덱싱하여 인덱스 테이블을 업데이트하며, 이를 데이터베이스에 저장할 것이다. 이 때 인덱스 테이블은 데이터베이스에 저장되는 데이터 관리를 효율적으로 하기 위한 것으로 기본적으로 데이터베이스에 저장된다.

나아가 서버는 제1 유효 데이터에 대한 인덱스 테이블을 업데이트할 때, 매칭 상태를 더 저장할 수 있다. 매칭 상태는 매칭 필요 상태, 매칭 완료 상태, 매칭 없음 상태를 포함할 수 있다.

단계 300에서, 서버는 제1 유효 데이터와 데이터베이스에 기 저장된 다른 제2 유효 데이터 사이의 제1 유사도를 연산할 수 있다. 서버는 제1 유사도를 연산하기 위해 먼저 유효 데이터를 자연어 처리(S310)할 수 있다.

단계 320에서 서버는 제1 유효 데이터와 제2 유효 데이터의 필드 값에 대한 제1 유사도를 연산할 수 있다. 서버는 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구, 생체조직 정보에 대한 필드 값에 대한 유사도를 각각 연산할 것이다. 서버는 유사도를 연산함에 있어서 종래의 방법을 따를 수 있다.

단계 330에서 서버는 제1 및 제2 유효 데이터에서 필드 값 별로 연산된 제1 유사도에 필드 별 가중치를 적용하여 제2 유사도를 산출할 수 있다. 가중치는 임상시험 데이터의 유사도를 결정하는 데 중요한 필드 값에서 높게 설정될 것이다.

단계 331에서 서버는 데이터베이스에 저장된 이미 매칭된 임상시험 데이터에 대응하는 유효 데이터의 필드 값에 대한 제1 유사도와 해당 임상시험 데이터의 매칭 과정에 있어서의 사용자의 검증 정보를 이용하여 가중치 설정 환경을 생성할 수 있다.

단계 333에서, 서버는 데이터베이스에 저장된 임상시험 데이터에 대응하는 적어도 하나의 유효 데이터의 필드 값에 대한 제1 유사도를 이용하여 강화학습 모델을 생성할 수 있다. 서버는 유효 데이터의 필드 값에 대한 제1 유사도에 필드 별 가중치를 적용했을 경우 산출되는 제2 유사도를 이용하여, 기준이 되는 제1 임상시험 데이터와 가장 높은 유사도를 갖거나 기 설정된 임계 값 이상의 유사도를 갖는 제2 임상시험 데이터에 대한 사용자의 검증 결과에 따른 보상을 통해 강화학습 모델을 생성할 수 있다.

단계 335에서, 서버는 보상을 최대로 하는 필드 별 가중치를 설정할 수 있다.

단계 337에서, 서버는 제1 임상시험 데이터의 제1 유효 데이터의 필드 값의 제1 유사도에, 설정된 필드 별 가중치를 반영하여 제2 유사도를 연산하고, 제2 유사도를 통해 추출된 적어도 하나의 제2 임상시험 데이터에 대한 사용자의 검증 결과를 이용하여 보상을 산정할 수 있다.

단계 331 내지 337을 반복하여, 서버는 가장 높은 보상을 받을 수 있는 필드 별 가중치를 설정하여 제2 유사도를 연산할 수 있다.

단계 400에서, 서버는 제1 임상시험 데이터와 유사하다고 판단된 제2 임상시험 데이터를 매칭하고, 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 변경(S500)할 것이다. 서버는 제1 임상시험 데이터와 매칭되는 제2 임상시험 데이터가 존재하면, 제1 및 제2 임상시험 데이터의 매칭 상태를 매칭 완료 상태로 변경하고, 제2 임상시험 데이터가 존재하지 않으면 제1 임상시험 데이터의 매칭 상태를 매칭 없음 상태로 변경할 것이다.

서버는 매칭 완료 상태의 제1 및 제2 임상시험 데이터에 대한 검증 요청 신호를 적어도 하나의 관리자 단말에 전송하고, 관리자 단말에 제1 및 제2 임상시험 데이터와 매칭 확정/매칭 취소 등의 버튼을 표시하여 사용자가 검증 결과를 보다 용이하게 선택할 수 있도록 한다.

나아가 서버는 사용자 단말로부터 추가 메모 정보를 수신하는 경우, 제1 및 제2 임상시험 데이터에 이를 더할 수 있다.

단계 600에서, 서버는 제1 임상시험 데이터, 그리고 제1 임상시험 데이터와 매칭된 적어도 하나의 제2 임상시험 데이터를 화면에 표시할 것이다.

본 명세서와 도면에 개시된 본 발명의 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.

Claims

서버가 임상시험 데이터를 유사도에 따라 매칭하는 방법에 있어서,

임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 a 단계;

상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 b 단계;

상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하는 c 단계;

상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하여 상기 제1 임상시험 데이터와 상기 제2 임상시험 데이터를 매칭하는 d 단계; 및

상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 수정하는 e 단계를 포함하는 임상시험 데이터 매칭 방법.
제1항에 있어서,

상기 b 단계는,

상기 제1 임상시험 데이터에서 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구 또는 생체조직 중 적어도 하나를 크롤링하여 제1 유효 데이터를 추출하는 단계;

상기 크롤링 된 데이터를 인덱싱하여 인덱스 테이블을 업데이트하고, 데이터베이스에 저장하는 단계를 포함하는 임상시험 데이터 매칭 방법.
제2항에 있어서,

상기 c 단계는,

상기 제1 및 제2 유효 데이터 간의 제1 유사도와, 상기 인덱스 테이블의 필드 각각에 기 부여된 가중치를 적용하여 상기 제1 및 제2 유효 데이터의 제2 유사도를 연산하는 임상시험 데이터 매칭 방법.
제1항에 있어서,

상기 제1 유효 데이터는 상기 매칭 상태를 더 포함하여,

상기 e 단계에서, 상기 매칭 상태를 완료 상태로 변경하되,

상기 매칭 상태는 매칭 필요 상태, 매칭 완료 상태, 매칭 없음 상태를 포함하는 임상시험 데이터 매칭 방법.
제1항에 있어서,

상기 매칭 완료 상태의 제1 및 제2 임상시험 데이터와 검증 요청 신호를 적어도 하나의 관리자 단말에 전송하는 단계;

상기 관리자 단말로부터 제1 및 제2 임상시험 데이터의 검증 결과를 수신하는 단계를 더 포함하는 임상시험 데이터 매칭 방법.
임상시험 데이터를 유사도에 따라 매칭하는 장치에 있어서,

임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 데이터 수신부;

상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 데이터 추출부;

상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하고, 상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하는 연산부; 및

상기 제1 임상시험 데이터와 유사한 상기 제2 임상시험 데이터를 매칭하며, 상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 변경하는 데이터 매칭부를 포함하는 임상시험 데이터 매칭 장치.