WO2021137359A1 - 임상시험 데이터 매칭 방법 및 장치 - Google Patents

임상시험 데이터 매칭 방법 및 장치 Download PDF

Info

Publication number
WO2021137359A1
WO2021137359A1 PCT/KR2020/005672 KR2020005672W WO2021137359A1 WO 2021137359 A1 WO2021137359 A1 WO 2021137359A1 KR 2020005672 W KR2020005672 W KR 2020005672W WO 2021137359 A1 WO2021137359 A1 WO 2021137359A1
Authority
WO
WIPO (PCT)
Prior art keywords
clinical trial
data
trial data
matching
similarity
Prior art date
Application number
PCT/KR2020/005672
Other languages
English (en)
French (fr)
Inventor
정지희
Original Assignee
(주)메디아이플러스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)메디아이플러스 filed Critical (주)메디아이플러스
Publication of WO2021137359A1 publication Critical patent/WO2021137359A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/156Query results presentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring

Definitions

  • the present invention relates to a clinical trial data matching method and apparatus, and more particularly, to a clinical trial data matching method and apparatus for matching data similar to clinical trial data in a database and providing it to a user.
  • Clinical trials are tests conducted on humans to confirm the safety, pharmacokinetics, pharmacological effects, and clinical effects of a drug before developing and marketing a drug. Management of data obtained through clinical trials is an important factor in increasing the reliability and quality of clinical trial data.
  • the present invention is intended to solve the above-described problems, and one object is to provide a user with other clinical trial data that matches one clinical trial data.
  • Another object of the present invention is to establish a database for clinical trial data by collecting clinical trial data scattered on a plurality of platforms.
  • Another object of the present invention is to more accurately measure the similarity between clinical trial data by adding weights to each index in matching clinical trial data.
  • the present invention for achieving this object is a method for a server to match clinical trial data according to a degree of similarity, in at least one website including the clinical trial data, the step a of receiving the first clinical trial data, the first 1 Step b of crawling clinical trial data, extracting first valid data and storing it in a database, step c of calculating a similarity between the first valid data and second valid data stored in the database, the similarity is a preset threshold If it is greater than or equal to the value, the first clinical trial data and the second clinical trial data corresponding to the second valid data are determined to be similar, and the d step of matching the first clinical trial data and the second clinical trial data; It is characterized in that it includes an e step of correcting the matching status of the first and second clinical trial data to the completed status.
  • the present invention provides an apparatus for matching clinical trial data according to similarity, a data receiving unit for receiving first clinical trial data from at least one website including clinical trial data, and crawling the first clinical trial data, A data extraction unit for extracting and storing the first valid data in a database, calculating the similarity between the first valid data and the second valid data stored in the database, and if the similarity is greater than or equal to a preset threshold, the first clinical trial An operation unit that determines that the test data and the second clinical trial data corresponding to the second valid data are similar, and the second clinical trial data similar to the first clinical trial data are matched, and the first and second clinical trial data It is characterized in that it comprises a data matching unit for changing the matching state of the completed state.
  • the user by providing other clinical trial data that matches one clinical trial data, the user can be provided with more various clinical trial data.
  • the present invention can collect clinical trial data scattered on a plurality of platforms to build a database for clinical trial data.
  • the present invention can more accurately measure the similarity between clinical trial data by adding weights to each index in matching clinical trial data, thereby improving the matching accuracy of clinical trial results.
  • FIG. 1 is a configuration diagram showing the configuration of a clinical trial data matching device according to an embodiment of the present invention
  • FIG. 2 is a flowchart of a clinical trial data matching method according to an embodiment of the present invention.
  • FIG. 3 is a flowchart of a similarity calculation method according to an embodiment of the present invention.
  • FIG. 4 is a flowchart of a method for calculating a weight for each field according to an embodiment of the present invention
  • 5 to 7 are diagrams illustrating clinical trial data displayed on a display unit according to an embodiment of the present invention.
  • each component may be implemented as a hardware processor, respectively, the above components may be integrated into one hardware processor, or the above components may be combined with each other and implemented as a plurality of hardware processors.
  • the clinical trial data matching apparatus will include a data receiving unit 110 , a data extracting unit 130 , a calculating unit 150 , a data matching unit 170 , and a display unit 190 .
  • the data receiving unit 110 may receive the first clinical trial data from at least one website including the clinical trial data. More specifically, the data receiving unit 110 receives the Ministry of Food and Drug Safety clinical trial approval information from the Ministry of Food and Drug Safety, clinical research registration information from CRIS (Clinical Research Information Service), Clinical Trials.gov (A Service of the US National Institutes of Health). ) to receive global clinical research registration information.
  • CRIS Cosmetic Research Information Service
  • Clinical Trials.gov A Service of the US National Institutes of Health.
  • the data receiving unit 110 may receive the first clinical trial data uploaded to the site regularly or irregularly.
  • the data extraction unit 130 may crawl the first clinical trial data to extract the first valid data, and store it in the database.
  • the data extraction unit 130 may crawl the first clinical trial data and extract first valid data including title, test stage, medicine, subject's gender, age, test method, test tool, or biological tissue information from the data. .
  • the data extraction unit 130 extracts valid data for the test phase, if the value of the test phase does not exist, the live
  • the data extraction unit 130 may standardize the first valid data in order to efficiently manage clinical trial data.
  • the data extractor 130 may standardize the first valid data using the pre-generated clinical trial terminology database.
  • the clinical trial terminology database can improve the unity of clinical trial data by uniformizing other terms with the same meaning, including Korean/English conversion information, synonyms, abbreviations, and key keywords for clinical trial terms.
  • the data extraction unit 130 uses a database in which the currently open institution name and researcher information are stored. , researchers, affiliations, and contacts can be standardized.
  • the data extraction unit 130 creates an index table using the title, test stage, drug, subject's gender, age, test method, test tool, and biological tissue information as fields, and updates the index table by indexing the first valid data, , will store it in the database.
  • the index table is basically stored in the database for efficient management of data stored in the database.
  • the data extractor 130 may further store a matching state when updating the index table for the first valid data.
  • the matching status may include a matching required status, a matching completed status, and a no matching status.
  • the calculator 150 may calculate a first similarity between the first valid data and other second valid data previously stored in the database.
  • the calculator 150 may first perform natural language processing on valid data in order to calculate the similarity.
  • Natural language processing is a technology that interprets and simulates human language by analyzing human language by a computer such as a computer. It expresses words numerically using methods such as DTM and Word2Vec, and calculates the difference between words using Euclidean distance and cosine similarity to calculate similarity. can be calculated.
  • the calculator 150 may calculate a first similarity between field values of the first valid data and the second valid data.
  • the calculating unit 150 calculates the first similarity with respect to the field values for the title, test stage, drug, subject's gender, age, test method, test tool, and biological tissue information, respectively.
  • the calculating unit 150 follows a conventional method in calculating the first similarity.
  • the calculator 150 may calculate the second similarity by applying a weight for each field to the first similarity calculated for each field value in the first and second valid data.
  • the weight will be set high in the field values that are important in determining the similarity of clinical trial data. For example, the title of clinical trial data is written based on a specific format, so the type of information included in the title is clear. Since the information is an abbreviation of clinical trial information, the weight for the title can be set the most. have.
  • the calculator 150 may use a value preset by the administrator as the weight, or may set the weight through reinforcement learning.
  • Reinforcement learning is a method in which an agent defined within a specific environment recognizes the current state and selects an action or action sequence that maximizes a reward among selectable actions.
  • the operation unit 150 generates a weight setting environment by using the user's verification information in the matching process of the first similarity to the field value of the valid data corresponding to the clinical trial data that is already matched in the database and the corresponding clinical trial data.
  • the operation unit 150 sets the first similarity of the field value of the valid data corresponding to the first clinical trial data as the current state and the weight for each field value as the action, so that the agent responds to the field value. At least one second clinical trial corresponding to the highest similarity or similarity having a value greater than or equal to a preset threshold as a result of calculating the second similarity by applying the weight to the first similarity when a weight that maximizes the reward is selected A reward can be provided to the agent by using the user's verification result for the data.
  • the calculating unit 150 may include a model generating unit 151 that generates a reinforcement learning model to perform the above process, a behavior selecting unit 153 , and a reward providing unit 155 .
  • the model generator 151 may generate a reinforcement learning model by using a first degree of similarity to a field value of at least one valid data corresponding to the clinical trial data stored in the database.
  • the model generator 151 may have the highest similarity with the reference first clinical trial data or a preset threshold according to a second degree of similarity generated by applying a weight for each field to a first degree of similarity with respect to a field value of valid data.
  • a reinforcement learning model may be generated through compensation according to the user's verification result for the second clinical trial data having a similarity greater than or equal to the value.
  • the model generation unit 151 may reinforce the reinforcement learning model by repeatedly learning so that the action selection unit 153 can set a weight that maximizes the reward.
  • the action selector 153 may set a weight for each field that maximizes the reward.
  • the reward providing unit 155 calculates the second similarity by reflecting the weight for each field set in the first similarity of the field value of the first valid data of the first clinical trial data in the behavior selection unit 153, and the second similarity Compensation may be calculated using the user's verification result for at least one second clinical trial data extracted through . Accordingly, the reward providing unit 155 will calculate a reward based on the user's feedback.
  • the data matching unit 170 may match the second clinical trial data determined to be similar to the first clinical trial data.
  • the data matching unit 170 will change the matching state of the first and second clinical trial data to the completed state.
  • the display unit 190 will display the first clinical trial data and at least one second clinical trial data matched with the first clinical trial data on the screen.
  • the display unit 190 may display the first and second clinical trial data as shown in FIGS. 5 to 7 .
  • FIGS. 2 to 4 a clinical trial data matching method will be described using FIGS. 2 to 4 .
  • the detailed embodiment overlapping with the aforementioned clinical trial data matching apparatus may be omitted.
  • the clinical trial data matching device which is the subject of the clinical trial data matching method, may be implemented as a server, and hereinafter, it will be referred to as a server for convenience of description.
  • the server may receive the first clinical trial data from at least one website including the clinical trial data. More specifically, the data receiving unit 110 receives the Ministry of Food and Drug Safety clinical trial approval information from the Ministry of Food and Drug Safety, clinical research registration information from CRIS (Clinical Research Information Service), Clinical Trials.gov (A Service of the US National Institutes of Health). ) to receive global clinical research registration information.
  • CRIS Cosmetic Research Information Service
  • Clinical Trials.gov A Service of the US National Institutes of Health.
  • the server may crawl the first clinical trial data to extract the first valid data, and store it in the database.
  • the server may crawl the first clinical trial data to extract first valid data including title, test phase, drug, subject's gender, age, test method, test tool, or biological tissue information from the data.
  • the server may standardize the first valid data in order to efficiently perform clinical trial data management.
  • the server may standardize the first valid data using the pre-generated clinical trial terminology database.
  • the clinical trial terminology database can improve the unity of clinical trial data by uniformizing other terms with the same meaning, including Korean/English conversion information, synonyms, abbreviations, and key keywords for clinical trial terms.
  • the server uses the database that stores the currently open institution name and researcher information to determine the institution, researcher, affiliation, Contacts can be standardized.
  • the server creates an index table using title, test phase, drug, subject gender, age, test method, test tool, and biological tissue information as fields, updates the index table by indexing the first valid data, and stores it in the database.
  • the index table is basically stored in the database for efficient management of data stored in the database.
  • the server may further store the matching state when updating the index table for the first valid data.
  • the matching status may include a matching required status, a matching completed status, and a no matching status.
  • the server may calculate a first similarity between the first valid data and other second valid data pre-stored in the database.
  • the server may first perform natural language processing ( S310 ) on valid data in order to calculate the first similarity.
  • the server may calculate a first similarity between field values of the first valid data and the second valid data.
  • the server will calculate the similarity for field values for title, test phase, drug, subject's gender, age, test method, test tool, and biological tissue information, respectively.
  • the server may follow a conventional method in calculating the similarity.
  • the server may calculate the second similarity by applying a weight for each field to the first similarity calculated for each field value in the first and second valid data.
  • the weight will be set high in the field values that are important in determining the similarity of clinical trial data.
  • step 331 the server creates a weight setting environment using the first similarity to the field value of the valid data corresponding to the already matched clinical trial data stored in the database and the user's verification information in the matching process of the clinical trial data. can do.
  • the server may generate the reinforcement learning model using the first similarity to the field value of at least one valid data corresponding to the clinical trial data stored in the database.
  • the server uses the second degree of similarity calculated when a weight for each field is applied to the first degree of similarity to the field value of the valid data, has the highest degree of similarity with the first clinical trial data, which is the standard, or the degree of similarity above a preset threshold
  • a reinforcement learning model can be created through compensation according to the user's verification result for the second clinical trial data having .
  • the server may set a weight for each field that maximizes the reward.
  • step 337 the server calculates a second degree of similarity by reflecting the set weight for each field in the first degree of similarity of the field value of the first valid data of the first clinical trial data, and at least one second degree of similarity extracted through the second degree of similarity is calculated.
  • 2 Compensation can be calculated using the user's verification results for clinical trial data.
  • the server may calculate the second similarity by setting a weight for each field that can receive the highest reward.
  • the server will match the second clinical trial data determined to be similar to the first clinical trial data, and change the matching state of the first and second clinical trial data to a complete state (S500). If the second clinical trial data matching the first clinical trial data exists, the server changes the matching state of the first and second clinical trial data to the matching complete state, and if the second clinical trial data does not exist, the first clinical trial data It will change the matching status of the test data to no matching status.
  • the server transmits a verification request signal for the first and second clinical trial data in the matching completion state to at least one manager terminal, and sends a button such as confirming/cancel matching with the first and second clinical test data to the manager terminal display so that the user can more easily select the verification result.
  • the server may add it to the first and second clinical trial data.
  • step 600 the server will display the first clinical trial data, and at least one second clinical trial data matched with the first clinical trial data on the screen.

Abstract

본 발명은 임상시험 데이터 매칭 방법 및 장치에 관한 것으로, 사용자에게 일 임상시험 결과와 매칭되는 다른 임상시험 결과를 제공하는 것을 일 목적으로 한다. 이러한 목적을 달성하기 위한 본 발명은 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 a 단계, 상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 b 단계, 상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하는 c 단계, 상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하여 상기 제1 임상시험 데이터와 상기 제2 임상시험 데이터를 매칭하는 d 단계 및 상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 수정하는 e 단계를 포함하는 것을 특징으로 한다.

Description

임상시험 데이터 매칭 방법 및 장치
본 발명은 임상시험 데이터 매칭 방법 및 장치에 관한 것으로, 보다 자세하게는 데이터베이스에서 임상시험 데이터와 유사한 데이터를 매칭하고, 사용자에게 제공하는 임상시험 데이터 매칭 방법 및 장치에 관한 것이다.
임상시험은 의약품을 개발, 시판하기에 앞서 그 의약품의 안전성, 약동학 및 약리효과, 임상적 효과를 확인하기 위하여 사람을 대상으로 실시하는 시험이다. 임상시험을 통해 얻어진 자료를 관리하는 일은 임상시험 데이터의 신뢰도와 정도를 높이는 데 있어 중요한 요소이다.
일반적으로 임상시험 데이터는 업로드 되는 플랫폼에 따라 그 양식을 달리 하기 때문에, 여러 플랫폼에 포진되어 있는 임상시험 결과를 한눈에 파악하기가 어려워 데이터의 공유가 용이하지 않다. 따라서, 복수 개의 플랫폼에 게재된, 선행된 임상시험의 데이터를 기반으로 유사한 결과를 매칭하여 특정 의약품에 대한 다양한 임상시험 데이터를 제공하는 기술의 개발이 필요한 실정이다.
본 발명은 전술한 문제점을 해결하기 위한 것으로서, 사용자에게 일 임상시험 데이터와 매칭되는 다른 임상시험 데이터를 제공하는 것을 일 목적으로 한다.
또한 본 발명은 복수 개의 플랫폼에 산재해 있는 임상시험 데이터를 수집하여 임상시험 데이터에 대한 데이터베이스를 구축하는 것을 일 목적으로 한다.
또한 본 발명은 임상시험 데이터의 매칭에 있어서 인덱스 별로 가중치를 부가함으로써 임상시험 데이터 사이의 유사도를 더 정확하게 측정하는 것을 일 목적으로 한다.
이러한 목적을 달성하기 위한 본 발명은 서버가 임상시험 데이터를 유사도에 따라 매칭하는 방법에 있어서, 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 a 단계, 상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 b 단계, 상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하는 c 단계, 상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하여 상기 제1 임상시험 데이터와 상기 제2 임상시험 데이터를 매칭하는 d 단계 및 상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 수정하는 e 단계를 포함하는 것을 일 특징으로 한다.
또한 본 발명은 임상시험 데이터를 유사도에 따라 매칭하는 장치에 있어서, 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 데이터 수신부, 상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 데이터 추출부, 상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하고, 상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하는 연산부 및 상기 제1 임상시험 데이터와 유사한 상기 제2 임상시험 데이터를 매칭하며, 상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 변경하는 데이터 매칭부를 포함하는 것을 일 특징으로 한다.
전술한 바와 같은 본 발명에 의하면, 일 임상시험 데이터와 매칭되는 다른 임상시험 데이터를 제공하여 사용자가 보다 다양한 임상시험 데이터를 제공받을 수 있다.
또한 본 발명은 복수 개의 플랫폼에 산재해 있는 임상시험 데이터를 수집하여 임상시험 데이터에 대한 데이터베이스를 구축할 수 있다.
또한 본 발명은 임상시험 데이터의 매칭에 있어서 인덱스 별로 가중치를 부가함으로써 임상시험 데이터 사이의 유사도를 더 정확하게 측정하여, 임상시험 결과의 매칭 정확도를 향상시킬 수 있다.
도 1은 본 발명의 일 실시 예에 의한 임상시험 데이터 매칭 장치의 구성을 도시한 구성도,
도 2는 본 발명의 일 실시 예에 의한 임상시험 데이터 매칭 방법의 순서도,
도 3은 본 발명의 일 실시 예에 의한 유사도 연산 방법의 순서도,
도 4는 본 발명의 일 실시 예에 의한 필드 별 가중치를 연산하는 방법의 순서도,
도 5 내지 도 7는 본 발명의 일 실시 예에 의한 디스플레이부에 표시되는 임상시험 데이터를 도시한 도면이다.
전술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되며, 이에 따라 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 상세한 설명을 생략한다.
도면에서 동일한 참조부호는 동일 또는 유사한 구성요소를 가리키는 것으로 사용되며, 명세서 및 특허청구의 범위에 기재된 모든 조합은 임의의 방식으로 조합될 수 있다. 그리고 다른 식으로 규정하지 않는 한, 단수에 대한 언급은 하나 이상을 포함할 수 있고, 단수 표현에 대한 언급은 또한 복수 표현을 포함할 수 있음이 이해되어야 한다.
본 명세서에서 사용되는 용어는 단지 특정 예시적 실시 예들을 설명할 목적을 가지고 있으며 한정할 의도로 사용되는 것이 아니다. 본 명세서에서 사용된 바와 같은 단수적 표현들은 또한, 해당 문장에서 명확하게 달리 표시하지 않는 한, 복수의 의미를 포함하도록 의도될 수 있다. 용어 "및/또는," "그리고/또는"은 그 관련되어 나열되는 항목들의 모든 조합들 및 어느 하나를 포함한다. 용어 "포함한다", "포함하는", "포함하고 있는", "구비하는", "갖는", "가지고 있는" 등은 내포적 의미를 갖는 바, 이에 따라 이러한 용어들은 그 기재된 특징, 정수, 단계, 동작, 요소, 및/또는 컴포넌트를 특정하며, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 컴포넌트, 및/또는 이들의 그룹의 존재 혹은 추가를 배제하지 않는다. 본 명세서에서 설명되는 방법의 단계들, 프로세스들, 동작들은, 구체적으로 그 수행 순서가 확정되는 경우가 아니라면, 이들의 수행을 논의된 혹은 예시된 그러한 특정 순서로 반드시 해야 하는 것으로 해석돼서는 안 된다. 추가적인 혹은 대안적인 단계들이 사용될 수 있음을 또한 이해해야 한다.
또한, 각각의 구성요소는 각각 하드웨어 프로세서로 구현될 수 있고, 위 구성요소들이 통합되어 하나의 하드웨어 프로세서로 구현될 수 있으며, 또는 위 구성요소들이 서로 조합되어 복수 개의 하드웨어 프로세서로 구현될 수도 있다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시 예를 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시 예에 의한 임상시험 데이터 매칭 장치의 구성을 도시한 도면이다. 도 1을 참조하면, 임상시험 데이터 매칭 장치는 데이터 수신부(110), 데이터 추출부(130), 연산부(150), 데이터 매칭부(170), 그리고 디스플레이부(190)를 포함할 것이다.
데이터 수신부(110)는 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서 제1 임상시험 데이터를 수신할 수 있다. 보다 구체적으로 데이터 수신부(110)는 식품의약품안전처에서 식약처 임상시험 승인 정보를, CRIS(Clinical Research Information Service)에서 임상연구 등록 정보를, Clinical Trials.gov(A Service of the U.S. National Institutes of Health)에서 글로벌 임상연구 등록 정보를 수신할 수 있다.
데이터 수신부(110)는 정기적 혹은 비정기적으로 상기 사이트에 업로드 된 제1 임상시험 데이터를 수신할 수 있다.
데이터 추출부(130)는 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하고, 이를 데이터베이스에 저장할 수 있다. 데이터 추출부(130)는 제1 임상시험 데이터를 크롤링하여 데이터에서 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구 또는 생체조직 정보를 포함하는 제1 유효 데이터를 추출할 수 있다.
예를 들어, 데이터 추출부(130)는 시험 단계에 대한 유효 데이터를 추출함에 있어서 시험 단계의 값이 존재하지 않으면 생동|연구자 임상시험을 유효 데이터로 하고, 'Phase 3'의 값이 존재하면 문자열을 제거하고 숫자만 추출하여 3을 유효 데이터로 할 수 있다. 또한 이 외의 다른 유효 데이터의 경우 값이 없으면 None을 설정할 수 있다.
데이터 추출부(130)는 임상시험 데이터 관리를 효율적으로 수행하기 위하여, 제1 유효 데이터를 표준화할 수 있다. 데이터 추출부(130)는 기 생성된 임상시험 용어 데이터베이스를 이용하여 제1 유효 데이터를 표준화할 수 있다. 임상시험 용어 데이터베이스는 임상시험 용어에 대한 한/영 변환 정보, 동의어, 약어, 주요 키워드 등을 포함하여 동일한 의미를 갖는 다른 용어를 균일화시켜 임상시험 데이터의 통일성을 향상시킬 수 있다.
또한 임상시험 데이터, 논문, 특허와 같이 다양한 데이터에 명시되는 기관, 연구자, 소속, 그리고 연락처가 표준화되어 있지 않아 데이터 추출부(130)는 현재 공개되어 있는 기관명, 연구자 정보가 저장된 데이터베이스를 이용하여 기관, 연구자, 소속, 그리고 연락처를 표준화할 수 있다.
데이터 추출부(130)는 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구, 생체조직 정보를 필드로 하는 인덱스 테이블을 생성하고, 제1 유효 데이터를 인덱싱하여 인덱스 테이블을 업데이트하며, 이를 데이터베이스에 저장할 것이다. 이 때 인덱스 테이블은 데이터베이스에 저장되는 데이터 관리를 효율적으로 하기 위한 것으로 기본적으로 데이터베이스에 저장된다. 데이터 추출부(130)는 제1 유효 데이터에 대한 인덱스 테이블을 업데이트할 때, 매칭 상태를 더 저장할 수 있다. 매칭 상태는 매칭 필요 상태, 매칭 완료 상태, 매칭 없음 상태를 포함할 수 있다.
연산부(150)는 제1 유효 데이터와 데이터베이스에 기 저장된 다른 제2 유효 데이터 사이의 제1 유사도를 연산할 수 있다. 연산부(150)는 유사도를 연산하기 위해 먼저 유효 데이터를 자연어 처리할 수 있다. 자연어 처리는 컴퓨터와 같은 기계가 인간의 언어를 분석함으로써 해석하고 모사하는 기술로, 단어들을 DTM, Word2Vec 등과 같은 방법으로 수치화하여 표현하고, 단어 간의 차이를 유클리드 거리, 코사인 유사도 등으로 연산하여 유사도를 연산할 수 있다.
연산부(150)는 제1 유효 데이터와 제2 유효 데이터의 필드 값에 대한 제1 유사도를 연산할 수 있다. 연산부(150)는 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구, 생체조직 정보에 대한 필드 값에 대한 제1 유사도를 각각 연산할 것이다. 연산부(150)는 제1 유사도를 연산함에 있어서 종래의 방법을 따른다.
연산부(150)는 제1 및 제2 유효 데이터에서 필드 값 별로 연산된 제1 유사도에 필드 별 가중치를 적용하여 제2 유사도를 산출할 수 있다. 가중치는 임상시험 데이터의 유사도를 결정하는 데 중요한 필드 값에서 높게 설정될 것이다. 예를 들어 임상시험 데이터의 타이틀은 특정 포맷을 기준으로 작성되어 타이틀이 포함하는 정보의 종류가 명확하며, 상기 정보는 임상시험에 대한 정보가 축약된 것이기 때문에 타이틀에 대한 가중치가 가장 크게 설정될 수 있다.
연산부(150)는 가중치로 관리자가 기 설정한 값을 이용할 수도 있고, 강화학습을 통해 가중치를 설정할 수도 있다. 강화학습은 특정 환경 내에서 정의된 에이전트(Agent)가 현재의 상태(State)를 인식하여, 선택 가능한 행동(Action) 중 보상을 최대화하는 행동 또는 행동 순서를 선택하는 방법이다.
연산부(150)는 데이터베이스에 저장된 이미 매칭된 임상시험 데이터에 대응하는 유효 데이터의 필드 값에 대한 제1 유사도와 해당 임상시험 데이터의 매칭 과정에 있어서 사용자의 검증 정보를 이용하여 가중치 설정 환경을 생성할 수 있다.
연산부(150)는 제1 임상시험 데이터에 대응하는 유효 데이터의 필드 값의 제1 유사도를 현재 상태(State)로, 각 필드 값에 대한 가중치를 행동(Action)으로 하여, 에이전트가 필드 값에 대하여 보상을 최대로 하는 가중치를 선택했을 때, 제1 유사도에 가중치를 적용하여 제2 유사도를 연산한 결과, 가장 높은 유사도 또는 기 설정된 임계 값 이상의 값을 갖는 유사도에 대응하는 적어도 하나의 제2 임상시험 데이터에 대한 사용자의 검증 결과를 이용하여 에이전트에게 보상을 제공할 수 있다.
연산부(150)는 상기 과정을 수행하기 위해 강화학습 모델을 생성하는 모델 생성부(151), 행동 선택부(153), 그리고 보상 제공부(155)를 포함할 수 있다.
모델 생성부(151)는 데이터베이스에 저장된 임상시험 데이터에 대응하는 적어도 하나의 유효 데이터의 필드 값에 대한 제1 유사도를 이용하여 강화학습 모델을 생성할 수 있다. 모델 생성부(151)는 유효 데이터의 필드 값에 대한 제1 유사도에 필드 별 가중치를 적용하여 생성되는 제2 유사도에 따라, 기준이 되는 제1 임상시험 데이터와 가장 높은 유사도를 갖거나 기 설정된 임계 값 이상의 유사도를 갖는 제2 임상시험 데이터에 대한 사용자의 검증 결과에 따른 보상을 통해 강화학습 모델을 생성할 수 있다. 나아가 모델 생성부(151)는 행동 선택부(153)가 보상을 최대로 하는 가중치를 설정할 수 있도록 반복적인 학습을 수행하여 강화학습 모델을 강화할 수 있다.
행동 선택부(153)는 보상을 최대로 하는 필드 별 가중치를 설정할 수 있다.
보상 제공부(155)는 행동 선택부(153)에서 제1 임상시험 데이터의 제1 유효 데이터의 필드 값의 제1 유사도에, 설정된 필드 별 가중치를 반영하여 제2 유사도를 연산하고, 제2 유사도를 통해 추출된 적어도 하나의 제2 임상시험 데이터에 대한 사용자의 검증 결과를 이용하여 보상을 산정할 수 있다. 따라서 보상 제공부(155)는 사용자의 피드백을 기반으로 보상을 산정할 것이다.
데이터 매칭부(170)는 제1 임상시험 데이터와 유사하다고 판단된 제2 임상시험 데이터를 매칭할 수 있다. 데이터 매칭부(170)는 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 변경할 것이다.
디스플레이부(190)는 제1 임상시험 데이터, 그리고 제1 임상시험 데이터와 매칭된 적어도 하나의 제2 임상시험 데이터를 화면에 표시할 것이다. 디스플레이부(190)는 제1 및 제2 임상시험 데이터를 도 5 내지 도 7과 같이 표시할 수 있다.
이하에서는 도 2 내지 도 4를 이용하여, 임상시험 데이터 매칭 방법을 설명한다. 임상시험 데이터 매칭 방법에 관한 설명에 있어서 전술한 임상시험 데이터 매칭 장치와 중복되는 세부 실시 예는 생략될 수 있다. 또한 임상시험 데이터 매칭 방법의 주체인 임상시험 데이터 매칭 장치는 서버로 구현될 수 있는 바, 이하에서는 설명의 편의를 위하여 서버로 명명한다.
단계 100에서, 서버는 임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서 제1 임상시험 데이터를 수신할 수 있다. 보다 구체적으로 데이터 수신부(110)는 식품의약품안전처에서 식약처 임상시험 승인 정보를, CRIS(Clinical Research Information Service)에서 임상연구 등록 정보를, Clinical Trials.gov(A Service of the U.S. National Institutes of Health)에서 글로벌 임상연구 등록 정보를 수신할 수 있다.
단계 200에서, 서버는 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하고, 이를 데이터베이스에 저장할 수 있다. 서버는 제1 임상시험 데이터를 크롤링하여 데이터에서 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구 또는 생체조직 정보를 포함하는 제1 유효 데이터를 추출할 수 있다.
또한 서버는 임상시험 데이터 관리를 효율적으로 수행하기 위하여, 제1 유효 데이터를 표준화할 수 있다. 서버는 기 생성된 임상시험 용어 데이터베이스를 이용하여 제1 유효 데이터를 표준화할 수 있다. 임상시험 용어 데이터베이스는 임상시험 용어에 대한 한/영 변환 정보, 동의어, 약어, 주요 키워드 등을 포함하여 동일한 의미를 갖는 다른 용어를 균일화시켜 임상시험 데이터의 통일성을 향상시킬 수 있다.
또한 임상시험 데이터, 논문, 특허와 같이 다양한 데이터에 명시되는 기관, 연구자, 소속, 그리고 연락처가 표준화되어 있지 않아 서버는 현재 공개되어 있는 기관명, 연구자 정보가 저장된 데이터베이스를 이용하여 기관, 연구자, 소속, 연락처를 표준화할 수 있다.
서버는 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구, 생체조직 정보를 필드로 하는 인덱스 테이블을 생성하고, 제1 유효 데이터를 인덱싱하여 인덱스 테이블을 업데이트하며, 이를 데이터베이스에 저장할 것이다. 이 때 인덱스 테이블은 데이터베이스에 저장되는 데이터 관리를 효율적으로 하기 위한 것으로 기본적으로 데이터베이스에 저장된다.
나아가 서버는 제1 유효 데이터에 대한 인덱스 테이블을 업데이트할 때, 매칭 상태를 더 저장할 수 있다. 매칭 상태는 매칭 필요 상태, 매칭 완료 상태, 매칭 없음 상태를 포함할 수 있다.
단계 300에서, 서버는 제1 유효 데이터와 데이터베이스에 기 저장된 다른 제2 유효 데이터 사이의 제1 유사도를 연산할 수 있다. 서버는 제1 유사도를 연산하기 위해 먼저 유효 데이터를 자연어 처리(S310)할 수 있다.
단계 320에서 서버는 제1 유효 데이터와 제2 유효 데이터의 필드 값에 대한 제1 유사도를 연산할 수 있다. 서버는 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구, 생체조직 정보에 대한 필드 값에 대한 유사도를 각각 연산할 것이다. 서버는 유사도를 연산함에 있어서 종래의 방법을 따를 수 있다.
단계 330에서 서버는 제1 및 제2 유효 데이터에서 필드 값 별로 연산된 제1 유사도에 필드 별 가중치를 적용하여 제2 유사도를 산출할 수 있다. 가중치는 임상시험 데이터의 유사도를 결정하는 데 중요한 필드 값에서 높게 설정될 것이다.
단계 331에서 서버는 데이터베이스에 저장된 이미 매칭된 임상시험 데이터에 대응하는 유효 데이터의 필드 값에 대한 제1 유사도와 해당 임상시험 데이터의 매칭 과정에 있어서의 사용자의 검증 정보를 이용하여 가중치 설정 환경을 생성할 수 있다.
단계 333에서, 서버는 데이터베이스에 저장된 임상시험 데이터에 대응하는 적어도 하나의 유효 데이터의 필드 값에 대한 제1 유사도를 이용하여 강화학습 모델을 생성할 수 있다. 서버는 유효 데이터의 필드 값에 대한 제1 유사도에 필드 별 가중치를 적용했을 경우 산출되는 제2 유사도를 이용하여, 기준이 되는 제1 임상시험 데이터와 가장 높은 유사도를 갖거나 기 설정된 임계 값 이상의 유사도를 갖는 제2 임상시험 데이터에 대한 사용자의 검증 결과에 따른 보상을 통해 강화학습 모델을 생성할 수 있다.
단계 335에서, 서버는 보상을 최대로 하는 필드 별 가중치를 설정할 수 있다.
단계 337에서, 서버는 제1 임상시험 데이터의 제1 유효 데이터의 필드 값의 제1 유사도에, 설정된 필드 별 가중치를 반영하여 제2 유사도를 연산하고, 제2 유사도를 통해 추출된 적어도 하나의 제2 임상시험 데이터에 대한 사용자의 검증 결과를 이용하여 보상을 산정할 수 있다.
단계 331 내지 337을 반복하여, 서버는 가장 높은 보상을 받을 수 있는 필드 별 가중치를 설정하여 제2 유사도를 연산할 수 있다.
단계 400에서, 서버는 제1 임상시험 데이터와 유사하다고 판단된 제2 임상시험 데이터를 매칭하고, 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 변경(S500)할 것이다. 서버는 제1 임상시험 데이터와 매칭되는 제2 임상시험 데이터가 존재하면, 제1 및 제2 임상시험 데이터의 매칭 상태를 매칭 완료 상태로 변경하고, 제2 임상시험 데이터가 존재하지 않으면 제1 임상시험 데이터의 매칭 상태를 매칭 없음 상태로 변경할 것이다.
서버는 매칭 완료 상태의 제1 및 제2 임상시험 데이터에 대한 검증 요청 신호를 적어도 하나의 관리자 단말에 전송하고, 관리자 단말에 제1 및 제2 임상시험 데이터와 매칭 확정/매칭 취소 등의 버튼을 표시하여 사용자가 검증 결과를 보다 용이하게 선택할 수 있도록 한다.
나아가 서버는 사용자 단말로부터 추가 메모 정보를 수신하는 경우, 제1 및 제2 임상시험 데이터에 이를 더할 수 있다.
단계 600에서, 서버는 제1 임상시험 데이터, 그리고 제1 임상시험 데이터와 매칭된 적어도 하나의 제2 임상시험 데이터를 화면에 표시할 것이다.
본 명세서와 도면에 개시된 본 발명의 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.

Claims (6)

  1. 서버가 임상시험 데이터를 유사도에 따라 매칭하는 방법에 있어서,
    임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 a 단계;
    상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 b 단계;
    상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하는 c 단계;
    상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하여 상기 제1 임상시험 데이터와 상기 제2 임상시험 데이터를 매칭하는 d 단계; 및
    상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 수정하는 e 단계를 포함하는 임상시험 데이터 매칭 방법.
  2. 제1항에 있어서,
    상기 b 단계는,
    상기 제1 임상시험 데이터에서 타이틀, 시험 단계, 의약품, 피험자 성별, 나이, 시험 방식, 시험 도구 또는 생체조직 중 적어도 하나를 크롤링하여 제1 유효 데이터를 추출하는 단계;
    상기 크롤링 된 데이터를 인덱싱하여 인덱스 테이블을 업데이트하고, 데이터베이스에 저장하는 단계를 포함하는 임상시험 데이터 매칭 방법.
  3. 제2항에 있어서,
    상기 c 단계는,
    상기 제1 및 제2 유효 데이터 간의 제1 유사도와, 상기 인덱스 테이블의 필드 각각에 기 부여된 가중치를 적용하여 상기 제1 및 제2 유효 데이터의 제2 유사도를 연산하는 임상시험 데이터 매칭 방법.
  4. 제1항에 있어서,
    상기 제1 유효 데이터는 상기 매칭 상태를 더 포함하여,
    상기 e 단계에서, 상기 매칭 상태를 완료 상태로 변경하되,
    상기 매칭 상태는 매칭 필요 상태, 매칭 완료 상태, 매칭 없음 상태를 포함하는 임상시험 데이터 매칭 방법.
  5. 제1항에 있어서,
    상기 매칭 완료 상태의 제1 및 제2 임상시험 데이터와 검증 요청 신호를 적어도 하나의 관리자 단말에 전송하는 단계;
    상기 관리자 단말로부터 제1 및 제2 임상시험 데이터의 검증 결과를 수신하는 단계를 더 포함하는 임상시험 데이터 매칭 방법.
  6. 임상시험 데이터를 유사도에 따라 매칭하는 장치에 있어서,
    임상시험 데이터가 포함된 적어도 하나의 웹 사이트에서, 제1 임상시험 데이터를 수신하는 데이터 수신부;
    상기 제1 임상시험 데이터를 크롤링하여 제1 유효 데이터를 추출하여 데이터베이스에 저장하는 데이터 추출부;
    상기 제1 유효 데이터와 상기 데이터베이스에 저장된 제2 유효 데이터 사이의 유사도를 연산하고, 상기 유사도가 기 설정된 임계 값 이상이면, 상기 제1 임상시험 데이터와 상기 제2 유효 데이터에 대응하는 제2 임상시험 데이터가 유사하다고 판단하는 연산부; 및
    상기 제1 임상시험 데이터와 유사한 상기 제2 임상시험 데이터를 매칭하며, 상기 제1 및 제2 임상시험 데이터의 매칭 상태를 완료 상태로 변경하는 데이터 매칭부를 포함하는 임상시험 데이터 매칭 장치.
PCT/KR2020/005672 2019-12-30 2020-04-29 임상시험 데이터 매칭 방법 및 장치 WO2021137359A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190177425A KR20210084909A (ko) 2019-12-30 2019-12-30 임상시험 데이터 매칭 방법 및 장치
KR10-2019-0177425 2019-12-30

Publications (1)

Publication Number Publication Date
WO2021137359A1 true WO2021137359A1 (ko) 2021-07-08

Family

ID=76686601

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/005672 WO2021137359A1 (ko) 2019-12-30 2020-04-29 임상시험 데이터 매칭 방법 및 장치

Country Status (2)

Country Link
KR (2) KR20210084909A (ko)
WO (1) WO2021137359A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230100462A (ko) * 2021-12-28 2023-07-05 (주)메디아이플러스 다국가 임상데이터 표준화 방법 및 장치
KR102464893B1 (ko) * 2022-06-03 2022-11-09 주식회사 클래스액트 임상 참여 조건의 정형화를 위한 데이터 파이프라인 처리 방법
KR102625111B1 (ko) * 2023-04-18 2024-01-15 주식회사 티지 다단계 개체분리식 애완동물 의약품 임상시험 온라인 자동화 시스템 및 그 동작 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090198676A1 (en) * 2006-06-01 2009-08-06 Microsoft Corporation Indexing Documents for Information Retrieval
KR101609716B1 (ko) * 2014-11-28 2016-04-06 주식회사 씨알에스큐브 통합 데이터 허브 기반 의료 데이터 수집 서비스 제공 방법 및 시스템
KR20180013095A (ko) * 2016-07-28 2018-02-07 건국대학교 산학협력단 유사 텍스트를 포함한 웹 페이지 수집을 위한 포털 사이트 기반 웹 크롤링 방법 및 장치
KR20190075067A (ko) * 2016-09-22 2019-06-28 엔퍼런스, 인크. 의미 정보의 시각화 및 생명 과학 엔티티들 사이의 현저한 연관을 나타내는 임시 신호의 추론을 위한 시스템, 방법 및 컴퓨터 판독 가능 매체
KR102035658B1 (ko) * 2019-04-01 2019-10-23 한국과학기술정보연구원 신약 재창출 후보 추천 시스템 및 이 시스템의 각 기능을 실행시키기 위해 매체에 저장된 컴퓨터 프로그램

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170110244A (ko) * 2016-03-23 2017-10-11 황규민 다수의 의료기관간에 협업체계 구축을 위한 웹기반의 폐암환자 임상연구 데이터 관리시스템 및 그 제어방법
KR102070030B1 (ko) * 2018-02-05 2020-03-02 재단법인 전통천연물기반 유전자동의보감 사업단 임상시험을 위한 데이터 관리 방법 및 장치
KR101953275B1 (ko) * 2018-04-03 2019-05-22 사회복지법인 삼성생명공익재단 임상 연구 데이터 제공 방법 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090198676A1 (en) * 2006-06-01 2009-08-06 Microsoft Corporation Indexing Documents for Information Retrieval
KR101609716B1 (ko) * 2014-11-28 2016-04-06 주식회사 씨알에스큐브 통합 데이터 허브 기반 의료 데이터 수집 서비스 제공 방법 및 시스템
KR20180013095A (ko) * 2016-07-28 2018-02-07 건국대학교 산학협력단 유사 텍스트를 포함한 웹 페이지 수집을 위한 포털 사이트 기반 웹 크롤링 방법 및 장치
KR20190075067A (ko) * 2016-09-22 2019-06-28 엔퍼런스, 인크. 의미 정보의 시각화 및 생명 과학 엔티티들 사이의 현저한 연관을 나타내는 임시 신호의 추론을 위한 시스템, 방법 및 컴퓨터 판독 가능 매체
KR102035658B1 (ko) * 2019-04-01 2019-10-23 한국과학기술정보연구원 신약 재창출 후보 추천 시스템 및 이 시스템의 각 기능을 실행시키기 위해 매체에 저장된 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR102521961B1 (ko) 2023-04-14
KR20220070398A (ko) 2022-05-31
KR20210084909A (ko) 2021-07-08

Similar Documents

Publication Publication Date Title
WO2021137359A1 (ko) 임상시험 데이터 매칭 방법 및 장치
CN110837550B (zh) 基于知识图谱的问答方法、装置、电子设备及存储介质
Romney et al. Cultural universals: Measuring the semantic structure of emotion terms in English and Japanese
He et al. Combining evidence for automatic web session identification
Kernighan et al. A spelling correction program based on a noisy channel model
Doane et al. Expertise in a computer operating system: Conceptualization and performance
KR100919912B1 (ko) 의미론적 지식의 평가, 교육, 및 습득을 위한 시스템 및방법
US20080208836A1 (en) Regression framework for learning ranking functions using relative preferences
Feinberg et al. Guidelines for interpreting and reporting subscores
US20210406687A1 (en) Method for predicting attribute of target object based on machine learning and related device
Vu et al. Linguistically inspired roadmap for building biologically reliable protein language models
CN114676233A (zh) 基于骨骼肌知识图谱的医疗自动问答方法
JP6908977B2 (ja) 医療情報処理システム、医療情報処理装置及び医療情報処理方法
CN112836019B (zh) 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质
Woolley et al. Application of artificial intelligence to systematics: SYSTEX—a prototype expert system for species identification
CN117407682A (zh) 医学模型评估方法、装置、电子设备和存储介质
Chen et al. Constructing a web-based employee training expert system with data mining approach
WO2014021656A1 (ko) 패스웨이 구축 시스템 및 방법
WO2017122872A1 (ko) 전자 출판물에 대한 정보를 생성하는 장치 및 방법
JP7184093B2 (ja) 熟練指数提供装置、熟練指数提供方法、及びプログラム
JP7230622B2 (ja) 指標値付与装置、指標値付与方法及びプログラム
Mei et al. An XML plagiarism detection model for C program
Korabik et al. 11 Best Practices in Scale Translation and Establishing Measurement Equivalence
Wennerberg Aligning medical domain ontologies for clinical query extraction
Van Oostendorp et al. Navigating in a virtual environment with model-generated support

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20909850

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20909850

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 16/01/2023)

122 Ep: pct application non-entry in european phase

Ref document number: 20909850

Country of ref document: EP

Kind code of ref document: A1