KR102571400B1 - Apparatus and method for retrieval of clinical trial data - Google Patents

Apparatus and method for retrieval of clinical trial data Download PDF

Info

Publication number
KR102571400B1
KR102571400B1 KR1020220116157A KR20220116157A KR102571400B1 KR 102571400 B1 KR102571400 B1 KR 102571400B1 KR 1020220116157 A KR1020220116157 A KR 1020220116157A KR 20220116157 A KR20220116157 A KR 20220116157A KR 102571400 B1 KR102571400 B1 KR 102571400B1
Authority
KR
South Korea
Prior art keywords
synonym
keywords
search
translation
clinical trial
Prior art date
Application number
KR1020220116157A
Other languages
Korean (ko)
Inventor
송남구
정지희
Original Assignee
(주)메디아이플러스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)메디아이플러스 filed Critical (주)메디아이플러스
Priority to KR1020220116157A priority Critical patent/KR102571400B1/en
Application granted granted Critical
Publication of KR102571400B1 publication Critical patent/KR102571400B1/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

검색어의 동의어 및 번역어를 이용하여 임상시험 데이터를 검색할 수 있는 임상시험 데이터 검색 장치 및 방법이 개시된다. 일 실시예에 따른 임상시험 데이터 검색 장치는 데이터 입력 및 출력을 수행하는 인터페이스부; 인터페이스부를 통하여 사용자 검색어를 입력 받아 동일 또는 유사한 하나 이상의 검색 키워드를 생성하는 키워드 생성부; 하나 이상의 검색 키워드 중 사용자가 선택한 선택 키워드의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성하는 동의어 생성부; 하나 이상의 동의어 키워드를 소정의 언어로 번역하여 하나 이상의 번역 키워드를 생성하는 번역부; 및 하나 이상의 번역 키워드를 기초로 데이터베이스로부터 임상시험 데이터를 검색하는 데이터 검색부를 포함할 수 있다.Disclosed are clinical trial data retrieval apparatuses and methods capable of retrieving clinical trial data using synonyms and translations of search words. An apparatus for retrieving clinical trial data according to an embodiment includes an interface unit for inputting and outputting data; a keyword generation unit receiving a user search word through the interface unit and generating one or more identical or similar search keywords; a synonym generation unit for generating one or more synonym keywords by searching for synonyms of a selected keyword selected by a user from among one or more search keywords; a translation unit generating one or more translation keywords by translating one or more synonymous keywords into a predetermined language; and a data search unit that searches clinical trial data from the database based on one or more translation keywords.

Description

임상시험 데이터 검색 장치 및 방법{Apparatus and method for retrieval of clinical trial data}Apparatus and method for retrieval of clinical trial data}

임상시험 데이터 검색을 위한 기술로서 특히, 검색어의 동의어 및 번역어를 이용하여 임상시험 데이터를 검색할 수 있는 임상시험 데이터 검색 장치 및 방법에 관한 것이다.As a technology for retrieval of clinical trial data, in particular, it relates to a clinical trial data retrieval apparatus and method capable of searching for clinical trial data using synonyms and translations of search words.

등록특허 제 10-2070030 호는 임상시험에 대한 데이터로 데이터베이스를 생성하고, 생성된 데이터베이스를 기반으로 수행하고자 하는 임상시험에 적합한 프로토콜을 검색하여 설계하는 방법을 개시하고 있다. 그러나, 선행발명은 검색어를 프로토콜 요소, 프로토콜 요소의 최하위 계층까지의 세부 요소, 표준 코드, 임상시험의 주제, 임상시험에서 사용될 약물 등 임상시험과 관련된 검색어로 한정하고 있어 약물, 질환 등 동의어와 다국어까지는 고려하고 있지 않고 있다.Registered Patent No. 10-2070030 discloses a method of creating a database with clinical trial data, searching for and designing a protocol suitable for a clinical trial to be performed based on the generated database. However, prior inventions limit search terms to search words related to clinical trials, such as protocol elements, detailed elements up to the lowest level of protocol elements, standard codes, subjects of clinical trials, and drugs to be used in clinical trials. It is not considered until now.

검색어의 동의어 및 번역어를 이용하여 임상시험 데이터를 검색할 수 있는 임상시험 데이터 검색 장치 및 방법을 제공하는데 목적이 있다.An object of the present invention is to provide a clinical trial data retrieval device and method capable of searching clinical trial data using synonyms and translations of search terms.

일 양상에 따르면, 임상시험 데이터 검색 장치는 데이터 입력 및 출력을 수행하는 인터페이스부; 인터페이스부를 통하여 사용자 검색어를 입력 받아 동일 또는 유사한 하나 이상의 검색 키워드를 생성하는 키워드 생성부; 하나 이상의 검색 키워드 중 사용자가 선택한 선택 키워드의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성하는 동의어 생성부; 하나 이상의 동의어 키워드를 소정의 언어로 번역하여 하나 이상의 번역 키워드를 생성하는 번역부; 및 하나 이상의 번역 키워드를 기초로 데이터베이스로부터 임상시험 데이터를 검색하는 데이터 검색부를 포함할 수 있다.According to one aspect, an apparatus for retrieving clinical trial data includes an interface unit for inputting and outputting data; a keyword generation unit receiving a user search word through the interface unit and generating one or more identical or similar search keywords; a synonym generation unit for generating one or more synonym keywords by searching for synonyms of a selected keyword selected by a user from among one or more search keywords; a translation unit generating one or more translation keywords by translating one or more synonymous keywords into a predetermined language; and a data search unit that searches clinical trial data from the database based on one or more translation keywords.

키워드 생성부는 인터페이스부를 통하여 사용자 검색어의 동일 또는 유사한 하나 이상의 후보 키워드를 출력하며, 사용자로부터 하나 이상의 후보 키워드 중 적어도 하나를 선택하는 입력을 수신하여 하나 이상의 검색 키워드를 생성할 수 있다.The keyword generation unit may output one or more candidate keywords that are the same as or similar to the user search word through the interface unit, and generate one or more search keywords by receiving an input for selecting at least one of the one or more candidate keywords from the user.

키워드 생성부는 사용자로부터 하나 이상의 후보 키워드 중 어느 하나도 선택하지 않는 입력을 수신하는 경우, 사용자 검색어를 기초로 검색 키워드를 생성할 수 있다.The keyword generation unit may generate a search keyword based on the user's search word when receiving an input not selecting any one of one or more candidate keywords from the user.

동의어 생성부는 소정 언어에 대한 동의어 테이블을 보유하고 있으며, 동의어 테이블에서 선택 키워드의 언어와 동일한 언어의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성할 수 있다.The synonym generation unit has a synonym table for a predetermined language, and searches synonyms of the same language as the language of the selected keyword in the synonym table to generate one or more synonym keywords.

동의어 생성부는 데이터베이스에 신규 임상시험 데이터가 업데이트 되는 경우, 신규 임상시험 데이터에 포함된 하나 이상의 단어를 추출하며, 추출된 하나 이상의 단어 중 동의어 테이블에 포함되어 있지 않은 새로운 단어를 검색하며, 새로운 단어가 검색된 경우, 단어의 유사도를 추정하도록 학습된 인공 신경망을 이용하여 동의어 테이블에 포함된 하나 이상의 단어 중 유사도가 소정 임계값 이상인 하나 이상의 유사 단어를 추출하며, 새로운 단어 및 하나 이상의 유사 단어를 매핑할 수 있다.The synonym generation unit extracts one or more words included in the new clinical trial data when new clinical trial data is updated in the database, searches for new words that are not included in the synonym table among the one or more extracted words, and finds new words. If it is found, one or more similar words having a similarity of at least a predetermined threshold value are extracted from among one or more words included in the synonym table using an artificial neural network trained to estimate the similarity of words, and a new word and one or more similar words may be mapped. there is.

동의어 생성부는 인터페이스부를 통하여 새로운 단어 및 하나 이상의 유사 단어를 출력하며, 사용자로부터 하나 이상의 유사 단어가 새로운 단어의 동의어인지에 대한 확인 데이터를 입력 받으며, 확인 데이터에 기초하여 새로운 단어를 동의어 테이블에 업데이트 할 수 있다.The synonym generation unit outputs a new word and one or more similar words through an interface unit, receives confirmation data from the user whether one or more similar words are synonyms of the new word, and updates the new word in the synonym table based on the confirmation data. can

단어의 유사도를 추정하도록 학습된 인공 신경망은 새로운 단어, 하나 이상의 유사 단어 및 확인 데이터에 기초하여 학습될 수 있다.An artificial neural network trained to estimate the similarity of words may be trained based on new words, one or more similar words, and validation data.

번역부는 생성된 하나 이상의 번역 키워드를 동의어 생성부로 전송하며, 동의어 생성부는 소정의 언어로 번역된 하나 이상의 번역 키워드 각각의 언어에 대한 동의어 테이블을 검색하여 하나 이상의 번역 키워드 각각에 대한 동의어를 검색하며, 하나 이상의 번역 키워드 중 적어도 하나에 대한 동의어가 검색되는 경우, 새롭게 검색된 동의어를 동의어 키워드에 추가할 수 있다.The translation unit transmits the generated one or more translation keywords to the synonym generation unit, and the synonym generation unit searches a synonym table for each language of the one or more translation keywords translated into a predetermined language and searches for a synonym for each of the one or more translation keywords, When a synonym for at least one of one or more translation keywords is searched for, the newly searched synonym may be added to the synonym keyword.

번역부는 동의어 키워드에 추가된 새롭게 검색된 동의어를 소정의 언어로 재번역하여 번역 키워드에 추가할 수 있다.The translation unit may re-translate newly searched synonyms added to the synonym keywords into a predetermined language and add the synonyms to the translation keywords.

일 양상에 따르면, 임상시험 데이터 검색 방법은 인터페이스를 통하여 사용자 검색어를 입력 받아 동일 또는 유사한 하나 이상의 검색 키워드를 생성하는 키워드 생성 단계; 하나 이상의 검색 키워드 중 사용자가 선택한 선택 키워드의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성하는 동의어 생성 단계; 하나 이상의 동의어 키워드를 소정의 언어로 번역하여 하나 이상의 번역 키워드를 생성하는 번역 단계; 및 하나 이상의 번역 키워드를 기초로 데이터베이스로부터 임상시험 데이터를 검색하는 데이터 검색 단계를 포함할 수 있다.According to one aspect, a clinical trial data search method includes a keyword generation step of generating one or more identical or similar search keywords by receiving a user search word through an interface; a synonym generating step of generating one or more synonym keywords by searching for a synonym of a selected keyword selected by a user from among one or more search keywords; a translation step of generating one or more translation keywords by translating one or more synonym keywords into a predetermined language; and a data search step of retrieving clinical trial data from the database based on one or more translation keywords.

키워드 생성 단계는 인터페이스를 통하여 사용자 검색어의 동일 또는 유사한 하나 이상의 후보 키워드를 출력하며, 사용자로부터 하나 이상의 후보 키워드 중 적어도 하나를 선택하는 입력을 수신하여 하나 이상의 검색 키워드를 생성할 수 있다.The keyword generating step may output one or more candidate keywords identical or similar to the user's search word through an interface, and may generate one or more search keywords by receiving an input for selecting at least one of the one or more candidate keywords from the user.

키워드 생성 단계는 사용자로부터 하나 이상의 후보 키워드 중 어느 하나도 선택하지 않는 입력을 수신하는 경우, 사용자 검색어를 기초로 검색 키워드를 생성할 수 있다.The keyword generating step may generate a search keyword based on the user's search word when an input not selecting any one of one or more candidate keywords is received from the user.

동의어 생성 단계는 보유하고 있는 소정 언어에 대한 동의어 테이블에서 선택 키워드의 언어와 동일한 언어의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성할 수 있다.In the synonym generation step, one or more synonym keywords may be generated by searching for synonyms of the same language as the language of the selected keyword in a synonym table for a predetermined language.

동의어 생성 단계는 데이터베이스에 신규 임상시험 데이터가 업데이트 되는 경우, 신규 임상시험 데이터에 포함된 하나 이상의 단어를 추출하며, 추출된 하나 이상의 단어 중 동의어 테이블에 포함되어 있지 않은 새로운 단어를 검색하며, 새로운 단어가 검색된 경우, 단어의 유사도를 추정하도록 학습된 인공 신경망을 이용하여 동의어 테이블에 포함된 하나 이상의 단어 중 유사도가 소정 임계값 이상인 하나 이상의 유사 단어를 추출하며, 새로운 단어 및 하나 이상의 유사 단어를 매핑할 수 있다.In the synonym generation step, when new clinical trial data is updated in the database, one or more words included in the new clinical trial data are extracted, new words that are not included in the synonym table are searched for among the one or more extracted words, and the new words are extracted. If is found, one or more similar words having a similarity of at least a predetermined threshold value are extracted from among one or more words included in the synonym table using an artificial neural network trained to estimate the similarity of words, and a new word and one or more similar words are mapped. can

동의어 생성 단계는 인터페이스를 통하여 새로운 단어 및 하나 이상의 유사 단어를 출력하며, 사용자로부터 하나 이상의 유사 단어가 새로운 단어의 동의어인지에 대한 확인 데이터를 입력 받으며, 확인 데이터에 기초하여 새로운 단어를 동의어 테이블에 업데이트할 수 있다.The synonym generation step outputs a new word and one or more similar words through an interface, receives confirmation data from the user whether the one or more similar words are synonyms of the new word, and updates the new word in the synonym table based on the confirmation data. can do.

단어의 유사도를 추정하도록 학습된 인공 신경망은 새로운 단어, 하나 이상의 유사 단어 및 확인 데이터에 기초하여 학습될 수 있다.An artificial neural network trained to estimate the similarity of words may be trained based on new words, one or more similar words, and validation data.

번역 단계는 생성된 하나 이상의 번역 키워드를 동의어 생성 단계로 전송하며, 동의어 생성 단계는 소정의 언어로 번역된 하나 이상의 번역 키워드 각각의 언어에 대한 동의어 테이블을 검색하여 하나 이상의 번역 키워드 각각에 대한 동의어를 검색하며, 하나 이상의 번역 키워드 중 적어도 하나에 대한 동의어가 검색되는 경우, 새롭게 검색된 동의어를 동의어 키워드에 추가할 수 있다.The translation step transmits the generated one or more translation keywords to the synonym generation step, and the synonym generation step retrieves a synonym table for each language of the one or more translation keywords translated into a predetermined language and generates a synonym for each of the one or more translation keywords. Search is performed, and when a synonym for at least one of one or more translation keywords is searched for, the newly searched synonym may be added to the synonym keyword.

번역 단계는 동의어 키워드에 추가된 새롭게 검색된 동의어를 소정의 언어로 재번역하여 번역 키워드에 추가할 수 있다.In the translation step, the newly searched synonym added to the synonym keyword may be retranslated into a predetermined language and added to the translation keyword.

선행된 임상시험을 단순 키워드 검색이 아닌 임상시험 특성에 맞는 다양한 다국어 키워드를 제공함으로써 임상시험에 적합한 최신 프로토콜을 검색하기 위한 시간과 비용을 줄일 수 있는 효과가 있다.By providing various multilingual keywords suitable for the characteristics of clinical trials rather than simple keyword searches for preceding clinical trials, it has the effect of reducing time and cost for searching for the latest protocols suitable for clinical trials.

도 1은 일 실시예에 따른 임상시험 데이터 검색 장치의 구성도이다.
도 2 및 도 3은 일 실시예에 키워드 방법을 설명하기 위한 구성도이다.
도 4는 일 예에 따른 임상시험 데이터 검색 장치의 동작을 설명하기 위한 예시도이다.
도 5는 일 실시예에 따른 임상시험 데이터 검색 방법을 도시한 흐름도이다.
1 is a configuration diagram of a clinical trial data retrieval device according to an embodiment.
2 and 3 are configuration diagrams for explaining a keyword method according to an embodiment.
4 is an exemplary diagram for explaining an operation of a clinical trial data retrieval device according to an example.
5 is a flowchart illustrating a clinical trial data search method according to an embodiment.

이하, 첨부된 도면을 참조하여 본 발명의 일 실시예를 상세하게 설명한다. 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로, 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings. In describing the present invention, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the gist of the present invention, the detailed description will be omitted. In addition, the terms to be described later are terms defined in consideration of functions in the present invention, which may vary according to the intention or custom of a user or operator. Therefore, the definition should be made based on the contents throughout this specification.

이하, 임상시험 데이터 검색 장치 및 방법의 실시예들을 도면들을 참고하여 자세히 설명한다.Hereinafter, embodiments of a clinical trial data retrieval apparatus and method will be described in detail with reference to drawings.

도 1은 일 실시예에 따른 임상시험 데이터 검색 장치의 구성도이다.1 is a configuration diagram of a clinical trial data retrieval device according to an embodiment.

도 1을 참조하면, 임상시험 데이터 검색 장치(100)는 데이터 입력 및 출력을 수행하는 인터페이스부(110), 인터페이스부(110)를 통하여 사용자 검색어를 입력 받아 동일 또는 유사한 하나 이상의 검색 키워드를 생성하는 키워드 생성부(120), 하나 이상의 검색 키워드 중 사용자가 선택한 선택 키워드의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성하는 동의어 생성부(130), 하나 이상의 동의어 키워드를 소정의 언어로 번역하여 하나 이상의 번역 키워드를 생성하는 번역부(140) 및 하나 이상의 번역 키워드를 기초로 데이터베이스로부터 임상시험 데이터를 검색하는 데이터 검색부(150)를 포함할 수 있다. Referring to FIG. 1, the clinical trial data search apparatus 100 receives a user search word through an interface unit 110 that performs data input and output, and generates one or more identical or similar search keywords through the interface unit 110. A keyword generation unit 120, a synonym generation unit 130 for generating one or more synonym keywords by searching for synonyms of a selected keyword selected by a user from among one or more search keywords, and translating one or more synonym keywords into a predetermined language and performing one or more translations. It may include a translation unit 140 that generates keywords and a data search unit 150 that searches clinical trial data from a database based on one or more translation keywords.

일 예로, 인터페이스부(110)는 키보드, 마우스, 모니터, 터치 스크린 등 사용자의 입력을 수신하거나 데이터를 출력할 수 있는 소정의 장치일 수 있다.For example, the interface unit 110 may be any device capable of receiving a user's input or outputting data, such as a keyboard, mouse, monitor, or touch screen.

일 실시예에 따르면, 키워드 생성부(120)는 인터페이스부(110)를 통하여 사용자 검색어의 동일 또는 유사한 하나 이상의 후보 키워드를 출력할 수 있다. 일 예로, 사용자가 검색어 1을 입력하는 경우, 동일 또는 유사한 단어인 후보 1, 후보 2 등의 후보 키워드를 출력할 수 있다. 이때, 검색어 1은 단어의 일부분일 수 있으며, 후보 키워드는 입력된 단어 일부분으로 구성될 수 있는 단어일 수 있다. 예를 들어, 사용자가 검색어로 'cardio'를 입력한 경우, 후보 키워드는 'cardiovascular', 'cardiomegaly', 'cardiology' 등이 될 수 있다. According to an embodiment, the keyword generation unit 120 may output one or more candidate keywords identical or similar to the user search word through the interface unit 110 . For example, when a user inputs search word 1, candidate keywords such as candidate 1 and candidate 2 which are identical or similar words may be output. In this case, the search word 1 may be a part of a word, and the candidate keyword may be a word that may be composed of a part of the input word. For example, when a user inputs 'cardio' as a search term, candidate keywords may be 'cardiovascular', 'cardiomegaly', 'cardiology', and the like.

일 실시예에 따르면, 키워드 생성부(120)는 사용자로부터 하나 이상의 후보 키워드 중 적어도 하나를 선택하는 입력을 수신하여 하나 이상의 검색 키워드를 생성할 수 있다. 예를 들어, 후보 키워드가 'cardiovascular', 'cardiomegaly', 'cardiology'이며, 이 중에서 사용자가 하나의 키워드인 'cardiovascular'를 선택하는 경우, 검색 키워드는 'cardiovascular'가 될 수 있다.According to an embodiment, the keyword generation unit 120 may generate one or more search keywords by receiving an input for selecting at least one of one or more candidate keywords from a user. For example, if the candidate keywords are 'cardiovascular', 'cardiomegaly', and 'cardiology', and the user selects one keyword, 'cardiovascular', the search keyword may be 'cardiovascular'.

일 실시예에 따르면, 키워드 생성부(120)는 사용자로부터 하나 이상의 후보 키워드 중 어느 하나도 선택하지 않는 입력을 수신하는 경우, 사용자 검색어를 기초로 검색 키워드를 생성할 수 있다. 예를 들어, 사용자 입력이 'cardiovascular'이나, 후보 키워드로 'cardiomegaly', 'cardiology'가 출력된 경우, 사용자는 후보 키워드 중 어느 것도 선택하지 않을 수 있으며, 이러한 경우 키워드 생성부(120)는 사용자가 입력한 'cardiovascular'를 검색 키워드로 생성할 수 있다. According to an embodiment, when receiving an input not selecting any one of one or more candidate keywords from a user, the keyword generation unit 120 may generate a search keyword based on a user search word. For example, when the user inputs 'cardiovascular' but 'cardiomegaly' and 'cardiology' are output as candidate keywords, the user may not select any of the candidate keywords. Can generate 'cardiovascular' entered as a search keyword.

일 실시예에 따르면, 동의어 생성부(130)는 소정 언어에 대한 동의어 테이블을 보유하고 있으며, 동의어 테이블에서 선택 키워드의 언어와 동일한 언어의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성할 수 있다.According to an embodiment, the synonym generation unit 130 has a synonym table for a predetermined language, and searches synonyms of the same language as the language of the selected keyword in the synonym table to generate one or more synonym keywords.

일 예로, 동의어 생성부(130)는 한국어, 영어, 프랑스어에 대한 동의어 테이블을 보유할 수 있다. 이때, 검색 키워드로 'cardiovascular'가 입력되는 경우, 동의어 생성부(130)는 동의어 테이블을 참조하여 'cardiovascular'의 동의어를 검색할 수 있다. 예를 들어, 동의어 생성부(130)는 동의어 테이블을 검색하여 'cardiovascular'의 동의어로 'circulatory' 및 'cv system'을 검색할 수 있으며, 이를 통해 동의어 키워드를 생성할 수 있다. 다시 말해, 동의어 키워드는 'cardiovascular', 'circulatory' 및 'cv system'가 될 수 있다. For example, the synonym generation unit 130 may have a table of synonyms for Korean, English, and French. At this time, when 'cardiovascular' is input as a search keyword, the synonym generation unit 130 may search for a synonym of 'cardiovascular' by referring to a synonym table. For example, the synonym generating unit 130 may search the synonym table to search for 'circulatory' and 'cv system' as synonyms of 'cardiovascular', thereby generating synonym keywords. In other words, synonym keywords can be 'cardiovascular', 'circulatory' and 'cv system'.

일 실시예에 따르면, 동의어 생성부(130)는 데이터베이스에 신규 임상시험 데이터가 업데이트 되는 경우, 신규 임상시험 데이터에 포함된 하나 이상의 단어를 추출할 수 있다. 도 2를 참조하면, 동의어 생성부(130)는 신규 임상시험 데이터가 데이터베이스에 업데이트 되는 경우, 해당 임상시험 데이터에 포함된 단어들을 추출할 수 있다. According to an embodiment, when new clinical trial data is updated in the database, the synonym generation unit 130 may extract one or more words included in the new clinical trial data. Referring to FIG. 2 , when new clinical trial data is updated to the database, the synonym generation unit 130 may extract words included in the corresponding clinical trial data.

이후, 동의어 생성부(130)는 추출된 하나 이상의 단어 중 동의어 테이블에 포함되어 있지 않은 새로운 단어를 검색하며, 새로운 단어가 검색된 경우, 단어의 유사도를 추정하도록 학습된 인공 신경망을 이용하여 동의어 테이블에 포함된 하나 이상의 단어 중 유사도가 소정 임계값 이상인 하나 이상의 유사 단어를 추출할 수 있다. Thereafter, the synonym generator 130 searches for a new word that is not included in the synonym table among the one or more extracted words, and when a new word is found, the synonym table is searched for using an artificial neural network trained to estimate the similarity of the word. Among the included one or more words, one or more similar words having similarities greater than or equal to a predetermined threshold value may be extracted.

예를 들어, 동의어 생성부(130)가 새로운 임상시험 데이터를 분석한 결과 '관상동맥'이라는 단어를 추출하였으나, 기존의 동의어 테이블에 해당 단어가 없는 경우, 동의어 생성부(130)는 '관상동맥'이라는 단어를 새로운 단어로 인식할 수 있다. 이후, 동의어 생성부(130)는 인공 신경망을 이용하여 새롭게 인식된 '심장혈과'과 종래 동의어 테이블에 등록된 단어들의 유사도를 추정할 수 있으며, 이 중에서 유사도가 소정 기준 이상인 단어를 추출할 수 있다. 예를 들어, 동의어 생성부(130)는 새로운 단어인 '관상동맥'과 유사도가 높은 단어로 '심혈관', '순환계' 및 '심장비대'를 추출할 수 있다. For example, if the synonym generator 130 extracts the word 'corona' as a result of analyzing new clinical trial data, but there is no corresponding word in the existing synonym table, the synonym generator 130 extracts the word 'coronary artery'. ' can be recognized as a new word. Thereafter, the synonym generation unit 130 may estimate the similarity between the newly recognized 'cardiovascular disease' and the words registered in the conventional synonym table using an artificial neural network, and extract a word having a similarity higher than or equal to a predetermined standard. there is. For example, the synonym generation unit 130 may extract 'cardiovascular', 'circulatory system', and 'cardiac enlargement' as words having a high similarity to the new word 'coronary artery'.

일 예에 따르면, 동의어 생성부(130)는 새로운 단어 및 하나 이상의 유사 단어를 매핑할 수 있다. 예를 들어, 동의어 생성부(130)는 새롭게 발견된 단어인 '관상동맥'과 '심혈관', '순환계' 및 '심장비대'를 유사 단어로 매핑할 수 있다.According to an example, the synonym generation unit 130 may map a new word and one or more similar words. For example, the synonym generation unit 130 may map newly discovered words 'coronary artery', 'cardiovascular', 'circulatory system', and 'cardiac enlargement' as similar words.

일 실시예에 따르면, 동의어 생성부(130)는 인터페이스부(110)를 통하여 새로운 단어 및 하나 이상의 유사 단어를 출력하며, 사용자로부터 하나 이상의 유사 단어가 새로운 단어의 동의어인지에 대한 확인 데이터를 입력 받을 수 있다. 예를 들어, 동의어 생성부(130)는 '관상동맥'의 유사 단어로 '심혈관', '순환계' 및 '심장비대'를 인터페이스를 통해 출력할 수 있으며, 사용자로부터 '심혈관', '순환계'가 '관상동맥'의 동의어인 것으로 확인 받을 수 있다.According to an embodiment, the synonym generation unit 130 outputs a new word and one or more similar words through the interface unit 110, and receives confirmation data from a user whether the one or more similar words are synonyms of the new word. can For example, the synonym generating unit 130 may output 'cardiovascular', 'circulatory system', and 'cardiac hypertrophy' as similar words to 'coronary artery' through an interface, and 'cardiovascular' and 'circulatory system' may be received by the user. It can be confirmed that it is a synonym for 'coronary artery'.

이후, 동의어 생성부(130)는 확인 데이터에 기초하여 새로운 단어를 동의어 테이블에 업데이트할 수 있다. 예를 들어, 동의어 생성부(130)는 '심혈관', '순환계' 및 '심장비대' 중 '관상동맥'과 동의어로 확인된 '심혈관'및 '순환계'를 '관상동맥'과 동의어로 동의어 테이블에 업데이트 할 수 있다. Then, the synonym generation unit 130 may update the synonym table with new words based on the verification data. For example, the synonym generation unit 130 converts 'cardiovascular' and 'circulatory system' identified as synonyms with 'coronary artery' among 'cardiovascular', 'circulatory system', and 'cardiac hypertrophy' into a synonym table as 'coronary artery'. can be updated on

일 실시예에 따르면, 단어의 유사도를 추정하도록 학습된 인공 신경망은 새로운 단어, 하나 이상의 유사 단어 및 확인 데이터에 기초하여 학습될 수 있다. 예를 들어, 인공 신경망은 '관상동맥'에 대한 유사도에 대한 결과로 '심혈관', '순환계' 및 '심장비대'에 대한 손실함수를 입력 받아 학습될 수 있다. According to one embodiment, an artificial neural network trained to estimate the similarity of words may be trained based on a new word, one or more similar words, and identification data. For example, the artificial neural network may be learned by receiving loss functions for 'cardiovascular', 'circulatory system', and 'cardiac hypertrophy' as a result of the similarity to 'coronary artery'.

일 실시예에 따르면, 번역부(140)는 생성된 하나 이상의 번역 키워드를 동의어 생성부로 전송할 수 있다. 이후, 동의어 생성부(130)는 소정의 언어로 번역된 하나 이상의 번역 키워드 각각의 언어에 대한 동의어 테이블을 검색하여 하나 이상의 번역 키워드 각각에 대한 동의어를 검색할 수 있다. 이때, 하나 이상의 번역 키워드 중 적어도 하나에 대한 동의어가 검색되는 경우, 동의어 생성부(130)는 새롭게 검색된 동의어를 동의어 키워드에 추가할 수 있다. According to an embodiment, the translation unit 140 may transmit one or more generated translation keywords to the synonym generation unit. Thereafter, the synonym generation unit 130 may retrieve a synonym for each of the one or more translation keywords by searching a synonym table for each language of one or more translation keywords translated into a predetermined language. In this case, when a synonym for at least one of one or more translation keywords is searched for, the synonym generation unit 130 may add the newly searched synonym to the synonym keyword.

도 3을 참조하면, 번역부(140)는 동의어 생성부(130)로부터 영어 동의어 키워드인 '동의어 1(EN), 동의어 2(EN)'를 입력 받을 수 있으며, 이를 한국어로 번역하여 번역 키워드 '동의어 1(KR), 동의어 2(KR), 동의어 1(EN), 동의어 1(EN)'를 생성할 수 있다. 이후, 번역부(140)는 번역 키워드 중 번역된 단어인 '동의어 1(KR), 동의어 2(KR)'를 동의어 생성부(130)로 전달할 수 있으며, 동의어 생성부(130)는 번역 키워드'동의어 1(KR), 동의어 2(KR)'에 대한 동의어를 검색하여 새로운 동의어가 있는지 여부를 확인할 수 있다. 예를 들어, 동의어 생성부(130)는 '동의어 1(KR), 동의어 2(KR)'에 대한 동의어로 '동의어 3(KR)'을 찾을 수 있으며, 이를 동의어 키워드에 추가할 수 있다.Referring to FIG. 3 , the translation unit 140 may receive English synonym keywords 'Synonym 1 (EN) and Synonym 2 (EN)' from the synonym generator 130, translate them into Korean, and translate them into Korean. Synonym 1 (KR), Synonym 2 (KR), Synonym 1 (EN), and Synonym 1 (EN)' can be created. Thereafter, the translation unit 140 may transmit 'synonym 1 (KR), synonym 2 (KR)', which are translated words among the translation keywords, to the synonym generator 130, and the synonym generator 130 may transmit the translated keyword' Synonyms for synonym 1 (KR) and synonym 2 (KR)' may be searched to determine whether a new synonym exists. For example, the synonym generation unit 130 may find 'synonym 3 (KR)' as a synonym for 'synonym 1 (KR) and synonym 2 (KR)' and may add it to the synonym keyword.

일 예로, 번역부(140)는 동의어 키워드로 'cardiovascular', 'circulatory'를 입력 받을 수 있으며, 이를 번역하여 '심혈관', '순환기'가 포함된 번역 키워드를 생성할 수 있다. 이후, 번역부(140)는 번역 키워드 '심혈관', '순환기'를 동의어 생성부(130)로 전달할 수 있으며, 동의어 생성부(130)는 '심혈관', '순환기'에 대한 동의어를 검색할 수 있다. 이때, '심혈관', '순환기'에 대한 새로운 동의어로 '관상동맥'이 검색될 수 있으며, 이 경우 동의어 생성부(130)는 '관상동맥'을 동의어 키워드에 추가하고 번역부(140)로 전송할 수 있다. For example, the translation unit 140 may receive input of 'cardiovascular' and 'circulatory' as synonymous keywords, and generate translation keywords including 'cardiovascular' and 'circulatory' by translating them. Thereafter, the translation unit 140 may transmit the translation keywords 'cardiovascular' and 'circulatory' to the synonym generator 130, and the synonym generator 130 may search synonyms for 'cardiovascular' and 'circulatory'. there is. At this time, 'coronary artery' may be searched for as a new synonym for 'cardiovascular' and 'circulatory system'. can

일 실시예에 따르면, 번역부(140)는 동의어 키워드에 추가된 새롭게 검색된 동의어를 소정의 언어로 재번역하여 번역 키워드에 추가할 수 있다. 일 예로, 동의어 생성부(130)는 새로운 동의어 '동의어 3(KR)'을 번역부(140)에 전송하여 번역을 수행할 수 있다. According to an embodiment, the translation unit 140 may re-translate newly searched synonyms added to the synonym keywords into a predetermined language and add them to the translation keywords. For example, the synonym generation unit 130 may transmit a new synonym 'Synonym 3 (KR)' to the translation unit 140 to perform translation.

예를 들어, 번역부(140)는 동의어 생성부(130)로부터 새로운 동의어인 '관상동맥'을 입력 받을 수 있으며, 이를 번역한 'coronary arteries'를 번역 키워드에 추가할 수 있다. 이후, 번역부(140)는 새롭게 추가된 번역 키워드 'coronary arteries'를 다시 동의어 생성부(130)로 전송하여 위의 과정을 반복할 수 있다. 예를 들어, 위의 과정은 번역 및 동의어 생성에서 새로운 동의어가 검색되지 않을 때까지 반복될 수 있다. For example, the translation unit 140 may receive input of a new synonym, 'coronary arteries', from the synonym generation unit 130, and may add 'coronary arteries' translated from the synonym to the translation keyword. Thereafter, the translation unit 140 may repeat the above process by transmitting the newly added translation keyword 'coronary arteries' to the synonym generator 130 again. For example, the above process can be repeated until no new synonyms are found in translation and synonym generation.

도 4는 일 예에 따른 임상시험 데이터 검색 장치의 동작을 설명하기 위한 예시도이다. 도 4를 참조하면, 임상시험 데이터 검색 장치는 인터페이스를 통하여 사용자로부터 검색어를 입력받을 수 있다. 이후, 임상시험 데이터 검색 장치는 사용자로부터 입력 받은 검색어에 기초하여 키워드를 생성할 수 있으며, 이를 기초로 동의어 키워드 및 번역어 키워드를 생성할 수 있다. 4 is an exemplary diagram for explaining an operation of a clinical trial data retrieval device according to an example. Referring to FIG. 4 , the clinical trial data retrieval device may receive a search word input from a user through an interface. Thereafter, the clinical trial data search device may generate keywords based on the search word input from the user, and may generate synonym keywords and translated keywords based on the keywords.

예를 들어, 사용자로부터 'cardiovascular'라는 검색어를 입력 받는 경우, 임상시험 데이터 검색 장치는 동의어 키워드로 'criculatory'및 'cv system'를 생성할 수 있으며, 이에 대한 번역을 수행하여 한국어 '심혈관' 및 프랑스어 'cardiovasculaire'를 번역 키워드로 생성할 수 있다. 이후, 임상시험 데이터 검색 장치는 번역 키워드를 이용하여 데이터베이스를 검색할 수 있으며, 검색된 데이터를 인터페이스에 출력할 수 있다. For example, when receiving a search term 'cardiovascular' from a user, the clinical trial data search device can generate 'criculatory' and 'cv system' as synonymous keywords, and translate them to Korean 'cardiovascular' and 'cardiovascular'. French 'cardiovasculaire' can be created as a translation keyword. Thereafter, the clinical trial data search device may search the database using the translation keyword and output the searched data to the interface.

일 실시예에서 동의어, 번역어 또는 유사어로 표시된 예는 일 예일 뿐이며, 실제 동의어, 번역어 또는 유사어와 다를 수 있다.Examples displayed as synonyms, translations, or analogs in one embodiment are only examples, and may differ from actual synonyms, translations, or analogs.

도 5는 일 실시예에 따른 임상시험 데이터 검색 방법을 도시한 흐름도이다.5 is a flowchart illustrating a clinical trial data search method according to an embodiment.

일 실시예에 따르면, 임상시험 데이터 검색 장치는 인터페이스를 통하여 사용자 검색어를 입력 받아 동일 또는 유사한 하나 이상의 검색 키워드를 생성할 수 있다(510). 일 예로, 인터페이스는 키보드, 마우스, 모니터, 터치 스크린 등 사용자의 입력을 수신하거나 데이터를 출력할 수 있는 소정의 장치일 수 있다.According to an embodiment, the clinical trial data retrieval apparatus may generate one or more identical or similar search keywords by receiving a user's search word through an interface (510). For example, the interface may be any device capable of receiving a user's input or outputting data, such as a keyboard, mouse, monitor, or touch screen.

일 예에 따르면, 임상시험 데이터 검색 장치는 인터페이스를 통하여 사용자 검색어의 동일 또는 유사한 하나 이상의 후보 키워드를 출력하며, 사용자로부터 하나 이상의 후보 키워드 중 적어도 하나를 선택하는 입력을 수신하여 하나 이상의 검색 키워드를 생성할 수 있다. 다른 예로, 임상시험 데이터 검색 장치는 사용자로부터 하나 이상의 후보 키워드 중 어느 하나도 선택하지 않는 입력을 수신하는 경우, 사용자 검색어를 기초로 검색 키워드를 생성할 수 있다.According to an example, the clinical trial data retrieval apparatus outputs one or more candidate keywords identical or similar to a user's search term through an interface, receives an input for selecting at least one of the one or more candidate keywords from a user, and generates one or more search keywords. can do. As another example, when receiving an input not selecting any one of one or more candidate keywords from the user, the apparatus for searching clinical trial data may generate a search keyword based on the user's search term.

일 실시예에 따르면, 임상시험 데이터 검색 장치는 하나 이상의 검색 키워드 중 사용자가 선택한 선택 키워드의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성할 수 있다(520). 일 예에 따르면, 임상시험 데이터 검색 장치는 보유하고 있는 소정 언어에 대한 동의어 테이블에서 선택 키워드의 언어와 동일한 언어의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성할 수 있다. According to an embodiment, the clinical trial data search apparatus may generate one or more synonym keywords by searching for a synonym of a selected keyword selected by a user among one or more search keywords (520). According to an example, the clinical trial data search apparatus may generate one or more synonym keywords by searching for synonyms of the same language as the language of the selected keyword in a synonym table for a predetermined language possessed.

일 예에 따르면, 임상시험 데이터 검색 장치는 데이터베이스에 신규 임상시험 데이터가 업데이트 되는 경우, 신규 임상시험 데이터에 포함된 하나 이상의 단어를 추출하며, 추출된 하나 이상의 단어 중 동의어 테이블에 포함되어 있지 않은 새로운 단어를 검색하며, 새로운 단어가 검색된 경우, 단어의 유사도를 추정하도록 학습된 인공 신경망을 이용하여 동의어 테이블에 포함된 하나 이상의 단어 중 유사도가 소정 임계값 이상인 하나 이상의 유사 단어를 추출하며, 새로운 단어 및 하나 이상의 유사 단어를 매핑할 수 있다. According to an example, the clinical trial data retrieval apparatus extracts one or more words included in the new clinical trial data when new clinical trial data is updated in the database, and extracts one or more words from the extracted one or more words that are not included in the synonym table. A word is searched, and if a new word is found, one or more similar words having a similarity of at least a predetermined threshold value are extracted from among one or more words included in the synonym table using an artificial neural network trained to estimate the similarity of the word, and the new word and One or more similar words can be mapped.

이후, 임상시험 데이터 검색 장치는 인터페이스를 통하여 새로운 단어 및 하나 이상의 유사 단어를 출력하며, 사용자로부터 하나 이상의 유사 단어가 새로운 단어의 동의어인지에 대한 확인 데이터를 입력 받으며, 확인 데이터에 기초하여 새로운 단어를 동의어 테이블에 업데이트할 수 있다.Thereafter, the clinical trial data retrieval device outputs the new word and one or more similar words through an interface, receives confirmation data from the user whether the one or more similar words are synonyms of the new word, and finds a new word based on the confirmation data. You can update the synonym table.

일 예에 따르면, 단어의 유사도를 추정하도록 학습된 인공 신경망은 새로운 단어, 하나 이상의 유사 단어 및 확인 데이터에 기초하여 학습할 수 있다.According to one example, an artificial neural network trained to estimate the similarity of words may learn based on a new word, one or more similar words, and identification data.

일 실시예에 따르면, 임상시험 데이터 검색 장치는 하나 이상의 동의어 키워드를 소정의 언어로 번역하여 하나 이상의 번역 키워드를 생성할 수 있다(530).According to an embodiment, the clinical trial data search apparatus may generate one or more translation keywords by translating one or more synonymous keywords into a predetermined language (530).

일 예에 따르면, 임상시험 데이터 검색 장치는 생성된 하나 이상의 번역 키워드를 동의어 생성 단계로 전송할 수 있다. 이후, 임상시험 데이터 검색 장치는 동의어 생성 단계에서 소정의 언어로 번역된 하나 이상의 번역 키워드 각각의 언어에 대한 동의어 테이블을 검색하여 하나 이상의 번역 키워드 각각에 대한 동의어를 검색하며, 하나 이상의 번역 키워드 중 적어도 하나에 대한 동의어가 검색되는 경우, 새롭게 검색된 동의어를 동의어 키워드에 추가할 수 있다.According to an example, the clinical trial data search apparatus may transmit one or more generated translation keywords to the synonym generation step. Thereafter, in the synonym generation step, the clinical trial data search device searches a synonym table for each language of one or more translation keywords translated into a predetermined language, searches for a synonym for each of the one or more translation keywords, and at least one of the one or more translation keywords. If a synonym for one is found, the newly searched synonym can be added to the synonym keyword.

일 예에 따르면, 임상시험 데이터 검색 장치는 동의어 키워드에 추가된 새롭게 검색된 동의어를 소정의 언어로 재번역하여 번역 키워드에 추가할 수 있다.According to an example, the clinical trial data search apparatus may retranslate newly searched synonyms added to synonym keywords into a predetermined language and add them to the translation keywords.

일 실시예에 따르면, 임상시험 데이터 검색 장치는 하나 이상의 번역 키워드를 기초로 데이터베이스로부터 임상시험 데이터를 검색할 수 있다(540).According to an embodiment, the clinical trial data retrieval device may search clinical trial data from a database based on one or more translation keywords (540).

도 5의 실시예 중 도 1 내지 도 4를 참조하여 설명한 내용 중 중복된 실시예는 생략하였다.Among the embodiments of FIG. 5 , overlapping embodiments of the contents described with reference to FIGS. 1 to 4 are omitted.

본 발명의 일 양상은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있다. 상기의 프로그램을 구현하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함할 수 있다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 디스크 등을 포함할 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드로 작성되고 실행될 수 있다.An aspect of the present invention may be implemented as computer readable code on a computer readable recording medium. Codes and code segments implementing the above program can be easily inferred by a computer programmer in the art. A computer-readable recording medium may include all types of recording devices storing data that can be read by a computer system. Examples of computer-readable recording media may include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical disk, and the like. In addition, the computer-readable recording medium may be distributed among computer systems connected through a network, and may be written and executed as computer-readable codes in a distributed manner.

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시 예에 한정되지 않고 특허 청구범위에 기재된 내용과 동등한 범위 내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.So far, the present invention has been looked at mainly with its preferred embodiments. Those skilled in the art to which the present invention pertains will be able to understand that the present invention can be implemented in a modified form without departing from the essential characteristics of the present invention. Therefore, the scope of the present invention should be construed to include various embodiments within the scope equivalent to those described in the claims without being limited to the above-described embodiments.

100: 임상시험 데이터 검색 장치
110: 인터페이스부
120: 키워드 생성부
130: 동의어 생성부
140: 번역부
150: 데이터 검색부
100: clinical trial data search device
110: interface unit
120: keyword generation unit
130: synonym generation unit
140: translation department
150: data search unit

Claims (18)

데이터 입력 및 출력을 수행하는 인터페이스부;
상기 인터페이스부를 통하여 사용자 검색어를 입력 받아 동일 또는 유사한 하나 이상의 검색 키워드를 생성하는 키워드 생성부;
하나 이상의 언어에 대한 동의어 테이블을 보유하며, 상기 동의어 테이블에서 상기 하나 이상의 검색 키워드 중 사용자가 선택한 선택 키워드의 언어와 동일한 제 1 언어의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성하는 동의어 생성부;
상기 하나 이상의 동의어 키워드를 소정의 제 2 언어로 번역하여 하나 이상의 번역 키워드를 생성하는 번역부; 및
상기 하나 이상의 번역 키워드를 기초로 데이터베이스로부터 임상시험 데이터를 검색하는 데이터 검색부를 포함하며,
상기 동의어 생성부는
상기 번역부에서 생성된 소정의 제 2 언어로 번역된 하나 이상의 번역 키워드에 대한 동의어 테이블을 검색하여 하나 이상의 번역 키워드 각각에 대한 제 2 언어의 동의어를 검색하며, 하나 이상의 번역 키워드 중 적어도 하나에 대한 새로운 동의어가 검색되는 경우, 새롭게 검색된 제 2 언어의 동의어를 동의어 키워드에 추가하며,
상기 번역부는
상기 동의어 키워드에 추가된 새롭게 검색된 제 2 언어의 동의어를 제 1 언어로 재번역하여 번역 키워드에 추가하는, 임상시험 데이터 검색 장치.
an interface unit that performs data input and output;
a keyword generation unit receiving a user search word input through the interface unit and generating one or more identical or similar search keywords;
a synonym generating unit that has a synonym table for one or more languages and searches for a synonym of a first language identical to a language of a selected keyword selected by a user from among the one or more search keywords in the synonym table and generates one or more synonym keywords;
a translation unit generating one or more translation keywords by translating the one or more synonymous keywords into a predetermined second language; and
A data search unit for retrieving clinical trial data from a database based on the one or more translation keywords;
The synonym generator
A synonym table for one or more translation keywords translated into a predetermined second language generated by the translation unit is searched for a synonym in the second language for each of the one or more translation keywords, and a synonym for at least one of the one or more translation keywords is searched. When a new synonym is found, the newly searched second language synonym is added to the synonym keyword;
the translation department
A clinical trial data search device for retranslating newly searched second language synonyms added to the synonym keywords into the first language and adding them to the translation keywords.
제 1 항에 있어서,
상기 키워드 생성부는
상기 인터페이스부를 통하여 상기 사용자 검색어의 동일 또는 유사한 하나 이상의 후보 키워드를 출력하며, 사용자로부터 상기 하나 이상의 후보 키워드 중 적어도 하나를 선택하는 입력을 수신하여 하나 이상의 검색 키워드를 생성하는, 임상시험 데이터 검색 장치.
According to claim 1,
The keyword generator
A clinical trial data retrieval device that outputs one or more candidate keywords identical or similar to the user's search term through the interface unit, and generates one or more search keywords by receiving an input from a user for selecting at least one of the one or more candidate keywords.
제 2 항에 있어서,
상기 키워드 생성부는
사용자로부터 상기 하나 이상의 후보 키워드 중 어느 하나도 선택하지 않는 입력을 수신하는 경우, 상기 사용자 검색어를 기초로 검색 키워드를 생성하는, 임상시험 데이터 검색 장치.
According to claim 2,
The keyword generator
A clinical trial data retrieval apparatus for generating a search keyword based on the user search word when receiving an input not selecting any one of the one or more candidate keywords from a user.
삭제delete 제 1 항에 있어서,
상기 동의어 생성부는
상기 데이터베이스에 신규 임상시험 데이터가 업데이트 되는 경우, 신규 임상시험 데이터에 포함된 하나 이상의 단어를 추출하며,
상기 추출된 하나 이상의 단어 중 상기 동의어 테이블에 포함되어 있지 않은 새로운 단어를 검색하며,
새로운 단어가 검색된 경우, 단어의 유사도를 추정하도록 학습된 인공 신경망을 이용하여 상기 동의어 테이블에 포함된 하나 이상의 단어 중 유사도가 소정 임계값 이상인 하나 이상의 유사 단어를 추출하며,
상기 새로운 단어 및 상기 하나 이상의 유사 단어를 매핑하는, 임상시험 데이터 검색 장치.
According to claim 1,
The synonym generator
When new clinical trial data is updated in the database, one or more words included in the new clinical trial data are extracted,
Searching for a new word not included in the synonym table among the one or more extracted words;
When a new word is found, extracting one or more similar words having a degree of similarity equal to or greater than a predetermined threshold value among one or more words included in the synonym table using an artificial neural network trained to estimate a word similarity;
A clinical trial data retrieval device for mapping the new word and the one or more similar words.
제 5 항에 있어서,
상기 동의어 생성부는
상기 인터페이스부를 통하여 상기 새로운 단어 및 상기 하나 이상의 유사 단어를 출력하며,
사용자로부터 상기 하나 이상의 유사 단어가 상기 새로운 단어의 동의어인지에 대한 확인 데이터를 입력 받으며,
상기 확인 데이터에 기초하여 상기 새로운 단어를 상기 동의어 테이블에 업데이트 하는, 임상시험 데이터 검색 장치.
According to claim 5,
The synonym generator
Outputting the new word and the one or more similar words through the interface unit;
Receive confirmation data from a user whether the one or more similar words are synonyms of the new word;
The clinical trial data retrieval device for updating the new word in the synonym table based on the confirmation data.
제 6 항에 있어서,
상기 단어의 유사도를 추정하도록 학습된 인공 신경망은
상기 새로운 단어, 상기 하나 이상의 유사 단어 및 상기 확인 데이터에 기초하여 학습되는, 임상시험 데이터 검색 장치.
According to claim 6,
An artificial neural network trained to estimate the similarity of the word
The clinical trial data retrieval device, which is learned based on the new word, the one or more similar words, and the confirmation data.
삭제delete 삭제delete 인터페이스를 통하여 사용자 검색어를 입력 받아 동일 또는 유사한 하나 이상의 검색 키워드를 생성하는 키워드 생성 단계;
하나 이상의 언어에 대한 동의어 테이블을 보유하며, 상기 동의어 테이블에서 상기 하나 이상의 검색 키워드 중 사용자가 선택한 선택 키워드의 언어와 동일한 제 1 언어의 동의어를 검색하여 하나 이상의 동의어 키워드를 생성하는 동의어 생성 단계;
상기 하나 이상의 동의어 키워드를 소정의 제 2 언어로 번역하여 하나 이상의 번역 키워드를 생성하는 번역 단계; 및
상기 하나 이상의 번역 키워드를 기초로 데이터베이스로부터 임상시험 데이터를 검색하는 데이터 검색 단계를 포함하며,
상기 동의어 생성 단계는
상기 번역 단계에서 생성된 소정의 제 2 언어로 번역된 하나 이상의 번역 키워드에 대한 동의어 테이블을 검색하여 하나 이상의 번역 키워드 각각에 대한 제 2 언어의 동의어를 검색하며, 하나 이상의 번역 키워드 중 적어도 하나에 대한 새로운 동의어가 검색되는 경우, 새롭게 검색된 제 2 언어의 동의어를 동의어 키워드에 추가하며,
상기 번역 단계는
상기 동의어 키워드에 추가된 새롭게 검색된 제 2 언어의 동의어를 제 1 언어로 재번역하여 번역 키워드에 추가하는, 임상시험 데이터 검색 방법.
A keyword generation step of generating one or more identical or similar search keywords by receiving a user search term through an interface;
a synonym generating step of maintaining a synonym table for one or more languages and generating one or more synonym keywords by searching for a synonym of a first language identical to a language of a selected keyword selected by a user from among the one or more search keywords in the synonym table;
a translation step of generating one or more translation keywords by translating the one or more synonymous keywords into a predetermined second language; and
A data search step of retrieving clinical trial data from a database based on the one or more translation keywords,
The synonym generation step is
A synonym table for one or more translation keywords translated into a predetermined second language generated in the translation step is searched for a synonym in the second language for each of the one or more translation keywords, and a synonym for at least one of the one or more translation keywords is searched. When a new synonym is found, the newly searched second language synonym is added to the synonym keyword;
The translation step is
The clinical trial data search method of retranslating newly searched second language synonyms added to the synonym keywords into the first language and adding them to the translation keywords.
제 10 항에 있어서,
상기 키워드 생성 단계는
인터페이스를 통하여 상기 사용자 검색어의 동일 또는 유사한 하나 이상의 후보 키워드를 출력하며, 사용자로부터 상기 하나 이상의 후보 키워드 중 적어도 하나를 선택하는 입력을 수신하여 하나 이상의 검색 키워드를 생성하는, 임상시험 데이터 검색 방법.
According to claim 10,
The keyword generation step is
A clinical trial data search method for outputting one or more candidate keywords that are the same or similar to the user's search term through an interface, and generating one or more search keywords by receiving an input for selecting at least one of the one or more candidate keywords from a user.
제 11 항에 있어서,
상기 키워드 생성 단계는
사용자로부터 상기 하나 이상의 후보 키워드 중 어느 하나도 선택하지 않는 입력을 수신하는 경우, 상기 사용자 검색어를 기초로 검색 키워드를 생성하는, 임상시험 데이터 검색 방법.
According to claim 11,
The keyword generation step is
The clinical trial data search method of generating a search keyword based on the user search word when receiving an input not selecting any one of the one or more candidate keywords from a user.
삭제delete 제 10 항에 있어서,
상기 동의어 생성 단계는
상기 데이터베이스에 신규 임상시험 데이터가 업데이트 되는 경우, 신규 임상시험 데이터에 포함된 하나 이상의 단어를 추출하며,
상기 추출된 하나 이상의 단어 중 상기 동의어 테이블에 포함되어 있지 않은 새로운 단어를 검색하며,
새로운 단어가 검색된 경우, 단어의 유사도를 추정하도록 학습된 인공 신경망을 이용하여 상기 동의어 테이블에 포함된 하나 이상의 단어 중 유사도가 소정 임계값 이상인 하나 이상의 유사 단어를 추출하며,
상기 새로운 단어 및 상기 하나 이상의 유사 단어를 매핑하는, 임상시험 데이터 검색 방법.
According to claim 10,
The synonym generation step is
When new clinical trial data is updated in the database, one or more words included in the new clinical trial data are extracted,
Searching for a new word not included in the synonym table among the one or more extracted words;
When a new word is found, extracting one or more similar words having a degree of similarity equal to or greater than a predetermined threshold value among one or more words included in the synonym table using an artificial neural network trained to estimate a word similarity;
A method for retrieving clinical trial data, wherein the new word and the one or more similar words are mapped.
제 14 항에 있어서,
상기 동의어 생성 단계는
인터페이스를 통하여 상기 새로운 단어 및 상기 하나 이상의 유사 단어를 출력하며,
사용자로부터 상기 하나 이상의 유사 단어가 상기 새로운 단어의 동의어인지에 대한 확인 데이터를 입력 받으며,
상기 확인 데이터에 기초하여 상기 새로운 단어를 상기 동의어 테이블에 업데이트하는, 임상시험 데이터 검색 방법.
15. The method of claim 14,
The synonym generation step is
Outputting the new word and the one or more similar words through an interface;
Receive confirmation data from a user whether the one or more similar words are synonyms of the new word;
and updating the new word to the synonym table based on the confirmation data.
제 15 항에 있어서,
상기 단어의 유사도를 추정하도록 학습된 인공 신경망은
상기 새로운 단어, 상기 하나 이상의 유사 단어 및 상기 확인 데이터에 기초하여 학습되는, 임상시험 데이터 검색 방법.
According to claim 15,
An artificial neural network trained to estimate the similarity of the word
Learning based on the new word, the one or more similar words, and the confirmation data.
삭제delete 삭제delete
KR1020220116157A 2022-09-15 2022-09-15 Apparatus and method for retrieval of clinical trial data KR102571400B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220116157A KR102571400B1 (en) 2022-09-15 2022-09-15 Apparatus and method for retrieval of clinical trial data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220116157A KR102571400B1 (en) 2022-09-15 2022-09-15 Apparatus and method for retrieval of clinical trial data

Publications (1)

Publication Number Publication Date
KR102571400B1 true KR102571400B1 (en) 2023-08-29

Family

ID=87802223

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220116157A KR102571400B1 (en) 2022-09-15 2022-09-15 Apparatus and method for retrieval of clinical trial data

Country Status (1)

Country Link
KR (1) KR102571400B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180068076A1 (en) * 2015-03-09 2018-03-08 Koninklijke Philips N.V. Systems and methods for semantic search and extraction of related concepts from clinical documents
US20200005906A1 (en) * 2018-06-27 2020-01-02 International Business Machines Corporation Clinical trial searching and matching

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180068076A1 (en) * 2015-03-09 2018-03-08 Koninklijke Philips N.V. Systems and methods for semantic search and extraction of related concepts from clinical documents
US20200005906A1 (en) * 2018-06-27 2020-01-02 International Business Machines Corporation Clinical trial searching and matching

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Pablo LOPEZ-GARCIA 외, Health Informatics Meets eHealth, 2016.01.01., pp.93-99.* *
Taihua Shao 외, Journal of Physics: Conference Series, 2018.02.25., Vol.1004, No.012018, pp.1-6.* *
Yongjun Zhu 외, BMC Medical Informatics and Decision Making, 2017.07.03., Vol.17, No.95, pp.1-8.* *

Similar Documents

Publication Publication Date Title
CN106537370B (en) Method and system for robust tagging of named entities in the presence of source and translation errors
JP2745370B2 (en) Machine translation method and machine translation device
US6983240B2 (en) Method and apparatus for generating normalized representations of strings
JP4319860B2 (en) Method and apparatus for developing a transfer dictionary for use in a transfer-based machine translation system
KR101326354B1 (en) Transliteration device, recording medium, and method
KR20170106308A (en) Annotation assistance device and computer program therefor
JP4239505B2 (en) Translation apparatus, translation method, program, and recording medium
WO2005059771A1 (en) Translation judgment device, method, and program
US20040153311A1 (en) Building concept knowledge from machine-readable dictionary
RU2644071C2 (en) Curation of multilingual commercial indicators and synthesis of transliteration
JP6817556B2 (en) Similar sentence generation method, similar sentence generation program, similar sentence generator and similar sentence generation system
CN112825111A (en) Natural language processing method and computing device thereof
JP2016164707A (en) Automatic translation device and translation model learning device
US10650195B2 (en) Translated-clause generating method, translated-clause generating apparatus, and recording medium
KR102571400B1 (en) Apparatus and method for retrieval of clinical trial data
JP4401269B2 (en) Parallel translation judgment device and program
JP4435144B2 (en) Data search system and program
JP6584361B2 (en) Keyword extraction device, keyword extraction method, and keyword extraction program
JP5302784B2 (en) Machine translation method and system
JP2016189154A (en) Translation method, device, and program
JP5557469B2 (en) Character search device, character search system, character search method, input terminal device, search server, and program
JP2006024114A (en) Mechanical translation device and mechanical translation computer program
KR102523806B1 (en) Document translation service server for performing supplement of machine translation using prestored translation result, and the operating method thereof
Tan et al. A review on sentiment analysis of resource-scarce languages and code-mixed social media text
JP5039114B2 (en) Machine translation apparatus and program

Legal Events

Date Code Title Description
GRNT Written decision to grant