KR20230010802A - Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model - Google Patents

Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model Download PDF

Info

Publication number
KR20230010802A
KR20230010802A KR1020230002727A KR20230002727A KR20230010802A KR 20230010802 A KR20230010802 A KR 20230010802A KR 1020230002727 A KR1020230002727 A KR 1020230002727A KR 20230002727 A KR20230002727 A KR 20230002727A KR 20230010802 A KR20230010802 A KR 20230010802A
Authority
KR
South Korea
Prior art keywords
information
artificial intelligence
synthetic material
intelligence model
data
Prior art date
Application number
KR1020230002727A
Other languages
Korean (ko)
Inventor
최종윤
홍석주
이상윤
Original Assignee
주식회사 앤트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 앤트 filed Critical 주식회사 앤트
Publication of KR20230010802A publication Critical patent/KR20230010802A/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Computing Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Acoustics & Sound (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

A synthetic material development process providing method using an artificial intelligence model and a device and computer program thereof are provided. According to various embodiments of the present invention, the synthetic material development process providing method using an artificial intelligence model performed by a computing device comprises the following steps of: obtaining one or more conditions; and extracting information about a synthetic material that satisfies the one or more obtained conditions and extracting guide information for synthesizing the synthetic material based on the extracted information about the synthetic material.

Description

인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법, 장치 및 컴퓨터프로그램{METHOD, APPARATUS AND COMPUTER PROGRAM FOR PROVIDING SYNTHETIC MATERIAL DEVELOPMENT PROCESS USING ARTIFICIAL INTELLIGENCE MODEL}Method, device and computer program for providing synthetic material development process using artificial intelligence model

본 발명의 다양한 실시예는 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법, 장치 및 컴퓨터프로그램에 관한 것이다.Various embodiments of the present invention relate to a method, apparatus, and computer program for providing a synthetic material development process using an artificial intelligence model.

일반적으로 바이오, 나노 연구는 물질 및 재료를 합성하는 단계, 구조 및 구성 확인하는 단계, 애플리케이션(Application) 가능성 확인을 위한 여러 특성을 측정하는 단계 및 애플리케이션을 상용화하는 단계를 거쳐 수행된다.In general, bio and nano research is conducted through the steps of synthesizing substances and materials, confirming structures and configurations, measuring various properties to confirm application possibilities, and commercializing applications.

여기서, 구조 및 구성 확인하는 단계에서 최적화된 물질의 구조 및 구성이 도출되지 않거나 애플리케이션 가능성 확인을 위한 여러 특성을 측정하는 단계에서, 원하는 특성이 특정되지 않는 경우, 첫번째 단계인 물질의 구조 및 구성을 합성하는 단계부터 재수행해야 하며, 최적화된 물질을 찾기 위하여 물질의 구조 및 구성을 합성하는 단계를 반복적으로 수행해야 하기 때문에 최적화된 물질을 찾을 때까지 최소 몇 개월에서 최대 몇 년 이상의 시간이 소요될 뿐만 아니라 합성 및 검사 등에 많은 비용이 지출된다는 문제가 있다.Here, if the structure and composition of an optimized material are not derived in the step of confirming the structure and composition, or if the desired properties are not specified in the step of measuring various properties for confirming application possibility, the first step, the structure and composition of the material Since the synthesizing step must be repeated, and the step of synthesizing the structure and composition of the material must be repeatedly performed to find the optimized material, it takes a minimum of several months to a maximum of several years to find the optimized material. There is a problem that a lot of cost is spent on synthesis and inspection.

한편, 이러한 종래의 문제점들을 해소하기 위하여, 바이오, 나노 연구와 관련된 각종 정보 및 데이터를 학습한 인공지능 모델을 이용하는 방법이 제안되고 있다.On the other hand, in order to solve these conventional problems, a method of using an artificial intelligence model learned from various information and data related to bio and nano research has been proposed.

여기서, 인공지능 모델을 이용하기 위해서는 인공지능 모델을 학습시키기 위한 자료로써, 연구 기록 데이터를 생성하는 과정이 필수적인데, 이러한 학습 데이터로 사용되는 연구 기록 데이터는 연구자 또는 실험자들이 일일이 실험 정보를 기록하여 작성하는 것이기 때문에, 비슷한 기록 반복 등과 같은 번거로움 야기, 실험의 중요 조건 누락, 데이터 활용 시 재가공 필수, 다량의 데이터 생성에 따른 분석 및 관리의 어려움 등 다양한 문제가 있다.Here, in order to use the artificial intelligence model, it is essential to create research record data as data for learning the artificial intelligence model. Since it is written, there are various problems such as causing hassle such as repetition of similar records, omission of important conditions for experiments, necessity of reprocessing when using data, and difficulties in analysis and management due to the generation of large amounts of data.

본 발명이 해결하고자 하는 과제는 정형화되지 않은 연구 기록 정보를 가공하여 자동으로 정형화된 연구 기록 데이터를 생성함으로써, 기록의 편의성을 증대 시키고, 기록의 정확도를 대폭 향상시키며, 연구 과정 및 결과 분석, 공유 및 관리가 용이하도록 할 뿐만 아니라, 상기의 방법에 따라 정형화된 연구 기록 데이터를 학습 데이터로 하여 학습된 인공지능 모델을 통해 특정 조건을 만족하는 합성 물질과 해당 합성 물질을 합성하기 위한 가이드 정보를 도출하는 합성 물질 개발 프로세스를 제공함으로써, 보다 편리하고 빠르게 합성 물질을 개발할 수 있도록 보조할 수 있는 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법, 장치 및 컴퓨터프로그램을 제공하는 것이다.The problem to be solved by the present invention is to process unstructured research record information to automatically generate standardized research record data, thereby increasing the convenience of records, significantly improving the accuracy of records, analyzing and sharing research processes and results and management, as well as deriving a synthetic material that satisfies specific conditions and guide information for synthesizing the synthetic material through an artificial intelligence model learned using the research record data standardized according to the above method as learning data To provide a synthetic material development process using an artificial intelligence model that can assist in developing synthetic materials more conveniently and quickly by providing a synthetic material development process, a device, and a computer program.

본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The problems to be solved by the present invention are not limited to the problems mentioned above, and other problems not mentioned will be clearly understood by those skilled in the art from the description below.

상술한 과제를 해결하기 위한 본 발명의 일 실시예에 따른 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법은 컴퓨팅 장치에 의해 수행되는 방법에 있어서, 하나 이상의 조건을 획득하는 단계 및 상기 획득된 하나 이상의 조건을 만족하는 합성 물질에 관한 정보를 추출하고, 상기 추출된 합성 물질에 관한 정보에 기초하여 상기 합성 물질을 합성하기 위한 가이드 정보를 추출하는 단계를 포함할 수 있다.A method for providing a synthetic material development process using an artificial intelligence model according to an embodiment of the present invention for solving the above problems is a method performed by a computing device, comprising the steps of acquiring one or more conditions and the obtained one or more conditions. The method may include extracting information on a synthetic material that satisfies a condition and extracting guide information for synthesizing the synthetic material based on the extracted information on the synthetic material.

다양한 실시예에서, 상기 가이드 정보를 추출하는 단계는, 제1 인공지능 모델을 생성하는 단계, 복수의 합성 물질 각각의 구조 및 특성 정보를 포함하는 속성 정보, 상기 복수의 합성 물질 각각을 합성하기 위한 정보 - 상기 복수의 합성 물질 각각을 합성하기 위한 정보는 상기 복수의 합성 물질 각각을 합성하기 위한 재료, 장비 및 합성 방법에 관한 정보를 포함함 - 를 학습 데이터로 하여 상기 생성된 제1 인공지능 모델을 학습시키는 단계 및 상기 획득된 하나 이상의 조건을 상기 학습된 제1 인공지능 모델의 입력 값으로 하여 상기 획득된 하나 이상의 조건을 만족하는 구조 및 특성을 가지는 합성 물질을 예측하고, 상기 예측된 합성 물질을 합성하기 위한 재료, 장비 및 합성 방법을 포함하는 결과 값을 추출하는 단계를 포함할 수 있다.In various embodiments, the extracting of the guide information may include generating a first artificial intelligence model, attribute information including structure and characteristic information of each of a plurality of synthetic materials, and synthesizing each of the plurality of synthetic materials. The first artificial intelligence model generated by using information - the information for synthesizing each of the plurality of synthetic materials includes information on materials, equipment, and synthesis methods for synthesizing each of the plurality of synthetic materials - as learning data and predicting a synthetic material having a structure and characteristics that satisfy the acquired one or more conditions by using the obtained one or more conditions as input values of the learned first artificial intelligence model, and the predicted synthetic material It may include a step of extracting result values including materials, equipment, and synthesis methods for synthesizing.

다양한 실시예에서, 상기 생성된 제1 인공지능 모델을 학습시키는 단계는, 사용자에게 상기 추출된 결과 값을 제공한 것에 대한 응답으로, 상기 사용자로부터 피드백 정보 - 상기 피드백 정보는 상기 예측된 합성 물질을 합성하기 위한 재료, 장비 및 합성 방법에 따라 생성된 합성 물질에 관한 정보를 포함함 - 를 입력받는 단계 및 상기 입력된 피드백 정보를 학습 데이터로 하여 상기 학습된 제1 인공지능 모델을 재학습시키는 단계를 포함할 수 있다.In various embodiments, the step of training the generated first artificial intelligence model may include, in response to providing the extracted result value to a user, feedback information from the user - the feedback information includes the predicted synthetic material. Including materials for synthesis, equipment, and information on synthetic materials generated according to the synthesis method - Step of receiving an input and re-learning the learned first artificial intelligence model using the input feedback information as learning data can include

다양한 실시예에서, 상기 가이드 정보를 추출하는 단계는, 특정 재료, 장비 및 합성 방법을 상기 학습된 제1 인공지능 모델의 입력 값으로 하여 상기 특정 재료, 장비 및 합성 방법에 따라 합성될 것으로 예측되는 합성 물질에 관한 정보를 결과 값으로 추출하는 단계를 더 포함할 수 있다.In various embodiments, the step of extracting the guide information is predicted to be synthesized according to the specific material, equipment, and synthesis method by using the specific material, equipment, and synthesis method as input values of the learned first artificial intelligence model A step of extracting information about the synthetic material as a result value may be further included.

다양한 실시예에서, 상기 생성된 제1 인공지능 모델을 학습시키는 단계는, 복수의 합성 방법에 따른 수율을 학습 데이터로 하여 상기 학습된 제1 인공지능 모델을 학습시키는 단계를 포함하며, 상기 결과 값을 추출하는 단계는, 상기 예측된 합성 물질에 대한 스케일업(scale-up)을 수행하고자 하는 경우, 상기 복수의 합성 방법에 따른 수율을 학습 데이터로 하여 학습된 제1 인공지능 모델을 통해 상기 예측된 합성 물질을 합성하기 위한 합성 방법을 재추출하는 단계를 포함할 수 있다.In various embodiments, the step of learning the generated first artificial intelligence model includes learning the learned first artificial intelligence model using a yield according to a plurality of synthesis methods as learning data, and the result value The step of extracting is, when scale-up for the predicted synthetic material is to be performed, the prediction through the first artificial intelligence model learned using the yield according to the plurality of synthesis methods as learning data It may include re-extracting the synthesis method for synthesizing the synthesized material.

다양한 실시예에서, 상기 가이드 정보를 추출하는 단계는, 제2 인공지능 모델을 생성하는 단계, 복수의 합성 물질에 관한 정보 및 시험에 관한 정보 - 상기 시험에 관한 정보는 상기 복수의 합성 물질에 대한 전임상 시험 또는 임상 시험을 수행하기 위해 설정된 조건, 상기 설정된 조건에 따른 시험 결과를 포함함 - 를 학습 데이터로 하여 상기 생성된 제2 인공지능 모델을 학습시키는 단계 및 상기 합성 물질에 관한 정보를 상기 학습된 제2 인공지능 모델의 입력 값으로 하여 상기 합성 물질의 시험을 위한 조건을 설정하는 단계를 포함하며, 상기 생성된 제2 인공지능 모델을 학습시키는 단계는, 상기 설정된 조건에 따라 상기 합성 물질에 대한 시험을 수행한 결과를 학습 데이터로 하여 상기 학습된 제2 인공지능 모델을 재학습시키는 단계를 포함할 수 있다.In various embodiments, the extracting of the guide information may include generating a second artificial intelligence model, information on a plurality of synthetic materials and information on a test - the information on the test may include information on the plurality of synthetic materials. Learning the generated second artificial intelligence model using conditions set for conducting a preclinical test or clinical trial, including test results according to the set conditions as learning data, and learning information about the synthetic material and setting a condition for testing the synthetic material using the input value of the second artificial intelligence model, wherein the step of learning the generated second artificial intelligence model is performed on the synthetic material according to the set condition. Re-learning the learned second artificial intelligence model using a result of performing a test for the learning data as learning data.

다양한 실시예에서, 상기 가이드 정보를 추출하는 단계는, 상기 합성 물질의 시험에 대한 특정 조건을 상기 학습된 제2 인공지능 모델의 입력 값으로 하여 상기 합성 물질의 시험 결과 예측 값을 결과 값으로 추출하는 단계를 더 포함할 수 있다.In various embodiments, in the step of extracting the guide information, a test result prediction value of the synthetic material is extracted as a result value by using a specific condition for the test of the synthetic material as an input value of the learned second artificial intelligence model It may further include steps to do.

다양한 실시예에서, 상기 가이드 정보를 추출하는 단계는, 제3 인공지능 모델을 생성하는 단계, 복수의 시험대상에 관한 정보, 신물질로 개발된 복수의 합성 물질에 관한 정보 및 상기 신물질로 개발된 복수의 합성 물질 각각의 시험 결과를 학습 데이터로 하여 상기 생성된 제3 인공지능 모델을 학습시키는 단계 및 상기 합성 물질에 관한 정보를 상기 제3 인공지능 모델의 입력 값으로 하여 상기 합성 물질을 포함하는 신물질 개발 시 상기 합성 물질을 포함하는 물질을 사용하기 적합한 대상 및 사용량에 관한 정보를 결과 값으로 추출하는 단계를 포함할 수 있다.In various embodiments, the step of extracting the guide information may include generating a third artificial intelligence model, information on a plurality of test subjects, information on a plurality of synthetic materials developed as new materials, and a plurality of materials developed as new materials. learning the generated third artificial intelligence model using the test results of each of the synthetic materials as learning data, and using the information on the synthetic material as an input value of the third artificial intelligence model New material including the synthetic material A step of extracting, as a result value, information about a target suitable for using the material including the synthetic material and the amount used during development may be included.

상술한 과제를 해결하기 위한 본 발명의 다른 실시예에 따른 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공장치는 프로세서, 네트워크 인터페이스, 메모리 및 상기 메모리에 로드(load)되고, 상기 프로세서에 의해 실행되는 컴퓨터 프로그램을 포함하되, 상기 컴퓨터 프로그램은, 하나 이상의 조건을 획득하는 인스트럭션(instruction) 및 상기 획득된 하나 이상의 조건을 만족하는 합성 물질에 관한 정보를 추출하고, 상기 추출된 합성 물질에 관한 정보에 기초하여 상기 합성 물질을 합성하기 위한 가이드 정보를 추출하는 인스트럭션을 포함할 수 있다.An apparatus for providing a synthetic material development process using an artificial intelligence model according to another embodiment of the present invention for solving the above problems is a processor, a network interface, a memory, and a computer loaded into the memory and executed by the processor. Including a program, wherein the computer program extracts instructions for acquiring one or more conditions and information about synthetic materials that satisfy the obtained one or more conditions, and based on the information about the extracted synthetic materials It may include instructions for extracting guide information for synthesizing the synthetic material.

상술한 과제를 해결하기 위한 본 발명의 또 다른 실시예에 따른 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터프로그램은 컴퓨팅 장치와 결합되어, 하나 이상의 조건을 획득하는 단계 및 상기 획득된 하나 이상의 조건을 만족하는 합성 물질에 관한 정보를 추출하고, 상기 추출된 합성 물질에 관한 정보에 기초하여 상기 합성 물질을 합성하기 위한 가이드 정보를 추출하는 단계를 포함하는 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 실행시키기 위하여 컴퓨터로 판독가능한 기록매체에 저장될 수 있다.A computer program recorded on a computer-readable recording medium according to another embodiment of the present invention for solving the above problems is combined with a computing device, obtaining one or more conditions, and the obtained one or more conditions. A method for providing a synthetic material development process using an artificial intelligence model comprising the step of extracting information about a synthetic material that satisfies and extracting guide information for synthesizing the synthetic material based on the extracted synthetic material information. It may be stored in a computer-readable recording medium in order to be executed.

본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.Other specific details of the invention are included in the detailed description and drawings.

본 발명의 다양한 실시예에 따르면, 정형화되지 않은 연구 기록 정보를 가공하여 자동으로 정형화된 연구 기록 데이터를 생성함으로써, 기록의 편의성을 증대 시키고, 기록의 정확도를 대폭 향상시키며, 연구 과정 및 결과 분석, 공유 및 관리가 용이하도록 할 뿐만 아니라, 상기의 방법에 따라 정형화된 연구 기록 데이터를 학습 데이터로 하여 학습된 인공지능 모델을 통해 특정 조건을 만족하는 합성 물질과 해당 합성 물질을 합성하기 위한 가이드 정보를 도출하는 합성 물질 개발 프로세스를 제공함으로써, 보다 편리하고 빠르게 합성 물질을 개발할 수 있도록 보조할 수 있다는 이점이 있다.According to various embodiments of the present invention, by processing non-standard research record information and automatically generating standardized research record data, the convenience of record is increased, the accuracy of record is greatly improved, the research process and result analysis, In addition to making it easy to share and manage, synthetic materials that satisfy specific conditions and guide information for synthesizing the synthetic materials through an artificial intelligence model learned using research record data standardized according to the above method as learning data By providing a synthetic material development process that derives, there is an advantage in being able to assist in developing synthetic materials more conveniently and quickly.

본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description below.

도 1은 본 발명의 일 실시예에 따른 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공시스템을 도시한 도면이다.
도 2는 본 발명의 다른 실시예에 따른 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공장치의 하드웨어 구성도이다.
도 3은 다양한 실시예에서, 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이다.
도 4는 다양한 실시예에서, 줄글 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이다.
도 5 내지 7은 다양한 실시예에서, 줄글 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.
도 8은 다양한 실시예에서, 키워드 입력을 통한 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이다.
도 9는 다양한 실시예에서, 키워드 입력을 통한 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.
도 10은 다양한 실시예에서, 음성 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.
도 11은 다양한 실시예에서, 정형화된 연구 기록 데이터를 이용하여 줄글 형태의 연구 기록 정보를 생성하는 방법을 설명하기 위한 순서도이다.
도 12 내지 14는 다양한 실시예에서, 정형화된 연구 기록 데이터를 이용하여 줄글 형태의 연구 기록 정보를 생성하는 과정을 도시한 도면이다.
도 15는 다양한 실시예에서, 정형화된 연구 기록 데이터를 기반으로 시뮬레이션을 수행하는 방법을 설명하기 위한 순서도이다.
도 16은 다양한 실시예에서, 제1 인공지능 모델을 통해 합성 물질 및 합성 물질의 합성을 위한 가이드 정보를 추출하는 방법을 설명하기 위한 도면이다.
도 17은 다양한 실시예에서, 제2 인공지능 모델을 통해 합성 물질에 대한 시험 조건을 설정하는 방법을 설명하기 위한 도면이다.
도 18은 다양한 실시예에서, 제3 인공지능 모델을 통해, 신약 개발 시 신약에 적합한 환자와 투약량을 도출하는 방법을 설명하기 위한 도면이다.
도 19는 다양한 실시예에서, 정형화된 연구 기록 데이터 기반 비정형 데이터를 추천 제공하는 과정을 도시한 도면이다.
도 20은 다양한 실시예에서, 정형화된 연구 기록 데이터 기반 연구자를 추천 매칭하는 과정을 도시한 도면이다.
도 21 내지 24는 다양한 실시예에 적용 가능한 사용자 인터페이스의 형태를 예시적으로 도시한 도면이다.
1 is a diagram illustrating a synthetic material development process providing system using an artificial intelligence model according to an embodiment of the present invention.
2 is a hardware configuration diagram of a synthetic material development process providing apparatus using an artificial intelligence model according to another embodiment of the present invention.
3 is a flowchart illustrating a method of automatically generating standardized research record data for learning of an artificial intelligence model, in various embodiments.
4 is a flowchart illustrating a method of automatically generating standardized research record data using the research record information in the form of a line in various embodiments.
5 to 7 are diagrams illustrating a process of automatically generating standardized research record data using the research record information in the form of a line in various embodiments.
8 is a flowchart illustrating a method of automatically generating standardized research record data through keyword input, in various embodiments.
9 is a diagram illustrating a process of automatically generating standardized research record data through keyword input in various embodiments.
10 is a diagram illustrating a process of automatically generating standardized research record data using voice-type research record information in various embodiments.
11 is a flowchart illustrating a method of generating research record information in a line form using standardized research record data, in various embodiments.
12 to 14 are diagrams illustrating a process of generating research record information in a line form using standardized research record data, in various embodiments.
15 is a flowchart illustrating a method of performing a simulation based on standardized study record data, in various embodiments.
16 is a diagram for explaining a method of extracting a synthetic material and guide information for synthesizing the synthetic material through a first artificial intelligence model, in various embodiments.
17 is a diagram for explaining a method of setting test conditions for a synthetic material through a second artificial intelligence model, in various embodiments.
18 is a view for explaining a method of deriving a patient and dosage suitable for a new drug when developing a new drug through a third artificial intelligence model, in various embodiments.
19 is a diagram illustrating a process of recommending and providing unstructured data based on standardized research record data, in various embodiments.
20 is a diagram illustrating a process of recommending and matching a researcher based on standardized research record data, in various embodiments.
21 to 24 are diagrams illustrating forms of user interfaces applicable to various embodiments by way of example.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. Advantages and features of the present invention, and methods of achieving them, will become clear with reference to the detailed description of the following embodiments taken in conjunction with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in various different forms, only these embodiments are intended to complete the disclosure of the present invention, and are common in the art to which the present invention belongs. It is provided to fully inform the person skilled in the art of the scope of the invention, and the invention is only defined by the scope of the claims.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.Terminology used herein is for describing the embodiments and is not intended to limit the present invention. In this specification, singular forms also include plural forms unless specifically stated otherwise in a phrase. As used herein, "comprises" and/or "comprising" does not exclude the presence or addition of one or more other elements other than the recited elements. Like reference numerals throughout the specification refer to like elements, and “and/or” includes each and every combination of one or more of the recited elements. Although "first", "second", etc. are used to describe various components, these components are not limited by these terms, of course. These terms are only used to distinguish one component from another. Accordingly, it goes without saying that the first element mentioned below may also be the second element within the technical spirit of the present invention.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used in this specification may be used with meanings commonly understood by those skilled in the art to which the present invention belongs. In addition, terms defined in commonly used dictionaries are not interpreted ideally or excessively unless explicitly specifically defined.

명세서에서 사용되는 "부" 또는 “모듈”이라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부" 또는 “모듈”은 어떤 역할들을 수행한다. 그렇지만 "부" 또는 “모듈”은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부" 또는 “모듈”은 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부" 또는 “모듈”은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부" 또는 “모듈”들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부" 또는 “모듈”들로 결합되거나 추가적인 구성요소들과 "부" 또는 “모듈”들로 더 분리될 수 있다.The term "unit" or "module" used in the specification means a hardware component such as software, FPGA or ASIC, and "unit" or "module" performs certain roles. However, "unit" or "module" is not meant to be limited to software or hardware. A “unit” or “module” may be configured to reside in an addressable storage medium and may be configured to reproduce one or more processors. Thus, as an example, a “unit” or “module” may refer to components such as software components, object-oriented software components, class components, and task components, processes, functions, properties, procedures, subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables. Functions provided within components and "units" or "modules" may be combined into smaller numbers of components and "units" or "modules" or may be combined into additional components and "units" or "modules". can be further separated.

공간적으로 상대적인 용어인 "아래(below)", "아래(beneath)", "하부(lower)", "위(above)", "상부(upper)" 등은 도면에 도시되어 있는 바와 같이 하나의 구성요소와 다른 구성요소들과의 상관관계를 용이하게 기술하기 위해 사용될 수 있다. 공간적으로 상대적인 용어는 도면에 도시되어 있는 방향에 더하여 사용시 또는 동작시 구성요소들의 서로 다른 방향을 포함하는 용어로 이해되어야 한다. 예를 들어, 도면에 도시되어 있는 구성요소를 뒤집을 경우, 다른 구성요소의 "아래(below)"또는 "아래(beneath)"로 기술된 구성요소는 다른 구성요소의 "위(above)"에 놓여질 수 있다. 따라서, 예시적인 용어인 "아래"는 아래와 위의 방향을 모두 포함할 수 있다. 구성요소는 다른 방향으로도 배향될 수 있으며, 이에 따라 공간적으로 상대적인 용어들은 배향에 따라 해석될 수 있다.The spatially relative terms "below", "beneath", "lower", "above", "upper", etc. It can be used to easily describe a component's correlation with other components. Spatially relative terms should be understood as including different orientations of elements in use or operation in addition to the orientations shown in the drawings. For example, if you flip a component that is shown in a drawing, a component described as "below" or "beneath" another component will be placed "above" the other component. can Thus, the exemplary term “below” may include directions of both below and above. Components may also be oriented in other orientations, and thus spatially relative terms may be interpreted according to orientation.

본 명세서에서, 컴퓨터는 적어도 하나의 프로세서를 포함하는 모든 종류의 하드웨어 장치를 의미하는 것이고, 실시 예에 따라 해당 하드웨어 장치에서 동작하는 소프트웨어적 구성도 포괄하는 의미로서 이해될 수 있다. 예를 들어, 컴퓨터는 스마트폰, 태블릿 PC, 데스크톱, 노트북 및 각 장치에서 구동되는 사용자 클라이언트 및 애플리케이션을 모두 포함하는 의미로서 이해될 수 있으며, 또한 이에 제한되는 것은 아니다.In this specification, a computer means any kind of hardware device including at least one processor, and may be understood as encompassing a software configuration operating in a corresponding hardware device according to an embodiment. For example, a computer may be understood as including a smartphone, a tablet PC, a desktop computer, a laptop computer, and user clients and applications running on each device, but is not limited thereto.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 명세서에서 설명되는 각 단계들은 컴퓨터에 의하여 수행되는 것으로 설명되나, 각 단계의 주체는 이에 제한되는 것은 아니며, 실시 예에 따라 각 단계들의 적어도 일부가 서로 다른 장치에서 수행될 수도 있다.Although each step described in this specification is described as being performed by a computer, the subject of each step is not limited thereto, and at least a part of each step may be performed in different devices according to embodiments.

도 1은 본 발명의 일 실시예에 따른 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공시스템을 도시한 도면이다.1 is a diagram illustrating a synthetic material development process providing system using an artificial intelligence model according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일 실시예에 따른 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공시스템은 합성 물질 개발 프로세스 제공장치(100), 사용자 단말(200), 외부 서버(300) 및 네트워크(400)를 포함할 수 있다.1, a synthetic material development process providing system using an artificial intelligence model according to an embodiment of the present invention includes a synthetic material development process providing apparatus 100, a user terminal 200, an external server 300, and a network ( 400) may be included.

여기서, 도 1에 도시된 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공시스템은 일 실시예에 따른 것이고, 그 구성 요소가 도 1에 도시된 실시예에 한정되는 것은 아니며, 필요에 따라 부가, 변경 또는 삭제될 수 있다. 예를 들어, 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공시스템은 각종 정보 및 데이터를 저장 및 관리하는 외부 서버(300)를 별도로 구비하지 않고, 합성 물질 개발 프로세스 제공장치(100) 내에 구비되는 저장 공간을 이용하여 각종 정보 및 데이터를 저장 및 관리할 수 있다.Here, the synthetic material development process providing system using the artificial intelligence model shown in FIG. 1 is according to an embodiment, and its components are not limited to the embodiment shown in FIG. may be deleted. For example, a synthetic material development process providing system using an artificial intelligence model does not separately include an external server 300 for storing and managing various information and data, and a storage space provided in the synthetic material development process providing apparatus 100. You can store and manage various types of information and data using .

일 실시예에서, 합성 물질 개발 프로세스 제공장치(100)는 사용자로부터 실험에 대한 연구 기록 정보를 입력받을 수 있고, 입력된 연구 기록 정보를 기 설정된 양식에 맞춰 자동으로 가공 및 기록함으로써, 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터를 생성할 수 있다.In one embodiment, the synthetic material development process providing apparatus 100 may receive research record information about an experiment from a user, and automatically process and record the input research record information according to a preset format, thereby forming an artificial intelligence model. It is possible to create standardized research record data for learning.

또한, 합성 물질 개발 프로세스 제공장치(100)는 정형화된 연구 기록 데이터를 기록 및 저장할 수 있고, 저장된 정형화된 연구 기록 데이터에 포함된 각종 정보들을 컴퓨팅(Computing)하여 특정 실험을 가상으로 시뮬레이션하기 위해 정형화된 연구 기록 데이터를 코드화 함으로써, 코드화된 연구 기록 데이터를 생성할 수 있다. 이때, 정형화된 연구 기록 데이터와 코드화된 연구 기록 데이터는 상호 연관되어 저장될 수 있다.In addition, the synthetic material development process providing apparatus 100 may record and store standardized research record data, and computes various information included in the stored standardized research record data to virtually simulate a specific experiment. Coded research record data can be coded to create coded study record data. In this case, the standardized research record data and the coded research record data may be correlated and stored.

다양한 실시예에서, 합성 물질 개발 프로세스 제공장치(100)는 상기의 방법에 따라 정형화된 연구 기록 데이터를 학습 데이터로 하여 기 학습된 인공지능 모델을 통해, 특정 조건을 만족하는 합성 물질을 예측하고, 예측된 합성 물질을 합성하기 위한 가이드 정보를 추출 및 제공하는 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 제공할 수 있다.In various embodiments, the synthetic material development process providing apparatus 100 predicts a synthetic material that satisfies a specific condition through a pre-learned artificial intelligence model using research record data standardized according to the above method as learning data, It is possible to provide a synthetic material development process providing method using an artificial intelligence model that extracts and provides guide information for synthesizing a predicted synthetic material.

다양한 실시예에서, 합성 물질 개발 프로세스 제공장치(100)는 네트워크(400)를 통해 사용자 단말(200)과 연결될 수 있으며, 사용자 단말(200)로 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 제공하기 위한 사용자 인터페이스(User Interface, UI)(예: 그래픽 사용자 인터페이스(Graphic User Interface, GUI), 도 20 내지 24의 10)를 제공할 수 있다.In various embodiments, the synthetic material development process providing apparatus 100 may be connected to the user terminal 200 through the network 400, and the user terminal 200 automatically records standardized research data for learning of an artificial intelligence model. To provide a user interface (UI) (e.g., a graphical user interface (GUI), 10 of FIGS. 20 to 24) for providing a method of providing a synthetic material development process using a generation method and an artificial intelligence model. can

여기서, 네트워크(400)는 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미할 수 있다. 예를 들어, 네트워크(400)는 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷(WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함할 수 있다.Here, the network 400 may refer to a connection structure capable of exchanging information between nodes such as a plurality of terminals and servers. For example, the network 400 includes a local area network (LAN), a wide area network (WAN), a world wide web (WWW), a wired and wireless data communication network, a telephone network, a wired and wireless television communication network, and the like. can do.

또한, 여기서, 무선 데이터 통신망은 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), 5GPP(5th Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), RF(Radio Frequency), 블루투스(Bluetooth) 네트워크, NFC(Near-Field Communication) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함할 수 있다. 그러나, 이에 한정되지 않고, 동일 또는 유사한 기술 분야에 적용 가능한 다른 범용적인 네트워크들이 더 포함될 수 있다.In addition, here, the wireless data communication networks are 3G, 4G, 5G, 3GPP (3rd Generation Partnership Project), 5GPP (5th Generation Partnership Project), LTE (Long Term Evolution), WIMAX (World Interoperability for Microwave Access), Wi-Fi (Wi-Fi) Fi), Internet, LAN (Local Area Network), Wireless LAN (Wireless Local Area Network), WAN (Wide Area Network), PAN (Personal Area Network), RF (Radio Frequency), Bluetooth network, A near-field communication (NFC) network, a satellite broadcasting network, an analog broadcasting network, a digital multimedia broadcasting (DMB) network, and the like may be included. However, it is not limited thereto, and other general-purpose networks applicable to the same or similar technical fields may be further included.

다양한 실시예에서, 합성 물질 개발 프로세스 제공장치(100)는 특정 사용자로부터 입력된 연구 기록 정보에 기초하여, 정형화된 연구 기록 데이터를 생성할 수 있고, 해당 정형화된 연구 기록 데이터를 다른 사용자들에게 공유하는 정형화된 연구 기록 데이터 공유 서비스를 제공할 수 있다.In various embodiments, the synthetic material development process providing apparatus 100 may generate standardized research record data based on research record information input from a specific user, and share the standardized research record data with other users. A standardized research record data sharing service can be provided.

예를 들어, 합성 물질 개발 프로세스 제공장치(100)는 복수의 사용자들로부터 입력된 연구 기록 정보에 기초하여 생성된 복수의 정형화된 연구 기록 데이터를 저장 및 관리할 수 있고, 복수의 사용자 각각에게 기 저장된 정형화된 연구 기록 데이터들의 검색 및 재현 서비스를 제공할 수 있으며, 사용자들이 검색 및 재현 서비스를 통해 자신이 원하는 정형화된 연구 기록 데이터를 검색하여 확인(예: 데이터에 기록된 정보 확인 및 시뮬레이션)할 수 있도록 구현될 수 있다.For example, the synthetic material development process providing apparatus 100 may store and manage a plurality of standardized research record data generated based on research record information input from a plurality of users, and provide each of the plurality of users with It is possible to provide a search and reproduction service for stored standardized research record data, and through the search and reproduction service, users can search and confirm the standardized research record data they want (e.g., check and simulate information recorded in data). can be implemented so that

또한, 합성 물질 개발 프로세스 제공장치(100)는 외부로부터 정형화된 연구 기록 데이터를 가져와 저장하는 가져오기 기능(Import) 및 기 저장된 정형화된 연구 기록 데이터를 외부로 내보내는 내보내기(Export) 기능을 제공하여, 사용자가 기 저장된 복수의 정형화된 연구 기록 데이터를 다운받거나, 사용자로부터 외부에서 생성된 정형화된 연구 기록 데이터를 업로드할 수 있도록 구현될 수 있다.In addition, the synthetic material development process providing apparatus 100 provides an import function for importing and storing standardized research record data from the outside and an export function for exporting previously stored standardized research record data to the outside, It may be implemented so that the user can download a plurality of pre-stored standardized research record data or upload standardized research record data generated externally from the user.

이때, 컴퓨팅 장치(100)는 다양한 확장자를 지원하여, 외부로 내보내는 정형화된 연구 기록 데이터의 확장자를 사용자의 요청에 맞춰 변환하거나 외부로부터 다양한 확장자를 가지는 정형화된 연구 기록 데이터를 업로드 받는 등 넓은 호환성을 가지도록 구현될 수 있다.At this time, the computing device 100 supports various extensions, and wide compatibility, such as converting the extension of standardized research record data exported to the outside according to the user's request or uploading standardized research record data having various extensions from the outside. It can be implemented to have

다양한 실시예에서, 합성 물질 개발 프로세스 제공장치(100)는 사용자의 요청에 따라 웹(Web) 또는 애플리케이션(Application) 기반의 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 제공할 수 있으나, 이에 한정되지 않는다.In various embodiments, the synthetic material development process providing apparatus 100 provides a method for automatically generating standardized research record data for learning of a web or application-based artificial intelligence model and an artificial intelligence model according to a user's request. It is possible to provide a method for providing a synthetic material development process using, but is not limited thereto.

일 실시예에서, 사용자 단말(200)은 네트워크(400)를 통해 합성 물질 개발 프로세스 제공장치(100)와 연결될 수 있으며, 합성 물질 개발 프로세스 제공장치(100)로부터 제공된 UI를 통해 연구 기록 정보를 입력할 수 있고, 연구 기록 정보를 입력한 것에 대한 응답으로, 연구 기록 정보에 대응하여 생성된 정형화된 연구 기록 데이터를 제공받을 수 있다.In one embodiment, the user terminal 200 may be connected to the synthetic material development process providing apparatus 100 through the network 400, and input research record information through the UI provided from the synthetic material development process providing apparatus 100. and, in response to input of the research record information, standardized research record data generated in response to the research record information may be provided.

또한, 사용자 단말(200)은 합성 물질 개발 프로세스 제공장치(100)로부터 제공된 UI를 통해 특정 조건을 입력할 수 있고, 특정 조건을 입력한 것에 대한 응답으로, 특정 조건을 만족하는 구조 및 특성을 가지는 합성 물질과 해당 합성 물질을 합성하기 위한 가이드 정보를 제공받을 수 있다.In addition, the user terminal 200 may input a specific condition through the UI provided from the synthetic material development process providing apparatus 100, and has a structure and characteristics satisfying the specific condition in response to inputting the specific condition. A synthetic material and guide information for synthesizing the synthetic material may be provided.

다양한 실시예에서, 사용자 단말(200)은 합성 물질 개발 프로세스 제공장치(100)로부터 제공된 애플리케이션을 다운로드, 설치 및 실행함에 따라 합성 물질 개발 프로세스 제공장치(100)로부터 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 제공받을 수 있다.In various embodiments, the user terminal 200 downloads, installs, and executes an application provided from the apparatus for providing a synthetic material development process 100, thereby providing a standardized system for learning an artificial intelligence model from the apparatus for providing a synthetic material development process 100. You can be provided with a method for automatically generating research record data and a method for providing a synthetic material development process using an artificial intelligence model.

이를 위해, 사용자 단말(200)은 애플리케이션 구동이 가능한 운영체제를 포함하고, 사용자 단말(200)의 적어도 일부분에 UI 출력을 위한 디스플레이를 포함하는 스마트폰(Smartphone)일 수 있다. 그러나, 이에 한정되지 않고, 사용자 단말(200)은, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트 패드(Smartpad), 타블렛PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.To this end, the user terminal 200 may be a smartphone including an operating system capable of driving applications and including a display for UI output on at least a portion of the user terminal 200 . However, it is not limited thereto, and the user terminal 200 is a wireless communication device that ensures portability and mobility, and includes navigation, PCS (Personal Communication System), GSM (Global System for Mobile communications), PDC (Personal Digital Cellular), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), IMT (International Mobile Telecommunication)-2000, CDMA (Code Division Multiple Access)-2000, W-CDMA (W-Code Division Multiple Access), Wibro (Wireless Broadband Internet ) terminal, smart pad (Smartpad), tablet PC (Tablet PC), such as all kinds of handheld (Handheld) based wireless communication device can be included.

일 실시예에서, 외부 서버(300)는 네트워크(400)를 통해 합성 물질 개발 프로세스 제공장치(100)와 연결될 수 있으며, 합성 물질 개발 프로세스 제공장치(100)가 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 수행하기 위해 필요한 각종 정보/데이터(예: 실험 재료와 관련된 데이터, 연구 및 실험 과정과 관련된 데이터 및 결과 데이터 양식 등)를 저장 및 관리하거나, 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 수행함에 따라 생성되는 각종 정보/데이터(예: 정형화(또는 코드화)된 연구 기록 데이터)를 저장 및 관리할 수 있다.In one embodiment, the external server 300 may be connected to the synthetic material development process providing apparatus 100 through the network 400, and the synthetic material development process providing apparatus 100 provides a standardized system for learning artificial intelligence models. Various information/data (e.g., data related to experimental materials, data related to research and experiment process, and result data form, etc.) Various information/data (e.g. standardized (or coded) research record data) can be stored and managed.

여기서, 외부 서버(300)는 합성 물질 개발 프로세스 제공장치(100) 외부에 별도로 구비되는 저장 서버일 수 있으나, 이에 한정되지 않는다. 이하, 도 2를 참조하여 합성 물질 개발 프로세스 제공장치(100)의 하드웨어 구성에 대해 설명하도록 한다.Here, the external server 300 may be a storage server provided separately outside the synthetic material development process providing apparatus 100, but is not limited thereto. Hereinafter, the hardware configuration of the synthetic material development process providing apparatus 100 will be described with reference to FIG. 2 .

도 2는 본 발명의 다른 실시예에 따른 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공장치의 하드웨어 구성도이다.2 is a hardware configuration diagram of a synthetic material development process providing apparatus using an artificial intelligence model according to another embodiment of the present invention.

도 2를 참조하면, 다양한 실시예에서, 합성 물질 개발 프로세스 제공장치(100)(이하, “컴퓨팅 장치(100)”)는 하나 이상의 프로세서(110), 프로세서(110)에 의하여 수행되는 컴퓨터 프로그램(151)을 로드(Load)하는 메모리(120), 버스(130), 통신 인터페이스(140) 및 컴퓨터 프로그램(151)을 저장하는 스토리지(150)를 포함할 수 있다. 여기서, 도 2에는 본 발명의 실시예와 관련 있는 구성요소들만 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 2에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.Referring to FIG. 2 , in various embodiments, an apparatus 100 for providing a synthetic material development process (hereinafter referred to as “computing apparatus 100”) includes one or more processors 110 and a computer program (executed by the processor 110). It may include a memory 120 for loading 151, a bus 130, a communication interface 140, and a storage 150 for storing the computer program 151. Here, in FIG. 2, only components related to the embodiment of the present invention are shown. Therefore, those skilled in the art to which the present invention pertains can know that other general-purpose components may be further included in addition to the components shown in FIG. 2 .

프로세서(110)는 컴퓨팅 장치(100)의 각 구성의 전반적인 동작을 제어한다. 프로세서(110)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 발명의 기술 분야에 잘 알려진 임의의 형태의 프로세서를 포함하여 구성될 수 있다.The processor 110 controls the overall operation of each component of the computing device 100 . The processor 110 includes a Central Processing Unit (CPU), a Micro Processor Unit (MPU), a Micro Controller Unit (MCU), a Graphic Processing Unit (GPU), or any type of processor well known in the art of the present invention. It can be.

또한, 프로세서(110)는 본 발명의 실시예들에 따른 방법을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있으며, 컴퓨팅 장치(100)는 하나 이상의 프로세서를 구비할 수 있다.Also, the processor 110 may perform an operation for at least one application or program for executing a method according to embodiments of the present invention, and the computing device 100 may include one or more processors.

다양한 실시예에서, 프로세서(110)는 프로세서(110) 내부에서 처리되는 신호(또는, 데이터)를 일시적 및/또는 영구적으로 저장하는 램(RAM: Random Access Memory, 미도시) 및 롬(ROM: Read-Only Memory, 미도시)을 더 포함할 수 있다. 또한, 프로세서(110)는 그래픽 처리부, 램 및 롬 중 적어도 하나를 포함하는 시스템온칩(SoC: system on chip) 형태로 구현될 수 있다.In various embodiments, the processor 110 may temporarily and/or permanently store signals (or data) processed in the processor 110 (RAM: Random Access Memory, not shown) and ROM (ROM: Read -Only Memory, not shown) may be further included. In addition, the processor 110 may be implemented in the form of a system on chip (SoC) including at least one of a graphics processing unit, RAM, and ROM.

메모리(120)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(120)는 본 발명의 다양한 실시예에 따른 방법/동작을 실행하기 위하여 스토리지(150)로부터 컴퓨터 프로그램(151)을 로드할 수 있다. 메모리(120)에 컴퓨터 프로그램(151)이 로드되면, 프로세서(110)는 컴퓨터 프로그램(151)을 구성하는 하나 이상의 인스트럭션들을 실행함으로써 상기 방법/동작을 수행할 수 있다. 메모리(120)는 RAM과 같은 휘발성 메모리로 구현될 수 있을 것이나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.Memory 120 stores various data, commands and/or information. Memory 120 may load computer program 151 from storage 150 to execute methods/operations according to various embodiments of the present invention. When the computer program 151 is loaded into the memory 120, the processor 110 may perform the method/operation by executing one or more instructions constituting the computer program 151. The memory 120 may be implemented as a volatile memory such as RAM, but the technical scope of the present disclosure is not limited thereto.

버스(130)는 컴퓨팅 장치(100)의 구성 요소 간 통신 기능을 제공한다. 버스(130)는 주소 버스(address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.The bus 130 provides a communication function between components of the computing device 100 . The bus 130 may be implemented in various types of buses such as an address bus, a data bus, and a control bus.

통신 인터페이스(140)는 컴퓨팅 장치(100)의 유무선 인터넷 통신을 지원한다. 또한, 통신 인터페이스(140)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 통신 인터페이스(140)는 본 발명의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다. 몇몇 실시예에서, 통신 인터페이스(140)는 생략될 수도 있다.The communication interface 140 supports wired and wireless Internet communication of the computing device 100 . Also, the communication interface 140 may support various communication methods other than Internet communication. To this end, the communication interface 140 may include a communication module well known in the art. In some embodiments, communication interface 140 may be omitted.

스토리지(150)는 컴퓨터 프로그램(151)을 비 임시적으로 저장할 수 있다. 컴퓨팅 장치(100)를 통해 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 수행하는 경우, 스토리지(150)는 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 제공하기 위하여 필요한 각종 정보를 저장할 수 있다.The storage 150 may non-temporarily store the computer program 151 . When the method of automatically generating standardized research record data for learning an artificial intelligence model and the method of providing a synthetic material development process using an artificial intelligence model are performed through the computing device 100, the storage 150 stores the artificial intelligence model for learning. It is possible to store various types of information necessary to provide a method for automatically generating standardized research record data and a method for providing a synthetic material development process using an artificial intelligence model.

스토리지(150)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.The storage 150 may be a non-volatile memory such as read only memory (ROM), erasable programmable ROM (EPROM), electrically erasable programmable ROM (EEPROM), flash memory, or the like, a hard disk, a removable disk, or a device well known in the art. It may be configured to include any known type of computer-readable recording medium.

컴퓨터 프로그램(151)은 메모리(120)에 로드될 때 프로세서(110)로 하여금 본 발명의 다양한 실시예에 따른 방법/동작을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다. 즉, 프로세서(110)는 상기 하나 이상의 인스트럭션들을 실행함으로써, 본 발명의 다양한 실시예에 따른 상기 방법/동작을 수행할 수 있다.Computer program 151 may include one or more instructions that when loaded into memory 120 cause processor 110 to perform methods/operations in accordance with various embodiments of the invention. That is, the processor 110 may perform the method/operation according to various embodiments of the present disclosure by executing the one or more instructions.

일 실시예에서, 컴퓨터 프로그램(151)은 실험에 관한 연구 기록 정보를 획득하는 단계, 기 저장된 실험과 관련된 데이터에 기초하여 획득된 연구 기록 정보를 가공하는 단계 및 가공된 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터를 생성하는 단계를 포함하는 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법을 수행하도록 하는 하나 이상의 인스트럭션을 포함할 수 있다.In one embodiment, the computer program 151 may perform the steps of acquiring research record information about an experiment, processing the obtained research record information based on previously stored data related to an experiment, and standardizing the research record information using the processed research record information. It may include one or more instructions for performing a method of automatically generating standardized research record data for learning of an artificial intelligence model, including generating research record data.

또한, 컴퓨터 프로그램(151)은 하나 이상의 조건을 획득하는 단계 및 획득된 하나 이상의 조건을 만족하는 합성 물질에 관한 정보를 추출하고, 추출된 합성 물질에 관한 정보에 기초하여 합성 물질을 합성하기 위한 가이드 정보를 추출하는 단계를 포함하는 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 수행하도록 하는 하나 이상의 인스트럭션을 포함할 수 있다.In addition, the computer program 151 includes a guide for obtaining one or more conditions, extracting information about a synthetic material that satisfies the obtained one or more conditions, and synthesizing the synthetic material based on the extracted information about the synthetic material. It may include one or more instructions for performing a synthetic material development process providing method using an artificial intelligence model including extracting information.

본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.Steps of a method or algorithm described in connection with an embodiment of the present invention may be implemented directly in hardware, implemented in a software module executed by hardware, or implemented by a combination thereof. A software module may include random access memory (RAM), read only memory (ROM), erasable programmable ROM (EPROM), electrically erasable programmable ROM (EEPROM), flash memory, hard disk, removable disk, CD-ROM, or It may reside in any form of computer readable recording medium well known in the art to which the present invention pertains.

본 발명의 구성 요소들은 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 애플리케이션)으로 구현되어 매체에 저장될 수 있다. 본 발명의 구성 요소들은 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있으며, 이와 유사하게, 실시 예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 이하, 도 3 내지 15를 참조하여 컴퓨팅 장치(100)에 의해 수행되는 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법에 대해 설명하도록 한다.Components of the present invention may be implemented as a program (or application) to be executed in combination with a computer, which is hardware, and stored in a medium. Components of the present invention may be implemented as software programming or software elements, and similarly, embodiments may include various algorithms implemented as data structures, processes, routines, or combinations of other programming constructs, such as C, C++ , Java (Java), can be implemented in a programming or scripting language such as assembler (assembler). Functional aspects may be implemented in an algorithm running on one or more processors. Hereinafter, a method for automatically generating standardized research record data for learning of an artificial intelligence model performed by the computing device 100 will be described with reference to FIGS. 3 to 15 .

도 3은 다양한 실시예에서, 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이다.3 is a flowchart illustrating a method of automatically generating standardized research record data for learning of an artificial intelligence model, in various embodiments.

도 3을 참조하면, S110 단계에서, 컴퓨팅 장치(100)는 실험에 대한 연구 기록 정보를 획득할 수 있다. Referring to FIG. 3 , in step S110 , the computing device 100 may obtain research record information about the experiment.

여기서, 연구 기록 정보는 사용자가 실험 또는 연구를 수행함에 따라 생성되는 정보를 의미할 수 있다. 예를 들어, 연구 기록 정보는 실험 재료에 대한 정보, 실험 장비에 대한 정보, 실험 및 연구 과정에 대한 정보, 실험 및 연구 결과에 대한 정보를 포함할 수 있으나, 이에 한정되지 않는다.Here, the research record information may refer to information generated as a user conducts an experiment or research. For example, the research record information may include, but is not limited to, information about experimental materials, information about experimental equipment, information about experimental and research processes, and information about experimental and research results.

다양한 실시예에서, 컴퓨팅 장치(100)는 사용자가 실험 또는 연구를 수행함에 따라 생성되는 실험에 대한 연구 기록 정보(예: 실험 재료에 대한 정보, 실험 장비에 대한 정보, 실험 및 연구 과정에 대한 정보, 실험 및 연구 결과에 대한 정보)를 사용자로부터 직접 입력받을 수 있다.In various embodiments, the computing device 100 provides research record information (eg, information about experiment materials, information about experiment equipment, information about experiments and research processes) for experiments generated as a user conducts experiments or researches. , information on experiment and research results) can be directly input from the user.

다양한 실시예에서, 컴퓨팅 장치(100)는 국내외 주요 바이오 나노 제조사에서 수행한 실험에 대한 연구 정보(예: 물질, 장비, 속성, 연구 프로세스, 실험 방법 등)를 웹 크롤링하여 수집할 수 있다. 그러나, 이에 한정되지 않고, 연구 기록 정보를 획득하기 위한 어떠한 방법이든 적용이 가능하다.In various embodiments, the computing device 100 may collect research information (eg, material, equipment, property, research process, experiment method, etc.) on experiments performed by major domestic and foreign bio-nano manufacturers by web crawling. However, it is not limited thereto, and any method for obtaining study record information can be applied.

S120 단계에서, 컴퓨팅 장치(100)는 S110 단계를 거쳐 획득한 연구 기록 정보를 가공할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 기 저장된 실험과 관련된 데이터에 기초하여 S110 단계를 거쳐 획득한 연구 기록 정보 내에서 주요 키워드(예: 재료, 장비, 합성 방법 등을 가리키는 키워드)만을 추출하는 등, 연구 기록 정보 내에 포함된 복수의 정보들을 정형화된 연구 기록 데이터 생성을 위한 형태로 가공할 수 있다.In step S120, the computing device 100 may process the research record information obtained through step S110. For example, the computing device 100 extracts only key keywords (eg, keywords indicating materials, equipment, synthesis methods, etc.) from the research record information obtained through step S110 based on data related to pre-stored experiments. , It is possible to process a plurality of pieces of information included in the research record information into a form for generating standardized research record data.

다양한 실시예에서, 컴퓨팅 장치(100)는 기 저장된 실험과 관련 데이터와 가공된 연구 기록 정보를 연동하여 저장할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 연구 기록 정보에 포함된 실험 재료에 관한 키워드를 가공함으로써 생성된 실험 재료 정보와 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 연동하여 저장할 수 있고, 연구 기록 정보에 포함된 연구 및 실험 과정에 관한 키워드를 가공함으로써 생성된 연구 및 실험 과정 정보와 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 연동하여 저장할 수 있다. 이를 통해, 정확한 샘플 정보 확인이 가능하도록 구현될 수 있다.In various embodiments, the computing device 100 may store pre-stored experiments and related data in conjunction with processed research record information. For example, the computing device 100 may store experimental material information generated by processing keywords related to experimental materials included in research record information and data related to experimental materials included in pre-stored experiment-related data in conjunction with each other, In addition, research and experiment process information generated by processing keywords related to research and experiment process included in research record information and data related to experiment materials included in pre-stored experiment related data can be linked and stored. Through this, it can be implemented to enable accurate sample information confirmation.

또한, 컴퓨팅 장치(100)는 기 설정된 결과 데이터 양식에 기초하여 사용자로부터 입력된 상기 연구 결과에 관한 키워드를 시각화(예: 이미지화, 그래프화 등)할 수 있다.In addition, the computing device 100 may visualize (eg, image, graph, etc.) keywords related to the research result input from the user based on a preset result data format.

S130 단계에서, 컴퓨팅 장치(100)는 S120 단계를 거쳐 가공된 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터(Labnote)를 생성할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 도 23에 도시된 바와 같이, 가공된 연구 기록 정보(예: 실험 재료 정보, 연구 및 실험 과정 정보와 시각화된 연구 결과)를 템플릿화 함으로써, 정형화된 연구 기록 데이터를 생성할 수 있다. 이하, 도 4 내지 12를 참조하여, 연구 기록 정보의 형태에 따라 연구 기록 정보를 가공하는 방법에 대해 설명하도록 한다.In step S130, the computing device 100 may generate standardized research record data (Labnote) using the research record information processed through step S120. For example, as shown in FIG. 23, the computing device 100 templates processed research record information (eg, experiment material information, research and experiment process information, and visualized research results), thereby standardized research records. data can be generated. Hereinafter, with reference to FIGS. 4 to 12, a method of processing research record information according to the form of the study record information will be described.

도 4는 다양한 실시예에서, 줄글 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이며, 도 5 내지 7은 다양한 실시예에서, 줄글 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.4 is a flowchart for explaining a method of automatically generating standardized research record data using research record information in a shortened form in various embodiments, and FIGS. It is a diagram showing the process of automatically generating standardized research record data.

도 4 내지 7을 참조하면, S210 단계에서, 컴퓨팅 장치(100)는 하나 이상의 텍스트 문장을 포함하는 줄글 형태의 연구 기록 정보를 획득할 수 있다(예: 도 5의 21).Referring to FIGS. 4 to 7 , in step S210 , the computing device 100 may acquire research record information in the form of lines including one or more text sentences (eg, 21 in FIG. 5 ).

다양한 실시예에서, 컴퓨팅 장치(100)는 하나 이상의 문장을 포함하는 줄글이나 수기 형태로 기록된 연구 기록 정보를 사용자로부터 직접 입력 받을 수 있다.In various embodiments, the computing device 100 may directly receive research record information recorded in a line or handwritten form including one or more sentences from a user.

다양한 실시예에서, 컴퓨팅 장치(100)는 웹 크롤링 등을 통해 외부로부터 하나 이상의 문장을 포함하는 줄글 형태의 연구 기록 정보를 수집할 수 있다. 그러나, 이에 한정되지 않는다.In various embodiments, the computing device 100 may collect research record information in the form of lines including one or more sentences from the outside through web crawling or the like. However, it is not limited thereto.

S220 단계에서, 컴퓨팅 장치(100)는 기 저장된 실험과 관련된 데이터(예: 논문 및 특허에서 발췌한 실험 연구 관련 단어 DB)에 기초하여 줄글 형태의 연구 기록 정보에 포함된 복수의 단어 각각을 토큰화(Tokenization)할 수 있다(예: 도 5의 22). 예를 들어, 컴퓨팅 장치(100)는 WPM(Wordpiece model)을 통해 BPE(Byte Pair Encoding으로, 자연어 처리 모델에서 널리 활용되는 정보 압축 알고리즘)의 변형 알고리즘으로 코퍼스(corpus)의 우도(likelihood)를 최대화 하는 방식으로 복수의 단어 각각을 토큰화할 수 있다.In step S220, the computing device 100 tokenizes each of a plurality of words included in the research record information in the form of a line based on previously stored experiment-related data (eg, DB of experimental research-related words extracted from papers and patents). (Tokenization) (e.g., 22 in FIG. 5). For example, the computing device 100 maximizes the likelihood of a corpus with a transformation algorithm of BPE (Byte Pair Encoding, an information compression algorithm widely used in natural language processing models) through a Wordpiece model (WPM). Each of a plurality of words can be tokenized in such a way.

여기서, 토큰화되는 단어의 의미는 하나의 단어일 수 있으나, 이에 한정되지 않고, 경우에 따라 둘 이상의 단어를 포함하는 구, 절, 문장일 수 있다. 예를 들어, "aqueous solution"의 경우, "aqueous"와 "solution" 두개의 단어로 구성되나, 두개의 단어가 결합되어 하나의 의미를 표현하는 것인 바, 복수의 단어를 의미 단위로 분류/그룹화하여 각각을 토큰화할 수 있다.Here, the meaning of a word to be tokenized may be one word, but is not limited thereto, and may be a phrase, clause, or sentence including two or more words in some cases. For example, in the case of "aqueous solution", it is composed of two words "aqueous" and "solution", but since the two words are combined to express one meaning, a plurality of words are classified / You can group them and tokenize each one.

다양한 실시예에서, 컴퓨팅 장치(100)는 줄글 형태의 연구 기록 정보를 분석하여 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과에 관한 키워드를 추출할 수 있고, 추출된 키워드에 대응되는 단어만을 선택적으로 토큰화할 수 있다.In various embodiments, the computing device 100 may extract keywords related to experimental materials, keywords related to research and experimental processes, and keywords related to research results by analyzing research record information in the form of lines, and correspond to the extracted keywords. You can selectively tokenize only words that are

다양한 실시예에서, 컴퓨팅 장치(100)는 줄글 형태의 연구 기록 정보를 분석(예: OCR 분석 등)하여 줄글 형태의 연구 기록 정보로부터 복수의 키워드를 추출할 수 있고, 추출된 복수의 키워드와 데이터베이스에 기 저장된 데이터(예: 실험 재료별 키워드 데이터, 연구 및 실험 과정별 키워드 데이터 및 연구 결과별 키워드 데이터)를 매칭함으로써, 추출된 복수의 키워드를 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과에 관한 키워드로 분류할 수 있다.In various embodiments, the computing device 100 may extract a plurality of keywords from the research record information in the form of lines by analyzing (eg, OCR analysis, etc.) the research record information in the form of lines, and the extracted keywords and database By matching pre-stored data (e.g., keyword data by experimental material, keyword data by research and experiment process, and keyword data by research result), a plurality of extracted keywords are converted into keywords related to experimental materials and keywords related to research and experimental processes. and keywords related to research results.

즉, 컴퓨팅 장치(100)는 기 저장된 실험 재료별 키워드 데이터, 연구 및 실험 과정별 키워드 데이터 및 연구 결과별 키워드 데이터에 기초하여, 줄글 형태의 연구 기록 정보로부터 추출된 복수의 키워드 각각이 실험 재료를 가리키는 것인지, 연구 및 실험 과정을 가리키는 것인지 또는 연구 결과를 가리키는 것인지 판단하고, 판단 결과에 따라 키워드들을 카테고리별로 분류할 수 있다.That is, the computing device 100 determines that each of a plurality of keywords extracted from the research record information in the form of a line is based on pre-stored keyword data for each experimental material, keyword data for each research and experiment process, and keyword data for each research result. It is determined whether the keywords are pointing to, research and experimentation processes, or research results, and keywords may be classified into categories according to the determination result.

여기서, 컴퓨팅 장치(100)는 기 저장된 실험 재료별 키워드 데이터, 연구 및 실험 과정별 키워드 데이터 및 연구 결과별 키워드 데이터를 학습 데이터로 하여 기 학습된 인공지능 모델을 이용하여 문자열 분석 및 키워드 추출 동작을 수행할 수 있으나, 이에 한정되지 않는다.Here, the computing device 100 uses pre-stored keyword data for each experimental material, keyword data for each research and experiment process, and keyword data for each research result as learning data, and performs string analysis and keyword extraction operations using a pre-learned artificial intelligence model. It may be performed, but is not limited thereto.

다양한 실시예에서, 컴퓨팅 장치(100)는 줄글 형태의 연구 기록 정보를 분석하여 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과에 관한 키워드를 추출하되, 추출된 키워드 중 정형화된 연구 기록 데이터 생성을 위해 필수적으로 필요한 정보에 대응되는 키워드가 추출되지 않은 경우, 해당 키워드가 추출될 때까지 줄글 형태의 연구 기록 정보를 반복하여 재분석할 수 있다.In various embodiments, the computing device 100 extracts keywords related to experimental materials, keywords related to research and experimental processes, and keywords related to research results by analyzing research record information in the form of lines, and standardized research among the extracted keywords. If a keyword corresponding to information essential for generating record data is not extracted, the research record information in the form of lines may be repeatedly reanalyzed until the keyword is extracted.

이때, 컴퓨팅 장치(100)는 줄글 형태의 연구 기록 정보를 기 설정된 횟수(N회)동안 재분석하였음에도 불구하고, 해당 키워드가 추출되지 않는 경우, 해당 키워드에 대응되는 정보를 입력할 것을 안내하는 안내 정보를 제공할 수 있다. 이를 통해, 정형화된 연구 기록 데이터를 생성함에 있어서, 필수적으로 입력되야 하는 중요한 조건 및 정보를 빠짐없이 입력할 수 있도록 보조할 수 있다.At this time, the computing device 100 guides information to input information corresponding to the keyword when the corresponding keyword is not extracted even though the research record information in the form of a line is reanalyzed for a preset number of times (N times). can provide. Through this, in generating standardized research record data, it is possible to assist in inputting all important conditions and information that must be input without omission.

S230 단계에서, 컴퓨팅 장치(100)는 S220 단계를 거쳐 토큰화된 복수의 단어 각각에 대한 속성 정보를 레이블링(Labeling)하여 가공된 연구 기록 정보를 생성함으로써(예: 도 5의 23), 복수의 단어 각각에 속성 정보가 레이블링된 연구 기록 정보 즉, 가공된 연구 기록 정보를 생성할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 기 저장된 실험과 관련된 데이터(예: 논문 및 특허에서 발췌한 실험 연구 관련 단어 DB)에 기초하여 복수의 단어 각각의 속성을 판단할 수 있고, 판단된 속성에 따른 속성 정보를 복수의 단어 각각에 레이블링할 수 있다.In step S230, the computing device 100 labels attribute information for each of a plurality of tokenized words through step S220 to generate processed research record information (eg, 23 in FIG. 5), thereby generating a plurality of Research record information in which attribute information is labeled for each word, that is, research record information that has been processed, may be generated. For example, the computing device 100 may determine properties of each of a plurality of words based on pre-stored experiment-related data (eg, DB of words related to experimental research extracted from papers and patents), and determine the properties according to the determined properties. According to the attribute information, each of a plurality of words may be labeled.

다양한 실시예에서, Named Entity Recognition을 통해 토큰화된 단어들에 대한 레이블링을 수행할 수 있다.In various embodiments, labeling of tokenized words may be performed through named entity recognition.

S240 단계에서, 컴퓨팅 장치(100)는 S230 단계를 거쳐 생성된 가공된 연구 기록 정보를 이용하여 연구 기록 그래프를 생성할 수 있다. 또한, 컴퓨팅 장치(100)는 연구 기록 그래프를 이용하여 정형화된 연구 기록 데이터를 생성할 수 있다. In step S240, the computing device 100 may generate a research record graph using the processed research record information generated through step S230. In addition, the computing device 100 may generate standardized research record data using the research record graph.

다양한 실시예에서, 컴퓨팅 장치(100)는 기 학습된 제1 모델(Text2Labnote 모델)을 이용하여 연구 기록 그래프를 생성할 수 있다.In various embodiments, the computing device 100 may generate a research record graph using a pre-learned first model (Text2Labnote model).

여기서, 기 학습된 제1 모델은 도 6에 도시된 바와 같이 복수의 인코더(encoder)를 포함하는 트랜스포머(Transformer) 구조를 기반으로 하는 도메인 언어 학습 모델(예: BERT(Bidirectional Encoder Representations from Transformers) 모델)일 수 있다.Here, the pre-learned first model is a domain language learning model based on a transformer structure including a plurality of encoders as shown in FIG. 6 (eg, a BERT (Bidirectional Encoder Representations from Transformers) model) ) can be.

또한, 기 학습된 제1 모델은 복수의 줄글 형태의 연구 기록 정보 및 복수의 줄글 형태의 연구 기록 정보 각각에 대응되는 복수의 연구 기록 그래프를 학습 데이터로 하여 학습된 모델일 수 있으나, 이에 한정되지 않는다.In addition, the pre-learned first model may be a model learned by using as learning data a plurality of research record information in the form of a plurality of lines and a plurality of research record graphs corresponding to each of the plurality of lines of research record information, but is not limited thereto don't

먼저, 컴퓨팅 장치(100)는 속성 정보가 레이블링된 복수의 단어를 포함하는 가공된 연구 기록 정보를 기 학습된 제1 모델의 입력 데이터로 하여 인접 행렬(Adjacency matrix)를 생성할 수 있다.First, the computing device 100 may generate an adjacency matrix by using processed research record information including a plurality of words labeled with attribute information as input data of a pre-learned first model.

이후, 컴퓨팅 장치(100)는 인접 행렬을 이용하여 연구 기록 그래프를 생성할 수 있다. 이때, 연구 기록 그래프는 복수의 단어 각각에 대응되는 노드(node)와 복수의 단어 각각을 연결하는 엣지(edge)를 포함할 수 있으나, 이에 한정되지 않는다. 예를 들어, 컴퓨팅 장치(100)는 도 7에 도시된 바와 같이 인접 행렬의 i행j열 셀의 값(

Figure pat00001
)을 이용하여 노드 i와 노드 j 간의 연결 관계를 판단할 수 있고, 복수의 노드 각각의 연결 관계에 따라 복수의 노드 사이를 연결하지 않거나 또는 연결함으로써 연구 기록 그래프를 생성할 수 있다.Then, the computing device 100 may generate a study record graph using the adjacency matrix. In this case, the research record graph may include a node corresponding to each of a plurality of words and an edge connecting each of the plurality of words, but is not limited thereto. For example, as shown in FIG. 7 , the computing device 100 calculates the value of a cell in row i of column j of an adjacency matrix (
Figure pat00001
) can be used to determine the connection relationship between node i and node j, and a research record graph can be created by not connecting or connecting a plurality of nodes according to the connection relationship of each of a plurality of nodes.

이후, 컴퓨팅 장치(100)는 생성된 연구 기록 그래프를 이용하여 정형화된 연구 기록 데이터를 생성할 수 있다(예: S130 단계). 예를 들어, 컴퓨팅 장치(100)는 도 23에 도시된 바와 같이 UI(10) 상에 복수의 단어 각각에 대응되는 카드(16)를 배치하되, 연구 기록 그래프에 따라 복수의 단어 각각에 대응되는 카드(16)의 배치 형태 및 배치 순서를 결정할 수 있으나, 이에 한정되지 않는다.Thereafter, the computing device 100 may generate standardized research record data using the generated research record graph (eg, step S130). For example, the computing device 100 arranges a card 16 corresponding to each of a plurality of words on the UI 10 as shown in FIG. 23, but corresponds to each of a plurality of words according to the research record graph. The arrangement form and arrangement order of the cards 16 may be determined, but are not limited thereto.

다양한 실시예에서, 컴퓨팅 장치(100)는 제1 모델을 통해, 전자 장치에 의해 작성된 텍스트 형태의 연구 기록 정보뿐만 아니라 사용자가 직접 수기로 작성한 연구 기록 정보를 정형화된 연구 기록 데이터로 변환할 수 있다. 이를 위해, 컴퓨팅 장치(100)는 전자 장치에 의해 작성된 텍스트 형태의 연구 기록 정보 및 이에 대응되는 정형화된 데이터를 학습한 제1 모델과 수기 형태의 연구 기록 정보 및 이에 대응되는 정형화된 연구 기록 데이터를 학습한 제2 모델을 별도로 구축할 수 있다.In various embodiments, the computing device 100 may convert text-type research record information created by an electronic device as well as research record information manually written by a user into standardized research record data through the first model. . To this end, the computing device 100 provides a first model for learning text-type research record information and corresponding standardized data created by an electronic device, research record information in handwritten form, and standardized research record data corresponding thereto. The learned second model may be separately constructed.

도 8은 다양한 실시예에서, 키워드 입력을 통한 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이며, 도 9는 다양한 실시예에서, 키워드 입력을 통한 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.8 is a flowchart illustrating a method of automatically generating standardized research record data through keyword input in various embodiments, and FIG. 9 illustrates a process of automatically generating standardized research record data through keyword input in various embodiments. it is a drawing

도 8 및 9를 참조하면, 도 9를 참조하면, S310 단계에서, 컴퓨팅 장치(100)는 연구 기록 정보의 입력을 위한 UI(예: 도 21 내지 24의 10)를 제공할 수 있고, UI를 통해 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과에 관한 키워드 중 적어도 하나를 포함하는 키워드를 검색어로서 입력받을 수 있다.Referring to FIGS. 8 and 9, referring to FIG. 9, in step S310, the computing device 100 may provide a UI (eg, 10 of FIGS. 21 to 24) for inputting research record information, and the UI Through this, a keyword including at least one of keywords related to experimental materials, keywords related to research and experimental processes, and keywords related to research results may be input as a search word.

여기서, 연구 기록 정보가 실험 재료에 대한 정보, 실험 장비에 대한 정보 및 실험 및 연구 과정에 대한 정보를 포함하는 바, UI(10)는 실험 재료에 대한 정보를 입력받는 기능, 실험 장비에 대한 정보를 입력받는 기능 및 실험 및 연구 과정에 대한 정보를 입력받는 기능을 포함할 수 있다.Here, since the research record information includes information on test materials, information on test equipment, and information on experiments and research processes, the UI 10 has a function of receiving information on test materials and information on test equipment. It may include a function of receiving input and a function of receiving information about experiments and research processes.

보다 구체적으로, 먼저, 컴퓨팅 장치(100)는 도 21 및 22에 도시된 바와 같이, 사용자가 제1 버튼(11)을 선택하는 것에 응답하여 실험 재료에 대한 정보의 입력을 위한 UI(14)를 제공할 수 있다. 이때, 컴퓨팅 장치(100)는 사용자가 제1 버튼(11)을 선택함에 따라 팝업 형태로 실험 재료에 대한 정보의 입력을 위한 UI(14)를 제공할 수 있으나, 이에 한정되지 않는다.More specifically, first, as shown in FIGS. 21 and 22 , the computing device 100 displays the UI 14 for inputting information on experimental materials in response to the user selecting the first button 11 . can provide At this time, the computing device 100 may provide the UI 14 for inputting information on the experiment material in a pop-up form as the user selects the first button 11, but is not limited thereto.

이후, 컴퓨팅 장치(100)는 실험 재료에 대한 정보의 입력을 위한 UI(14)를 통해 실험 재료에 관한 키워드를 입력받을 수 있다. 예를 들어, 컴퓨팅 장치(100)는 실험 재료에 대한 정보의 입력을 위한 UI(14)를 통해 닉네임(Nickname)에 관한 키워드, 원소 기호(Chemical)에 관한 키워드, 제품 번호(Product number)에 관한 키워드, 상태(state)에 관한 키워드, 용매(Solvent)에 관한 키워드, 부피(Volume)에 관한 키워드 및 농도(Concentration)에 관한 키워드(추가적으로, 해당 실험 재료에 대한 별도의 코멘트)를 입력받을 수 있다.Thereafter, the computing device 100 may receive a keyword related to the experimental material through the UI 14 for inputting information on the experimental material. For example, the computing device 100 provides keywords for nicknames, keywords for chemical elements, and product numbers through the UI 14 for inputting information on experimental materials. Keywords, keywords related to state, keywords related to solvent, keywords related to volume, keywords related to volume, and keywords related to concentration (additionally, a separate comment on the corresponding experimental material) may be input. .

도면에 도시되어 있지 않으나, 상기와 마찬가지로, 컴퓨팅 장치(100)는 사용자가 제2 버튼(12)을 선택하는 것에 응답하여 실험 장비에 대한 정보의 입력을 위한 UI를 제공함으로써 실험 장비에 대한 정보의 입력을 위한 UI를 통해 실험 장비에 관한 키워드를 입력받을 수 있고, 사용자가 제3 버튼(13)을 선택하는 것에 응답하여, 실험 및 연구 과정에 대한 정보의 입력을 위한 UI를 제공함으로써, 실험 및 연구 과정에 관한 키워드를 입력받을 수 있다.Although not shown in the drawings, similarly to the above, the computing device 100 provides a UI for inputting information on the experiment equipment in response to the user selecting the second button 12, thereby providing information on the experiment equipment. It is possible to receive input of keywords related to experimental equipment through the UI for input, and in response to the user selecting the third button 13, by providing a UI for inputting information on experiments and research processes, experiments and Keywords related to the research process may be entered.

S320 단계에서, 컴퓨팅 장치(100)는 기 저장된 실험과 관련된 데이터에 기초하여 사용자로부터 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터를 선택할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 도 9에 도시된 바와 같이 사용자로부터 키워드로서 "아세트산(Acetic ac)"를 입력받는 경우, 기 저장된 실험과 관련된 데이터 중 아세트산에 관한 정보를 포함하는 데이터를 선택할 수 있으나, 이에 한정되지 않는다.In step S320, the computing device 100 may select experiment-related data corresponding to one or more keywords input from the user based on pre-stored experiment-related data. For example, as shown in FIG. 9 , when the user inputs “acetic acid” as a keyword, the computing device 100 selects data including information on acetic acid from among pre-stored experiment-related data. may, but is not limited thereto.

다양한 실시예에서, 컴퓨팅 장치(100)는 사용자로부터 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터가 복수 개인 경우, 사용자의 검색 이력에 기초하여 복수의 실험과 관련된 데이터 중 하나 이상의 실험과 관련된 데이터를 선택하여 추천 데이터로서 사용자에게 제공할 수 있으며, 사용자로부터 추천 데이터로서 제공된 하나 이상의 실험과 관련된 데이터 중 어느 하나의 데이터를 선택받을 수 있다. 예를 들어, 컴퓨팅 장치(100)는 아세트산에 관한 정보를 포함하는 데이터가 복수 개인 경우, 복수의 데이터 중 사용자의 검색 이력에 기초하여 마지막에 검색(또는 선택)된 데이터 또는 가장 많이 검색(또는 선택)된 데이터를 추천 데이터로서 제공할 수 있다.In various embodiments, when there is a plurality of experiment-related data corresponding to one or more keywords input by the user, the computing device 100 provides data related to one or more experiments among the data related to the plurality of experiments based on the user's search history. may be selected and provided to the user as recommendation data, and any one of data related to one or more experiments provided as recommendation data may be selected from the user. For example, if there is a plurality of pieces of data including information on acetic acid, the computing device 100 selects the last searched (or selected) data or the most searched (or selected) data based on the user's search history among the plurality of data. ) may be provided as recommendation data.

다양한 실시예에서, 컴퓨팅 장치(100)는 사용자로부터 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터가 복수 개인 경우, 사용자와 동일한 연구 분야를 연구하는 복수의 사용자들의 검색 이력에 기초하여 복수의 실험과 관련된 데이터 중 하나 이상의 실험과 관련된 데이터를 선택하여 추천 데이터로서 사용자에게 제공할 수 있다.In various embodiments, the computing device 100 performs a plurality of experiments based on search histories of a plurality of users researching the same research field as the user when there is a plurality of data related to experiments corresponding to one or more keywords input by the user. Data related to at least one experiment among data related to may be selected and provided to the user as recommended data.

S330 단계에서, 컴퓨팅 장치(100)는 S320 단계를 거쳐 선택된 실험과 관련된 데이터를 이용하여, 사용자로부터 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성할 수 있다. 그러나, 이에 한정되지 않는다. 예를 들어, 컴퓨팅 장치(100)는 사용자로부터 선택된 데이터(키워드에 대응되는 실험에 관한 데이터)에 포함된 정보들을 정형화된 연구 기록 데이터를 생성하기 위한 템플릿 상에 자동적으로 배치할 수 있다.In step S330, the computing device 100 may automatically complete research record information corresponding to one or more keywords input by the user using data related to the experiment selected through step S320. However, it is not limited thereto. For example, the computing device 100 may automatically arrange information included in user-selected data (experiment data corresponding to a keyword) on a template for generating standardized research record data.

이후, 컴퓨팅 장치(100)는 자동완성된 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터를 생성할 수 있다. 여기서, 정형화된 연구 기록 데이터를 생성하는 방법은 도 3의 S130 단계와 동일한 형태로 구현될 수 있으나, 이에 한정되지 않는다.Thereafter, the computing device 100 may generate standardized research record data using the automatically completed research record information. Here, the method of generating standardized research record data may be implemented in the same form as step S130 of FIG. 3, but is not limited thereto.

도 10은 다양한 실시예에서, 음성 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.10 is a diagram illustrating a process of automatically generating standardized research record data using voice-type research record information in various embodiments.

도 10을 참조하면, S410 단계에서, UI를 통해 사용자로부터 음성 형태의 연구 기록 정보를 획득할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 사용자 단말(200)과 네트워크(400)로 연결될 수 있으며, 사용자 단말(200) 내에 별도로 구비되는 마이크(예; 스마트폰, 노트북) 또는 사용자 단말(200)과 연결되는 외부 마이크를 통해 입력되는 음성 형태의 연구 기록 정보를 수집할 수 있다. 그러나, 이에 한정되지 않는다.Referring to FIG. 10 , in step S410 , research record information in the form of audio may be obtained from the user through the UI. For example, the computing device 100 may be connected to the user terminal 200 and the network 400, and may be connected to a microphone (eg, a smartphone, a laptop computer) or a user terminal 200 separately provided in the user terminal 200. It is possible to collect research record information in the form of voice input through the connected external microphone. However, it is not limited thereto.

S420 단계에서, 컴퓨팅 장치(100)는 S410 단계를 거쳐 획득한 음성 형태의 연구 기록 정보를 자연어 처리(NLP)하여 텍스트 형태의 연구 기록 정보로 변환할 수 있다. In step S420, the computing device 100 may convert the research record information in a text form by natural language processing (NLP) on the voice type research record information acquired through step S410.

여기서, 음성 형태의 정보를 자연어 처리하여 텍스트 형태의 정보로 변환하는 방식은 다양한 기술들이 공지되어 있고, 이러한 공지 기술들을 선택적으로 적용할 수 있는 바, 구체적인 방법에 대해서는 언급하지 않는다.Here, various techniques are known for converting voice-type information into text-type information by natural language processing, and since these known techniques can be selectively applied, specific methods are not mentioned.

또한, 컴퓨팅 장치(100)는 텍스트 형태의 연구 기록 정보를 분석하여 하나 이상의 키워드를 추출할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 기 저장된 실험 재료별 키워드 데이터, 연구 및 실험 과정별 키워드 데이터 및 연구 결과별 키워드 데이터를 학습 데이터로 하여 기 학습된 인공지능 모델을 이용하여 문자열 분석 및 키워드 추출 동작을 수행할 수 있으나, 이에 한정되지 않는다.In addition, the computing device 100 may extract one or more keywords by analyzing research record information in text form. For example, the computing device 100 uses pre-stored keyword data for each experimental material, keyword data for each research and experiment process, and keyword data for each research result as learning data, and analyzes strings and extracts keywords using a pre-learned artificial intelligence model. An operation may be performed, but is not limited thereto.

다양한 실시예에서, 컴퓨팅 장치(100)는 S410 단계에서 입력된 음성 형태의 연구 기록 정보가 사용자 단말(200)에 구비된 음성 입력 장치를 통해 실시간으로 입력되는 것인 경우, 음성 입력 장치가 구동된 시점부터 실시간으로 입력되는 음성 입력 장치를 분석(예: 자연어 처리)함으로써 하나 이상의 키워드를 추출할 수 있다.In various embodiments, the computing device 100 operates the voice input device when the research record information in the form of voice input in step S410 is input in real time through the voice input device provided in the user terminal 200. One or more keywords may be extracted by analyzing (eg, natural language processing) a voice input device input in real time from the point of view.

이때, 컴퓨팅 장치(100)는 음성 입력 장치의 구동이 종료될 경우 음성 입력 장치를 통해 입력된 음성 형태의 연구 기록 정보 전체를 재분석하여 실시간으로 추출된 하나 이상의 키워드에 대한 검증을 수행할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 음성 형태의 연구 기록 정보 전체를 재분석하여 실시간으로 추출된 키워드의 유효성(예: 추출된 키워드가 정확하게 추출되었는지 여부 및 잘못된 키워드가 추출되었는지 여부)을 판단하거나, 추출되지 못한 키워드가 있는지 여부를 확인할 수 있다.At this time, the computing device 100 may perform verification of one or more keywords extracted in real time by reanalyzing all research record information in the form of voice input through the voice input device when the driving of the voice input device is terminated. For example, the computing device 100 reanalyzes the entire research record information in the form of audio to determine the validity of the extracted keyword in real time (eg, whether the extracted keyword is correctly extracted or whether the wrong keyword is extracted), It is possible to check whether there are keywords that could not be extracted.

S430 단계에서, 컴퓨팅 장치(100)는 기 저장된 실험과 관련된 데이터에 기초하여 S420 단계를 거쳐 추출된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터를 선택할 수 있다. 여기서, 키워드에 대응되는 실험에 관한 데이터를 선택하는 과정은 도 8의 S320 단계와 동일 또는 유사한 형태로 구현될 수 있으나, 이에 한정되지 않는다.In step S430, the computing device 100 may select experiment-related data corresponding to one or more keywords extracted through step S420 based on pre-stored experiment-related data. Here, the process of selecting experiment data corresponding to the keyword may be implemented in the same or similar form to step S320 of FIG. 8 , but is not limited thereto.

S440 단계에서, 컴퓨팅 장치(100)는 S430 단계를 거쳐 선택된 실험과 관련된 데이터를 이용하여, 사용자로부터 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성할 수 있다. 여기서, 연구 기록 정보를 자동완성 하는 과정은 도 8의 S330 단계와 동일 또는 유사한 형태로 구현될 수 있으나, 이에 한정되지 않는다.In step S440, the computing device 100 may automatically complete research record information corresponding to one or more keywords input by the user using data related to the experiment selected through step S430. Here, the process of automatically completing the research record information may be implemented in the same or similar form to step S330 of FIG. 8, but is not limited thereto.

S450 단계에서, 컴퓨팅 장치(100)는 연구 및 실험에 사용되는 복수의 장비 각각에 구비되는 센서로부터 장비 사용 정보를 획득할 수 있고, 연구 및 실험에 사용되는 복수의 재료 각각에 구비되는 센서로부터 재료 사용 정보를 획득할 수 있으며, 획득된 장비 사용 정보 및 획득된 재료 사용 정보를 통해 장비 및 재료의 사용을 인식함으로써 가공된 연구 기록 정보를 생성할 수 있다.In step S450, the computing device 100 may obtain equipment usage information from sensors provided in each of a plurality of equipment used in research and experiments, and materials from sensors provided in each of a plurality of materials used in research and experiments. It is possible to obtain usage information, and by recognizing the use of equipment and materials through the obtained equipment usage information and the acquired material usage information, it is possible to generate processed research record information.

예를 들어, 컴퓨팅 장치(100)는 연구 및 실험에 사용되는 장비 각각에 구비되는 센서(예: 위치 센서, 움직임 센서 등)와 연결될 수 있고, 해당 센서로부터 수집되는 센서 데이터를 기초하여 장비 사용 정보(예: 장비의 사용 여부 및 사용된 장비의 종류 등)를 인식(예: 특정 장비의 위치가 기 설정된 거리 이상 이동한 경우 또는 특정 장비에 대한 움직임이 감지된 경우 등)할 수 있다.For example, the computing device 100 may be connected to a sensor (eg, a position sensor, a motion sensor, etc.) provided in each equipment used for research and experimentation, and equipment use information based on sensor data collected from the corresponding sensor. (eg, whether or not the equipment is used and the type of equipment used) may be recognized (eg, when the location of a specific equipment moves more than a predetermined distance or when motion of a specific equipment is detected).

또한, 컴퓨팅 장치(100)는 실험 재료의 용기 및 시약병 등에 부착된 RFID를 활용하여 재료 사용 정보(예: 재료의 사용 여부, 사용된 재료의 종류 및 양 등)를 인식 및 추적할 수 있다. 그러나, 이에 한정되지 않는다. 이하, 도 12 내지 14를 참조하여, 정형화된 연구 기록 데이터를 이용하여 줄글 형태의 연구 기록 정보를 생성하는 과정에 대해 설명하도록 한다.In addition, the computing device 100 may recognize and track material usage information (eg, whether or not the material is used, the type and amount of the material used, etc.) by utilizing RFID attached to a test material container or a reagent bottle. However, it is not limited thereto. Hereinafter, with reference to FIGS. 12 to 14, a process of generating research record information in the form of lines using standardized research record data will be described.

이후, 컴퓨팅 장치(100)는 자동완성된 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터를 생성할 수 있다. 여기서, 정형화된 연구 기록 데이터를 생성하는 방법은 도 3의 S130 단계와 동일한 형태로 구현될 수 있으나, 이에 한정되지 않는다. 이하, 도 12 내지 14를 참조하여, 정형화된 연구 기록 데이터를 이용하여 줄글 형태의 연구 기록 정보를 생성하는 과정에 대해 설명하도록 한다. Thereafter, the computing device 100 may generate standardized research record data using the automatically completed research record information. Here, the method of generating standardized research record data may be implemented in the same form as step S130 of FIG. 3, but is not limited thereto. Hereinafter, with reference to FIGS. 12 to 14, a process of generating research record information in the form of lines using standardized research record data will be described.

도 11은 다양한 실시예에서, 정형화된 연구 기록 데이터를 이용하여 줄글 형태의 연구 기록 정보를 생성하는 방법을 설명하기 위한 순서도이며, 도 12 내지 14는 다양한 실시예에서, 정형화된 연구 기록 데이터를 이용하여 줄글 형태의 연구 기록 정보를 생성하는 과정을 도시한 도면이다.11 is a flowchart illustrating a method of generating research record information in a line form using standardized research record data in various embodiments, and FIGS. 12 to 14 are, in various embodiments, using standardized research record data. It is a diagram showing the process of generating the research record information in the form of a line by writing.

도 11 내지 14를 참조하면, S510 단계에서, 컴퓨팅 장치(100)는 사용자로부터 정형화된 연구 기록 데이터를 포함하는 줄글 형태의 연구 기록 정보 생성 요청을 획득할 수 있다.Referring to FIGS. 11 to 14 , in step S510 , the computing device 100 may obtain a request for generating research record information in a line form including standardized research record data from the user.

S520 단계에서, 컴퓨팅 장치(100)는 S510 단계를 거쳐 획득된 줄글 형태의 연구 기록 정보 생성 요청에 포함된 정형화된 연구 기록 데이터를 이용하여 연구 기록 그래프를 생성할 수 있다. 여기서, 정형화된 연구 기록 데이터는 연구 기록 그래프를 기반으로 생성되는 것인 바, 컴퓨팅 장치(100)는 역변환함으로써 정형화된 연구 기록 데이터에 대응되는 연구 기록 그래프를 생성할 수 있다. 그러나, 이에 한정되지 않는다.In step S520, the computing device 100 may generate a research record graph by using the standardized research record data included in the research record information generation request in the form of lines acquired through step S510. Here, since the standardized research record data is generated based on the research record graph, the computing device 100 may generate a research record graph corresponding to the standardized research record data by performing inverse transformation. However, it is not limited thereto.

S530 단계에서, 컴퓨팅 장치(100)는 S520 단계를 거쳐 생성된 연구 기록 그래프를 이용하여 하나 이상의 텍스트 문장을 포함하는 줄글 형태의 연구 기록 정보를 생성할 수 있다.In step S530, the computing device 100 may generate research record information in the form of a line including one or more text sentences using the research record graph generated through step S520.

다양한 실시예에서, 컴퓨팅 장치(100)는 연구 기록 그래프를 기 학습된 제2 모델(Labnote2Text 모델)의 입력 데이터로 하여 하나 이상의 텍스트 문장을 포함하는 줄글 형태의 연구 기록 정보를 생성할 수 있다.In various embodiments, the computing device 100 may generate research record information in the form of lines including one or more text sentences using the research record graph as input data of the pre-learned second model (Labnote2Text model).

여기서, 기 학습된 제2 모델은 도 12 및 13에 도시된 바와 같이 인코더(Encoder) 및 디코더(Decoder)를 포함하는 트랜스포머(Transformer) 구조를 기반으로 한 자연어 처리 모델(예: sequence to sequence 자연어 처리 모델)일 수 있으나, 이에 한정되지 않는다.Here, the pre-learned second model is a natural language processing model (eg, sequence to sequence natural language processing) based on a transformer structure including an encoder and a decoder, as shown in FIGS. 12 and 13 . model), but is not limited thereto.

또한, 기 학습된 제2 모델은 어텐션 매커니즘(Attention mechanism)을 활용한 그래프 데이터 학습 모델로서, 연구 기록 그래프 형태로 변환된 정형화된 연구 기록 데이터를 제2 모델의 베이스 모델(Base model)로 활용 가능하도록 도 14에 도시된 바와 같이 GAP(Graph Attention Network)를 제작/구축할 수 있으나, 이에 한정되지 않는다.In addition, the pre-learned second model is a graph data learning model using an attention mechanism, and the standardized research record data converted into a graph of research records can be used as a base model for the second model. As shown in FIG. 14, a GAP (Graph Attention Network) may be produced/constructed, but is not limited thereto.

또한, 기 학습된 제2 모델은 복수의 줄글 형태의 연구 기록 정보 및 복수의 줄글 형태의 연구 기록 정보 각각에 대응되는 복수의 연구 기록 그래프를 학습 데이터로 하여 학습된 모델일 수 있으나, 이에 한정되지 않는다.In addition, the pre-learned second model may be a model learned by using as learning data a plurality of research record information in the form of a plurality of lines and a plurality of research record graphs corresponding to each of the plurality of lines of research record information, but is not limited thereto don't

다양한 실시예에서, 컴퓨팅 장치(100)는 제1 모델과 제2 모델을 상호 연동시켜 입출력 데이터를 통해 제1 모델 및 제2 모델을 학습시킬 수 있다. 예를 들어, 제1 모델은 줄글 형태의 연구 기록 정보를 입력으로 하여 연구 기록 그래프를 출력하는 모델이고, 제2 모델은 연구 기록 그래프를 입력으로 하여 줄글 형태의 연구 기록 정보를 출력하는 모델인 바, 제1 모델의 출력을 제2 모델의 입력으로 하고, 제2 모델의 출력을 제1 모델의 입력으로 하며, 제1 모델 및 제2 모델 각각이 입출력 데이터들을 학습 데이터로 하여 제1 모델 및 제2 모델을 학습시킬 수 있다.In various embodiments, the computing device 100 may learn the first model and the second model through input/output data by interworking the first model and the second model. For example, the first model is a model that outputs a research record graph by taking the research record information in the form of a line, and the second model is a model that outputs the research record information in the form of a line by taking the research record graph as an input. , The output of the first model is used as the input of the second model, the output of the second model is used as the input of the first model, and each of the first model and the second model uses the input and output data as training data to generate the first model and the second model. 2 models can be trained.

이후, 컴퓨팅 장치(100)는 상기의 방법에 따라 생성된 줄글 형태의 연구 기록 정보를 사용자에게 제공할 수 있다.Thereafter, the computing device 100 may provide the user with the research record information in the form of a line generated according to the above method.

즉, 사용자는 연구 기록 정보를 입력함에 따라 정형화된 연구 기록 데이터를 생성함으로써 연구 기록의 관리 및 공유를 보다 용이하게 수행할 수 있고, 논문, 특허 등의 문서를 작성하기 위해 줄글 형태로 연구 기록을 작성하고자 할 경우, 정형화된 연구 기록 데이터를 다시 줄글 형태의 연구 기록 정보로 변환함으로써 보다 빠르고 편리하게 작성이 가능하다는 이점이 있다.In other words, the user can more easily manage and share research records by generating standardized research record data as he inputs research record information, and writes research records in the form of lines to write documents such as theses and patents. In the case of writing, there is an advantage in that it is possible to write more quickly and conveniently by converting the standardized research record data back into the research record information in the form of a line.

다양한 실시예에서, 컴퓨팅 장치(100)는 제1 사용자로부터 제1 정형화된 연구 기록 데이터에 대한 텍스트 변환을 요청받는 경우, 제1 정형화된 연구 기록 데이터를 그래프화 하여 제1 연구 기록 그래프를 생성하고, 생성된 제1 연구 기록 그래프를 통해 제1 줄글 형태의 연구 기록 정보를 생성하여 제1 사용자에게 제공하되, 제1 사용자로부터 제1 줄글 형태의 연구 기록 정보의 적어도 일부분이 수정되는 경우, 적어도 일부분이 수정된 제1 줄글 형태의 연구 기록 정보와 제1 연구 기록 그래프를 학습 데이터로 하여 기 학습된 제2 모델을 재학습시킬 수 있다. 이를 통해, 정형화된 연구 기록 데이터의 텍스트 변환 성능을 향상시킬 수 있다.In various embodiments, when receiving a text conversion request for the first standardized research record data from the first user, the computing device 100 generates a first research record graph by graphing the first standardized research record data; , Research record information in the first line form is generated through the generated first research record graph and provided to the first user, but when at least a portion of the research record information in the first line form is modified by the first user, at least a portion of the research record information in the first line form is modified. The pre-learned second model may be re-learned by using the modified research record information in the form of the first line and the first research record graph as learning data. Through this, it is possible to improve text conversion performance of standardized research record data.

다양한 실시예에서, 컴퓨팅 장치(100)는 정형화된 연구 기록 데이터를 이용하여, 실험 및 연구를 시뮬레이션할 수 있다. 이하, 도 15를 참조하여 설명하도록 한다.In various embodiments, computing device 100 may simulate experiments and studies using structured study record data. Hereinafter, it will be described with reference to FIG. 15 .

도 15는 다양한 실시예에서, 정형화된 연구 기록 데이터를 기반으로 시뮬레이션을 수행하는 방법을 설명하기 위한 순서도이다.15 is a flowchart illustrating a method of performing a simulation based on standardized study record data, in various embodiments.

도 15를 참조하면, S610 단계에서, 컴퓨팅 장치(100)는 제1 정형화된 연구 기록 데이터에 포함된 실험 재료, 실험 장비 및 실험 과정에 따라 실험을 시뮬레이션할 수 있다.Referring to FIG. 15 , in step S610 , the computing device 100 may simulate an experiment according to experimental materials, experimental equipment, and experimental procedures included in the first standardized research record data.

먼저, 컴퓨팅 장치(100)는 정형화된 연구 기록 데이터 기반의 실험 시뮬레이션을 수행하기 위하여, 클라우드 랩(무인 자동 연구실, 버추얼랩(Virtual Lab))을 구축할 수 있다.First, the computing device 100 may build a cloud lab (unmanned automatic laboratory, virtual lab) to perform experimental simulation based on standardized research record data.

여기서, 클라우드 랩은 클라우드 등의 자료 공유 시스템을 활용한 플랫폼 기반의 연구 및 실험 공간으로, 외부에서 가져온 데이터(예: 컴퓨팅 장치(100)에서 제공되는 정형화된 연구 기록 데이터)를 기초하여 특정 연구 및 실험을 가상으로 시뮬레이션하거나, 연구 및 실험에 관한 내용 및 결과를 시, 공간의 제약없이 다수의 사용자들과 공유 가능한 공간을 의미할 수 있다. 여기서, 클라우드 랩을 구축하고 이를 이용하는 방법은 사전이 공지되어 있는 기술인 바, 본 명세서에서 클라우드 랩을 구축하고 이를 이용하는 구체적인 방법에 대해 서술하지 않더라도 당업자라면 용이하게 인식할 수 있을 것이다.Here, the cloud lab is a platform-based research and experiment space utilizing a data sharing system such as the cloud, and specific research and experimentation based on external data (eg, standardized research record data provided from the computing device 100). It may mean a space where experiments can be virtually simulated or contents and results related to research and experiments can be shared with multiple users without time and space restrictions. Here, the method of building and using the cloud lab is a previously known technology, and even if a specific method of building and using the cloud lab is not described in this specification, those skilled in the art will be able to easily recognize it.

이후, 컴퓨팅 장치(100)는 정형화된 연구 기록 데이터를 기반으로 가상의 연구 및 실험을 컴퓨팅하기 위하여, 정형화된 연구 기록 데이터를 컴퓨터가 읽을 수 있는 코드 형태로 변환함으로써, 코드화된 연구 기록 데이터를 생성할 수 있고, 생성된 코드화된 연구 기록 데이터를 클라우드 랩으로 제공할 수 있으며, 클라우드 랩을 동작시켜 코드화된 연구 기록 데이터 기반의 실험을 시뮬레이션할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 제1 정형화된 연구 기록 데이터를 이용하여 제1 연구 기록 그래프를 생성(코드화)하고, 제1 연구 기록 그래프를 이용하여 제1 정형화된 연구 기록 데이터에 포함된 실험 재료, 실험 장비 및 실험 과정에 따라 실험을 시뮬레이션할 수 있다. 그러나, 이에 한정되지 않는다.Thereafter, the computing device 100 generates coded research record data by converting the standardized research record data into a computer-readable code form in order to compute virtual research and experiments based on the standardized research record data. The generated coded research record data can be provided to the cloud lab, and the experiment based on the coded research record data can be simulated by operating the cloud lab. For example, the computing device 100 generates (codes) a first research record graph using the first standardized research record data, and uses the first research record graph to generate (encode) the first standardized research record data included in the first standardized research record data. Experiments can be simulated according to experimental materials, experimental equipment, and experimental procedures. However, it is not limited thereto.

여기서, 클라우드 랩을 통해 시뮬레이션되는 코드화된 연구 기록 데이터는 사용자가 입력한 연구 기록 정보에 기초하여 정형화된 연구 기록 데이터가 생성될 때마다 모든 정형화된 연구 기록 데이터를 대상으로 자동적으로 수행되거나, 또는 사용자로부터 특정 정형화된 연구 기록 데이터에 대한 시뮬레이션을 요청받는 경우 해당 정형화된 연구 기록 데이터에 대해서만 시뮬레이션을 수행할 수 있다.Here, the coded research record data simulated through the cloud lab is automatically performed for all standardized research record data whenever standardized research record data is generated based on the research record information entered by the user, or If a simulation is requested for specific standardized research record data from the company, simulation may be performed only for the standardized research record data.

S620 단계에서, 컴퓨팅 장치(100)는 클라우드 랩을 통해 코드화된 연구 기록 데이터 기반의 실험을 시뮬레이션한 결과(예: 코드화된 연구 기록 데이터에 포함된 실험 재료들과 실험 과정에 따라 도출되는 물질의 구조 및 구성과 해당 물질의 특성 등)를 시뮬레이션에 사용된 코드화된 연구 기록 데이터와 매칭하여 저장할 수 있다.In step S620, the computing device 100 simulates the experiment based on the coded research record data through the cloud lab (eg, the experimental materials included in the coded research record data and the structure of the material derived according to the experiment process). and composition and properties of the material, etc.) can be matched and stored with the coded research record data used in the simulation.

S520 단계에서, 컴퓨팅 장치(100)는 클라우드 랩을 통해 코드화된 연구 기록 데이터 기반의 실험을 시뮬레이션한 결과(예: 코드화된 연구 기록 데이터에 포함된 실험 재료들과 실험 과정에 따라 도출되는 물질의 구조 및 구성과 해당 물질의 특성 등)를 시뮬레이션에 사용된 코드화된 연구 기록 데이터와 매칭하여 저장할 수 있다.In step S520, the computing device 100 simulates the experiment based on the coded research record data through the cloud lab (e.g., the experimental materials included in the coded research record data and the structure of the material derived according to the experimental process). and composition and properties of the material, etc.) can be matched and stored with the coded research record data used in the simulation.

이때, 클라우드 랩에서 시뮬레이션 결과를 코드화된 연구 기록 데이터에 포함된 연구 결과 정보에 추가하여 저장할 수 있고, 컴퓨팅 장치(100)는 시뮬레이션 결과가 추가되어 저장된 코드화된 연구 기록 데이터를 클라우드 랩으로부터 제공받아 저장 및 관리할 수 있다. 이하, 도 16 내지 20을 참조하여, 컴퓨팅 장치에 의해 수행되는 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법에 대해 설명하도록 한다.At this time, the simulation result may be added to and stored in the research result information included in the coded research record data in the cloud lab, and the computing device 100 receives and stores coded research record data in which the simulation result is added and stored from the cloud lab. and can be managed. Hereinafter, with reference to FIGS. 16 to 20, a method for providing a synthetic material development process using an artificial intelligence model performed by a computing device will be described.

도 16은 다양한 실시예에서, 제1 인공지능 모델을 통해 합성 물질 및 합성 물질의 합성을 위한 가이드 정보를 추출하는 방법을 설명하기 위한 도면이다.16 is a diagram for explaining a method of extracting a synthetic material and guide information for synthesizing the synthetic material through a first artificial intelligence model, in various embodiments.

도 16을 참조하면, 컴퓨팅 장치(100)는 특정 구조 및 특성을 가지는 합성 물질에 관한 정보와 해당 합성 물질을 합성시키기 위한 가이드 정보를 추출 및 제공할 수 있다. 도 16 내지 18에서, 합성 물질은 신약 개발을 위한 후보 물질인 것으로 설명하고 있으며, 이에 한정되지 않는다.Referring to FIG. 16 , the computing device 100 may extract and provide information on a synthetic material having a specific structure and characteristics and guide information for synthesizing the synthetic material. In FIGS. 16 to 18, the synthetic material is described as a candidate material for new drug development, but is not limited thereto.

이하에서는 개시된 실시 예에 따른 합성 물질 개발 프로세스를 설명하기 위해 신약개발의 예시를 들어 설명하고 있으나, 개시된 실시 예에 따른 합성 물질 개발 프로세스는 신약 외에도 다양한 분야의 합성 물질 개발에 활용될 수 있다.Hereinafter, although new drug development is described as an example to explain the synthetic material development process according to the disclosed embodiment, the synthetic material development process according to the disclosed embodiment can be used for the development of synthetic materials in various fields other than new drugs.

예를 들어, 개시된 실시 예에 따른 합성 물질 개발 프로세스는 반도체 재료의 내열성을 높이기 위한 합성 물질 개발, 배터리 재료의 전기전도도를 높이기 위한 합성 물질 개발 등 다양한 영역에 활용될 수 있으며, 특정한 분야에 한정되지 않는다.For example, the synthetic material development process according to the disclosed embodiments can be utilized in various fields, such as developing synthetic materials for increasing heat resistance of semiconductor materials and developing synthetic materials for increasing electrical conductivity of battery materials, and is not limited to specific fields. don't

S710 단계에서, 컴퓨팅 장치(100)는 제1 인공지능 모델을 생성 및 학습시킬 수 있다.In step S710, the computing device 100 may generate and train a first artificial intelligence model.

여기서, 제1 인공지능 모델(또는 연산 모델, 신경망, 네트워크 함수, 뉴럴 네트워크(neural network))은 하나 이상의 네트워크 함수로 구성되며, 하나 이상의 네트워크 함수는 일반적으로 ‘노드’라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 ‘노드’들은 ‘뉴런(neuron)’들로 지칭될 수도 있다. 하나 이상의 네트워크 함수는 적어도 하나 이상의 노드들을 포함하여 구성된다. 하나 이상의 네트워크 함수를 구성하는 노드(또는 뉴런)들은 하나 이상의 ‘링크’에 의해 상호 연결될 수 있다.Here, the first artificial intelligence model (or computational model, neural network, network function, neural network) is composed of one or more network functions, and one or more network functions are interconnected, which can generally be referred to as 'nodes'. It can consist of a set of computational units. These 'nodes' may also be referred to as 'neurons'. One or more network functions include at least one or more nodes. Nodes (or neurons) that make up one or more network functions can be interconnected by one or more 'links'.

제1 인공지능 모델 내에서, 링크를 통해 연결된 하나 이상의 노드들은 상대적으로 입력 노드 및 출력 노드의 관계를 형성할 수 있다. 입력 노드 및 출력 노드의 개념은 상대적인 것으로서, 하나의 노드에 대하여 출력 노드 관계에 있는 임의의 노드는 다른 노드와의 관계에서 입력 노드 관계에 있을 수 있으며, 그 역도 성립할 수 있다. 전술한 바와 같이, 입력 노드 대 출력 노드 관계는 링크를 중심으로 생성될 수 있다. 하나의 입력 노드에 하나 이상의 출력 노드가 링크를 통해 연결될 수 있으며, 그 역도 성립할 수 있다.In the first artificial intelligence model, one or more nodes connected through a link may form a relationship of a relatively input node and an output node. The concept of an input node and an output node is relative, and any node in an output node relationship with one node may have an input node relationship with another node, and vice versa. As described above, the input node to output node relationship can be created around the link. More than one output node can be connected to one input node through a link, and vice versa.

하나의 링크를 통해 연결된 입력 노드 및 출력 노드 관계에서, 출력 노드는 입력 노드에 입력된 데이터에 기초하여 그 값이 결정될 수 있다. 여기서 입력 노드와 출력 노드를 상호 연결하는 노드는 가중치(weight)를 가질 수 있다. 가중치는 가변적일 수 있으며, 제1 인공지능 모델이 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 가중치에 기초하여 출력 노드 값을 결정할 수 있다.In a relationship between an input node and an output node connected through one link, the value of the output node may be determined based on data input to the input node. Here, a node interconnecting an input node and an output node may have a weight. The weight may be variable, and may be variable by a user or an algorithm so that the first artificial intelligence model performs a desired function. For example, when one or more input nodes are interconnected by respective links to one output node, the output node is set to a link corresponding to values input to input nodes connected to the output node and respective input nodes. An output node value may be determined based on the weight.

전술한 바와 같이, 제1 인공지능 모델은 하나 이상의 노드들이 하나 이상의 링크를 통해 상호연결 되어 제1 인공지능 모델 내에서 입력 노드 및 출력 노드 관계를 형성한다. 제1 인공지능 모델 내에서 노드들과 링크들의 개수 및 노드들과 링크들 사이의 연관관계, 링크들 각각에 부여된 가중치의 값에 따라, 제1 인공지능 모델의 특성이 결정될 수 있다. 예를 들어, 동일한 개수의 노드 및 링크들이 존재하고, 링크들 사이의 가중치 값이 상이한 두 제1 인공지능 모델이 존재하는 경우, 두 개의 제1 인공지능 모델들은 서로 상이한 것으로 인식될 수 있다.As described above, in the first artificial intelligence model, one or more nodes are interconnected through one or more links to form an input node and output node relationship in the first artificial intelligence model. Characteristics of the first artificial intelligence model may be determined according to the number of nodes and links in the first artificial intelligence model, a relationship between the nodes and links, and a value of a weight assigned to each link. For example, when there are two first artificial intelligence models having the same number of nodes and links and different weight values between the links, the two first artificial intelligence models may be recognized as different from each other.

제1 인공지능 모델을 구성하는 노드들 중 일부는, 최초 입력 노드로부터의 거리들에 기초하여, 하나의 레이어(layer)를 구성할 수 있다. 예를 들어, 최초 입력 노드로부터 거리가 n인 노드들의 집합은, n 레이어를 구성할 수 있다. 최초 입력 노드로부터 거리는, 최초 입력 노드로부터 해당 노드까지 도달하기 위해 거쳐야 하는 링크들의 최소 개수에 의해 정의될 수 있다. 그러나, 이러한 레이어의 정의는 설명을 위한 임의적인 것으로서, 제1 인공지능 모델 내에서 레이어의 차수는 전술한 것과 상이한 방법으로 정의될 수 있다. 예를 들어, 노드들의 레이어는 최종 출력 노드로부터 거리에 의해 정의될 수도 있다.Some of the nodes constituting the first artificial intelligence model may constitute one layer based on distances from the first input node. For example, a set of nodes having a distance of n from the first input node may constitute n layers. The distance from the first input node may be defined by the minimum number of links that must be passed through to reach the corresponding node from the first input node. However, the definition of such a layer is arbitrary for explanation, and the order of the layer in the first artificial intelligence model may be defined in a method different from that described above. For example, a layer of nodes may be defined by a distance from a final output node.

최초 입력 노드는 제1 인공지능 모델 내의 노드들 중 다른 노드들과의 관계에서 링크를 거치지 않고 데이터가 직접 입력되는 하나 이상의 노드들을 의미할 수 있다. 또는, 제1 인공지능 모델 네트워크 내에서, 링크를 기준으로 한 노드 간의 관계에 있어서, 링크로 연결된 다른 입력 노드들 가지지 않는 노드들을 의미할 수 있다. 이와 유사하게, 최종 출력 노드는 제1 인공지능 모델 내의 노드들 중 다른 노드들과의 관계에서, 출력 노드를 가지지 않는 하나 이상의 노드들을 의미할 수 있다. 또한, 히든 노드는 최초 입력 노드 및 최후 출력 노드가 아닌 제1 인공지능 모델을 구성하는 노드들을 의미할 수 있다. 본 개시의 일 실시예에 따른 제1 인공지능 모델은 입력 레이어의 노드가 출력 레이어에 가까운 히든 레이어의 노드보다 많을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하는 형태의 제1 인공지능 모델일 수 있다.The initial input node may refer to one or more nodes to which data is directly input without going through a link in relation to other nodes among nodes in the first artificial intelligence model. Alternatively, in the relationship between nodes based on links in the first artificial intelligence model network, it may refer to nodes that do not have other input nodes connected by links. Similarly, the final output node may refer to one or more nodes that do not have an output node in relation to other nodes among nodes in the first artificial intelligence model. Also, the hidden node may refer to nodes constituting the first artificial intelligence model other than the first input node and the last output node. The first artificial intelligence model according to an embodiment of the present disclosure may have more nodes of an input layer than nodes of a hidden layer close to an output layer, and the number of nodes decreases as the number of nodes increases from the input layer to the hidden layer. It can be an artificial intelligence model.

제1 인공지능 모델은 하나 이상의 히든 레이어를 포함할 수 있다. 히든 레이어의 히든 노드는 이전의 레이어의 출력과 주변 히든 노드의 출력을 입력으로 할 수 있다. 각 히든 레이어 별 히든 노드의 수는 동일할 수도 있고 상이할 수도 있다. 입력 레이어의 노드의 수는 입력 데이터의 데이터 필드의 수에 기초하여 결정될 수 있으며 히든 노드의 수와 동일할 수도 있고 상이할 수도 있다. 입력 레이어에 입력된 입력 데이터는 히든 레이어의 히든 노드에 의하여 연산될 수 있고 출력 레이어인 완전 연결 레이어(FCL: fully connected layer)에 의해 출력될 수 있다.The first artificial intelligence model may include one or more hidden layers. A hidden node of a hidden layer may use outputs of previous layers and outputs of neighboring hidden nodes as inputs. The number of hidden nodes for each hidden layer may be the same or different. The number of nodes of the input layer may be determined based on the number of data fields of the input data and may be the same as or different from the number of hidden nodes. Input data input to the input layer may be operated by a hidden node of the hidden layer and may be output by a fully connected layer (FCL) that is an output layer.

다양한 실시예에서, 컴퓨팅 장치(100)는 제1 인공지능 모델을 학습시키기 위한 학습 데이터를 구축할 수 있고, 구축된 학습 데이터를 이용하여 교사 학습(supervised learning), 비교사 학습(unsupervised learning), 및 반교사학습(semi supervised learning) 중 적어도 하나의 방식으로 제1 인공지능 모델을 학습시킬 수 있다.In various embodiments, the computing device 100 may build learning data for learning the first artificial intelligence model, and use the built learning data to perform supervised learning, unsupervised learning, The first artificial intelligence model may be trained using at least one of semi-supervised learning and semi-supervised learning.

제1 인공지능 모델의 학습은 출력의 오류를 최소화하기 위한 것이다. 제1 인공지능 모델의 학습에서 반복적으로 학습 데이터를 제1 인공지능 모델에 입력시키고 학습 데이터에 대한 제1 인공지능 모델의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 제1 인공지능 모델의 에러를 제1 인공지능 모델의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation)하여 제1 인공지능 모델의 각 노드의 가중치를 업데이트 하는 과정이다. Learning of the first artificial intelligence model is to minimize output errors. In the learning of the first artificial intelligence model, the learning data is repeatedly input into the first artificial intelligence model, the output of the first artificial intelligence model for the learning data and the error of the target are calculated, and the first artificial intelligence is directed to reduce the error. This is a process of updating the weight of each node of the first artificial intelligence model by backpropagating the error of the model from the output layer of the first artificial intelligence model to the input layer.

교사 학습의 경우 각각의 학습 데이터에 정답이 레이블링 되어있는 학습 데이터를 사용하며(즉, 레이블링된 학습 데이터), 비교사 학습의 경우는 각각의 학습 데이터에 정답이 레이블링 되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 교사 학습의 경우의 학습 데이터는 학습 데이터 각각에 카테고리가 레이블링 된 데이터 일 수 있다. 레이블링된 학습 데이터가 제1 인공지능 모델에 입력되고, 제1 인공지능 모델의 출력(카테고리)과 학습 데이터의 레이블을 비교함으로써 오류(error)가 계산될 수 있다.In the case of teacher learning, the learning data in which the correct answer is labeled is used for each learning data (ie, the labeled learning data), and in the case of comparative teacher learning, the correct answer may not be labeled in each learning data. That is, for example, learning data in the case of teacher learning regarding data classification may be data in which each learning data is labeled with a category. Labeled training data may be input to the first artificial intelligence model, and an error may be calculated by comparing an output (category) of the first artificial intelligence model with a label of the training data.

다른 예로, 데이터 분류에 관한 비교사 학습의 경우 입력인 학습 데이터가 제1 인공지능 모델 출력과 비교됨으로써 오류가 계산될 수 있다. 계산된 오류는 제1 인공지능 모델에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파 되며, 역전파에 따라 제1 인공지능 모델의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다.As another example, in the case of comparative history learning for data classification, an error may be calculated by comparing input learning data with an output of the first artificial intelligence model. The calculated error is back-propagated in the first artificial intelligence model in a reverse direction (ie, from the output layer to the input layer), and connection weights of each node of each layer of the first artificial intelligence model may be updated according to the back-propagation. The amount of change in the connection weight of each updated node may be determined according to a learning rate.

입력 데이터에 대한 제1 인공지능 모델의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 제1 인공지능 모델의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 제1 인공지능 모델의 학습 초기에는 높은 학습률을 사용하여 제1 인공지능 모델이 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다.The computation of the first artificial intelligence model on the input data and the backpropagation of errors may constitute a learning cycle (epoch). The learning rate may be applied differently according to the number of iterations of the learning cycle of the first artificial intelligence model. For example, a high learning rate is used at the beginning of the learning of the first artificial intelligence model to ensure that the first artificial intelligence model quickly achieves a certain level of performance to increase efficiency, and a low learning rate is used in the later stage to increase accuracy. .

제1 인공지능 모델의 학습에서 일반적으로 학습 데이터는 실제 데이터(즉, 학습된 제1 인공지능 모델을 이용하여 처리하고자 하는 데이터)의 부분집합일 수 있으며, 따라서, 학습 데이터에 대한 오류는 감소하나 실제 데이터에 대해서는 오류가 증가하는 학습 사이클이 존재할 수 있다. 과적합(overfitting)은 이와 같이 학습 데이터에 과하게 학습하여 실제 데이터에 대한 오류가 증가하는 현상이다. 예를 들어, 노란색 고양이를 보여 고양이를 학습한 제1 인공지능 모델이 노란색 이외의 고양이를 보고는 고양이임을 인식하지 못하는 현상이 과적합의 일종일 수 있다.In the learning of the first artificial intelligence model, generally, the training data may be a subset of actual data (ie, data to be processed using the learned first artificial intelligence model), and thus, errors in the training data are reduced, but For real data, there may be learning cycles in which the error increases. Overfitting is a phenomenon in which errors for actual data increase due to excessive learning on training data. For example, a phenomenon in which the first artificial intelligence model, which learned a cat by showing a yellow cat, does not recognize that the cat is a cat when it sees a cat other than yellow may be a type of overfitting.

과적합은 머신러닝 알고리즘의 오류를 증가시키는 원인으로 작용할 수 있다. 이러한 과적합을 막기 위하여 다양한 최적화 방법이 사용될 수 있다. 과적합을 막기 위해서는 학습 데이터를 증가시키거나, 레귤라이제이션(regularization), 학습의 과정에서 네트워크의 노드 일부를 생략하는 드롭아웃(dropout) 등의 방법이 적용될 수 있다.Overfitting can act as a cause of increasing the error of machine learning algorithms. Various optimization methods can be used to prevent such overfitting. In order to prevent overfitting, methods such as increasing training data, regularization, and omitting some nodes of a network in the process of learning may be applied.

다양한 실시예에서, 컴퓨팅 장치(100)는 복수의 합성 물질 각각의 속성 정보(예: 구조, 특성 정보)와 복수의 합성 물질 각각을 합성하기 위한 정보(예: 복수의 합성 물질 각각을 합성하기 위한 재료, 장비 및 합성 방법에 관한 정보 등)를 학습 데이터로 하여 제1 인공지능 모델을 학습시킬 수 있다. 그러나, 이에 한정되지 않고, 컴퓨팅 장치(100)는 복수의 합성 방법 각각에 대한 수율 정보를 학습 데이터로 하여 제1 인공지능 모델을 학습시킬 수 있다.In various embodiments, the computing device 100 may include attribute information (eg, structure, property information) of each of a plurality of synthetic materials and information for synthesizing each of a plurality of synthetic materials (eg, information for synthesizing each of a plurality of synthetic materials). The first artificial intelligence model may be trained using materials, equipment, information on synthesis methods, etc.) as learning data. However, the present invention is not limited thereto, and the computing device 100 may use yield information for each of a plurality of synthesis methods as learning data to learn the first artificial intelligence model.

S720 단계에서, 컴퓨팅 장치(100)는 사용자로부터 하나 이상의 조건을 획득할 수 있다. 여기서, 하나 이상의 조건은 합성 물질이 가져야 하는 성질(예: 특정 질병에 대한 효과가 있어야 함 등)을 의미할 수 있으나, 이에 한정되지 않는다.In step S720, the computing device 100 may obtain one or more conditions from the user. Here, the one or more conditions may mean properties that the synthetic material should have (eg, it should have an effect on a specific disease, etc.), but is not limited thereto.

S730 단계에서, 컴퓨팅 장치(100)는 S720 단계를 거쳐 획득된 하나 이상의 조건을 제1 인공지능 모델의 입력 값으로 하여 하나 이상의 조건을 만족하는 구조 및 특성을 가지는 합성 물질을 예측하고, 예측된 합성 물질을 합성하기 위한 재료, 장비 및 합성 방법을 포함하는 결과 값을 추출할 수 있다.In step S730, the computing device 100 predicts a synthetic material having a structure and characteristics that satisfy one or more conditions by using the one or more conditions obtained through step S720 as input values of the first artificial intelligence model, and the predicted synthesis Result values including materials, equipment and synthesis methods for synthesizing the substance can be extracted.

일례로, 컴퓨팅 장치(100)는 사용자로부터 입력된 조건이 "질병 z에 효과가 있으면서 수율 90% 이상"인 경우, 해당 조건을 제1 인공지능 모델에 입력함으로써, 질병 z에 효과가 있도록 최적화된 구조 및 특성을 가지는 합성 물질을 예측할 수 있고, 예측된 합성 물질에 따라 해당 합성 물질을 생성하기 위한 재료를 판단할 수 있으며, 해당 합성 물질을 합성시킬 수 있으면서 수율 90% 이상이 되도록 하는 합성 방법과 이를 수행하기 위해 필요한 장비를 판단하여 결과 값으로 추출할 수 있다.For example, when the condition input from the user is "effective for disease z and yield is 90% or more", the computing device 100 inputs the condition to the first artificial intelligence model, so that the optimized disease z is effective. A synthetic material having a structure and characteristics can be predicted, a material for generating the synthetic material can be determined according to the predicted synthetic material, and a synthesis method capable of synthesizing the synthetic material with a yield of 90% or more It can be extracted as a result value by determining the equipment required to perform this.

제1 인공지능 모델은 복수의 합성 물질 각각의 속성 정보(예: 구조, 특성 정보)와 복수의 합성 물질 각각을 합성하기 위한 정보(예: 복수의 합성 물질 각각을 합성하기 위한 재료, 장비 및 합성 방법) 및 합성 방법별 수율 정보를 "특정 재료, 특정 장비, 특정 합성 과정으로 합성 시 수율 N%로 특정 질병에 효과가 있는 특정 합성 물질 생성" 형태의 학습 데이터로 하여 학습된 모델 즉 합성 물질의 속성 정보 합성 물질을 합성하기 위한 정보 및 수율 정보 간의 상관관계를 학습한 모델인 바, 특정 조건을 제1 인공지능 모델에 입력하는 동작 만으로 해당 조건을 만족하는 합성 물질과 해당 합성 물질을 생성하기 위한 가이드 정보를 추출할 수 있다.The first artificial intelligence model includes attribute information (e.g., structure, property information) of each of a plurality of synthetic materials and information for synthesizing each of a plurality of synthetic materials (e.g., materials, equipment, and synthesis for synthesizing each of a plurality of synthetic materials). method) and yield information for each synthesis method as learning data in the form of “generating a specific synthetic substance effective for a specific disease with a yield of N% when synthesized with specific materials, specific equipment, and specific synthesis processes” As a model that learns the correlation between information for synthesizing property information synthetic materials and yield information, it is possible to generate a synthetic material that satisfies the condition and a corresponding synthetic material only by inputting a specific condition into the first artificial intelligence model. Guide information can be extracted.

뿐만 아니라, 제1 인공지능 모델은 합성 물질의 속성 정보 합성 물질을 합성하기 위한 정보 및 수율 정보 간의 상관관계를 학습한 모델인 바, 상기의 동작과 반대로, 특정 재료, 장비 및 합성 방법을 제1 인공지능 모델의 입력 값으로 하여 특정 재료, 장비 및 합성 방법에 따라 합성될 것으로 예측되는 합성 물질에 관한 정보를 결과 값으로 추출할 수 있다.In addition, the first artificial intelligence model is a model that learns the correlation between the property information of synthetic materials, information for synthesizing synthetic materials, and yield information, and, contrary to the above operation, specific materials, equipment, and synthesis methods are first Information on synthetic materials predicted to be synthesized according to specific materials, equipment, and synthesis methods can be extracted as input values of the artificial intelligence model as result values.

다양한 실시예에서, 컴퓨팅 장치(100)는 사용자에게 상기의 결과 값을 제공할 수 있고, 상기의 결과 값을 제공한 것에 대한 응답으로, 사용자로부터 피드백 정보(예: 예측된 합성 물질을 합성하기 위한 재료, 장비 및 합성 방법에 따라 생성된 합성 물질에 관한 정보)를 입력받을 수 있으며, 입력된 피드백 정보를 학습 데이터로 하여 제1 인공지능 모델을 재학습시킬 수 있다.In various embodiments, the computing device 100 may provide the result value to the user, and in response to providing the result value, feedback information (eg, for synthesizing the predicted synthetic material) from the user. materials, equipment, and information on synthetic substances generated according to synthesis methods) may be input, and the first artificial intelligence model may be re-learned using the input feedback information as learning data.

이때, 컴퓨팅 장치(100)는 사용자에게 제공된 결과 값에 기초하여 생성될 것으로 예측된 합성 물질과 사용자로부터 입력된 피드백 정보에 기초하여 실제로 생성된 합성 물질이 상이한 경우에만 해당 정보를 학습 데이터로 하여 제1 인공지능 모델을 재학습시킬 수 있다.At this time, the computing device 100 uses the information as learning data only when the synthetic material predicted to be generated based on the result value provided to the user is different from the synthetic material actually generated based on the feedback information input from the user. 1 AI models can be retrained.

다양한 실시예에서, 컴퓨팅 장치(100)는 제1 인공지능 모델을 통해 예측된 합성 물질에 대한 스케일업(scale-up)을 수행하고자 하는 경우, 복수의 합성 방법에 따른 수율을 학습 데이터로 하여 학습된 제1 인공지능 모델을 통해 합성 물질을 합성하기 위한 합성 방법을 재추출할 수 있다. In various embodiments, when the computing device 100 intends to perform scale-up on the synthetic material predicted through the first artificial intelligence model, the yield according to the plurality of synthesis methods is used as learning data. A synthesis method for synthesizing a synthetic material can be re-extracted through the first artificial intelligence model.

보다 구체적으로, 컴퓨팅 장치(100)는 합성 방법별 수율 정보를 학습한 제1 인공지능 모델과 합성 방법별 수율 정보를 학습 하지 않은 제1 인공지능 모델을 생성할 수 있으며, 합성 방법별 수율 정보를 학습하지 않은 제1 인공지능 모델을 통해 결과 값을 도출하는 것을 기본(default)로 이용함으로써, 특정 조건을 만족하는 합성 물질을 예측 하는 것에 우선순위를 두되, 경우에 따라 합성 물질의 개발이 승인 및 완료 되어 해당 합성 물질에 대한 스케일업을 수행하고자 하는 경우에만 합성 방법별 수율 정보를 학습한 제1 인공지능 모델을 통해 합성 방법을 재추출할 수 있다.More specifically, the computing device 100 may generate a first artificial intelligence model that has learned yield information for each synthesis method and a first artificial intelligence model that has not learned yield information for each synthesis method, and generates yield information for each synthesis method. By using the derivation of the result value through the first unlearned artificial intelligence model as a default, priority is given to predicting synthetic materials that satisfy specific conditions, but in some cases, the development of synthetic materials is approved and approved. Only when the scale-up of the corresponding synthetic material is completed, the synthesis method may be re-extracted through the first artificial intelligence model that has learned the yield information for each synthesis method.

도 17은 다양한 실시예에서, 제2 인공지능 모델을 통해 합성 물질에 대한 시험 조건을 설정하는 방법을 설명하기 위한 도면이다.17 is a diagram for explaining a method of setting test conditions for a synthetic material through a second artificial intelligence model, in various embodiments.

도 17을 참조하면, 컴퓨팅 장치(100)는 특정 합성 물질의 시험(예: 전임상 시험 또는 임상 시험)을 위한 조건을 설정할 수 있다.Referring to FIG. 17 , the computing device 100 may set conditions for a test (eg, preclinical test or clinical test) of a specific synthetic material.

S810 단계에서, 컴퓨팅 장치(100)는 제2 인공지능 모델을 생성 및 학습시킬 수 있다.In step S810, the computing device 100 may generate and train a second artificial intelligence model.

여기서, 제2 인공지능 모델의 구조 및 동작 형태는 제1 인공지능 모델과 동일할 수 있으나, 이에 한정되지 않는다.Here, the structure and operation form of the second artificial intelligence model may be the same as that of the first artificial intelligence model, but is not limited thereto.

다양한 실시예에서, 컴퓨팅 장치(100)는 복수의 합성 물질에 관한 정보 및 시험에 관한 정보(예: 복수의 합성 물질에 대한 전임상 시험 또는 임상 시험을 수행하기 위해 설정된 조건, 설정된 조건에 따른 시험 결과 등)를 학습 데이터로 하여 제2 인공지능 모델을 학습시킬 수 있다.In various embodiments, the computing device 100 may provide information about a plurality of synthetic materials and information about tests (eg, conditions set to conduct a preclinical test or clinical test on a plurality of synthetic materials, and test results according to the set conditions). etc.) can be used as learning data to learn the second artificial intelligence model.

S820 단계에서, 컴퓨팅 장치(100)는 전임상 또는 임상 시험을 수행하고자 하는 합성 물질에 관한 정보를 획득할 수 있다.In step S820, the computing device 100 may obtain information about a synthetic material to be subjected to a preclinical or clinical test.

S830 단계에서, 컴퓨팅 장치(100)는 S820 단계를 거쳐 획득된 합성 물질에 관한 정보를 제2 인공지능 모델의 입력 값으로 하여 합성 물질의 시험을 위한 조건을 설정에 관한 결과 값을 추출할 수 있다.In step S830, the computing device 100 may use the information on the synthetic material acquired through step S820 as an input value of the second artificial intelligence model to extract a result value for setting conditions for testing the synthetic material. .

제2 인공지능 모델은 복수의 합성 물질에 관한 정보 및 시험에 관한 정보를 학습 데이터로 하여 학습된 모델 즉, 학습 물질별 시험 조건에 따른 시험 결과를 학습한 모델인 바, 특정 학습 물질에 관한 정보를 제2 인공지능 모델에 입력하는 동작만으로 최적의 시험 결과를 도출할 수 있는 시험 조건을 추출할 수 있다.The second artificial intelligence model is a model learned using information and test information on a plurality of synthetic materials as learning data, that is, a model that learns test results according to test conditions for each learning material, information on a specific learning material Test conditions that can derive optimal test results can be extracted only by the operation of inputting to the second artificial intelligence model.

뿐만 아니라, 제2 인공지능 모델은 학습 물질별 시험 조건에 따른 시험 결과를 학습한 모델인 바, 합성 물질의 시험에 대한 특정 조건을 제2 인공지능 모델의 입력 값으로 하여 합성 물질의 시험 결과 예측 값을 결과 값으로 추출할 수 있다.In addition, since the second artificial intelligence model is a model that learns the test results according to the test conditions for each learning material, the test result of the synthetic material is predicted by using the specific conditions for the test of the synthetic material as the input value of the second artificial intelligence model Values can be extracted as result values.

다양한 실시예에서, 컴퓨팅 장치(100)는 상기의 방법에 따라 설정된 조건에 따라 학습 물질에 대한 시험을 수행한 결과를 학습 데이터로 하여 제2 인공지능 모델을 재학습시킬 수 있다.In various embodiments, the computing device 100 may re-learn the second artificial intelligence model by using the result of testing the learning material according to the conditions set according to the above method as learning data.

도 18은 다양한 실시예에서, 제3 인공지능 모델을 통해, 신약 개발 시 신약에 적합한 환자와 투약량을 도출하는 방법을 설명하기 위한 도면이다.18 is a view for explaining a method of deriving a patient and dosage suitable for a new drug when developing a new drug through a third artificial intelligence model, in various embodiments.

도 18을 참조하면, 컴퓨팅 장치(100)는 도 17 및 도 18의 동작을 거쳐 특정 합성 물질에 대한 신약 개발 승인 및 완료처리가 되는 경우, 특정 합성 물질을 포함하는 신약 개발 시 해당 신약에 적합한 환자와 적합한 투약량을 추출할 수 있다.Referring to FIG. 18 , the computing device 100, through the operations of FIGS. 17 and 18 , when a new drug development approval and completion process for a specific synthetic material is completed, when a new drug containing a specific synthetic material is developed, a patient suitable for the corresponding new drug and suitable dosages can be extracted.

S910 단계에서, 컴퓨팅 장치(100)는 제3 인공지능 모델을 생성 및 학습시킬 수 있다.In step S910, the computing device 100 may generate and train a third artificial intelligence model.

여기서, 제3 인공지능 모델의 구조 및 동작 형태는 제1 인공지능 모델 및 제2 인공지능 모델과 동일할 수 있으나, 이에 한정되지 않는다.Here, the structure and operation form of the third artificial intelligence model may be the same as those of the first artificial intelligence model and the second artificial intelligence model, but are not limited thereto.

다양한 실시예에서, 컴퓨팅 장치(100)는 복수의 시험대상에 관한 정보, 신물질로 개발된 복수의 합성 물질에 관한 정보 및 신물질로 개발된 복수의 합성 물질 각각의 시험 결과를 학습 데이터로 하여 제3 인공지능 모델을 학습시킬 수 있다.In various embodiments, the computing device 100 uses information on a plurality of test subjects, information on a plurality of synthetic materials developed as new materials, and test results of each of a plurality of synthetic materials developed as new materials as learning data to obtain a third AI models can be trained.

예를 들어, 컴퓨팅 장치(100)는 복수의 환자에 관한 정보, 신약으로 개발된 복수의 합성 물질에 관한 정보 및 신약으로 개발된 복수의 합성 물질 각각의 전임상 시험 또는 임상 시험 결과를 학습 데이터로 하여 제3 인공지능 모델을 학습시킬 수 있다.For example, the computing device 100 uses information about a plurality of patients, information about a plurality of synthetic materials developed as new drugs, and preclinical test or clinical test results of each of a plurality of synthetic materials developed as new drugs as learning data. A third artificial intelligence model can be trained.

S920 단계에서, 컴퓨팅 장치(100)는 시험이 완료된 합성 물질에 대한 정보를 획득할 수 있다.In step S920, the computing device 100 may acquire information about the synthetic material for which the test has been completed.

예를 들어, 컴퓨팅 장치(100)는 신약 개발이 승인 및 완료된 합성 물질에 관한 정보를 획득할 수 있다.For example, the computing device 100 may obtain information about synthetic materials for which new drug development has been approved and completed.

S930 단계에서, 컴퓨팅 장치(100)는 S920 단계를 거쳐 획득된 합성 물질에 관한 정보를 제3 인공지능 모델의 입력 값으로 하여 합성 물질을 포함하는 신물질을 사용하기 적합한 대상 및 사용량에 관한 정보를 결과 값으로 추출할 수 있다.In step S930, the computing device 100 uses the information on the synthetic material obtained through step S920 as an input value of the third artificial intelligence model, and results in information about a target suitable for using the new material including the synthetic material and the amount used. values can be extracted.

예를 들어, 컴퓨팅 장치(100)는 S920 단계를 거쳐 획득된 합성 물질에 관한 정보를 제3 인공지능 모델의 입력 값으로 하여 합성 물질을 포함하는 신약을 투약하기 적합한 환자 및 투약량에 관한 정보를 결과 값으로 추출할 수 있다.For example, the computing device 100 uses the information on the synthetic material obtained through step S920 as an input value of the third artificial intelligence model, and provides information on a patient suitable for administering a new drug containing the synthetic material and a dosage amount as a result. values can be extracted.

신약개발과 관련한 실시 예에서, 제3 인공지능 모델은 복수의 환자에 관한 정보, 신약으로 개발된 복수의 합성 물질에 관한 정보 및 신약으로 개발된 복수의 합성 물질 각각의 전임상 시험 또는 임상 시험 결과를 학습 데이터로 하여 학습된 모델 즉, 환자의 속성(나이, 성별, 기저질환 등)와 신약 효과 간의 상관관계 및 투약량과 신약 효과 간의 상관관계를 학습한 모델인 바, 특정 학습 물질에 관한 정보를 제3 인공지능 모델에 입력하는 동작만으로 신약에 적합한 환자가 누구인지 또한 적당한 투약량이 어느정도 인지를 추출할 수 있다.In an embodiment related to drug development, the third artificial intelligence model provides information on a plurality of patients, information on a plurality of synthetic substances developed as new drugs, and preclinical test or clinical test results of each of a plurality of synthetic substances developed as new drugs. It is a model learned with learning data, that is, a model that learns the correlation between the patient's attributes (age, gender, underlying disease, etc.) and the effect of the new drug, and the correlation between the dosage and the effect of the new drug. Provides information on specific learning substances 3 It is possible to extract which patients are suitable for the new drug and what the appropriate dosage is just by inputting the motion to the artificial intelligence model.

또한, 컴퓨팅 장치(100)는 상기와 같이 인공지능 모델을 통해 신약 개발을 위한 직접적으로 가이드할 뿐만 아니라, 연구 분야에 도움이 되는 문헌들을 제공하거나 유사 분야를 연구하는 연구원을 매칭하는 등 간접적으로 가이드할 수 있다. In addition, the computing device 100 not only directly guides the development of new drugs through the artificial intelligence model as described above, but also guides indirectly, such as providing helpful literature for research fields or matching researchers studying similar fields. can do.

보다 구체적으로, 컴퓨팅 장치(100)는 도 19에 도시된 바와 같이, 특정 사용자(연구자)에 대응하여 기 생성된 정형화된 연구 기록 데이터를 분석하여 중요 세부 조건(재료로서 사용되는 물질, 장비, 합성 과정 등)을 추출할 수 있고, 추출된 세부 조건에 대응되는 비정형 데이터(예: 논문, 특허)를 검색하여 제공함으로써, 연구 내용에 최적화된 자료를 제공할 수 있다.More specifically, as shown in FIG. 19, the computing device 100 analyzes pre-generated standardized research record data corresponding to a specific user (researcher) to provide important detailed conditions (substances used as materials, equipment, synthesis). process, etc.) can be extracted, and data optimized for research contents can be provided by searching and providing unstructured data (eg, papers, patents) corresponding to the extracted detailed conditions.

또한, 컴퓨팅 장치(100)는 도 20에 도시된 바와 같이, 특정 사용자(연구자)에 대한 정보(예: 개인 정보, 연구 분야 및 포트폴리오)를 게재하거나, 연구 논문 데이터를 공유하는 기능 및 연구 내용을 기반으로 유사 분야를 연구하는 다른 연구자들을 매칭하는 기능을 제공하는 연구 공유 및 협업 플랫폼을 제공할 수 있다.In addition, as shown in FIG. 20, the computing device 100 provides a function of posting information (eg, personal information, research field, and portfolio) for a specific user (researcher) or sharing research paper data and research contents. Based on this, it is possible to provide a research sharing and collaboration platform that provides a function to match other researchers studying similar fields.

전술한 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법은 도면에 도시된 순서도를 참조하여 설명하였다. 간단한 설명을 위해 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법 및 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법은 일련의 블록들로 도시하여 설명하였으나, 본 발명은 상기 블록들의 순서에 한정되지 않고, 몇몇 블록들은 본 명세서에 도시되고 시술된 것과 상이한 순서로 수행되거나 또는 동시에 수행될 수 있다. 또한, 본 명세서 및 도면에 기재되지 않은 새로운 블록이 추가되거나, 일부 블록이 삭제 또는 변경된 상태로 수행될 수 있다. 이하, 도 21 내지 24를 참조하여, 컴퓨팅 장치(100)가 제공하는 UI(10)에 대해 설명하도록 한다.A method for automatically generating standardized research record data for learning the aforementioned artificial intelligence model and a method for providing a synthetic material development process using the artificial intelligence model have been described with reference to the flow chart shown in the drawings. For a brief description, the method for automatically generating standardized research record data for learning of an artificial intelligence model and the method for providing a synthetic material development process using an artificial intelligence model have been illustrated and described as a series of blocks, but the present invention is based on the order of the blocks. Without limitation, some blocks may be performed concurrently or in a different order than shown and performed herein. In addition, new blocks not described in the present specification and drawings may be added, or some blocks may be deleted or changed. Hereinafter, the UI 10 provided by the computing device 100 will be described with reference to FIGS. 21 to 24 .

도 21 내지 24는 다양한 실시예에 적용 가능한 사용자 인터페이스의 형태를 예시적으로 도시한 도면이다.21 to 24 are diagrams illustrating forms of user interfaces applicable to various embodiments by way of example.

도 21 내지 24를 참조하면, UI(10)는 실험 재료에 대한 정보의 입력을 위한 제1 버튼(11), 실험 장비에 대한 정보의 입력을 위한 제2 버튼(12) 및 실험 및 연구 과정에 대한 정보의 입력을 위한 제3 버튼(13)을 포함할 수 있다.Referring to FIGS. 21 to 24 , the UI 10 includes a first button 11 for inputting information on experimental materials, a second button 12 for inputting information on experimental equipment, and experiments and research processes. It may include a third button 13 for inputting information about.

컴퓨팅 장치(100)는 사용자로부터 제1 버튼(11), 제2 버튼(12) 및 제3 버튼(13) 중 적어도 하나의 버튼이 선택되는 것에 응답하여, 실험 재료에 대한 정보, 실험 장비에 대한 정보 및 실험 및 연구 과정에 대한 정보 중 어느 하나의 정보를 입력받기 위한 UI를 제공할 수 있다. 예를 들어, 사용자가 UI(10) 상의 제1 버튼(11)을 선택(예: 마우스 클릭 입력)하는 경우, 팝업 형태의 실험 재료에 대한 정보의 입력을 위한 UI(14)를 제공할 수 있다.In response to a selection of at least one of the first button 11, the second button 12, and the third button 13 by the user, the computing device 100 provides information about the experiment material and information about the experiment equipment. A UI for receiving any one of information and information on experiments and research processes may be provided. For example, when the user selects the first button 11 on the UI 10 (eg, inputting a mouse click), the UI 14 for inputting information on experimental materials in a pop-up form may be provided. .

또한, 도면에 도시되어 있지 않으나, 상기와 마찬가지로, 사용자가 제2 버튼(12)을 선택하는 것에 응답하여 실험 장비에 대한 정보의 입력을 위한 UI를 제공할 수 있고, 사용자가 제3 버튼(13)을 선택하는 것에 응답하여, 실험 및 연구 과정에 대한 정보의 입력을 위한 UI를 제공할 수 있다. 이때, 각각의 UI들은 실험 재료에 대한 정보의 입력을 위한 UI(14)와 마찬가지로 팝업 형태로 출력될 수 있다.In addition, although not shown in the drawings, as described above, a UI for inputting information on experimental equipment may be provided in response to the user selecting the second button 12, and the user may use the third button 13 In response to selecting ), a UI for inputting information on experiments and research processes may be provided. At this time, each of the UIs may be output in a pop-up form similarly to the UI 14 for inputting information on the experiment material.

컴퓨팅 장치(100)는 실험 재료에 대한 정보의 입력을 위한 UI(14), 실험 장비에 대한 정보의 입력을 위한 UI 및 실험 및 연구 과정에 대한 정보의 입력을 위한 UI를 통해 입력된 실험 재료, 연구 및 실험 과정 및 연구 결과에 대한 키워드를 자동완성 및 연동하여 실험 재료 정보, 연구 및 실험 과정 정보 및 연구 결과 정보를 생성할 수 있고, 생성된 각각의 정보를 기 설정된 템플릿에 맞춰 UI(10) 상에 배치 및 등록할 수 있다. 예를 들어, 각각의 정보들은 도 23에 도시된 바와 같이 개별적인 박스 형태로 구현되되, 동일한 범주에 속하는 정보들끼리 동일한 열에 배치되도록 할 수 있다.The computing device 100 includes a UI 14 for inputting information on experimental materials, a UI for inputting information on experimental equipment, and experimental materials input through the UI for inputting information on experiments and research processes; It is possible to create experimental material information, research and experiment process information, and research result information by automatically completing and interlocking keywords for research and experiment processes and research results, and UI (10) according to each generated information according to a preset template. can be placed and registered on the For example, each piece of information may be implemented in the form of an individual box as shown in FIG. 23, but information belonging to the same category may be arranged in the same column.

이때, UI(10) 상에 배치(등록)된 특정 정보를 포함하는 카드는 사용자의 요청에 따라 자유롭게 복사되어 UI(10) 상의 다른 영역에 배치될 수 있다. 예를 들어, 컴퓨팅 장치(100)는 특정 실험 재료에 대한 정보를 포함하는 제1 카드(16)에 대한 복사 요청(예: 제1 카드(16) 선택, 기 설정된 키(예: Ctrl) + 드래그 입력)을 얻는 것에 응답하여, 사용자가 지정한 영역(예: 드래그 입력 후 마우스 포인터가 위치하는 영역)에 제1 카드(16)의 복사본인 제2 카드(16')를 생성하여 표시 및 등록할 수 있다.At this time, the card including specific information disposed (registered) on the UI 10 may be freely copied and disposed in another area on the UI 10 according to a user's request. For example, the computing device 100 requests copying of the first card 16 including information on a specific experimental material (eg, selection of the first card 16, a preset key (eg, Ctrl) + drag input), a second card 16', which is a copy of the first card 16, can be created, displayed, and registered in an area designated by the user (eg, an area where the mouse pointer is located after a drag input). there is.

또한, UI(10) 상에 배치(등록)된 특정 정보를 포함하는 복수의 카드는 사용자의 요청에 따라 자유롭게 혼합될 수 있다. 예를 들어, 컴퓨팅 장치(100)는 제1 실험 재료에 대한 정보를 포함하는 제1 카드와 제2 실험 재료에 대한 정보를 포함하는 제2 카드에 대한 혼합 요청(예: 제1 카드를 선택 및 드래그하여 제2 카드 위에 올려놓거나, 제2 카드를 선택 및 드래그하여 제1 카드 위에 올려놓는 동작 등)을 얻는 것에 응답하여, 제1 카드에 포함된 정보와 제2 카드에 포함된 정보를 결합하여 새로운 제3 카드(예: 제1 실험 재료에 대한 정보와 제2 실험 재료에 대한 정보를 포함)를 생성할 수 있다.In addition, a plurality of cards including specific information disposed (registered) on the UI 10 may be freely mixed according to a user's request. For example, the computing device 100 may request a combination of a first card including information on a first test material and a second card including information on a second test material (eg, selecting and selecting a first card). In response to obtaining an action of dragging and placing the second card on top of the second card, selecting and dragging the second card and placing it on the first card, etc.), combining the information included in the first card with the information included in the second card A new third card (eg, including information on the first experimental material and information on the second experimental material) may be created.

컴퓨팅 장치(100)는 UI(10) 상에 모든 정보가 배치(등록)되어 최종적으로 정형화된 연구 기록 데이터의 생성이 완료되는 경우, 요약 정보 제공 UI(17)를 통해 정형화된 연구 기록 데이터에 대한 요약 정보를 제공할 수 있다.When all information is placed (registered) on the UI 10 and generation of the finally standardized research record data is completed, the computing device 100 provides information about the standardized research record data through the summary information providing UI 17. Summary information can be provided.

이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.Although the embodiments of the present invention have been described with reference to the accompanying drawings, those skilled in the art to which the present invention pertains can be implemented in other specific forms without changing the technical spirit or essential features of the present invention. you will be able to understand Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive.

100 : 합성 물질 개발 프로세스 제공장치(또는 컴퓨팅 장치)
200 : 사용자 단말
300 : 외부 서버
400 : 네트워크
100: synthetic material development process providing device (or computing device)
200: user terminal
300: external server
400: Network

Claims (10)

컴퓨팅 장치에 의해 수행되는 방법에 있어서,
하나 이상의 조건을 획득하는 단계; 및
상기 획득된 하나 이상의 조건을 만족하는 합성 물질에 관한 정보를 추출하고, 상기 추출된 합성 물질에 관한 정보에 기초하여 상기 합성 물질을 합성하기 위한 가이드 정보를 추출하는 단계를 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법.
In a method performed by a computing device,
obtaining one or more conditions; and
Extracting information about a synthetic material that satisfies the obtained one or more conditions, and extracting guide information for synthesizing the synthetic material based on the extracted information about the synthetic material,
Method for providing synthetic material development process using artificial intelligence model.
제1항에 있어서,
상기 가이드 정보를 추출하는 단계는,
제1 인공지능 모델을 생성하는 단계;
복수의 합성 물질 각각의 구조 및 특성 정보를 포함하는 속성 정보, 상기 복수의 합성 물질 각각을 합성하기 위한 정보 - 상기 복수의 합성 물질 각각을 합성하기 위한 정보는 상기 복수의 합성 물질 각각을 합성하기 위한 재료, 장비 및 합성 방법에 관한 정보를 포함함 - 를 학습 데이터로 하여 상기 생성된 제1 인공지능 모델을 학습시키는 단계; 및
상기 획득된 하나 이상의 조건을 상기 학습된 제1 인공지능 모델의 입력 값으로 하여 상기 획득된 하나 이상의 조건을 만족하는 구조 및 특성을 가지는 합성 물질을 예측하고, 상기 예측된 합성 물질을 합성하기 위한 재료, 장비 및 합성 방법을 포함하는 결과 값을 추출하는 단계를 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법.
According to claim 1,
The step of extracting the guide information,
Generating a first artificial intelligence model;
Attribute information including structure and characteristic information of each of a plurality of synthetic materials, information for synthesizing each of the plurality of synthetic materials - information for synthesizing each of the plurality of synthetic materials is information for synthesizing each of the plurality of synthetic materials Learning the generated first artificial intelligence model using - as learning data; and
A material for predicting a synthetic material having a structure and characteristics satisfying the one or more acquired conditions by using the obtained one or more conditions as an input value of the learned first artificial intelligence model, and synthesizing the predicted synthetic material. , Including the step of extracting the result value including the equipment and synthesis method,
Method for providing synthetic material development process using artificial intelligence model.
제2항에 있어서,
상기 생성된 제1 인공지능 모델을 학습시키는 단계는,
사용자에게 상기 추출된 결과 값을 제공한 것에 대한 응답으로, 상기 사용자로부터 피드백 정보 - 상기 피드백 정보는 상기 예측된 합성 물질을 합성하기 위한 재료, 장비 및 합성 방법에 따라 생성된 합성 물질에 관한 정보를 포함함 - 를 입력받는 단계; 및
상기 입력된 피드백 정보를 학습 데이터로 하여 상기 학습된 제1 인공지능 모델을 재학습시키는 단계를 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법.
According to claim 2,
The step of learning the generated first artificial intelligence model,
In response to providing the extracted result value to the user, feedback information from the user - the feedback information is information about materials, equipment, and synthesized materials produced according to the synthesis method for synthesizing the predicted synthetic material. Including - Receiving an input; and
Re-learning the learned first artificial intelligence model using the input feedback information as learning data,
Method for providing synthetic material development process using artificial intelligence model.
제2항에 있어서,
상기 가이드 정보를 추출하는 단계는,
특정 재료, 장비 및 합성 방법을 상기 학습된 제1 인공지능 모델의 입력 값으로 하여 상기 특정 재료, 장비 및 합성 방법에 따라 합성될 것으로 예측되는 합성 물질에 관한 정보를 결과 값으로 추출하는 단계를 더 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법.
According to claim 2,
The step of extracting the guide information,
Extracting information on synthetic materials predicted to be synthesized according to the specific materials, equipment, and synthesis methods as input values of the learned first artificial intelligence model as a result value of specific materials, equipment, and synthesis methods. including,
Method for providing synthetic material development process using artificial intelligence model.
제2항에 있어서,
상기 생성된 제1 인공지능 모델을 학습시키는 단계는,
복수의 합성 방법에 따른 수율을 학습 데이터로 하여 상기 학습된 제1 인공지능 모델을 학습시키는 단계를 포함하며,
상기 결과 값을 추출하는 단계는,
상기 예측된 합성 물질에 대한 스케일업(scale-up)을 수행하고자 하는 경우, 상기 복수의 합성 방법에 따른 수율을 학습 데이터로 하여 학습된 제1 인공지능 모델을 통해 상기 예측된 합성 물질을 합성하기 위한 합성 방법을 재추출하는 단계를 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법.
According to claim 2,
The step of learning the generated first artificial intelligence model,
Learning the learned first artificial intelligence model using yields according to a plurality of synthesis methods as learning data;
The step of extracting the result value is,
When scaling-up of the predicted synthetic material is to be performed, synthesizing the predicted synthetic material through a first artificial intelligence model learned using the yield according to the plurality of synthesis methods as learning data Including the step of re-extracting the synthesis method for
Method for providing synthetic material development process using artificial intelligence model.
제1항에 있어서,
상기 가이드 정보를 추출하는 단계는,
제2 인공지능 모델을 생성하는 단계;
복수의 합성 물질에 관한 정보 및 시험에 관한 정보 - 상기 시험에 관한 정보는 상기 복수의 합성 물질에 대한 전임상 시험 또는 임상 시험을 수행하기 위해 설정된 조건, 상기 설정된 조건에 따른 시험 결과를 포함함 - 를 학습 데이터로 하여 상기 생성된 제2 인공지능 모델을 학습시키는 단계; 및
상기 합성 물질에 관한 정보를 상기 학습된 제2 인공지능 모델의 입력 값으로 하여 상기 합성 물질의 시험을 위한 조건을 설정하는 단계를 포함하며,
상기 생성된 제2 인공지능 모델을 학습시키는 단계는,
상기 설정된 조건에 따라 상기 합성 물질에 대한 시험을 수행한 결과를 학습 데이터로 하여 상기 학습된 제2 인공지능 모델을 재학습시키는 단계를 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법.
According to claim 1,
The step of extracting the guide information,
Generating a second artificial intelligence model;
Information on a plurality of synthetic materials and information on tests - the information on tests includes conditions set for conducting preclinical tests or clinical tests on the plurality of synthetic materials, and test results under the set conditions - learning the generated second artificial intelligence model using learning data; and
Setting conditions for testing the synthetic material by using the information about the synthetic material as an input value of the learned second artificial intelligence model,
The step of learning the generated second artificial intelligence model,
Re-learning the learned second artificial intelligence model using the results of testing the synthetic material according to the set conditions as learning data,
Method for providing synthetic material development process using artificial intelligence model.
제6항에 있어서,
상기 가이드 정보를 추출하는 단계는,
상기 합성 물질의 시험에 대한 특정 조건을 상기 학습된 제2 인공지능 모델의 입력 값으로 하여 상기 합성 물질의 시험 결과 예측 값을 결과 값으로 추출하는 단계를 더 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법.
According to claim 6,
The step of extracting the guide information,
Extracting a predicted value of the test result of the synthetic material as a result value by using a specific condition for the test of the synthetic material as an input value of the learned second artificial intelligence model,
Method for providing synthetic material development process using artificial intelligence model.
제1항에 있어서,
상기 가이드 정보를 추출하는 단계는,
제3 인공지능 모델을 생성하는 단계;
복수의 시험대상에 관한 정보, 신물질로 개발된 복수의 합성 물질에 관한 정보 및 상기 신물질로 개발된 복수의 합성 물질 각각의 시험 결과를 학습 데이터로 하여 상기 생성된 제3 인공지능 모델을 학습시키는 단계; 및
상기 합성 물질에 관한 정보를 상기 제3 인공지능 모델의 입력 값으로 하여 상기 합성 물질을 포함하는 신물질 개발 시 상기 합성 물질을 포함하는 신물질을 사용하기 적합한 대상 및 사용량에 관한 정보를 결과 값으로 추출하는 단계를 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법.
According to claim 1,
The step of extracting the guide information,
Generating a third artificial intelligence model;
Learning the generated third artificial intelligence model using information on a plurality of test subjects, information on a plurality of synthetic materials developed as new materials, and test results of each of the plurality of synthetic materials developed as new materials as learning data ; and
When developing a new material containing the synthetic material by using the information on the synthetic material as an input value of the third artificial intelligence model, the new material containing the synthetic material is suitable for use and information on the amount of use is extracted as a result value Including steps,
Method for providing synthetic material development process using artificial intelligence model.
프로세서;
네트워크 인터페이스;
메모리; 및
상기 메모리에 로드(load)되고, 상기 프로세서에 의해 실행되는 컴퓨터 프로그램을 포함하되,
상기 컴퓨터 프로그램은,
하나 이상의 조건을 획득하는 인스트럭션(instruction); 및
상기 획득된 하나 이상의 조건을 만족하는 합성 물질에 관한 정보를 추출하고, 상기 추출된 합성 물질에 관한 정보에 기초하여 상기 합성 물질을 합성하기 위한 가이드 정보를 추출하는 인스트럭션을 포함하는,
인공지능 모델을 이용한 합성 물질 개발 프로세스 제공장치.
processor;
network interface;
Memory; and
A computer program loaded into the memory and executed by the processor,
The computer program,
instructions that obtain one or more conditions; and
Including instructions for extracting information on a synthetic material that satisfies the obtained one or more conditions, and extracting guide information for synthesizing the synthetic material based on the extracted information on the synthetic material.
Device for providing synthetic material development process using artificial intelligence model.
컴퓨팅 장치와 결합되어,
하나 이상의 조건을 획득하는 단계; 및
상기 획득된 하나 이상의 조건을 만족하는 합성 물질에 관한 정보를 추출하고, 상기 추출된 합성 물질에 관한 정보에 기초하여 상기 합성 물질을 합성하기 위한 가이드 정보를 추출하는 단계를 포함하는 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법을 실행시키기 위하여 컴퓨터로 판독가능한 기록매체에 저장된,
컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터프로그램.
Combined with a computing device,
obtaining one or more conditions; and
Extracting information on a synthetic material that satisfies the obtained one or more conditions, and extracting guide information for synthesizing the synthetic material based on the extracted information on the synthetic material using an artificial intelligence model comprising the step of extracting Stored in a computer-readable recording medium to execute the synthetic material development process providing method,
A computer program recorded on a computer-readable recording medium.
KR1020230002727A 2020-11-20 2023-01-09 Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model KR20230010802A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR1020200157187 2020-11-20
KR20200157187 2020-11-20
KR1020210018208 2021-02-09
KR20210018208 2021-02-09
KR1020210161667A KR102491345B1 (en) 2020-11-20 2021-11-22 Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020210161667A Division KR102491345B1 (en) 2020-11-20 2021-11-22 Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model

Publications (1)

Publication Number Publication Date
KR20230010802A true KR20230010802A (en) 2023-01-19

Family

ID=81791014

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020210161667A KR102491345B1 (en) 2020-11-20 2021-11-22 Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model
KR1020210161668A KR102491346B1 (en) 2020-11-20 2021-11-22 Method, apparatus and computer program for generating formalized research record data automatically for learning artificial intelligence model
KR1020230002727A KR20230010802A (en) 2020-11-20 2023-01-09 Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model
KR1020230002728A KR20230010803A (en) 2020-11-20 2023-01-09 Method, apparatus and computer program for generating formalized research record data automatically for learning artificial intelligence model

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020210161667A KR102491345B1 (en) 2020-11-20 2021-11-22 Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model
KR1020210161668A KR102491346B1 (en) 2020-11-20 2021-11-22 Method, apparatus and computer program for generating formalized research record data automatically for learning artificial intelligence model

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020230002728A KR20230010803A (en) 2020-11-20 2023-01-09 Method, apparatus and computer program for generating formalized research record data automatically for learning artificial intelligence model

Country Status (1)

Country Link
KR (4) KR102491345B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240055290A (en) * 2022-10-20 2024-04-29 주식회사 아이팩토리 Document creating device, method, computer program, computer-readable recording medium, server and system having text auto-generating functionality using natural language generation model
WO2024085731A1 (en) * 2022-10-20 2024-04-25 주식회사 씨젠 Method of guiding multiple detailed performance experiments required for developing reagent for detecting target nucleic acid molecule, and organizing experiment result record sheets
KR102646547B1 (en) * 2023-11-01 2024-03-12 에프원테크시스템즈 주식회사 Methods of providing injection-related structured and unstructured data-based molds and injection condition analysis solutions using artificial intelligence models

Also Published As

Publication number Publication date
KR102491346B9 (en) 2024-03-13
KR20220069870A (en) 2022-05-27
KR102491345B1 (en) 2023-01-27
KR20220069871A (en) 2022-05-27
KR102491345B9 (en) 2024-03-15
KR20230010803A (en) 2023-01-19
KR102491346B1 (en) 2023-01-27

Similar Documents

Publication Publication Date Title
KR102491345B1 (en) Method, apparatus and computer program for providing synthetic material development process using artificial intelligence model
Saelens et al. A comparison of single-cell trajectory inference methods
Yang et al. Visually-enabled active deep learning for (geo) text and image classification: a review
Yu Three principles of data science: predictability, computability, and stability (PCS)
CN112270951A (en) Brand-new molecule generation method based on multitask capsule self-encoder neural network
Zeng et al. Relation construction for aspect-level sentiment classification
Sidak et al. Interpretable machine learning methods for predictions in systems biology from omics data
US11797281B2 (en) Multi-language source code search engine
Alymani et al. Graph machine learning classification using architectural 3D topological models
Sinha et al. A review on the recent applications of deep learning in predictive drug toxicological studies
Reddy Machine learning for drug discovery and manufacturing
Barbierato et al. The Challenges of Machine Learning: A Critical Review
US20220083907A1 (en) Data generation and annotation for machine learning
Xiao et al. Censoring-aware deep ordinal regression for survival prediction from pathological images
Luo et al. A Caps-UBI model for protein ubiquitination site prediction
KR20220114780A (en) Method for generating formalized research record data automatically by automated collection of experiment data
KR20220114779A (en) Method for artificial intelligence model learning using formalized research record data
EP4231305A1 (en) Method, apparatus, and computer program for automatically generating standardized research record data for training artificial intelligence model
US11972225B2 (en) Automated patent language generation
Lu et al. TrGPCR: GPCR-ligand Binding Affinity Predicting based on Dynamic Deep Transfer Learning
Moscato et al. Taughtnet: Learning multi-task biomedical named entity recognition from single-task teachers
KR102483916B1 (en) Method, apparatus and computer program for generating formalized research record data automatically for learning artificial intelligence
Nolde et al. Autoencoded deep features for semi-automatic, weakly supervised physiological signal labelling
CN116453702B (en) Data processing method, device, system and medium for autism behavior feature set
Green Applying Deep Learning Techniques to Assist Bioinformatics Researchers in Analysis Pipeline Composition

Legal Events

Date Code Title Description
A107 Divisional application of patent