KR102491346B1 - 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 - Google Patents
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 Download PDFInfo
- Publication number
- KR102491346B1 KR102491346B1 KR1020210161668A KR20210161668A KR102491346B1 KR 102491346 B1 KR102491346 B1 KR 102491346B1 KR 1020210161668 A KR1020210161668 A KR 1020210161668A KR 20210161668 A KR20210161668 A KR 20210161668A KR 102491346 B1 KR102491346 B1 KR 102491346B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- research
- research record
- experiment
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011160 research Methods 0.000 title claims abstract description 515
- 238000000034 method Methods 0.000 title claims abstract description 184
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 136
- 238000004590 computer program Methods 0.000 title claims abstract description 18
- 238000002474 experimental method Methods 0.000 claims abstract description 171
- 238000012545 processing Methods 0.000 claims abstract description 30
- 239000000463 material Substances 0.000 claims description 125
- 230000008569 process Effects 0.000 claims description 96
- 238000012360 testing method Methods 0.000 claims description 36
- 238000003058 natural language processing Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 3
- 229920002994 synthetic fiber Polymers 0.000 description 87
- 230000000875 corresponding effect Effects 0.000 description 37
- 230000002194 synthesizing effect Effects 0.000 description 21
- 239000002547 new drug Substances 0.000 description 20
- 238000010586 diagram Methods 0.000 description 19
- 238000011161 development Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 238000001308 synthesis method Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 10
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 9
- 238000004088 simulation Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 239000000203 mixture Substances 0.000 description 6
- 241000282326 Felis catus Species 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 238000009509 drug development Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000013341 scale-up Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229910052729 chemical element Inorganic materials 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S715/00—Data processing: presentation processing of document, operator interface processing, and screen saver display processing
- Y10S715/978—Audio interaction as part of an operator interface
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Analytical Chemistry (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
도 2는 본 발명의 다른 실시예에 따른 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 장치의 하드웨어 구성도이다.
도 3은 다양한 실시예에서, 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이다.
도 4는 다양한 실시예에서, 줄글 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이다.
도 5 내지 7은 다양한 실시예에서, 줄글 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.
도 8은 다양한 실시예에서, 키워드 입력을 통한 정형화된 연구 기록 데이터 자동생성 방법을 설명하기 위한 순서도이다.
도 9는 다양한 실시예에서, 키워드 입력을 통한 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.
도 10은 다양한 실시예에서, 음성 형태의 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터 자동생성 과정을 도시한 도면이다.
도 11은 다양한 실시예에서, 정형화된 연구 기록 데이터를 이용하여 줄글 형태의 연구 기록 정보를 생성하는 방법을 설명하기 위한 순서도이다.
도 12 내지 14는 다양한 실시예에서, 정형화된 연구 기록 데이터를 이용하여 줄글 형태의 연구 기록 정보를 생성하는 과정을 도시한 도면이다.
도 15는 다양한 실시예에서, 정형화된 연구 기록 데이터를 기반으로 시뮬레이션을 수행하는 방법을 설명하기 위한 순서도이다.
도 16은 다양한 실시예에서, 제1 인공지능 모델을 통해 합성 물질 및 합성 물질의 합성을 위한 가이드 정보를 추출하는 방법을 설명하기 위한 도면이다.
도 17은 다양한 실시예에서, 제2 인공지능 모델을 통해 합성 물질에 대한 시험 조건을 설정하는 방법을 설명하기 위한 도면이다.
도 18은 다양한 실시예에서, 제3 인공지능 모델을 통해, 신약 개발 시 신약에 적합한 환자와 투약량을 도출하는 방법을 설명하기 위한 도면이다.
도 19는 다양한 실시예에서, 정형화된 연구 기록 데이터 기반 비정형 데이터를 추천 제공하는 과정을 도시한 도면이다.
도 20은 다양한 실시예에서, 정형화된 연구 기록 데이터 기반 연구자를 추천 매칭하는 과정을 도시한 도면이다.
도 21 내지 24는 다양한 실시예에 적용 가능한 사용자 인터페이스의 형태를 예시적으로 도시한 도면이다.
200 : 사용자 단말
300 : 외부 서버
400 : 네트워크
Claims (13)
- 컴퓨팅 장치에 의해 수행되는 방법에 있어서,
실험에 관한 연구 기록 정보를 획득하는 단계;
기 저장된 실험과 관련된 데이터에 기초하여 상기 획득된 연구 기록 정보 - 상기 획득된 연구 기록 정보는 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과 키워드를 포함함 - 를 가공하는 단계; 및
상기 가공된 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터를 생성하는 단계를 포함하며,
상기 획득된 연구 기록 정보를 가공하는 단계는,
상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 이용하여 상기 실험 재료에 관한 키워드를 자동완성 함으로써 실험 재료 정보를 생성하고, 상기 생성된 실험 재료 정보와 상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 연동하는 단계;
상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 이용하여 연구 및 실험 과정에 관한 키워드를 자동완성 함으로써 연구 및 실험 과정 정보를 생성하고, 상기 생성된 연구 및 실험 과정 정보와 상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 연동하는 단계; 및
기 설정된 결과 데이터 양식에 기초하여 상기 연구 결과에 관한 키워드를 시각화하는 단계를 포함하고,
상기 획득된 연구 기록 정보를 가공하는 단계는,
사용자 인터페이스(User Interface, UI)를 통해 사용자로부터 하나 이상의 키워드 - 상기 하나 이상의 키워드는 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과에 관한 키워드 중 적어도 하나를 포함함 - 를 입력받는 경우, 상기 기 저장된 실험과 관련된 데이터에 기초하여 상기 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터를 선택하는 단계; 및
상기 선택된 실험과 관련된 데이터를 이용하여 상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 단계를 포함하며,
상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 단계는,
상기 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터가 복수 개인 경우, 사용자의 검색 이력에 기초하여 복수의 실험과 관련된 데이터 중 하나 이상의 실험과 관련된 데이터를 추천 데이터로서 상기 사용자에게 제공하는 단계; 및
상기 사용자로부터 상기 제공된 추천 데이터를 선택받는 경우, 상기 선택된 추천 데이터를 이용하여 상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 단계를 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법. - 제1항에 있어서,
상기 획득된 연구 기록 정보를 가공하는 단계는,
하나 이상의 텍스트 문장을 포함하는 줄글 형태의 연구 기록 정보가 획득된 경우, 상기 기 저장된 실험과 관련된 데이터에 기초하여 상기 획득된 줄글 형태의 연구 기록 정보에 포함된 복수의 단어 각각을 토큰화(Tokenization)하는 단계; 및
상기 토큰화된 복수의 단어 각각에 속성 정보를 레이블링(Labeling)하여 가공된 연구 기록 정보를 생성하는 단계를 포함하며,
상기 정형화된 연구 기록 데이터를 생성하는 단계는,
상기 가공된 연구 기록 정보를 이용하여 연구 기록 그래프를 생성하고, 상기 생성된 연구 기록 그래프를 이용하여 상기 정형화된 연구 기록 데이터를 생성하는 단계를 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법. - 제2항에 있어서,
상기 생성된 연구 기록 그래프를 이용하여 상기 정형화된 연구 기록 데이터를 생성하는 단계는,
상기 속성 정보가 레이블링된 복수의 단어를 기 학습된 제1 모델의 입력 데이터로 하여 연구 기록 그래프 - 상기 연구 기록 그래프는 상기 복수의 단어 각각에 대응되는 노드(node)와 상기 복수의 단어 각각을 연결하는 엣지(edge)를 포함함 - 를 생성하는 단계를 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법. - 삭제
- 삭제
- 제1항에 있어서,
상기 획득된 연구 기록 정보를 가공하는 단계는,
사용자 인터페이스(User Interface, UI)를 통해 사용자로부터 음성 형태의 연구 기록 정보를 입력받는 경우, 상기 입력받은 음성 형태의 연구 기록 정보를 자연어 처리(NLP)하여 텍스트 형태의 연구 기록 정보로 변환하는 단계;
상기 변환된 텍스트 형태의 연구 기록 정보를 분석하여 하나 이상의 키워드 - 상기 하나 이상의 키워드는 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과에 관한 키워드 중 적어도 하나를 포함함 - 를 추출하는 단계; 및
상기 기 저장된 실험과 관련된 데이터에 기초하여 상기 추출된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터를 선택하고, 상기 선택된 실험과 관련된 데이터를 이용하여 상기 추출된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 단계를 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법. - 제1항에 있어서,
상기 연구 기록 정보를 획득하는 단계는,
연구 및 실험에 사용되는 복수의 장비 각각에 구비되는 센서로부터 장비 사용 정보를 획득하는 단계; 및
연구 및 실험에 사용되는 복수의 재료 각각에 구비되는 센서로부터 재료 사용 정보를 획득하는 단계를 포함하며,
상기 획득된 연구 기록 정보를 가공하는 단계는,
상기 획득된 장비 사용 정보 및 상기 획득된 재료 사용 정보를 이용하여 가공된 연구 기록 정보를 생성하는 단계를 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법. - 삭제
- 제1항에 있어서,
상기 정형화된 연구 기록 데이터에 대응되는 연구 기록 그래프를 기 학습된 제2 모델의 입력 데이터로 하여 하나 이상의 텍스트 문장을 포함하는 줄글 형태의 연구 기록 정보를 생성하는 단계를 더 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법. - 제9항에 있어서,
상기 하나 이상의 텍스트 문장을 포함하는 줄글 형태의 연구 기록 정보를 생성하는 단계는,
제1 사용자로부터 제1 정형화된 연구 기록 데이터에 대한 텍스트 변환을 요청받는 경우, 상기 제1 정형화된 연구 기록 데이터를 그래프화 하여 제1 연구 기록 그래프를 생성하는 단계;
상기 생성된 제1 연구 기록 그래프를 이용하여 제1 줄글 형태의 연구 기록 정보를 생성하고, 상기 생성된 제1 줄글 형태의 연구 기록 정보를 상기 제1 사용자에게 제공하는 단계; 및
상기 제1 사용자로부터 상기 제공된 제1 줄글 형태의 연구 기록 정보의 적어도 일부분이 수정되는 경우, 상기 적어도 일부분이 수정된 제1 줄글 형태의 연구 기록 정보와 상기 제1 연구 기록 그래프를 학습 데이터로 하여 상기 기 학습된 제2 모델을 재학습시키는 단계를 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법. - 제1항에 있어서,
상기 정형화된 연구 기록 데이터를 생성하는 단계는,
제1 정형화된 연구 기록 데이터를 이용하여 제1 연구 기록 그래프를 생성하고, 상기 생성된 제1 연구 기록 그래프를 이용하여 상기 제1 정형화된 연구 기록 데이터에 포함된 실험 재료, 실험 장비 및 실험 과정에 따라 실험을 시뮬레이션하는 단계; 및
상기 실험을 시뮬레이션한 결과와 상기 제1 정형화된 연구 기록 데이터를 매칭하여 저장하는 단계를 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법. - 프로세서;
네트워크 인터페이스;
메모리; 및
상기 메모리에 로드(load)되고, 상기 프로세서에 의해 실행되는 컴퓨터 프로그램을 포함하되,
상기 컴퓨터 프로그램은,
실험에 관한 연구 기록 정보를 획득하는 인스트럭션(instruction);
기 저장된 실험과 관련된 데이터에 기초하여 상기 획득된 연구 기록 정보 - 상기 획득된 연구 기록 정보는 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과 키워드를 포함함 - 를 가공하는 인스트럭션; 및
상기 가공된 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터를 생성하는 인스트럭션을 포함하며,
상기 획득된 연구 기록 정보를 가공하는 인스트럭션은,
상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 이용하여 상기 실험 재료에 관한 키워드를 자동완성 함으로써 실험 재료 정보를 생성하고, 상기 생성된 실험 재료 정보와 상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 연동하는 인스트럭션;
상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 이용하여 연구 및 실험 과정에 관한 키워드를 자동완성 함으로써 연구 및 실험 과정 정보를 생성하고, 상기 생성된 연구 및 실험 과정 정보와 상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 연동하는 인스트럭션; 및
기 설정된 결과 데이터 양식에 기초하여 상기 연구 결과에 관한 키워드를 시각화하는 인스트럭션을 포함하고,
상기 획득된 연구 기록 정보를 가공하는 인스트럭션은,
사용자 인터페이스(User Interface, UI)를 통해 사용자로부터 하나 이상의 키워드 - 상기 하나 이상의 키워드는 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과에 관한 키워드 중 적어도 하나를 포함함 - 를 입력받는 경우, 상기 기 저장된 실험과 관련된 데이터에 기초하여 상기 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터를 선택하는 인스트럭션; 및
상기 선택된 실험과 관련된 데이터를 이용하여 상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 인스트럭션을 포함하며,
상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 인스트럭션은,
상기 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터가 복수 개인 경우, 사용자의 검색 이력에 기초하여 복수의 실험과 관련된 데이터 중 하나 이상의 실험과 관련된 데이터를 추천 데이터로서 상기 사용자에게 제공하는 인스트럭션; 및
상기 사용자로부터 상기 제공된 추천 데이터를 선택받는 경우, 상기 선택된 추천 데이터를 이용하여 상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 인스트럭션을 포함하는,
인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 장치. - 컴퓨팅 장치와 결합되어,
실험에 관한 연구 기록 정보를 획득하는 단계;
기 저장된 실험과 관련된 데이터에 기초하여 상기 획득된 연구 기록 정보 - 상기 획득된 연구 기록 정보는 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과 키워드를 포함함 - 를 가공하는 단계; 및
상기 가공된 연구 기록 정보를 이용하여 정형화된 연구 기록 데이터를 생성하는 단계를 포함하며,
상기 획득된 연구 기록 정보를 가공하는 단계는,
상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 이용하여 상기 실험 재료에 관한 키워드를 자동완성 함으로써 실험 재료 정보를 생성하고, 상기 생성된 실험 재료 정보와 상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 연동하는 단계;
상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 이용하여 연구 및 실험 과정에 관한 키워드를 자동완성 함으로써 연구 및 실험 과정 정보를 생성하고, 상기 생성된 연구 및 실험 과정 정보와 상기 기 저장된 실험과 관련된 데이터에 포함된 실험 재료에 관한 데이터를 연동하는 단계; 및
기 설정된 결과 데이터 양식에 기초하여 상기 연구 결과에 관한 키워드를 시각화하는 단계를 포함하고,
상기 획득된 연구 기록 정보를 가공하는 단계는,
사용자 인터페이스(User Interface, UI)를 통해 사용자로부터 하나 이상의 키워드 - 상기 하나 이상의 키워드는 실험 재료에 관한 키워드, 연구 및 실험 과정에 관한 키워드 및 연구 결과에 관한 키워드 중 적어도 하나를 포함함 - 를 입력받는 경우, 상기 기 저장된 실험과 관련된 데이터에 기초하여 상기 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터를 선택하는 단계; 및
상기 선택된 실험과 관련된 데이터를 이용하여 상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 단계를 포함하며,
상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 단계는,
상기 입력된 하나 이상의 키워드에 대응되는 실험과 관련된 데이터가 복수 개인 경우, 사용자의 검색 이력에 기초하여 복수의 실험과 관련된 데이터 중 하나 이상의 실험과 관련된 데이터를 추천 데이터로서 상기 사용자에게 제공하는 단계; 및
상기 사용자로부터 상기 제공된 추천 데이터를 선택받는 경우, 상기 선택된 추천 데이터를 이용하여 상기 입력된 하나 이상의 키워드에 대응되는 연구 기록 정보를 자동완성 하는 단계를 포함하는 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법을 실행시키기 위하여 컴퓨터로 판독가능한 기록매체에 저장된, 컴퓨터프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230002728A KR20230010803A (ko) | 2020-11-20 | 2023-01-09 | 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20200157187 | 2020-11-20 | ||
KR1020200157187 | 2020-11-20 | ||
KR20210018208 | 2021-02-09 | ||
KR1020210018208 | 2021-02-09 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230002728A Division KR20230010803A (ko) | 2020-11-20 | 2023-01-09 | 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 |
Publications (3)
Publication Number | Publication Date |
---|---|
KR20220069871A KR20220069871A (ko) | 2022-05-27 |
KR102491346B1 true KR102491346B1 (ko) | 2023-01-27 |
KR102491346B9 KR102491346B9 (ko) | 2024-03-13 |
Family
ID=81791014
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210161668A Active KR102491346B1 (ko) | 2020-11-20 | 2021-11-22 | 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 |
KR1020210161667A Active KR102491345B1 (ko) | 2020-11-20 | 2021-11-22 | 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법, 장치 및 컴퓨터프로그램 |
KR1020230002728A Pending KR20230010803A (ko) | 2020-11-20 | 2023-01-09 | 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 |
KR1020230002727A Pending KR20230010802A (ko) | 2020-11-20 | 2023-01-09 | 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법, 장치 및 컴퓨터프로그램 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210161667A Active KR102491345B1 (ko) | 2020-11-20 | 2021-11-22 | 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법, 장치 및 컴퓨터프로그램 |
KR1020230002728A Pending KR20230010803A (ko) | 2020-11-20 | 2023-01-09 | 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 |
KR1020230002727A Pending KR20230010802A (ko) | 2020-11-20 | 2023-01-09 | 인공지능 모델을 이용한 합성 물질 개발 프로세스 제공방법, 장치 및 컴퓨터프로그램 |
Country Status (1)
Country | Link |
---|---|
KR (4) | KR102491346B1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240107646A1 (en) * | 2021-01-28 | 2024-03-28 | Signify Holding B.V. | A controller for unlearning a learnt preference for a lighting system and a method thereof |
CN115166154B (zh) * | 2022-07-20 | 2024-10-18 | 广州蓝勃生物科技有限公司 | 试剂开发实验方法、装置、计算机设备和存储介质 |
CN115166153B (zh) * | 2022-07-20 | 2024-10-15 | 广州蓝勃生物科技有限公司 | 试剂开发的实验方法、装置、计算机设备和存储介质 |
KR20240055290A (ko) * | 2022-10-20 | 2024-04-29 | 주식회사 아이팩토리 | 자연어 생성 모델을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 |
IL320357A (en) * | 2022-10-20 | 2025-06-01 | Seegene Inc | A method for guiding the performance of multiple detailed experiments required for the development of a reagent for the detection of a nucleic acid target molecule, and the organization of experimental results on record sheets. |
KR102757793B1 (ko) * | 2023-09-04 | 2025-01-21 | 쿠팡 주식회사 | 개인 정보의 탈개인화를 통한 토큰화와 토큰화된 개인 정보의 요청 및 인가를 위한 방법 및 그 시스템 |
KR102646547B1 (ko) * | 2023-11-01 | 2024-03-12 | 에프원테크시스템즈 주식회사 | 인공지능 모델을 활용한 사출 관련 정형 및 비정형 데이터 기반 금형 및 사출 상태 분석 솔루션 제공 방법 |
-
2021
- 2021-11-22 KR KR1020210161668A patent/KR102491346B1/ko active Active
- 2021-11-22 KR KR1020210161667A patent/KR102491345B1/ko active Active
-
2023
- 2023-01-09 KR KR1020230002728A patent/KR20230010803A/ko active Pending
- 2023-01-09 KR KR1020230002727A patent/KR20230010802A/ko active Pending
Non-Patent Citations (5)
Title |
---|
E. Soedarmadji et al., Tracking materials science data lineage to manage millions of materials experments and analyses, Npj Comput. Mater. Vol.5, 79(2019) |
J. Li et al., AI Applications through the Whole Life Cycle of Material Discovery, Matter Vol.3, pp393-432(2020.08.05.) |
L. Yao et al., Graph Convolutional Networks for Text Classification, arXiv:1809.05679v3(2018) |
R. D. King et al., On the formalization and reuse of scientific research, J. R. Soc. Interface Vol.8, pp1440-1448(2011) |
Y. Roh et al., A Survey on Data Collection for Machine Learning, arXiv:1811.030402v2(2019) |
Also Published As
Publication number | Publication date |
---|---|
KR20220069871A (ko) | 2022-05-27 |
KR102491345B1 (ko) | 2023-01-27 |
KR20220069870A (ko) | 2022-05-27 |
KR102491346B9 (ko) | 2024-03-13 |
KR102491345B9 (ko) | 2024-03-15 |
KR20230010803A (ko) | 2023-01-19 |
KR20230010802A (ko) | 2023-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102491346B1 (ko) | 인공지능 모델의 학습을 위한 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 | |
US12008341B2 (en) | Systems and methods for generating natural language using language models trained on computer code | |
Oldenhof et al. | ChemGrapher: optical graph recognition of chemical compounds by deep learning | |
Yang et al. | Visually-enabled active deep learning for (geo) text and image classification: a review | |
Chen et al. | Applying interpretable machine learning in computational biology—pitfalls, recommendations and opportunities for new developments | |
Morris et al. | Predicting binding from screening assays with transformer network embeddings | |
Sinha et al. | A review on the recent applications of deep learning in predictive drug toxicological studies | |
US20240152707A1 (en) | Automated Patent Language Generation | |
Fantozzi et al. | The explainability of transformers: Current status and directions | |
Li et al. | Open challenges and opportunities in federated foundation models towards biomedical healthcare | |
KR20250006768A (ko) | 정형화된 연구 기록 데이터 기반의 실험을 위한 무인 자동 연구실 동작 제어 방법, 장치 및 컴퓨터프로그램 | |
Moscato et al. | Taughtnet: Learning multi-task biomedical named entity recognition from single-task teachers | |
Wiens et al. | A tutorial and use case example of the eXtreme gradient boosting (XGBoost) artificial intelligence algorithm for drug development applications | |
Choi et al. | CELLama: foundation model for single cell and spatial transcriptomics by cell embedding leveraging language model abilities | |
JP7521855B2 (ja) | 人工知能モデルの学習のための定型化された研究記録データ自動生成方法、装置およびコンピュータプログラム | |
KR20250055638A (ko) | 자연어 처리 기술을 이용한 연구노트의 자동 텍스트 변환 방법, 장치 및 프로그램 | |
KR20250055045A (ko) | 연구노트의 자동 텍스트 변환을 위한 인공지능 모델 학습 방법, 장치 및 프로그램 | |
KR20220114780A (ko) | 실험 데이터 자동 수집을 통한 정형화된 연구 기록 데이터 자동생성 방법 | |
KR20250055639A (ko) | 바이오 및 나노 분야에 특화된 정형화된 연구 기록 데이터 자동생성 방법, 장치 및 컴퓨터프로그램 | |
KR20220114779A (ko) | 정형화된 연구 기록 데이터를 이용한 인공지능 모델의 학습 방법 | |
KR20250055046A (ko) | 연구노트의 자동 텍스트 변환을 위한 인공지능 모델의 피드백 기반 재학습 방법, 장치 및 프로그램 | |
CN117012321A (zh) | 对象匹配方法、装置、设备、存储介质及程序产品 | |
Cao et al. | HiRXN: Hierarchical Attention-Based Representation Learning for Chemical Reaction | |
Green | Applying Deep Learning Techniques to Assist Bioinformatics Researchers in Analysis Pipeline Composition | |
Nolde et al. | Autoencoded deep features for semi-automatic, weakly supervised physiological signal labelling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20211122 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
PA0302 | Request for accelerated examination |
Patent event date: 20221103 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20211122 Patent event code: PA03021R01I Comment text: Patent Application |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230106 |
|
A107 | Divisional application of patent | ||
PA0107 | Divisional application |
Comment text: Divisional Application of Patent Patent event date: 20230109 Patent event code: PA01071R01D |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230118 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20230118 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
G170 | Re-publication after modification of scope of protection [patent] | ||
PG1701 | Publication of correction |
Patent event code: PG17011E01I Patent event date: 20240308 Comment text: Request for Publication of Correction Publication date: 20240313 |