KR20200106397A - 인공지능을 이용하여 증례기록지(crf)에 저장할 기록 양식 전산화 - Google Patents

인공지능을 이용하여 증례기록지(crf)에 저장할 기록 양식 전산화 Download PDF

Info

Publication number
KR20200106397A
KR20200106397A KR1020190024898A KR20190024898A KR20200106397A KR 20200106397 A KR20200106397 A KR 20200106397A KR 1020190024898 A KR1020190024898 A KR 1020190024898A KR 20190024898 A KR20190024898 A KR 20190024898A KR 20200106397 A KR20200106397 A KR 20200106397A
Authority
KR
South Korea
Prior art keywords
content
artificial intelligence
case
data
database
Prior art date
Application number
KR1020190024898A
Other languages
English (en)
Inventor
김봉규
Original Assignee
주식회사 헤링스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 헤링스 filed Critical 주식회사 헤링스
Priority to KR1020190024898A priority Critical patent/KR20200106397A/ko
Publication of KR20200106397A publication Critical patent/KR20200106397A/ko

Links

Images

Classifications

    • G06K9/00456
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

본 발명은 인공지능을 이용하여 인공지능을 이용하여 증례기록지(CRF)에 저장할 기록 양식 전산화함으로써 임상시험 준비를 신속하고 저렴하게 한다.

Description

인공지능을 이용하여 증례기록지(CRF)에 저장할 기록 양식 전산화 {Automatic eCRF generation from pCRF using AItechnology}
본 발명은 임상시험에 사용되는 증례기록지를 인공지능을 이용하여 증례기록지에 입력해야할 데이터의 내용과 형태를 자동으로 인식하고 이를 데이터베이스에 저장할 수 있는 형태로 만들고 웹 기반의 프로그램을 자동 생성하는 기술이다.
증례기록지는 임상연구에 필요한 데이터의 형태를 워드, PDF를 사용하여 만든 테본 발명은 임상시험에 사용되는 증례기록지를 인공지능을 이용하여 증례기록지에 입력해야할 데이터의 내용과 형태를 자동으로 인식하고 이를 데이터베이스에 저장할 수 있는 형태로 만들고 웹 기반의 프로그램을 자동 생성하는 기술이다.이터 취합용 표이다. 따라서 증례기록지는 임상시험마다 모두 다른 형태를 가진다. 증례기록지가 만들어지면 이를 병원의 IRB의 승인을 득한 다음, 데이터 취합을 위해 대부분의 경우 같은 모향의 웹 기반의 프로그램을 만들고 필요한 데이터를 수집하고 있다. 본 발명은 증례기록지에 있는 표를 인공지능의 여러가지 기술을 이용하여 파일이나 이미지 형태로 증례기록지를 읽어서 이를 자동으로 데이터 베이스에 저장할 수 있는 형태로 만들어 주는 것이다. 이것을 가능하게 하기 위한 기술로 OCR 기술, 자연어처리(NLP) 기술, 강화학습 기술 등 다양한 인공지능 기술이 필요하다. 또한 인공지능으로 만들어진 여러가지 메타 정보를 데이터베이스에 저장할 수 있는 DB 기술도 이용된다. 또한 인공지능을 통해 웹기반의 프로그램으로 저장할 수 있다.
앞서 언급했듯이 증례기록지는 임상연구에 반드시 필요한 것으로 임상시험에 별 서로 다른 형태로 만들어진다. 현재는 증례기록지와 같은 모양으로 데이터를 저장하기 위해 웹 기반의 프로그램을 이용하여 임상시험마다 전자 증례기록지(eCRF)를 만들고 있으며 이를 만들기 위해 약 1 ~ 2개월이 시간과 프로그램 개발인력이 필요하다. 본 발명은 인공지능을 이용하여 증례기록지에 필요한 데이터의 형태를 자동으로 인식하고 이를 데이터베이스화 하여 전자 증례기록지(eCRF)를 쉽고 빠르게 만들어 줌으로써 임상시험 준비 기간을 줄이고 이를 통해 보다 저렴하고 효율적인 임상시험을 할 수 있도록 하는 것이다.
종이 형태로 만들어진 증례기록지를 스캔을 통해 이미지화 한다. 이미지화 된 증례기록지에서 인공지능의 OCR 기술을 이용하여 글자, 표, 이미지 등의 증례기록지 내의 콘텐츠별로 그 형태를 구분하고 그 위치를 각각 저장한다. ORC로 인식된 표의 형태는 형태소 분석을 통해 그 패턴이 임베딩되며 이는 학습을 통해 그 정확도를 높여 나간다. 글자로 인식된 부분은 자연어처리(NLP) 기반의 인공지능 기술을 이용하여 그 내용을 인식하게 된다. 다음 단계로, 인공지능을 통해 각 콘텐츠의 위치, 표의 임베딩 정보와 자연어 처리된 글자의 내용을 종합하여 증례기록지 표에 입력해야 할 정보를 유추하게 되며 이를 데이터베이스의 데이블 형태로 저장한다. 마지막으로 각 컨탠츠와 생성된 데이터베이스를 토대로 전자 증례기록지 입력을 위한 웹 프로그램을 생성한다.
상기한 바와 같이 본 발명은 종이 증례기록지를 전자 증례기록지로 자동으로 전환하여 주기 때문에 임상시험 준비에 필요한 시간과 비용을 절감할 수 있다. 현재 국내 바이오 산업이 급속도로 발전하고 있으며 관련하여 임상시험의 숫자도 증가하고 있다. 증례기록지를 통한 임상 테이터 수집은 제약회사가 임상시험을 하면 반드시 해야하는 일로써 관련 비즈니스가 지속적으로 커지고 있다. 많은 소프트웨어 업체들이 종이 증례기록지와 동일한 형태로 전자 증례지록지를 만들수 있는 소프트웨어 제공을 하고 있으며 또한 임상시험 데이터를 저장할 수 있는 서비스도 제공하고 있다. 본 발명은 현재 서비스중인 소프트웨어의 혁신을 가져올 수 있어 협업의 형태로 서비스를 제공할 수 있으며 단독으로도 판매할 수 있다. 또한 임상시험의 스폰서인 제약회사에 임상시험 비용 절감요소가 있으므로 상업적인 성공도 가능하다.
도1 Form Perception Processing은 스캔된 종이 증례기록지내의 다양한 콘텐츠 형태를 표시한 것으로 OCR 기술을 이용하여 스캔된 문서에서 다양한 종류의 콘텐츠를 식별하고 식별된 콘텐츠의 각각의 크기와 위치를 저장하여 웹 기반 문서 생성의 인풋데이터로 사용한다.
도2는 증례기록지에서 글자로 인식된 콘텐츠를 자연어 기반의 인공지능을 이용하여 처리하는 과정을 도식화하였다.
도3은 인공지능을 통해 여러 콘텐츠의 내용을 종합하여 증례기록지에 입력해야 할 데이터의 타입과 포맷 생성 예시를 기술한 것이다. 웹 기반의 전자 증례지록지에 데이터를 입력하면 도3에 예시한 바와 같은 형태로 만들어진 데이터베이스에 데이터가 저장된다.
기존에 사용중인 증례기록지를 모아서 형태에 대한 학습을 진행한다. 관련하여 연구단체와 병원과 협력 계약을 체결하여 진행하고 있다. 증례기록지의 OCR로 인식한 것이 정확한지 여부를 강화 학습을 통해 정확도를 높여나간다. 임상시험에 사용되는 용어는 일반인이 사용하는 자연어와 다르기 때문에 일반 자연어 임베딩과는 별도로 학습을 통해 의학용어 임베딩을 생성한다. 다양한 케이스의 증례기록지를 인식하여 예상하지 못한 폼에 대해서도 대응할 수 있도록 학습능력을 강화한다.

Claims (2)

  1. 인공지능의 OCR 기술을 이용하여 스캔된 종이 증례기록지에서 이미지, 표, 텍스트 형태의 컨텐츠를 식별하고 식별된 콘텐츠의 각각의 크기와 위치를 저장
  2. 인공지능을 활용하여 스캔된 종이 증례기록지의 각 콘텐츠와 자연어처리(NLP) 기반으로 텍스트 내용을 인식하여 저장해야 할 데이터의 내용을 인식하고 그 내용을 데이터베이스화
KR1020190024898A 2019-03-04 2019-03-04 인공지능을 이용하여 증례기록지(crf)에 저장할 기록 양식 전산화 KR20200106397A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190024898A KR20200106397A (ko) 2019-03-04 2019-03-04 인공지능을 이용하여 증례기록지(crf)에 저장할 기록 양식 전산화

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190024898A KR20200106397A (ko) 2019-03-04 2019-03-04 인공지능을 이용하여 증례기록지(crf)에 저장할 기록 양식 전산화

Publications (1)

Publication Number Publication Date
KR20200106397A true KR20200106397A (ko) 2020-09-14

Family

ID=72471433

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190024898A KR20200106397A (ko) 2019-03-04 2019-03-04 인공지능을 이용하여 증례기록지(crf)에 저장할 기록 양식 전산화

Country Status (1)

Country Link
KR (1) KR20200106397A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023212278A1 (en) * 2022-04-28 2023-11-02 R.P. Scherer Technologies, Llc Data analysis and reporting systems and methods

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023212278A1 (en) * 2022-04-28 2023-11-02 R.P. Scherer Technologies, Llc Data analysis and reporting systems and methods

Similar Documents

Publication Publication Date Title
US9465920B2 (en) Providing assistance with reporting
Bellary et al. Basics of case report form designing in clinical research
Friedman et al. Representing information in patient reports using natural language processing and the extensible markup language
CA2381251C (en) System and method for language extraction and encoding
US7936925B2 (en) Paper interface to an electronic record system
US20080077443A1 (en) Medical record coding and audit system
CN110688421B (zh) 一种智能化的可定制的数据治理和分析方法
Groom et al. Improved standardization of transcribed digital specimen data
CN113421657B (zh) 临床实践指南的知识表示模型的构建方法及装置
KR20200106397A (ko) 인공지능을 이용하여 증례기록지(crf)에 저장할 기록 양식 전산화
Wallace Metadata and the archival management of electronic records: a review
JP2009252023A (ja) 診断書作成支援装置及びプログラム
McRae et al. ArtMARC Sourcebook: Cataloging Art, Architecture, and Their Visual Images.
Geldenhuys The language of forms: A discourse analysis of municipal application forms.
Lafia et al. Digitizing and parsing semi-structured historical administrative documents from the GI Bill mortgage guarantee program
JP2017151627A (ja) 帳票データ化システム、帳票データ化装置、帳票データ化方法および帳票データ化装置の制御プログラム
Sojka Digitization Workflow in the Czech Digital Mathematics Library
KR20160136898A (ko) 클라우드기반 창작 저작물 등록시스템
Lampič et al. An Analysis on the Application of the UNCITRAL Model Law on Electronic Transferable Records on Contract Automation and Metadata
Fernando Intelligent Document Processing: A Guide For Building RPA Solutions
Sojka et al. From Pixels and Minds to the Mathematical Knowledge in a Digital Library
JP4538245B2 (ja) データベースの作成システム及びデータベースの作成方法
EP1936516A1 (en) Method to directly and automatically load data from documents and/or extract data to documents
KR20230068654A (ko) 전자문서 데이터 추출 시스템 및 방법
Reynaert et al. Beyond SoNaR: towards the facilitation of large corpus building efforts

Legal Events

Date Code Title Description
E601 Decision to refuse application