KR20200023689A - 인공지능 기반의 약물유해반응 탐지 방법 및 그 시스템 - Google Patents

인공지능 기반의 약물유해반응 탐지 방법 및 그 시스템 Download PDF

Info

Publication number
KR20200023689A
KR20200023689A KR1020180096836A KR20180096836A KR20200023689A KR 20200023689 A KR20200023689 A KR 20200023689A KR 1020180096836 A KR1020180096836 A KR 1020180096836A KR 20180096836 A KR20180096836 A KR 20180096836A KR 20200023689 A KR20200023689 A KR 20200023689A
Authority
KR
South Korea
Prior art keywords
drug
artificial intelligence
reference data
reaction
feature extraction
Prior art date
Application number
KR1020180096836A
Other languages
English (en)
Inventor
윤덕용
Original Assignee
아주대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아주대학교산학협력단 filed Critical 아주대학교산학협력단
Priority to KR1020180096836A priority Critical patent/KR20200023689A/ko
Publication of KR20200023689A publication Critical patent/KR20200023689A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법은 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 약물 부작용 레퍼런스 데이터 세트 생성부가 전자 건강 기록(Electronic Health Record, EHR) 정보와 약물 부작용(Adverse Drug Reaction, ADR) 정보를 이용하여 약물 부작용 레퍼런스 데이터 세트를 생성하는 단계; 상기 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 특징 추출부가 상기 생성된 약물 부작용 레퍼런스 데이터 세트로부터 특정 약물에 대한 약물유해반응을 판별할 수 있는 복수의 특징들을 추출하는 단계; 상기 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 인공지능 모델 구축부가 상기 추출된 복수의 특징들을 표준화하는 단계; 및 상기 인공지능 모델 구축부가 상기 표준화된 복수의 특징들을 기초로 하여 인공지능 모델을 구축하는 단계를 포함할 수 있다.

Description

인공지능 기반의 약물유해반응 탐지 방법 및 그 시스템 {The method of artificial intelligence(AI)-based adverse drug reactions detection and the system thereof}
본 발명은 인공지능 기반의 약물유해반응 탐지 방법 및 시스템에 관한 것이다. 보다 자세하게는, 복수개의 통계 알고리즘을 통합하여 변수 범위를 넓힘으로써 정확성이 향상된 인공지능 모델을 생성하고, 그에 기반하여 약물유해반응을 탐지하는 방법 및 그 시스템에 관한 것이다.
최근 약물 안전성에 대한 관심이 증가하고 그 중요성이 강조되고 있는 가운데 식품의약품안정청, 약물의 처방 및 제조가 이루어지는 의료기관, 의약품을 생산하는 제약 회사 등에서 시판 후 약물유해반응을 조기에 발견하고 예방하기 위한 노력이 이루어지고 있다.
이를 위하여 여러 기관에서 약물 부작용 자료를 수집하고 해당 자료를 데이터베이스화하고 있다. 그러나 아직까지 어떤 약물에 대한 부작용에 대해 알려지지 않은 경우가 많으며, 의료데이터가 복잡해 짐에 따라 기존 접근방식으로 약물유해반응(Adverse Drug Reaction, ADR)을 판단하거나 예측하기가 어려워졌다. 또한, 약물 부작용에 관한 의료 데이터를 해석하는 개개인의 해석능력에 따라 결과에서 차이 나기도 한다.
이런 문제점들을 극복하여 빠르고 정확하게 약리 기전을 분석하고 최적화된 임상시험을 도출하기 위해 AI(Artificial Intelligence) 기술 기반 의료 빅데이터 분석 연구가 활발히 이루어지고 있다. AI 예측 모델의 성능은 데이터의 양 뿐만 아니라 질에 굉장히 의존적이며 정확한 정보로 모델을 학습시켜야 높은 정확도를 얻을 수 있다. 그러므로 적절한 변수들의 조합을 사용하여 학습시키는 과정이 필수적이다. 기존 약물유해반응 탐지 알고리즘들은 대부분 통계 과정에서 나온 유의확률(p-value) 및 오즈 비(odds ratio)등만을 기반으로 약물유해반응 여부를 판단하였고 이는 기대만큼 높은 정확도를 보여주지 못하였다.
본 발명이 해결하고자 하는 기술적 과제는 인공지능 기반의 약물유해반응 탐지 방법 및 시스템을 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법은 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 약물 부작용 레퍼런스 데이터 세트 생성부가 전자 건강 기록(Electronic Health Record, EHR) 정보와 약물 부작용(Adverse Drug Reaction, ADR) 정보를 이용하여 약물 부작용 레퍼런스 데이터 세트를 생성하는 단계; 상기 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 특징 추출부가 상기 생성된 약물 부작용 레퍼런스 데이터 세트로부터 특정 약물에 대한 약물유해반응을 판별할 수 있는 복수의 특징들을 추출하는 단계; 상기 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 인공지능 모델 구축부가 상기 추출된 복수의 특징들을 표준화하는 단계; 및 상기 인공지능 모델 구축부가 상기 표준화된 복수의 특징들을 기초로 하여 인공지능 모델을 구축하는 단계를 포함할 수 있다.
본 발명의 일 실시예에 따라 상기 복수의 특징들을 추출하는 단계는, 상기 약물 부작용 레퍼런스 데이터에 대한 최대 값 또는 최소 값을 비교하는 제1 특징 추출 알고리즘, 상기 약물 부작용 레퍼런스 데이터에 대한 극단적 이상 비율을 비교하는 제2 특징 추출 알고리즘 및 상기 약물 부작용 레퍼런스 데이터가 처방에 의한 결과인지 약물 부작용에 의한 결과인지를 분류할 수 있는 제3 특징 추출 알고리즘을 이용하여 수행할 수 있다.
본 발명의 일 실시예에 따라 인공지능 모델을 구축하는 단계는, L1 정규화된 로지스틱 회귀, 랜덤 포레스트(Random Forest), 서포트 벡터 머신(Support Vector Machine) 및 인공 신경망 중 어느 하나를 사용하여 인공지능 모델을 구축할 수 있다.
본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 시스템은 외부 데이터베이스 또는 내부 데이터베이스로부터 전자 건강 기록(Electronic Health Record, EHR) 정보를 획득하는 제1 획득부; 외부 데이터베이스 또는 내부 데이터베이스로부터 약물 부작용 정보를 획득하는 제2 획득부; 상기 제1 획득부로부터 획득한 전자 건강 기록 정보와 제2 획득부로부터 획득한 약물 부작용 정보를 약물의 이름에 대해 매핑하는 약물 부작용 레퍼런스 데이터 세트 생성부; 상기 생성된 약물 부작용 레퍼런스 데이터 세트로부터 특정 약물에 대한 약물유해반응을 판별할 수 있는 복수의 특징들을 추출하는 특징 추출부; 상기 추출된 복수의 특징들을 표준화하고 표준화된 복수의 특징들을 기초로 하여 인공지능 모델을 구축하는 인공지능 모델 구축부를 포함할 수 있다.
본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법 및 시스템을 이용하면 더 다양한 변수들을 인공지능 모델에 사용하기 때문에 종래 알고리즘보다 더 빠르고 정확하게 약물유해반응을 탐지할 수 있다.
보다 자세하게는, 기존의 약물 부작용 데이터베이스에서 알려지지 않은 약물 부작용을 탐지할 수 있는 장점이 있다.
따라서, 본 발명의 일 실시예에 따른 기반의 약물유해반응 탐지 방법 및 시스템을 통하여 약학 사고 예방뿐만 아니라, 미리 임상시험 결과와 부작용 프로파일을 예측할 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법의 개념도이다.
도 2는 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법의 순서도이다.
도 3은 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 시스템의 블록도이다.
도 4는 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법에 대한 실험결과를 나타낸다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법의 개념도이고, 도 2는 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법의 순서도이다.
도 1 및 도 2를 참조하면, 본 발명의 일 실시예는 약물 부작용 레퍼런스 데이터 세트 생성부(100)가 전자 건강 기록(Electronic Health Record, EHR) 정보(11)와 약물 부작용(Adverse Drug Reaction, ADR) 정보(12)를 이용하여 약물 부작용 레퍼런스 데이터 세트(ADR Reference Dataset, 13)를 생성할 수 있다(S210).
약물 부작용 레퍼런스 데이터 세트(ADR Reference Dataset, 13)가 생성되면, 특징 추출부(110)가 상기 생성된 약물 부작용 레퍼런스 데이터 세트(13)로부터 특정 약물에 대한 약물유해반응을 판별할 수 있는 복수의 특징들을 추출할 수 있다(S220).
인공지능 모델 구축부(120)는 상기 추출된 복수의 특징들을 표준화(S230)한 다음, 표준화된 복수의 특징들에 기초하여 인공지능 모델을 구축할 수 있다(S240).
본 발명의 일 실시예에 따른 전자 건강 기록(EHR) 정보는 1994년 6월 1일부터 2015 년 4 월 15 일까지 아주 대학교 병원에서 치료받은 475,417 명의 전체 입원 환자의 데이터에 관한 것으로, 환자에게 처방한 약물목록과 처방한 약물의 용량, 환자의 임상 검사 수치 등의 정보를 포함한다.
여기에 사용된 임상 데이터는 연구 목적으로 Observational Health Data Science and Informatics (OHDSI) 컨소시엄이 Observational Medical Outcomes Partnership (OMP) 공통 데이터 모델 (CDM)로 변환 한 것이다. 전자 건강 기록(EHR)이 저장된 데이터베이스에는 119,165,743 개의 약물 처방과 782,190 건의 입원 사례에 대한 34,573,581 개의 실험실 테스트 기록(53 개의 별개의 실험실 테스트)에 관한 정보를 포함한다. 데이터에 관한 관측 기간 (환자의 입원에서 퇴원까지)의 평균 및 표준 편차는 각각 8.6 일 및 16.1 일이다.
본 발명의 일 실시예에 따른 약물 부작용(ADR) 정보는 SIDER 4.1(Protect collaborative and the Side Effect Resouce)및 EU-SPC(European Union Adverse Drug Reactions from Summary of Product Characteristics) 데이터베이스를 사용한다. 다만, 상기 기술된 데이터베이스 종류에 한정되는 것은 아니며, 다른 종류의 데이터베이스를 더 포함할 수 있다.
SIDER 데이터 베이스는 FDA 승인된 약물과 그 밖에 시중에 판매되는 약물의 부작용을 포함하고, EU-SPC 데이터베이스는 EU에서 승인한 의약품의 제품특성 요약본(Summary of Product Characteristics, SPC)에 나열된 모든 ADR을 포함한다. 보다 구체적으로는, 총 918개의 약물, 3,154개의 부작용 종류, 64,498 개의 약물 - 부작용 쌍에 대한 데이터를 포함한다. 한편, SIDER 4.1 은 1,430개의 약물, 5,880개의 부작용 종류, 140, 064개의 약물-부작용 쌍에 대한 데이터를 포함한다.
레퍼런스 데이터베이스는 MedDRA사전에서 부작용(ADR) 이름을 사용하여 우선 순위 및 하위 수준 용어에 대한 엑세스를 제공한다.
약물 부작용(ADR) 레퍼런스 데이터세트 생성부(100)는, EHR의 약물 실험실 사건 분석을 위해 모든 ADR 용어 중에서 비정상적인 검사 결과와 관련된 용어만 선택한다. 그리고 EHR의 실험실 이상 사례의 대부분을 나타내는 “증가”, “감소”, “과장”, “hypo”, “연장된” 또는 “짧아진” 단어 중 하나를 포함하는 ADR을 필터링한다.
약물 부작용 (ADR) 데이터베이스에서 사용된 약물 용어는 각각 STITCH 화합물 ID와 상표가 붙은 이름이다. 따라서, 데이터베이스에 사용된 약물 용어에서 OMOP CDM의 약물에 대한 표준 용어인 RxNorm으로 매핑하여 특정 약물과 그 약물에 대한 ADR 쌍을 추출한다. LAERTES와 OMOP 표준 어휘집에 의해 구축된 매핑 테이블을 사용하여 주로 RxNorm 성분에 브랜드 약품 이름과 STITCH 화합물 ID를 매핑한다.
한편, 두 명의 임상의 전문가는 할당된 모든 RxNorm 개념을 검토하고 매핑 테이블을 통해 매핑 할 수 없는 용어를 수동으로 매핑하였다.
본 발명의 일 실시예에서 생성된 약물 부작용(ADR) 레퍼런스 데이터세트(13)는 ADR이 알려진 약물 823개와 ADR이 알려지지 않은 약물 924개가 사용되었다.
상술한 바와 같이 약물과 그 ADR 쌍으로 매핑된 약물 부작용(ADR) 레퍼런스 데이터세트(13)가 생성되면, 특징 추출부(110)가 약물유해반응을 판별할 수 있는 복수의 특징들을 추출한다(S220).
본 발명의 일 실시예는 CERT(Comparison of Extreme Laboratory Test Results) 알고리즘, CLEAR(Comparison of the Extreme Abnormality Ratio) 알고리즘, PACE(Prescription pattern Around Clinical Event) 알고리즘이 상기 특징 추출부에서 사용된다. 다만, 상술한 3개의 알고리즘에 한정되는 것은 아니며, 특징 추출부(110)는 각 알고리즘의 기능과 유사한 다른 종류의 알고리즘도 더 포함할 수 있다.
본 발명의 일 실시예에서 사용된 CERT 알고리즘은 약물 노출 전후의 실험실 검사 결과 중 최대값 또는 최소값(이하, 극한쌍으로 지칭함)을 비교하는 기능을 수행할 수 있다.
CERT 알고리즘에 따르면, 결과 및 치료 회피와 관련된 교란변수를 제거할 수 있다. 그러나, 입원 기간 동안 환자의 상태가 크게 변하기 때문에 시간에 대한 공변량을 조정할 수 없다.
CERT 알고리즘에 대한 상세한 설명은 다음과 같다.
약물 노출 전과 후에 대한 실험실 결과값 쌍에 대해 t-test 검정으로 비교한다. 그리고 약물 노출 전과 후에 대한 비정상적인 검사 결과 차이에 대한 동일한 극한쌍은 McNemar 검사로 비교한다.
t-test 와 McNemar 테스트의 결과가 유의미한 경우(p<0.05) 양성 신호로 간주한다.
본 발명의 일 실시예에 사용된 CLEAR 알고리즘은 약물 노출 환자와 약물이 노출되지 않은 대조군을 비교하여 극단적 이상 비율을 도출하는 것이다. 보다 구체적으로, 상기 CLEAR 알고리즘은 약물 노출군과 약물 비노출군의 검사 수치의 최대값 또는 최소값을 비교한다.
CLEAR 알고리즘은 CERT와는 달리, 시간 경과에 따른 치료법 선택 변화와 같이 시간에 따른 공변량을 조정할 수 있다. 즉, CEAR알고리즘은 공변량에 의한 환자 내 교란변수를 제거할 수 있다.
CLEAR 알고리즘의 경우, 각 약물과 비정상 검사 결과 사이의 연관성에 대한 교차비(Odds Ratio)와 95% 신뢰 구간은 CLEAR 알고리즘의 조건부 로지스틱 회귀 분석에 의해 평가되었으며, 하한이 1.0 이상인 신뢰구간은 양의 신호로 간주된다.
본 발명의 일 실시예에 따른 PACE 알고리즘은 이상 결과가 처방에 의한 결과인지 약물 부작용에 의한 결과인지를 분류할 수 있는 것으로, 처방 변경 지수(PCI)를 제공한다. PCI로 3가지 처방 패턴을 정의할 수 있다.
3가지 처방 패턴은 다음과 같다. 중단 패턴은 해당 약물의 사용이 감소된 것, 중재 패턴은 치료효과가 있기 때문에 약물의 사용 증가인 것, 유지 패턴은 이벤트와 독립적으로 약물을 계속 사용하는 것을 의미한다.
사건 발생 후 처방 건수의 1.5 배 감소 또는 증가를 컷오프 값으로 설정하고, 중단패턴은 PCI≤0.667 로 정의되며, PCI> 1.500은 개입 패턴으로 정의되고, 두 컷오프 사이의 PCI는 유지 패턴으로 분류된다.
각 약물에 대해 상술한 CERT 알고리즘을 통해서는 16개의 특징이 추출되고, CLEAR 알고리즘을 통해서는 21개의 특징이 추출되고 PACE 알고리즘을 통해서는 5개의 특징이 추출된다.
그리고 인공지능 모델 구축부(120)는 상기 추출된 복수의 특징들을 표준화한다(S230). 예컨대, 서로 다른 유형의 특징 값들의 서로 다른 스케일을 조정함으로써, 특징들을 표준화한다.
그 다음, 상기 표준화된 42개의 특징(CERT-16개, CLEAR-21개, PACE-5개)을 인공지능 모델의 입력으로 사용하여 인공지능 모델을 구축한다(S240).
인공지능 모델을 구축하기 위하여 본 발명은 L1 정규화된 로지스틱 회귀(L1 Regularized Logistic Regression), 랜덤 포레스트(Random Forest), 서포트 벡터 머신(Support Vector Machine) 및 인공 신경망(Neural Network)을 사용한다.
본 발명의 일 실시예에 따라 서로 다른 복수의 특징들을 결합하는 인공지능 모델을 개발하기 위하여, 다음과 같은 조건들을 설정하여 인공지능 모델을 개발한다.
L1 정규화된 로지스틱 회귀에서는 페널티 매개 변수 λ의 다른 값에 대한 평균 AUC(Area Under Curve)를 측정하고 오차가 1 표준 편차 이내가 되도록 가장 큰 λ를 택한다.
랜덤 포레스트(Random Forest)에서는 100 개의 트리가 사용되었고, 최대 트리의 깊이가 20인 것을 사용한다.
서포트 벡터 머신(Support Vector Machine)은 페널티(C)와 감마(γ)의 최적 값을 찾기 위해 Grid 알고리즘을 사용한다.
인공 신경망(Neural Network)은 숨겨진 단위에 대한 활성화 함수 ReLU(Rectified Linear Unit)를 사용하여 3개의 숨겨진 레이어로 모델을 만든다. 역전파는 학습율 0.0001을 가지는 Adam 최적기를 사용하여 수행된다.
본 발명의 일 실시예에 따라 구축한 인공지능 모델을 학습(S250)하고, 학습된 내용에 의하여 약물들의 유해반응을 탐지 할 수 있다(S260).
따라서, 본 발명의 일 실시예에 따르면, 기존 방식보다 더 많은 특징들을 변수로 하여 인공지능 모델을 구축하기 때문에, 알려진 약물 부작용과 알려지지 않은 약물 부작용이 합해진 약물 부작용 레퍼런스 데이터 세트에 대해 알려지지 않은 약물 부작용 정보를 획득할 수 있다.
도 3은 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 시스템의 블록도이다.
도 3을 참조하면, 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 시스템(300)은 통신부(310), 제어부(320), 메모리(330) 및 입출력부(340)를 더 포함할 수 있다.
통신부(310)는 외부 데이터베이스와 통신하여 약물유해반응과 관련된 임상정보를 수신하는 기능을 수행할 수 있다.
제어부(320)는 적어도 하나 이상의 중앙 처리 장치(CPU) 또는 코어를 포함하는 프로세서나 마이크로프로세서로 구현될 수 있다. 중앙처리장치 또는 코어는 처리할 명령어를 저장하는 레지스터(register)와, 비교, 판단, 연산을 담당하는 산술논리연산장치(arithmetic logical unit, ALU)와, 명령어의 해석과 실행을 위해 CPU를 내부적으로 제어하는 제어유닛(control unit)과, 이들을 연결하는 내부 버스 등을 구비할 수 있다. 중앙처리장치 혹은 코어는 MCU(micro control unit)와 주변 장치(외부 확장 장치를 위한 집적회로)가 함께 배치되는 SOC(system on chip)로 구현될 수 있으나, 이에 한정되지는 않는다.
메모리(330)는 본 발명의 일 실시예에 따라 인공지능 기반으로 약물유해반응을 탐지하고 그 결과를 출력하기 위한 프로그램을 저장할 수 있다.
메모리(330)는 전자 건강 기록(EHR) 정보를 획득하는 제1획득부(331), 약물 부작용 정보를 획득하는 제2 획득부(332), 약물부작용 레퍼런스 데이터 세트 생성부(100), 특징 추출부(110), 인공지능 모델 구축부(120), 데이터 학습부(130), 약물유해반응 탐지 결과를 출력하는 출력부(140)를 포함할 수 있다.
전술한 메모리(120)는 비휘발성 랜덤 액세스 메모리(non-volatile RAM, NVRAM), 대표적 휘발성 메모리인 DRAM(dynamic random access memory) 등의 반도체 메모리, 하드디스크 드라이브(hard disk drive, HDD), 광 저장 장치, 플래시 메모리 등으로 구현될 수 있다.
그리고 메모리(120)는 인공지능 기반 약물유해반응 탐지 방법을 구현하기 위한 소프트웨어 모듈 외에 운영체제, 프로그램, 명령어 집합 등을 저장할 수 있다.
인공지능 기반 약물유해반응 탐지 방법을 구현하는 소프트웨어 모듈은 이들이 수행하는 일련의 기능을 구현하기 위한 소프트웨어 형태로 컴퓨터 판독 가능 매체(기록매체)에 저장되거나 혹은 캐리어 형태로 원격지의 서버 장치 내 저장장치에 저장되고 서버 장치와 네트워크를 통해 연결되는 임상적 유효성 평가 장치에서 다운로드하여 해당 기능을 수행하도록 구현될 수 있다.
도 4는 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법에 대한 실험결과를 나타낸다.
도 4를 참조하면, 각 알고리즘의 최적 AUROC(Area under the curves)(A) 및 평균 AUROC(B)에서 본 발명의 일 실시예에 따른 인공지능 기반의 탐지 민감도가 일반적인 약물 부작용 탐지 알고리즘보다 높은 것을 확인할 수 있다.
도 4에 대한 자세한 수치는 아래 표 1과 같다.
[표 1]
Figure pat00001
표 2는 본 발명의 일 실시예에 따른 인공지능 기반의 약물유해반응 탐지 방법으로 기존에 알려지지 않았던 약물의 부작용 중에서 3가지 이상으로 약물과 부작용이 관련성이 있다고 예측된 약물-부작용(ADR) 쌍을 나타낸다.
이 쌍들을 조사한 결과, 여러 연구들이 그 연관성을 뒷받침하고 있으므로, 본 발명에 따른 약물유해반응 탐지 방법은 신뢰도를 가진다고 볼 수 있다.
예를 들어, 본 발명의 일 실시예에 따른 인공지능 모델은 메트포르민(Metformin)이 증가하는 혈청 아밀라아제 수준에 영향을 미칠 것으로 예측했다. 혈청 아밀라아제의 증가는 보통 췌장의 염증에서 관찰될 수 있다. 이와 관련된 여러 보고서는 메트포민이 약물로 유발된 췌장염과 관련되어 있음을 지지한다.
즉, 본 발명의 일 실시예에 따른 인공지능 모델이 많은 알려지지 않은 쌍들에서 약물 - ADR 상관 관계가 존재한다는 것을 예측하였고, 추후 약학분야에서 많이 활용될 수 있다.
[표 2]
Figure pat00002
이상 첨부된 도면을 참조하여 본 발명의 실시 예들을 설명하였지만, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

Claims (6)

  1. 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 약물 부작용 레퍼런스 데이터 세트 생성부가 전자 건강 기록(Electronic Health Record, EHR) 정보와 약물 부작용(Adverse Drug Reaction, ADR) 정보를 이용하여 약물 부작용 레퍼런스 데이터 세트를 생성하는 단계;
    상기 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 특징 추출부가 상기 생성된 약물 부작용 레퍼런스 데이터 세트로부터 특정 약물에 대한 약물유해반응을 판별할 수 있는 복수의 특징들을 추출하는 단계;
    상기 인공지능 기반의 약물유해반응 탐지 시스템에 포함된 인공지능 모델 구축부가 상기 추출된 복수의 특징들을 표준화하는 단계; 및
    상기 인공지능 모델 구축부가 상기 표준화된 복수의 특징들을 기초로 하여 인공지능 모델을 구축하는 단계를 포함하는 인공지능 기반의 약물유해반응 탐지 방법.
  2. 제1항에 있어서,
    상기 특징 추출부가 상기 복수의 특징들을 추출하는 단계는,
    상기 약물 부작용 레퍼런스 데이터에 대한 최대 값 또는 최소 값을 비교하는 제1 특징 추출 알고리즘,
    상기 약물 부작용 레퍼런스 데이터에 대한 극단적 이상 비율을 비교하는 제2 특징 추출 알고리즘 및
    상기 약물 부작용 레퍼런스 데이터가 처방에 의한 결과인지 약물 부작용에 의한 결과인지를 분류할 수 있는 제3 특징 추출 알고리즘을 이용하야 수행하는 것을 특징으로 하는 인공지능 기반의 약물유해반응 탐지 방법.
  3. 제1항에 있어서,
    상기 인공지능 모델 구축부가 인공지능 모델을 구축하는 단계는,
    L1 정규화된 로지스틱 회귀, 랜덤 포레스트(Random Forest), 서포트 벡터 머신(Support Vector Machine) 및 인공 신경망을 사용하여 인공지능 모델을 구축하는 것인 인공지능 기반의 약물유해반응 탐지 방법.
  4. 외부 데이터베이스 또는 내부 데이터베이스로부터 전자 건강 기록(Electronic Health Record, EHR) 정보를 획득하는 제1 획득부;
    외부 데이터베이스 또는 내부 데이터베이스로부터 약물 부작용 정보를 획득하는 제2 획득부;
    상기 제1 획득부로부터 획득한 전자 건강 기록 정보와 제2 획득부로부터 획득한 약물 부작용 정보를 약물의 이름에 대해 매핑하는 약물 부작용 레퍼런스 데이터 세트 생성부;
    상기 생성된 약물 부작용 레퍼런스 데이터 세트로부터 특정 약물에 대한 약물유해반응을 판별할 수 있는 복수의 특징들을 추출하는 특징 추출부; 및
    상기 추출된 복수의 특징들을 표준화하고 표준화된 복수의 특징들을 기초로 하여 인공지능 모델을 구축하는 인공지능 모델 구축부를 포함하는 인공지능 기반의 약물유해반응 탐지 시스템.
  5. 제4항에 있어서,
    상기 특징 추출부는,
    상기 약물 부작용 레퍼런스 데이터에 대한 최대 값 또는 최소 값을 비교하는 제1 특징 추출 알고리즘,
    상기 약물 부작용 레퍼런스 데이터에 대한 극단적 이상 비율을 비교하는 제2 특징 추출 알고리즘, 및
    상기 약물 부작용 레퍼런스 데이터가 처방에 의한 결과인지 약물 부작용에 의한 결과인지를 분류할 수 있는 제3 특징 추출 알고리즘을 포함하는 것을 특징으로 하는 인공지능 기반의 약물유해반응 탐지 시스템.
  6. 제4항에 있어서,
    상기 인공지능 모델 구축부는,
    L1 정규화된 로지스틱 회귀, 랜덤 포레스트(Random Forest), 서포트 벡터 머신(Support Vector Machine) 및 인공 신경망 중 어느 하나를 사용하여 인공지능 모델을 구축하는 것인 인공지능 기반의 약물유해반응 탐지 시스템.
KR1020180096836A 2018-08-20 2018-08-20 인공지능 기반의 약물유해반응 탐지 방법 및 그 시스템 KR20200023689A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180096836A KR20200023689A (ko) 2018-08-20 2018-08-20 인공지능 기반의 약물유해반응 탐지 방법 및 그 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180096836A KR20200023689A (ko) 2018-08-20 2018-08-20 인공지능 기반의 약물유해반응 탐지 방법 및 그 시스템

Publications (1)

Publication Number Publication Date
KR20200023689A true KR20200023689A (ko) 2020-03-06

Family

ID=69802393

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180096836A KR20200023689A (ko) 2018-08-20 2018-08-20 인공지능 기반의 약물유해반응 탐지 방법 및 그 시스템

Country Status (1)

Country Link
KR (1) KR20200023689A (ko)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111477344A (zh) * 2020-04-10 2020-07-31 电子科技大学 一种基于自加权多核学习的药物副作用识别方法
CN112289458A (zh) * 2020-11-26 2021-01-29 温州市人民医院 一种面向大数据的潜在药物不良反应数据挖掘系统及方法
KR20220043297A (ko) * 2020-09-29 2022-04-05 가천대학교 산학협력단 유사도 측정에 기반한 약물의 부작용을 예측하는 방법, 시스템, 및 컴퓨터-판독가능 매체
KR20220057821A (ko) * 2020-10-30 2022-05-09 가천대학교 산학협력단 인공지능 기반 약물 반응성 예측 장치 및 방법
KR20220064243A (ko) * 2020-11-11 2022-05-18 아주대학교산학협력단 인공지능 기반의 이상 반응 감시 방법 및 이에 대한 시스템
KR20220117729A (ko) 2021-02-17 2022-08-24 성균관대학교산학협력단 머신러닝 기반의 약물 부작용 탐지 방법 및 그 장치
KR102456205B1 (ko) * 2022-06-03 2022-10-19 주식회사 원스글로벌 의약품 부작용 예측 방법 및 이러한 방법을 수행하는 장치
KR102464996B1 (ko) * 2022-05-31 2022-11-09 주식회사 원스글로벌 의약품 표준화 데이터 구축 방법 및 이러한 방법을 수행하는 장치
WO2022265480A1 (ko) * 2021-06-16 2022-12-22 닥터노아바이오텍 주식회사 약물들 간 상호작용을 분석하기 위한 방법 및 장치
KR20220169033A (ko) * 2021-06-17 2022-12-27 사회복지법인 삼성생명공익재단 강직성 척추염 환자에 대한 생물학적제제의 반응성 예측 방법 및 분석 장치
KR102600419B1 (ko) * 2023-05-30 2023-11-09 주식회사 에비드넷 주기변환 데이터베이스와 인공지능을 활용한 능동적 약물 이상반응 탐지 시스템
WO2023229239A1 (ko) * 2022-05-24 2023-11-30 차의과학대학교 산학협력단 백신 대상자 변수 정보 기반의 인공지능 학습 모델을 이용한 백신 부작용 예측 분석 방법 및 그 장치

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111477344A (zh) * 2020-04-10 2020-07-31 电子科技大学 一种基于自加权多核学习的药物副作用识别方法
KR20220043297A (ko) * 2020-09-29 2022-04-05 가천대학교 산학협력단 유사도 측정에 기반한 약물의 부작용을 예측하는 방법, 시스템, 및 컴퓨터-판독가능 매체
KR20220057821A (ko) * 2020-10-30 2022-05-09 가천대학교 산학협력단 인공지능 기반 약물 반응성 예측 장치 및 방법
KR20220064243A (ko) * 2020-11-11 2022-05-18 아주대학교산학협력단 인공지능 기반의 이상 반응 감시 방법 및 이에 대한 시스템
CN112289458A (zh) * 2020-11-26 2021-01-29 温州市人民医院 一种面向大数据的潜在药物不良反应数据挖掘系统及方法
KR20220117729A (ko) 2021-02-17 2022-08-24 성균관대학교산학협력단 머신러닝 기반의 약물 부작용 탐지 방법 및 그 장치
WO2022265480A1 (ko) * 2021-06-16 2022-12-22 닥터노아바이오텍 주식회사 약물들 간 상호작용을 분석하기 위한 방법 및 장치
KR20220169033A (ko) * 2021-06-17 2022-12-27 사회복지법인 삼성생명공익재단 강직성 척추염 환자에 대한 생물학적제제의 반응성 예측 방법 및 분석 장치
KR20230088327A (ko) * 2021-06-17 2023-06-19 사회복지법인 삼성생명공익재단 강직성 척추염 환자에 대한 생물학적제제의 반응성 예측 방법 및 분석 장치
WO2023229239A1 (ko) * 2022-05-24 2023-11-30 차의과학대학교 산학협력단 백신 대상자 변수 정보 기반의 인공지능 학습 모델을 이용한 백신 부작용 예측 분석 방법 및 그 장치
KR102464996B1 (ko) * 2022-05-31 2022-11-09 주식회사 원스글로벌 의약품 표준화 데이터 구축 방법 및 이러한 방법을 수행하는 장치
KR102456205B1 (ko) * 2022-06-03 2022-10-19 주식회사 원스글로벌 의약품 부작용 예측 방법 및 이러한 방법을 수행하는 장치
KR102600419B1 (ko) * 2023-05-30 2023-11-09 주식회사 에비드넷 주기변환 데이터베이스와 인공지능을 활용한 능동적 약물 이상반응 탐지 시스템

Similar Documents

Publication Publication Date Title
KR20200023689A (ko) 인공지능 기반의 약물유해반응 탐지 방법 및 그 시스템
Li et al. Consistency of variety of machine learning and statistical models in predicting clinical risks of individual patients: longitudinal cohort study using cardiovascular disease as exemplar
CN109934719A (zh) 医保违规行为的检测方法及检测装置、医保控费系统
Saffian et al. Warfarin dosing algorithms underpredict dose requirements in patients requiring≥ 7 mg daily: A systematic review and meta‐analysis
Jeong et al. Machine learning model combining features from algorithms with different analytical methodologies to detect laboratory-event-related adverse drug reaction signals
Tronci et al. Patient-specific models from inter-patient biological models and clinical records
Saleh et al. Transfer learning‐based platform for detecting multi‐classification retinal disorders using optical coherence tomography images
CN110689939A (zh) 一种用药序列的推荐方法、装置、可读介质及电子设备
Zhao et al. Handling temporality of clinical events for drug safety surveillance
Simon et al. Survival association rule mining towards type 2 diabetes risk assessment
Bean et al. Semantic computational analysis of anticoagulation use in atrial fibrillation from real world data
Shrestha et al. Supervised machine learning for early predicting the sepsis patient: modified mean imputation and modified chi-square feature selection
KR102559641B1 (ko) 인공지능 기반의 이상 반응 감시 방법 및 이에 대한 시스템
Ho et al. An app for predicting patient dementia classes using convolutional neural networks (CNN) and artificial neural networks (ANN): Comparison of prediction accuracy in Microsoft Excel
Al-Azzawi et al. Developing an Artificial Intelligence-Guided Signal Detection in the Food and Drug Administration Adverse Event Reporting System (FAERS): A Proof-of-Concept Study Using Galcanezumab and Simulated Data
CN116719926B (zh) 基于智慧医疗的先天性心脏病报告数据筛选方法及系统
Bhattarai et al. Can big data and machine learning improve our understanding of acute respiratory distress syndrome?
CN109767819B (zh) 病历的分组方法、装置、存储介质和电子设备
Saab et al. Comparison of Machine Learning Algorithms for Classifying Adverse-Event Related 30-ay Hospital Readmissions: Potential Implications for Patient Safety
Liao et al. A machine learning‐based risk scoring system for infertility considering different age groups
Xia et al. Learning doctors’ medicine prescription pattern for chronic disease treatment by mining electronic health records: a multi-task learning approach
Zhang et al. Application of L 1/2 regularization logistic method in heart disease diagnosis
CN113609295A (zh) 文本分类方法、装置及相关设备
Zhu et al. Design and development of a readmission risk assessment system for patients with cardiovascular disease
Pandit et al. A comprehensive review on Adverse Drug Reactions (ADRs) Detection and Prediction Models

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application