KR20230072088A - 인공지능기반 유해화학물질 오염영향 평가 시스템 - Google Patents

인공지능기반 유해화학물질 오염영향 평가 시스템 Download PDF

Info

Publication number
KR20230072088A
KR20230072088A KR1020210158458A KR20210158458A KR20230072088A KR 20230072088 A KR20230072088 A KR 20230072088A KR 1020210158458 A KR1020210158458 A KR 1020210158458A KR 20210158458 A KR20210158458 A KR 20210158458A KR 20230072088 A KR20230072088 A KR 20230072088A
Authority
KR
South Korea
Prior art keywords
organism
site
pollution
health
field
Prior art date
Application number
KR1020210158458A
Other languages
English (en)
Inventor
정지현
심원준
강창완
최승배
Original Assignee
한국해양과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국해양과학기술원 filed Critical 한국해양과학기술원
Priority to KR1020210158458A priority Critical patent/KR20230072088A/ko
Publication of KR20230072088A publication Critical patent/KR20230072088A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 실시 예는 해양에서 서식하는 현장 생물체의 생체 정보를 기초한 현장 생물체 건강도 정도를 추정하여 해양의 오염 정도를 평가할 수 있는 해양 오염 평가 시스템 및 방법을 제공한다.

Description

인공지능기반 유해화학물질 오염영향 평가 시스템{EFFECT ASSESSMENT SYSTEM OF ENVIRONMENTAL CHEMICAL CONTAMINATION BASED ON ARTIFICIAL INTELLIGENCE}
본 발명은 해양에서 서식하는 현장생물체 노출반응에 기초하여 해양 오염 영향에 대해 평가하는 시스템 및 방법에 관한 것으로서, 보다 상세하게는 현장 생물체의 건강도를 기반하여 해양의 오염 상태를 평가할 수 있는 시스템 및 방법에 관한 것이다.
이하에서 기술되는 내용은 본 발명의 실시 예와 관련되는 배경 정보를 제공할 목적으로 기재된 것일 뿐이고, 기술되는 내용들이 당연하게 종래기술을 구성하는 것은 아니다.
해양 생태계의 오염 영향 정도를 최종적으로 평가하기 위해서는 해양에 서식하는 생물의 아치사(亞致死_사망 이전 상태) 수준의 생리화학적영향 정도에 대한 모니터링 결과가 동반되어야 한다. 구체적으로 아치사 수준의 해양 생물의 생체지표반응은 향후 해양의 오염영향상태를 평가할 수 있는 정보로 사용될 수 있다.
이러한 생리화학적영향 정도에 대한 모니터링 결과는 유해물질에 노출된 정도(예: 유해물질 농도 및 물질 종류)와 유해물질에 특이적으로 반응하는 높은 민감도에 대한 정보와, 유해물질에 따른 해양 오염의 정도에 대더욱이, 유해물질의 오염된 정도에 따라 해양 생물의 건강도에 영향을 미치는 정도를 를 평가할 수 있는 진단 시스템이 필요하다.
전술한 배경기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
본 발명의 실시 예는 생체지표의 실측한 반응정도를 통해 해양의 유해물질 오염 정도를 평가하고 예측하여 현장 해역의 관리에 활용할 수 있도록 한다.
또한, 본 발명의 실시 예는 해양에 서식하는 현장 생물체의 유해물질중 유류기원 오염물질 등 유해화학물질에 특이적으로 반응하는 현장 어류의 민감도 정보를 통해 구성되어 있다.
또한, 본 발명의 실시 예는 해양의 유해물질에 대한 해양에 서식하는 현장 생물체의 생체지표반응에 따라 해양의 오염을 통계적으로 평가할 수 있도록 한다.
본 발명의 목적은 이상에서 언급한 과제에 한정되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시 예에 의해보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 알 수 있을 것이다.
본 발명의 실시 예에 따라 각 단계의 적어도 일부가 프로세서에 의해 수행되고, 해양 생물에 기초하여 해양 오염을 평가하기 위한 방법은, 모니터링을 위해 해양에 서식하는 현장 생물체 정보를 수집하고, 상기 현장 생물체의 아치사 생체지표 반응을 평가하여 출력하도록 훈련된 건강도 추정 모델에 상기 현장 생물체 정보를 입력하면, 상기 현장 생물체 건강도 정도를 기반으로 상기 해양의 오염 상태에 대한 평가값을 출력할 수 있다.
상기 현장 생물체의 정보는 상기 현장 생물체의 종(種) 정보, 상기 현장 생물체의 아치사 수준의 생체지표 반응값의 이상(異常) 정보 중 적어도 어느 하나의 정보일 수 있다.
상기 건강도 추정 모델은 입력한 상기 현장 생물체의 생체지표 분석값을 기반으로 도출된 현장 생물체 건강 평가 인덱스(Fish Health Assessment Index) 및 지역별 상기 현장 생물체의 정보를 통해 확보할 수 있다.
상기 건강도 추정 모델은, 상기 해양의 오염정도와 대응하는 아치사오염반응 값을 수집하고, 오염에 노출된 상기 현장 생물체의 생체대사 반응을 PCA(Principal component analysis)에 적용하는 과정으로 수행될 수 있다.
상기 현장 생물체의 생체대사 반응을 기준화하는 일반화선형모형(Generalized Linear model)을 설정하고, 상기 일반화선형모형의 적합 정도를 판단하는 과정을 더 포함할 수 있다.
상기 건강도 추정 모델은 현장 생물체 별로 각각 개별화되어 생성된 머신 러닝 기반의 학습 모델로 발전할 수 있다.
상기 해양의 오염 상태 평가 시, 미리 설정된 해양 오염에 따른 생체지표 반응 리스트 중에서 상기 해양 오염에 대응하는 어느 하나의 상태를 출력할 수 있다.
본 발명의 실시 예에 따른 해양 생물반응에 기초하여 해양 오염을 평가하는 시스템은, 프로세서 및 상기 프로세서와 전기적으로 연결되고, 상기 프로세서에서 수행되는 적어도 하나의 코드(code)가 저장되는 메모리를 포함하고, 상기 메모리는 상기 프로세서를 통해 실행될 때 상기 프로세서가 모니터링을 위해 해양에 서식하는 현장 생물체의 정보를 수집하고, 상기 현장 생물체의 아치사 생체지표 반응을 출력하도록 훈련된 건강도 추정 모델에 상기 현장 생물체 정보를 입력한 후, 상기 현장 생물체 건강도 정도를 기반으로 상기 해양의 오염 상태에 대한 평가값을 출력하도록 야기하는 코드들을 저장할 수 있다.
전술한 것 외의 다른 측면, 특징, 및 이점이 이하의 도면, 청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.
본 발명의 실시 예에 따르면, 현장 생물체 생체반응 정보를 입력 받아 현장 생물체의 건강도를 레이블링하여 학습 데이터로 생성한 뒤, 생성된 학습 데이터로 훈련된 건강도 추정 모델에 현장 생물체의 생체지표 반응 정보를 입력하여 현장 생물체의 건강도 정도를 추정할 수 있다.
현장 생물체의 건강 정도에 따라 현장 생물체가 위치한 해양의 오염을 추정할 수 있다. 구체적으로, 기 저장된 해양 오염 범주에 현장 생물체의 건강 정도를 대응하여 해양의 오염 정도 및 상태를 추정할 수 있다.
또한, 해양 오염을 평가하기 위한 데이터에서 현장 생물체의 생체 정보를 측정하여 현장 생물체가 서식하는 해양의 상태를 추정할 수도 있다.
본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 실시 예에 따른 해양 오염 평가 시스템을 개략적으로 나타낸 도면이다.
도 2는 본 발명의 실시 예에 따른 서버의 구성을 나타낸 블록이다.
도 3은 본 발명의 실시 예에 따른 신경망 알고리즘 모형에 대한 도면이다.
도 4는 본 발명의 실시 예에 따라 해양 오염 정도를 도시한 인덱스이다.
도 5는 본 발명의 실시 예에 따른 해양에 서식하는 현장 생물체의 건강도 정보에 따라 현장 생물체의 건강도를 분석하는 과정을 도시한 순서도이다.
이하, 첨부된 도면을 참조하여 본 명세서에 발명된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이 함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 발명된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 발명된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 발명된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 발명된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수개의 표현을 포함한다.
본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
도 1은 본 발명의 실시 예에 따른 해양 오염 평가 시스템을 개략적으로 나타낸 도면이다.
도 1을 참고하면, 해양 오염 평가 시스템(10)은 해양에서 서식하는 생물(이하 현장 생물체(100))의 정보를 기반으로 현장 생물체(100)의 건강도를 추정하고, 해양의 오염 정도를 평가할 수 있는 시스템이다.
본 발명의 실시 예에 있어서 해양 오염 평가 시스템(10)은 오염 물질에 노출된 현장 생물체(100)가 오염 물질에 대응하는 생체반응과 실제 오염농도의 정보를 통해 실현될 수 있다. 즉, 현장 생물체(100)를 지역별로 채집하고 생체 변화와 오염물질의 농도를 측정하여 결과를 취합하여 수집될 수도 있으며 이와 다르게 해양 오염 또는 오염 물질에 대응하는 오염수준을 인위적으로 형성시킨 실험실 수조에 생물체(100)를 노출시켜, 생체 변화와 해양 오염 정도를 모형에 적용하여 평가할 수도 있다.
이와 같이 수집된 현장 생물체(100)의 생체 정보를 기반으로 평가된 해양 오염 정도는 현장 생물체(100)의 생체 정보를 저장하고 기 저장된 조건을 기반으로 현장 생물체(100)의 상태를 추정하는 서버(200)와 유무선 통신 연결된 전자장치(예: 개인 단말, 서버 장치, PC 등)에 전달되어 육안으로 확인할 수 있다.
일 실시 예에서 해양 오염 평가 시스템(10)은 우선 모니터링을 위해 해양에 서식하는 현장 생물체(100)를 선정하고 선정된 현장 생물체(100) 정보를 수집할 수 있다. 수집된 현장 생물체(100) 정보는 현장 생물체(100)의 아치사 생체지표 반응을 출력하도록 훈련된 건강도 추정 모델에 현장 생물체(100) 정보를 입력할 수 있다. 입력된 현장 생물체(100) 정보를 기반으로 해양 오염 상태에 대한 평가값을 출력할 수 있다.
출력되는 평가값은 하기에 기재된 표 1의 건강도 인덱스에 대응되는 값으로 출력할 수 있다. 즉, 현장 생물체(100)의 아치사 반응 정도를 기반으로 해양 오염 상태를 평가할 수 있는 것이다.
즉, 본 발명의 실시 예들에 있어서 해양 오염 평가 시스템(10)은 설명한 바와 같이 오염이 발생한 해양에 서식하는 생물(현장 생물체(100))을 채집하고, 채집한 현장 생물체(100)의 생태 변화인 아치사 생체지표 반응을 통해 해양 오염 정도를 평가할 수 있다. 평가되는 해양 오염 정도는 해양 오염 정도를 평가하는 작업자가 전자 장치(예를 들어 서버(200) 또는 단말(50))에 입력하고, 입력된 데이터와 기 저장된 데이터에 기반하여 해양 오염 정도를 평가하게 된다.
구체적으로, 해양 오염 평가 시스템(10)은 서버(200) 또는 단말(50)을 통해 구현할 수 있다. 예컨대, 해양 오염을 평가하는 작업자(이하 작업자)는 채집한 현장 생물체(100)로부터 생체 정보를 수집하고, 수집한 생체 정보를 서버(200)나 단말(50)에 저장할 수 있다. 이때, 서버(200)나 단말(50)에 기 저장된 현장 생물체(100)의 아치사 생체지표 반응을 출력하도록 훈련된 건강도 추정 모델을 통해 현장 생물체(100)의 건강 상태를 추정하고, 현장 생물체(100)의 건강 정도에 따라 해양 오염 상태를 출력할 수 있는 것이다.
한편 수집하는 현장 생물체(100) 정보는 현장 생물체(100)의 종(種)정보, 현장 생물체(100)의 아치사 수준의 생체지표 반응에 대한 이상 정보 등이 될 수 있으며, 현장 생물체(100) 정보는 이에 한정하지 않는다.
오염범주
단위: ng/liver g.dw)
건강도
범주
해석
0 ~ 200 a ~ b 매우 양호
201 ~ 420 b ~ c 보통
421 ~ 1000 c ~ d 심각
1000 이상 d 이상 매우 심각
[표 1]을 살펴보면, 현장 생물체(100)의 건강도 리스트는 현장 생물체(100)의 건강도를 평가하기 위해 현장 생물체(100)의 간조직의 PAHs 분석농도를 200, 420, 1000, 1001 ng/liver g.dw으로 구분한 것이다. 본 발명의 실시 예에 따른 현장 생물체(100) 건강도는 오염물질에 의해 오염된 정도에 따라 0 ~ 200, 201 ~ 420, 421 ~ 1000 및 1000 이상으로 구분할 수 있다. 구분된 각각의 단계는 해양에서 채집한 현장 생물체(100)의 생체 정보를 PCA(Principal component analysis)를 적용하여 도출할 수 있다.
구체적으로, 현장 생물체(100) 건강도를 도출하기 위해 현장 생물체(100)로부터 채집할 수 있는 생체 정보를 수치화할 수 있다. 예컨대 현장 생물체(100)의 간장(간과 창자)의 EROD(Ethoxyresorufin O-deethylase)활성 정도, Cyanoethoxycoumarin O-de-ethylase (CN-ECOD) 활성 정도 및 유세포분석기를 통한 현장 생물체(100)의 면역지표를 측정하여 수치화하도록 한다.
현장 생물체(100)의 간장의 EROD (Ethoxyresorufin O-deethylase)활성 정도는 Addison and Payne(1986)의 방법을 기반으로 측정할 수 있으며, EROD 활성 정도는 fluorescence plate reader로 excitation 544 nm와 emission 590 nm에서 측정하였고 각각의 시료마다 세 번 반복으로 측정하여 그 평균값을 사용할 수 있다.
Cyanoethoxycoumarin O-de-ethylase (CN-ECOD) 활성 정도 측정방법은 앞서 설명된 Addison and Payne(1986)의 방법을 기반으로 측정할 수 있다. 구체적으로 Addison and Payne(1986)의 방법을 기반으로 96-well microplate 로 측정할 수 있도록 최적화하였다. 조효소인 NADPH (cofactor)와 기질(ethoxy-resorufin) 을 첨가한 후 excitation 파장 544-590 nm와 emission 파장은 405 - 450 nm에서 3-cyanoumbelliferone 을 최종산물로 측정하여 활성을 계산할 수 있다.
현장 생물체(100)로부터 채집한 생체 정보를 수치화하면, 수치화된 변수에는 로그(log)를 취하여 PCA(Principle Component Analysis_주성분분석)를 수행할 수 있다. 즉, logEROD와 같이 앞서 추출한 변수에 log를 취한 결과값을 추출할 수 잇다.
이렇게 추출한 PCA 결과값은 요인적재량(요인행렬)을 가중치로 하여 각 변수와 선형결합하게 된다. 요인적재량이란, 상관계수가 높은 변수들끼리 모아서 작은 수의 변수집단으로 구분한 것을 의미할 수 있다. 이렇게 획득한 결과값을 현장 생물체(100) 건강도 평가 인덱스(FHAI: Fish Health Assessment Index)라고 정의할 수 있다.
정의된 현장 생물체(100) 건강도 평가 인덱스는 주성분점수는 평균이 0이고, 분산이 1을 가지며, 대략 -3부터 +3까지 값을 가진다. 이러한 건강도 평가 인덱스 값은 소수점 이하 값과 음수(-)를 가지기 때문에 0부터 100 사이의 값을 갖도록 변환을 수행할 수 있다.
변환이 수행된 현장 생물체(100) 건강도 평가 인덱스 값은 앞서 설명된 [표 1]과 같이 간조직 PAHs 분석농도 200, 420, 1000, 1001 ng/liver g.dw을 고려하여 오염도가 200, 420, 1000, 1001 (ng/liver g.dw; ppb)에 해당하도록 구분하고, 구분된 건강도 평가 인덱스에서 현장 생물체(100) 건강도에 대응하는 어느 하나의 레벨을 출력할 수 있다.
다만, 본 발명의 실시 예에 따라 현장 생물체(100) 건강도 평가 인덱스는 조건에 따라 단계가 더 세분화되거나 단순하게 구분될 수 있다.
건강도 추정 모델을 기초로 출력된 현장 생물체(100)의 아치사 생체지표 반응에 대한 분석값을 기준으로 현장 생물체(100)의 생체반응을 기준화할 수 있다. 이를 위해 일반화선형모형(Generalized Linear model)을 이용할 수 있다. 일반화선형모형이란, 연속성 반응변수뿐 아니라 범주형 반응변수에 대한 모형들까지 포함하는 모형의 집합을 의미한다.
이러한 일반화선형모형을 이용하여 현장 생물체(100)의 생체대사 반응을 기준화할 수 있으며, 현장 생물체(100)의 생체대사 반응을 기준화하기 위해 종속변수로 PAHs, 설명변수로 GSI, CF, 그리고 주성분점수(PCA)를 고려할 수 있다. 이때, 종속변수에 로그(log)를 취한 이유는 정규성 등의 가정을 만족하기 위함이다.
이러한 일반화선형모형은 다음의 식으로 구체화할 수 있다.
logPAHs =α +β 1GSI +β 1CF +β 3PCA +ε
한편 현장 생물체(100)의 생체대사 반응을 기준화하기 위한 일반화선형모형은 도출된 식[표 2]이 현장 생물체(100)의 생체대사 반응을 기준화하기 위한 적합 정도를 판단할 수 있다.
적합 정도 판단은 예를 들어, 적합도 계산식(카이제곱통계량 값/자유도)과, 우도비 카이제곱 검정을 이용하여 수행할 수 있다. 적합도 계산식에 의한 값은 어느 정도 자료가 모형에 적합되는 지에 대한 정도에 대한 정보를 제공하지만 통계적으로 유의한 지에 대해서는 판단할 수 없다. 우도비 카이제곱 검정은 모형의 적합 여부에 대한 통계적 유의성을 결과를 출력할 수 있다.
따라서, 본 발명의 실시 예에 따른 일반화선형모형의 적합도 판단은 조건에 따라 다르게 적용하거나 두 방법을 동시에 사용하여 판단할 수 있다.
도 2는 본 발명의 실시 예에 따른 서버의 구성을 나타낸 블록이고, 도 3은 본 발명의 실시 예에 따른 신경망 알고리즘 모형에 대한 도면이며, 도 4는 본 발명의 실시 예에 따라 해양 오염 정도를 도시한 인덱스이다.
도면 설명에 앞서 설명의 편의상 해양 오염 평가 시스템(10)은 서버(200)에 현장 생물체(100)(해양 생물)의 정보를 입력하고, 입력된 현장 생물체(100)의 정보를 통해 해양 오염 정도를 평가할 수 있는 기술로 구현된 예를 들어 설명하기로 하지만, 본 발명의 실시 예는 이에 한정되는 것은 아니다.
또한, 해양 오염 평가를 위해 인공지능을 이용할 수 있으며, 구체적으로 현장 생물체(100)의 생체정보를 이용하여 해양 오염을 추정할 수 있다. 이를 위해 서버(200)에는 해양 오염을 추정할 수 있는 학습 모델이 구현될 수 있다.
도 2를 참고하면, 해양 오염 평가 시스템(10)의 서버(200)는 현장 생물체(100)에서 측정한 생체 정보를 기반으로 해양 오염 정도를 추정할 수 있는 장치이다. 이러한 해양 오염 평가 시스템(10)은 통신부(210), 메모리(230), 러닝 프로세서(220) 및 프로세서(250) 등을 포함할 수 있다.
서버(200)의 통신부(210)는 단말(50)과 통신 연결될 수 있는 구성이고, 단말(50)로 해양 오염 정도 정보를 전송하거나 현장 생물체(100)에 부착된 센서를 통해 현장 생물체(100)의 생체 정보를 수신 받을 수 있다.
메모리(230)는 모델 저장부(231)를 포함할 수 있다. 모델 저장부(231)는 러닝 프로세서(220)를 통해 학습 전 또는 학습된 모델(231a)을 저장할 수 있다. 학습된 모델 또는 학습 전 모델을 포함하는 학습 모델은 인공 신경망 기반 등 특별히 그 종류를 한정하지 않는다.
러닝 프로세서(220)는 학습 데이터를 이용하여 학습 모델(231a)을 학습시킬 수 있다. 학습 모델(231a)은 서버(200)난 단말(50)에 탑재된 상태에서 이용될 수 있다.
학습 모델은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다. 학습 모델의 일부 또는 전부가 소프트웨어로 구현되는 경우 학습 모델을 구성하는 하나 이상의 명령어(instruction)는 메모리(230)에 저장될 수 있다.
본 개시의 학습 모델은 머신 러닝을 기반으로 하여 현장 생물체(100)의 아치사 생체지표 반응을 출력하도록 훈련된 건강도 출력모델에서 건강도를 추정할 수 있는 모델이며, 건강도 추정 모델은 오염에 노출된 현장 생물체의 오염 반응 값을 실험실 또는 해양에서 수집한 정보를 기반으로 레이블링한 훈련 데이터로 훈련될 수 있다.
구체적으로 본 발명의 실시 예에 따른 건강도 추정 모델은 Biomarker(바이오마커)를 이용한 신경망 알고리즘에 기반하고, 현장 생물체(100)의 아치사 생체지표 반응을 출력하도록 훈련될 수 있다.
예를 들어, 현장 생물체(100)의 생체 정보는 오염에 노출된 현장 생물체(100)의 생체 조직을 분석한 분석값들(예: 간장)의 EROD(Ethoxyresorufin O-deethylase)활성 정도, Cyanoethoxycoumarin O-de-ethylase (CN-ECOD) 활성 정도 등)을 기초하여 획득한 데이터일 수 있고, 획득한 데이터를 PCA를 수행하도록 훈련될 수 있다. 즉, 훈련된 Biomarker(바이오마커)를 이용한 신경망 알고리즘에 기반한 학습 모델에 현장 생물체(100)로부터 측정한 생체 정보를 입력하고, 훈련된 PCA로부터 현장 생물체(100)의 건강정도를 추정할 수 있다.
일 실시 예에서 Biomarker(바이오마커)를 이용한 신경망 알고리즘은 도 3과 같을 수 있다. 입력되는 데이터는 수치화된 현장 생물체(100)로부터 채집한 생체 정보일 수 있다. 입력된 데이터를 PCA 값으로 결정하고, 결정된 PCA 값에 따라 현장 생물체(100)의 건강 정도를 good 및 bad로 구분, 추정할 수 있다.
여기서, 데이터는 현장 생물체(100)가 발생한 오염에 노출되고, 일정 시간이 지난 후 분석한 데이터일 수 있으며, 다르게는 수조에 발생 가능한 오염 정도를 설정하여 현장 생물체(100)를 수조에 넣어 오염에 노출되도록 한 뒤 일정 시간이 지난 후 분석한 데이터일 수도 있다.
예를 들어 현장 생물체(100)를 해양의 오염 정도와 대응하는 오염도에 노출되도록 할 수 있다. 오염에 노출된 현장 생물체(100)의 생체 정보를 수치화하여 현장 생물체(100) 건강도 평가 인덱스 값을 추출할 수 있다. 추출된 데이터는 현장 생물체(100) 건강도를 추정하는 추정값이 될 수 있다.
현장 생물체(100)의 건강도를 측정하면 측정한 현장 생물체(100) 건강도를 기 설정된 현장 생물체(100) 건강도 추정 모델에 입력할 수 있다. 이때, 건강도 추정 모델은 해양 오염을 추정하기 위한 작업자가 입력한 현장 생물체(100)의 건강 평가 인덱스 및 지역별 현장 생물체의 정보를 기준으로 레이블링된 훈련 데이터로 훈련된다.
지역별 현장 생물체의 정보란, 실제 조사된 지역에서의 오염 농도를 의미할 수 있다.
구체적으로, 현장 생물체(100)의 간조직의 PAHs 분석농도를 200, 420, 1000, 1001 ng/liver g.dw으로 구분할 수 있고, 현장 생물체(100) 건강도는 오염물질에 의해 오염된 정도에 따라 0 ~ 200, 201 ~ 420, 421 ~ 1000 및 1000 이상으로 구분할 수 있다.
이때, 현장 생물체(100)로부터 채집할 수 있는 생체 정보를 수치화하여 현장 생물체(100) 건강도를 도출할 수 있다. 예컨대 현장 생물체(100)의 간장의 EROD(Ethoxyresorufin O-deethylase)활성 정도, Cyanoethoxycoumarin O-de-ethylase (CN-ECOD) 활성 정도 및 유세포분석기를 통한 현장 생물체(100)의 면역지표를 측정하도록 한다.
현장 생물체(100)의 건강도를 도출한 데이터에 로그(log)를 취하여 PCA(Principle Component Analysis_주성분분석)를 수행하고, 수행된 결과값을 현장 생물체(100) 건강도 평가 인덱스(FHAI: Fish Health Assessment Index)라고 정의하도록 한다.
이렇게 정의된 현장 생물체(100) 건강도 평가 인덱스를 기준으로 작업자가 현장 생물체(100)의 생체 정보를 입력하면 기 학습된 현장 생물체(100) 건강도 평가 인덱스에 따라 현장 생물체(100)의 건강 정도 및 해양의 오염 정도를 예측할 수 있다.
이러한 건강도 추정 모델은 현장 생물체(100) 별로 각각 개별화될 수 있다. 즉, 현장 생물체(100)마다 서식하는 지역별, 각 지역의 오염에 따라 변화 정도가 다를 수 있기 때문에 건강도 추정 모델은 현장 생물체(100) 별로 각각 개별화되는 것이 바람직할 것이다.
즉, 현장 생물체(100)의 건강도 정도를 [표 1]과 같은 수치적 값 또는 해당 수치적 값에 매핑된 레벨로 출력할 수 있다. 현장 생물체(100)의 생체 상태를 현장 생물체(100)의 생체 정보에 기반하여 기 설정되어 건강도 정도를 어느 하나로 출력할 수 있는 것이다.
이때, 건강도 추정 모델의 정확성을 위해 다양한 현장 생물체(100)를 선정하고, 현장 생물체(100)의 생체정보를 기반으로 훈련 데이터를 생성할 수 있다. 특히 오염이 발생하지 않은 해양에서와 오염이 발생한 해양에서 동일 현장 생물체(100)의 생체 정보를 취득하여 학습 모델을 훈련할 수 있다.
이렇게 현장 생물체(100) 건강도 추정 모델을 기반으로 추정한 현장 생물체(100) 건강도 정도를 기반으로 도 4과 같은 리스트에 대응하여 해양 오염 상태를 평가할 수 있다.
일 실시 예에서 해양 오염 상태를 평가하는 리스트는 도 4와 같을 수 있다. 예를 들어 현장 생물체(100)의 생체 정보를 입력으로 하여 현장 생물체(100)의 건강 정도를 [표 1]과 같이 출력하고, 출력된 데이터를 기반으로 해양 오염 정도를 구분할 수 있다. 즉, 해양 오염 정도는 등급 Ⅰ, Ⅱ, Ⅲ, Ⅳ 및 Ⅴ으로 구분할 수 있으며, 각 등급은 양호에서부터 매우 심각까지 구분될 수 있다.
예컨대, 현장 생물체(100)의 건강 정도 범주가 d 이상인 경우, 해양 오염의 평가가 등급 Ⅴ(매우 심각)인 것으로 해석될 수 있다. 이와 유사하게, 현장 생물체(100)의 건강 정도 범주가 a ~ b인 경우 해양 오염의 평가가 등급 Ⅰ(양호)인 것으로 해석될 수 있다.
이러한 해양 오염 범주 데이터는 기 설정되어 학습된 결과일 수 있지만, 환경의 변화에 따라 범주는 변경될 수 있다.
프로세서(250)는 학습 모델을 이용하여 새로운 입력 데이터에 대하여 결과 값을 추론하고, 추론한 결과 값에 기초한 응답이나 제어 명령을 생성할 수 있다.
프로세서(250)는 통신부(210)를 통해 서버(200)로 수신된 현장 생물체(100)의 생체 정보를 학습 모델에 적용하여 현장 생물체(100)의 건강도를 추정하고 해양 오염의 범주를 평가할 수 있다.
도 5는 본 발명의 실시 예에 따른 해양에 서식하는 현장 생물체의 건강도 정보에 따라 현장 생물체의 건강도를 분석하는 과정을 도시한 순서도이다.
도면을 참고하면, 본 발명의 실시 예에 따른 해양 오염 평가 방법은 해양에 서식하는 현장 생물체(100)의 생체 정보를 기반으로 평가된 해양 오염 정도는 현장 생물체(100)의 생체 정보를 저장하고 기 저장된 조건을 기반으로 현장 생물체(100)의 건강 정도를 추정하여 해양의 오염을 평가할 수 있도록 한다(S110).
이후, 수집한 현장 생물체(100)의 건강도를 평가하기 위한 인덱스를 도출한 후(S120), 현장 생물체(100) 건강도를 추정하는 인덱스를 통해 현장 생물체(100)의 건강도 및 해양 오염도를 추정하는 과정을 통해 이루어질 수 있다(S130).
일 실시 예에서, 수집된 현장 생물체(100) 정보는 현장 생물체(100)의 건강도를 출력하도록 훈련된 건강도 추정 모델에 현장 생물체(100) 정보를 입력하여 현장 생물체(100) 건강도를 출력하도록 한다. 출력된 수치는 현장 생물체(100)의 건강도 인덱스에 대응되는 값으로 출력할 수 있다([표 1] 참고).
이를 위해 현장 생물체(100) 건강도를 출력할 수 있도록 각각의 현장 생물체(100) 별로 해양 오염 정도에 따라 생체 정보에 대한 학습 데이터를 생성하고, 생성된 학습 데이터로 학습 모델을 훈련할 수 있다.
학습된 학습 모델을 기반으로 생성된 건강도 인덱스를 기반으로 현장 생물체(100)의 건강도 및 해양 오염도를 추정할 수 있다.
이와 같이, 현장 생물체에 따른 현장 생물체 생체 정보를 입력 받아 현장 생물체의 건강도에 레이블링하여 학습 데이터로 생성한 뒤, 생성된 학습 데이터로 훈련된 건강도 추정 모델에 현장 생물체의 생체 정보를 입력하여 현장 생물체의 건강도 정도를 추정할 수 있다. 따라서, 각각의 현장 생물체 별로 건강 정도를 보다 정확하게 추정할 수 있다.
현장 생물체의 건강 정도에 따라 현장 생물체가 위치한 해양의 오염을 추정할 수 있다. 즉, 기 저장된 해양 오염 범주에 현장 생물체의 건강 정도를 대응하여 해양의 오염 상태를 추정할 수 있다.
나아가 해양 오염을 평가하기 위한 데이터에서 현장 생물체의 생체 정보를 측정하여 현장 생물체가 서식하는 해양의 상태를 추정할 수도 있다.
이상 설명된 본 발명의 실시 예에 대한 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 청구범위에 의하여 나타내어지며, 청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
현장 생물체 생체반응 정보를 입력 받아 현장 생물체의 건강도를 레이블링하여 학습 데이터로 생성한 뒤, 생성된 학습 데이터로 훈련된 건강도 추정 모델에 현장 생물체의 생체지표 반응 정보를 입력하여 현장 생물체의 건강도 정도를 추정할 수 있다.
현장 생물체의 건강 정도에 따라 현장 생물체가 위치한 해양의 오염을 추정할 수 있다. 구체적으로, 기 저장된 해양 오염 범주에 현장 생물체의 건강 정도를 대응하여 해양의 오염 정도 및 상태를 추정할 수 있다.
또한, 해양 오염을 평가하기 위한 데이터에서 현장 생물체의 생체 정보를 측정하여 현장 생물체가 서식하는 해양의 상태를 추정할 수도 있다.

Claims (14)

  1. 각 단계의 적어도 일부가 프로세서에 의해 수행되고, 해양 생물에 기초하여 해양 오염을 평가하기 위한 방법으로서,
    모니터링을 위해 해양에 서식하는 현장 생물체의 정보를 수집하는 단계;
    상기 현장 생물체의 아치사 생체지표 반응을 출력하도록 훈련된 건강도 추정 모델에 상기 현장 생물체 정보를 입력하는 단계; 및
    상기 현장 생물체 건강도 정도를 기반으로 상기 해양의 오염 상태에 대한 평가값을 출력하는 단계를 포함하는,
    해양 오염 평가 방법.
  2. 제1항에 있어서,
    상기 현장 생물체의 정보는 상기 현장 생물체의 종(種) 정보, 상기 현장 생물체의 아치사 수준의 생체지표 반응에 대한 이상(異常) 정보 중 적어도 어느 하나의 정보인,
    해양 오염 평가 방법.
  3. 제1항에 있어서,
    상기 건강도 추정 모델은 입력한 상기 현장 생물체의 생체지표 반응에 대한 분석값을 기반으로 도출된 상기 현장 생물체 건강 평가 인덱스(Fish Health Assessment Index) 및 지역별 상기 현장 생물체의 정보가 레이블링된 훈련 데이터로 훈련된, 해양 오염 평가 방법.
  4. 제3항에 있어서,
    상기 건강도 추정 모델을 훈련하기 위한 상기 훈련 데이터를 생성하는 단계를 포함하고,
    상기 훈련 데이터를 생성하는 단계는,
    상기 해양의 오염 정도와 대응하는 아치사 오염반응값을 수집하는 단계; 및
    오염에 노출된 상기 현장 생물체의 생체대사 반응을 PCA(Principal component analysis)에 적용하는 단계를 포함하는,
    해양 오염 평가 방법.
  5. 제1항에 있어서,
    상기 현장 생물체의 생체대사 반응을 기준화하는 일반화선형모형(Generalized Linear model)을 설정하는 단계; 및
    상기 일반화선형모형의 적합 정도를 판단하는 단계를 더 포함하는,
    해양 오염 평가 방법.
  6. 제1항에 있어서,
    상기 건강도 추정 모델은 상기 현장 생물체 별로 각각 개별화되어 생성된 머신 러닝 기반의 학습 모델인,
    해양 오염 평가 방법.
  7. 제1항에 있어서,
    상기 해양의 오염 상태를 평가하는 단계는,
    기 설정된 해양 오염에 따른 생체지표 반응 리스트 중에서 상기 해양 오염에 대응하는 어느 하나의 상태를 출력하는 단계를 포함하는,
    해양 오염 평가 방법.
  8. 해양 생물에 기초하여 해양 오염을 평가하는 시스템으로서,
    프로세서; 및
    상기 프로세서와 전기적으로 연결되고, 상기 프로세서에서 수행되는 적어도 하나의 코드(code)가 저장되는 메모리를 포함하고,
    상기 메모리는 상기 프로세서를 통해 실행될 때 상기 프로세서가
    모니터링을 위해 해양에 서식하는 현장 생물체의 정보를 수집하고, 상기 현장 생물체의 아치사 생체지표 반응을 출력하도록 훈련된 건강도 추정 모델에 상기 현장 생물체 정보를 입력한 후, 상기 현장 생물체 건강도 정도를 기반으로 상기 해양의 오염 상태에 대한 평가값을 출력하도록 야기하는 코드들을 저장하는,
    해양 오염 평가 시스템.
  9. 제8항에 있어서,
    상기 현장 생물체의 정보는 상기 현장 생물체의 종(種) 정보, 상기 현장 생물체의 아치사 수준의 생체지표 반응에 대한 이상(異常) 정보 중 적어도 어느 하나의 정보인,
    해양 오염 평가 시스템.
  10. 제8항에 있어서,
    상기 메모리는 상기 프로세서로 하여금,
    상기 건강도 추정 모델은 입력한 상기 현장 생물체의 생체지표 반응에 대한 분석값을 기반으로 도출된 상기 현장 생물체 건강 평가 인덱스(Fish Health Assessment Index) 및 지역별 상기 현장 생물체의 정보가 레이블링된 훈련 데이터로 훈련하도록 야기하는 코드들을 더 저장하는,
    해양 오염 평가 시스템.
  11. 제10항에 있어서,
    상기 메모리는 상기 프로세서로 하여금,
    상기 건강도 추정 모델을 훈련하기 위한 상기 훈련 데이터를 생성하도록 야기하는 코드들을 더 저장하고,
    상기 훈련 데이터는, 상기 해양의 오염 정도와 대응하는 아치사 오염반응값을 수집하고, 오염에 노출된 상기 현장 생물체의 생체대사 반응을 PCA(Principal component analysis)에 적용하도록 야기하는 코드들을 더 저장하는,
    해양 오염 평가 시스템.
  12. 제8항에 있어서,
    상기 메모리는 상기 프로세서로 하여금,
    상기 현장 생물체의 생체대사 반응을 기준화하는 일반화선형모형(Generalized Linear model)을 설정하고, 상기 일반화선형모형의 적합 정도를 판단하도록 야기하는 코드들을 더 저장하는,
    해양 오염 평가 시스템.
  13. 제8항에 있어서,
    상기 메모리는 상기 프로세서로 하여금,
    상기 건강도 추정 모델은 상기 현장 생물체 별로 각각 개별화되어 생성된 머신 러닝 기반의 학습 모델인,
    해양 오염 평가 시스템.
  14. 제8항에 있어서,
    상기 메모리는 상기 프로세서로 하여금,
    기 설정된 해양 오염에 따른 생체지표 반응 리스트 중에서 상기 해양 오염에 대응하는 어느 하나의 상태를 출력하도록 야기하는 코드들을 더 저장하는, 해양 오염 평가 시스템.
KR1020210158458A 2021-11-17 2021-11-17 인공지능기반 유해화학물질 오염영향 평가 시스템 KR20230072088A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210158458A KR20230072088A (ko) 2021-11-17 2021-11-17 인공지능기반 유해화학물질 오염영향 평가 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210158458A KR20230072088A (ko) 2021-11-17 2021-11-17 인공지능기반 유해화학물질 오염영향 평가 시스템

Publications (1)

Publication Number Publication Date
KR20230072088A true KR20230072088A (ko) 2023-05-24

Family

ID=86541050

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210158458A KR20230072088A (ko) 2021-11-17 2021-11-17 인공지능기반 유해화학물질 오염영향 평가 시스템

Country Status (1)

Country Link
KR (1) KR20230072088A (ko)

Similar Documents

Publication Publication Date Title
CN110088619A (zh) 用于废水处理厂或饮用水厂的过程和资产健康诊断、异常检测和控制的智能系统和方法
Pillar et al. A framework for metacommunity analysis of phylogenetic structure
Popescu et al. Estimating population impacts via dynamic occupancy analysis of before–after control–impact studies
Fieberg et al. Used‐habitat calibration plots: A new procedure for validating species distribution, resource selection, and step‐selection models
Flavelle A quantitative measure of model validation and its potential use for regulatory purposes
Shatkin Informing Environmental Decision Making by Combining Life Cycle Assessment and Risk Analysis.
CN117195135B (zh) 一种水污染异常溯源检测方法及系统
DiRenzo et al. A practical guide to understanding and validating complex models using data simulations
Holzhütter et al. Recommendations for the application of biostatistical methods during the development and validation of alternative toxicological methods: ECVAM biostatistics task force report 1
Barnthouse et al. Quantifying natural resource injuries and ecological service reductions: Challenges and opportunities
CN114034334A (zh) 岩溶管道污染源和流量的识别方法
KR20230072088A (ko) 인공지능기반 유해화학물질 오염영향 평가 시스템
Bauer et al. A toxicokinetic–toxicodynamic modeling workflow assessing the quality of input mortality data
Pacheco et al. Integrating chemical and biological criteria
Sánchez et al. A software system for the microbial source tracking problem
CN113866375A (zh) 出水含氮物智能在线监测方法和系统
Unluturk et al. Quantifying productivity of individual software programmers: Practical approach
Kmiecik The impact of human errors on the estimation of uncertainty of measurements in water monitoring
CN116522248B (zh) 基于机器学习的核酸异常数据智能研判系统
Shaw When Is' Good'Enough?: Evaluating and Selecting Software Metrics
CN117875573B (zh) 一种基于生物毒性和生物有效性的水环境评价方法和系统
Karthikeyan et al. Design and development of low-cost blood serum analyser using adaptive neuro fuzzy inference system
Guzmán Fernández et al. Prediction of biochemical oxygen demand in mexican surface waters using machine learning
WO2023281901A1 (ja) 維持管理システム
CN116579486A (zh) 土壤有机污染物的迁移及转化预测方法、系统和存储介质