KR102635610B1 - 딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치 - Google Patents
딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치 Download PDFInfo
- Publication number
- KR102635610B1 KR102635610B1 KR1020210070860A KR20210070860A KR102635610B1 KR 102635610 B1 KR102635610 B1 KR 102635610B1 KR 1020210070860 A KR1020210070860 A KR 1020210070860A KR 20210070860 A KR20210070860 A KR 20210070860A KR 102635610 B1 KR102635610 B1 KR 102635610B1
- Authority
- KR
- South Korea
- Prior art keywords
- layer
- data
- seismic
- seismic data
- attention
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013135 deep learning Methods 0.000 title abstract description 14
- 238000009826 distribution Methods 0.000 claims abstract description 19
- 238000010606 normalization Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000013145 classification model Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V1/00—Seismology; Seismic or acoustic prospecting or detecting
- G01V1/28—Processing seismic data, e.g. for interpretation or for event detection
- G01V1/282—Application of seismic models, synthetic seismograms
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V1/00—Seismology; Seismic or acoustic prospecting or detecting
- G01V1/003—Seismic data acquisition in general, e.g. survey design
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V1/00—Seismology; Seismic or acoustic prospecting or detecting
- G01V1/01—Measuring or predicting earthquakes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Geophysics (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geology (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Geophysics And Detection Of Objects (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
Abstract
딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치가 개시된다. 딥러닝을 이용한 지진 데이터 생성 방법은, (a) 가우시안 잡음 분포를 가지는 1-D 샘플 입력 데이터를 기학습된 주의 기반 지진파 생성 모델에 적용하여 지진파 특성이 반영된 3채널 지진 데이터를 생성하는 단계; 및 (b) 상기 3채널 지진 데이터를 상기 주의 기반 지진파 생성 모델에 적용하여 지진 이벤트를 판별하도록 학습하는 단계를 포함한다.
Description
본 발명은 딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치에 관한 것이다.
지진을 정확하게 감지하는 것은 매우 중요한 작업이다. 동일한 감지 알고리즘을 통해 지속 시간이 다른 지진 이벤트를 감지하는 것은 자동화된 지진 감지 방법을 개발하는 연구자들에게는 여전히 어려운 과제로 남아 있다.
그러나, 최근 인공 지능의 발전에 따라 많은 시계열 탐지 작업에 대한 다양한 딥러닝 기술이 적용되고 있다. Thibaut Perol et al. 는 컨볼루션 신경망(CNN)으로 구성된 딥 러닝 알고리즘을 제안했으며, 종래의 유명한 머신 러닝 알고리즘에 비해 더 나은 정확도 성능으로 계산 효율성이 높다는 것을 보여준다. 이외에도, 딥 러닝 알고리즘을 통한 지진 감지에 대한 여러 연구가 선행되고 있다.
이러한 딥러닝을 적용한 기술들은 기존의 머신 러닝 알고리즘과 비교하여 우수한 성능 및 연산 속도를 보여주고 있다. 그러나, 학습 데이터 수량이 부족한 경우 딥러닝 적용 기술들은 overfitting 문제가 발생하게 된다. 즉, 딥러닝 모델의 안정적인 성능 유지를 위해서는 대규모 학습 데이터가 필수적이다.
종래의 경우, 학습 데이터의 간단한 scaling, shifting 및 flipping 같은 다양한 데이터 보강 기술을 적용하여 학습 데이터 부족 문제를 해결하고 있으나, 이러한 방법은 학습에 사용할 수 있는 데이터 다양성을 충분히 제공할 수 없는 문제점이 있다.
본 발명은 딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치를 제공하기 위한 것이다.
또한, 본 발명은 지진의 복잡한 특징이 반영한 다양한 지진 데이터 생성이 가능한 딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치를 제공하기 위한 것이다.
본 발명의 일 측면에 따르면, 딥러닝을 이용한 지진 데이터 생성 방법이 제공된다.
본 발명의 일 실시예에 따르면, (a) 가우시안 잡음 분포를 가지는 1-D 샘플 입력 데이터를 기학습된 주의 기반 지진파 생성 모델에 적용하여 지진파 특성이 반영된 3채널 지진 데이터를 생성하는 단계; 및 (b) 상기 3채널 지진 데이터를 상기 주의 기반 지진파 생성 모델에 적용하여 지진 이벤트를 판별하도록 학습하는 단계를 포함하는 지진 데이터 생성 방법이 제공될 수 있다.
상기 주의 기반 지진파 생성 모델은 생성 모듈과 판별 모듈을 포함하되, 상기 생성 모듈은, 상기 가우시안 잡음 분포를 가지는 1-D 샘플 입력 데이터의 크기를 2-D로 변경하는 제1 FC 레이어; 상기 제1 FC 레이어의 후단에 위치되며, 상기 2-D로 변경된 입력 데이터를 이용하여 특징맵과 지진파 특성이 학습된 어텐션맵을 추출한 후 특징맵과 어텐션 맵을 요소별 곱(element-wise product) 연산하여 지진파 특성이 반영되도록 업 샘플링하여 특징맵을 출력하는 복수의 Gated CNN 레이어; 상기 복수의 Gated CNN 레이어의 후단에 위치되며, 상기 업 샘플링된 특징맵을 3채널로 추출하는 컨볼루션 레이어; 및 상기 컨볼루션 레이어 후단에 위치되며, 상기 3채널 특징맵을 평탄화하여 3채널 지진 데이터를 생성하는 제2 FC 레이어를 포함할 수 있다.
상기 복수의 Gated CNN 레이어는 각각, 컨볼루션 레이어, 픽셀 셔플 레이어, 인스턴스 정규화 레이어를 포함하며, 상기 2-D로 변경된 입력 데이터를 이용하여 특징맵을 추출하는 제1 블록; 컨볼루션 레이어, 픽셀 셔플 레이어, 인스턴스 정규화 레이어를 포함하되, 상기 인스턴스 정규화 레이어를 통과한 출력값을 지진파 특성에 따른 확률값으로 매핑되는 활성화 함수인 시그모이드 연산을 적용하여 어텐션 맵을 추출하는 제2 블록을 포함하되, 상기 제1 블록과 상기 제2 블록의 출력값인 특징맵과 어텐션맵은 요소별 곱(element-wise product) 연산하여 업 샘플링된 특징맵이 출력될 수 있다.
상기 판별 모듈은, 8개의 컨볼루션 레이어와 FC 레이어로 구성되며, 상기 3채널 지진 데이터를 분석하여 지진 이벤트를 판별하도록 학습될 수 있다.
상기 판별 모듈은 실제 지진 데이터를 이용하여 지진 이벤트를 기 학습하되, 상기 실제 지진 데이터는, 센터링 과정(centering)을 통해 지진 데이터의 범위를 일치하도록 전처리될 수 있다.
본 발명의 다른 측면에 따르면, 딥러닝을 이용한 지진 데이터 생성을 위한 장치가 제공된다.
본 발명의 일 실시예에 따르면, 적어도 하나의 명렁어를 저장하는 메모리; 및 상기 메모리에 저장된 명령어를 실행하는 프로세서를 포함하되, 상기 프로세서에 의해 실행된 명령어는, 가우시안 잡음 분포를 가지는 1-D 샘플 입력 데이터를 기학습된 주의 기반 지진파 생성 모델에 적용하여 지진파 특성이 반영된 3채널 1000 샘플 지진 데이터를 생성하는 단계; 및 상기 3채널 1000 샘플 지진 데이터로부터 실제 지진 데이터를 구별하도록 상기 지진파 생성 모델을 적대적 학습하는 단계를 실행하는 것을 특징으로 하는 지진 데이터 생성 장치가 제공될 수 있다.
본 발명의 일 실시예에 따른 딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치를 제공함으로써, 지진의 복잡한 특징이 반영한 다양한 지진 데이터 생성이 가능한 이점이 있다.
도 1은 본 발명의 일 실시예에 따른 지진 데이터 생성 방법을 나타낸 순서도.
도 2는 본 발명의 일 실시예에 따른 생성 모듈의 구조를 도시한 도면.
도 3은 본 발명의 일 실시예에 따른 픽셀 셔플을 통한 재배열을 설명하기 위해 도시한 도면.
도 4는 본 발명의 일 실시예에 따른 지진 데이터 샘플을 예시한 도면.
도 5는 본 발명의 일 실시예에 따른 판별 모듈의 구조를 도시한 도면.
도 6 및 도 7은 종래와 본 발명의 일 실시예에 따른 생성된 지진 데이터를 이용한 성능 비교 결과를 도시한 도면.
도 8은 본 발명의 일 실시예에 따른 지진 데이터 생성 장치의 내부 구성을 개략적으로 도시한 블록도.
도 2는 본 발명의 일 실시예에 따른 생성 모듈의 구조를 도시한 도면.
도 3은 본 발명의 일 실시예에 따른 픽셀 셔플을 통한 재배열을 설명하기 위해 도시한 도면.
도 4는 본 발명의 일 실시예에 따른 지진 데이터 샘플을 예시한 도면.
도 5는 본 발명의 일 실시예에 따른 판별 모듈의 구조를 도시한 도면.
도 6 및 도 7은 종래와 본 발명의 일 실시예에 따른 생성된 지진 데이터를 이용한 성능 비교 결과를 도시한 도면.
도 8은 본 발명의 일 실시예에 따른 지진 데이터 생성 장치의 내부 구성을 개략적으로 도시한 블록도.
본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
이하, 첨부된 도면들을 참조하여 본 발명의 실시예를 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 지진 데이터 생성 방법을 나타낸 순서도이고, 도 2는 본 발명의 일 실시예에 따른 생성 모듈의 구조를 도시한 도면이고, 도 3은 본 발명의 일 실시예에 따른 픽셀 셔플을 통한 재배열을 설명하기 위해 도시한 도면이며, 도 4는 본 발명의 일 실시예에 따른 지진 데이터 샘플을 예시한 도면이고, 도 5는 본 발명의 일 실시예에 따른 판별 모듈의 구조를 도시한 도면이고, 도 6 및 도 7은 종래와 본 발명의 일 실시예에 따른 생성된 지진 데이터를 이용한 성능 비교 결과를 도시한 도면이다.
단계 110에서 지진 데이터 생성 장치(100)는 지진 데이터를 전처리한다. 여기서, 지진 데이터는 주의 기반 지진파 생성 모델의 학습에 이용될 수 있다.
관측소별 특성으로 인해 획득되는 지진 데이터의 범위가 다른 경우들이 발생하며, 이로 인해 딥러닝 모델인 주의 기반 지진파 생성 모델의 학습에 적합하지 않을 수 있다. 따라서, 본 발명의 일 실시예에서는 관측소별로 획득된 지진 데이터에 대해 센터링(centering) 과정을 수행하여 지진 데이터의 범위를 일치시키는 전처리 과정을 수행할 수 있다.
센터링 과정은 기하학적으로 데이터의 군집을 모든 차원에 대해 원점으로 이동시키는 효과를 얻을 수 있다. 본 발명의 일 실시예에 따른 지진 데이터 생성 장치(100)는 수학식 1을 이용하여 지진 데이터를 센터링할 수 있다.
여기서, 는 지진 데이터를 나타내며, M은 하나의 데이터에서 취득하는 총 샘플 수를 나타낸다.
단계 115에서 지진 데이터 생성 장치(100)는 1-D 샘플 입력 데이터를 주의 기반 지진 데이터 생성 모델에 적용하여 지진파 특성이 반영된 3채널 지진 데이터를 생성한다.
본 발명의 일 실시예에 따른 주의 기반 지진 데이터 생성 모델은 GAN(Generative Adversarial Network) 기반 모델로, 생성 모듈(210)과 판별 모듈(220)을 포함한다.
본 발명의 일 실시예에 따른 주의 기반 지진 데이터 생성 모델은 지진파 특성을 학습하고, 이를 기반으로 다양한 지진 데이터를 생성할 수 있다. 주의 기반 지진 데이터 생성 모델은 가우시안 잡음 분포를 실제 지진 데이터 분포에 매핑하도록 학습할 수 있다.
예를 들어, 주의 기반 지진 데이터 생성 모델은 하기 수학식 2의 목적 함수를 만족하도록 학습될 수 있다.
여기서, D는 판별 모듈을 나타내고, G는 생성 모듈을 나타내며, 는 실제 지진 데이터에 대한 확률 분포에서 샘플링한 데이터를 나타내고, 는 가우시안 분포를 사용하는 노이즈에서 샘플링한 데이터를 나타낸다.
와 는 각각 실제 지진 데이터와 생성된 지진 데이터에 대한 판별 모듈을 통한 분류 확률값을 나타낸다.
도 2에는 생성 모듈의 상세 구조가 예시되어 있다. 도 2를 참조하여 생성 모듈(210)에 대해 설명하기로 한다.
도 2에 도시된 바와 같이, 생성 모듈(210)은 제1 FC(Fully connected) 레이어(211), 4개의 Gated CNN 레이어(212 ~ 215), 컨볼루션 레이어(216) 및 제2 FC 레이어(217)를 포함한다.
제1 FC 레이어(211)는 1-D 입력 데이터를 2-D 입력 데이터로 변경한다.
예를 들어, 1-D 입력 데이터는 1-D 100 샘플인 가우시안 노이즈일 수 있다. 1-D 100 샘플인 가우시안 노이즈인 입력 데이터는 제1 FC 레이어(211)를 통해 2-D 64 x 256 사이즈로 변경될 수 있다.
이와 같이 변경된 2-D 샘플 입력 데이터는 4개의 Gated CNN 레이어(212 ~ 215)를 통해 지진파 특성 분포가 반영된 특징맵으로 업 샘플링될 수 있다.
Gated CNN 레이어(212 ~ 215)는 도 2에 도시된 바와 같이, 제1 블록(210a)과 제2 블록(210b)으로 구성된다.
제1 블록(210a)은 2-D 샘플 입력 데이터를 입력받아 컨볼루션 연산을 수행하여 특징맵을 생성할 수 있다. 제1 블록(210a)은 도 2에 도시된 바와 같이, 컨볼루션 레이어, 픽셀 셔플 레이어와 인스턴스 정규화 레이어를 포함한다.
따라서, 2-D 샘플 입력 데이터에 대해 컨볼루션 연산을 적용한 후 PS(periodic shuffling) 연산을 통해 재배열하여 더 높은 해상도의 특징맵 생성이 가능케 할 수 있다. 컨볼루션 레이어의 후단에는 픽셀 셔플 레이어가 위치된다. 픽셀 셔플 레이어는 컨볼루션 레이어의 출력값의 체커 보드(checker board) 문제를 해결할 수 있다. 즉, 픽셀 셔플 레이어를 통해 입력 채널을 PS(periodic shuffling) 연산을 통해 재배열 하여 도 3에 도시된 바와 같이 더 높은 해상도의 특징맵 생성이 가능케 할 수 있다.
픽셀 셔플 레이어의 후단에는 인스턴스 정규화(instance normalization) 레이어가 위치된다.
인스턴스 정규화 레이어는 픽셀 셔플 레이어를 통과한 특징맵에 대한 스타일 변형을 제거할 수 있다. 즉, 인스턴스 정규화 레이어는 특징맵을 직접 정규화하여 물체에 고유한 텍스터와 배경 화면과 같은 스타일 변형을 제거하는 효과가 있다. 인스턴스 정규화 레이어는 입력의 전체 채널을 정규화하는 대신 입력의 각 채널을 통해 정규화할 수 있다.
이와 같이, 픽셀 셔플 레이어를 통과한 특징맵은 인스턴스 정규화 레이어를 통과하며 스타일 변형이 제거될 수 있다.
제2 블록(210b)은 제1 블록(210a)과 마찬가지로 컨볼루션 레이어, 픽셀 셔플 레이어와 인스턴스 정규화 레이어를 포함한다. 제2 블록(210b)은 제1 블록(210a)과 달리 확률값으로 매핑된 활성화 함수인 시그모이드 함수를 더 포함한다.
따라서, 제2 블록(210b)은 2-D 샘플 입력 데이터를 입력받아 컨볼루션 연산의 결과값에 대해 확률값으로 매핑된 활성화 함수인 시그모이드 함수가 적용되어 지진파 특성 분포가 반영된 어텐션 맵이 생성될 수 있다.
제1 블록(210a)과 제2 블록(210b)에 의해 출력된 특징맵과 어텐션 맵을 요소별 곱(element-wise product)을 통해 특징맵을 출력할 수 있다.
본 발명의 일 실시예에서는 64 x 256 2-D 샘플 데이터에 지진파 특성 분포를 반영하여 1024 크기의 지진 데이터를 생성하므로, 4개의 Gated CNN 레이어(212 ~ 215)가 구비되는 것을 가정하나, 출력하고자 하는 지진 데이터의 크기가 달라지는 경우 생성 모듈(210)에 포함되는 Gated CNN 레이어의 개수가 상이할 수 있음은 당연하다.
다시 정리하면, Gated CNN 레이어(212 ~ 215)는 하나의 컨볼루션 과정의 출력값을 활성화 함수인 sigmoid 함수를 통해 다른 컨볼루션 과정의 출력값과 요소별 곱(element-wise product)를 통해 특징값을 출력한다.
이를 수학식으로 나타내면, 수학식 3과 같다.
여기서, X는 입력 데이터를 나타내고, W, V, b, c는 컨볼루션 레이어의 학습 파라미터를 나타내며, 는 sigmoid 함수를 나타낸다.
4개의 Gated CNN 레이어의 후단에는 컨볼루션 레이어(216)가 위치된다. 컨볼루션 레이어(216)를 통해 특징맵이 3채널 특징맵으로 추출될 수 있다. 즉, 4개의 Gated CNN 레이어(212 ~ 215)를 통과한 64 x 256 입력 데이터는 지진파 특성 분포를 가지는 1024 사이즈의 특징맵으로 업 샘플링되어 출력되며, 4개의 Gated CNN 레이어의 후단에 위치한 컨볼루션 레이어(216)를 통과하여 3채널 특징맵으로 출력될 수 있다.
컨볼루션 레이어(216)의 후단에는 제2 FC 레이어(217)가 위치될 수 있다. 이로 인해, 제2 FC 레이어(217)를 통과한 3채널 특징맵은 3채널 1000 샘플 지진 데이터로 출력될 수 있다.
이와 같이, 생성 모듈(210)은 가우시안 노이즈인 샘플 입력 데이터를 입력받아 지진파 특성 분포를 가지는 3채널 1000 샘플 지진 데이터를 생성하여 출력할 수 있다.
단계 120에서 지진 데이터 생성 장치(100)는 3채널 지진 데이터를 상기 주의 기반 지진파 생성 모델에 적용하여 지진 이벤트를 판별하도록 학습한다.
판별 모듈(220)은 실제 지진 데이터를 이용하여 지진파 특성 분포를 기 학습할 수 있다. 판별 모듈(220)의 학습에 이용되는 실제 지진 데이터는 단계 110에서 전처리된 지진 데이터일 수 있다.
본 발명의 일 실시예에서는 2016년 1월에서 2018년 7월까지 관측소에서 획득된 지진 데이터 세트를 이용하여 지진 데이터를 전처리하여 이용한 것을 가정하기로 한다. 지진 데이터 세트에서 지진 이벤트의 크기는 Mw 3.0.보다 크며, 256개 로컬 관측소에서 획득된 연속적인 지상 속도 기록을 사용하고, 3채널에서 100Hz의 샘플 레이트로 지진 신호를 기록할 수 있다. 이때의 전체 지진 발생 건수는 6145건이다.
지진 이벤트 분류를 위해 2개의 클래스로 구분하기로 한다. 제1 클래스는 지진이 없는 노이즈에 해당하고, 제2 클래스는 지진 이벤트에 해당한다. 우리는 지진 데이터에서 10초 길이 윈도우 기준으로 2가지 타입으로 각각의 샘플을 추출할 수 있다. 예를 들어, 지진 이벤트가 포함된 윈도우와 지진 이벤트가 포함되지 않은(즉, 노이즈를 포함하는) 윈도우를 각각 샘플로 추출할 수 있다. 따라서, 각 샘플의 사이즈는 (1000, 3)일 수 있다.
지진 이벤트 윈도우의 시작 지점은 p-도착 시간이다. 샘플은 도 4에 시각적으로 도시되어 있다. 분류 테스트를 위해 지진이 발생하지 않을 때 비-지진 이벤트를 무작위로 샘플링할 수 있다. 지진 이벤트와 노이즈 샘플의 비율은 1:1인 것을 가정하기로 한다.
판별 모듈(220)의 상세 구조는 도 5에 도시되어 있다. 도 5에 도시된 바와 같이, 판별 모듈(220)은 8개의 컨볼루션 레이어(221 ~ 228)와 FC 레이어(229)를 포함하여 구성된다.
8개의 컨볼루션 레이어(221 ~ 228)는 수학식 4와 같이 1D 컨볼루션 연산을 수행하고, 컨볼루션 수행 결과는 수학식 5와 같은 ReLU(Rectified Linear Unit) 함수를 통해 비선형 매핑 과정을 거친다.
컨볼루션 레이어와 ReLU 레이어 사이에 배치 정규화 과정이 수행될 수 있다.
네트워크의 레이어가 증가하면서 gradient vanishing 및 exploding 문제는 딥러닝 네트워크의 주요 쟁점 사항이다. 이러한 문제는 활성화 함수의 변화, 초기화, 학습율(learning rate)을 통해 해결하려는 다양한 시도가 있었다. 배치 정규화 과정은 gradient vanishing /gradient exploding의 문제를 본질적으로 훈련 과정안에서 해결하려는 접근을 취한다.
배치 정규화 과정은 각 레이어마다 입력 분포가 상이해지는 내적 공분산 현상(internal covariance shift)을 막기 위해 각 레이어의 입력 분포를 평균 0, 표준 편차 1의 형태로 정규화시키는 화이트닝(whitening) 방법을 착안하여 고안되었다. 각 특징에 대해 평균과 분산을 구한 후 정규화를 거치며 정규화된 값들에 대해 스케일 계수(scale factor)와 이동 계수(shift factor)를 더해주는 변환 과정을 거치게 된다. 스케일 계수(scale factor)와 이동 계수(shift factor) 파라미터는 미니-배치(mini-batch) 단위로 훈련 과정에서 유도될 수 있다.
본 발명의 일 실시예에서는 성능 분석을 위해 두가지 평가 방법을 사용했다. 직접적으로 합성된 지진을 시각적(visualization) 방법으로 확인하며, 간접적으로 합성된 지진을 지진 분류 모델에 추가해 분류 모델의 성능을 확인하였다.
분류 모델의 성능 측정은 수학식 6과 같이 정확도(Accuracy) 지수를 사용하였다.
정확도 지수는 총 테스트 개수 중에서 정확하게 추정된 결과(TP: true positive, TN: true negative) 개수의 비로 정의될 수 있다.
시각화 측면에서의 성능 비교 결과는 도 6에 도시된 바와 같다. 베이스 라인 구조는 종래의 DCGAN 을 비교 대상으로 하였다. 도 6에서 보여지는 바와 같이, 본 발명의 일 실시예에 따른 지진 데이터 생성 방법이 종래 방법보다 생성된 지진 데이터의 1-D 구조가 진지 지진 데이터와 더 근접한 것을 알 수 있으며, 종래 방법으로 학습한 결과는 모드 축소(mode collapse) 현상이 발생하는 것을 알 수 있다.
분류 모델을 이용한 성능 비교 결과는 도 7에 도시된 바와 같다. 데이터셋 A는 실제 데이터셋과 종래 방법(베이스라인 모델)을 통해 합성한 데이터로 구성되며, 데이터 셋 B는 실제 데이터셋과 본 발명의 일 실시예에 따른 지진 데이터 생성 모델을 통해 합성한 데이터로 구성되어 있다. 데이터셋 A로 분류 모델을 학습한 결과는 실제 데이터셋만 사용해 학습한 결과보다 정확도를 2.94 % 향상 시켰으며 데이터셋 B로 분류 모델을 학습한 결과는 정확도를 6.74 % 향상된 것을 알 수 있다. 즉, 본 발명의 일 실시예에 따른 지진 데이터 생성 방법이 종래 방법보다 지진파 특성을 반영하여 지진 데이터 생성이 가능한 것을 알 수 있다.
도 8은 본 발명의 일 실시예에 따른 지진 데이터 생성 장치의 내부 구성을 개략적으로 도시한 블록도이다.
도 8을 참조하면, 본 발명의 일 실시예에 따른 지진 데이터 생성 장치(100)는 메모리(810) 및 프로세서(820)를 포함하여 구성된다.
메모리(810)는 적어도 하나의 명령어들을 저장한다.
프로세서(820)는 메모리(810)를 제어하며, 메모리에 저장된 명령어를 실행할 수 있다. 프로세서(820)에 의해 실행된 명령어는 주의 기반 지진 데이터 생성 모델을 실행하여 도 1에서 설명한 바와 같은 각각의 단계를 실행할 수 있다.
이에 대해서는 이미 전술한 바와 동일하므로 중복되는 설명은 생략하기로 한다.
본 발명의 실시 예에 따른 장치 및 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야 통상의 기술자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100: 지진 데이터 생성 장치
210: 생성 모듈
220: 판별 모듈
810: 메모리
820: 프로세서
210: 생성 모듈
220: 판별 모듈
810: 메모리
820: 프로세서
Claims (6)
- (a) 가우시안 잡음 분포를 가지는 1-D 샘플 입력 데이터를 기학습된 주의 기반 지진파 생성 모델에 적용하여 지진파 특성이 반영된 3채널 지진 데이터를 생성하는 단계; 및
(b) 상기 3채널 지진 데이터로부터 실제 지진 데이터를 구별하도록 상기 주의 기반 지진파 생성 모델을 적대적 학습하는 단계를 포함하되,
상기 주의 기반 지진파 생성 모델은 생성 모듈과 판별 모듈을 포함하되,
상기 생성 모듈은,
상기 가우시안 잡음 분포를 가지는 1-D 샘플 입력 데이터의 크기를 2-D로 변경하는 제1 FC 레이어;
상기 제1 FC 레이어의 후단에 위치되며, 상기 2-D로 변경된 입력 데이터를 이용하여 특징맵과 지진파 특성이 학습된 어텐션맵을 추출한 후 특징맵과 어텐션 맵을 요소별 곱(element-wise product) 연산하여 지진파 특성이 반영되도록 업 샘플링하여 특징맵을 출력하는 복수의 Gated CNN 레이어;
상기 복수의 Gated CNN 레이어의 후단에 위치되며, 상기 업 샘플링된 특징맵을 3채널로 추출하는 컨볼루션 레이어; 및
상기 컨볼루션 레이어 후단에 위치되며, 상기 3채널 특징맵을 평탄화하여 3채널 지진 데이터를 생성하는 제2 FC 레이어를 포함하며,
상기 판별 모듈은,
8개의 컨볼루션 레이어와 FC 레이어로 구성되며, 상기 3채널 지진 데이터를 분석하여 실제 지진 데이터를 판별하도록 학습되는 것을 특징으로 하는 지진 데이터 생성 방법.
- 삭제
- 제1 항에 있어서,
상기 복수의 Gated CNN 레이어는 각각,
컨볼루션 레이어, 픽셀 셔플 레이어, 인스턴스 정규화 레이어를 포함하며, 상기 2-D로 변경된 입력 데이터를 이용하여 특징맵을 추출하는 제1 블록;
컨볼루션 레이어, 픽셀 셔플 레이어, 인스턴스 정규화 레이어를 포함하되, 상기 인스턴스 정규화 레이어를 통과한 출력값을 지진파 특성에 따른 확률값으로 매핑되는 활성화 함수인 시그모이드 연산을 적용하여 어텐션 맵을 추출하는 제2 블록을 포함하되,
상기 제1 블록과 상기 제2 블록의 출력값인 특징맵과 어텐션맵은 요소별 곱(element-wise product) 연산하여 업 샘플링된 특징맵이 출력되는 것을 특징으로 하는 지진 데이터 생성 방법.
- 삭제
- 제1 항에 있어서,
상기 판별 모듈은 실제 지진 데이터를 이용하여 지진 이벤트를 기 학습하되, 상기 실제 지진 데이터는, 센터링 과정(centering)을 통해 지진 데이터의 범위를 일치하도록 전처리되는 것을 특징으로 하는 지진 데이터 생성 방법.
- 적어도 하나의 명렁어를 저장하는 메모리; 및
상기 메모리에 저장된 명령어를 실행하는 프로세서를 포함하되,
상기 프로세서에 의해 실행된 명령어는,
가우시안 잡음 분포를 가지는 1-D 샘플 입력 데이터를 기학습된 주의 기반 지진파 생성 모델에 적용하여 지진파 특성이 반영된 3채널 1000 샘플 지진 데이터를 생성하는 단계; 및
상기 3채널 1000 샘플 지진 데이터로부터 실제 지진 데이터를 구별하도록 상기 주의 기반 지진파 생성 모델을 적대적 학습하는 단계를 실행하되,
상기 주의 기반 지진파 생성 모델은 생성 모듈과 판별 모듈을 포함하되,
상기 생성 모듈은,
상기 가우시안 잡음 분포를 가지는 1-D 샘플 입력 데이터의 크기를 2-D로 변경하는 제1 FC 레이어;
상기 제1 FC 레이어의 후단에 위치되며, 상기 2-D로 변경된 입력 데이터를 이용하여 특징맵과 지진파 특성이 학습된 어텐션맵을 추출한 후 특징맵과 어텐션 맵을 요소별 곱(element-wise product) 연산하여 지진파 특성이 반영되도록 업 샘플링하여 특징맵을 출력하는 복수의 Gated CNN 레이어;
상기 복수의 Gated CNN 레이어의 후단에 위치되며, 상기 업 샘플링된 특징맵을 3채널로 추출하는 컨볼루션 레이어; 및
상기 컨볼루션 레이어 후단에 위치되며, 상기 3채널 특징맵을 평탄화하여 3채널 지진 데이터를 생성하는 제2 FC 레이어를 포함하며,
상기 판별 모듈은,
8개의 컨볼루션 레이어와 FC 레이어로 구성되며, 상기 3채널 지진 데이터를 분석하여 실제 지진 데이터를 구별하도록 학습되는 것을 특징으로 하는 지진 데이터 생성 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20200090498 | 2020-07-21 | ||
KR1020200090498 | 2020-07-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220011572A KR20220011572A (ko) | 2022-01-28 |
KR102635610B1 true KR102635610B1 (ko) | 2024-02-13 |
Family
ID=80051173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210070860A KR102635610B1 (ko) | 2020-07-21 | 2021-06-01 | 딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102635610B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116520401B (zh) * | 2023-05-18 | 2024-02-27 | 四川鹭羽科技有限公司 | 一种基于注意力机制的地震数据去噪方法 |
CN116958468A (zh) * | 2023-07-05 | 2023-10-27 | 中国科学院地理科学与资源研究所 | 基于SCycleGAN的高山积雪环境模拟方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101919098B1 (ko) | 2017-05-18 | 2018-11-16 | 전남대학교산학협력단 | 지진 감지 시스템 및 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200061307A (ko) * | 2018-11-23 | 2020-06-02 | 고려대학교 산학협력단 | 딥러닝을 이용한 지진 분류 방법 및 장치 |
-
2021
- 2021-06-01 KR KR1020210070860A patent/KR102635610B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101919098B1 (ko) | 2017-05-18 | 2018-11-16 | 전남대학교산학협력단 | 지진 감지 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20220011572A (ko) | 2022-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Environmental sound classification with dilated convolutions | |
Salman et al. | Classification of real and fake human faces using deep learning | |
CN106951753B (zh) | 一种心电信号的认证方法和认证装置 | |
KR102635610B1 (ko) | 딥러닝을 이용한 지진 데이터 생성 방법 및 그 장치 | |
CN109147817B (zh) | 一种基于变异受限玻尔兹曼机的去噪音频特征提取方法 | |
KR102690208B1 (ko) | Ai 기반으로 딥 러닝 네트워크를 학습시키는 방법 및 이를 이용한 학습 장치 | |
Dobrescu et al. | Understanding deep neural networks for regression in leaf counting | |
CN111859010B (zh) | 一种基于深度互信息最大化的半监督音频事件识别方法 | |
CN112365344B (zh) | 一种业务规则自动生成方法和系统 | |
CN114722812A (zh) | 一种多模态深度学习模型脆弱性的分析方法和系统 | |
CN114511710A (zh) | 一种基于卷积神经网络的图像目标检测方法 | |
Ge et al. | Coarse-to-fine foraminifera image segmentation through 3D and deep features | |
CN112464721A (zh) | 微地震事件自动识别方法及装置 | |
Kohlsdorf et al. | An auto encoder for audio dolphin communication | |
CN116612335A (zh) | 一种基于对比学习的少样本细粒度图像分类方法 | |
KR20200061307A (ko) | 딥러닝을 이용한 지진 분류 방법 및 장치 | |
Markert et al. | Visualizing Automatic Speech Recognition--Means for a Better Understanding? | |
CN111581640A (zh) | 一种恶意软件检测方法、装置及设备、存储介质 | |
CN113792141B (zh) | 基于协方差度量因子的特征选择方法 | |
CN105005763A (zh) | 一种基于局部特征信息挖掘的人脸识别方法及系统 | |
KR102635608B1 (ko) | 멀티태스크 딥러닝을 이용한 지진 이벤트 분류 방법 및 장치 | |
CN113705489B (zh) | 基于先验区域知识指导的遥感影像细粒度飞机识别方法 | |
CN115097518A (zh) | 基于模糊聚类u型神经网络的微震到时拾取方法 | |
CN114420133A (zh) | 欺诈语音检测方法、装置、计算机设备以及可读存储介质 | |
CN103745232A (zh) | 基于波段迁移的高光谱图像聚类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |