KR102451552B1 - 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템 - Google Patents

딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템 Download PDF

Info

Publication number
KR102451552B1
KR102451552B1 KR1020210079765A KR20210079765A KR102451552B1 KR 102451552 B1 KR102451552 B1 KR 102451552B1 KR 1020210079765 A KR1020210079765 A KR 1020210079765A KR 20210079765 A KR20210079765 A KR 20210079765A KR 102451552 B1 KR102451552 B1 KR 102451552B1
Authority
KR
South Korea
Prior art keywords
content
data
authenticity
deep learning
module
Prior art date
Application number
KR1020210079765A
Other languages
English (en)
Inventor
강미현
김연희
백현정
유예린
유현선
Original Assignee
강미현
김연희
백현정
유예린
유현선
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강미현, 김연희, 백현정, 유예린, 유현선 filed Critical 강미현
Priority to KR1020210079765A priority Critical patent/KR102451552B1/ko
Application granted granted Critical
Publication of KR102451552B1 publication Critical patent/KR102451552B1/ko

Links

Images

Classifications

    • G06K9/6201
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/40Spoof detection, e.g. liveness detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템이 개시된다. 본 발명의 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템은 플랫폼에 등록되는 딥 러닝 기반의 콘텐츠에 대한 진위를 판단하기 위한 콘텐츠 분석 시스템으로써, 콘텐츠 분석 시스템을 기반으로 진위를 판단하기 위한 대상이 되는 콘텐츠의 데이터가 입력되는 데이터 입력 모듈, 데이터 입력 모듈로 입력되는 데이터에 대한 진위를 판단하기 위해 악의적인 데이터를 기반으로 딥 러닝 모델을 생성하고, 딥 러닝 모델을 이용하여 콘텐츠의 데이터에 대한 진위를 판단하는 진위 여부 탐지 모듈 및 콘텐츠의 데이터에 대하여 판단된 진위의 결과에 기초하여 콘텐츠의 데이터의 처리 방식을 결정하고, 결정된 처리 방식으로 콘텐츠의 데이터를 출력하는 데이터 출력 모듈을 포함한다.

Description

딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템{CONTENT ANALYSIS SYSTEM FOR AUTHENTICITY VERIFYING OF CONTENT BASED ON DEEP LEARNING}
본 발명은 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에 관한 것으로, 더욱 상세하게는 딥 러닝을 기반으로 생성된 이미지 및 영상과 같은 콘텐츠의 진위를 판단하기 위해 콘텐츠를 분석하는 콘텐츠 분석 시스템에 관한 것이다.
최근 딥 러닝과 관련된 기술의 발전에 따라 다양한 이미지나 영상과 같은 콘텐츠가 생성되고 있다. 특히, 딥 러닝과 관련된 기술의 발전에 따라 '딥페이크' 라는 용어가 생겨나게 되었는데, 이는 딥러닝과 페이크의 합성어로 적대 관계 생성 신경망(GAN: Generative Adversarial Network)이라는 기계학습(machine learning) 기술을 사용하여, 새로운 이미지나 영상을 원본 이미지나 영상에 겹쳐지도록 만들어 내는 기술을 의미할 수 있다.
예를 들어, 딥페이크는 인공지능을 활용하여 인간의 이미지나 영상을 합성하는 기술을 의미할 수도 있다. 즉, 딥페이크는 기존에 있던 인물의 얼굴이나, 특정한 부위를 영화의 CG처리한 것과 같이 합성한 영상 편집물을 총칭할 수도 있다. 과거 인물의 사진이나 영상을 조악하게 합성해 게시하던 부분이 디지털 기술과 인공지능의 발전으로 상당히 정교해진 결과라 볼 수 있다. 이와 같은 기술은 합성하고자 하는 인물의 얼굴이 주로 나오는 고화질의 동영상을 딥 러닝하여 대상이 되는 동영상이나 이미지를 프레임의 단위로 합성되는 것일 수 있다.
그러나, 이와 같은 딥페이크는 단순히 일반적인 이미지나 영상의 합성에만 사용되는 것이 아닌 불법적인 음란 콘텐츠나 허위 사실을 담고 있는 뉴스 콘텐츠 등에 사용되고 있어, 많은 사용자들에게 피해를 주고 있는 상황이다. 또한, 딥페이크의 기술은 점차 발전하고 있어 이미지나 영상의 진위를 판단하기 곤란해지고 있으며, 딥페이크로 생성된 콘텐츠가 매우 정교해짐에 따라 해당 콘텐츠의 진위를 판단하기 다소 어려운 문제가 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 일 목적은 딥 러닝을 기반으로 생성된 이미지 및 영상과 같은 콘텐츠의 진위를 판단하기 위해 콘텐츠를 분석하는 콘텐츠 분석 시스템을 제공하는 데 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은 딥 러닝을 기반으로 생성된 이미지 및 영상과 같은 콘텐츠의 진위를 판단하기 위해 콘텐츠를 분석하는 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 제공하는 데 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템은 플랫폼에 등록되는 딥 러닝 기반의 콘텐츠에 대한 진위를 판단하기 위한 콘텐츠 분석 시스템으로써, 콘텐츠 분석 시스템을 기반으로 진위를 판단하기 위한 대상이 되는 콘텐츠의 데이터가 입력되는 데이터 입력 모듈, 데이터 입력 모듈로 입력되는 데이터에 대한 진위를 판단하기 위해 악의적인 데이터(adversarial example)를 적용하여 딥 러닝을 기반으로 딥 러닝 모델을 생성하고, 딥 러닝 모델을 이용하여 콘텐츠의 데이터에 대한 진위를 판단하는 진위 여부 탐지 모듈 및 콘텐츠의 데이터에 대하여 판단된 진위의 결과에 기초하여 콘텐츠의 데이터의 처리 방식을 결정하고, 결정된 처리 방식으로 콘텐츠의 데이터를 출력하는 데이터 출력 모듈을 포함한다.
여기서, 상기 데이터 입력 모듈은 상기 콘텐츠 분석 시스템을 기반으로 진위를 판단하기 위한 대상이 되는 이미지 데이터 및 영상 데이터 중 하나인 콘텐츠의 데이터가 입력될 수 있다.
여기서, 상기 진위 여부 탐지 모듈은 상기 콘텐츠의 시스템을 통해 진위를 판단하기 위한 학습 콘텐츠의 데이터에 대하여 CNN(convolution neural network)을 기반으로 1차적으로 학습을 수행하는 제1 딥 러닝 모듈 및 진위 여부 탐지 모듈의 정확성을 높이기 위해 제1 딥 러닝 모듈을 통해 1차적으로 학습된 1차 학습 데이터에 대하여 악의적인 데이터를 적용하여 2차적으로 학습을 수행하는 제2 딥 러닝 모듈을 포함할 수 있다.
여기서, 상기 악의적인 데이터는 상기 딥 러닝 모델의 결과로 출력되는 데이터에 대하여 영향을 주는 악의적인 공격(adversarial attack)을 기반으로 생성되는 노이즈(noise) 타입의 데이터일 수 있다.
여기서, 상기 데이터 출력 모듈은 상기 콘텐츠의 데이터에 대한 진위 여부가 참(truth)인 것으로 판단되는 경우, 콘텐츠 분석 시스템의 플랫폼에 포함된 데이터베이스에 콘텐츠의 데이터를 저장하는 데이터 저장 모듈 및 콘텐츠의 데이터에 대한 진위 여부가 거짓(false)인 것으로 판단되는 경우, 콘텐츠 분석 시스템의 플랫폼에 콘텐츠의 데이터가 저장되지 않도록 콘텐츠의 데이터를 차단하는 데이터 차단 모듈을 포함할 수 있다.
본 발명에 의하면, 딥 러닝을 기반으로 생성된 이미지나 영상과 같은 콘텐츠에 대한 진위를 명확히 판단할 수 있고, 이를 통해 거짓 콘텐츠를 차단하거나 별도의 콘텐츠를 감시하거나 관리하는 플랫폼이나 시스템 등으로 전달할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템이 적용되는 환경의 일 예를 도시한 개념도이다.
도 2는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템이 적용되는 환경의 다른 예를 도시한 개념도이다.
도 3은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 수행하는 콘텐츠 분석 장치에 대한 하드웨어 블록도이다.
도 4는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템을 도시한 개념도이다.
도 5는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에 포함된 진위 여부 탐지 모듈을 도시한 개념도이다.
도 6은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에 포함된 진위 여부 탐지 모듈에서 수행되는 학습 방법을 도시한 개념도이다.
도 7은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에서 사용되는 악의적인 데이터의 예를 도시한 개념도이다.
도 8은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에 포함된 데이터 출력 모듈을 도시한 개념도이다.
도 9는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 도시한 흐름도이다.
도 10은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 데이터 처리 방식 결정 방법을 도시한 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
본 발명에서 언급되는 'ADDS(automatic deepfake detection system)'은 딥 러닝을 기반으로 생성된 이미지 및 영상에 대하여 진위 여부를 탐지 및 판별하는 시스템의 명칭을 의미할 수 있으며, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 명칭을 의미할 수 있다. 또한, 본 발명에서 언급되는 '딥페이크', '딥페이크 이미지' 및 '딥페이크 영상' 등은 딥 러닝을 기반으로 생성된 이미지 및 영상 중에서 악의적인 목적을 가지고 생성된 거짓 이미지 및 거짓 영상과 같은 콘텐츠를 의미할 수 있다.
또한, 본 발명에서 언급되는 '탐지' 및 '판별' 은 복수의 구성들에서 특정한 목적을 가지도록 미리 설정된 기준에 부합되지 않는 구성을 구분하여 판단하는 과정 등을 의미할 수 있으며, 설명하는 과정에서 서로 유사하거나 동일한 의미로 사용될 수 있다. 또한, 본 발명에서 언급되는 '콘텐츠'는 이미지 및 영상과 같은 데이터를 의미할 수 있으나, 반드시 이에 한정되는 것은 아닐 수도 있다.
도 1은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템이 적용되는 환경의 일 예를 도시한 개념도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템은 다양한 환경에 적용될 수 있으나, 그 다양한 환경 중 콘텐츠 분석 시스템이 적용되는 일 예를 확인할 수 있다.
먼저, 콘텐츠 분석 시스템은 콘텐츠가 등록될 수 있는 플랫폼과 연동될 수 있고, 해당 플랫폼에는 복수의 플랫폼 사용자들에 의해 다양한 콘텐츠가 등록될 수 있다. 이때, 복수의 플랫폼 사용자들 중 하나인 어느 하나의 플랫폼 사용자는 플랫폼의 프론트엔드(frontend)를 통해 콘텐츠를 등록할 수 있으며, 이와 같은 과정에서 '딥페이크 영상' 이 플랫폼에 등록하기 위해 입력될 수 있다.
이때, 콘텐츠 분석 시스템의 플랫폼 상 프론트엔드는 플랫폼 사용자가 플랫폼에 직접적으로 접근할 수 있는 웹페이지 등과 같은 인터페이스(interface)를 의미할 수 있다. 또한, 플랫폼 사용자가 플랫폼에 등록하기 위해 프론트엔드로 입력하는 '딥페이크 영상' 은 미리 설명된 바와 같이 딥 러닝을 기반으로 생성된 영상을 의미할 수 있고, 본 발명에서는 악의적인 목적을 가지고 생성된 콘텐츠로 '탐지' 또는 '선별'의 대상이 되는 콘텐츠를 의미할 수 있다.
이후, 콘텐츠 분석 시스템은 플랫폼의 프론트엔드로 입력된 '딥페이크 영상'에 대하여 'ADDS'의 딥페이크 탐지 모델을 기반으로 '딥페이크 영상'의 해당 여부를 판단할 수 있다. 여기서, '딥페이크 탐지 모델'은 본 발명에서 콘텐츠의 데이터에 대하여 '딥페이크'의 해당 여부를 판단하기 위해 미리 학습된 모델을 의미할 수 있다.
이때, 콘텐츠 분석 시스템은 플랫폼의 프론트엔드로 입력된 콘텐츠의 데이터가 데이터베이스와 관련된 처리(예를 들어, 데이터베이스에 저장 또는 데이터베이스에 저장되지 않도록 차단 처리 등)를 수행하는 데이터 액세스 계층(data acces layer)으로 진입되기 전에 'ADDS'의 딥페이크 탐지 모델을 기반으로 '딥페이크'의 해당 여부가 확인되도록 동작할 수 있다. 또한, 콘텐츠 분석 시스템은 'ADDS'의 딥페이크 탐지 모델을 기반으로 '딥페이크 영상'의 해당 여부에 대한 판단 결과가 나오지 않은 상황에서는 임시적으로 콘텐츠의 데이터를 데이터베이스에 저장할 수 있다.
이후, 콘텐츠 분석 시스템은 '딥페이크 영상'이 '딥페이크'에 해당하지 않는 것으로 판단된 경우(즉, 결론적으로'딥페이크 영상'이 아닌 것으로 판단된 경우), 해당 콘텐츠의 데이터를 데이터베이스에 안정적으로 저장할 수 있다. 그러나, 콘텐츠 분석 시스템은 '딥페이크 영상' 이 '딥페이크'에 해당하는 것으로 판단된 경우, '딥페이크 영상'을 플랫폼의 프론트엔드로 입력한 플랫폼 사용자를 차단할 수 있다. 이후, 콘텐츠 분석 시스템은 '딥페이크'에 대항하는 콘텐츠를 처리하는 관리자인 '유해물 처리 담당자'에게 '딥페이크 영상'을 전송할 수 있다.
이후, 콘텐츠 분석 시스템과 미리 연동된 '유해물 처리 담당자'의 관리자 장치는 데이터베이스에 임시적으로 저장된 '딥페이크 영상'을 삭제할 수 있고, '딥페이크 영상'을 플랫폼의 프론트엔드로 입력한 플랫폼 사용자가 추가적인 콘텐츠를 입력하지 못하도록 해당 플랫폼 사용자를 차단하는 등의 방식으로 처리할 수 있다.
도 2는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템이 적용되는 환경의 다른 예를 도시한 개념도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템은 다양한 환경에 적용될 수 있으나, 그 다양한 환경 중 도 1과는 다른 방식으로 콘텐츠 분석 시스템이 적용되는 일 예를 확인할 수 있다.
먼저, 콘텐츠 분석 시스템은 플랫폼을 기반으로 사용자의 단말인 사용자 단말로부터 수신되는 콘텐츠에 대한 진위를 판단하여 결과를 사용자 단말에게 출력할 수 있다.
구체적으로, 콘텐츠 분석 시스템은 콘텐츠의 진위 여부를 판단하기 위해 사용되는 데이터가 구축된 데이터베이스를 포함할 수 있다. 예를 들어, 콘텐츠 분석 시스템에 의해 구축되는 데이터는 '딥페이크'를 탐지하기 위한 데이터 셋(data set)을 의미할 수 있다. 다시 말해, 데이터베이스는 이와 같은 딥페이크'를 탐지하기 위한 데이터 셋(data set)이 저장된 데이터베이스를 의미할 수 있다.
또한, 콘텐츠 분석 시스템은 콘텐츠에 대한 진위를 판단(즉, 콘텐츠에 대한 '딥페이크'의 해당 여부를 판단)하기 위한'딥페이크 탐지 모델'을 서버에 포함되도록 하여 구축할 수 있다. 예를 들어, 콘텐츠 분석 시스템은 GPU 서버와 같은 장치에 '딥페이크 탐디 모델'이 포함되도록 구축할 수 있다.
이와 같은 형태로 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템은 사용자 단말이 플랫폼을 기반으로 'ADDS'에 접속되는 것을 확인할 수 다. 즉, 사용자 단말은 플랫폼을 기반으로 콘텐츠에 대한 진위 여부를 판단하기 위해 'ADDS'에 접속할 수 있다. 이후, 콘텐츠 분석 시스템은 사용자 단말에 의해 플랫폼으로 전송, 업로드, 등록된 콘텐츠(예를 들어, 이미지 또는 영상)에 대한 진위 여부를 '딥페이크 탐지 모델'을 기반으로 탐지할 수 있다.
이후, 콘텐츠 분석 시스템은 '딥페이크 탐지 모델'을 기반으로 탐지된 콘텐츠에 대한 진위 여부의 결과를 플랫폼을 통해 사용자 단말로 전송할 수 있다. 예를 들어, 콘텐츠 분석 시스템은 플랫폼에서 제공하는 온라인 웹 페이지 또는 모바일 앱 페이지를 통해 콘텐츠에 대한 진위 여부의 결과를 출력함으로써 사용자 단말에게 제공할 수 있다.
즉, 콘텐츠 분석 시스템은 콘텐츠에 대한 진위 여부의 결과가 '참(truth)'인 경우, 콘텐츠가 '딥페이크'에 해당되지 않는다는 결과를 출력할 수 있다. 또한, 콘텐츠 분석 시스템은 콘텐츠에 대한 진위 여부의 결과가 '거짓(false)'인 경우, 콘텐츠가 '딥페이크'에 해당한다는 결과를 출력할 수 있다.
도 3은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 수행하는 콘텐츠 분석 장치에 대한 하드웨어 블록도이다.
도 3을 참조하면, 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 수행하는 콘텐츠 분석 장치(100)는 도 1 내지 도 2를 참조하여 설명된 콘텐츠 분석 시스템과 관련된 서버 등을 의미할 수 있으며, 이를 콘텐츠 분석 장치라 칭할 수 있다.
본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 수행하는 콘텐츠 분석 장치(100)는 적어도 하나의 프로세서(processor, 110) 및 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory, 120)를 포함할 수 있다.
여기서, 적어도 하나의 프로세서(110)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 일 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 메모리(120) 및 저장 장치(160) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(120)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나로 구성될 수 있다.
또한, 콘텐츠 분석 장치(100)는 무선 네트워크를 통해 통신을 수행하는 송수신 장치(transceiver)(130)를 포함할 수 있다. 또한, 콘텐츠 분석 장치(100)는 입력 인터페이스 장치(140), 출력 인터페이스 장치(150) 및 저장 장치(160) 등을 더 포함할 수 있다. 상권 분석 장치(100)에 포함된 각각의 구성 요소들은 버스(bus)(170)에 의해 연결되어 서로 통신을 수행할 수 있다.
여기서, 적어도 하나의 단계는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법과 관련된 단계를 의미할 수 있고, 더욱 상세하게는 콘텐츠 분석 장치(100)에서 수행되는 동작 방법과 관련된 단계를 포함할 수 있다.
이하에서는 도 3을 참조하여 설명된 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 수행하는 콘텐츠 분석 장치가 도 4 내지 도 8을 참조하여 콘텐츠 방법의 수행을 위한 각 기능에 따라 구분될 수 있는 요소에 기초하여 설명될 수 있다.
특히, 도 4 내지 도 8을 참조하여 설명되는 복수의 요소들은 물리적인 요소를 의미할 수 있으나, 반드시 이에 한정되는 것은 아닐 수 있다. 즉, 도 4 내지 도 8을 참조하여 설명되는 복수의 요소들은 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 수행하기 위한 각 기능에 따라 구분된 것으로 물리적인 요소가 아닌 논리적인 요소를 의미할 수도 있다.
도 4는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템을 도시한 개념도이다.
도 4를 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템은 콘텐츠 분석 방법을 수행하기 위한 콘텐츠 분석 장치(200)를 포함할 수 있으며, 콘텐츠 분석 장치(200)와 통신을 수행 가능한 복수의 장치들과 서로 연동되어 동작할 수 있다. 다시 말해, 콘텐츠 분석 시스템은 콘텐츠 분석 장치(200)를 포함하고, 콘텐츠 분석 방법을 수행하기 위해 요구되는 기능을 수행 가능하며 콘텐츠 분석 장치(200)와 통신을 수행 가능한 복수의 장치들을 더 포함할 수 있다.
먼저, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)는 콘텐츠 분석 방법을 수행하기 위한 각 기능에 기초하여 구분될 수 있는 데이터 입력 모듈(210), 프레임 추출 모듈(220), 이미지 분류 모듈(230), 특징 추출 모듈(240), 진위 여부 탐지 모듈(250) 및 데이터 출력 모듈(260)을 포함할 수 있다.
구체적으로, 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 데이터 입력 모듈(210)은 콘텐츠 분석 시스템을 기반으로 진위를 판단하기 위한 대상이 되는 콘텐츠의 데이터를 수신할 수 있다. 다시 말해, 데이터 입력 모듈(210)은 도 1 내지 도 2를 참조하여 설명된 바와 같이 콘텐츠 분석 시스템의 플랫폼으로 등록되거나 업로드되는 콘텐츠의 데이터를 수신하는 모듈을 의미할 수 있다.
이때, 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 데이터 입력 모듈(210)로 입력되는 콘텐츠의 데이터는 콘텐츠 분석 시스템을 기반으로 진위를 판단하기 위한 대상이 되는 이미지 데이터 및 영상 데이터 중 하나인 콘텐츠의 데이터를 의미할 수 있다. 예를 들어, 데이터 입력 모듈은 라이브러리 임포트(library import) 기능, 데이터 로드 기능 및 데이터 전처리 기능을 수행할 수 있으며, 이를 위해 사용되는 라이브러리는 넘파이(Numpy) 및 OpenCV(Open Source Computer Vision) 등이 포함될 수 있다.
또한, 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 프레임 추출 모듈(220)은 콘텐츠의 데이터에 대한 진위를 판단하기 위해 콘텐츠의 데이터에 포함된 프레임을 추출할 수 있다. 구체적으로, 프레임 추출 모듈(220)은 콘텐츠가 이미지인 경우, 이미지에 대한 프레임을 추출할 수 있고, 콘텐츠가 영상인 경우, 영상에 포함된 복수의 프레임들을 추출할 수 있다. 예를 들어, 프레임 추출 모듈(220)에서 사용되는 라이브러리는 OpenCV, matplotlib 및 넘파이 등이 포함될 수 있다.
또한, 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 이미지 분류 모듈(230)은 콘텐츠의 데이터에 포함된 이미지를 분류할 수 있다. 구체적으로, 이미지 분류 모듈(230)은 콘텐츠의 데이터에 포함된 이미지를 미리 설정된 특징에 기초하여 분류할 수 있다. 예를 들어, 이미지 분류 모듈은(230)은 콘텐츠의 데이터에 포함된 이미지에서 인물의 전면 얼굴을 탐지하도록 미리 설정될 수 있고, 이를 통해 인물의 전면 얼굴이 포함된 이미지를 분류할 수 있다. 또한, 이미지 분류 모듈(230)은 정적인 이미지를 추출하도록 미리 설정된 수 있고, 이를 통해 콘텐츠의 데이터에 포함된 정적인 이미지를 추출할 수 있다. 또한, 이미지 분류 모듈(230)에서 사용되는 라이브러리는 efficientNet, Pytorch 및 OpenCV 등이 포함될 수 있다.
또한, 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 특징 추출 모듈(240)은 콘텐츠의 데이터로부터 추출되거나 분류된 이미지에 대한 특징을 추출할 수 있으며, 추출되는 특징은 콘텐츠의 데이터를 분석하거나 콘텐츠에 대한 진위를 판단하기 위해 사용되는 특징으로 미리 설정될 수 있다. 예를 들어, 특징 추출 모듈(240)에서 사용되는 라이브러리는 OpenCV, matplotlib 및 Pytorch 등을 포함할 수 있다.
또한, 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 진위 여부 탐지 모듈(250)은 데이터 입력 모듈(210)로 입력된 콘텐츠의 데이터에 대한 진위를 판단하거나 탐지할 수 있다. 구체적으로, 진위 여부 탐지 모듈(250)은 콘텐츠의 데이터에 대한 진위를 판단하거나 탐지하기 위해 딥 러닝 기반의 모델을 정의하는 기능, 데이터를 학습하는 기능(예를 들어, '딥페이크' 탐지를 위한 데이터의 학습 등) 및 학습된 결과에 대하여 검증을 수행하는 기능을 수행할 수 있다. 예를 들어, 진위 여부 탐지 모듈(250)에서 사용되는 라이브러리는 Pytorch 및 EfficientNet 등을 포함할 수 있고, 검증을 위한 알고리즘으로는 K겹 교차 검증(K-fold Cross Validation) 기반의 알고리즘이 사용될 수 있다.
한편, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 진위 여부 탐지 모듈(250)은 콘텐츠에 대한 진위를 판단하기 위한 딥 러닝 기반의 모델을 정의할 수 있으며, 정의된 딥 러닝 기반의 모델을 기반으로 학습을 수행함으로써 콘텐츠에 대한 진위를 판단하기 위한 딥 러닝 기반의 모델이 사용될 수 있는데, 이는 이하에서 도 5를 참조하여 보다 상세하게 설명될 수 있다.
도 5는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에 포함된 진위 여부 탐지 모듈을 도시한 개념도이다.
도 5를 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 진위 여부 탐지 모듈(250)은 제1 딥러닝 모듈(251) 및 제2 딥 러닝 모듈(252)을 포함할 수 있다.
구체적으로, 콘텐츠 분석 장치(200)의 진위 여부 탐지 모듈(250)에 포함된 제1 딥 러닝 모듈(251)은 콘텐츠의 시스템을 통해 진위를 판단하기 위한 학습 콘텐츠의 데이터에 대하여 CNN(convolution neural network)을 기반으로 1차적으로 학습을 수행할 수 있다.
다시 말해, 제1 딥 러닝 모듈(251)은 CNN을 기반으로 딥 러닝을 수행하는 CNN 모델을 포함할 수 있고, 이를 통해 콘텐츠의 데이터에 대한 진위를 판단하기 위해 학습 콘텐츠의 데이터를 학습할 수 있다. 예를 들어, 제1 딥 러닝 모듈(251)은 서로 다른 타입을 가지는 복수의 인물들의 얼굴 이미지 및 '딥페이크'에 해당하는 영상이 포함된 데이터인 학습 콘텐츠의 데이터를 학습할 수 있다. 이때, 제1 딥러닝 모듈(251)은 인물의 성별, 인종 및 나이 등 특정한 파라미터가 영향을 주지 않도록 비교적 균등한 비율을 가지는 학습 콘텐츠의 데이터를 기반으로 학습될 수 있으며, 교차 검증 알고리즘을 통해 검증을 수행할 수 있다.
또한, 콘텐츠 분석 장치(200)의 진위 여부 탐지 모듈(250)에 포함된 제2 딥 러닝 모듈(252)은 진위 여부 탐지 모듈의 정확성을 높이기 위해 제1 딥 러닝 모듈(251)을 통해 1차적으로 학습된 1차 학습 데이터에 대하여 악의적인 데이터(adversarial example)를 적용하여 2차적으로 학습을 수행할 수 있다.
여기서, 악의적인 데이터는 딥 러닝 모델의 데이터에 대하여 영향을 주는 악의적인 공격(adversarial attack)을 기반으로 생성되는 노이즈(noise) 타입의 데이터를 의미할 수 있다. 구체적으로, 콘텐츠 분석 장치(200)의 진위 여부 탐지 모듈(250)에 포함된 제2 딥 러닝 모듈(252)의 동작은 이하에서 도 6 내지 도 7을 참조하여 보다 상세하게 설명될 수 있다.
도 6은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에 포함된 진위 여부 탐지 모듈에서 수행되는 학습 방법을 도시한 개념도이고, 도 7은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에서 사용되는 악의적인 데이터의 예를 도시한 개념도이다.
도 6을 참조하면, 콘텐츠 분석 장치(200)의 진위 여부 탐지 모듈(250)에 포함된 제2 딥 러닝 모듈(252)은 콘텐츠의 진위 여부를 탐지하기 위한 딥 러닝 기반의 모델을 포함할 수 있고, 이는 제1 딥 러닝 모듈(251)을 통해 학습된 1차 학습 데이터에 대하여 2차적으로 학습을 수행할 수 있다.
예를 들어, 제2 딥 러닝 모듈(252)에 포함된 딥 러닝 기반의 모델은 '딥페이크 탐지 모델'을 의미할 수 있고, '딥 페이크 탐지 모델'은 1차 학습 데이터를 의미할 수 있는 '학습 데이터' 및 '딥페이크'에 해당하는 영상이 포함된 데이터인 테스트 데이터를 기반으로 학습을 수행할 수 있다.
이때, 제2 딥 러닝 모듈(252)는 콘텐츠의 진위 여부를 탐지하기 위한 딥 러닝 기반의 모델인 '딥페이크 탐지 모델'에 대하여 악의적인 공격을 수행할 수 있고, 이를 통해 생성된 악의적인 데이터를 적용할 수 있다. 여기서, 악의적인 공격은 FGSM 공격(fast gradient sign method attack)을 의미할 수 있고, 이와 같은 공격을 기반으로 악의적인 데이터가 생성될 수 있다.
구체적으로, 악의적인 공격을 기반으로 생성되는 악의적인 데이터는 딥 러닝 기반의 모델 내에서 데이터를 잘못 분류하도록 하는 데이터를 의미할 수 있으며, 육안으로는 정상적인 콘텐츠의 데이터와 거의 차이가 없는 것으로 확인될 수 있으나, 딥 러닝 기반의 모델 내에서는 정확하게 식별하지 못할 수 있다.
특히, FGSM 공격은 화이트 박스(white box) 타입의 공격 방식에 포함될 수 있으며, 화이트 박스 공격이란 공격자가 공격 대상 모델의 모든 파라미터 값(예를 들어, 아키텍처(architecture), 입력, 출력 및 가중치 등)에 접근할 수 있다는 가정 하에 이루어지는 공격을 의미할 수 있다.
예를 들어, FGSM 공격은 도 7를 참조하면 원본 이미지에 특정한 왜곡을 추가하는 경우, 딥 러닝 기반의 모델 내에서 원본 이미지에 대한 분류의 정확성을 현저하게 낮출 수 있다. 다시 말해, 도 7(a)가 원본 이미지이고, 도 7(a)의 원본 이미지에 도 7(b)와 같이 크게 부각되지 않을 수 있는 미리 설정된 값인 '0.007'을 노이즈 데이터(즉, 노이즈 이미지)에 곱하여 도 7(c)와 같은 악의적인 데이터를 생성할 수 있다. 이와 같은 경우, 딥 러닝 기반의 모델은 도 7(c)에 대하여 분류를 정확하게 수행하지 못할 가능성이 매우 높아질 수 있다.
그러나, 본 발명의 콘텐츠 분석 장치(200)의 진위 여부 탐지 모듈(250)에 포함된 제2 딥 러닝 모듈(252)은 미리 설명된 바와 같이 FGSM 공격을 기반으로 생성된 악의적인 데이터에 대하여 미리 학습을 수행할 수 있고, 제2 딥 러닝 모듈(252)에 포함된 딥 러닝 기반의 모델(즉, '딥페이크 탐지 모델')은 콘텐츠에 대한 진위 여부를 보다 정확히 판단할 수 있다.
다시 도 4를 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 데이터 출력 모듈(260)은 콘텐츠의 데이터에 대하여 판단된 진위의 결과에 기초하여 콘텐츠의 데이터에 대한 처리 방식을 결정할 수 있고, 결정된 처리 방식으로 콘텐츠의 데이터를 출력할 수 있다.
여기서, 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 데이터 출력 모듈(260)에서 콘텐츠의 데이터에 대하여 판단된 진위의 결과에 기초하여 콘텐츠의 데이터에 대한 처리 방식을 결정할 수 있고, 결정된 처리 방식으로 콘텐츠의 데이터를 출력하는 구체적인 방법은 이하에서 도 8을 참조하여 보다 상세하게 설명될 수 있다.
도 8은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템에 포함된 데이터 출력 모듈을 도시한 개념도이다.
도 8을 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에 포함된 데이터 출력 모듈(260)은 데이터 저장 모듈(261) 및 데이터 차단 모듈(262)를 포함할 수 있다.
구체적으로, 콘텐츠 분석 장치(200)의 데이터 출력 모듈(260)에 포함된 데이터 저장 모듈(261)은 콘텐츠의 데이터에 대한 진위 여부가 참(truth)인 것으로 판단되는 경우, 콘텐츠 분석 시스템의 플랫폼에 포함된 데이터베이스에 콘텐츠의 데이터를 저장할 수 있다.
즉, 데이터 저장 모듈(261)은 진위 여부 탐지 모듈(250)에 의해 판단된 콘텐츠의 데이터에 대한 진위 여부의 결과를 진위 여부 탐지 모듈(250)로부터 수신할 수 있다. 이후, 데이터 저장 모듈(261)은 진위 여부 탐지 모듈(250)로부터 수신된 진위 여부의 결과가 참인 것으로 확인되는 경우, 해당 콘텐츠의 데이터를 플랫폼에 포함된 데이터베이스에 저장되도록 동작할 수 있다. 예를 들어, 콘텐츠의 데이터에 대한 진위 여부의 결과가 참이라는 의미는 해당 콘텐츠의 데이터가 '딥페이크'에 해당되지 않음을 의미할 수 있다.
또한, 콘텐츠 분석 장치(200)의 데이터 출력 모듈(270)에 포함된 데이터 차단 모듈(262)은 콘텐츠의 데이터에 대한 진위 여부가 거짓(false)인 것으로 판단되는 경우, 콘텐츠 분석 시스템의 플랫폼에 콘텐츠의 데이터가 저장되지 않도록 콘텐츠의 데이터를 차단할 수 있다.
즉, 데이터 차단 모듈(262)은 진위 여부 탐지 모듈(250)에 의해 판단된 콘텐츠의 데이터에 대한 진위 여부의 결과를 진위 여부 탐지 모듈(250)로부터 수신할 수 있다. 이후, 데이터 차단 모듈(260)은 진위 여부 탐지 모듈(250)로부터 수신된 진위 여부의 결과가 거짓인 것으로 확인되는 경우, 해당 콘텐츠의 데이터를 차단하여 플랫폼에 포함된 데이터베이스에 저장되지 않도록 동작할 수 있다. 예를 들어, 콘텐츠의 데이터에 대한 진위 여부의 결과가 거짓이라는 의미는 해당 콘텐츠의 데이터가 '딥페이크'에 해당됨을 의미할 수 있다.
여기서, 데이터 출력 모듈(260)에 포함된 데이터 저장 모듈(261) 및 데이터 차단 모듈(262)은 콘텐츠의 데이터에 대한 진위 여부의 결과를 진위 여부 탐지 모듈(250)로부터 모두 수신하여 확인하는 것으로 설명되었으나, 반드시 이에 한정되는 것은 아닐 수 있다. 다시 말해, 진위 여부 탐지 모듈(250)은 콘텐츠의 데이터에 대한 진위 여부를 판단한 후 판단된 진위 여부의 결과에 기초하여 데이터 출력 모듈(260)에 포함된 데이터 저장 모듈(261) 및 데이터 차단 모듈(262) 중 하나로 진위 여부의 결과를 전송할 수도 있다.
예를 들어, 진위 여부 탐지 모듈(250)은 콘텐츠의 데이터에 대하여 판단된 진위 여부의 결과가 참인 것으로 확인된 경우, 해당 콘텐츠의 데이터에 대하여 판단된 진위 여부의 결과를 데이터 저장 모듈(261)로만 전송할 수 있다. 반면, 진위 여부 탐지 모듈(250)은 콘텐츠의 데이터에 대하여 판단된 진위 여부의 결과가 거짓인 것으로 확인된 경우, 해당 콘텐츠의 데이터에 대하여 판단된 진위 여부의 결과를 데이터 차단 모듈(262)로만 전송할 수도 있다.
이와 같은 방법을 통해 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)는 플랫폼에 등록되는 콘텐츠의 데이터에 대한 진위 여부(즉, '딥페이크'의 해당 여부)를 판단 및 탐지할 수 있다.
또한, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)는 콘텐츠의 데이터에 대한 진위 여부가 참인 콘텐츠의 데이터만 플랫폼의 데이터베이스에 저장될 수 있도록 동작하고, 콘텐츠의 데이터에 대한 진위 여부가 거짓인 콘텐츠의 데이터는 플랫폼의 데이터베이스에 저장되지 않도록 동작함으로써 플랫폼을 안정적으로 관리할 수 있다.
이하에서는, 도 1 내지 도 8을 참조하여 설명된 본 발명의 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치(200)에서 수행되는 콘텐츠 분석 방법이 순서에 따라 도 9 내지 도 10을 참조하여 보다 상세하게 설명될 수 있다.
도 9는 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법을 도시한 흐름도이다.
도 9를 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 방법은 도 1 내지 도 8을 참조하여 설명된 콘텐츠 분석 시스템의 콘텐츠 분석 장치에서 수행될 수 있으며, 이는 콘텐츠 분석 시스템의 플랫폼을 운영하거나 관리하는 서버 등의 장치를 의미할 수 있다.
먼저, 콘텐츠 분석 장치는 콘텐츠 분석 방법을 수행하기 위한 데이터 획득 절차를 수행할 수 있다(S100).
구체적으로, 콘텐츠 분석 장치는 콘텐츠의 데이터에 대한 진위 여부를 판단하기 위한 대상이 되는 콘텐츠의 데이터를 획득할 수 있다. 예를 들어, 콘텐츠 분석 장치는 콘텐츠 분석 시스템의 플랫폼을 사용하는 플랫폼 사용자에 의해 등록되거나 업로드된 콘텐츠를 확인할 수 있고, 확인된 콘텐츠로부터 콘텐츠의 데이터를 획득할 수 있다. 여기서, 콘텐츠 분석 장치는 도 4를 참조하여 설명된 콘텐츠 장치의 데이터 입력 모듈을 기반으로 데이터 획득 절차를 수행할 수 있다.
이후, 콘텐츠 분석 장치는 획득된 콘텐츠의 데이터에 대한 진위 여부 탐지 절차를 수행할 수 있다(S200).
구체적으로, 콘텐츠 분석 장치는 콘텐츠의 데이터에 대한 진위 여부를 콘텐츠 분석 장치에 포함된 진위 여부 탐지 모듈을 기반으로 판단할 수 있으며, 이는 도 4 내지 도 5를 참조하여 설명된 바와 유사 또는 동일할 수 있다. 즉, 콘텐츠 분석 장치는 CNN을 기반으로 1차적인 학습이 수행된 데이터에 대하여 악의적인 데이터를 적용하여 2차적인 학습을 수행한 딥 러닝 모델을 기반으로 콘텐츠의 데이터에 대한 진위 여부를 판단할 수 있다.
이후, 콘텐츠 분석 장치는 데이터 처리 방식 결정 절차를 수행할 수 있다(S300).
여기서, 콘텐츠 분석 장치에서 수행되는 콘텐츠의 데이터에 대한 진위 여부의 결과에 기초하여 콘텐츠의 데이터를 처리하는 방식인 데이터 처리 방식을 결정하는 구체적인 방법은 이하에서 도 10을 참조하여 보다 상세하게 설명될 수 있다.
도 10은 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 데이터 처리 방식 결정 방법을 도시한 흐름도이다.
도 10을 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치는 콘텐츠의 진위 여부를 판단할 수 있고, 판단된 콘텐츠의 진위 여부에 대한 결과를 확인할 수 있다(S310).
구체적으로, 콘텐츠의 데이터에 대한 진위 여부는 콘텐츠 분석 장치에 포함된 진위 여부 탐지 모듈에 의해 판단될 수 있다. 따라서, 콘텐츠 분석 장치는 콘텐츠 분석 장치에 포함된 진위 여부 탐지 모듈에서 판단된 콘텐츠의 데이터에 대한 진위 여부의 결과를 확인할 수 있고, 확인된 콘텐츠의 데이터에 대한 진위 여부의 결과에 기초하여 콘텐츠의 데이터에 대한 처리 방식을 결정할 수 있다.
예를 들어, 콘텐츠의 데이터에 대한 진위 여부의 결과가 참인 것으로 확인되는 경우는 콘텐츠의 데이터가 '딥페이크'에 해당되지 않음을 의미할 수 있고, 콘텐츠의 데이터에 대한 진위 여부의 결과가 거짓인 것으로 확인되는 경우는 콘텐츠의 데이터가 '딥페이크'에 해당됨을 의미할 수 있다.
이때, 콘텐츠 분석 장치는 콘텐츠의 데이터에 대한 진위 여부가 참인 것으로 판단된 경우, 플랫폼의 데이터베이스에 콘텐츠의 데이터를 저장하도록 처리하는 제1 처리 방식을 콘텐츠의 데이터에 대한 처리 방식으로 결정할 수 있다(S320).
여기서, 콘텐츠 분석 장치는 콘텐츠의 데이터에 대한 진위 여부가 참인 것으로 판단된 경우, 콘텐츠 분석 장치에 포함된 데이터 저장 모듈로 콘텐츠의 데이터에 대한 처리 방식이 제1 처리 방식으로 결정되었음을 지시하는 메시지를 전송할 수 있다.
반면, 콘텐츠 분석 장치는 콘텐츠의 데이터에 대한 진위 여부가 거짓인 것으로 판단된 경우, 플랫폼의 데이터베이스에 콘텐츠의 데이터가 저장되지 않도록 처리하는 제2 처리 방식을 콘텐츠의 데이터에 대한 처리 방식으로 결정할 수 있다(S330).
여기서, 콘텐츠 분석 장치는 콘텐츠의 데이터에 대한 진위 여부가 거짓인 것으로 판단된 경우, 콘텐츠 분석 장치에 포함된 데이터 차단 모듈로 콘텐츠의 데이터에 대한 처리 방식이 제2 처리 방식으로 결정되었음을 지시하는 메시지를 전송할 수 있다.
이때, 콘텐츠 분석 장치의 데이터 저장 모듈 및 데이터 차단 모듈은 콘텐츠의 데이터에 대한 처리 방식인 제1 처리 방식 및 제2 처리 방식이 의미하는 구체적인 내용에 대하여 미리 인지된 상태일 수 있으며, 반드시 이에 한정되는 것은 아닐 수 있다. 다시 말해, 제1 처리 방식 및 제2 처리 방식이 미리 정의된 것으로 설명되었으나, 콘텐츠 분석 장치에서 데이터 저장 모듈 및 데이터 차단 모듈로 메시지를 전송하는 과정에서 콘텐츠의 데이터를 처리하는 방식에 대한 구체적인 내용을 함꼐 전송할 수도 있다.
다시 도 9를 참조하면, 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치는 처리 방식으로 데이터를 처리하는 절차를 수행할 수 있다(S400).
구체적으로, 콘텐츠 분석 장치는 단계 S300에 기초하여 결정된 콘텐츠의 데이터에 대한 처리 방식을 기반으로 콘텐츠 분석 장치에 포함된 데이터 저장 모듈 및 데이터 차단 모듈 중 하나를 통해 콘텐츠의 데이터에 대한 처리를 수행할 수 있다.
예를 들어, 콘텐츠 분석 장치의 데이터 저장 모듈을 통해 콘텐츠의 데이터가 처리되는 것으로 결정된 경우, 데이터 저장 모듈은 콘텐츠의 데이터가 콘텐츠 분석 시스템의 데이터베이스에 저장되도록 동작할 수 있다. 또한, 콘텐츠 분석 장치의 데이터 차단 모듈을 통해 콘텐츠의 데이터가 처리되는 것으로 결정된 경우, 데이터 차단 모듈은 콘텐츠의 데이터를 차단하여 콘텐츠 분석 시스템의 데이터베이스에 저장되지 않도록 동작할 수 있다.
도 1 내지 도 10을 참조하여 설명된 바와 같이 본 발명의 일 실시예에 따른 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템의 콘텐츠 분석 장치는 플랫폼을 기반으로 콘텐츠의 데이터에 대한 진위 여부를 판단 및 탐지할 수 있고, 그 결과에 따라 플랫폼의 데이터베이스에 대한 저장 여부를 결정할 수 있다.
이를 통해, 본 발명의 콘텐츠 분석 장치는 플랫폼을 안정적으로 관리할 수 있고, 플랫폼을 사용하는 사용자에게 거짓된 콘텐츠를 제공하지 않고, 참된 콘텐츠만 엄선하여 제공함으로써 안전한 플랫폼의 콘텐츠 환경을 제공할 수 있는 효과가 있다.
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 콘텐츠 분석 장치 110: 프로세서
120: 메모리 130: 송수신 장치
140: 입력 인터페이스 장치 150: 출력 인터페이스 장치
160: 저장 장치 170: 버스
200: 콘텐츠 분석 장치 210: 데이터 입력 모듈
220: 프레임 추출 모듈 230: 이미지 분류 모듈
240: 특징 추출 모듈 250: 진위 여부 탐지 모듈
251: 제1 딥 러닝 모듈 252: 제2 딥 러닝 모듈
260: 데이터 출력 모듈 261: 데이터 저장 모듈
262: 데이터 차단 모듈

Claims (5)

  1. 플랫폼에 등록되는 딥 러닝 기반의 콘텐츠에 대한 진위를 판단하기 위한 콘텐츠 분석 시스템으로써,
    콘텐츠 분석 시스템을 기반으로 진위를 판단하기 위한 대상이 되는 콘텐츠의 데이터가 입력되는 데이터 입력 모듈;
    데이터 입력 모듈로 입력되는 데이터에 대한 진위를 판단하기 위해 악의적인 데이터(adversarial example)를 적용하여 딥 러닝을 기반으로 딥 러닝 모델을 생성하고, 딥 러닝 모델을 이용하여 콘텐츠의 데이터에 대한 진위를 판단하는 진위 여부 탐지 모듈; 및
    콘텐츠의 데이터에 대하여 판단된 진위의 결과에 기초하여 콘텐츠의 데이터의 처리 방식을 결정하고, 결정된 처리 방식으로 콘텐츠의 데이터를 출력하는 데이터 출력 모듈을 포함하되,
    상기 진위 여부 탐지 모듈은 콘텐츠의 시스템을 통해 진위를 판단하기 위한 학습 콘텐츠의 데이터에 대하여 CNN(convolution neural network)을 기반으로 1차적으로 학습을 수행하고, 서로 다른 타입의 내용을 가지는 콘텐츠의 데이터 및 진위 여부가 거짓인 콘텐츠의 데이터가 포함된 학습 콘텐츠의 데이터를 교차 학습하고 교차 검증 알고리즘을 통해 검증을 수행하는 제1 딥 러닝 모듈을 포함하고,
    상기 진위 여부 탐지 모듈의 진위 여부를 판단하는 정확성을 높이기 위해 상기 제1 딥 러닝 모듈을 기반으로 1차적으로 학습된 결과를 의미하는 1차 학습 데이터에 대하여 악의적인 데이터를 적용하여 2차적으로 학습을 수행하는 제2 딥 러닝 모듈을 포함하고,
    상기 제2 딥 러닝 모듈은 딥 러닝 모델의 결과로 출력되는 데이터에 영향을 주는 악의적인 공격(adversarial attack)을 기반으로 생성되는 노이즈(noise) 타입의 데이터인 상기 악의적인 데이터를 생성하되,
    상기 악의적인 데이터는 상기 진위 여부 탐지 모듈에서 진위를 판단하기 위한 대상이 되는 원본의 콘텐츠의 데이터에 대하여 악의적인 데이터를 생성하기 위해 미리 설정된 값의 곱이 반영된 노이즈 데이터를 합하여 생성되는, 콘텐츠 분석 시스템.
  2. 청구항 1에 있어서,
    상기 데이터 입력 모듈은,
    상기 콘텐츠 분석 시스템을 기반으로 진위를 판단하기 위한 대상이 되는 이미지 데이터 및 영상 데이터 중 하나인 콘텐츠의 데이터가 입력되는 것을 특징으로 하는, 콘텐츠 분석 시스템.
  3. 삭제
  4. 삭제
  5. 청구항 1에 있어서,
    상기 데이터 출력 모듈은,
    콘텐츠의 데이터에 대한 진위 여부가 참(truth)인 것으로 판단되는 경우, 콘텐츠 분석 시스템의 플랫폼에 포함된 데이터베이스에 상기 콘텐츠의 데이터를 저장하는 데이터 저장 모듈; 및
    콘텐츠의 데이터에 대한 진위 여부가 거짓(false)인 것으로 판단되는 경우, 콘텐츠 분석 시스템의 플랫폼에 콘텐츠의 데이터가 저장되지 않도록 콘텐츠의 데이터를 차단하는 데이터 차단 모듈을 포함하는, 콘텐츠 분석 시스템.
KR1020210079765A 2021-06-21 2021-06-21 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템 KR102451552B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210079765A KR102451552B1 (ko) 2021-06-21 2021-06-21 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210079765A KR102451552B1 (ko) 2021-06-21 2021-06-21 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템

Publications (1)

Publication Number Publication Date
KR102451552B1 true KR102451552B1 (ko) 2022-10-06

Family

ID=83597219

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210079765A KR102451552B1 (ko) 2021-06-21 2021-06-21 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템

Country Status (1)

Country Link
KR (1) KR102451552B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180081444A (ko) * 2017-01-06 2018-07-16 삼성전자주식회사 콘텐츠를 처리하는 장치 및 방법
KR20200066119A (ko) * 2018-11-30 2020-06-09 고려대학교 산학협력단 지식 기반 추론 및 신뢰도 분석을 이용한 가짜뉴스 판별 방법, 이를 수행하기 위한 기록매체 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180081444A (ko) * 2017-01-06 2018-07-16 삼성전자주식회사 콘텐츠를 처리하는 장치 및 방법
KR20200066119A (ko) * 2018-11-30 2020-06-09 고려대학교 산학협력단 지식 기반 추론 및 신뢰도 분석을 이용한 가짜뉴스 판별 방법, 이를 수행하기 위한 기록매체 및 장치

Similar Documents

Publication Publication Date Title
US20230116801A1 (en) Image authenticity detection method and device, computer device, and storage medium
US20210295114A1 (en) Method and apparatus for extracting structured data from image, and device
CN110728319B (zh) 一种图像生成方法、装置以及计算机存储介质
US20200218772A1 (en) Method and apparatus for dynamically identifying a user of an account for posting images
WO2019191266A1 (en) Object classification method, apparatus, server, and storage medium
CN111415336B (zh) 一种图像篡改识别方法、装置、服务器及存储介质
CN111553235B (zh) 保护隐私的网络训练方法、身份识别方法及装置
US11328095B2 (en) Peceptual video fingerprinting
KR102629848B1 (ko) 가짜 영상 탐지 방법 및 이를 수행하기 위한 장치
Wu et al. DAPter: Preventing user data abuse in deep learning inference services
KR102451552B1 (ko) 딥 러닝 기반의 콘텐츠의 진위를 판단하기 위한 콘텐츠 분석 시스템
CN111881446A (zh) 一种工业互联网恶意代码识别方法及装置
CN117197857A (zh) 人脸伪造攻击检测、人脸识别方法、装置和设备
CN111091489A (zh) 图片优化方法、装置、电子设备及存储介质
CN115880786A (zh) 基于通道注意力的人脸活体检测方法、装置及设备
CN111639718B (zh) 分类器应用方法及装置
KR102476334B1 (ko) 딥러닝 기반 일기 생성 방법 및 장치
US20220327849A1 (en) Computer-Implemented Method For Optical Character Recognition
CN114360015A (zh) 活体检测方法、装置、设备及存储介质
KR102270607B1 (ko) 웹 사이트에 대한 이미지 권리 확인 감사 시스템 및 방법
Shibel et al. Deep learning detection of facial biometric presentation attack
KR20220005930A (ko) 데이터 위변조 방지 방법 및 장치, 데이터 위변조 검출 방법 및 장치
CN113034337B (zh) 图像检测方法及相关装置
CN118071867B (zh) 将文本数据转换为图像数据的方法和装置
CN111898761B (zh) 服务模型生成方法、图像处理方法、装置和电子设备

Legal Events

Date Code Title Description
GRNT Written decision to grant