KR20200045700A

KR20200045700A - 이미지 기반 가짜 뉴스 검출 시스템

Info

Publication number: KR20200045700A
Application number: KR1020180126557A
Authority: KR
Inventors: 이충형; 임찬형
Original assignee: 요타코퍼레이션(주)
Priority date: 2018-10-23
Filing date: 2018-10-23
Publication date: 2020-05-06
Also published as: KR102116956B1

Abstract

본 발명은 뉴스로부터 입력받은 기사의 이미지를 추출하여 해당 이미지의 조작 여부와, 메타데이터 조사와, 출저 조사를 통해 가짜 뉴스인지의 여부를 검출하는 이미지 기반 가짜 뉴스 검출 시스템을 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위해, 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템은, 뉴스 기사에서 추출된 이미지를 인공지능을 이용하여 학습시키는 학습 및 모델링 서버(100)와, 상기 학습 및 모델링 서버(100)에서 학습된 내용을 이용하여 사용자에게 가짜뉴스 판별 서비스를 제공하는 사용자 표출 서버(200)를 포함한다.

Description

이미지 기반 가짜 뉴스 검출 시스템{SYSTEM FOR DETECTING IMAGE BASED FAKE NEWS}

본 발명은 이미지 기반 가짜 뉴스 검출 시스템에 관한 것으로, 더욱 상세하게는 뉴스로부터 입력받은 기사의 이미지를 추출하여 해당 이미지의 조작 여부와, 메타데이터 조사와, 출처 조사를 통해 가짜 뉴스인지의 여부를 검출하는 이미지 기반 가짜 뉴스 검출 시스템에 관한 것이다.

세계 신문 협회는 최근 가장 주목해야할 저널리즘 이슈로‘가짜 뉴스(fake news)의 확산’을 선정하는 등 국내외적으로 가짜 뉴스의 영향력이 상당히 커지고있다.

내외신 종합에 따르면, 가짜 뉴스는 상업적 또는 정치적인 의도성을 가지고 전통적인 뉴스 매체 혹은 소셜 미디어를 통해 전파되는 거짓 정보(hoax) 또는 의도적 잘못된 정보나 가짜 뉴스를 사설 정보지 형태가 아닌, 기성 언론사 뉴스 형태를 그대로 모방해 실제 언론 보도인 양 허위로 유포되는 정보로 정의할 수 있다.

최근 소셜미디어의 영향력이 커지면서 가짜 뉴스의 심각성이 더욱 커지고 있다. 2016년 미국 대선 당시 페이스북을 통해 가짜 뉴스들이 확산되면서 선거 여론에 상당한 영향력을 미쳤다. 일례로 인터넷, SNS으로 유통된 가짜 뉴스가 도널드 트럼프 당선에 기여했다는 비판 여론이 높아지자 미국 페이스북과 구글의 최고경영자들이 가짜 뉴스와의 전쟁을 선포하였다.

미국의 인터넷 뉴스 매체 버즈피드(BuzzFeed)의 분석에 따르면 전통미디어보다 페이스북의 영향력이 크다고 발표하였으며, 페이스북을 통해 유통된 상위 50개 뉴스 중 23개가 미국 정치 관련 이슈이며, 이에 따라 정치관련 가짜 뉴스 공유 및 댓글 수는 1,060만 건으로 전체 2,150만 건의 49.3%를 차지하였다.

가짜 뉴스는 미국 이외에도 전세계적으로 확산되고 있는 가운데, 국내에서도 크게 이슈화될 가능성이 크다. 국내에서도 사설 정보지, 낚시 뉴스 등이 개인, 기업 등에 경제적, 정신적 피해를 끼치는 등 이미 사회적으로 문제가 되고 있는 상황이다. 국내에도 최근 언론 조정에 대한 청구 건수가 증가하고 있는 가운데 침해 유형별로는 명예 훼손 비중이 가장 크다. 연간 언론 조정신청 건수를 보면 1990년에 159건에 불과 했으나, 2015년 5227건으로 약 33배 증가하였으며, 특히, 2014년에는 세월호 사건이 터지면서 이들 관련 뉴스에 대한 언론 조정 건수가 급격히 증가하였다. 언론 조정 청구건수를 누적으로 보면, 명예훼손 비중이 95%에 이르면서 대부분을 차지하였다.

더욱이 향후 정치적으로 중요한 이벤트들이 예정되어 있는 가운데, 가짜 뉴스의 확산은 많은 혼란을 야기할 수 있다는 우려가 확대되고 있다. 2017년 3월 15일 중앙선거관리위원회가 발표한 보도 자료에 따르면, 허위사실공표 또는 후보자 등 비방 등의 내용이 담긴 약 4,662건의 기사를 삭제 요청했다고 밝혔다.

이와 같이 가짜 뉴스는 잘못된 여론 형성, 개개인의 의사 결정의 혼동, 민주주의 사회의 붕괴 등 부정적인 영향을 초래할 가능성이 매우 크다.

가짜 뉴스가 무서운 점은 확산이 빠르고 확산이 되는 동안 지속적으로 피해가 발생되며, 검증된 결과가 나오더라도 이미 퍼진 상태에서는 바로잡기가 힘들다는 것이다.

또한, 가짜 뉴스는 그 자체로도 해당하는 인물 또는 회사에 막대한 피해를 주며 사회의 분열을 조장하여 막대한 사회적 비용을 초래한다.

게다가, 가짜 뉴스인지 여부를 확인하는 과정이 대부분 사람의 힘으로 진행되어 팩트를 확인하는 과정에서 소요되는 인적, 물적 비용이 막대한 문제점이 있다.

이에 본 발명은 상기한 바와 같은 요구에 부응하기 위해 제안된 것으로서, 그 목적은 뉴스로부터 입력받은 기사의 이미지를 추출하여 해당 이미지의 조작 여부와, 메타데이터 조사와, 출저 조사를 통해 가짜 뉴스인지의 여부를 검출하는 이미지 기반 가짜 뉴스 검출 시스템을 제공하는 것이다.

상기 목적을 달성하기 위해, 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템은, 뉴스 기사에서 추출된 이미지를 인공지능을 이용하여 학습시키는 학습 및 모델링 서버(100)와, 상기 학습 및 모델링 서버(100)에서 학습된 내용을 이용하여 사용자에게 가짜뉴스 판별 서비스를 제공하는 사용자 표출 서버(200)를 포함한다.

또한, 본 발명의 다른 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 학습 및 모델링 서버(100)는, 인터넷 상의 기사를 수집하여 이미지를 추출하는 기사 수집 모듈(110)과, 상기 기사 수집 모듈(110)에 의해 추출된 이미지의 조작 여부를 판별하는 제 1 이미지 조작 판별 모듈(120)과, 상기 기사 수집 모듈(110)에 의해 추출된 이미지의 메타데이터를 통해 상기 메타데이터에 가중치를 부여하는 제 1 메타데이터 판정 모듈(130)과, 상기 기사 수집 모듈(110)에 의해 추출된 이미지를 사용하는 웹페이지를 검색하여 출처 가중치를 부여하는 제 1 이미지 출처 판정 모듈(140)과, 상기 제 1 이미지 조작 판별 모듈(120)과, 상기 제 1 메타데이터 판정 모듈(130)과, 상기 제 1 이미지 출처 판정 모듈(140)에 의한 결과값을 통합하여 가짜 뉴스 여부를 학습하는 통합 학습부(150)를 포함한다.

또한, 본 발명의 다른 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 사용자 표출 서버(200)는, 사용자에게 기사 URL을 제공받아 이미지를 추출하는 입력 모듈(210)과, 상기 입력 모듈(210)로부터 추출된 이미지의 조작 여부를 판별하는 제 2 이미지 조작 판별 모듈(220)과, 상기 입력 모듈(210)로부터 추출된 이미지의 메타데이터를 통해 상기 메타데이터에 가중치를 부여하는 제 2 메타데이터 판정 모듈(230)과, 상기 입력 모듈(210)로부터 추출된 이미지를 사용하는 웹페이지를 검색하여 출처 가중치를 부여하는 제 2 이미지 출처 판정 모듈(240)과, 상기 통합 학습부(150)에 의해 학습된 내용을 기반으로 상기 제 2 이미지 조작 판별 모듈(220)과, 상기 제 2 메타데이터 판정 모듈(230)과, 상기 제 2 이미지 출처 판정 모듈(240)의 결과값을 통합하여 가짜 뉴스 여부를 예측하는 통합 예측부(250)와, 상기 통합 예측부(250)의 예측 결과를 상기 사용자에게 표시하는 결과 표시부(260)를 포함한다.

또한, 본 발명의 또 다른 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 기사 수집 모듈(110)은, 상기 기사를 크롤링하는 제 1 기사 수집부(111)와, 상기 제 1 기사 수집부에 의해 크롤링된 기사에서 이미지를 추출하는 제 1 이미지 추출부(112)를 포함한다.

또한, 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 제 1 이미지 조작 판별 모듈(120)은, 상기 기사 수집 모듈(110)로부터 추출된 이미지의 이미지 조작 여부를 판별하기 위해 추출된 상기 이미지를 입력 데이터의 형태로 변환하는 전처리를 수행하는 제 1 전처리부(121)와, 상기 제 1 전처리부(121)에 의해 전처리된 이미지의 조작 여부를 판별하기 위해 학습하는 학습부(122)를 포함한다.

또한, 본 발명의 다른 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 제 1 메타데이터 판정 모듈(130)은, 상기 기사 수집 모듈(110)로부터 추출된 이미지의 메타데이터를 추출하는 제 1 메타데이터 추출부(131)와, 상기 제 1 메타데이터 추출부(131)로부터 추출된 메타데이터를 통해 메타데이터 가중치를 부여하는 제 1 메타데이터 판정부(132)를 포함한다.

또한, 본 발명의 다른 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 제 1 이미지 출처 판정 모듈(140)은, 상기 기사 수집 모듈(110)로부터 추출된 이미지를 사용중인 웹페이지를 검색하는 제 1 이미지 출처 검색부(141)와, 상기 제 1 이미지 출처 검색부(141)의 검색 결과인 웹페이지에서 일치하는 이미지 및 상기 웹페이지 내의 정보를 추출하는 제 1 정보 추출부(142)와, 상기 제 1 정보 추출부(142)에 의해 추출된 상기 이미지 및 상기 정보를 분석하는 정보 분석부(143)와, 정보 분석부(143)에 의해 분석된 결과에 출처 가중치를 부여하는 제 1 출처 판정부(144)를 포함한다.

또한, 본 발명의 또 다른 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 입력 모듈(210)은, 상기 사용자에게 기사 URL을 입력받는 입력부(211)와, 상기 입력부(211)에 의해 입력받은 기사 URL을 수집하는 제 2 기사 수집부(212)와, 상기 제 2 기사 수집부(212)에 의해 수집된 기사의 이미지를 추출하는 제 2 이미지 추출부(213)를 포함한다.

또한, 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 제 2 이미지 조작 판별 모듈(220)은, 상기 입력 모듈(210)에 의해 추출된 이미지의 이미지 조작 여부를 판별하기 위해 추출된 상기 이미지를 입력 데이터의 형태로 변환하는 전처리를 수행하는 제 2 전처리부(221)와, 상기 학습부(122)에 의해 학습된 내용에 의거하여 이미지 조작을 예측하는 예측부(222)를 포함한다.

또한, 본 발명의 다른 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 제 2 메타데이터 판정 모듈(230)은, 상기 입력 모듈(210)로부터 추출된 이미지의 메타데이터를 추출하는 제 2 메타데이터 추출부(231)와, 상기 제 2 메타데이터 추출부(231)로부터 추출된 메타데이터를 통해 메타데이터 가중치를 부여하는 제 2 메타데이터 판정부(232)를 포함한다.

또한, 본 발명의 다른 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템에서, 상기 제 2 이미지 출처 판정 모듈(240)은, 상기 입력 모듈(210)로부터 추출된 이미지를 사용중인 웹페이지를 검색하는 제 2 이미지 출처 검색부(241)와, 상기 제 2 이미지 출처 검색부(241)의 검색 결과인 웹페이지에서 일치하는 이미지 및 상기 웹페이지 내의 정보를 추출하는 제 2 정보 추출부(242)와, 상기 제 2 정보 추출부(242)에 의해 추출된 상기 이미지 및 상기 정보를 분석하는 이미지 분석부(243)와, 상기 이미지 분석부(243)에 의해 분석된 결과에 출처 가중치를 부여하는 제 2 출처 판정부(244)를 포함한다.

본 발명에 의하면, 뉴스로부터 입력받은 기사의 이미지를 추출하여 해당 이미지의 조작 여부와, 메타데이터 조사와, 출저 조사를 통해 가짜 뉴스인지의 여부를 검출하는 효과가 있다.

또한, 가짜 뉴스 검증의 자동화를 통해 가짜 뉴스 검증에 필요한 시간을 단축시켜 조기에 검증 결과를 발표함으로써 가짜 뉴스 확산을 막을 수 있고, 이에 의해 피해 당사자의 피해 규모를 줄일 수 있는 효과가 있다.

또한, 가짜 뉴스의 대상이 된 일반인의 경우 현실적으로 이에 대응할 방법이 없는 경우가 많지만, 이미지 기반 가짜 뉴스 검출을 통해 일반인들에게 최소한의 대응을 할 수 있는 환경을 제공할 수 있는 효과가 있다.

또한, 가짜 뉴스가 확산됨에 따라 발생되는 사회적 갈등을 감소시킬 수 있으며, 이러한 사회적 갈등을 해결하기 위한 사회적 비용 역시 절감할 수 있는 효과가 있다.

한편, 언론사들에게는 해당 뉴스의 사실 여부를 확인하는데 사용되는 비용 및 시간을 줄여, 양질의 기사를 제공함으로써 경쟁력을 확보할 수 있으며 언론의 신뢰성을 높이는 환경을 제공할 수 있는 효과가 있다.

도 1은 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템의 전체 구성을 나타내는 블록도.

이하, 본 발명의 실시예에 대해 관련 도면들을 참조하여 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템의 전체 구성을 나타내는 블록도이다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템(1000)은, 학습 및 모델링 서버(100)와, 사용자 표출 서버(200)를 포함한다.

여기서, 학습 및 모델링 서버(100)는 뉴스 기사에서 추출된 이미지를 인공지능을 이용하여 각각의 모듈들을 학습시키는 역할을 수행하고, 사용자 표출 서버(200)는 학습 및 모델링 서버에서 학습된 내용을 이용하여 이미지 기반 가짜뉴스 판별 서비스를 사용자에게 제공하는 역할을 수행한다.

좀더 상세히 설명하면, 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템(1000)에서, 학습 및 모델링 서버(100)는, 기사 수집 모듈(110)과, 제 1 이미지 조작 판별 모듈(120)과, 제 1 메타데이터 판정 모듈(130)과, 제 1 이미지 출처 판정 모듈(140)을 포함한다.

여기서, 기사 수집 모듈(110)은 인터넷 상의 기사를 수집하여 이미지를 추출하는 역할을 수행한다.

그리고, 제 1 이미지 조작 판별 모듈(120)은 기사 수집 모듈(110)에 의해 추출된 이미지의 조작 여부를 판별하는 역할을 수행한다.

또한, 제 1 메타데이터 판정 모듈(130)은 기사 수집 모듈(110)에 의해 추출된 이미지의 메타데이터를 통해 판별을 위한 메타데이터 가중치를 부여하는 역할을 수행한다.

여기서, 메타데이터란, 어떠한 목적을 가지고 만들어지는 데이터이다. 본 실시예에서는 수집되는 기사들 중 이미지를 제외한 날짜, 이미지 편집 프로그램, 카메라 정보 등의 추가적인 데이터이다.

한편, 제 1 이미지 출처 판정 모듈(140)은 기사 수집 모듈(110)에 의해 추출된 이미지를 사용하는 웹페이지를 검색하여 출처 가중치를 부여하는 역할을 수행한다.

이와 같이 제 1 이미지 조작 판별 모듈(120)과, 제 1 메타데이터 판정 모듈(130)과, 제 1 이미지 출처 판정 모듈(140)에 의한 결과값을 통합하여 가짜 뉴스 여부를 학습하게 되며, 이러한 가짜 뉴스 여부를 학습하는 역할은 통합 학습부(150)에 의해 수행된다.

다음, 본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템(1000)에서, 사용자 표출 서버(200)는 입력 모듈(210)과, 제 2 이미지 조작 판별 모듈(220)과, 제 2 메타데이터 판정 모듈(230)과, 제 2 이미지 출처 판정 모듈(240)과, 통합 예측부(250)와, 결과 표시부(260)를 포함한다.

여기서, 입력 모듈(210)은 사용자에게 기사 URL을 제공받아 이미지를 추출하는 역할을 수행한다.

또한, 제 2 이미지 조작 판별 모듈(220)은, 입력 모듈(210)로부터 추출된 이미지의 조작 여부를 판별하는 역할을 수행한다.

그리고, 제 2 메타데이터 판정 모듈(230)은 입력 모듈(210)로부터 추출된 이미지의 메타데이터를 통해 판별을 위한 메타데이터 가중치를 부여하는 역할을 수행한다.

한편, 제 2 이미지 출처 판정 모듈(240)은 입력 모듈(210)로부터 추출된 이미지를 사용하는 웹페이지를 검색하여 출처 가중치를 부여하는 역할을 수행한다.

더불어, 통합 학습부(150)에 의해 학습된 내용을 기반으로 제 2 이미지 조작 판별 모듈(220)과, 제 2 메타데이터 판정 모듈(230)과, 제 2 이미지 출처 판정 모듈(240)의 결과값을 통합하여 가짜 뉴스 여부를 예측하는 역할은 통합 예측부(250)에 의해 수행되며, 이러한 통합 예측부(250)의 예측 결과를 사용자에게 표시하는 역할은 결과 표시부(260)에 의해 수행된다.

다음, 각 모듈들이 하는 역할에 대해 좀더 상세히 설명하도록 한다.

우선, 학습 및 모델링 서버(100)에서, 기사 수집 모듈(110)과, 제 1 이미지 조작 판별 모듈(120)과, 제 1 메타데이터 판정 모듈(130)과, 제 1 이미지 출처 판정 모듈(140)이 수행하는 역할에 대해 설명한다.

본 발명의 일 실시예에 따른 이미지 기반 가짜 뉴스 검출 시스템(1000)에서, 기사 수집 모듈(110)은 제 1 기사 수집부(111)와, 제 1 이미지 추출부(112)를 포함한다.

여기서, 제 1 기사 수집부(111)는 인터넷 상의 기사를 크롤링하는 역할을 수행한다.

또한, 제 1 이미지 추출부(112)는 제 1 기사 수집부(111)에 의해 인터넷 상에서 크롤링된 기사에서 이미지를 추출한다.

다음, 제 1 이미지 조작 판별 모듈(120)은, 제 1 전처리부(121)와, 학습부(122)를 포함한다.

여기서, 제 1 전처리부(121)는 기사 수집 모듈(110)로부터 추출된 이미지의 이미지 조작 여부를 판별하기 위해 추출된 이미지를 학습부(122)로의 입력 데이터의 형태로 변환하는 전처리를 수행한다.

또한, 학습부(122)는 제 1 전처리부(121)에 의해 전처리된 이미지의 조작 여부를 판별하기 위해 학습한다. 이러한 학습부(122)의 학습은 딥러닝(deep learning) 학습을 통해 이루어진다. 딥러닝이란 컴퓨터가 사람의 뇌처럼 사물이나 데이터를 분류하거나 군집할 수 있는 기술로 일종의 기계 학습이다.

또한, 제 1 메타데이터 판정 모듈(130)은 제 1 메타데이터 추출부(131)와, 제 1 메타데이터 판정부(132)를 포함한다.

여기서, 제 1 메타데이터 추출부(131)는 기사 수집 모듈(110)로부터 추출된 이미지의 메타데이터를 추출하는 역할을 수행한다.

또한, 제 1 메타데이터 판정부(132)는 제 1 메타데이터 추출부(131)로부터 추출된 메타데이터에 가중치를 부여하는 역할을 수행한다.

한편, 제 1 이미지 출처 판정 모듈(140)은, 제 1 이미지 출처 검색부(141)와, 제 1 정보 추출부(142)와, 정보 분석부(143)와, 제 1 출처 판정부(144)를 포함한다.

제 1 이미지 출처 검색부(141)는 기사 수집 모듈(110)로부터 추출된 이미지를 사용중인 웹페이지를 검색하는 역할을 수행한다.

제 1 정보 추출부(142)는 제 1 이미지 출처 검색부(141)의 검색 결과인 웹페이지에서 일치하는 이미지 및 이러한 웹페이지 내의 정보를 추출하는 역할을 수행한다.

정보 분석부(143)는 제 1 정보 추출부(142)에 의해 추출된 이미지 및 이러한 정보를 분석하는 역할을 수행한다.

제 1 출처 판정부(144)는 정보 분석부(143)에 의해 분석된 결과에 출처 가중치를 부여하는 역할을 수행한다.

앞서 상술한 바와 같이 제 1 이미지 조작 판별 모듈(120)과, 제 1 메타데이터 판정 모듈(130)과, 제 1 이미지 출처 판정 모듈(140)에 의한 결과값을 통합하여 가짜 뉴스 여부를 통합 학습부(150)에 의해 학습하게 된다.

다음, 사용자 표출 서버(200)에서, 입력 모듈(210)과, 제 2 이미지 조작 판별 모듈(220)과, 제 2 메타데이터 판정 모듈(230)과, 제 2 이미지 출처 판정 모듈(240)이 수행하는 역할에 대해 설명한다.

입력 모듈(210)은, 입력부(211)와, 제 2 기사 수집부(212)와, 제 2 이미지 추출부(213)를 포함한다.

여기서, 입력부(211)는 사용자에게 기사 URL을 입력받는 역할을 수행한다.

제 2 기사 수집부(212)는 입력부(211)에 의해 입력받은 기사 URL을 수집하는 역할을 수행한다. 제 2 이미지 추출부(213)는 제 2 기사 수집부(212)에 의해 수집된 기사의 이미지를 추출하는 역할을 수행한다.

또한, 제 2 이미지 조작 판별 모듈(220)은 제 2 전처리부(221)와, 예측부(222)를 포함한다.

제 2 전처리부(221)는 입력 모듈(210)에 의해 추출된 이미지의 이미지 조작 여부를 판별하기 위해 추출된 이미지를 예측부(222)로의 입력 데이터의 형태로 변환하는 전처리를 수행한다.

예측부(222)는 학습부(122)에 의해 학습된 내용에 의거하여 이미지 조작을 예측하는 역할을 수행한다.

그리고, 제 2 메타데이터 판정 모듈(230)은, 제 2 메타데이터 추출부(231)와, 제 2 메타데이터 판정부(232)를 포함한다.

제 2 메타데이터 추출부(231)는 입력 모듈(210)로부터 추출된 이미지의 메타데이터를 추출하는 역할을 수행한다.

제 2 메타데이터 판정부(232)는 제 2 메타데이터 추출부(231)로부터 추출된 메타데이터에 가중치를 부여하는 역할을 수행한다.

한편, 제 2 이미지 출처 판정 모듈(240)은 제 2 이미지 출처 검색부(241)와, 제 2 정보 추출부(242)와, 이미지 분석부(243)와, 제 2 출처 판정부(244)를 포함한다.

제 2 이미지 출처 검색부(241)는 입력 모듈(210)로부터 추출된 이미지를 사용중인 웹페이지를 검색하는 역할을 수행한다.

제 2 정보 추출부(242)는 제 2 이미지 출처 검색부(241)의 검색 결과인 웹페이지에서 일치하는 이미지 및 이 웹페이지 내의 정보를 추출하는 역할을 수행한다.

이미지 분석부(243)는 제 2 정보 추출부(242)에 의해 추출된 이미지 및 정보를 분석하는 역할을 수행한다.

제 2 출처 판정부(244)는 이미지 분석부(243)에 의해 분석된 결과에 출처 가중치를 부여하는 역할을 수행한다.

이에 의해, 앞서 상술한 통합 학습부(150)에 의해 학습된 내용을 기반으로 제 2 이미지 조작 판별 모듈(220)과, 제 2 메타데이터 판정 모듈(230)과, 제 2 이미지 출처 판정 모듈(240)의 결과값을 통합하여 가짜 뉴스 여부를 통합 예측부(250)에 의해 예측하게 되며, 이러한 통합 예측부(250)의 예측 결과를 결과 표시부(260)에 의해 사용자에게 표시하하게 된다.

사사 : 본 특허는 2018년도 정부(과학기술정보통신부)의 재원으로 정보통신기술진흥센터의 지원을 받아 수행된 연구 결과입니다(No.2018-0-00705, 인공지능 기반 가짜뉴스를 판단하는 알고리즘 설계 및 S/W 모델링).

This Patent was supported by Institute for Information & communications Technology Promotion(IITP) grant funded by the Korea government(MSIP) (No.2018-0-00705, Algorithm design and software modeling for judge fake news based on artificial intelligence).

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

100 : 학습 및 모델링 서버
110 : 기사 수집 모듈
120 : 제 1 이미지 조작 판별 모듈
130 : 제 1 메타데이터 판정 모듈
140 : 제 1 이미지 출처 판정 모듈
150 : 통합 학습부
200 : 사용자 표출 서버
210 : 입력 모듈
220 : 제 2 이미지 조작 판별 모듈
230 : 제 2 메타데이터 판정 모듈
240 : 제 2 이미지 출처 판정 모듈
250 : 통합 판정부
260 : 결과 표시부

Claims

뉴스 기사에서 추출된 이미지를 인공지능을 이용하여 학습시키는 학습 및 모델링 서버(100)와,
상기 학습 및 모델링 서버(100)에서 학습된 내용을 이용하여 사용자에게 가짜뉴스 판별 서비스를 제공하는 사용자 표출 서버(200)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 1 항에 있어서,
상기 학습 및 모델링 서버(100)는,
인터넷 상의 기사를 수집하여 이미지를 추출하는 기사 수집 모듈(110)과,
상기 기사 수집 모듈(110)에 의해 추출된 이미지의 조작 여부를 판별하는 제 1 이미지 조작 판별 모듈(120)과,
상기 기사 수집 모듈(110)에 의해 추출된 이미지의 메타데이터를 통해 상기 메타데이터에 가중치를 부여하는 제 1 메타데이터 판정 모듈(130)과,
상기 기사 수집 모듈(110)에 의해 추출된 이미지를 사용하는 웹페이지를 검색하여 출처 가중치를 부여하는 제 1 이미지 출처 판정 모듈(140)과,
상기 제 1 이미지 조작 판별 모듈(120)과, 상기 제 1 메타데이터 판정 모듈(130)과, 상기 제 1 이미지 출처 판정 모듈(140)에 의한 결과값을 통합하여 가짜 뉴스 여부를 학습하는 통합 학습부(150)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 2 항에 있어서,
상기 사용자 표출 서버(200)는,
사용자에게 기사 URL을 제공받아 이미지를 추출하는 입력 모듈(210)과,
상기 입력 모듈(210)로부터 추출된 이미지의 조작 여부를 판별하는 제 2 이미지 조작 판별 모듈(220)과,
상기 입력 모듈(210)로부터 추출된 이미지의 메타데이터를 통해 상기 메타데이터에 가중치를 부여하는 제 2 메타데이터 판정 모듈(230)과,
상기 입력 모듈(210)로부터 추출된 이미지를 사용하는 웹페이지를 검색하여 출처 가중치를 부여하는 제 2 이미지 출처 판정 모듈(240)과,
상기 통합 학습부(150)에 의해 학습된 내용을 기반으로 상기 제 2 이미지 조작 판별 모듈(220)과, 상기 제 2 메타데이터 판정 모듈(230)과, 상기 제 2 이미지 출처 판정 모듈(240)의 결과값을 통합하여 가짜 뉴스 여부를 예측하는 통합 예측부(250)와,
상기 통합 예측부(250)의 예측 결과를 상기 사용자에게 표시하는 결과 표시부(260)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 2 항에 있어서,
상기 기사 수집 모듈(110)은,
상기 기사를 크롤링하는 제 1 기사 수집부(111)와,
상기 제 1 기사 수집부에 의해 크롤링된 기사에서 이미지를 추출하는 제 1 이미지 추출부(112)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 2 항에 있어서,
상기 제 1 이미지 조작 판별 모듈(120)은,
상기 기사 수집 모듈(110)로부터 추출된 이미지의 이미지 조작 여부를 판별하기 위해 추출된 상기 이미지를 입력 데이터의 형태로 변환하는 전처리를 수행하는 제 1 전처리부(121)와,
상기 제 1 전처리부(121)에 의해 전처리된 이미지의 조작 여부를 판별하기 위해 학습하는 학습부(122)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 2 항에 있어서,
상기 제 1 메타데이터 판정 모듈(130)은,
상기 기사 수집 모듈(110)로부터 추출된 이미지의 메타데이터를 추출하는 제 1 메타데이터 추출부(131)와,
상기 제 1 메타데이터 추출부(131)로부터 추출된 메타데이터를 통해 메타데이터 가중치를 부여하는 제 1 메타데이터 판정부(132)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 2 항에 있어서,
상기 제 1 이미지 출처 판정 모듈(140)은,
상기 기사 수집 모듈(110)로부터 추출된 이미지를 사용중인 웹페이지를 검색하는 제 1 이미지 출처 검색부(141)와,
상기 제 1 이미지 출처 검색부(141)의 검색 결과인 웹페이지에서 일치하는 이미지 및 상기 웹페이지 내의 정보를 추출하는 제 1 정보 추출부(142)와,
상기 제 1 정보 추출부(142)에 의해 추출된 상기 이미지 및 상기 정보를 분석하는 정보 분석부(143)와,
상기 정보 분석부(143)에 의해 분석된 결과에 출처 가중치를 부여하는 제 1 출처 판정부(144)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 3 항에 있어서,
상기 입력 모듈(210)은,
상기 사용자에게 기사 URL을 입력받는 입력부(211)와,
상기 입력부(211)에 의해 입력받은 기사 URL을 수집하는 제 2 기사 수집부(212)와,
상기 제 2 기사 수집부(212)에 의해 수집된 기사의 이미지를 추출하는 제 2 이미지 추출부(213)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 5 항에 있어서,
상기 제 2 이미지 조작 판별 모듈(220)은,
상기 입력 모듈(210)에 의해 추출된 이미지의 이미지 조작 여부를 판별하기 위해 추출된 상기 이미지를 입력 데이터의 형태로 변환하는 전처리를 수행하는 제 2 전처리부(221)와,
상기 학습부(122)에 의해 학습된 내용에 의거하여 이미지 조작을 예측하는 예측부(222)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 3 항에 있어서,
상기 제 2 메타데이터 판정 모듈(230)은,
상기 입력 모듈(210)로부터 추출된 이미지의 메타데이터를 추출하는 제 2 메타데이터 추출부(231)와,
상기 제 2 메타데이터 추출부(231)로부터 추출된 메타데이터를 통해 메타데이터 가중치를 부여하는 제 2 메타데이터 판정부(232)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.
제 3 항에 있어서,
상기 제 2 이미지 출처 판정 모듈(240)은,
상기 입력 모듈(210)로부터 추출된 이미지를 사용중인 웹페이지를 검색하는 제 2 이미지 출처 검색부(241)와,
상기 제 2 이미지 출처 검색부(241)의 검색 결과인 웹페이지에서 일치하는 이미지 및 상기 웹페이지 내의 정보를 추출하는 제 2 정보 추출부(242)와,
상기 제 2 정보 추출부(242)에 의해 추출된 상기 이미지 및 상기 정보를 분석하는 이미지 분석부(243)와,
상기 이미지 분석부(243)에 의해 분석된 결과에 출처 가중치를 부여하는 제 2 출처 판정부(244)를 포함하는 이미지 기반 가짜 뉴스 검출 시스템.