KR101594452B1 - 온라인 게시물의 유언비어 식별장치 - Google Patents

온라인 게시물의 유언비어 식별장치 Download PDF

Info

Publication number
KR101594452B1
KR101594452B1 KR1020150127053A KR20150127053A KR101594452B1 KR 101594452 B1 KR101594452 B1 KR 101594452B1 KR 1020150127053 A KR1020150127053 A KR 1020150127053A KR 20150127053 A KR20150127053 A KR 20150127053A KR 101594452 B1 KR101594452 B1 KR 101594452B1
Authority
KR
South Korea
Prior art keywords
post
posts
unit
posting
vowel
Prior art date
Application number
KR1020150127053A
Other languages
English (en)
Inventor
전호철
Original Assignee
국방과학연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국방과학연구소 filed Critical 국방과학연구소
Priority to KR1020150127053A priority Critical patent/KR101594452B1/ko
Application granted granted Critical
Publication of KR101594452B1 publication Critical patent/KR101594452B1/ko

Links

Images

Classifications

    • G06Q50/30
    • G06F17/2705
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따른 온라인 게시물(Online posting)의 유언비어(rumor) 식별장치는, 사용자로부터의 게시물을 수집/분석/유언비어 판단을 수행할 주소(URL)를 입력 받고, 상기 게시물의 분석결과 및 통계 데이터를 출력하는 사용자인터페이스부; 각 SNS 매체별 URL을 통해 각 유형별 게시물들을 수집하는 수집기부; 수집된 각 게시물에 대해 개행문자 제거하여 전처리를 수행하는 전처리부; 상기 각 게시물의 헤더 또는 게시물내 포함된 작성일시, 작성자, IP의 속성값들을 추출하는 속성추출부; 및 기 각 게시물에 대해 상기 속성값들에 기반하여 악의적 의도와 관련된 평가값을 연산하고, 상기 연산된 평가값에 기반하여 유언비어 여부를 판단하는 유언비어 식별부를 포함하여, 다양한 온라인 매체에서 유통되는 다양한 형태의 유언비어의 식별이 가능하다.

Description

온라인 게시물의 유언비어 식별장치{AN APPARATUS FOR IDENTIFYING A RUMOR OF ONLINE POSTING}
본 발명은 온라인 게시물의 유언비어 식별 방법 및 그 장치에 관한 것이다.
웹이 발전하면서 웹사이트뿐 아니라 블로그, 카페, SNS 등 다양한 온라인 매체들이 개발되고 이를 이용하는 사람들이 늘어남에 따라 온라인상에 게시되는 게시물의 수는 매일 기하급수적으로 늘어나고 있다. 이러한 게시물 중에는 잘못된 사실을 마치 진실인 것처럼 사용자들을 현혹하는 것들이 있다. 이처럼 검증되지 않은 정보를 유언비어라 하며, 이러한 유언비어는 오보(Misinformation)와 역정보(Disinformation)의 두 가지 유형으로 구분되며, 트위터나 페이스북 같은 SNS(Social Network Service)를 통해 빠르게 사람들 사이에 퍼지고 있다. 오보는 불확실한 사실이나 실수에 의해 주로 발생하며, 대체로 의도하지 않은 잘못된 정보가 전달되는 경우가 이에 해당한다. 반면에 역정보는 개인 또는 단체가 특정한 목적을 성취하기 위해 의도적으로 퍼뜨리는 정보다. 오보는 의도를 지니지 않았기 때문에 그 대상이 불분명한 반면, 역정보는 의도적으로 만들어지고 퍼뜨려지는 정보이기 때문에 그 대상이 정해져 있으며, 해당 정보를 여과 없이 믿을 경우 치명적 손실을 야기 할 수 있다. 이러한 유언비어는 국방, 경제, 사회 등 각 분야별로 다양하게 존재할 수 있다. 특히 국방분야의 역정보는 주로 적대국에 의해 조직적으로 이루어 지며, 주로 상대국의 사회혼란 야기 및 내부분열을 목적으로 의도적으로 수행되기 때문에 그 영향이나 파장은 다른 분야보다 더 치명적일 수 있다. 또한 유언비어는 텍스트뿐 아니라 그림, 음성/음악, 동영상 등 매우 다양한 형태로 온라인을 통해 유포 될 수 있으며, 온라인을 통해 유포되는 유언비어들은 오프라인을 통해 유포되는 유언비어보다 그 전파 속도나 범위가 상대적으로 매우 빠르고 광범위하다.
기존의 유언비어식별 연구들은 오보나 역정보에 대한 구분이 없거나 오보에 초점을 맞추어 진행되고, 그 의도에 대한 고려없이 유언비어 식별이 이루어지기 때문에 특정 계정의 폐쇄를 관리자에게 요청하는 등 적절한 대응방법을 찾는 것이 쉽지 않고, 해당 유언비어 유포자의 다음 행동에 대한 확률적 예측도 쉽지 않다. 또한 각 유언비어에 대한 영향력이나 파급효과를 고려하지 않아 모든 유언비어를 동일하게 취급하지만, 각 유언비어가 속한 분야에 따라 다른 분야보다 보다 민감할 수 있으며, 또한 유언비어의 내용에 따라 대응방법을 달리 하거나 보다 빠른 대응을 필요로 하는 경우 적절하게 처리하지 못할 수 있다. 마지막으로 기존의 대부분 연구들은 빠르게 유포되는 특징을 지닌 SNS상의 단문 텍스트에만 초점을 맞추어 유언비어 식별 대상이 텍스트이다. 동일한 유언비어 식별 알고리즘을 다른 유형에 그대로 적용하기 어려운 것을 감안할 때, 기존의 연구들은 다양한 유형의 유언비어 식별이 어렵다. 이와 관련하여, 대한민국 등록특허 10-1174192에서는 블랙 리스트 및 화이트 리스트를 참조하여 검수 목록을 추출하고, 추출된 검수 목록에 대한 서비스 데이터를 검수하는 특징을 제시한다. 하지만, 이러한 기존 특허에서도 온라인 게시물의 악의적 의도와 관련된 평가값에 기반하여 유언비어의 식별이 어렵다는 문제점이 여전히 존재한다.
본 발명은 이와 같은 다양한 유형의 유언비어에 대한 식별 및 상기 유포자의 행동의 예측을 목적으로 한다.
본 발명은 유언비어의 영향력을 고려하여 상기 유언비어에 대한 대응 방법을 제공하는 것을 또 다른 목적으로 한다.
이와 같은 목적을 달성하기 위한 본 발명에 따른 온라인 게시물(Online posting)의 유언비어(rumor) 식별장치는, 사용자로부터의 게시물을 수집/분석/유언비어 판단을 수행할 주소(URL)를 입력 받고, 상기 게시물의 분석결과 및 통계 데이터를 출력하는 사용자인터페이스부; 각 SNS 매체별 URL을 통해 각 유형별 게시물들을 수집하는 수집기부; 수집된 각 게시물에 대해 개행문자 제거하여 전처리를 수행하는 전처리부; 상기 각 게시물의 헤더 또는 게시물내 포함된 작성일시, 작성자, IP의 속성값들을 추출하는 속성추출부; 및 기 각 게시물에 대해 상기 속성값들에 기반하여 악의적 의도와 관련된 평가값을 연산하고, 상기 연산된 평가값에 기반하여 유언비어 여부를 판단하는 유언비어 식별부를 포함한다.
일 실시예에 따르면, 상기 유언비어 식별장치는, 상기 각 게시물에 첨부된 파일에서 유언비어 식별을 위한 특징값들을 추출하는 특징 추출부; 상기 각 게시물의 게시물에 대해 형태소분석을 수행하는 형태소분석부; 상기 속성값, 특징값 및 형태소분석에 기반하여, 상기 각 게시물을 사전에 정의된 카테고리로 분류하기 위한 유언비어 분류부; 및 상기 유언비어의 영향력 지수를 계산하는 유언비어 평가부를 더 포함할 수 있다.
일 실시예에 따르면, 상기 유언비어 식별부는, 상기 게시물의 유형에 따라 상기 유언비어를 평가하기 위한 서로 다른 인자들을 적용하며, 하나의 게시물에 둘 이상의 유형이 존재하는 경우, 각각의 유형에 대해 서로 다른 인자들을 적용할 수있다.
일 실시예에 따르면, 상기 하나의 게시물에 둘 이상의 유형이 존재하는 경우, 하나의 유형에 대하여 악의적 의도가 존재한다고 판단되면, 상기 게시물을 유언비어로 판단할 수 있다.
일 실시예에 따르면, 상기 게시물이 유언비어로 판단된 경우, 상기 게시물의 영향력지수를 기반으로 상기 게시물이 검색되는 경우, 상기 게시물에 대응방안에 대한 자동 추천 및 상기 게시물과 관련된 웹사이트 운용자 별 대응방안을 상기 사용자 인터페이스부에 출력할 수 있다.
이와 같은 목적을 달성하기 위한 본 발명에 따른 온라인 게시물의 유언비어식별방법은, 사용자로부터의 게시물을 수집/분석/유언비어 판단을 수행할 주소(URL)를 입력받는 단계; 각 SNS 매체별 URL을 통해 각 유형별 게시물들을 수집하는 단계; 상기 수집된 각 게시물에 대해 개행문자 제거하여 전처리를 수행하는 단계; 상기 각 게시물의 헤더 또는 게시물내 포함된 작성일시, 작성자, IP의 속성값들을 추출하는 단계; 및 상기 각 게시물에 대해 상기 속성값들에 기반하여 악의적 의도와 관련된 평가값을 연산하고, 상기 연산된 평가값에 기반하여 유언비어 여부를 판단하는 단계를 포함한다.
상기 유언비어식별방법은, 상기 각 게시물에 첨부된 파일에서 유언비어 식별을 위한 특징값들을 추출하는 단계; 상기 각 게시물의 게시물에 대해 형태소분석을 수행하는 단계; 상기 추출된 속성값, 특징값 및 형태소분석에 기반하여, 상기 각 게시물을 사전에 정의된 카테고리로 분류하는 단계; 및 상기 유언비어의 영향력 지수를 계산하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 다양한 온라인 매체에서 유통되는 다양한 형태의 유언비어의 식별이 가능하며, 그 의도를 확률적으로 인지하여 역정보를 식별하고 해당 유언비어 유포자의 다음 행동에 대한 확률적 예측이 가능함에 따라 관리자가 유언비어에 대해 보다 적절히 대처를 할 수 있다.
본 발명에 따르면, 유언비어의 영향력(또는 파급효과)을 고려함에 따라 여러 유언비어가 동시에 발생시 그 처리에 따른 우선순위나 대응방법을 달리 함으로써 해당 대응방법을 수행하는데 필요한 자원을 보다 효과적으로 사용할 수 있다.
도 1은 본 발명에 따른 유언비어 식별장치의 상세한 구성을 도시하는 도면이다.
도 2는 악의적 의도를 인지하기 위한 방법과 관련된 요소들을 나타낸 개념도를 도시한다.
도 3 및 도 4는 본 발명에 따른 유언비어 식별 방법의 흐름도를 도시한다.
상술한 본 발명의 특징 및 효과는 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명은 다양한 변경을 가할 수 있고 여러가지 형태를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 개시형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 명세서에서 사용한 용어는 단지 특정한 실시 예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다.
본 발명은 관한 온라인상에 유포되는 유언비어의 실질적 내용 및 파급효과를 분석하기 어렵다는 문제점을 해소하기 위하여, 유언비어의 실질적 내용 및 파급효과를 고려한 유언비어 식별 장치 및 방법을 제안한다.
이하, 본 발명에 따른 유언비어 식별 장치 및 방법에 있어, 유언비어의 실질적 내용 및 파급효과를 고려한 유언비어 식별 장치 및 그 제어 방법을 도면을 참조하여 보다 상세하게 설명한다.
도 1은 본 발명에 따른 유언비어 식별장치(100)의 상세한 구성을 도시하는 도면이다. 도1에 도시된 바와 같이, 본 발명에 따른 유언비어 식별장치(100)는 사용자인터페이스부(110), 저장부(200) 및 제어부(300)를 포함한다.
여기서, 상기 제어부(300)는 수집기부(320), 전처리기부(330), 속성추출부(340), 유언비어 식별부(350), 특징추출부(360), 형태소분석부(370), 유언비어 분류부(380) 및 유언비어 평가부(390)를 포함할 수 있다.
먼저, 사용자인터페이스부(110)는 사용자로부터 수집하고자 온라인 매체의 URL을 입력 받는다. 사용자는 수집할 사이트, 카페, 블로그, 페이스북, 트위터, 유투브 등 수집할 온라인 매체의 URL을 사용자인터페이스부(110)에 입력하며, 이때 주기 및 적용기간를 추가하여 설정한 주기마다 수집하고 정해진 기간이 지나면 해지되어 더 이상 수집하지 않도록 할 수 있다.
수집기부(320)는 각 URL을 통해 게시물들을 수집하며, 개수의 제한은 없고, 설정된 기간과 주기가 있으면 설정된 값에 따라 주기적으로 해당 URL을 통해 게시물들을 수집하고 저장부(200)를 통해 데이터베이스에 저장한다. 이때, 데이터베이스에 저장된 게시물과 비교하여 기 수집된 게시물은 저장하지 않는다. 게시물 수집중 게시물내 동영상, 이미지, 음성/노래 등의 데이터가 포함된 경우 자동으로 다운로드를 통해 지정된 위치에 저장한다.
계속하여, 전처리부(330)는 수집된 게시물에 대해 개행문자 같은 특수문자 제거 등의 전처리 작업을 수행한다.
또한 속성추출부(340)는 각 게시물의 Header나 게시물내 포함된 작성일시나 작성자, ip 등의 속성값뿐 아니라 해당 게시물에 대한 retweet, mention 또는 댓글 등에 대해서도 작성자 및 작성일시 등을 추출하며 이를 근거로 각 retweet, mention, 또는 댓글의 극성(긍정 또는 부정)을 구분하여 유언비어 식별부(370)에 의해 게시물의 악의적 의도를 판단할 때 활용한다.
계속하여, 특징추출부(350)는 동영상 등에서 유언비어 식별을 위한 색상, 질감 등의 특징값들을 추출하며, 유언비어 식별부(370)에 의해 게시물의 악의적 의도를 판단할 때 활용한다.
유언비어 식별부(370)는 속성추출부(340)에 의해 추출된 게시물의 속성정보와 특징추출부(350)에 의해 추출된 특징정보 등에 기반해 구현된 베이지안네트워크에 따라 악의적 의도를 확률적으로 인지한다.
한편, 도 2는 상기 악의적 의도를 인지하기 위한 방법과 관련된 요소들을 나타낸 개념도를 도시한다. 상기 악의적 의도를 인지하기 위한 요소들은 시간', '사이트'의 도메인정보와 '문서분석지수', '유언비어 생성/유포이력', '유포된 사이트 수', '대상 유무' 같은 상황정보를 함께 고려하여 확률적으로 계산한다. 또한, 각 행동들은 '악의적의도'를 지녔을 때 나타날 수 있는 행동들을 의미하며, 이들간의 관계는 인과관계를 표현하고 있다. 악의적 의도에 대한 판단은 다음의 수식1과 같은 베이스정리를 이용해서 수식2의 확률밀도함수
Figure 112015087302594-pat00001
를 계산함으로써 결정한다.
Figure 112015087302594-pat00002
Figure 112015087302594-pat00003
이때,
Figure 112015087302594-pat00004
는 도메인 정보를 나타내는 벡터,
Figure 112015087302594-pat00005
는 상황정보에 대한 벡터,
Figure 112015087302594-pat00006
는 관측된 행동에 대한 벡터를 나타낸다.
확률밀도함수
Figure 112015087302594-pat00007
의 값이 일정 임계값(α) 이상이면 악의적 의도가 있다고 판단하며 해당 유언비어를 유언비어로 판단한다.
형태소분석부(360)는 게시물의 게시물에 대해 형태소분석을 수행하며, 유언비어 식별부(370)는 각 게시물에 대해 악의적 의도의 유무를 확률적으로 판단하고 유언비어를 식별한다.
유언비어 분류부(380)는 각 추출된 속성 및 특징값, 형태소분석에 기반해 각 게시물을 사전에 정의된 카테고리로 분류하는 기능을 한다. 각 카테고리는 사전에 정의되며, 국방, 정치, 사회, 연예, 스포츠, 문화 등으로 정의 될 수 있으며, 사전에 각 카테고리별 게시물들을 수집/분석하고 각 카테고리별 특징들을 저장하여 신규 게시물의 분류시 사용한다.
또한, 유언비어 평가부(390)는 각 유언비어의 영향력 지수를 계산하며, 영향력지수는 게시물을 작성한 사용자 정보, 게시물의 내용, 해당 게시물의 분류 정보를 고려하여 계산되며, 다음의 수식3으로 표현될 수 있다.
Figure 112015087302594-pat00008
이때, UP(User Power)는 해당 문서를 작성한 사용자의 영향력을 나타내는 지표로 작성자의 직업과 팔로워수/친구수를 고려해 계산된다. 이때, 직업은 사전 정의된 분류에 따라 0과 1사이의 값을 지닌다. 정부관계자와 같이 파급효과가 큰 직업군일수록 1에 가까운 값을 지닌다. CC(Category Classification)는 해당 문서가 분류될 수 있는 카테고리의 영향지수를 나타내며, 0과 1사이의 값을 지닌다. 국방, 정치, 사회, 경제와 같이 직접적 위협을 줄 수 있는 분야일수록 1에 가까운 값을 지닌다. CA(Content Analysis)는 해당 문서의 내용을 분석한 결과에 따라 위협 정도를 구분한 것으로, 문서의 내용에 따라 '매우치명적', '치명적', '보통', '경미', '무시'의 다섯 가지로 구분된다. RIF는 0과 1사이의 값을 지니며, 1에 가까울수록 파급효과가 크다는 것을 의미한다. RIF값에 따라 취해야 할 행동을 사전에 정의함으로써 관리자 또는 사용자로 하여금 적절한 행동을 취할 수 있도록 할 수 있다. 예를 들면, '사이버 수사국/사이버 사령부 등 관련기관 의뢰', '계정폐쇄/삭제 요청', '경고' 등의 행동을 적절하게 정의함으로써 시스템은 유언비어 식별 시 신속하게 사용자에게 경고와 함께 적절한 행동에 대한 추천을 할 수 있다.
한편, 상기 저장부(200)는 각 게시물 및 속성 등 유언비어의 평가까지 추출되거나 계산된 모든 관련값들을 데이터베이스에 저장하고 이를 관리하는 역할을 한다.
한편, 도 3 및 도 4는 본 발명에 따른 유언비어 식별 방법의 흐름도를 도시한다.
상기 유언비어 식별 방법은 도 3에 도시된 바와 같이, 주소 입력 단계(S310), 게시물 수집 단계(S320), 전처리 수행 단계(S330), 속성값 추출 단계(S340) 및 유언비어 판단 단계(S350)를 포함한다.
또한, 상기 유언비어 식별 방법은 도 4에 도시된 바와 같이, 특징값 추출 단계(S360), 형태소분석 단계(S370) 및 카테고리 분류 단계(S380) 및 영향력 지수 평가 단계(S390)를 더 포함할 수 있다.
상기 주소 입력 단계(S310)는 사용자로부터의 게시물을 수집/분석/유언비어 판단을 수행할 주소(URL)를 입력받는다.
상기 게시물 수집 단계(S320)는 각 SNS 매체별 URL을 통해 각 유형별 게시물들을 수집한다.
상기 전처리 수행 단계(S330)는 상기 수집된 각 게시물에 대해 개행문자 제거하여 전처리를 수행한다.
상기 속성값 추출 단계(S340)는 상기 각 게시물의 헤더 또는 게시물내 포함된 작성일시, 작성자, IP의 속성값들을 추출한다.
상기 유언비어 판단 단계(S350)는 상기 각 게시물에 대해 상기 속성값들에 기반하여 악의적 의도와 관련된 평가값을 연산한다. 또한, 상기 유언비어 판단 단계(S350)는 상기 연산된 평가값에 기반하여 유언비어 여부를 판단할 수 있다.
상기 유언비어 판단 단계(S350)에서, 상기 게시물의 유형에 따라 상기 유언비어를 평가하기 위한 서로 다른 인자들을 적용하며, 하나의 게시물에 둘 이상의 유형이 존재하는 경우, 각각의 유형에 대해 서로 다른 인자들을 적용할 수 있다.
이때, 상기 하나의 게시물에 둘 이상의 유형이 존재하는 경우, 하나의 유형에 대하여 악의적 의도가 존재한다고 판단되면, 상기 게시물을 유언비어로 판단할 수 있다.
상기 특징값 추출 단계(S360)는 상기 각 게시물에 첨부된 파일에서 유언비어 식별을 위한 특징값들을 추출한다.
상기 형태소분석 단계(S370)는 상기 각 게시물의 게시물에 대해 형태소분석을 수행한다.
상기 카테고리 분류 단계(S380)는 상기 추출된 속성값, 특징값 및 형태소분석에 기반하여, 상기 각 게시물을 사전에 정의된 카테고리로 분류한다.
상기 영향력 지수 평가 단계(S390)는 상기 유언비어의 영향력 지수를 계산하고, 상기 유언비어의 영향력 지수를 평가한다.
이때, 상기 게시물이 유언비어로 판단된 경우, 상기 게시물의 영향력지수를 기반으로 상기 게시물이 검색되는 경우, 상기 게시물에 대응방안에 대한 자동 추천 및 상기 게시물과 관련된 웹사이트 운용자 별 대응방안을 사용자 인터페이스부에 출력한다.
한편, 도 1 및 도 2를 포함하여 전술된 바와 같이, 유언비어 식별장치에 관한 설명들은 도 3 및 도 4에 제시된 유언비어 식별방법과 결합되어, 상기 유언비어를 식별하고, 이들을 관리하는 방법으로 사용될 수 있음은 물론이다.
이를 통하여, 본 발명은 다양한 온라인 매체에서 유통되는 다양한 형태의 유언비어의 식별이 가능하다.
또한, 본 발명은 유언비어의 의도를 인지하여, 해당 소스로부터의 유언비어에 대한 예측 및 대응이 가능하다는 장점이 있다.
한편 상기 도 1에 제시된 제어부(300)는 하드웨어, 소프트웨어 및 이들의 조합에 의해 구현될 수 있다. 또한, 상기 제어부(300)의 세부 구성 요소 또한 하드웨어, 소프트웨어 및 이들의 조합에 의해 구현될 수 있다.
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능 뿐만 아니라 각각의 구성 요소들은 별도의 소프트웨어 모듈로도 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리에 저장되고, 제어부(controller) 또는 프로세서(processor)에 의해 실행될 수 있다.
100: 유언비어 식별장치 200: 저장부
300: 제어부

Claims (7)

  1. 온라인 게시물(Online posting)의 유언비어(rumor) 식별장치에 있어서,
    사용자로부터의 게시물을 수집/분석/유언비어 판단을 수행할 주소(URL)를 입력 받고, 상기 게시물의 분석결과 및 통계 데이터를 출력하는 사용자인터페이스부;
    각 SNS 매체별 URL을 통해 각 유형별 게시물들을 수집하는 수집기부;
    수집된 각 게시물에 대해 개행문자 제거하여 전처리를 수행하는 전처리부;
    상기 각 게시물의 헤더 또는 게시물내 포함된 작성일시, 작성자, IP의 속성값들을 추출하는 속성추출부; 및
    상기 각 게시물에 대해 상기 속성값들에 기반하여 악의적 의도와 관련된 평가값을 연산하고, 상기 연산된 평가값에 기반하여 유언비어 여부를 판단하는 유언비어 식별부;
    상기 각 게시물에 첨부된 파일에서 유언비어 식별을 위한 특징값들을 추출하는 특징 추출부;
    상기 각 게시물의 게시물에 대해 형태소분석을 수행하는 형태소분석부;
    상기 추출된 속성값, 특징값 및 형태소분석에 기반하여, 상기 각 게시물을 사전에 정의된 카테고리로 분류하기 위한 유언비어 분류부; 및
    상기 유언비어의 영향력 지수를 계산하는 유언비어 평가부를 포함하는, 유언비어 식별장치.
  2. 삭제
  3. 제1항에 있어서,
    상기 유언비어 식별부는, 상기 게시물의 유형에 따라 상기 유언비어를 평가하기 위한 서로 다른 인자들을 적용하며, 하나의 게시물에 둘 이상의 유형이 존재하는 경우, 각각의 유형에 대해 서로 다른 인자들을 적용하는, 유언비어 식별장치.
  4. 제3항에 있어서,
    상기 하나의 게시물에 둘 이상의 유형이 존재하는 경우, 하나의 유형에 대하여 악의적 의도가 존재한다고 판단되면, 상기 게시물을 유언비어로 판단하는, 유언비어 식별장치.
  5. 제3항에 있어서,
    상기 게시물이 유언비어로 판단된 경우, 상기 게시물의 영향력지수를 기반으로 상기 게시물이 검색되는 경우, 상기 게시물에 대응방안에 대한 자동 추천 및 상기 게시물과 관련된 웹사이트 운용자 별 대응방안을 상기 사용자 인터페이스부에 출력하는, 유언비어 식별장치
  6. 유언비어 식별방법에 있어서,
    사용자로부터의 게시물을 수집/분석/유언비어 판단을 수행할 주소(URL)를 입력받는 단계;
    각 SNS 매체별 URL을 통해 각 유형별 게시물들을 수집하는 단계;
    상기 수집된 각 게시물에 대해 개행문자 제거하여 전처리를 수행하는 단계;
    상기 각 게시물의 헤더 또는 게시물내 포함된 작성일시, 작성자, IP의 속성값들을 추출하는 단계;
    상기 각 게시물에 대해 상기 속성값들에 기반하여 악의적 의도와 관련된 평가값을 연산하고, 상기 연산된 평가값에 기반하여 유언비어 여부를 판단하는 단계;
    상기 각 게시물에 첨부된 파일에서 유언비어 식별을 위한 특징값들을 추출하는 단계;
    상기 각 게시물의 게시물에 대해 형태소분석을 수행하는 단계;
    상기 추출된 속성값, 특징값 및 형태소분석에 기반하여, 상기 각 게시물을 사전에 정의된 카테고리로 분류하는 단계; 및
    상기 유언비어의 영향력 지수를 계산하는 단계를 포함하는, 유언비어 식별방법.
  7. 삭제
KR1020150127053A 2015-09-08 2015-09-08 온라인 게시물의 유언비어 식별장치 KR101594452B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150127053A KR101594452B1 (ko) 2015-09-08 2015-09-08 온라인 게시물의 유언비어 식별장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150127053A KR101594452B1 (ko) 2015-09-08 2015-09-08 온라인 게시물의 유언비어 식별장치

Publications (1)

Publication Number Publication Date
KR101594452B1 true KR101594452B1 (ko) 2016-02-17

Family

ID=55457712

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150127053A KR101594452B1 (ko) 2015-09-08 2015-09-08 온라인 게시물의 유언비어 식별장치

Country Status (1)

Country Link
KR (1) KR101594452B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108614855A (zh) * 2018-03-19 2018-10-02 众安信息技术服务有限公司 一种谣言识别方法
KR20190019589A (ko) 2017-08-18 2019-02-27 주식회사 포스코아이씨티 팩트체크 시스템 및 방법
CN111610913A (zh) * 2020-04-24 2020-09-01 维沃移动通信有限公司 一种消息鉴别方法、装置及电子设备
CN112001072A (zh) * 2020-08-17 2020-11-27 东北财经大学 基于爆发阈值及用户体验的谣言抑制方法
CN112749559A (zh) * 2021-01-19 2021-05-04 北京邮电大学 微博谣言检测模型训练方法、微博谣言检测方法及装置
KR20210092979A (ko) 2020-01-17 2021-07-27 글로벌사이버대학교 산학협력단 가짜 뉴스 인공지능 판별 시스템 및 그 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020027142A (ko) * 2000-10-04 2002-04-13 송완주 정보 모니터링 시스템 및 방법
KR20070090312A (ko) * 2006-03-02 2007-09-06 엔에이치엔(주) 스팸 지수 산정 방법 및 시스템
KR20090000284A (ko) * 2007-02-14 2009-01-07 (주)인포메딕스프리벤션테크놀로지 관심주제에 대한 동향 및 성향 분석시스템
KR101469009B1 (ko) * 2013-10-21 2014-12-05 한국전자통신연구원 스팸 그룹 추출 장치 및 그 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020027142A (ko) * 2000-10-04 2002-04-13 송완주 정보 모니터링 시스템 및 방법
KR20070090312A (ko) * 2006-03-02 2007-09-06 엔에이치엔(주) 스팸 지수 산정 방법 및 시스템
KR20090000284A (ko) * 2007-02-14 2009-01-07 (주)인포메딕스프리벤션테크놀로지 관심주제에 대한 동향 및 성향 분석시스템
KR101469009B1 (ko) * 2013-10-21 2014-12-05 한국전자통신연구원 스팸 그룹 추출 장치 및 그 방법

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190019589A (ko) 2017-08-18 2019-02-27 주식회사 포스코아이씨티 팩트체크 시스템 및 방법
KR101972660B1 (ko) * 2017-08-18 2019-04-25 주식회사 포스코아이씨티 팩트체크 시스템 및 방법
CN108614855A (zh) * 2018-03-19 2018-10-02 众安信息技术服务有限公司 一种谣言识别方法
KR20210092979A (ko) 2020-01-17 2021-07-27 글로벌사이버대학교 산학협력단 가짜 뉴스 인공지능 판별 시스템 및 그 방법
CN111610913A (zh) * 2020-04-24 2020-09-01 维沃移动通信有限公司 一种消息鉴别方法、装置及电子设备
CN111610913B (zh) * 2020-04-24 2021-08-24 维沃移动通信有限公司 一种消息鉴别方法、装置及电子设备
CN112001072A (zh) * 2020-08-17 2020-11-27 东北财经大学 基于爆发阈值及用户体验的谣言抑制方法
CN112001072B (zh) * 2020-08-17 2023-06-16 东北财经大学 基于爆发阈值及用户体验的谣言抑制方法
CN112749559A (zh) * 2021-01-19 2021-05-04 北京邮电大学 微博谣言检测模型训练方法、微博谣言检测方法及装置

Similar Documents

Publication Publication Date Title
KR101594452B1 (ko) 온라인 게시물의 유언비어 식별장치
Boididou et al. Detection and visualization of misleading content on Twitter
Nouh et al. Understanding the radical mind: Identifying signals to detect extremist content on twitter
Gharge et al. An integrated approach for malicious tweets detection using NLP
CN107437038B (zh) 一种网页篡改的检测方法及装置
Kumar et al. Multimedia social big data: Mining
Stamatatos Authorship Verification: A Review of Recent Advances.
KR20130022042A (ko) 토픽별 오피니언과 소셜 영향력자를 기반으로 토픽을 탐지하고 추적하는 시스템 및 방법
CN105359181A (zh) 基于在线内容评估品牌的价值
Klyuev Fake news filtering: Semantic approaches
JP2017527913A (ja) 経験属性による体系化されていないデータのソースの分析、選定、及び取り込みのためのシステム及びプロセス
KR20200062520A (ko) 출처 분석 기반의 뉴스 신뢰성 평가 시스템 및 그 동작 방법
KR102135074B1 (ko) 인공지능 기반의 팩트 체크 가이드라인을 이용한 가짜 뉴스 판별 시스템
Nirmala et al. Twitter data analysis for unemployment crisis
Rajesh et al. Fraudulent news detection using machine learning approaches
Samonte Polarity analysis of editorial articles towards fake news detection
Singh et al. On the coherence of fake news articles
Eckhardt et al. A User-centric Focus for Detecting Phishing Emails
CN113157871A (zh) 应用人工智能的新闻舆情文本处理方法、服务器及介质
Thanos et al. Combined deep learning and traditional NLP approaches for fire burst detection based on twitter posts
CN116795978A (zh) 一种投诉信息处理方法、装置、电子设备及介质
CN106462614B (zh) 信息分析系统、信息分析方法以及信息分析程序
Yin et al. Research of integrated algorithm establishment of a spam detection system
KR102180329B1 (ko) 가짜 뉴스 판단 시스템
Chaurasia et al. Sentiment Analysis of Twitter Data by Natural Language Processing and Machine Learning

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190201

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20200204

Year of fee payment: 5