KR20240059930A - 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치 - Google Patents

악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치 Download PDF

Info

Publication number
KR20240059930A
KR20240059930A KR1020220141026A KR20220141026A KR20240059930A KR 20240059930 A KR20240059930 A KR 20240059930A KR 1020220141026 A KR1020220141026 A KR 1020220141026A KR 20220141026 A KR20220141026 A KR 20220141026A KR 20240059930 A KR20240059930 A KR 20240059930A
Authority
KR
South Korea
Prior art keywords
comments
malicious
avoid
detection
comment
Prior art date
Application number
KR1020220141026A
Other languages
English (en)
Inventor
이주석
김현우
이종복
Original Assignee
이주석
김현우
이종복
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이주석, 김현우, 이종복 filed Critical 이주석
Priority to KR1020220141026A priority Critical patent/KR20240059930A/ko
Publication of KR20240059930A publication Critical patent/KR20240059930A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Machine Translation (AREA)

Abstract

악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치가 개시된다. 본 발명의 실시 예에 따른 악플탐지 회피 시도 댓글의 검출 방법은, 기저장된 키워드 및 유사도를 이용하여 악플로 예상되는 댓글을 수집하는 단계, 수집된 악플 예상 댓글 중 악플탐지 회피를 시도한 댓글을 식별하는 단계, 식별된 악플탐지 회피를 시도한 댓글에 의해 악플 탐지 모듈을 학습시키는 단계, 및 학습된 악플 탐지 모듈에 의해 악플을 탐지하는 단계를 포함한다.

Description

악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치 {METHOD FOR DETECTING COMMENTS THAT ATTEMPT TO AVOID MALICIOUS COMMENTS, AND DEVICE FOR DETECTING MALICIOUS COMMENT}
본 발명은 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치에 관한 것으로서, 보다 상세하게는, 야민정음을 사용한 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치에 관한 것이다.
IT 기술의 발전에 따라, 남녀노소를 불문하고 온라인에 접속할 수 있는 기기들을 적어도 하나 이상 보유하고 있으며, 누구나 쉽게 콘텐츠를 제작하여 등록할 수 있음에 따라, 온라인 상에는 수많은 정보가 넘쳐나고 있다.
일반적으로, 온라인 상에 게시된 콘텐츠는 콘텐츠를 게시한 사람과 콘텐츠를 시청하는 사람과의 상호 소통을 위해 댓글 기능이 제공된다. 온라인 콘텐츠에 대한 댓글은 해당 온라인 콘텐츠의 또 하나의 서브 콘텐츠가 될 수 있다. 즉, 댓글은 콘텐츠를 게시한 사람뿐만 아니라 다른 사용자들도 읽을 수 있기 때문에, 여러 사람에게 영향을 끼칠 수 있다.
댓글 기능은, 해당 온라인 콘텐츠에 대한 감상평, 혹은 문의 사항들을 간단하게 기재하는 용도이지만, 경우에 따라서는 악의적으로 온라인 콘텐츠 및 해당 콘텐츠를 게시한 사람을 비방하는 내용을 포함하기도 한다.
악의적인 댓글을 '악플'이라 칭한다. 이러한 악플은 여러 사람에게 피해를 주기 때문에, 악플을 필터링하기 위한 다양한 방안들이 안출되었다. 예를 들면, 악플일 것으로 예상되는 단어들을 데이터베이스화하여, 이 데이터베이스에 존재하는 단어가 감지되면 해당 댓글을 악플로 탐지하는 기술이 개시되어 있다.
그런데, 악플 탐지 기술이 알려지면서 이를 회피하기 위하여 한글의 초성, 중성, 중성을 분리하여 기재하거나, 글자와 글자 사이에 알파벳이나 숫자를 추가하는 등의 방법으로 교묘하게 악플 탐지 기술을 회피하고 있다. 그러므로, 악플을 보다 효율적으로 감지하기 위한 방안이 요구된다.
국내등록특허 제10-2366369호(2022. 02. 18. 공개)
전술한 문제점을 해결하기 위하여 본 발명이 이루고자 하는 기술적 과제는, 야민정음을 사용한 악플탐지 회피 시도 댓글을 추출하여 악플 탐지 모듈을 지속적으로 학습시켜 악플탐지 회피 시도를 색출함으로써, 온라인 상에서의 모든 악플을 감시할 수 있는 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치를 제시하는 데 있다.
본 발명의 해결과제는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 해결과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 기술적 과제를 해결하기 위한 수단으로서, 본 발명의 실시 예에 따른 악플탐지 회피 시도 댓글의 검출 방법은, 기저장된 키워드 및 유사도를 이용하여 악플로 예상되는 댓글을 수집하는 단계, 수집된 악플 예상 댓글 중 악플탐지 회피를 시도한 댓글을 식별하는 단계, 식별된 악플탐지 회피를 시도한 댓글에 의해 악플 탐지 모듈을 학습시키는 단계, 및 학습된 악플 탐지 모듈에 의해 악플을 탐지하는 단계를 포함한다.
바람직하게, 악플탐지 회피를 시도한 댓글은, 단어를 한글의 초성, 중성, 및 종성을 분리하여 기재한 댓글, 단어의 중간에 알파벳, 숫자, 및 기호를 혼합하여 기재한 댓글을 포함할 수 있다.
또한 바람직하게, 악플탐지 회피를 시도한 댓글을 이미지화 하는 단계, 이미지화된 악플탐지 회피를 시도한 댓글로부터 텍스트를 추출하는 단계, 추출된 텍스트를 일반 텍스트로 변환하여, 악플탐지 회피를 시도한 댓글을 일반 댓글로 변환하는 단계를 더 포함할 수 있다.
한편, 본 발명의 다른 실시 예에 따른 악플 탐지 장치는, 기저장된 키워드 및 유사도를 이용하여 악플로 예상되는 댓글을 수집하는 악플 수집부, 수집된 악플 예상 댓글 중 악플탐지 회피를 시도한 댓글을 식별하는 식별부, 및 식별된 악플탐지 회피를 시도한 댓글에 의해 악플 탐지 모듈을 학습시키는 모듈 학습부를 포함하고, 플 수집부는, 학습된 악플 탐지 모듈에 의해 악플을 탐지한다.
바람직하게, 악플탐지 회피를 시도한 댓글은, 단어를 한글의 초성, 중성, 및 종성을 분리하여 기재한 댓글, 단어의 중간에 알파벳, 숫자, 및 기호를 혼합하여 기재한 댓글을 포함할 수 있다.
또한 바람직하게, 악플탐지 회피를 시도한 댓글을 이미지화 하는 이미지 변환부, 이미지화된 악플탐지 회피를 시도한 댓글로부터 텍스트를 추출하는 텍스트 추출부, 및 추출된 텍스트를 일반 텍스트로 변환하여, 악플탐지 회피를 시도한 댓글을 일반 댓글로 변환하는 댓글 변환부를 더 포함할 수 있다.
본 발명에 따르면, 한글을 야민정음화하여 악플 탐지를 회피하고자 시도한 댓글들을 추출하고, 이에 의해 악플 탐지 모듈을 지속적으로 학습시킴으로써, 온라인 상에 난무하고 있는 악플을 검출해 낼 수 있으며, 악플을 일반 댓글로 변환해 주는 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치를 제공하는 효과가 있다.
본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
첨부된 도면은 해당 기술 분야의 통상의 기술자에게 본 발명의 내용을 보다 상세하게 설명하기 위한 것으로 본 발명의 기술적 사상이 이에 한정되는 것은 아니다.
도 1은 본 발명의 바람직한 실시예에 따른 악플탐지 회피 시도 댓글의 검출 시스템의 네트워크 구성도,
도 2는 본 발명의 바람직한 실시예에 따른 악플 탐지 장치의 기능 블록도, 그리고,
도 3은 본 발명의 바람직한 실시예에 따른 악플탐지 회피 시도 댓글의 검출 방법을 설명하기 위한 흐름도이다.
이상의 본 발명의 목적들, 다른 목적들, 특징들 및 이점들은 첨부된 도면과 관련된 이하의 바람직한 실시 예들을 통해서 쉽게 이해될 것이다. 그러나 본 발명은 여기서 설명되는 실시 예들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 오히려, 여기서 소개되는 실시 예들은 개시된 내용이 철저하고 완전해질 수 있도록 그리고 당업자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 제공되는 것이다.
본 명세서에서, 어떤 구성요소가 다른 구성요소 상에 있다고 언급되는 경우에 그것은 다른 구성요소 상에 직접 형성될 수 있거나 또는 그들 사이에 제 3의 구성요소가 개재될 수도 있다는 것을 의미한다. 또한, 도면들에 있어서, 구성요소들의 두께는 기술적 내용의 효과적인 설명을 위해 과장된 것이다.
본 명세서에서 제1, 제2 등의 용어가 구성요소들을 기술하기 위해서 사용된 경우, 이들 구성요소들이 이 같은 용어들에 의해서 한정되어서는 안 된다. 이들 용어들은 단지 어느 구성요소를 다른 구성요소와 구별시키기 위해서 사용되었을 뿐이다. 여기에 설명되고 예시되는 실시 예들은 그것의 상보적인 실시 예들도 포함한다.
또한, 제1 엘리먼트 (또는 구성요소)가 제2 엘리먼트(또는 구성요소) 상(ON)에서 동작 또는 실행된다고 언급될 때, 제1 엘리먼트(또는 구성요소)는 제2 엘리먼트(또는 구성요소)가 동작 또는 실행되는 환경에서 동작 또는 실행되거나 또는 제2 엘리먼트(또는 구성요소)와 직접 또는 간접적으로 상호 작용을 통해서 동작 또는 실행되는 것으로 이해되어야 할 것이다.
어떤 엘리먼트, 구성요소, 장치, 또는 시스템이 프로그램 또는 소프트웨어로 이루어진 구성요소를 포함한다고 언급되는 경우, 명시적인 언급이 없더라도, 그 엘리먼트, 구성요소, 장치, 또는 시스템은 그 프로그램 또는 소프트웨어가 실행 또는 동작하는데 필요한 하드웨어(예를 들면, 메모리, CPU 등)나 다른 프로그램 또는 소프트웨어(예를 들면 운영체제나 하드웨어를 구동하는데 필요한 드라이버 등)를 포함하는 것으로 이해되어야 할 것이다.
또한, 어떤 엘리먼트(또는 구성요소)가 구현됨에 있어서 특별한 언급이 없다면, 그 엘리먼트(또는 구성요소)는 소프트웨어, 하드웨어, 또는 소프트웨어 및 하드웨어 어떤 형태로도 구현될 수 있는 것으로 이해되어야 할 것이다.
또한, 본 명세서에서 사용된 용어는 실시 예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 '포함한다(comprises)' 및/또는 '포함하는(comprising)'은 언급된 구성요소는 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.
도 1은 본 발명의 바람직한 실시예에 따른 악플탐지 회피 시도 댓글의 검출 시스템의 네트워크 구성도이다.
도 1을 참조하여, 본 발명의 바람직한 실시예에 따른 악플탐지 회피 시도 댓글의 검출 시스템은, 상호 간에 네트워크 통신이 가능한 다수의 사용자 단말장치(100), 및 악플 탐지 장치(200)로 이루어진다.
사용자 단말장치(100)는 온라인에 접속하는 모든 사용자들이 사용하는 단말장치로, 사용자들은 사용자 단말장치(100)를 통해 온라인에 접속해 특정 콘텐츠에 댓글을 남길 수 있다. 이들 중 어느 하나는 악플을 남기는 사용자를 지칭하는 악플러일 수 있다.
악플 탐지 장치(200)는 사용자들이 사용자 단말장치(100)를 통해 온라인 사이트에 접속하여 남긴 댓글을 탐지하고, 댓글 중 악의를 가진 악플을 색출하며, 악플 중에서도 악플탐지를 회피하기 위한 시도가 담긴 악플을 추출한다.
악플탐지를 회피하기 위한 시도로는, 단어를 한글의 초성, 중성, 및 종성을 분리하여 기재한 댓글, 단어의 중간에 알파벳, 숫자, 및 기호를 혼합하여 기재한 댓글이 이에 해당할 수 있다.
이러한 형태를 '야민정음'이라 한다. 야민정음은, 일반적인 키워드 방식의 악플 탐지 프로그램을 통한 악플 탐지를 회피하기 위해 만들어진 개념이다. 키워드 방식의 악플 탐지 프로그램은, 단어가 조금만 달라져도 악플로 탐지가 되지 않는다는 점에 착안한 것으로, 이를 회피하기 위하여 단어에서 초성, 중성, 및 종성을 분리하여 각각 기재하거나 혹은 단어에 무의미한 알파벳, 숫자, 기호 등을 추가하여 기재하는 방식으로 악플 탐지를 회피하고자 하는 시도에 해당한다.
악플 탐지 장치(200)는 악플 탐지 회피를 시도한 댓글을 색출하기 위한 서버에 해당할 수 있다. 악플 탐지 장치(200)에 관하여는 후술하는 도 2에서 보다 상세히 설명한다.
도 2는 본 발명의 바람직한 실시예에 따른 악플 탐지 장치의 기능 블록도이다.
도 2를 참조하면, 본 발명의 바람직한 실시예에 따른 악플 탐지 장치(200)는 악플 수집부(210), 식별부(220), 모듈 학습부(230), 이미지 변환부(240), 텍스트 추출부(250), 댓글 변환부(260), 저장부(270), 네트워크 인터페이스부(280), 제어부(290)를 포함한다.
악플 수집부(210)는 온라인에 게시된 악플로 예상되는 댓글 중 악플로 예상되는 댓글을 수집한다. 이때, 악플의 추출은 기저장된 키워드 및 유사도를 이용하여 댓글들 중에서 악플을 추출할 수 있다.
식별부(220)는 악플 수집부(210)에서 수집한 악플 예상 댓글 중 악플탐지 회피를 시도한 댓글을 식별한다. 여기서, 악플탐지 회피를 시도한 댓글은 야민정음을 사용하여 작성한 댓글을 의미할 수 있다.
모듈 학습부(230)는 딥러닝에 의해 악플 탐지 모듈을 학습시킨다. 보다 구체적으로, 모듈 학습부(230)는 식별부(220)에 의해 악플탐지 회피를 시도한 댓글이 식별될 때마다 악플 탐지 모듈을 학습시킨다. 즉, 댓글에 사용된 야민정음이 발결될 때마다 악플 탐지 모듈을 학습시키며, 이에 의해 악플 탐지 모듈은 새로운 야민정음을 모두 학습하게 된다.
이미지 변환부(240)는 악플탐지 회피를 시도한 댓글을 이미지화한다.
텍스트 추출부(250)는 이미지 변환부(240)에 의해 이미지화된 악플탐지 회피를 시도한 댓글로부터 텍스트를 추출한다.
댓글 변환부(260)는 텍스트 추출부(250)에 의해 추출된 텍스트를 일반 텍스트로 변환하는 동작에 의해, 악플 탐지 회피를 시도한 댓글을 일반 댓글로 변환한다.
이미지 변환부(240)에서 해당 댓글을 이미지화하고, 텍스트 추출부(250)에서 이미지화된 댓글로부터 텍스트를 추출한 후, 댓글 변환부(260)에서 텍스트를 일반 텍스트로 변환하는 동작은, 변환 성능을 조절하여 야민정음화된 한글이 정상적인 한글의 상태로 변환될 수 있도록 하기 위함이다. 야민정음의 경우, 한글의 초성, 중성, 종성이 분리되어 있는 경우가 있는데, 이때 변환 AI의 성능이 우수하면, 야민정음을 야민정음의 상태 그대로 변환하게 된다. 그러므로, 본 실시예에서는, 야민정음이 정상적인 한글의 상태로 변환될 수 있도록 하기 위하여, 변환 AI의 성능을 조절하도록 구성한다. 예를 들면, “ㄱ ㅐ 멋져”라고 입력된 야민정음의 경우, 변환 AI의 성능이 좋으면 “ㄱ ㅐ 멋져”의 상태 그대로 출력이 되는데, 이때 변환 AI의 성능을 감소시켜 “개멋져”의 상태가 출력되도록 한다.
저장부(270)는 본 악플 탐지 장치(200)의 동작에 필요한 모든 정보를 저장한다. 예를 들면, 악플 탐지 모듈의 동작에 필요한 정보를 저장할 수 있고, 악플 수집부(210)가 댓글 수집에 사용할 온라인 서버(미도시)들의 IP를 저장할 수 있다.
네트워크 인터페이스부(280)는 본 악플 탐지 장치(200)의 네트워크 인터페이스를 지원한다. 네트워크 인터페이스부(280)를 통해 사용자 단말장치(100)와의 소정 정보를 송수신할 수 있고, 다양한 온라인 서버들에 접속할 수 있다.
제어부(290)는 본 악플 탐지 장치(200)의 전반적인 동작을 제어한다. 즉, 제어부(290)는 악플 수집부(210), 식별부(220), 모듈 학습부(230), 이미지 변환부(240), 텍스트 추출부(250), 댓글 변환부(260), 저장부(270), 네트워크 인터페이스부(280)들 간의 신호 입출력을 제어한다.
도 3은 본 발명의 바람직한 실시예에 따른 악플탐지 회피 시도 댓글의 검출 방법을 설명하기 위한 흐름도이다.
여기에서는 도 1 내지 도 3을 참조하여, 본 발명의 바람직한 실시예에 따른 악플탐지 회피 시도 댓글의 검출 방법을 설명한다.
악플 수집부(210)는 기저장된 키워드 및 유사도를 이용하여 악플로 예상되는 댓글을 수집한다(S310).
식별부(220)는 악플 수집부(210)에서 수집한 악플 예상 댓글 중 악플탐지 회피를 시도한 댓글을 식별한다(S320). 여기서, 악플탐지 회피를 시도한 댓글은 야민정음을 사용한 댓글일 수 있다.
모듈 학습부(230)는 식별부(220)에서 악플탐지 회피를 시도한 댓글을 식별해 낼 때마다 악플 탐지 모듈을 학습시킨다(S330). 결국, 악플 탐지 모듈은 온라인에 등장하는 모든 야민정음을 학습하게 된다.
악플 수집부(210)는 모듈 학습부(230)에 의해 학습된 악플 탐지 모듈에 의해 악플을 탐지한다(S340).
이후, 이미지 변환부(240)는 악플탐지 회피 시도 댓글을 이미지로 변환하고(S350), 텍스트 추출부(250)는 이 이미지로부터 텍스트를 추출하며(S360), 댓글 변환부(260)에서 이 텍스트를 일반 텍스트로 변환하여 악플탐지 회피 시도 댓글을 일반 댓글로 변환한다(S370).
이러한 과정에 의해, 악플을 추출하되 악플로부터 악플탐지 회피를 시도한 댓글을 식별하고, 이들을 통해 악플 탐지 모듈을 학습시킨다. 악플 탐지 모듈은 결국에는 온라인에서 사용되고 있는 모든 야민정음을 학습하게 되어, 모든 악플 탐지 회피 시도를 차단할 수 있다.
또한, 야민정음을 사용한 악플탐지 회피 시도 댓글을 일반 댓글로 변환함으로써, 온라인 상에서의 언어 순화 역할도 할 수 있다.
본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
S310 : 악플 수집 단계
S320 : 악플탐지 회피 시도 댓글 식별 단계
S330 : 악플 탐지 모듈 학습 단계
S340 : 악플 탐지 단계
S350 : 이미지 변환 단계
S360 : 텍스트 추출 단계
S370 : 일반 댓글 변환 단계

Claims (6)

  1. 기저장된 키워드 및 유사도를 이용하여 악플로 예상되는 댓글을 수집하는 단계;
    상기 수집된 악플 예상 댓글 중 악플탐지 회피를 시도한 댓글을 식별하는 단계;
    상기 식별된 악플탐지 회피를 시도한 댓글에 의해 악플 탐지 모듈을 학습시키는 단계; 및
    상기 학습된 악플 탐지 모듈에 의해 악플을 탐지하는 단계;를 포함하는 것을 특징으로 하는 악플탐지 회피 시도 댓글의 검출 방법.
  2. 제 1 항에 있어서,
    상기 악플탐지 회피를 시도한 댓글은, 단어를 한글의 초성, 중성, 및 종성을 분리하여 기재한 댓글, 단어의 중간에 알파벳, 숫자, 및 기호를 혼합하여 기재한 댓글을 포함하는 것을 특징으로 하는 악플탐지 회피 시도 댓글의 검출 방법.
  3. 제 1 항에 있어서,
    상기 악플탐지 회피를 시도한 댓글을 이미지화 하는 단계;
    상기 이미지화된 악플탐지 회피를 시도한 댓글로부터 텍스트를 추출하는 단계;
    상기 추출된 텍스트를 일반 텍스트로 변환하여, 악플탐지 회피를 시도한 댓글을 일반 댓글로 변환하는 단계;를 더 포함하는 것을 특징으로 하는 악플탐지 회피 시도 댓글의 검출 방법.
  4. 기저장된 키워드 및 유사도를 이용하여 악플로 예상되는 댓글을 수집하는 악플 수집부;
    상기 수집된 악플 예상 댓글 중 악플탐지 회피를 시도한 댓글을 식별하는 식별부; 및
    상기 식별된 악플탐지 회피를 시도한 댓글에 의해 악플 탐지 모듈을 학습시키는 모듈 학습부;를 포함하고,
    상기 악플 수집부는, 상기 학습된 악플 탐지 모듈에 의해 악플을 탐지하는 것을 특징으로 하는 악플 탐지 장치.
  5. 제 4 항에 있어서,
    상기 악플탐지 회피를 시도한 댓글은, 단어를 한글의 초성, 중성, 및 종성을 분리하여 기재한 댓글, 단어의 중간에 알파벳, 숫자, 및 기호를 혼합하여 기재한 댓글을 포함하는 것을 특징으로 하는 악플 탐지 장치.
  6. 제 4 항에 있어서,
    상기 악플탐지 회피를 시도한 댓글을 이미지화 하는 이미지 변환부;
    상기 이미지화된 악플탐지 회피를 시도한 댓글로부터 텍스트를 추출하는 텍스트 추출부; 및
    상기 추출된 텍스트를 일반 텍스트로 변환하여, 악플탐지 회피를 시도한 댓글을 일반 댓글로 변환하는 댓글 변환부;를 더 포함하는 것을 특징으로 하는 악플 탐지 장치.
KR1020220141026A 2022-10-28 2022-10-28 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치 KR20240059930A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220141026A KR20240059930A (ko) 2022-10-28 2022-10-28 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220141026A KR20240059930A (ko) 2022-10-28 2022-10-28 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치

Publications (1)

Publication Number Publication Date
KR20240059930A true KR20240059930A (ko) 2024-05-08

Family

ID=91074677

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220141026A KR20240059930A (ko) 2022-10-28 2022-10-28 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치

Country Status (1)

Country Link
KR (1) KR20240059930A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102366369B1 (ko) 2020-06-09 2022-02-22 성신여자대학교 연구 산학협력단 악성 텍스트 데이터 인식방법 및 악성 텍스트 데이터 인식장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102366369B1 (ko) 2020-06-09 2022-02-22 성신여자대학교 연구 산학협력단 악성 텍스트 데이터 인식방법 및 악성 텍스트 데이터 인식장치

Similar Documents

Publication Publication Date Title
US10169706B2 (en) Corpus quality analysis
Opara et al. HTMLPhish: Enabling phishing web page detection by applying deep learning techniques on HTML analysis
CN112686036B (zh) 风险文本识别方法、装置、计算机设备及存储介质
US11886815B2 (en) Self-supervised document representation learning
US10762192B2 (en) Cleartext password detection using machine learning
CN113055386A (zh) 一种攻击组织的识别分析方法和装置
JP5314195B2 (ja) 自然言語処理装置、方法、及びプログラム
Zhao et al. Exploiting classification correlations for the extraction of evidence-based practice information
CN116776889A (zh) 一种基于图卷积网络和外部知识嵌入的粤语谣言检测方法
JP2012088803A (ja) 悪性ウェブコード判別システム、悪性ウェブコード判別方法および悪性ウェブコード判別用プログラム
Wen et al. Cross-lingual cross-platform rumor verification pivoting on multimedia content
Karimi et al. Evaluation methods for statistically dependent text
CN113918973A (zh) 一种密标检测方法、装置及电子设备
Hossain et al. AraCovTexFinder: Leveraging the transformer-based language model for Arabic COVID-19 text identification
Sundriyal et al. DESYR: definition and syntactic representation based claim detection on the web
Ahmad et al. Analysis of the effects and relationship of perceived handwritten signature's size, graphical complexity, and legibility with dynamic parameters for forged and genuine samples
KR20240059930A (ko) 악플탐지 회피 시도 댓글의 검출 방법 및 악플 탐지 장치
CN111563276B (zh) 一种网页篡改检测方法、检测系统及相关设备
Abdelhakim et al. Ar-PuFi: A short-text dataset to identify the offensive messages towards public figures in the Arabian community
Barbieri et al. Multi-task emoji learning
JP2021125040A (ja) 帳票仕分システム、帳票仕分方法、及びプログラム
Nguyen et al. Measuring Moral Dimensions in Social Media with Mformer
Farazmanesh et al. Compromised account detection using authorship verification: a novel approach
Zhou et al. EACE: A document-level event argument extraction model with argument constraint enhancement
KR20200010669A (ko) 빅데이터 기반의 웹접근성 개선 장치 및 방법