KR20160029164A - 이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템 - Google Patents

이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템 Download PDF

Info

Publication number
KR20160029164A
KR20160029164A KR1020140117412A KR20140117412A KR20160029164A KR 20160029164 A KR20160029164 A KR 20160029164A KR 1020140117412 A KR1020140117412 A KR 1020140117412A KR 20140117412 A KR20140117412 A KR 20140117412A KR 20160029164 A KR20160029164 A KR 20160029164A
Authority
KR
South Korea
Prior art keywords
image
spam
data
pixel
mms
Prior art date
Application number
KR1020140117412A
Other languages
English (en)
Inventor
김광립
김지혜
강인숙
김태균
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020140117412A priority Critical patent/KR20160029164A/ko
Publication of KR20160029164A publication Critical patent/KR20160029164A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/58Message adaptation for wireless communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템으로서, 멀티 미디어 메시지(MMS)에 포함된 이미지를 추출하는 이미지 추출 단계; 상기 이미지를 픽셀 단위로 변환하고, 픽셀 단위의 상기 이미지의 색상 또는 명암 분포에 대한 픽셀 히스토그램 데이터를 생성하는 이미지 분석 단계; 및 상기 이미지에 대한 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터를 대비하여 상기 이미지에 대한 스팸 여부를 판단하는 스팸 판단 단계를 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법과 이를 구현하기 위한 시스템이며, 이와 같은 본 발명에 의하면 이미지를 포함하는 MMS의 스팸 여부를 분석하는 것이 용이하지 않은 문제를 해결하여, 이미지 형태의 스팸 MMS를 통해 텍스트 분석용 스팸 차단 솔루션을 우회하여 전파시키는 스팸 MMS를 필터링하고 차단할 수 있게 된다.

Description

이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템 {Method and System for filtering image spam massage in mobile network}
본 발명은 이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템에 대한 것으로서, 보다 상세하게는 멀티미디어 메시지에 포함된 이미지에 대한 픽셀 분석을 통해 스팸 여부를 판단하는 방안에 관한 것이다.
이동통신 단말기가 현대인의 생활 필수품으로 자리 잡으면서 이동통신망으로 전달되는 스팸 메시지는 기하급수적으로 증가하였으며, 무차별적인 스팸 메시지 발송으로 인해 이를 수신하는 수신자는 원치 않는 메시지에 노출되는 불편함이 있고, 또한 이동통신사에게는 동시 다발적인 대량 스팸 메시지 발생에 따른 통신망 부하 등으로 인해 비용 낭비를 야기시키는 문제가 있어 스팸 메시지를 필터링하여 차단하는 대책 강구가 절실하다.
스팸 메시지는 비용절감을 위한 홍보 마케팅 수단으로 적극 이용되면서 더욱 확산되고 있는데, 스? 메시지가 단순히 홍보 차원에 그치지 않고 이를 통해 악성 코드 등을 유포시키는 수단으로도 이용됨에 따라 스팸 메시지로 인한 2차, 3차 피해 등이 발생되는 등 많은 부작용이 발생되고 있는 실정이다.
스팸 메시지의 차단과 관련하여, 이동통신망을 통한 단순 문자 메시지인 SMS(Short Message Service)의 경우에는 메시지 상에 포함된 문자열을 분석하여 스팸 여부를 판단하는 텍스트 필터링 기술을 통해 현재 각 통신사별로 스팸 SMS를 차단하는 스팸 차단 솔루션을 구축하고 있다.
그러나 멀티 미디어 메시지인 MMS(Multi-media Message Service)의 경우에는 단순 문자열뿐만 아니라 이미지 등을 포함하므로 이에 대한 스팸 여부를 분석하는 것이 용이하지가 않다. 이로 인해 스패머는 전달하고자 하는 내용을 텍스트가 아닌 이미지 형태로 바꾸어 MMS를 통해 현재 구축된 스팸 차단 솔루션을 우회하여 전파하고 있는데, 그에 따른 스팸 MMS에 대한 적절한 차단이 이루어지지 못하고 있어 스팸 MMS의 차단과 관련된 기술 개발에 대한 요구가 절실하다.
MMS에 포함된 이미지의 스팸 여부를 판단하기 위한 다양한 방안이 제시되고 있는데, 그 중 하나는 방안은 OCR(Optical Character Reader) 판독 방식이다. OCR 판독 방식은 이미지 상에 포함된 텍스트를 인식하여 추출하고, 추출된 텍스트에 대한 스팸 여부를 판단하는 방식이다.
그러나 OCR 판독 방식은, 이미지 상의 문자체가 인식되지 않는 형태로 변형되거나 신종 문자체를 이용하는 경우, 또는 이미지의 해상도가 낮은 경우에 텍스트의 판독이 적절하게 이루어지지 않음으로써 실질적으로 이미지 스팸 여부를 판단하는데 있어서 신뢰성이 떨어지는 문제점이 있다.
기존 OCR 방식을 보완하고자 제시된 다른 방안으로서, 이미지에 포함된 패턴을 추출하고 패턴을 텍스트로 분석하는 방식이 시도되고 있으나, 이와 같은 방식의 경우에도 이미지의 해상도가 낮은 경우에는 패턴 분석이 적절히 이루어지지 못하고, 또한 이미지 분석을 위한 고성능 자원이 도입되어야 하며 처리 속도가 늦어 실시간 전송되어야 하는 대량의 MMS에 포함된 이미지를 처리하기에는 효율성이 떨어지는 문제점이 있다.
다른 하나의 방안은 MMS에 포함된 이미지 전체를 픽셀로 분석하여 스팸 여부를 판단하는 방식으로서, 이미지 전체에 대한 픽셀을 추출하고 이를 기보유된 스팸 정보와 대비하여 스팸 여부를 판단하는 방식인데, 실시간 전송되어야 하는 대량의 MMS에 포함된 이미지 전체의 픽셀을 추출하고 개별적인 픽셀들을 일일이 대비하기에는 처리 속도의 효율성이 떨어지며, 또한 고해상도 이미지나 사이즈가 큰 이미지의 경우 분석할 픽셀 수가 급증하고 스팸 정보로서 보유할 데이터의 용량이 방대하여 시스템 구축이 용이하지 않다는 문제점이 있다.
본 발명은 상술한 바와 같은 종래 기술의 문제점을 해결하고자 하는 것으로서, 멀티 미디어 메시지인 MMS에 포함된 이미지의 스팸 여부를 분석하는 것이 용이하지 않은 문제를 해결하여, 이미지 형태의 스팸 MMS를 통해 텍스트 분석용 스팸 차단 솔루션을 우회하여 전파시키는 스팸 MMS를 필터링하고 차단하는 방안을 제시하는 것을 주된 목적으로 한다.
특히, 이미지 상의 문자체가 변형되거나 신종 문자체를 이용하는 경우 또는 이미지의 해상도가 낮은 경우에 OCR 판독 방식 등 기존 스팸 판단 방식을 적용함에 따라 스팸 판단에 대한 정확성과 신뢰성이 떨어지는 문제점을 해결하고자 한다.
또한, 이미지에 대한 스팸 여부를 판단하기 위해 이미지 분석을 위한 고성능 자원이 필요하고 그에 따라 시스템 구축 및 운용 비용이 증가되는 문제를 해결하고, 대용량 데이터를 처리해야 함에 따라 처리 속도가 늦어져 실시간 전송되어야 하는 대량의 MMS에 포함된 이미지의 스팸 판단을 처리하는데 효율성이 떨어지는 문제점을 해결하고자 한다.
나아가서, 스팸 이미지 자체를 저장하거나 스팸 이미지의 전체 픽셀 정보를 저장하는 경우에 기하급수적으로 저장 용량이 소요되는 문제점을 해결하면서, 스팸 이미지의 사이즈가 상이하거나 다양하게 변형되는 변종 스팸 이미지를 정확하게 검출해 낼 수 있는 방안을 제공하고자 한다.
상기 기술적 과제를 달성하고자 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법은, 멀티 미디어 메시지(MMS)에 포함된 이미지를 추출하는 이미지 추출 단계; 상기 이미지를 픽셀 단위로 변환하고, 픽셀 단위의 상기 이미지의 색상 또는 명암 분포에 대한 픽셀 히스토그램 데이터를 생성하는 이미지 분석 단계; 및 상기 이미지에 대한 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터를 대비하여 상기 이미지에 대한 스팸 여부를 판단하는 스팸 판단 단계를 포함할 수 있다.
바람직하게는 상기 이미지 분석 단계는, 상기 이미지를 픽셀 단위로 변환하는 단계; 상기 이미지의 각 픽셀에 대한 색상 데이터를 추출하는 단계; 및 상기 이미지의 색상 데이터를 기초로 픽셀 히스토그램 데이터를 생성하는 단계를 포함할 수 있다.
또는 상기 이미지 분석 단계는, 상기 이미지를 그레이 변환하는 단계; 그레이 변환된 상기 이미지를 픽셀 단위로 변환하는 단계; 상기 이미지의 각 픽셀에 대한 명암 데이터를 추출하는 단계; 및 상기 이미지의 명암 데이터를 기초로 픽셀 히스토그램 데이터를 생성하는 단계를 포함할 수도 있다.
나아가서 상기 스팸 판단 단계는, 상기 이미지에 대한 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터를 대비하여 유사율을 산출하는 단계; 및 상기 유사율을 기초로 상기 이미지에 대한 스팸 여부를 판단하는 단계를 포함할 수 있다.
바람직하게는 상기 유사율을 산출하는 단계는, 상기 픽셀 히스토그램 데이터와 이에 대응되는 기보유된 스팸 이미지 데이터를 대비하여 비교값을 산출하는 단계; 상기 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터에 기설정된 오차범위를 적용하여 오차 수용 한계를 산출하는 단계; 및 상기 비교값과 상기 오차 수용 한계를 대비하여 유사율을 산출하는 단계를 포함할 수 있다.
또한 상기 이미지 추출 단계는, 이동통신망을 통해 수신자에게 전송될 멀티 미디어 메시지 중 이미지를 포함하는 멀티 미디어 메시지를 감시하여, 상기 멀티 미디어 메시지에서 이미지를 추출하며, 상기 스팸 판단 단계의 수행 후, 스팸으로 판단된 이미지를 포함하는 멀티 미디어 메시지의 전송을 차단하는 메시지 차단 단계를 더 포함할 수도 있다.
나아가서 상기 스팸 판단 단계의 수행 후, 스팸으로 판단된 이미지에 대한 픽셀 히스토그램 데이터를 스팸 이미지 데이터로 저장하는 스팸 이미지 데이터 업그레이드 단계를 더 포함할 수도 있다.
또는 상기 이미지 추출 단계는, 사용자가 신고하는 스팸 의심 이미지를 포함하는 멀티 미디어 메시지를 수집하고, 수집된 멀티 미디어 메시지에서 이미지를 추출할 수도 있다.
나아가서 상기 이미지 추출 단계는, 상기 멀티 미디어 메시지에 포함된 이미지에 대한 해시값을 추출하고, 상기 해시값을 기보유된 스팸 이미지의 해시값 데이터와 대비하여 상기 멀티 미디어 메시지에 대한 스팸 여부를 판단하는 해시값 대비 단계를 더 포함하며, 상기 해시값 대비 단계의 수행 결과에 따라 상기 이미지 분석 단계를 수행하거나 상기 스팸 판단 단계의 수행 결과에 따라 상기 해시값 대비 단계를 수행할 수도 있다.
한걸음 더 나아가서 상기 멀티 미디어 메시지에 포함된 이미지에 대한 OCR 판독을 수행하여 텍스트를 추출하고, 상기 텍스트에 대한 스팸 여부를 판단하는 OCR 판독 단계를 더 포함하며, 상기 OCR 판독 단계의 수행 결과에 따라 상기 이미지 분석 단계를 수행하거나, 상기 스팸 판단 단계의 수행 결과에 따라 상기 OCR 판독 단계를 수행할 수도 있다.
또한 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 시스템은, 멀티 미디어 메시지(MMS)에 포함된 이미지를 추출하고, 추출된 이미지를 픽셀 단위로 변환하여, 상기 이미지에 대한 픽셀 히스토그램 데이터를 생성하는 이미지 분석부; 및 상기 이미지에 대한 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터를 대비하여 상기 이미지에 대한 스팸 여부를 판단하는 픽셀 비교 판단부를 포함하는 스팸 이미지 판단 수단과; 스팸 이미지에 대한 스팸 이미지 데이터를 저장한 스팸 정보 DB를 포함할 수 있다.
상황에 따라서 상기 스팸 이미지 판단 수단은, 상기 이미지에 대한 해시값과 기보유된 스팸 이미지의 해시값 데이터를 대비하여 스팸 여부를 판단하는 해시값 비교 판단부를 더 포함하며, 상기 스팸 정보 DB는, 스팸 이미지에 대한 해시값 데이터를 저장할 수 있다.
또는 상기 스팸 이미지 판단 수단은, 상기 이미지에 대한 OCR 판독을 수행하여 텍스트를 추출하고, 추출된 텍스트를 기보유된 스팸 텍스트 데이터와 대비하여 스팸 여부를 판단하는 OCR 판독부를 더 포함하며, 상기 스팸 정보 DB는, 스팸 텍스트 데이터를 저장할 수도 있다.
나아가서 MMSC와 연동하여, 이동통신망을 통해 수신자에게 전송될 멀티 미디어 메시지 중 이미지를 포함하는 멀티 미디어 메시지를 감시하는 MMS 수집 수단을 더 포함할 수 있다.
나아가서 MMS 수집 수단은, 스팸 의심 이미지를 포함하는 멀티 미디어 메시지를 사용자로부터 신고받아 수집할 수도 있다.
바람직하게는 상기 스팸 이미지 판단 수단이 스팸으로 판단한 이미지를 포함하는 멀티 미디어 메시지의 전송을 차단하는 스팸 메시지 차단 수단을 더 포함할 수 있다.
이와 같은 본 발명에 의하면, 이미지를 포함하는 MMS의 스팸 여부를 분석하는 것이 용이하지 않은 문제를 해결하여, 이미지 형태의 스팸 MMS를 통해 텍스트 분석용 스팸 차단 솔루션을 우회하여 전파시키는 스팸 MMS를 필터링하고 차단할 수 있게 된다.
특히, 이미지 상의 문자체가 변형되거나 신종 문자체를 이용하여 기존 스팸 이미지를 변형시키는 경우에도 정확하게 스팸 여부를 판단할 수 있으며, 이미지의 해상도에 상관없이 스팸 여부를 신뢰성 높게 판단할 수 있다.
나아가서 MMS에 포함된 이미지에 대한 스팸 여부를 판단하기 위해 이미지 분석을 위한 고성능 자원이 요구되지 않아 전체적인 시스템 구축 및 운용 비용을 낮출 수 있으며, 스팸 판단을 위한 처리 데이터를 획기적으로 줄임으로써 이미지 스팸 여부 판단의 처리 속도를 향상시켜 실시간 전송되는 대량의 MMS에 포함된 이미지에 대하여 효율적으로 스팸 판단을 처리할 수 있게 된다.
한 걸음 나아가서, 다양하게 변형되는 변종 스팸 이미지를 정확하게 검출해 낼 수 있으며, 실시간 발생되는 새로운 변종 스팸 이미지에 대한 업데이트가 가능하여 새로운 스팸 정보에 대한 실시간 제공이 가능해진다.
또한 색상 분포에 대한 픽셀 히스토그램 데이터 또는 명암 분포에 대한 픽셀 히스토그램 데이터를 스팸 이미지 데이터로 저장함으로써, 스팸 이미지의 해상도나 사이즈에 관계없이 동일한 데이터량으로 스팸 이미지에 대한 정보를 저장할 수 있어 데이터 관리가 용이하게 되며, 특히 스팸 이미지에 대한 정보가 계속적으로 누적되어 스팸 이미지 데이터를 대량으로 보유하는 경우에도 그에 대응되는 데이터량을 획기적으로 줄일 수 있게 된다.
도 1은 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지를 필터링하기 위한 전체적인 시스템의 구성도를 나타내며,
도 2는 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 시스템의 일실시예에 대한 구성도를 도시하며,
도 3은 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 시스템에서 스팸 이미지 판단 수단의 일실시예에 대한 구성도를 도시하며,
도 4는 본 발명에 따른 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 시스템에서 스팸 정보 DB의 일실시예에 대한 구성도를 도시하며,
도 5는 본 발명에 따른 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법의 일실시예에 대한 흐름도를 도시하며,
도 6은 본 발명에 따른 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법에서 MMS를 수집하는 일실시예에 대한 흐름도를 도시하며,
도 7은 본 발명을 적용하여 스팸 여부를 판단할 이미지에 대한 예시이며,
도 8은 상기 도 7에 대하여 본 발명에 따른 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법으로 픽셀 히스토그램 데이터와 스팸 이미지 데이터를 산출한 예시를 나타내며,
도 9는 상기 도 7의 예시에서 픽셀 히스토그램 데이터와 스팸 이미지 데이터를 대비하는 과정을 나타내며,
도 10은 본 발명에 따라 상기 도 7의 예시 이미지들에 대한 유사율 산출 결과를 나타내며,
도 11은 상기 도 5의 실시예에 스팸 여부 판단의 제1 추가 과정을 적용한 실시예를 나타내며,
도 12는 상기 도 5의 실시예에 스팸 여부 판단의 제2 추가 과정을 적용한 실시예를 나타낸다.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 설명하기 위하여 이하에서는 본 발명의 바람직한 실시예를 예시하고 이를 참조하여 살펴본다.
먼저, 본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로서, 본 발명을 한정하려는 의도가 아니며, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 또한 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 발명을 설명함에 있어서, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
본 발명은 멀티 미디어 메시지인 MMS(Multi-media Message Service)에 포함된 이미지에 대한 픽셀 히스토그램 데이터를 생성하고 이를 기초로 이미지에 대한 스팸 여부를 판단하여 스팸 MMS를 필터링하고 차단하는 방안을 개시한다.
도 1은 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지를 필터링하기 위한 전체적인 시스템의 구성도를 나타낸다.
본 발명은 이동통신망을 통해 전송되는 MMS 상에 포함된 이미지에 대한 스팸 여부를 판단하는 것인데, 상기 도 1에서 이동 통신망(30)은 CDMA, LTE 등의 다양한 통신 형태의 이동 통신망이 적용될 수 있으며, 이동 통신망(30)에 대한 구성은 공지된 내용이므로 자세한 설명은 생략하기로 한다.
MMS(70)는 이동 통신망(30) 상의 멀티미디어 메시징 서비스 센터 MMSC(Multimedia Messaging Service Center)(50)를 통해 전송되며, 본 발명에서 이미지 스팸 메시지 필터링 시스템(100)은 MMSC(50)와 연동하여 이미지를 포함하는 MMS(70)를 수집하거나 스팸으로 판단된 MMS(70)의 전송을 차단할 수 있다.
상기 도 1에서는 이미지 스팸 메시지 필터링 시스템(100)이 이동 통신망(30)의 외부에 위치된 것으로 도시되었으나, 상황에 따라서는 이동 통신사 자체 시스템으로 구축되어 이동 통신망(30)의 내부에 위치될 수도 있다.
그리고 이동통신 단말(10)은 기본적으로 이동 통신망(30)을 통해 MMS(70)의 수신이 가능한 단말로서 셀룰러폰, 스마트폰, 테블릿 PC 등 MMS 수신이 가능한 다양한 종류의 단말이 적용될 수 있다.
본 발명에 따른 이미지 스팸 메시지 필터링 시스템(100)은 상기 도 1에서와 같이 이동 통신망(30)의 외부에 위치되거나 또는 이동 통신망(30) 내에 위치되어 이동통신망(30)을 통해 실시간 전송되는 MMS(70) 중 이미지를 포함하는 MMS(70)를 감시하여, 스팸 이미지를 포함하는 MMS(70)를 필터링할 수 있고, 나아가서 스팸 MMS의 전송을 차단하는 서비스를 제공하는 시스템으로 구성될 수 있으며, 추가적으로 새롭게 변형된 스팸 이미지나 신규 스팸 이미지에 대한 데이터를 업데이트하여 스팸 이미지에 대한 정보를 제공하는 서비스에 대한 시스템으로 구축될 수도 있다.
도 2는 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 시스템의 일실시예에 대한 구성도를 도시한다.
이미지 스팸 메시지 필터링 시스템(100)은 개략적으로 MMS 수집 수단(110), 스팸 이미지 판단 수단(130), 스팸 정보 DB(170)를 포함하여 구성될 수 있으며, 추가적으로 스팸 메시지 차단 수단(150)을 포함할 수도 있다.
MMS 수집 수단(110)은 이미지를 포함하는 MMS를 수집하는데, 이동통신망(30) 상의 MMSC(50)와 연동하여 이동통신망 상을 통해 전송되는 MMS를 실시간 감시하여 수집할 수도 있고, 또는 사용자로부터 스팸 의심 이미지를 포함하는 MMS를 신고받아 수집할 수도 있다.
스팸 이미지 판단 수단(130)은 MMS에 포함된 이미지에 대한 스팸 여부를 판단하는데, 스팸 이미지 여부를 판단하는데 있어서 이미지를 픽셀 단위로 변환하고 픽셀 단위의 이미지에 대한 색상 또는 명암 분포를 기초로 픽셀 히스토그램 데이터를 생성하여 상기 픽셀 히스토그램 데이터로 스팸 여부를 판단하게 된다.
색상 분포의 경우 R, G, B 각각이 256개로 분류되어 RGB 색상표는 총 768개로 구분되므로, 이미지에 대한 색상 분포를 픽셀 히스토그램으로 산출하면 이는 768개의 정수값으로 산출된다. 따라서 이미지에 대한 색상 분포를 기초로 하는 픽셀 히스토그램 데이터는 768개의 정수값으로 나타나며, 이는 해상도나 이미지 사이즈에 관계없이 항상 768개의 정수값으로 나타나게 된다.
또한 명암 분포의 경우 명암이 256개로 구분되므로, 이미지에 대한 명암 분포를 픽셀 히스토그램으로 산출하면 이는 256개의 정수값으로 산출되며, 이또한 해상도나 이미지 사이즈에 관계없이 항상 256개의 정수값으로 나타나게 된다.
여기서, 상기 픽셀 히스토그램 데이터로 스팸 여부를 판단하기 위해 사전에 보유된 스팸 이미지 데이터들과 상기 픽셀 히스토그램 데이터를 대비하여 유사율에 따라 해당 이미지의 스팸 여부를 판단할 수 있다.
즉, 사전에 스팸으로 판단된 이미지에 대한 픽셀 히스토그램 데이터를 스팸 이미지 데이터로 보유하는데, 하나의 스팸 이미지의 색상 분포에 대한 스팸 이미지 데이터는 항시 768개의 정수값으로 저장되고, 명암 분포에 대한 스팸 이미지 데이터는 항시 256개의 정수값으로 저장된다.
나아가서, 판단 대상 이미지에 대하여 픽셀 히스토그램 데이터로 스팸 여부를 판단하기 이전이나 또는 픽셀 히스토그램 데이터로 판단 대상 이미지에 대한 스팸 여부의 판단이 명확하지 않은 경우, 스팸 이미지 판단 수단(130)은 추가적으로 이미지의 해시값으로 스팸 여부를 판단하기 위한 구성이나 OCR 판독으로 스팸 여부를 판단하기 위한 구성을 포함할 수도 있다.
스팸 정보 DB(170)는 스팸으로 판단된 이미지에 대한 스팸 이미지 데이터를 보유하는데, 상기 스팸 이미지 데이터는 관리자에 의해 업데이트될 수도 있고 또는 이미지 스팸 메시지 필터링 시스템(100)이 이미지의 픽셀 히스토그램 데이터가 스팸으로 판단되는 경우에 이를 스팸 이미지 데이터로 업데이트할 수도 있다. 가령, 기보유된 스팸 이미지 데이터와 판단 대상 이미지의 픽셀 히스토그램 데이터를 대비하여 판단 대상 이미지가 변형된 스팸 이미지로 판단되는 경우에 이에 대한 픽셀 히스토그램 데이터를 스팸 이미지 데이터로 설정하여 업데이트하게 된다. 이로써 새롭게 변형되는 다양한 형태의 스팸 이미지에 대한 업데이트가 실시간 이루어질 수 있다.
나아가서 이미지 스팸 메시지 필터링 시스템(100)은, MMS 수집 수단(110)이 MMSC와 연동하여 실시간 이동통신망으로 전송되는 MMS를 감시하여 이미지를 포함하는 MMS를 선별하면, 스팸 이미지 판단 수단(130)이 이미지를 포함하는 MMS에 대한 스팸 여부를 판단하고, 이에 대한 차단을 할 수 있는데, 이를 위해서 스팸 메시지 차단 수단(150)을 포함할 수도 있다.
스팸 메시지 차단 수단(150)은 MMSC와 연동하여 스팸 이미지를 포함하는 MMS의 전송을 차단하는데, 스팸 메시지 차단 수단(150)은 이미지 스팸 메시지 필터링 시스템(100)에 포함되어 구성될 수도 있고, 또는 기존에 구축되어 있는 스팸 차단 솔루션에 포함된 구성이 될 수도 있다.
이와 같이 본 발명에서는 이미지 스팸 메시지 필터링 시스템을 제안하여 실시간 전송되는 MMS에 포함된 이미지에 대한 스팸을 판단하고 차단하거나 스팸 이미지에 대한 정보를 실시간 업데이트할 수 있는데, 본 발명의 주된 구성 중 하나인 스팸 이미지 판단 수단(130)에 대하여 좀더 자세히 살펴보자면, 도 3은 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 시스템에서 스팸 이미지 판단 수단의 일실시예에 대한 구성도를 도시한다.
스팸 이미지 판단 수단(130)은 기본적으로 이미지 분석부(131)와 픽셀 비교 판단부(133)를 포함한다.
이미지 분석부(131)는 MMS에 포함된 이미지를 추출하고, 추출된 이미지를 픽셀 단위로 변환하여 상기 이미지에 대한 픽셀 히스토그램 데이터를 생성한다.
그리고 픽셀 비교 판단부(133)는 상기 이미지에 대한 픽셀 히스토그램 데이터와 스팸 정보 DB(170) 상에 기보유된 스팸 이미지 데이터를 대비하여 상기 이미지에 대한 스팸 여부를 판단한다.
이미지에 대한 픽셀 히스토그램 데이터를 생성하고, 기보유된 스팸 데이터와 대비하여 스팸 여부를 판단하는 상세한 내용은 이후에 예시를 통해 살펴보기로 한다.
나아가서 스팸 이미지 판단 수단(130)에는 추가적으로 이미지의 해시값을 통해 스팸 여부를 판단하는 해시값 비교 판단부(135)와 이미지에 대한 OCR 판독을 통해 텍스트를 추출하여 스팸 여부를 판단하는 OCR 판독부(137)가 포함될 수도 있는데, 이는 필요에 따라 추가되는 구성요소로서, 판단 대상 이미지에 대한 픽셀 분석 전에 해시값 비교 판단부(135)나 OCR 판독부(137)를 통해 스팸여부를 판단함으로써 스팸 여부가 판단되지 않는 이미지에 대해서만 픽셀 분석을 수행하거나 또는 픽셀 분석으로 스팸 여부가 명확하게 판단되지 않는 경우에 해시값 비교 판단부(135)나 OCR 판독부(137)를 통해 추가적으로 스팸 여부를 판단해보기 위해 구성될 수 있다.
판단 대상 이미지에 대한 스팸 여부를 판단하기 위해서 사전에 스팸 이미지에 대한 데이터를 보유해야되는데, 도 4는 본 발명에 따른 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 시스템에서 스팸 정보 DB의 일실시예에 대한 구성도를 도시한다.
이미지 스팸 메시지 필터링 시스템(100)은 기본적으로 스팸 이미지 데이터 DB(171)를 포함하는데, 스팸 이미지 데이터 DB(171)는 스팸 이미지에 대한 픽셀 히스토그램 데이터에 대응되는 스팸 이미지 데이터를 저장한다.
앞서 살펴본 바와 같이 하나의 스팸 이미지의 색상 분포에 대한 스팸 이미지 데이터는 항시 768개의 정수값으로 나타나며, 명암 분포에 대한 스팸 이미지 데이터는 항시 256개의 정수값으로 나타나게 되어 스팸 이미지마다 각각 768개 정수값 또는 256개의 정수값이 대응되어 저장된다.
이와 같이 색상 분포에 대한 픽셀 히스토그램 데이터 또는 명암 분포에 대한 픽셀 히스토그램 데이터를 스팸 이미지 데이터로 저장함으로써, 스팸 이미지의 해상도나 사이즈와 관계없이 동일한 데이터량으로 스팸 이미지에 대한 정보를 저장할 수 있어 데이터 관리가 용이하게 되며, 특히 스팸 이미지에 대한 정보가 계속적으로 누적되어 스팸 이미지 데이터를 대량으로 보유하는 경우에도 그에 대응되는 데이터량을 획기적으로 줄일 수 있게 된다.
나아가서 스팸 정보 DB(170)는 해시값 데이터 DB(173)와 스팸 텍스트 데이터 DB(175)를 추가적으로 포함할 수도 있는데, 해시값 데이터 DB(173)는 스팸 이미지에 대응되는 해시값 데이터를 저장하여, 해시값 비교 판단부(135)가 스팸 여부를 판단하도록 해시값 데이터를 제공하며, 스팸 텍스트 데이터 DB(175)는 스팸으로 판단되는 텍스트 데이터를 저장하여 OCR 판독부(137)가 스팸 여부를 판단하도록 스팸 텍스트 데이터를 제공한다.
또한 본 발명은 이상에서 살펴본 본 발명에 따른 이미지 스팸 메시지 필터링 시스템을 이용하여 이미지 스팸 메시지를 필터링하는 방법을 개시하는데, 이하에서는 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법에 대하여 살펴보기로 한다.
도 5는 본 발명에 따른 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법의 일실시예에 대한 흐름도를 도시한다.
본 발명에 따른 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법은 앞서 살펴본 본 발명에 따른 이미지 스팸 메시지 필터링 시스템 상에서 구현되므로 이하의 실시예에서는 본 발명에 따른 이미지 스팸 메시지 필터링 시스템의 실시예를 같이 참조하기로 한다.
이미지 스팸 메시지 필터링 시스템(100)의 MMS 수집 수단(110)은 이미지를 포함하는 MMS를 수집(S100)하는데, MMS 수집 수단(110)이 MMS를 수집하는 과정을 도 6의 실시예를 참조하여 살펴보면, MMS 수집 수단(110)은 MMSC(50)와 연동하여 이동 통신망(30)을 통해 전송되는 MMS(70)를 실시간 감시하며, 이동 통신망(30)을 통해 전송되는 MMS(70) 중 이미지를 포함하는 MMS를 선별하여 검출(S130)함으로써 MMS를 수집(S170)한다. 이때 MMS 수집 수단(110)은 이동통신 단말(10)에 전송되는 MMS를 단순히 수집만하여 MMS가 이동통신 단말(10)로 바로 전송될 수도 있으나, 보다 바람직하게는 MMS가 이동통신 단말(10)로 전송되기 전에 먼저 수집하여 MMS의 전송이 유보될 수 있다.
또한 MMS 수집 수단(110)은 사용자로부터 스팸 의심 이미지를 포함한 MMS에 대한 신고를 접수(S150)하여 MMS를 수집(S170)할 수도 있는데, 즉 사용자가 이동통신 단말기(10) 상으로 수신된 MMS에 포함된 이미지가 스팸일 경우에 이를 이미지 스팸 메시지 필터링 시스템(100)으로 전송하여 신고할 수도 있다. 이를 위해서 MMS 수집 수단(110)은 사용자가 수신한 스팸 의심 이미지를 포함한 MMS를 이동통신망(30)을 통해 MMS로 전달받을 수도 있고, 또는 신고 접수 사이트를 구비하여 인터넷 망 등을 통해 사용자가 수신한 스팸 의심 이미지를 포함한 MMS를 접수받을 수도 있다.
상기 예시외에도 다양한 방식으로 MMS 수집 수단(110)은 이미지를 포함한 MMS를 수집(S170)할 수 있을 것이다.
다시 상기 도 5로 회귀하여 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법의 실시예에 대하여 계속살펴보기로 한다.
스팸 이미지 판단 수단(130)의 이미지 분석부(131)는 수집된 MMS에 포함된 이미지를 추출(S310)하고 추출된 이미지를 픽셀 단위로 변환(S320)한 후 픽셀 단위의 이미지에서 픽셀 히스토그램 데이터를 생성(S330)한다.
그리고 픽셀 비교 판단부(133)는 스팸 정보 DB(170) 상에 기보유된 스팸 이미지 데이터를 추출(S240)하여 상기 스팸 이미지 데이터와 상기 픽셀 히스토그램 데이터를 대비하여 유사율을 산출(S350)하고, 산출된 유사율에 기초한 유사 판단으로 스팸 여부를 판단(S360)한다.
판단 대상 이미지에 대하여 유사율에 기초한 유사 판단 결과가 스팸 유효범위에 해당되는 경우 상기 판단 대상 이미지를 포함하는 MMS를 스팸 MMS로 처리(S500)하며, 스팸 유효범위를 벗어나는 경우에는 상기 판단 대상 이미지를 포함하는 MMS를 정상 MMS로 처리(S500)한다.
추가적으로 스팸 MMS로 판단된 경우에 이미지 스팸 메시지 필터링 시스템(100)의 스팸 메시지 차단 수단(150)은 MMSC와 연동하여 해당 스팸 MMS가 이동통신 단말로 전송되는 것을 차단(S600)할 수도 있다.
나아가서 상기 도 5에 도시되지 않았으나, 스팸 MMS로 판단된 경우에 여기에 포함된 이미지에 대한 픽셀 히스토그램 데이터를 스팸 이미지 데이터로 처리하여 스팸 이미지 데이터 DB(171)를 업그레이드할 수도 있는데, 이때 스팸 MMS로 판단된 이미지가 이미 저장하고 있는 스팸 이미지 데이터와는 상이한 변형 스팸 이미지일 경우 이를 새롭게 스팸 이미지 데이터 DB(171)에 저장할 수 있는데, 가령 유사율 판단 결과 100%의 유사율이 아닌 기설정된 범위에 해당되는 유사율을 나타내는 경우, 가령 90% 내지 80%의 유사율일 경우 이를 변형 스팸 이미지로 판단하여 새로운 스팸 이미지 데이터로서 저장할 수 있다.
상기 픽셀 히스토그램 데이터를 생성하고 이를 스팸 이미지 데이터와 대비하여 스팸 여부를 판단하는 과정을 도 7 내지 도 9의 실제 적용예를 통해 자세히 살펴보기로 한다.
도 7은 스팸 이미지와 판단 대상 이미지의 예를 나타내며, 도 8은 상기 도 7에 대하여 본 발명에 따라 스팸 이미지 데이터와 픽셀 히스토그램 데이터에 대한 적용예를 나타낸다.
상기 도 7에서 판단 대상 이미지 1(B)은 스팸 이미지(A)에서 숫자 부분(B1)이 변형된 경우이고, 판단 대상 이미지 2(C)는 스팸 이미지(A)에서 문자 부분(C1)이 변형된 경우이며, 판단 대상 이미지 3(D)는 스팸 이미지(A)에서 숫자 부분(D1)과 문자 부분(D2)이 모두 변형된 경우이다. 그리고 판단 대상 이미지 4(E)는 스팸 이미지가 아닌 정상 이미지이다.
상기 도 7에서와 같이 스팸 이미지(A)와 판단 대상 이미지 1 내지 4(B, C, D, E)에 대하여 본 발명을 적용하면, 먼저 이미지를 픽셀 단위로 변환하고, 이미지의 픽셀에 대한 색상 데이터 또는 명암 데이터를 추출하는데, 가령 상기 도 7의 (a)에서 일부분의 이미지를 픽셀 단위로 변환한 예와 같이 전체 이미지를 픽셀로 변환하고 각각의 픽셀이 나타내는 색상 데이터를 추출할 수 있다.
앞서 설명한 바와 같이 색상 데이터의 경우, R, G, B 각각은 256개의 색상으로 구분될 수 있고, RGB 색상표에 따라 768개로 분류할 수 있으며, 이미지의 픽셀 단위 하나는 768개의 색상 중 하나로 나타난다.
픽셀 각각에 대하여 나타내는 색상 데이터를 추출하면, 전체 이미지에 대한 각각의 단위 픽셀들에 대한 색상 데이터를 얻을 수 있고, 이를 기초로 색상 분포에 대한 픽셀 히스토그램 데이터를 생성할 수 있다.
만약, 이미지의 픽셀에 대한 명암 데이터로서 픽셀 히스토그램 데이터를 생성하는 경우에는 먼저 이미지를 그레이 변환한 후 그레이 변환된 이미지를 픽셀 단위로 변환하여 이미지의 각 픽셀에서 명암 데이터를 추출할 수 있는데, 명암의 경우 256개로 분류될 수 있으며, 이미지 픽셀 단위 하나는 256개의 명암 중 하나로 나타난다.
도 8은 상기 과정으로 생성된 픽셀 히스토그램 데이터로서, 스팸 이미지(A)의 경우 픽셀 히스토그램 데이터가 스팸 이미지 데이터로서 스팸 이미지 데이터 DB(171)에 저장된다.
상기 도 8에서 보는 바와 같이 이미지에 대한 픽셀 히스토그램 데이터는 색상의 경우 항상 768개의 정수값으로 나타나고, 명암의 경우 항상 256개의 정수값으로 나타난다.
이와 같이 생성된 판단 대상 이미지 1 내지 4(B, C, D, E)와 스팸 이미지 데이터 DB(171)에 저장된 스팸 이미지(A)의 스팸 이미지 데이터를 대비하여 유사율을 산출하는데, 도 9는 본 발명에서 판단 대상 이미지에 대한 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터를 대비하여 유사율을 산출하는 과정에 대한 예를 나타낸다.
판단 대상 이미지 1 내지 4(B, C, D, E)는 동일하게 적용되므로, 상기 도 9에서는 판단 대상 이미지 1(B)에 대해서만 예로써 설명한다.
색상 데이터 순번에 따라 순차적으로 스팸 이미지 데이터(A)와 판단 대상 이미지 1의 픽셀 히스토그램 데이터(B) 중 어느 한 값에 대한 오차수용한계를 산출하는데, 사전에 스팸 이미지 데이터(A)이나 픽셀 히스토그램 데이터(B) 중 어느 값으로 오차수용한계를 산출할지는 기설정될 수 있으며, 바람직하게는 스팸 이미지 데이터(A)과 픽셀 히스토그램 데이터(B) 중 큰 값으로 오차수용한계를 산출하는 것이 보다 효과적이므로 상기 도 9에서는 스팸 이미지 데이터(A)과 픽셀 히스토그램 데이터(B) 중 큰 값으로 오차수용한계(F)를 산출하였다.
상기 도 9에서 스팸 유효범위를 90%로 설정하였으므로, 오차수용한계는 스팸 이미지 데이터(A)과 픽셀 히스토그램 데이터(B) 중 큰 값의 10%로 산출하였다. 가령 색상 0번째의 경우 스팸 이미지 데이터(A) 6955와 픽셀 히스토그램 데이터(B) 5640 중 큰 값은 스팸 이미지 데이터(A) 6955이므로 스팸 이미지 데이터(A) 6955의 10%인 695.5가 색상 0번째의 오차수용한계(F)로 산출된다.
하나를 더 설명하자면, 색상 766번째의 경우 스팸 이미지 데이터(A) 26479와 픽셀 히스토그램 데이터(B) 27643 중 큰 값은 픽셀 히스토그램 데이터(B) 27643이므로 픽셀 히스토그램 데이터(B) 27643의 10%인 2764.3이 색상 766번째의 오차수용한계(F)로 산출된다.
이와 같은 과정을 거쳐서 색상 0번째부터 색상 767까지 총 768개에 대하여 순차적으로 오차수용한계(F)를 산출한다.
다음으로 색상 데이터 순번에 따라 순차적으로 스팸 이미지 데이터(A)과 픽셀 히스토그램 데이터(B)의 차이값(G)을 산출한다. 여기서 차이값(G)은 절대값으로 산출한다.
가령, 색상 0번째의 경우 스팸 이미지 데이터(A) 6955와 픽셀 히스토그램 데이터(B) 5640의 차이값은 1315이며, 색상 766번째의 경우 스팸 이미지 데이터(A) 26479와 픽셀 히스토그램 데이터(B) 27643의 차이값은 1164이다.
이와 같은 과정을 거쳐서 색상 0번째부터 색상 767까지 총 768개에 대하여 순차적으로 차이값(G)을 산출한다.
그리고 색상 데이터 순번에 따라 순차적으로 오차수용한계(F)와 차이값(G)을 대비하여 차이값(G)이 오차수용한계(F) 내에 있는지로 유사판단(H)한다. 즉, 차이값(G)이 오차수용한계(F)보다 작다면 오차수용한계(F) 내에 있으므로 해당 색상 데이터 순번의 경우에는 유사로 판단하고 차이값(G)이 오차수용한계(F)보다 크다면 오차수용한계(F)를 벗어나므로 해당 색상 데이터 순번의 경우에는 비유사로 판단한다.
이와 같은 과정을 거쳐서 색상 0번째부터 색상 767까지 총 768개에 대하여 순차적으로 유사판단(H)을 수행한다.
최종적으로 색상 0번째부터 색상 767까지 총 768개에 대한 유사판단(H) 결과로 유사율을 산출하고, 유사율이 스팸 유효범위라면 판단 대상 이미지를 스팸 이미지로 결정하는데, 상기 도 9의 경우 유사판단(H) 결과에 따른 유사율이 91.2%로 산출되어 스팸 유효범위 90% 이상이므로 판단 대상 이미지 1(B)은 스팸 이미지로 결정된다.
상기 도 8의 판단 대상 이미지 2 내지 4(C, D, E)에 대하여 상기 도 9의 과정을 수행한 결과를 도 10에 나타내는데, 상기 도 10의 결과에서 보는 바와 같이 판단 대상 이미지 1(B) 내지 판단 대상 이미지 4(E)에 대한 스팸 여부를 본 발명에 따라 판단해본 결과 판단 대상 이미지 1(B) 내지 판단 대상 이미지 3(D)는 모두 설정한 스팸 유효범위에 해당되어 스팸 이미지로 판단되며, 판단 대상 이미지 4(E)는 스팸 유효범위를 벗어나므로 정상 이미지로 판단된다.
나아가서 스팸 유효범위 90%로 설정한 경우 상기 도 9에 따라 91.2%의 유사율로 나타났지만 스팸 유효범위 80%로 설정한 경우 99.6%까지 유사율이 상승하였다.
즉, 판단 대상 이미지가 스팸 이미지와 거의 동일 수준일 경우만을 스팸으로 판단하고자 하는 경우에는 스팸 유효범위를 보다 높게 설정함으로써 보다 명확하게 스팸 이미지 여부를 판단할 수 있고, 나아가서 스팸 이미지의 변형된 형태에 대한 필터링이 필요한 경우에는 스팸 유효범위를 보다 낮게 설정함으로써 스팸 이미지로부터 다양하게 변형된 이미지들의 색출이 가능하게 된다.
상기 도 10의 전체적인 결과로 판단해보건데, 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법을 적용하는 경우에 스팸 이미지를 어느정도 변형시켜 배포하는 경우에도 정확하게 스팸 이미지의 색출이 가능하므로 스팸 이미지 필터링의 정확도 및 신뢰도가 높으며, 또한 스팸 유효범위의 설정에 따라 변형 정도가 심한 스팸 이미지까지도 색출이 가능하므로 변형 스팸 이미지에 대한 정보 업데이트가 효과적이다.
한걸음 더 나아가서 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법에서는 스팸 이미지를 보다 빠르게 필터링하면서 동시에 정확도와 신뢰도를 더욱 향상시키기 위해서 상기 도 5의 스팸 이미지 필터링 과정에 또다른 스팸 이미지 판단 과정을 추가할 수 있는데, 이에 대하여 실시예를 통해 살펴보기로 한다.
도 11은 상기 도 5의 실시예에 스팸 여부 판단의 제1 추가 과정을 적용한 실시예를 나타낸다.
상기 도 11에서는 상기 도 5의 실시예를 수행하기 이전에 제1 추가 과정을 수행하여 상기 제1 추가 과정으로 스팸 여부가 판단되지 않은 판단 대상 이미지에 대해서만 상기 도 5의 실시예를 수행하게 된다.
상기 도 5의 실시예에 따라 MMS가 수집(S100)되면, 먼저 상기 도 11에 따라 스팸 이미지 판단 수단(130)의 해시값 비교 판단부(135)가 MMS에서 포함된 이미지에 대한 해시값(S210)을 추출하고 해시값 데이터 DB(173) 상의 스팸 이미지 해시값 데이터를 추출(S220)하여 이를 판단 대상 이미지에 대한 해시값을 대비하여 스팸 여부를 판단(S230)한다.
만약 해시값 대비를 통해 판단 대상 이미지가 스팸으로 판단되면 상기 도 5의 스팸 이미지 픽셀 분석(S300) 과정을 수행할 필요없이 바로 판단 대상 이미지가 포함된 MMS를 스팸 MMS로 결정(S500)하며, 해시값 대비를 통해 판단 대상 이미지에 대한 스팸 여부가 판단되지 않으면 상기 도 5의 스팸 이미지 픽셀 분석(S300) 과정을 수행하게 된다.
이와 같인 제1 추가 과정을 도입함으로써, 간단하게 스팸 여부가 판단되는 MMS에 대해서는 스팸 이미지 픽셀 분석(S300) 과정을 수행하지 않음으로써 시스템의 전체적인 로드를 줄여 보다 빠르게 스팸 판단이 이루어질 수 있게 된다.
나아가서 상기 도 11에서는 스팸 이미지 픽셀 분석(S300) 과정 전에 상기 제1 추가 과정을 수행하는 것으로 도시되어 있으나, 상황에 따라서는 스팸 이미지 픽셀 분석(S300) 과정 수행 후 상기 제1 추가 과정을 수행함으로써 스팸 판단에 대한 정확도를 보다 높일 수도 있다.
도 12는 상기 도 5의 실시예에 스팸 여부 판다의 제2 추가 과정을 적용한 실시예를 나타낸다.
상기 도 12에서는 상기 도 5의 실시예를 수행한 후 스팸 판단이 애매한 경우에 제2 추가 과정을 추가적으로 수행하는데, 상기 도 5의 실시예에 따라 스팸 이미지 픽셀 분석(S300) 과정을 수행하여 스팸 여부에 대한 판단이 적절히 이루어지지 않은 경우, 즉 스팸 이미지가 아닌 경우로 판단되거나 유사율이 스팸 유효범위를 크게 벗어나지 않는 경우에 상기 도 12에 따른 제2 추가 과정을 수행한다.
상기 도 12의 제2 추가 과정을 살펴보면, 동일 이미지를 갖는 MMS가 일정 시간 내 전송되는 회수를 카운트(S410)하고, 전송 회수를 기준치와 대비(S420)한다. 전송 회수의 카운트와 기준치의 대비는 MMS 수집수단(110)에서 수행될 수 있다.
대비결과 전송 회수가 기준치 이하인 경우에는 정상 MMS로 판단(S550)하지만, 전송 회수가 기준치를 초과하는 경우에는 스팸 이미지 파단 수단(130)의 OCR 판독부(137)가 MMS에 포함된 이미지를 추출하여 이미지에 대한 OCR 판독(S430)을 수행한다. 그리고 OCR 판독을 통해 텍스트를 추출(S440)하고 이를 스팸 텍스트 데이터 DB(175)에 보유된 스팸 텍스트 데이터와 대비하여 스팸 여부를 판단한다.
상기 도 12의 실시예에서 OCR 판독은 단순히 이미지에 대한 OCR 방식을 적용하는 경우뿐만 아니라 이미지의 패턴을 분석하여 패턴으로부터 텍스트를 추출하는 방식까지 포함할 수 있다.
이와 같인 제1 추가 과정을 도입함으로써, 스팸 판단에 대한 정확도를 보다 높일 수 있으며, 나아가서 상기 도 12에서는 스팸 이미지 픽셀 분석(S300) 과정 후에 상기 제2 추가 과정을 수행하는 것으로 도시되어 있으나, 상황에 따라서는 스팸 이미지 픽셀 분석(S300) 과정 수행 전에 상기 제1 추가 과정을 수행할 수도 있다.
이상에서 살펴본 본 발명에 따른 이동통신망에서의 이미지 스팸 메시지 필터링 방법과 시스템을 통해 이미지를 포함하는 MMS의 스팸 여부를 분석하는 것이 용이하지 않은 문제를 해결하여, 이미지 형태의 스팸 MMS를 통해 텍스트 분석용 스팸 차단 솔루션을 우회하여 전파시키는 스팸 MMS를 필터링하고 차단할 수 있으며, 특히, 이미지 상의 문자체가 변형되거나 신종 문자체를 이용하여 기존 스팸 이미지를 변형시키는 경우에도 정확하게 스팸 여부를 판단할 수 있으며, 이미지의 해상도에 상관없이 스팸 여부를 신뢰성 높게 판단할 수 있다
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서 본 발명에 기재된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상이 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의해서 해석되어야하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100 : 이미지 스팸 메시지 필터링 시스템,
110 : MMS 수집 수단,
130 : 스팸 이미지 판단 수단,
131 : 이미지 분석부, 133 : 픽셀 비교 판단부,
135 : 해시값 비교 판단부, 137 : OCR 판독부,
150 : 스팸 메시지 차단 수단
170 : 스팸 정보 DB,
171 : 스팸 이미지 데이터 DB, 173 : 해시값 데이터 DB,
175 : 스팸 텍스트 데이터 DB.

Claims (16)

  1. 멀티 미디어 메시지(MMS)에 포함된 이미지를 추출하는 이미지 추출 단계;
    상기 이미지를 픽셀 단위로 변환하고, 픽셀 단위의 상기 이미지의 색상 또는 명암 분포에 대한 픽셀 히스토그램 데이터를 생성하는 이미지 분석 단계; 및
    상기 이미지에 대한 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터를 대비하여 상기 이미지에 대한 스팸 여부를 판단하는 스팸 판단 단계를 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  2. 제 1 항에 있어서,
    상기 이미지 분석 단계는,
    상기 이미지를 픽셀 단위로 변환하는 단계;
    상기 이미지의 각 픽셀에 대한 색상 데이터를 추출하는 단계; 및
    상기 이미지의 색상 데이터를 기초로 픽셀 히스토그램 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  3. 제 1 항에 있어서,
    상기 이미지 분석 단계는,
    상기 이미지를 그레이 변환하는 단계;
    그레이 변환된 상기 이미지를 픽셀 단위로 변환하는 단계;
    상기 이미지의 각 픽셀에 대한 명암 데이터를 추출하는 단계; 및
    상기 이미지의 명암 데이터를 기초로 픽셀 히스토그램 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  4. 제 1 항에 있어서,
    상기 스팸 판단 단계는,
    상기 이미지에 대한 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터를 대비하여 유사율을 산출하는 단계; 및
    상기 유사율을 기초로 상기 이미지에 대한 스팸 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  5. 제 4 항에 있어서,
    상기 유사율을 산출하는 단계는,
    상기 픽셀 히스토그램 데이터와 이에 대응되는 기보유된 스팸 이미지 데이터를 대비하여 비교값을 산출하는 단계;
    상기 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터에 기설정된 오차범위를 적용하여 오차 수용 한계를 산출하는 단계; 및
    상기 비교값과 상기 오차 수용 한계를 대비하여 유사율을 산출하는 단계를 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  6. 제 1 항에 있어서,
    상기 이미지 추출 단계는,
    이동통신망을 통해 수신자에게 전송될 멀티 미디어 메시지 중 이미지를 포함하는 멀티 미디어 메시지를 감시하여, 상기 멀티 미디어 메시지에서 이미지를 추출하며,
    상기 스팸 판단 단계의 수행 후, 스팸으로 판단된 이미지를 포함하는 멀티 미디어 메시지의 전송을 차단하는 메시지 차단 단계를 더 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  7. 제 1 항에 있어서,
    상기 스팸 판단 단계의 수행 후,
    스팸으로 판단된 이미지에 대한 픽셀 히스토그램 데이터를 스팸 이미지 데이터로 저장하는 스팸 이미지 데이터 업그레이드 단계를 더 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  8. 제 7 항에 있어서,
    상기 이미지 추출 단계는,
    사용자가 신고하는 스팸 의심 이미지를 포함하는 멀티 미디어 메시지를 수집하고, 수집된 멀티 미디어 메시지에서 이미지를 추출하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 이미지 추출 단계는,
    상기 멀티 미디어 메시지에 포함된 이미지에 대한 해시값을 추출하고, 상기 해시값을 기보유된 스팸 이미지의 해시값 데이터와 대비하여 상기 멀티 미디어 메시지에 대한 스팸 여부를 판단하는 해시값 대비 단계를 더 포함하며,
    상기 해시값 대비 단계의 수행 결과에 따라 상기 이미지 분석 단계를 수행하거나,
    상기 스팸 판단 단계의 수행 결과에 따라 상기 해시값 대비 단계를 수행하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  10. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 멀티 미디어 메시지에 포함된 이미지에 대한 OCR 판독을 수행하여 텍스트를 추출하고, 상기 텍스트에 대한 스팸 여부를 판단하는 OCR 판독 단계를 더 포함하며,
    상기 OCR 판독 단계의 수행 결과에 따라 상기 이미지 분석 단계가 수행되거나,
    상기 스팸 판단 단계의 수행 결과에 따라 상기 OCR 판독 단계를 수행하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 방법.
  11. 멀티 미디어 메시지(MMS)에 포함된 이미지를 추출하고, 추출된 이미지를 픽셀 단위로 변환하여, 상기 이미지에 대한 픽셀 히스토그램 데이터를 생성하는 이미지 분석부; 및
    상기 이미지에 대한 픽셀 히스토그램 데이터와 기보유된 스팸 이미지 데이터를 대비하여 상기 이미지에 대한 스팸 여부를 판단하는 픽셀 비교 판단부를 포함하는 스팸 이미지 판단 수단과;
    스팸 이미지에 대한 스팸 이미지 데이터를 저장한 스팸 정보 DB를 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 시스템.
  12. 제 11 항에 있어서,
    상기 스팸 이미지 판단 수단은,
    상기 이미지에 대한 해시값과 기보유된 스팸 이미지의 해시값 데이터를 대비하여 스팸 여부를 판단하는 해시값 비교 판단부를 더 포함하며,
    상기 스팸 정보 DB는,
    스팸 이미지에 대한 해시값 데이터를 저장한 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 시스템.
  13. 제 11 항에 있어서,
    상기 스팸 이미지 판단 수단은,
    상기 이미지에 대한 OCR 판독을 수행하여 텍스트를 추출하고, 추출된 텍스트를 기보유된 스팸 텍스트 데이터와 대비하여 스팸 여부를 판단하는 OCR 판독부를 더 포함하며,
    상기 스팸 정보 DB는,
    스팸 텍스트 데이터를 저장한 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 시스템.
  14. 제 11 항에 있어서,
    MMSC와 연동하여, 이동통신망을 통해 수신자에게 전송될 멀티 미디어 메시지 중 이미지를 포함하는 멀티 미디어 메시지를 감시하는 MMS 수집 수단을 더 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 시스템.
  15. 제 14 항에 있어서,
    MMS 수집 수단은,
    스팸 의심 이미지를 포함하는 멀티 미디어 메시지를 사용자로부터 신고받아 수집하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 시스템.
  16. 제 14 항에 있어서,
    상기 스팸 이미지 판단 수단이 스팸으로 판단한 이미지를 포함하는 멀티 미디어 메시지의 전송을 차단하는 스팸 메시지 차단 수단을 더 포함하는 것을 특징으로 하는 이동통신망에서의 이미지 스팸 메시지 필터링 시스템.
KR1020140117412A 2014-09-04 2014-09-04 이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템 KR20160029164A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140117412A KR20160029164A (ko) 2014-09-04 2014-09-04 이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140117412A KR20160029164A (ko) 2014-09-04 2014-09-04 이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20160029164A true KR20160029164A (ko) 2016-03-15

Family

ID=55541846

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140117412A KR20160029164A (ko) 2014-09-04 2014-09-04 이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20160029164A (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019129128A1 (zh) * 2017-12-29 2019-07-04 中兴通讯股份有限公司 彩信验证方法、服务器、移动终端及存储介质
KR20190143083A (ko) * 2018-06-20 2019-12-30 라인플러스 주식회사 이미지에서 추출된 키워드를 이용하여 이미지를 필터링하기 위한 방법과 시스템 및 비-일시적인 컴퓨터 판독 가능한 기록 매체
KR20200072456A (ko) * 2018-06-20 2020-06-22 라인플러스 주식회사 이미지에서 추출된 키워드를 이용하여 이미지를 필터링하기 위한 방법과 시스템 및 비-일시적인 컴퓨터 판독 가능한 기록 매체
KR102259789B1 (ko) * 2020-02-24 2021-06-02 삼정데이타서비스 주식회사 발신 메일 및 수신 메일의 스팸 필터링 방법 및 장치
KR20220084246A (ko) * 2020-06-11 2022-06-21 라인플러스 주식회사 이미지에서 추출된 키워드를 이용하여 이미지를 필터링하기 위한 방법과 시스템 및 비-일시적인 컴퓨터 판독 가능한 기록 매체
KR102472447B1 (ko) * 2022-06-13 2022-11-30 (주)유알피시스템 머신러닝을 이용한 복합 문서내 특정 콘텐츠 자동 차단 시스템 및 방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019129128A1 (zh) * 2017-12-29 2019-07-04 中兴通讯股份有限公司 彩信验证方法、服务器、移动终端及存储介质
CN109996191A (zh) * 2017-12-29 2019-07-09 中兴通讯股份有限公司 彩信验证方法、服务器、移动终端及计算机可读存储介质
KR20190143083A (ko) * 2018-06-20 2019-12-30 라인플러스 주식회사 이미지에서 추출된 키워드를 이용하여 이미지를 필터링하기 위한 방법과 시스템 및 비-일시적인 컴퓨터 판독 가능한 기록 매체
KR20200072456A (ko) * 2018-06-20 2020-06-22 라인플러스 주식회사 이미지에서 추출된 키워드를 이용하여 이미지를 필터링하기 위한 방법과 시스템 및 비-일시적인 컴퓨터 판독 가능한 기록 매체
US11082379B2 (en) 2018-06-20 2021-08-03 LINE Plus Corporation Methods, systems, devices, and non-transitory computer readable record media for filtering images using keywords
KR102259789B1 (ko) * 2020-02-24 2021-06-02 삼정데이타서비스 주식회사 발신 메일 및 수신 메일의 스팸 필터링 방법 및 장치
KR20220084246A (ko) * 2020-06-11 2022-06-21 라인플러스 주식회사 이미지에서 추출된 키워드를 이용하여 이미지를 필터링하기 위한 방법과 시스템 및 비-일시적인 컴퓨터 판독 가능한 기록 매체
KR102472447B1 (ko) * 2022-06-13 2022-11-30 (주)유알피시스템 머신러닝을 이용한 복합 문서내 특정 콘텐츠 자동 차단 시스템 및 방법

Similar Documents

Publication Publication Date Title
KR20160029164A (ko) 이동통신망에서의 이미지 스팸 메시지 필터링 방법 및 시스템
CN103763690B (zh) 检测伪基站向移动终端发送短信息的方法和装置
WO2016065908A1 (zh) 一种欺诈用户的检测方法、装置和系统
KR20170024777A (ko) 스미싱 메시지 판별장치 및 스미싱 메시지 판별방법
CN102088697A (zh) 垃圾短信的处理方法和系统
CN105335354A (zh) 欺诈信息识别方法和装置
WO2019012305A1 (en) SYSTEM AND METHOD FOR REALIZING DIAGNOSTICS OF MOBILE COMMUNICATION DEVICE
CN103546449A (zh) 一种基于附件格式的邮件病毒检测方法和装置
CN103369486A (zh) 诈骗短信防范系统与防范方法
CN110378276B (zh) 车辆状态获取方法、装置、设备、及存储介质
CN109858250A (zh) 一种基于级联分类器的安卓恶意代码检测模型方法
CN105101124A (zh) 标注短信类别的方法及装置
CN110895811B (zh) 一种图像篡改检测方法和装置
CN110856188A (zh) 通信方法、装置、系统和计算机可读存储介质
CN110276300B (zh) 用于识别垃圾品质的方法和装置
CN106301975A (zh) 一种数据检测方法及其装置
CN110532772B (zh) 文件检测方法、模型、设备及计算机可读存储介质
CN102932753A (zh) 一种在多媒体系统的链路上实现垃圾彩信拦截的方法
CN103902906A (zh) 基于应用图标的移动终端恶意代码检测方法及系统
CN102711112A (zh) 短信拦截方法及装置
CN109495891A (zh) 伪基站识别方法、设备及计算机可读存储介质
CN101232643A (zh) 一种网络信息自动监控系统及方法
CN104346337A (zh) 一种拦截垃圾信息的方法和装置
CN105848157B (zh) 一种确定非安全短消息的方法及电子设备
CN112364267B (zh) 前端数据的采集方法及装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid