KR20110012740A - 중복 콘텐츠 검출 장치 및 검출 방법 - Google Patents

중복 콘텐츠 검출 장치 및 검출 방법 Download PDF

Info

Publication number
KR20110012740A
KR20110012740A KR1020090070587A KR20090070587A KR20110012740A KR 20110012740 A KR20110012740 A KR 20110012740A KR 1020090070587 A KR1020090070587 A KR 1020090070587A KR 20090070587 A KR20090070587 A KR 20090070587A KR 20110012740 A KR20110012740 A KR 20110012740A
Authority
KR
South Korea
Prior art keywords
content
class
contents
fingerprint
feature information
Prior art date
Application number
KR1020090070587A
Other languages
English (en)
Other versions
KR101030130B1 (ko
Inventor
김재범
한효정
Original Assignee
주식회사 다음커뮤니케이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 다음커뮤니케이션 filed Critical 주식회사 다음커뮤니케이션
Priority to KR1020090070587A priority Critical patent/KR101030130B1/ko
Publication of KR20110012740A publication Critical patent/KR20110012740A/ko
Application granted granted Critical
Publication of KR101030130B1 publication Critical patent/KR101030130B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/44Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

본 발명에 따른 중복 콘텐츠 검출 장치는 복수의 콘텐츠 각각의 특징 정보를 추출하는 특징 정보 추출부, 상기 특징 정보를 기초로 상기 복수의 콘텐츠를 복수의 클래스로 구분하는 클래스 생성부, 상기 복수의 콘텐츠 각각을 표시하는 핑거 프린트를 생성하는 핑거 프린트 생성부, 그리고 상기 복수의 콘텐츠 중 동일한 상기 클래스에 속한 두 개의 콘텐츠를 서로 비교하여 중복 여부를 검사하는 비교부를 포함한다.
중복검출, 이미지, 동영상, 핑거프린트

Description

중복 콘텐츠 검출 장치 및 검출 방법{DEVICE AND METHOD FOR DETECTING DUPLICATE CONTENTS}
본 발명은 중복 콘텐츠 검출 장치 및 검출 방법에 관한 것이다.
인터넷을 통하여 이미지 및 동영상 등의 콘텐츠(contents)를 검색하는 서비스가 제공되고 있다. 검색 사이트의 사업자는 콘텐츠를 저장하고 있으며, 사용자의 검색에 따라 저장된 콘텐츠에서 선별하여 서비스를 제공한다.
그러나 이러한 콘텐츠는 인터넷의 발달에 따라 그 종류와 수가 점점 방대해져 그의 저장이 용이하지 않다. 따라서 콘텐츠 관리가 효율적으로 이루어질 필요가 있다. 콘텐츠를 효율적으로 관리하기 위해서는 중복된 콘텐츠를 검출하여, 중복된 컨텐츠를 제거하고 사용자에게 제공할 필요가 있다.
그러나, 비교 대상이 되는 콘텐츠를 기존의 모든 콘텐츠와 비교하여 중복 여부를 검출하면, 비교에 필요한 연산량이 방대해지고 검출 과정이 제대로 수행되기 어렵다.
한편, 각 컨텐츠는 고유의 식별 문자열(string)인 핑거 프린트(finger print)로 표시할 수 있으며, 중복된 콘텐츠의 검출은 각 컨텐츠의 핑거 프린트를 비교하여 수행될 수 있다. 핑거 프린트를 생성하는 방법은 여러 가지가 존재하는데 모든 콘텐츠에 동일한 방법으로 생성된 핑거 프린트를 사용하면 콘텐츠의 특성이 제대로 표현되지 않을 수 있다. 그러면 콘텐츠 중복 검출 결과의 정확도가 떨어진다.
본 발명이 이루고자 하는 기술적 과제는 각 콘텐츠 특성에 맞는 핑거 프린트를 사용하여 콘텐츠 중복 검출의 재현율을 확보하면서 정확도를 높이고, 콘텐츠 비교 과정에 소요되는 연산량을 줄여서 효율적인 콘텐츠 중복 검출을 수행하는 것이다.
본 발명의 한 실시예에 따른 콘텐츠 중복 검출 장치는 복수의 콘텐츠 각각의 특징 정보를 추출하는 특징 정보 추출부, 상기 특징 정보를 기초로 상기 복수의 콘텐츠를 복수의 클래스로 구분하는 클래스 생성부, 상기 복수의 콘텐츠 각각을 표시하는 핑거 프린트를 생성하는 핑거 프린트 생성부, 그리고 상기 복수의 콘텐츠 중 동일한 상기 클래스에 속한 두 개의 콘텐츠를 서로 비교하여 중복 여부를 검사하는 비교부를 포함한다.
상기 핑거 프린트는 상기 클래스의 특징을 고려하여 생성될 수 있다.
상기 핑거 프린트는 상기 클래스 별로 서로 다른 방법에 기초하여 생성될 수있다.
상기 핑거 프린트는 상기 클래스를 표현하는 클래스 비트를 포함할 수 있다.
상기 비교부는 상기 클래스 비트를 이용하여 상기 두 개의 상기 콘텐츠가 동일한 상기 클래스에 포함되는지 여부를 검사할 수 있다.
상기 비교부는 배타적 논리합 연산을 이용하여 상기 클래스 비트를 비교할 수 있다.
상기 핑거 프린트는 상기 콘텐츠의 특징을 표시하는 주 비트를 더 포함할 수 있다.
상기 비교부는 상기 주 비트를 이용하여 상기 두 개의 콘텐츠의 중복 여부를 검사할 수 있다.
상기 특징 정보는 평균값 핑거 프린트(mean finger print) 또는 중간값 핑거 프린트(median finger print)를 이용하여 추출될 수 있다.
상기 특징 정보는 색상 히스토그램(color histogram)을 이용하여 추출될 수 있다.
상기 특징 정보는 경계값 맵(edge map)을 이용하여 추출될 수 있다.
상기 콘텐츠를 저장하고, 상기 콘텐츠를 상기 특징 정보 추출부에 제공하며, 상기 핑거 프린트 및 상기 중복 여부의 검사 결과를 저장하는 저장부를 더 포함할 수 있다.
상기 클래스 생성부는, 상기 콘텐츠가 단순 이미지인지 여부, 상기 콘텐츠의패턴이 일정한지 여부 및 상기 콘텐츠의 색상 동일 여부에 따라 상기 클래스를 생성할 수 있다.
본 발명의 다른 실시예에 따른 중복 콘텐트의 검출 방법은 복수의 콘텐츠를 수신하여 상기 복수의 콘텐츠 각각의 특징 정보를 추출하는 단계, 상기 특징 정보를 기초로 상기 콘텐츠를 복수의 클래스로 구분하는 단계, 상기 복수의 콘텐츠 각각을 표시하는 핑거 프린트를 생성하는 단계, 그리고 상기 복수의 콘텐츠 중 동일한 상기 클래스에 속한 두 개의 콘텐츠를 비교하는 단계를 포함한다.
상기 핑거 프린트는 상기 클래스의 특징을 고려하여 생성될 수 있다.
상기 핑거 프린트는 상기 클래스를 표현하는 클래스 비트를 포함하고, 상기 비교하는 단계는, 상기 클래스 비트를 이용하여 상기 두 개의 콘텐츠가 동일한 클래스에 포함되는지 여부를 검사하는 단계를 포함할 수 있다.
상기 동일한 클래스에 포함되는지 여부를 검사하는 단계는 배타적 논리합 연산을 이용할 수 있다.
상기 핑거 프린트는 상기 콘텐츠의 특성을 표현하는 주 비트를 포함하고, 상기 비교하는 단계는, 상기 주 비트를 이용하여 상기 두 개의 콘텐츠를 비교하는 단계를 포함할 수 있다.
상기 추출하는 단계는 평균값 핑거 프린트, 중간값 핑거 프린트, 색상 히스토그램 및 경계 맵 중 적어도 어느 하나를 이용할 수 있다.
상기 복수의 클래스로 구분하는 단계는, 상기 콘텐츠가 단순 이미지인지 여부, 상기 콘텐츠의 패턴이 일정한지 여부 및 상기 콘텐츠의 색상 동일 여부에 따라 수행될 수 있다.
본 발명에 따르면 각 콘텐츠 특성에 맞는 핑거 프린트를 사용하여 콘텐츠 중복 검출의 재현율을 확보하면서 정확도를 높이고, 콘텐츠 비교 과정에 소요되는 연산량을 줄여서 효율적으로 콘텐츠 중복 검출을 수행할 수 있다. 이로써 콘텐츠 관리가 효율적으로 이루어 수 있다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이제 도면을 참고하여 본 발명의 한 실시예에 따른 중복 콘텐츠 검출 장치 및 검출 방법에 대하여 상세하게 설명한다.
도 1은 본 발명의 한 실시예에 따른 중복 콘텐츠 검출 장치를 개략적으로 도시하는 블록도이다.
도 1을 참고하면, 본 발명의 한 실시예에 따른 중복 콘텐츠 검출 장치(100)는 특징 정보 추출부(110), 클래스 생성부(120), 핑거 프린트 생성부(130), 비교 부(140) 및 저장부(150)를 포함한다.
특징 정보 추출부(110)는 저장부(150)로부터 이미지 또는 동영상 등의 콘텐츠(contents)를 수신하여, 각 콘텐츠의 특징 정보를 추출한다. 특징 정보는 평균값 핑거 프린트(mean finger print), 중간값 핑거 프린트(median finger print), 색상 히스토그램(color histogram) 및 경계 맵(edge map) 등을 이용하여 표현될 수 있다.
클래스 생성부(120)는 특징 정보 추출부(110)로부터 특징 정보를 수신하여 특징 정보를 기초로 콘텐츠를 복수의 클래스(class)로 구분한다. 복수의 클래스는 다양한 기준에 따라 정해질 수 있는 바, 예를 들어 콘텐츠가 단순 이미지인지 여부, 콘텐츠의 패턴이 일정한 지 여부 및 콘텐츠의 색상이 동일한지 여부를 기준으로 구분될 수 있다.
핑거 프린트 생성부(130)는 각 콘텐츠 고유의 식별 문자열(string)인 핑거 프린트를 생성한다. 핑거 프린트 생성부(130)가 생성하는 각 콘텐츠의 핑거 프린트는 주 비트 및 클래스 비트를 포함한다.
주 비트는 콘텐츠의 특징을 표시하는 부분으로써 모든 콘텐츠에 대하여 동일한 방법에 기초하여 생성되는 것이 아니라, 각 콘텐츠가 속한 클래스 특성에 따라 서로 다른 방법에 기초하여 생성된다. 예를 들어 패턴이 일정하지 않은 이미지를 포함하는 클래스에 대해서는 평균값 핑거 프린트 또는 중간값 핑거 프린트를 이용할 수 있고, 패턴은 일정하지만 색상이 다양한 이미지에 대해서는 색상 히스토그램에 기초한 핑거 프린트를 이용할 수도 있다.
클래스 비트는 각 콘텐츠가 속한 클래스를 표시하며 적어도 하나의 비트로 이루어져 있다. 예를 들어 클래스의 개수가 8개이면, 핑거 프린트에 속한 클래스 비트는 3비트일 수 있다.
비교부(140)는 동일한 클래스에 속한 두 콘텐츠를 서로 비교하여 중복 여부를 검사한다. 즉, 비교부(140)는 먼저 비교 대상인 두 콘텐츠의 핑거 프린트에 포함된 클래스 비트를 비교하여 두 콘텐츠가 동일한 클래스에 속하는지 여부를 검사하고, 두 콘텐츠가 동일한 클래스에 속하는 경우 주 비트를 서로 비교하여 중복 여부를 검사한다.
저장부(150)는 콘텐츠를 저장하고 있으며, 콘텐츠를 특징 정보 추출부(110)에게 제공하며, 핑거 프린트 생성부(130)로부터 각 콘텐츠를 표시하는 핑거 프린트를 수신하여 저장하고, 비교부(140)로부터 중복 검사 결과를 수신하여 저장한다.
이제 도 2 및 도 3을 참고하여 본 발명의 한 실시예에 따른 콘텐츠 중복 검출 방법에 대하여 상세하게 설명한다.
도 2는 본 발명의 한 실시예에 따른 콘텐츠 중복 검출 방법을 도시하는 흐름도이다.
도 2를 참고하면, 먼저 콘텐츠를 수신하여 이로부터 특징 정보를 추출한다(S210). 콘텐츠의 특징 정보는 앞서 설명한 바와 같이 평균값 핑거 프린트, 중간값 핑거 프린트, 색상 히스토그램 및 경계 맵 등을 이용하여 추출할 수 있다.
이제 도 3 내지 도 12를 참고하여 콘텐츠의 특징 정보를 추출하는 여러 가지 방법에 대하여 상세하게 설명한다.
먼저 도 3은 본 발명의 한 실시예에 따른 콘텐츠를 도시하는 도면이며, 도 4는 본 발명의 한 실시예에 따라 도 3의 콘텐츠를 복수의 영역으로 나눈 도면이며, 도 5는 도 4에서 표시한 각 영역의 계조값을 표시하는 도면이며, 도 6은 도 3의 콘텐츠를 평균값 핑거 프린트로 표시한 도면이며, 도 7은 도 3의 콘텐츠를 중간값 핑거 프린트로 표시한 도면이다.
도 3과 같은 이미지의 콘텐츠는 도 4와 같이 가로 8개 및 세로 8개의 총 64개로 이루어진 복수의 영역으로 나눌 수 있다. 그리고 도 4의 각 영역의 계조값을 조사하면 도 5와 같이 표현될 수 있다.
도 5에서 각 영역의 계조값의 평균값은 132이며, 각 영역의 계조값이 평균값보다 크면 1로, 작으면 0으로 표시하여 도 6과 같이 평균값 핑거 프린트를 표현할 수 있다.
도 5에서 각 영역의 계조값의 중간값은 156이며, 각 영역의 계조값이 중간값보다 크면 1로, 작으면 0으로 표시하여 도 7과 같이 중간값 핑거 프린트를 표현할 수 있다.
다음으로 도 8은 본 발명의 다른 실시예에 따라 도 3의 콘텐츠를 복수의 영역으로 나눈 도면이며, 도 9은 본 발명의 다른 실시예에 따라 도 3의 콘텐츠를 복수의 영역으로 나눈 도면이며, 도 10은 색상 히스토그램의 일 예를 도시하는 그래프이다.
도 3과 같은 이미지의 콘텐츠는 도 8과 같이 가로 방향으로 잘린 4개의 영역으로 나뉠 수 있으며, 도 9와 같이 세로 방향으로 잘린 4개의 영역으로 나뉠 수 있 다. 이와 같이 나뉜 8개의 영역 각각에 대하여 도 10과 같이 색상 히스토그램을 작성한다. 여기서 색상 히스토그램은 색조 채도 명도(hue, saturation, value, HSV) 기반 색상 히스토그램을 사용할 수 있으며, 예를 들어 색조는 18개의 빈(bin), 채도는 3개의 빈 및 명도는 3개의 빈으로 이루어져 총 18*3*3=162개의 빈으로 이루어진 색상 히스토그램으로 표현될 수 있다. 이와 같이 생성된 HSV 색상 히스토그램에서 가장 높은 빈도를 나타내는 빈(Bh)을 해당 영역의 대표 빈으로 채택하여 콘텐츠의 특징 정보를 표현할 수 있다.
다음으로 도 11은 도 3과 같은 콘텐츠의 경계(edge)를 표시하는 도면이다. 도 11을 참고하면, 도 3의 콘텐츠를 도 4와 같이 복수의 영역으로 나누고 각 영역에서 경계를 기초로 특징 정보를 추출할 수 있다. 예를 들어 각 영역에 경계가 있으면 1로 표현하고 없으면 0으로 표현하거나, 각 영역에서 경계가 일정한 기준보다 조밀하면 1로 표현하고 조밀하지 않으면 0으로 표현하여 콘텐츠의 특징 정보를 표현할 수 있다.
다시 도 2를 참고하면, 여러 가지 방법에 의해 생성된 특징 정보를 기초로 각 콘텐츠의 클래스를 구분한다(S220). 이제 도 12를 참고로 하여 클래스 구분 단계(S220)를 더욱 상세하게 설명한다.
도 12는 본 발명의 한 실시예에 따른 콘텐츠 중복 검출 방법의 일부를 도시하는 흐름도이다.
도 12를 참고하면, 클래스 구분 단계(S220)는 특징 정보를 이용하여 콘텐츠를 복수의 클래스로 구분하는 단계로서, 예를 들어 먼저 콘텐츠가 단순 이미지인지 여부를 판단한다(S221). 여기서 단순 이미지란 특정 어느 색상이 콘텐츠의 대부분을 차지하고 있고, 콘텐츠 중 관심있는 일부 영역에 경계가 존재하지 않는 이미지를 의미한다. 단순 이미지인지 여부 판단은 콘텐츠 전체 화면에 대하여 색상 히스토그램을 기초로 특정 색상이 기준치 이상으로 존재하는지 여부를 검사하여 판단할 수 있으며, 콘텐츠에서 관심있는 일정 영역을 정하여 그 영역 내에 경계가 있는지 여부를 검사하여 판단할 수 있다.
콘텐츠가 단순 이미지인 경우에는 해당 콘텐츠를 제1 클래스로 정의할 수 있다.
만일 콘텐츠가 단순 이미지가 아닐 경우에는 콘텐츠의 패턴이 일정한지 여부를 검사한다(S222). 여기서 패턴이 일정한지 여부는 도 6과 같은 평균값 핑거 프린트 또는 도 7과 같은 중간값 핑거 프린트에서 가로 방향 및 세로 방향으로 이웃하는 각 비트값이 같은 값으로 연속되는지 여부를 검사하여 같은 값으로 연속되는 이웃 쌍의 개수가 일정 기준, 예를 들어 전체의 2/3 이상인지를 확인함으로써 검사할 수 있다.
콘텐츠의 패턴이 일정하지 않은 경우에는 해당 콘텐츠를 제2 클래스로 구분할 수 있다.
콘텐츠의 패턴이 일정한 경우에는 콘텐츠의 색상이 동일한지 여부를 검사한다(S223). 여기서 색상의 동일 여부는 콘텐츠를 도 8 및 도 9과 같이 복수의 영역으로 나누고 각 영역에서 도 10과 같은 색상 히스토그램을 작성하여 가장 높은 빈도값을 갖는 빈(Bh)을 해당 영역의 대표 빈으로 결정하고 각 영역의 대표 빈 값이 서로 동일한지 여부를 검사함으로써 수행될 수 있다.
콘텐츠의 색상이 동일하다고 판단된 경우에는 해당 콘텐츠를 제3 클래스로 구분할 수 있으며, 콘텐츠의 색상이 동일하지 않다고 판단된 경우에는 해당 콘텐츠를 제4 클래스로 구분할 수 있다.
본 실시예에서는 복수의 클래스를 네 개의 클래스로 예를 들어 설명하였지만 이에 한정되지 않고 다양한 숫자의 클래스로 구분될 수 있으며, 클래스를 구분하는 기준 또한 도 12에 한정되지 않으며 다양한 기준이 채택될 수 있다.
다시 도 2를 참고하면, 각 콘텐츠에 대하여 클래스를 참고하여 핑거 프린트를 생성한다(S230). 이제 도 13을 참고하여 핑거 프린트에 대하여 상세하게 설명한다.
도 13은 본 발명의 한 실시예에 따라 생성된 핑거 프린트를 도시하는 도면이다.
도 13을 참고하면, 핑거 프린트(P1)는 점선으로 표시한 바와 같은 클래스 비트를 포함하며, 콘텐츠의 특징을 표시하는 주 비트를 포함한다.
앞서 설명한 바와 같이 주 비트는 각 콘텐츠가 속한 클래스 특성에 따라 서로 다른 방법에 기초하여 생성된다. 이와 같이 각 콘텐츠 특성에 맞는 핑거 프린트를 사용하면 콘텐츠를 더욱 효과적으로 표현할 수 있으므로 콘텐츠 중복 검출의 재현율을 확보하면서 정확도를 높일 수 있다.
클래스 비트는 각 콘텐츠가 속한 클래스를 표시하며 도 13과 같이 3비트일 수 있다.
다시 도 2를 참고하면 비교 대상이 되는 두 개의 콘텐츠가 속한 클래스 동일 여부를 검사한다(S240). 이제 도 14를 참고하여 클래스 동일 여부 검사를 상세하게 설명한다.
도 14는 본 발명의 한 실시예에 따라 클래스 동일 여부 검사를 도시하는 도면이다.
도 14를 참고하면 클래스 동일 여부 검사(S240)는 비교 대상인 두 개의 콘텐츠에 대하여 생성된 핑거 프린트(P1, P2) 각각에 포함된 클래스 비트를 비교함으로써 수행된다. 이때 비교는 배타적 논리합(exclusive or, XOR)의 연산을 이용하여 수행될 수 있다. 예를 들어 핑거 프린트(P1)에 포함된 클래스 비트가 001이고, 핑거 프린트(P2)에 포함된 클래스 비트가 001인 경우 각 클래스 비트의 값은 서로 동일하므로 배타적 논리합의 결과는 000이 된다. 따라서 두 콘텐츠는 서로 동일한 클래스에 속해 있다고 판단할 수 있다.
다시 도 2를 참고하면, 클래스 동일 여부 검사(S240) 후 클래스가 동일하다고 판단된 경우에는 비교 대상인 두 개의 콘텐츠를 비교하여 중복 여부를 판단한다(S250). 중복 여부 판단 단계(S250)는 도 14와 같은 두 개의 핑거 프린트(P1, P2)에서 주 비트를 서로 비교함으로써 수행될 수 있다.
이와 같이 콘텐츠를 복수의 클래스로 구분하고, 콘텐츠의 중복 여부를 검사 하기 이전에 각 콘텐츠가 속한 클래스의 동일여부를 검사하여 동일한 클래스에 속한 콘텐츠에 대해서만 중복 여부를 검사하면, 비교 대상을 현저히 줄일 수 있어 비교 과정에 소요되는 연산량을 줄일 수 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
도 1은 본 발명의 한 실시예에 따른 중복 콘텐츠 검출 장치를 개략적으로 도시하는 블록도이다.
도 2는 본 발명의 한 실시예에 따른 콘텐츠 중복 검출 방법을 도시하는 흐름도이다.
도 3은 본 발명의 한 실시예에 따른 콘텐츠를 도시하는 도면이다.
도 4는 본 발명의 한 실시예에 따라 도 3의 콘텐츠를 복수의 영역으로 나눈 도면이다.
도 5는 도 4에서 표시한 각 영역의 계조값을 표시하는 도면이다.
도 6은 도 3의 콘텐츠를 계조 평균값 핑거 프린트로 표시한 도면이다.
도 7은 도 3의 콘텐츠를 계조 중간값 핑거 프린트로 표시한 도면이다.
도 8은 본 발명의 다른 실시예에 따라 도 3의 콘텐츠를 복수의 영역으로 나눈 도면이다.
도 9는 본 발명의 다른 실시예에 따라 도 3의 콘텐츠를 복수의 영역으로 나눈 도면다.
도 10은 색상 히스토그램의 일 예를 도시하는 그래프이다.
도 11은 도 3과 같은 콘텐츠의 경계를 표시하는 도면이다.
도 12는 본 발명의 한 실시예에 따른 콘텐츠 중복 검출 방법의 일부를 도시하는 흐름도이다.
도 13은 본 발명의 한 실시예에 따라 생성된 핑거 프린트를 도시하는 도면이다.
도 14는 본 발명의 한 실시예에 따라 클래스 동일 여부 검사를 도시하는 도면이다.

Claims (20)

  1. 복수의 콘텐츠 각각의 특징 정보를 추출하는 특징 정보 추출부,
    상기 특징 정보를 기초로 상기 복수의 콘텐츠를 복수의 클래스로 구분하는 클래스 생성부,
    상기 복수의 콘텐츠 각각을 표시하는 핑거 프린트를 생성하는 핑거 프린트 생성부, 그리고
    상기 복수의 콘텐츠 중 동일한 상기 클래스에 속한 두 개의 콘텐츠를 서로 비교하여 중복 여부를 검사하는 비교부
    를 포함하는 중복 콘텐츠 검출 장치.
  2. 제1항에서,
    상기 핑거 프린트는 상기 클래스의 특징을 고려하여 생성되는 중복 콘텐츠 검출 장치.
  3. 제2항에서,
    상기 핑거 프린트는 상기 클래스 별로 서로 다른 방법에 기초하여 생성되는 중복 콘텐츠 검출 장치.
  4. 제1항에서,
    상기 핑거 프린트는 상기 클래스를 표현하는 클래스 비트를 포함하는 중복 콘텐츠 검출 장치.
  5. 제4항에서,
    상기 비교부는 상기 클래스 비트를 이용하여 상기 두 개의 상기 콘텐츠가 동일한 상기 클래스에 포함되는지 여부를 검사하는 중복 콘텐츠 검출 장치.
  6. 제5항에서,
    상기 비교부는 배타적 논리합 연산을 이용하여 상기 클래스 비트를 비교하는 중복 콘텐츠 검출 장치.
  7. 제4항에서,
    상기 핑거 프린트는 상기 콘텐츠의 특징을 표시하는 주 비트를 더 포함하는 중복 콘텐츠 검출 장치.
  8. 제7항에서,
    상기 비교부는 상기 주 비트를 이용하여 상기 두 개의 콘텐츠의 중복 여부를 검사하는 중복 콘텐츠 검출 장치.
  9. 제1항에서,
    상기 특징 정보는 평균값 핑거 프린트(mean finger print) 또는 중간값 핑거 프린트(median finger print)를 이용하여 추출되는 중복 콘텐츠 검출 장치.
  10. 제1항에서,
    상기 특징 정보는 색상 히스토그램(color histogram)을 이용하여 추출되는 중복 콘텐츠 검출 장치.
  11. 제1항에서,
    상기 특징 정보는 경계값 맵(edge map)을 이용하여 추출되는 중복 콘텐츠 검출 장치.
  12. 제1항에서,
    상기 콘텐츠를 저장하고, 상기 콘텐츠를 상기 특징 정보 추출부에 제공하며, 상기 핑거 프린트 및 상기 중복 여부의 검사 결과를 저장하는 저장부를 더 포함하는 중복 콘텐츠 검출 장치.
  13. 제1항에서,
    상기 클래스 생성부는, 상기 콘텐츠가 단순 이미지인지 여부, 상기 콘텐츠의패턴이 일정한지 여부 및 상기 콘텐츠의 색상 동일 여부에 따라 상기 클래스를 생성하는 중복 콘텐츠 검출 장치.
  14. 복수의 콘텐츠를 수신하여 상기 복수의 콘텐츠 각각의 특징 정보를 추출하는 단계,
    상기 특징 정보를 기초로 상기 콘텐츠를 복수의 클래스로 구분하는 단계,
    상기 복수의 콘텐츠 각각을 표시하는 핑거 프린트를 생성하는 단계, 그리고
    상기 복수의 콘텐츠 중 동일한 상기 클래스에 속한 두 개의 콘텐츠를 비교하는 단계
    를 포함하는 중복 콘텐츠 검출 방법.
  15. 제14항에서,
    상기 핑거 프린트는 상기 클래스의 특징을 고려하여 생성되는 중복 콘텐츠 검출 방법.
  16. 제14항에서,
    상기 핑거 프린트는 상기 클래스를 표현하는 클래스 비트를 포함하고,
    상기 비교하는 단계는, 상기 클래스 비트를 이용하여 상기 두 개의 콘텐츠가 동일한 클래스에 포함되는지 여부를 검사하는 단계를 포함하는 중복 콘텐츠 검출 방법.
  17. 제16항에서,
    상기 동일한 클래스에 포함되는지 여부를 검사하는 단계는 배타적 논리합 연산을 이용하는 중복 콘텐츠 검출 방법.
  18. 제14항에서,
    상기 핑거 프린트는 상기 콘텐츠의 특성을 표현하는 주 비트를 포함하고,
    상기 비교하는 단계는, 상기 주 비트를 이용하여 상기 두 개의 콘텐츠를 비교하는 단계를 포함하는 중복 콘텐츠 검출 방법.
  19. 제18항에서,
    상기 추출하는 단계는 평균값 핑거 프린트, 중간값 핑거 프린트, 색상 히스토그램 및 경계 맵 중 적어도 어느 하나를 이용하는 중복 콘텐츠 검출 방법.
  20. 제14항에서,
    상기 복수의 클래스로 구분하는 단계는,
    상기 콘텐츠가 단순 이미지인지 여부, 상기 콘텐츠의 패턴이 일정한지 여부 및 상기 콘텐츠의 색상 동일 여부에 따라 수행되는 중복 콘텐츠 검출 방법.
KR1020090070587A 2009-07-31 2009-07-31 중복 콘텐츠 검출 장치 및 검출 방법 KR101030130B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090070587A KR101030130B1 (ko) 2009-07-31 2009-07-31 중복 콘텐츠 검출 장치 및 검출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090070587A KR101030130B1 (ko) 2009-07-31 2009-07-31 중복 콘텐츠 검출 장치 및 검출 방법

Publications (2)

Publication Number Publication Date
KR20110012740A true KR20110012740A (ko) 2011-02-09
KR101030130B1 KR101030130B1 (ko) 2011-04-20

Family

ID=43772629

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090070587A KR101030130B1 (ko) 2009-07-31 2009-07-31 중복 콘텐츠 검출 장치 및 검출 방법

Country Status (1)

Country Link
KR (1) KR101030130B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873863B2 (en) 2011-12-05 2014-10-28 Electronics And Telecommunications Research Institute System and method for fingerprinting for comics
KR20150105883A (ko) 2014-03-10 2015-09-18 에스케이플래닛 주식회사 클라우드 스트리밍 서버를 테스트하기 위한 기준 서버 변경 방법, 이를 위한 장치 및 시스템
KR20150105884A (ko) 2014-03-10 2015-09-18 에스케이플래닛 주식회사 클라우드 스트리밍 서버 테스트 방법, 이를 위한 장치 및 시스템
KR20150136838A (ko) 2014-05-28 2015-12-08 엔트릭스 주식회사 클라우드 스트리밍 서버 테스트 방법, 이를 위한 장치 및 시스템
KR20160008400A (ko) 2014-07-14 2016-01-22 엔트릭스 주식회사 클라우드 스트리밍 서버 테스트 방법, 이를 위한 장치 및 시스템
US10397288B2 (en) 2014-07-14 2019-08-27 Sk Techx Co., Ltd. Cloud streaming service system, data compressing method for preventing memory bottlenecking, and device for same

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2608062A1 (en) 2011-12-23 2013-06-26 Thomson Licensing Method of automatic management of images in a collection of images and corresponding device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3457617B2 (ja) 2000-03-23 2003-10-20 株式会社東芝 画像検索システムおよび画像検索方法
KR100888804B1 (ko) * 2007-06-04 2009-03-13 (주)엔써즈 동영상 데이터의 동일성 판단 및 동일 구간 검출 방법 및장치
KR100842310B1 (ko) * 2007-06-21 2008-06-30 (주)엔써즈 동영상 데이터들을 서로 동일성이 있는 동영상데이터들끼리 클러스터링하는 방법 및 시스템
KR100946694B1 (ko) * 2007-08-07 2010-03-12 주식회사 코난테크놀로지 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한시스템 및 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873863B2 (en) 2011-12-05 2014-10-28 Electronics And Telecommunications Research Institute System and method for fingerprinting for comics
KR20150105883A (ko) 2014-03-10 2015-09-18 에스케이플래닛 주식회사 클라우드 스트리밍 서버를 테스트하기 위한 기준 서버 변경 방법, 이를 위한 장치 및 시스템
KR20150105884A (ko) 2014-03-10 2015-09-18 에스케이플래닛 주식회사 클라우드 스트리밍 서버 테스트 방법, 이를 위한 장치 및 시스템
KR20150136838A (ko) 2014-05-28 2015-12-08 엔트릭스 주식회사 클라우드 스트리밍 서버 테스트 방법, 이를 위한 장치 및 시스템
KR20160008400A (ko) 2014-07-14 2016-01-22 엔트릭스 주식회사 클라우드 스트리밍 서버 테스트 방법, 이를 위한 장치 및 시스템
US10397288B2 (en) 2014-07-14 2019-08-27 Sk Techx Co., Ltd. Cloud streaming service system, data compressing method for preventing memory bottlenecking, and device for same

Also Published As

Publication number Publication date
KR101030130B1 (ko) 2011-04-20

Similar Documents

Publication Publication Date Title
KR101030130B1 (ko) 중복 콘텐츠 검출 장치 및 검출 방법
US8385646B2 (en) Image processing
US8520941B2 (en) Method and system for document image classification
KR20130118276A (ko) 자동 및 수동 결함 분류의 통합
US8340412B2 (en) Image processing
JP4494563B2 (ja) トークン化によるイメージ分割を用いたイメージ処理方法および装置
CN107145487A (zh) 图像搜索方法和装置
CN108765386A (zh) 一种隧道裂缝检测方法、装置、电子设备及存储介质
EP3242271B1 (en) Method, system and apparatus for assigning image interpretation task
GB2497516A (en) Generating training data for automation of image analysis
Azad et al. A novel and robust method for automatic license plate recognition system based on pattern recognition
CN111242899B (zh) 基于图像的瑕疵检测方法及计算机可读存储介质
Chhatkuli et al. Separating compound figures in journal articles to allow for subfigure classification
US20100172569A1 (en) Cell image analysis apparatus, cell image analysis method, and program
Rebelo et al. Staff line detection and removal in the grayscale domain
Tralic et al. Video frame copy-move forgery detection based on cellular automata and local binary patterns
CN113920434A (zh) 一种基于目标的图像翻拍检测方法、装置及介质
Ovhal Detecting plagiarism in images
CN110428006A (zh) 计算机生成图像的检测方法、系统、装置
CN113793322A (zh) 一种对磁性材料自动检测的方法、电子设备和存储介质
CN116824488A (zh) 一种基于迁移学习的目标检测方法
Musci et al. An object-based image analysis approach based on independent segmentations
CN113537253B (zh) 一种红外图像目标检测方法、装置、计算设备及存储介质
Busin et al. Color space selection for color image segmentation by spectral clustering
Aldeborgh et al. Unsupervised object detection on remote sensing imagery using hierarchical image representations and deep learning

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140320

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150226

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160126

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170109

Year of fee payment: 9