KR20230162409A - Method, system and non-transitory computer-readable recording medium for detecting near-duplicate images - Google Patents

Method, system and non-transitory computer-readable recording medium for detecting near-duplicate images Download PDF

Info

Publication number
KR20230162409A
KR20230162409A KR1020220062261A KR20220062261A KR20230162409A KR 20230162409 A KR20230162409 A KR 20230162409A KR 1020220062261 A KR1020220062261 A KR 1020220062261A KR 20220062261 A KR20220062261 A KR 20220062261A KR 20230162409 A KR20230162409 A KR 20230162409A
Authority
KR
South Korea
Prior art keywords
image
subject
similarity
reference image
duplicate
Prior art date
Application number
KR1020220062261A
Other languages
Korean (ko)
Inventor
최형원
아드리아 아루팟바탈라
Original Assignee
옴니어스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 옴니어스 주식회사 filed Critical 옴니어스 주식회사
Priority to KR1020220062261A priority Critical patent/KR20230162409A/en
Publication of KR20230162409A publication Critical patent/KR20230162409A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

본 개시는 중복 이미지를 검출하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체에 관한 것이다. 본 개시의 일 실시예에 따른 동일 피사체를 포함하는 중복 이미지를 검출하는 방법은 적어도 하나의 제1 피사체를 포함하는 기준 이미지를 수신하는 단계, 상기 기준 이미지와 유사한 적어도 하나의 유사 이미지를 결정하는 단계, 상기 기준 이미지에 포함된 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 적어도 하나의 제2 피사체의 유사도를 계산하는 단계, 상기 유사도가 소정의 제1 기준을 만족하는 경우 상기 유사 이미지를 상기 기준 이미지의 중복 이미지로 결정하는 단계 및 상기 중복 이미지에 대한 정보를 제공하는 단계를 포함한다.The present disclosure relates to a method, system, and non-transitory computer-readable recording medium for detecting duplicate images. A method of detecting a duplicate image including the same subject according to an embodiment of the present disclosure includes receiving a reference image including at least one first subject, and determining at least one similar image similar to the reference image. , calculating a similarity between at least one first subject included in the reference image and at least one second subject included in the similar image, if the similarity satisfies a predetermined first standard, the similar image is It includes determining a duplicate image of a reference image and providing information about the duplicate image.

Description

중복 이미지를 검출하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체{METHOD, SYSTEM AND NON-TRANSITORY COMPUTER-READABLE RECORDING MEDIUM FOR DETECTING NEAR-DUPLICATE IMAGES}METHOD, SYSTEM AND NON-TRANSITORY COMPUTER-READABLE RECORDING MEDIUM FOR DETECTING NEAR-DUPLICATE IMAGES}

본 개시는 중복 이미지를 검출하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체에 관한 것으로서, 보다 상세하게는 기준 이미지에 포함된 피사체와 동일한 피사체를 포함하는 변형된 이미지를 중복 이미지로 인식하여 검출하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체에 관한 것이다. The present disclosure relates to a method, system, and non-transitory computer-readable recording medium for detecting duplicate images, and more specifically, to detecting and recognizing a modified image including a subject identical to a subject included in a reference image as a duplicate image. It relates to a method, system, and non-transitory computer-readable recording medium.

최근 전체 소매 판매 시장에서 온라인 시장이 차지하는 점유율이 급격하게 증가함에 따라, 소비자는 원하는 상품을 검색하고 여러 온라인 판매 사이트에서 검색된 상품을 비교하여 구매 여부를 결정할 수 있다. Recently, as the online market's share of the overall retail sales market has rapidly increased, consumers can search for desired products and compare products found on multiple online sales sites to decide whether to purchase them.

특히, 온라인 오픈 마켓에서는 여러 브랜드 및 서로 다른 사업자가 상품을 판매하고 있고, 동일한 상품에 대한 이미지가 일부 배경이 다르거나 회전되어 제공될 수 있다. 이 경우 소비자뿐만 아니라 오픈 마켓 운영자는 동일 상품에 대한 필터링 기능을 필요로 할 수 있다. In particular, in online open markets, multiple brands and different businesses sell products, and images for the same product may be provided with some different backgrounds or rotated images. In this case, not only consumers but also open market operators may need a filtering function for the same product.

이와 관련하여, 최근 일부 변형된 이미지에 대하여 중복 이미지로 검출하는 기술의 개발 및 연구가 활발하게 이루어 지고 있다.In this regard, the development and research of technology for detecting some modified images as duplicate images has been actively conducted recently.

예를 들어, 등록특허공보 제10-2260631호에서는 중복 이미지 파일의 검색 방법 및 장치가 개시되어 있다. 상기 종래 기술에서는, 각각의 이미지 파일의 특징점을 추출하여 동일한 이미지 파일에서 추출된 특징점의 유클리드 거리를 산출하고, 특징점 개수 및/또는 유클리드 거리를 비교하여 중복 이미지 여부를 결정한다. For example, Patent Registration No. 10-2260631 discloses a method and device for searching duplicate image files. In the prior art, the feature points of each image file are extracted, the Euclidean distance of the feature points extracted from the same image file is calculated, and the number of feature points and/or the Euclidean distance are compared to determine whether or not there is a duplicate image.

이러한 종래 기술에 의하면 각각의 이미지의 일부 특징만을 비교하는 경우 신속하게 비교할 수 있으나 정확도가 떨어지는 문제가 있고, 각각의 이미지에서 비교하는 특징을 늘리는 경우 처리 속도가 떨어지고 서버의 업무량이 증가하는 문제가 있다.According to this prior art, when only some features of each image are compared, quick comparison is possible, but there is a problem of low accuracy, and when the features compared in each image are increased, the processing speed decreases and the server workload increases. .

이에 본 발명자는, 먼저 이미지의 전체 영역에 대한 유사도를 간략하게 비교하여 중복 이미지의 후보군을 설정하고, 이후 세부 영역을 비교하여 중복 이미지를 검출하여 효율적이고 정확도를 높인 중복 이미지 검출 서비스를 제안하는 바이다.Accordingly, the present inventor proposes a duplicate image detection service that is efficient and improves accuracy by first setting a candidate group of duplicate images by briefly comparing the similarity of the entire area of the image, and then detecting duplicate images by comparing detailed regions. .

등록특허공보 제10-2260631호(2021. 05. 31)Registered Patent Publication No. 10-2260631 (May 31, 2021)

본 개시는 전술한 종래 기술의 문제점을 모두 해결하는 것을 그 목적으로 한다. The purpose of the present disclosure is to solve all the problems of the prior art described above.

또한, 본 개시는 동일한 피사체를 포함하고 있으나 각도나 초점이 변형되거나, 피사체의 자세가 변형된 이미지를 중복 이미지로 검출할 수 있는 방법 및 시스템을 제공하는 것을 목적으로 한다. Additionally, the purpose of the present disclosure is to provide a method and system for detecting images containing the same subject but with a changed angle or focus or a changed posture of the subject as duplicate images.

또한, 본 개시는 동일한 피사체를 포함하는 변형 이미지를 중복 이미지로 빠르고 효율적으로 검출하는 방법 및 시스템을 제공하는 것을 또 다른 목적으로 한다. Another purpose of the present disclosure is to provide a method and system for quickly and efficiently detecting a modified image containing the same subject as a duplicate image.

본 개시의 일 실시예에 따른 동일 피사체를 포함하는 중복 이미지를 검출하는 방법은 적어도 하나의 제1 피사체를 포함하는 기준 이미지를 수신하는 단계, 상기 기준 이미지와 유사한 적어도 하나의 유사 이미지를 결정하는 단계, 상기 기준 이미지에 포함된 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 적어도 하나의 제2 피사체의 유사도를 계산하는 단계, 상기 유사도가 소정의 제1 기준을 만족하는 경우 상기 유사 이미지를 상기 기준 이미지의 중복 이미지로 결정하는 단계 및 상기 중복 이미지에 대한 정보를 제공하는 단계를 포함한다.A method of detecting a duplicate image including the same subject according to an embodiment of the present disclosure includes receiving a reference image including at least one first subject, and determining at least one similar image similar to the reference image. , calculating a similarity between at least one first subject included in the reference image and at least one second subject included in the similar image, if the similarity satisfies a predetermined first standard, the similar image is It includes determining a duplicate image of a reference image and providing information about the duplicate image.

본 개시의 일 실시예에 따르면, 상기 기준 이미지와 유사한 적어도 하나의 유사 이미지를 결정하는 단계는, 소정의 이미지 데이터베이스에 포함된 적어도 하나의 이미지를 상기 기준 이미지와 비교하여 전체 유사도를 계산하는 단계 및 상기 전체 유사도가 소정의 제2 기준을 만족하는 경우 상기 적어도 하나의 이미지를 유사 이미지로 결정하는 단계를 포함할 수 있다.According to an embodiment of the present disclosure, determining at least one similar image similar to the reference image includes calculating an overall degree of similarity by comparing at least one image included in a predetermined image database with the reference image; The method may include determining the at least one image as a similar image when the overall similarity satisfies a second predetermined criterion.

본 개시의 일 실시예에 따르면, 상기 기준 이미지에 포함된 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 적어도 하나의 제2 피사체의 유사도를 계산하는 단계는, 상기 기준 이미지에 포함된 적어도 하나의 제1 피사체를 검출하는 단계, 상기 유사 이미지에 포함된 적어도 하나의 제2 피사체를 검출하는 단계 및 상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체를 비교하여 유사도를 계산하는 단계를 포함할 수 있다.According to an embodiment of the present disclosure, calculating the similarity between at least one first subject included in the reference image and at least one second subject included in the similar image includes at least one subject included in the reference image. Detecting a first subject, detecting at least one second subject included in the similar image, and calculating similarity by comparing the at least one first subject and the at least one second subject. It can be included.

본 개시의 일 실시예에 따르면, 상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체를 비교하여 유사도를 계산하는 단계는, 상기 적어도 하나의 제1 피사체의 제1 카테고리를 결정하고, 상기 적어도 하나의 제2 피사체의 제2 카테고리를 결정하여, 각각의 상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체 중 상기 제1 카테고리와 상기 제2 카테고리가 동일한 제1 피사체와 제2 피사체를 비교하여 상기 유사도를 계산할 수 있다.According to an embodiment of the present disclosure, the step of calculating similarity by comparing the at least one first subject and the at least one second subject includes determining a first category of the at least one first subject, A second category of the at least one second subject is determined, so that among the at least one first subject and the at least one second subject, the first subject and the second subject have the same first and second categories. The similarity can be calculated by comparing .

본 개시의 일 실시예에 따르면, 상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체를 비교하여 유사도를 계산하는 단계는, 상기 적어도 하나의 제1 피사체 중 상기 기준 이미지의 중앙부에 위치한 제1 피사체를 결정하고, 상기 적어도 하나의 제2 피사체 중 상기 유사 이미지의 중앙부에 위치한 제2 피사체를 결정하여, 상기 제1 피사체와 상기 제2 피사체를 비교하여 상기 유사도를 계산할 수 있다.According to an embodiment of the present disclosure, the step of calculating similarity by comparing the at least one first subject and the at least one second subject may include comparing the at least one first subject to a second subject located in the center of the reference image. 1 A subject may be determined, a second subject located in the center of the similar image among the at least one second subject may be determined, and the degree of similarity may be calculated by comparing the first subject and the second subject.

본 개시의 일 실시예에 따르면, 상기 기준 이미지의 중앙부에 위치한 제1 피사체는, 상기 기준 이미지의 중앙점과 상기 적어도 하나의 제1 피사체의 중앙점의 거리가 가장 가까운 제1 피사체로 결정하고, 상기 유사 이미지의 중앙부에 위치한 제2 피사체는, 상기 유사 이미지의 중앙점과 상기 적어도 하나의 제2 피사체의 중앙점의 거리가 가장 가까운 제2 피사체로 결정할 수 있다.According to an embodiment of the present disclosure, the first subject located in the center of the reference image is determined to be the first subject in which the distance between the center point of the reference image and the center point of the at least one first subject is closest, The second subject located in the center of the similar image may be determined as the second subject whose distance between the center point of the similar image and the center point of the at least one second subject is closest.

본 개시의 일 실시예에 따르면, 상기 유사도는 각각의 상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체 중 상기 제1 카테고리와 상기 제2 카테고리가 동일한 제1 피사체와 제2 피사체를 비교하여 피사체 유사도를 계산하고, 상기 피사체 유사도에 가중치를 부여하여 결정할 수 있다. According to an embodiment of the present disclosure, the similarity is determined by comparing a first subject and a second subject in which the first category and the second category are the same among the at least one first subject and the at least one second subject. Thus, the subject similarity can be calculated and determined by assigning a weight to the subject similarity.

본 개시의 일 실시예에 따르면, 상기 전체 유사도를 계산하는 단계는, 상기 기준 이미지의 중심부와 상기 적어도 하나의 이미지의 중심부의 제1 유사도를 계산하고, 상기 기준 이미지의 주변부와 상기 적어도 하나의 이미지의 주변부의 제2 유사도를 계산하여, 상기 제1 유사도와 상기 제2 유사도에 각각의 가중치를 부여하여 상기 전체 유사도를 계산할 수 있다.According to an embodiment of the present disclosure, calculating the overall similarity includes calculating a first similarity of the center of the reference image and the center of the at least one image, and calculating the first similarity of the center of the reference image and the center of the at least one image. The overall similarity can be calculated by calculating the second similarity of the periphery of and assigning weights to the first similarity and the second similarity.

본 개시의 일 실시예에 따르면, 상기 전체 유사도를 계산하는 단계는, 상기 기준 이미지에 포함된 상기 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 상기 적어도 하나의 제2 피사체 각각을 비교하여 유사도를 계산하고, 그 중 가장 가까운 유사도를 제1 유사도로 선택하고, 상기 기준 이미지의 중앙부에 위치한 제1 피사체와 상기 유사 이미지의 중앙부에 위치한 제2 피사체를 비교하여 제2 유사도를 계산하여, 상기 제1 유사도와 상기 제2 유사도에 소정의 가중치를 부여하여 상기 전체 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, calculating the overall similarity includes comparing each of the at least one first subject included in the reference image and the at least one second subject included in the similar image to determine the similarity. Calculate, select the closest similarity among them as the first similarity, calculate the second similarity by comparing the first subject located in the center of the reference image with the second subject located in the center of the similar image, and calculate the second similarity. The total similarity can be calculated by assigning a predetermined weight to the first similarity and the second similarity.

본 개시의 일 실시예에 따르면, 상기 중복 이미지에 대한 정보를 제공하는 단계에서, 상기 유사도를 기준으로 정렬하여 상기 중복 이미지에 대한 정보를 제공할 수 있다.According to an embodiment of the present disclosure, in the step of providing information about the duplicate image, information about the duplicate image may be provided by sorting based on the similarity.

본 개시의 일 실시예에 따른 동일 피사체를 포함하는 중복 이미지 검출 시스템은 적어도 하나의 제1 피사체를 포함하는 기준 이미지를 수신하는 기준 이미지 수신부, 상기 기준 이미지와 유사한 적어도 하나의 유사 이미지를 결정하는 유사 이미지 결정부, 상기 기준 이미지에 포함된 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 적어도 하나의 제2 피사체의 유사도를 계산하고, 상기 유사도가 소정의 제1 기준을 만족하는 경우 상기 유사 이미지를 상기 기준 이미지의 중복 이미지로 결정하는 중복 이미지 결정부 및 상기 중복 이미지에 대한 정보를 제공하는 중복 이미지 정보 제공부를 포함한다. A system for detecting duplicate images including the same subject according to an embodiment of the present disclosure includes a reference image receiving unit that receives a reference image including at least one first subject, and a similar image receiving unit that determines at least one similar image similar to the reference image. An image determination unit, calculates the similarity between at least one first subject included in the reference image and at least one second subject included in the similar image, and if the similarity satisfies a predetermined first standard, the similar image It includes a duplicate image determination unit that determines a duplicate image of the reference image and a duplicate image information provider that provides information about the duplicate image.

이 외에도, 본 개시를 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 비일시성의 컴퓨터 판독 가능 기록 매체가 더 제공된다.In addition, other methods for implementing the present disclosure, other systems, and non-transitory computer-readable recording media for recording computer programs for executing the methods are further provided.

본 개시에 의하면, 동일한 피사체를 포함하는 변형 이미지를 중복 이미지로 검출할 수 있는 방법 및 시스템을 제공할 수 있다.According to the present disclosure, it is possible to provide a method and system that can detect a modified image including the same subject as a duplicate image.

또한, 본 개시에 의하면, 동일한 피사체를 포함하는 변형 이미지를 중복 이미지로 빠르고 효율적으로 검출할 수 있다. Additionally, according to the present disclosure, a modified image including the same subject can be quickly and efficiently detected as a duplicate image.

도 1은 본 개시의 일 실시예에 따라 중복 이미지를 검출하기 위한 시스템 환경의 개략적인 구성을 나타내는 도면이다.
도 2는 본 개시의 일 실시예에 따른 기준 이미지와 해당 기준 이미지의 중복 이미지(예: 중복 이미지 세트)를 예시적으로 나타내는 도면이다.
도 3은 본 개시의 일 실시예에 따른 중복 이미지 검출 서버의 기능적 구성을 개략적으로 도시한 기능 블록도이다.
도 4는 본 개시의 일 실시예에 따라 기준 이미지와 비교 대상 이미지의 전체 영역 비교를 예시적으로 나타내는 도면이다.
도 5는 본 개시의 일 실시예에 따라 기준 이미지의 제1 피사체와 유사 이미지의 제2 피사체를 비교하는 방법을 예시적으로 나타내는 도면이다.
도 6은 본 개시의 일 실시예에 따라 기준 이미지의 제1 피사체와 유사 이미지의 제 2 피사체를 비교하는 방법의 또 다른 예시를 나타내는 도면이다.
도 7은 본 개시의 일 실시예에 따라 중복 이미지를 검출하는 과정을 보여주는 동작 흐름도이다.
1 is a diagram illustrating a schematic configuration of a system environment for detecting duplicate images according to an embodiment of the present disclosure.
FIG. 2 is a diagram illustrating a reference image and a duplicate image (eg, a duplicate image set) of the reference image according to an embodiment of the present disclosure.
Figure 3 is a functional block diagram schematically showing the functional configuration of a duplicate image detection server according to an embodiment of the present disclosure.
FIG. 4 is a diagram illustrating an entire area comparison between a reference image and a comparison target image according to an embodiment of the present disclosure.
FIG. 5 is a diagram illustrating a method of comparing a first subject of a reference image and a second subject of a similar image according to an embodiment of the present disclosure.
FIG. 6 is a diagram illustrating another example of a method of comparing a first subject of a reference image and a second subject of a similar image according to an embodiment of the present disclosure.
Figure 7 is an operation flowchart showing a process for detecting duplicate images according to an embodiment of the present disclosure.

이하, 첨부 도면을 참조하여 본 개시의 실시예에 관하여 상세히 설명한다. 이하에서는, 본 개시의 요지를 불필요하게 흐릴 우려가 있다고 판단되는 경우, 이미 공지된 기능 및 구성에 관한 구체적인 설명을 생략한다. 또한, 이하에서 설명하는 내용은 어디까지나 본 개시의 일 실시예에 관한 것일 뿐 본 개시가 이로써 제한되는 것은 아님을 알아야 한다.Hereinafter, embodiments of the present disclosure will be described in detail with reference to the accompanying drawings. Below, if it is judged that there is a risk of unnecessarily obscuring the gist of the present disclosure, detailed descriptions of already known functions and configurations will be omitted. In addition, it should be noted that the content described below only relates to one embodiment of the present disclosure and is not limited thereto.

본 개시에서 사용되는 용어는 단지 특정한 실시예를 설명하기 위해 사용되는 것으로 본 개시를 한정하려는 의도에서 사용된 것이 아니다. 예를 들면, 단수로 표현된 구성요소는 문맥상 명백하게 단수만을 의미하지 않는다면 복수의 구성요소를 포함하는 개념으로 이해되어야 한다. 본 개시에서 사용되는 "및/또는"이라는 용어는, 열거되는 항목들 중 하나 이상의 항목에 의한 임의의 가능한 모든 조합들을 포괄하는 것임이 이해되어야 한다. 본 개시에서 사용되는 '포함하다' 또는 '가지다' 등의 용어는 본 개시 상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것일 뿐이고, 이러한 용어의 사용에 의해 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 배제하려는 것은 아니다.The terms used in this disclosure are only used to describe specific embodiments and are not intended to limit the disclosure. For example, a component expressed in the singular should be understood as a concept that includes plural components unless the context clearly indicates only the singular. It should be understood that the term “and/or” as used in this disclosure encompasses any and all possible combinations of one or more of the listed items. Terms such as 'include' or 'have' used in this disclosure are only intended to designate the presence of features, numbers, steps, operations, components, parts, or combinations thereof described in this disclosure, and the meaning of these terms is The use is not intended to exclude the presence or addition of one or more other features, numbers, steps, operations, components, parts or combinations thereof.

본 개시의 실시예에 있어서 '모듈' 또는 '부'는 적어도 하나의 기능이나 동작을 수행하는 기능적 부분을 의미하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '모듈' 또는 '부'는, 특정한 하드웨어로 구현될 필요가 있는 '모듈' 또는 '부'를 제외하고는, 적어도 하나의 소프트웨어 모듈로 일체화되어 적어도 하나의 프로세서에 의해 구현될 수 있다.In the embodiments of the present disclosure, 'module' or 'unit' refers to a functional part that performs at least one function or operation, and may be implemented as hardware or software, or as a combination of hardware and software. Additionally, a plurality of 'modules' or 'units' may be integrated into at least one software module and implemented by at least one processor, except for 'modules' or 'units' that need to be implemented with specific hardware. there is.

덧붙여, 달리 정의되지 않는 한 기술적 또는 과학적인 용어를 포함하여, 본 개시에서 사용되는 모든 용어들은 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의된 용어들은, 관련 기술의 문맥상 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 개시에서 명백하게 달리 정의하지 않는 한 과도하게 제한 또는 확장하여 해석되지 않는다는 점을 알아야 한다.In addition, unless otherwise defined, all terms used in this disclosure, including technical or scientific terms, have the same meaning as commonly understood by a person of ordinary skill in the technical field to which this disclosure pertains. It should be noted that terms defined in commonly used dictionaries should be interpreted as having a meaning consistent with the context meaning of the related technology, and should not be interpreted in an overly restrictive or expanded manner unless clearly defined otherwise in the present disclosure. .

이하, 본 개시의 일 실시예에 따른 이미지 데이터 특징 자동화 추출 방법에 관하여 도면을 참조하여 상세히 설명한다.Hereinafter, a method for automatically extracting image data features according to an embodiment of the present disclosure will be described in detail with reference to the drawings.

도 1은 본 개시의 일 실시예에 따라 중복 이미지를 검출하기 위한 시스템 환경의 개략적인 구성을 나타내는 도면이다.1 is a diagram illustrating a schematic configuration of a system environment for detecting duplicate images according to an embodiment of the present disclosure.

도 1에 도시된 바와 같이, 본 개시의 일 실시예에 따른 중복 이미지 검출 시스템(100)은 복수의 사용자 단말(110), 통신망(120) 및 중복 이미지 검출 서버(130)를 포함할 수 있다.As shown in FIG. 1, the duplicate image detection system 100 according to an embodiment of the present disclosure may include a plurality of user terminals 110, a communication network 120, and a duplicate image detection server 130.

본 개시의 일 실시예에 따른 사용자 단말(110)은 통신망(120)을 통해 중복 이미지 검출 서버(130)에 접속하고 통신할 수 있는 기능을 포함하는 디지털 기기이다. 스마트폰, 태블릿 PC 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 휴대 가능한 디지털 기기일 수 있으며, 특정 형태로 제한되지 않는다. 본 도면에서는 3개의 사용자 단말이 도시되어 있으나 본 개시가 이로써 제한되는 것을 아니다. The user terminal 110 according to an embodiment of the present disclosure is a digital device that includes a function to connect to and communicate with the duplicate image detection server 130 through the communication network 120. It may be a portable digital device, such as a smartphone, tablet PC, etc., equipped with a memory means and equipped with a microprocessor to have computing power, and is not limited to a specific form. Although three user terminals are shown in this drawing, the present disclosure is not limited thereto.

본 개시의 일 실시예에 의하면, 사용자 단말(110) 상에서 수신된 다양한 형태의 사용자 입력은 통신망(120)을 통해 중복 이미지 검출 서버(130)로 전달될 수 있다. 본 개시의 일 실시예에 의하면, 사용자 단말(110)은 통신망(120)을 통하여 외부(예컨대, 중복 이미지 검출 서버(130))로부터 전송되어 온 다양한 신호를 수신할 수 있다. According to an embodiment of the present disclosure, various types of user input received on the user terminal 110 may be transmitted to the duplicate image detection server 130 through the communication network 120. According to an embodiment of the present disclosure, the user terminal 110 may receive various signals transmitted from the outside (eg, the duplicate image detection server 130) through the communication network 120.

본 개시의 일 실시예에 의하면, 사용자 단말(110)에는 본 개시에 따른 기능이 지원되기 위한 애플리케이션이 포함되어 있을 수 있다. 이와 같은 애플리케이션은 중복 이미지 검출 서버(130) 또는 외부의 애플리케이션 배포 서버(미도시)로부터 다운로드된 것일 수 있다. According to an embodiment of the present disclosure, the user terminal 110 may include an application to support the function according to the present disclosure. Such an application may be downloaded from the duplicate image detection server 130 or an external application distribution server (not shown).

본 개시의 일 실시예에 따른 통신망(120)은 유선 통신이나 무선 통신과 같은 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN: Metropolitan Area Network), 광역 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 바람직하게는, 본 명세서에서 말하는 통신망(120)은 공지의 인터넷 또는 월드와이드웹(WWW: World Wide Web)일 수 있다. 그러나 통신망(120)은, 굳이 이에 국한될 필요 없이, 공지의 유무선 데이터 통신망, 공지의 전화망 또는 공지의 유무선 텔레비전 통신망을 그 적어도 일부에 있어서 포함할 수도 있다.The communication network 120 according to an embodiment of the present disclosure may be configured regardless of communication mode, such as wired communication or wireless communication, and may include a local area network (LAN), a metropolitan area network (MAN), It can be composed of various communication networks, such as a wide area network (WAN). Preferably, the communication network 120 referred to in this specification may be the known Internet or World Wide Web (WWW). However, the communication network 120 is not necessarily limited thereto and may include at least a portion of a known wired or wireless data communication network, a known telephone network, or a known wired or wireless television communication network.

예를 들면, 통신망(120)은 무선 데이터 통신망으로서, 와이파이(WiFi) 통신, 와이파이 다이렉트(WiFi-Direct) 통신, 롱텀 에볼루션(LTE: Long Term Evolution) 통신, 블루투스 통신(예를 들면, 저전력 블루투스(BLE: Bluetooth Low Energy) 통신), 적외선 통신, 초음파 통신 등과 같은 종래의 통신 방식을 적어도 그 일부분에 있어서 구현하는 것일 수 있다.For example, the communication network 120 is a wireless data communication network, including Wi-Fi communication, WiFi-Direct communication, Long Term Evolution (LTE) communication, and Bluetooth communication (e.g., low-power Bluetooth (e.g., low-power Bluetooth). It may implement at least part of a conventional communication method such as BLE (Bluetooth Low Energy) communication, infrared communication, ultrasonic communication, etc.

본 개시의 일 실시예에 따른 중복 이미지 검출 서버(130)는 소정의 기준 이미지에 대한 중복 이미지를 검출하여 정보를 제공할 수 있다. 중복 이미지 검출 서버(130)는 소정의 기준 이미지에 포함되어 있는 피사체와 동일한 피사체를 포함하는 이미지를 중복 이미지로 검출하여 정보를 제공할 수 있다. The duplicate image detection server 130 according to an embodiment of the present disclosure may detect duplicate images for a predetermined reference image and provide information. The duplicate image detection server 130 may detect an image containing the same subject as a subject included in a predetermined reference image as a duplicate image and provide information.

도 2는 본 개시의 일 실시예에 따른 기준 이미지와 해당 기준 이미지의 중복 이미지(예: 중복 이미지 세트)를 예시적으로 나타내는 도면이다. FIG. 2 is a diagram illustrating a reference image and a duplicate image (eg, a duplicate image set) of the reference image according to an embodiment of the present disclosure.

여기서, 중복 이미지는 기준 이미지에 포함된 피사체와 동일한 피사체를 포함하는 이미지로, 기준 이미지와 동일한 이미지 또는 기준 이미지가 변형된 이미지를 포함한다. 예를 들어, 도 2(a)는 기준 이미지를 나타내고, 도 2(b)는 기준 이미지의 배경색을 변형한 중복 이미지를 나타낸다. 다른 예로, 도 2(c)는 기준 이미지이고, 2(d)는 기준 이미지의 피사체를 회전 또는 반전하여 변형한 중복 이미지를 나타낸다. 또 다른 예로, 도 2(e)는 기준 이미지이고, 2(f)는 동일한 장소 및 피사체에 대해, 촬영 각도나 초점을 변형하여 촬영한 중복 이미지 또는 피사체의 자세가 변형된 중복 이미지를 나타낸다. 본 개시의 일 실시예에 따른 중복 이미지 검출 서버(130)는 도 2에 도시된 바와 같이 기준 이미지와 동일한 피사체를 포함하되, 배경이 상이한 이미지(도 2(a), (b)), 회전된 이미지(도 2(c), (d)), 동일한 장소 및 피사체에 대한 서로 다른 컷의 이미지(도 2(e), (f))등 기준 이미지가 변형된 이미지에 대하여 중복 이미지로 검출하여 정보를 제공할 수 있다. 본 도면에서는 기준이미지의 변형이 육안으로 구분되는 이미지를 중복이미지의 예시로 도시하였으나 이로써 제한되는 것은 아니며, 그 밖에도 중복이미지는 기준이미지의 화질이 변경된 경우, 이미지의 해상도가 변경된 경우도 포함할 수 있다. Here, the duplicate image is an image containing the same subject as the subject included in the reference image, and includes an image identical to the reference image or an image in which the reference image has been modified. For example, Figure 2(a) shows a reference image, and Figure 2(b) shows a duplicate image in which the background color of the reference image has been modified. As another example, Figure 2(c) is a reference image, and Figure 2(d) shows a duplicate image transformed by rotating or inverting the subject of the reference image. As another example, Figure 2(e) is a reference image, and Figure 2(f) shows a duplicate image taken of the same location and subject by changing the shooting angle or focus, or a duplicate image in which the subject's posture has been changed. As shown in FIG. 2, the duplicate image detection server 130 according to an embodiment of the present disclosure includes an image that includes the same subject as the reference image, but has a different background (FIG. 2(a), (b)), and a rotated image. Information is collected by detecting duplicate images for images with modified reference images, such as images (Figures 2(c) and (d)) and images of different cuts for the same location and subject (Figures 2(e) and (f)). can be provided. In this drawing, an image in which the modification of the reference image can be distinguished by the naked eye is shown as an example of a duplicate image, but this is not limited. In addition, a duplicate image may also include cases where the image quality of the reference image is changed or the resolution of the image is changed. there is.

중복 이미지 검출 서버(130)는, 도시된 바와 같이, 통신망(120)을 통하여 사용자 단말(110)과의 통신을 수행할 수 있다.As shown, the duplicate image detection server 130 may communicate with the user terminal 110 through the communication network 120.

본 개시의 일 실시예에 따른 중복 이미지 검출 서버(130)는 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산능력을 갖춘 디지털 기기일 수 있다. 이러한 중복 이미지 검출 서버(130)는 서버 시스템일 수 있다.The duplicate image detection server 130 according to an embodiment of the present disclosure may be a digital device equipped with a memory means and equipped with a microprocessor to have computing capabilities. This duplicate image detection server 130 may be a server system.

도 3은 본 개시의 일 실시예에 따른 중복 이미지 검출 서버의 기능적 구성을 개략적으로 도시한 기능 블록도이다.Figure 3 is a functional block diagram schematically showing the functional configuration of a duplicate image detection server according to an embodiment of the present disclosure.

도 3을 참조하면, 중복 이미지 검출 서버(130)는 기준 이미지 수신부(302), 유사 이미지 결정부(304), 중복 이미지 결정부(306), 중복 이미지 정보 제공부(308) 및 통신부(310)를 포함할 수 있다. 도 3에 도시된 구성요소들은 중복 이미지 검출 서버(130)의 모든 기능을 반영한 것이 아니고, 필수적인 것도 아니어서, 중복 이미지 검출 서버(130)는 도시된 구성요소들보다 많은 구성요소를 포함하거나 그보다 적은 구성요소를 포함할 수 있다. Referring to FIG. 3, the duplicate image detection server 130 includes a reference image receiving unit 302, a similar image determining unit 304, a duplicate image determining unit 306, a duplicate image information providing unit 308, and a communication unit 310. may include. The components shown in FIG. 3 do not reflect all functions of the duplicate image detection server 130 and are not essential, so the duplicate image detection server 130 may include more or fewer components than the components shown. May contain components.

본 개시의 일 실시예에 따르면, 중복 이미지 검출 서버(130)는 기준 이미지 수신부(302), 유사 이미지 결정부(304), 중복 이미지 결정부(306), 중복 이미지 정보 제공부(308) 및 통신부(310)는 그 중 적어도 일부가 외부의 시스템과 통신하는 프로그램 모듈일 수 있다. 이러한 프로그램 모듈은 운영 시스템, 응용 프로그램 모듈 또는 기타 프로그램 모듈의 형태로 중복 이미지 검출 서버(130)에 포함될 수 있고, 물리적으로는 여러가지 공지의 기억 장치에 저장될 수 있다. 또한, 이러한 프로그램 모듈은 중복 이미지 검출 서버(130)와 통신 가능한 원격 기억 장치에 저장될 수 있다. 한편, 이러한 프로그램 모듈은 본 개시에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다. According to an embodiment of the present disclosure, the duplicate image detection server 130 includes a reference image receiving unit 302, a similar image determining unit 304, a duplicate image determining unit 306, a duplicate image information providing unit 308, and a communication unit. 310 may be a program module, at least some of which communicate with an external system. These program modules may be included in the duplicate image detection server 130 in the form of an operating system, application program module, or other program module, and may be physically stored in various known storage devices. Additionally, these program modules may be stored in a remote storage device capable of communicating with the duplicate image detection server 130. Meanwhile, such program modules include, but are not limited to, routines, subroutines, programs, objects, components, data structures, etc. that perform specific tasks or execute specific abstract data types according to the present disclosure.

본 개시의 일 실시예에 의하면, 기준 이미지 수신부(302)는 소정의 기준 이미지를 수신하는 기능을 수행한다. 본 개시의 일 실시예에 의하면, 기준 이미지 수신부(302)는 적어도 하나의 피사체를 포함하는 이미지를 기준 이미지로 수신할 수 있다. 본 개시의 일 실시예에 의하면, 기준 이미지 수신부(302)는 패션 아이템을 피사체로 포함하는 이미지를 기준 이미지로 수신할 수 있다. 일 실시예에서, 기준 이미지 수신부(302)는 적어도 하나의 피사체 및 배경 이미지를 포함하는 이미지를 기준 이미지로 수신할 수 있다.According to an embodiment of the present disclosure, the reference image receiver 302 performs a function of receiving a predetermined reference image. According to an embodiment of the present disclosure, the reference image receiver 302 may receive an image including at least one subject as a reference image. According to an embodiment of the present disclosure, the reference image receiver 302 may receive an image including a fashion item as a subject as a reference image. In one embodiment, the reference image receiver 302 may receive an image including at least one subject and a background image as a reference image.

본 개시의 일 실시예에 의하면, 유사 이미지 결정부(304)는 기준 이미지와 유사한 이미지를 중복 이미지 후보군으로 결정하는 기능을 수행한다. 여기에서, 기준 이미지와 유사한 이미지란 기준 이미지의 전체 영역(이하, 글로벌 영역)에 대한 유사도가 소정의 값 이상을 만족하는 이미지로 기준 이미지의 중복 이미지가 될 수 있는 중복 이미지 후보군이다. According to an embodiment of the present disclosure, the similar image determination unit 304 performs a function of determining images similar to a reference image as a duplicate image candidate group. Here, an image similar to the reference image is an image whose similarity to the entire area (hereinafter referred to as global area) of the reference image satisfies a predetermined value or more, and is a group of duplicate image candidates that can be duplicate images of the reference image.

본 개시의 일 실시예에 의하면, 유사 이미지 결정부(304)는 기준 이미지와 비교 대상 이미지의 세부적인 차이를 비교하지 않고, 전체적인 유사도를 계산하여 비교할 수 있다. 일 실시예에 의하면, 유사 이미지 결정부(304)는 소정의 이미지 데이터베이스에 포함된 비교 대상 이미지의 글로벌 영역과 기준 이미지의 글로벌 영역의 유사도를 계산하여 소정의 값 이상을 만족하는 경우 비교 대상 이미지를 유사 이미지로 결정할 수 있다. According to an embodiment of the present disclosure, the similar image determination unit 304 may calculate the overall similarity and compare the reference image and the comparison target image without comparing detailed differences. According to one embodiment, the similar image determination unit 304 calculates the similarity between the global area of the comparison target image and the global area of the reference image included in a predetermined image database, and selects the comparison target image if it satisfies a predetermined value or more. You can decide based on similar images.

본 개시의 일 실시예에 의하면, 유사도는 각 특징 벡터의 거리로 나타낼 수 있다. 여기에서 특징 벡터란, 스타일 공간 상에서 이미지의 속성 정보를 포함하는 벡터이다. 일 실시예에서, 특징 벡터는 이미지에 포함된 아이템 종류, 카테고리, 색상, 패턴, 스타일 및 기장 등의 속성 정보를 포함하는 스타일 공간 상의 벡터일 수 있다. 본 개시의 일 실시예에 의하면, 각각의 특징 벡터의 거리가 가까울수록 유사도가 높게 결정될 수 있다. According to an embodiment of the present disclosure, similarity can be expressed as the distance of each feature vector. Here, the feature vector is a vector containing attribute information of the image in the style space. In one embodiment, the feature vector may be a vector in a style space that includes attribute information such as item type, category, color, pattern, style, and length included in the image. According to an embodiment of the present disclosure, the closer the distance between each feature vector, the higher the similarity can be determined.

본 개시의 일 실시예에서, 유사 이미지 결정부(304)는 기준 이미지의 글로벌 영역에 대한 특징 벡터를 추출하고, 소정의 이미지 데이터베이스에 포함된 비교 대상 이미지의 글로벌 영역에 대한 특징 벡터를 추출하여 유사도를 계산할 수 있다. 일 실시예에서, 글로벌 영역에 대한 특징 벡터는 이미지의 글로벌 영역, 즉 전체 영역에 대한 속성 정보를 포함하는 스타일 공간 상의 벡터일 수 있다. 본 개시의 일 실시예에서, 글로벌 영역에 대한 특징 벡터는 이미지에 포함된 적어도 하나의 피사체의 속성 정보 및 배경 이미지에 대한 속성 정보를 포함할 수 있다. In one embodiment of the present disclosure, the similar image determination unit 304 extracts a feature vector for the global area of the reference image and extracts a feature vector for the global area of the comparison target image included in a predetermined image database to determine the similarity. can be calculated. In one embodiment, the feature vector for the global region may be a vector in a style space that includes attribute information for the global region of the image, that is, the entire region. In one embodiment of the present disclosure, the feature vector for the global area may include attribute information about at least one subject included in the image and attribute information about the background image.

본 개시의 일 실시예에 의하면, 유사 이미지 결정부(304)는 소정의 이미지 데이터베이스에 포함된 각각의 이미지와 기준 이미지에서 중심부와 주변부의 유사 정도에 서로 다른 가중치를 부여하여 전체 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the similar image determination unit 304 may calculate the overall similarity by assigning different weights to the degree of similarity between the center and the periphery of each image included in a predetermined image database and the reference image. .

본 개시의 일 실시예에 의하면, 유사 이미지 결정부(304)는 기준 이미지의 중심부와 비교 대상 이미지의 중심부를 비교하여 제1 유사도를 계산하고, 기준 이미지의 주변부와 비교 대상 이미지의 주변부를 비교하여 제2 유사도를 계산하여, 제1 유사도와 제2 유사도를 합산하여 전체 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the similar image determination unit 304 calculates the first similarity by comparing the center of the reference image with the center of the comparison image, and compares the peripheral portion of the reference image with the peripheral portion of the comparison image. By calculating the second similarity, the total similarity can be calculated by adding the first similarity and the second similarity.

본 개시의 일 실시예에 의하면, 유사 이미지 결정부(304)는 기준 이미지의 특징 벡터와 비교 대상 이미지의 특징 벡터의 각 성분 값에 따라 소정의 가중치를 부여하여 유사도를 계산할 수 있다. 일 실시예에서, 유사 이미지 결정부(304)는 이미지에 포함된 피사체에 대한 속성을 나타내는 벡터 성분 값을 배경에 대한 속성을 나타내는 성분 값보다 큰 가중치를 부여하여 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the similar image determination unit 304 may calculate the degree of similarity by assigning a predetermined weight to each component value of the feature vector of the reference image and the feature vector of the image to be compared. In one embodiment, the similar image determination unit 304 may calculate the similarity by assigning a greater weight to the vector component value representing the properties of the subject included in the image than the component value representing the properties of the background.

본 개시의 일 실시예에 의하면, 유사 이미지 결정부(304)는 기준 이미지와 비교 대상 이미지의 유사도가 소정의 제2 기준을 만족하는 경우 해당 비교 대상 이미지를 기준 이미지에 대한 중복 이미지 후보군에 해당하는 유사 이미지로 결정할 수 있다. According to an embodiment of the present disclosure, when the similarity between the reference image and the image to be compared satisfies a predetermined second standard, the similar image determination unit 304 selects the image to be compared as a duplicate image candidate group for the reference image. You can decide based on similar images.

도 4는 본 개시의 일 실시예에 따라 기준 이미지와 비교 대상 이미지의 전체 영역 비교를 예시적으로 나타내는 도면이다. FIG. 4 is a diagram illustrating an entire area comparison between a reference image and a comparison target image according to an embodiment of the present disclosure.

도 4를 참조하면, 기준 이미지(401)와 비교 대상 이미지(403)는 동일 이미지에 대해 보여지는 영역이 다르게 설정된 것이다. 기준 이미지(401)와 비교 대상 이미지(403)는 동일한 이미지에 해당하지 않지만, 유사 이미지 결정부(304)에서는 기준 이미지(401)와 비교 대상 이미지(403)의 글로벌 영역을 비교하여 비교 대상 이미지(403)를 유사 이미지로 결정할 수 있다. Referring to FIG. 4, the reference image 401 and the comparison target image 403 have different visible areas for the same image. Although the reference image 401 and the comparison target image 403 do not correspond to the same image, the similar image determination unit 304 compares the global area of the reference image 401 and the comparison target image 403 to compare the comparison target image ( 403) can be determined as a similar image.

본 개시의 일 실시예에 의하면, 유사 이미지 결정부(304)는 기준 이미지(401)의 글로벌 영역에 대한 속성 정보를 포함하는 특징 벡터를 추출하고, 비교 대상 이미지(403)의 글로벌 영역에 대한 속성 정보를 포함하는 특징 벡터를 추출한 후, 특징 벡터를 비교하여 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the similar image determination unit 304 extracts a feature vector containing attribute information for the global area of the reference image 401 and attributes for the global area of the comparison target image 403. After extracting a feature vector containing information, similarity can be calculated by comparing the feature vectors.

본 개시의 일 실시예에 의하면, 글로벌 영역에 대한 특징 벡터는 기준 이미지(401) 및 비교 대상 이미지(403)에 포함된 피사체인 사람에 대한 속성 정보 및 배경 이미지인 지구본 형상 등에 대한 정보를 포함할 수 있다. 일 실시예에서, 유사 이미지 결정부(304)는 기준 이미지(401) 및 비교 대상 이미지(403)의 피사체에 대한 속성 정보를 포함하는 성분 값의 차이를 배경 이미지에 대한 속성 정보를 포함하는 성분 값의 차이보다 큰 가중치를 부여하여 유사도를 계산할 수 있다. 본 개시의 일 실시예에 의하면, 유사 이미지 결정부(304)는 기준 이미지(401)와 비교 대상 이미지(403)의 유사도를 계산하고, 소정의 제2 기준을 만족하는 경우 비교 대상 이미지(403)를 기준 이미지(403)에 대한 유사 이미지로 결정할 수 있다.According to an embodiment of the present disclosure, the feature vector for the global area may include attribute information about the person as the subject included in the reference image 401 and the comparison target image 403 and information about the shape of the globe as the background image. You can. In one embodiment, the similar image determination unit 304 calculates the difference in component values including attribute information about the subject of the reference image 401 and the comparison target image 403 into component values including attribute information about the background image. Similarity can be calculated by assigning a weight greater than the difference. According to an embodiment of the present disclosure, the similar image determination unit 304 calculates the degree of similarity between the reference image 401 and the comparison target image 403, and, if a predetermined second standard is satisfied, the comparison target image 403 can be determined as a similar image to the reference image 403.

다시 도 3을 참조하여, 본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지의 로컬 영역과 유사 이미지의 로컬 영역을 비교하여 유사 이미지가 기준 이미지의 중복 이미지에 해당하는지 여부를 결정하는 기능을 수행한다. 여기에서, 이미지의 로컬 영역이란, 각 이미지에 포함된 피사체 영역을 의미한다. Referring again to FIG. 3, according to an embodiment of the present disclosure, the duplicate image determination unit 306 compares the local area of the reference image and the local area of the similar image to determine whether the similar image corresponds to a duplicate image of the reference image. It performs the function of deciding. Here, the local area of the image refers to the subject area included in each image.

일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지에 포함된 제1 피사체와 유사 이미지에 포함된 제2 피사체를 비교하여 유사도를 계산하고, 해당 유사도가 소정의 값 이상을 만족하는 경우 해당 유사 이미지를 기준 이미지에 대한 중복 이미지로 결정할 수 있다.According to one embodiment, the duplicate image determination unit 306 calculates the degree of similarity by comparing the first subject included in the reference image and the second subject included in the similar image, and when the similarity satisfies a predetermined value or more. The similar image may be determined as a duplicate image for the reference image.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지에 포함된 피사체를 로컬 영역으로 추출하여 제1 피사체로 결정할 수 있다. 또한, 중복 이미지 결정부(306)는 유사 이미지에 포함된 피사체를 로컬 영역으로 추출하여 제2 피사체로 결정할 수 있다. 일 실시예에서, 기준 이미지와 유사 이미지에는 복수의 피사체가 포함되어 있을 수 있다. 이 경우, 중복 이미지 결정부(306)는 기준 이미지에 포함된 각각의 피사체를 제1 피사체로 결정하고, 유사 이미지에 포함된 각각의 피사체를 제2 피사체로 결정할 수 있다.According to an embodiment of the present disclosure, the duplicate image determination unit 306 may extract a subject included in the reference image into a local area and determine it as the first subject. Additionally, the duplicate image determination unit 306 may extract a subject included in a similar image to a local area and determine it as the second subject. In one embodiment, the reference image and the similar image may include a plurality of subjects. In this case, the duplicate image determination unit 306 may determine each subject included in the reference image as the first subject and each subject included in the similar image as the second subject.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지에 포함된 적어도 하나의 제1 피사체와 유사 이미지에 포함된 적어도 하나의 제2 피사체를 비교하여 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the duplicate image determination unit 306 may calculate the degree of similarity by comparing at least one first subject included in the reference image and at least one second subject included in the similar image.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 각각의 제1 피사체 및 제2 피사체에 대한 특징 벡터를 추출하고, 각각의 특징 벡터를 비교하여 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the duplicate image determination unit 306 may extract feature vectors for each first subject and second subject, and calculate similarity by comparing the respective feature vectors.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지에 포함된 복수의 제1 피사체와 유사 이미지에 포함된 복수의 제2 피사체 각각을 모두 비교하여 유사도를 계산하고, 그 중 가장 가까운 것에 해당하는 유사도를 선택할 수 있다. According to an embodiment of the present disclosure, the duplicate image determination unit 306 calculates the degree of similarity by comparing each of the plurality of first subjects included in the reference image and the plurality of second subjects included in the similar image. You can select the similarity corresponding to the closest one.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지에 포함된 제1 피사체와 유사 이미지에 포함된 제2 피사체의 카테고리를 먼저 결정하고, 제1 피사체의 카테고리와 제2 피사체의 카테고리가 동일한 경우에만 제1 피사체와 제2 피사체를 비교하여 유사도를 계산할 수 있다. 일 실시예에서, 중복 이미지 결정부(306)는 제1 피사체의 특징 벡터로부터 제1 피사체의 카테고리를 추출하고, 제2 피사체의 특징 벡터로부터 제2 피사체의 카테고리를 추출할 수 있다. According to an embodiment of the present disclosure, the duplicate image determination unit 306 first determines the category of the first subject included in the reference image and the second subject included in the similar image, and determines the category of the first subject and the second subject. Only when the categories are the same, similarity can be calculated by comparing the first subject and the second subject. In one embodiment, the duplicate image determination unit 306 may extract the category of the first subject from the feature vector of the first subject and extract the category of the second subject from the feature vector of the second subject.

본 개시의 일 실시예에 의하면, 기준 이미지와 유사 이미지가 각각 복수의 피사체를 포함하는 경우, 중복 이미지 결정부(306)는 각각의 제1 피사체의 카테고리와 제2 피사체의 카테고리를 우선적으로 결정할 수 있다. 일 실시예에서, 중복 이미지 결정부(306)는 기준 이미지에 포함된 복수의 제1 피사체와 유사 이미지에 포함된 복수의 제2 피사체 중, 서로 동일한 카테고리에 해당하는 제1 피사체와 제2 피사체를 비교하여 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, when the reference image and the similar image each include a plurality of subjects, the duplicate image determination unit 306 may preferentially determine the category of each first subject and the category of the second subject. there is. In one embodiment, the duplicate image determination unit 306 selects the first and second subjects corresponding to the same category among the plurality of first subjects included in the reference image and the plurality of second subjects included in the similar image. Similarity can be calculated by comparison.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지의 중앙부에 위치한 제1 피사체와 유사 이미지의 중앙부에 위치한 제2 피사체를 결정하고, 제1 피사체와 제2 피사체를 비교하여 유사도를 계산할 수 있다. 일 실시예에서, 중복 이미지 결정부(306)는 기준 이미지의 중앙점과 적어도 하나의 제1 피사체의 중앙점의 거리가 가장 가까운 제1 피사체를 선택하고, 유사 이미지의 중앙점과 적어도 하나의 제2 피사체의 중앙점의 거리가 가장 가까운 제2 피사체를 선택하여, 제1 피사체와 제2 피사체를 비교하여 유사도를 계산할 수 있다. 일 실시예에서, 기준 이미지와 유사 이미지에 각각 복수의 피사체를 포함하는 경우에도, 이미지의 중앙부에 위치한 피사체 간의 비교를 통해 유사도를 계산하여 유사도 계산 과정을 단순화할 수 있다. According to an embodiment of the present disclosure, the duplicate image determination unit 306 determines a first subject located in the center of the reference image and a second subject located in the center of a similar image, and compares the first subject and the second subject. Similarity can be calculated. In one embodiment, the duplicate image determination unit 306 selects the first subject in which the distance between the center point of the reference image and the center point of the at least one first subject is closest, and the distance between the center point of the reference image and the center point of the at least one first subject is closest. 2 The similarity can be calculated by selecting the second subject whose central point distance is closest to the subject and comparing the first subject and the second subject. In one embodiment, even when the reference image and the similar image each include a plurality of subjects, the similarity calculation process can be simplified by calculating similarity through comparison between subjects located in the center of the image.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 복수의 제1 피사체와 제2 피사체 각각의 피사체 유사도를 계산하고 이를 합산하여 유사도를 계산할 수 있다. 본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 각각의 피사체 유사도에 가중치를 부여하고 합산하여 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the duplicate image determination unit 306 may calculate the similarity by calculating the subject similarity of each of the plurality of first and second subjects and adding them together. According to an embodiment of the present disclosure, the duplicate image determination unit 306 may calculate the similarity by assigning a weight to the similarity of each subject and adding them together.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지의 중앙부에 위치한 제1 피사체와 유사 이미지의 중앙부에 위치한 제2 피사체 간의 유사도에 큰 가중치를 부여하여 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the duplicate image determination unit 306 may calculate the similarity by assigning a large weight to the similarity between the first subject located in the center of the reference image and the second subject located in the center of the similar image.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 기준 이미지에 포함된 적어도 하나의 제1 피사체와 유사 이미지에 포함된 적어도 하나의 제2 피사체 각각을 모두 비교하여 유사도를 계산하고, 그 중 가장 가까운 것에 해당하는 것을 제1 유사도로 선택하고, 기준 이미지의 중앙부에 위치한 제1 피사체와 유사 이미지의 중앙부에 위치한 제2 피사체를 비교하여 제2 유사도를 계산한 후, 제1 유사도와 제2 유사도에 가중치를 부여하여 전체 유사도를 계산할 수 있다. According to an embodiment of the present disclosure, the duplicate image determination unit 306 calculates the degree of similarity by comparing each of the at least one first subject included in the reference image and the at least one second subject included in the similar image, Among them, the closest one is selected as the first similarity, the second similarity is calculated by comparing the first subject located in the center of the reference image and the second subject located in the center of the similar image, and then the first similarity and the second similarity are calculated. 2 The overall similarity can be calculated by assigning weights to the similarity.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 제1 피사체와 제2 피사체 간의 유사도가 소정의 제1 기준을 만족하는 경우 해당 유사 이미지를 기준 이미지에 대한 중복 이미지로 결정할 수 있다. 본 개시의 일 실시예에서, 사전에 별도의 검증 데이터셋을 구성하고, 해당 검증 데이터셋을 이용하여 중복 이미지 검출 정확도를 최대화할 수 있는 기준값을 소정의 제1 기준으로 결정할 수 있다. According to an embodiment of the present disclosure, when the similarity between the first subject and the second subject satisfies a predetermined first standard, the duplicate image determination unit 306 may determine the similar image as a duplicate image for the reference image. . In one embodiment of the present disclosure, a separate verification data set may be configured in advance, and a reference value that can maximize the accuracy of detecting duplicate images may be determined using the verification data set as a predetermined first standard.

일 실시예에서, 중복 이미지 결정부(306)에서 유사 이미지를 중복 이미지로 결정하는 소정의 제1 기준은, 유사 이미지 결정부(304)에서 비교 대상 이미지를 기준 이미지에 대한 유사 이미지로 결정하는 소정의 제2 기준보다 엄격하게 정해질 수 있다. In one embodiment, the predetermined first criterion for determining a similar image as a duplicate image in the duplicate image determination unit 306 is a predetermined first criterion for determining the image to be compared as a similar image to the reference image in the similar image determination unit 304. It can be determined more strictly than the second standard.

도 5는 본 개시의 일 실시예에 따라 기준 이미지의 제1 피사체와 유사 이미지의 제2 피사체를 비교하는 방법을 예시적으로 나타내는 도면이다.FIG. 5 is a diagram illustrating a method of comparing a first subject of a reference image and a second subject of a similar image according to an embodiment of the present disclosure.

도 5를 참조하면, 중복 이미지 결정부(306)는 기준 이미지(501)에 포함된 제1 피사체(503, 505)를 결정하고, 유사 이미지(507)에 포함된 제2 피사체(509, 511)를 결정할 수 있다. 본 개시의 일 실시예에서, 중복 이미지 결정부(305)는 제1 피사체(503, 505) 각각의 특징 벡터를 추출하고, 제2 피사체(509, 511) 각각의 특징 벡터를 추출할 수 있다. Referring to FIG. 5, the duplicate image determination unit 306 determines the first subjects 503 and 505 included in the reference image 501 and the second subjects 509 and 511 included in the similar image 507. can be decided. In one embodiment of the present disclosure, the duplicate image determination unit 305 may extract feature vectors for each of the first subjects 503 and 505 and feature vectors for each of the second subjects 509 and 511.

일 실시예에서, 중복 이미지 결정부(306)는 제1 피사체(503, 505)의 카테고리(503: 상의, 505: 하의)를 결정하고, 제2 피사체(509, 511)의 카테고리(509: 상의, 511: 하의)를 결정할 수 있다. In one embodiment, the duplicate image determination unit 306 determines the category (503: top, 505: bottom) of the first subjects (503, 505) and the category (509: top) of the second subject (509, 511). , 511: bottoms) can be determined.

본 개시의 일 실시예에서, 중복 이미지 결정부(306)는 복수의 제1 피사체와 제2 피사체 중에서, 상의에 해당하는 제1 피사체(503)와 제2 피사체(509)의 특징 벡터를 비교하여 제1 피사체 유사도를 계산하고 하의에 해당하는 제1 피사체(505)와 제2 피사체(511)의 특징 벡터를 비교하여 제2 피사체 유사도를 계산할 수 있다. In one embodiment of the present disclosure, the duplicate image determination unit 306 compares the feature vectors of the first subject 503 and the second subject 509 corresponding to the top among the plurality of first and second subjects. The similarity of the first subject may be calculated and the similarity of the second subject may be calculated by comparing the feature vectors of the first subject 505 and the second subject 511 corresponding to the bottoms.

일 실시예에서, 중복 이미지 결정부(306)는 제1 피사체 유사도와 제2 피사체 유사도를 합산하여 기준 이미지(501)와 유사 이미지(507)의 로컬 영역에 대한 유사도를 계산할 수 있다. In one embodiment, the duplicate image determination unit 306 may calculate the similarity of the local area of the reference image 501 and the similar image 507 by adding the first and second subject similarities.

도 6은 본 개시의 일 실시예에 따라 기준 이미지의 제1 피사체와 유사 이미지의 제 2 피사체를 비교하는 방법의 또 다른 예시를 나타내는 도면이다.FIG. 6 is a diagram illustrating another example of a method of comparing a first subject of a reference image and a second subject of a similar image according to an embodiment of the present disclosure.

도 6에서 중복 이미지 결정부(306)는 기준 이미지(601)의 중앙부에 위치한 제1 피사체(603)을 결정하고, 유사 이미지(605)의 중앙부에 위치한 제2 피사체(605)를 결정할 수 있다. 중복 이미지 결정부(306)는 복수의 피사체 중에서 제1 피사체(603)와 제2 피사체(605)만 비교하여 유사도를 계산할 수 있다. In FIG. 6 , the duplicate image determination unit 306 may determine the first subject 603 located in the center of the reference image 601 and the second subject 605 located in the center of the similar image 605. The duplicate image determination unit 306 may calculate similarity by comparing only the first subject 603 and the second subject 605 among the plurality of subjects.

본 개시의 일 실시예에 의하면, 중복 이미지 결정부(306)는 제1 피사체와 제2 피사체의 유사도가 소정의 값을 만족하는 경우, 해당 유사 이미지(403, 507)를 기준 이미지(401, 501)의 중복 이미지로 결정할 수 있다. According to an embodiment of the present disclosure, when the similarity between the first and second subjects satisfies a predetermined value, the duplicate image determination unit 306 selects the similar images 403 and 507 as the reference images 401 and 501. ) can be determined by the duplicate image.

다시 도 3을 참조하여, 본 개시의 일 실시예에 의하면, 중복 이미지 정보 제공부(308)는 기준 이미지에 대한 중복 이미지의 정보를 제공하는 기능을 수행한다. 일 실시예에서, 중복 이미지 정보 제공부(308)는 소정의 이미지 데이터베이스의 비교 대상 이미지 중에서 기준 이미지에 대한 중복 이미지로 결정된 이미지에 대한 정보를 사용자 단말(110)로 제공할 수 있다. Referring again to FIG. 3, according to an embodiment of the present disclosure, the duplicate image information provider 308 performs a function of providing information on a duplicate image for a reference image. In one embodiment, the duplicate image information provider 308 may provide the user terminal 110 with information about an image determined to be a duplicate image with respect to the reference image among images to be compared in a predetermined image database.

본 개시의 일 실시예에 의하면, 중복 이미지 정보 제공부(308)는 기준 이미지에 대한 유사도가 높은 순으로 중복 이미지를 정렬하여 정보를 제공할 수 있다. According to an embodiment of the present disclosure, the duplicate image information provider 308 may provide information by sorting duplicate images in order of high similarity to the reference image.

본 개시의 일 실시예에 따른 중복 이미지 검출 서버(130)의 통신부(310)는 기준 이미지 수신부(302), 유사 이미지 결정부(304), 중복 이미지 결정부(306) 및 중복 이미지 정보 제공부(308)로부터의/로의 데이터 송수신이 가능하도록 하는 기능을 수행한다. The communication unit 310 of the duplicate image detection server 130 according to an embodiment of the present disclosure includes a reference image receiver 302, a similar image determination unit 304, a duplicate image determination unit 306, and a duplicate image information provider ( 308) performs a function that enables data transmission and reception from/to.

도 7은 본 개시의 일 실시예에 따라 중복 이미지를 검출하는 과정을 보여주는 동작 흐름도이다. Figure 7 is an operation flowchart showing a process for detecting a duplicate image according to an embodiment of the present disclosure.

먼저 단계(S701)에서 중복 이미지 검출 서버(130)는 소정의 기준 이미지를 수신한다. 기준 이미지는 피사체를 포함하는 이미지로, 중복 이미지 검출 서버(130)는 적어도 하나의 피사체 및 배경 이미지를 포함하는 이미지를 기준 이미지로 수신할 수 있다. First, in step S701, the duplicate image detection server 130 receives a predetermined reference image. The reference image is an image including a subject, and the duplicate image detection server 130 may receive an image including at least one subject and a background image as the reference image.

다음으로 단계(S703)에서, 중복 이미지 검출 서버(130)는 소정의 이미지 데이터베이스의 비교 대상 이미지와 기준 이미지의 전체 영역(이하, 글로벌 영역)에 대한 유사도를 계산한다. 일 실시예에서, 중복 이미지 검출 서버(130)는 기준 이미지의 글로벌 영역 특징 벡터 및 비교 대상 이미지의 글로벌 영역 특징 벡터를 추출하고, 이를 비교하여 유사도를 계산할 수 있다. 본 개시의 일 실시예에서, 중복 이미지 검출 서버(130)는 기준 이미지와 비교 대상 이미지의 중심부를 주변부보다 큰 가중치를 적용하여 전체 유사도를 계산할 수 있다.Next, in step S703, the duplicate image detection server 130 calculates the similarity of the entire area (hereinafter referred to as global area) between the image to be compared and the reference image in a predetermined image database. In one embodiment, the duplicate image detection server 130 extracts a global region feature vector of a reference image and a global region feature vector of a comparison target image, and compares them to calculate similarity. In one embodiment of the present disclosure, the duplicate image detection server 130 may calculate the overall similarity by applying a greater weight to the center of the reference image and the image to be compared than to the periphery.

단계(S705)에서, 중복 이미지 검출 서버(130)는 비교 대상 이미지 중 기준 이미지와 전체 유사도가 소정의 제2 기준을 만족하는 경우, 해당 비교 대상 이미지를 기준 이미지에 대한 유사 이미지로 결정할 수 있다. In step S705, the duplicate image detection server 130 may determine the comparison target image as a similar image to the reference image when the overall similarity with the reference image among the comparison target images satisfies a predetermined second standard.

단계(S707)에서는, 중복 이미지 검출 서버(130)는 기준 이미지에 포함된 각각의 피사체를 검출하여 제1 피사체로 결정하고 유사 이미지에 포함된 각각의 피사체를 검출하여 제2 피사체로 결정한다. 일 실시예에서, 기준 이미지와 유사 이미지에서는 각각 적어도 하나 이상의 제1 피사체 및 제2 피사체가 결정될 수 있다. In step S707, the duplicate image detection server 130 detects each subject included in the reference image and determines it as the first subject, and detects each subject included in the similar image and determines it as the second subject. In one embodiment, at least one first subject and at least one second subject may be determined from the reference image and the similar image, respectively.

다음으로 단계(S709)에서는, 중복 이미지 검출 서버(130)는 제1 피사체 및 제2 피사체의 유사도를 계산한다. 본 개시의 일 실시예에서, 중복 이미지 검출 서버(130)는 각각의 제1 피사체의 특징 벡터와 제2 피사체의 특징 벡터를 먼저 결정할 수 있다. 일 실시예에서, 중복 이미지 검출 서버(130)는 제1 피사체의 카테고리 및 제2 피사체의 카테고리를 추출하고, 서로 동일한 카테고리에 해당하는 제1 피사체와 제2 피사체를 비교하여 유사도를 계산할 수 있다. 본 개시의 일 실시예에서, 복수의 제1 피사체와 복수의 제2 피사체가 결정된 경우, 각각의 피사체 유사도를 계산하고, 가중치를 부여하여 기준 이미지와 유사 이미지의 로컬 영역에 대한 유사도를 계산할 수 있다.Next, in step S709, the duplicate image detection server 130 calculates the degree of similarity between the first subject and the second subject. In one embodiment of the present disclosure, the duplicate image detection server 130 may first determine the feature vector of each first subject and the feature vector of the second subject. In one embodiment, the duplicate image detection server 130 may extract the category of the first subject and the category of the second subject, and calculate the degree of similarity by comparing the first subject and the second subject that correspond to the same category. In one embodiment of the present disclosure, when a plurality of first subjects and a plurality of second subjects are determined, the similarity of each subject may be calculated, and a weight may be applied to calculate the similarity between the reference image and the local area of the similar image. .

단계(S711)에서, 중복 이미지 검출 서버(130)는 제1 피사체와 제2 피사체 간의 유사도가 소정의 제1 기준을 만족하는 경우 해당 유사 이미지를 기준 이미지에 대한 중복 이미지로 결정할 수 있다.In step S711, the duplicate image detection server 130 may determine the similar image as a duplicate image for the reference image when the similarity between the first subject and the second subject satisfies a predetermined first standard.

마지막으로, 단계(S713)에서, 중복 이미지 검출 서버(130)는 기준 이미지에 대한 중복 이미지의 정보를 사용자 단말(110)에 제공할 수 있다. 일 실시예에서, 중복 이미지 검출 서버(130)는 기준 이미지에 대한 유사도가 높은 순으로 중복 이미지를 정렬하여 정보를 제공할 수 있다.Finally, in step S713, the duplicate image detection server 130 may provide the user terminal 110 with information on the duplicate image with respect to the reference image. In one embodiment, the duplicate image detection server 130 may provide information by sorting duplicate images in order of high similarity to the reference image.

도면을 참조하여 전술한 본 개시의 실시예에서는(그리고 본 명세서에서 전반적으로), 사용자 단말(110)과 중복 이미지 검출 서버(130)가 클라이언트-서버 모델, 특히 클라이언트는 주로 사용자 입출력 기능만을 제공하고 그 외 대부분의 기능들(특히, 중복 이미지 검출과 관련한 많은 기능들)이 서버에 위임된 형태에 기초하여 구현된 것과 같이 설명되어 있으나, 본 개시가 이로써 제한되는 것은 아니다. 본 개시의 다른 실시예에 의하면, 중복 이미지 검출 시스템 환경은 그 기능들이 사용자 단말과 서버 사이에 고르게 분배되어 구현될 수도 있고, 오히려 사용자 단말 상에 설치된 애플리케이션 환경에 더욱 의존하여 구현될 수도 있음을 알아야 한다. 또한, 본 개시의 일 실시예에 따라 중복 이미지 검출 시스템의 기능들을 사용자 단말과 서버 사이에 분배하여 구현하는 경우, 클라이언트와 서버 사이의 중복 이미지 검출 시스템의 각 기능의 분배는 실시예마다 달리 구현될 수 있음을 알아야 한다. 본 개시의 일 실시예에 따르면, 중복 이미지 검출 서버의 주요 기능은 중복 이미지 검출 서버 (130)가 아닌 각 사용자 단말(110)에 구현되어 제공될 수 있음을 알아야 한다.In the embodiments of the present disclosure described above with reference to the drawings (and herein generally), the user terminal 110 and the duplicate image detection server 130 use a client-server model, in particular, the client mainly provides only user input and output functions. Most other functions (in particular, many functions related to duplicate image detection) are described as if implemented based on a server-delegated form, but the present disclosure is not limited thereto. According to another embodiment of the present disclosure, it should be noted that the duplicate image detection system environment may be implemented with its functions evenly distributed between the user terminal and the server, or may rather be implemented depending more on the application environment installed on the user terminal. do. In addition, when implementing the functions of the duplicate image detection system by distributing them between the user terminal and the server according to an embodiment of the present disclosure, the distribution of each function of the duplicate image detection system between the client and the server may be implemented differently for each embodiment. You need to know that you can. According to an embodiment of the present disclosure, it should be noted that the main functions of the duplicate image detection server may be implemented and provided in each user terminal 110 rather than the duplicate image detection server 130.

또한, 전술한 본 개시의 실시예에서는, 편의상 특정 모듈이 소정의 동작들을 수행하는 것처럼 설명되었으나, 본 개시가 이로써 제한되는 것은 아니다. 본 개시의 다른 실시예에 의하면, 위 설명에서 어느 특정 모듈에 의해 수행되는 것과 같이 설명된 동작들이, 그와 다른 별개의 모듈에 의해 각각 수행될 수 있음을 알아야 한다.In addition, in the above-described embodiments of the present disclosure, for convenience, a specific module is described as performing certain operations, but the present disclosure is not limited thereto. According to another embodiment of the present disclosure, it should be noted that operations described above as being performed by a specific module may be performed by separate modules.

본 개시에서 설명된 단말기 및 서버에 의해 실행되는 프로그램은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 프로그램은 컴퓨터로 읽을 수 있는 명령어들을 수행할 수 있는 모든 시스템에 의해 수행될 수 있다.Programs executed by the terminals and servers described in this disclosure may be implemented with hardware components, software components, and/or a combination of hardware components and software components. A program can be executed by any system that can execute computer-readable instructions.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령어(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어는, 컴퓨터로 읽을 수 있는 저장 매체(computer-readable storage media)에 저장된 명령어를 포함하는 컴퓨터 프로그램으로 구현될 수 있다. 컴퓨터가 읽을 수 있는 기록 매체로는, 예를 들어 마그네틱 저장 매체(예컨대, ROM(Read-Only Memory), RAM(Random-Access Memory), 플로피 디스크, 하드 디스크 등) 및 광학적 판독 매체(예컨대, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc)) 등이 있다. 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템들에 분산되어, 분산 방식으로 컴퓨터가 판독 가능한 코드가 저장되고 실행될 수 있다. 매체는 컴퓨터에 의해 판독가능하며, 메모리에 저장되고, 프로세서에서 실행될 수 있다.Software may include a computer program, code, instructions, or a combination of one or more of these, which may configure a processing unit to operate as desired, or may be processed independently or collectively. You can command the device. Software may be implemented as a computer program including instructions stored on computer-readable storage media. Computer-readable recording media include, for example, magnetic storage media (e.g., ROM (Read-Only Memory), RAM (Random-Access Memory), floppy disk, hard disk, etc.) and optical read media (e.g., CD-ROM). (CD-ROM), DVD (Digital Versatile Disc), etc. The computer-readable recording medium is distributed among computer systems connected to a network, so that computer-readable code can be stored and executed in a distributed manner. The media may be readable by a computer, stored in memory, and executed by a processor.

컴퓨터로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.Computer-readable storage media may be provided in the form of non-transitory storage media. Here, 'non-transitory' only means that the storage medium does not contain signals and is tangible, and does not distinguish whether the data is stored semi-permanently or temporarily in the storage medium.

또한, 본 개시의 실시예들에 따른 프로그램은 컴퓨터 프로그램(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램은 소프트웨어 프로그램, 소프트웨어 프로그램이 저장된 컴퓨터로 읽을 수 있는 저장 매체를 포함할 수 있다. 예를 들어, 컴퓨터 프로그램은 디바이스의 제조사 또는 전자 마켓(예를 들어, 구글 플레이스토어, 앱 스토어)을 통해 전자적으로 배포되는 소프트웨어 프로그램 형태의 상품(예를 들어, 다운로드 가능한 애플리케이션 (downloadable application))을 포함할 수 있다. 전자적 배포를 위하여, 소프트웨어 프로그램의 적어도 일부는 저장 매체에 저장되거나, 임시적으로 생성될 수 있다. 이 경우, 저장 매체는 제조사의 서버, 전자 마켓의 서버, 또는 소프트웨어 프로그램을 임시적으로 저장하는 중계 서버의 저장매체가 될 수 있다.Additionally, programs according to embodiments of the present disclosure may be included and provided as a computer program product. Computer programs are commodities and can be traded between sellers and buyers. A computer program may include a software program and a computer-readable storage medium on which the software program is stored. For example, a computer program may be a product in the form of a software program (e.g., a downloadable application) that is distributed electronically by the device manufacturer or through an electronic marketplace (e.g., Google Play Store, App Store). It can be included. For electronic distribution, at least a portion of the software program may be stored on a storage medium or created temporarily. In this case, the storage medium may be a storage medium of a manufacturer's server, an electronic market server, or a relay server that temporarily stores a software program.

컴퓨터 프로그램은, 서버 및 디바이스로 구성되는 시스템에서, 서버의 저장매체 또는 디바이스의 저장매체를 포함할 수 있다. 또는, 서버 또는 디바이스와 통신 연결되는 제3의 디바이스(예, 스마트폰)가 존재하는 경우, 컴퓨터 프로그램은 제3의 디바이스의 저장매체를 포함할 수 있다. 또는, 컴퓨터 프로그램은 서버로부터 디바이스 또는 제3 디바이스로 전송되거나, 제3 디바이스로부터 디바이스로 전송되는 소프트웨어 프로그램 자체를 포함할 수 있다. 이 경우, 서버, 디바이스 및 제3 디바이스 중 하나가 컴퓨터 프로그램을 실행하여 개시된 실시예들에 따른 방법을 수행할 수 있다. 또는, 서버, 디바이스 및 제3 디바이스 중 둘 이상이 컴퓨터 프로그램을 실행하여 개시된 실시예들에 따른 방법을 분산하여 실시할 수 있다. 예를 들면, 서버가 서버에 저장된 컴퓨터 프로그램을 실행하여, 서버와 통신 연결된 디바이스가 개시된 실시예들에 따른 방법을 수행하도록 제어할 수 있다. 또 다른 예로, 제3 디바이스가 컴퓨터 프로그램을 실행하여, 제3 디바이스와 통신 연결된 디바이스가 개시된 실시예에 따른 방법을 수행하도록 제어할 수 있다. 제3 디바이스가 컴퓨터 프로그램을 실행하는 경우, 제3 디바이스는 서버로부터 컴퓨터 프로그램을 다운로드하고, 다운로드된 컴퓨터 프로그램을 실행할 수 있다. 또는, 제3 디바이스는 프리로드 (pre-loaded)된 상태로 제공된 컴퓨터 프로그램을 실행하여 개시된 실시예들에 따른 방법을 수행할 수도 있다.A computer program may include a storage medium of a server or a storage medium of a device in a system comprised of a server and a device. Alternatively, if there is a third device (eg, a smartphone) that is connected to the server or device for communication, the computer program may include the storage medium of the third device. Alternatively, the computer program may include a software program itself that is transmitted from a server to the device or a third device, or from a third device to the device. In this case, one of the server, the device, and the third device may execute the computer program to perform the method according to the disclosed embodiments. Alternatively, two or more of a server, a device, and a third device may execute the computer program and perform the methods according to the disclosed embodiments in a distributed manner. For example, the server may execute a computer program stored on the server and control a device connected to the server to perform the method according to the disclosed embodiments. As another example, a third device may execute a computer program to control a device connected to the third device to perform the method according to the disclosed embodiment. When the third device executes a computer program, the third device may download the computer program from the server and execute the downloaded computer program. Alternatively, the third device may perform the method according to the disclosed embodiments by executing a computer program provided in a pre-loaded state.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 컴퓨터 시스템 또는 모듈 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with limited examples and drawings, various modifications and variations can be made by those skilled in the art from the above description. For example, the described techniques may be performed in a different order than the described method, and/or components, such as a described computer system or module, may be combined or combined in a form different from the described method, or other components or equivalents may be used. Appropriate results can be achieved even if replaced or replaced by .

100: 중복 이미지 검출 시스템
110: 사용자 단말
120: 통신망
130: 중복 이미지 검출 서버
100: Duplicate image detection system
110: user terminal
120: communication network
130: Duplicate image detection server

Claims (12)

동일한 피사체를 포함하는 중복 이미지를 검출하는 방법으로서,
적어도 하나의 제1 피사체를 포함하는 기준 이미지를 수신하는 단계,
상기 기준 이미지와 유사한 적어도 하나의 유사 이미지를 결정하는 단계,
상기 기준 이미지에 포함된 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 적어도 하나의 제2 피사체의 유사도를 계산하는 단계,
상기 유사도가 소정의 제1 기준을 만족하는 경우 상기 유사 이미지를 상기 기준 이미지의 중복 이미지로 결정하는 단계 및
상기 중복 이미지에 대한 정보를 제공하는 단계를 포함하는,
방법.
A method for detecting duplicate images containing the same subject, comprising:
Receiving a reference image including at least one first subject,
determining at least one similar image similar to the reference image;
Calculating a degree of similarity between at least one first subject included in the reference image and at least one second subject included in the similar image;
If the similarity satisfies a predetermined first standard, determining the similar image as a duplicate image of the reference image;
Including providing information about the duplicate image,
method.
제1항에 있어서,
상기 기준 이미지와 유사한 적어도 하나의 유사 이미지를 결정하는 단계는,
소정의 이미지 데이터베이스에 포함된 적어도 하나의 이미지를 상기 기준 이미지와 비교하여 전체 유사도를 계산하는 단계 및
상기 전체 유사도가 소정의 제2 기준을 만족하는 경우 상기 적어도 하나의 이미지를 유사 이미지로 결정하는 단계를 포함하는,
방법.
According to paragraph 1,
Determining at least one similar image similar to the reference image includes:
Comparing at least one image included in a predetermined image database with the reference image to calculate overall similarity;
Comprising the step of determining the at least one image as a similar image when the overall similarity satisfies a predetermined second criterion,
method.
제1항에 있어서,
상기 기준 이미지에 포함된 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 적어도 하나의 제2 피사체의 유사도를 계산하는 단계는,
상기 기준 이미지에 포함된 적어도 하나의 제1 피사체를 검출하는 단계,
상기 유사 이미지에 포함된 적어도 하나의 제2 피사체를 검출하는 단계 및
상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체를 비교하여 유사도를 계산하는 단계를 포함하는,
방법.
According to paragraph 1,
Calculating the degree of similarity between at least one first subject included in the reference image and at least one second subject included in the similar image,
Detecting at least one first subject included in the reference image,
detecting at least one second subject included in the similar image; and
Comprising the step of calculating similarity by comparing the at least one first subject and the at least one second subject,
method.
제3항에 있어서,
상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체를 비교하여 유사도를 계산하는 단계는,
상기 적어도 하나의 제1 피사체의 제1 카테고리를 결정하고, 상기 적어도 하나의 제2 피사체의 제2 카테고리를 결정하여, 각각의 상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체 중 상기 제1 카테고리와 상기 제2 카테고리가 동일한 제1 피사체와 제2 피사체를 비교하여 상기 유사도를 계산하는,
방법.
According to paragraph 3,
The step of calculating similarity by comparing the at least one first subject and the at least one second subject,
Determine a first category of the at least one first subject, and determine a second category of the at least one second subject, so that each of the at least one first subject and the at least one second subject is Calculating the similarity by comparing a first subject and a second subject whose first category and the second category are the same,
method.
제3항에 있어서,
상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체를 비교하여 유사도를 계산하는 단계는,
상기 적어도 하나의 제1 피사체 중 상기 기준 이미지의 중앙부에 위치한 제1 피사체를 결정하고, 상기 적어도 하나의 제2 피사체 중 상기 유사 이미지의 중앙부에 위치한 제2 피사체를 결정하여, 상기 제1 피사체와 상기 제2 피사체를 비교하여 상기 유사도를 계산하는,
방법.
According to paragraph 3,
The step of calculating similarity by comparing the at least one first subject and the at least one second subject,
Determining a first subject located in the center of the reference image among the at least one first subject, and determining a second subject located in the center of the similar image among the at least one second subject, wherein the first subject and the Calculating the similarity by comparing a second subject,
method.
제5항에 있어서,
상기 기준 이미지의 중앙부에 위치한 제1 피사체는, 상기 기준 이미지의 중앙점과 상기 적어도 하나의 제1 피사체의 중앙점의 거리가 가장 가까운 제1 피사체로 결정하고,
상기 유사 이미지의 중앙부에 위치한 제2 피사체는, 상기 유사 이미지의 중앙점과 상기 적어도 하나의 제2 피사체의 중앙점의 거리가 가장 가까운 제2 피사체로 결정하는,
방법.
According to clause 5,
The first subject located in the center of the reference image is determined to be the first subject whose distance between the center point of the reference image and the center point of the at least one first subject is closest,
The second subject located in the center of the similar image is determined as the second subject in which the distance between the center point of the similar image and the center point of the at least one second subject is closest,
method.
제4항에 있어서,
상기 유사도는 각각의 상기 적어도 하나의 제1 피사체와 상기 적어도 하나의 제2 피사체 중 상기 제1 카테고리와 상기 제2 카테고리가 동일한 제1 피사체와 제2 피사체를 비교하여 피사체 유사도를 계산하고, 상기 피사체 유사도에 가중치를 부여하여 결정하는,
방법.
According to clause 4,
The similarity is calculated by comparing a first subject and a second subject among the at least one first subject and the at least one second subject whose first and second categories are the same, and wherein the subject Determined by weighting the similarity,
method.
제2항에 있어서,
상기 전체 유사도를 계산하는 단계는,
상기 기준 이미지의 중심부와 상기 적어도 하나의 이미지의 중심부의 제1 유사도를 계산하고, 상기 기준 이미지의 주변부와 상기 적어도 하나의 이미지의 주변부의 제2 유사도를 계산하여, 상기 제1 유사도와 상기 제2 유사도에 각각의 가중치를 부여하여 상기 전체 유사도를 계산하는,
방법.
According to paragraph 2,
The step of calculating the overall similarity is,
Calculate a first similarity between the center of the reference image and the center of the at least one image, calculate a second similarity between the periphery of the reference image and the periphery of the at least one image, and calculate the first similarity and the second similarity. Calculating the overall similarity by assigning weights to each similarity,
method.
제2항에 있어서,
상기 전체 유사도를 계산하는 단계는,
상기 기준 이미지에 포함된 상기 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 상기 적어도 하나의 제2 피사체 각각을 비교하여 유사도를 계산하고, 그 중 가장 가까운 유사도를 제1 유사도로 선택하고,
상기 기준 이미지의 중앙부에 위치한 제1 피사체와 상기 유사 이미지의 중앙부에 위치한 제2 피사체를 비교하여 제2 유사도를 계산하여,
상기 제1 유사도와 상기 제2 유사도에 소정의 가중치를 부여하여 상기 전체 유사도를 계산하는,
방법.
According to paragraph 2,
The step of calculating the overall similarity is,
Calculating similarity by comparing each of the at least one first subject included in the reference image and the at least one second subject included in the similar image, and selecting the closest similarity among them as the first similarity,
Calculating a second similarity by comparing a first subject located in the center of the reference image and a second subject located in the center of the similar image,
Calculating the total similarity by assigning a predetermined weight to the first similarity and the second similarity,
method.
제1항에 있어서,
상기 중복 이미지에 대한 정보를 제공하는 단계에서,
상기 유사도를 기준으로 정렬하여 상기 중복 이미지에 대한 정보를 제공하는,
방법.
According to paragraph 1,
In the step of providing information about the duplicate image,
Sorting based on the similarity to provide information about the duplicate images,
method.
제1항 내지 제10항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 비일시성의 컴퓨터 판독 가능 기록 매체.A non-transitory computer-readable recording medium recording a computer program for executing the method according to claims 1 to 10. 동일 피사체를 포함하는 중복 이미지 검출 시스템으로서,
적어도 하나의 제1 피사체를 포함하는 기준 이미지를 수신하는 기준 이미지 수신부,
상기 기준 이미지와 유사한 적어도 하나의 유사 이미지를 결정하는 유사 이미지 결정부,
상기 기준 이미지에 포함된 적어도 하나의 제1 피사체와 상기 유사 이미지에 포함된 적어도 하나의 제2 피사체의 유사도를 계산하고, 상기 유사도가 소정의 제1 기준을 만족하는 경우 상기 유사 이미지를 상기 기준 이미지의 중복 이미지로 결정하는 중복 이미지 결정부 및
상기 중복 이미지에 대한 정보를 제공하는 중복 이미지 정보 제공부를 포함하는,
시스템.
A duplicate image detection system including the same subject, comprising:
a reference image receiving unit that receives a reference image including at least one first subject;
a similar image determination unit that determines at least one similar image similar to the reference image;
Calculate the similarity between at least one first subject included in the reference image and at least one second subject included in the similar image, and when the similarity satisfies a predetermined first standard, the similar image is converted to the reference image. A duplicate image determination unit that determines a duplicate image of
Comprising a duplicate image information provider that provides information about the duplicate image,
system.
KR1020220062261A 2022-05-20 2022-05-20 Method, system and non-transitory computer-readable recording medium for detecting near-duplicate images KR20230162409A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220062261A KR20230162409A (en) 2022-05-20 2022-05-20 Method, system and non-transitory computer-readable recording medium for detecting near-duplicate images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220062261A KR20230162409A (en) 2022-05-20 2022-05-20 Method, system and non-transitory computer-readable recording medium for detecting near-duplicate images

Publications (1)

Publication Number Publication Date
KR20230162409A true KR20230162409A (en) 2023-11-28

Family

ID=88957523

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220062261A KR20230162409A (en) 2022-05-20 2022-05-20 Method, system and non-transitory computer-readable recording medium for detecting near-duplicate images

Country Status (1)

Country Link
KR (1) KR20230162409A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102260631B1 (en) 2015-01-07 2021-06-07 한화테크윈 주식회사 Duplication Image File Searching Method and Apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102260631B1 (en) 2015-01-07 2021-06-07 한화테크윈 주식회사 Duplication Image File Searching Method and Apparatus

Similar Documents

Publication Publication Date Title
US20210224877A1 (en) Intelligent online personal assistant with image text localization
US20220050870A1 (en) Intelligent online personal assistant with offline visual search database
JP2021108188A (en) Visual search based on image analysis and prediction
KR102206589B1 (en) Detecting abnormalities in web document modification
US20170293695A1 (en) Optimizing similar item recommendations in a semi-structured environment
KR20180100159A (en) Techniques for detecting spam posts
EP3028184A1 (en) Method and system for searching images
US11037071B1 (en) Cross-category item associations using machine learning
CN112154452B (en) Countermeasure learning for fine granularity image search
KR102177823B1 (en) Method, system and non-transitory computer-readable recording medium for augmenting product information
KR102437103B1 (en) Livestock product distribution system and method based on neural network and livestock product distribution metaverse platform
WO2019213418A1 (en) Systems and methods for transactions at a shopping cart
CN111868709A (en) Automatic batch sorting
KR102057321B1 (en) Method, system and non-transitory computer-readable recording medium for augmenting product information
KR20230162409A (en) Method, system and non-transitory computer-readable recording medium for detecting near-duplicate images
KR102677865B1 (en) Method, system and non-transitory computer-readable recording medium for searching similar products using a multi task learning model
KR102299393B1 (en) Server for matching product with buyer and matching system having the same
US11715119B2 (en) Geographic recommendation platform
KR20190061317A (en) Method of providing stock information
KR20180069276A (en) Method and Apparatus For Processing Purchase Request Using The Wire-Wireless Communication Network
KR102286661B1 (en) Chat based on-demand shopping curation apparatus
US20240037140A1 (en) Method, system and non-transitory computer-readable recording medium for searching similar products using a multi task learning model
KR20230162410A (en) Method, system and non-transitory computer-readable recording medium for providing style recommendation service
US20230260006A1 (en) System and method for searching image of goods
KR102583308B1 (en) Service providing apparatus and method for fashion analysis using short-form contents