KR20110076089A - System and method for selecting representative image in eliminating image redundancy - Google Patents
System and method for selecting representative image in eliminating image redundancy Download PDFInfo
- Publication number
- KR20110076089A KR20110076089A KR1020090132704A KR20090132704A KR20110076089A KR 20110076089 A KR20110076089 A KR 20110076089A KR 1020090132704 A KR1020090132704 A KR 1020090132704A KR 20090132704 A KR20090132704 A KR 20090132704A KR 20110076089 A KR20110076089 A KR 20110076089A
- Authority
- KR
- South Korea
- Prior art keywords
- image
- search
- identical images
- images
- representative image
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Abstract
Description
본 발명은 이미지 중복 제거시의 대표 이미지 선택 방법 및 시스템에 관한 것으로 특히, 중복되는 문서를 검색 대상에 모두 노출하고, 검색 시 중복을 제거하는 이미지 중복 제거시의 대표 이미지 선택 방법 및 시스템에 관한 것이다.The present invention relates to a method and a system for selecting a representative image during image deduplication, and more particularly, to a method and a system for selecting a representative image during image deduplication for exposing all duplicated documents to a search target and removing duplicates in a search. .
사용자의 입력 키워드에 대응하여 이미지의 검색을 수행하는 이미지 검색에 있어서, 검색의 대상이 되는 이미지에 동일한 이미지가 복수개 존재할 수 있다. 이때, 이미지 검색에 있어서 동일한 이미지들이 복수개 검색되어 노출되는 것은 이미지 검색의 품질을 저하시키는 요인이 될 수 있다. In an image search in which an image is searched in response to a user's input keyword, a plurality of identical images may exist in the image to be searched. In this case, a plurality of identical images may be searched and exposed in the image search, which may be a factor to deteriorate the quality of the image search.
한편, 복수의 동일한 이미지를 중복 제거하여 대표 이미지만을 검색 결과로 노출하는 경우, 노출된 대표 이미지에 사용자가 입력한 키워드가 포함되어 있지 않으면, 사용자는 입력한 키워드와 관련되는 이미지가 검색되었음에도, 검색 결과의 정확성을 의심할 수 있다.On the other hand, when a plurality of identical images are removed to expose only the representative image as a search result, if the exposed representative image does not include the keyword input by the user, the user may search even if an image related to the entered keyword is searched. The accuracy of the results can be questioned.
따라서, 중복되는 이미지를 제거하여 대표 이미지를 노출할 때, 사용자가 입력한 키워드를 포함하는 대표 이미지를 노출하기 위한 키워드 선택 방법 및 시스 템에 관한 연구가 요구된다.Therefore, when exposing a representative image by removing a duplicate image, a study on a keyword selection method and system for exposing a representative image including a keyword input by a user is required.
본 발명은 검색 요청에 앞서 중복되는 이미지를 먼저 제거하지 않고, 검색 시에 중복되는 문서를 제거함으로써, 사용자가 입력한 키워드를 포함하는 대표이미지를 검색 결과에 노출하고, 검색 결과의 편의성을 높이는 대표 이미지 선택 방법 및 시스템을 제공한다.According to the present invention, a duplicate image including a keyword input by a user is exposed to a search result by removing a duplicate document at the time of a search without first removing the duplicate image prior to the search request, thereby increasing the convenience of the search result. Provided are an image selection method and system.
본 발명은 각 이미지를 포함하는 문서 내의 단어마다 산출된 텀 웨이트(term weights)를 할당하여 각 이미지를 스코어링하고, 스코어가 가장 높은 이미지를 대표 이미지로 결정함으로써, 사용자가 입력한 키워드가 포함되는 대표 이미지를 검색 결과에 노출할 수 있도록 하는 대표 이미지 선택 방법 및 시스템을 제공한다.The present invention scores each image by assigning term weights calculated for each word in a document including each image, and determines the image having the highest score as the representative image, thereby representing the keyword including the user input. A representative image selection method and system are provided that allow an image to be exposed to search results.
본 발명의 일실시예에 따른 이미지 중복 제거시의 대표 이미지 선택 방법은, 복수의 동일 이미지를 추출하는 단계, 상기 복수의 동일 이미지를 검색 대상에 노출시키는 단계, 상기 검색 대상에 기초하여, 입력된 키워드에 대한 이미지 검색을 수행하는 단계 및 상기 이미지 검색에 따른 검색 결과 노출시 상기 복수의 동일 이미지 중 대표 이미지를 노출하는 단계를 포함할 수 있다.According to an exemplary embodiment of the present invention, a method of selecting a representative image at the time of removing duplicate images may include extracting a plurality of identical images, exposing the plurality of identical images to a search target, based on the search target. The method may include performing an image search for a keyword and exposing a representative image of the plurality of identical images when the search result is exposed according to the image search.
본 발명의 일측면에 따르면, 상기 복수의 동일 이미지를 추출하는 단계는, 각 이미지의 시그니쳐(signature)를 비교하여 이미지 동일성을 판단하는 단계, 상호 동일한 것으로 판단된 복수의 이미지를 그룹화하여 상기 복수의 동일 이미지를 추출하는 단계를 포함할 수 있다.According to an aspect of the invention, the step of extracting the plurality of the same image, comparing the signature (signature) of each image to determine the image identity, the plurality of images determined to be the same as the plurality of groups It may include extracting the same image.
본 발명의 일측면에 따르면, 상기 각 이미지의 시그니쳐는, 상기 각 이미지의 해시값(hash value)일 수 있다.According to an aspect of the present invention, the signature of each image may be a hash value of each image.
본 발명의 일측면에 따르면, 상기 대표 이미지를 노출하는 단계는, 상기 검색 결과 내의 복수의 동일 이미지 중 대표 이미지를 선택하는 단계 및 상기 복수의 동일 이미지 중 상기 대표 이미지를 제외한 이미지를 상기 검색 결과에서 제외하고 상기 대표 이미지를 노출하는 단계를 포함할 수 있다.According to an aspect of the present disclosure, the exposing the representative image may include selecting a representative image among a plurality of identical images in the search result, and extracting an image excluding the representative image among the plurality of identical images from the search result. Excluding the representative image may be exposed.
본 발명의 일측면에 따르면, 상기 복수의 동일 이미지를 포함하는 각 문서 내의 하나 이상의 단어에 대하여 텀 웨이트(term weights)를 계산하는 단계 및 상기 텀 웨이트를 이용하여 상기 복수의 동일 이미지를 각각 스코어링하는 단계를 더 포함하고, 상기 대표 이미지를 노출하는 단계는, 상기 복수의 동일 이미지 중 스코어가 가장 높은 이미지를 상기 대표 이미지로 선택할 수 있다.According to an aspect of the present invention, calculating term weights for one or more words in each document including the plurality of identical images and scoring the plurality of identical images using the term weights, respectively. The method may further include: exposing the representative image, and may select an image having the highest score among the plurality of identical images as the representative image.
본 발명의 일측면에 따르면, 상기 복수의 동일 이미지를 스코어링하는 단계는, 상기 하나 이상의 단어에 상기 결정된 텀 웨이트를 부여하고, 각 단어에 부여된 상기 텀 웨이트를 각 이미지별로 합산하여 상기 복수의 동일 이미지를 스코어링 할 수 있다.According to an aspect of the present invention, the scoring of the plurality of identical images may include assigning the determined term weight to the one or more words and adding the term weights assigned to each word for each image to add the plurality of identical images. Score an image.
본 발명의 일실시예에 따른 이미지 중복 제거시의 대표 이미지 선택 시스템은, 복수의 동일 이미지를 추출하는 중복 이미지 추출부, 상기 복수의 동일 이미지를 검색 대상에 노출시키는 검색 대상 관리부, 상기 검색 대상에 기초하여, 입력된 키워드에 대한 이미지 검색을 수행하는 검색 수행부 및 상기 이미지 검색에 따른 검색 결과 노출시 상기 복수의 동일 이미지 중 대표 이미지를 노출하는 검색 결과 제공부를 포함할 수 있다.Representative image selection system at the time of image deduplication according to an embodiment of the present invention, duplicate image extraction unit for extracting a plurality of the same image, a search target management unit for exposing the plurality of the same image to the search target, the search target The search result may include a search performing unit that performs an image search on the input keyword and a search result providing unit which exposes a representative image of the plurality of identical images when the search result is exposed according to the image search.
본 발명의 일측면에 따르면, 상기 검색 결과 제공부는, 상기 검색 결과 내의 복수의 동일 이미지 중 대표 이미지를 선택하는 대표 이미지 선택부 및 상기 복수의 동일 이미지 중 상기 대표 이미지를 제외한 이미지를 상기 검색 결과에서 제외하고 상기 대표 이미지를 노출하는 이미지 노출부를 포함할 수 있다.According to an aspect of the invention, the search result providing unit, the representative image selection unit for selecting a representative image of the plurality of the same image in the search results and the image other than the representative image of the plurality of the same image from the search results Excluding it may include an image exposure unit for exposing the representative image.
본 발명의 일측면에 따르면, 상기 복수의 동일 이미지를 포함하는 각 문서 내의 하나 이상의 단어에 대하여 텀 웨이트(term weights)를 계산하는 텀 웨이트 계산부 및 상기 텀 웨이트를 이용하여 상기 복수의 동일 이미지를 각각 스코어링하는 이미지 스코어링부를 더 포함하고, 상기 검색 결과 제공부는, 상기 복수의 동일 이미지 중 스코어가 가장 높은 이미지를 상기 대표 이미지로 선택할 수 있다.According to an aspect of the present invention, a term weight calculation unit configured to calculate term weights for one or more words in each document including the plurality of identical images, and the plurality of same images using the term weights. The apparatus may further include an image scoring unit that scores each, and the search result providing unit may select an image having the highest score among the plurality of identical images as the representative image.
본 발명의 일실시예에 따르면, 검색 요청에 앞서 중복되는 이미지를 먼저 제거하지 않고, 검색 시에 중복되는 문서를 제거함으로써, 사용자가 입력한 키워드를 포함하는 대표이미지를 검색 결과에 노출하고, 검색 결과의 편의성을 높이는 대표 이미지 선택 방법 및 시스템이 제공된다.According to an embodiment of the present invention, by removing a duplicate document at the time of a search without first removing the duplicate image prior to the search request, the representative image including the keyword input by the user is exposed to the search result, and the search is performed. A representative image selection method and system are provided that enhance the convenience of the results.
본 발명의 일실시예에 따르면, 각 이미지를 포함하는 문서 내의 단어마다 산출된 텀 웨이트를 할당하여 각 이미지를 스코어링하고, 스코어가 가장 높은 이미지를 대표 이미지로 결정함으로써, 사용자가 입력한 키워드가 포함되는 대표 이미지를 검색 결과에 노출할 수 있도록 하는 대표 이미지 선택 방법 및 시스템이 제공 된다.According to an embodiment of the present invention, a keyword input by a user is included by assigning a term weight calculated for each word in a document including each image to score each image, and determining the image having the highest score as the representative image. Representative image selection methods and systems are provided that enable exposing representative images to search results.
이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명의 실시예들을 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.Hereinafter, with reference to the contents described in the accompanying drawings will be described in detail the embodiments of the present invention. However, the present invention is not limited to or limited by the embodiments. Like reference numerals in the drawings denote like elements.
도 1은 본 발명의 일실시예에 있어서, 이미지 중복 제거시의 대표 이미지 선택 방법을 도시한 동작흐름도이다.FIG. 1 is a flowchart illustrating a representative image selection method when an image is duplicated according to an embodiment of the present invention.
도 1을 참고하면, 단계(110)에서는 복수의 동일 이미지를 추출할 수 있다. 즉, 웹페이지 등에 포함된 이미지 검색을 위한 검색 대상 이미지는 동일한 이미지가 복수개 포함될 수 있고, 이미지 검색을 위해, 복수의 동일 이미지들을 모두 추출할 수 있다. 이미지 검색을 위한 복수의 이미지의 일예는 도 2를 참고하여 이하에서 더욱 상세하게 설명한다.Referring to FIG. 1, in
도 2는 본 발명의 일실시예에 있어서, 검색 대상 이미지의 중복을 설명하기 위한 도면이다.2 is a diagram for describing duplication of a search target image according to an exemplary embodiment of the present invention.
도 2에 도시된 일예와 같이, 검색의 대상이 되는 이미지들 중 '이효리'와 관련된 이미지들(211, 212, 213, 214, 215, 216, 217, 218, 219, 220)이 복수개 존재할 수 있다. 여기서, '이효리'와 관련된 이미지들은 동일한 이미지가 여러 웹페이지 등에 중복하여 존재할 수 있다. 도 2의 일예에서, 이미지 1(211)은 동일한 이미지들(213, 220)이 존재할 수 있고, 이미지 2(212)도 동일한 이미지(218)가 더 존재할 수 있다. 이때, 동일한 이미지를 모두 검색 결과에 노출시키는 것은 검색 의 품질을 저하시키고, 검색 결과에 대한 사용자의 편의성을 떨어뜨릴 수 있으므로, 동일한 이미지들에 대해서는 중복을 제거하고 대표 이미지만을 검색 결과에 노출하도록 할 수 있다. 그러나, 대표 이미지를 선택하여 검색 결과에 노출할 때, 어느 이미지를 대표 이미지로 선택하여 노출하느냐에 따라, 검색 결과의 품질이 달라질 수 있다. 예를 들어, 이미지 5(215)의 경우, 이미지 9(219)와 동일한 이미지이므로, 두 이미지(215, 219) 중 하나의 이미지를 대표 이미지로 선택하여 노출할 수 있다. 이때, 만일 이미지 9(219)가 대표 이미지로 선택되는 경우, 이미지 9(219)는 키워드 '이효리'를 포함하고 있지 않고, 검색 결과로 이효리에 관한 이미지가 노출됨에도 사용자는 키워드에 '이효리'가 없어, 검색이 정확히 이루어지지 않은 것으로 판단할 수 있다. 따라서, 사용자로부터 검색 키워드를 입력받고, 검색시에 대표 이미지 선택 및 중복 이미지 제거를 수행함으로써, 항상 검색 키워드를 포함하는 대표 이미지를 선택하도록 할 수 있다.As shown in FIG. 2, a plurality of
한편, 복수의 동일 이미지를 추출하는 단계의 세부 과정은, 도 3을 참고하여 이하에서 더욱 상세하게 설명한다.Meanwhile, a detailed process of extracting a plurality of identical images will be described in more detail below with reference to FIG. 3.
도 3은 도 1에 도시한, 복수의 동일 이미지를 추출하는 과정의 일례를 도시한 도면이다.FIG. 3 is a diagram illustrating an example of a process of extracting a plurality of identical images shown in FIG. 1.
도 3을 참고하면, 단계(310)에서는 각 이미지의 시그니쳐(signature)를 비교하여 이미지 동일성을 판단할 수 있다. 여기서, 이미지의 시그니쳐는, 이미지에 대한 해시값(hash value)일 수 있다.Referring to FIG. 3, in
단계(320)에서는 상호 동일한 것으로 판단된 복수의 이미지를 그룹화하여 상기 복수의 동일 이미지를 추출할 수 있다. 즉, 상기 이미지 시그니쳐 비교를 통해 상호 동일한 것으로 판단된 이미지들을 각 이미지별로 그룹화할 수 있다. 따라서, 복수의 동일 이미지를 추출시 중복되는 동일한 이미지들을 하나의 그룹으로 모아둘 수 있다.In
다시 도 1을 참고하면, 단계(110)는 상기 복수의 동일 이미지를 포함하는 각 문서 내의 하나 이상의 단어에 대하여 텀 웨이트(term weights)를 계산하는 단계 및 상기 텀 웨이트를 이용하여 상기 복수의 동일 이미지를 각각 스코어링하는 단계를 더 포함할 수 있다. 즉, 복수의 동일한 이미지 그룹에 대하여 텀 웨이트를 계산하여 각 단어별로 웨이트를 결정하고, 결정된 웨이트를 각 이미지를 포함하는 문서 내의 각 단어들에 할당할 수 있다. 따라서, 각 단어에 할당된 웨이트들을 각 이미지별로 합산하면, 합산된 스코어의 크기에 따라 각 이미지들의 순위가 결정될 수 있다. 여기서, 순위화된 이미지들은 이후 대표 이미지를 선택하기 위해 사용될 수 있으며, 이는 이하에서 더욱 상세하게 설명한다.Referring back to FIG. 1,
단계(120)에서는 복수의 동일 이미지를 검색 대상에 노출시킬 수 있다. 상기 복수의 이미지들을 모두 검색 대상에 노출하여, 검색 이전에 중복을 미리 제거하지 않고, 검색시에 중복을 제거하도록 할 수 있다.In
단계(130)에서는 검색 대상에 기초하여, 입력된 키워드에 대한 이미지 검색을 수행할 수 있다. 즉, 입력된 키워드를 포함하는 이미지들을 모두 검색할 수 있으며, 그 검색 결과에는 복수의 중복된 이미지들이 포함될 수 있다.In
단계(140)에서는 이미지 검색에 따른 검색 결과 노출시 상기 복수의 동일 이미지 중 대표 이미지를 노출할 수 있다. 상기 검색의 결과를 사용자에게 노출할 때, 중복을 제거하고 대표 이미지만을 노출할 수 있으며, 이때, 대표 이미지는 사용자로부터 입력된 키워드를 포함하는 이미지일 수 있다.In
이때, 일예로, 대표 이미지를 결정하기 위해 상기에서 계산한 텀 웨이트를 사용하여 복수의 동일 이미지들을 스코어링하고, 스코어링한 각 이미지의 순위를 사용하여 대표 이미지를 결정할 수 있다. 즉, 상기 결정된 텀 웨이트에 따라 결정된 이미지들의 순위 중 가장 순위가 높은 이미지를 복수의 중복 이미지에 대한 대표 이미지로 결정할 수 있다.In this case, as an example, a plurality of identical images may be scored using the term weight calculated above to determine the representative image, and the representative image may be determined using the ranking of each scored image. That is, the highest ranking image among the ranking of the images determined according to the determined term weight may be determined as a representative image of the plurality of overlapping images.
상기에서 살펴본 바와 같이, 중복 이미지에 대한 중복 제거를 검색 이전에 수행하지 않고, 키워드 입력 후 검색을 수행할 때 중복을 제거함으로써, 대표 이미지가 상기 입력된 키워드를 항상 포함할 수 있어, 검색 결과에 대한 사용자 만족도를 향상시킬 수 있다.As described above, by eliminating duplicates when performing a search after inputting a keyword without performing deduplication of duplicate images before the search, the representative image can always include the entered keywords, Improve user satisfaction.
도 4는 본 발명의 다른 일실시예에 있어서, 이미지 중복 제거시의 대표 이미지 선택 방법을 도시한 동작흐름도이다.4 is a flowchart illustrating a representative image selection method at the time of image de-duplication according to another embodiment of the present invention.
도 4를 참고하면, 단계(410)에서는 복수의 동일 이미지를 추출할 수 있다. 즉, 웹페이지 등으로부터 이미지 검색을 수행하기 위한 복수의 동일 이미지들을 추출할 수 있다.Referring to FIG. 4, in
단계(420)에서는 복수의 동일 이미지를 포함하는 각 문서 내의 하나 이상의 단어에 대하여 텀 웨이트를 계산할 수 있고, 단계(430)에서는 텀 웨이트를 이용하여 상기 복수의 동일 이미지를 각각 스코어링할 수 있다.In
단계(440)에서는 복수의 동일 이미지를 검색 대상에 노출시킬 수 있다.In
단계(450)에서는 검색 대상에 기초하여, 입력된 키워드에 대한 이미지 검색을 수행할 수 있고, 단계(460)에서는 복수의 동일 이미지 중 스코어가 가장 높은 이미지를 상기 대표 이미지로 선택할 수 있다.In
단계(470)에서는 복수의 동일 이미지 중 상기 대표 이미지를 제외한 이미지를 상기 검색 결과에서 제외한 후, 상기 대표 이미지를 노출할 수 있다. In
여기서, 텀 웨이트를 계산하고, 상기 텀 웨이트를 이용하여 대표 이미지를 선택하는 일실시예를 도 5를 참고하여 이하에서 상세하게 설명한다.Here, an embodiment of calculating the term weight and selecting the representative image using the term weight will be described in detail with reference to FIG. 5.
도 5는 본 발명의 일실시예에 있어서, 텀 웨이트를 이용하여 대표 이미지를 선택하는 과정을 설명하기 위한 도면이다.FIG. 5 is a diagram for describing a process of selecting a representative image using a term weight according to an embodiment of the present invention.
도 5를 참고하면, '이효리'의 이미지 A에 대한 복수의 동일한 이미지(511, 512, 513)는 하나의 그룹(510)으로 그룹화될 수 있다. 이때, 복수의 동일한 이미지(511, 512, 513) 각각을 포함하는 문서들은 서로 상이한 단어들을 포함할 수 있으며, 대표 이미지를 결정하기 위해, 우선, 각 문서가 포함하는 단어들에 대한 텀 웨이트를 계산할 수 있다. 상기 결정된 텀 웨이트는 각 이미지가 포함하는 단어들에 할당될 수 있으며, 스코어가 할당된 단어들은 각 이미지별로 합산될 수 있고, 각 이미지는 상기 합산된 스코어에 따라 순위화될 수 있다. 예를 들어, 이미지 A에 대한 복수의 동일한 이미지(511, 512, 513)는 단어 '이효리', '섹시한', '전지현', 및 '이쁜'을 포함할 수 있고, 각 단어에 대해 순차적으로 3.5, 1.0, 1.0, 1.0의 웨이트가 각각 결정될 수 있다. 따라서, 상기 결정된 웨이트를 각 이미지가 포 함하는 단어에 대해 할당하여 이미지별로 스코어를 합산하고, 가장 높은 스코어를 가지는 이미지를 대표 이미지(530)로 결정할 수 있다.Referring to FIG. 5, a plurality of
상기와 같이, 중복 이미지가 포함하는 각 단어들의 웨이트를 결정하고, 상기 결정된 텀 웨이트를 통해 각 이미지를 순위화하여 대표 이미지를 결정함으로써, 항상 사용자가 입력한 키워드를 포함하는 대표 이미지를 결정할 수 있는 대표 이미지 선택 방법을 제공할 수 있다.As described above, the weight of each word included in the duplicate image is determined, and the representative image is determined by ranking the respective images through the determined weight to determine the representative image including the keyword input by the user at all times. A representative image selection method can be provided.
도 6은 본 발명의 일실시예에 있어서, 이미지 중복 제거시의 대표 이미지 선택 시스템을 도시한 블록도이다.FIG. 6 is a block diagram illustrating a representative image selection system at the time of image de-duplication according to an embodiment of the present invention.
도 6을 참고하면, 대표 이미지 선택 시스템(600)은 중복 이미지 추출부(610), 검색 대상 관리부(640), 검색 수행부(650), 및 검색 결과 제공부(660)를 포함할 수 있다.Referring to FIG. 6, the representative
중복 이미지 추출부(610)는 웹페이지 등으로부터 복수의 동일 이미지를 추출할 수 있다. 즉, 이미지 검색을 위한 검색 대상 이미지들을 제공하기 위해 웹페이지 등으로부터 복수의 동일 이미지들을 추출할 수 있다. 여기서, 중복 이미지 추출부(610)는 중복 판단부(611) 및 중복 분류부(612)를 포함할 수 있다. 중복 판단부(611)는 웹페이지 등에 존재하는 이미지들의 시그니쳐(signature)를 비교하여 이미지 동일성을 판단할 수 있고, 중복 분류부(612)는 상기 이미지 동일성 판단결과 상호 동일한 것으로 판단된 복수의 이미지를 그룹화할 수 있다. 이때, 이미지 시그니쳐는, 이미지의 해시값(hash value)을 의미할 수 있다.The
검색 대상 관리부(640)는 복수의 동일 이미지를 검색 대상에 노출시킬 수 있다. 즉, 이미지 검색시 복수의 동일 이미지에 대한 중복을 검색전에 미리 제거하지 않고, 웹페이지 등을 통해 추출된 복수의 동일 이미지들을 모두 검색 대상에 노출시킬 수 있다.The
검색 수행부(650)는 상기 검색 대상에 기초하여, 입력된 키워드에 대한 이미지 검색을 수행할 수 있다. 따라서, 이미지를 포함하는 문서 내의 단어에 상기 입력된 키워드가 포함되는 경우, 검색 수행부(650)에 의해 상기 이미지가 검색될 수 있다.The
검색 결과 제공부(660)는 이미지 검색에 따른 검색 결과 노출시 상기 복수의 동일 이미지 중 대표 이미지를 노출할 수 있다. 즉, 복수의 동일 이미지에 대한 중복을 제거하지 않은 검색 대상에 기초하여 이미지 검색을 수행하고, 대표 이미지를 선택함으로써, 상기 입력된 키워드를 포함하는 이미지를 대표 이미지로 선택하여 검색 결과에 노출시킬 수 있다.The search
여기서, 검색 결과 제공부(660)는 검색 결과 내의 복수의 동일 이미지 중 대표 이미지를 선택하는 대표 이미지 선택부(661) 및 복수의 동일 이미지 중 상기 대표 이미지를 제외한 이미지를 상기 검색 결과에서 제외하고 상기 대표 이미지를 노출하는 이미지 노출부(662)를 포함할 수 있다. 따라서, 중복되는 동일 이미지들을 제거하여, 검색 결과를 생성할 수 있으며, 대표 이미지에 항상 입력 키워드가 포함되도록 할 수 있다.Here, the search
한편, 대표 이미지 선택 시스템(600)은 텀 웨이트 계산부(620) 및 이미지 스코어링부(630)를 더 포함할 수 있다.The representative
텀 웨이트 계산부(620)는 복수의 동일 이미지를 포함하는 각 문서 내의 하나 이상의 단어에 대하여 텀 웨이트를 계산하고, 이미지 스코어링부(630)는 상기 텀 웨이트를 이용하여 상기 복수의 동일 이미지를 각각 스코어링할 수 있다. 즉, 이미지 스코어링부(630)는 하나 이상의 단어에 상기 결정된 텀 웨이트를 부여하고, 각 단어에 부여된 상기 텀 웨이트를 각 이미지별로 합산하여 상기 복수의 동일 이미지를 스코어링할 수 있다. 여기서, 스코어링된 이미지들 중 가장 스코어가 높은 이미지를 상기 복수의 동일 이미지들에 대한 대표 이미지로 선택할 수 있다.The
상기와 같이, 검색 요청에 앞서 중복되는 이미지를 선제거하지 않고, 검색 시에 중복되는 문서를 제거함으로써, 사용자가 입력한 키워드를 포함하는 대표이미지를 검색 결과에 노출하고, 검색 결과의 편의성을 향상시킬 수 있다.As described above, by removing a duplicate image prior to the search request without removing the duplicate image, the representative image including the keyword input by the user is exposed to the search result and the convenience of the search result is improved. You can.
또한, 이미지를 포함하는 문서 내의 단어마다 산출된 텀 웨이트를 할당하고, 각 이미지를 스코어링한 후, 스코어가 가장 높은 이미지를 대표 이미지로 결정함으로써, 사용자가 입력한 키워드를 포함하는 대표 이미지를 항상 선택할 수 있다.In addition, by assigning a calculated weight for each word in a document including an image, scoring each image, and determining the image having the highest score as the representative image, thereby always selecting the representative image including the keyword entered by the user. Can be.
또한 본 발명의 일실시예에 따른 이미지 중복 제거시의 대표 이미지 선택 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판 독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.In addition, the representative image selection method for image de-duplication according to an embodiment of the present invention includes a computer readable medium including program instructions for performing operations implemented by various computers. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The media may be program instructions that are specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.
이상과 같이 본 발명의 일실시예는 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명의 일실시예는 상기 설명된 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 일실시예는 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.Although one embodiment of the present invention as described above has been described by a limited embodiment and drawings, one embodiment of the present invention is not limited to the above-described embodiment, which is a general knowledge in the field of the present invention Those having a variety of modifications and variations are possible from these descriptions. Accordingly, one embodiment of the invention should be understood only by the claims set forth below, all equivalent or equivalent modifications will be within the scope of the invention idea.
도 1은 본 발명의 일실시예에 있어서, 이미지 중복 제거시의 대표 이미지 선택 방법을 도시한 동작흐름도이다.FIG. 1 is a flowchart illustrating a representative image selection method when an image is duplicated according to an embodiment of the present invention.
도 2는 본 발명의 일실시예에 있어서, 검색 대상 이미지의 중복을 설명하기 위한 도면이다.2 is a diagram for describing duplication of a search target image according to an exemplary embodiment of the present invention.
도 3은 도 1에 도시한, 복수의 동일 이미지를 추출하는 과정의 일례를 도시한 도면이다.FIG. 3 is a diagram illustrating an example of a process of extracting a plurality of identical images shown in FIG. 1.
도 4는 본 발명의 다른 일실시예에 있어서, 이미지 중복 제거시의 대표 이미지 선택 방법을 도시한 동작흐름도이다.4 is a flowchart illustrating a representative image selection method at the time of image de-duplication according to another embodiment of the present invention.
도 5는 본 발명의 일실시예에 있어서, 텀 웨이트를 이용하여 대표 이미지를 선택하는 과정을 설명하기 위한 도면이다.FIG. 5 is a diagram for describing a process of selecting a representative image using a term weight according to an embodiment of the present invention.
도 6은 본 발명의 일실시예에 있어서, 이미지 중복 제거시의 대표 이미지 선택 시스템을 도시한 블록도이다.FIG. 6 is a block diagram illustrating a representative image selection system at the time of image de-duplication according to an embodiment of the present invention.
Claims (15)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090132704A KR101108761B1 (en) | 2009-12-29 | 2009-12-29 | System and method for selecting representative image in eliminating image redundancy |
JP2010288777A JP5647509B2 (en) | 2009-12-29 | 2010-12-24 | Method and system for selecting representative image when removing duplicate images |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090132704A KR101108761B1 (en) | 2009-12-29 | 2009-12-29 | System and method for selecting representative image in eliminating image redundancy |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110076089A true KR20110076089A (en) | 2011-07-06 |
KR101108761B1 KR101108761B1 (en) | 2012-02-24 |
Family
ID=44349806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090132704A KR101108761B1 (en) | 2009-12-29 | 2009-12-29 | System and method for selecting representative image in eliminating image redundancy |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5647509B2 (en) |
KR (1) | KR101108761B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021246549A1 (en) * | 2020-06-04 | 2021-12-09 | 엘지전자 주식회사 | Image display device and operation method thereof |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10013426B2 (en) | 2012-06-14 | 2018-07-03 | International Business Machines Corporation | Deduplicating similar image objects in a document |
US8837867B2 (en) * | 2012-12-07 | 2014-09-16 | Realnetworks, Inc. | Method and system to detect and select best photographs |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000305933A (en) * | 1999-04-26 | 2000-11-02 | Canon Inc | Information retrieving device, information retrieving method and storage medium |
JP2003203090A (en) * | 2002-01-07 | 2003-07-18 | Ricoh Co Ltd | Image space displaying method |
JP2004102792A (en) * | 2002-09-11 | 2004-04-02 | Canon Inc | Image retrieval device and image retrieval method, program, and medium |
JP2005182179A (en) * | 2003-12-16 | 2005-07-07 | Hitachi Medical Corp | Image search system and program |
JP2006221446A (en) * | 2005-02-10 | 2006-08-24 | Mitsubishi Electric Corp | Image search device |
KR100706389B1 (en) * | 2005-07-15 | 2007-04-10 | (주)첫눈 | Image search method and apparatus considering a similarity among the images |
KR100785928B1 (en) | 2006-07-04 | 2007-12-17 | 삼성전자주식회사 | Method and system for searching photograph using multimodal |
JP2008167291A (en) * | 2006-12-28 | 2008-07-17 | Canon Inc | Information processing apparatus, method and program |
JP2009295104A (en) * | 2008-06-09 | 2009-12-17 | Fujifilm Corp | Website retrieving device, image information collecting server, and website retrieving method |
-
2009
- 2009-12-29 KR KR1020090132704A patent/KR101108761B1/en active IP Right Grant
-
2010
- 2010-12-24 JP JP2010288777A patent/JP5647509B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021246549A1 (en) * | 2020-06-04 | 2021-12-09 | 엘지전자 주식회사 | Image display device and operation method thereof |
Also Published As
Publication number | Publication date |
---|---|
JP5647509B2 (en) | 2014-12-24 |
KR101108761B1 (en) | 2012-02-24 |
JP2011138512A (en) | 2011-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Entity linking with effective acronym expansion, instance selection and topic modeling | |
JP5646792B2 (en) | Word division device, word division method, and word division program | |
KR20160124742A (en) | Method for disambiguating features in unstructured text | |
RU2018122689A (en) | METHOD AND SELECTION SYSTEM FOR RANKING SEARCH RESULTS USING THE MACHINE LEARNING ALGORITHM | |
KR102059743B1 (en) | Method and system for providing biomedical passage retrieval using deep-learning based knowledge structure construction | |
CN106372231A (en) | Search method and device | |
KR101108761B1 (en) | System and method for selecting representative image in eliminating image redundancy | |
KR101626247B1 (en) | Online plagiarized document detection system using synonym dictionary | |
US8370390B1 (en) | Method and apparatus for identifying near-duplicate documents | |
JP5362807B2 (en) | Document ranking method and apparatus | |
JP2007025939A (en) | Multilingual document retrieval device, multilingual document retrieval method and program for retrieving multilingual document | |
JP5869948B2 (en) | Passage dividing method, apparatus, and program | |
KR100867081B1 (en) | Method for making document score using book search and system for executing the method | |
JP2003263441A (en) | Keyword determination database preparing method, keyword determining method, device, program and recording medium | |
JP2011191834A (en) | Method, device and program for classifying document | |
JP2015225666A (en) | Method and device for extracting full name dictionary and translation rule table | |
JP5613536B2 (en) | Method, system, and computer-readable recording medium for dynamically extracting and providing the most suitable image according to a user's request | |
JP4592629B2 (en) | Document search support method and apparatus, program, and computer-readable recording medium | |
KR101113787B1 (en) | Apparatus and method for indexing text | |
KR101629210B1 (en) | Online automatic reference citation marking support system and services | |
JP6648421B2 (en) | Information processing apparatus for processing documents, information processing method, and program | |
KR101083476B1 (en) | System and method for calculation rank of document using position information of document | |
KR102045574B1 (en) | Apparatus and method for deducting keyword of technical document | |
Soleman et al. | A Method for Plagiarism Detection over Academic Citation Networks. | |
US20200183678A1 (en) | Software classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20151223 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170116 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190102 Year of fee payment: 8 |