KR20080018631A - Region weighting mehtod based on spatial location informaiton for relevance feedback in image search engine - Google Patents

Region weighting mehtod based on spatial location informaiton for relevance feedback in image search engine Download PDF

Info

Publication number
KR20080018631A
KR20080018631A KR1020060081047A KR20060081047A KR20080018631A KR 20080018631 A KR20080018631 A KR 20080018631A KR 1020060081047 A KR1020060081047 A KR 1020060081047A KR 20060081047 A KR20060081047 A KR 20060081047A KR 20080018631 A KR20080018631 A KR 20080018631A
Authority
KR
South Korea
Prior art keywords
image
region
query
feedback
images
Prior art date
Application number
KR1020060081047A
Other languages
Korean (ko)
Other versions
KR100824698B1 (en
Inventor
김덕환
이주홍
송재원
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020060081047A priority Critical patent/KR100824698B1/en
Publication of KR20080018631A publication Critical patent/KR20080018631A/en
Application granted granted Critical
Publication of KR100824698B1 publication Critical patent/KR100824698B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0007Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A space location information-based region weighting method for relevance feedback of an image searching unit is provided to be applied as a core technology for searching images of various fields to thus accurately reflect a user intention and obtain good searching performance. Every image is divided into multiple images by using an image dividing method(step1). A weight value is calculated by extracting a characteristic vector of a size of a region, a location of a region, a distribution of a region, compactness and convexity for weight value information from the divided regions(step2). A region-based image searching process based on a relevance feedback is repeatedly performed by applying the weight value information until the user intention is reflected(step3).

Description

이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법{Region Weighting Mehtod Based on Spatial Location Informaiton for Relevance Feedback in Image Search Engine}Region Weighting Mehtod Based on Spatial Location Informaiton for Relevance Feedback in Image Search Engine}

도 1은 본 발명에 따른 공간 위치 가중치 기법을 적용하여 적합성 피드백에 기반한 영역 기반 이미지 검색 시스템의 이미지 검색 과정을 도시한 흐름도.1 is a flowchart illustrating an image retrieval process of an area-based image retrieval system based on suitability feedback by applying a spatial position weighting technique according to the present invention.

도 2는 본 발명에 따른 동적인 영역 클러스터링을 사용하는 적합성 피드백 기반 영역 기반 이미지 검색 과정을 도시한 흐름도.FIG. 2 is a flow diagram illustrating a region based image retrieval process based on conformance feedback using dynamic region clustering in accordance with the present invention. FIG.

도 3은 크기 백분율 가중치 기법, 영역 빈도수 가중치 기법, 공간 위치 가중치 기법에 따른 동물 이미지의 4개의 영역에 대한 예를 도시한 도.3 illustrates an example of four regions of an animal image according to a size percentage weighting technique, an area frequency weighting technique, and a spatial position weighting technique.

도 4는 반복 단계에 따른 공간 위치 가중치 기법과 크기 백분율 가중치 기법 및 영역 빈도수 가중치 기법의 평균 재현율을 나타내는 그래프.4 is a graph showing an average reproducibility of a spatial position weighting technique, a size percentage weighting technique, and an area frequency weighting technique according to an iterative step.

도 5는 반복 단계에 따른 공간 위치 가중치 기법과 크기 백분율 가중치 기법 및 영역 빈도수 가중치 기법의 검색 시간을 나타내는 그래프.5 is a graph illustrating a search time of a spatial position weighting technique, a size percentage weighting technique, and an area frequency weighting technique according to an iterative step.

본 발명은 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법에 관한 것으로, 더욱 상세하게는 영역의 크기에 따라 영역 가중치를 부여하지 않고 영역의 위치에 따라 가중치를 부여함으로써 사용자의 의도를 정확히 반영할 수 있으며, 용어 빈도수 및 역 문헌 빈도수를 사용하는 문서 가중치 기법을 동적인 클러스터링을 이용한 적합성 피드백(Relevance Feedback) 기반한 영역 기반 이미지 검색 시스템에 적용함으로써 영역의 공간적 위치로 이미지의 중심에 나타나는 전경 객체(全景 客體)에 더 높은 가중치를 부여하고, 의학 사진과 범죄 예방 및 날씨 예측, 그리고 전자 상거래와 웹 이미지 분류 등의 다양한 분야의 이미지 검색에 핵심 기술로 적용되어 사용자의 의도를 정확하게 반영하며, 우수한 검색 성능을 가지는 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법에 관한 것이다.The present invention relates to an area weighting method based on spatial position information for suitability feedback of an image searcher. More specifically, the user's intention is precisely assigned by weighting the area according to the location of the area without weighting the area according to the size of the area. Foreground objects appearing in the center of the image at spatial locations of regions by applying document weighting techniques using term frequency and inverse bibliographic frequency to region-based image retrieval systems based on relevance feedback using dynamic clustering It gives a higher weight to the whole landscape, and is applied as a core technology in various fields such as medical photography, crime prevention and weather forecasting, and image search in various fields such as e-commerce and web image classification, accurately reflecting user's intention, Image search with search performance The present invention relates to a spatial location information-based region weighting method for fitness feedback.

일반적으로, 이미지 검색은 저수준(색상, 질감, 모양)의 내용 속성을 사용하여 대용량 이미지 데이터 베이스로부터 사용자의 질의 이미지 및 가장 유사한 이미지를 검색하는 내용 기반 이미지 검색(Content Based Image Retrieval)이 가장 활동적인 분야 중 하나로 대두되면서, 컴퓨터 처리 속도의 발달과 인터넷의 확산으로 수십만 화소의 디지털 이미지 사용이 용이해지고, 이미지의 효율적인 내용 기반 질의 및 이미지 검색에 대한 수요가 증가하고 있다.In general, image retrieval is most active with Content Based Image Retrieval, which uses low-level (color, texture, and shape) content attributes to retrieve the user's query image and the most similar images from a large image database. As one of the fields, the development of computer processing speed and the spread of the Internet has made it easy to use digital images of hundreds of thousands of pixels, and the demand for efficient content-based query and image retrieval of images is increasing.

그리고, 내용 기반 이미지 검색(Content Based Image Retrieval)은 질의 이 미지에 대한 저수준의 특징이 고수준의 사용자 개념을 표현하지 못하기 때문에, 검색 시스템의 성능이 낮았기 때문에, 이러한 문제점을 개선하기 위하여 다음 두 가지 기술이 적용된다.In addition, since content-based image retrieval has low performance in the search system because low-level features of query images do not represent high-level user concepts, the following two problems are solved. Several techniques apply.

1) 사용자의 의도를 파악하기 위한 적합성 피드백(Relevance Feedback).1) Relevance Feedback to identify the user's intent.

2) 이미지 내용에 대한 사용자의 인식 상태를 분할된 영역의 특징으로 표현하기 위한 영역 기반 이미지 검색(Region-Based Image Retrieval).2) Region-Based Image Retrieval to express the user's perception of the image content as a feature of the segmented area.

여기서, 적합성 피드백(Relevance Feedback)은 내용 기반 이미지 검색(Content Based Image Retrieval)의 저수준의 특징과 사용자의 고수준 개념 사이의 격차를 줄이기 위한 온라인 학습 기법으로써 각 라운드에서 사용자는 이전 라운드에서 검색된 이미지 집합 내에서 적합한 이미지들을 선택함으로 결과를 평가하며, 이때, 시스템은 현재의 질의를 보정하기 위하여 피드백을 사용하여 다음 라운드의 검색 결과를 개선한다.Here, Relevance Feedback is an online learning technique that bridges the gap between the low level features of Content Based Image Retrieval and the high level concepts of the user. Evaluate the results by selecting the appropriate images at, where the system improves the results of the next round of search using feedback to calibrate the current query.

또한, 적합성 피드백(Relevance Feedback)의 초기 연구들은 단일점 이동과 다중점 이동 기법을 사용하였는데, 마스(MARS)[ Y. Rui, T. Huang, S. Mehrotra, “Content-based image retrieval with relevance feedback in MARS”, Proceedings of IEEE International Conference on Image Processing '97, Santa Barbara, CA, October 1997.] 및 마인드 리더(MindReader)[Y. Ishikawa, R. Subramanya, C. Faloutsos, “MindReader. Querying databases through multiple examples”, Proceedings of the 24th VLDB Conference, 218-227, New York, USA, 1998.]와 같은 단일점 이동 기법들은 각 특징 공간 내에 하나의 점으로 질의를 표 현하고, 사용자로부터 적합성을 판단받은 점들의 방향으로 질의점을 이동한다. In addition, early studies of relevance feedback used single-point and multi-point movement techniques, which are described in the context of MARS [Y. Rui, T. Huang, S. Mehrotra, “Content-based image retrieval with relevance feedback. in MARS ”, Proceedings of IEEE International Conference on Image Processing '97, Santa Barbara, CA, October 1997.] and MindReader [Y. Ishikawa, R. Subramanya, C. Faloutsos, “MindReader. Single point movement techniques such as "Querying databases through multiple examples", Proceedings of the 24th VLDB Conference, 218-227, New York, USA, 1998.] Move the query point in the direction of the determined points.

그리고, 질의점을 이동하면서, 질의 확장(Query expansion) [K. Porkaew, K. Chakrabarti, “Query Re_nement for Multimedia Similarity Retrieval in MARS”, Proceedings of the 7th ACM Multimedia Conference, 235-238, Orlando, Florida, 1999.], Qcluster [ D.-H. Kim, C. W. Chung, K. Barnard, “Relevance feedback using adaptive clustering for image similarity retrieval”, Journal of Systems and Software, 78(1), 9-23, 2005.]과 같은 다중점 이동 기법들은 사용자의 피드백에 따라 적합성을 판단 받은 점들을 클러스터(Cluster)로 그룹화하고 클러스터(Cluster)의 대표들을 새로운 질의로 이용한다.Then, while moving the query point, query expansion [K. Porkaew, K. Chakrabarti, “Query Re_nement for Multimedia Similarity Retrieval in MARS”, Proceedings of the 7th ACM Multimedia Conference, 235-238, Orlando, Florida, 1999.], Qcluster [D.-H. Kim, CW Chung, K. Barnard, “Relevance feedback using adaptive clustering for image similarity retrieval”, Journal of Systems and Software, 78 (1), 9-23, 2005. As a result, the points judged as suitability are grouped into clusters and the representatives of the clusters are used as new queries.

한편, 영역 기반 이미지 검색(Region-Based Image Retrieval)은 저수준의 특징들만 사용하는 내용 기반 이미지 검색(Content Based Image Retrieval) 접근 기법과는 대조적으로 이미지 분할을 적용함으로써, 객체 수준에서 이미지를 표현한다.Region-Based Image Retrieval, on the other hand, represents an image at the object level by applying image segmentation as opposed to the Content Based Image Retrieval approach, which uses only low-level features.

그리고, 영역 특징 사용의 주목적은 이미지 내용에서 사용자의 지각 포착 능력을 향상시키기 위함으로써, 이를 위하여 영역 기반 이미지 유사도 함수들이 제안되었다.[A. Natsev, R. Rastogu, K. Shim, “WALRUS. A similarity retrieval algorithm for image databases”, In Proceedings of SIGMOD '99, Philadelphia, PA, 395-406, 1999.][Y. Rubner, L.J. Guibas, C. Tomasi, “The earth mover's distance, Shimutildimensional scaling, and color-based image retrieval”, Proc. ARPA Image Underatanding Workshop, 661-668, New Orelans, LA, May 1997.]And, the main purpose of using region features is to improve the user's perceptual capturing ability in image content, for which region-based image similarity functions have been proposed. Natsev, R. Rastogu, K. Shim, “WALRUS. A similarity retrieval algorithm for image databases ”, In Proceedings of SIGMOD '99, Philadelphia, PA, 395-406, 1999.] [Y. Rubner, L.J. Guibas, C. Tomasi, “The earth mover's distance, Shimutildimensional scaling, and color-based image retrieval”, Proc. ARPA Image Underatanding Workshop, 661-668, New Orelans, LA, May 1997.]

이때, 유사도 정의의 주된 요소는 영역 가중치이며, 기존의 영역 기반 이미지 시스템에서 제시되었던 영역 가중치들은 영역의 크기 비율에 따라 영역 가중치를 설정하였는데, 즉 WALRUS 시스템[A. Natsev, R. Rastogu, K. Shim, “WALRUS. A similarity retrieval algorithm for image databases”, In Proceedings of SIGMOD '99, Philadelphia, PA, 395-406, 1999.]에서 두 이미지들 사이의 유사도는 두 이미지가 일치하는 영역의 크기 비율로 정의되며, 중요한 영역들은 그 크기가 크다고 가정되는 경향이 있으나, 이러한 가정과 사용자의 인식 사이에는 일관성이 없다.At this time, the main element of the similarity definition is the region weight, and the region weights presented in the existing region-based image system set the region weights according to the size ratio of the regions, that is, the WALRUS system [A. Natsev, R. Rastogu, K. Shim, “WALRUS. A similarity retrieval algorithm for image databases ”, In Proceedings of SIGMOD '99, Philadelphia, PA, 395-406, 1999.], the similarity between two images is defined as the ratio of the size of the region where the two images coincide. They tend to be large in size, but there is no consistency between this assumption and the user's perception.

다시 말하면, 배경 영역과 같은 큰 영역은 전경 객체(全景 客體)와 같은 작은 영역에 비하여 중요하게 고려되지 않지만, 사용자는 주로 이미지에서 배경 영역보다는 전경 객체(全景 客體)에 더 중요도를 부여하고 있기 때문에 이에 따른 문제점이 발생하였다.In other words, a large area, such as a background area, is not considered as important as a small area, such as a foreground object, but because the user places more importance on the foreground object than the background area in the image. This caused a problem.

본 발명은 상기한 문제점을 해결하기 위하여 안출한 것으로, 영역의 크기에 따라 영역 가중치를 부여하지 않고 영역의 위치에 따라 가중치를 부여함으로써 사용자의 의도를 정확히 반영할 수 있으며, 용어 빈도수 및 역 문헌 빈도수를 사용하는 문서 가중치 기법을 동적인 클러스터링을 이용한 적합성 피드백(Relevance Feedback) 기반한 영역 기반 이미지 검색 시스템에 적용함으로써 영역의 공간적 위치로 이미지의 중심에 나타나는 전경 객체(全景 客體)에 더 높은 가중치를 부여하 고, 의학 사진과 범죄 예방 및 날씨 예측, 그리고 전자 상거래와 웹 이미지 분류 등의 다양한 분야의 이미지 검색에 핵심 기술로 적용되어 사용자의 의도를 정확하게 반영하며, 우수한 검색 성능을 가지는 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법을 제공하는 것을 목적으로 한다.The present invention has been made to solve the above problems, it is possible to accurately reflect the user's intention by assigning the weight according to the position of the region without weighting the region according to the size of the region, the term frequency and inverse literature frequency By applying the document weighting technique to the region-based image retrieval system based on relevance feedback using dynamic clustering, we give higher weight to the foreground object appearing in the center of the image by the spatial position of the region. It is applied to image search in various fields such as medical photography, crime prevention and weather forecasting, and e-commerce and web image classification, and accurately reflects user's intentions. Spatial weighting based region weighting It is an object to provide a method.

상기한 바와 같은 목적을 달성하기 위하여 본 발명은 적합성 피드백을 이용한 영역 기반 이미지 검색에 있어서, 모든 이미지들을 이미지 분할 방법을 사용하여 다중 영역들로 분할하는 단계; 분할된 영역들로부터 가중치 정보를 위한 영역의 크기, 영역의 위치, 영역의 분산, 조밀성 그리고 볼록성의 특징 벡터를 추출하여 가중치를 계산하는 단계; 및 가중치 정보를 적용하여 사용자의 의도가 반영될 때까지 적합성 피드백에 기반한 영역 기반 이미지 검색 과정을 반복하는 단계;를 포함하여 이루어지는 것을 특징으로 한다.In order to achieve the object as described above, the present invention provides a region-based image retrieval using fitness feedback, comprising: dividing all images into multiple regions using an image segmentation method; Calculating weights by extracting the size of the area for the weight information, the location of the area, the distribution of the area, the density and the convex feature vectors from the divided areas; And repeating the region-based image retrieval process based on the suitability feedback until the user's intention is reflected by applying the weight information.

그리고, 추출된 특징 벡터를 데이터 베이스에 저장하여 초기 질의에 지구 중력 거리를 이용하여 이미지간의 거리를 측정하는 단계; 거리 함수에 따라 질의점에 밀접한 상위 k 개의 이미지로 구성된 결과 집합을 구성하는 단계; 결과 집합의 이미지 적합성을 평가하되, 이전의 적합한 이미지에 감쇄 요소를 도입하는 단계; 질의점 및 거리 함수를 보정하기 위하여, 동적인 영역 클러스터링 기법을 적용하고, 적합한 이미지 집합에서 유사한 이미지를 병합하는 영역 클러스터링을 하는 단계; 영역 클러스터링으로부터 군집의 대표값을 생성하는 단계;를 포함하여 이루어진다.And storing the extracted feature vector in a database to measure the distance between the images using the earth's gravity distance in the initial query; Constructing a result set consisting of the top k images close to the query point according to the distance function; Evaluating image suitability of the result set, but introducing attenuation elements in a previous suitable image; Applying a dynamic region clustering technique to correct the query point and distance function, and performing region clustering to merge similar images in a suitable set of images; Generating a representative value of the cluster from the region clustering.

또한, 상기 초기 질의는 예제 이미지가 다중 영역으로 분할되어 다중 질의점(q), 질의 결과 이미지의 수(k), 질의점 가중치(w), 거리 함수(d)를 포함하여 이루어진다.In addition, the initial query is made by including an example image is divided into multiple areas and includes a multiple query point (q), the number of query result image (k), the query point weight (w), the distance function (d).

한편, 적합한 이미지 집합의 영역보다 적은 수의 클러스터(Cluster)로 그룹화하기 위하여, 클러스터의 수를 결정하고, 다음 반복 단계에서 질의점의 수를 감소시키기 위한 동일 수준의 특정 클러스터를 병합하는 계층적 클러스터링(Clustering)을 적용한다.On the other hand, hierarchical clustering that determines the number of clusters and merges specific clusters of the same level to reduce the number of query points in the next iteration step, in order to group them into fewer clusters than the region of the appropriate image set. Apply Clustering.

이때, 분류된 집합의 적합한 이미지 영역으로부터 생성된 클러스터(Cluster)의 대표들은 새로운 질의점을 구성하여 가중치를 산출하되, 생성된 새로운 질의는 다음 반복 단계를 위한 입력으로서 적용된다.At this time, the representatives of the clusters generated from the appropriate image regions of the sorted set form a new query point to calculate the weight, and the generated new query is applied as an input for the next iteration step.

이하, 본 발명에 따른 실시예를 첨부된 예시도면을 참고로 하여 상세하게 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 공간 위치 가중치 기법을 적용하여 적합성 피드백에 기반한 영역 기반 이미지 검색 시스템의 이미지 검색 과정을 도시한 흐름도이다.1 is a flowchart illustrating an image retrieval process of an area-based image retrieval system based on suitability feedback by applying a spatial position weighting technique according to the present invention.

도면에서 도시하고 있는 바와 같이, 전처리 단계로서, 모든 이미지들은 이미지 분할 방법이 적용되어 다중 영역들로 분할된다(S10).As shown in the figure, as a preprocessing step, all images are divided into multiple regions by applying an image segmentation method (S10).

그리고, 상기 단계(S10)에서 분할된 영역들로부터 가중치 정보를 위한 영역의 크기 및 영역의 위치, 그리고 영역 중심으로부터 영역 픽셀(Pixel)들의 분산과 같은 특징들이 추출된다(S20).Then, features such as the size of the area for the weight information, the location of the area, and the dispersion of the area pixels from the area center are extracted from the areas divided in the step S10 (S20).

특히, 공간 위치 가중치 기법을 위하여 추출된 영역 위치는 한 이미지에 존재하는 한 객체의 상대적 위치에 대한 정보이며, 이미지 Ik의 폭과 너비에 대하여 i번째 영역 Rki 중심의 일반화된 좌표

Figure 112006061051261-PAT00001
로 정의되고, 공간 위치 가중치 기법을 위하여 추출된 영역 분산
Figure 112006061051261-PAT00002
은 x축과 y축을 따라 계산되므로, 영역 표현은 확대 및 축소에 영향을 받지 않는 특성을 갖는다.In particular, the region position extracted for the spatial position weighting technique is information about the relative position of an object in an image, and the i th region R ki for the width and width of the image I k . Generalized coordinates of the center
Figure 112006061051261-PAT00001
Domain variance extracted for spatial location weighting
Figure 112006061051261-PAT00002
Since is computed along the x- and y-axes, the region representation has the property of being unaffected by zooming in and out.

마지막으로, 상기 단계(S20)에서 각 이미지의 영역에 부여된 가중치 정보를 적용하여 사용자의 의도를 반영하는 적합성 피드백(Relevance Feedback)에 기반한 영역 기반 이미지 검색(Region-Based Image Retrieval) 과정을 반복한다(S30).Finally, in step S20, the region-based image retrieval process based on the relevance feedback reflecting the user's intention is applied by applying the weight information assigned to the region of each image. (S30).

다시 말하면, 본 발명은 배경 영역과 같은 큰 영역은 전경 객체(全景 客體)와 같은 작은 영역에 비해 중요하게 고려하지 않는 사용자의 질의 의도를 파악 및 이미지의 중요성과 영역의 크기가 비례 관계가 성립하지 않는 점을 적용하며 이루어진다.In other words, the present invention grasps the query intention of the user, which is not considered to be important compared to the small area such as the foreground object, and does not have a proportional relationship between the importance of the image and the size of the area. It is done by applying the point.

그리고, 이미지 검색시 나타나는 고수준의 사용자 개념과 저수준의 특징 사이에 의미적 격차를 줄이기 위하여 적합성 피드백(Relevance Feedback)에 기반한 영역 기반 이미지 검색(Region-Based Image Retrieval)의 공간 위치 가중치 기법을 적용하는데, 공간 위치 가중치 기법은 객체의 위치에 따라 가중치를 부여하므로, 이미지의 중요 영역은 주로 이미지의 중심에 도시된다는 가정에 기반하여 배경 영역보다 전경 객체(全景 客體)에 가중치가 크게 부여된다.In order to reduce the semantic gap between high-level user concepts and low-level features appearing in image retrieval, we apply the spatial position weighting technique of region-based image retrieval based on relevance feedback. Since the spatial position weighting technique weights according to the position of the object, the weight of the foreground object is greater than that of the background region based on the assumption that the important region of the image is mainly shown in the center of the image.

도 2는 본 발명에 따른 동적인 영역 클러스터링을 사용하는 적합성 피드백 기반 영역 기반 이미지 검색 과정을 도시한 흐름도이다. 도면에서 도시한 바와 같이, 도 1의 공간 위치 가중치 기법을 적용하여 적합성 피드백에 기반한 영역 기반 이미지 검색 시스템의 이미지 검색 과정을 도시한 흐름도를 자세히 나타낸다.2 is a flowchart illustrating a region based image retrieval process based on conformance feedback using dynamic region clustering according to the present invention. As shown in the figure, a flowchart illustrating an image retrieval process of an area-based image retrieval system based on suitability feedback by applying the spatial position weighting technique of FIG. 1 is shown in detail.

여기서, 이미지가 시스템으로 입력되거나, 질의 이미지로 전송될 때의 진행과정을 도시하고 있는데, 한 이미지가 시스템으로 입력될 때 시스템은 이미지를 다수개의 영역으로 분할하고(S10), 영역 크기와 영역 중심과 조밀성(Compactnesss)과 볼록성(Convexity)등과 같은 특징 벡터를 추출하며, 추출된 특징 벡터들은 데이터 베이스에 저장된다(S20).Here, the process of when an image is input into the system or transmitted as a query image is shown. When an image is input into the system, the system divides the image into a plurality of areas (S10), and the area size and area center. Feature vectors such as compactness and convexity are extracted, and the extracted feature vectors are stored in a database (S20).

그리고, 상기 단계(S10)에서 사용자가 전송한 하나의 예제 이미지는 초기 질의 Q=(q, d, w, k)를 생성하기 위하여 분석되는데, 예제 이미지가 다중 영역으로 분할되기때문에, q는 특징 공간에서의 다중 질의점, k는 시스템에 의하여 반환되는 질의 결과 이미지 개수, w는 질의점들의 가중치, d는 거리 함수를 의미하게 된다.In addition, one example image transmitted by the user in step S10 is analyzed to generate an initial query Q = (q, d, w, k). Multiple query points in space, k is the number of query result images returned by the system, w is the weight of the query points, d is the distance function.

또한, 지구 중력 거리(Earth Mover's Distance)는 두 이미지 사이의 거리를 측정하기 위해 사용되며(S31)[Y. Rubner, L.J. Guibas, C. Tomasi, “The earth mover's distance, Shimutildimensional scaling, and color-based image retrieval”, Proc. ARPA Image Underatanding Workshop, 661-668, New Orelans, LA, May 1997.], 질의점(q)는 거리 함수(d)를 사용하여 데이터 베이스에 저장되어 있는 이미지들과 비교되고, 거리 함수(d)에 따라서 질의점(q)에 밀접한 질의 결과 이미지 개수(k)로 구성된 결과 집합이 사용자에게 반환된다(S33).In addition, Earth Mover's Distance is used to measure the distance between two images (S31) [Y. Rubner, L.J. Guibas, C. Tomasi, “The earth mover's distance, Shimutildimensional scaling, and color-based image retrieval”, Proc. ARPA Image Underatanding Workshop, 661-668, New Orelans, LA, May 1997.], The query point (q) is compared with the images stored in the database using the distance function (d), and the distance function (d) As a result, a result set consisting of the number of query result images k close to the query point q is returned to the user (S33).

이때, 사용자는 Result(Q)의 이미지들의 적합 유무를 구분함으로써, 이미지 적합성을 평가하는데, 적합성 평가에 기반하여 적합한 이미지 집합이 구성되고(S35), 적합한 이미지로 구성된 집합은 새로 추가된 적합한 이미지 및 이전 반복 단계에서 사용된 적합한 이미지를 모두 포함하며, 새로 추가된 적합한 이미지는 사용자의 개념을 이전의 적합한 이미지의 효과를 줄이기 위하여 감쇄 요소를 도입하여 새로 추가된 적합한 이미지가 더욱 강조되도록 하여 보다 정확히 반영한다(S35a).At this time, the user evaluates the image suitability by distinguishing the suitability of the images of the result (Q), and a suitable image set is constructed based on the suitability evaluation (S35), and the set composed of the suitable images is newly added suitable image and It includes all the appropriate images used in the previous iteration, and the newly added appropriate image reflects the user's concept more accurately by introducing attenuation elements to reduce the effect of the previous suitable image so that the newly added suitable image is more emphasized. (S35a).

다음으로, 질의와 거리 함수를 보정하기 위하여 클러스터링(Clustering) 과정 및 클러스터링 병합 과정에 기반하고 있는 영역으로 구성된 동적인 영역 클러스터링 기법이 이용된다(S37a).Next, in order to correct the query and the distance function, a dynamic region clustering technique consisting of regions based on the clustering process and the clustering merging process is used (S37a).

여기서, 적합한 이미지의 이용가능성이 증가함에 따라, 질의 영역의 수가 급속도로 증가되며, 질의 및 이미지 사이의 거리 값을 계산하는데 요구되는 시간은 해당 질의 영역의 수에 비례하고, 시스템의 검색 속도를 줄이기 위하여 영역 기반 클러스터링 처리 과정은 적합한 이미지 집합에서 유사한 이미지들을 병합한다.Here, as the availability of a suitable image increases, the number of query regions is rapidly increased, and the time required to calculate the distance value between the query and the image is proportional to the number of the query regions and reduces the search speed of the system. The region-based clustering process merges similar images in a suitable image set.

그리고, 계층적 클러스터링 알고리즘은 적합한 이미지 집합에 있는 영역들을 감소시킨 수의 클러스터(Cluster) 그룹화에 적용되는데, 각각의 클러스터는 다음 질의의 새로운 영역과 일치하고, 이때 클러스터 병합 처리 과정은 클러스터의 수를 결정하고, 다음 반복 단계에서 질의점 수를 감소시키기 위하여 같은 수준에 있는 특정한 클러스터를 병합한다(S37).The hierarchical clustering algorithm is then applied to a number of cluster groupings that reduce the regions in the appropriate image set, where each cluster matches a new region of the next query, where the cluster merging process determines the number of clusters. In order to reduce the number of query points in the next iteration step, specific clusters at the same level are merged (S37).

이를 위하여, 두 개의 클러스터(Ci, Cj)들이 각각 평균 벡터

Figure 112006061051261-PAT00003
공분산(covarinace) 행렬(Si,Sj), 클러스터 안의 요소들의 개수(ni,nj)로 특징지워 질 때, 호텔링(Hotelling)의 T2함수[H. Hotelling, “Multivariate Quality Control In C”, Eisenhart, M. W. Hastay, and W.A. Wallis, eds. Techniques of Statistical Analysis. N.Y., McGraw-Hill, 1947.]는 두 개의 클러스터 위치 동등 여부를 결정하기 위하여 적용된다.For this purpose, two clusters (C i , C j ) are each mean vector
Figure 112006061051261-PAT00003
Characterized by the covarinace matrix (Si, Sj), the number of elements in the cluster (ni, nj), Hotelling's T 2 function [H. Hotelling, “Multivariate Quality Control In C”, Eisenhart, MW Hastay, and WA Wallis, eds. Techniques of Statistical Analysis. NY, McGraw-Hill, 1947.] is applied to determine whether two cluster positions are equal.

Figure 112006061051261-PAT00004
Figure 112006061051261-PAT00004

Figure 112006061051261-PAT00005
Figure 112006061051261-PAT00005

여기서, 두 개의 클러스터들이 충분히 밀접할 경우 Where the two clusters are close enough

Figure 112006061051261-PAT00006
Figure 112006061051261-PAT00006

xik는 Ci안에 있는 k번째 이미지이고,

Figure 112006061051261-PAT00007
는 p와
Figure 112006061051261-PAT00008
사이의 자유도를 가지는 F분포의 100(1-α)상위 백분율이다.x ik is the kth image in C i ,
Figure 112006061051261-PAT00007
With p
Figure 112006061051261-PAT00008
100 (1-α) upper percentage of the F distribution with degrees of freedom between.

다시 말해, 만약 T2

Figure 112006061051261-PAT00009
보다 클 경우에는 두 클러스터의 분리된 상태이고, 전역적인 이미지 표현에 기반한 내용 기반 이미지 검색(Content Based Image Retrieval) 접근 기법에서 동적인 클러스터링을 사용하는 적합성 피드백(Relevance Feedback) 사용은 [D.-H. Kim, C. W. Chung, K. Barnard, “Relevance feedback using adaptive clustering for image similarity retrieval”, Journal of Systems and Software, 78(1), 9-23, 2005.]에 기반을 두고 있다.In other words, if T 2
Figure 112006061051261-PAT00009
In larger cases, the use of Relevance Feedback with dynamic clustering in the content-based image retrieval approach based on the global image representation is described in [D.-H]. . Kim, CW Chung, K. Barnard, “Relevance feedback using adaptive clustering for image similarity retrieval”, Journal of Systems and Software, 78 (1), 9-23, 2005.

마지막으로, 분류된 집합의 적합한 이미지 영역들로부터 생성된 클러스터(Cluster)의 대표는 새로운 질의점을 구성하고, 이에 따라 대표의 가중치가 계산되며, 새로운 질의인 Q'=(q',d',w',k)가 생성되어 다음 반복을 위한 입력으로 사용되고, 이때 새로운 질의점(q'), 새로운 가중치(w'), 새롭게 조절된 가중치를 반영하기 위한 거리 함수(d')를 포함한다(S39).Finally, the representative of the cluster generated from the appropriate image regions of the sorted set constitutes a new query point, whereby the weight of the representative is calculated, and the new query Q '= (q', d ', w ', k) is generated and used as an input for the next iteration, including a new query point (q'), a new weight (w '), and a distance function (d') to reflect the newly adjusted weight ( S39).

그리고, 다수번 반복 후에 사용자가 결과에 만족하게 되면, 마지막 결과 집합과 함께 반복 단계는 종료된다.If the user is satisfied with the result after several iterations, the iteration step ends with the last result set.

도 3은 크기 백분율 가중치 기법, 영역 빈도수 가중치 기법, 공간 위치 가중치 기법에 따른 동물 이미지의 4개의 영역에 대한 예를 도시한 도이다. 도면에서 도시하고 있는 바와 같이, 공간 위치 가중치 기법은 전경 객체(全景 客體)에 가장 큰 가중치를 할당함으로써, 사용자의 관심을 반영 가능하고, 반면 배경 객체에는 작은 가중치를 할당함으로써, 사용자의 관심인 전경 객체(全景 客體)에 상대적으로 높은 가중치를 부여하도록 이루어진다.3 is a diagram illustrating an example of four regions of an animal image according to a size percentage weighting technique, an area frequency weighting technique, and a spatial position weighting technique. As shown in the figure, the spatial position weighting technique can reflect the user's interest by assigning the largest weight to the foreground object, while the foreground, which is the user's interest, by assigning the small weight to the background object. It is made to give a relatively high weight to an object.

여기서, 한 이미지에 있는 각 픽셀(Pixel)을 임의의 특징 공간에 있는 하나의 점으로서 적용하여, 선택된 색상 및 질감 특징에 따라 유사한 픽셀(Pixel)을 그룹화하는 정규화된 컷 분할 기법[J. Shi and J. Malik, “Normalized Cuts and Image Segmentation”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 22(8), 888-905, August 2000.]을 이용한다.Here, a normalized cut segmentation technique that applies each pixel in an image as a point in an arbitrary feature space, grouping similar pixels according to selected color and texture features [J. Shi and J. Malik, “Normalized Cuts and Image Segmentation”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 22 (8), 888-905, August 2000.

그리고, 각 영역은 자신의 색상 및 모양, 가중치 정보를 사용하여 표현되며, 색상 및 모양 특징을 위하여 L*a*b 색상 공간에서의 색상 표준 편차와 조밀성, 볼록성과 같은 모양이 나타내는 특징을 사용하고, 가중치 정보를 위하여 이미지 크기에 의하여 정규화된 영역의 면적인 영역 크기, 한 이미지에 있는 한 객체의 상대적인 위치에 대한 정보를 나타내는 이미지 Ik의 폭 및 너비에 대하여 i번째 영역 중심의 정규화된 좌표

Figure 112006061051261-PAT00010
인 영역 위치 그리고 x축 및 y축을 따라 계산되어 영역 표현의 확대 및 축소에 영향을 받지 않는
Figure 112006061051261-PAT00011
, 영역 중심으로부터 영역 픽셀들의 분산이 사용된다.Each area is expressed using its own color, shape, and weight information, and features such as color standard deviation, density, and convexity in the L * a * b color space are used for color and shape characteristics. The normalized coordinates of the center of the i-th region with respect to the width and width of the image Ik representing information about the area size of the region normalized by the image size for weighting information, and the relative position of an object in an image.
Figure 112006061051261-PAT00010
Area position and computed along the x- and y-axes so that they are unaffected by the expansion and contraction of the area representation.
Figure 112006061051261-PAT00011
In other words, the dispersion of the area pixels from the area center is used.

한편, 영역 가중치 기법은 적합성 피드백(Relevance Feedback) 기반 영역 기반 이미지 검색(Region-Based Image Retrieval)에서 중요한 요소로서, 한 이미지 안에서 영역의 공간적 위치를 이용하여 중요한 영역은 전경 객체(全景 客體)로서 이미지의 중심에 도시된다고 가정하였을 때, 이미지 Ik의 각 영역 Rki 에 대하여 영역 Rki의중심과 이미지 Ik 중심 사이에 가중치가 부여된 유클리디언 거리는 아래처럼 계산된다.On the other hand, the region weighting technique is an important element in region-based image retrieval based on relevance feedback, and an important region is used as a foreground object by using the spatial position of the region within an image. when a is assumed that as shown in the center, each area of the image I k R ki With respect to the center of the zone R ki Image I k The weighted Euclidean distance between centers is calculated as

Figure 112006061051261-PAT00012
Figure 112006061051261-PAT00012

여기서, 각 이미지 Ik는 영역들의 집합

Figure 112006061051261-PAT00013
으로 나타나고, 영역의 중심
Figure 112006061051261-PAT00014
은 영역 위치를 결정하며, 분산
Figure 112006061051261-PAT00015
은 영역의 모양과 방향을 나타낸다.Where each image I k is a set of regions
Figure 112006061051261-PAT00013
Appears, the center of the area
Figure 112006061051261-PAT00014
Determines the location of the region, and
Figure 112006061051261-PAT00015
Indicates the shape and direction of the area.

그리고, 이미지 Ik의 타 영역들과 비교하여 이미지 Ik의 중심에 밀접한 영역은 타 영역보다 큰 가중치를 가지며 각 영역의 가중치는 그 합이 1로 정규화되며,이미지Ik의 영역 Rki의 가중치는 하기와 같이 정의된다.And, a close area in the center of the image I k as compared with other areas of the image I k has a greater weight than the other area weight of each zone is the sum of the normalized as 1, the weight of the region R ki of images I k Is defined as follows.

Figure 112006061051261-PAT00016
Figure 112006061051261-PAT00016

이때, nk는 이미지 Ik의 영역들의 개수이다.N k is the number of regions of the image I k .

그리고, 각 반복 단계에서 이전 단계의 적합한 이미지의 효과를 감소시키기 위하여 감쇄 요소(Decay Factor) β(0≤ β ≤1)를 이용하는데, I1,..,Im의 이전 단계의 이미지와 Im + 1,…,In의 새로운 이미지로 구성된 n개의 적합한 이미지 I1,…,Ink가 존재한다고 가정하고, 감쇄 요소(Decay Factor)를 사용하여 다음과 같이 새로운 영역 가중치를 설정한다.In each iteration step, the decay factor β (0 ≦ β ≦ 1) is used to reduce the effect of the suitable image of the previous step, i 1 , .. Im and the image of the previous step of I m and I. m + 1 ,... , N suitable images consisting of new images of I n I 1 ,. Assuming that I nk exists, a new region weight is set as follows using a Decay Factor.

Figure 112006061051261-PAT00017
Figure 112006061051261-PAT00017

Figure 112006061051261-PAT00018
Figure 112006061051261-PAT00018

여기서, 클러스터(Cluster) Cl의 영역 중요도는 다음과 같이 정의 된다.Here, the region importance of the cluster C l is defined as follows.

Figure 112006061051261-PAT00019
Figure 112006061051261-PAT00019

이 식에서 v는 각 반복 단계에서 클러스터(Cluster) 개수이고, 제약조건

Figure 112006061051261-PAT00020
이 고려되어야 한다.Where v is the number of clusters in each iteration step, and the constraint
Figure 112006061051261-PAT00020
This should be considered.

본 발명에 따른 적합성 피드백 방법은 영역 클러스터링 및 클러스터 병합 과정으로 구성되는데, 이 과정을 통하여 의미적으로 관련된 클러스터를 검색하고, 사 용자가 몇몇 이미지는 적합성 피드백의 각 반복 단계에 적합하다고 판단했을 때, 일련의 점을 클러스터링(Clustering)하고 클러스터의 중심을 대표로서 선택한다.The conformance feedback method according to the present invention consists of a process of region clustering and cluster merging. Through this process, a search for semantically related clusters is performed, and when a user determines that some images are suitable for each iteration of conformance feedback, Cluster a series of points and select the center of the cluster as a representative.

그리고, 유사한 영역들은 클러스터링을 통하여 병합되고, 다중점 최적화 질의로서 복합 이미지를 형성하는데, 즉 지구 중력 거리(Earth Mover's Distance)[Y. Rubner, L.J. Guibas, C. Tomasi, “The earth mover's distance, Shimutildimensional scaling, and color-based image retrieval”, Proc. ARPA Image Underatanding Workshop, 661-668, New Orelans, LA, May 1997.]의 기호(Signature)는 클러스터(Cluster)에 대응되는 모든 영역들과 관련된 복합 이미지이며, 클러스터의 대표 및 가중치는 적합성 피드백(Relevance Feedback) 기반 영역 기반 이미지 검색(Region-Based Image Retrieval)의 다음 반복 단계에서 질의점과 지구 중력 거리(Earth Mover's Distance)거리 함수의 구성 요소로서 사용된다.Similar regions are then merged through clustering and form a composite image as a multipoint optimization query, ie Earth Mover's Distance [Y. Rubner, L.J. Guibas, C. Tomasi, “The earth mover's distance, Shimutildimensional scaling, and color-based image retrieval”, Proc. ARPA Image Underatanding Workshop, 661-668, New Orelans, LA, May 1997.] is a composite image of all regions corresponding to the cluster, and the representative and weight of the cluster is the relevance feedback. In the next iteration phase of Region-Based Image Retrieval, it is used as a component of the query point and Earth Mover's Distance function.

다음은 본 발명의 실험 예에 대하여 살펴본다.The following looks at the experimental example of the present invention.

본 발명의 영역 기반 이미지 데이터 베이스에서 k-Nearest Neighbor(k-NN) 질의를 위한 영역 가중치 기법을 평가를 위하여, 코렐(COREL) 이미지 데이터 베이스(Data Base)로부터 10,000개의 범용 이미지를 이용하여, 선택된 10개의 카테고리(일몰, 해안, 동물, 비행기, 새, 나무, 꽃, 자동차, 사람, 과일 등)로부터 40개의 임의의 초기 질의 이미지를 생성하며, 시뮬레이션을 위하여 적합성 피드백(Relevance Feedback)을 고수준 카테고리 정보에 이용하였고, 즉 초기 질의 이미지와 같은 카테고리의 이미지는 적합한 이미지로 고려되며, 질의 이미지 각각에 대 하여 초기 질의 실행 외에 추가적인 5번의 피드백 반복이 수행되고, 모든 측정값들은 40개의 질의에 대한 평균값을 나타내며, k-NN 질의가 유사도 기반 매칭을 위하여 사용되고, k는 100으로 설정된다(k=100).In order to evaluate a region weighting technique for k-Nearest Neighbor (k-NN) queries in the region-based image database of the present invention, 10,000 general images are selected from a Corel image database. Generate 40 random initial query images from 10 categories (Sunset, Coast, Animals, Airplanes, Birds, Trees, Flowers, Cars, People, Fruits, etc.) and generate Relevance Feedback for simulation. In other words, an image of the same category as the initial query image is considered to be a suitable image, and for each query image, an additional five iterations of feedback are performed in addition to the initial query execution, and all measurements are averaged over 40 queries. K-NN query is used for similarity-based matching, and k is set to 100 (k = 100).

그리고, Pentium-IV Celeron 2.4GHz CPU, 512MB(Mega Byte) 메모리 사양의 Windows 2003 운영 체제에서 구동시켰으며, 다음의 두 가지 주요 질문에 대한 답을 구하는 형태로 실험을 진행시켰다.We ran the Pentium-IV Celeron 2.4GHz CPU and 512MB (Mega Byte) memory on the Windows 2003 operating system. The experiment was conducted to answer the following two main questions.

1. 본 발명의 방법이 크기 백분율 가중치 기법 및 영역 빈도수 가중치 기법보다 얼마나 성능을 개선하는가?1. How much performance does the method of the present invention improve over size percent weighting and region frequency weighting?

2. 동적인 영역 클러스터링을 사용하는 적합성 피드백(Relevance Feedback)(Relevance Feedback)기반 영역 기반 이미지 검색(Region-Based Image Retrieval) 시스템에 대한 평균 재현율 및 검색 시간이 얼마나 개선되는가?2. How is the average recall and retrieval time improved for a region-based image retrieval system based on relevance feedback using dynamic domain clustering?

여기서, 다중점 이동 적합성 피드백(Relevance Feedback)을 이용한 공간 위치 가중치 기법과 크기 백분율 가중치 기법[A. Natsev, R. Rastogu, K. Shim, “WALRUS. A similarity retrieval algorithm for image databases”, In Proceedings of SIGMOD '99, Philadelphia, PA, 395-406, 1999.], [J. Z. Wang, J.Li and G. Wiederhold, “SIMPLIcity. Semantics-Sensitive Integrated Matching for Picture Libraries”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 23(9), 947-963, 2001] 및 영역 빈도수 가중치 기법을 각각 비교하 는데, 다중 점 이동 적합성 피드백(Relevance Feedback)을 위하여 동적인 영역 클러스터링(Clustering) 기법을 사용하였으며, 개별적인 영역 빈도수 가중치는 클러스터(Cluster)의 영역 빈도수 가중치로 교체한다.Here, the spatial position weighting technique and the size percentage weighting technique using the multipoint relevance feedback [A. Natsev, R. Rastogu, K. Shim, “WALRUS. A similarity retrieval algorithm for image databases ”, In Proceedings of SIGMOD '99, Philadelphia, PA, 395-406, 1999.], [J. Z. Wang, J. Li and G. Wiederhold, “SIMPLIcity. Semantics-Sensitive Integrated Matching for Picture Libraries ”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 23 (9), 947-963, 2001] and region frequency weighting techniques, respectively. For this purpose, dynamic domain clustering technique is used, and individual domain frequency weights are replaced with cluster frequency domain weights.

도 4는 반복 단계에 따른 공간 위치 가중치 기법과 크기 백분율 가중치 기법 및 영역 빈도수 가중치 기법의 평균 재현율을 나타내는 그래프이다. 도면에서 도시하고 있는 바와 같이, 동적인 영역 클러스터링을 사용하는 적합성 피드백(Relevance Feedback)의 영역 기반 이미지 검색 시스템에 대한 평균 재현율을 공간 위치 가중치 기법과 크기 백분율 가중치 기법과 클러스터의 영역 빈도수 가중치 기법에 대하여 각각 비교하였다.4 is a graph showing an average reproducibility of a spatial position weighting technique, a size percentage weighting technique, and an area frequency weighting technique according to an iterative step. As shown in the figure, the average reproducibility of the region-based image retrieval system of the relevance feedback using dynamic region clustering is determined by the spatial position weighting technique, the size percentage weighting technique, and the region frequency weighting technique of the cluster. Each comparison was made.

또한, 공간 위치 가중치 기법은 첫번째 반복 단계 이후에 더 좋은 성능을 보이며, 5번의 반복 단계 이후 공간 위치 가중치 기법의 평균 재현율은 크기 백분율 가중치 기법의 평균 재현율에 비하여 18% 높게 나타났으며, 영역 빈도수 가중치 기법에 비하여 11% 높게 나타났는데, 이는 공간 위치 가중치 기법이 18% 및 11%의 성능 향상을 보인다.In addition, the spatial position weighting technique shows better performance after the first iteration phase, and the average recall of the spatial position weighting technique after 18 iterations is 18% higher than the average recall of the size percentage weighting technique. It is 11% higher than the proposed method, which shows that the spatial position weighting technique improves the performance by 18% and 11%.

그리고, 5번의 반복 단계 이후에 평균 재현율은 공간 위치 가중치 기법은 39%, 크기 백분율 가중치 기법은 38%, 영역 빈도수 가중치 기법은 37%의 향상을 보이는데, 이 결과에 따르면 공간 위치 가중치 기법은 크기 백분율 가중치 기법 및 영역 빈도수 가중치 기법보다 평균 재현율이 높을 뿐 아니라, 영역 기반 이미지 검색(Region-Based Image Retrieval)으로부터 피드백된 선호도 정보를 이용하여 영역 의 중요도를 빠르게 학습하기 때문에 가장 빠른 성능 향상을 제공할 수 있다.After five iterations, the average recall was improved by 39% for the spatial position weighting technique, 38% for the size percent weighting technique, and 37% for the region frequency weighting technique. In addition to higher average reproducibility than weighting technique and region frequency weighting technique, it can provide the fastest performance improvement because it learns the importance of region quickly by using the preference information fed back from Region-Based Image Retrieval. have.

도 5는 반복 단계에 따른 공간 위치 가중치 기법과 크기 백분율 가중치 기법 및 영역 빈도수 가중치 기법의 검색 시간을 나타내는 그래프이다. 도면에서 도시하고 있는 바와 같이, 공간 위치 가중치 기법의 효율성을 증명하기 위하여 공간 위치와 관련된 동적인 영역 클러스터링(Clustering)을 사용하는 적합성 피드백(Relevance Feedback) 영역 기반 이미지 검색(Region-Based Image Retrieval)의 공간 위치 가중치 기법과 클러스터의 영역 빈도수 가중치 기법 및 크기 백분율 가중치 기법의 평균 검색 시간을 비교한다.5 is a graph illustrating a search time of a spatial position weighting technique, a size percentage weighting technique, and an area frequency weighting technique according to an iterative step. As shown in the figure, the relevance feedback of region-based image retrieval using dynamic region clustering associated with spatial position to demonstrate the effectiveness of the spatial position weighting technique. The average search time of the spatial position weighting technique, the cluster region frequency weighting technique, and the size percentage weighting technique are compared.

여기서, 5번의 반복 단계 이후에 공간 위치 가중치 기법의 평균 검색 시간은 영역 빈도수 가중치 기법의 1/10 정도이며, 이는 영역 빈도수 가중치 기법이 영역 및 각각의 반복에서 나타나는 관련된 이미지들 사이에 유사도 값을 계산하기 위한 추가 시간을 필요로 하기 때문이다.Here, after five iterations, the average search time of the spatial position weighting technique is about one tenth of the region frequency weighting technique, which calculates the similarity value between the region and the associated images that appear in each iteration. This is because it requires additional time to do so.

따라서, 공간 위치 가중치 기법은 효율성 및 효과성 면에서 크기 백분율 가중치 기법 및 영역 빈도수 가중치 기법보다 우수하다는 것을 보여준다.Therefore, spatial position weighting technique is shown to be superior to size percentage weighting technique and region frequency weighting technique in terms of efficiency and effectiveness.

다시 말하면, 동적인 클러스터링(Clustering)을 포함하는 적합성 피드백(Relevance Feedback)에 공간 위치 가중치 기법을 적용함에 있어서, 사용자의 질의 개념을 더욱 정확하게 표현하도록 최근 단계의 적합한 이미지들에 가중치를 부여하는데, 10,000개의 범용 이미지 데이터 베이스에 따른 실험 결과는 공간 위치 가중치 기법이 효율성 및 효과성 측면에서 공간 위치 가중치 기법 및 크기 백분율 가중치 기법보다 우수한 성능을 보여줌을 나타낸다.In other words, in applying the spatial position weighting technique to the relevance feedback including dynamic clustering, weighting of the most recent suitable images to more accurately represent the user's query concept, 10,000 Experimental results with two general-purpose image databases show that the spatial position weighting technique outperforms the spatial positional weighting technique and the size percentage weighting technique in terms of efficiency and effectiveness.

상술한 바와 같이, 본 발명의 바람직한 실시 예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 또는 변형하여 실시할 수 있다.As described above, although described with reference to a preferred embodiment of the present invention, those skilled in the art various modifications of the present invention without departing from the spirit and scope of the invention described in the claims below Or it may be modified.

이상에서 설명한 바와 같이 상기와 같은 구성을 갖는 본 발명은 영역의 크기에 따라 영역 가중치를 부여하지 않고 영역의 위치에 따라 가중치를 부여함으로써 사용자의 의도를 정확히 반영할 수 있으며, 용어 빈도수 및 역 문헌 빈도수를 사용하는 문서 가중치 기법을 동적인 클러스터링을 이용한 적합성 피드백(Relevance Feedback) 기반한 영역 기반 이미지 검색 시스템에 적용함으로써 영역의 공간적 위치로 이미지의 중심에 나타나는 전경 객체(全景 客體)에 더 높은 가중치를 부여하고, 의학 사진과 범죄 예방 및 날씨 예측, 그리고 전자 상거래와 웹 이미지 분류 등의 다양한 분야의 이미지 검색에 핵심 기술로 적용되어 사용자의 의도를 정확하게 반영하며, 우수한 검색 성능을 가지는 등의 효과를 거둘 수 있다.As described above, the present invention having the configuration as described above can accurately reflect the user's intention by assigning a weight according to the position of the region without giving the region weight according to the size of the region. By applying the document weighting technique to the region-based image retrieval system based on relevance feedback using dynamic clustering, we give higher weight to the foreground object appearing in the center of the image by the spatial position of the region. , Medical photography, crime prevention and weather prediction, and image search in various fields such as e-commerce and web image classification, which can accurately reflect the user's intentions and have excellent search performance. .

Claims (5)

적합성 피드백을 이용한 영역 기반 이미지 검색에 있어서,In area-based image retrieval using fitness feedback, 모든 이미지들을 이미지 분할 방법을 사용하여 다중 영역들로 분할하는 단계(S10);Dividing all images into multiple regions using an image segmentation method (S10); 분할된 영역들로부터 가중치 정보를 위한 영역의 크기, 영역의 위치, 영역의 분산, 조밀성 그리고 볼록성의 특징 벡터를 추출하여 가중치를 계산하는 단계(S20); 및Calculating a weight by extracting the size of the area for the weight information, the location of the area, the distribution of the area, the compactness, and the convex feature vector from the divided areas (S20); And 가중치 정보를 적용하여 사용자의 의도가 반영될 때까지 적합성 피드백에 기반한 영역 기반 이미지 검색 과정을 반복하는 단계(S30);Repeating the region-based image retrieval process based on the suitability feedback until the user's intention is reflected by applying the weight information (S30); 를 포함하여 이루어지는 것을 특징으로 하는 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법.Spatial location information-based region weighting method for suitability feedback of an image searcher comprising a. 제1항에 있어서,The method of claim 1, 상기 단계(S30)는 추출된 특징 벡터를 데이터 베이스에 저장하여 초기 질의에 지구 중력 거리를 이용하여 이미지간의 거리를 측정하는 단계(S31);The step S30 may include storing the extracted feature vector in a database and measuring the distance between the images using the earth's gravity distance in the initial query (S31); 거리 함수에 따라 질의점에 밀접한 상위 k 개의 이미지로 구성된 결과 집합을 구성하는 단계(S33);Constructing a result set consisting of the top k images close to the query point according to the distance function (S33); 결과 집합의 이미지 적합성을 평가하되(S35), 이전의 적합한 이미지에 감쇄 요소를 도입하는 단계(S35a);Evaluating image suitability of the result set (S35), and introducing attenuation elements into the previous suitable image (S35a); 질의점 및 거리 함수를 보정하기 위하여, 동적인 영역 클러스터링 기법을 적용하고(S37a), 적합한 이미지 집합에서 유사한 이미지를 병합하는 영역 클러스터링을 하는 단계(S37);Applying a dynamic region clustering technique (S37a) to correct the query point and distance function (S37a), and performing region clustering to merge similar images in a suitable image set (S37); 영역 클러스터링으로부터 군집의 대표값을 생성하는 단계(S39);Generating representative values of clusters from region clustering (S39); 를 포함하여 이루어지는 것을 특징으로 하는 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법.Spatial location information-based region weighting method for suitability feedback of an image searcher comprising a. 제2항에 있어서,The method of claim 2, 상기 초기 질의는 예제 이미지가 다중 영역으로 분할되어 다중 질의점(q), 질의 결과 이미지의 수(k), 질의점 가중치(w), 거리 함수(d)를 포함하여 이루어지는 것을 특징으로 하는 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법.The initial query is an image searcher characterized in that the example image is divided into multiple regions and includes multiple query points (q), the number of query result images (k), query point weights (w), and a distance function (d). Spatial Weighting Method Based on Spatial Location Information for Relevance Feedback. 제2항에 있어서,The method of claim 2, 상기 단계(S37)에서 적합한 이미지 집합의 영역보다 적은 수의 클러스터(Cluster)로 그룹화하기 위하여, 클러스터의 수를 결정하고, 다음 반복 단계에서 질의점의 수를 감소시키기 위한 동일 수준의 특정 클러스터를 병합하는 계층적 클 러스터링(Clustering)을 적용하는 것을 특징으로 하는 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법.In order to group the clusters into fewer clusters than the area of the suitable image set in step S37, the number of clusters is determined, and in the next iteration step, merge specific clusters of the same level to reduce the number of query points. Spatial location information based region weighting method for conformance feedback of an image finder, characterized by applying a hierarchical clustering. 제2항에 있어서,The method of claim 2, 상기 단계(S39)는 분류된 집합의 적합한 이미지 영역으로부터 생성된 클러스터(Cluster)의 대표들은 새로운 질의점을 구성하여 가중치를 산출하되, 생성된 새로운 질의는 다음 반복 단계를 위한 입력으로서 적용되는 것을 특징으로 하는 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반 영역 가중치 방법.In step S39, representatives of clusters generated from suitable image regions of the sorted set form a new query point to calculate weights, and the generated new query is applied as an input for the next iteration step. A spatial weighting based region weighting method for conformance feedback of an image searcher.
KR1020060081047A 2006-08-25 2006-08-25 Region Weighting Mehtod Based on Spatial Location Informaiton for Relevance Feedback in Image Search Engine KR100824698B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060081047A KR100824698B1 (en) 2006-08-25 2006-08-25 Region Weighting Mehtod Based on Spatial Location Informaiton for Relevance Feedback in Image Search Engine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060081047A KR100824698B1 (en) 2006-08-25 2006-08-25 Region Weighting Mehtod Based on Spatial Location Informaiton for Relevance Feedback in Image Search Engine

Publications (2)

Publication Number Publication Date
KR20080018631A true KR20080018631A (en) 2008-02-28
KR100824698B1 KR100824698B1 (en) 2008-04-24

Family

ID=39385632

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060081047A KR100824698B1 (en) 2006-08-25 2006-08-25 Region Weighting Mehtod Based on Spatial Location Informaiton for Relevance Feedback in Image Search Engine

Country Status (1)

Country Link
KR (1) KR100824698B1 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101270465B1 (en) * 2011-11-10 2013-06-03 한국과학기술정보연구원 Intellectual property searching service method and system using an image search
KR101427864B1 (en) * 2012-10-11 2014-09-19 한국과학기술원 Per-class key feature weighting method for image retrieval
KR20150117201A (en) * 2014-03-14 2015-10-19 시아오미 아이엔씨. Clustering method and device related to the same
US9720937B2 (en) 2008-12-22 2017-08-01 Koninklijke Philips N.V. Relevance feedback on a segment of a data object
WO2020085696A1 (en) * 2018-10-24 2020-04-30 삼성전자주식회사 Electronic device, and method for controlling same
CN115495603A (en) * 2022-09-26 2022-12-20 江苏衫数科技集团有限公司 Clothing image retrieval method and system
US11933599B2 (en) 2018-11-08 2024-03-19 Samsung Electronics Co., Ltd. Electronic device and method for controlling same

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101269560B1 (en) 2011-09-19 2013-06-04 주식회사 타이호인스트 System for searching similar weather chart and method thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990016894A (en) * 1997-08-20 1999-03-15 전주범 How to search video database
KR20050063021A (en) * 2003-12-19 2005-06-28 (주) 네오솔 Searching method of image

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9720937B2 (en) 2008-12-22 2017-08-01 Koninklijke Philips N.V. Relevance feedback on a segment of a data object
KR101270465B1 (en) * 2011-11-10 2013-06-03 한국과학기술정보연구원 Intellectual property searching service method and system using an image search
KR101427864B1 (en) * 2012-10-11 2014-09-19 한국과학기술원 Per-class key feature weighting method for image retrieval
KR20150117201A (en) * 2014-03-14 2015-10-19 시아오미 아이엔씨. Clustering method and device related to the same
RU2630373C2 (en) * 2014-03-14 2017-09-07 Сяоми Инк. Method and device for clustering
WO2020085696A1 (en) * 2018-10-24 2020-04-30 삼성전자주식회사 Electronic device, and method for controlling same
US11928797B2 (en) 2018-10-24 2024-03-12 Samsung Electronics Co., Ltd. Electronic device and method for acquiring a synthesized image
US11933599B2 (en) 2018-11-08 2024-03-19 Samsung Electronics Co., Ltd. Electronic device and method for controlling same
CN115495603A (en) * 2022-09-26 2022-12-20 江苏衫数科技集团有限公司 Clothing image retrieval method and system
CN115495603B (en) * 2022-09-26 2023-11-24 江苏衫数科技集团有限公司 Clothing image retrieval method and system

Also Published As

Publication number Publication date
KR100824698B1 (en) 2008-04-24

Similar Documents

Publication Publication Date Title
KR100824698B1 (en) Region Weighting Mehtod Based on Spatial Location Informaiton for Relevance Feedback in Image Search Engine
EP1459206B1 (en) Method and system for similarity search and clustering
Lee et al. Information embedding based on user's relevance feedback for image retrieval
US7266545B2 (en) Methods and apparatus for indexing in a database and for retrieving data from a database in accordance with queries using example sets
Willett Recent trends in hierarchic document clustering: a critical review
US20130212104A1 (en) System and method for document analysis, processing and information extraction
Ghesmoune et al. A new growing neural gas for clustering data streams
Bespalov et al. Scale-space representation of 3d models and topological matching
WO2007041565A2 (en) Similarity detection and clustering of images
Lewis et al. An integrated content and metadata based retrieval system for art
Nasraoui et al. A framework for mining evolving trends in web data streams using dynamic learning and retrospective validation
Shyu et al. Image database retrieval utilizing affinity relationships
Kondadadi et al. A modified fuzzy art for soft document clustering
Simran et al. Content based image retrieval using deep learning convolutional neural network
Wu et al. Inference and retrieval of facial images
Guo Research on sports video retrieval algorithm based on semantic feature extraction
Parker et al. Scalable fuzzy neighborhood DBSCAN
KR100830949B1 (en) Adaptive Clustering Method for Relevance Feedback in Region-Based Image Search Engine
Zhang et al. Relevance feedback in CBIR
Assent et al. Clustering multidimensional sequences in spatial and temporal databases
Kim et al. A new region filtering and region weighting approach to relevance feedback in content-based image retrieval
WO2005024661A2 (en) Improved search engine optimisation
Paglieroni et al. Matching random tree models of spatio-temporal patterns to tables or graphs
Azcarraga et al. SOM-based methodology for building large text archives
Repke et al. Visualising large document collections by jointly modeling text and network structure

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130325

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140303

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20151019

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20161006

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170418

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190319

Year of fee payment: 12