KR20010048785A - Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram - Google Patents

Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram Download PDF

Info

Publication number
KR20010048785A
KR20010048785A KR1019990053588A KR19990053588A KR20010048785A KR 20010048785 A KR20010048785 A KR 20010048785A KR 1019990053588 A KR1019990053588 A KR 1019990053588A KR 19990053588 A KR19990053588 A KR 19990053588A KR 20010048785 A KR20010048785 A KR 20010048785A
Authority
KR
South Korea
Prior art keywords
color
series
histogram
multimedia
color histogram
Prior art date
Application number
KR1019990053588A
Other languages
Korean (ko)
Other versions
KR100350793B1 (en
Inventor
이진수
Original Assignee
구자홍
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자 주식회사 filed Critical 구자홍
Priority to KR1019990053588A priority Critical patent/KR100350793B1/en
Priority to US09/725,037 priority patent/US6708167B2/en
Publication of KR20010048785A publication Critical patent/KR20010048785A/en
Application granted granted Critical
Publication of KR100350793B1 publication Critical patent/KR100350793B1/en

Links

Classifications

    • G06F17/30

Landscapes

  • Image Analysis (AREA)

Abstract

PURPOSE: A method for extracting feature of a multi media object, a feature structure and a method for searching a multi media using a binary color histogram are provided to maintain a superior performance although a rapid searching time and a small feature storing space are used by using a color histogram, thereby satisfying requesting matters generated in a multi media searching. CONSTITUTION: A color histogram is created, and each bin of the created color histogram is grouped as an unmixed color system, a middle color system and a gray color system. Reference points of the unmixed color system and the gray color system are decided as lower than that of the middle color system by searching a binary-reference point for binarizing bins of the middle color system from a sample group. A multi media feature is extracted by creating a binary color histogram by binarizing each histogram bin value. When a multi media is searched, the color histogram is used by properly combining the binary color histogram according to a group by including binary color histogram information being applied different reference points according to a group into a multi media feature information structure with the existing color histogram information.

Description

2진 칼라 히스토그램을 이용한 멀티미디어 객체의 특징소 추출방법과 특징소 구조 및 멀티미디어 검색방법{Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram}Feature Extraction, Feature Structure, and Multimedia Retrieval of Multimedia Objects Using Binary Color Histograms {Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram}

본 발명은 멀티미디어(Multimedia) 객체를 검색하기 위하여 칼라 히스토그램 (Color Histogram)을 이용하는 멀티미디어 시스템에 관한 것으로서, 특히 칼라정보를 그룹(Group)별로 2진화하고, 이 그룹별 2진 칼라 히스토그램을 이용해서 멀티미디어 객체를 검색하도록 함으로써, 적은 공간과 빠른 검색 속도를 유지하면서도 높은 검색 성능을 갖는 멀티미디어 특징소(Feature) 구조와 이 특징소의 추출방법, 그리고 상기 특징소를 이용한 멀티미디어 검색 방법에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multimedia system that uses a color histogram to search for multimedia objects, and in particular, to binarize color information by group, and by using a binary color histogram for each group. By searching for an object, the present invention relates to a multimedia feature structure having a high search performance while maintaining a small space and a fast search speed, a method of extracting the feature, and a multimedia search method using the feature.

더욱 상세하게는 본 발명은 멀티미디어의 특징소로서 칼라 히스토그램의 각 빈을 N개의 그룹으로 분류하고, 각 그룹별로 칼라 히스토그램을 2진화 하기 위한 기준치를 각 그룹별 칼라계열에 적합하게 적응적으로 달리 설정하여 구성된 2진 칼라 히스토그램을 사용해서 멀티미디어를 검색할 수 있도록 한, 멀티미디어 특징소 구조와 그 구조를 이용하는 검색방법에 관한 것이다.More specifically, the present invention categorizes each bin of the color histogram into N groups as a feature of multimedia, and sets a reference value for binarizing the color histogram for each group according to the color series for each group. The present invention relates to a multimedia feature structure and a retrieval method using the structure that enable a multimedia search using a binary color histogram.

더욱 상세하게는 본 발명은 멀티미디어의 특징소로서 칼라 히스토그램의 각 빈을 순색계열과 회색계열, 그리고 중간색 계열로 분류하고, 상기 분류된 순색과 회색 및 중간색 계열마다 2진화 기준치를 다르게 설정하여 구성된 2진 칼라 히스토그램을 사용해서 멀티미디어를 검색할 수 있도록 한, 멀티미디어 특징소 구조와 그 구조를 이용하는 검색방법에 관한 것이다.More specifically, the present invention classifies each bin of the color histogram into a pure color series, a gray series, and a middle color series as a feature of multimedia, and sets the binarization reference value differently for each of the classified pure colors, gray, and middle color series. The present invention relates to a multimedia feature structure and a retrieval method using the structure that enable a multimedia search using a binary color histogram.

최근에 내용기반으로 멀티미디어를 검색하는 기술들이 대두됨에 따라 검색 성능을 좌우하는 멀티미디어 특징소에 대한 연구가 활발히 이루어지고 있다.Recently, as the technology of searching for multimedia based on the contents has emerged, researches on multimedia features that influence search performance have been actively conducted.

현재 가장 많이 사용되는 검색 엔진에서는 이미지 검색을 위해 전역적, 지역적 칼라 정보와 텍스쳐(Texture) 정보 등을 사용하고 있으며, 이 중에서 칼라 정보는 이미지 검색에 가장 중요한 영향을 주는 요소로 알려져 있다.Currently, the most popular search engines use global and local color information and texture information for image retrieval. Among them, color information is known as the most important factor in image retrieval.

따라서 보다 효과적인 칼라 특징소의 개발이 이루어지고 있으며, 보다 검색에 효과적인 칼라 공간(Color Space)을 개발하려는 시도도 이루어지고 있다.Therefore, more effective color features have been developed, and attempts have been made to develop more efficient color spaces.

그러나, 이러한 수많은 연구에도 불구하고 변함없어 공통적으로 사용되는 특징소는 칼라 히스토그램이다.However, despite these numerous studies, the most commonly used feature is the color histogram.

칼라 히스토그램은 이미지의 전체, 또는 지역에 나타나는 칼라의 분포를 표현하는 것으로서 히스토그램을 구성하는 빈(Bin)의 수는 칼라의 양자화에 좌우된다.The color histogram represents the distribution of colors appearing in the whole or region of the image, and the number of bins constituting the histogram depends on the quantization of the colors.

일반적으로 칼라 히스토그램의 각 빈의 수치는 소수(float)로 표현되는데, 검색시 유사도 측정은 이러한 칼라 히스토그램간의 거리(Distance)로 계산된다.In general, the numerical value of each bin of the color histogram is expressed as a float, and the similarity measure in the search is calculated as the distance between these color histograms.

따라서, 검색시 두 이미지 간의 거리를 계산하기 위해서는 소수의 계산이 요구되고, 각 이미지의 특징을 표현하기 위해서는 소수를 표현하기 위한 기본적인 저장 공간의 빈 수배 만큼의 공간이 필요하다.Therefore, a small number of calculations are required to calculate the distance between two images during retrieval, and a space several times as much as the empty storage space for expressing the prime number is required to express the characteristics of each image.

일반적으로 칼라 히스토그램을 이용한 거리 계산은 수학적으로 복잡한 계산에 포함되지 않으나, 수많은 이미지를 대상으로 검색을 행할 때에는 보다 빠른 검색 시간이 요구되므로 히스토그램의 거리 계산에 요구되는 시간을 줄이려는 많은 노력들이 일어나고 있다.In general, distance calculation using a color histogram is not included in mathematically complicated calculations. However, since a faster search time is required when searching a large number of images, many efforts are being made to reduce the time required to calculate the distance of a histogram. .

본 발명은 칼라 히스토그램을 사용하여 멀티미디어 검색시 발생하는 요구사항을 만족시킴으로써, 빠른 검색 시간과 적은 특징소 저장 공간을 사용하면서도 기존의 칼라 히스토그램을 사용한 검색 성능에 비해 크게 떨어지지 않는 성능을 유지할 수 있는 효과적인 멀티미디어 검색방법을 제공한다.The present invention satisfies the requirements of multimedia search using a color histogram, thereby enabling an effective method to maintain performance that does not drop significantly compared to a search performance using a conventional color histogram while using a fast search time and a small feature storage space. Provides a multimedia search method.

특히, 본 발명에서는 크게 칼라 그룹을 순색계열과 회색계열 및 중간색 계열의 3개의 계열로 나누어 각 그룹마다 다른 2진화 기준점을 택함으로써, 칼라분포를 2진 히스토그램으로 효율적으로 표현하여, 기존의 2진 칼라 히스토그램의 문제점인 매우 낮은 검색 성능을 개선하면서 동시에 2진 칼라 히스토그램의 장점인 높은 효율을 갖는 멀티미디어 검색 방법을 제공한다.In particular, in the present invention, by dividing a color group into three series of pure color series, gray series, and middle color series, and selecting a different binarization reference point for each group, the color distribution can be efficiently represented by a binary histogram, and the existing binary The present invention provides a multimedia retrieval method with high efficiency, which is an advantage of binary color histograms while improving very low retrieval performance which is a problem of color histograms.

도1은 본 발명을 설명하기 위하여, 256레벨에서의 빈값에 대한 확률 누적 분포의 예를 나타낸 도면BRIEF DESCRIPTION OF THE DRAWINGS Fig. 1 is a diagram showing an example of probability cumulative distribution of bin values at 256 levels for explaining the present invention.

도2는 본 발명을 설명하기 위하여, 128레벨에서의 빈값에 대한 확률 누적 분포의 예를 나타낸 도면FIG. 2 is a diagram showing an example of probability cumulative distribution of bin values at level 128 for explaining the present invention. FIG.

도3은 본 발명을 설명하기 위하여, 칼라 히스토그램과 2진 칼라 히스토그램의 예를 나타낸 도면3 is a diagram showing an example of a color histogram and a binary color histogram for explaining the present invention.

도4는 본 발명을 설명하기 위하여, HMMD 칼라 스페이스에서 MMD 단면을 나타낸 도면4 is a cross-sectional view of the MMD in the HMMD color space to explain the present invention.

도5는 본 발명을 설명하기 위하여, MMD단면을 18레벨로 양자화한 경우 각 빈에 할당된 칼라 계열을 나타낸 도면5 is a view showing a color sequence assigned to each bin when the MMD cross section is quantized to 18 levels for explaining the present invention.

도6은 본 발명에서, 순색, 중간색, 회색 계열의 칼라 그룹이 갖는 빈값들의 분산을 나타낸 도면FIG. 6 is a view showing variance of bin values of color groups of pure, neutral and gray in the present invention. FIG.

도7은 본 발명에서, 순색, 중간색, 회색 계열의 칼라 그룹이 갖는 빈값들의 평균을 나타낸 도면7 is a view showing the average of the bin values of the color group of the pure, middle, and gray series in the present invention

도8은 본 발명을 설명하기 위한 특징소 추출방법의 플로우차트8 is a flowchart of a feature extraction method for explaining the present invention;

본 발명은 2진 칼라 히스토그램을 사용한 멀티미디어 검색에 있어서, (a). 멀티미디어 객체의 특징소로서 칼라 히스토그램의 각 빈을 N개의 그룹으로 분류하고, (b). 상기 분류된 N개의 각 그룹별로 2진화하기 위한 기준치를 각 그룹의 특성에 맞게 적응적으로 설정하여 2진 칼라 히스토그램을 구하여 멀티미디어 검색을 수행하는 것을 특징으로 한다.The present invention relates to a multimedia search using a binary color histogram, (a). As a feature of the multimedia object, each bin of the color histogram is classified into N groups, and (b). The reference value for binarization of the classified N groups is adaptively set according to the characteristics of each group to obtain a binary color histogram and perform multimedia search.

또한 본 발명에서 상기 N개의 칼라 빈 그룹은;In addition, the N color bin group in the present invention;

(a). 순색을 표현하는 순색 계열과, (b). 회색 계통을 표현하는 회색 계열과, (c). 나머지 중간 색 계통을 표현하는 중간 계열 ; 로 구성됨을 특징으로 한다.(a). A pure color series representing pure colors, and (b). A gray series representing a gray line, and (c). A middle series representing the rest of the middle color system; Characterized in that consisting of.

또한 본 발명에서 상기 순색 계열은; (a). 일반적인 칼라공간에서, 흰색과 검은색의 포함 비율이 적은 영역을 나타내거나, (b). HSV 칼라공간에서 S와 V가 비교적 큰 영역을 나타내거나, (c). MAX(R,G,B) 과 MIN(R,G,B)의 차가 상대적으로 큰 영역을 나타내는 것을 특징으로 한다.In the present invention, the pure color series is; (a). In a typical color space, it represents areas of low coverage of white and black, or (b). S and V represent relatively large areas of the HSV color space, or (c). The difference between MAX (R, G, B) and MIN (R, G, B) represents a relatively large area.

또한 본 발명에서 상기 회색 계열은; (a). 일반적인 칼라 공간에서, 흰색과 검은색의 포함 비율이 많은 영역을 나타내거나, (b). HSV 칼라 공간에서 S와 V가 비교적 작은 영역을 나타내거나, (c). MAX(R,G,B) 과 MIN(R,G,B) 의 차가 상대적으로 적은 영역을 나타내는 것을 특징으로 한다.In the present invention, the gray series is; (a). In the general color space, represent areas with high coverage of white and black, or (b). S and V represent relatively small regions in the HSV color space, or (c). The difference between MAX (R, G, B) and MIN (R, G, B) represents a relatively small area.

또한 본 발명에서 상기 순색 계열과 회색 계열은 중간 계열보다 낮은 2진화 기준점에 의해 2진화 되는 것을 특징으로 한다.In the present invention, the pure color series and the gray series are characterized by being binarized by a lower binarization reference point than the middle series.

또한 본 발명에서 상기 2진화 기준치는 칼라 양자화 수, 즉 칼라 히스토그램 빈 수가 클수록 낮아지는 것을 특징으로 한다.Further, in the present invention, the binarization reference value is lowered as the number of color quantizations, that is, the number of color histogram bins.

또한 본 발명의 멀티미디어 검색방법은; 2진 칼라 히스토그램을 사용하여 멀티미디어 검색을 수행하기 위해, (a). 멀티미디어의 칼라 히스토그램을 생성하는 과정과, (b). 칼라 히스토그램의 각 빈들을 순색계열과 중간계열과 회색계열로 그룹핑하는 과정과, (c). 표본집단으로부터 중간계열의 빈들을 2진화하기 위한 2진화 기준점을 찾는 과정과, (d). 상기 결정된 중간계열의 2진화 기준점보다 낮게 순색 계열과 회색 계열의 기준점을 결정하는 과정과, (e). 상기 결정된 2진화 기준치에 의해 각 히스토그램 빈 값을 2진화하여 2진 칼라 히스토그램을 생성하는 과정으로 이루어진 특징소 추출 방법이다.In addition, the multimedia search method of the present invention; To perform a multimedia search using a binary color histogram, (a). Generating a color histogram of the multimedia, and (b). Grouping each bin of the color histogram into a color sequence, a middle sequence, and a gray sequence; and (c). Finding a binarization reference point for binarizing the bins of the middle series from the sample population, and (d). Determining a reference point of a pure color series and a gray series lower than the determined binarization reference point of the intermediate series, and (e). And a binarization color histogram by binarizing each histogram bin value based on the determined binarization reference value.

또한 본 발명은 상기의 특징소 추출방법에 의해서 추출된 그룹별 2진화 칼라 히스토그램 정보를 더 포함하는 멀티미디어 특징소 구조를 특징으로 한다.In addition, the present invention is characterized in that the multimedia feature structure further comprises a binarized color histogram information for each group extracted by the feature extraction method.

이하, 상기한 바와같이 이루어지는 본 발명의 멀티미디어 검색방법과 특징소의 추출 방법 및, 멀티미디어 특징소 구조에 대해서 보다 상세하게 설명하면 다음과 같다.Hereinafter, the multimedia searching method, the feature extraction method, and the multimedia feature structure of the present invention made as described above will be described in more detail.

일반적으로 한 이미지의 칼라 특징을 0에서 1사이의 칼라 확률 분포로 표현하는 칼라 히스토그램으로 표현했을 때, 각 빈의 칼라 확률 값은 매우 적은 값으로 표현된다.In general, when a color feature of an image is represented by a color histogram representing a color probability distribution between 0 and 1, the color probability value of each bin is represented by a very small value.

따라서 각 빈을 하나의 소수로 표현했을 때, 소수의 표현 가능한 영역 중에서 표현되지 않는 영역이 매우 크므로, 이러한 영역을 제외한 나머지 영역만을 적절한 양자화 과정을 거쳐, 소수의 표현 공간보다 적은 공간으로 각 빈을 표현할 수 있다.Therefore, when each bin is represented by one prime number, the unexpressed regions of the prime representable regions are very large. Therefore, only the remaining regions except for these regions are subjected to proper quantization, and each bin has a smaller space than the few representation spaces. Can be expressed.

하지만 이와 같은 방법은 특징소를 위한 저장 공간의 절약은 가능하지만 검색시 히스토그램 비교를 위해 요구되는 시간은 크게 개선되지 않는다.However, this method saves storage space for the feature, but does not significantly improve the time required for the histogram comparison in retrieval.

만일 극단적으로 소수를 이분하여 2진 히스토그램으로 표현한다면 두 히스토그램의 거리 계산은 비트(bit)의 배타적 논리합(XOR; Exclusive OR) 계산이 되므로 매우 빠른 계산이 가능하고, 또한 저장 공간도 칼라 빈 수만큼의 비트 수만으로 가능하게 된다.If the fraction of two decimals is expressed as a binary histogram, the distance calculation of the two histograms is an exclusive OR of bits, and the calculation is very fast, and the storage space is as much as the number of color bins. Only by the number of bits is possible.

이와 같이 칼라 히스토그램을 2진 히스토그램으로 표현할 수 있다면 공간과 시간적으로 큰 이점이 있다.Thus, if the color histogram can be represented as a binary histogram, there is a big advantage in space and time.

하지만 칼라 히스토그램을 2진화하는 만큼 정보의 손실도 매우 커서 검색 성능이 떨어지게 되므로 2진 히스토그램은 일반적으로 사용하지 않고 있다.However, binary histograms are not commonly used because binary data histograms are lost because information loss is so large that searching performance is poor.

본 발명은 2진 히스토그램 구성시 2진화의 기준치를 칼라 그룹별로 다르게 할당하여, 최대한의 칼라 특성을 표현하는 2진 칼라 히스토그램을 구성함으로써, 기존 칼라 히스토그램을 사용했을 때와 비교하여 크게 떨어지지 않는 성능을 유지하면서도 2진 칼라 히스토그램의 장점을 그대로 포함하고 있다.The present invention provides a binary color histogram that expresses the maximum color characteristics by assigning a binarization reference value differently for each color group when constructing a binary histogram, so that the performance does not drop significantly compared to when using a conventional color histogram. It retains the advantages of a binary color histogram while maintaining it.

표본집단으로부터 이미지 칼라 분포를 분석하면, 칼라 분포의 특성이 크게 순색 계열과, 중간색 계열, 그리고 회색 계열, 이렇게 세 가지의 칼라 그룹으로 나누어 짐을 알 수 있다.By analyzing the image color distribution from the sample population, we can see that the color distribution is divided into three color groups: pure color, neutral color, and gray color.

이 중에서 중간색 계열은 보통 이미지에서 가장 많은 영역이 차지하는 색 계열이며, 일반적인 이미지 검색시 검색 성능을 결정하는 중요한 부분이다.Among them, the middle color series is usually the color series occupied by the largest area of the image, and is an important part in determining the search performance in general image searching.

따라서 빈 값을 2진화할 때 중간색 계열을 기준으로 2진화 기준점을 찾는 것이 효율적이다.Therefore, when binarizing bin values, it is efficient to find the binarization reference point based on the intermediate color series.

순색 계열의 특성은 이미지마다 고루 나타나기 보다는 특정 이미지에 편중되는 경향이 있으므로 중간색 계열의 2진화 기준점보다 낮은 기준점을 택한다.The characteristics of the pure color series tend to be biased toward a specific image rather than appearing uniformly in each image, so select a reference point lower than the binary reference point of the intermediate color series.

회색 계열은 반대로 모든 이미지에 고루 다량으로 나타나는 성질이 있어 그 값의 차가 이미지 검색에 영향을 미치지 못하므로 역시 낮은 기준점을 택하여 적지만 예외적인 이미지를 분류하는데 이용한다.Gray series, on the other hand, has a property of appearing evenly in all images, and since the difference of the value does not affect image retrieval, it is also used to classify small but exceptional images by selecting a low reference point.

2진화 기준치의 중심이 되는 중간 계열의 2진화 기준치 값은 일반적으로 칼라 양자화 수, 즉 칼라 히스토그램의 빈 수가 증가할수록 낮아진다.The intermediate binarization threshold value, which is the center of the binarization threshold, generally decreases as the number of color quantizations, i.e., the number of bins in the color histogram, increases.

이러한 이유는 칼라 양자화 수가 클수록 전체적으로 각 빈 값이 낮아지기 때문이다.This is because the larger the number of color quantizations, the lower each bin value as a whole.

이와 같이 본 발명에서는 크게 칼라 그룹을 순색과 회색 및 중간색의 세 계열로 나누어 각 그룹마다 다른 2진화 기준점을 택함으로써 칼라분포를 2진 히스토그램으로 효율적으로 표현하여, 기존의 2진 칼라 히스토그램의 문제점인 매우 낮은 검색 성능을 개선하면서 동시에 2진 칼라 히스토그램의 장점인 높은 효율을 갖는 검색 방법을 제공하는 것이다.As such, the present invention divides a color group into three series of pure color, gray color, and intermediate color, and selects a different binarization reference point for each group to efficiently express a color distribution in a binary histogram, which is a problem of the conventional binary color histogram. It provides a highly efficient search method that improves very low search performance while at the same time an advantage of binary color histograms.

앞에서 설명한 바와같이 칼라 히스토그램은 한 이미지의 칼라 특징을 0에서 1사이의 칼라 확률 분포로 표현하는 것이다.As described above, the color histogram is a representation of the color characteristics of an image as a color probability distribution between 0 and 1.

따라서, 각 빈의 칼라 확률 값은 매우 적은 값으로 표현되는데 예를 들어 도면 1과 도면 2는 각각 256 레벨과 128 레벨로 칼라를 양자화했을 경우 각 빈마다 나타나는 빈 값의 확률 누적 분포를 나타낸다.Therefore, the color probability value of each bin is represented by a very small value. For example, FIGS. 1 and 2 show probability cumulative distributions of bin values for each bin when color is quantized at 256 and 128 levels, respectively.

도면에서 알 수 있듯이 대부분의 빈 값은 적은 확률 값을 나타내는데, 95% 이상의 빈들이 0.1 이내의 값을 갖는 것을 알 수 있다.As can be seen from the figure, most of the bins show a small probability value, and it can be seen that more than 95% of the bins have a value within 0.1.

보통의 경우 이러한 각 빈 값은 0에서 1 사이의 소수로 표현하게 되는데, 이와 같은 특성 때문에 빈값을 하나의 소수로 표현했을 때, 사실상 0.1 이상의 영역은 이미지 검색에 별로 영향을 주지 못하게 된다.Normally, each of these bins is represented as a decimal number between 0 and 1, and because of this characteristic, when a bin is represented as a prime number, an area of 0.1 or more does not affect image search very much.

따라서 이러한 빈값의 분포를 이용하면 히스토그램을 2진화하기 위한 적절한 기준 값을 결정할 수 있다.Therefore, using this distribution of bin values, we can determine the appropriate reference value for binarizing the histogram.

기준값(Th)에 의한 히스토그램의 2진화가 도면 3에 설명되어 있는데, 여기서 각 히스토그램 빈 값은 임계치(Th)를 기준으로 해서 임계치(Th)를 넘는 값은 '1'로, 임계치(Th)를 넘지않는 값은 '0'으로 맵핑(Mapping)함으로써 칼라 히스토그램을 2진화하고 있다.The binarization of the histogram by the reference value Th is illustrated in FIG. 3, where each histogram bin value is based on the threshold value Th and the value above the threshold value is '1', and the threshold value Th is represented. The nonzero value is binarized by mapping the color histogram to zero.

이와 같이 변환된 2진 히스토그램은 저장공간과 검색 시간 측면에서 기존의 칼라 히스토그램보다 매우 높은 효율을 갖게 되는데 자세히 살펴보면 다음과 같다.The converted binary histogram has higher efficiency than the conventional color histogram in terms of storage space and search time.

먼저, 저장 공간 측면에서 보면 기존의 칼라 히스토그램의 각 빈이 4바이트(bytes)의 소수로 표현되고 빈의 수가 N이라면 한 이미지를 표현하기 위한 히스토그램의 전체 저장 공간은 4N 바이트가 된다.First, in terms of storage space, if each bin of the existing color histogram is represented by a decimal number of 4 bytes and the number of bins is N, the total storage space of the histogram for representing an image becomes 4N bytes.

이에 반해 같은 빈 수의 2진 히스토그램의 저장공간은 한 빈당 한 비트만을 요구하므로 N 비트, 즉 N/8바이트가 된다. 이는 기존의 히스토그램에 비해 32배만큼의 저장공간 효율을 가져온다.In contrast, the storage of a binary histogram of the same number of bins requires only one bit per bin, resulting in N bits, or N / 8 bytes. This results in 32 times more storage efficiency than conventional histograms.

그리고, 검색시 요구되는 계산 시간 측면에서 보면 가장 흔히 사용되는 유클리디언 거리 측정(참조와 대상 이미지의 히스토그램의 차의 제곱의 합) 방법을 사용하였을 때, N번의 '-' 소수 연산과 '×' 소수 연산이 요구된다.In terms of the computation time required for the search, the most commonly used Euclidean distance measurement (sum of squares of the difference between the reference and the histogram of the target image) is used. 'Decimal operation is required.

이에 반해 2진 히스토그램은 N번의 XOR 비트 연산이 요구되므로 수치적으로 명시할 필요가 없을 정도로 빠른 효율을 보인다.On the other hand, binary histograms are fast enough that they do not need to be specified numerically since N XOR bit operations are required.

도면 4는 상기 설명한 3가지 타입의 칼라 그룹을 Hue, Min(R,G,B), Max(R,G,B), Diff (Max-Min)으로 표현된 칼라 공간(HMMD)의 Min_Max_Diff 단면을 통해 보여주고 있다.4 is a cross-sectional view of Min_Max_Diff in the color space (HMMD) expressed as Hue, Min (R, G, B), Max (R, G, B), and Diff (Max-Min). Is showing through.

도면에서 401 영역은 Diff가 특정 임계치 이상인 영역으로 순색 계열을 나타내고, 402 영역은 중간계열의 칼라 영역이고, 403 영역은 Diff가 특정 임계치 이하인 영역으로 회색 계열을 나타낸다.In the drawing, region 401 is a region where the diff is above a certain threshold, and shows a pure color sequence, region 402 is a middle region of the color region, and region 403 represents a region where the diff is below a certain threshold.

이와 같은 기준에 의거하여 도면 5에서는 Min_Max_Diff 단면을 18 레벨로 양자화 했을 때 각 빈에 할당된 칼라 계열을 보여준다.Based on these criteria, Figure 5 shows the color sequence assigned to each bin when the Min_Max_Diff cross section is quantized to 18 levels.

도면 4에서 정해진 칼라 계열 기준에 의거하여 도면 5에서 빈0는 순색 계열에 해당하고 빈1 - 빈9는 중간 계열에 해당하고 나머지는 회색 계열에 해당한다.Based on the color series criteria defined in FIG. 4, in FIG. 5, bin 0 corresponds to a pure color series, bin 1 to bin 9 correspond to a middle series, and the rest corresponds to a gray series.

도면 6은 세 계열의 칼라 그룹이 갖는 빈 값들의 분산을 보여주고 도면 7은 평균을 나타낸다.FIG. 6 shows the variance of the bin values of the three series of color groups and FIG. 7 shows the mean.

도면에서 알 수 있듯이 순색 계열의 분산과 평균 값은 모두 낮은데 이는 순색 계열의 경우 이미지에 따라 거의 나타나지 않거나 특정 이미지에만 특정 순색에 나타난다는 것을 의미한다.As can be seen from the figure, both the variance and the average value of the pure color series are low, which means that the pure color series hardly appears depending on the image or appears in a specific pure color only in a specific image.

따라서, 순색 계열의 경우 다른 계열에 비해 상대적으로 낮은 기준값을 가지고 2진화했을 때 이미지의 칼라 특성을 잘 반영할 수 있다.Therefore, the pure color series can reflect the color characteristics of the image well when binarized with a lower reference value than other series.

회색 계열은 분산과 평균값이 모두 크다.Gray series have both large variances and average values.

이것은 이미지마다 히스토그램 빈 값의 차이 크기만, 값 자체가 큰데서 오는 차이이므로 회색 계열이 대부분의 이미지 검색에 영향을 주지는 못한다는 것을 의미한다.This means that the difference between the histogram bin values for each image is only the difference in the value itself, so that the gray line does not affect most image searches.

하지만 일부 희소하게 나타나는 회색 계열에 의해 구분 가능한 이미지 그룹이 존재하므로 이러한 이미지 그룹을 구분하기 위해 낮은 기준값으로 히스토그램을 2진화하면 효과적일 수 있다.However, since there are groups of images that can be distinguished by some sparse grays, it may be effective to binarize the histogram with a low reference value to distinguish these groups of images.

도면 8은 본 발명을 실행하기 위한 멀티미디어 특징소 추출 과정을 나타낸다.8 illustrates a multimedia feature extraction process for implementing the present invention.

먼저, 일반적인 방법과 같이 칼라 히스토그램 생성하고, 생성된 칼라 히스토그램의 각 빈들을 순색계열과 중간계열과 회색계열로 그룹핑한다.First, a color histogram is generated as in the general method, and each bin of the generated color histogram is grouped into a color sequence, a middle sequence, and a gray sequence.

그리고, 표본집단으로부터 중간계열의 빈들을 2진화하기 위한 2진화 기준점을 찾아서, 결정된 중간계열의 2진화 기준점보다 낮게 순색 계열과 회색 계열의 기준점을 결정한다.Then, the binarization reference point for binarizing the bins of the middle series is found from the sample population, and the reference point of the pure color series and the gray series is determined to be lower than the determined binarization reference point of the intermediate series.

이와같이 결정된 2진화 기준치에 의해 각 히스토그램 빈 값을 2진화하여 2진 칼라 히스토그램을 생성함으로써 멀티미디어 특징소를 추출한다.The multimedia feature is extracted by generating a binary color histogram by binarizing each histogram bin value according to the binarization reference value determined as described above.

이와같은 방법으로 추출된 멀티미디어 특징소 정보는 해당 멀티미디어 특징소로서 포함할 수 있다.The multimedia feature information extracted in this way may be included as the corresponding multimedia feature.

즉, 기존의 칼라 히스토그램 정보와 함께, 그룹별로 다른 기준점을 적용한 2진 칼라 히스토그램 정보를 멀티미디어 특징소 정보구조에 포함시킴으로써, 멀티미디어 검색시에 상기 칼라 히스토그램과 그룹별 2진 칼라 히스토그램을 적절하게 조합하여 사용할 수 있게 되는 것이다.That is, by including binary color histogram information with different reference points for each group together with the existing color histogram information in the multimedia feature information structure, the color histogram and the group binary color histogram are appropriately combined during the multimedia search. It will be available.

이상에서와 같이 본 발명은 칼라 히스토그램을 이용한 멀티미디어 검색에서 2진 칼라 히스토그램을 사용함으로써, 매우 빠른 검색 시간과, 매우 적은 특징소 공간을 갖는 효과를 가지면서, 동시에 기존의 2진 칼라 히스토그램을 사용한 방법에 비해 검색 성능이 높아 원래의 칼라 히스토그램을 사용한 방법과 비슷한 성능을 보이는 효과가 있다.As described above, the present invention uses a binary color histogram in a multimedia search using a color histogram, thereby having an effect of having a very fast searching time and a very small feature space, and at the same time using a conventional binary color histogram. Compared to the original color histogram, the search performance is higher than that of the original color histogram.

특히 본 발명은 칼라 히스토그램을 이용한 멀티미디어 검색에서 칼라 그룹별로 다른 2진화 기준점을 적용한 2진화 칼라 히스토그램을 사용함으로써, 보다 빠른 검색시간과 적은 특징소 저장공간을 가지면서도 충분한 성능의 멀티미디어 검색엔진을 제공할 수 있는 효과가 있다.In particular, the present invention uses a binarized color histogram applying different binarization reference points for each color group in a multimedia search using a color histogram, thereby providing a multimedia search engine with sufficient performance while having faster search time and less feature storage space. It can be effective.

Claims (10)

멀티미디어 객체의 특징소로서 2진 칼라 히스토그램을 사용하는 멀티미디어 검색방법에 있어서,In a multimedia retrieval method using a binary color histogram as a feature of a multimedia object, (a). 칼라 히스토그램의 각 빈을 N개의 그룹으로 분류하고, (b). 상기 분류된 N개의 각 그룹별로 칼라 히스토그램을 2진화 하기 위한 기준점을 각각 다르게 설정하고, (c). 상기 각 그룹별로 달리 설정된 2진화 기준점을 기준으로 칼라 히스토그램을 2진화하여 멀티미디어 검색을 실행하는 것을 특징으로 하는 2진 칼라 히스토그램을 이용한 멀티미디어 검색방법.(a). Each bin of the color histogram is classified into N groups, and (b). A reference point for binarizing the color histogram for each of the classified N groups is set differently from each other (c). And performing a multimedia search by binarizing the color histogram on the basis of the binarization reference point set differently for each group. 제 1 항에 있어서, 상기 N개의 칼라 빈 그룹은 칼라 공간에서; (a). 순색을 표현하는 순색계열과, (b). 회색계통을 표현하는 회색계열과, (c). 상기 순색과 회색계열을 제외한 나머지 중간색 계열로 분류하는 것을 특징으로 하는 2진 칼라 히스토그램을 이용한 멀티미디어 검색방법.2. The apparatus of claim 1, wherein the N color bin groups are in color space; (a). A pure color series representing pure colors, (b). A gray series representing a gray series, and (c). Multimedia search method using a binary color histogram, characterized in that the classification of the remaining middle color except the pure color and gray series. 제 2 항에 있어서, 상기 순색계열은 흰색과 검은색의 포함 비율이 적은 영역을 나타내건, HSV 칼라 공간에서 S와 V가 비교적 큰 영역을 나타내거나, HMMD 칼라 공간에서 Max(R,G,B)와 Min(R,G,B)의 차가 상대적으로 큰 영역을 나타내는 것을 특징으로 하는 2진 칼라 히스토그램을 이용한 멀티미디어 검색방법.The method of claim 2, wherein the pure color series represents a region having a low content ratio of white and black, a region where S and V are relatively large in the HSV color space, or Max (R, G, B in the HMMD color space. ) And a multimedia search method using a binary color histogram, characterized in that the difference between Min (R, G, B) represents a relatively large area. 제 2 항에 있어서, 상기 회색계열은 흰색과 검은색의 포함 비율이 많은 영역을 나타내거나, HSV 칼라공간에서 S와 V가 비교적 작은 영역을 나타내거나, HMMD 칼라공간에서, Max(R.G.B)와 Min(R.G,B)의 차가 상대적으로 적은 영역을 나타내는 것을 특징으로 하는 2진 칼라 히스토그램을 이용한 멀티미디어 검색방법.The method of claim 2, wherein the gray series represents a region having a high content ratio of white and black, a region where S and V are relatively small in the HSV color space, or Max (RGB) and Min in the HMMD color space. A multimedia retrieval method using a binary color histogram, characterized by a relatively small area difference between (RG and B). 제 2 항에 있어서, 상기 2진화 기준점은 중간색 계열을 기준으로 찾아서 순색계열과 회색계열의 2진화 기준점을 결정하는 것을 특징으로 하는 2진 칼라 히스토그램을 이용한 멀티미디어 검색방법.3. The multimedia retrieval method according to claim 2, wherein the binarization reference point is determined based on an intermediate color series to determine a binarization reference point of a pure color series and a gray series. 제 2 항 또는 제 5 항에 있어서, 상기 순색계열과 회색계열의 2진화 기준점은 중간색 계열의 2진화 기준점 보다 낮은 2진화 기준점에 의해서 2진화되는 것을 특징으로 하는 2진 칼라 히스토그램을 이용한 멀티미디어 검색방법.6. The multimedia retrieval method using a binary color histogram according to claim 2 or 5, wherein the binarization reference point of the pure color series and the gray series is binarized by a binarization reference point lower than that of the intermediate color series. . 제 1 항 또는 제 2 항에 있어서, 상기 2진화 기준치는 칼라 양자화수(칼라 히스토그램의 빈 수)에 반비례하여 결정하는 것을 특징으로 하는 2진 칼라 히스토그램을 이용한 멀티미디어 검색방법.3. The multimedia retrieval method according to claim 1 or 2, wherein the binarization reference value is determined in inverse proportion to the color quantization number (bin number of the color histogram). 멀티미디어 객체의 특징소로서 2진 칼라 히스토그램을 사용하는 멀티미디어 검색방법에 있어서,In a multimedia retrieval method using a binary color histogram as a feature of a multimedia object, (a). 칼라 히스토그램을 생성하는 과정과,(a). Creating a color histogram, (b). 상기 칼라 히스토그램의 각 빈들을 순색계열과 회색계열 및 중간색 계열로 분류하는 과정과,(b). Classifying each bin of the color histogram into a pure color series, a gray series, and a middle color series; (c). 상기 중간계열의 2진화 기준점을 찾는 과정과,(c). Finding a binarization reference point of the intermediate series; (d). 상기 중간계열의 2진화 기준점 보다 낮게 순색계열과 회색계열의 기준점을 결정하는 과정과,(d). Determining a reference point of a pure color series and a gray series lower than the binarization reference point of the intermediate series; (e). 상기 각 계열별로 결정된 2진화 기준치에 의해서 각 히스토그램의 빈갑을 2진화하여 2진 칼라 히스토그램을 생성하는 과정;(e). Generating a binary color histogram by binarizing the bins of each histogram by the binarization reference value determined for each series; 으로 이루어진 것을 특징으로 하는 멀티미디어 특징소 추출방법.Multimedia feature extraction method characterized in that consisting of. 제 8 항에 있어서, 상기 중간계열의 2진화 기준점은 표본집단으로부터 중간계열의 빈들을 2진화 하기 위한 기준점을 결정하는 것을 특징으로 하는 멀티미디어 특징소 추출방법.9. The method of claim 8, wherein the binarization reference point of the intermediate series determines a reference point for binarizing the bins of the intermediate series from a sample population. 제 8 항에 기재된 방법으로 추출된 특징소를 멀티미디어의 특징소 구조에 더 포함하여 이루어지는 것을 특징으로 하는 멀티미디어 특징소 구조.A multimedia feature structure comprising the feature feature extracted by the method according to claim 8 in a multimedia feature structure.
KR1019990053588A 1999-11-29 1999-11-29 Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram KR100350793B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1019990053588A KR100350793B1 (en) 1999-11-29 1999-11-29 Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram
US09/725,037 US6708167B2 (en) 1999-11-29 2000-11-29 Method for searching multimedia data using color histogram

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990053588A KR100350793B1 (en) 1999-11-29 1999-11-29 Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram

Publications (2)

Publication Number Publication Date
KR20010048785A true KR20010048785A (en) 2001-06-15
KR100350793B1 KR100350793B1 (en) 2002-09-10

Family

ID=19622499

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990053588A KR100350793B1 (en) 1999-11-29 1999-11-29 Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram

Country Status (1)

Country Link
KR (1) KR100350793B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100955180B1 (en) * 2008-04-11 2010-04-30 엔에이치엔(주) Method and System for Computing Quality Value of Image

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2695045A4 (en) 2011-04-07 2015-02-11 Hewlett Packard Development Co Graphical object classification

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200627A (en) * 1993-12-28 1995-08-04 Toshiba Corp Retrieval device for multimedia data base
JPH0916457A (en) * 1995-06-28 1997-01-17 Fujitsu Ltd Multimedia data retrieval system
JPH0981590A (en) * 1995-09-13 1997-03-28 Canon Inc Multimedia information retrieval device
JPH10301948A (en) * 1997-04-25 1998-11-13 Nippon Telegr & Teleph Corp <Ntt> Method for retrieving image and video
JPH1166079A (en) * 1997-08-11 1999-03-09 Hitachi Ltd Retrieval system for multimedia data
KR100283615B1 (en) * 1998-11-10 2001-03-02 정선종 Multimedia Feature Extraction and Retrieval Method in Multimedia Retrieval System

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100955180B1 (en) * 2008-04-11 2010-04-30 엔에이치엔(주) Method and System for Computing Quality Value of Image

Also Published As

Publication number Publication date
KR100350793B1 (en) 2002-09-10

Similar Documents

Publication Publication Date Title
KR100926193B1 (en) Segmenting digital image and producing compact representation
JP4242532B2 (en) Digital image data classification method
JP4295882B2 (en) Method for classifying digital image data and method for classifying and classifying data blocks
US6778697B1 (en) Color image processing method and apparatus thereof
US7158669B2 (en) Image compression method and apparatus, and image coding method and apparatus
Hsieh et al. An adaptive clustering algorithm for color quantization
US20080056573A1 (en) Methods and Systems for Identifying Text in Digital Images
JP2004525471A (en) Palette-based histogram matching by recursive histogram vector generation
CN111476319B (en) Commodity recommendation method, commodity recommendation device, storage medium and computing equipment
US6708167B2 (en) Method for searching multimedia data using color histogram
Shah et al. Image blurring and sharpening inspired three-way clustering approach
US6327382B1 (en) Image processing method and apparatus and storage medium therefor
Reta et al. Color uniformity descriptor: An efficient contextual color representation for image indexing and retrieval
US8131077B2 (en) Systems and methods for segmenting an image based on perceptual information
KR100350793B1 (en) Multimedia Feature And Method Of Multimedia Retrieval System Using Binary Color Histogram
KR100436500B1 (en) Color image processing method
Thepade et al. Content based image classification with thepade's static and dynamic ternary block truncation coding
KR100369370B1 (en) Block-based Image Histogram Generation Method
KR100626838B1 (en) High speed image compare, retrieval system based on near maximum flow matching and method thereof
Mojsilovic et al. A method for color content matching of images
EP1006717A2 (en) Method and apparatus for segmenting data
CN100543766C (en) Image segmentation methods, compact representation production method, image analysis method and device
JPH07160879A (en) Picture processing method
KR100374063B1 (en) HMMD color space based color quantization method and Method for searching multimedia feature
El-Feghi et al. Content-Based Image Retrieval based on efficient fuzzy color signature

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080618

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee