KR100911628B1 - 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법 - Google Patents

텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법 Download PDF

Info

Publication number
KR100911628B1
KR100911628B1 KR1020070059678A KR20070059678A KR100911628B1 KR 100911628 B1 KR100911628 B1 KR 100911628B1 KR 1020070059678 A KR1020070059678 A KR 1020070059678A KR 20070059678 A KR20070059678 A KR 20070059678A KR 100911628 B1 KR100911628 B1 KR 100911628B1
Authority
KR
South Korea
Prior art keywords
visual information
search result
image
images
information descriptor
Prior art date
Application number
KR1020070059678A
Other languages
English (en)
Other versions
KR20080111574A (ko
Inventor
낭종호
박주현
Original Assignee
서강대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서강대학교산학협력단 filed Critical 서강대학교산학협력단
Priority to KR1020070059678A priority Critical patent/KR100911628B1/ko
Publication of KR20080111574A publication Critical patent/KR20080111574A/ko
Application granted granted Critical
Publication of KR100911628B1 publication Critical patent/KR100911628B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 소정의 개념을 갖는 텍스트 질의를 기반으로 하여 검색된 검색 결과 이미지들을 정련하는 검색 결과 정련 방법에 관한 것이다. 상기 검색 결과 정련 방법은, (a) 검색 결과 이미지들에 대하여 다수 개의 시각 정보 기술자들의 각각에 대한 가중치를 생성하는 단계, (b) 각 시각 정보 기술자별로 생성된 가중치들을 이용하여, 검색 결과 이미지들에 대한 이미지간 거리들을 계산하는 단계, (c) 상기 계산된 이미지간 거리들을 이용하여 검색 결과 이미지들을 클러스터링하여 다수개의 이미지 그룹으로 분할하는 단계, (d) 상기 분할된 이미지 그룹들과 상기 질의 개념과의 연관 정도를 평가하고, 연관 정도가 낮은 소정 비율의 이미지 그룹을 검색 결과에서 제외하는 단계를 포함한다. 상기 (a) 단계는, (a1) 각 시각 정보 기술자 별로 상기 검색 결과 이미지들을 클러스터링하는 단계, (a2) 각 시각 정보 기술자별로 클러스터링된 결과들에 대하여 소정의 평가 지수 값을 구하는 단계, 및 (a3) 각 시각 정보 기술자별로 구한 평가 지수값을 이용하여, 각 시각 정보 기술자들에 대한 가중치를 생성하는 단계를 포함하는 것이 바람직하다.
검색, 정련, 이미지, CH Index, 시각 정보 기술자

Description

텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법{METHOD FOR REFINEMENT OF IMAGES SEARCH RESULTS BASED ON TEXT QUERY}
도 1은 본 발명의 바람직한 실시예에 따른 텍스트 질의에 의한 이미지 검색 결과를 복수개의 시각 정보를 기반으로 주어진 개념과 연관 정도가 낮은 이미지들을 검색 결과에서 제외하여 검색 결과를 정련하는 방법의 주요 단계들을 나타낸 흐름도이다.
도 2는 본 발명의 바람직한 실시예에 따른 검색 결과 정련 방법에 있어서, 각 시각 정보 기술자별 가중치를 구하는 과정을 순차적으로 도시한 흐름도이다.
도 3은 여러 가지의 개념에 대하여 본 발명에 따른 정련 방법에 의한 결과와 종래의 기술에 따른 키워드 기반 이미지 검색 결과를 비교하여 도시한 도표이다.
본 발명은 텍스트 질의를 기반으로 한 이미지 검색 결과를 정련하는 검색 결과 정련 방법에 관한 것으로서, 더욱 구체적으로는 텍스트 질의를 기반으로 하여 검색된 이미지 검색 결과를 다수 개의 시각 정보 기술자들을 이용하여 정련하여 검색 결과의 정확성을 향상시키는 검색 결과 정련 방법에 관한 것이다.
본 발명은 텍스트 질의 기반의 이미지 검색 결과 정련에 관한 것으로, 더 상세하게는 텍스트 질의 기반의 이미지 검색 결과를 시각 정보를 기반으로 분석하여 질의 개념과 연관 정도가 떨어지는 이미지들을 제외하여 검색 결과를 정련시키는 방법에 관한 것이다.
텍스트 질의를 기반으로 한 웹 이미지 검색은 저작자가 이미지를 보고 단 주석이나 일정한 규칙에 의해 자동으로 달린 주석을 기반으로 검색을 수행한다. 그런데, 저작자가 직접 주석을 다는 경우는 주석 부여 과정에서 저작자의 주관이 개입되기 때문에, 텍스트 질의를 기반으로 한 웹 이미지 검색시에는 검색하고자 하는 결과를 제대로 얻지 못하거나 원하지 않는 결과를 얻을 수 있게 된다.
또한, 자동 주석 방법에 따라 차이가 있긴 하지만, 자동으로 주석을 다는 경우에도 정확성이 낮기 때문에, 텍스트 질의를 기반으로 한 웹 이미지 검색의 결과에는 주어진 개념과 일치하지 않는 많은 이미지들이 포함되기도 한다.
이러한 문제점들을 해결하기 위해서 이미지로부터 추출할 수 있는 색상, 외형등과 같은 시각 정보를 이용한 내용 기반 검색을 텍스트 기반 검색과 병행하는 방법이 제안되었다. 하지만, 이와 같은 내용기반 검색과 텍스트 기반 검색의 병행 방법은 다수의 질의를 처리해야 하는 검색 서버에 큰 부하를 주게 되는 문제점이 있다.
따라서 본 출원인은 검색 클라이언트에서 주어진 개념과 일치하지 않은 이미지들을 검색 결과에서 제외할 수 있도록 하여, 검색 서버에 영향을 주지 않으면서 검색 결과에 대한 검색자의 만족도를 크게 높일 수 있는 방안을 제안하고자 한다.
전술한 문제점을 해결하기 위한 본 발명의 목적은 텍스트 질의 기반의 이미지 검색 결과를 다수 개의 시각 정보 기술자들을 이용하여 분석하여 질의 개념과 연관 정도가 떨어지는 이미지들을 제외시킴으로써 검색 결과를 정련시키는 이미지 검색 결과 정련 방법을 제공하는 것이다.
전술한 기술적 과제를 달성하기 위한 본 발명의 특징은 소정의 개념을 갖는 텍스트 질의를 기반으로 하여 검색된 검색 결과 이미지들을 정련하는 검색 결과 정련 방법에 관한 것으로서,
(a) 검색 결과 이미지들에 대하여 다수 개의 시각 정보 기술자들의 각각에 대한 가중치를 생성하는 단계,
(b) 각 시각 정보 기술자별로 생성된 가중치들을 이용하여, 검색 결과 이미지들에 대한 이미지간 거리들을 계산하는 단계,
(c) 상기 계산된 이미지간 거리들을 이용하여 검색 결과 이미지들을 클러스터링하여 다수개의 이미지 그룹으로 분할하는 단계,
(d) 상기 분할된 이미지 그룹들과 상기 질의 개념과의 연관 정도를 평가하고, 연관 정도가 낮은 소정 비율의 이미지 그룹을 검색 결과에서 제외하는 단계를 포함한다.
전술한 특징을 갖는 검색 결과 정련 방법의 상기 (a) 단계는, (a1) 각 시각 정보 기술자 별로 상기 검색 결과 이미지들을 클러스터링하는 단계, (a2) 각 시각 정보 기술자별로 클러스터링된 결과들에 대하여 소정의 평가 지수 값을 구하는 단계, 및 (a3) 각 시각 정보 기술자별로 구한 평가 지수값을 이용하여, 각 시각 정보 기술자들에 대한 가중치를 생성하는 단계를 포함하는 것이 바람직하다.
전술한 특징을 갖는 검색 결과 정련 방법의 상기 (b) 단계는, 상기 이미지간 거리는 각 시각 정보 기술자들에 대한 보정된 이미지간 거리들의 합(合)으로 구해지며, 상기 보정된 이미지간 거리는 해당 시각 정보 기술자에 대해 구한 이미지간 거리를 해당 시각 정보 기술자에 대한 가중치를 이용하여 보정한 값으로 이루어지는 것이 바람직하다.
전술한 특징을 갖는 검색 결과 정련 방법의 상기 (d) 단계에서 질의어 텍스트와 검색결과 이미지 사이의 연관 정도는 검색 순위에 따라 결정되는 것이 바람직하다.
전술한 특징을 갖는 검색 결과 정련 방법에 사용되는 상기 시각 정보 기술자는 Dominant Color(DH), Color Layout(CL), Color Structure(CS), Edge Histogram(EH) 중 적어도 하나 이상을 포함하는 것이 바람직하다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 텍스트 질의를 기반으로 한 이미지 검색 결과에 대한 정련 방법을 구체적으로 설명한다. 도 1은 본 발명의 바람직한 실시예에 따른 텍스트 질의를 기반으로 한 이미지 검색 결과를 정련하는 방법을 순차적으로 도시한 흐름도로서, 복수개의 시각 정보 기술자들을 기반으로 하여 주어진 개념과 연관 정도가 낮은 이미지들을 검색 결과에서 제외하여 검색 결과를 정련하는 방법의 주요 단계들을 나타낸다.
도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 텍스트 질의 기반 이미 지 검색 클라이언트에서의 검색 결과 정련 방법은 크게 (a) 검색 결과 이미지들에 대하여 복수개의 시각 정보 기술자에 대한 가중치들을 생성하는 가중치 생성 단계(단계 10), (b) 상기 가중치들을 이용하여 이미지간 거리를 계산하여 클러스터링을 수행하는 클러스터링 단계(단계 20), 및 (c) 클러스터링된 각 이미지 그룹과 개념 간 연관 정도를 평가하여 연관 정도가 낮은 이미지 그룹을 검색 결과에서 제외하는 정련 단계(단계 30)를 포함한다.이하, 전술한 각 단계별로 구체적으로 설명한다.
상기 가중치 생성 단계(단계 10)는 텍스트 질의로서 주어진 임의의 개념(c)를 표현하는 이미지의 분류에 적합하도록 다수 개의 시각 정보 기술자들의 각각에 대한 가중치를 구하는 단계이다. 상기 가중치 생성 단계(단계 10)는, 도 2에 도시된 바와 같이, 검색 결과 이미지 집합(D)을 구성하는 이미지들을 복수 개의 시각 정보 기술자들의 각각에 대하여 클러스터링을 수행하는 단계(단계 100), 각 시각 정보 기술자별로 수행된 클러스터링 결과들에 대하여 소정의 평가 지수값을 구하는 단계(단계 110), 각 시각 정보 기술자들에 대해 구한 평가 지수값을 이용하여 각 시각 정보 기술자별 가중치를 설정하는 단계(단계 120)를 구비한다. 이하, 각 시각 정보 기술자들에 대한 가중치 생성 단계를 구성하는 각 단계들에 대하여 구체적으로 설명한다.
먼저, 단계 100에 있어서, 클라이언트에서 요청한 텍스트 질의 기반의 이미지 검색 요청에 따라, 상기 클라이언트는 검색 서버로부터 복수개의 이미지들로 이루어지는 검색 결과 이미지 집합(D)를 제공받는다. 상기 클라이언트는 서버로부터 제공된 검색 결과 이미지 집합(D)의 이미지들을 다수 개의 시각 정보 기술자의 각 각에 대하여 클러스터링을 수행하게 된다.
본 발명의 바람직한 실시예에 따른 정련 방법에서 사용하는 시각정보 기술자는 MPEG-7시각정보 기술자중 Dominant Color(DC), Color Layout(CL), Color Structure(CS), Edge Histogram(EH)이다. 본 발명에서 전술한 4개의 MPEG-7 시각정보 기술자들을 사용한 이유는 이 기술자들이 표준화 과정을 통해서 대량의 데이터 집합에 대해 그 유용성이 충분히 검증되었다고 볼 수 있기 때문이다. 하지만, 본 발명의 바람직한 실시예에서 사용하지 않은 시각 정보 기술자들도 그 유용성이 충분히 검증된다면 사용할 수 있음은 당연하다.
한편, 이와 같이 각 시각 정보 기술자들에 대하여 가중치를 구하는 이유는, 이미지의 속성에 따라 각각의 시각 정보 기술자들이 해당 개념에 대한 이미지들을 클러스터링함에 있어 서로 다른 성능을 보여주기 때문이다. 예를 들어, 시각 정보 기술자 중 Dominant Color는 "tiger" 이미지들과 같이 고유의 색상을 가지고 있는 개념에 대해서는 좋은 클러스터링 성능을 보여주지만, "cat" 이미지들과 같이 다양한 색상을 가지고 있는 개념에 대해서는 좋은 클러스터링 결과를 보여주지 못한다. 따라서 효과적인 이미지 클러스터링을 위해서는 각 개념의 속성에 따라 좋은 클러스터링 결과를 보여줄 수 있는 적합한 기술자를 선택해야만 한다.
즉, 좋은 클러스터링 성능을 갖는 시각 정보 기술자는 서로 다른 내용의 이미지들을 잘 구별하여 각 클러스터가 높은 편차를 가질 수 있도록 이미지를 기술할 수 있어야 한다. 따라서 검색 결과 이미지들을 각 시각 정보 기술자를 사용하여 클러스터링을 한 후, 그 결과를 평가한다면 각 개념에 적합한 좋은 기술자를 선택할 수 있을 것이다.
단계 110에 있어서, 각 시각 정보 기술자별로 수행된 클러스터링 결과들에 대하여 소정의 평가 지수값을 구한다. 본 발명의 바람직한 실시예에서는 각 질의 개념에 적합한 좋은 클러스터링 성능을 갖는 시각 정보 기술자를 선택하기 위해서 클러스터링 결과에 대한 평가 척도인 평가 지수로서 CH Index를 사용한다. CH Index는 클러스터 내부의 분산 정도와 클러스터간 떨어진 정도의 비율로 표현되기 때문에 그 값이 클수록 좋은 시각 정보 기술자의 조건에 만족된다고 할 수 있다. 따라서, 각 시각 정보 기술자들을 기반으로 하여 클러스터링을 한 결과에 대한 CH Index 값이 가장 큰 기술자를 "그 개념을 분류하기에 가장 적합한 기술자"라고 가정할 수 있을 것이다. 이러한 가정이 언제나 옳다면 적합한 시각 정보 기술자 하나만을 사용하여 이미지들을 클러스터링할 수 있을 것이다.
하지만 예비 실험에 의하면 70%의 개념에 대해서만 가정이 옳음을 보여주었다. 따라서 CH Index에 의해 선택된 기술자 하나만을 사용하는 것은 좋지 않은 클러스터링 결과를 가져올 가능성이 있게 된다. CH Index에 의해 선택된 기술자가 항상 좋은 클러스터링 결과를 보여주지는 않더라도 각 기술자의 CH Index 값은 각 기술자의 중요도에 대한 지표로 활용할 수 있다. 즉, 두 이미지간 거리를 구할 때 CH Index의 값을 각 기술자에 대한 가중치로 하여 합하여 구한다면 잘못된 기술자 선택에서 발생하는 위험을 줄일 수 있을 것이다.
한편, 본 발명의 바람직한 실시예에 따른 정련 방법에서는 평가 지수로서 CH Index를 사용하였으나, 그 외의 다른 지수들도 평가 지수로 사용할 수 있다. 예를 들어, 각 클러스터의 응집 정도와 클러스터 간 거리의 비율로 표현되는 DB Index를 이용하여 클러스터 결과를 평가할 수 있다. 단, DB Index의 경우 CH Index와 다르게 그 값을 최소로 하는 상태를 최적의 클러스터링 결과로 간주한다. CH Index와 비슷하지만 클러스터의 분포 정도까지 고려한 I Index를 사용할 수도 있다. I Index는 CH Index와 마찬가지로 그 값을 최대로 하는 상태를 최적의 클러스터링 결과로 간주한다.
단계 120에 있어서, 각 시각 정보 기술자에 대해 구한 평가 지수값에 따라, 해당 질의 개념의 분류에 대한 각 시각 정보 기술자별 가중치를 설정한다. 상기 각 시각 정보 기술자별 가중치는 상기 평가 지수값을 그대로 사용하거나 상기 평가 지수값에 비례하여 설정할 수 있을 것이다.
이하, 본 발명에 따른 정련 방법의 클러스터링 단계(단계 20)를 구체적으로 설명한다. 상기 클러스터링 단계(단계 20)는 상기 시각 정보 기술자별 가중치들을 이용하여 검색 결과 이미지 집합(D)을 구성하는 이미지들에 대하여 이미지간 거리들을 계산하고, 계산된 이미지간 거리들을 이용하여 검색 결과 이미지 집합을 k개의 이미지 그룹으로 클러스터링한다.
상기 클러스터링 단계(단계 20)를 설명하기 위해 검색 결과 이미지 집합(D) 내의 임의의 두 이미지 o i o j 를 가정하자. 상기 두 이미지에 대한 이미지간 거리 함수 d( o i , o j ) 는 아래의 수학식 1에 의해 구할 수 있다.
Figure 112007044090547-pat00001
여기서, λ=∑ ch x 를 의미하고, x는 각각 DC, CL, CS, EH 시각 정보 기술자를 의미한다. 그리고 d x ch x 는 각각 MPEG-7 visual part of XM에 정의된 거리 함수를 사용하여 구한 각 시각 정보 기술자 별 거리와 전술한 단계에서 설정된 각 시각 정보 기술자 별 가중치를 의미한다. GausNorm은 각 기술자 별 거리를 [0, 1] 사이로 정규화하는 가우시안 방법을 의미한다. 정의된 거리 함수를 기반으로 k-means 클러스터링을 수행하면, 검색 결과 이미지 집합(D)은 k 개의 이미지 그룹들로 나뉘게 되고 그 결과를 Φ (Φ = {C i | 1≤ik }로 표현한다. 여기서 C i i번 째 이미지 그룹을 의미한다.
이하, 본 발명에 따른 정련 방법의 정련 단계(단계 30)를 구체적으로 설명한다. 상기 정련 단계(단계 30)는 클러스터링된 각 이미지 그룹과 개념 간 연관 정도를 평가하여 연관 정도가 낮은 이미지 그룹을 검색 결과에서 제외함으로써, 최종적으로 검색 결과 이미지 집합을 정련하게 된다.
상기 정련 단계(단계 30)을 설명하기 위해 개념(c)와 임의의 이미지 그룹 Ci 의 연관 정도를 Sc(Ci)로 정의하자. 이미지 사전과 같이 개념(c)를 표현한 이미지들의 시각적 특징에 대한 정보가 없기 때문에 이미지 그룹에 포함되어 있는 이미지 각각의 텍스트 기반 검색 결과에서의 검색 순위를 기준으로 각 이미지 그룹과 개념과의 연관 정도를 평가해야 한다.
이미지 그룹 내 임의의 이미지(o)의 검색 순위(r)과 해당 이미지 그룹의 개념(c)와의 연관 정도를 확률적으로 생각해보자. 각 클러스터에서 임의의 이미지를 선택했을 때 기대되는 주어진 개념과 연관되는 정도를 구할 수 있을 것이다. 확률 변수 X를 검색 순위(r)의 구간으로 설정한다면, 각 이미지 그룹 단위로 특정 순위 그룹 값을 가지고 있는 이미지가 나올 확률 P(x)을 경험적으로 구할 수 있다. 따라서 임의의 이미지 그룹(Ci)이 해당 이미지 그룹의 개념(c)와 연관되는 정도에 대한 기대 값 Ec ( Ci )는 아래의 수학식 2로 나타낼 수 있다.
Figure 112007044090547-pat00002
여기서 P(c 0 =c|x)는 x 구간의 순위를 갖는 이미지의 개념이 실제로 c 개념을 나타내고 있을 경험적인 확률을 의미한다. 즉, 경험적으로 보았을 때, 검색 순위 1위부터 5위까지의 이미지들이 질의 개념과 부합할 확률이 0.9 라면, P(c 0 =c | 1≤x≤5) = 0.9 임을 의미한다. 하지만 각 이미지 그룹의 기대 값을 그대로 이미지 그룹의 선택에 적용하는 것은 문제가 있다. 높은 순위를 갖는 매우 적은 이미지로 구성된 클러스터들만이 선택되는 것을 막기 위해 이미지 그룹의 크기를 최종 스코어 계산에 반영하였다. 임의의 이미지 그룹 C i 가 주어진 개념과 연관되는 정도에 대한 최종 이미지 그룹과 개념 c간의 연관 정도 S c ( C i )는 수학식 3으로 나타낼 수 있다.
Figure 112008078245031-pat00007
여기서 nC i 는 이미지 그룹 C i 가 포함하고 있는 이미지의 개수를 의미한다. 이미지의 개수에 너무 민감해지는 것을 방지하기 위해 log-scheme을 사용하는 것이 바람직하다. S c ( C i )가 주어진 임계값 T 보다 낮은 이미지 그룹들은 최종 검색 결과에서 제외한다.
상기와 같은 본 발명에 따른 텍스트 질의 기반 이미지 검색 클라이언트에서의 복수개의 시각 정보 기술자들을 이용한 검색 결과 정련 방법에 따르면 평균 10% 이상의 정확률 향상 효과를 볼 수 있다.
이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 예를 들어, 본 발명의 실시예에서, 시각 정보 기술자들의 종류, 평가 지수의 종류 등은 전체 정련 방법의 성능을 향상시키기 위하여 다양하게 변형하여 실시할 수 있는 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규 정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.
본 발명에 의하여, 텍스트 질의를 기반으로 한 이미지 검색 클라이언트에서 복수개의 시각 정보 기술자들을 이용하여 이미지 검색 결과들을 정련함으로써, 정확성이 평균 10% 이상 향상된 검색 결과를 검색 클라이언트에서 재구성할 수 있게 된다. 도 3은 여러 가지의 개념에 대하여 본 발명에 따른 정련 방법에 의한 결과와 종래의 기술에 따른 키워드 기반 이미지 검색 결과를 비교하여 도시한 도표이다. 도 3을 통해, 본 발명에 따른 정련 방법에 의하여 종래에 비하여 정확성이 평균적으로 10% 이상 향상되었음을 알 수 있다.

Claims (6)

  1. 텍스트 질의를 기반으로 하여 검색된 검색 결과 이미지들을 정련하는 검색 결과 정련 방법에 있어서,
    (a) 검색 결과 이미지들에 대하여 다수 개의 시각 정보 기술자들의 각각에 대한 가중치를 생성하는 단계;
    (b) 각 시각 정보 기술자별로 생성된 가중치들을 이용하여, 검색 결과 이미지들에 대한 이미지간 거리들을 계산하는 단계;
    (c) 상기 계산된 이미지간 거리들을 이용하여 검색 결과 이미지들을 클러스터링하여 다수개의 이미지 그룹으로 분할하는 단계;
    (d) 상기 분할된 이미지 그룹들과 상기 텍스트 질의와의 연관 정도를 평가하고, 연관 정도가 낮은 비율의 이미지 그룹을 검색 결과에서 제외하는 단계;
    를 구비하고,
    상기 (a) 단계는,
    (a1) 각 시각 정보 기술자 별로 상기 검색 결과 이미지들을 클러스터링하는 단계; (a2) 각 시각 정보 기술자별로 클러스터링된 결과들에 대하여 평가 지수 값을 구하는 단계; 및 (a3) 각 시각 정보 기술자별로 구한 평가 지수값을 이용하여, 각 시각 정보 기술자들에 대한 가중치를 생성하는 단계를 포함하며,
    상기 (b) 단계는,
    상기 이미지간 거리는 각 시각 정보 기술자들에 대한 보정된 이미지간 거리들의 합(合)으로 구해지며, 상기 보정된 이미지간 거리는 해당 시각 정보 기술자에 대해 구한 이미지간 거리를 해당 시각 정보 기술자에 대한 가중치를 이용하여 보정한 값으로 이루어지는 것을 특징으로 하는 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법.
  2. 삭제
  3. 제1항에 있어서, 상기 평가 지수는 CH 인덱스이며, 상기 각 시각 정보 기술자들에 대한 가중치는 해당 시각 정보 기술자에 대한 CH 인덱스 값으로 결정하는 것을 특징으로 하는 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법.
  4. 삭제
  5. 제1항에 있어서, 상기 (d) 단계의 연관 정도는 검색 순위에 따라 결정되는 것을 특징으로 하는 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법.
  6. 제1항, 제3항 및 제5항 중 어느 한 항에 있어서, 상기 시각 정보 기술자는 Dominant Color(DH), Color Layout(CL), Color Structure(CS), Edge Histogram(EH) 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법.
KR1020070059678A 2007-06-19 2007-06-19 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법 KR100911628B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070059678A KR100911628B1 (ko) 2007-06-19 2007-06-19 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070059678A KR100911628B1 (ko) 2007-06-19 2007-06-19 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법

Publications (2)

Publication Number Publication Date
KR20080111574A KR20080111574A (ko) 2008-12-24
KR100911628B1 true KR100911628B1 (ko) 2009-08-12

Family

ID=40369679

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070059678A KR100911628B1 (ko) 2007-06-19 2007-06-19 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법

Country Status (1)

Country Link
KR (1) KR100911628B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9036925B2 (en) 2011-04-14 2015-05-19 Qualcomm Incorporated Robust feature matching for visual search
US11061943B2 (en) 2017-12-28 2021-07-13 International Business Machines Corporation Constructing, evaluating, and improving a search string for retrieving images indicating item use
US11645329B2 (en) 2017-12-28 2023-05-09 International Business Machines Corporation Constructing, evaluating, and improving a search string for retrieving images indicating item use
US10664517B2 (en) 2017-12-28 2020-05-26 International Business Machines Corporation Constructing, evaluating, and improving a search string for retrieving images indicating item use
US11055345B2 (en) 2017-12-28 2021-07-06 International Business Machines Corporation Constructing, evaluating, and improving a search string for retrieving images indicating item use

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0266A (ja) * 1987-10-15 1990-01-05 Konica Corp 感光性組成物
JP2004157623A (ja) 2002-11-05 2004-06-03 Hitachi Ltd 検索システム及び検索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0266A (ja) * 1987-10-15 1990-01-05 Konica Corp 感光性組成物
JP2004157623A (ja) 2002-11-05 2004-06-03 Hitachi Ltd 検索システム及び検索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
논문:한국정보과학회 2006년 6월

Also Published As

Publication number Publication date
KR20080111574A (ko) 2008-12-24

Similar Documents

Publication Publication Date Title
US20190340194A1 (en) Associating still images and videos
Boyack et al. Clustering more than two million biomedical publications: Comparing the accuracies of nine text-based similarity approaches
US7809185B2 (en) Extracting dominant colors from images using classification techniques
US8429173B1 (en) Method, system, and computer readable medium for identifying result images based on an image query
US9081852B2 (en) Recommending terms to specify ontology space
US8560529B2 (en) System and method for measuring the quality of document sets
US9317593B2 (en) Modeling topics using statistical distributions
US7496567B1 (en) System and method for document categorization
US8989450B1 (en) Scoring items
US8543380B2 (en) Determining a document specificity
JP6299596B2 (ja) クエリ類似度評価システム、評価方法、及びプログラム
US10296531B2 (en) Visual semantic complex network and method for forming network
JP5094830B2 (ja) 画像検索装置、画像検索方法及びプログラム
US9875295B1 (en) Evaluation of substitution contexts
KR100911628B1 (ko) 텍스트 질의를 기반으로 한 이미지 검색 결과 정련 방법
Tekli An overview of cluster-based image search result organization: background, techniques, and ongoing challenges
Arevalillo-Herráez et al. A relevance feedback CBIR algorithm based on fuzzy sets
Li et al. Re-ranking by multi-modal relevance feedback for content-based social image retrieval
Malmgren Towards a theory of jurisprudential relevance ranking
Zhang Relevance feedback in content-based image retrieval
KR101137491B1 (ko) 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법
CN114036305A (zh) 多层文本聚类方法、系统、设备及存储介质
Chiang et al. Independent query refinement and feature re-weighting using positive and negative examples for content-based image retrieval
Toselli et al. Interactive Image Retrieval
Boyack et al. Clustering More than Two Million Biomedical Publications: Comparing the

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120807

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130805

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160805

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170703

Year of fee payment: 9