KR20070009338A

KR20070009338A - 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치

Info

Publication number: KR20070009338A
Application number: KR1020050064506A
Authority: KR
Inventors: 정인서; 성영제; 이주호; 김남일; 신중호
Original assignee: (주)첫눈
Priority date: 2005-07-15
Filing date: 2005-07-15
Publication date: 2007-01-18
Also published as: KR100706389B1

Abstract

이미지 상호간의 유사도를 고려한 이미지 검색 방법 및 장치가 개시된다. 본 발명에 따라, 이미지 검색 방법은 (a) 수집한 이미지들간의 유사도를 계산하는 단계; (b) 상기 유사도 값이 소정의 값 이상이 되는 유사 이미지들을 그룹으로 묶고, 대표 키워드를 추출하는 단계; 및 (c) 상기 그룹이 복수개가 존재할 때, 상기 각각의 그룹에 대한 대표 키워드들에 대해 검색을 수행하여 대표 키워드에 대응되는 그룹의 대표 이미지를 출력하는 단계를 포함한다. 이에 의해, 사용자가 원하는 정보를 보다 정확하게 제공할 수 있으며, 유사한 이미지를 삭제함으로써 사용자가 검색결과 확인에 사용하는 불필요한 시간과 노력을 줄일 수 있다.

Description

이미지 상호간의 유사도를 고려한 이미지 검색 방법 및 장치 {Image search method and apparatus considering a similarity among the images}

도 1은 유사한 이미지들을 묶어 그룹핑하고 각각의 그룹들마다 대표 키워드를 선정하여, 각 그룹별 이미지의 중요도에 따라 그 출력 위치를 정하여 사용자에게 제공하는 것을 설명하기 위한 참조도,

도 2는 본 발명의 일실시예에 따른, 이미지간의 유사도에 따라 그룹핑하여 이미지 검색을 수행하는 이미지 검색 방법의 흐름도,

도 3은 도 2의 이미지 검색 방법의 상세 흐름도,

도 4a 내지 도 4b는 이미지 파일을 구성하는 부가 데이터(410)의 내용과, 이미지 데이터(420)를 영역으로 나누어 바이너리 데이터로 변환하는 과정을 설명하기 위한 참조도,

도 5a 내지 도 5b는 부가 데이터와 이미지 데이터를 참조하여 계산된 유사도와 각각의 이미지 파일에 대한 유사 이미지 파일 결과의 일예를 도시한 도면,

도 6은 본 발명의 일실시예에 따른, 유사도를 고려한 이미지 검색 장치의 구성도,

도 7a 내지 도 7b는 본 발명의 이미지 검색 방법을 적용한 결과의 일예를 도시한 도면이다.

본 발명은 정보의 검색에 관한 것으로, 보다 상세하게는 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및 장치에 관한 것이다.

인터넷을 통한 정보 제공자와 그 이용자의 폭발적인 증가에 따라 현재 수많은 정보들이 넘쳐나고 있다. 따라서 이들 정보들 중에서 사용자가 원하는 정보만을 골라 제공하는 검색엔진의 역할이 점점 중요해지고 있다. 종래의 검색 엔진은 원하는 정보를 보다 많이 찾는 것에 중점을 두고 검색을 수행하였으나, 현재는 원하는 정보만을 제대로 선별하여 보여주는 것에 중점을 두고 검색을 수행한다. 이렇게 원하는 정보를 찾고 이를 선별하여 제공하기 위해서는 검색된 정보의 중요도를 매겨 그 순서에 따라 사용자에게 보여주는 것이 필요하다.

종래의 이미지 검색 방법에서는 입력된 검색어와 검색 대상 이미지 파일의 내용간의 유사도를 계산한다. 즉, 검색어가 검색 대상 이미지 파일 내에서 출현하는 횟수에 따라 유사도를 계산한다. 예를 들어 "우유"라는 검색어가 있을 때 이미지 파일 1에서는 "우유"라는 단어가 10회 출현하고 이미지 파일 2에서는 "우유"라는 단어가 5회 출현하면, 이미지 파일 1의 유사도는 100% 가 되고, 이미지 파일 2의 유사도는 50% 가 된다.

이러한 유사도 계산 방법에 불리안 검색 모델, 확장 불리언 검색 모델, 벡터 공간 모델, 확률 분포, 포아송 모델, 라그란지 모델 등이 사용된다. 그러나 이 방 법은 단순히 검색어가 중복적으로 출현하는 빈도에 따라 유사도를 계산할 뿐, 검색된 정보들간의 상대적 가치가 반영되지 않는다.

한편, 정보의 중요도를 하이퍼 링크로 연결되어 있는 웹의 구조적인 특성을 이용하여 측정하는 방법이 있다. 즉, 정보의 가치를 그 정보를 참조하고 있는 인터넷 링크의 수를 이용하여 측정한다. 예를 들어, 검색된 이미지를 타 사이트에서 참조하고 있는 횟수를 계산하여 많이 참조하고 있는 정보를 중요한 정보로 판단한다. 그러나, 이러한 방법도 모든 종류의 정보에 적용하기 어렵다. 특히 한글 설명을 포함하고 있는 이미지 파일을 링크하고 있는 사이트가 영문 설명을 포함하고 있는 이미지 파일을 링크하고 있는 사이트보다 상대적으로 적기 때문에 이러한 방법을 일률적으로 적용하기가 어렵다.

따라서, 본 발명이 이루고자 하는 기술적 과제는 이미지 파일을 구성하는 부가 데이터와 이미지 데이터를 분석하여 유사도를 계산한 후 그 결과에 따라 유사 이미지들을 그룹핑하고, 각 그룹별로 대표 키워드를 추출하여 검색을 수행한 후 대표 이미지를 선정하여 출력하는, 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및 장치를 제공하는 것이다.

상기 기술적 과제는 본 발명에 따라, (a) 수집한 이미지들간의 유사도를 계산하는 단계; (b) 상기 유사도 값이 소정의 값 이상이 되는 유사 이미지들을 그룹으로 묶고, 대표 키워드를 추출하는 단계; 및 (c) 상기 그룹이 복수개가 존재할 때 , 상기 각각의 그룹에 대한 대표 키워드들에 대해 검색을 수행하여 대표 키워드에 대응되는 그룹의 대표 이미지를 출력하는 단계를 포함하는 것을 특징으로 하는 이미지 검색 방법에 의해 달성된다.

상기 (a) 단계는, (a1) 수집한 이미지 파일에 포함된 이미지 파일 특징 정보인 부가 데이터를 추출하는 단계; (a2) 이미지 파일에 포함된 실제 이미지를 복수개의 구역으로 나누어 각 구역의 데이터를 바이너리 데이터로 변환하는 단계; 및 (a3) 상기 부가 데이터와 상기 바이너리 데이터를 참조하여 각각의 이미지 파일 상호간의 유사도를 계산하는 단계를 포함하는 것이 바람직하다.

한편, 본 발명의 다른 분야에 따르면, 상기 기술적 과제는 인터넷 상의 데이터를 수집하여 이미지 파일을 저장하는 이미지 문서 저장부; 상기 저장된 이미지들간의 유사도를 계산하는 유사도 분석부; 상기 유사도 값이 소정의 값 이상이 되는 유사 이미지들을 그룹으로 묶고, 대표 키워드를 추출하는 대표 키워드 추출부; 및 상기 그룹이 복수개가 존재할 때, 상기 각각의 그룹에 대한 대표 키워드들에 대해 검색을 수행하여 대표 키워드에 대응되는 그룹의 대표 이미지를 출력하는 검색부를 포함하는 것을 특징으로 하는 이미지 검색 장치에 의해서도 달성된다.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대해 상세히 설명한다.

도 1은 유사한 이미지들을 묶어 그룹핑하고 각각의 그룹들마다 대표 키워드를 선정하여, 각 그룹별 이미지의 중요도에 따라 그 출력 위치를 정하여 사용자에게 제공하는 것을 설명하기 위한 참조도이다.

도 1을 참조하면, 인터넷 등을 통하여 수집한 이미지 정보들 중에서 유사한 이미지 정보들을 동일한 그룹으로 묶는다. 즉 하나의 검색어에 관한 내용을 여러 사이트에서 동일하게 포함하고 있을 수 있는데, 이러한 이미지 정보들을 하나의 그룹으로 묶는다.

즉, 유사한 이미지 정보들을 하나의 그룹으로 묶는다. 그리고, 하나의 그룹에 포함된 내용은 서로 유사한 내용이므로 중복 디스플레이를 방지하기 위하여 각 그룹에서 대표 이미지를 추출하고, 대표 이미지만을 사용자에게 디스플레이한다. 대표 이미지는 각각의 그룹을 대표하는 정보로써, 그룹내에서의 이미지들 중에서 가장 최근에 생성된 정보, 가장 큰 파일 크기를 갖는 정보 또는 가장 작은 파일 크기를 갖는 정보를 대표 이미지로 정할 수 있다. 대표 이미지의 선정은 설정에 따라 달라질 수 있다.

그리고 나서, 검색 결과의 디스플레이시에 그 출현 빈도가 높은 순서에 따라 사용자에게 먼저 보여줄 수 있다. 다시 말하면, 동일한 내용의 이미지 정보 출현 빈도가 높을수록 중요한 정보라고 판단하여 그 출력 우선순위를 높게 함으로써 사용자에게 가치 있는 정보를 눈에 잘 띄게 해 준다.

도 2는 본 발명의 일실시예에 따른, 이미지간의 유사도에 따라 그룹핑하여 이미지 검색을 수행하는 이미지 검색 방법의 흐름도이다.

우선 각 주제별로 이미지 정보를 수집하고(S210), 수집한 이미지들간의 유사도를 계산한다(S220). 유사도는 이미지 정보들이 담고 있는 내용이 서로 어느 정도 유사한지를 나타내는 값이다. 유사도는 각 이미지 정보들 간에 계산된다. 따라서 수집한 이미지 정보가 100개라고 하면 모든 이미지 정보에 대해 유사도를 계산하기 위해서는 100x100회의 계산이 필요하다. 유사도 계산과정의 상세한 설명은 도 3, 도 4a 내지 도 5b를 참조하여 후술한다. 유사도를 계산하여 유사한 이미지 정보들을 동일한 그룹으로 묶고 중복 이미지를 제거함으로써 대표 이미지를 추출한다(S230). 그리고 추출한 대표 이미지를 각 그룹의 중요도에 따라 출력한다(S240). 중요도는 그 내용을 포함하는 이미지 정보의 출현 빈도가 높은 그룹의 대표 이미지를 중요도가 높은 정보로 판단하여, 결과 출력 화면의 맨 처음에 위치시킨다거나, 또는 하이라이트 등의 수단을 사용하여 잘 보이도록 하여 출력한다.

도 3은 도 2의 이미지 검색 방법의 상세 흐름도이다.

도 3을 참조하면 우선, 이미지 파일간의 유사도를 계산하기 위하여 그 이미지 파일을 구성하는 부가 데이터를 추출한다(S310). 이미지 파일은 헤더인 부가 데이터와 실제 이미지 데이터를 포함하는데, 헤더에는 이미지 파일의 특징 정보가 기록되어 있다. 부가 데이터의 상세 구성에 대해서는 도 4a를 참조하여 후술한다. 그리고 나서, 이미지 데이터를 구역으로 나누어 각 구역의 데이터를 바이너리 데이터로 변환한다(S320). 예를 들어 320x240 크기의 이미지를 좌측 상단의 제1구역, 우측 상단의 제2구역, 좌측 하단의 제3구역, 우측 하단의 제4구역 및 중앙의 제5구역으로 나눌 수 있는데, 각 구역의 이미지 데이터를 MD5(Message Digest 5) 방법에 따라 바이너리 데이터(숫자열)로 변환하여 히스토그램을 만든다.

그리고, 부가 데이터 및 바이너리 데이터를 참조하여 각각의 이미지 파일간의 상호간 유사도를 계산한다(S330). 예를 들어, 부가 데이터에 기록된 파일의 크 기, 이미지의 크기, 파일 속성, 이미지 출처가 유사하다면 서로 유사한 이미지 파일일 가능성이 높으므로 유사도가 높아진다. 그리고 실제 이미지 데이터간의 유사도는 각 영역에 해당하는 바이너리 데이터에 포함된 '0'과 '1'의 개수의 비율에 따라 정해진다. 파일의 크기가 다른 경우에도 동일하거나 유사한 이미지가 될 수 있으므로 그 경우에도 서로 유사한 이미지인지를 판단하기 위해서는 '0'과 '1'의 개수가 아닌 그 비율을 고려하여야 한다.

유사도를 계산한 후에 유사 이미지들을 선정하여 하나의 그룹으로 묶고 각 그룹에 대한 대표 키워드를 추출한다(S340). 대표 키워드의 추출은 그룹내의 이미지들과 함께 포함되어 있는 단어열 패턴 중에서 가장 많이 발견된 단어열 패턴을 대표 키워드로 선정하여 추출한다. 그리고 추출된 대표 키워드에 대해 검색을 수행하여 검색결과를 사용자에게 제공한다(S350). 이하 도 4a 내지 도 5b를 참조하여 이미지 파일 상호간의 유사도를 계산하는 것에 대하여 상세히 설명한다.

도 4a 내지 도 4b는 이미지 파일을 구성하는 부가 데이터(410)의 내용과, 이미지 데이터(420)를 영역으로 나누어 바이너리 데이터로 변환하는 과정을 설명하기 위한 참조도이다.

도 4a에 도시한 바와 같이 각 이미지 파일은 부가 데이터(410)를 포함하고 있다. 부가 데이터(410)는 이미지 파일을 구성하는 데이터의 헤더라고 할 수 있다. 부가 데이터는 이미지 파일의 크기를 나타내는 파일 크기 필드(411), 실제 이미지의 가로x세로의 크기를 나타내는 이미지 크기 필드(412), 이미지 파일이 GIF 파일인지, JPG 파일인지 등을 나타내는 파일 속성 필드(413), 이미지 파일을 만든 제작 자 등의 정보를 담고 있는 이미지 출처 필드(414) 등을 포함하고 있다. 이러한 부가 데이터(410)가 상호 일치 또는 유사하다면 서로 동일한 파일 또는 유사한 파일로 볼 수 있다.

이하, 도 4b를 참조하여 이미지 파일을 구성하는 이미지 데이터(420)를 바이너리 데이터로 변환하는 것에 대하여 설명한다. 이미지 데이터(420)를 복수개의 구역으로 나눈다. 본 실시예에서는 좌측 상단의 영역 A(421), 우측 상단의 영역 B(422), 좌측 하단의 영역 C(423), 우측 하단의 영역 D(424) 및 중앙 영역 E(425)로 구성되어 있음을 알 수 있다. 그리고 각각의 영역의 데이터를 MD5와 같은 바이너리 코드 부호화 방법에 따라 숫자열로 변환한다. 이렇게 변환된 숫자열을 히스토그램(430)이라 한다. 본 실시예에서는 5개의 구역으로 나누었으나 구역의 분할은 경우에 따라 달리할 수 있다.

도 5a 내지 도 5b는 부가 데이터와 이미지 데이터를 참조하여 계산된 유사도와 각각의 이미지 파일에 대한 유사 이미지 파일 결과의 일예를 도시한 도면이다.

도 5a는 도 4a 내지 도 4b를 참조하여 전술한 예에서와 같이 각 이미지 파일에 대해 바이너리 데이터로 변환하여 유사도를 계산하여 유사한 이미지 파일을 찾는 것을 나타낸 일예이다. 도 5a를 참조하면, 이미지 1과 이미지 2와의 유사도는 75%이고, 이미지 1과 이미지 3과의 유사도는 4%이며, 이미지 1과 이미지 4와의 유사도는 96%이다. 유사도의 계산은 여러 가지 방법에 따라 수행될 수 있다. 예를 들어, 부가 데이터가 유사한 정도와 이미지 데이터가 유사한 정도에 대해 동일한 가중치를 두어 비교할 수 있고, 부가 데이터가 유사한 정도에 대하여 보다 많은 가중 치를 둘 수도 있다.

이미지 데이터의 유사 여부를 판단하는데 있어, 동일한 이미지가 서로 다른 크기인 경우가 있으므로 '0'과 '1'의 개수를 비교하는 것이 아니라 '0'과 '1'의 개수의 비율을 비교하면 보다 정확한 유사 정도의 판단이 가능하다.

도 5b는 도 5a와 같이 계산된 유사도 정보를 바탕으로 각 이미지 파일과 유사한 이미지 파일을 찾는 예를 나타낸 도면이다. 도 5b를 참조하면, 이미지 1과 유사한 이미지 파일은 25개가 존재하고 유사한 이미지 파일은 이미지 파일 B, 이미지 파일 D, 이미지 파일 G 등이 있음을 알 수 있다.

도 6은 본 발명의 일실시예에 따른, 유사도를 고려한 이미지 검색 장치의 구성도이다.

이미지 검색 장치는 웹 데이터 저장부(610), 이미지 문서 저장부(620), 유사도 분석부(630), 대표 키워드 추출부(640), 검색부(650) 및 정보 추천부(660)를 포함한다.

웹 데이터 저장부(610)는 인터넷 상에 존재하는 정보를 수집하여 저장하고 있다. 이미지 문서 저장부(620)는 이들 정보들 중에서 이미지 파일들을 저장한다. 유사도 분석부(630)는 전술한 바와 같이 이미지 파일을 구성하는 부가 데이터 및 이미지 데이터를 바탕으로 유사도를 계산하여 상기 이미지 파일을 그룹핑한다. 대표 키워드 추출부(640)는 각 그룹에 대해 대표 키워드를 추출한다. 대표 키워드는 전술한 바와 같이 이미지 파일과 함께 포함되어 있는 단어열 중 가장 많이 출현하는 단어열을 대표 키워드로 선정하여 추출한다.

한편 사용자는 검색부(650)에 검색어를 입력하면, 검색부(650)는 그에 대한 결과를 대표 키워드 추출부(640)를 검색하여 출력한다. 이때, 대표 키워드에 속한 그룹중 가장 많은 유사 이미지를 포함하고 있는 그룹의 대표 이미지를 검색결과 페이지의 상위에 위치시킨다. 정보 추천부(660)는 가치있는 이미지 파일을 미리 설정된 바에 따라 출력한다. 예를 들어, 인터넷 상에서 많이 출현하는 이미지 파일은 가치 있는 정보로 판단하여 사용자가 검색어를 입력하지 않아도 자동으로 대표 이미지로서 출력되도록 한다. 예를 들어 하루에 1000 회 이상 출현하는 이미지 파일은 사람들에게 이슈가 되는 중요한 내용이므로 이를 자동적으로 출력하도록 할 수 있다.

도 7a 내지 도 7b를 참조하면, 본 발명의 이미지 검색 방법에 따르면 중요도가 높은 이미지 파일을 출력 화면상의 상위에 위치시키고 중복된 이미지들을 출력하지 않음을 알 수 있다. 유사도의 판단은 전술한 방법에 따라 이루어지며 하나의 그룹에 속한 유사한 이미지들이 많을수록 상대적으로 중요한 이미지로 판단한다. 예를 들어, 검색창에서 "우유"를 입력하면 검색결과를 출력하되 가장 중요한 이미지를 우선적으로 출력한다.

이미지(700)는 실제 이미지(710) 및 그에 연결된 단어열(720)을 포함하고 있고, 동일한 이미지(700)를 구성하는 서로 다른 출처(810 내지 830)가 복수개 존재함을 알 수 있다. 복수개의 출처(810 내지 830)에서 대표 이미지를 선정하는 것은 문자열, 파일 크기 등을 고려하여 선정할 수 있다. 사용자가 데이터를 수신하는 효율측면에서는 파일의 크기가 작은 것을 대표 이미지로 선정할 수 있으며, 서비스를 제공받는 질적인 측면에서는 파일의 크기가 큰 것을 대표 이미지로 선정할 수 있다.

한편, 전술한 이미지 검색 방법은 컴퓨터 프로그램으로 작성 가능하다. 상기 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 텍스트 검색 방법을 구현한다. 상기 정보저장매체는 자기 기록매체, 광 기록매체, 및 캐리어 웨이브 매체를 포함한다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

전술한 바와 같이 본 발명에 따르면, 이미지를 구역으로 나누어 유사도를 계산하고, 계산된 유사도에 따라 그룹화한 후 각 그룹내에서 대표 키워드를 선정하며, 각 대표 키워드에 대해 검색을 수행하여 대표 이미지를 출력함으로써, 사용자가 원하는 정보를 보다 정확하게 제공할 수 있으며, 유사한 이미지를 삭제함으로써 사용자가 검색결과 확인에 사용하는 불필요한 시간과 노력을 줄일 수 있다.

Claims

(a) 수집한 이미지들간의 유사도를 계산하는 단계;

(b) 상기 유사도 값이 소정의 값 이상이 되는 유사 이미지들을 그룹으로 묶고, 대표 키워드를 추출하는 단계; 및

(c) 상기 그룹이 복수개가 존재할 때, 상기 각각의 그룹에 대한 대표 키워드들에 대해 검색을 수행하여 대표 키워드에 대응되는 그룹의 대표 이미지를 출력하는 단계를 포함하는 것을 특징으로 하는 이미지 검색 방법.
제1항에 있어서, 상기 (a) 단계는

(a1) 수집한 이미지 파일에 포함된 이미지 파일 특징 정보인 부가 데이터를 추출하는 단계;

(a2) 이미지 파일에 포함된 실제 이미지를 복수개의 구역으로 나누어 각 구역의 데이터를 바이너리 데이터로 변환하는 단계; 및

(a3) 상기 부가 데이터와 상기 바이너리 데이터를 참조하여 각각의 이미지 파일 상호간의 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 이미지 검색 방법.
제2항에 있어서,

상기 (a1) 단계에서 부가 데이터는 이미지 파일의 헤더에 포함되어 있고, 상기 헤더는 이미지 파일의 크기, 이미지의 크기, 이미지 파일의 속성 및 이미지 파일의 출처 중 적어도 어느 하나를 포함하고 있는 것을 특징으로 하는 이미지 검색 방법.
제2항에 있어서,

상기 (a2) 단계에서 상기 실제 이미지를 5 개의 구역으로 나누어 각 구역의 데이터를 MD5 방법에 따라 바이너리 데이터로 변환하는 것을 특징으로 하는 이미지 검색 방법.
제2항에 있어서, 상기 (a3) 단계는

상기 부가 데이터의 유사 정도 및 상기 각각의 구역에 대한 바이너리 데이터에서의 '1'의 값의 비율의 유사 정도를 참조하여 각각의 이미지 파일 상호간의 유사도를 계산하는 것을 특징으로 하는 이미지 검색 방법.
제1항에 있어서, 상기 (b) 단계는

상기 계산된 유사도 값이 소정의 값 이상이 되는 유사 이미지들을 그룹으로 묶는 단계; 및

상기 이미지와 함께 제공되는 단어열 패턴 중 가장 많이 등장하는 단어열을 대표 키워드로 선정하는 단계를 포함하는 것을 특징으로 하는 이미지 검색 방법.
제1항에 있어서, 상기 (c) 단계는

(c1) 상기 그룹이 복수개가 존재할 때, 상기 각각의 그룹에 대한 대표 키워드들에 대해, 사용자로부터 입력받은 검색어를 가지고 검색을 수행하는 단계; 및

(c2) 상기 검색 결과와 일치하는 대표 키워드에 대응되는 그룹에서 이미지의 크기 또는 이미지 파일의 크기를 포함하는 이미지의 속성을 고려하여 대표 이미지를 선정하여 출력하는 단계를 포함하는 것을 특징으로 하는 이미지 검색 방법.
제7항에 있어서, 상기 (c2) 단계에서

복수개의 대표 이미지들간의 디스플레이 순위는 해당 그룹에 포함된 이미지 파일의 수가 많은 순서인 것을 특징으로 하는 이미지 검색 방법.
인터넷 상의 데이터를 수집하여 이미지 파일을 저장하는 이미지 문서 저장부;

상기 저장된 이미지들간의 유사도를 계산하는 유사도 분석부;

상기 유사도 값이 소정의 값 이상이 되는 유사 이미지들을 그룹으로 묶고, 대표 키워드를 추출하는 대표 키워드 추출부; 및

상기 그룹이 복수개가 존재할 때, 상기 각각의 그룹에 대한 대표 키워드들에 대해 검색을 수행하여 대표 키워드에 대응되는 그룹의 대표 이미지를 출력하는 검색부를 포함하는 것을 특징으로 하는 이미지 검색 장치.
제9항에 있어서, 상기 유사도 분석부는

상기 이미지 파일에 포함된 이미지 파일의 특징 정보인 부가 데이터를 추출하고, 상기 이미지 파일에 포함된 실제 이미지를 복수개의 구역으로 나누어 각 구역의 데이터를 바이너리 데이터로 변환하며, 상기 부가 데이터와 상기 바이너리 데이터를 참조하여 각각의 이미지 파일 상호간의 유사도를 계산하는 것을 특징으로 하는 이미지 검색 장치.
제10항에 있어서,

상기 부가 데이터는 이미지 파일의 헤더에 포함되어 있고, 상기 헤더는 이미지 파일의 크기, 이미지의 크기, 이미지 파일의 속성 및 이미지 파일의 출처 중 적어도 어느 하나를 포함하고 있는 것을 특징으로 하는 이미지 검색 장치.
제10항에 있어서,

상기 실제 이미지를 5 개의 구역으로 나누어 각 구역의 데이터를 MD5 방법에 따라 바이너리 데이터로 변환하는 것을 특징으로 하는 이미지 검색 장치.
제9항에 있어서, 상기 대표 키워드 추출부는

상기 계산된 유사도 값이 소정의 값 이상이 되는 유사 이미지들을 그룹으로 묶고, 상기 이미지와 함께 제공되는 단어열 패턴 중 가장 많이 등장하는 단어열을 대표 키워드로 선정하는 것을 특징으로 하는 이미지 검색 장치.
제9항에 있어서, 상기 검색부는

상기 그룹이 복수개가 존재할 때, 상기 각각의 그룹에 대한 대표 키워드들에 대해, 사용자로부터 입력받은 검색어를 가지고 검색을 수행하고, 상기 검색 결과와 일치하는 대표 키워드에 대응되는 그룹에서 이미지의 크기 또는 이미지 파일의 크기를 포함하는 이미지의 속성을 고려하여 대표 이미지를 선정하여 출력하는 것을 특징으로 하는 이미지 검색 방법.
제9항 내지 제14항 중 어느 한 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.