KR20050014918A - 데이터베이스에서의 데이터 객체의 분류 장치 및 방법 - Google Patents

데이터베이스에서의 데이터 객체의 분류 장치 및 방법

Info

Publication number
KR20050014918A
KR20050014918A KR10-2005-7000190A KR20057000190A KR20050014918A KR 20050014918 A KR20050014918 A KR 20050014918A KR 20057000190 A KR20057000190 A KR 20057000190A KR 20050014918 A KR20050014918 A KR 20050014918A
Authority
KR
South Korea
Prior art keywords
data object
additional
parameter
database
classification
Prior art date
Application number
KR10-2005-7000190A
Other languages
English (en)
Inventor
마르텐 피. 보들라엔데르
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050014918A publication Critical patent/KR20050014918A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

저장 매체의 용량을 증가시킴으로써 데이터베이스는 더 커지게 된다. 이것은 사진 및 영화와 같은 데이터 객체의 검색을 개선하는 효과적인 분류 방법을 요구한다. 사진은 생성 날짜, 시간 및 장소에 관련된 메타데이터를 운반할 수 있다. 이것은 검색에 도움을 주지만, 많은 메타데이터가 체크되어야 하기 때문에 빠른 서치 및 검색을 방해한다. 본 발명은 데이터 객체를 분류 파라미터와 연관시킴으로써 데이터 객체를 분류하는 방법을 제안한다. 각 분류 파라미터는, 하나 이상의 메타데이터 파라미터의 값이 특정 범위 내에 있을 때 데이터 객체와 연관된다. 유리한 실시예는 데이터베이스 자체로부터 분류를 위해 기준을 추출함으로써 자동 분류에 대한 가능성을 제공한다. 이것은, 분류 파라미터를 위한 동일한 값을 갖는 데이터 객체 사이에 유사성을 체크함으로써 이루어진다. 유사성은 예를 들어 데이터 객체의 생성에 관련된 매타데이터의 값에 기초한다.

Description

데이터베이스에서의 데이터 객체의 분류 장치 및 방법{METHOD AND APPARATUS FOR CLASSIFICATION OF A DATA OBJECT IN A DATABASE}
그러한 방법은 유럽 특허 출원 EP-A-0 959 418에 알려져 있다. 상기 특허는 그러한 방법을 이용하는 디지털 이미지 검색 시스템을 제공한다. 이 시스템은 저장된 복수의 디지털 이미지를 갖는 이미지 데이터베이스를 포함하고, 상기 복수의 디지털 이미지 각각은 이와 연관된 복수의 파라미터 중 적어도 하나를 갖는다. 파라미터는, 화상이 취해진 장소의 지리적 위치, 화상이 취해진 날짜 및/또는 이미지의 다른 특성을 나타낼 수 있다. 이미지는 주어진 시간 및 날짜와 같은 직접적인 질의뿐 아니라 '매핑된 질의(mapped query)'에 의해 검색될 수 있고: '저녁'과 같은 질의를 입력하는 것은 5pm 내지 8pm의 시간 범위로 해석될 수 있다.
또한, '뉴욕에서의 여름'이라는 질의가 입력될 수도 있다. 이 경우에, 날짜 및 지리적 장소에 대한 파라미터가 체크될 것이다. 날짜를 나타내는 제 1 파라미터에 대해, 모든 이미지는, 제 1 파라미터의 값이 6월 21일 내지 9월 23일의 기간 내에 있는지가 검색되어야 한다. 지리적 장소가 좌표로 표시될 때, 심지어 2개의 값은 이 값이 존재하는 범위에 대해 체크되어야 한다.
이것은, 특히 다수의 변수를 갖는 질의가 입력될 때 이미지 검색 절차를 매우 느리게 진행시킨다는 것을 당업자는 이해할 것이다.
본 발명은 데이터베이스에서의 데이터 객체 분류 방법에 관한 것으로, 상기 데이터 객체는 이와 연관된 적어도 하나의 소스 파라미터를 구비한다.
본 발명은 또한 데이터베이스에서의 데이터 객체 분류 장치에 관한 것으로, 상기 데이터 객체는 이와 연관된 적어도 하나의 소스 파라미터를 구비하고, 상기 장치는 상기 데이터베이스 저장용 저장 디바이스와, 데이터 객체 수신 수단과, 중앙 처리 장치를 포함한다.
도 1은 이와 연관된 소스 파라미터를 갖는 데이터 객체를 포함하는 데이터베이스를 도시한 도면.
도 2는 소스 파라미터 및 이와 연관된 분류 파라미터를 갖는 데이터 객체를 포함하는 데이터베이스를 도시한 도면.
도 3은 데이터 객체의 분류를 위한 기준을 포함하는 테이블을 도시한 도면.
도 4는 본 발명에 따른 방법의 일실시예를 도시한 흐름도.
도 5는 주변 기기와 함께 본 발명에 따른 장치의 일실시예를 도시한 도면.
도 6은 본 발명에 따른 컴퓨터 판독가능 매체의 일실시예를 도시한 도면.
본 발명의 목적은, 서치 및 검색 시간을 감소시키는 분류 방법을 제공하는 것이다.
본 목적은 분류 파라미터를 데이터 객체와 연관시킴으로써 본 발명에 따른 방법에 의해 달성되며, 여기서 분류 파라미터는, 소스 파라미터의 값이 적어도 하나의 기준을 충족시킬 때 데이터 객체와 연관된다.
이러한 방식으로, 데이터 객체는 질의 및 서치 이전에 분류될 수 있고, 서치는 하나의 파라미터에만, 즉 분류 파라미터에만 목표를 할 수 있다. 이것은 특히 다수의 변수를 갖는 질의가 입력될 때, 서치 시간을 크게 감소시킨다. 이것은 종래 기술에 비해 주요한 장점이다.
본 발명에 따른 방법의 일실시예에서, 데이터베이스는 이와 연관된 적어도 하나의 추가 소스 파라미터를 갖는 추가 데이터 객체를 포함하고, 상기 방법은, 각 유사한 데이터 객체와 연관된 적어도 하나의 추가 분류 파라미터를 갖는 유사한 추가 데이터 객체를 식별하는 단계로서, 여기서 상기 유사한 추가 데이터 객체의 분류 파라미터는 동일한 값을 갖는, 추가 데이터 객체의 식별 단계와; 동일한 추가 분류 파라미터를 갖는 유사한 추가 데이터 객체의 추가 소스 파라미터의 값의 유사성을 식별하는 단계와; 상기 데이터 객체가 추가 데이터 객체와 유사할 때 추가 분류 파라미터를 데이터 객체와 연관시키는 단계를 포함한다.
이러한 실시예의 장점은, 일단 약간의 데이터 객체가 분류되었으면, 본 발명에 따른 방법의 이 실시예를 이용하여, 미리 결정된 값을 구비한 분류 파라미터를 데이터 객체와 연관시키는 기준(유사성 기준)이 식별될 수 있고, 다른 데이터 객체가 분류될 수 있다는 점이다. 이 실시예의 장점은, 이러한 방식으로, 데이터 객체의 분류가 자동화될 수 있다는 점이다.
본 발명에 따른 방법의 일실시예에서, 추가 분류 파라미터의 값과, 상기 값을 갖는 추가 분류 파라미터에 새로운 데이터 객체를 연관시키는 기준으로서 유사성은 추가 데이터베이스에 저장된다.
테이블과 같은 추가 데이터베이스에서 미리 결정된 값을 갖는 분류 파라미터와 데이터 객체를 연관시키는 기준을 저장함으로써, 유사성에 대한 기준은, 데이터 객체가 분류되어야 할 때마다 데이터베이스로부터 발견될 필요가 없다. 이것은 특히 대형 데이터베이스에서 데이터 객체의 분류에 필요한 시간을 감소시킨다.
본 발명에 따른 장치에서, 중앙 처리 장치는, 소스 파라미터가 적어도 하나의 기준을 충족시킬 때 분류 파라미터를 데이터 객체와 연관시키도록 인식된다.
본 발명의 일실시예는 컴퓨터-판독가능 매체인데, 이 매체는 컴퓨터에 의해판독가능하고 수행가능한 명령을 포함하고, 여기서 상기 명령은 컴퓨터로 하여금 제 1항에 한정된 방법을 수행하도록 한다.
본 발명의 실시예는 도면에 의해 이제 제공될 것이다.
도 1은 수 개의 데이터 객체(102, 104, 106, 108, 110, 112, 114, 116, 118)를 포함하는 데이터베이스(100)를 도시한다. 이러한 데이터베이스는 이후에 논의될 장치에 저장될 것이다. 데이터 객체(102, 104, 106, 108, 110, 112, 114, 116, 118)는 정지 화상 이미지, 오디오-비디오 데이터 스트림 또는 텍스트 문서일 수 있다. 이러한 목록이 한정되지 않음을 당업자는 인식할 것이다. 여기에 설명된 실시예에서, 데이터 객체는 정지 화상 이미지(특히 사진), 및 오디오 비디오 데이터를 갖는 스트림이다. 도면에서, 사진은 큰 정사각형으로 표시되는 반면, 오디오-비디오 데이터를 갖는 스트림은 큰 삼각형으로 표시된다.
사진은 소스 파라미터와 연관되는데, 예를 들어 사진(104)은 제 1 소스 파라미터(151), 제 2 소스 파라미터(152) 및 제 3 소스 파라미터(153)와 연관된다. 이러한 소스 파라미터들은 데이터 소스에 대한 정보를 제공한다. 이러한 정보는 데이터 객체의 지리적 장소, 데이터 객체의 생성 데이터, 데이터 객체의 생성 시간, 데이터 객체의 생성자(creator) 이름 또는 데이터 객체의 포맷에 관한 것이지만, 또한 다른 정보에도 소스 파라미터들이 제공될 수 있다. 데이터 포맷 파라미터는 압축 포맷(예를 들어 GIF 또는 JPEG) 또는 일종의 데이터(예를 들어 사진, 또는 오디오-비디오 데이터를 갖는 스트림)에 관한 것일 수 있다. 본 발명의 일실시예에서, 소스 데이터는 데이터 객체의 콘텐트에 관한 것이다. 예를 들어, 사진은 얼굴 분석 프로그램에 의해 분석되어, 사진에 있는 사람의 이름을 밝혀낸다. 사진에 있는 사람의 이름을 갖는 소스 파라미터는 분석 이후에 사진과 연관된다. 간략함을 위해, 단지 3개의 소스 파라미터만이 도 1에 도시된다.
소스 파라미터가 데이터 객체의 소스를 매우 잘 설명할지라도, 단일 소스 파라미터는 사진 또는 스트림의 콘텐트에 대해 그리 자세히 알려주지 않을 것이다. 그러나, 다수의 파라미터의 값은 사진의 콘텐트에 대한 표시(indication)를 매우 잘 제공할 것이다. 예를 들어, 피터라 불리는 어떤 사람이 2001년 4월에 북위 53°, 동경 4°의 좌표에서 찍은 사진은 "암스테르담에서의 휴가(holiday in Amsterdam)"를 나타낼 수 있다. 그러므로, 특수한 이벤트에 관련된 사진 및 스트림을 찾을 때, 수 개의 소스 파라미터에 대한 수 개의 기준을 갖는 질의는 데이터베이스(100) 상에서 실행될 것이다. 그러나, 이것은, 특히 특정 도시의 좌표 또는 나라를 나타내는 좌표 범위를 한정할 때 고역일 수 있다. 예를 들어 사용자에게 지도상에 지역을 그려서 지역을 한정하도록 하거나, 예를 들어 "여름"이라는 질의를 6월 21부터 9월 22일까지의 시간 기간에 매핑함으로써 서치를 용이하게 하는 수 개의 아이디어가 제안되었다. 이것은 특정 사진에 대한 검색을 용이하게 할 수 있지만, 질의 순간에 많은 처리를 필요로 하는데, 그 이유는, 모든 데이터 객체의 4개의 파라미터(포맷, 날짜, 장소, 생성자)가 판독되어야 하고, 비교되어야 하기 때문이다. 이것은 사용자에게 상당한 인내심을 요구할 수 있다.
그러므로, 사용자 뿐 아니라 데이터베이스(100)를 저장하기 위한 시스템으로 하여금 사진 및 스트림을 적어도 하나의 분류 파라미터와 연관시킴으로써 사진 및 스트림을 분류하도록 하는 것이 제안된다. 이것은, 피터라 불리는 어떤 사람이 2001년 4월에 북위 53°, 동경 4°의 좌표에서 찍은 모든 사진이 파라미터 "암스테르담에서의 휴가"와 연관된다는 것을 의미한다. 이것은 암스테르담에서 찍은 휴가 사진에 대한 검색을 크게 단순화시키는데, 그 이유는, 모든 데이터 객체의 하나의 파라미터, 즉 분류 파라미터만이 판독되고 비교되어야 하기 때문이다.
도 2는 도 1에 도시된 동일한 데이터 객체를 도시하지만, 도 1 외에도, 도 2의 몇몇 데이터 객체는 이와 연관된 하나 또는 2개의 분류 파라미터를 갖는다. 제 1 분류 파라미터(202)는 피터라 불리는 어떤 사람이 2001년 4월에 암스테르담에서 생성한 포맷 화상의 데이터 객체와 연관된다. 제 2 분류 파라미터(204)는 2001년 봄에 유럽에서 생성한 데이터 객체(데이터 포맷과 무관함)와 연관된다. 그 이유는,분류와의 연관이 데이터베이스(100)의 서치 가능성을 개선시키기 때문이다. 다수의 소스 파라미터의 값을 체크하기보다는 데이터베이스(100)에서의 모든 데이터 객체의 하나의 분류 파라미터만의 값을 체크하는 것이 더 쉽다. 더욱이, 사용자가 특정 범위에 있을 하나 이상의 소스 파라미터의 값을 규정하는 질의를 입력하기보다는 자연어로 질의를 입력하는 것이 더 편리하다.
그러므로, 데이터베이스(100)의 서치 및 검색 기능, 및 사용자 친밀도(friendliness)를 개선시키기 위해, 데이터 객체는, 적어도 하나의 소스 파라미터가 적어도 하나의 기준에 일치할 때, (2001년 여름에 중국으로 여행갔을 때 휴가 사진과 같은) 미리 결정된 분류 파라미터와 연관된다. 바람직한 실시예에서, 이것은, 데이터 객체가 나중 스테이지에서의 처리를 감소시키기 위해 데이터베이스(100)에 입력될 때 이루어진다. 그러나, 다수의 데이터 객체가 동시에 입력될 때, 이것은 많은 처리 능력이 연관 프로세스에 의해 소요되기 때문에 오래 걸릴 것이다. 그러므로, 다른 실시예에서, 객체가 입력된 후에 연관은 배경 작업으로서 발생한다.
특정 값을 갖는 분류 파라미터를 데이터 객체와 연관시키기 위해 충족될 데이터 객체의 하나 이상의 소스 파라미터의 하나 이상의 값에 대한 기준은 도 3에서 표(300)와 같은 다른 데이터베이스에 저장될 수 있다. 표(300)의 좌측 열은 분류 파라미터의 값을 나타낸다. 표(300)의 제 1 행은 소스 파라미터의 엔티티(entity)를 나타낸다. 본 발명의 이러한 실시예에서, 엔티티는 데이터 객체의 생성 장소("loc"), 생성 시간("tme"), 생성 날짜("dt") 및 문서의 생성자("crtr")이다.
연관 프로세스 동안, 데이터 객체의 소스 파라미터의 값은 표(300)에서 기준과 비교된다. 데이터 객체의 생성 장소가 범위(R1) 내에 있는 경우, 날짜는 값(V1)과 동일하고, 생성자는 V2와 동일하고, 데이터 객체는 값(C1)을 갖는 분류 파라미터와 연관된다. 전술한 바와 같이, 데이터 객체는 하나를 초과하는 분류 파라미터와 연관될 수 있다. 데이터 객체의 장소가 범위(R3) 내에 있고 시간이 범위(R4) 내에 있는 경우, 소스 파라미터는 추가 값(C3)을 갖는 추가 분류 파라미터와 연관된다.
표(300)는 사용자에 의해 생성될 수 있다. 상기 표는 또한 도 4에서의 흐름도(400)에 의해 도시된 프로세스에 의해 생성될 수 있다. 이러한 프로세스는 본 발명에 따른 방법의 일실시예이다. 분류될 데이터 객체를 갖는 데이터베이스가 분류된 데이터 객체를 이미 포함한다는 것이 가정된다. 이러한 데이터 객체는 예를 들어 도 3에 도시된 표(300)를 이용하여 사용자 또는 장치에 의해 분류될 것이다.
상기 프로세스는 분류될 데이터 객체를 선택함으로써 프로세스 단계(401)에서 시작한다. 프로세스 단계(401)는 데이터 객체를 데이터베이스에 입력함으로써 개시될 것이다. 후속적으로, 프로세스 단계(402)에서, 이미 분류된 데이터 객체가 검색되고 있다. 프로세스 단계(403)에서, 이미 분류된 데이터 객체는 분류 파라미터의 값마다 그룹 단위로 구분된다. 전술한 바와 같이, 데이터 객체는 이와 연관된 다수의 분류 파라미터를 가질 수 있다. 이 경우에, 데이터 객체는 다수의 그룹으로 구분된다.
데이터 객체가 적어도 하나의 분류 파라미터의 동일한 값마다 그룹화될 때,분류 파라미터의 동일한 값과의 데이터 객체의 유사성은 프로세스 단계(404)에서 식별된다. 프로세스 단계(404)는 2개의 하위 단계를 포함한다. 하위 단계(405)는 수치 소스 파라미터에 대해 수행되고, 하위 단계(406)는 문자 숫자식(alphanumerical) 소스 파라미터에 대해 수행된다. 하위 단계(405)에서, 값의 범위는 분류 파라미터의 동일한 값을 갖는 데이터 객체의 각 수치 소스 파라미터에 대해 결정된다. 하위 단계(406)에서, 각 문자 숫자식 소스 파라미터의 값이 결정된다. 특정한 문자 숫자식 소스 파라미터의 모든 값이 동일한 값을 가질 때, 이 값은 유사성에 대한 기준으로 간주된다.
다음 단계는 마찬가지로 2개의 하위 단계를 포함하는 프로세스 단계(407)이다. 프로세스 단계(407)에서, 분류될 객체가 이미 분류된 임의의 데이터 객체와 유사한지를 체크한다. 하위 단계(408)에서, 수치 소스 파라미터의 값이 각 소스 파라미터에 대한 유사성에 대해 한정된 범위 내에 있는지를 체크한다. 이러한 범위는 이미 설명된 바와 같이 하위 단계(405)에서 정의되었다. 하위 단계(409)에서, 문자 숫자식 소스 파라미터의 값이 이러한 각 소스 파라미터에 대한 유사성에 대해 한정된 값과 동일한지 체크한다. 이러한 값은 하위 단계(406)에서 정의되었다.
추가 실시예에서, 문자 숫자식 소스 파라미터의 값은 워드이고, 다른 언어에서의 동의어 및 워드는 또한 동일하므로 유사한 것으로 고려된다.
본 발명에 따른 방법의 또 다른 실시예에서, 유사성 기준은 문자 숫자식 값이 주어진 값, 예를 들어 90%를 초과한 값만큼 일치할 때 충족된다.
프로세스 단계(410)에서, 하위 단계(408)와 하위 단계(409)의 결과가 조합된다. 후속적으로, 결정 단계(411)에서, 하위 단계(408) 및 하위 단계(409)의 모든 테스트가 하나의 분류 파라미터에 대해 긍정적인 결과를 가지는지를 체크한다. 이것은, 분류될 데이터 객체의 모든 소스 파라미터의 모든 값이 유사성에 대한 모든 기준에 일치한다는 것을 의미한다. 이것이 사실일 때, 데이터 객체는 모든 유사성 기준에 일치하게 된 값을 갖는 분류 파라미터와 연관된다. 이것은 프로세스 단계(420)에서 수행된다. 이후에, 프로세스는 종료(412)에서 종료한다.
하위 단계(408) 및 하위 단계(409)의 모든 테스트가 긍정적인 결과를 갖지 않는다고 결정 단계(411)에서 나타날 때, 프로세스는 결정 단계(411) 이후에 종료(412)에서 종료한다.
본 발명의 다양한 다른 실시예는 출발점으로서 방금 설명되었던 실시예를 취한다. 하나의 다른 실시예에서, 분류될 데이터 객체가 이미 분류된 데이터 객체와 유사한지를 체크할 때, 특정한 미리 결정된 소스 파라미터의 값만이 분류될 데이터 객체의 모든 소스 파라미터의 값 대신에 체크된다.
본 발명의 다른 실시예에서, 흐름도(400)의 프로세스 단계(404)에서 유도된 유사성에 대한 기준은 다른 형태의 표 또는 데이터베이스에 저장된다. 이 표는 도 3에서의 표(300)와 유사하게 설정될 수 있다. 본 발명의 또 다른 실시예에서, 흐름도(400)는 추가 프로세스 단계로 확장된다. 이러한 프로세스 단계는 프로세스 단계(401)와 프로세스 단계(402) 사이에 있을 수 있다. 추가 프로세스 단계에서, 유사성에 대한 기준을 갖는 표는, 유사성이 표에 이미 저장된 분류 파라미터의 특정 값을 갖는 데이터 객체와 분류될 데이터 객체 사이에 유사성이 있는지를 체크한다.유사성이 발견되지 않으면, 흐름도(400)에 의해 설명된 프로세스는 계속된다.
본 발명의 또 다른 실시예에서, 유사성에 대한 기준은, 프로세스 단계(404)만을 수행하고 이전 실시예에 기재된 바와 같이 표를 갱신함으로써 주기적으로 식별된다. 데이터 객체가 데이터베이스에 입력되거나 다른 방법으로 분류되는 것으로 목표가 정해질 때, 표에서 유사성 기준만이 데이터 객체가 분류되어야 할지와, 만약 그렇다면, 데이터 객체가 어떻게 분류되어야 하는지를 결정하도록 체크된다.
본 발명에 따른 방법의 다른 실시예에서, 분류 파라미터는 또한 데이터 객체와 수동으로 연관될 수 있다. 유사하게, 분류 파라미터는 또한 데이터 객체와 수동으로 연관 해제(de-associated)될 수 있다. 분류 파라미터를 데이터 객체와 수동으로 연관시키는 것은, 이러한 데이터 객체가 분류될 데이터베이스에서 첫 번째로 있을 때 자동 분류 절차를 개시할 것이다. 분류 파라미터가 데이터 객체와 연관 해제될 때, 이것은, 유사한 데이터 객체가 미래에 상기 분류 파라미터와 연관되지 않는 방식으로 나타나는 것이 바람직하다.
도 5는 본 발명에 따른 장치의 일실시예로서 장치(500)를 도시한다. 장치(500)는 중앙 처리 장치(CPU)(501)와, 버퍼(503)와, 하드디스크와 같은 대용량 저장 디바이스(502)와, 비디오 프로세서(504)를 포함한다. 장치(500)는 데이터 객체를 수신하기 위한 제 1 연결기(511)와, 사용자 입력을 수신하기 위한 제 2 연결기(512)와, 비디오 신호를 TV 세트(540)에 제공하기 위한 제 3 연결기(513)를 더 포함한다.
장치(500)는 다음과 같이 동작한다. 버퍼(503)는 제 1 연결기(511)에 연결되는 디지털 사진 카메라(520)로부터 데이터 객체를 수신한다. 이러한 데이터 객체는 사진 또는 오디오-비디오 데이터 스트림일 수 있다. 버퍼(503)에서, 데이터 객체의 소스 파라미터가 판독된다. 그 결과는 CPU(501)에 의해 처리되며, 상기 CPU는 데이터 객체가 분류될 수 있는지, 만약 그렇다면, 데이터 객체가 어떻게 분류될 수 있는지를 체크한다. 분류 프로세스는 도 4를 참조하여 설명된 바와 같이 본 발명에 따른 방법의 실시예들 중 임의의 실시예일 수 있다.
데이터 객체가 알려진 유사성 기준에 기초하여 분류될 수 있을 때, 버퍼(503)에서의 데이터 객체는 분류 파라미터와 연관되고, 대용량 저장 디바이스(502)에 저장된다.
디지털 사진 카메라(520)에 의해 생성된 데이터 객체의 분류 및 저장은 자동으로 처리될 수 있다. 그러나, 분류는, 키보드(531) 및 트랙볼(532)을 포함하는 입력 수단(530)을 이용하여 사용자에 의해 또한 이루어질 수 있다. 사용자 입력 수단(530)은 데이터를 도 3에 도시된 표(300)에 추가함으로써 분류를 위한 유사성 기준을 생성하는데 또한 사용될 수 있다.
대용량 저장 디바이스(502)에 저장된 데이터 객체는 TV-세트(540)의 스크린(541) 상에 표시될 수 있다. 사용자는 사용자 입력 수단(530), 및 스크린(541) 상에 표시된 그래픽 사용자 인터페이스(GUI)(미도시)에 의해 하나 이상의 데이터 객체를 선택할 수 있다. 대용량 저장 디바이스(502)에 저장된 데이터 객체를 선택할 때, 데이터 객체는 비디오 프로세서(504)에 로딩된다. 비디오 프로세서(504)는 데이터 객체를 처리하여, TV-세트(540) 상에 표현가능한 신호를 제공한다. 이러한 방식으로, 디지털 사진 카메라(520)에 의해 생성된 이미지 또는 오디오-비디오 스트림은 TV-세트(540)의 스크린(541) 상에 보여질 수 있다. 추가 실시예에서, TV-세트(540)는 네트워크를 통해 장치(500)에 연결된 원격 디스플레이로 교체될 수 있다.
대용량 저장 디바이스(500)에 저장된 데이터 객체에 대한 질의는 다수일 수 있다. 예를 들어, 사용자는, 일치하는 값을 갖는 분류 파라미터를 찾기 위해 질의를 입력함으로써 사용자가 2002년 여름에 파리에서 찍은 모든 사진을 검색하도록 질의를 입력할 수 있다. 그러나, 이 질의는 또한 소스 파라미터에 관한 것일 수 있지만, 물론 분류 파라미터의 하나의 값에 대한 서치는 수 개의 소스 파라미터의 특정 값에 대한 서치보다 시간이 적게 걸릴 것이다.
설명된 바와 같이, 장치(500)는 본 발명에 따른 방법을 수행하는 전용 장치이다. 본 발명의 추가 실시예에서, 개인용 컴퓨터와 같은 일반적인 용도의 계산 장치의 중앙 처리 장치는 본 발명에 따른 방법을 수행하도록 프로그래밍된다. 중앙 처리 장치를 프로그래밍하는 명령은 레코드 캐리어(record carrier) 상에 저장된다.
이들 모두 도 6a 및 도 6b에 도시된다. 도 6a는 본 발명에 따른 컴퓨터-판독가능 및 수행가능 명령을 포함하는 레코드 캐리어의 일실시예로서 플로피 디스크(610)를 도시한다. 플로피 디스크(610) 상의 정보는 플로피 디스크 드라이브(621)에 의해 개인용 컴퓨터(620)에 의해 판독될 수 있다. 플로피 디스크(610) 상에 저장된 명령은 플로피 디스크 드라이브(621)를 통해 중앙 처리 장치(CPU)(622)로 송신되어, CPU(622)가 본 발명에 따른 방법을 수행하도록 한다.
CPU(622)는 입력 버퍼(623)를 제어하고, 디지털 사진 카메라(624)는 연결기(625)에 의해 상기 입력 버퍼(623)에 연결될 수 있다. 제공된 실시예에서, 디지털 사진 카메라(624)와 개인용 컴퓨터(620) 사이의 연결기 및 연결은 USB 형태이다.
설명된 바와 같이, CPU(622)에 의해 판독된, 플로피 디스크(610) 상의 명령은, CPU(622)로 하여금 본 발명에 따른 방법을 수행하도록 하고, 입력 버퍼(623)에서 데이터 객체를 분류하도록 한다. 분류될 지와, 만약 그렇다면, 데이터가 어떻게 분류될 지에 대한 정보는 개인용 컴퓨터(620)가 포함한 하드디스크(626)에 저장된다. 데이터 객체가 분류된 후에, 또는 분류에 대한 일치 기준이 발견되지 않기 때문에 분류하지 않는다는 결정이 취해진 후에, 데이터 객체는 하드디스크 시스템(626)에 저장된다. 하드디스크 시스템(626)으로부터, 데이터 객체는 미래 이용을 위해 검색될 수 있다.
본 발명은 다음과 같이 요약될 수 있다.
저장 매체의 용량이 증가하면, 데이터베이스가 더 커지게 된다. 이것은 사진 및 영화와 같은 데이터 객체의 검색을 개선시키기 위한 효과적인 분류 방법을 요구한다. 사진은 생성 날짜, 생성 시간 및 생성 장소에 관련된 메타데이터를 전달할 것이다. 이것은 검색에 도움을 주지만, 조합된 질의는 다수의 메타데이터가 체크되어야 할 때 빠른 서치 및 검색을 방해한다. 본 발명은 데이터 객체를 분류 파라미터와 연관시킴으로써 데이터 객체를 분류하는 방법을 제안한다. 각 분류 파라미터는, 하나 이상의 메타데이터 파라미터 값이 특정 범위 내에 있을 때 데이터 객체와 연관된다. 유리한 실시예는 데이터베이스 자체로부터 분류를 위한 기준을 추출함으로써 자동 분류에 대한 가능성을 제공한다. 이것은, 분류 파라미터에 대한 동일한 값을 갖는 데이터 객체들 사이에 유사성을 체크함으로써 이루어진다. 유사성은 예를 들어 데이터 객체의 생성에 관련된 메타데이터의 값에 기초한다.
상술한 바와 같이, 본 발명은 데이터베이스에서의 데이터 객체 분류 방법, 및 데이터베이스에서의 데이터 객체 분류 장치 등에 이용된다.

Claims (18)

  1. 데이터베이스에서의 데이터 객체의 분류 방법으로서, 상기 데이터 객체는 분류 파라미터를 상기 데이터 객체와 연관시킴으로써 상기 데이터 객체와 연관된 적어도 하나의 소스 파라미터를 갖고, 여기서 상기 분류 파라미터는, 상기 소스 파라미터의 값이 적어도 하나의 기준을 충족할 때, 상기 데이터 객체와 연관되는, 데이터베이스에서의 데이터 객체의 분류 방법.
  2. 제 1항에 있어서, 상기 분류 파라미터는, 상기 데이터 객체가 상기 데이터베이스에 입력될 때, 상기 데이터 객체와 연관되는, 데이터베이스에서의 데이터 객체의 분류 방법.
  3. 제 1항에 있어서, 상기 기준은, 상기 소스 파라미터의 값이 미리 결정된 범위 내에 있다는 것인, 데이터베이스에서의 데이터 객체의 분류 방법.
  4. 제 3항에 있어서, 상기 소스 파라미터는 상기 데이터 객체 생성의 지리적(geographical) 장소를 나타내고, 상기 기준은, 상기 소스 파라미터의 값이, 상기 데이터 객체의 생성이 미리 결정된 영역에서 발생하도록 이루어진다는 것인, 데이터베이스에서의 데이터 객체의 분류 방법.
  5. 제 1항에 있어서, 상기 기준은, 상기 소스 파라미터의 값이 미리 결정된 값과 동일한 것인, 데이터베이스에서의 데이터 객체의 분류 방법.
  6. 제 1항에 있어서, 상기 데이터베이스는 추가 데이터 객체와 연관된 적어도 하나의 추가 소스 파라미터를 갖는 추가 데이터 객체를 포함하고, 상기 방법은,
    각 유사한 데이터 객체와 연관된 적어도 하나의 추가 분류 파라미터를 갖는 유사한 추가 데이터 객체를 식별하는 단계로서, 상기 유사한 추가 데이터 객체의 추가 분류 파라미터는 동일한 값을 갖는, 유사한 추가 데이터 객체 식별 단계와,
    동일한 추가 분류 파라미터를 갖는 상기 유사한 추가 데이터 객체의 추가 소스 파라미터의 값의 유사성을 식별하는 단계와,
    상기 데이터 객체가 상기 추가 데이터 객체와 유사할 때 상기 추가 분류 파라미터를 상기 데이터 객체와 연관시키는 단계를
    포함하는, 데이터베이스에서의 데이터 객체의 분류 방법.
  7. 제 6항에 있어서, 상기 추가 분류 파라미터의 값 및 유사성은 새로운 데이터 객체를 상기 값을 갖는 상기 추가 분류 파라미터와 연관시키기 위한 기준으로서 추가 데이터베이스에 저장되는, 데이터베이스에서의 데이터 객체의 분류 방법.
  8. 제 7항에 있어서, 상기 방법은, 상기 데이터 객체의 소스 파라미터가 상기 추가 데이터베이스에 저장된 적어도 하나의 기준과 일치하는지를 체크하기 위해 상기 추가 데이터베이스를 서치하는 단계를 포함하는, 데이터베이스에서의 데이터 객체의 분류 방법.
  9. 제 6항에 있어서, 상기 추가 소스 파라미터의 값은 문자 숫자식 스트링(alphanumerical string)이고, 유사성은 동일한 값을 갖는 상기 추가 소스 파라미터로서 식별되는, 데이터베이스에서의 데이터 객체의 분류 방법.
  10. 제 6항에 있어서, 상기 추가 소스 파라미터의 값은 수치 값이고, 상기 유사성은 미리 결정된 범위에서 그 값을 갖는 상기 추가 소스 파라미터로서 식별되는, 데이터베이스에서의 데이터 객체의 분류 방법.
  11. 제 3항에 있어서, 상기 소스 파라미터는 다음의 엔티티(entity), 즉
    상기 데이터 객체 생성의 지리적 장소와,
    상기 데이터 객체의 생성 날짜와,
    상기 데이터 객체의 시간과,
    상기 데이터 객체의 생성자(creator)의 이름과,
    상기 데이터 객체의 데이터 포맷
    중 적어도 하나를 나타내는, 데이터베이스에서의 데이터 객체의 분류 방법.
  12. 제 1항에 있어서, 상기 분류 파라미터는 이벤트에 대응하는, 데이터베이스에서의 데이터 객체의 분류 방법.
  13. 제 1항에 있어서, 상기 데이터 객체는 정지 화상 이미지인, 데이터베이스에서의 데이터 객체의 분류 방법.
  14. 제 1항에 있어서, 상기 데이터 객체는 오디오 비디오 정보 스트림인, 데이터베이스에서의 데이터 객체의 분류 방법.
  15. 제 1항에 있어서, 상기 분류 파라미터는 사용자에 의해 상기 데이터 객체와 연관되는, 데이터베이스에서의 데이터 객체의 분류 방법.
  16. 제 1항에 있어서, 상기 기준은 추가 데이터베이스에 저장되는, 데이터베이스에서의 데이터 객체의 분류 방법.
  17. 데이터베이스에서의 데이터 객체의 분류 장치로서, 상기 데이터 객체는 이와 연관된 적어도 하나의 소스 파라미터를 갖고, 상기 장치는 상기 데이터베이스를 저장하기 위한 저장 디바이스와, 데이터 객체를 수신하기 위한 수단과, 중앙 처리 장치를 포함하고, 여기서 상기 중앙 처리 장치는, 상기 소스 파라미터가 적어도 하나의 기준을 충족할 때 분류 파라미터를 상기 데이터 객체와 연관시키도록 고안되는, 데이터베이스에서의 데이터 객체의 분류 장치.
  18. 명령을 포함하는 컴퓨터-판독가능 매체로서, 상기 명령은 컴퓨터에 의해 판독가능하고, 수행가능하며, 여기서 상기 명령은 컴퓨터로 하여금 제 1항에 따른 방법을 수행하도록 하는, 컴퓨터-판독가능 매체.
KR10-2005-7000190A 2002-07-09 2003-06-27 데이터베이스에서의 데이터 객체의 분류 장치 및 방법 KR20050014918A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02077765.2 2002-07-09
EP02077765 2002-07-09
PCT/IB2003/002911 WO2004006128A2 (en) 2002-07-09 2003-06-27 Method and apparatus for classification of a data object in a database

Publications (1)

Publication Number Publication Date
KR20050014918A true KR20050014918A (ko) 2005-02-07

Family

ID=30011180

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2005-7000190A KR20050014918A (ko) 2002-07-09 2003-06-27 데이터베이스에서의 데이터 객체의 분류 장치 및 방법

Country Status (7)

Country Link
US (1) US20060026127A1 (ko)
EP (1) EP1522029A2 (ko)
JP (1) JP2005532624A (ko)
KR (1) KR20050014918A (ko)
CN (1) CN100403302C (ko)
AU (1) AU2003281390A1 (ko)
WO (1) WO2004006128A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100854755B1 (ko) * 2006-05-08 2008-08-27 에스케이 텔레콤주식회사 객체 및 부분 이미지 비교에 의한 이미지 검색 서비스를제공하는 방법 및 시스템
US7831598B2 (en) 2006-07-06 2010-11-09 Samsung Electronics Co., Ltd. Data recording and reproducing apparatus and method of generating metadata

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7676739B2 (en) * 2003-11-26 2010-03-09 International Business Machines Corporation Methods and apparatus for knowledge base assisted annotation
GB0414332D0 (en) * 2004-06-25 2004-07-28 British Telecomm Data storage and retrieval
US7840586B2 (en) 2004-06-30 2010-11-23 Nokia Corporation Searching and naming items based on metadata
US20090064029A1 (en) * 2006-11-27 2009-03-05 Brightqube, Inc. Methods of Creating and Displaying Images in a Dynamic Mosaic
US8458606B2 (en) * 2006-12-18 2013-06-04 Microsoft Corporation Displaying relatedness of media items
US20090089711A1 (en) * 2007-09-28 2009-04-02 Dunton Randy R System, apparatus and method for a theme and meta-data based media player
US20090216792A1 (en) * 2008-02-25 2009-08-27 Sap Ag Embedded work process item management
US9818157B2 (en) 2008-10-07 2017-11-14 State Farm Mutual Automobile Insurance Company Method for using electronic metadata to verify insurance claims
US20110099199A1 (en) * 2009-10-27 2011-04-28 Thijs Stalenhoef Method and System of Detecting Events in Image Collections
US8478705B2 (en) * 2010-01-15 2013-07-02 International Business Machines Corporation Portable data management using rule definitions
US8666998B2 (en) 2010-09-14 2014-03-04 International Business Machines Corporation Handling data sets
US8949166B2 (en) 2010-12-16 2015-02-03 International Business Machines Corporation Creating and processing a data rule for data quality
US8898104B2 (en) 2011-07-26 2014-11-25 International Business Machines Corporation Auto-mapping between source and target models using statistical and ontology techniques
CN102323936A (zh) * 2011-08-31 2012-01-18 宇龙计算机通信科技(深圳)有限公司 对照片进行自动分类的方法及装置
KR101953305B1 (ko) 2012-01-04 2019-02-28 삼성전자주식회사 소셜 네트워크 서비스를 통한 콘텐트 리스트 제공 시스템 및 방법
CN103745262A (zh) * 2013-12-30 2014-04-23 远光软件股份有限公司 一种数据归集方法和装置
US10409453B2 (en) 2014-05-23 2019-09-10 Microsoft Technology Licensing, Llc Group selection initiated from a single item
CN110110122A (zh) * 2018-06-22 2019-08-09 北京交通大学 基于多层语义深度哈希算法的图像-文本跨模态检索

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744568A (ja) * 1993-07-30 1995-02-14 Mitsubishi Electric Corp 検索インタフェース装置
DE69712835T2 (de) * 1996-07-18 2002-09-19 Matsushita Electric Ind Co Ltd Gerät zur Unterstützung des Wiederauffindens von Daten
US6504571B1 (en) 1998-05-18 2003-01-07 International Business Machines Corporation System and methods for querying digital image archives using recorded parameters
US6606411B1 (en) * 1998-09-30 2003-08-12 Eastman Kodak Company Method for automatically classifying images into events
US6408301B1 (en) * 1999-02-23 2002-06-18 Eastman Kodak Company Interactive image storage, indexing and retrieval system
CN1132115C (zh) * 2000-02-21 2003-12-24 英业达股份有限公司 动态建立快速索引的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100854755B1 (ko) * 2006-05-08 2008-08-27 에스케이 텔레콤주식회사 객체 및 부분 이미지 비교에 의한 이미지 검색 서비스를제공하는 방법 및 시스템
US7831598B2 (en) 2006-07-06 2010-11-09 Samsung Electronics Co., Ltd. Data recording and reproducing apparatus and method of generating metadata

Also Published As

Publication number Publication date
WO2004006128A8 (en) 2005-03-17
WO2004006128A3 (en) 2004-07-01
US20060026127A1 (en) 2006-02-02
CN1666200A (zh) 2005-09-07
CN100403302C (zh) 2008-07-16
AU2003281390A1 (en) 2004-01-23
JP2005532624A (ja) 2005-10-27
WO2004006128A2 (en) 2004-01-15
EP1522029A2 (en) 2005-04-13

Similar Documents

Publication Publication Date Title
KR20050014918A (ko) 데이터베이스에서의 데이터 객체의 분류 장치 및 방법
US8874596B2 (en) Image processing system and method
JP5680063B2 (ja) デジタル写真のコレクションからのランドマーク
US8676001B2 (en) Automatic discovery of popular landmarks
WO2018072071A1 (zh) 知识图谱构建系统及方法
US7672508B2 (en) Image classification based on a mixture of elliptical color models
US7469257B2 (en) Generating and monitoring a multimedia database
JP2008276768A (ja) 情報検索装置及び方法
US7366710B2 (en) Apparatus for retrieving and presenting digital data
JP4240896B2 (ja) 画像分類システム
US20230086735A1 (en) Systems and methods for retrieving videos using natural language description
CN105159976A (zh) 图像文件的处理方法和系统
RU2568276C2 (ru) Способ извлечения полезного контента из установочных файлов мобильных приложений для дальнейшей машинной обработки данных, в частности поиска
JP7395377B2 (ja) コンテンツ検索方法、装置、機器、および記憶媒体
CN106033417B (zh) 视频搜索系列剧的排序方法和装置
CN113254665A (zh) 一种知识图谱扩充方法、装置、电子设备及存储介质
JP2002007413A (ja) 画像検索装置
WO2021042084A1 (en) Systems and methods for retreiving images using natural language description
KR20030062585A (ko) 멀티미디어 객체의 특징 기술정보 생성방법
US9020995B2 (en) Hybrid relational, directory, and content query facility
AU2021106751A4 (en) Point of interest (poi) review method and apparatus based on semantic classification
WO2004008344A1 (en) Annotation of digital images using text
JP2012043366A (ja) データ検索装置、データ検索方法及びプログラム
CN115033738A (zh) 一种标签扩展方法、装置、电子设备和存储介质
JP2023057658A (ja) 情報処理装置、情報を提供するためにコンピューターによって実行される方法、および、プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application