KR20030051594A - 물체를 화상으로 표현하고 검색하는 방법 및 장치 - Google Patents
물체를 화상으로 표현하고 검색하는 방법 및 장치 Download PDFInfo
- Publication number
- KR20030051594A KR20030051594A KR10-2003-7000150A KR20037000150A KR20030051594A KR 20030051594 A KR20030051594 A KR 20030051594A KR 20037000150 A KR20037000150 A KR 20037000150A KR 20030051594 A KR20030051594 A KR 20030051594A
- Authority
- KR
- South Korea
- Prior art keywords
- observation
- image
- descriptor
- viewing
- plane
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/752—Contour matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
화상으로 나타나는 물체를 표현하는 방법에 있어서, 물체의 복수의 관측면 기술자(view descriptor)-각 관측면 기술자는 물체의 상이한 관측면에 해당함-를 도출하는 단계, 및 둘 이상의 관측면 기술자를 연관시키는 단계를 포함하고, 각 관측면 기술자에 대해 각 관측면이 상기 화상으로 나타나는 물체의 관측면에 대응하는 때를 표시하는 단계를 포함한다.
Description
화상으로 나타나는 물체의 표현을 이용하여, 예컨대 화상 라이브러리에서 정지 또는 비디오 화상을 저장하는 것이 잘 알려져있다. 이 표현은 관심있는 물체를 포함한 화상이 검색될 수 있는 검색방법에서 사용된다. 이 표현은 색채, 질감 및 형상을 포함한 물체의 다양한 특징에 기초할 것이다.
물체의 형상을 화상으로 표현하는 다양한 방법이 잘 알려져 있다. 공지의 방법은 체인 코딩, 쿼드트리(quad-tree) 방법, 및 CSS(curvature scale space) 표현방법을 포함한다.
화상검색 시스템에서 검색을 수행하기 위해, 사용자는 찾는 물체의 스케치 또는 화상을 시스템에 제공하거나, 시스템에 저장된 물체의 관측면(view)을 선택함으로써 질의어를 입력한다. 그후 이 시스템은 상기 질의 물체의 표현을 유도해내거나 얻고 이 질의표현을 적절한 대조방법을 이용하여 데이터베이스에 저장된 화상의 표현과 비교한다. 가장 비슷한 것이 디스플레이장치에 표시된다.
대부분의 경우, 비디오 화상으로 나타나는 물체는 3차원의 실물을 2차원의 화상평면으로 투사한 것이다. 이렇게 화상으로 나타나는 물체의 2차원 형상 또는 윤곽, 및 눈에 보이는 물체표면의 색채 및 질감은 관측 위치, 관측 각도, 및 카메라와 광학 시스템 파라미터와 같은 요인에 달려 있다. 따라서, 물체는 각기 다른 관측면에 따라 윤곽, 형상, 색채, 질감 등이 상이한 특징을 가질 것이다.
참고로 공동계류중인 특허출원 PCT/GB00/01662 에는 화상으로 나타나는 물체를 표현하는 방법 및 장치에 대해 기재되어 있는데, 여기서 복수의 서로 다른 2차원 관측면에서의 물체의 표현이 유도되고 연관되어 물체를 표현한다. 바람직하게는, 이 표현은 물체의 형상으로 되어 있지만, 예컨대 상이한 관측면에서의 색채 또는 질감일 수도 있다.
상기 방법을 정지화상 또는 동영상 내에서 물체에 적용할 때, 상이한 관측면과 관련된 물체의 특징을 표현하기 위해 화상과 연관된 몇가지 형상 또는 다른 기술자(descriptor)가 있을 것이다. 그러나, 전형적으로 이러한 관측면들 중 어느 것은 원래의 화상내에서 보일 것이다. 이들 특징 중 몇몇은 물체의 보이지않는 부분과 연관될 수도 있고 물체의 3D 특성을 설명하기 위한 것만일 수도 있다.
물체의 여러 관측면 중 어느 것이 보이고 보이지 않는지를 결정할 수 없으면, 이 검색방법은 특정된 관측면을 정확히 찾을 수 없을 것이다. 예를 들면, 측면 관측면을 이용하여, 자동차를 표현하는 화상에 대한 검색은 자동차의 상면 및 정면 관측면도 찾을 것이다.
본 발명은 특히 예컨대 멀티미디어 데이터베이스에서 검색시 사용하기 위하여 물체를 화상으로 표현하는 방법 및 장치에 관한 것이다. 본 발명은 또한 화상으로 표현된 물체를 검색하는 방법 및 장치에 관한 것이다.
본 발명의 실시예는 첨부도면을 참조하여 설명될 것이다.
도 1은 본 발명의 일실시예에 따른 시스템 블록도,
도 2는 비디오 시퀀스로 물체를 표현한 것을 도시한 도면,
도 3은 정지화상으로 물체를 표현한 것을 도시한 도면,
도 4는 제 1 검색방법의 결과를 도시한 도면,
도 5는 제 2 검색방법의 결과를 예시한 도면이다.
본 발명의 아이디어는, 어떤 기술자가 그 기술자와 연결된 화상 또는 동영상 내에서의 가시적인 특징과 실제로 관련되는지를 기술하는 가시 플래그(visibility flag)를 사용하는 것이다.
이에 따라, 본 발명은 화상으로 나타나는 물체를 표현하는 방법을 제공하고, 이 방법은, 물체의 상이한 관측면에 대응하는 물체의 복수의 관측면 기술자를 유도해내는 단계와, 관측면이 상기 화상으로 나타나는 물체의 관측면에 대응할 때를 나타내는 단계를 포함한다.
PCT/GB00/01662에 개시된 본 발명에서 형상 기술자는 하나의 멀티미디어 콘텐트내에 제공된 물체와 연관된다. 이러한 기술자는 상이한 관측면으로부터 물체의 형상을 기술하였다. 이들 관측면은 멀티미디어 재료내에서 보일 수 있고 안보일 수도 있다. 가시 플래그는 이 가시성 정보를 저장할 것이다.
각 관측면에 대한 가시성 데이터를 얻어지면, 이 검색방법으로 필요할 때에 보이지 않는 관측면을 갖는 물체를 여과해낼 수 있다.
본 발명의 일실시예에 따른 시스템이 도 1에 도시되어 있다. 이 시스템은 시스템의 작동을 제어하는 컴퓨터와 같은 제어장치(2), 화상 및 텍스트를 포함한 출력을 표시하기 위해 제어장치(2)에 접속된 모니터와 같은 디스플레이 장치(4), 및 명령을 제어장치(2)로 입력하기 위한 마우스와 같은 위치지정장치(6)를 포함한다. 이 시스템은 또한 복수의 정지화상 및 비디오 시퀀스의 형태의 일군의 화상의 디지털 버전을 저장하는 화상 데이터베이스(8), 및 화상 데이터베이스(8)에 저장된 정지화상 및 비디오 시퀀스의 각각으로 나타나는 물체에 대한 기술자 정보를 저장하는 기술자 데이터베이스(10)(아래에서 상세히 설명)를 포함한다. 화상 데이터베이스(8) 및 기술자 데이터베이스(10)는 각각 제어장치(2)에 접속된다.
이 실시예에서, 시스템의 부품들이 화상 라이브러리와 같은 단일 장소에 제공되는데, 이 시스템의 구성요소들은 영구적으로 연결된다.
이하, 본 발명의 일실시예에 따라 물체에 대한 기술자를 유도해내는 방법에 대해 설명하기로 한다. 비교적 간단한 형상을 갖는 물체, 이 경우에는 원통형 물체에 대해 먼저 설명한다.
이 실시예에서는, 화상 데이터베이스(8)에 저장된 비디오 시퀀스에서, 원통형 물체가 두번 나타난다. 도 2를 참조하면, 첫번째는, 물체의 윤곽이 관측면 1, 즉 측면에서의 관측면에 해당하고, 두번째는, 물체의 윤곽이 관측면 3, 즉 측면 위쪽에서의 투시도에 해당한다.
데이터베이스 색인작성자는 두개의 윤곽이 동일한 물체이며 이 윤곽에 대응하는 3차원의 물체는 원통임을 인식한다. 관측면 1 및 관측면 3의 각각에 대해, CSS(curvature scale space) 표현을 사용한 형상 기술자가 유도된다. 또한, 이 데이터베이스 색인작성자는, 고려하고 있는 비디오 시퀀스에 나타나지 않는다 하더라도, 물체를 대표하는 것이라 생각되는 추가적인 관측면을 선택한다. 이 실시예에서, 원통의 위에서 관측한 관측면 2가 대표적으로 선택된다. 이 관측면의 CSS 표현도 얻어진다.
Farzin Mokhtarian, Sadegh Abbassi 와 Josef Kittler의 논문 "Robust and Efficient Shape Indexing through Curvature Scale Space", Proc. British Machine Vision Conference, pp. 53-62, Edinburgh, UK 1996 에는 CSS 표현의 방법에 대해 개시되어 있으며 참조로 본 명세서에 기술되어 있다. 간단히 말하면, 형상의 윤곽을 표현하는 곡선은 이 곡선을 부드럽게 함으로써 전개된다. 이 곡선은 상기 전개에서 수많은 다른 단계에서 고려된다. 구체적으로, 곡률 부호변환점(curvature zero crossing)은 전개의 각 단계에서 곡률함수에서 식별된다. 이 곡률 부호변환점 그래프는 전개의 모든 단계로부터 부호변환점을 결합함으로써 얻어진다. 그래프의 한 축은 곡선의 전개 파라미터를 나타내는 б에 대응하고 다른 축은 곡선 호 길이 파라미터 u에 대응한다. 이때 형상은 이 그래프에서 윤곽선의 최대의 위치로 표현된다.
각 관측면에 대해, 적절한 CSS 표현을 포함하여, 관측면 기술자가 형성된다. 관측면 기술자는 PCT/GB00/01662에 개시된 바와 같은 전체 파라미터 또는 대응하는가시 표면의 색채/질감 특성과 같은 다른 정보를 포함할 수도 있다.
이 관측면 형상 기술자는 3D 물체 형상 기술자를 형성하도록 결합된다. 또한, 주어진 관측면이 비디오 시퀀스의 적어도 한 프레임에서 보이는지 보이지 않는지를 나타내는 가시 플래그는 이 물체 기술자와 연관된다. 이 실시예에서, 가시 플래그는 각 관측면 기술자의 일부를 형성한다. 따라서, 관측면 1 및 관측면 3의 각각의 관측면 기술자는 관측면이 비디오의 프레임에서 보임을 나타내는 가시 플래그 '1'을 포함하고, 관측면 2의 관측면 기술자는 관측면이 어떤 프레임에서도 보이지 않음을 나타내는 가시 플래그 '0'을 갖는다.
화상 데이터베이스(8)에 있는 화상 또는 일군의 화상으로 나타나는 관심있는 모든 물체에 대해 3D 물체 형상 기술자가 상기 방식으로 얻어진다.
다른 실시예로서, 도 3을 참조하면, 자동차 사진에 대해 3개의 관측면이 얻어진다. CSS 표현을 포함한 대응 관측면 기술자는 각 관측면에서의 자동차 윤곽에 대해 상기와 같이 얻어진다. 제 1 관측면은 사진의 관측면에 대응하고 따라서 연관된 관측면 기술자는 가시 관측면을 나타내는 가시 플래그 '1'을 갖는다. 다른 두개의 관측면에 대한 관측면 기술자는, 이들이 사진에 나타나지 않은 관측면에 대응하는 가시 플래그 '0'을 갖는다. 이 실시예에서, 가시 플래그는 사진으로부터 윤곽을 추출할 때에 결정된다. 즉, 형상이 사진으로부터 직접 추출되면, 가시 플래그 '1'이 주어지고, 색인작성자에 의해 형상이 선택되면, 가시 플래그 '0'을 갖는다. 달리, 가시 플래그는 나중에 검사에 의해 수동으로 추가될 수도 있다.
각 관측면 기술자는 또한, 어느 화상 또는 어느 비디오 시퀀스의 어느 프레임에서 나타나는지, 그리고 이 영상 또는 프레임에서 어느 물체인지를 나타내는 기준 포인터를 갖는데, 예컨대 물체의 관측면은, 비디오 181의 프레임 1000에서 나타나고 이것은 물체 번호 3임을 나타내는 포인터를 가질 수도 있다.
이 기술자 데이터베이스(10)는 화상 데이터베이스(8)에 저장된 화상 및 비디오 시퀀스에 있는 물체에 대한 3D 물체 형상 기술자를 저장한다.
상기 실시예에서, 비디오 시퀀스에서 나타나는 물체에 대해, 일군의 관측면 기술자가 전체 시퀀스에 대해 유도되고, 이 관측면 기술자는 관련된 관측면이 시퀀스의 적어도 한 프레임에서 나타나는지 나타나지 않는지를 표시하도록 사용된다. 대안적인 실시예에서, 각 프레임은 별도로 처리된다. 더 상세히 설명하면, 일군의 관측면 기술자는 프레임에서 나타나는 물체에 대해 유도되고, 가시 플래그는, 시퀀스의 다른 프레임에서 나타나는지의 여부에 상관없이, 연관된 관측면이 그 프레임에서 나타나는지의 여부를 나타낸다. 다른 대안적인 실시예에서, 일군의 관측면 기술자는 비디오 시퀀스에서 나타나는 물체에 대해 유도되고, 대응하는 일군의 가시 플래그가 각 프레임에 대해 유도되고 저장된다.
가시 플래그는 이하 설명되는 바와 같이 화상으로 물체를 검색하는 방법에서 사용된다.
사용자는 질의를 입력함으로써 검색을 개시한다. 이 질의는 위치지정장치(6)를 사용하여 입력되어 디스플레이 장치(4)에서 하나 이상의 형상의 윤곽을 나타낸다. 제어장치(2)는 그후 질의 관측면에 대한 CSS 관측면 기술자를 유도해낸다. 사용자는 제어장치(2)에 의해 디스플레이 장치(4)에 표시된 형상의메뉴로부터 질의 형상 또는 형상들을 선택함으로써 질의를 입력할 수도 있다. 이러한 경우, 관측면 기술자는 기술자 데이터베이스(10)에서 이미 사용가능할 수도 있다. 사용자는 또한 상자를 체크함으로써 검색이 질의 관측면과 동일한 관측면에 제한되어야 하는지 여부를 나타낸다. 검색이 그렇게 제한적이지 않으면, 검색 및 대조절차는 질의 물체 기술자와 기술자 데이터베이스(10)에 저장된 물체 기술자(이하, 모델 물체 기술자라 함)와의 사이의 유사성을 결정함으로써 본질적으로 PCT/GB00/01662에 개시된 바와 같이 수행된다.
간단히 말해서, 관측면-유사성 측정값을 도출하기 위해 대조함수를 이용하여 비교기에서 고려중인 모델 물체 기술자에 대한 각 모델 관측면 기술자와 각 질의 관측면 기술자가 비교된다. i 번째 질의 관측면 기술자와 j 번째 모델 관측면 기술자의 비교결과는 관측면 유사성 측정값 si,j로 된다. 하나 이상의 질의 관측면이 있으면, 관측면 유사성 측정값들의 중간값을 물체 유사성 측정값 S로 한다.
대조절차 결과, n개의 유사성 측정값 S로 되는데, 여기서 n은 기술자 데이터베이스에서 3D 물체 기술자의 갯수이다. n개의 유사성 측정값은 이후 가장 비슷한 것을 나타내는 최저값에서 시작하여 순서가 매겨진다. 이후, m개의 최저값(여기서 m은 사용자에 의해 선택된 값이거나 제어유닛의 셋업에 의해 결정된 값임)이 선택되고, 물체를 포함하여 대응하는 m개의 화상(이들 중 몇몇은 비디오 시퀀스로부터 얻어지는 화상일 수 있다)들이 디스플레이 장치(4)에 표시된다.
질의 관측면과 동일한 관측면으로 검색이 제한되면, 보이지않는 모델 관측면이 검색 프로세스 동안에 여과된다. 이는, 대조함수를 사용하여 질의 관측면 기술자를 오직 대응하는 관측면이 화상에서 보임을 나타내는 모델 관측면 기술자와 대조함으로써 이뤄질 수 있다. 즉, 대조함수를 이용하여 유사성 측정값을 계산할 때, 가시 플래그가 '0'인 모델 관측면 기술자는 빠진다. 대신, 관측면 유사성 측정값은 모든 모델 관측면 기술자에 대해 계산될 수 있지만, 가시 플래그가 0인 모델 관측면 기술자에 대한 결과는 향후의 처리에서 빠질 수 있다. 달리, 가시 플래그는 표시를 위해 검색결과를 선택할 때에 고려될 수 있다. 대조절차의 결과를 표시할 때, 비디오 시퀀스의 경우에, 대조된 관측면을 포함하는 프레임이 표시된다.
도 4는 PCT/GB00/01662에 개시된 다수의 관측면 검색방법이 어떻게 질의 아이템과 동일 형상이지만 동일 관측면은 아닌 결과를 찾아 반환하는지의 예를 보여준다. 한편 도 5는 각 관측면 기술자 내에 있는 가시 플래그가 어떻게 질의 아이템과 동일 형상 및 동일 관측면인 결과를 반환하게 할 수 있는지를 도시한다.
본 발명에 따른 시스템은 예컨대 화상 라이브러리에서 제공될 수도 있다. 택일적으로, 데이터베이스는, 전화선과 같은 일시적 링크 또는 인터넷과 같은 네트워크에 의해 제어장치에 접속된, 시스템의 제어장치로부터 떨어져 위치될 수도 있다. 이 화상 및 기술자 데이터베이스는 예컨대 영구기억장치나 CD-ROM 또는 DVD와 같은 휴대용 데이터 저장매체에 제공될 수도 있다.
예컨대 선택기 및 비교기와 같은 전술된 시스템의 구성요소는 소프트웨어 또는 하드웨어 형태로 제공될 수도 있다. 본 발명이 컴퓨터 시스템의 형태로 기술되었지만, 다른 형태, 예컨대 전용칩을 이용하여 구현될 수도 있다.
물체의 2D 형상을 표현하는 방법 및 두개의 형상 사이의 유사성을 표현하는 값을 계산하는 방법에 대해 구체적인 예가 주어졌지만 임의의 적절한 방법을 사용할 수 있다.
완전한 또는 거의 완전한 형상 기술을 구성하는 물체의 다양한 관측면을 예컨대 영화제작자가 제공될 수도 있다. 예를 들어, 자동차를 포함하는 영화에서, 제작자가 데이터베이스에서 영화 색인을 할 때에 사용하기 위해 촬영한 자동차의 20가지 다른 관측면을 준비할 수도 있다. 택일적으로, 이 관측면들을 찾을 수 있도록 물체의 모든 다른 관측면들 사이의 연결을 시퀀스로 제공할 수도 있고, 시퀀스에서 나타나지 않는 임의의 유용한 관측면에 대한 형상을 예컨대 물체의 제 1 관측면에 대한 데이터가 포함될 때에 제공할 수도 있다.
본 발명은 또한, 예컨대 확인목적으로 물체의 화상을 대조하거나 여과를 할 목적으로 사용될 수도 있다.
본 발명은 단일의 화상, 및 영화나 비디오에서의 화상과 같은 화상의 시퀀스에서의 화상, 또는 동일한 웹페이지에서와 같이 어떤 방식으로든 연관된 화상의 집합에 적용할 수 있다.
상기 실시예에서, 관측면 기술자는 상이한 관측면의 물체의 형상으로부터 도출된다. 관측면 기술자는, 형상 대신에 또는 형상은 물론, 색채 또는 질감와 같은 물체의 다른 특징으로부터 도출될 수 있다. 예컨대 형상, 색채, 질감와 같은 물체의 다양한 특징은 단독으로 또는 조합하여 관측면 기술자의 기초를 형성할 수 있고, 관측면 기술자는 상이한 관측면에 대한 상이한 특징을 근거로 할 수 있다.
Claims (19)
- 화상으로 나타나는 물체를 표현하는 방법에 있어서,상기 물체의 복수의 관측면 기술자(view descriptor)를 도출하는 단계-상기 각 관측면 기술자는 상기 물체의 상이한 관측면에 대응함-와,각 관측면 기술자에 대해 상기 각 관측면이 상기 화상으로 나타나는 상기 물체의 관측면에 대응하는 때를 표시하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서,상기 각 관측면이 상기 화상으로 나타나는 상기 물체의 관측면에 대응하는지의 여부를 표시하기 위해 플래그를 각 관측면 기술자와 연관시키는 단계를 포함하는 것을 특징으로 하는 방법.
- 일군의 화상으로 나타나는 물체를 표현하는 방법에 있어서,상기 물체의 복수의 관측면 기술자를 도출하는 단계-상기 각 관측면 기술자는 상기 물체의 상이한 관측면에 대응함-와,각 관측면 기술자에 대해 상기 각 관측면이 상기 일군의 화상으로 나타나는 상기 물체의 관측면에 대응하는 때를 표시하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 3 항에 있어서,상기 각 관측면이 상기 일군의 화상 중 적어도 하나의 화상으로 나타나는지의 여부를 표시하기 위하여 플래그를 각 관측면 기술자와 연관시키는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 3 항에 있어서,상기 일군의 화상에서의 각 화상에 대해, 상기 각 관측면이 상기 화상으로 나타나는 물체의 관측면에 대응하는지의 여부를 각 관측면 기술자에 대해 표시하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 3 항 내지 제 5 항 중 어느 한 항에 있어서,상기 일군의 화상은 화상의 시퀀스인 것을 특징으로 하는 방법.
- 제 6 항에 있어서,상기 화상의 시퀀스는 비디오 또는 영화로부터 나온 것임을 특징으로 하는 방법.
- 선행하는 청구항 중 어느 한 항에 있어서,적어도 하나의 관측면 기술자는 상기 각 관측면에서의 상기 물체의 가시 특징의 표현을 포함하는 것을 특징으로 하는 방법.
- 제8항에 있어서,적어도 하나의 관측면 기술자는 상기 각 관측면에서의 상기 물체의 형상의 표현을 포함하는 것을 특징으로 하는 방법.
- 제9항에 있어서,상기 형상 관측면 기술자는 CSS(curvature scale space) 표현을 사용하여 도출되는 것을 특징으로 하는 방법.
- 제8항에 있어서,적어도 하나의 관측면 기술자는 상기 각 관측면에서의 상기 물체의 색채의 표현을 포함하는 것을 특징으로 하는 방법.
- 제8항에 있어서,적어도 하나의 관측면 기술자는 상기 각 관측면에서의 상기 물체의 질감의 표현을 포함하는 것을 특징으로 하는 방법.
- 선행하는 청구항 중 어느 한 항에 있어서,검색을 목적으로 화상 또는 화상의 집합을 색인하는 것을 특징으로 하는 방법.
- 검색을 목적으로 데이터베이스에 저장된 화상 또는 일군의 화상을 색인하는 방법에 있어서,화상 또는 일군의 화상으로 나타나는 물체를 식별하는 단계,상기 물체의 복수의 상이한 관측면의 표현을 도출하는 단계, 및표현된 관측면이 화상으로 나타나는 물체의 상기 관측면에 대응할 때를 표시하는 단계를 포함하는 것을 특징으로 하는 방법.
- 저장된 화상 및 일군의 화상으로 질의 물체를 검색하는 방법에 있어서,질의를 입력하는 단계,상기 질의를 선행하는 청구항에서의 방법을 이용하여 도출된 상기 저장된 화상의 표현과 대조하는 단계, 및가장 비슷한 것을 인출(retrieval)하는 단계를 포함하고,상기 질의 입력은 상기 검색이 상기 질의 관측면과 동일한 관측면으로 상기 질의 물체를 보여주는 화상 또는 일군의 화상에 제한되어야 하는지의 여부를 표시하는 단계를 포함하는 것을 특징으로 하는 방법.
- 선행하는 청구항의 방법을 구현하기 위해 적합한 것을 특징으로 하는 화상 검색 및 인출 시스템.
- 제 1 항 내지 제 15 항 중 어느 한 항의 방법을 구현하는 것을 특징으로 하는 컴퓨터 프로그램.
- 제 1 항 내지 제 15 항 중 어느 한 항의 방법에 따라 작동하도록 프로그램된는 것을 특징으로 하는 컴퓨터 시스템.
- 제 1 항 내지 제 15 항 중 어느 한 항의 방법을 구현하는 컴퓨터 실행가능한 프로세스 단계를 저장하는 것을 특징으로 하는 컴퓨터 판독가능한 기억매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0016809A GB2364590B (en) | 2000-07-07 | 2000-07-07 | Method and apparatus for representing and searching for an object in an image |
GB0016809.6 | 2000-07-07 | ||
PCT/GB2001/003044 WO2002005129A1 (en) | 2000-07-07 | 2001-07-06 | Method and apparatus for representing and searching for an object in an image |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067013655A Division KR100931740B1 (ko) | 2000-07-07 | 2001-07-06 | 화상들 및 화상들의 그룹들에서 질의 물체를 검색하는 방법, 장치, 기억 매체, 및 컴퓨터 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030051594A true KR20030051594A (ko) | 2003-06-25 |
KR100820510B1 KR100820510B1 (ko) | 2008-04-10 |
Family
ID=9895287
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077029346A KR100901911B1 (ko) | 2000-07-07 | 2001-07-06 | 화상 내의 물체를 표현하고 검색하는 방법 및 장치 |
KR1020087029686A KR100955980B1 (ko) | 2000-07-07 | 2001-07-06 | 화상 내의 물체를 표현하고 검색하는 방법 및 장치 |
KR1020037000150A KR100820510B1 (ko) | 2000-07-07 | 2001-07-06 | 물체를 화상으로 표현하고 검색하는 방법 및 장치 |
KR1020067013655A KR100931740B1 (ko) | 2000-07-07 | 2001-07-06 | 화상들 및 화상들의 그룹들에서 질의 물체를 검색하는 방법, 장치, 기억 매체, 및 컴퓨터 시스템 |
KR1020087011953A KR100957888B1 (ko) | 2000-07-07 | 2001-07-06 | 화상 내의 물체를 표현하고 검색하는 방법 및 장치 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077029346A KR100901911B1 (ko) | 2000-07-07 | 2001-07-06 | 화상 내의 물체를 표현하고 검색하는 방법 및 장치 |
KR1020087029686A KR100955980B1 (ko) | 2000-07-07 | 2001-07-06 | 화상 내의 물체를 표현하고 검색하는 방법 및 장치 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067013655A KR100931740B1 (ko) | 2000-07-07 | 2001-07-06 | 화상들 및 화상들의 그룹들에서 질의 물체를 검색하는 방법, 장치, 기억 매체, 및 컴퓨터 시스템 |
KR1020087011953A KR100957888B1 (ko) | 2000-07-07 | 2001-07-06 | 화상 내의 물체를 표현하고 검색하는 방법 및 장치 |
Country Status (8)
Country | Link |
---|---|
US (6) | US7269285B2 (ko) |
EP (5) | EP2302530A1 (ko) |
JP (2) | JP4632627B2 (ko) |
KR (5) | KR100901911B1 (ko) |
CN (5) | CN1963812A (ko) |
AU (1) | AU2001269289A1 (ko) |
GB (1) | GB2364590B (ko) |
WO (1) | WO2002005129A1 (ko) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2364590B (en) * | 2000-07-07 | 2004-06-02 | Mitsubishi Electric Inf Tech | Method and apparatus for representing and searching for an object in an image |
AR031202A1 (es) | 2000-11-03 | 2003-09-10 | Wyeth Corp | Ciclopenta(b) (1,4)diazepino(6,7,1-hi) indoles y derivados |
US7624123B2 (en) * | 2004-02-26 | 2009-11-24 | Ati Technologies, Inc. | Image processing system and method |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US10192279B1 (en) | 2007-07-11 | 2019-01-29 | Ricoh Co., Ltd. | Indexed document modification sharing with mixed media reality |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US7702673B2 (en) * | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US9495385B2 (en) | 2004-10-01 | 2016-11-15 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US7812986B2 (en) | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US7561756B1 (en) | 2005-05-02 | 2009-07-14 | Nanostellar, Inc. | Particle shape characterization from 2D images |
US7430322B1 (en) * | 2005-05-02 | 2008-09-30 | Nanostellar, Inc. | Particle shape characterization from 2D images |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US7856380B1 (en) * | 2006-12-29 | 2010-12-21 | Amazon Technologies, Inc. | Method, medium, and system for creating a filtered image set of a product |
SE533185C2 (sv) * | 2007-02-16 | 2010-07-13 | Scalado Ab | Metod för behandling av en digital bild samt bildrepresentationsformat |
JP5233306B2 (ja) * | 2008-02-15 | 2013-07-10 | セイコーエプソン株式会社 | 画像検索装置、画像検索方法、及び画像検索プログラム |
US8886669B2 (en) * | 2008-03-21 | 2014-11-11 | Trimble Navigation Limited | File access via conduit application |
US8125481B2 (en) | 2008-03-21 | 2012-02-28 | Google Inc. | Lightweight three-dimensional display |
JP4770960B2 (ja) * | 2009-03-30 | 2011-09-14 | カシオ計算機株式会社 | 画像検索システム及び画像検索方法 |
US7953245B2 (en) * | 2009-08-18 | 2011-05-31 | General Electric Company | System, method and program product for camera-based object analysis |
JP4850278B2 (ja) * | 2009-11-20 | 2012-01-11 | 株式会社ソニー・コンピュータエンタテインメント | コンテンツ作成支援装置、コンテンツ作成支援方法、およびシナリオファイル生成方法 |
US8687898B2 (en) * | 2010-02-01 | 2014-04-01 | Toyota Motor Engineering & Manufacturing North America | System and method for object recognition based on three-dimensional adaptive feature detectors |
US9652462B2 (en) * | 2010-04-29 | 2017-05-16 | Google Inc. | Identifying responsive resources across still images and videos |
US8555192B2 (en) * | 2010-06-03 | 2013-10-08 | Microsoft Corporation | Sketching and searching application for idea generation |
US9449026B2 (en) * | 2010-08-31 | 2016-09-20 | Microsoft Technology Licensing, Llc | Sketch-based image search |
US8619124B2 (en) * | 2010-10-14 | 2013-12-31 | Industrial Technology Research Institute | Video data processing systems and methods |
EP2652680A1 (de) * | 2010-12-13 | 2013-10-23 | Incca GmbH | Vorrichtung und verfahren zur unterstuetzung der durchfuehrung eines wartungs- und/oder bedienvorgangs |
US8799201B2 (en) | 2011-07-25 | 2014-08-05 | Toyota Motor Engineering & Manufacturing North America, Inc. | Method and system for tracking objects |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US8655016B2 (en) * | 2011-07-29 | 2014-02-18 | International Business Machines Corporation | Example-based object retrieval for video surveillance |
CN108197631B (zh) * | 2012-07-23 | 2022-06-28 | 苹果公司 | 提供图像特征描述符的方法 |
CN103870485B (zh) * | 2012-12-13 | 2017-04-26 | 华为终端有限公司 | 实现增强现实应用的方法及设备 |
US9147125B2 (en) | 2013-05-03 | 2015-09-29 | Microsoft Technology Licensing, Llc | Hand-drawn sketch recognition |
US9355123B2 (en) | 2013-07-19 | 2016-05-31 | Nant Holdings Ip, Llc | Fast recognition algorithm processing, systems and methods |
WO2015123647A1 (en) | 2014-02-14 | 2015-08-20 | Nant Holdings Ip, Llc | Object ingestion through canonical shapes, systems and methods |
CN106462774B (zh) * | 2014-02-14 | 2020-01-24 | 河谷控股Ip有限责任公司 | 通过规范形状的对象摄取、系统和方法 |
CN106462772B (zh) * | 2014-02-19 | 2019-12-13 | 河谷控股Ip有限责任公司 | 对象识别特征的基于不变量的维数缩减、系统和方法 |
US9827714B1 (en) | 2014-05-16 | 2017-11-28 | Google Llc | Method and system for 3-D printing of 3-D object models in interactive content items |
US10354143B2 (en) * | 2014-10-13 | 2019-07-16 | Telecom Italia S.P.A. | Method and system for comparing video shots |
US10275902B2 (en) | 2015-05-11 | 2019-04-30 | Magic Leap, Inc. | Devices, methods and systems for biometric user recognition utilizing neural networks |
CN108780519B (zh) | 2016-03-11 | 2022-09-02 | 奇跃公司 | 卷积神经网络的结构学习 |
WO2020236993A1 (en) | 2019-05-21 | 2020-11-26 | Magic Leap, Inc. | Hand pose estimation |
US11775617B1 (en) * | 2021-03-15 | 2023-10-03 | Amazon Technologies, Inc. | Class-agnostic object detection |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4270229A (en) * | 1980-01-17 | 1981-06-02 | Louisville Manufacturing Co., Inc. | Method of surface ornamented cap |
US4548704A (en) * | 1982-07-19 | 1985-10-22 | E. I. Du Pont De Nemours And Company | Pitch for direct spinning into carbon fibers derived from a steam cracker tar feedstock |
US4584704A (en) | 1984-03-01 | 1986-04-22 | Bran Ferren | Spatial imaging system |
JPS61231630A (ja) * | 1985-04-05 | 1986-10-15 | Mitsubishi Electric Corp | デ−タ検索装置 |
JPH0644282B2 (ja) * | 1985-10-02 | 1994-06-08 | 富士通株式会社 | 物体検索方式 |
JPH0614360B2 (ja) * | 1987-07-20 | 1994-02-23 | 工業技術院長 | 物体認識装置 |
JPS6423379U (ko) | 1987-07-31 | 1989-02-07 | ||
GB9322260D0 (en) * | 1993-10-28 | 1993-12-15 | Pandora Int Ltd | Digital video processor |
US5465353A (en) * | 1994-04-01 | 1995-11-07 | Ricoh Company, Ltd. | Image matching and retrieval by multi-access redundant hashing |
US6205231B1 (en) * | 1995-05-10 | 2001-03-20 | Identive Corporation | Object identification in a moving video image |
US5710877A (en) * | 1995-12-29 | 1998-01-20 | Xerox Corporation | User-directed interaction with an image structure map representation of an image |
US5907846A (en) * | 1996-06-07 | 1999-05-25 | Electronic Data Systems Corporation | Method and system for accessing relational databases using objects |
US5809505A (en) * | 1996-06-14 | 1998-09-15 | Lo; Thomas | System and method for relational to object mapping |
US6006214A (en) * | 1996-12-04 | 1999-12-21 | International Business Machines Corporation | Database management system, method, and program for providing query rewrite transformations for nested set elimination in database views |
US6122627A (en) * | 1997-05-09 | 2000-09-19 | International Business Machines Corporation | System, method, and program for object building in queries over object views |
US6038074A (en) * | 1997-05-20 | 2000-03-14 | Ricoh Company, Ltd. | Three-dimensional measuring apparatus and method, image pickup apparatus, and apparatus and method for inputting image |
AUPO894497A0 (en) * | 1997-09-02 | 1997-09-25 | Xenotech Research Pty Ltd | Image processing method and apparatus |
KR19990025292A (ko) * | 1997-09-11 | 1999-04-06 | 정선종 | 필터링 과정에 의한 이미지 데이터 베이스의 효과적 검색 방법 |
FI103417B (fi) * | 1997-09-16 | 1999-06-30 | Metsae Serla Oyj | Paperiraina ja menetelmä sen valmistamiseksi |
US6249600B1 (en) * | 1997-11-07 | 2001-06-19 | The Trustees Of Columbia University In The City Of New York | System and method for generation of a three-dimensional solid model |
JP3383563B2 (ja) * | 1997-12-18 | 2003-03-04 | 富士通株式会社 | 物体移動シミュレーション装置 |
US6301370B1 (en) * | 1998-04-13 | 2001-10-09 | Eyematic Interfaces, Inc. | Face recognition from video images |
JP3615657B2 (ja) * | 1998-05-27 | 2005-02-02 | 株式会社日立製作所 | 映像検索方法及び装置ならびに記録媒体 |
KR20000016778A (ko) * | 1998-12-18 | 2000-03-25 | 윌리암 아메스 커트라이트 | 균일 포맷의 디지탈 맵 이미지를 생성시키는 방법 및 장치 |
US6819797B1 (en) * | 1999-01-29 | 2004-11-16 | International Business Machines Corporation | Method and apparatus for classifying and querying temporal and spatial information in video |
ES2284478T3 (es) * | 1999-02-05 | 2007-11-16 | Samsung Electronics Co., Ltd. | Procedimiento y aparato para el tratamiento de imagenes en color. |
GB2375212B (en) * | 1999-04-29 | 2003-06-11 | Mitsubishi Electric Inf Tech | Method and apparatus for searching for an object using shape |
GB2394349B (en) * | 1999-07-05 | 2004-06-16 | Mitsubishi Electric Inf Tech | Method and apparatus for representing and searching for an object in an image |
KR100422697B1 (ko) * | 1999-12-27 | 2004-03-12 | 엘지전자 주식회사 | 색공간 양자화 묘사자 |
GB2364590B (en) * | 2000-07-07 | 2004-06-02 | Mitsubishi Electric Inf Tech | Method and apparatus for representing and searching for an object in an image |
-
2000
- 2000-07-07 GB GB0016809A patent/GB2364590B/en not_active Expired - Lifetime
-
2001
- 2001-07-06 JP JP2002508670A patent/JP4632627B2/ja not_active Expired - Lifetime
- 2001-07-06 EP EP10183022A patent/EP2302530A1/en not_active Withdrawn
- 2001-07-06 AU AU2001269289A patent/AU2001269289A1/en not_active Abandoned
- 2001-07-06 EP EP10182402A patent/EP2299374A1/en not_active Withdrawn
- 2001-07-06 KR KR1020077029346A patent/KR100901911B1/ko active IP Right Grant
- 2001-07-06 CN CNA2006100944935A patent/CN1963812A/zh active Pending
- 2001-07-06 CN CNB018123260A patent/CN1242351C/zh not_active Expired - Lifetime
- 2001-07-06 CN CN2006100934596A patent/CN1904892B/zh not_active Expired - Lifetime
- 2001-07-06 CN CN2005101370223A patent/CN1790342B/zh not_active Expired - Lifetime
- 2001-07-06 EP EP01947643.1A patent/EP1299822B1/en not_active Expired - Lifetime
- 2001-07-06 KR KR1020087029686A patent/KR100955980B1/ko active IP Right Grant
- 2001-07-06 EP EP10182344A patent/EP2299373A1/en not_active Withdrawn
- 2001-07-06 US US10/220,636 patent/US7269285B2/en not_active Expired - Lifetime
- 2001-07-06 KR KR1020037000150A patent/KR100820510B1/ko active IP Right Grant
- 2001-07-06 KR KR1020067013655A patent/KR100931740B1/ko active IP Right Grant
- 2001-07-06 WO PCT/GB2001/003044 patent/WO2002005129A1/en active Application Filing
- 2001-07-06 CN CNB2006100934581A patent/CN100555281C/zh not_active Expired - Lifetime
- 2001-07-06 EP EP10182325.0A patent/EP2296097B1/en not_active Expired - Lifetime
- 2001-07-06 KR KR1020087011953A patent/KR100957888B1/ko active IP Right Grant
-
2007
- 2007-07-12 US US11/777,135 patent/US7388986B2/en not_active Expired - Lifetime
-
2008
- 2008-04-03 US US12/062,382 patent/US7593577B2/en not_active Expired - Fee Related
- 2008-04-03 US US12/062,371 patent/US7689041B2/en not_active Expired - Fee Related
- 2008-04-03 US US12/062,377 patent/US7756339B2/en not_active Expired - Fee Related
-
2010
- 2010-06-02 US US12/792,205 patent/US7940987B2/en not_active Expired - Lifetime
- 2010-07-28 JP JP2010169455A patent/JP2011028757A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100820510B1 (ko) | 물체를 화상으로 표현하고 검색하는 방법 및 장치 | |
US7769248B2 (en) | Method and apparatus for representing and searching for an object using shape |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130321 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20140319 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160318 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20170302 Year of fee payment: 10 |