KR20150137006A - 주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법 - Google Patents

주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법 Download PDF

Info

Publication number
KR20150137006A
KR20150137006A KR1020150071697A KR20150071697A KR20150137006A KR 20150137006 A KR20150137006 A KR 20150137006A KR 1020150071697 A KR1020150071697 A KR 1020150071697A KR 20150071697 A KR20150071697 A KR 20150071697A KR 20150137006 A KR20150137006 A KR 20150137006A
Authority
KR
South Korea
Prior art keywords
image
group
images
annotation
search word
Prior art date
Application number
KR1020150071697A
Other languages
English (en)
Inventor
프레데릭 바봉
조아낀 제뻬다 쌀바띠에라
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20150137006A publication Critical patent/KR20150137006A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • G06F17/241
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • G06F18/41Interactive pattern learning with a human teacher
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

주석 디스플레이 보조 장치는 검색 단어와 관련하여 제1 그룹에 포함될 수 있는 이미지를 디스플레이하는 디스플레이 처리 유닛; 디스플레이 처리 유닛에 의해 디스플레이된 이미지들 중에서 검색 단어와 관련하여 제2 그룹에 포함되어야 하는 이미지의 선택을 수용하는 입력 수용 유닛; 및 이미지와 연관된 주석을 추가하기 위해 제2 그룹에 포함되도록 선택된 이미지에 기초하여 디스플레이 처리 유닛에 의해 디스플레이된 이미지들 중에서 제2 그룹에 속할 수 있는 이미지를 검출하는 주석 추가 유닛을 포함하며, 디스플레이 처리 유닛은 주석 추가 유닛에 의해 검출되어 제2 그룹에 속할 수 있는 이미지와 연관된 주석을 디스플레이하고, 주석은 이미지가 제2 그룹에 속할 수 있음을 나타낸다.

Description

주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법{ANNOTATION DISPLAY ASSISTANCE DEVICE AND METHOD OF ASSISTING ANNOTATION DISPLAY}
본 발명은 주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법에 관한 것이다.
"양(sheep)" 또는 "고양이" 등의 미리결정된 시각적 개념이 각각의 이미지에 존재하는지 또는 아닌지를 나타내는 이미지 분류기에 의해 이미지들을 분류하기 위한 기술이 존재한다. 이미지 분류기는 시각적 개념을 포함하는 포지티브 이미지 및 시각적인 개념을 포함하지 않는 네가티브 이미지를 포함하는 훈련 세트를 이용하는 학습 알고리즘에 의해 구축된다. 통상적인 학습 알고리즘으로서, 결과적인 분류기가 이미지 특징들(이미지로부터 추출된 히스토그램 등의 고차원 벡터)의 공간에서 분리 초평면(separating hyper-plane)을 정의하는 선형적인 분류기인 SVM(Support Vector Machine) 알고리즘이 알려져 있다.
또한, 미국특허 제7,890,443호는 빈약한 분류기를 훈련시키기 위한 MIP(multiple instance pruning) 또는 조합 분류기의 "특징들"을 개시한다.
그러나, 각각의 사용자가 훈련세트를 준비하는 것은 어렵다. 예를 들어, 시각적인 개념을 제공하기 위해 포지티브 이미지들과 네가티브 이미지들의 큰 집합을 수동으로 준비하는 것은 시간소모가 크다. 따라서, 각각의 사용자가 모을 수 있는 시각적 개념들의 양은 제한적이다.
이러한 문제를 해결하기 위해, 포지티브 이미지는 GIS(Google image search)를 이용하여 획득되고, 기술어(descriptor)는 포지티브 이미지들의 각각에 대해 계산되고, 선형적인 SVM 분류기는 포지티브 이미지 기술어 및 가중치 벡터를 획득하기 위한 미리 계산된 기술어를 갖는 네가티브 이미지들의 풀(pool)을 이용하여 훈련되고, 데이터 세트는 분류기에 의해 등급이 매겨지는 기술이 제안되었다(K. Chatfield and A. Zisserman. "VISOR: Towards On-the-Fly Large-Scale Object Category Retrieval". Asian Conference on Computer Vision, 2012).
그러나, 웹의 일반성 및 일부 단어들의 모호성으로 인해, GIS에 의해 반환된 포지티브 세트는 때때로 시각적인 개념(검색 단어(search word))이 빈약하게 표현된다. 이러한 이유로, 아직도 각각의 사용자가 시각적 개념이 빈약하게 표현된 이미지들에 표시를 함으로써, 반환된 포지티브 이미지들을 수동으로 수정하는 것이 필요하다. 따라서, 이미지 분류의 결과의 품질을 개선하기 위해서 여전히 전술한 훈련 세트를 준비하는 어려움의 문제는 해결되어야 한다.
본 발명은 전술한 문제들의 관점에서 이루어지고, 이미지들을 분류하기 위한 훈련 세트를 쉽게 준비하기 위해 사용자를 보조하는 기술을 제공한다.
일 실시예에 따르면, 검색 단어와 관련하여 제1 그룹에 포함될 수 있는 이미지를 디스플레이하는 디스플레이 처리 유닛; 디스플레이 처리 유닛에 의해 디스플레이된 이미지들 중에서 검색 단어와 관련하여 제2 그룹에 포함되어야 하는 이미지의, 사용자로부터의 선택을 수용하는 입력 수용 유닛; 및 이미지 상에 주석을 추가하기 위해 제2 그룹에 포함되도록 사용자에 의해 선택된 이미지에 기초하여 디스플레이 처리 유닛에 의해 디스플레이된 이미지들 중에서, 제2 그룹에 포함되도록 사용자에 의해 선택된 이미지 외에, 제2 그룹에 속할 수 있는 이미지를 검출하는 주석 추가 유닛을 포함하는 주석 디스플레이 보조 장치가 제공되며, 디스플레이 처리 유닛은 주석 추가 유닛에 의해 제2 그룹에 속하는 것으로 검출되는 이미지 상에 주석을 디스플레이하고, 주석은 이미지가 제2 그룹에 속할 수 있음을 나타낸다.
또 따른 실시예에 따르면, 검색 단어와 관련하여 제1 그룹에 포함될 수 있는 이미지를 디스플레이하는 단계; 디스플레이하는 단계에서 디스플레이된 이미지들 중에서 검색 단어와 관련하여 제2 그룹에 포함되어야 하는 이미지의, 사용자로부터의 선택을 사용자로부터 수용하는 단계; 이미지 상에 주석을 추가하기 위해 제2 그룹에 포함되도록 사용자에 의해 선택된 이미지에 기초하여 디스플레이 단계에서 디스플레이된 이미지들 중에서, 제2 그룹에 포함되도록 사용자에 의해 선택된 이미지 외에, 제2 그룹에 속할 수 있는 이미지를 검출하는 단계 및 검출하는 단계에서 제2 그룹에 속하는 것으로 검출되는 이미지 상에 주석 - 주석은 이미지가 제2 그룹에 속할 수 있다는 것을 나타냄 - 을 디스플레이하는 단계를 포함하는 주석 디스플레이를 보조하는 방법이 제공된다.
또한, 방법들, 장치들, 시스템들 등에서 이루어진, 전술한 구성들의 임의의 조합 및 본 발명에서의 표현들의 임의의 변화는 본 발명의 실시예들로서 유효하다는 것을 알아야한다.
첨부된 도면들과 함께 읽혀졌을 경우, 본 발명의 다른 목적들, 특징들 및 장점들은 이하의 발명의 상세한 설명으로부터 보다 명백해 질 것이다.
도 1은 일 실시예의 주석 디스플레이 보조 장치의 기능적인 구조의 일 예시를 도시한 블록도;
도 2는 실시예의 주속 디스플레이 보조 장치의 하드웨어 구조의 일 예시를 도시한 블록도;
도 3은 실시예의 디스플레이 처리 유닛에 의해 디스플레이된 스크린의 일 예시를 도시한 도면;
도 4는 실시예의 디스플레이 처리 유닛에 의해 디스플레이된 스크린의 또 다른 예시를 도시한 도면; 및
도 5는 실시예의 프로세스의 일 예를 도시한 플로우차트.
본 발명은 본 명세서에서 예시적인 실시예들을 참조하여 기술될 것이다. 당업자는 본 발명의 교시들을 이용하여 많은 대안적인 실시예들이 달성될 수 있다는 것과 본 발명이 설명적인 목적을 위해 제시된 실시예들에 제한되지 않는다는 것을 알 것이다.
도면들의 설명에서 동일한 구성요소에는 동일한 참조번호가 주어지고, 설명들은 반복되지 않는다는 것을 알아야한다.
도 1은 일 실시예의 주석 디스플레이 보조 장치(100)의 기능적인 구조의 일 예를 도시한 블록도이다.
주석 디스플레이 보조 장치(100)는, 예컨대 인터넷 등의 네트워크(400)를 통해, 예컨대 GIS(Google Image Search) 등의 이미지 검색 엔진을 포함하는 외부 이미지 검색 시스템(300)과 통신할 수 있다.
주석 디스플레이 보조 장치(100)의 기능적 구조를 상세하게 기술하기 전에, 주석 디스플레이 보조 장치(100)의 하드웨어 구조가 설명된다.
도 2는 실시예의 주석 디스플레이 보조 장치(100)의 하드웨어 구조의 일 예시를 도시한 도면이다. 여기서, 주석 디스플레이 보조 장치(100)는, 예컨대 스마트폰, 휴대폰 등의 휴대 단말기인 예가 설명된다.
주석 디스플레이 보조 장치(100)는 전력 소스 시스템(251), 주 시스템(252) - 상기 주 시스템은 프로세서(253), 메모리 제어기(254) 및 주변장치 인터페이스(255)를 포함함 - , 저장 유닛(256), 외부 포트(257), 고주파 회로(258), 안테나(259), 음향 회로(260), 스피커(261), 마이크로폰(262), 센서(263), I/O(Input/Output) 서브 시스템(264) - 상기 I/O 서브 시스템은 디스플레이 제어기(265), 광 센서 제어기(266) 및 입력 제어기(267)를 포함함 - , 터치 패널 디스플레이 시스템(268), 광 센서(269), 및 입력 유닛(270)을 포함한다. 비록 상세하게 설명되지는 않았지만, 센서(263)는 근접 센서(proximity sensor), GPS(Global Positioning System) 회로, 가속도계, 자이로스코프, 자력계, 광 센서(luminosity sensor) 등을 포함할 수 있다.
대안적으로, 주석 디스플레이 보조 장치(100)는, 예컨대 개인용 컴퓨터 등의 단말 장치일 수 있다.
다시 도 1을 참조하면, 주석 디스플레이 보조 장치(100)는 입력 수용 유닛(12), 디스플레이 처리 유닛(14), 주석 추가 유닛(18), 이미지 획득 유닛(16) 및 이미지 데이터 저장소(20)를 포함한다.
입력 수용 유닛(12)은 주석 디스플레이 보조 장치(100)의 사용자의 다양한 입력 동작들을 수용한다. 특히, 입력 수용 유닛(12)은 사용자로부터 시각적 개념의 원문적인 설명(이하에서는, "검색 단어"로서 지칭됨)을 수용한다. 사용자가 양에 관한 이미지를 획득하고자 할 경우, 검색 단어는, 예컨대 "양"일 수 있다.
이미지 획득 유닛은 사용자에 의해 입력된 검색 단어에 기초하여 외부 검색 엔진을 사용하여 제1 그룹에 포함될 수 있는 이미지들을 획득한다.
이미지 획득 유닛(16)은 검색 단어에 기초하여 외부 이미지 검색 시스템(300)에 의해 검색되고 찾아지는 검색 단어와 관련하여 제1 그룹에 포함될 수 있는 이미지들을 획득(다운로드)한다. 이러한 실시예에서, 제1 그룹은 검색 단어에 대해 포지티브인 이미지들(이하에서, "검색 단어에 대한 포지티브 이미지들"로서 지칭됨)의 그룹이다. 따라서, 구체적으로 이미지 획득 유닛(16)은 검색 단어에 기초하여 외부 이미지 검색 시스템(300)에 의해 검색되고 찾아지는 검색 단어에 포지티브일 수 있는 이미지들(이하에서, "검색 단어에 대해 포지티브일 수 있는 이미지들"로서 지칭됨)을 획득(다운로드)한다.
디스플레이 처리 유닛(14)은, 예컨대 터치 패널 디스플레이 시스템 등과 같은 디스플레이 유닛 상에 다양한 정보 항목들을 디스플레이한다. 구체적으로, 디스플레이 처리 유닛(14)은 이미지 획득 유닛(16)에 의해 획득된 검색 단어에 대해 포지티브일 수 있는 이미지들의 리스트를 디스플레이한다.
입력 수용 유닛(12)은 디스플레이 처리 유닛(14)에 의해 디스플레이되는 이미지들 중에서 검색 단어와 관련하여 제2 그룹에 포함되어야 하는 이미지의 사용자로부터의 선택을 수용한다. 이러한 실시예에서, 제2 그룹은 검색 단어에 대한 네가티브인 이미지들(이하에서, "검색 단어에 대한 네가티브 이미지"라고 지칭됨)의 그룹이다. 따라서, 구체적으로, 입력 수용 유닛(12)은 디스플레이 처리 유닛(14)에 의해 디스플레이되는 포지티브일 수 있는 이미지들 중에서 검색 단어에 대해 네가티브인 이미지의 사용자로부터의 선택을 수용한다.
예를 들어, 디스플레이 처리 유닛(14)은 검색 단어에 대해 포지티브일 수 있는 이미지들을 각각 체크박스와 함께 디스플레이할 수 있다. 그 후, 사용자는 검색 단어 등에 의해 정의된 시각적 개념을 포함하지 않는 이미지를 동반하는 체크박스를 수동으로 마킹 또는 체킹함으로써 검색 단어에 대한 네가티브 이미지를 선택할 수 있다. 사용자가 체크박스를 체킹할 때, 디스플레이 처리 유닛(14)은, 예컨대 십자표(cross mark)와 같은 네가티브 아이콘을, 예컨대 동반된 이미지 상에 디스플레이하여, 이것이 실제로는 네가티브 이미지임을 나타낼 수 있다.
주석 추가 유닛(18)은 사용자에 의해 선택된 네가티브 이미지에 기초하여 디스플레이 처리 유닛(14)에 의해 디스플레이된 남아있는 포지티브일 수 있는 이미지들 중에서 검색 단어에 대해 네가티브일 수 있는 이미지(이하에서, "검색단어에 대해 네가티브일 수 있는 이미지"라고 지칭됨)를 검출한다. 이 때, 주석 추가 유닛(18)은 디스플레이 처리 유닛(14)에 의해 디스플레이된 남아있는 포지티브일 수 있는 이미지들이 검색단어에 대해 네가티브일 수 있는 이미지로서 제안되는지 자동적으로 검출하기 위해, 선택된 네가티브 이미지를 임시적인 이미지로서 사용하는 알고리즘을 실행할 수 있다. 이 때, 주석 추가 유닛(18)은 유사성 기초 비교, 분류 기초 비교 등을 이용할 수 있다.
유사성 기초 비교가 사용되는 경우, 주석 추가 유닛(18)은 디스플레이 처리 유닛(14)에 의해 디스플레이된 남아있는 포지티브일 수 있는 이미지들의 각각을 선택된 네가티브 이미지와 비교한다. 비교는, 예컨대 SIFT(Scale Invariant Feature Transform) 등의 로컬 기술어를 이용하고 뒤이어 매칭되는 기술어들의 기하학적인 확인으로 수행될 수 있다.
분류 기초 비교가 사용되는 경우, 주석 추가 유닛(18)은, 예컨대 선택된 네가티브 이미지를 네가티브 이미지로서 사용하고, 남아있는 포지티브일 수 있는 이미지들을 포지티브 이미지들로서 사용하는 이미지 분류기를 구축한다.
디스플레이 처리 유닛(14)은 이미지가 검색 단어에 네가티브일 수 있다는 것을 나타내는 주석을 주석 추가 유닛(18)에 의해 검출되는 네가티브일 수 있는 이미지 상에 디스플레이한다. 이미지가 네가티브일 수 있다는 것을 나타내는 주석은, 예컨대 물음표 등의 네가티브 제안 아이콘일 수 있다.
따라서, 사용자는 디스플레이 처리 유닛(14)에 의해 디스플레이되는 이미지에 동반되는 네가티브 제안 아이콘을 참조하여 검색 단어에 대한 또 다른 네가티브 이미지를 쉽게 선택할 수 있다. 입력 수용 유닛(12)은 검색 단어에 대한 네가티브 이미지의 사용자로부터의 선택을 수용한다.
사용자가 검색 단어에 대한 네가티브 이미지를 선택한 경우, 결과는 이미지 데이터 저장소(20)에 저장된다. 구체적으로, 이미지 획득 유닛(16)에 의해 획득된 이미지들의 각각의 이미지 데이터, 검색 단어 및 각각의 이미지가 사용자에 의해 검색 단어에 대한 네가티브 이미지로서 선택되는지 여부를 나타내는 정보는 서로 대응되게 이미지 데이터 저장소(20)에 저장된다.
또한, 이미지 획득 유닛(16)이 외부 이미지 검색 시스템(300)에 의해 검색되고 찾아지는 검색 단어에 대해 포지티브일 수 있는 이미지들을 새롭게 획득한 경우, 주석 추가 유닛(18)은 새롭게 획득된 포지티브일 수 있는 이미지와 이미지 데이터 저장소(20)에 저장된 이미지들을 비교할 수 있다. 그 후, 주석 추가 유닛(18)은 이미지 데이터 저장소(20)에 저장된 이미지들에 기초하여 새롭게 획득된 이미지들 중에서 검색 단어에 대해 네가티브일 수 있는 이미지를 검출할 수 있다.
도 3 및 도 4는 디스플레이 처리 유닛(14)에 의해 디스플레이된 스크린(500)의 예를 도시하는 도면이다.
도 3에서, 검색 단어인 "양(sheep)"은 외부 이미지 검색 시스템(300)에 의해 제공된 검색 웹 사이트의 검색 단어 박스(502)에 입력된다는 것이 가정된다. 그 후, 이미지 획득 유닛(16)은 외부 이미지 검색 시스템(300)으로부터 검색 단어 "양"에 대한 복수의 포지티브일 수 있는 이미지들을 획득한다. 그 후, 디스플레이 처리 유닛(14)은 획득된 이미지들의 리스트를 디스플레이한다. 도 3은 검색 단어 "양"에 대한 그러한 포지티브일 수 있는 이미지들을 도시한다.
또한, 파선(510) 내의 이미지들이 사용자에 의해 사전에 획득되고 확인된 이미지들과 동일하다고 가정한다. 예를 들어, 이미지(504a)는 검색 단어 "양"에 대해 네가티브인 것으로 사용자에 의해 사전에 체킹되었다고 가정되고, 결과는 이미지 데이터 저장소(20)에 저장되었다. 따라서, 네가티브 아이콘인 십자표(506a)가 이미지(504a)와 함께 디스플레이된다.
이러한 상태에서, 사용자가 커서(514)를 사용자가 검색 단어 "양"에 대해 네가티브인 것으로 생각하는 이미지들 중 하나, 예컨대 이미지(504b)로 이동시키는 경우, 박스(512)가 디스플레이된다. 대안적으로, 박스들은 원래 모든 이미지들에 대해 각각 디스플레이될 수 있다. 그 후, 사용자가 박스(512)를 체킹하는 경우, 도 4에 도시된 바와 같이, 십자표(506b)가 이미지(504b)와 함께 디스플레이된다.
그 후, 주석 추가 유닛(18)은 사용자에 의해 선택된 네가티브 이미지들(504a, 504b) 및 남아있는 포지티브일 수 있는 이미지들에 기초하여 남아있는 포지티브일 수 있는 이미지들 중에서 "양"에 대해 네가티브일 수 있는 이미지인 이미지들을 검출한다.
예를 들어, 이 경우에는, 도 4에서 도시된 바와 같이, 네가티브 제안 아이콘들인 물음표들(506c, 506d)이 각각 이미지들(504c, 504d)과 함께 디스플레이된다.
이러한 구성에 의해, 사용자는 물음표들(506c, 506d)을 봄으로써 검색 단어 "양"에 대해 네가티브일 수 있는 이미지들을 쉽게 알 수 있다.
도 5는 실시예의 프로세스의 예시를 도시하는 플로우차트이다.
우선, 입력 수용 유닛(12)은 검색 단어를 수용한다(단계 S102). 그 후, 이미지 획득 유닛(16)은 외부 이미지 검색 시스템(300)으로부터 검색 단어에 대해 포지티브일 수 있는 복수의 이미지들을 획득한다(단계 S104).
그 후, 주석 추가 유닛(18)은 획득된 이미지들을 이미지 데이터 저장소(20)에 저장된 검색 단어에 대해 네가티브인 것으로 검증 또는 체킹되는 사전에 획득된 이미지들과 비교한다(단계 S106). 그 후, 디스플레이 처리 유닛(14)은 네가티브 아이콘 (이전의 주석(previous annotation)) 등과 함께 이미지 획득 유닛(16)에 의해 획득된 이미지들을 디스플레이한다(단계 S108).
그 후, 입력 수용 유닛(12)은 사용자로부터의 검색 단어에 대한 네가티브 이미지의 선택(수동 주석(manual annotation))을 수용한다(단계 S110). 이 때, 디스플레이 처리 유닛(14)은 사용자에 의해 네가티브인 것으로 선택된 이미지에 대해 네가티브 아이콘을 디스플레이한다.
그 후, 주석 추가 유닛(18)은 사용자에 의해 검색 단어에 대해 네가티브인 것으로 현재 및 사전에 선택된 이미지들 및 남아있는 포지티브일 수 있는 이미지들 에 기초하여 검색 단어에 대해 네가티브일 수 있는 이미지들 (네가티브 후보들)을 검출한다(단계 S112).
그 후, 디스플레이 처리 유닛(14)은 검색 단어에 대해 네가티브일 수 있는 것으로 검출되는 이미지들과 함께 네가티브 제안 아이콘들을 디스플레이한다(단계 S114).
그 후, 주석 프로세스가 끝날지가 결정된다(단계 S116). 주석 프로세스가 끝나지 않은 경우(단계(S116)에서의 '아니오'), 프로세스는 단계(S106)으로 돌아가고, 동일한 단계들이 반복된다. 주석 프로세스가 끝난 경우(단계(S116)에서의 '예'), 주석 추가 유닛(18)은 이미지 획득 유닛(16)에 의해 획득된 이미지들의 각각을 검색 단어 및 각각의 이미지가 사용자에 의해 검색 단어에 대한 네가티브 이미지로서 선택되는지 또는 아닌지를 나타내는 정보와 함께 이미지 데이터 저장소(20)에 저장한다(단계 S118).
대안적으로, 단계(S116)에서, 주석 프로세스가 끝나는지 여부는 사용자에 의해 검색 단어에 대해 포지티브 이미지인 것으로 확인되는 이미지들의 수가 목표 수에 도달하는지에 따라 결정될 수 있다. 구체적으로, 단계(S116)에서, 검색 단어에 대해 포지티브 이미지들로 확인되는 이미지들의 수가 목표 수에 도달하는 경우, 주석 프로세스는 끝나는 것으로 결정된다. 다른 한편으로는, 단계(S116)에서, 검색 단어에 대해 포지티브 이미지들로 확인되는 이미지들의 수가 목표 수에 도달하지 않는 경우, 프로세는 단계(S104)로 돌아갈 수 있고, 새로운 이미지들이 다운로드될 수 있다.
실시예에 따르면, 사용자가 검색 단어에 대해 네가티브인 이미지를 선택할 때마다, 검색 단어에 대해 네가티브일 수 있는 이미지들이 검출된다. 그 후, 새로운 네가티브일 수 있는 이미지들이 검출된 경우, 각각의 이미지가 검색 단어에 대해 네가티브일 수 있다는 것을 나타내는, 예컨대 네가티브 제안 아이콘 등의 주석이 디스플레이된다. 여기서, 주석 추가 유닛(18)이 검색 단어에 대해 네가티브일 수 있는 이미지를 검출하는 경우, 주석 추가 유닛(18)은 네가티브일 수 있는 이미지들(각각 네가티브 제안 아이콘들을 갖는 이미지들)을 자동으로 사실상 네가티브 이미지들로서 취급할 수 있다.
따라서, 네가티브 제안 아이콘을 봄으로써 사용자가 검색 단어에 대해 네가티브인 이미지를 빠르게 선택할 수 있기 때문에 사용자는 쉽게 훈련 세트를 준비할 수 있다.
본 발명은 원래의 온-더-플라이(on-the-fly) 이미지 분류 시스템의 포지티브 세트 주석의 속도를 높이고 보다 인체공학적으로 만드는 데에 기여한다. 아직 검사되지 않은 이미지들 내에서 네가티브인 것들을 자동으로 제안하는 것은 포지티브 세트에 보다 빠른 주석을 허용하여, 사용자 경험을 보다 유연하게 만든다.
전술한 실시예는 주석 프로세스가 포지티브일 수 있는 이미지들의 데이터 세트 상에서 수행되는 예를 제시한다. 대안적으로, 동일한 로직과 시스템이 네가티브일 수 있는 이미지들의 데이터 세트 상에 사용될 수 있다. 이것은 제1 그룹과 제2 그룹이 각각 검색 단어에 대해 네가티브인 이미지들의 그룹 및 검색 단어에 대해 포지티브인 이미지들의 그룹일 수 있다는 것을 의미한다.
예를 들어, 가장 영향력이 큰 네가티브 이미지(초평면 분리에 근접한 이미지)에 수동으로 주석을 다는 것이 유용하다. 그러한 경우에, 디스플레이 처리 유닛(14)은 네가티브일 수 있는 이미지를 디스플레이할 수 있다. 그 후, 사용자는 네가티브일 수 있는 이미지들 중에서 검색 단어에 포지티브인 이미지를 선택할 수 있다. 그 후, 디스플레이 처리 유닛(14)은 사용자에 의해 포지티브인 것으로 선택된 이미지와 함께 포지티브 아이콘을 디스플레이할 수 있다.
그 후, 주석 추가 유닛(18)은 사용자에 의해 선택된 포지티브 이미지와 남아있는 네가티브일 수 있는 이미지들에 기초하여 디스플레이 처리 유닛(14)에 의해 디스플레이된 남아있는 네가티브일 수 있는 이미지들 중에서 포지티브일 수 있는 이미지를 검출할 수 있다. 그 후, 디스플레이 처리 유닛(14)은 포지티브 제안 아이콘들을 각각 포지티브일 수 있는 이미지들과 함께 디스플레이할 수 있다. 그 후, 사용자는 포지티브 제안 아이콘들을 봄으로써 이미지에 포지티브인 이미지를 쉽게 선택할 수 있다.
또한, GIS 등의 외부 이미지 검색 시스템(300)으로부터 다운로드된 이미지들이 반복되는 경우가 있을 수 있다. 이러한 반복은 주석 프로세스를 불필요하게 힘들게 만든다. 따라서, 동일한 시각적 정보를 포함하는 이미지는 이미지들을 군집화함으로써 검출될 수 있고, 쌓는 방식(stacked manner)으로 디스플레이될 수 있다. 군집화 프로세스는 상세하게 전술한 바와 같이 유사성 기초 비교를 사용하여 수행될 수 있다. 이러한 구성을 이용하여, 사용자는 보다 빠르게 큰 범위의 이미지들 - 큰 훈련 세트는 결과에 중요한 포지티브 영향을 가지는 것으로 알려져 있음 - 에 주석을 달 수 있다. 이 경우에, 선택적으로, 사용자는 이미지 군집을 검사하기 위해 쌓인 이미지들을 확장시키는 것이 가능할 수 있다.
주석 디스플레이 보조 장치(100)의 개별적인 구성요소는 하드웨어와 소프트웨어의 임의적인 조합으로 구체화되고, 임의의 컴퓨터의 CPU, 메모리, 도면들에 도시된 구성요소들을 구체화하기 위해 메모리에 로드된 프로그램, 하드디스크와 같이 프로그램을 저장하기 위한 저장 유닛 및 네트워크 접속을 위한 인터페이스로 전형화될 수 있다. 실시예들을 위한 방법들 및 장치들이 다양한 변형을 허용한다는 것을 당업자라면 이해할 수 있을 것이다.
본 발명은 구체적으로 개시된 실시예들에 제한되지 않고, 본 발명의 범위를 벗어나지 않으면서 변경 및 변형이 이루어 질 수 있다.

Claims (7)

  1. 주석 디스플레이 보조 장치로서,
    검색 단어와 관련하여 제1 그룹에 포함될 수 있는 이미지들을 디스플레이하는 디스플레이 처리 유닛;
    상기 디스플레이 처리 유닛에 의해 디스플레이된 이미지들 중에서 상기 검색 단어와 관련하여 제2 그룹에 포함되어야 하는 이미지의 선택을 수용하는 입력 수용 유닛; 및
    상기 이미지와 연관된 주석을 추가하기 위해 상기 제2 그룹에 포함되도록 선택된 이미지에 기초하여 상기 디스플레이 처리 유닛에 의해 디스플레이된 이미지들 중에서, 상기 제2 그룹에 포함되도록 선택된 이미지 외에, 상기 제2 그룹에 속할 수 있는 이미지를 검출하는 주석 추가 유닛
    을 포함하며,
    상기 디스플레이 처리 유닛은 상기 주석 추가 유닛에 의해 상기 제2 그룹에 속할 수 있는 것으로 검출된 이미지와 연관된 주석을 디스플레이하고, 상기 주석은 상기 이미지가 제2 그룹에 속할 수 있음을 나타내는, 주석 디스플레이 보조 장치.
  2. 제1항에 있어서,
    상기 제1 그룹 및 상기 제2 그룹은 각각 상기 검색 단어에 대해 포지티브인 이미지들의 그룹 및 상기 검색 단어에 대해 네가티브인 이미지들의 그룹이거나, 각각 상기 검색 단어에 대해 네가티브인 이미지들의 그룹 및 상기 검색 단어에 대해 포지티브인 이미지들의 그룹인, 주석 디스플레이 보조 장치.
  3. 제1항에 있어서,
    상기 입력 검색 단어에 기초하여 외부 검색 엔진을 이용하여 상기 제1 그룹에 포함될 수 있는 이미지들을 획득하는 이미지 획득 유닛을 더 포함하고,
    상기 디스플레이 처리 유닛은 상기 이미지 획득 유닛에 의해 획득된 이미지들을 디스플레이하는, 주석 디스플레이 보조 장치.
  4. 제1항에 있어서,
    상기 주석 추가 유닛은 상기 제2 그룹에 포함되도록 현재 선택된 이미지 뿐만 아니라 상기 제2 그룹에 포함되도록 사전에 선택된 이미지에 기초하여, 상기 디스플레이 처리 유닛에 의해 디스플레이된 남아있는 이미지들 중에서 상기 제2 그룹에 속할 수 있는 이미지를 검출하는, 주석 디스플레이 보조 장치.
  5. 제1항에 있어서,
    상기 디스플레이 처리 유닛은 쌓는 방식(stacked manner)으로 군집화에 의해 동일한 시각적 정보를 포함하도록 검출되는 이미지들을 디스플레이하는, 주석 디스플레이 보조 장치.
  6. 주석 디스플레이를 보조하는 방법으로서,
    검색 단어와 관련하여 제1 그룹에 포함될 수 있는 이미지를 디스플레이하는 단계;
    상기 디스플레이하는 단계에서 디스플레이된 이미지들 중에서 상기 검색 단어와 관련하여 제2 그룹에 포함되어야 하는 이미지의 선택을 수용하는 단계;
    상기 이미지와 연관된 주석을 추가하기 위해 상기 제2 그룹에 포함되도록 선택된 이미지에 기초하여 상기 디스플레이하는 단계에서 디스플레이된 이미지들 중에서, 제2 그룹에 포함되도록 선택된 이미지 외에, 상기 제2 그룹에 속할 수 있는 이미지를 검출하는 단계 및
    상기 검출하는 단계에서 상기 제2 그룹에 속할 수 있는 것으로 검출된 상기 이미지와 연관된 주석 - 상기 주석은 상기 이미지가 제2 그룹에 속할 수 있다는 것을 나타냄 - 을 디스플레이하는 단계
    를 포함하는 주석 디스플레이를 보조하는 방법.
  7. 제6항에 있어서,
    상기 제1 그룹 및 상기 제2 그룹은 각각 상기 검색 단어에 대해 포지티브인 이미지들의 그룹 및 상기 검색 단어에 대해 네가티브인 이미지들의 그룹이거나, 각각 상기 검색 단어에 대해 네가티브인 이미지들의 그룹 및 상기 검색 단어에 대해 포지티브인 이미지들의 그룹인, 주석 디스플레이를 보조하는 방법
KR1020150071697A 2014-05-28 2015-05-22 주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법 KR20150137006A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14305797.4 2014-05-28
EP14305797.4A EP2950224A1 (en) 2014-05-28 2014-05-28 Annotation display assistance device and method of assisting annotation display

Publications (1)

Publication Number Publication Date
KR20150137006A true KR20150137006A (ko) 2015-12-08

Family

ID=50933108

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150071697A KR20150137006A (ko) 2014-05-28 2015-05-22 주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법

Country Status (6)

Country Link
US (1) US20150347369A1 (ko)
EP (2) EP2950224A1 (ko)
JP (1) JP2015225669A (ko)
KR (1) KR20150137006A (ko)
CN (1) CN105302849A (ko)
TW (1) TW201546636A (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11048779B2 (en) 2015-08-17 2021-06-29 Adobe Inc. Content creation, fingerprints, and watermarks
US10366433B2 (en) 2015-08-17 2019-07-30 Adobe Inc. Methods and systems for usage based content search results
US10592548B2 (en) 2015-08-17 2020-03-17 Adobe Inc. Image search persona techniques and systems
US20170053365A1 (en) * 2015-08-17 2017-02-23 Adobe Systems Incorporated Content Creation Suggestions using Keywords, Similarity, and Social Networks
US10475098B2 (en) 2015-08-17 2019-11-12 Adobe Inc. Content creation suggestions using keywords, similarity, and social networks
US10878021B2 (en) 2015-08-17 2020-12-29 Adobe Inc. Content search and geographical considerations
CN107766349B (zh) * 2016-08-16 2022-03-01 阿里巴巴集团控股有限公司 一种生成文本的方法、装置、设备及客户端
CN107832662B (zh) * 2017-09-27 2022-05-27 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
US10853983B2 (en) 2019-04-22 2020-12-01 Adobe Inc. Suggestions to enrich digital artwork

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6970860B1 (en) * 2000-10-30 2005-11-29 Microsoft Corporation Semi-automatic annotation of multimedia objects
US6748398B2 (en) * 2001-03-30 2004-06-08 Microsoft Corporation Relevance maximizing, iteration minimizing, relevance-feedback, content-based image retrieval (CBIR)
US7869647B2 (en) * 2004-04-02 2011-01-11 Agilent Technologies, Inc. System and method for processing training data for a statistical application
US20070098303A1 (en) * 2005-10-31 2007-05-03 Eastman Kodak Company Determining a particular person from a collection
US8726144B2 (en) * 2005-12-23 2014-05-13 Xerox Corporation Interactive learning-based document annotation
JP2007286864A (ja) * 2006-04-17 2007-11-01 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体
US7840076B2 (en) * 2006-11-22 2010-11-23 Intel Corporation Methods and apparatus for retrieving images from a large collection of images
US7890443B2 (en) 2007-07-13 2011-02-15 Microsoft Corporation Learning classifiers using combined boosting and weight trimming
US9002100B2 (en) * 2008-04-02 2015-04-07 Xerox Corporation Model uncertainty visualization for active learning
US20090287655A1 (en) * 2008-05-13 2009-11-19 Bennett James D Image search engine employing user suitability feedback
US8676803B1 (en) * 2009-11-04 2014-03-18 Google Inc. Clustering images
US8724908B2 (en) * 2010-09-03 2014-05-13 Adobe Systems Incorporated System and method for labeling a collection of images
US10142441B2 (en) * 2010-09-24 2018-11-27 Google Llc Search result annotations
US9092529B1 (en) * 2011-11-11 2015-07-28 Google Inc. Social search endorsements
JP5895777B2 (ja) * 2012-09-06 2016-03-30 富士ゼロックス株式会社 情報分類プログラム及び情報処理装置

Also Published As

Publication number Publication date
US20150347369A1 (en) 2015-12-03
JP2015225669A (ja) 2015-12-14
EP2950224A1 (en) 2015-12-02
TW201546636A (zh) 2015-12-16
CN105302849A (zh) 2016-02-03
EP2950239A1 (en) 2015-12-02

Similar Documents

Publication Publication Date Title
KR20150137006A (ko) 주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법
US20220075806A1 (en) Natural language image search
US10043109B1 (en) Attribute similarity-based search
US8775401B2 (en) Shape based picture search
US9449026B2 (en) Sketch-based image search
US7961986B1 (en) Ranking of images and image labels
US7769771B2 (en) Searching a document using relevance feedback
US11461386B2 (en) Visual recognition using user tap locations
US10140261B2 (en) Visualizing font similarities for browsing and navigation using a font graph
US8577882B2 (en) Method and system for searching multilingual documents
US9535930B2 (en) System and method for using an image to provide search results
US10210181B2 (en) Searching and annotating within images
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
US8923626B1 (en) Image retrieval
CN110598123B (zh) 基于画像相似性的信息检索推荐方法、装置及存储介质
US10698971B2 (en) Method and apparatus for storing access log based on keyword
US20160283520A1 (en) Search device, search method, and computer program product
US20180239838A1 (en) Display processing apparatus and display processing method