KR102671052B1 - 동적 컨텍스트 미디어 필터 - Google Patents
동적 컨텍스트 미디어 필터 Download PDFInfo
- Publication number
- KR102671052B1 KR102671052B1 KR1020237021031A KR20237021031A KR102671052B1 KR 102671052 B1 KR102671052 B1 KR 102671052B1 KR 1020237021031 A KR1020237021031 A KR 1020237021031A KR 20237021031 A KR20237021031 A KR 20237021031A KR 102671052 B1 KR102671052 B1 KR 102671052B1
- Authority
- KR
- South Korea
- Prior art keywords
- media
- media content
- client device
- location
- image data
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 37
- 230000004044 response Effects 0.000 claims description 14
- 230000006870 function Effects 0.000 description 27
- 238000004891 communication Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 12
- 230000000007 visual effect Effects 0.000 description 7
- 230000006855 networking Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000537 electroencephalography Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000008261 resistance mechanism Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4722—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
- H04N21/4725—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content using interactive regions of the image, e.g. hot spots
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/54—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
- H04L51/046—Interoperability with other network applications or services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Transfer Between Computers (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
클라이언트 디바이스에서 이미지 프레임을 캡처하는 단계 - 상기 이미지 프레임은 객체의 묘사를 포함함 -, 상기 이미지 프레임 내의 상기 객체의 묘사에 기초하여 상기 객체의 객체 카테고리를 식별하는 단계, 미디어 저장소 내의 상기 객체 카테고리와 연관된 미디어 콘텐츠에 액세스하는 단계, 상기 미디어 콘텐츠의 프레젠테이션을 생성하는 단계, 및 상기 클라이언트 디바이스에서 상기 이미지 프레임 내의 상기 미디어 콘텐츠의 프레젠테이션의 디스플레이를 야기하는 단계를 포함하는 동작들을 수행하도록 구성된 컨텍스트 필터 시스템.
Description
본 개시내용의 실시예들은 일반적으로 모바일 컴퓨팅 기술에 관한 것으로, 제한으로서가 아니라, 더 특정하게는, 클라이언트 디바이스에서 동적 컨텍스트 미디어 콘텐츠를 생성하고 디스플레이하기 위한 시스템들에 관한 것이다.
증강 현실(AR)은 컴퓨터 생성 감각 입력들에 의해 증강되는 요소들을 갖는 물리적 현실 세계 환경의 라이브 직접 또는 간접 뷰이다.
임의의 특정 요소 또는 동작의 논의를 쉽게 식별하기 위해, 참조 번호의 최상위 숫자 또는 숫자들은 해당 요소가 처음으로 도입되는 도면 번호를 참조한다.
도 1은 일부 실시예들에 따른 네트워크를 통해 데이터(예를 들어, 메시지들 및 연관된 콘텐츠)를 교환하기 위한 예시적인 메시징 시스템을 도시하는 블록도이고, 여기서 메시징 시스템은 컨텍스트 필터 시스템(contextual filter system)을 포함한다.
도 2는 예시적인 실시예들에 따른, 메시징 시스템에 관한 추가의 상세들을 예시하는 블록도이다.
도 3은 특정 예시적인 실시예들에 따른, 컨텍스트 필터 시스템의 다양한 모듈들을 예시하는 블록도이다.
도 4는 특정 예시적인 실시예들에 따른, 컨텍스트 필터의 디스플레이를 야기하는 방법을 묘사하는 흐름도이다.
도 5는 특정 예시적인 실시예들에 따른, 컨텍스트 필터의 디스플레이를 야기하는 방법을 묘사하는 흐름도이다.
도 6은 특정 예시적인 실시예들에 따른, 클라이언트 디바이스에서 디스플레이될 컨텍스트 필터를 생성하는 방법을 묘사하는 흐름도이다.
도 7은 특정 예시적인 실시예들에 따른, 컨텍스트 필터 시스템에 의해 프레젠테이션된 인터페이스들을 묘사하는 인터페이스 플로우-다이어그램이다.
도 8은 다양한 실시예들을 구현하기 위해 사용되고 본 명세서에 설명된 다양한 하드웨어 아키텍처들과 함께 사용될 수 있는 대표적인 소프트웨어 아키텍처를 예시하는 블록도이다.
도 9는 머신-판독가능 매체(예를 들어, 머신-판독가능 스토리지 매체)로부터의 명령어들을 판독하고 본 명세서에서 논의된 방법론들 중 어느 하나 이상을 수행할 수 있는, 일부 예시적인 실시예들에 따른, 머신의 컴포넌트들을 예시하는 블록도이다.
도 1은 일부 실시예들에 따른 네트워크를 통해 데이터(예를 들어, 메시지들 및 연관된 콘텐츠)를 교환하기 위한 예시적인 메시징 시스템을 도시하는 블록도이고, 여기서 메시징 시스템은 컨텍스트 필터 시스템(contextual filter system)을 포함한다.
도 2는 예시적인 실시예들에 따른, 메시징 시스템에 관한 추가의 상세들을 예시하는 블록도이다.
도 3은 특정 예시적인 실시예들에 따른, 컨텍스트 필터 시스템의 다양한 모듈들을 예시하는 블록도이다.
도 4는 특정 예시적인 실시예들에 따른, 컨텍스트 필터의 디스플레이를 야기하는 방법을 묘사하는 흐름도이다.
도 5는 특정 예시적인 실시예들에 따른, 컨텍스트 필터의 디스플레이를 야기하는 방법을 묘사하는 흐름도이다.
도 6은 특정 예시적인 실시예들에 따른, 클라이언트 디바이스에서 디스플레이될 컨텍스트 필터를 생성하는 방법을 묘사하는 흐름도이다.
도 7은 특정 예시적인 실시예들에 따른, 컨텍스트 필터 시스템에 의해 프레젠테이션된 인터페이스들을 묘사하는 인터페이스 플로우-다이어그램이다.
도 8은 다양한 실시예들을 구현하기 위해 사용되고 본 명세서에 설명된 다양한 하드웨어 아키텍처들과 함께 사용될 수 있는 대표적인 소프트웨어 아키텍처를 예시하는 블록도이다.
도 9는 머신-판독가능 매체(예를 들어, 머신-판독가능 스토리지 매체)로부터의 명령어들을 판독하고 본 명세서에서 논의된 방법론들 중 어느 하나 이상을 수행할 수 있는, 일부 예시적인 실시예들에 따른, 머신의 컴포넌트들을 예시하는 블록도이다.
위에 논의된 바와 같이, AR 시스템들은 물리적 현실 세계 환경의 라이브 직접 또는 간접 뷰를 디스플레이하기 위한 그래픽 사용자 인터페이스들(GUI)을 사용자들에 제공하고, 여기서 뷰의 요소들은 컴퓨터 생성 감각 입력들에 의해 증강된다. 예를 들어, AR 인터페이스는, 미디어 콘텐츠가 현실 세계 환경에서의 요소들과 상호작용하는 것처럼 보이도록, 현실 세계 환경의 뷰의 디스플레이 내의 위치들에서 미디어 콘텐츠를 프레젠테이션할 수 있다.
본 명세서에 설명된 예시적인 실시예들은 클라이언트 디바이스에서 컨텍스트 필터들을 생성하고 디스플레이하기 위한 컨텍스트 필터 시스템에 관한 것이다. 특정 실시예들에 따르면, 이 컨텍스트 필터 시스템은, 클라이언트 디바이스에서 이미지 프레임을 캡처하는 단계 - 상기 이미지 프레임은 객체의 묘사를 포함함 -, 상기 이미지 프레임 내의 상기 객체의 묘사에 기초하여 상기 객체의 객체 카테고리를 식별하는 단계, 미디어 저장소 내의 상기 객체 카테고리와 연관된 미디어 콘텐츠에 액세스하는 단계, 상기 미디어 콘텐츠의 프레젠테이션을 생성하는 단계, 및 상기 클라이언트 디바이스에서 상기 이미지 프레임 내의 상기 미디어 콘텐츠의 프레젠테이션의 디스플레이를 야기하는 단계를 포함하는 동작들을 수행하도록 구성된다.
상기 미디어 콘텐츠는 다양한 형상, 크기 및 테마의 애니메이션된 그래픽 교환 포맷(GIF) 이미지들을 포함할 수 있다. 일부 실시예들에서, 이 컨텍스트 필터 시스템은 상기 미디어 콘텐츠의 소팅되고 라벨링된 컬렉션을 포함하는 미디어 저장소와 통신할 수 있고, 여기서 상기 미디어 콘텐츠의 컬렉션 내의 상기 미디어 콘텐츠는 상기 미디어 콘텐츠의 속성들에 기초하여 라벨링되거나 태깅된다. 예를 들어, 미디어 콘텐츠는 "음식" 또는 "농구"와 같은 미디어 콘텐츠의 객체 카테고리를 식별하는 라벨로 태깅될 수 있고, 따라서 객체 카테고리에 대한 참조는 미디어 콘텐츠의 컬렉션 중의 미디어 콘텐츠의 세트에 대응하게 된다.
일부 실시예들에서, 사용자 옵션들의 세트 중에서 사용자 옵션을 선택하는 입력을 수신하는 것에 응답하여, 이 컨텍스트 필터 시스템은 클라이언트 디바이스로부터 이미지를 캡처하고, 여기서 상기 이미지 프레임은 현실 세계 환경에서의 하나 이상의 객체의 묘사를 포함하고, 상기 이미지 프레임 내에 묘사된 상기 객체 중 하나 이상의 객체의 객체 카테고리를 식별한다. 예를 들어, 이 컨텍스트 필터 시스템은 상기 이미지 프레임 내에서 하나 이상의 QR(Quick Response) 코드를 검출할 수 있고 - 여기서 상기 QR 코드들은 상기 이미지 프레임 내에 묘사된 객체 또는 상기 객체와 연관된 객체 카테고리를 식별함 -, 또는 추가 실시예들에서 하나 이상의 이미지 및 텍스트 인식 기법들을 이용하여 상기 이미지 프레임 내에 묘사된 상기 객체를 식별할 수도 있다. 상기 객체 또는 객체 카테고리의 식별에 기초하여, 이 컨텍스트 필터 시스템은 상기 객체 또는 객체 카테고리와 연관된 라벨들 또는 태그들의 세트를 검색하고, 이 라벨들 또는 태그들의 세트에 기초하여 미디어 콘텐츠를 식별하기 위해 미디어 저장소를 조회한다. 따라서, 상기 콘텐츠 저장소로부터의 상기 식별된 미디어 콘텐츠는 상기 이미지 프레임 내에서 식별된 상기 객체 또는 객체 카테고리와 연관된 미디어 콘텐츠의 세트를 포함할 수 있다.
상기 미디어 저장소로부터 상기 미디어 콘텐츠의 세트를 식별하는 것에 응답하여, 이 컨텍스트 필터 시스템은 상기 클라이언트 디바이스에서 상기 미디어 콘텐츠의 세트를 생성하고 그의 디스플레이를 야기한다. 일부 실시예들에서, 상기 미디어 콘텐츠의 세트의 프레젠테이션을 생성하기 위해, 이 컨텍스트 필터 시스템은 상기 미디어 콘텐츠의 세트에 대한 프레젠테이션 포맷 및 레이아웃을 제공하는 미디어 템플릿을 검색한다. 예를 들어, 상기 미디어 템플릿은 상기 클라이언트 디바이스에서 상기 이미지 프레임 내에 상기 미디어 콘텐츠의 세트를 프레젠테이션하기 위한 위치들을 정의할 수 있다. 일부 실시예들에서, 상기 클라이언트 디바이스에서 상기 이미지 프레임 내의 상기 미디어 콘텐츠의 세트의 프레젠테이션은 상기 이미지 프레임 내에서 식별된 상기 객체들의 위치(또는 위치들)에 기초할 수 있다.
도 1은 네트워크를 통해 데이터(예를 들어, 메시지 및 연관된 콘텐츠)를 교환하기 위한 예시적인 메시징 시스템(100)을 도시하는 블록도이다. 메시징 시스템(100)은 메시징 클라이언트 애플리케이션(104)을 포함하는 다수의 애플리케이션을 호스팅하는 하나 이상의 클라이언트 디바이스(102)를 포함한다. 각각의 메시징 클라이언트 애플리케이션(104)은 네트워크(106)(예를 들어, 인터넷)를 통해 메시징 클라이언트 애플리케이션(104) 및 메시징 서버 시스템(108)의 다른 인스턴스들에 통신가능하게 결합된다.
따라서, 각각의 메시징 클라이언트 애플리케이션(104)은 네트워크(106)를 통해 다른 메시징 클라이언트 애플리케이션(104)과 그리고 메시징 서버 시스템(108)과 통신하고 데이터를 교환할 수 있다. 메시징 클라이언트 애플리케이션(104)들 사이에 그리고 메시징 클라이언트 애플리케이션(104)과 메시징 서버 시스템(108) 사이에 교환되는 데이터는, 기능들(예를 들어, 기능들을 기동시키는 명령들)뿐만 아니라, 페이로드 데이터(예를 들어, 텍스트, 오디오, 비디오 또는 다른 멀티미디어 데이터)를 포함한다.
메시징 서버 시스템(108)은 네트워크(106)를 통해 특정 메시징 클라이언트 애플리케이션(104)에 서버 측 기능성을 제공한다. 메시징 시스템(100)의 특정 기능들이 메시징 클라이언트 애플리케이션(104)에 의해 또는 메시징 서버 시스템(108)에 의해 수행되는 것으로 본 명세서에 설명되지만, 메시징 클라이언트 애플리케이션(104) 또는 메시징 서버 시스템(108) 내의 특정 기능성의 위치는 설계 선택사항이라는 것을 인식할 것이다. 예를 들어, 처음에는 특정 기술 및 기능성을 메시징 서버 시스템(108) 내에 배치하지만, 나중에 클라이언트 디바이스(102)가 충분한 처리 용량을 갖는 경우 이 기술 및 기능성을 메시징 클라이언트 애플리케이션(104)으로 이전시키는 것이 기술적으로 바람직할 수 있다.
메시징 서버 시스템(108)은 메시징 클라이언트 애플리케이션(104)에 제공되는 다양한 서비스들 및 동작들을 지원한다. 그러한 동작들은 메시징 클라이언트 애플리케이션(104)에 데이터를 송신하고, 그로부터 데이터를 수신하고, 그에 의해 생성된 데이터를 처리하는 것을 포함한다. 일부 실시예들에서, 이 데이터는, 예로서, 메시지 콘텐츠, 클라이언트 디바이스 정보, 지오로케이션 정보, 미디어 주석 및 오버레이, 메시지 콘텐츠 지속 조건, 소셜 네트워크 정보, 및 라이브 이벤트 정보를 포함한다. 다른 실시예들에서, 다른 데이터가 사용된다. 메시징 시스템(100) 내의 데이터 교환은 메시징 클라이언트 애플리케이션(104)의 GUI들을 통해 이용 가능한 기능들을 통해 기동되고 제어된다.
이제 구체적으로 메시징 서버 시스템(108)을 참조하면, 애플리케이션 프로그램 인터페이스(API) 서버(110)가 애플리케이션 서버(112)에 결합되어 프로그램 방식의 인터페이스(programmatic interface)를 제공한다. 애플리케이션 서버(112)는 데이터베이스 서버(118)에 통신가능하게 결합되고, 이는 애플리케이션 서버(112)에 의해 처리되는 메시지들과 연관된 데이터가 저장되는 데이터베이스(120)로의 액세스를 용이하게 한다.
애플리케이션 프로그램 인터페이스(API) 서버(110)를 구체적으로 다루면, 이 서버는 클라이언트 디바이스(102)와 애플리케이션 서버(112) 사이에서 메시지 데이터(예를 들어, 명령들 및 메시지 페이로드들)를 수신하고 송신한다. 구체적으로, 애플리케이션 프로그램 인터페이스(API) 서버(110)는 애플리케이션 서버(112)의 기능성을 기동시키기 위해 메시징 클라이언트 애플리케이션(104)에 의해 호출되거나 조회될 수 있는 인터페이스들(예를 들어, 루틴들 및 프로토콜들)의 세트를 제공한다. 애플리케이션 프로그램 인터페이스(API) 서버(110)는, 계정 등록, 로그인 기능성, 특정 메시징 클라이언트 애플리케이션(104)으로부터 다른 메시징 클라이언트 애플리케이션(104)으로의, 애플리케이션 서버(112)를 통한 메시지의 전송, 메시징 클라이언트 애플리케이션(104)으로부터 메시징 서버 애플리케이션(114)으로의 미디어 파일들(예를 들어, 이미지 또는 비디오)의 전송, 및 다른 메시징 클라이언트 애플리케이션(104)에 의한 가능한 액세스를 위해, 미디어 데이터의 컬렉션(예를 들어, 스토리)의 설정, 클라이언트 디바이스(102)의 사용자의 친구들의 리스트의 검색, 그러한 컬렉션들의 검색, 메시지 및 콘텐츠의 검색, 소셜 그래프로의 친구의 추가 및 삭제, 소셜 그래프 내의 친구들의 위치, 및 (예를 들어, 메시징 클라이언트 애플리케이션(104)에 관련된) 애플리케이션 이벤트를 오픈하는 것 등을 포함한, 애플리케이션 서버(112)에 의해 지원되는 다양한 기능들을 노출시킨다.
애플리케이션 서버(112)는 메시징 서버 애플리케이션(114), 이미지 처리 시스템(116), 소셜 네트워크 시스템(122), 및 컨텍스트 필터 시스템(124)을 포함하는 다수의 애플리케이션 및 서브시스템들을 호스팅한다. 컨텍스트 필터 시스템(124)은, 일부 예시적인 실시예들에 따라, 클라이언트 디바이스(102)로부터 객체의 묘사를 포함하는 이미지 프레임을 캡처하고, 상기 객체의 묘사에 기초하여 상기 이미지 프레임 내의 하나 이상의 객체 또는 객체 카테고리를 식별하고, 상기 객체 또는 객체 카테고리들에 기초하여 하나 이상의 라벨 또는 태그를 선택하고, 상기 라벨들 또는 태그들에 기초하여 미디어 콘텐츠의 세트를 검색하고, 상기 클라이언트 디바이스에서 상기 이미지 프레임 내의 상기 미디어 콘텐츠의 세트의 프레젠테이션의 디스플레이를 야기하도록 구성된다. 컨텍스트 필터 시스템(124)의 추가의 상세들은 아래의 도 3에서 발견될 수 있다.
메시징 서버 애플리케이션(114)은, 특히 메시징 클라이언트 애플리케이션(104)의 다수의 인스턴스로부터 수신된 메시지들에 포함된 콘텐츠(예를 들어, 텍스트 및 멀티미디어 콘텐츠)의 집성 및 다른 처리에 관련된, 다수의 메시지 처리 기술들 및 기능들을 구현한다. 더 상세히 설명되는 바와 같이, 다수의 소스로부터의 텍스트 및 미디어 콘텐츠는, 콘텐츠의 컬렉션들(예를 들어, 스토리 또는 갤러리라고 불림)로 집성될 수 있다. 그 후, 이들 컬렉션은 메시징 서버 애플리케이션(114)에 의해, 메시징 클라이언트 애플리케이션(104)이 이용할 수 있게 된다. 다른 프로세서 및 메모리 집약적인 데이터의 처리는 또한, 그러한 처리를 위한 하드웨어 요건을 고려하여, 메시징 서버 애플리케이션(114)에 의해 서버 측에서 수행될 수 있다.
애플리케이션 서버(112)는 전형적으로 메시징 서버 애플리케이션(114)에서 메시지의 페이로드 내에서 수신된 이미지 또는 비디오에 관하여, 다양한 이미지 처리 동작들을 수행하는 데 전용되는 이미지 처리 시스템(116)을 또한 포함한다.
소셜 네트워크 시스템(122)은 다양한 소셜 네트워킹 기능들 서비스들을 지원하고, 이들 기능 및 서비스를 메시징 서버 애플리케이션(114)이 이용할 수 있게 한다. 이를 위해, 소셜 네트워크 시스템(122)은 데이터베이스(120) 내에 엔티티 그래프(304)를 유지하고 액세스한다. 소셜 네트워크 시스템(122)에 의해 지원되는 기능들 및 서비스들의 예들은, 특정 사용자가 관계를 가지거나 "팔로우하는" 메시징 시스템(100)의 다른 사용자들의 식별, 및 또한 다른 엔티티들의 식별 및 특정 사용자의 관심사들을 포함한다.
애플리케이션 서버(112)는 데이터베이스 서버(118)에 통신가능하게 결합되고, 이는 메시징 서버 애플리케이션(114)에 의해 처리되는 메시지들과 연관된 데이터가 저장되는 데이터베이스(120)로의 액세스를 용이하게 한다.
도 2는 예시적인 실시예들에 따른, 메시징 시스템(100)에 관한 추가의 상세들을 예시하는 블록도이다. 구체적으로, 메시징 시스템(100)은 메시징 클라이언트 애플리케이션(104) 및 애플리케이션 서버(112)를 포함하는 것으로 도시되고, 이는 결국 다수의 일부 서브시스템, 즉, 단기적 타이머 시스템(202), 컬렉션 관리 시스템(204) 및 주석 시스템(206)을 구현한다.
단기적 타이머 시스템(202)은 메시징 클라이언트 애플리케이션(104) 및 메시징 서버 애플리케이션(114)에 의해 허용되는 콘텐츠에 대한 임시 액세스를 시행하는 것을 담당한다. 이를 위해, 단기적 타이머 시스템(202)은 메시지, 메시지들의 컬렉션(예를 들어, SNAPCHAT 스토리), 또는 그래픽 요소와 연관된 지속기간 및 디스플레이 파라미터들에 기초하여, 메시징 클라이언트 애플리케이션(104)을 통해 메시지들 및 연관된 콘텐츠를 선택적으로 디스플레이하고 그에 대한 액세스를 가능하게 하는 다수의 타이머를 포함한다. 단기적 타이머 시스템(202)의 동작에 관한 추가의 상세들이 아래에 제공된다.
컬렉션 관리 시스템(204)은 미디어의 컬렉션들(예를 들어, 텍스트, 이미지 비디오 및 오디오 데이터의 컬렉션들)을 관리하는 것을 담당한다. 일부 예들에서, 콘텐츠의 컬렉션(예를 들어, 이미지들, 비디오, 텍스트 및 오디오를 포함하는 메시지들)은 "이벤트 갤러리" 또는 "이벤트 스토리"로 조직될 수 있다. 그러한 컬렉션은 콘텐츠가 관련되는 이벤트의 지속기간과 같은 지정된 기간 동안 이용 가능하게 될 수 있다. 예를 들어, 음악 콘서트와 관련된 콘텐츠는 그 음악 콘서트의 지속기간 동안 "스토리"로서 이용 가능하게 될 수 있다. 컬렉션 관리 시스템(204)은 또한 메시징 클라이언트 애플리케이션(104)의 사용자 인터페이스에 특정 컬렉션의 존재의 통지를 제공하는 아이콘을 게시하는 것을 담당할 수 있다.
컬렉션 관리 시스템(204)은 더욱이 컬렉션 관리자가 콘텐츠의 특정 컬렉션을 관리 및 큐레이팅하는 것을 허용하는 큐레이션 인터페이스(208)를 포함한다. 예를 들어, 큐레이션 인터페이스(208)는 이벤트 조직자가 특정 이벤트에 관련된 콘텐츠의 컬렉션을 큐레이팅(예를 들어, 부적절한 콘텐츠 또는 중복 메시지들을 삭제)하는 것을 가능하게 한다. 추가적으로, 컬렉션 관리 시스템(204)은 머신 비전(또는 이미지 인식 기술) 및 콘텐츠 규칙들을 이용하여 콘텐츠 컬렉션을 자동으로 큐레이팅한다. 특정 실시예들에서, 사용자 생성 콘텐츠를 컬렉션에 포함시키는 것에 대한 보상이 사용자에게 지불될 수 있다. 그러한 경우들에서, 큐레이션 인터페이스(208)는 그러한 사용자들에게 그들의 콘텐츠를 사용하는 것에 대해 자동으로 지불하도록 동작한다.
주석 시스템(206)은 사용자가 메시지와 연관된 미디어 콘텐츠를 주석하거나 다른 방식으로 수정하거나 편집하는 것을 가능하게 하는 다양한 기능들을 제공한다. 예를 들어, 주석 시스템(206)은 메시징 시스템(100)에 의해 처리된 메시지들에 대한 미디어 오버레이들의 생성 및 게시와 관련된 기능들을 제공한다. 주석 시스템(206)은 클라이언트 디바이스(102)의 지오로케이션에 기초하여 메시징 클라이언트 애플리케이션(104)에 미디어 오버레이(예를 들어, SNAPCHAT 필터)를 유효하게 공급한다. 다른 예에서, 주석 시스템(206)은 클라이언트 디바이스(102)의 사용자의 소셜 네트워크 정보와 같은 다른 정보에 기초하여 메시징 클라이언트 애플리케이션(104)에 미디어 오버레이를 유효하게 공급한다. 미디어 오버레이는 오디오 및 시각 콘텐츠 및 시각 효과를 포함할 수 있다. 오디오 및 시각 콘텐츠의 예들은 사진들, 텍스트들, 로고들, 애니메이션들, 및 음향 효과들뿐만 아니라 컨텍스트 필터 시스템(124)에 의해 생성되는 것들과 같은 애니메이션된 얼굴 모델들을 포함한다. 시각 효과의 예는 컬러 오버레잉을 포함한다. 오디오 및 시각 콘텐츠 또는 시각 효과는 클라이언트 디바이스(102)에 있는 미디어 콘텐츠 항목(예를 들어, 사진)에 적용될 수 있다. 예를 들어, 미디어 오버레이는 클라이언트 디바이스(102)에 의해 촬영되어 생성된 사진의 위에 오버레이될 수 있는 텍스트를 포함한다. 다른 예에서, 미디어 오버레이는, 위치 오버레이의 식별(예를 들어, Venice beach), 라이브 이벤트의 이름, 또는 상인 오버레이의 이름(예를 들어, Beach Coffee House)을 포함한다. 다른 예에서, 주석 시스템(206)은 클라이언트 디바이스(102)의 지오로케이션을 이용하여, 클라이언트 디바이스(102)의 지오로케이션에서의 상인의 이름을 포함하는 미디어 오버레이를 식별한다. 미디어 오버레이는 상인과 연관된 다른 표시들을 포함할 수 있다. 미디어 오버레이들은 데이터베이스(120)에 저장되고 데이터베이스 서버(118)를 통해 액세스될 수 있다.
하나의 예시적인 실시예에서, 주석 시스템(206)은 사용자들이 지도 상에서 지오로케이션을 선택하고, 선택된 지오로케이션과 연관된 콘텐츠를 업로드하는 것을 가능하게 하는 사용자-기반 게시 플랫폼(user-based publication platform)을 제공한다. 사용자는 또한 특정 미디어 오버레이가 다른 사용자들에게 제공되어야 하는 상황들을 지정할 수 있다. 주석 시스템(206)은 업로드된 콘텐츠를 포함하고 업로드된 콘텐츠를 선택된 지오로케이션과 연관시키는 미디어 오버레이를 생성한다.
다른 예시적인 실시예에서, 주석 시스템(206)은 상인들이 입찰 프로세스를 통해 지오로케이션과 연관된 특정 미디어 오버레이를 선택하는 것을 가능하게 하는 상인 기반 게시 플랫폼을 제공한다. 예를 들어, 주석 시스템(206)은 최고 입찰 상인의 미디어 오버레이를 사전 정의된 양의 시간 동안 대응하는 지오로케이션과 연관시킨다.
도 3은 일부 예시적인 실시예들에 따른, 컨텍스트 필터 시스템(124)의 컴포넌트들을 예시하는 블록도로서, 이들은 클라이언트 디바이스(102)로부터 객체의 묘사를 포함하는 이미지 프레임을 캡처하고, 상기 객체의 묘사에 기초하여 상기 이미지 프레임 내의 하나 이상의 객체 또는 객체 카테고리를 식별하고, 상기 객체 또는 객체 카테고리들에 기초하여 하나 이상의 라벨 또는 태그를 선택하고, 상기 라벨들 또는 태그들에 기초하여 미디어 콘텐츠의 세트를 검색하고, 상기 클라이언트 디바이스에서 상기 이미지 프레임 내의 상기 미디어 콘텐츠의 세트의 프레젠테이션의 디스플레이를 야기하는 동작들을 수행하게 하도록 컨텍스트 필터 시스템(124)을 구성한다.
컨텍스트 필터 시스템(124)은 프레젠테이션 모듈(302), 미디어 모듈(304), 통신 모듈(306) 및 식별 모듈(308)을 포함하는 것으로 도시되어 있고, 이들 모두는 서로 통신하도록 구성된다(예를 들어, 버스, 공유 메모리, 또는 스위치를 통해). 이들 모듈 중 어느 하나 이상은 하나 이상의 프로세서(310)를 이용하여(예를 들어, 그 모듈에 대해 설명된 기능들을 수행하도록 그러한 하나 이상의 프로세서를 구성함으로써) 구현될 수 있고 따라서 프로세서들(310) 중 하나 이상을 포함할 수 있다.
설명된 모듈들 중 어느 하나 이상은 하드웨어 단독(예를 들어, 머신의 프로세서들(310) 중 하나 이상) 또는 하드웨어와 소프트웨어의 조합을 이용하여 구현될 수 있다. 예를 들어, 컨텍스트 필터 시스템(124)의 설명된 임의의 모듈은 그 모듈에 대해 본 명세서에 설명된 동작들을 수행하도록 구성된 프로세서들(310) 중 하나 이상(예를 들어, 머신의 하나 이상의 프로세서 중의 또는 그들의 서브세트)의 배열을 물리적으로 포함할 수 있다. 다른 예로서, 컨텍스트 필터 시스템(124)의 임의의 모듈은 그 모듈에 대해 본 명세서에 설명된 동작들을 수행하도록 하나 이상의 프로세서(310)(예를 들어, 머신의 하나 이상의 프로세서 중의)의 배열을 구성하는 소프트웨어, 하드웨어, 또는 둘 다를 포함할 수 있다. 따라서, 컨텍스트 필터 시스템(124)의 상이한 모듈들은 상이한 시점들에서 그러한 프로세서들(310)의 상이한 배열들 또는 그러한 프로세서들(310)의 단일 배열을 포함하고 구성할 수 있다. 더욱이, 컨텍스트 필터 시스템(124)의 임의의 둘 이상의 모듈이 단일 모듈로 결합될 수 있고, 단일 모듈에 대해 본 명세서에 설명된 기능들은 다수의 모듈 사이에서 세분될 수 있다. 더욱이, 다양한 예시적인 실시예들에 따르면, 단일 머신, 데이터베이스, 또는 디바이스 내에 구현되는 것으로 본 명세서에 설명된 모듈들은 다수의 머신, 데이터베이스, 또는 디바이스에 걸쳐 분산될 수 있다.
도 4는 특정 예시적인 실시예들에 따른, 클라이언트 디바이스(102)에서 컨텍스트 필터의 디스플레이를 야기하는 방법(400)을 묘사하는 흐름도이다. 방법(400)의 동작들은 도 3에 관하여 위에 설명된 모듈들에 의해 수행될 수 있다. 도 4에 도시된 바와 같이, 방법(400)은 하나 이상의 동작(402, 404, 406, 408, 및 410)을 포함한다.
동작 402에서, 프레젠테이션 모듈(302)은 클라이언트 디바이스(102)에서 이미지 프레임을 캡처한다 - 여기서 상기 이미지 프레임은 상기 이미지 프레임 내의 위치에 객체의 묘사를 포함한다. 예를 들어, 프레젠테이션 모듈(302)은 클라이언트 디바이스(102)의 카메라를 활성화하고, 클라이언트 디바이스(102)의 카메라가 이미지 프레임을 캡처하게 할 수 있다.
동작 404에서, 식별 모듈(308)은 이미지 프레임 내에 묘사된 객체를 식별한다. 일부 실시예들에서, 객체를 식별하기 위해, 식별 모듈(308)은 컴퓨터 비전을 이용하여 하나 이상의 이미지 또는 패턴 인식 기법을 수행할 수 있다. 추가 실시예들에서, 식별 모듈(308)은 이미지 프레임 내의 하나 이상의 QR 코드를 식별하고, QR 코드들에 기초하여 객체를 식별할 수 있다.
동작 406에서, 미디어 모듈(304)은 미디어 저장소(예를 들어, 데이터베이스들(120)) 내의 식별된 객체와 연관된 미디어 콘텐츠에 액세스한다. 예를 들어, 일부 실시예들에서, 식별 모듈(308)은 이미지 프레임 내의 객체의 식별에 기초하여 하나 이상의 태그 또는 라벨을 선택하고, 미디어 모듈(304)로 하여금 선택된 태그들 또는 라벨들에 기초하여 미디어 저장소를 조회하게 할 수 있다. 따라서, 미디어 모듈(304)은, 선택된 태그들 또는 라벨들로 미디어 저장소 내에 라벨링된 미디어 콘텐츠를 참조함으로써, 이미지 프레임 내에서 식별된 객체와 관련된 미디어 콘텐츠의 세트에 액세스할 수 있다.
동작 408에서, 프레젠테이션 모듈(302)은 클라이언트 디바이스(102)에서 이미지 프레임 내에 디스플레이될 미디어 콘텐츠의 세트의 프레젠테이션을 생성한다. 예를 들어, 미디어 콘텐츠의 세트의 프레젠테이션은, 검색된 미디어 콘텐츠가 실시간으로 이미지 프레임 내에 묘사된 요소들과 상호작용하는 것처럼 보이도록, 미디어 콘텐츠의 세트의 AR 디스플레이를 포함할 수 있다.
일부 실시예들에서, 미디어 콘텐츠의 프레젠테이션을 생성하기 위해, 프레젠테이션 모듈(302)은 미디어 템플릿을 검색하고, 여기서 미디어 템플릿은 미디어 콘텐츠의 세트에 적용될 프레젠테이션 포맷 및 레이아웃을 정의한다. 예를 들어, 미디어 템플릿은, 클라이언트 디바이스(102)에서, 이미지 프레임 내에 미디어 콘텐츠의 세트를 프레젠테이션하기 위한 위치들 및 배향들을 정의할 수 있다.
일부 실시예들에서, 클라이언트 디바이스(102)에서 디스플레이될 미디어 콘텐츠의 프레젠테이션을 생성하기 위해, 미디어 모듈(304)은 미디어 콘텐츠의 세트 중의 각각의 미디어 콘텐츠의 식별자들을 클라이언트 디바이스(102)에 제공하고, 따라서 클라이언트 디바이스(102)가 로컬 메모리 저장소 내의 관련 미디어 콘텐츠를 식별할 수 있게 한다.
동작 410에서, 프레젠테이션 모듈(302)은 클라이언트 디바이스(102)에서 이미지 프레임 내의 미디어 콘텐츠의 세트의 프레젠테이션의 디스플레이를 야기한다. 일부 실시예들에서, 이미지 프레임 내의 미디어 콘텐츠의 세트의 프레젠테이션은 이미지 프레임 내에서 식별된 객체의 위치에 기초할 수 있다. 예를 들어, 프레젠테이션 모듈(302)은 식별된 객체의 위치에 기초하여 이미지 프레임 내의 미디어 콘텐츠의 세트의 프레젠테이션을 배향시킬 수 있다.
일부 실시예들에서, 클라이언트 디바이스(102)의 사용자는 미디어 콘텐츠의 세트의 프레젠테이션을 포함하는 이미지 프레임에 기초한 메시지를 생성하기 위해 하나 이상의 입력을 제공하고, 통신 모듈(308)로 하여금 클라이언트 디바이스(102)의 사용자에 의해 정의된 하나 이상의 수신자에게 메시지를 배포하게 할 수 있다.
도 5는 특정 예시적인 실시예들에 따른, 클라이언트 디바이스(102)에서 컨텍스트 필터의 디스플레이를 야기하는 방법(500)을 묘사하는 흐름도이다. 방법(500)의 동작들은 도 3에 관하여 위에 설명된 모듈들에 의해 수행될 수 있다. 도 5에 도시된 바와 같이, 방법(500)은 하나 이상의 동작(502, 504, 및 506)을 포함한다.
동작 502에서, 미디어 저장소에 있는 미디어 콘텐츠에 액세스하는 것에 응답하여, 미디어 모듈(304)은 이미지 프레임 내에 디스플레이될 미디어 콘텐츠의 세트의 프레젠테이션을 생성하기 위해 미디어 템플릿을 검색한다. 일부 실시예들에서, 미디어 모듈(304)은 이미지 프레임 내에서 식별된 객체와 연관된 객체 카테고리에 대응하는 미디어 템플릿을 검색하기 위해 템플릿 저장소(예를 들어, 데이터베이스(120))에 액세스할 수 있다.
동작 504에서, 미디어 모듈(304)은 미디어 템플릿을 미디어 저장소로부터 액세스된 미디어 콘텐츠의 세트로 채워 미디어 콘텐츠의 세트의 프레젠테이션을 생성한다.
동작 506에서, 프레젠테이션 모듈(302)은 클라이언트 디바이스(102)에서 이미지 프레임 내의 채워진 템플릿의 프레젠테이션의 디스플레이를 야기한다. 일부 실시예들에서, 프레젠테이션 모듈(302)은 이미지 프레임 내에서 식별된 객체의 위치에 기초하여 이미지 프레임 내의 위치에 채워진 템플릿을 디스플레이할 수 있다.
도 6은 특정 예시적인 실시예들에 따른, 클라이언트 디바이스(102)에서 디스플레이될 컨텍스트 필터를 생성하는 방법(500)을 묘사하는 흐름도이다. 방법(600)의 동작들은 도 3에 관하여 위에 설명된 모듈들에 의해 수행될 수 있다. 도 6에 도시된 바와 같이, 방법(600)은 하나 이상의 동작(602, 604, 및 606)을 포함한다.
동작 602에서는, 동작 402에서와 같이, 프레젠테이션 모듈(302)은 클라이언트 디바이스(102)에서 이미지 프레임을 캡처한다 - 여기서 상기 이미지 프레임은 상기 이미지 프레임 내의 위치에 객체의 묘사를 포함한다. 예를 들어, 프레젠테이션 모듈(302)은 클라이언트 디바이스(102)의 카메라를 활성화하고, 클라이언트 디바이스(102)의 카메라가 이미지 프레임을 캡처하게 할 수 있다. 일부 실시예들에서, 프레젠테이션 모듈(302)에 의해 캡처된 이미지 프레임은, 클라이언트 디바이스(102)의 위치 데이터, 시간 데이터뿐만 아니라 디바이스 데이터를 포함하는 이미지 메타데이터를 포함할 수 있다.
동작 604에서, 식별 모듈(308)은 이미지 프레임을 캡처하는 것에 응답하여 클라이언트 디바이스(102)의 컨텍스트를 결정한다. 예를 들어, 컨텍스트는 클라이언트 디바이스의 위치, 이미지 프레임이 캡처된 시각뿐만 아니라 클라이언트 디바이스(102)의 디바이스 유형을 포함할 수 있다.
일부 실시예들에서, 식별 모듈(308)은 메타데이터의 위치 데이터, 시간 데이터, 및 디바이스 데이터로부터 관련 컨텍스트 정보를 결정하기 위해 이미지 프레임의 메타데이터를 파싱할 수 있다.
동작 608에서, 미디어 모듈(304)은 객체의 식별, 및 클라이언트 디바이스(102)의 컨텍스트에 기초하여 관련 미디어 콘텐츠를 식별하기 위해 미디어 저장소에 액세스한다. 예를 들어, 미디어 콘텐츠는 미디어 저장소 내의 위치 정보 또는 시간 정보로 태깅될 수 있고, 따라서 특정 시각, 계절, 요일, 월, 또는 장소에 대한 참조는 관련 미디어 콘텐츠의 세트를 식별할 수 있게 된다.
도 7은 특정 예시적인 실시예들에 따른, 컨텍스트 필터 시스템(124)에 의해 프레젠테이션된 인터페이스들을 묘사하는 인터페이스 플로우-다이어그램(700)이다. 플로우-다이어그램(700)의 인터페이스들에 의해 묘사된 동작들은 도 3에 관하여 위에 설명된 모듈들에 의해 수행될 수 있다.
인터페이스(705)는 클라이언트 디바이스(102)에 의해 캡처된 이미지 프레임을 묘사한다. 도 7에 도시된 바와 같이, 인터페이스(705)는 인터페이스(705) 내의 위치에 객체(720)의 묘사를 포함한다.
일부 실시예들에서, 클라이언트 디바이스(102)는 컨텍스트 필터 시스템(124)을 활성화하고 컨텍스트 필터 시스템(124)으로 하여금, 인터페이스(705) 내에 디스플레이된 바와 같이, 사용자 옵션(725)을 선택하는 사용자 입력을 수신하는 것에 응답하여 인터페이스(705) 내에 묘사된 이미지 프레임을 캡처하게 할 수 있다.
사용자 옵션(725)을 선택하는 입력을 수신하는 것에 응답하여, 컨텍스트 필터 시스템(124)은, 컨텍스트 필터 시스템(124)이 활성화되었다는 것을 지시하기 위해, 인터페이스(710) 내의 그래픽 아이콘(730)의 디스플레이를 야기할 수 있다.
인터페이스(715)는 클라이언트 디바이스(102)에 의해 캡처된 이미지 프레임 내에 디스플레이된 미디어 콘텐츠의 세트(735)의 프레젠테이션을 포함한다. 인터페이스(715)에서 알 수 있는 바와 같이, 미디어 콘텐츠의 세트(735)의 프레젠테이션은 객체(720)의 위치에 기초하여 이미지 프레임 내의 위치에 디스플레이될 수 있다. 인터페이스(715)에서 알 수 있는 바와 같이, 미디어 콘텐츠의 세트(735)의 프레젠테이션은 객체(720)에 관련된 이미지들 및 GIF들을 포함하는 복수의 미디어 항목을 포함할 수 있다.
예를 들어, 도 7에 도시된 바와 같이, 객체(720)는 칩 가방이다. 컨텍스트 필터 시스템(124)은 객체(720)의 객체 카테고리(예를 들어, 음식, 간식 등)를 식별하고, 미디어 콘텐츠의 세트(735)를 검색하고, 여기서 미디어 콘텐츠의 세트(735)는 객체(720)의 객체 카테고리로 태깅 또는 라벨링된 미디어 콘텐츠를 포함한다.
인터페이스(705)에 묘사된 이미지 프레임 내의 미디어 콘텐츠의 세트(735) 중의 각각의 미디어 콘텐츠의 위치들은, 방법들(400, 500, 및 600)에서 논의된 바와 같이, 미디어 템플릿에 기초하여 결정될 수 있다. 클라이언트 디바이스(102)의 사용자는 그렇게 함으로써 클라이언트 디바이스(102)의 사용자에 의해 식별된 하나 이상의 수신자에게 배포될 미디어 콘텐츠의 세트(735)를 포함하는 메시지를 생성할 수 있다. 일부 실시예들에서, 메시지는 단기적 메시지를 포함할 수 있다.
소프트웨어 아키텍처
도 8은 본 명세서에 설명된 다양한 하드웨어 아키텍처들과 함께 사용될 수 있는 예시적인 소프트웨어 아키텍처(806)를 예시하는 블록도이다. 도 8은 소프트웨어 아키텍처의 비제한적 예이고, 본 명세서에 설명된 기능성을 용이하게 하기 위해 많은 다른 아키텍처들이 구현될 수 있다는 것을 인식할 것이다. 소프트웨어 아키텍처(806)는, 여러 다른 것들 중에서도, 프로세서들(904), 메모리(914), 및 I/O 컴포넌트들(918)을 포함하는 도 9의 머신(900)과 같은 하드웨어 상에서 실행될 수 있다. 대표적인 하드웨어 계층(852)이 예시되어 있고, 예를 들어, 도 8의 머신(800)을 나타낼 수 있다. 대표적인 하드웨어 계층(852)은 연관된 실행가능 명령어들(804)을 갖는 처리 유닛(854)을 포함한다. 실행가능 명령어들(804)은, 본 명세서에 설명된 방법들, 컴포넌트들 등의 구현을 포함하는, 소프트웨어 아키텍처(806)의 실행가능 명령어들을 나타낸다. 하드웨어 계층(852)은 메모리 및/또는 스토리지 모듈들인 메모리/스토리지(856)를 또한 포함하고, 이들도 실행가능 명령어들(804)을 갖는다. 하드웨어 계층(852)은 다른 하드웨어(858)를 또한 포함할 수 있다.
도 8의 예시적인 아키텍처에서, 소프트웨어 아키텍처(806)는, 각각의 계층이 특정 기능성을 제공하는, 계층들의 스택으로서 개념화될 수 있다. 예를 들어, 소프트웨어 아키텍처(806)는 운영 체제(802), 라이브러리들(820), 애플리케이션들(816) 및 프레젠테이션 계층(814)과 같은 계층들을 포함할 수 있다. 동작중에, 애플리케이션들(816) 및/또는 계층들 내의 다른 컴포넌트들은 소프트웨어 스택을 통해 애플리케이션 프로그래밍 인터페이스(API) API 호출들(808)을 기동시키고 API 호출들(808)에 응답하여 응답을 수신할 수 있다. 예시된 계층들은 본질적으로 대표적인 것이며 소프트웨어 아키텍처들 모두가 모든 계층들을 갖는 것은 아니다. 예를 들어, 일부 모바일 또는 특수 목적 운영 체제들은 프레임워크들/미들웨어(818)를 제공하지 않을 수도 있지만, 다른 것들은 그러한 계층을 제공할 수도 있다. 다른 소프트웨어 아키텍처들은 추가적인 또는 상이한 계층들을 포함할 수 있다.
운영 체제(802)는 하드웨어 리소스들을 관리하고 공통 서비스들을 제공할 수도 있다. 운영 체제(802)는, 예를 들어, 커널(822), 서비스들(824), 및 드라이버들(826)을 포함할 수 있다. 커널(822)은 하드웨어와 다른 소프트웨어 계층들 사이에서 추상화 계층(abstraction layer)으로서 역할을 할 수 있다. 예를 들어, 커널(822)은 메모리 관리, 프로세서 관리(예를 들어, 스케줄링), 컴포넌트 관리, 네트워킹, 보안 설정 등을 담당할 수 있다. 서비스들(824)은 다른 소프트웨어 계층들을 위한 다른 공통 서비스들을 제공할 수 있다. 드라이버들(826)은 기본 하드웨어(underlying hardware)를 제어하거나 그와 인터페이싱하는 것을 담당한다. 예를 들어, 드라이버들(826)은 하드웨어 구성에 따라 디스플레이 드라이버, 카메라 드라이버, Bluetooth® 드라이버, 플래시 메모리 드라이버, 직렬 통신 드라이버(예를 들어, 범용 직렬 버스(USB) 드라이버), Wi-Fi® 드라이버, 오디오 드라이버, 전력 관리 드라이버 등을 포함한다.
라이브러리들(820)은 애플리케이션들(816) 및/또는 다른 컴포넌트들 및/또는 계층들에 의해 사용되는 공통 인프라스트럭처를 제공한다. 라이브러리들(820)은 다른 소프트웨어 컴포넌트들이 기본 운영 체제(802) 기능성(예를 들어, 커널(822), 서비스들(824) 및/또는 드라이버들(826))과 직접 인터페이스하는 것보다 더 쉬운 방식으로 작업들을 수행할 수 있게 하는 기능성을 제공한다. 라이브러리들(820)은 메모리 할당 기능들, 문자열 조작 기능들, 수학 기능들 등과 같은 기능들을 제공할 수 있는 시스템 라이브러리들(844)(예를 들어, C 표준 라이브러리)를 포함할 수 있다. 게다가, 라이브러리들(820)은 미디어 라이브러리들(예를 들어, MPREG4, H.264, MP3, AAC, AMR, JPG, PNG와 같은 다양한 미디어 포맷의 프레젠테이션 및 조작을 지원하기 위한 라이브러리들), 그래픽 라이브러리들(예를 들어, 디스플레이 상의 그래픽 콘텐츠에서 2D 및 3D를 렌더링하기 위해 사용될 수 있는 OpenGL 프레임워크), 데이터베이스 라이브러리들(예를 들어, 다양한 관계형 데이터베이스 기능들을 제공할 수 있는 SQLite), 웹 라이브러리들(예를 들어, 웹 브라우징 기능성을 제공할 수 있는 WebKit) 등과 같은 API 라이브러리들(846)을 포함할 수 있다. 라이브러리들(820)은 많은 다른 API들을 애플리케이션들(816) 및 다른 소프트웨어 컴포넌트들/모듈들에 제공하는 매우 다양한 다른 라이브러리들(848)을 또한 포함할 수 있다.
프레임워크들/미들웨어(818)(때때로 미들웨어라고도 지칭됨)는 애플리케이션들(816) 및/또는 다른 소프트웨어 컴포넌트들/모듈들에 의해 사용될 수 있는 더 하이-레벨의 공통 인프라스트럭처를 제공한다. 예를 들어, 프레임워크들/미들웨어(818)는 다양한 그래픽 사용자 인터페이스(GUI) 기능들, 하이-레벨 리소스 관리, 하이-레벨 위치 서비스들 등을 제공할 수 있다. 프레임워크들/미들웨어(818)는 애플리케이션들(816) 및/또는 다른 소프트웨어 컴포넌트들/모듈들에 의해 이용될 수 있는 광범위한 스펙트럼의 다른 API들을 제공할 수 있고, 그 중 일부는 특정 운영 체제(802) 또는 플랫폼에 특정할 수 있다.
애플리케이션들(816)은 빌트인 애플리케이션들(838) 및/또는 제3자 애플리케이션들(840)을 포함한다. 대표적인 빌트인 애플리케이션들(838)의 예들은, 연락처 애플리케이션, 브라우저 애플리케이션, 북 리더 애플리케이션, 위치 애플리케이션, 미디어 애플리케이션, 메시징 애플리케이션, 및/또는 게임 애플리케이션을 포함할 수 있지만, 이들로 제한되지 않는다. 제3자 애플리케이션들(840)은 특정 플랫폼의 벤더 이외의 엔티티에 의해 ANDROID™ 또는 IOS™ 소프트웨어 개발 키트(SDK)를 이용하여 개발된 애플리케이션을 포함할 수 있고, IOS™, ANDROID™, WINDOWS® Phone, 또는 다른 모바일 운영 체제들과 같은 모바일 운영 체제 상에서 실행되는 모바일 소프트웨어일 수 있다. 제3자 애플리케이션들(840)은 본 명세서에 설명된 기능성을 용이하게 하기 위해 모바일 운영 체제(예컨대 운영 체제(802))에 의해 제공되는 API 호출들(808)을 기동시킬 수 있다.
애플리케이션들(816)은 시스템의 사용자들과 상호작용하기 위한 사용자 인터페이스들을 생성하기 위해 빌트인 운영 체제 기능들(예를 들어, 커널(822), 서비스들(824) 및/또는 드라이버들(826)), 라이브러리들(820), 및 프레임워크들/미들웨어(818)를 사용할 수 있다. 대안적으로 또는 추가적으로, 일부 시스템들에서, 사용자와의 상호작용은 프레젠테이션 계층(814)과 같은 프레젠테이션 계층을 통해 발생할 수 있다. 이들 시스템에서, 애플리케이션/컴포넌트 "로직"은 사용자와 상호작용하는 애플리케이션/컴포넌트의 양태들로부터 분리될 수 있다.
도 9는 머신-판독가능 매체(예를 들어, 머신-판독가능 스토리지 매체)로부터의 명령어들을 판독하고 본 명세서에서 논의된 방법론들 중 어느 하나 이상을 수행할 수 있는, 일부 예시적인 실시예들에 따른, 머신(900)의 컴포넌트들을 예시하는 블록도이다. 구체적으로, 도 9는 컴퓨터 시스템의 예시적인 형식의 머신(900)의 도식적 표현을 나타내는 것으로, 그 안에서 머신(900)으로 하여금 본 명세서에서 논의된 방법론들 중 어느 하나 이상을 수행하게 하기 위한 명령어들(910)(예를 들어, 소프트웨어, 프로그램, 애플리케이션, 애플릿(applet), 앱, 또는 다른 실행가능 코드)이 실행될 수 있다. 그에 따라, 명령어들(910)은 본 명세서에 설명된 모듈들 또는 컴포넌트들을 구현하기 위해 사용될 수 있다. 명령어들(910)은, 일반적인 비-프로그래밍된 머신(900)을, 설명되고 예시된 기능들을 설명된 방식으로 수행하도록 프로그래밍된 특정 머신(900)으로 변환한다. 대안적인 실시예들에서, 머신(900)은 독립형 디바이스로서 동작하거나 다른 머신들에 결합(예를 들어, 네트워킹)될 수 있다. 네트워킹된 배치에서, 머신(900)은 서버-클라이언트 네트워크 환경에서 서버 머신 또는 클라이언트 머신의 자격으로 동작하거나, 피어-투-피어(또는 분산형) 네트워크 환경에서 피어 머신으로서 동작할 수 있다. 머신(900)은, 서버 컴퓨터, 클라이언트 컴퓨터, 개인용 컴퓨터(PC), 태블릿 컴퓨터, 랩톱 컴퓨터, 넷북, 셋톱 박스(STB), 개인 휴대 정보 단말(PDA), 엔터테인먼트 미디어 시스템, 셀룰러 폰, 스마트폰, 모바일 디바이스, 웨어러블 디바이스(예를 들어, 스마트 시계), 스마트 홈 디바이스(예를 들어, 스마트 어플라이언스), 다른 스마트 디바이스들, 웹 어플라이언스, 네트워크 라우터, 네트워크 스위치, 네트워크 브리지, 또는 머신(900)에 의해 취해질 액션들을 지정하는 명령어들(910)을 순차적으로 또는 다른 방식으로 실행할 수 있는 임의의 머신을 포함할 수 있지만, 이들로 제한되지 않는다. 또한, 단일 머신(900)만이 예시되어 있지만, "머신"이라는 용어는 또한 본 명세서에서 논의된 방법론들 중 어느 하나 이상을 수행하기 위해 명령어들(910)을 개별적으로 또는 공동으로 실행하는 머신들의 컬렉션을 포함하는 것으로 간주되어야 한다.
머신(900)은, 예컨대 버스(902)를 통해 서로 통신하도록 구성될 수 있는, 프로세서들(904), 메모리 메모리/스토리지(906), 및 I/O 컴포넌트들(918)을 포함할 수 있다. 메모리/스토리지(906)는 메인 메모리, 또는 다른 메모리 스토리지와 같은 메모리(914), 및 스토리지 유닛(916)을 포함할 수 있고, 이 둘 다 예컨대 버스(902)를 통해 프로세서들(904)이 액세스 가능하다. 스토리지 유닛(916) 및 메모리(914)는 본 명세서에 설명된 방법론들 또는 기능들 중 어느 하나 이상을 구현하는 명령어들(910)을 저장한다. 명령어들(910)은 또한, 머신(900)에 의한 그의 실행 동안, 완전히 또는 부분적으로, 메모리(914) 내에, 스토리지 유닛(916) 내에, 프로세서들(904) 중 적어도 하나 내에(예를 들어, 프로세서의 캐시 메모리 내에), 또는 이들의 임의의 적합한 조합으로 존재할 수 있다. 따라서, 메모리(914), 스토리지 유닛(916), 및 프로세서들(904)의 메모리는 머신-판독가능 매체의 예들이다.
I/O 컴포넌트들(918)은, 입력을 수신하고, 출력을 제공하고, 출력을 생성하고, 정보를 송신하고, 정보를 교환하고, 측정들을 캡처하는 등을 수행하기 위한 사용자 인터페이스를 제공하는 매우 다양한 컴포넌트들을 포함할 수 있다. 특정 머신(900)에 포함되는 특정 I/O 컴포넌트들(918)은 머신의 유형에 의존할 것이다. 예를 들어, 모바일 폰과 같은 휴대용 머신은 아마 터치 입력 디바이스 또는 다른 그러한 입력 메커니즘을 포함할 것인 반면, 헤드리스 서버 머신(headless server machine)은 아마 그러한 터치 입력 디바이스를 포함하지 않을 것이다. I/O 컴포넌트들(918)은 도 9에 도시되지 않은 많은 다른 컴포넌트들을 포함할 수 있다는 것을 인식할 것이다. I/O 컴포넌트들(918)은 단지 이하의 논의를 간소화하기 위해 기능성에 따라 그룹화되어 있고 이러한 그룹화는 결코 제한적인 것이 아니다. 다양한 예시적인 실시예들에서, I/O 컴포넌트들(918)은 출력 컴포넌트들(926) 및 입력 컴포넌트들(928)을 포함할 수 있다. 출력 컴포넌트들(926)은, 시각 컴포넌트들(예를 들어, 플라즈마 디스플레이 패널(PDP), 발광 다이오드(LED) 디스플레이, 액정 디스플레이(LCD), 프로젝터, 또는 음극선관(CRT)과 같은 디스플레이), 음향 컴포넌트들(예를 들어, 스피커), 햅틱 컴포넌트들(예를 들어, 진동 모터, 저항 메커니즘), 다른 신호 생성기 등을 포함할 수 있다. 입력 컴포넌트들(928)은, 영숫자 입력 컴포넌트들(예를 들어, 키보드, 영숫자 입력을 수신하도록 구성된 터치 스크린, 포토-광학 키보드, 또는 다른 영숫자 입력 컴포넌트), 포인트 기반 입력 컴포넌트들(예를 들어, 마우스, 터치패드, 트랙볼, 조이스틱, 모션 센서, 또는 다른 포인팅 기구), 촉각 입력 컴포넌트들(예를 들어, 물리적 버튼, 터치 또는 터치 제스처의 위치 및/또는 힘을 제공하는 터치 스크린, 또는 다른 촉각 입력 컴포넌트), 오디오 입력 컴포넌트들(예를 들어, 마이크로폰) 등을 포함할 수 있다.
추가의 예시적인 실시예들에서, I/O 컴포넌트들(918)은 광범위한 다른 컴포넌트들 중에서도 바이오메트릭 컴포넌트들(930), 모션 컴포넌트들(934), 환경 환경 컴포넌트들(936), 또는 포지션 컴포넌트들(938)을 포함할 수 있다. 예를 들어, 바이오메트릭 컴포넌트들(930)은, 표현들(예를 들어, 손 표현, 얼굴 표정, 음성 표현, 신체 제스처, 또는 시선 추적)을 검출하고, 생체신호들(예를 들어, 혈압, 심박수, 체온, 땀 또는 뇌파)을 측정하고, 사람을 식별(예를 들어, 음성 식별, 망막 식별, 얼굴 식별, 지문 식별, 또는 뇌파계 기반 식별)하는 등의 컴포넌트들을 포함할 수 있다. 모션 컴포넌트들(934)은, 가속 센서 컴포넌트들(예를 들어, 가속도계), 중력 센서 컴포넌트들, 회전 센서 컴포넌트들(예를 들어, 자이로스코프) 등을 포함할 수 있다. 환경 컴포넌트들(936)은, 예를 들어, 조명 센서 컴포넌트들(예를 들어, 광도계), 온도 센서 컴포넌트들(예를 들어, 주위 온도를 검출하는 하나 이상의 온도계), 습도 센서 컴포넌트들, 압력 센서 컴포넌트들(예를 들어, 기압계), 음향 센서 컴포넌트들(예를 들어, 배경 노이즈를 검출하는 하나 이상의 마이크로폰), 근접 센서 컴포넌트들(예를 들어, 인근 객체들을 검출하는 적외선 센서들), 가스 센서들(예를 들어, 안전을 위해 유해성 가스들의 농도들을 검출하거나 대기 내의 오염물질들을 측정하기 위한 가스 검출 센서들), 또는 주변 물리적 환경에 대응하는 지시들, 측정들, 또는 신호들을 제공할 수 있는 다른 컴포넌트들을 포함할 수 있다. 포지션 컴포넌트들(938)은, 위치 센서 컴포넌트들(예를 들어, GPS(Global Position system) 수신기 컴포넌트), 고도 센서 컴포넌트들(예를 들어, 고도계 또는 고도가 도출될 수 있는 기압을 검출하는 기압계), 방위 센서 컴포넌트들(예를 들어, 자력계) 등을 포함할 수 있다.
통신은 매우 다양한 기술들을 이용하여 구현될 수 있다. I/O 컴포넌트들(918)은 머신(900)을 결합(922) 및 결합(924)을 통해 각각 네트워크(932) 또는 디바이스들(920)에 결합하도록 동작가능한 통신 컴포넌트들(940)을 포함할 수 있다. 예를 들어, 통신 컴포넌트(940)는, 네트워크 인터페이스 컴포넌트, 또는 네트워크(932)와 인터페이스하기 위한 다른 적합한 디바이스를 포함할 수 있다. 추가 예들에서, 통신 컴포넌트들(940)은 유선 통신 컴포넌트, 무선 통신 컴포넌트, 셀룰러 통신 컴포넌트, 근거리 무선 통신(NFC) 컴포넌트, Bluetooth® 컴포넌트(예를 들어, Bluetooth® Low Energy), Wi-Fi® 컴포넌트, 및 다른 양상들을 통해 통신을 제공하는 다른 통신 컴포넌트들을 포함할 수 있다. 디바이스들(920)은 다른 머신 또는 매우 다양한 주변 디바이스들 중 임의의 것(예를 들어, 범용 직렬 버스(USB)를 통해 결합된 주변 디바이스)일 수 있다.
더욱이, 통신 컴포넌트들(940)은 식별자들을 검출할 수 있거나 식별자들을 검출하도록 동작가능한 컴포넌트들을 포함할 수 있다. 예를 들어, 통신 컴포넌트들(940)은 RFID(Radio Frequency Identification) 태그 판독기 컴포넌트들, NFC 스마트 태그 검출 컴포넌트들, 광학 판독기 컴포넌트들(예를 들어, UPC(Universal Product Code) 바 코드와 같은 1-차원 바 코드들, QR(Quick Response) 코드와 같은 다-차원 바 코드들, Aztec 코드, Data Matrix, Dataglyph, MaxiCode, PDF417, Ultra Code, UCC RSS-2D 바 코드, 및 다른 광학 코드들을 검출하기 위한 광학 센서), 또는 음향 검출 컴포넌트들(예를 들어, 태깅된 오디오 신호들을 식별하기 위한 마이크로폰들)을 포함할 수 있다. 게다가, 인터넷 프로토콜(IP) 지오-로케이션을 통한 위치, Wi-Fi® 신호 삼각측량을 통한 위치, 특정 위치를 나타낼 수 있는 NFC 비컨 신호 검출을 통한 위치 등과 같은, 다양한 정보가 통신 컴포넌트들(940)을 통해 도출될 수 있다.
용어집
이 맥락에서 "캐리어 신호(CARRIER SIGNAL)"는 머신에 의한 실행을 위한 명령어들을 저장, 인코딩, 또는 운반할 수 있는 임의의 무형 매체를 지칭하고, 그러한 명령어들의 통신을 용이하게 하기 위한 디지털 또는 아날로그 통신 신호들 또는 다른 무형 매체를 포함한다. 명령어들은 네트워크 인터페이스 디바이스를 통해 송신 매체를 사용하여 그리고 다수의 잘 알려진 전송 프로토콜들 중 임의의 하나를 사용하여 네트워크를 통해 송신 또는 수신될 수 있다.
이 맥락에서 "클라이언트 디바이스(CLIENT DEVICE)"는 하나 이상의 서버 시스템 또는 다른 클라이언트 디바이스들로부터 리소스들을 획득하기 위해 통신 네트워크에 인터페이스하는 임의의 머신을 지칭한다. 클라이언트 디바이스는, 모바일 폰, 데스크톱 컴퓨터, 랩톱, 휴대 정보 단말(PDA), 스마트폰, 태블릿, 울트라 북, 넷북, 랩톱, 멀티-프로세서 시스템, 마이크로프로세서-기반 또는 프로그래밍 가능한 가전 제품, 게임 콘솔, 셋톱 박스, 또는 사용자가 네트워크에 액세스하기 위해 사용할 수 있는 임의의 다른 통신 디바이스일 수 있지만, 이것으로 제한되지 않는다.
이 맥락에서 "통신 네트워크(COMMUNICATIONS NETWORK)"는 애드 혹 네트워크, 인트라넷, 엑스트라넷, VPN(virtual private network), LAN(local area network), 무선 LAN(WLAN), WAN(wide area network), 무선 WAN(WWAN), MAN(metropolitan area network), 인터넷, 인터넷의 일부, PSTN(Public Switched Telephone Network)의 일부, POTS(plain old telephone service) 네트워크, 셀룰러 전화 네트워크, 무선 네트워크, Wi-Fi® 네트워크, 다른 유형의 네트워크, 또는 둘 이상의 그러한 네트워크의 조합일 수 있는, 네트워크의 하나 이상의 부분을 지칭한다. 예를 들어, 네트워크 또는 네트워크의 부분은 무선 또는 셀룰러 네트워크를 포함할 수 있고 결합은 CDMA(Code Division Multiple Access) 연결, GSM(Global System for Mobile communications) 연결, 또는 다른 유형의 셀룰러 또는 무선 결합일 수 있다. 이 예에서, 결합은 1xRTT(Single Carrier Radio Transmission Technology), EVDO(Evolution-Data Optimized) 기술, GPRS(General Packet Radio Service) 기술, EDGE(Enhanced Data rates for GSM Evolution) 기술, 3G를 포함하는 3GPP(third Generation Partnership Project), 4G(fourth generation wireless) 네트워크들, UMTS(Universal Mobile Telecommunications System), HSPA(High Speed Packet Access), WiMAX(Worldwide Interoperability for Microwave Access), LTE(Long Term Evolution) 표준, 다양한 표준 설정 조직들에 의해 정의된 다른 것들, 다른 장거리 프로토콜들, 또는 다른 데이터 전송 기술과 같은 임의의 다양한 유형의 데이터 전송 기술을 구현할 수 있다.
이 맥락에서 "단기적 메시지(EMPHEMERAL MESSAGE)"는 시간-제한된 지속기간 동안 액세스 가능한 메시지를 지칭한다. 단기적 메시지는 텍스트, 이미지, 비디오 등일 수 있다. 단기적 메시지에 대한 액세스 시간은 메시지 발신자에 의해 설정될 수 있다. 대안적으로, 액세스 시간은 디폴트 설정 또는 수신자에 의해 지정된 설정일 수 있다. 설정 기법에 관계없이, 메시지는 일시적이다.
이 맥락에서 "머신-판독가능 매체(MACHINE-READABLE MEDIUM)"는 명령어 및 데이터를 일시적으로 또는 영구적으로 저장할 수 있는 컴포넌트, 디바이스 또는 다른 유형 매체를 지칭하고, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 버퍼 메모리, 플래시 메모리, 광학 매체, 자기 매체, 캐시 메모리, 다른 유형의 스토리지(예를 들어, 소거가능하고 프로그래밍 가능한 판독 전용 메모리(EEPROM)) 및/또는 이들의 임의의 적합한 조합을 포함할 수 있지만, 이들로 제한되지 않는다. "머신-판독가능 매체"라는 용어는, 명령어를 저장할 수 있는 단일의 매체 또는 다수의 매체(예를 들어, 중앙집중형 또는 분산형 데이터베이스, 또는 연관된 캐시 및 서버)를 포함하는 것으로 간주되어야 한다. "머신-판독가능 매체"라는 용어는 또한, 명령어들이, 머신의 하나 이상의 프로세서에 의해 실행될 때, 머신으로 하여금 본 명세서에 설명된 방법론들 중 어느 하나 이상을 수행하게 하도록, 머신에 의한 실행을 위한 명령어들(예를 들어, 코드)을 저장할 수 있는 임의의 매체, 또는 다수의 매체의 조합을 포함하는 것으로 간주되어야 한다. 따라서, "머신-판독가능 매체"는 단일 스토리지 장치 또는 디바이스뿐만 아니라, 다수의 스토리지 장치 또는 디바이스를 포함하는 "클라우드-기반" 스토리지 시스템들 또는 스토리지 네트워크들을 지칭한다. "머신-판독가능 매체"라는 용어는 신호 그 자체를 제외한다.
이 맥락에서 "컴포넌트(COMPONENT)"는 함수 또는 서브루틴 호출, 분기 포인트, 애플리케이션 프로그램 인터페이스(API), 또는 특정 처리 또는 제어 기능의 분할 또는 모듈화를 제공하는 다른 기술들에 의해 정의된 경계들을 갖는 디바이스, 물리적 엔티티, 또는 로직을 지칭한다. 컴포넌트들은 그들의 인터페이스를 통해 다른 컴포넌트들과 결합되어 머신 프로세스를 실행할 수 있다. 컴포넌트는, 보통 관련된 기능들 중 특정 기능을 수행하는 프로그램의 일부 및 다른 컴포넌트들과 함께 사용되도록 설계된 패키징된 기능 하드웨어 유닛일 수 있다. 컴포넌트들은 소프트웨어 컴포넌트들(예를 들어, 머신-판독가능 매체 상에 구현된 코드) 또는 하드웨어 컴포넌트들 중 어느 하나를 구성할 수 있다. "하드웨어 컴포넌트"는 특정 동작들을 수행할 수 있는 유형 유닛(tangible unit)이고, 특정 물리적 방식으로 구성되거나 배열될 수 있다. 다양한 예시적인 실시예들에서, 하나 이상의 컴퓨터 시스템(예를 들어, 독립형 컴퓨터 시스템, 클라이언트 컴퓨터 시스템, 또는 서버 컴퓨터 시스템) 또는 컴퓨터 시스템의 하나 이상의 하드웨어 컴포넌트(예를 들어, 프로세서 또는 프로세서들의 그룹)는 본 명세서에 설명된 바와 같이 특정 동작들을 수행하도록 동작하는 하드웨어 컴포넌트로서 소프트웨어(예를 들어, 애플리케이션 또는 애플리케이션 부분)에 의해 구성될 수 있다. 하드웨어 컴포넌트는 또한, 기계적으로, 전자적으로, 또는 이들의 임의의 적합한 조합으로 구현될 수 있다. 예를 들어, 하드웨어 컴포넌트는 특정 동작들을 수행하도록 영구적으로 구성된 전용 회로 또는 로직을 포함할 수 있다. 하드웨어 컴포넌트는, FPGA(Field-Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)와 같은 특수 목적 프로세서일 수 있다. 하드웨어 컴포넌트는 특정 동작들을 수행하기 위해 소프트웨어에 의해 일시적으로 구성되는 프로그래밍 가능한 로직 또는 회로를 또한 포함할 수 있다. 예를 들어, 하드웨어 컴포넌트는 범용 프로세서 또는 다른 프로그래밍 가능한 프로세서에 의해 실행되는 소프트웨어를 포함할 수 있다. 일단 그러한 소프트웨어에 의해 구성되면, 하드웨어 컴포넌트들은 구성된 기능들을 수행하도록 고유하게 맞춤화된 특정 머신들(또는 머신의 특정 컴포넌트들)이 되고 더 이상 범용 프로세서들이 아니다. 하드웨어 컴포넌트를 기계적으로, 전용의 영구적으로 구성된 회로에, 또는 일시적으로 구성된 회로(예를 들어, 소프트웨어에 의해 구성됨)에 구현하기로 하는 결정은 비용 및 시간 고려사항들에 의해 주도될 수 있다는 것을 인식할 것이다. 따라서, "하드웨어 컴포넌트"(또는 "하드웨어-구현된 컴포넌트")라는 문구는, 유형 엔티티, 즉, 특정 방식으로 동작하거나 본 명세서에 설명된 특정 동작들을 수행하도록 물리적으로 구성되거나, 영구적으로 구성되거나(예를 들어, 하드와이어드) 또는 일시적으로 구성되는(예를 들어, 프로그래밍되는) 엔티티를 포괄하는 것으로 이해해야 한다. 하드웨어 컴포넌트들이 일시적으로 구성되는(예를 들어, 프로그래밍되는) 실시예들을 고려할 때, 하드웨어 컴포넌트들 각각이 임의의 하나의 시간 인스턴스에서 구성 또는 인스턴스화될 필요는 없다. 예를 들어, 하드웨어 컴포넌트가 특수 목적 프로세서가 되도록 소프트웨어에 의해 구성된 범용 프로세서를 포함하는 경우에, 범용 프로세서는 상이한 시간들에서 각각 상이한 특수 목적 프로세서들(예를 들어, 상이한 하드웨어 컴포넌트들을 포함함)로서 구성될 수 있다. 따라서 소프트웨어는 예를 들어, 하나의 시간 인스턴스에서는 특정 하드웨어 컴포넌트를 구성하고 상이한 시간 인스턴스에서는 상이한 하드웨어 컴포넌트를 구성하도록 특정 프로세서 또는 프로세서들을 구성한다. 하드웨어 컴포넌트들은 다른 하드웨어 컴포넌트들에 정보를 제공하고 그들로부터 정보를 수신할 수 있다. 따라서, 설명된 하드웨어 컴포넌트들은 통신가능하게 결합되어 있는 것으로 간주될 수 있다. 다수의 하드웨어 컴포넌트가 동시에 존재하는 경우에, 하드웨어 컴포넌트들 중 둘 이상 사이의 또는 그들 사이의(예를 들어, 적절한 회로들 및 버스들을 통한) 신호 송신을 통해 통신이 달성될 수 있다. 다수의 하드웨어 컴포넌트가 상이한 시간들에서 구성되거나 인스턴스화되는 실시예들에서, 그러한 하드웨어 컴포넌트들 사이의 통신은, 예를 들어, 다수의 하드웨어 컴포넌트가 액세스할 수 있는 메모리 구조들 내의 정보의 스토리지 및 검색을 통해 달성될 수 있다. 예를 들어, 하나의 하드웨어 컴포넌트는 동작을 수행하고, 그에 통신가능하게 결합되는 메모리 디바이스에 그 동작의 출력을 저장할 수 있다. 그 후 추가의 하드웨어 컴포넌트가, 나중에, 저장된 출력을 검색 및 처리하기 위해 메모리 디바이스에 액세스할 수 있다. 하드웨어 컴포넌트들은 또한 입력 또는 출력 디바이스들과 통신을 개시할 수 있고, 리소스(예를 들어, 정보의 컬렉션)를 조작할 수 있다. 본 명세서에 설명된 예시적인 방법들의 다양한 동작은 관련 동작들을 수행하도록 일시적으로 구성되거나(예를 들어, 소프트웨어에 의해) 영구적으로 구성되는 하나 이상의 프로세서에 의해 적어도 부분적으로 수행될 수 있다. 일시적으로 구성되는 영구적으로 구성되든 간에, 그러한 프로세서들은 본 명세서에 설명된 하나 이상의 동작 또는 기능을 수행하도록 동작하는 프로세서-구현된 컴포넌트들을 구성할 수 있다. 본 명세서에서 사용된, "프로세서-구현된 컴포넌트"는 하나 이상의 프로세서를 이용하여 구현된 하드웨어 컴포넌트를 지칭한다. 유사하게, 본 명세서에 설명된 방법들은 적어도 부분적으로 프로세서-구현될 수 있고, 특정 프로세서 또는 프로세서들은 하드웨어의 예이다. 예를 들어, 방법의 동작들 중 적어도 일부가 하나 이상의 프로세서 또는 프로세서-구현된 컴포넌트에 의해 수행될 수 있다. 더욱이, 하나 이상의 프로세서는 또한 "클라우드 컴퓨팅" 환경에서 또는 "서비스로서의 소프트웨어(software as a service)"(SaaS)로서 관련 동작들의 수행을 지원하도록 동작할 수 있다. 예를 들어, 동작들 중 적어도 일부는 (프로세서들을 포함하는 머신들의 예들로서) 컴퓨터들의 그룹에 의해 수행될 수 있고, 이들 동작은 네트워크(예를 들어, 인터넷)를 통해 그리고 하나 이상의 적절한 인터페이스(예를 들어, 애플리케이션 프로그램 인터페이스(API))를 통해 액세스 가능하다. 동작들 중 특정 동작의 수행은 단일 머신 내에 존재할 뿐만 아니라, 다수의 머신에 걸쳐 배치되는, 프로세서들 사이에 분산될 수 있다. 일부 예시적인 실시예들에서, 프로세서들 또는 프로세서에 의해 구현되는 컴포넌트들은 단일의 지리적 위치에(예를 들어, 가정 환경, 사무실 환경, 또는 서버 팜(server farm) 내에) 위치할 수 있다. 다른 예시적인 실시예들에서, 프로세서들 또는 프로세서에 의해 구현되는 컴포넌트들은 다수의 지리적 위치에 걸쳐 분산될 수 있다.
이 맥락에서 "프로세서(PROCESSOR)"는 제어 신호들(예를 들어, "명령들", "op 코드들", "머신 코드" 등)에 따라 데이터 값들을 조작하고 머신을 동작시키기 위해 적용되는 대응하는 출력 신호들을 생성하는 임의의 회로 또는 가상 회로(실제 프로세서 상에서 실행되는 로직에 의해 에뮬레이트되는 물리 회로)를 지칭한다. 프로세서는, 예를 들어, CPU(Central Processing Unit), RISC(Reduced Instruction Set Computing) 프로세서, CISC(Complex Instruction Set Computing) 프로세서, GPU(Graphics Processing Unit), DSP(Digital Signal Processor), ASIC(Application Specific Integrated Circuit), RFIC(Radio-Frequency Integrated Circuit), 또는 이들의 임의의 조합일 수 있다. 프로세서는 또한, 명령어들을 동시에 실행할 수 있는 둘 이상의 독립 프로세서(때때로 "코어"라고도 지칭됨)를 갖는 멀티-코어 프로세서일 수 있다.
이 맥락에서 "타임스탬프(TIMESTAMP)"는 특정 이벤트가 언제 발생했는지를 식별하는, 예를 들어, 때때로 1초의 작은 분수까지 정확한, 날짜 및 시각을 제공하는, 문자들 또는 인코딩된 정보의 시퀀스를 지칭한다.
이 맥락에서 "리프트(LIFT)"는 랜덤 선택 타겟팅 모델에 대하여 측정되는 (전체로서의 집단에 관하여) 향상된 응답을 갖는 것으로서 경우들을 예측하거나 분류하는 데 있어서 타겟팅된 모델의 성능의 척도이다.
이 맥락에서 "음소 얼라인먼트(PHONEME ALIGNMENT)"는 하나의 단어를 다른 단어와 구별하는 음성의 단위이다. 하나의 음소는 폐쇄, 파열, 및 흡인 이벤트들의 시퀀스로 구성될 수 있다; 또는, 이중모음(dipthong)이 후설 모음(back vowel)에서 전설 모음(front vowel)으로 전이할 수 있다. 따라서 음성 신호는 그것이 어떤 음소들을 포함하는지뿐만 아니라, 또한 음소들의 위치들에 의해 기술될 수 있다. 따라서 음소 얼라인먼트는 음성 신호 내의 각각의 음소의 적절한 시퀀스 및 위치를 결정하기 위해, 파형 내의 음소들의 "시간-얼라인먼트"로서 기술될 수 있다.
이 맥락에서 "오디오-시각 변환(AUDIO-TO-VISUAL CONVERSION)"은 가청 음성 신호들을 가시적 음성으로 변환하는 것을 지칭하고, 여기서 가시적 음성은 가청 음성 신호를 나타내는 입 형상을 포함할 수 있다.
이 맥락에서 "시간 지연 신경망(TIME DELAYED NEURAL NETWORK, TDNN)"은 TDNN은 그의 주 목적이 순차적 데이터에 대해 작용하는 것인 인공 신경망 아키텍처이다. 예는 연속적인 오디오를 음성 인식을 위한 분류된 음소 라벨들의 스트림으로 변환하는 것일 것이다.
이 맥락에서 "양방향 장단기 메모리(BI-DIRECTIONAL LONG-SHORT TERM MEMORY, BLSTM)"는 임의의 간격들에 걸쳐 값들을 기억하는 순환 신경망(recurrent neural network, RNN) 아키텍처를 지칭한다. 저장된 값들은 학습이 진행됨에 따라 수정되지 않는다. RNN들은 뉴런들 사이의 순방향 및 역방향 연결들을 허용한다. BLSTM은 이벤트들 사이의 알려지지 않은 크기 및 지속기간의 시간 지체가 주어질 경우, 시계열(time series)의 분류, 처리, 및 예측에 적합하다.
Claims (20)
- 방법으로서,
클라이언트 디바이스에서 이미지 데이터의 디스플레이를 야기하는 단계 - 상기 이미지 데이터는 상기 이미지 데이터 내의 위치에 있는 객체의 묘사를 포함함 -;
상기 객체의 묘사에 기초하여 상기 객체의 객체 카테고리를 식별하는 단계 - 상기 객체 카테고리는 하나 이상의 태그에 대응함 -;
컨텍스트 인자 및 상기 객체 카테고리에 대응하는 상기 하나 이상의 태그에 기초하여 미디어 콘텐츠의 컬렉션 중에서 미디어 콘텐츠를 선택하는 단계; 및
상기 클라이언트 디바이스에서 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 프레젠테이션의 디스플레이를 야기하는 단계
를 포함하는, 방법. - 제1항에 있어서,
상기 클라이언트 디바이스에서 상기 이미지 데이터의 디스플레이를 야기하는 단계는:
상기 클라이언트 디바이스에서 이미지 데이터의 컬렉션 중에서 상기 이미지 데이터를 선택하는 입력을 수신하는 단계를 포함하는, 방법. - 제1항에 있어서,
상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계는:
상기 객체 카테고리에 대응하는 미디어 템플릿을 검색하는 단계; 및
상기 미디어 템플릿 및 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계를 포함하는, 방법. - 제3항에 있어서,
상기 미디어 콘텐츠는 복수의 미디어 객체 유형을 포함하고, 상기 복수의 미디어 객체 유형 중의 각각의 미디어 객체 유형은 대응하는 디스플레이 속성을 포함하고, 상기 미디어 콘텐츠는 제1 미디어 객체 유형의 제1 미디어 콘텐츠를 적어도 포함하고, 상기 미디어 템플릿 및 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계는:
상기 제1 미디어 콘텐츠의 상기 제1 미디어 객체 유형에 기초하여 상기 제1 미디어 콘텐츠를 상기 미디어 템플릿 내의 위치에 할당하는 단계를 포함하는, 방법. - 제1항에 있어서,
상기 방법은:
상기 클라이언트 디바이스에서 상기 이미지 데이터의 디스플레이를 야기하는 것에 응답하여 상기 클라이언트 디바이스의 컨텍스트를 결정하는 단계를 추가로 포함하고;
상기 미디어 콘텐츠는 미디어 저장소 내의 상기 컨텍스트 및 상기 객체 카테고리와 연관되는, 방법. - 제5항에 있어서,
상기 이미지 데이터는 이미지 메타데이터를 포함하고, 상기 컨텍스트는 위치를 포함하고, 상기 위치를 결정하는 단계는:
상기 이미지 메타데이터에 기초하여 상기 클라이언트 디바이스의 상기 위치를 결정하는 단계를 포함하는, 방법. - 제1항에 있어서,
상기 이미지 데이터는 이미지 특징들의 세트를 포함하고, 상기 객체의 상기 객체 카테고리를 식별하는 단계는:
상기 이미지 특징들의 세트에 기초하여 상기 객체를 식별하는 단계; 및
상기 객체에 기초하여 상기 객체 카테고리를 식별하는 단계를 포함하는, 방법. - 시스템으로서,
메모리; 및
상기 메모리에 결합되고 명령어들을 포함하는 적어도 하나의 하드웨어 프로세서를 포함하고, 상기 명령어들은 상기 시스템으로 하여금:
클라이언트 디바이스에서 이미지 데이터의 디스플레이를 야기하는 단계 - 상기 이미지 데이터는 상기 이미지 데이터 내의 위치에 있는 객체의 묘사를 포함함 -;
상기 객체의 묘사에 기초하여 상기 객체의 객체 카테고리를 식별하는 단계 - 상기 객체 카테고리는 하나 이상의 태그에 대응함 -;
컨텍스트 인자 및 상기 객체 카테고리에 대응하는 상기 하나 이상의 태그에 기초하여 미디어 콘텐츠의 컬렉션 중에서 미디어 콘텐츠를 선택하는 단계; 및
상기 클라이언트 디바이스에서 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 프레젠테이션의 디스플레이를 야기하는 단계
를 포함하는 동작들을 수행하게 하는, 시스템. - 제8항에 있어서,
상기 클라이언트 디바이스에서 상기 이미지 데이터의 디스플레이를 야기하는 단계는:
상기 클라이언트 디바이스에서 이미지 데이터의 컬렉션 중에서 상기 이미지 데이터를 선택하는 입력을 수신하는 단계를 포함하는, 시스템. - 제8항에 있어서,
상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계는:
상기 객체 카테고리에 대응하는 미디어 템플릿을 검색하는 단계; 및
상기 미디어 템플릿 및 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계를 포함하는, 시스템. - 제10항에 있어서,
상기 미디어 콘텐츠는 복수의 미디어 객체 유형을 포함하고, 상기 복수의 미디어 객체 유형 중의 각각의 미디어 객체 유형은 대응하는 디스플레이 속성을 포함하고, 상기 미디어 콘텐츠는 제1 미디어 객체 유형의 제1 미디어 콘텐츠를 적어도 포함하고, 상기 미디어 템플릿 및 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계는:
상기 제1 미디어 콘텐츠의 상기 제1 미디어 객체 유형에 기초하여 상기 제1 미디어 콘텐츠를 상기 미디어 템플릿 내의 위치에 할당하는 단계를 포함하는, 시스템. - 제8항에 있어서,
상기 동작들은
상기 클라이언트 디바이스에서 상기 이미지 데이터의 디스플레이를 야기하는 것에 응답하여 상기 클라이언트 디바이스의 컨텍스트를 결정하는 단계를 추가로 포함하고;
상기 미디어 콘텐츠는 미디어 저장소 내의 상기 컨텍스트 및 상기 객체 카테고리와 연관되는, 시스템. - 제12항에 있어서,
상기 이미지 데이터는 이미지 메타데이터를 포함하고, 상기 컨텍스트는 위치를 포함하고, 상기 위치를 결정하는 단계는:
상기 이미지 메타데이터에 기초하여 상기 클라이언트 디바이스의 상기 위치를 결정하는 단계를 포함하는, 시스템. - 제8항에 있어서,
상기 이미지 데이터는 이미지 특징들의 세트를 포함하고, 상기 객체의 상기 객체 카테고리를 식별하는 단계는:
상기 이미지 특징들의 세트에 기초하여 상기 객체를 식별하는 단계; 및
상기 객체에 기초하여 상기 객체 카테고리를 식별하는 단계를 포함하는, 시스템. - 명령어들을 포함하는 비일시적 머신-판독가능 스토리지 매체로서, 상기 명령어들은 머신의 하나 이상의 프로세서에 의해 실행될 때, 상기 머신으로 하여금:
클라이언트 디바이스에서 이미지 데이터의 디스플레이를 야기하는 단계 - 상기 이미지 데이터는 상기 이미지 데이터 내의 위치에 있는 객체의 묘사를 포함함 -;
상기 객체의 묘사에 기초하여 상기 객체의 객체 카테고리를 식별하는 단계 - 상기 객체 카테고리는 하나 이상의 태그에 대응함 -;
컨텍스트 인자 및 상기 객체 카테고리에 대응하는 상기 하나 이상의 태그에 기초하여 미디어 콘텐츠의 컬렉션 중에서 미디어 콘텐츠를 선택하는 단계; 및
상기 클라이언트 디바이스에서 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 프레젠테이션의 디스플레이를 야기하는 단계
를 포함하는 동작들을 수행하게 하는, 비일시적 머신-판독가능 스토리지 매체. - 제15항에 있어서,
상기 클라이언트 디바이스에서 상기 이미지 데이터의 디스플레이를 야기하는 단계는:
상기 클라이언트 디바이스에서 이미지 데이터의 컬렉션 중에서 상기 이미지 데이터를 선택하는 입력을 수신하는 단계를 포함하는, 비일시적 머신-판독가능 스토리지 매체. - 제15항에 있어서,
상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계는:
상기 객체 카테고리에 대응하는 미디어 템플릿을 검색하는 단계; 및
상기 미디어 템플릿 및 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계를 포함하는, 비일시적 머신-판독가능 스토리지 매체. - 제17항에 있어서,
상기 미디어 콘텐츠는 복수의 미디어 객체 유형을 포함하고, 상기 복수의 미디어 객체 유형 중의 각각의 미디어 객체 유형은 대응하는 디스플레이 속성을 포함하고, 상기 미디어 콘텐츠는 제1 미디어 객체 유형의 제1 미디어 콘텐츠를 적어도 포함하고, 상기 미디어 템플릿 및 상기 객체의 위치에 기초하여 상기 미디어 콘텐츠의 상기 프레젠테이션의 디스플레이를 야기하는 단계는:
상기 제1 미디어 콘텐츠의 상기 제1 미디어 객체 유형에 기초하여 상기 제1 미디어 콘텐츠를 상기 미디어 템플릿 내의 위치에 할당하는 단계를 포함하는,
비일시적 머신-판독가능 스토리지 매체. - 제15항에 있어서,
상기 동작들은:
상기 클라이언트 디바이스에서 상기 이미지 데이터의 디스플레이를 야기하는 것에 응답하여 상기 클라이언트 디바이스의 컨텍스트를 결정하는 단계를 추가로 포함하고;
상기 미디어 콘텐츠는 미디어 저장소 내의 상기 컨텍스트 및 상기 객체 카테고리와 연관되는, 비일시적 머신-판독가능 스토리지 매체. - 제19항에 있어서,
상기 이미지 데이터는 이미지 메타데이터를 포함하고, 상기 컨텍스트는 위치를 포함하고, 상기 위치를 결정하는 단계는:
상기 이미지 메타데이터에 기초하여 상기 클라이언트 디바이스의 상기 위치를 결정하는 단계를 포함하는, 비일시적 머신-판독가능 스토리지 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020247017762A KR20240093971A (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/232,787 US10699123B1 (en) | 2018-12-26 | 2018-12-26 | Dynamic contextual media filter |
US16/232,787 | 2018-12-26 | ||
KR1020217023143A KR102547894B1 (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
PCT/US2019/068580 WO2020139948A1 (en) | 2018-12-26 | 2019-12-26 | Dynamic contextual media filter |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217023143A Division KR102547894B1 (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247017762A Division KR20240093971A (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230098362A KR20230098362A (ko) | 2023-07-03 |
KR102671052B1 true KR102671052B1 (ko) | 2024-05-31 |
Family
ID=69187998
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247017762A KR20240093971A (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
KR1020237021031A KR102671052B1 (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
KR1020217023143A KR102547894B1 (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247017762A KR20240093971A (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217023143A KR102547894B1 (ko) | 2018-12-26 | 2019-12-26 | 동적 컨텍스트 미디어 필터 |
Country Status (5)
Country | Link |
---|---|
US (6) | US10699123B1 (ko) |
EP (1) | EP3903504A1 (ko) |
KR (3) | KR20240093971A (ko) |
CN (2) | CN118102038A (ko) |
WO (1) | WO2020139948A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP1662143S (ko) * | 2018-10-13 | 2020-06-22 | ||
US10699123B1 (en) | 2018-12-26 | 2020-06-30 | Snap Inc. | Dynamic contextual media filter |
US11776253B2 (en) * | 2020-03-27 | 2023-10-03 | Snap Inc. | Displaying object names in association with augmented reality content |
US11360733B2 (en) | 2020-09-10 | 2022-06-14 | Snap Inc. | Colocated shared augmented reality without shared backend |
US20220101416A1 (en) * | 2020-09-30 | 2022-03-31 | Snap Inc. | Templates to generate augmented reality content items that display product information |
US12033303B2 (en) | 2022-02-08 | 2024-07-09 | Kyocera Document Solutions, Inc. | Mitigation of quantization-induced image artifacts |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170132821A1 (en) | 2015-11-06 | 2017-05-11 | Microsoft Technology Licensing, Llc | Caption generation for visual media |
US20180253900A1 (en) | 2017-03-02 | 2018-09-06 | Daqri, Llc | System and method for authoring and sharing content in augmented reality |
WO2018165154A1 (en) | 2017-03-06 | 2018-09-13 | Snap Inc. | Virtual vision system |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7103605B1 (en) * | 1999-12-10 | 2006-09-05 | A21, Inc. | Timeshared electronic catalog system and method |
JP2005250944A (ja) * | 2004-03-05 | 2005-09-15 | Brother Ind Ltd | 印刷データ編集装置及び印刷データ編集プログラム |
US9143573B2 (en) * | 2008-03-20 | 2015-09-22 | Facebook, Inc. | Tag suggestions for images on online social networks |
US9626798B2 (en) * | 2011-12-05 | 2017-04-18 | At&T Intellectual Property I, L.P. | System and method to digitally replace objects in images or video |
US8494346B2 (en) * | 2011-12-22 | 2013-07-23 | Max Abecassis | Identifying a performer during a playing of a video |
KR20130081595A (ko) * | 2012-01-09 | 2013-07-17 | 삼성전자주식회사 | 디스플레이 장치, 원격 제어 장치 및 그 검색 방법 |
US9380282B2 (en) * | 2012-03-26 | 2016-06-28 | Max Abecassis | Providing item information during video playing |
US9135735B2 (en) * | 2012-06-26 | 2015-09-15 | Qualcomm Incorporated | Transitioning 3D space information to screen aligned information for video see through augmented reality |
US20140006550A1 (en) * | 2012-06-30 | 2014-01-02 | Gamil A. Cain | System for adaptive delivery of context-based media |
US10764645B2 (en) * | 2014-01-22 | 2020-09-01 | Sunshine Partners LLC | Viewer-interactive enhanced video advertisements |
KR102204919B1 (ko) * | 2014-06-14 | 2021-01-18 | 매직 립, 인코포레이티드 | 가상 및 증강 현실을 생성하기 위한 방법들 및 시스템들 |
US10782019B2 (en) | 2015-03-30 | 2020-09-22 | Sabic Global Technologies B.V. | Wet scrubbing high rubber graft ABS particulate vent vapors |
US9569213B1 (en) * | 2015-08-25 | 2017-02-14 | Adobe Systems Incorporated | Semantic visual hash injection into user activity streams |
US20170115853A1 (en) * | 2015-10-21 | 2017-04-27 | Google Inc. | Determining Image Captions |
US10657373B2 (en) * | 2016-01-06 | 2020-05-19 | Orcam Technologies Ltd. | Systems and methods for automatically varying privacy settings of wearable camera systems |
CN105812680A (zh) * | 2016-03-31 | 2016-07-27 | 联想(北京)有限公司 | 图像处理方法及电子设备 |
US10366144B2 (en) * | 2016-04-01 | 2019-07-30 | Ebay Inc. | Analyzing and linking a set of images by identifying objects in each image to determine a primary image and a secondary image |
US10318573B2 (en) * | 2016-06-22 | 2019-06-11 | Oath Inc. | Generic card feature extraction based on card rendering as an image |
US10008042B2 (en) * | 2016-09-30 | 2018-06-26 | Intel Corporation | Augmented reality rendered structured content |
US10769438B2 (en) * | 2017-05-23 | 2020-09-08 | Samsung Electronics Company, Ltd. | Augmented reality |
US10726308B2 (en) * | 2017-07-07 | 2020-07-28 | Accenture Global Solutions Limited | Image content moderation |
US10699123B1 (en) | 2018-12-26 | 2020-06-30 | Snap Inc. | Dynamic contextual media filter |
-
2018
- 2018-12-26 US US16/232,787 patent/US10699123B1/en active Active
-
2019
- 2019-12-26 KR KR1020247017762A patent/KR20240093971A/ko unknown
- 2019-12-26 KR KR1020237021031A patent/KR102671052B1/ko active IP Right Grant
- 2019-12-26 CN CN202410363220.4A patent/CN118102038A/zh active Pending
- 2019-12-26 WO PCT/US2019/068580 patent/WO2020139948A1/en unknown
- 2019-12-26 EP EP19842543.1A patent/EP3903504A1/en active Pending
- 2019-12-26 CN CN201980086375.5A patent/CN113228693B/zh active Active
- 2019-12-26 KR KR1020217023143A patent/KR102547894B1/ko active Application Filing
-
2020
- 2020-04-17 US US16/852,045 patent/US11017234B2/en active Active
-
2021
- 2021-04-22 US US17/237,932 patent/US11354898B2/en active Active
-
2022
- 2022-05-27 US US17/827,179 patent/US11710311B2/en active Active
-
2023
- 2023-03-30 US US18/129,015 patent/US11989937B2/en active Active
-
2024
- 2024-04-26 US US18/647,285 patent/US20240273897A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170132821A1 (en) | 2015-11-06 | 2017-05-11 | Microsoft Technology Licensing, Llc | Caption generation for visual media |
US20180253900A1 (en) | 2017-03-02 | 2018-09-06 | Daqri, Llc | System and method for authoring and sharing content in augmented reality |
WO2018165154A1 (en) | 2017-03-06 | 2018-09-13 | Snap Inc. | Virtual vision system |
Also Published As
Publication number | Publication date |
---|---|
US11354898B2 (en) | 2022-06-07 |
US10699123B1 (en) | 2020-06-30 |
CN118102038A (zh) | 2024-05-28 |
KR102547894B1 (ko) | 2023-06-27 |
US11710311B2 (en) | 2023-07-25 |
US20210240990A1 (en) | 2021-08-05 |
US20200242363A1 (en) | 2020-07-30 |
US20240273897A1 (en) | 2024-08-15 |
US20200210703A1 (en) | 2020-07-02 |
KR20210105968A (ko) | 2021-08-27 |
EP3903504A1 (en) | 2021-11-03 |
US20220292820A1 (en) | 2022-09-15 |
CN113228693A (zh) | 2021-08-06 |
KR20240093971A (ko) | 2024-06-24 |
WO2020139948A1 (en) | 2020-07-02 |
KR20230098362A (ko) | 2023-07-03 |
CN113228693B (zh) | 2024-04-05 |
US11989937B2 (en) | 2024-05-21 |
US20230237798A1 (en) | 2023-07-27 |
US11017234B2 (en) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11170035B2 (en) | Context based media curation | |
US20200310601A1 (en) | Dynamic media selection menu | |
US11722837B2 (en) | Geo-fence selection system | |
KR102671052B1 (ko) | 동적 컨텍스트 미디어 필터 | |
KR20220024993A (ko) | 어드레싱가능한 증강 현실 콘텐츠 | |
US12105930B2 (en) | Interactive messaging stickers | |
US20240160655A1 (en) | Media request system | |
US20230336514A1 (en) | Messaging system | |
US11716243B2 (en) | User classification based notification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |