KR20200101934A - 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들 - Google Patents

음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들 Download PDF

Info

Publication number
KR20200101934A
KR20200101934A KR1020207019382A KR20207019382A KR20200101934A KR 20200101934 A KR20200101934 A KR 20200101934A KR 1020207019382 A KR1020207019382 A KR 1020207019382A KR 20207019382 A KR20207019382 A KR 20207019382A KR 20200101934 A KR20200101934 A KR 20200101934A
Authority
KR
South Korea
Prior art keywords
user
users
demographics
voice
matching
Prior art date
Application number
KR1020207019382A
Other languages
English (en)
Other versions
KR102451348B1 (ko
Inventor
션 매튜스
벤자민 에이치. 모건
케빈 비. 렌하트
Original Assignee
로비 가이드스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 로비 가이드스, 인크. filed Critical 로비 가이드스, 인크.
Publication of KR20200101934A publication Critical patent/KR20200101934A/ko
Application granted granted Critical
Publication of KR102451348B1 publication Critical patent/KR102451348B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/45Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying users
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/61Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/65Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on users' side

Abstract

음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들이 본 명세서에서 개시된다. 미디어 안내 애플리케이션은 사용자의 입력으로부터 음성 시그니처를 생성하고 그 시그니처에 기초하여 사용자의 일부 인구통계 특성들(예를 들어, 연령, 성별, 및 다른 적합한 특성들)을 식별할 수 있다. 미디어 안내 애플리케이션은 사용자의 세대와 연관된 사용자들에 대한 사용자 데이터를 리트리브하고 사용자들 중 어느 사용자가 커맨드를 발화했는지를 식별하려고 시도할 수 있다. 다수의 사용자들이 식별되는 경우, 인구통계 특성들에 기초하여, 미디어 안내 애플리케이션은 음성 커맨드의 내용(예를 들어, 요청된 미디어의 유형)을 사용하여 사용자를 식별할 수 있다.

Description

음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들
각각의 세대(household) 내의 미디어 소비 디바이스들의 개수는 지난 몇 년에 걸쳐 급격히 증가하였다. 더 많은 사용자들이 세대 내의 다양한 디바이스들로부터 미디어를 소비함에 따라, 사용자가 콘텐츠를 소비하기 위해 사용하고 있는 디바이스에 관계없이 각각의 사용자가 소비하고 있는 콘텐츠를 식별하는 것이 유용할 수 있다. 현재 시스템들이 이 문제를 해결하는 하나의 방식은 사용자가 콘텐츠를 요청하는 음성 커맨드를 발화할 때 보이스 인식을 인에이블시키는 것이다. 음성 커맨드를 수신할 시에, 현재 시스템들은 음성 커맨드로부터 추출되는 바와 같은 사용자의 성문(voice print)을 이전에 저장된 성문들과 비교하여 매칭을 획득한다. 그렇지만, 성문들을 비교하는 데 사용될 수 있는 성문들이 저장되어 있지 않을 때 이 프로세스는 실패한다.
따라서, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들이 본 명세서에서 개시된다. 미디어 안내 애플리케이션은 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하는 것과 관련하여 설명된 액션들을 수행하는 데 사용될 수 있다. 미디어 안내 애플리케이션은 사용자의 입력으로부터 음성 시그니처(voice signature)를 생성할 수 있고, 그 시그니처에 기초하여, 사용자의 일부 인구통계 특성(demographic characteristic)들(예를 들어, 연령, 성별, 및 다른 적합한 특성들)을 식별할 수 있다. 미디어 안내 애플리케이션은 사용자의 세대와 연관된 사용자들에 대한 사용자 데이터를 리트리브(retrieve)할 수 있고 사용자들 중 어느 사용자가 커맨드를 발화했는지를 식별하려고 시도할 수 있다. 다수의 사용자들이 식별되는 경우, 인구통계 특성들에 기초하여, 미디어 안내 애플리케이션은 커맨드의 내용(예를 들어, 요청된 미디어의 유형)을 사용하여 사용자를 식별할 수 있다.
예를 들어, 세대는 남편, 아내, 및 둘 다 남자 아이이고, 한 명은 9세이고 다른 한 명은 15세인 두 명의 아이를 포함할 수 있다. 남자 아이들 중 한 명이, PG-13 영화인, 영화 "Avatar"에 대한 커맨드를 발화할 수 있다. 이에 응답하여, 미디어 안내 애플리케이션은 아이의 음성을 분석할 수 있고 아이가, 6세 내지 16세의 남성이라고 결정할 수 있다. 미디어 안내 애플리케이션은 세대에 대한 사용자 정보를 획득할 수 있고, 그 정보에 기초하여, (예를 들어, 부모 둘 다가 아마도 16세보다 더 나이가 많을 수 있기 때문에) 제1 아이 또는 제2 아이 중 어느 하나가 커맨드를 발화했다고 결정할 수 있다. 미디어 안내 애플리케이션은, 어느 아이가 커맨드를 발화했는지를 결정하기 위해, "Avatar"를 요청된 미디어 자산(media asset)으로서 식별할 수 있다. 미디어 안내 애플리케이션은 영화 "Avatar"의 특성들을 각각의 아이의 선호된 미디어 특성들(예를 들어, 그 각자의 프로파일로부터 획득됨)과 비교할 수 있고, 그 정보에 기초하여, 나이가 더 많은 아이가 커맨드를 발화한 아이라고 결정할 수 있다.
일부 양태들에서, 미디어 안내 애플리케이션은 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위해 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 발화된 커맨드 "Play Avatar"를 수신할 수 있다. 커맨드의 수신 시에, 미디어 안내 애플리케이션은 사용자에 대한 음성 시그니처(예를 들어, 인구통계 정보 검출을 가능하게 해주는 음성 입력의 부분들)을 생성할 수 있다.
미디어 안내 애플리케이션은 음성 시그니처를 분석하여 화자의 인구통계 특성들을 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 음성 시그니처로부터, 사용자와 연관된 복수의 음성 특성들을 결정할 수 있고, 여기서 복수의 음성 특성들은 복수의 인구통계들에 대응한다. 예를 들어, 미디어 안내 애플리케이션은 음성 시그니처로부터 화자가 6세 내지 14세이고 화자가 남성이라고 결정할 수 있다.
미디어 안내 애플리케이션은 세대(예를 들어, 사용자 발화 입력을 수신한 디바이스의 세대) 내의 사용자들에 대한 사용자 정보를 획득하려고 시도할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 세대 식별자를 포함하는, 사용자 정보에 대한 요청을 전송할 수 있다.
사용자 정보에 대한 요청에 응답하여, 미디어 안내 애플리케이션은 요청된 바와 같은 세대 정보를 수신할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 사용자 정보를 수신할 수 있고, 여기서 사용자 정보는 세대 내의 각각의 사용자의 각자의 인구통계 정보를 포함한다. 예를 들어, 미디어 안내 애플리케이션은 세대가 4명의 사용자를 포함한다는 것을 나타내는 정보를 수신할 수 있다. 즉, 가능한 사용자들은 46세의 남성, 44세의 여성, 및 제각기 8세와 14세인 부가의 2명의 남성을 포함할 수 있다.
미디어 안내 애플리케이션은 음성 시그니처로부터 추출되는 인구통계 정보를 수신된 인구통계 세대 정보와 비교할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 복수의 인구통계들을 사용자 정보 내의 인구통계 정보와 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 음성 시그니처(예를 들어, 남성)에 대한 성별을 가능한 사용자들의 성별들과 비교할 수 있고 여성이 매칭이 아니라고 결정할 수 있다. 미디어 안내 애플리케이션은 사용자들의 연령들을 음성 시그니처로부터 추출된 바와 같은 연령 범위와 비교할 수 있다.
비교의 결과로서, 미디어 안내 애플리케이션은 음성 시그니처에 대한 매칭일 수 있는 다수의 사용자들을 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 비교에 기초하여, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 두 명의 남자 아이가 기준들을 충족시키는 세대의 유일한 구성원들이라고 결정할 수 있다.
매칭되는 다수의 신원들에 응답하여, 미디어 안내 애플리케이션은 커맨드의 내용을 사용하여 어느 사용자가 화자인지를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 음성 커맨드가 미디어 자산(예를 들어, 영화 "Avatar")에 대한 요청을 포함한다고 결정할 수 있고, 미디어 자산과 연관된 메타데이터를 복수의 인구통계들과 매칭되는 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 남자 아이들 각각의 프로파일을 리트리브할 수 있고 프로파일들 각각 내의 데이터를 영화 "Avatar"와 연관된 메타데이터와 비교할 수 있다.
미디어 안내 애플리케이션은, 비교에 기초하여, 가장 가능성 있는 화자를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 미디어 자산과 연관된 메타데이터를 복수의 인구통계들과 매칭되는 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 것에 기초하여, 둘 이상의 사용자들 중 제1 사용자가 최상의 매칭을 구성한다고 결정할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 나이가 더 많은 남자 아이(14세)의 프로파일 내의 데이터가 나이가 더 적은 남자 아이의 프로파일보다 영화 "Avatar"의 메타데이터에 대한 더 나은 매칭이라고 결정할 수 있다.
미디어 안내 애플리케이션은 화자가 식별되었다는 것을 시청자에게 통보하기 위해 어떤 유형의 표시자를 디스플레이를 위해 생성할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 제1 사용자가 최상의 매칭이라고 결정한 것에 응답하여, 사용자가 식별되었다는 표시를 디스플레이를 위해 생성할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 사용자의 사진의 아이콘, 사용자의 아바타의 아이콘, 사용자의 이름, 또는 다른 적합한 표시자를 디스플레이를 위해 생성할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 다음의 액션들을 취함으로써 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송할 수 있다. 미디어 안내 애플리케이션은 음성 커맨드를 수신한 사용자 디바이스에 대한 식별 스트링(identification string)을 리트리브할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 음성 커맨드가 수신되는 사용자 장비 디바이스와 연관된 식별 스트링을 결정할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 디바이스의 일련 번호를 나타내는 영숫자 스트링을 리트리브할 수 있다.
미디어 안내 애플리케이션은 식별 스트링을 사용하여 세대 정보에 대한 질의(query)를 작성할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 세대 사용자 정보에 대한 질의를 생성할 수 있고, 여기서 질의는 식별 스트링을 포함한다. 예를 들어, 미디어 안내 애플리케이션은 디바이스의 일련 번호를 나타내는 영숫자 스트링을 사용하여 데이터베이스 탐색 질의를 생성할 수 있다.
미디어 안내 애플리케이션은 생성된 질의를 적절한 정보를 저장하는 서버에 전송할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 사용자의 세대와 연관된 사용자 정보를 저장하는 원격 서버에 질의를 전송할 수 있다. 예를 들어, 사용자의 세대와 연관된 사용자 정보는 원격 위치에 있는 데이터베이스 서버 상에 저장될 수 있다. 미디어 안내 애플리케이션은 인터넷을 통해 질의를 전송할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 사용자 정보를 수신할 때, 사용자 정보를 데이터 구조에 저장할 수 있다. 데이터 구조는 복수의 엔트리(entry)들을 포함할 수 있고, 여기서 복수의 엔트리들은 세대 내의 각각의 사용자에 대한 엔트리를 포함한다. 예를 들어, 미디어 안내 애플리케이션은 데이터 구조를 테이블로서 저장할 수 있고, 여기서 테이블은 각각의 엔트리에 대한 행을 포함한다. 미디어 안내 애플리케이션은 각각의 엔트리에 대한 복수의 필드(field)들을 저장할 수 있고, 여기서 복수의 필드들은 각자의 사용자와 연관된 인구통계 정보의 각각의 아이템에 대한 필드를 포함한다. 예를 들어, 테이블은 연령(예를 들어, 14세) 및 성별(예를 들어, 남성)에 대한 필드들을 포함하는 엔트리를 포함할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 복수의 인구통계들을 사용자 정보 내의 인구통계 정보와 비교할 때, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 복수의 엔트리들로부터 제1 엔트리를 리트리브할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 상기 예시된 엔트리를 리트리브할 수 있으며, 여기서 연령 필드는 14의 값을 갖고 성별 필드는 남성의 값을 갖는다.
미디어 안내 애플리케이션은 수신된 인구통계 정보를 음성 커맨드로부터 추출되는 인구통계와 비교할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 복수의 인구통계들 중 각각의 인구통계를 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 음성 커맨드로부터 추출되는 연령 범위(예를 들어, 6 내지 16)를 수신된 엔트리의 연령 필드(예를 들어, 14)와 비교할 수 있다. 미디어 안내 애플리케이션은 또한 음성 커맨드로부터 추출되는 연령 범위를 다른 엔트리들의 연령 필드(즉, 세대 내 다른 사용자들의 연령들)와 비교할 수 있다.
미디어 안내 애플리케이션은 인구통계 비교에 기초하여 매칭되는 사용자를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 복수의 인구통계들 중 각각의 인구통계를 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 것에 기초하여, 복수의 인구통계들로부터 제1 사용자와 연관된 인구통계들과 매칭되는 한 세트의 인구통계 정보를 생성할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 제1 사용자(예를 들어, 14세 남성) 및 제2 사용자(예를 들어, 8세 남성)를 포함하는 세트를 생성할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정할 때, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 복수의 인구통계들과 매칭되는 제1 사용자와 연관된 인구통계 정보의 양을 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 각각의 테이블 엔트리에 대해 음성 커맨드로부터의 인구통계 정보와 매칭되는 필드들의 개수를 다른 테이블 엔트리들에서의 매칭되는 필드들의 개수와 비교할 수 있다.
미디어 안내 애플리케이션은 다수의 세트들의 매칭되는 인구통계 정보를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 복수의 인구통계들과 매칭되는 제1 사용자와 연관된 인구통계 정보의 양을 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 것에 기초하여, 가장 많은 양의 매칭되는 인구통계 정보를 갖는 둘 이상의 사용자들을 식별할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 남자 아이들에 대한 2개의 엔트리가 가장 많은 양의 매칭되는 정보를 구성한다고 결정할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 미디어 자산과 연관된 메타데이터를 복수의 인구통계들과 매칭되는 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교할 때, 다음의 액션들을 수행할 수 있다.
미디어 안내 애플리케이션은 복수의 사용자 프로파일들을 수신할 수 있으며, 여기서 복수의 사용자 프로파일들 내의 각각의 사용자 프로파일은 둘 이상의 사용자들 중 한 사용자에 대응하고, 여기서 각각의 사용자 프로파일은 둘 이상의 사용자들 중 각자의 사용자가 선호하는 미디어 자산들에 대응하는 복수의 특성들을 포함한다. 예를 들어, 미디어 안내 애플리케이션은 각각의 식별된 사용자에 대한 사용자 프로파일을 리트리브할 수 있다. 사용자 프로파일은 사용자가 선호하는 콘텐츠의 유형을 나타내는 정보를 포함할 수 있다.
미디어 안내 애플리케이션은 인구통계 정보에 기초하여 이전에 식별된 사용자들 중 어느 사용자가 음성 커맨드와 매칭되는지를, 사용자들의 프로파일들에 기초하여, 결정할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 미디어 자산과 연관된 메타데이터를 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 영화 "Avatar"의 메타데이터를 대응하는 사용자의 프로파일에 저장된 사용자들의 선호도들과 비교할 수 있다.
미디어 안내 애플리케이션은, 비교에 기초하여, 각각의 사용자의 프로파일에 대해, 미디어 자산의 메타데이터와 매칭되는 특성들의 양을 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 미디어 자산과 연관된 메타데이터를 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 것에 기초하여, 둘 이상의 사용자들의 각각의 사용자에 대해, 매칭되는 특성들의 양을 결정할 수 있다. 예를 들어, 14세의 프로파일은 부모 지도(parental guidance) 등급 레벨(예를 들어, PG-13) 및 장르(예를 들어, 액션 어드벤처)와 매칭될 수 있는 반면, 7세의 프로파일은 장르와만 매칭될 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 둘 이상의 사용자들 중에서, 가장 많은 양의 매칭되는 메타데이터를 갖는 사용자를 결정할 때, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 복수의 특성들 중 각각의 특성과 연관된 가중치를 리트리브할 수 있다. 예를 들어, 장르 특성은 부모 지도 등급(예를 들어, PG-13) 특성보다 높은 가중치를 가질 수 있다.
미디어 안내 애플리케이션은 대응하는 가중치를 각각의 특성에 적용하여 최상의 매칭을 결정할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 각각의 특성에 대한 각자의 가중치를 사용하여, 둘 이상의 사용자들의 각각의 사용자에 대해, 매칭되는 특성들의 양을 계산할 수 있다. 예를 들어, 장르에 대한 가중치는 .75일 수 있는 반면, 부모 지도 등급에 대한 가중치는 .25일 수 있다. 미디어 안내 애플리케이션은 이러한 가중치들을 특성들에 적용함으로써 매칭되는 특성들의 최종 양을 결정할 수 있다.
미디어 안내 애플리케이션은 가장 많은 양의 매칭되는 특성들을 갖는 매칭되는 사용자를 선택할 수 있다. 예를 들어, 14세가 1.00의 최종 매칭 점수(예를 들어, .25의 부모 지도 등급 + .75의 장르)를 갖고 7세가 .75의 매칭 점수(예를 들어, .75의 장르)를 갖는 경우, 미디어 안내 애플리케이션은 14세를 음성 커맨드의 발화자로서 선택할 수 있다. 일부 실시예들에서, 미디어 안내 애플리케이션은 커맨드 내용 매칭에 부가하여 또는 그 대신에 커맨드의 컨텍스트를 사용할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 커맨드와 연관된 하루 중 시간을 사용할 수 있다. 아이들 중 하나는 어린이집에 있지만, 제2 아이가 이미 학교에 없는 시간 동안(예를 들어, 오후 4시에) 커맨드가 발화되는 경우, 미디어 안내 애플리케이션은 제2 아이를 발화자로서 식별할 수 있다. 미디어 안내 애플리케이션은 식별을 위해 다른 컨텍스트 데이터를 사용할 수 있다. 미디어 안내 애플리케이션은 계절, 월, 요일, 및 다른 적합한 컨텍스트를 사용할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 사용자가 식별되었다는 표시를 디스플레이를 위해 생성할 때, 다음의 액션들을 취할 수 있다. 미디어 안내 애플리케이션은, 스토리지로부터, 사용자의 프로파일을 리트리브할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 셋톱 박스 또는 원격 서버로부터 사용자 설정을 리트리브할 수 있다.
미디어 안내 애플리케이션은, 사용자의 프로파일에 기초하여, 사용자가 아바타를 선택했다고 결정할 수 있다. 예를 들어, 사용자의 프로파일은 사용자가 선호하는 아바타의 식별을 포함할 수 있다. 미디어 안내 애플리케이션은 미디어 자산의 일 부분 위에 오버레이되는 아바타를 디스플레이를 위해 생성할 수 있다. 예를 들어, 사용자의 아바타는 스크린 상에 디스플레이될 수 있는 영화 "Avatar"의 캐릭터의 사진일 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 사용자와 연관된 모든 디바이스들 상에 음성 시그니처를 저장할 수 있다. 예를 들어, 사용자는 (예를 들어, 집의 다수의 방들에 있는) 다수의 셋톱 박스들에 부가하여 전자 태블릿을 가질 수 있다. 미디어 안내 애플리케이션은 추후 사용을 위해 디바이스들 전부에게 음성 시그니처를 전송할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 음성 시그니처로 사용자의 프로파일을 업데이트할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 음성 시그니처 및 미디어 자산의 표시를, 사용자의 음성 프로파일에 저장할 수 있고, 후속 음성 커맨드를 검출할 시에, 후속 음성 커맨드와 연관된 후속 음성 시그니처가 음성 시그니처와 매칭된다고 결정할 수 있다. 미디어 안내 애플리케이션은 후속 음성 커맨드의 내용을 사용자의 음성 프로파일에 저장할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 14세 남자 아이에 속하는 것으로서 식별되는 음성 시그니처를 저장할 수 있고, 14세 남자 아이가 다른 음성 커맨드(예를 들어, play terminator)를 입력할 때, 미디어 안내 애플리케이션은 그 미디어 콘텐츠의 표시를 사용자의 프로파일에 추가할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 세대의 구성원이 아닌 사용자를 식별할 수 있다. 예를 들어, 세대 내의 사용자들의 방문 친척 또는 친구가 미디어 안내 애플리케이션에 의해 실행될 커맨드를 발화하고 있을 수 있다. 미디어 안내 애플리케이션은, 세대의 구성원이 아닌 사용자를 식별하기 위해, 세대 내의 사용자들 전부가 이전에 식별되었는지 여부를 결정할 수 있다. 예를 들어, 미디어 안내 애플리케이션은, 세대가 4명의 사용자(2명의 부모 및 2명의 자녀)를 갖고 4명의 사용자가 이전에 이미 식별된 경우, 새로운 사용자가 방문자라고 결정할 수 있다. 그렇지만, 세대의 모든 사용자들이 식별되지 않은 경우, 미디어 안내 애플리케이션은 그 결정에서 사용 빈도를 사용할 수 있다. 예를 들어, 커맨드를 발화하고 있는 사용자가 시스템의 빈번한 사용자가 아닌 경우(예를 들어, 첫 번째 화자 또는 두 번째 화자인 경우), 미디어 안내 애플리케이션은 사용자가 세대의 구성원이 아니라고(예를 들어, 방문자라고) 결정할 수 있다. 대조적으로, 사용자가 시스템을 자주(예를 들어, 20회 이상) 사용한 경우, 미디어 안내 애플리케이션은 사용자가 세대의 구성원이라고 결정할 수 있다.
사용자가 세대의 구성원이 아닌 경우, 미디어 안내 애플리케이션은 사용자에 대한 손님 프로파일을 셋업할 수 있다. 일부 실시예들에서, 미디어 안내 애플리케이션은 식별을 위해 사용자의 자격증명들을 입력하도록 사용자에게 요구하거나 인구통계 정보를 입력하도록 사용자에게 요구할 수 있다. 또 다른 일부 실시예들에서, 미디어 안내 애플리케이션은 방문자를 식별하기 위해 다른 방식들을 사용하려고 시도할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 인구통계 데이터를 위해 방문자의 음성을 분석할 수 있고 방문자를 식별하기 위해 세대의 구성원들과 연관된 프로파일들(예를 들어, 소셜 미디어 프로파일들)을 사용하려고 시도할 수 있다. 예를 들어, 방문자가 소셜 미디어 상에서 세대의 구성원들에 접속될 수 있는 할아버지일 수 있는 경우, 미디어 안내 애플리케이션은 그 정보를 사용하여 그 사람을 식별할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 사용자에 대한 완전한 프로파일을 생성하기 위해 인구통계 정보와 함께 음성 커맨드를 사용할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 사용자로부터 커맨드를 수신하고 그 음성 커맨드에 기초하여 사용자를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 미디어 안내 애플리케이션 내에 저장된 사용자와 연관된 음성 샘플을 음성 커맨드와 비교하여 사용자를 식별할 수 있다. 미디어 안내 애플리케이션은 원격 위치로부터 세대의 사용자들과 연관된 인구통계 정보를 리트리브하고 음성 커맨드로부터 추출되는 인구통계 정보를 수신된 인구통계 정보와 비교할 수 있다. 미디어 안내 애플리케이션은, 비교에 기초하여, 사용자를 식별할 수 있다. 미디어 안내 애플리케이션은 사용자의 프로파일을 가능한 한 완전하게 만들기 위해 원격 서버로부터 수신되는 인구통계 정보를 사용자의 프로파일에 복사할 수 있다.
본 개시내용의 상기 및 다른 목적들 및 장점들은, 비슷한 참조 문자들이 전반에 걸쳐 비슷일 부분들을 지칭하는, 첨부 도면들과 관련하여 취해진, 이하의 상세한 설명을 고려할 때 명백할 것이다.
도 1은 본 개시내용의 일부 실시예들에 따른, 음성 시그니처로부터 추출되는 인구통계 정보 및 세대 내의 사용자들에 대한 인구통계 데이터를 포함하는 데이터 구조들의 예시적인 예를 도시한다;
도 2는 본 개시내용의 일부 실시예들에 따른, 미디어 콘텐츠에 액세스하는 데 사용하기 위한 디스플레이 스크린의 예시적인 예를 도시한다;
도 3은 본 개시내용의 일부 실시예들에 따른, 미디어 콘텐츠에 액세스하는 데 사용하기 위한 디스플레이 스크린의 다른 예시적인 예를 도시한다;
도 4는 본 개시내용의 일부 실시예들에 따른, 예시적인 사용자 장비 디바이스의 블록 다이어그램이다;
도 5는 본 개시내용의 일부 실시예들에 따른, 예시적인 미디어 시스템의 블록 다이어그램이다;
도 6은 본 개시내용의 일부 실시예들에 따른, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 예시적인 액션들의 플로차트이다;
도 7은 본 개시내용의 일부 실시예들에 따른, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 예시적인 액션들의 다른 플로차트이다;
도 8은 본 개시내용의 일부 실시예들에 따른, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정하기 위한 예시적인 액션들의 플로차트이다;
도 9는 본 개시내용의 일부 실시예들에 따른, 음성 시그니처를 사용자와 매칭시키기 위한 예시적인 액션들의 플로차트이다.
음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들이 본 명세서에서 개시된다. 일부 실시예들에서, 미디어 안내 애플리케이션은 사용자의 입력으로부터 음성 시그니처(voice signature)를 생성할 수 있고, 그 시그니처에 기초하여, 사용자의 일부 인구통계 특성들(예를 들어, 연령, 성별, 및 다른 적합한 특성들)을 식별할 수 있다. 미디어 안내 애플리케이션은 사용자의 세대와 연관된 사용자들에 대한 사용자 데이터를 리트리브할 수 있고 사용자들 중 어느 사용자가 커맨드를 발화했는지를 식별하려고 시도할 수 있다. 다수의 사용자들이 식별되는 경우, 인구통계 특성들에 기초하여, 미디어 안내 애플리케이션은 음성 커맨드의 내용(예를 들어, 요청된 미디어의 유형)을 사용하여 사용자를 식별할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위해 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 사용자로부터 발화된 커맨드를 수신할 수 있다. 커맨드의 수신 시에, 미디어 안내 애플리케이션은 사용자에 대한 음성 시그니처(예를 들어, 인구통계 정보 검출을 가능하게 해주는 음성 입력의 부분들)을 생성할 수 있다.
미디어 안내 애플리케이션은 음성 시그니처를 분석하여 화자의 인구통계 특성들을 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 음성 시그니처로부터, 사용자와 연관된 복수의 음성 특성들을 결정할 수 있고, 여기서 복수의 음성 특성들은 복수의 인구통계들에 대응한다. 예를 들어, 미디어 안내 애플리케이션은 특정 성별 및 연령 범위와 연관된 특정 특성들을 위해 음성 시그니처를 분석할 수 있다. 미디어 안내 애플리케이션은 그 정보를 데이터 구조에(예를 들어, 데이터 구조(100))에 저장할 수 있다. 도 1의 데이터 구조(100)는 다수의 필드 유형들(102)을 포함할 수 있다. 필드 유형들(102)은 음성 시그니처를 나타내는 2진수 또는 16진수 데이터를 포함할 수 있는 음성 시그니처 필드를 포함할 수 있다. 음성 시그니처가 다른 적합한 유형의 데이터로서 저장될 수 있음에 유의해야 한다. 필드들(102)은 성별 필드, 연령 범위 필드 및 다른 적합한 인구통계 필드들을 또한 포함할 수 있다. 일부 실시예들에서, 데이터 구조(100)는 음성 커맨드와 연관된 컨텍스트 필드들을 포함할 수 있다. 예를 들어, 커맨드의 날짜/시간, 커맨드가 발화된 위치는 물론 다른 적합한 컨텍스트 데이터. 데이터 구조(100)는 다수의 엔트리들(104)을 포함할 수 있다. 각각의 엔트리(104)는 음성 시그니처로부터 추출되는 인구통계 데이터(예를 들어, 성별 값, 연령 범위 값, 및 다른 적합한 인구통계 데이터 값들)를 포함할 수 있다. 데이터 구조들(100 및 120)이 다른 인구통계 데이터에 대한 별도의 필드들을 포함할 수 있으며, 여기서 하나의 인구통계 데이터 유형이 하나의 필드에 대응한다는 점에 유의해야 한다.
미디어 안내 애플리케이션은 세대(예를 들어, 사용자 발화 입력을 수신한 디바이스의 세대) 내의 사용자들에 대한 사용자 정보를 획득하려고 시도할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 세대 식별자를 포함하는, 사용자 정보에 대한 요청을 전송할 수 있다.
사용자 정보에 대한 요청에 응답하여, 미디어 안내 애플리케이션은 세대 정보를 수신할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 사용자 정보를 수신할 수 있고, 여기서 사용자 정보는 세대 내의 각각의 사용자의 각자의 인구통계 정보를 포함한다. 예를 들어, 미디어 안내 애플리케이션은 다수의 엔트리들을 포함하는 데이터 구조를 수신할 수 있으며, 각각의 엔트리는 세대 구성원에 대한 것이다. 도 1의 데이터 구조(120)는 그러한 데이터 구조의 예시적인 예로서 역할할 수 있다. 필드 유형들(122)은 사용자 ID 필드(예를 들어, 영숫자 스트링, 숫자, 또는 16진수 숫자), 성별 필드, 및 연령 필드를 포함할 수 있다. 이 데이터 구조에서의 연령 필드가 특정 숫자라는 것에 유의해야 한다. 일부 실시예들에서, 연령 필드는 연령 대신에 사용자의 생년월일을 포함할 수 있다. 다른 인구통계 데이터도 데이터 구조에 저장될 수 있다. 데이터 구조(120)는 각각의 필드 유형에 대한 필드 값들을 갖는 엔트리들(124)을 포함할 수 있다. 예를 들어, 사용자 1은 사용자 ID 값일 수 있고, 남성은 성별일 수 있으며, 16은 특정 사용자의 연령일 수 있다. 다수의 엔트리들(124)이 데이터 구조에 저장될 수 있다.
미디어 안내 애플리케이션은 음성 시그니처로부터 추출되는 인구통계 정보를 수신된 인구통계 세대 정보와 비교할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 복수의 인구통계들을 사용자 정보 내의 인구통계 정보와 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 엔트리(104) 내의 성별 값을 엔트리(124) 내의 성별 값과 비교할 수 있다. 연령 필드 및 다른 인구통계 필드들에 대해 동일한 비교가 이루어질 수 있다.
비교의 결과로서, 미디어 안내 애플리케이션은 음성 시그니처에 대한 매칭일 수 있는 다수의 사용자들을 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 비교에 기초하여, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 2개의 엔트리(124)가 엔트리(104)와 매칭된다고 결정할 수 있다.
매칭되는 다수의 신원들에 응답하여, 미디어 안내 애플리케이션은 커맨드의 내용을 사용하여 어느 사용자가 화자인지를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 (예를 들어, 음성 커맨드에 대해 음성 인식 알고리즘을 실행함으로써) 음성 커맨드가 미디어 자산에 대한 요청을 포함한다고 결정할 수 있고, 미디어 자산과 연관된 메타데이터를 복수의 인구통계들과 매칭되는 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 각각의 매칭되는 사용자에 대한 프로파일을 리트리브할 수 있다. 프로파일은 음성 커맨드가 수신된 디바이스의 메모리에 및/또는 원격 서버에 저장될 수 있다. 각각의 프로파일은 사용자의 선호도들(예를 들어, 선호된 장르, 선호된 부모 지도 등급, 선호된 배우, 선호된 영화, 또는 다른 적합한 선호도)를 나타내는 데이터를 포함할 수 있다.
미디어 안내 애플리케이션은, 비교에 기초하여, 가장 가능성 있는 화자를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 미디어 자산과 연관된 메타데이터를 복수의 인구통계들과 매칭되는 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 것에 기초하여, 둘 이상의 사용자들 중 제1 사용자가 최상의 매칭을 구성한다고 결정할 수 있다. 예를 들어, 미디어 안내 애플리케이션은, 예를 들어, 제1 프로파일은 액션 어드벤처 장르에 대한 선호도를 나타내는 반면, 제2 프로파일은 아이들의 코미디에 대한 선호도를 나타내기 때문에, 제1 프로파일 내의 데이터가 제2 프로파일 내의 데이터보다 미디어 자산의 메타데이터에 대한 더 나은 매칭이라고 결정할 수 있다.
미디어 안내 애플리케이션은 화자가 식별되었다는 것을 시청자에게 통보하기 위해 어떤 유형의 표시자를 디스플레이를 위해 생성할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 제1 사용자가 최상의 매칭이라고 결정한 것에 응답하여, 사용자가 식별되었다는 표시를 디스플레이를 위해 생성할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 사용자의 사진의 아이콘, 사용자의 아바타의 아이콘, 사용자의 이름, 또는 다른 적합한 표시자를 디스플레이를 위해 생성할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 다음의 액션들을 취함으로써 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송할 수 있다. 미디어 안내 애플리케이션은 음성 커맨드를 수신한 사용자 디바이스에 대한 식별 스트링을 리트리브할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 음성 커맨드가 수신되는 사용자 장비 디바이스와 연관된 식별 스트링을 결정할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 디바이스의 일련 번호를 나타내는 영숫자 스트링을 리트리브할 수 있다.
미디어 안내 애플리케이션은 식별 스트링을 사용하여 세대 정보에 대한 질의를 작성할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 세대 사용자 정보에 대한 질의를 생성할 수 있고, 여기서 질의는 식별 스트링을 포함한다. 예를 들어, 미디어 안내 애플리케이션은 디바이스의 일련 번호를 나타내는 영숫자 스트링을 사용하여 데이터베이스 탐색 질의를 생성할 수 있다.
미디어 안내 애플리케이션은 생성된 질의를 적절한 정보를 저장하는 서버에 전송할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 사용자의 세대와 연관된 사용자 정보를 저장하는 원격 서버에 질의를 전송할 수 있다. 예를 들어, 사용자의 세대와 연관된 사용자 정보는 원격 위치에 있는 데이터베이스 서버 상에 저장될 수 있다. 미디어 안내 애플리케이션은 인터넷을 통해 질의를 전송할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 사용자 정보를 수신할 때, 사용자 정보를 데이터 구조에 저장할 수 있다. 데이터 구조는 복수의 엔트리들을 포함할 수 있고, 여기서 복수의 엔트리들은 세대 내의 각각의 사용자에 대한 엔트리를 포함한다. 예를 들어, 미디어 안내 애플리케이션은 데이터 구조를 테이블로서 저장할 수 있고, 여기서 테이블은 각각의 엔트리에 대한 행을 포함한다. 미디어 안내 애플리케이션은 각각의 엔트리에 대한 복수의 필드들을 저장할 수 있고, 여기서 복수의 필드들은 각자의 사용자와 연관된 인구통계 정보의 각각의 아이템에 대한 필드를 포함한다. 예를 들어, 테이블은 연령 및 성별에 대한 필드들을 포함하는 엔트리(예를 들어, 엔트리(124))를 포함할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 복수의 인구통계들을 사용자 정보 내의 인구통계 정보와 비교할 때, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 복수의 엔트리들로부터 제1 엔트리를 리트리브할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 메모리로부터 제1 엔트리, 즉 엔트리(124)를 리트리브할 수 있다.
미디어 안내 애플리케이션은 수신된 인구통계 정보를 음성 커맨드로부터 추출되는 인구통계와 비교할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 복수의 인구통계들 중 각각의 인구통계를 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 음성 커맨드로부터 추출되는 연령 범위(예를 들어, 엔트리(104)의 연령 범위 필드)를 수신된 엔트리의 연령 필드(예를 들어, 엔트리(124)의 연령 필드)와 비교할 수 있다. 미디어 안내 애플리케이션은 또한 음성 커맨드로부터 추출되는 연령 범위를 다른 엔트리들의 연령 필드(즉, 세대 내 다른 사용자들의 연령들)와 비교할 수 있다.
미디어 안내 애플리케이션은 인구통계 비교에 기초하여 매칭되는 사용자를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 복수의 인구통계들 중 각각의 인구통계를 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 것에 기초하여, 복수의 인구통계들로부터 제1 사용자와 연관된 인구통계들과 매칭되는 한 세트의 인구통계 정보를 생성할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 제1 사용자 및 제2 사용자를 포함하는 세트를 생성할 수 있다. 세트는 각각의 사용자에 대한 엔트리(124)를 포함할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정할 때, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 복수의 인구통계들과 매칭되는 제1 사용자와 연관된 인구통계 정보의 양을 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 각각의 엔트리(124)에 대해 음성 커맨드로부터의 인구통계 정보와 매칭되는 필드들(예를 들어, 성별 필드 및 연령 필드)의 개수를 다른 테이블 엔트리들에서의 매칭되는 필드들의 개수와 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은, 비교에 기초하여, 2개의 엔트리가 매칭되는 2개의 필드를 갖는 반면 2개의 엔트리가 매칭되는 엔트리를 갖지 않는다고 결정할 수 있다.
미디어 안내 애플리케이션은 다수의 세트들의 매칭되는 인구통계 정보를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 복수의 인구통계들과 매칭되는 제1 사용자와 연관된 인구통계 정보의 양을 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 것에 기초하여, 가장 많은 양의 매칭되는 인구통계 정보를 갖는 둘 이상의 사용자들을 식별할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 2개의 엔트리(예를 들어, 엔트리들(124))가 가장 많은 양의 매칭되는 정보를 구성한다고 결정할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 미디어 자산과 연관된 메타데이터를 복수의 인구통계들과 매칭되는 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교할 때, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 복수의 사용자 프로파일들을 수신할 수 있으며, 여기서 복수의 사용자 프로파일들 내의 각각의 사용자 프로파일은 둘 이상의 사용자들 중 한 사용자에 대응하고, 여기서 각각의 사용자 프로파일은 둘 이상의 사용자들 중 각자의 사용자가 선호하는 미디어 자산들에 대응하는 복수의 특성들을 포함한다. 예를 들어, 미디어 안내 애플리케이션은 각각의 식별된 사용자에 대한 사용자 프로파일을 메모리로부터 리트리브할 수 있다. 사용자 프로파일은 사용자가 선호하는 콘텐츠의 유형을 나타내는 정보를 포함할 수 있다. 예를 들어, 각각의 사용자의 프로파일은 사용자의 좋아하는 미디어 자산, 선호된 장르, 선호된 배우들, 및 다른 적합한 선호도들을 포함할 수 있다.
미디어 안내 애플리케이션은 인구통계 정보에 기초하여 이전에 식별된 사용자들 중 어느 사용자가 음성 커맨드와 매칭되는지를, 사용자들의 프로파일들에 기초하여, 결정할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 미디어 자산과 연관된 메타데이터를 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 미디어 자산과 연관된 메타데이터를 리트리브할 수 있다. 메타데이터는 로컬 스토리지(예를 들어, 프로그램 리스팅 데이터베이스)로부터 또는 원격 서버로부터 리트리브될 수 있다. 메타데이터는 미디어 자산의 장르를 포함할 수 있다. 미디어 안내 애플리케이션은 미디어 자산의 장르를 사용자의 프로파일에서의 사용자의 선호된 장르와 비교하여 매칭을 결정할 수 있다. 프로세스는 미디어 자산과 연관된 다른 메타데이터에 대해 반복될 수 있다(예를 들어, 각각의 배우가 사용자에 의해 선호되는 배우들의 리스트와 비교될 수 있다). 일부 실시예들에서, 커맨드의 내용을 사용하여 사용자 서브세트 중 하나의 사용자를 식별하는 대신에 또는 그에 부가하여, 미디어 안내 애플리케이션은 식별을 위해 사용자에게 프롬프트할 수 있다. 예를 들어, 미디어 안내 애플리케이션은, 화자가 하나를 선택할 수 있도록, 매칭되는 사용자들에 대응하는 2개 이상의 사용자 식별자들을 디스플레이를 위해 생성할 수 있다. 일부 실시예들에서, 미디어 안내 애플리케이션은 선택안들을 사용자에게 발화할 수 있다. 미디어 안내 애플리케이션은 적절한 식별자의 사용자 선택을 수신할 수 있다.
미디어 안내 애플리케이션은, 비교에 기초하여, 각각의 사용자의 프로파일에 대해, 미디어 자산의 메타데이터와 매칭되는 특성들의 양을 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 미디어 자산과 연관된 메타데이터를 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 것에 기초하여, 둘 이상의 사용자들의 각각의 사용자에 대해, 매칭되는 특성들의 양을 결정할 수 있다. 예를 들어, 하나의 프로파일은 장르와 매칭될 수 있는 반면 다른 프로파일은 장르, 부모 지도 등급 및 좋아하는 배우와 매칭될 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 둘 이상의 사용자들 중에서, 가장 많은 양의 매칭되는 메타데이터를 갖는 사용자를 결정할 때, 다음의 액션들을 수행할 수 있다. 미디어 안내 애플리케이션은 복수의 특성들 중 각각의 특성과 연관된 가중치를 리트리브할 수 있다. 예를 들어, 장르 특성은 부모 지도 등급 특성보다 높은 가중치를 가질 수 있다.
미디어 안내 애플리케이션은 대응하는 가중치를 각각의 특성에 적용하여 최상의 매칭을 결정할 수 있다. 구체적으로, 미디어 안내 애플리케이션은, 각각의 특성에 대한 각자의 가중치를 사용하여, 둘 이상의 사용자들의 각각의 사용자에 대해, 매칭되는 특성들의 양을 계산할 수 있다. 예를 들어, 장르에 대한 가중치는 .75일 수 있는 반면, 부모 지도 등급에 대한 가중치는 .25일 수 있다. 미디어 안내 애플리케이션은 이러한 가중치들을 특성들에 적용함으로써 매칭되는 특성들의 최종 양을 결정할 수 있다.
미디어 안내 애플리케이션은 가장 많은 양의 매칭되는 특성들을 갖는 매칭되는 사용자를 선택할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 가장 많은 개수의 매칭 특성들을 갖는 사용자를 음성 커맨드의 화자로서 식별할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은, 사용자가 식별되었다는 표시를 디스플레이를 위해 생성할 때, 다음의 액션들을 취할 수 있다. 미디어 안내 애플리케이션은, 스토리지로부터, 사용자의 프로파일을 리트리브할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 셋톱 박스 또는 원격 서버로부터 사용자 설정을 리트리브할 수 있다.
미디어 안내 애플리케이션은, 사용자의 프로파일에 기초하여, 사용자가 아바타를 선택했다고 결정할 수 있다. 예를 들어, 사용자의 프로파일은 사용자가 선호하는 아바타의 식별을 포함할 수 있다. 미디어 안내 애플리케이션은 미디어 자산의 일 부분 위에 오버레이되는 아바타를 디스플레이를 위해 생성할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 사용자와 연관된 모든 디바이스들 상에 음성 시그니처를 저장할 수 있다. 예를 들어, 사용자는 (예를 들어, 집의 다수의 방들에 있는) 다수의 셋톱 박스들에 부가하여 전자 태블릿을 가질 수 있다. 미디어 안내 애플리케이션은 추후 사용을 위해 디바이스들 전부에게 음성 시그니처를 전송할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 음성 시그니처로 사용자의 프로파일을 업데이트할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 음성 시그니처 및 미디어 자산의 표시를, 사용자의 음성 프로파일에 저장할 수 있고, 후속 음성 커맨드를 검출할 시에, 후속 음성 커맨드와 연관된 후속 음성 시그니처가 음성 시그니처와 매칭된다고 결정할 수 있다. 미디어 안내 애플리케이션은 후속 음성 커맨드의 내용을 사용자의 음성 프로파일에 저장할 수 있다. 미디어 안내 애플리케이션은 사용자와 연관된 태블릿 및 다른 디바이스들의 메모리는 물론 정보를 새로 취득된 디바이스로 푸시할 수 있는 서버에 정보를 저장할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 세대의 구성원이 아닌 사용자를 식별할 수 있다. 예를 들어, 세대 내의 사용자들의 방문 친척 또는 친구가 미디어 안내 애플리케이션에 의해 실행될 커맨드를 발화하고 있을 수 있다. 미디어 안내 애플리케이션은, 세대의 구성원이 아닌 사용자를 식별하기 위해, 세대 내의 사용자들 전부가 이전에 식별되었는지 여부를 결정할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 세대 내의 각각의 사용자에 대해 반복하여 사용자의 각자의 프로파일을 리트리브할 수 있다. 일부 실시예들에서, 미디어 안내 애플리케이션은 사용자의 프로파일에 액세스할 수 있을 뿐이다. 미디어 안내 애플리케이션은 사용자 프로파일 내의 플래그로부터 사용자가 식별되었는지 여부를 결정할 수 있다. 세대 내의 모든 사용자들이 사용자가 식별되었다는 프로파일 내의 플래그를 갖는 경우, 미디어 안내 애플리케이션은 방문 사용자가 시스템을 사용하고 있다고 결정할 수 있다. 그렇지만, 세대의 모든 사용자들이 식별되지 않은 경우, 미디어 안내 애플리케이션은 그 결정에서 사용 빈도를 사용할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 사용자의 성문을 시스템에 액세스하는 데 사용되는 다른 성문들과 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 시스템에 액세스하는 데 사용된 각각의 성문 및 액세스 빈도를 저장할 수 있다. 커맨드를 발화하고 있는 사용자가 시스템의 빈번한 사용자가 아닌 경우(2회 이하), 미디어 안내 애플리케이션은 사용자가 세대의 구성원이 아니라고(예를 들어, 방문자라고) 결정할 수 있다. 대조적으로, 사용자가 시스템을 자주(예를 들어, 20회 이상) 사용한 경우, 미디어 안내 애플리케이션은 사용자가 세대의 구성원이라고 결정할 수 있다. 미디어 안내 애플리케이션은 액세스 빈도와 함께 타이밍을 또한 사용할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 특정 월에 대한 또는 지난 30일 동안의 액세스 빈도를 결정할 수 있다. 일부 실시예들에서, 미디어 안내 애플리케이션은 사용자의 디바이스에 기초하여 사용자가 손님인지 여부를 결정할 수 있다. 사용자의 디바이스가 세대 네트워크에 자주 접속되지 않은 디바이스인 경우, 사용자는 손님일 수 있다.
일부 실시예들에서, 제어 회로부는 사용자의 음성 입력의 빈도에 기초하여 사용자가 손님인지 또는 세대의 구성원인지를 결정할 수 있다. 예를 들어, 특정 사용자가 세대 내에서 종종 음성 입력 디바이스를 사용하는 경우(예를 들어, 한 달에 10회), 제어 회로부는 사용자가 세대의 구성원이라고 결정할 수 있다. 그렇지만, 입력 빈도가 작은 경우(예를 들어, 지난 달에 1회 또는 2회), 미디어 안내 애플리케이션은 사용자가 세대 내의 손님이라고 결정할 수 있다.
사용자가 세대의 구성원이 아닌 경우, 미디어 안내 애플리케이션은 사용자에 대한 손님 프로파일을 셋업할 수 있다. 일부 실시예들에서, 미디어 안내 애플리케이션은 식별을 위해 사용자의 자격증명들을 입력하라는 사용자에 대한 프롬프트 또는 인구통계 정보를 입력하라는 프롬프트를 디스플레이를 위해 생성할 수 있다. 또 다른 일부 실시예들에서, 미디어 안내 애플리케이션은 방문자를 식별하기 위해 다른 방식들을 사용하려고 시도할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 (위에서 논의된 바와 같이) 인구통계 데이터를 위해 사용자의 음성을 분석할 수 있고 방문자를 식별하기 위해 세대의 구성원들과 연관된 프로파일들(예를 들어, 소셜 미디어 프로파일들)을 사용하려고 시도할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 각각의 사용자와 연관된 소셜 미디어 계정들을 식별하기 위해 세대 내의 각각의 사용자의 프로파일에 대해 반복할 수 있다. 미디어 안내 애플리케이션은, 예를 들어, 각각의 사용자의 소셜 미디어 접속들의 연령 및 성별을 음성 커맨드 인구통계 데이터와 비교함으로써 방문자를 식별하기 위해 각각의 소셜 미디어 계정에 대해 반복할 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 사용자에 대한 완전한 프로파일을 생성하기 위해 인구통계 정보와 함께 음성 커맨드를 사용할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 사용자로부터 커맨드를 수신하고 그 음성 커맨드에 기초하여 사용자를 식별할 수 있다. 구체적으로, 미디어 안내 애플리케이션은 미디어 안내 애플리케이션 내에 저장된 사용자와 연관된 음성 샘플을 음성 커맨드와 비교하여 사용자를 식별할 수 있다. 미디어 안내 애플리케이션은 원격 위치로부터 세대의 사용자들과 연관된 인구통계 정보를 리트리브하고 음성 커맨드로부터 추출되는 인구통계 정보를 수신된 인구통계 정보와 비교할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 인구통계 데이터를 리트리브하고 이를 데이터 구조(120)에 저장할 수 있다. 미디어 안내 애플리케이션은, 비교에 기초하여, 사용자를 식별할 수 있다. 예를 들어, 데이터 구조(120)의 사용자 1은 데이터 구조(100)의 6-16세의 남성에 대응할 수 있다. 미디어 안내 애플리케이션은 사용자의 프로파일을 가능한 한 완전하게 만들기 위해 원격 서버로부터 수신되는 인구통계 정보를 사용자의 프로파일에 복사할 수 있다.
임의의 주어진 콘텐츠 전달 시스템에서 사용자들에 이용가능한 콘텐츠의 양은 상당할 수 있다. 결과적으로, 많은 사용자들은 사용자들이 콘텐츠 셀렉션들(content selections)을 효율적으로 내비게이팅할 수 있게 해주고 사용자들이 원할 수 있는 콘텐츠를 쉽게 식별할 수 있게 해주는 인터페이스를 통한 미디어 안내의 형태를 요망한다. 그러한 안내를 제공하는 애플리케이션은 본 명세서에서 대화형 미디어 안내 애플리케이션 또는, 때때로, 미디어 안내 애플리케이션 또는 안내 애플리케이션이라고 지칭된다.
대화형 미디어 안내 애플리케이션들은 이들이 안내를 제공하는 콘텐츠에 따라 다양한 형태들을 취할 수 있다. 하나의 전형적인 유형의 미디어 안내 애플리케이션은 대화형 텔레비전 프로그램 가이드(interactive television program guide)이다. 대화형 텔레비전 프로그램 가이드들(때때로 전자 프로그램 가이드들이라고 지칭됨)은, 그 중에서도, 사용자들이 많은 유형들의 콘텐츠 또는 미디어 자산들을 내비게이팅하고 위치확인할 수 있게 해주는 잘 알려진 안내 애플리케이션들이다. 대화형 미디어 안내 애플리케이션들은 사용자가 콘텐츠를 내비게이팅하고 위치확인하며 선택할 수 있게 해주는 그래픽 사용자 인터페이스 스크린들을 생성할 수 있다. 본 명세서에서 언급되는 바와 같이, 용어들 "미디어 자산" 및 "콘텐츠"는 텔레비전 프로그래밍은 물론, 페이-퍼-뷰(pay-per-view) 프로그램들, (비디오-온-디맨드(VOD) 시스템들에서와 같은) 온-디맨드 프로그램들, 인터넷 콘텐츠(예를 들어, 스트리밍 콘텐츠, 다운로드가능한 콘텐츠, 웹 캐스트들(Webcasts) 등), 비디오 클립들, 오디오, 콘텐츠 정보, 그림들, 회전 이미지들, 문서들, 플레이리스트들, 웹 사이트들, 기사들, 책들, 전자책들, 블로그들, 채팅 세션들, 소셜 미디어, 애플리케이션들, 게임들, 및/또는 임의의 다른 미디어 또는 멀티미디어 및/또는 이들의 조합과 같은, 전자적으로 소비가능한 사용자 자산을 의미하는 것으로 이해되어야 한다. 안내 애플리케이션들은 또한 사용자들이 콘텐츠를 내비게이팅하고 위치확인할 수 있게 해준다. 본 명세서에서 언급되는 바와 같이, 용어 "멀티미디어"는 위에서 설명된 적어도 2개의 상이한 콘텐츠 형태, 예를 들어, 텍스트, 오디오, 이미지들, 비디오, 또는 상호작용성 콘텐츠 형태들(interactivity content forms)을 이용하는 콘텐츠를 의미하는 것으로 이해되어야 한다. 콘텐츠는 사용자 장비 디바이스들에 의해 녹화, 재생, 디스플레이 또는 액세스될 수 있을 뿐만 아니라, 라이브 공연의 일부일 수도 있다.
본 명세서에서 논의된 실시예들 중 임의의 것을 수행하기 위한 미디어 안내 애플리케이션 및/또는 임의의 명령어들은 컴퓨터 판독가능 매체들 상에 인코딩될 수 있다. 컴퓨터 판독가능 매체들은 데이터를 저장할 수 있는 임의의 매체들을 포함한다. 컴퓨터 판독가능 매체들은, 전기 또는 전자기 신호들을 전파하는 것을 포함하지만 이에 제한되지 않는, 일시적인 것일 수 있거나, 또는 하드 디스크, 플로피 디스크, USB 드라이브, DVD, CD, 미디어 카드들, 레지스터 메모리, 프로세서 캐시들, 랜덤 액세스 메모리("RAM") 등과 같은 휘발성 및 비휘발성 컴퓨터 메모리 또는 저장 디바이스들을 포함하지만, 이에 제한되지 않는, 비일시적인 것일 수 있다.
인터넷, 모바일 컴퓨팅, 및 고속 무선 네트워크들의 출현으로, 전통적으로 그렇지 않았던 사용자들이 사용자 장비 디바이스들 상에서 미디어에 액세스하고 있다. 본 명세서에서 언급되는 바와 같이, 문구 "사용자 장비 디바이스", "사용자 장비", "사용자 디바이스", "전자 디바이스", "전자 장비", "미디어 장비 디바이스", 또는 "미디어 디바이스"는, 텔레비전, 스마트 TV, 셋톱 박스, 위성 텔레비전을 핸들링하기 위한 통합 수신기 디코더(integrated receiver decoder; IRD), 디지털 저장 디바이스, 디지털 미디어 수신기(digital media receiver; DMR), 디지털 미디어 어댑터(digital media adapter; DMA), 스트리밍 미디어 디바이스, DVD 플레이어, DVD 레코더, 커넥티드 DVD(connected DVD), 로컬 미디어 서버, BLU-RAY 플레이어, BLU-RAY 레코더, 개인용 컴퓨터(PC), 랩톱 컴퓨터, 태블릿 컴퓨터, WebTV 박스, 개인용 컴퓨터 텔레비전(PC/TV), PC 미디어 서버, PC 미디어 센터, 핸드헬드 컴퓨터, 고정식 전화(stationary telephone), PDA(personal digital assistant), 모바일 전화, 휴대용 비디오 플레이어 , 휴대용 음악 플레이어, 휴대용 게이밍 머신, 스마트폰, 또는 임의의 다른 텔레비전 장비, 컴퓨팅 장비, 또는 무선 디바이스, 및/또는 이들의 조합과 같은, 위에서 설명된 콘텐츠에 액세스하기 위한 임의의 디바이스를 의미하는 것으로 이해되어야 한다. 일부 실시예들에서, 사용자 장비 디바이스는 전방 스크린(front facing screen) 및 후방 스크린(rear facing screen), 다수의 전면 스크린들(front screens), 또는 다수의 각진 스크린들(angled screens)을 가질 수 있다. 일부 실시예들에서, 사용자 장비 디바이스는 전방 카메라(front facing camera) 및/또는 후방 카메라(rear facing camera)를 가질 수 있다. 이러한 사용자 장비 디바이스들 상에서, 사용자들은 텔레비전을 통해 이용가능한 동일한 콘텐츠를 내비게이팅하고 위치확인할 수 있다. 결과적으로, 미디어 안내는 이러한 디바이스들 상에서도 이용가능할 수 있다. 제공되는 안내는 텔레비전을 통해서만 이용가능한 콘텐츠에 대한 것, 다른 유형들의 사용자 장비 디바이스들 중 하나 이상을 통해서만 이용가능한 콘텐츠에 대한 것, 또는 텔레비전 및 다른 유형들의 사용자 장비 디바이스들 중 하나 이상 둘 다를 통해 이용가능한 콘텐츠에 대한 것일 수 있다. 미디어 안내 애플리케이션들은 온라인 애플리케이션들(즉, 웹 사이트 상에서 제공됨)로서, 또는 사용자 장비 디바이스들 상의 독립형 애플리케이션들 또는 클라이언트들로서 제공될 수 있다. 미디어 안내 애플리케이션들을 구현할 수 있는 다양한 디바이스들 및 플랫폼들은 아래에서 더 상세히 설명된다.
미디어 안내 애플리케이션의 기능들 중 하나는 미디어 안내 데이터를 사용자들에게 제공하는 것이다. 본 명세서에서 언급되는 바와 같이, 문구 "미디어 안내 데이터" 또는 "안내 데이터"는 콘텐츠에 관련된 임의의 데이터 또는 안내 애플리케이션을 동작시키는 데 사용되는 데이터를 의미하는 것으로 이해되어야 한다. 예를 들어, 안내 데이터는 프로그램 정보, 안내 애플리케이션 설정, 사용자 선호도들, 사용자 프로파일 정보, 미디어 리스팅들, 미디어 관련 정보(예를 들어, 방송 시간들, 방송 채널들, 제목들, 설명들, 등급 정보(예를 들어, 부모 통제 등급(parental control ratings), 비평가의 등급(critic's ratings) 등), 장르 또는 카테고리 정보, 배우 정보, 방송사들의 또는 제공자들의 로고들에 대한 로고 데이터 등), 미디어 포맷(예를 들어, 표준 화질(standard definition), 고화질(high definition), 3D 등), 온-디맨드 정보, 블로그들, 웹 사이트들, 및 사용자가 원하는 콘텐츠 셀렉션들을 내비게이팅하고 위치확인하는 데 도움이 되는 임의의 다른 유형의 안내 데이터를 포함할 수 있다.
도 2 및 도 3은 미디어 안내 데이터를 제공하는 데 사용될 수 있는 예시적인 디스플레이 스크린들을 도시한다. 도 2 및 도 3에 도시된 디스플레이 스크린들은 임의의 적당한 사용자 장비 디바이스 또는 플랫폼 상에 구현될 수 있다. 도 2 및 도 3의 디스플레이들이 전체 스크린 디스플레이들(full screen displays)로 예시되어 있지만, 그것들은 또한 디스플레이되고 있는 콘텐츠 위에 전체적으로 또는 부분적으로 오버레이될 수 있다. 사용자는 디스플레이 스크린에서 제공되는 선택가능한 옵션(예를 들어, 메뉴 옵션, 리스팅들 옵션, 아이콘, 하이퍼링크 등)을 선택하는 것 또는 리모컨 또는 다른 사용자 입력 인터페이스 또는 디바이스 상의 전용 버튼(예를 들어, GUIDE 버튼)을 누르는 것에 의해 콘텐츠 정보에 액세스하고자 하는 바램을 표시할 수 있다. 사용자의 표시에 응답하여, 미디어 안내 애플리케이션은, 그리드에서 시간 및 채널별로, 시간별로, 채널별로, 소스별로, 콘텐츠 유형별로, 카테고리(예를 들어, 영화, 스포츠, 뉴스, 어린이, 또는 다른 프로그래밍 카테고리들)별로, 또는 다른 미리 정의된, 사용자 정의된(user-defined), 또는 다른 구성 기준들과 같은, 몇몇 방식들 중 하나로 구성된 미디어 안내 데이터를 디스플레이 스크린에 제공할 수 있다.
도 3은 단일 디스플레이에서 상이한 유형의 콘텐츠에 대한 액세스를 또한 가능하게 해주는 시간 및 채널별로 배열된 프로그램 리스팅들 디스플레이(200)의 예시적인 그리드를 도시하고 있다. 디스플레이(200)는: (1) 채널/콘텐츠 유형 식별자들의 열(column)(204) - (열 내의 셀인) 각각의 채널/콘텐츠 유형 식별자는 이용가능한 상이한 채널 또는 콘텐츠 유형을 식별해줌 - ; 및 (2) 시간 식별자들(206)의 행(row) - (행 내의 셀인) 각각의 시간 식별자는 프로그래밍의 시간 블록을 식별해줌 - 을 갖는 그리드(202)를 포함할 수 있다. 그리드(202)는, 프로그램 리스팅(208)과 같은, 프로그램 리스팅들의 셀들을 또한 포함하며, 여기서 각각의 리스팅은 리스팅들의 연관된 채널 및 시간에서 제공되는 프로그램의 제목을 제공한다. 사용자 입력 디바이스를 사용하여, 사용자는 하이라이트 영역(210)을 이동시키는 것에 의해 프로그램 리스팅들을 선택할 수 있다. 하이라이트 영역(210)에 의해 선택되는 프로그램 리스팅에 관한 정보는 프로그램 정보 영역(212)에서 제공될 수 있다. 영역(212)은, 예를 들어, 프로그램 제목, 프로그램 설명, 프로그램이 제공되는 시간(해당되는 경우), 프로그램이 방송 중인 채널(해당되는 경우), 프로그램의 등급, 및 다른 원하는 정보를 포함할 수 있다.
선형 프로그래밍(linear programming)(예를 들어, 미리 결정된 시간에 복수의 사용자 장비 디바이스들에 전송되도록 스케줄링되고 스케줄에 따라 제공되는 콘텐츠)에 대한 액세스를 제공하는 것에 부가하여, 미디어 안내 애플리케이션은 비-선형 프로그래밍(non-linear programming)(예를 들어, 언제든지 사용자 장비 디바이스에 의해 액세스가능하고 스케줄에 따라 제공되지 않는 콘텐츠)에 대한 액세스를 또한 제공한다. 비-선형 프로그래밍은 온-디맨드 콘텐츠(예를 들어, VOD), 인터넷 콘텐츠(예를 들어, 스트리밍 미디어, 다운로드가능한 미디어 등), 로컬로 저장된 콘텐츠(예를 들어, 위에서 설명된 임의의 사용자 장비 디바이스 또는 다른 저장 디바이스 상에 저장된 콘텐츠), 또는 다른 시간-독립적인 콘텐츠를 포함한, 상이한 콘텐츠 소스들로부터의 콘텐츠를 포함할 수 있다. 온-디맨드 콘텐츠는 특정의 콘텐츠 제공자(예를 들어, "The Sopranos" 및 "Curb Your Enthusiasm"을 제공하는 HBO On Demand)에 의해 제공되는 영화 또는 임의의 다른 콘텐츠를 포함할 수 있다. HBO ON DEMAND는 Time Warner Company L.P. 등이 소유한 서비스 마크이며, THE SOPRANOS 및 CURB YOUR ENTHUSIASM은 Home Box Office, Inc.가 소유한 상표들이다. 인터넷 콘텐츠는, 채팅 세션 또는 웹 캐스트와 같은, 웹 이벤트들, 또는 인터넷 웹 사이트 또는 다른 인터넷 액세스(예를 들어, FTP)를 통해 스트리밍 콘텐츠 또는 다운로드가능한 콘텐츠로서 온-디맨드로 이용가능한 콘텐츠를 포함할 수 있다.
그리드(202)는 온-디맨드 리스팅(214), 녹화된 콘텐츠 리스팅(216), 및 인터넷 콘텐츠 리스팅(218)을 포함하는 비-선형 프로그래밍에 대한 미디어 안내 데이터를 제공할 수 있다. 상이한 유형들의 콘텐츠 소스들로부터의 콘텐츠에 대한 미디어 안내 데이터를 결합시키는 디스플레이는 때때로 "혼합 미디어(mixed-media)" 디스플레이라고 지칭된다. 디스플레이(200)와 상이한 디스플레이될 수 있는 미디어 안내 데이터의 유형들의 다양한 대체들(permutations)은 사용자 선택 또는 안내 애플리케이션 정의(예컨대, 레코딩된 및 방송 리스팅들만, 온-디맨드 및 방송 리스팅들만 등의 디스플레이)에 기초할 수 있다. 예시된 바와 같이, 리스팅들(214, 216, 및 218)은 이 리스팅들의 선택이 온-디맨드 리스팅들, 레코딩된 리스팅들, 또는 인터넷 리스팅들에, 제각기, 전용된 디스플레이에 대한 액세스를 제공할 수 있음을 나타내기 위해 그리드(202)에 디스플레이된 시간 블록 전체에 걸쳐있는 것으로 도시되어 있다. 일부 실시예들에서, 이러한 콘텐츠 유형들에 대한 리스팅들은 그리드(202)에 직접 포함될 수 있다. 부가의 미디어 안내 데이터는 사용자가 네비게이션 아이콘들(navigational icons)(220) 중 하나를 선택하는 것에 응답하여 디스플레이될 수 있다. (사용자 입력 디바이스 상의 화살표 키를 누르는 것은 네비게이션 아이콘들(220)을 선택하는 것과 유사한 방식으로 디스플레이에 영향을 줄 수 있다.)
디스플레이(200)는 비디오 영역(222), 및 옵션들 영역(226)을 또한 포함할 수 있다. 비디오 영역(222)은 사용자에게 현재 이용가능한, 이용가능할, 또는 이용가능했던 프로그램들을 사용자가 보는 것 및/또는 미리보기하는 것을 가능하게 해줄 수 있다. 비디오 영역(222)의 콘텐츠는 그리드(202)에 디스플레이된 리스팅들 중 하나에 대응하거나 또는 그와 독립적일 수 있다. 비디오 영역을 포함하는 그리드 디스플레이들은 때때로 픽처-인-가이드(picture-in-guide; PIG) 디스플레이들이라고 지칭된다. PIG 디스플레이들 및 이들의 기능성들은 2003년 5월 13일자로 발행된 Satterfield 등의 미국 특허 제6,564,378호 및 2001년 5월 29일자로 발행된 Yuen 등의 미국 특허 제6,239,794호에 설명되어 있으며, 이 미국 특허들은 이로써 그 전체가 참조에 의해 본 명세서에 포함된다. PIG 디스플레이들은 본 명세서에 설명된 실시예들의 다른 미디어 안내 애플리케이션 디스플레이 스크린들에 포함될 수 있다.
옵션들 영역(226)은 사용자가 상이한 유형의 콘텐츠, 미디어 안내 애플리케이션 디스플레이들, 및/또는 미디어 안내 애플리케이션 특징들에 액세스할 수 있게 해줄 수 있다. 옵션들 영역(226)은 디스플레이(200)(및 본 명세서에서 설명된 다른 디스플레이 스크린들)의 일부일 수 있거나, 또는 온-스크린 옵션을 선택하는 것 또는 사용자 입력 디바이스 상의 전용 또는 할당가능 버튼을 누르는 것에 의해 사용자에 의해 호출(invoke)될 수 있다. 옵션들 영역(226) 내의 선택가능 옵션들은 그리드(202)에서의 프로그램 리스팅들에 관련된 특징들에 관한 것일 수 있거나, 메인 메뉴 디스플레이로부터 이용가능한 옵션들을 포함할 수 있다. 프로그램 리스팅들에 관련된 특징들은 프로그램을 수신하는 다른 방송 시간들 또는 방식들을 탐색하는 것, 프로그램을 녹화하는 것, 프로그램의 시리즈 녹화를 인에이블시키는 것, 프로그램 및/또는 채널을 즐겨찾기(favorite)로서 설정하는 것, 프로그램을 구매하는 것, 또는 다른 특징들을 포함할 수 있다. 메인 메뉴 디스플레이로부터 이용가능한 옵션들은 탐색 옵션들, VOD 옵션들, 부모 통제 옵션들, 인터넷 옵션들, 클라우드 기반 옵션들, 디바이스 동기화 옵션들, 제2 스크린 디바이스 옵션들, 다양한 유형들의 미디어 안내 데이터 디스플레이들에 액세스하는 옵션들, 프리미엄 서비스에 가입하는 옵션들, 사용자의 프로파일을 편집하는 옵션들, 브라우즈 오버레이에 액세스하는 옵션들, 또는 다른 옵션들을 포함할 수 있다.
미디어 안내 애플리케이션은 사용자의 선호도들에 기초하여 개인화될 수 있다. 개인화된 미디어 안내 애플리케이션은 미디어 안내 애플리케이션을 사용하여 개인화된 "경험"을 생성하기 위해 사용자가 디스플레이들 및 특징들을 커스터마이즈할 수 있게 해준다. 이러한 개인화된 경험은 사용자가 이러한 커스터마이제이션들(customizations)을 입력할 수 있게 해주는 것에 의해 그리고/또는 미디어 안내 애플리케이션이 사용자 활동을 모니터링하여 다양한 사용자 선호도들을 결정하는 것에 의해 생성될 수 있다. 사용자들은 안내 애플리케이션에 로그인하는 것 또는 안내 애플리케이션에게 다른 방식으로 신원을 밝히는 것에 의해 자신의 개인화된 안내 애플리케이션에 액세스할 수 있다. 미디어 안내 애플리케이션의 커스터마이제이션은 사용자 프로파일에 따라 이루어질 수 있다. 커스터마이제이션들은 다양한 제시 스킴들(예를 들어, 디스플레이들의 컬러 스킴, 텍스트의 글꼴 크기 등), 디스플레이된 콘텐츠 리스팅들의 양태들(예를 들어, HDTV만 또는 3D 프로그래밍만, 즐겨찾기 채널 셀렉션들(channel selections)에 기초한 사용자 지정 방송 채널들, 채널들의 디스플레이의 재정렬(re-ordering), 추천된 콘텐츠 등), 원하는 녹화 특징들(예를 들어, 특정의 사용자들에 대한 녹화 또는 시리즈 녹화들, 녹화 품질 등), 부모 통제 설정, 인터넷 콘텐츠의 커스터마이즈된 제시(예를 들어, 소셜 미디어 콘텐츠, 이메일, 전자적으로 전달된 기사들 등의 제시) 및 다른 원하는 커스터마이제이션들을 포함할 수 있다.
미디어 안내 애플리케이션은 사용자가 사용자 프로파일 정보를 제공할 수 있게 해줄 수 있거나 또는 사용자 프로파일 정보를 자동으로 수집(compile)할 수 있다. 미디어 안내 애플리케이션은, 예를 들어, 사용자가 액세스하는 콘텐츠 및/또는 사용자가 안내 애플리케이션과 가질 수 있는 다른 상호작용들을 모니터링할 수 있다. 부가적으로, 미디어 안내 애플리케이션은 (예를 들어, www.Tivo.com과 같은, 사용자가 액세스하는 인터넷 상의 다른 웹 사이트들로부터, 사용자가 액세스하는 다른 미디어 안내 애플리케이션들로부터, 사용자가 액세스하는 다른 대화형 애플리케이션들로부터, 사용자의 다른 사용자 장비 디바이스로부터 등) 특정의 사용자에 관련되는 다른 사용자 프로파일들의 전부 또는 일부를 획득할 수 있고, 그리고/또는 미디어 안내 애플리케이션이 액세스할 수 있는 다른 소스들로부터 사용자에 관한 정보를 획득할 수 있다. 그 결과, 사용자는 사용자의 상이한 사용자 장비 디바이스들에 걸쳐 통일된 안내 애플리케이션 경험을 제공받을 수 있다. 이러한 유형의 사용자 경험은 도 5와 관련하여 아래에서 보다 상세히 설명된다. 부가의 개인화된 미디어 안내 애플리케이션 특징들은 2005년 7월 11일자로 출원된 Ellis 등의 미국 특허 출원 공개 제2005/0251827호, 2007년 1월 16일자로 발행된 Boyer 등의 미국 특허 제7,165,098호, 및 2002년 2월 21일자로 출원된 Ellis 등의 미국 특허 출원 공개 제2002/0174430호에 더 상세히 설명되어 있으며, 이들은 이로써 그 전체가 참조에 의해 본 명세서에 포함된다.
미디어 안내를 제공하기 위한 다른 디스플레이 배열이 도 3에 도시되어 있다. 비디오 모자이크 디스플레이(300)는 콘텐츠 유형, 장르, 및/또는 다른 구성 기준들에 기초하여 구성되는 콘텐츠 정보에 대한 선택가능 옵션들(302)을 포함한다. 디스플레이(300)에서, 텔레비전 리스팅들 옵션(304)이 선택되고, 따라서 방송 프로그램 리스팅들로서 리스팅들(306, 308, 310, 및 312)을 제공한다. 디스플레이(300)에서, 리스팅들은 커버 아트, 콘텐츠로부터의 스틸 이미지들, 비디오 클립 미리보기들, 콘텐츠로부터의 라이브 비디오, 또는 리스팅에서의 미디어 안내 데이터에 의해 설명되는 콘텐츠를 사용자에게 나타내는 다른 유형의 콘텐츠를 포함하는 그래픽 이미지들을 제공할 수 있다. 그래픽 리스팅들 각각은 또한 리스팅과 연관된 콘텐츠에 관한 추가 정보를 제공하기 위해 텍스트를 동반할 수 있다. 예를 들어, 리스팅(308)은 미디어 부분(314) 및 텍스트 부분(316)을 포함한, 하나 초과의 부분을 포함할 수 있다. 콘텐츠를 전체 스크린으로 보기 위해 또는 미디어 부분(314)에 디스플레이된 콘텐츠에 관련된 정보를 보기 위해(예를 들어, 비디오가 디스플레이되는 채널에 대한 리스팅들을 보기 위해) 미디어 부분(314) 및/또는 텍스트 부분(316)이 선택가능할 수 있다.
디스플레이(300)에서의 리스팅들이 상이한 크기들을 갖지만(즉, 리스팅(306)은 리스팅들(308, 310, 및 312)보다 더 큼), 원하는 경우, 모든 리스팅들이 동일한 크기일 수 있다. 관심의 정도들을 사용자에게 표시하기 위해 또는 특정 콘텐츠를 강조하기 위해, 콘텐츠 제공자가 원하는 대로 또는 사용자 선호도들에 기초하여, 리스팅들이 상이한 크기들을 가질 수 있거나 또는 그래픽적으로 강조될 수 있다. 콘텐츠 리스팅들을 그래픽적으로 강조하기 위한 다양한 시스템들 및 방법들은, 예를 들어, 2009년 11월 12일자로 출원된 Yates의 미국 특허 출원 공개 제2010/0153885호에서 논의되며, 이 미국 출원은 이로써 그 전체가 참조에 의해 본 명세서에 포함된다.
사용자들은 자신의 사용자 장비 디바이스들 중 하나 이상으로부터 콘텐츠 및 미디어 안내 애플리케이션(및 위에서 그리고 아래에서 설명된 그것의 디스플레이 스크린들)에 액세스할 수 있다. 도 4는 예시적인 사용자 장비 디바이스(400)의 일반화된 실시예를 도시하고 있다. 사용자 장비 디바이스들의 보다 구체적인 구현들은 도 5와 관련하여 아래에서 논의된다. 사용자 장비 디바이스(400)는 입/출력(이하, "I/O") 경로(402)를 통해 콘텐츠 및 데이터를 수신할 수 있다. I/O 경로(402)는 콘텐츠(예를 들어, 방송 프로그래밍, 온-디맨드 프로그래밍, 인터넷 콘텐츠, LAN(local area network) 또는 WAN(wide area network)을 통해 이용가능한 콘텐츠, 및/또는 다른 콘텐츠) 및 데이터를, 프로세싱 회로부(406) 및 스토리지(408)를 포함하는, 제어 회로부(404)에 제공할 수 있다. 제어 회로부(404)는 I/O 경로(402)를 사용하여 커맨드들, 요청들, 및 다른 적합한 데이터를 송신 및 수신하는 데 사용될 수 있다. I/O 경로(402)는 제어 회로부(404)(및 구체적으로는 프로세싱 회로부(406))를 하나 이상의 통신 경로(아래에서 설명됨)에 접속시킬 수 있다. I/O 기능들은 이러한 통신 경로들 중 하나 이상에 의해 제공될 수 있지만, 도면을 과도하게 복잡하게 하는 것을 피하기 위해 도 4에 단일 경로로서 도시되어 있다.
제어 회로부(404)는 프로세싱 회로부(406)와 같은 임의의 적합한 프로세싱 회로부에 기초할 수 있다. 본 명세서에서 언급되는 바와 같이, 프로세싱 회로부는 하나 이상의 마이크로프로세서, 마이크로컨트롤러, 디지털 신호 프로세서, 프로그래밍가능 로직 디바이스, FPGA(field-programmable gate array), ASIC(application-specific integrated circuit) 등에 기초한 회로부를 의미하는 것으로 이해되어야 하며, 다중 코어 프로세서(예를 들어, 듀얼 코어, 쿼드 코어, 헥사 코어, 또는 임의의 적합한 개수의 코어들) 또는 수퍼컴퓨터를 포함할 수 있다. 일부 실시예들에서, 프로세싱 회로부는 다수의 개별 프로세서들 또는 프로세싱 유닛들, 예를 들어, 다수의 동일한 유형의 프로세싱 유닛들(예를 들어, 2개의 Intel Core i7 프로세서) 또는 다수의 상이한 프로세서들(예를 들어, Intel Core i5 프로세서와 Intel Core i7 프로세서)에 걸쳐 분산될 수 있다. 일부 실시예들에서, 제어 회로부(404)는 메모리(즉, 스토리지(408))에 저장된 미디어 안내 애플리케이션에 대한 명령어들을 실행한다. 구체적으로는, 제어 회로부(404)는 위에서 그리고 아래에서 논의된 기능들을 수행하도록 미디어 안내 애플리케이션에 의해 지시받을 수 있다. 예를 들어, 미디어 안내 애플리케이션은 미디어 안내 디스플레이들을 생성하라는 지시들을 제어 회로부(404)에 제공할 수 있다. 일부 구현예들에서, 제어 회로부(404)에 의해 수행되는 임의의 액션은 미디어 안내 애플리케이션으로부터 수신된 지시들에 기초할 수 있다.
클라이언트-서버 기반 실시예들에서, 제어 회로부(404)는 안내 애플리케이션 서버 또는 다른 네트워크들 또는 서버들과 통신하기에 적합한 통신 회로부를 포함할 수 있다. 위에서 언급된 기능성을 수행하기 위한 명령어들은 안내 애플리케이션 서버 상에 저장될 수 있다. 통신 회로부는 케이블 모뎀, ISDN(integrated services digital network) 모뎀, DSL(digital subscriber line) 모뎀, 전화 모뎀, 이더넷 카드, 또는 다른 장비와의 통신을 위한 무선 모뎀, 또는 임의의 다른 적합한 통신 회로부를 포함할 수 있다. 그러한 통신은 (도 5와 관련하여 더 상세히 설명되는) 인터넷 또는 임의의 다른 적합한 통신 네트워크들 또는 경로들을 수반할 수 있다. 그에 부가하여, 통신 회로부는 사용자 장비 디바이스들의 피어-투-피어 통신, 또는 서로 떨어져 있는 위치들에 있는 사용자 장비 디바이스들의 통신을 가능하게 해주는 회로부를 포함할 수 있다(아래에서 더 상세히 설명됨).
메모리는 제어 회로부(404)의 일부인 스토리지(408)로서 제공되는 전자 저장 디바이스일 수 있다. 본 명세서에서 언급되는 바와 같이, 문구 "전자 저장 디바이스" 또는 "저장 디바이스"는, 랜덤 액세스 메모리, 판독 전용 메모리, 하드 드라이브들, 광학 드라이브들, DVD(digital video disc) 레코더들, CD(compact disc) 레코더들, BD(BLU-RAY disc) 레코더들, BLU-RAY 3D 디스크 레코더들, 디지털 비디오 레코더들(DVR, 때때로 개인용 비디오 레코더(personal video recorder) 또는 PVR라고 불림), 솔리드 스테이트 디바이스들, 양자 저장 디바이스들(quantum storage devices), 게이밍 콘솔들, 게이밍 매체들, 또는 임의의 다른 적합한 고정식 또는 이동식 저장 디바이스들, 및/또는 이들의 임의의 조합과 같은, 전자 데이터, 컴퓨터 소프트웨어, 또는 펌웨어를 저장하기 위한 임의의 디바이스를 의미하는 것으로 이해되어야 한다. 스토리지(408)는 본 명세서에 설명된 다양한 유형의 콘텐츠는 물론 위에서 설명된 미디어 안내 데이터를 저장하는 데 사용될 수 있다. 비휘발성 메모리가 (예를 들어, 부트-업 루틴(boot-up routine) 및 다른 명령어들을 론칭하기 위해) 또한 사용될 수 있다. 도 5와 관련하여 설명된, 클라우드 기반 스토리지는 스토리지(408)를 보충하기 위해 또는 스토리지(408) 대신에 사용될 수 있다.
제어 회로부(404)는 비디오 생성 회로부 및, 하나 이상의 아날로그 튜너와 같은, 튜닝 회로부, 하나 이상의 MPEG-2 디코더 또는 다른 디지털 디코딩 회로부, 고화질 튜너들, 또는 임의의 다른 적합한 튜닝 또는 비디오 회로들 또는 그러한 회로들의 조합들을 포함할 수 있다. (예를 들어, 오버-디-에어(over-the-air), 아날로그, 또는 디지털 신호들을 저장을 위해 MPEG 신호들로 변환하기 위한) 인코딩 회로부가 또한 제공될 수 있다. 제어 회로부(404)는 콘텐츠를 사용자 장비(400)의 선호된 출력 포맷으로 업컨버팅(upconverting) 및 다운컨버팅(downconverting)하기 위한 스케일러 회로부(scaler circuitry)를 또한 포함할 수 있다. 회로부(404)는 디지털 신호들과 아날로그 신호들 사이에서 변환하기 위한 디지털-아날로그 변환기 회로부 및 아날로그-디지털 변환기 회로부를 또한 포함할 수 있다. 튜닝 및 인코딩 회로부는 콘텐츠를 수신하여 디스플레이하기 위해, 재생하기 위해, 또는 녹화하기 위해 사용자 장비 디바이스에 의해 사용될 수 있다. 튜닝 및 인코딩 회로부는 안내 데이터를 수신하는 데 또한 사용될 수 있다. 예를 들어, 튜닝, 비디오 생성, 인코딩, 디코딩, 암호화, 복호화, 스케일러, 및 아날로그/디지털 회로부를 포함한, 본 명세서에 설명된 회로부는 하나 이상의 범용 또는 특수 프로세서 상에서 실행되는 소프트웨어를 사용하여 구현될 수 있다. 동시 튜닝 기능들(예를 들어, 시청 및 녹화 기능들, PIP(picture-in-picture) 기능들, 다중 튜너 녹화 등)을 핸들링하기 위해 다수의 튜너들이 제공될 수 있다. 스토리지(408)가 사용자 장비(400)와 별개의 디바이스로서 제공되는 경우, (다수의 튜너들을 포함하는) 튜닝 및 인코딩 회로부는 스토리지(408)와 연관될 수 있다.
사용자는 사용자 입력 인터페이스(410)를 사용하여 제어 회로부(404)에 지시들을 송신할 수 있다. 사용자 입력 인터페이스(410)는, 리모콘, 마우스, 트랙볼, 키패드, 키보드, 터치 스크린, 터치패드, 스타일러스 입력, 조이스틱, 음성 인식 인터페이스, 또는 다른 사용자 입력 인터페이스들과 같은, 임의의 적합한 사용자 인터페이스일 수 있다. 디스플레이(412)는 독립형 디바이스로서 제공될 수 있거나 사용자 장비 디바이스(400)의 다른 요소들과 통합될 수 있다. 예를 들어, 디스플레이(412)는 터치스크린 또는 터치 감응 디스플레이일 수 있다. 그러한 상황들에서, 사용자 입력 인터페이스(410)는 디스플레이(412)와 통합되거나 디스플레이(512)와 결합될 수 있다. 디스플레이(412)는 모니터, 텔레비전, 모바일 디바이스용 LCD(liquid crystal display), 비정질 실리콘 디스플레이, 저온 폴리 실리콘 디스플레이, 전자 잉크 디스플레이, 전기 영동 디스플레이, 액티브 매트릭스 디스플레이, 전기 습윤 디스플레이(electro-wetting display), 전기 유체 디스플레이(electrofluidic display), 음극선관 디스플레이, 발광 다이오드 디스플레이, 전자 발광 디스플레이, 플라스마 디스플레이 패널, 고성능 어드레싱 디스플레이(high-performance addressing display), 박막 트랜지스터 디스플레이, 유기 발광 다이오드 디스플레이, 표면 전도 전자 방출 디스플레이(surface-conduction electron-emitter display)(SED), 레이저 텔레비전, 탄소 나노튜브들, 양자점 디스플레이, 간섭계 변조기 디스플레이(interferometric modulator display), 또는 시각적 이미지들을 디스플레이하기 위한 임의의 다른 적당한 장비 중 하나 이상일 수 있다. 일부 실시예들에서, 디스플레이(412)는 HDTV 가능(HDTV-capable)일 수 있다. 일부 실시예들에서, 디스플레이(412)는 3D 디스플레이일 수 있고, 대화형 미디어 안내 애플리케이션 및 임의의 적합한 콘텐츠가 3D로 디스플레이될 수 있다. 비디오 카드 또는 그래픽 카드는 디스플레이(412)로의 출력을 생성할 수 있다. 비디오 카드는 3D 장면들 및 2D 그래픽들의 가속 렌더링, MPEG-2/MPEG-4 디코딩, TV 출력, 또는 다수의 모니터들을 접속시키는 능력과 같은 다양한 기능들을 제공할 수 있다. 비디오 카드는 제어 회로부(404)와 관련하여 위에서 설명된 임의의 프로세싱 회로부일 수 있다. 비디오 카드는 제어 회로부(404)와 통합될 수 있다. 스피커들(414)은 사용자 장비 디바이스(400)의 다른 요소들과 통합되는 것으로 제공될 수 있거나 또는 독립형 유닛들일 수 있다. 디스플레이(412) 상에 디스플레이되는 비디오들 및 다른 콘텐츠의 오디오 컴포넌트는 스피커들(414)을 통해 재생될 수 있다. 일부 실시예들에서, 오디오는, 오디오를 프로세싱하여 스피커들(414)을 통해 출력하는, 수신기(도시되지 않음)에 배포될 수 있다.
안내 애플리케이션은 임의의 적합한 아키텍처를 사용하여 구현될 수 있다. 예를 들어, 이는 사용자 장비 디바이스(400) 상에 전체적으로 구현된 독립형 애플리케이션일 수 있다. 그러한 접근법에서, 애플리케이션의 명령어들은 로컬적으로(예컨대, 스토리지(408))에 저장되고, 애플리케이션에 의한 사용을 위한 데이터는(예컨대, 대역외 피드(out-of-band feed)로부터, 인터넷 자원으로부터, 또는 다른 적합한 접근법을 사용하여) 주기적으로 다운로드된다. 제어 회로부(404)는 애플리케이션의 명령어들을 스토리지(408)로부터 리트리브하고 본 명세서에서 논의된 디스플레이들 중 임의의 것을 생성하기 위해 명령어들을 프로세싱할 수 있다. 프로세싱된 명령어들에 기초하여, 제어 회로부(404)는 입력이 입력 인터페이스(410)로부터 수신될 때 어떤 액션을 수행할지를 결정할 수 있다. 예를 들어, 입력 인터페이스(410)가 위/아래(up/down) 버튼이 선택되었음을 표시할 때 디스플레이 상의 커서의 위/아래로의 이동이 프로세싱된 명령어들에 의해 표시될 수 있다.
일부 실시예들에서, 미디어 안내 애플리케이션은 클라이언트-서버 기반 애플리케이션이다. 사용자 장비 디바이스(400) 상에 구현된 씩(thick) 또는 씬(thin) 클라이언트에 의해 사용하기 위한 데이터는 사용자 장비 디바이스(400)에 원격인 서버에 요청들을 발행함으로써 온-디맨드로 리트리브된다. 클라이언트-서버 기반 안내 애플리케이션의 일 예에서, 제어 회로부(404)는 원격 서버에 의해 제공되는 웹 페이지들을 해석하는 웹 브라우저를 실행한다. 예를 들어, 원격 서버는 애플리케이션에 대한 명령어들을 저장 디바이스에 저장할 수 있다. 원격 서버는 저장된 명령어들을 회로부(예컨대, 제어 회로부(404))를 사용하여 프로세싱하고 위에서 그리고 아래에서 논의된 디스플레이들을 생성할 수 있다. 클라이언트 디바이스는 원격 서버에 의해 생성되는 디스플레이들을 수신할 수 있고, 디스플레이들의 콘텐츠를 장비 디바이스(400) 상에서 로컬로 디스플레이할 수 있다. 이러한 방식으로, 명령어들의 프로세싱은 서버에 의해 원격적으로 수행되는 반면, 결과적인 디스플레이들은 장비 디바이스(400) 상에서 로컬로 제공된다. 장비 디바이스(400)는 입력 인터페이스(410)를 통해 사용자로부터 입력들을 수신하고 대응하는 디스플레이들을 프로세싱하고 생성하기 위해 그 입력들을 원격 서버에 전송할 수 있다. 예를 들어, 장비 디바이스(400)는 입력 인터페이스(410)를 통해 위/아래 버튼이 선택되었음을 나타내는 통신을 원격 서버에 전송할 수 있다. 원격 서버는 그 입력에 따라 명령어들을 프로세싱하고 입력에 대응하는 애플리케이션의 디스플레이(예를 들어, 커서를 위/아래로 이동시키는 디스플레이)를 생성할 수 있다. 생성된 디스플레이는 이어서 사용자에게 제시하기 위해 장비 디바이스(400)에 전송된다.
일부 실시예들에서, 미디어 안내 애플리케이션은 (제어 회로부(404)에 의해 실행되는) 인터프리터(interpreter) 또는 가상 머신에 의해 다운로드되어 인터프리트되거나 또는 다른 방식으로 실행된다. 일부 실시예들에서, 안내 애플리케이션은 EBIF(ETV Binary Interchange Format)로 인코딩되고, 적합한 피드의 일부로서 제어 회로부(404)에 의해 수신되며, 제어 회로부(404) 상에서 실행되는 사용자 에이전트에 의해 해석될 수 있다. 예를 들어, 안내 애플리케이션은 EBIF 애플리케이션일 수 있다. 일부 실시예들에서, 안내 애플리케이션은 제어 회로부(404)에 의해 실행되는 로컬 가상 머신 또는 다른 적합한 미들웨어에 의해 수신되고 실행되는 일련의 자바 기반 파일들에 의해 정의될 수 있다. 그러한 실시예들 중 일부(예를 들어, MPEG-2 또는 다른 디지털 미디어 인코딩 스킴들을 이용하는 것들)에서, 안내 애플리케이션은, 예를 들어, 프로그램의 MPEG 오디오 및 비디오 패킷들과 함께 MPEG-2 객체 캐로셀(MPEG-2 object carousel)에 인코딩되어 전송될 수 있다.
도 4의 사용자 장비 디바이스(400)는 도 5의 시스템(500)에서 사용자 텔레비전 장비(502), 사용자 컴퓨터 장비(504), 무선 사용자 통신 디바이스(506), 또는 비-휴대용 게이밍 머신과 같은, 콘텐츠에 액세스하기에 적합한 임의의 다른 유형의 사용자 장비로서 구현될 수 있다. 간략함을 위해, 이러한 디바이스들은 본 명세서에서 집합적으로 사용자 장비 또는 사용자 장비 디바이스들이라고 지칭될 수 있으며, 위에서 설명된 사용자 장비 디바이스들과 실질적으로 유사할 수 있다. 미디어 안내 애플리케이션이 구현될 수 있는 사용자 장비 디바이스들은 독립형 디바이스로서 기능할 수 있거나 또는 디바이스들의 네트워크의 일부일 수 있다. 디바이스들의 다양한 네트워크 구성들이 구현될 수 있으며, 아래에서 더 상세히 논의된다.
도 4와 관련하여 위에서 설명된 시스템 특징들 중 적어도 일부를 이용하는 사용자 장비 디바이스는 사용자 텔레비전 장비(502), 사용자 컴퓨터 장비(504), 또는 무선 사용자 통신 디바이스(506)로만 분류되지 않을 수 있다. 예를 들어, 사용자 텔레비전 장비(502)는, 일부 사용자 컴퓨터 장비(504)와 같이, 인터넷 콘텐츠에 대한 액세스를 가능하게 해주는 인터넷 가능(Internet-enabled)일 수 있는 반면, 사용자 컴퓨터 장비(504)는, 일부 텔레비전 장비(502)와 같이, 텔레비전 프로그래밍에 대한 액세스를 가능하게 해주는 튜너를 포함할 수 있다. 미디어 안내 애플리케이션은 다양한 상이한 유형들의 사용자 장비 상에서 동일한 레이아웃을 가질 수 있거나 또는 사용자 장비의 디스플레이 능력에 맞춤화될 수 있다. 예를 들어, 사용자 컴퓨터 장비(504) 상에서, 안내 애플리케이션은 웹 브라우저에 의해 액세스되는 웹 사이트로서 제공될 수 있다. 다른 예에서, 안내 애플리케이션은 무선 사용자 통신 디바이스들(506)에 대해 스케일링 다운될(scaled down) 수 있다.
시스템(500)에, 전형적으로 하나 초과의 각각의 유형의 사용자 장비 디바이스가 있지만 도면을 과도하게 복잡하게 하는 것을 피하기 위해 각각의 유형이 단지 하나만 도 5에 도시되어 있다. 그에 부가하여, 각각의 사용자는 하나 초과의 유형의 사용자 장비 디바이스 그리고 또한 하나 초과의 각각의 유형의 사용자 장비 디바이스를 이용할 수 있다.
일부 실시예들에서, 사용자 장비 디바이스(예를 들어, 사용자 텔레비전 장비(502), 사용자 컴퓨터 장비(504), 무선 사용자 통신 디바이스(506))는 "제2 스크린 디바이스"라고 지칭될 수 있다. 예를 들어, 제2 스크린 디바이스는 제1 사용자 장비 디바이스 상에서 제시되는 콘텐츠를 보충할 수 있다. 제2 스크린 디바이스 상에서 제시되는 콘텐츠는 제1 디바이스 상에서 제시되는 콘텐츠를 보충하는 임의의 적합한 콘텐츠일 수 있다. 일부 실시예들에서, 제2 스크린 디바이스는 제1 디바이스의 설정들 및 디스플레이 기본설정들을 조정하기 위한 인터페이스를 제공한다. 일부 실시예들에서, 제2 스크린 디바이스는 다른 제2 스크린 디바이스들과 상호작용하도록 또는 소셜 네트워크와 상호작용하도록 구성된다. 제2 스크린 디바이스는 제1 디바이스와 동일한 방에, 제1 디바이스와 상이한 방에 그러나 동일한 주택 또는 건물에, 또는 제1 디바이스와 상이한 건물에 위치될 수 있다.
사용자는 또한 가정내 디바이스들 및 원격 디바이스들에 걸쳐 일관된 미디어 안내 애플리케이션 설정들을 유지하기 위해 다양한 설정들을 설정할 수 있다. 설정들은 본 명세서에 설명된 것들은 물론, 채널 및 프로그램 즐겨찾기들, 안내 애플리케이션이 프로그래밍 추천들을 하기 위해 이용하는 프로그래밍 선호도들, 디스플레이 기본설정들, 및 다른 바람직한 안내 설정들을 포함한다. 예를 들어, 사용자가 자신의 사무실에 있는 자신의 개인용 컴퓨터 상에서, 예를 들어, 웹 사이트 www.Tivo.com 상에서 한 채널을 즐겨찾기로서 설정하는 경우, 동일한 채널이 사용자의 가정내 디바이스들(예를 들어, 사용자 텔레비전 장비 및 사용자 컴퓨터 장비)은 물론, 원하는 경우, 사용자의 모바일 디바이스들 상에서 즐겨찾기로서 나타날 것이다. 따라서, 하나의 사용자 장비 디바이스 상에서 행해진 변경들은 다른 사용자 장비 디바이스 상에서의 안내 경험을, 이들이 동일한 또는 상이한 유형의 사용자 장비 디바이스인지에 관계없이, 변경할 수 있다. 그에 부가하여, 행해진 변경들은 사용자에 의해 입력되는 설정들은 물론, 안내 애플리케이션에 의해 모니터링되는 사용자 활동에 기초할 수 있다.
사용자 장비 디바이스는 통신 네트워크(514)에 커플링될 수 있다. 즉, 사용자 텔레비전 장비(502), 사용자 컴퓨터 장비(504), 및 무선 사용자 통신 디바이스(506)는, 제각기, 통신 경로들(508, 510, 및 512)을 통해 통신 네트워크(514)에 커플링된다. 통신 네트워크(514)는 인터넷, 모바일 폰 네트워크, 모바일 음성 또는 데이터 네트워크(예를 들어, 4G 또는 LTE 네트워크), 케이블 네트워크, 공중 교환 전화 네트워크, 또는 다른 유형의 통신 네트워크 또는 통신 네트워크들의 조합들을 포함하는 하나 이상의 네트워크일 수 있다. 경로들(508, 510, 및 512)은, 위성 경로, 광 섬유 경로, 케이블 경로, 인터넷 통신(예컨대, IPTV)을 지원하는 경로, (예컨대, 방송 또는 다른 무선 신호들을 위한) 자유 공간 접속들, 또는 임의의 다른 적합한 유선 또는 무선 통신 경로 또는 그러한 경로들의 조합과 같은, 하나 이상의 통신 경로를 개별적으로 또는 함께 포함할 수 있다. 경로(512)는, 도 5에 도시된 예시적인 실시예에서, 이것이 무선 경로임을 나타내기 위해 점선들로 그려져 있고, 경로들(508 및 510)은 이들이 유선 경로들임을 나타내기 위해 실선들로 그려져 있다(그러나 이 경로들은, 원하는 경우, 무선 경로들일 수 있음). 사용자 장비 디바이스들과의 통신은 이러한 통신 경로들 중 하나 이상에 의해 제공될 수 있지만, 도면을 과도하게 복잡하게 하는 것을 피하기 위해 도 5에서 단일 경로로서 도시되어 있다.
비록 사용자 장비 디바이스들 사이에 통신 경로들이 그려져 있지 않지만, 이러한 디바이스들은, 경로들(508, 510, 및 512)과 관련하여 위에서 설명된 것들과 같은, 통신 경로들은 물론, USB 케이블들, IEEE 1394 케이블들, 무선 경로들(예를 들어, 블루투스, 적외선, IEEE 802-11x 등), 또는 유선 또는 무선 경로들을 통한 다른 단거리 통신과 같은, 다른 단거리 포인트-투-포인트 통신 경로들을 통해 서로 직접적으로 통신할 수 있다. 블루투스는 Bluetooth SIG, INC.가 소유한 인증 마크(certification mark)이다. 사용자 장비 디바이스들은 또한 통신 네트워크(514)를 경유한 간접 경로를 통해 서로 직접적으로 통신할 수 있다.
시스템(500)은, 제각기, 통신 경로들(520 및 522)을 통해 통신 네트워크(514)에 커플링된 콘텐츠 소스(516) 및 미디어 안내 데이터 소스(518)를 포함한다. 경로들(520 및 522)은 경로들(508, 510, 및 512)과 관련하여 위에서 설명된 통신 경로들 중 임의의 것을 포함할 수 있다. 콘텐츠 소스(516) 및 미디어 안내 데이터 소스(518)와의 통신은 하나 이상의 통신 경로를 통해 교환될 수 있지만, 도면을 과도하게 복잡하게 하는 것을 피하기 위해 도 5에서 단일 경로로서 도시되어 있다. 그에 부가하여, 콘텐츠 소스(516) 및 미디어 안내 데이터 소스(518) 각각이 2개 이상 있을 수 있지만, 도면을 과도하게 복잡하게 하는 것을 피하기 위해 각각이 단지 하나만 도 5에 도시되어 있다. (상이한 유형들의 이러한 소스들 각각은 아래에서 논의된다.) 원하는 경우, 콘텐츠 소스(516) 및 미디어 안내 데이터 소스(518)는 하나의 소스 디바이스로서 통합될 수 있다. 비록 소스들(516 및 518)과 사용자 장비 디바이스들(502, 504, 및 506) 사이의 통신이 통신 네트워크(514)를 통하는 것으로서 도시되어 있지만, 일부 실시예들에서, 소스들(516 및 518)은 경로들(508, 510, 및 512)과 관련하여 위에서 설명된 것들과 같은 통신 경로들(도시되지 않음)을 통해 사용자 장비 디바이스들(502, 504, 및 506)과 직접적으로 통신할 수 있다.
콘텐츠 소스(516)는 텔레비전 배포 설비, 케이블 시스템 헤드엔드, 위성 배포 설비, 프로그래밍 소스들(예를 들어, NBC, ABC, HBO 등과 같은, 텔레비전 방송국들), 중간 배포 설비들 및/또는 서버들, 인터넷 제공자들, 온-디맨드 미디어 서버들, 및 다른 콘텐츠 제공자들을 포함한 하나 이상의 유형의 콘텐츠 배포 장비를 포함할 수 있다. NBC는 National Broadcasting Company, Inc.가 소유한 상표이고, ABC는 American Broadcasting Company, Inc.가 소유한 상표이며, HBO는 Home Box Office, Inc.가 소유한 상표이다. 콘텐츠 소스(516)는 콘텐츠의 창작자(originator)일 수 있거나(예를 들어, 텔레비전 방송국, 웹 캐스트 제공자 등) 또는 콘텐츠의 창작자가 아닐 수 있다(예를 들어, 온-디맨드 콘텐츠 제공자, 다운로드를 위한 방송 프로그램들의 콘텐츠의 인터넷 제공자 등). 콘텐츠 소스(516)는 케이블 소스들, 위성 제공자들, 온-디맨드 제공자들, 인터넷 제공자들, 오버-더-톱(over-the-top) 콘텐츠 제공자들, 또는 다른 콘텐츠 제공자들을 포함할 수 있다. 콘텐츠 소스(516)는 상이한 유형의 콘텐츠(사용자에 의해 선택된 비디오 콘텐츠를 포함함)를, 사용자 장비 디바이스들 중 임의의 것으로부터 멀리 떨어진 위치에, 저장하는 데 사용되는 원격 미디어 서버를 또한 포함할 수 있다. 콘텐츠의 원격 저장, 및 원격적으로 저장된 콘텐츠를 사용자 장비에 제공하는 것을 위한 시스템들 및 방법들은 2010년 7월 20일자로 발행된 Ellis 등의 미국 특허 제7,761,892호와 관련하여 더 상세히 논의되며, 이 미국 특허는 이로써 그 전체가 참조에 의해 본 명세서에 포함된다.
미디어 안내 데이터 소스(518)는, 위에서 설명된 미디어 안내 데이터와 같은, 미디어 안내 데이터를 제공할 수 있다. 미디어 안내 데이터는 임의의 적합한 접근법을 사용하여 사용자 장비 디바이스들에 제공될 수 있다. 일부 실시예들에서, 안내 애플리케이션은 데이터 피드(예를 들어, 연속적인 피드(continuous feed) 또는 트리클 피드(trickle feed))를 통해 프로그램 가이드 데이터를 수신하는 독립형 대화형 텔레비전 프로그램 가이드일 수 있다. 프로그램 스케줄 데이터 및 다른 안내 데이터는 텔레비전 채널 측파대(television channel sideband)에서, 대역내 디지털 신호를 사용하여, 대역외 디지털 신호를 사용하여, 또는 임의의 다른 적합한 데이터 전송 기술에 의해 사용자 장비에 제공될 수 있다. 프로그램 스케줄 데이터 및 다른 미디어 안내 데이터는 다수의 아날로그 또는 디지털 텔레비전 채널들 상에서 사용자 장비에 제공될 수 있다.
일부 실시예들에서, 미디어 안내 데이터 소스(518)로부터의 안내 데이터는 클라이언트-서버 접근법을 사용하여 사용자들의 장비에 제공될 수 있다. 예를 들어, 사용자 장비 디바이스는 서버로부터 미디어 안내 데이터를 풀링(pull)할 수 있거나, 또는 서버가 미디어 안내 데이터를 사용자 장비 디바이스로 푸싱(push)할 수 있다. 일부 실시예들에서, 사용자의 장비 상에 존재하는 안내 애플리케이션 클라이언트는, 필요할 때, 예를 들어, 안내 데이터가 오래되었을 때 또는 사용자 장비 디바이스가 데이터를 수신하라는 사용자로부터의 요청을 수신할 때, 안내 데이터를 획득하기 위해 소스(518)와의 세션들을 개시할 수 있다. 임의의 적합한 빈도로(예를 들어, 연속적으로, 매일, 사용자 지정 시간 기간마다, 시스템 지정 시간 기간마다, 사용자 장비로부터의 요청에 응답하여 등) 미디어 안내가 사용자 장비에 제공될 수 있다. 미디어 안내 데이터 소스(518)는 사용자 장비 디바이스들(502, 504 및 506)에 미디어 안내 애플리케이션 자체 또는 미디어 안내 애플리케이션에 대한 소프트웨어 업데이트들을 제공할 수 있다.
일부 실시예들에서, 미디어 안내 데이터는 시청자 데이터(viewer data)를 포함할 수 있다. 예를 들어, 시청자 데이터는 현재의 및/또는 과거의 사용자 활동 정보(예를 들어, 사용자가 전형적으로 어떤 콘텐츠를 시청하는지, 하루 중 어떤 시간들에서 사용자가 콘텐츠를 시청하는지, 사용자가 소셜 네트워크와 상호작용하는지 여부, 어떤 시간들에서 사용자가 정보를 포스팅하기 위해 소셜 네트워크와 상호작용하는지, 사용자가 전형적으로 어떤 유형들의 콘텐츠를 시청하는지(예를 들어, 유료 TV 또는 무료 TV), 기분, 뇌 활동 정보 등)를 포함할 수 있다. 미디어 안내 데이터는 가입 데이터를 또한 포함할 수 있다. 예를 들어, 가입 데이터는 주어진 사용자가 어느 소스들 또는 서비스들에 가입하는지 및/또는 주어진 사용자가 어느 소스들 또는 서비스들에 이전에 가입했으나 나중에 액세스를 종료했는지(예를 들어, 사용자가 프리미엄 채널들에 가입하는지 여부, 사용자가 프리미엄 레벨의 서비스들을 추가했는지 여부, 사용자가 인터넷 속도를 증가시켰는지 여부)를 식별해줄 수 있다. 일부 실시예들에서, 시청자 데이터 및/또는 가입 데이터는 1년 초과의 기간 동안 주어진 사용자의 패턴들을 식별해줄 수 있다. 미디어 안내 데이터는 주어진 사용자가 서비스/소스에 대한 액세스를 종료할 가능성을 나타내는 점수를 생성하는 데 사용되는 모델(예를 들어, 생존자 모델(survivor model))을 포함할 수 있다. 예를 들어, 미디어 안내 애플리케이션은 주어진 사용자가 특정의 서비스 또는 소스에 대한 액세스를 종료할지 여부의 가능성을 나타내는 값 또는 점수를 생성하기 위해 그 모델을 사용하여 시청자 데이터를 가입 데이터와 함께 프로세싱할 수 있다. 상세하게는, 더 높은 점수는 사용자가 특정의 서비스 또는 소스에 대한 액세스를 종료할 것이라는 더 높은 신뢰 수준(level of confidence)을 나타낼 수 있다. 점수에 기초하여, 미디어 안내 애플리케이션은 사용자가 액세스를 종료할 가능성이 있을 것으로서 점수에 의해 표시되는 특정의 서비스 또는 소스를 유지하도록 사용자를 유도하는 프로모션들을 생성할 수 있다.
미디어 안내 애플리케이션은, 예를 들어, 사용자 장비 디바이스들 상에 구현된 독립형 애플리케이션들일 수 있다. 예를 들어, 미디어 안내 애플리케이션은 스토리지(408)에 저장되고 사용자 장비 디바이스(400)의 제어 회로부(404)에 의해 실행될 수 있는 소프트웨어 또는 한 세트의 실행가능 명령어들로서 구현될 수 있다. 일부 실시예들에서, 미디어 안내 애플리케이션들은 클라이언트 애플리케이션만이 사용자 장비 디바이스 상에 존재하고 서버 애플리케이션이 원격 서버 상에 존재하는 클라이언트-서버 애플리케이션들일 수 있다. 예를 들어, 미디어 안내 애플리케이션들은 부분적으로 사용자 장비 디바이스(400)의 제어 회로부(404) 상의 클라이언트 애플리케이션으로서 그리고 부분적으로 원격 서버 상의 제어 회로부 상에서 실행되는 서버 애플리케이션(예를 들어, 미디어 안내 데이터 소스(518))으로서 원격 서버 상에 구현될 수 있다. (미디어 안내 데이터 소스(518)와 같은) 원격 서버의 제어 회로부에 의해 실행될 때, 미디어 안내 애플리케이션은 안내 애플리케이션 디스플레이들을 생성하고 생성된 디스플레이들을 사용자 장비 디바이스들에 전송하도록 제어 회로부에 지시할 수 있다. 서버 애플리케이션은 사용자 장비 상에 저장하기 위한 데이터를 전송하도록 미디어 안내 데이터 소스(518)의 제어 회로부에 지시할 수 있다. 클라이언트 애플리케이션은 안내 애플리케이션 디스플레이들을 생성하도록 수신 사용자 장비의 제어 회로부에 지시할 수 있다.
사용자 장비 디바이스들(502, 504, 및 506)에 전달되는 콘텐츠 및/또는 미디어 안내 데이터는 OTT(over-the-top) 콘텐츠일 수 있다. OTT 콘텐츠 전달은, 위에서 설명된 임의의 사용자 장비 디바이스를 포함한, 인터넷 가능 사용자 디바이스들이 케이블 또는 위성 접속들을 통해 수신되는 콘텐츠에 부가하여, 위에서 설명된 콘텐츠를 포함한, 인터넷을 통해 전송되는 콘텐츠를 수신할 수 있게 해준다. OTT 콘텐츠는 인터넷 서비스 제공자(ISP)에 의해 제공되는 인터넷 접속을 통해 전달되지만, 서드파티가 콘텐츠를 배포한다. ISP는 콘텐츠의 시청 능력, 저작권, 또는 재배포에 대해 책임지지 않을 수 있으며, OTT 콘텐츠 제공자에 의해 제공되는 IP 패킷들만을 전송할 수 있다. OTT 콘텐츠 제공자들의 예들은 IP 패킷들을 통해 오디오 및 비디오를 제공하는, YOUTUBE, NETFLIX, 및 HULU를 포함한다. Youtube는 Google Inc.가 소유한 상표이고, Netflix는 Netflix Inc.가 소유한 상표이며, Hulu는 Hulu, LLC가 소유한 상표이다. OTT 콘텐츠 제공자들은 부가적으로 또는 대안적으로 위에서 설명된 미디어 안내 데이터를 제공할 수 있다. 콘텐츠 및/또는 미디어 안내 데이터에 부가하여, OTT 콘텐츠의 제공자들은 미디어 안내 애플리케이션들(예를 들어, 웹 기반 애플리케이션들 또는 클라우드 기반 애플리케이션들)을 배포할 수 있거나, 또는 콘텐츠가 사용자 장비 디바이스 상에 저장된 미디어 안내 애플리케이션들에 의해 디스플레이될 수 있다.
미디어 안내 시스템(500)은 콘텐츠에 액세스하고 미디어 안내를 제공하는 목적을 위해 사용자 장비 디바이스들과 콘텐츠 및 안내 데이터의 소스들이 서로 통신할 수 있는 다수의 접근법들 또는 네트워크 구성들을 설명하도록 의도되어 있다. 본 명세서에 설명된 실시예들은 이 접근법들 중 임의의 것 또는 그 서브세트에서, 또는 콘텐츠를 전달하고 미디어 안내를 제공하기 위해 다른 접근법들을 이용하는 시스템에서 적용될 수 있다. 이하의 4가지 접근법은 도 5의 일반화된 예에 대한 특정 예시들을 제공한다.
하나의 접근법에서, 사용자 장비 디바이스들은 홈 네트워크 내에서 서로 통신할 수 있다. 사용자 장비 디바이스들은 앞서 설명된 단거리 포인트-투-포인트 통신 스킴들을 통해 직접적으로, 홈 네트워크 상에 제공된 허브 또는 다른 유사한 디바이스를 통한 간접 경로들을 통해, 또는 통신 네트워크(514)를 통해 서로 통신할 수 있다. 단일 가정 내의 다수의 개인들 각각은 홈 네트워크 상의 상이한 사용자 장비 디바이스들을 동작시킬 수 있다. 그 결과, 다양한 미디어 안내 정보 또는 설정들이 상이한 사용자 장비 디바이스들 사이에서 전달되는 것이 바람직할 수 있다. 예를 들어, 사용자들이, 2005년 7월 11일자로 출원된 Ellis 등의 미국 특허 공개 제2005/0251827호에 보다 상세히 설명된 바와 같이, 홈 네트워크 내의 상이한 사용자 장비 디바이스들 상에 일관된 미디어 안내 애플리케이션 설정을 유지하는 것이 바람직할 수 있다 . 홈 네트워크 내의 상이한 유형의 사용자 장비 디바이스들은 또한 콘텐츠를 전송하기 위해 서로 통신할 수 있다. 예를 들어, 사용자는 사용자 컴퓨터 장비로부터 휴대용 비디오 플레이어 또는 휴대용 음악 플레이어로 콘텐츠를 전송할 수 있다.
제2 접근법에서, 사용자들은 사용자들이 콘텐츠에 액세스하고 미디어 안내를 획득하는 다수의 유형들의 사용자 장비를 가질 수 있다. 예를 들어, 일부 사용자들은 가정내 및 모바일 디바이스들에 의해 액세스되는 홈 네트워크들을 가질 수 있다. 사용자들은 원격 디바이스 상에 구현되는 미디어 안내 애플리케이션을 통해 가정내 디바이스들을 제어할 수 있다. 예를 들어, 사용자들은 자신의 사무실에 있는 개인용 컴퓨터, 또는 PDA 또는 웹 가능(web-enabled) 모바일 전화와 같은 모바일 디바이스를 통해 웹 사이트 상의 온라인 미디어 안내 애플리케이션에 액세스할 수 있다. 사용자는 사용자의 가정내 장비를 제어하기 위해 온라인 안내 애플리케이션 상에 다양한 설정들(예를 들어, 녹화들, 리마인더들(reminders), 또는 다른 설정들)을 설정할 수 있다. 온라인 가이드는 직접적으로, 또는 사용자의 가정내 장비 상의 미디어 안내 애플리케이션과 통신하는 것에 의해 사용자의 장비를 제어할 수 있다. 사용자 장비 디바이스들이 서로 멀리 떨어진 위치들에 있는 경우, 사용자 장비 디바이스들이 통신하기 위한 다양한 시스템들 및 방법들은, 예를 들어, 2011년 10월 25일자로 발행된 Ellis 등의 미국 특허 제8,046,801호에서 논의되며, 이 미국 특허는 이로써 그 전체가 참조에 의해 본 명세서에 포함된다.
제3 접근법에서, 가정 내부 및 가정 외부에 있는 사용자 장비 디바이스들의 사용자들은 콘텐츠에 액세스하기 위해 콘텐츠 소스(516)와 직접적으로 통신하는 데 자신의 미디어 안내 애플리케이션을 사용할 수 있다. 구체적으로, 가정 내에서, 사용자 텔레비전 장비(502) 및 사용자 컴퓨터 장비(504)의 사용자들은 바람직한 콘텐츠를 내비게이팅하고 찾아내기 위해 미디어 안내 애플리케이션에 액세스할 수 있다. 사용자들은 또한 바람직한 콘텐츠를 내비게이팅하고 위치확인하기 위해 무선 사용자 통신 디바이스들(506)을 사용하여 가정 외부의 미디어 안내 애플리케이션에 액세스할 수 있다.
제4 접근법에서, 사용자 장비 디바이스들은 클라우드 서비스들에 액세스하기 위해 클라우드 컴퓨팅 환경에서 동작할 수 있다. 클라우드 컴퓨팅 환경에서, 콘텐츠 공유, 저장 또는 배포를 위한 다양한 유형들의 컴퓨팅 서비스들(예를 들어, 비디오 공유 사이트들 또는 소셜 네트워킹 사이트들)이, "클라우드"라고 지칭되는, 네트워크 액세스가능 컴퓨팅 및 저장 자원들의 컬렉션에 의해 제공된다. 예를 들어, 클라우드는 통신 네트워크(514)를 통해 인터넷과 같은 네트워크를 통해 접속된 다양한 유형의 사용자들 및 디바이스들에 클라우드 기반 서비스들을 제공하는, 중앙집중식으로 또는 분산된 위치들에 위치될 수 있는, 서버 컴퓨팅 디바이스들의 컬렉션을 포함할 수 있다. 이러한 클라우드 자원들은 하나 이상의 콘텐츠 소스(516) 및 하나 이상의 미디어 안내 데이터 소스(518)를 포함할 수 있다. 부가적으로 또는 대안적으로, 원격 컴퓨팅 사이트들은, 사용자 텔레비전 장비(502), 사용자 컴퓨터 장비(504), 및 무선 사용자 통신 디바이스(506)와 같은, 다른 사용자 장비 디바이스들을 포함할 수 있다. 예를 들어, 다른 사용자 장비 디바이스들은 비디오의 저장된 사본 또는 스트리밍된 비디오에 대한 액세스를 제공할 수 있다. 그러한 실시예들에서, 사용자 장비 디바이스들은 중앙 서버와 통신하지 않고 피어-투-피어 방식으로 동작할 수 있다.
클라우드는 사용자 장비 디바이스들을 위해, 예들 중에서도, 콘텐츠 저장, 콘텐츠 공유, 또는 소셜 네트워킹 서비스들과 같은, 서비스들에 대한 액세스는 물론, 위에서 설명된 임의의 콘텐츠에 대한 액세스를 제공한다. 서비스들은 클라우드 컴퓨팅 서비스 제공자들을 통해 또는 온라인 서비스들의 다른 제공자들을 통해 클라우드에서 제공될 수 있다. 예를 들어, 클라우드 기반 서비스들은 콘텐츠 저장 서비스, 콘텐츠 공유 사이트, 소셜 네트워킹 사이트, 또는 사용자에 의해 소싱된 콘텐츠(user-sourced content)가 접속된 디바이스들 상에서의 다른 사람들에 의한 시청을 위해 배포되는 다른 서비스들을 포함할 수 있다. 이러한 클라우드 기반 서비스들은 사용자 장비 디바이스가, 콘텐츠를 로컬로 저장하고 로컬로 저장된 콘텐츠에 액세스하기보다는, 콘텐츠를 클라우드에 저장하고 클라우드로부터 콘텐츠를 수신할 수 있게 해줄 수 있다.
사용자는 콘텐츠를 녹화하기 위해, 캠코더들, 비디오 모드를 갖는 디지털 카메라들, 오디오 레코더들, 모바일 폰들, 및 핸드헬드 컴퓨팅 디바이스들과 같은, 다양한 콘텐츠 캡처 디바이스들을 사용할 수 있다. 사용자는 클라우드 상의 콘텐츠 저장 서비스에 콘텐츠를 직접적으로, 예를 들어, 콘텐츠 캡처 특징을 갖는 사용자 컴퓨터 장비(504) 또는 무선 사용자 통신 디바이스(506)로부터, 업로드할 수 있다. 대안적으로, 사용자는 먼저 콘텐츠를, 사용자 컴퓨터 장비(504)와 같은, 사용자 장비 디바이스에 전송할 수 있다. 콘텐츠를 저장하는 사용자 장비 디바이스는 통신 네트워크(514) 상의 데이터 전송 서비스를 사용하여 콘텐츠를 클라우드에 업로드한다. 일부 실시예들에서, 사용자 장비 디바이스 자체는 클라우드 자원이고, 다른 사용자 장비 디바이스들은 사용자가 콘텐츠를 저장한 사용자 장비 디바이스로부터 직접적으로 콘텐츠에 액세스할 수 있다.
클라우드 자원들은, 예를 들어, 웹 브라우저, 미디어 안내 애플리케이션, 데스크톱 애플리케이션, 모바일 애플리케이션, 및/또는 이들의 액세스 애플리케이션들의 임의의 조합을 사용하여 사용자 장비 디바이스에 의해 액세스될 수 있다. 사용자 장비 디바이스는 애플리케이션 전달을 위해 클라우드 컴퓨팅에 의존하는 클라우드 클라이언트일 수 있거나, 또는 사용자 장비 디바이스는 클라우드 자원들에 대한 액세스를 갖지 않는 일부 기능성을 가질 수 있다. 예를 들어, 사용자 장비 디바이스 상에서 실행되는 일부 애플리케이션들은 클라우드 애플리케이션들, 즉 인터넷을 통해 서비스로서 전달되는 애플리케이션들일 수 있는 반면, 다른 애플리케이션들은 사용자 장비 디바이스 상에 저장되어 실행될 수 있다. 일부 실시예들에서, 사용자 디바이스는 다수의 클라우드 자원들로부터 동시에 콘텐츠를 수신할 수 있다. 예를 들어, 사용자 디바이스는 제2 클라우드 자원으로부터 콘텐츠를 다운로드하면서 하나의 클라우드 자원으로부터 오디오를 스트리밍할 수 있다. 또는 사용자 디바이스는 더 효율적인 다운로드를 위해 다수의 클라우드 자원들로부터 콘텐츠를 다운로드할 수 있다. 일부 실시예들에서, 사용자 장비 디바이스들은 도 4와 관련하여 설명된 프로세싱 회로부에 의해 수행되는 프로세싱 동작들과 같은 프로세싱 동작들을 위해 클라우드 자원들을 사용할 수 있다.
본 명세서에서 언급되는 바와 같이, 용어 "~에 응답하여(in response to)"는 ~의 결과로서 개시됨을 말한다. 예를 들어, 제1 액션이 제2 액션에 응답하여 수행된다는 것은 제1 액션과 제2 액션 사이에 중간 단계들(interstitial steps)을 포함할 수 있다. 본 명세서에서 언급된 바와 같이, 용어 "~에 응답하여 직접적으로(directly in response to)"는 ~에 의해 야기됨을 말한다. 예를 들어, 제1 액션이 제2 액션에 응답하여 직접적으로 수행된다는 것은 제1 액션과 제2 액션 사이에 중간 단계들을 포함하지 않을 수 있다.
도 6은 본 개시내용의 일부 실시예들에 따른, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 예시적인 액션들의 플로차트이다. 602에서, 제어 회로부(404)는 사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성한다. 예를 들어, 제어 회로부(404)는 사용자 입력 인터페이스(410)를 통해 사용자로부터 음성 입력을 수신할 수 있고 사용자 입력을 분석하여 음성 시그니처를 생성할 수 있으며 음성 시그니처를 스토리지(408)에 저장할 수 있다. 일부 실시예들에서, 제어 회로부는 음성 시그니처를 원격 서버(예를 들어, 미디어 콘텐츠 소스(516) 및/또는 미디어 안내 데이터 소스(518)와 연관된 서버)에 저장할 수 있다.
604에서, 제어 회로부(404)는, 음성 시그니처에 기초하여, 사용자와 연관된 복수의 음성 특성들을 식별하며, 여기서 복수의 음성 특성들 각각은 사용자와 연관된 인구통계 데이터에 대응한다. 예를 들어, 제어 회로부(404)는 스토리지(408)로부터 저장된 음성 시그니처를 리트리브할 수 있고 음성 시그니처에 대해 알고리즘을 실행하여 음성 특성들을 식별할 수 있다.
606에서, 제어 회로부(404)는 복수의 인구통계들을 한 세대와 연관된 복수의 사용자들과 연관된 복수의 프로파일들 중 각각의 프로파일 내의 인구통계 정보와 비교한다. 제어 회로부는 음성 시그니처로부터 추출되는 인구통계들과 원격 서버(예를 들어, 미디어 콘텐츠 소스(516) 또는 미디어 안내 데이터 소스(518)와 연관된 원격 서버)로부터 수신되는 인구통계 정보에 대해 비교 알고리즘을 실행할 수 있다. 예를 들어, 제어 회로부는 음성 커맨드로부터 추출되는 인구통계 데이터(예를 들어, 데이터 구조(100)에 저장됨)를 원격 소스로부터 수신되는 인구통계 데이터(예를 들어, 데이터 구조(120)에 저장된 인구통계 데이터)와 비교할 수 있다.
608에서, 제어 회로부(404)는, 비교에 기초하여, 복수의 프로파일들 내의 2개 이상의 프로파일들이 복수의 인구통계들과 매칭된다고 결정한다. 예를 들어, 제어 회로부(404)는 2개 이상의 프로파일들이 음성 시그니처로부터 추출되는 인구통계들과 동일하게 매칭되는 인구통계들을 포함한다고 결정할 수 있다. 예를 들어, 제어 회로부(404)는, 외부 인구통계 데이터와 음성 커맨드로부터 추출되는 인구통계 데이터(예를 들어, 데이터 구조(100) 내의 데이터와 데이터 구조(120) 내의 데이터)를 비교하는 것에 기초하여, 2개의 프로파일이 추출된 인구통계 데이터와 동일하게 매칭된다고 결정할 수 있다.
608에서, 제어 회로부(404)는, 비교에 기초하여, 복수의 프로파일들 내의 2개 이상의 프로파일들이 복수의 인구통계들과 매칭된다고 결정한다. 예를 들어, 제어 회로부(404)는 매칭인 엔트리들(124) 중의 해당 엔트리들에 마킹할 수 있다. 하나의 프로파일만이 매칭되는 경우, 미디어 안내 애플리케이션은 사용자 식별이 완료되었다고 결정하고 액션(610)을 스킵할 수 있다는 것에 유의해야 한다.
610에서, 복수의 프로파일들 내의 2개 이상의 프로파일들이 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여, 제어 회로부(404)는, 2개 이상의 프로파일들로부터 음성 커맨드의 내용에 기초하여, 사용자의 프로파일을 식별한다. 예를 들어, 제어 회로부는 미디어 자산의 메타데이터와 가장 잘 매칭되는 사용자의 프로파일을 식별할 수 있다. 612에서, 제어 회로부(404)는 사용자가 식별되었음을 나타내는 표시를 디스플레이를 위해 생성한다. 예를 들어, 제어 회로부는 디스플레이(412) 상에 표시를 디스플레이를 위해 생성할 수 있다.
도 7은 본 개시내용의 일부 실시예들에 따른, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 예시적인 액션들의 다른 플로차트이다. 702에서, 제어 회로부(404)는 사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성한다. 예를 들어, 제어 회로부(404)는 사용자 입력 인터페이스(410)를 통해 사용자로부터 음성 입력을 수신할 수 있고 사용자 입력을 분석하여 음성 시그니처를 생성할 수 있으며 음성 시그니처를 스토리지(408)에 저장할 수 있다. 일부 실시예들에서, 제어 회로부는 음성 시그니처를 원격 서버(예를 들어, 미디어 콘텐츠 소스(516) 및/또는 미디어 안내 데이터 소스(518)와 연관된 서버)에 저장할 수 있다.
704에서, 제어 회로부(404)는, 음성 시그니처로부터, 사용자와 연관된 복수의 음성 특성들을 결정하고, 여기서 복수의 음성 특성들은 복수의 인구통계들에 대응한다. 예를 들어, 제어 회로부(404)는 스토리지(408)로부터 저장된 음성 시그니처를 리트리브할 수 있고 음성 시그니처에 대해 알고리즘을 실행하여 음성 특성들을 식별할 수 있다.
706에서, 제어 회로부(404)는 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송한다. 예를 들어, 제어 회로부는 질의를 (예를 들어, I/O 인터페이스(402)를 통해) 원격 서버(예를 들어, 미디어 콘텐츠 소스(516) 또는 미디어 안내 데이터 소스(518))에 전송할 수 있다.
708에서, 제어 회로부(404)는 사용자 정보를 수신하고, 여기서 사용자 정보는 세대 내의 각각의 사용자의 각자의 인구통계 정보를 포함한다. 예를 들어, 제어 회로부는 데이터 구조(예를 들어, 데이터 구조(120))를 수신하고 데이터 구조를 스토리지(408)에(예를 들어, 랜덤 액세스 메모리에) 저장할 수 있다. 710에서, 제어 회로부(404)는 복수의 인구통계들을 사용자 정보 내의 인구통계 정보와 비교한다. 예를 들어, 제어 회로부(404)는 비교를 위해 수신된 인구통계 정보를 (예를 들어, 스토리지(408)로부터) 리트리브할 수 있다.
712에서, 제어 회로부(404)는, 비교에 기초하여, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정한다. 예를 들어, 제어 회로부는 매칭의 표시자를 매칭되는 엔트리들과 함께 (예를 들어, 스토리지(408)에) 저장할 수 있다. 714에서, 제어 회로부(404)는, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여, 다음의 액션들을 수행한다.
716에서, 제어 회로부(404)는 음성 커맨드가 미디어 자산에 대한 요청을 포함한다고 결정한다. 예를 들어, 제어 회로부(404)는 음성 커맨드를 분석하고 요청된 미디어 자산의 식별자를 추출할 수 있다. 718에서, 제어 회로부(404)는 미디어 자산과 연관된 메타데이터를 복수의 인구통계들과 매칭되는 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교한다. 예를 들어, 제어 회로부(404)는 인구통계 정보(예를 들어, 연령 범위 및 연령)에 대한 스트링 값들 및/또는 다른 인구통계 정보에 대한(예를 들어, 성별에 대한) 불리언 값들을 비교할 수 있다.
720에서, 제어 회로부(404)는, 미디어 자산과 연관된 메타데이터를 복수의 인구통계들과 매칭되는 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 것에 기초하여, 둘 이상의 사용자들 중 제1 사용자가 최상의 매칭을 구성한다고 결정한다. 제어 회로부(404)는, 제1 사용자가 최상의 매칭이라고 결정한 것에 응답하여, 사용자가 식별되었다는 표시를 디스플레이를 위해 생성한다. 예를 들어, 제어 회로부는 디스플레이(412) 상에 표시를 디스플레이를 위해 생성할 수 있다.
도 8은 본 개시내용의 일부 실시예들에 따른, 둘 이상의 사용자들과 연관된 인구통계 정보가 복수의 인구통계들과 매칭된다고 결정하기 위한 예시적인 액션들의 플로차트이다. 802에서, 제어 회로부(404)는 엔트리들의 테이블을 리트리브하고, 여기서 각각의 엔트리는 사용자와 연관된다. 예를 들어, 제어 회로부는 복수의 엔트리들(124)을 포함하는 데이터 구조(120)를 리트리브할 수 있다. 804에서, 제어 회로부(404)는 복수의 엔트리들 중에서 이전에 선택되지 않은 엔트리를 선택하고, 여기서 각각의 엔트리는 세대 사용자를 나타낸다. 예를 들어, 각각의 엔트리는 데이터 구조를 통해 선택가능할 수 있다. 제어 회로부는 각각의 엔트리에 대해 반복할 수 있다.
808에서, 제어 회로부(404)는 선택된 엔트리 내의 각각의 필드를 음성 커맨드로부터 추출되는 인구통계 정보의 대응하는 필드와 비교한다. 예를 들어, 제어 회로부는 대응하는 필드들 사이의 스트링 비교 또는 다른 유형의 비교를 수행할 수 있다. 810에서, 제어 회로부(404)는 선택된 엔트리의 임의의 필드가 음성 커맨드로부터 추출되는 인구통계 정보의 대응하는 필드와 매칭되는지 여부를 결정한다. 예를 들어, 제어 회로부(404)는 하나 이상의 필드가 매칭된다고 결정할 수 있다. 선택된 엔트리의 어떠한 필드도 인구통계 정보와 매칭되지 않는 경우, 프로세스(800)는 액션(814)으로 이동한다. 선택된 엔트리의 적어도 하나의 필드가 인구통계 정보의 대응하는 필드와 매칭되는 경우, 프로세스(800)는 812로 이동한다.
812에서, 제어 회로부(404)는 인구통계 정보의 대응하는 필드와 매칭되는 선택된 엔트리의 각각의 필드의 표시를 저장한다. 예를 들어, 제어 회로부는 매칭이 발생했는지 여부의 표시를 각각의 필드 내에 저장할 수 있다. 814에서, 제어 회로부(404)는 복수의 엔트리들 중에 임의의 이전에 선택되지 않은 엔트리들이 더 있는지 여부를 결정한다. 복수의 엔트리들 중에 이전에 선택되지 않은 엔트리들이 더 있는 경우, 프로세스(800)는, 다른 이전에 선택되지 않은 엔트리가 프로세싱을 위해 선택하는, 액션(804)으로 이동한다. 복수의 엔트리들 중에 이전에 선택되지 않은 엔트리들이 더 이상 없는 경우, 프로세스(800)는 액션(816)으로 이동한다. 816에서, 제어 회로부(404)는 복수의 엔트리들 각각의 매칭되는 필드들의 개수를 비교함으로써 가장 많은 양의 매칭되는 인구통계들을 갖는 둘 이상의 사용자들을 식별한다.
도 9는 본 개시내용의 일부 실시예들에 따른, 음성 시그니처를 사용자에 매칭시키기 위한 예시적인 액션들의 플로차트이다. 902에서, 제어 회로부(404)는 음성 시그니처 및 미디어 자산의 표시를, 사용자의 음성 프로파일에, 저장한다. 제어 회로부는 음성 프로파일을 스토리지(408)에 저장할 수 있다. 904에서, 제어 회로부(404)는 후속 음성 커맨드를 검출한다. 예를 들어, 제어 회로부는 사용자 입력 인터페이스(410)로부터 음성 입력을 검출할 수 있다.
906에서, 제어 회로부(404)는 후속 음성 커맨드에 기초하여 후속 음성 시그니처를 생성한다. 예를 들어, 제어 회로부(404)는 최초의 음성 시그니처와 동일한 방식으로 후속 음성 시그니처를 생성할 수 있다. 908에서, 제어 회로부(404)는 음성 시그니처와 후속 음성 시그니처를 비교한다. 예를 들어, 음성 시그니처들은 음성 특정 데이터(voice specific data)에 대해 분석될 수 있고 그 음성 특정 데이터가 비교될 수 있다.
910에서, 제어 회로부(404)는 음성 시그니처가 후속 음성 시그니처와 매칭되는지 여부를 결정한다. 제어 회로부(404)가 음성 시그니처가 후속 음성 시그니처와 매칭된다고 결정하는 경우, 프로세스(900)는, 제어 회로부(404)가 후속 음성 커맨드의 내용을 사용자의 음성 프로파일에 저장하는, 912로 이동한다. 그렇지만, 제어 회로부(404)가 음성 시그니처가 후속 음성 시그니처와 매칭되지 않는다고 결정하는 경우, 프로세스(900)는, 제어가 후속 음성 커맨드를 저장하는, 914로 이동한다. 예를 들어, 제어 회로부(404)는 식별되지 않은 음성 커맨드들에 대한 데이터 구조를 인스턴스화할 수 있다. 제어 회로부는 그 데이터 구조를 스토리지(408)에 저장할 수 있다.
916에서, 제어 회로부(404)는 후속 음성 커맨드의 음성 시그니처를 새로 식별된 사용자들의 음성 시그니처들과 주기적으로 비교한다. 예를 들어, 신규 사용자들이 시스템에 합류하고 식별됨에 따라, 음성 커맨드로부터의 음성 시그니처가 비교될 수 있고, 매칭이 발견되는 경우, 사용자의 음성 커맨드 내용이 사용자의 프로파일에 저장될 수 있거나 다른 방식으로 프로세싱될 수 있다. 음성 프로파일이 장소들의 조합에 저장될 수 있음에 유의해야 한다. 예를 들어, 인구통계 데이터를 포함하는 사용자의 프로파일은 사용자 디바이스(예를 들어, 사용자 텔레비전 장비(502), 사용자 컴퓨터 장비(504), 및/또는 무선 통신 디바이스(506)) 상의 스토리지(408)에 저장될 수 있다. 부가적으로 또는 대안적으로, 사용자의 프로파일은 원격 서버(예를 들어, 미디어 콘텐츠 소스(516) 및/또는 미디어 안내 데이터 소스(518)와 연관된 서버) 상에 저장될 수 있다.
위에서 논의된 프로세스들은 제한적인 것이 아니라 예시적인 것으로 의도된다. 본 기술분야의 통상의 기술자는 본 명세서에서 논의된 프로세스들의 액션들이 생략, 수정, 조합, 및/또는 재배열될 수 있으며, 본 발명의 범위를 벗어나지 않으면서 임의의 부가의 액션들이 수행될 수 있음을 이해할 것이다. 보다 일반적으로, 위의 개시내용은 제한적인 것이 아니라 예시적인 것으로 의도된다. 이하의 청구항들만이 본 개시내용이 무엇을 포함하는지에 관한 한계(bounds)를 설정하는 것으로 의도된다. 게다가, 임의의 일 실시예에서 설명된 특징들 및 제한들이 본 명세서에서의 임의의 다른 실시예에 적용될 수 있으며, 일 실시예에 관련된 플로차트들 또는 예들이 적합한 방식으로 임의의 다른 실시예와 결합될 수 있거나, 상이한 순서들로 행해질 수 있거나, 또는 병렬로 행해질 수 있다는 점에 유의해야 한다. 그에 부가하여, 본 명세서에 설명된 시스템들 및 방법들은 실시간으로 수행될 수 있다. 위에서 설명된 시스템들 및/또는 방법들이 다른 시스템들 및/또는 방법들에 적용될 수 있거나 그에 따라 사용될 수 있음에 또한 유의해야 한다.

Claims (51)

  1. 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 방법으로서,
    사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성하는 단계;
    상기 음성 시그니처에 기초하여, 상기 사용자와 연관된 복수의 음성 특성들을 식별하는 단계 - 상기 복수의 음성 특성들 각각은 상기 사용자와 연관된 인구통계 데이터(demographic data)에 대응함 - ;
    복수의 인구통계들을 한 세대(household)와 연관된 복수의 사용자들과 연관된 복수의 프로파일들 중 각각의 프로파일 내의 인구통계 정보와 비교하는 단계;
    상기 비교하는 단계에 기초하여, 상기 복수의 프로파일들 내의 2개 이상의 프로파일들이 상기 복수의 인구통계들과 매칭된다고 결정하는 단계;
    상기 복수의 프로파일들 내의 2개 이상의 프로파일들이 상기 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여, 상기 2개 이상의 프로파일들로부터 상기 음성 커맨드의 내용(content)에 기초하여, 상기 사용자의 프로파일을 식별하는 단계; 및
    상기 사용자가 식별되었음을 나타내는 표시를 디스플레이를 위해 생성하는 단계
    를 포함하는, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 방법.
  2. 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 방법으로서,
    사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성하는 단계;
    상기 음성 시그니처로부터, 상기 사용자와 연관된 복수의 음성 특성들을 결정하는 단계 - 상기 복수의 음성 특성들은 복수의 인구통계들에 대응함 - ;
    상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하는 단계;
    상기 사용자 정보를 수신하는 단계 - 상기 사용자 정보는 상기 세대 내의 각각의 사용자의 각자의 인구통계 정보를 포함함 - ;
    상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하는 단계;
    상기 비교하는 단계에 기초하여, 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하는 단계;
    상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여,
    상기 음성 커맨드가 미디어 자산(media asset)에 대한 요청을 포함한다고 결정하는 단계;
    상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 단계;
    상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 단계에 기초하여, 상기 둘 이상의 사용자들 중 제1 사용자가 최상의 매칭을 구성한다고 결정하는 단계; 및
    상기 제1 사용자가 상기 최상의 매칭이라고 결정한 것에 응답하여, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하는 단계
    를 포함하는, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 방법.
  3. 제2항에 있어서, 상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하는 단계는,
    상기 음성 커맨드가 수신되는 사용자 장비 디바이스와 연관된 식별 스트링(identification string)을 결정하는 단계;
    세대 사용자 정보에 대한 질의(query)를 생성하는 단계 - 상기 질의는 상기 식별 스트링을 포함함 - ; 및
    상기 사용자의 세대와 연관된 상기 사용자 정보를 저장하는 원격 서버에 상기 질의를 전송하는 단계를 포함하는 것인, 방법.
  4. 제3항에 있어서, 상기 사용자 정보를 수신하는 단계는, 상기 사용자 정보를 데이터 구조에 저장하는 단계를 더 포함하고, 상기 데이터 구조는,
    복수의 엔트리(entry)들 - 상기 복수의 엔트리들은 상기 세대 내의 각각의 사용자에 대한 엔트리를 포함함 - ; 및
    각각의 엔트리에 대한 복수의 필드(field)들 - 상기 복수의 필드들은 각자의 사용자와 연관된 인구통계 정보의 각각의 아이템에 대한 필드를 포함함 - 을 포함하는 것인, 방법.
  5. 제4항에 있어서, 상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하는 단계는,
    상기 복수의 엔트리들로부터 제1 엔트리를 리트리브(retrieve)하는 단계;
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 단계; 및
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 단계에 기초하여, 상기 복수의 인구통계들로부터 상기 제1 사용자와 연관된 인구통계들과 매칭되는 한 세트의 인구통계 정보를 생성하는 단계를 포함하는 것인, 방법.
  6. 제5항에 있어서, 상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하는 단계는,
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 단계; 및
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 단계에 기초하여, 가장 많은 양의 매칭되는 인구통계 정보를 갖는 둘 이상의 사용자들을 식별하는 단계를 포함하는 것인, 방법.
  7. 제2항에 있어서, 상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 단계는,
    복수의 사용자 프로파일들을 수신하는 단계 - 상기 복수의 사용자 프로파일들 내의 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 한 사용자에 대응하고, 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 각자의 사용자가 선호하는 미디어 자산들에 대응하는 복수의 특성들을 포함함 - ;
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 단계; 및
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 단계에 기초하여 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 결정하는 단계를 포함하는 것인, 방법.
  8. 제7항에 있어서, 상기 둘 이상의 사용자들로부터 가장 많은 양의 매칭되는 메타데이터를 갖는 사용자를 결정하는 단계는,
    상기 복수의 특성들 중 각각의 특성과 연관된 가중치를 리트리브하는 단계;
    각각의 특성에 대한 각자의 가중치를 사용하여, 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 계산하는 단계; 및
    가장 많은 양의 매칭되는 특성들을 갖는 매칭되는 사용자를 선택하는 단계를 포함하는 것인, 방법.
  9. 제2항에 있어서, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하는 단계는,
    스토리지로부터, 상기 사용자의 프로파일을 리트리브하는 단계;
    상기 사용자의 프로파일에 기초하여, 상기 사용자가 아바타를 선택했다고 결정하는 단계; 및
    상기 미디어 자산의 일 부분 위에 오버레이되는 상기 아바타를 디스플레이를 위해 생성하는 단계를 포함하는 것인, 방법.
  10. 제2항에 있어서, 상기 사용자와 연관된 모든 디바이스들 상에 상기 음성 시그니처를 저장하는 단계
    를 더 포함하는, 방법.
  11. 제2항에 있어서,
    상기 음성 시그니처 및 상기 미디어 자산의 표시를 상기 사용자의 음성 프로파일에 저장하는 단계;
    후속 음성 커맨드를 검출하는 단계;
    상기 후속 음성 커맨드와 연관된 후속 음성 시그니처가 상기 음성 시그니처와 매칭된다고 결정하는 단계; 및
    상기 후속 음성 커맨드의 내용을 상기 사용자의 음성 프로파일에 저장하는 단계
    를 더 포함하는, 방법.
  12. 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 시스템으로서,
    통신 회로부; 및
    제어 회로부
    를 포함하고, 상기 제어 회로부는,
    사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성하도록;
    상기 음성 시그니처로부터, 상기 사용자와 연관된 복수의 음성 특성들을 결정하도록 - 상기 복수의 음성 특성들은 복수의 인구통계들에 대응함 - ;
    상기 통신 회로부를 사용하여, 상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하도록;
    상기 통신 회로부를 사용하여, 상기 사용자 정보를 수신하도록 - 상기 사용자 정보는 상기 세대 내의 각각의 사용자의 각자의 인구통계 정보를 포함함 - ;
    상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하도록;
    상기 비교에 기초하여, 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하도록;
    상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여,
    상기 음성 커맨드가 미디어 자산에 대한 요청을 포함한다고 결정하도록;
    상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하도록;
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 것에 기초하여, 상기 둘 이상의 사용자들 중 제1 사용자가 최상의 매칭을 구성한다고 결정하도록; 그리고
    상기 제1 사용자가 상기 최상의 매칭이라고 결정한 것에 응답하여, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하도록
    구성되는 것인, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 시스템.
  13. 제12항에 있어서, 상기 제어 회로부는 또한, 상기 사용자의 세대와 연관된 사용자 정보에 대한 상기 요청을 전송할 때,
    상기 음성 커맨드가 수신되는 사용자 장비 디바이스와 연관된 식별 스트링을 결정하도록;
    세대 사용자 정보에 대한 질의를 생성하도록 - 상기 질의는 상기 식별 스트링을 포함함 - ; 그리고
    상기 사용자의 세대와 연관된 상기 사용자 정보를 저장하는 원격 서버에 상기 질의를 전송하도록 구성되는 것인, 시스템.
  14. 제13항에 있어서, 상기 제어 회로부는 또한, 상기 사용자 정보를 수신할 때, 상기 사용자 정보를 데이터 구조에 저장하도록 구성되고, 상기 데이터 구조는,
    복수의 엔트리들 - 상기 복수의 엔트리들은 상기 세대 내의 각각의 사용자에 대한 엔트리를 포함함 - ; 및
    각각의 엔트리에 대한 복수의 필드들 - 상기 복수의 필드들은 각자의 사용자와 연관된 인구통계 정보의 각각의 아이템에 대한 필드를 포함함 - 을 포함하는 것인, 시스템.
  15. 제14항에 있어서, 상기 제어 회로부는 또한, 상기 복수의 인구통계들을 상기 사용자 정보 내의 상기 인구통계 정보와 비교할 때,
    상기 복수의 엔트리로부터 제1 엔트리를 리트리브하도록;
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하도록; 그리고
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 것에 기초하여, 상기 복수의 인구통계들로부터 상기 제1 사용자와 연관된 인구통계들과 매칭되는 한 세트의 인구통계 정보를 생성하도록 구성되는 것인, 시스템.
  16. 제15항에 있어서, 상기 제어 회로부는 또한, 상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정할 때,
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하도록; 그리고
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 것에 기초하여, 가장 많은 양의 매칭되는 인구통계 정보를 갖는 둘 이상의 사용자들을 식별하도록 구성되는 것인, 시스템.
  17. 제12항에 있어서, 상기 제어 회로부는 또한, 상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교할 때,
    복수의 사용자 프로파일들을 수신하도록 - 상기 복수의 사용자 프로파일들 내의 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 한 사용자에 대응하고, 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 각자의 사용자가 선호하는 미디어 자산들에 대응하는 복수의 특성들을 포함함 - ;
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하도록; 그리고
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 것에 기초하여 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 결정하도록 구성되는 것인, 시스템.
  18. 제17항에 있어서, 상기 제어 회로부는 또한, 상기 둘 이상의 사용자들로부터 가장 많은 양의 매칭되는 메타데이터를 갖는 사용자를 결정할 때,
    상기 복수의 특성들 중 각각의 특성과 연관된 가중치를 리트리브하도록;
    각각의 특성에 대한 각자의 가중치를 사용하여, 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 계산하도록; 그리고
    가장 많은 양의 매칭되는 특성들을 갖는 매칭되는 사용자를 선택하도록 구성되는 것인, 시스템.
  19. 제12항에 있어서, 상기 제어 회로부는 또한, 상기 사용자가 식별되었다는 상기 표시를 디스플레이를 위해 생성할 때,
    스토리지로부터, 상기 사용자의 프로파일을 리트리브하도록;
    상기 사용자의 프로파일에 기초하여, 상기 사용자가 아바타를 선택했다고 결정하도록; 그리고
    상기 미디어 자산의 일 부분 위에 오버레이되는 상기 아바타를 디스플레이를 위해 생성하도록 구성되는 것인, 시스템.
  20. 제12항에 있어서, 상기 제어 회로부는 또한, 상기 사용자와 연관된 모든 디바이스들 상에 상기 음성 시그니처를 저장하도록 구성되는 것인, 시스템.
  21. 제12항에 있어서, 상기 제어 회로부는 또한,
    상기 음성 시그니처 및 상기 미디어 자산의 표시를 상기 사용자의 음성 프로파일에 저장하도록;
    후속 음성 커맨드를 검출하도록;
    상기 후속 음성 커맨드와 연관된 후속 음성 시그니처가 상기 음성 시그니처와 매칭된다고 결정하도록; 그리고
    상기 후속 음성 커맨드의 내용을 상기 사용자의 음성 프로파일에 저장하도록 구성되는 것인, 시스템.
  22. 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 시스템으로서,
    사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성하기 위한 수단;
    상기 음성 시그니처로부터, 상기 사용자와 연관된 복수의 음성 특성들을 결정하기 위한 수단 - 상기 복수의 음성 특성들은 복수의 인구통계들에 대응함 - ;
    상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하기 위한 수단;
    상기 사용자 정보를 수신하기 위한 수단 - 상기 사용자 정보는 상기 세대 내의 각각의 사용자의 각자의 인구통계 정보를 포함함 - ;
    상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하기 위한 수단;
    상기 비교에 기초하여, 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하기 위한 수단;
    상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여,
    상기 음성 커맨드가 미디어 자산에 대한 요청을 포함한다고 결정하고;
    상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하며;
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 것에 기초하여, 상기 둘 이상의 사용자들 중 제1 사용자가 최상의 매칭을 구성한다고 결정하기 위한 수단; 및
    상기 제1 사용자가 상기 최상의 매칭이라고 결정한 것에 응답하여, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하기 위한 수단
    을 포함하는, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 시스템.
  23. 제22항에 있어서, 상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하기 위한 수단은,
    상기 음성 커맨드가 수신되는 사용자 장비 디바이스와 연관된 식별 스트링을 결정하기 위한 수단;
    세대 사용자 정보에 대한 질의를 생성하기 위한 수단 - 상기 질의는 상기 식별 스트링을 포함함 - ; 및
    상기 사용자의 세대와 연관된 상기 사용자 정보를 저장하는 원격 서버에 상기 질의를 전송하기 위한 수단을 포함하는 것인, 시스템.
  24. 제23항에 있어서, 상기 사용자 정보를 수신하기 위한 수단은, 상기 사용자 정보를 데이터 구조에 저장하기 위한 수단을 더 포함하고, 상기 데이터 구조는,
    복수의 엔트리들 - 상기 복수의 엔트리들은 상기 세대 내의 각각의 사용자에 대한 엔트리를 포함함 - ; 및
    각각의 엔트리에 대한 복수의 필드들 - 상기 복수의 필드들은 각자의 사용자와 연관된 인구통계 정보의 각각의 아이템에 대한 필드를 포함함 - 을 포함하는 것인, 시스템.
  25. 제24항에 있어서, 상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하기 위한 수단은,
    상기 복수의 엔트리로부터 제1 엔트리를 리트리브하기 위한 수단;
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하기 위한 수단; 및
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 것에 기초하여, 상기 복수의 인구통계들로부터 상기 제1 사용자와 연관된 인구통계들과 매칭되는 한 세트의 인구통계 정보를 생성하기 위한 수단을 포함하는 것인, 시스템.
  26. 제25항에 있어서, 상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하기 위한 수단은,
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하기 위한 수단; 및
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 것에 기초하여, 가장 많은 양의 매칭되는 인구통계 정보를 갖는 둘 이상의 사용자들을 식별하기 위한 수단을 포함하는 것인, 시스템.
  27. 제22항에 있어서, 상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하기 위한 수단은,
    복수의 사용자 프로파일들을 수신하기 위한 수단 - 상기 복수의 사용자 프로파일들 내의 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 한 사용자에 대응하고, 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 각자의 사용자가 선호하는 미디어 자산들에 대응하는 복수의 특성들을 포함함 - ;
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하기 위한 수단; 및
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 것에 기초하여 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 결정하기 위한 수단을 포함하는 것인, 시스템.
  28. 제27항에 있어서, 상기 둘 이상의 사용자들로부터 가장 많은 양의 매칭되는 메타데이터를 갖는 사용자를 결정하기 위한 수단은,
    상기 복수의 특성들 중 각각의 특성과 연관된 가중치를 리트리브하기 위한 수단;
    각각의 특성에 대한 각자의 가중치를 사용하여, 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 계산하기 위한 수단; 및
    가장 많은 양의 매칭되는 특성들을 갖는 매칭되는 사용자를 선택하기 위한 수단을 포함하는 것인, 시스템.
  29. 제22항에 있어서, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하기 위한 수단은,
    스토리지로부터, 상기 사용자의 프로파일을 리트리브하기 위한 수단;
    상기 사용자의 프로파일에 기초하여, 상기 사용자가 아바타를 선택했다고 결정하기 위한 수단; 및
    상기 미디어 자산의 일 부분 위에 오버레이되는 상기 아바타를 디스플레이를 위해 생성하기 위한 수단을 포함하는 것인, 시스템.
  30. 제22항에 있어서, 상기 사용자와 연관된 모든 디바이스들 상에 상기 음성 시그니처를 저장하기 위한 수단
    을 더 포함하는, 시스템.
  31. 제22항에 있어서,
    상기 음성 시그니처 및 상기 미디어 자산의 표시를 상기 사용자의 음성 프로파일에 저장하기 위한 수단;
    후속 음성 커맨드를 검출하기 위한 수단;
    상기 후속 음성 커맨드와 연관된 후속 음성 시그니처가 상기 음성 시그니처와 매칭된다고 결정하기 위한 수단; 및
    상기 후속 음성 커맨드의 내용을 상기 사용자의 음성 프로파일에 저장하기 위한 수단
    을 더 포함하는, 시스템.
  32. 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 내부에 인코딩된 비일시적 컴퓨터 판독가능 명령어들을 포함하는 비일시적 컴퓨터 판독가능 매체로서, 상기 명령어들은,
    사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성하기 위한 명령어;
    상기 음성 시그니처로부터, 상기 사용자와 연관된 복수의 음성 특성들을 결정하기 위한 명령어 - 상기 복수의 음성 특성들은 복수의 인구통계들에 대응함 - ;
    상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하기 위한 명령어;
    상기 사용자 정보를 수신하기 위한 명령어 - 상기 사용자 정보는 상기 세대 내의 각각의 사용자의 각자의 인구통계 정보를 포함함 - ;
    상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하기 위한 명령어;
    상기 비교에 기초하여, 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하기 위한 명령어;
    상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여,
    상기 음성 커맨드가 미디어 자산에 대한 요청을 포함한다고 결정하고;
    상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하며;
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 것에 기초하여, 상기 둘 이상의 사용자들 중 제1 사용자가 최상의 매칭을 구성한다고 결정하기 위한 명령어; 및
    상기 제1 사용자가 상기 최상의 매칭이라고 결정한 것에 응답하여, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하기 위한 명령어
    를 포함하는 것인, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 내부에 인코딩된 비일시적 컴퓨터 판독가능 명령어들을 포함하는 비일시적 컴퓨터 판독가능 매체.
  33. 제32항에 있어서, 상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하기 위한 명령어는,
    상기 음성 커맨드가 수신되는 사용자 장비 디바이스와 연관된 식별 스트링을 결정하기 위한 명령어;
    세대 사용자 정보에 대한 질의를 생성하기 위한 명령어 - 상기 질의는 상기 식별 스트링을 포함함 - ; 및
    상기 사용자의 세대와 연관된 상기 사용자 정보를 저장하는 원격 서버에 상기 질의를 전송하기 위한 명령어를 포함하는 것인, 비일시적 머신 판독가능 매체.
  34. 제33항에 있어서, 상기 사용자 정보를 수신하기 위한 명령어는, 상기 사용자 정보를 데이터 구조에 저장하기 위한 명령어를 더 포함하고, 상기 데이터 구조는,
    복수의 엔트리들 - 상기 복수의 엔트리들은 상기 세대 내의 각각의 사용자에 대한 엔트리를 포함함 - ; 및
    각각의 엔트리에 대한 복수의 필드들 - 상기 복수의 필드들은 각자의 사용자와 연관된 인구통계 정보의 각각의 아이템에 대한 필드를 포함함 - 을 포함하는 것인, 비일시적 머신 판독가능 매체.
  35. 제34항에 있어서, 상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하기 위한 명령어는,
    상기 복수의 엔트리로부터 제1 엔트리를 리트리브하기 위한 명령어;
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하기 위한 명령어; 및
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 것에 기초하여, 상기 복수의 인구통계들로부터 상기 제1 사용자와 연관된 인구통계들과 매칭되는 한 세트의 인구통계 정보를 생성하기 위한 명령어를 포함하는 것인, 비일시적 머신 판독가능 매체.
  36. 제35항에 있어서, 상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하기 위한 명령어는,
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하기 위한 명령어; 및
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 것에 기초하여, 가장 많은 양의 매칭되는 인구통계 정보를 갖는 둘 이상의 사용자들을 식별하기 위한 명령어를 포함하는 것인, 비일시적 머신 판독가능 매체.
  37. 제32항에 있어서, 상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하기 위한 명령어는,
    복수의 사용자 프로파일들을 수신하기 위한 명령어 - 상기 복수의 사용자 프로파일들 내의 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 한 사용자에 대응하고, 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 각자의 사용자가 선호하는 미디어 자산들에 대응하는 복수의 특성들을 포함함 - ;
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하기 위한 명령어; 및
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 것에 기초하여 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 결정하기 위한 명령어를 포함하는 것인, 비일시적 머신 판독가능 매체.
  38. 제37항에 있어서, 상기 둘 이상의 사용자들로부터 가장 많은 양의 매칭되는 메타데이터를 갖는 사용자를 결정하기 위한 명령어는,
    상기 복수의 특성들 중 각각의 특성과 연관된 가중치를 리트리브하기 위한 명령어;
    각각의 특성에 대한 각자의 가중치를 사용하여, 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 계산하기 위한 명령어; 및
    가장 많은 양의 매칭되는 특성들을 갖는 매칭되는 사용자를 선택하기 위한 명령어를 포함하는 것인, 비일시적 머신 판독가능 매체.
  39. 제32항에 있어서, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하기 위한 명령어는,
    스토리지로부터, 상기 사용자의 프로파일을 리트리브하기 위한 명령어;
    상기 사용자의 프로파일에 기초하여, 상기 사용자가 아바타를 선택했다고 결정하기 위한 명령어; 및
    상기 미디어 자산의 일 부분 위에 오버레이되는 상기 아바타를 디스플레이를 위해 생성하기 위한 명령어를 포함하는 것인, 비일시적 머신 판독가능 매체.
  40. 제32항에 있어서, 상기 사용자와 연관된 모든 디바이스들 상에 상기 음성 시그니처를 저장하기 위한 명령어를 더 포함하는, 비일시적 머신 판독가능 매체.
  41. 제32항에 있어서,
    상기 음성 시그니처 및 상기 미디어 자산의 표시를 상기 사용자의 음성 프로파일에 저장하기 위한 명령어;
    후속 음성 커맨드를 검출하기 위한 명령어;
    상기 후속 음성 커맨드와 연관된 후속 음성 시그니처가 상기 음성 시그니처와 매칭된다고 결정하기 위한 명령어; 및
    상기 후속 음성 커맨드의 내용을 상기 사용자의 음성 프로파일에 저장하기 위한 명령어
    를 더 포함하는, 비일시적 머신 판독가능 매체.
  42. 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 방법으로서,
    제어 회로부를 사용하여, 사용자로부터 수신되는 음성 커맨드로부터 음성 시그니처를 생성하는 단계;
    상기 제어 회로부를 사용하여 상기 음성 시그니처로부터, 상기 사용자와 연관된 복수의 음성 특성들을 결정하는 단계 - 상기 복수의 음성 특성들은 복수의 인구통계들에 대응함 - ;
    통신 회로부를 사용하여, 상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하는 단계;
    상기 통신 회로부를 사용하여, 상기 사용자 정보를 수신하는 단계 - 상기 사용자 정보는 상기 세대 내의 각각의 사용자의 각자의 인구통계 정보를 포함함 - ;
    상기 제어 회로부를 사용하여, 상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하는 단계;
    상기 제어 회로부를 사용하여 상기 비교하는 단계에 기초하여, 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하는 단계;
    상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정한 것에 응답하여,
    상기 제어 회로부를 사용하여, 상기 음성 커맨드가 미디어 자산에 대한 요청을 포함한다고 결정하는 단계;
    상기 제어 회로부를 사용하여, 상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 단계;
    상기 제어 회로부를 사용하여 상기 미디어 자산과 연관된 상기 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 단계에 기초하여, 상기 둘 이상의 사용자들 중 제1 사용자가 최상의 매칭을 구성한다고 결정하는 단계; 및
    상기 제어 회로부를 사용하여, 상기 제1 사용자가 상기 최상의 매칭이라고 결정한 것에 응답하여, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하는 단계
    를 포함하는, 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자를 식별하기 위한 방법.
  43. 제42항에 있어서, 상기 사용자의 세대와 연관된 사용자 정보에 대한 요청을 전송하는 단계는,
    상기 음성 커맨드가 수신되는 사용자 장비 디바이스와 연관된 식별 스트링을 결정하는 단계;
    세대 사용자 정보에 대한 질의를 생성하는 단계 - 상기 질의는 상기 식별 스트링을 포함함 - ; 및
    상기 사용자의 세대와 연관된 상기 사용자 정보를 저장하는 원격 서버에 상기 질의를 전송하는 단계를 포함하는 것인, 방법.
  44. 제43항에 있어서, 상기 사용자 정보를 수신하는 단계는, 상기 사용자 정보를 데이터 구조에 저장하는 단계를 더 포함하고, 상기 데이터 구조는,
    복수의 엔트리들 - 상기 복수의 엔트리들은 상기 세대 내의 각각의 사용자에 대한 엔트리를 포함함 - ; 및
    각각의 엔트리에 대한 복수의 필드들 - 상기 복수의 필드들은 각자의 사용자와 연관된 인구통계 정보의 각각의 아이템에 대한 필드를 포함함 - 을 포함하는 것인, 방법.
  45. 제44항에 있어서, 상기 복수의 인구통계들을 상기 사용자 정보 내의 인구통계 정보와 비교하는 단계는,
    상기 복수의 엔트리로부터 제1 엔트리를 리트리브하는 단계;
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 단계; 및
    상기 복수의 인구통계들 중 각각의 인구통계를 상기 둘 이상의 사용자들 중 제1 사용자의 대응하는 인구통계와 연관된 필드의 내용과 비교하는 단계에 기초하여, 상기 복수의 인구통계들로부터 상기 제1 사용자와 연관된 인구통계들과 매칭되는 한 세트의 인구통계 정보를 생성하는 단계를 포함하는 것인, 방법.
  46. 제45항에 있어서, 상기 둘 이상의 사용자들과 연관된 인구통계 정보가 상기 복수의 인구통계들과 매칭된다고 결정하는 단계는,
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 단계; 및
    상기 복수의 인구통계들과 매칭되는 상기 제1 사용자와 연관된 인구통계 정보의 양을 상기 복수의 인구통계들과 매칭되는 다른 사용자들과 연관된 인구통계 정보의 양들과 비교하는 단계에 기초하여, 가장 많은 양의 매칭되는 인구통계 정보를 갖는 둘 이상의 사용자들을 식별하는 단계를 포함하는 것인, 방법.
  47. 제42항 내지 제46항 중 어느 한 항에 있어서, 상기 미디어 자산과 연관된 메타데이터를 상기 복수의 인구통계들과 매칭되는 상기 둘 이상의 사용자들 각각의 관심 대상인 미디어 자산들과 연관된 메타데이터와 비교하는 단계는,
    복수의 사용자 프로파일들을 수신하는 단계 - 상기 복수의 사용자 프로파일들 내의 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 한 사용자에 대응하고, 각각의 사용자 프로파일은 상기 둘 이상의 사용자들 중 각자의 사용자가 선호하는 미디어 자산들에 대응하는 복수의 특성들을 포함함 - ;
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 단계; 및
    상기 미디어 자산과 연관된 상기 메타데이터를 상기 대응하는 사용자가 선호하는 미디어 자산들의 특성들과 비교하는 단계에 기초하여 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 결정하는 단계를 포함하는 것인, 방법.
  48. 제47항에 있어서, 상기 둘 이상의 사용자들로부터 가장 많은 양의 매칭되는 메타데이터를 갖는 사용자를 결정하는 단계는,
    상기 복수의 특성들 중 각각의 특성과 연관된 가중치를 리트리브하는 단계;
    각각의 특성에 대한 각자의 가중치를 사용하여, 상기 둘 이상의 사용자들 중 각각의 사용자에 대해, 매칭되는 특성들의 양을 계산하는 단계; 및
    가장 많은 양의 매칭되는 특성들을 갖는 매칭되는 사용자를 선택하는 단계를 포함하는 것인, 방법.
  49. 제42항 내지 제48항 중 어느 한 항에 있어서, 상기 사용자가 식별되었다는 표시를 디스플레이를 위해 생성하는 단계는,
    스토리지로부터, 상기 사용자의 프로파일을 리트리브하는 단계;
    상기 사용자의 프로파일에 기초하여, 상기 사용자가 아바타를 선택했다고 결정하는 단계; 및
    상기 미디어 자산의 일 부분 위에 오버레이되는 상기 아바타를 디스플레이를 위해 생성하는 단계를 포함하는 것인, 방법.
  50. 제42항 내지 제49항 중 어느 한 항에 있어서, 상기 사용자와 연관된 모든 디바이스들 상에 상기 음성 시그니처를 저장하는 단계
    를 더 포함하는, 방법.
  51. 제42항 내지 제50항 중 어느 한 항에 있어서,
    상기 음성 시그니처 및 상기 미디어 자산의 표시를 상기 사용자의 음성 프로파일에 저장하는 단계;
    후속 음성 커맨드를 검출하는 단계;
    상기 후속 음성 커맨드와 연관된 후속 음성 시그니처가 상기 음성 시그니처와 매칭된다고 결정하는 단계; 및
    상기 후속 음성 커맨드의 내용을 상기 사용자의 음성 프로파일에 저장하는 단계
    를 더 포함하는, 방법.
KR1020207019382A 2017-12-27 2017-12-27 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들 KR102451348B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2017/068581 WO2019132896A1 (en) 2017-12-27 2017-12-27 Systems and methods for identifying users based on voice data and media consumption data

Publications (2)

Publication Number Publication Date
KR20200101934A true KR20200101934A (ko) 2020-08-28
KR102451348B1 KR102451348B1 (ko) 2022-10-06

Family

ID=61018017

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207019382A KR102451348B1 (ko) 2017-12-27 2017-12-27 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들

Country Status (9)

Country Link
US (3) US10937431B2 (ko)
EP (2) EP4246508A3 (ko)
JP (1) JP7127131B2 (ko)
KR (1) KR102451348B1 (ko)
CN (1) CN111527541A (ko)
AR (1) AR113680A1 (ko)
AU (1) AU2017444907B2 (ko)
CA (1) CA3083453A1 (ko)
WO (1) WO2019132896A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022035131A1 (ko) 2020-08-13 2022-02-17 주식회사 엘지에너지솔루션 배터리 관리 시스템, 배터리 관리 방법, 배터리 팩 및 전기 차량

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3963894A4 (en) * 2019-05-01 2023-01-25 The Nielsen Company (US), LLC. NEURAL NETWORK PROCESSING OF RETURN PATH DATA FOR ESTIMATION OF DEMOGRAPHIC DATA OF HOUSEHOLD MEMBERS AND VISITORS
KR20210001529A (ko) * 2019-06-28 2021-01-06 엘지전자 주식회사 로봇, 그와 연결되는 서버, 및 로봇을 이용한 음성 인식 방법
US20210304259A1 (en) * 2020-03-31 2021-09-30 Salesforce.Com, Inc. Methods and systems for delivery of customized content via voice recognition
EP4057165A1 (de) * 2021-03-11 2022-09-14 Deutsche Telekom AG Sprachassistenzsteuerung
EP4202738A1 (de) * 2021-12-22 2023-06-28 Deutsche Telekom AG Nutzeridentifikation anhand einer spracheingabe
US11641505B1 (en) * 2022-06-13 2023-05-02 Roku, Inc. Speaker-identification model for controlling operation of a media player

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040105999A (ko) * 2003-06-10 2004-12-17 온오프코리아 주식회사 네트워크 기반 소리 아바타 생성 방법 및 시스템
US20100169091A1 (en) * 2008-12-30 2010-07-01 Motorola, Inc. Device, system and method for providing targeted advertisements and content
KR20110100008A (ko) * 2010-03-03 2011-09-09 한국전자통신연구원 연령 및 성별을 이용한 사용자 인식 장치 및 방법
KR20140079328A (ko) * 2012-12-18 2014-06-26 삼성전자주식회사 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치
WO2014199602A1 (ja) * 2013-06-10 2014-12-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 話者識別方法、話者識別装置及び情報管理方法
EP3257043B1 (en) * 2015-02-11 2018-12-12 Bang & Olufsen A/S Speaker recognition in multimedia system

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6239794B1 (en) 1994-08-31 2001-05-29 E Guide, Inc. Method and system for simultaneously displaying a television program and information about the program
US7613659B1 (en) * 1994-11-28 2009-11-03 Yt Acquisition Corporation System and method for processing tokenless biometric electronic transmissions using an electronic rule module clearinghouse
US6564378B1 (en) 1997-12-08 2003-05-13 United Video Properties, Inc. Program guide system with browsing display
CN1867068A (zh) 1998-07-14 2006-11-22 联合视频制品公司 交互式电视节目导视系统及其方法
AR020608A1 (es) 1998-07-17 2002-05-22 United Video Properties Inc Un metodo y una disposicion para suministrar a un usuario acceso remoto a una guia de programacion interactiva por un enlace de acceso remoto
PT1986425E (pt) 1998-07-17 2014-07-24 United Video Properties Inc Sistema de guia de programas de televisão interactivo que tem múltiplos dispositivos dentro de uma zona habitacional
US7165098B1 (en) 1998-11-10 2007-01-16 United Video Properties, Inc. On-line schedule system with personalization features
JP3735209B2 (ja) 1999-03-03 2006-01-18 富士通株式会社 話者認識装置及び方法
CN108053844B (zh) 2001-02-21 2020-12-22 乐威指南公司 具有个人视频记录特征的交互式节目导视器的系统和方法
US20100153885A1 (en) 2005-12-29 2010-06-17 Rovi Technologies Corporation Systems and methods for interacting with advanced displays provided by an interactive media guidance application
US7627641B2 (en) * 2006-03-09 2009-12-01 Watchguard Technologies, Inc. Method and system for recognizing desired email
US20080092156A1 (en) * 2006-09-29 2008-04-17 United Video Properties, Inc. Systems and methods for automatically identifying a user profile
US8442824B2 (en) * 2008-11-26 2013-05-14 Nuance Communications, Inc. Device, system, and method of liveness detection utilizing voice biometrics
US20100169809A1 (en) 2008-12-31 2010-07-01 Mccarthy Ann Lerene Method And System For Managing Visually Related Multimedia Information By Means Of Dimensional Classification
CN102404287A (zh) * 2010-09-14 2012-04-04 盛乐信息技术(上海)有限公司 用数据复用法确定声纹认证阈值的声纹认证系统及方法
US9031848B2 (en) * 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source
US9299350B1 (en) * 2013-03-15 2016-03-29 Amazon Technologies, Inc. Systems and methods for identifying users of devices and customizing devices to users
US11170089B2 (en) * 2013-08-22 2021-11-09 Staton Techiya, Llc Methods and systems for a voice ID verification database and service in social networking and commercial business transactions
US9426525B2 (en) * 2013-12-31 2016-08-23 The Nielsen Company (Us), Llc. Methods and apparatus to count people in an audience
US10127911B2 (en) * 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10165322B2 (en) * 2014-09-30 2018-12-25 Rovi Guides, Inc. Methods and systems for controlling user devices
US10067985B2 (en) * 2015-03-05 2018-09-04 Telenav, Inc. Computing system with crowd-source mechanism and method of operation thereof
WO2017106072A2 (en) * 2015-12-17 2017-06-22 Technicolor Usa, Inc. Personalized presentation enhancement using augmented reality
US9826306B2 (en) * 2016-02-22 2017-11-21 Sonos, Inc. Default playback device designation
US10026403B2 (en) * 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
WO2018106971A1 (en) * 2016-12-07 2018-06-14 Interactive Intelligence Group, Inc. System and method for neural network based speaker classification
KR20180074316A (ko) * 2016-12-23 2018-07-03 삼성전자주식회사 장소 정보를 제공하기 위한 시스템 및 이를 지원하는 방법 및 전자 장치
CA3046058A1 (en) * 2016-12-27 2018-07-05 Rovi Guides, Inc. Systems and methods for dynamically adjusting media output based on presence detection of individuals
US20180204133A1 (en) * 2017-01-18 2018-07-19 Facebook, Inc. Demographic prediction for users in an online system with unidirectional connection
US10522154B2 (en) * 2017-02-13 2019-12-31 Google Llc Voice signature for user authentication to electronic device
US10438594B2 (en) * 2017-09-08 2019-10-08 Amazon Technologies, Inc. Administration of privileges by speech for voice assistant system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040105999A (ko) * 2003-06-10 2004-12-17 온오프코리아 주식회사 네트워크 기반 소리 아바타 생성 방법 및 시스템
US20100169091A1 (en) * 2008-12-30 2010-07-01 Motorola, Inc. Device, system and method for providing targeted advertisements and content
KR20110100008A (ko) * 2010-03-03 2011-09-09 한국전자통신연구원 연령 및 성별을 이용한 사용자 인식 장치 및 방법
KR20140079328A (ko) * 2012-12-18 2014-06-26 삼성전자주식회사 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치
WO2014199602A1 (ja) * 2013-06-10 2014-12-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 話者識別方法、話者識別装置及び情報管理方法
EP3257043B1 (en) * 2015-02-11 2018-12-12 Bang & Olufsen A/S Speaker recognition in multimedia system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022035131A1 (ko) 2020-08-13 2022-02-17 주식회사 엘지에너지솔루션 배터리 관리 시스템, 배터리 관리 방법, 배터리 팩 및 전기 차량

Also Published As

Publication number Publication date
AU2017444907A1 (en) 2020-06-11
AU2017444907B2 (en) 2023-08-17
EP4246508A2 (en) 2023-09-20
US20230402042A1 (en) 2023-12-14
CN111527541A (zh) 2020-08-11
EP3732675B1 (en) 2023-05-03
US11798565B2 (en) 2023-10-24
KR102451348B1 (ko) 2022-10-06
US20210233542A1 (en) 2021-07-29
JP7127131B2 (ja) 2022-08-29
US20200395021A1 (en) 2020-12-17
AR113680A1 (es) 2020-05-27
EP3732675A1 (en) 2020-11-04
CA3083453A1 (en) 2019-07-04
JP2021516356A (ja) 2021-07-01
WO2019132896A1 (en) 2019-07-04
EP4246508A3 (en) 2023-11-15
US10937431B2 (en) 2021-03-02

Similar Documents

Publication Publication Date Title
US11818439B2 (en) Methods and systems for recommending to a first user media assets for inclusion in a playlist for a second user based on the second user's viewing activity
KR20200015582A (ko) 다수의 음성-동작 사용자 디바이스들에 대한 볼륨-기반 응답을 생성하기 위한 시스템들 및 방법들
KR102451348B1 (ko) 음성 데이터 및 미디어 소비 데이터에 기초하여 사용자들을 식별하기 위한 시스템들 및 방법들
AU2016256358A1 (en) Systems and methods for updating a knowledge graph through user input
US11381878B2 (en) System and methods for recommending a media asset relating to a character unknown to a user
US10747799B2 (en) Systems and methods for correcting a voice query based on a subsequent voice query with a lower pronunciation rate
US11109110B2 (en) Systems and methods for conflict detection based on user preferences
US20210211773A1 (en) Methods and systems for receiving ratings from a third-party source of ratings
US10405062B2 (en) Systems and methods for generating a set of custom keywords based on a media asset

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant