CN111527541A - 基于语音数据和媒体消费数据识别用户的系统和方法 - Google Patents
基于语音数据和媒体消费数据识别用户的系统和方法 Download PDFInfo
- Publication number
- CN111527541A CN111527541A CN201780097947.0A CN201780097947A CN111527541A CN 111527541 A CN111527541 A CN 111527541A CN 201780097947 A CN201780097947 A CN 201780097947A CN 111527541 A CN111527541 A CN 111527541A
- Authority
- CN
- China
- Prior art keywords
- user
- demographic
- users
- determining
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000004891 communication Methods 0.000 claims description 54
- 238000003860 storage Methods 0.000 claims description 45
- 230000004044 response Effects 0.000 claims description 28
- 230000009471 action Effects 0.000 description 26
- 230000008569 process Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 9
- 230000002452 interceptive effect Effects 0.000 description 9
- 238000009826 distribution Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000003825 pressing Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 244000187656 Eucalyptus cornuta Species 0.000 description 1
- 229910021417 amorphous silicon Inorganic materials 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007177 brain activity Effects 0.000 description 1
- 239000002041 carbon nanotube Substances 0.000 description 1
- 229910021393 carbon nanotube Inorganic materials 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000002772 conduction electron Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910021420 polycrystalline silicon Inorganic materials 0.000 description 1
- 229920005591 polysilicon Polymers 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/45—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying users
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/61—Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/65—Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on users' side
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本文公开了用于基于语音数据和媒体消费数据来识别用户的系统和方法。媒体指南应用可以根据用户的输入生成语音签名,并基于该签名来识别用户的一些人口统计特征(例如,年龄、性别和其它合适的特征)。媒体指南应用可以检索与用户的家庭相关联的用户的用户数据,并尝试识别哪个用户说出了命令。如果基于人口统计特征识别出多个用户,那么媒体指南应用可以使用语音命令的内容(例如,所请求的媒体类型)来识别用户。
Description
背景技术
在最近几年中,每个家庭中的媒体消费设备的数量急剧增加。随着越来越多的用户从家庭中的各种设备消费媒体,与用户用来消费内容的设备无关地识别每个用户正在消费的内容可能是有用的。当前系统解决该问题的一种方式是通过在用户说出请求内容的语音命令时启用语音识别。一旦接收到语音命令,当前系统将从语音命令中提取的用户声纹与先前存储的声纹进行比较,以获得匹配结果。但是,如果没有存储可以用于比较声纹的声纹,那么这种处理将失败。
发明内容
因此,本文公开了用于基于语音数据和媒体消费数据来识别用户的系统和方法。媒体指南应用可以用于基于语音数据和媒体消费数据执行与识别用户相关的操作。媒体指南应用可以根据用户的输入生成语音签名,并基于该签名来识别用户的一些人口统计特征(例如,年龄、性别和其它合适的特征)。媒体指南应用可以检索与用户的家庭相关联的用户的用户数据,并尝试识别哪个用户说出了命令。如果基于人口统计特征识别出多个用户,那么媒体指南应用可以使用命令的内容(例如,所请求的媒体类型)来识别用户。
例如,家庭可以包括丈夫、妻子和两个都是男孩的孩子,一个是9岁,另一个是15岁。其中一个男孩可能说出PG-13电影“Avatar”的命令。作为响应,媒体指南应用可以分析孩子的语音并确定孩子是六岁至十六岁之间的男性。媒体指南应用可以获得家庭的用户信息,并基于该信息确定第一个孩子或者第二个孩子说出了命令(例如,因为据推测父母双方年龄都在十六岁以上)。为了确定哪个孩子说出了命令,媒体指南应用可以将“Avatar”识别为所请求的媒体资产。媒体指南应用可以将电影“Avatar”的特征与每个孩子的首选媒体特征(例如,从他们各自的简档中获得)进行比较,并基于该信息确定年龄较大的孩子是说出命令的孩子。
在一些方面,媒体指南应用可以执行以下动作,以便基于语音数据和媒体消费数据来识别用户。媒体指南应用可以根据从用户接收到的语音命令来生成语音签名。例如,媒体指南应用可以接收语音命令“播放Avatar”。一旦接收到命令,媒体指南应用可以为用户生成语音签名(例如,语音输入中使得能够进行人口统计信息检测的部分)。
媒体指南应用可以分析语音签名以识别说话者的人口统计特征。具体而言,媒体指南应用可以从语音签名中确定与用户相关联的多个语音特征,其中多个语音特征对应于多个人口统计学特征。例如,媒体指南应用可以从语音签名中确定说话者年龄在六岁到十四岁之间,并且说话者是男性。
媒体指南应用可以尝试获得家庭(例如,接收用户语音输入的设备的家庭)中的用户的用户信息。具体而言,媒体指南应用可以发送对与用户的家庭相关联的用户信息的请求。例如,媒体指南应用可以发送包括用于用户信息的家庭标识符的请求。
响应于对用户信息的请求,媒体指南应用可以接收所请求的家庭信息。具体而言,媒体指南应用可以接收用户信息,其中用户信息包括家庭中每个用户的各自的人口统计信息。例如,媒体指南应用可以接收指示家庭包括四个用户的信息。即,可能的用户可以包括四十六岁的男性、四十四岁的女性以及另外两个年龄分别为八岁和十四岁的男性。
媒体指南应用可以将从语音签名中提取的人口统计信息与接收到的人口统计学家庭信息进行比较。具体而言,媒体指南应用可以将多个人口统计学特征与用户信息内的人口统计信息进行比较。例如,媒体指南应用可以将语音签名的性别(例如,男性)与可能的用户的性别进行比较,并确定女性不匹配。媒体指南应用可以将用户的年龄与从语音签名中提取的年龄范围进行比较。
作为比较的结果,媒体指南应用可以识别可能与语音签名匹配的多个用户。具体而言,媒体指南应用可以基于比较确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配。例如,媒体指南应用可以确定两个男孩是家庭中满足条件的仅有成员。
响应于匹配多个身份,媒体指南应用可以使用命令的内容来识别哪个用户是说话者。具体而言,媒体指南应用可以响应于确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配而执行以下动作。媒体指南应用可以确定语音命令包括对媒体资产(例如,电影“Avatar”)的请求,并将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较。例如,媒体指南应用可以检索每个男孩的简档,并将每个简档中的数据和与电影“Avatar”相关联的元数据进行比较。
媒体指南应用可以基于比较来识别最可能的说话者。具体而言,媒体指南应用可以基于将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较来确定两个或更多个用户中的第一用户构成最佳匹配。例如,媒体指南应用可以确定年长男孩(14岁)简档中的数据比年长男孩的简档更匹配电影“Avatar”的元数据。
媒体指南应用可以生成用于显示的某种类型的指示符,以通知观看者说话者已经被识别。具体而言,媒体指南应用可以响应于确定第一用户是最佳匹配而生成用于显示的用户已经被识别的指示。例如,媒体指南应用可以生成用于显示的用户照片的图标、用户头像(avatar)的图标、用户的名字或其它合适的指示符。
在一些实施例中,媒体指南应用可以通过采取以下动作来发送对与用户的家庭相关联的用户信息的请求。媒体指南应用可以检索接收到语音命令的用户设备的标识串。具体而言,媒体指南应用可以确定与其中接收到语音命令的用户装备设备相关联的标识串。例如,媒体指南应用可以检索表示设备序列号的字母数字串。
媒体指南应用可以使用标识串来建立对家庭信息的查询。具体而言,媒体指南应用可以生成针对家庭用户信息的查询,其中该查询包括标识串。例如,媒体指南应用可以使用表示设备序列号的字母数字串来生成数据库搜索查询。
媒体指南应用可以将生成的查询发送到存储适当信息的服务器。具体而言,媒体指南应用可以将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。例如,与用户的家庭相关联的用户信息可以存储在远程位置处的数据库服务器上。媒体指南应用可以通过互联网发送查询。
在一些实施例中,媒体指南应用可以在接收到用户信息时将用户信息存储在数据结构中。数据结构可以包括多个条目,其中多个条目包括针对家庭中每个用户的条目。例如,媒体指南应用可以将数据结构存储为表,其中该表包括针对每个条目的行。媒体指南应用可以为每个条目存储多个字段,其中该多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。例如,表可以包括条目,条目包括用于年龄(例如,十四岁)和性别(例如,男性)的字段。
在一些实施例中,媒体指南应用可以在将多个人口统计学特征与用户信息内的人口统计信息进行比较时执行以下动作。媒体指南应用可以从多个条目中检索第一条目。例如,媒体指南应用可以检索上述例示的条目,其中年龄字段的值为14,性别字段的值为男性(male)。
媒体指南应用可以将接收到的人口统计信息与从语音命令提取的人口统计学特征进行比较。具体而言,媒体指南应用可以将多个人口统计学特征中的每个人口统计学特征和与两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较。例如,媒体指南应用可以将从语音命令提取的年龄范围(例如,六到十六)与接收到的条目的年龄字段(例如,十四)进行比较。媒体指南应用还可以将从语音命令中提取的年龄范围与其它条目的年龄(即,家庭中其它用户的年龄)字段进行比较。
媒体指南应用可以基于人口统计学特征比较来识别匹配的用户。具体而言,媒体指南应用可以基于将多个人口统计学特征中的每个人口统计学特征和与两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较来从多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。例如,媒体指南应用可以生成包括第一用户(例如,十四岁的男性)和第二用户(例如,八岁的男性)的集合。
在一些实施例中,媒体指南应用可以在确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配时,执行以下动作。媒体指南应用可以将与匹配多个人口统计学特征的第一用户相关联的人口统计信息量和与匹配多个人口统计学特征的其它用户相关联的人口统计信息量进行比较。例如,媒体指南应用可以针对每个表条目将匹配语音命令中的人口统计信息的多个字段与在其它表条目中匹配的多个字段进行比较。
媒体指南应用可以识别多个匹配的人口统计信息集合。具体而言,媒体指南应用可以基于将与匹配多个人口统计学特征的第一用户相关联的人口统计信息量和与匹配多个人口统计学特征的其它用户相关联的人口统计信息量进行比较来识别匹配的具有最高人口统计信息量的两个或更多个用户。例如,媒体指南应用可以确定男孩的两个条目构成最高匹配信息量。
在一些实施例中,媒体指南应用可以在将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较时,执行以下动作。
媒体指南应用可以接收多个用户简档,其中多个用户简档中的每个用户简档对应于两个或更多个用户中的一个用户,并且其中每个用户简档包括与两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征。例如,媒体指南应用可以检索每个识别出的用户的用户简档。用户简档可以包括指示用户偏好的内容的类型的信息。
媒体指南应用可以基于用户的简档,确定先前识别出的哪个用户基于人口统计信息与语音命令匹配。具体而言,媒体指南应用可以将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较。例如,媒体指南应用可以将电影“Avatar”的元数据与对应用户简档中存储的用户的偏好进行比较。
媒体指南应用可以基于比较为每个用户简档识别与媒体资产的元数据匹配的特征量。具体而言,媒体指南应用可以基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较来为两个或更多个用户中的每个用户确定匹配的特征量。例如,十四岁孩子的简档可以与父母指导等级(例如,PG-13)和体裁(例如,动作-冒险)匹配,而七岁孩子的简档可以仅与体裁匹配。
在一些实施例中,媒体指南应用可以在从两个或更多个用户确定具有最高匹配元数据量的用户时,执行以下动作。媒体指南应用可以检索与多个特征中的每个特征相关联的权重。例如,体裁特征可以具有比父母指导等级(例如,PG-13)特征更高的权重。
媒体指南应用可以将对应的权重应用于每个特征以确定最佳匹配。具体而言,媒体指南应用可以使用每个特征的相应权重针对两个或更多个用户中的每个用户计算匹配的特征量。例如,体裁的权重可以是.75,而父母指导等级的权重可以是.25。媒体指南应用可以通过将这些权重应用于特征来确定最终的匹配的特征量。
媒体指南应用可以选择具有最高匹配特征量的匹配用户。例如,如果十四岁孩子的最终匹配分数为1.00(例如,父母指导等级.25加上体裁.75),并且七岁孩子的匹配分数为.75(例如,体裁.75),那么媒体指南应用可以选择十四岁孩子作为语音命令的说话者。在一些实施例中,除了或代替命令内容匹配,媒体指南应用可以使用命令的上下文。例如,媒体指南应用可以使用与命令相关联的一天中的时间。如果命令是在其中一个孩子在幼儿园而第二个孩子已经放学的时间期间(例如,下午4点)说出的,那么媒体指南应用可以将第二个孩子识别为说话者。媒体指南应用可以使用其它上下文数据进行识别。媒体指南应用可以使用季节、月份、一周中的几天以及其它合适的上下文。
在一些实施例中,媒体指南应用可以在生成用于显示的用户已经被识别的指示时,采取以下动作。媒体指南应用可以从存储装置中检索用户的简档。例如,媒体指南应用可以从机顶盒或远程服务器检索用户设置。
媒体指南应用可以基于用户的简档来确定用户已经选择头像。例如,用户的简档可以包括用户偏好的头像的标识。媒体指南应用可以生成用于显示的覆盖在一部分媒体资产上的头像。例如,用户的头像可以是可以在屏幕上显示的电影“Avatar”的角色的图片。
在一些实施例中,媒体指南应用可以将语音签名存储在与用户相关联的所有设备上。例如,除了多个机顶盒(例如,在家庭的多个房间中)之外,用户还可能具有电子平板电脑。媒体指南应用可以将语音签名发送到所有设备,以供以后使用。
在一些实施例中,媒体指南应用可以使用语音签名更新用户的简档。具体而言,媒体指南应用可以在用户的语音简档中存储语音签名和媒体资产的指示,并且一旦检测到后续语音命令,就确定与后续语音命令相关联的后续语音签名与该语音签名匹配。媒体指南应用可以将后续语音命令的内容存储在用户的语音简档中。例如,媒体指南应用可以存储被识别为属于十四岁男孩的语音签名,并且当十四岁男孩输入另一个语音命令(例如,播放终止者)时,媒体指南应用可以将媒体内容的指示添加到用户的简档。
在一些实施例中,媒体指南应用可以识别不是家庭成员的用户。例如,家庭中用户的来访亲戚或朋友可能说出要由媒体指南应用执行的命令。为了识别不是家庭成员的用户,媒体指南应用可以确定是否先前已经识别家庭中的所有用户。例如,如果家庭有四个用户(父母双方和两个孩子)并且之前已经识别四个用户,那么媒体指南应用可以确定新用户是访客。但是,如果尚未识别出家庭的所有用户,那么媒体指南应用可以在确定中使用使用频率。例如,如果正在说出命令的用户不是系统的频繁用户(例如,首次说话者或第二次说话者),那么媒体指南应用可以确定该用户不是家庭的成员(例如,访客)。相反,如果用户经常使用系统(例如,二十次或更多次),那么媒体指南应用可以确定该用户是家庭成员。
如果用户不是家庭成员,那么媒体指南应用可以为该用户设置访客简档。在一些实施例中,媒体指南应用可以要求用户输入用户的凭据以进行识别或要求用户输入人口统计信息。在又一些实施例中,媒体指南应用可以尝试使用其它方式来识别访客。例如,媒体指南应用可以分析访客的语音以获得人口统计数据,并尝试使用与家庭成员相关联的简档(例如,社交媒体简档)来识别访客。例如,如果访客可能是可能在社交媒体上与家庭成员相关连的祖父。媒体指南应用可以使用该信息来识别该人。
在一些实施例中,媒体指南应用可以将语音命令与人口统计信息一起使用,以便为用户生成完整的简档。例如,媒体指南应用可以从用户接收命令,并基于该语音命令来识别用户。具体而言,媒体指南应用可以将存储在媒体指南应用内的与用户相关联的语音样本与语音命令进行比较来识别用户。媒体指南应用可以从远程位置检索与家庭用户相关联的人口统计信息,并将从语音命令中提取的人口统计信息与接收到的人口统计信息进行比较。媒体指南应用可以基于比较来识别用户。媒体指南应用可以将从远程服务器接收到的人口统计信息复制到用户的简档,以使用户的简档尽可能完整。
附图说明
通过结合附图考虑以下详细描述,本公开的上述和其它目的和优点将变得显而易见,其中相同的附图标记通篇指代相同的部分,并且其中:
图1示出了根据本公开的一些实施例的数据结构的说明性示例,该数据结构包括从语音签名提取的人口统计信息和家庭中的用户的人口统计数据;
图2示出了根据本公开的一些实施例的用于访问媒体内容的显示屏幕的说明性示例;
图3示出了根据本公开的一些实施例的用于访问媒体内容的显示屏幕的另一个说明性示例;
图4是根据本公开的一些实施例的说明性用户装备设备的框图;
图5是根据本公开的一些实施例的说明性媒体系统的框图;
图6是根据本公开的一些实施例的用于基于语音数据和媒体消费数据来识别用户的说明性动作的流程图;
图7是根据本公开的一些实施例的用于基于语音数据和媒体消费数据来识别用户的说明性动作的另一个流程图;
图8是根据本公开的一些实施例的用于确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配的说明性动作的流程图;以及
图9是根据本公开的一些实施例的用于将语音签名与用户匹配的说明性动作的流程图。
具体实施方式
本文公开了用于基于语音数据和媒体消费数据来识别用户的系统和方法。在一些实施例中,媒体指南应用可以根据用户的输入生成语音签名,并基于该签名来识别用户的一些人口统计特征(例如,年龄、性别和其它合适的特征)。媒体指南应用可以检索与用户的家庭相关联的用户的用户数据,并尝试识别哪个用户说出了命令。如果基于人口统计特征识别出多个用户,那么媒体指南应用可以使用语音命令的内容(例如,所请求的媒体类型)来识别用户。
在一些实施例中,媒体指南应用可以执行以下动作,以便基于语音数据和媒体消费数据来识别用户。媒体指南应用可以根据从用户接收到的语音命令来生成语音签名。例如,媒体指南应用可以接收来自用户的口语命令。一旦接收到命令,媒体指南应用就可以为用户生成语音签名(例如,语音输入中使得能够进行人口统计信息检测的部分)。
媒体指南应用可以分析语音签名以识别说话者的人口统计特征。具体而言,媒体指南应用可以从语音签名中确定与用户相关联的多个语音特征,其中多个语音特征对应于多个人口统计学特征。例如,媒体指南应用可以分析语音签名以寻找与特定性别和年龄范围相关联的特定特征。媒体指南应用可以将该信息存储在数据结构中(例如,在数据结构100中)。图1的数据结构100可以包括多个字段类型102。字段类型102可以包括语音签名字段,该语音签名字段可以包括表示语音签名的二进制或十六进制数据。应当注意的是,语音签名可以被存储为另一种合适类型的数据。字段102还可以包括性别字段、年龄范围字段和其它合适的人口统计学特征字段。在一些实施例中,数据结构100可以包括与语音命令相关联的上下文字段。例如,命令的日期/时间、说出命令的位置以及其它合适的上下文数据。数据结构100可以包括多个条目104。每个条目104可以包括从语音签名中提取的人口统计数据(例如,性别值、年龄范围值和其它合适的人口统计数据值)。应当注意的是,数据结构100和120可以包括用于其它人口统计数据的单独的字段,其中一种人口统计数据类型对应于一个字段。
媒体指南应用可以尝试获得家庭(例如,接收用户语音输入的设备的家庭)中的用户的用户信息。具体而言,媒体指南应用可以发送对与用户的家庭相关联的用户信息的请求。例如,媒体指南应用可以发送包括用于用户信息的家庭标识符的请求。
响应于对用户信息的请求,媒体指南应用可以接收家庭信息。具体而言,媒体指南应用可以接收用户信息,其中用户信息包括家庭中每个用户的各自的人口统计信息。例如,媒体指南应用可以接收包括多个条目、每个条目用于一个家庭成员的数据结构。图1的数据结构120可以用作这种数据结构的说明性示例。字段类型122可以包括用户ID字段(例如,字母数字串、数字或十六进制数字)、性别字段和年龄字段。应当注意的是,该数据结构中的年龄字段是特定数字。在一些实施例中,年龄字段可以包括用户的出生日期而不是年龄。其它人口统计数据也可以存储在数据结构中。数据结构120可以包括具有针对每种字段类型的字段值的条目124。例如,用户1可以是用户ID值,男性(male)可以是性别,并且十六可以是特定用户的年龄。多个条目124可以存储在数据结构中。
媒体指南应用可以将从语音签名中提取的人口统计信息与接收到的人口统计家庭信息进行比较。具体而言,媒体指南应用可以将多个人口统计学特征与用户信息内的人口统计信息进行比较。例如,媒体指南应用可以将条目104中的性别值与条目124中的性别值进行比较。可以对“年龄”字段和其它人口统计学特征字段进行相同的比较。
作为比较的结果,媒体指南应用可以识别可能与语音签名匹配的多个用户。具体而言,媒体指南应用可以基于比较确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配。例如,媒体指南应用可以确定两个条目124匹配条目104。
响应于匹配多个身份,媒体指南应用可以使用命令的内容来识别哪个用户是说话者。具体而言,媒体指南应用可以响应于确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配而执行以下动作。媒体指南应用可以确定语音命令包括对媒体资产的请求(例如,通过在语音命令上执行言语识别算法),并将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较。例如,媒体指南应用可以检索每个匹配用户的简档。简档可以存储在接收到语音命令的设备的存储器中和/或存储在远程服务器处。每个简档可以包括指示用户的偏好(例如,偏好的体裁、偏好的父母指导等级、喜爱的演员、喜爱的电影或其它合适的偏好)的数据。
媒体指南应用可以基于比较来识别最可能的说话者。具体而言,媒体指南应用可以基于将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较来确定两个或更多个用户中的第一用户构成最佳匹配。例如,媒体指南应用可以确定第一简档中的数据比第二简档中的数据更匹配媒体资产的元数据,因为,例如,第一简档表示对动作-冒险体裁的偏好而第二简档则表示对儿童喜剧的偏好。
媒体指南应用可以生成用于显示的某种类型的指示符,以通知观看者说话者已经被识别。具体而言,媒体指南应用可以响应于确定第一用户是最佳匹配而生成用于显示的用户已经被识别的指示。例如,媒体指南应用可以生成用于显示的用户照片的图标、用户头像的图标、用户的名字或其它合适的指示符。
在一些实施例中,媒体指南应用可以通过采取以下动作来发送对与用户的家庭相关联的用户信息的请求。媒体指南应用可以检索接收到语音命令的用户设备的标识串。具体而言,媒体指南应用可以确定与其中接收到语音命令的用户装备设备相关联的标识串。例如,媒体指南应用可以检索表示设备序列号的字母数字串。
媒体指南应用可以使用标识串来建立对家庭信息的查询。具体而言,媒体指南应用可以生成针对家庭用户信息的查询,其中该查询包括标识串。例如,媒体指南应用可以使用表示设备序列号的字母数字串来生成数据库搜索查询。
媒体指南应用可以将生成的查询发送到存储适当信息的服务器。具体而言,媒体指南应用可以将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。例如,与用户的家庭相关联的用户信息可以存储在远程位置处的数据库服务器上。媒体指南应用可以通过互联网发送查询。
在一些实施例中,媒体指南应用可以在接收到用户信息时将用户信息存储在数据结构中。数据结构可以包括多个条目,其中多个条目包括针对家庭中每个用户的条目。例如,媒体指南应用可以将数据结构存储为表,其中该表包括针对每个条目的行。媒体指南应用可以为每个条目存储多个字段,其中该多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。例如,表可以包括条目(例如,条目124),条目包括用于年龄和性别的字段。
在一些实施例中,媒体指南应用可以在将多个人口统计学特征与用户信息内的人口统计信息进行比较时执行以下动作。媒体指南应用可以从多个条目中检索第一条目。例如,媒体指南应用可以从存储器中检索第一条目:条目124。
媒体指南应用可以将接收到的人口统计信息与从语音命令提取的人口统计学特征进行比较。具体而言,媒体指南应用可以将多个人口统计学特征中的每个人口统计学特征和与两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较。例如,媒体指南应用可以将从语音命令提取的年龄范围(例如,条目104的年龄范围字段)与接收到的条目的年龄字段(例如,条目124的年龄字段)进行比较。媒体指南应用还可以将从语音命令中提取的年龄范围与其它条目的年龄字段(即,家庭中其它用户的年龄)进行比较。
媒体指南应用可以基于人口统计学特征比较来识别匹配的用户。具体而言,媒体指南应用可以基于将多个人口统计学特征中的每个人口统计学特征和与两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较来从多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。例如,媒体指南应用可以生成包括第一用户和第二用户的集合。该集合可以包括用于每个用户的条目124。
在一些实施例中,媒体指南应用可以在确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配时,执行以下动作。媒体指南应用可以将与第一用户相关联的匹配多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配多个人口统计学特征的人口统计信息量进行比较。例如,媒体指南应用可以针对每个条目124将匹配来自语音命令的人口统计信息的多个字段(例如,性别和年龄字段)与在其它表条目中匹配的多个字段进行比较。例如,媒体指南应用可以基于比较确定两个条目具有匹配的两个字段,而两个条目没有匹配的条目。
媒体指南应用可以识别多个匹配的人口统计信息集合。具体而言,媒体指南应用可以基于将与第一用户相关联的匹配多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配多个人口统计学特征的人口统计信息量进行比较来识别具有最高匹配的人口统计信息量的两个或更多个用户。例如,媒体指南应用可以确定两个条目(例如,条目124)构成最高匹配信息量。
在一些实施例中,媒体指南应用可以在将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较时,执行以下动作。媒体指南应用可以接收多个用户简档,其中多个用户简档中的每个用户简档对应于两个或更多个用户中的一个用户,并且其中每个用户简档包括与两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征。例如,媒体指南应用可以从存储器中检索每个识别出的用户的用户简档。用户简档可以包括指示用户偏好的内容类型的信息。例如,每个用户的简档可以包括用户喜欢的媒体资产、偏好的体裁、偏好的演员以及其它合适的偏好。
媒体指南应用可以基于用户的简档确定先前识别出的哪个用户基于人口统计信息与语音命令匹配。具体而言,媒体指南应用可以将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较。例如,媒体指南应用可以检索与媒体资产关联的元数据。可以从本地存储装置(例如,节目列表数据库)或从远程服务器检索元数据。元数据可以包括媒体资产的体裁。媒体指南应用可以将媒体资产的体裁与用户简档中用户的偏好体裁进行比较以确定匹配。可以针对与媒体资产相关联的其它元数据重复该处理(例如,可以将每个演员与用户偏好的演员列表进行比较)。在一些实施例中,代替或除了使用命令的内容来识别用户子集中的一个用户之外,媒体指南应用还可以提示用户进行识别。例如,媒体指南应用可以生成用于显示的与匹配的用户对应的两个或更多个用户标识符,使得说话者能够选择一个。在一些实施例中,媒体指南应用可以向用户说出选择。媒体指南应用可以接收用户对适当标识符的选择。
媒体指南应用可以基于对每个用户简档的比较来识别与媒体资产的元数据匹配的特征量。具体而言,媒体指南应用可以基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较来为两个或更多个用户中的每个用户确定匹配的特征量。例如,一个简档可以匹配体裁,而另一个简档可以匹配体裁、父母指导等级和喜欢的演员。
在一些实施例中,媒体指南应用可以在从两个或更多个用户确定具有最大匹配元数据量的用户时,执行以下动作。媒体指南应用可以检索与多个特征中的每个特征相关联的权重。例如,体裁特征可以具有比父母指导等级特征更高的权重。
媒体指南应用可以将对应的权重应用于每个特征以确定最佳匹配。具体而言,媒体指南应用可以使用每个特征的相应权重针对两个或更多个用户中的每个用户计算匹配的特征量。例如,体裁的权重可以是.75,而父母指导等级的权重可以是.25。媒体指南应用可以通过将这些权重应用于特征来确定最终的匹配的特征量。
媒体指南应用可以选择具有最高匹配特征量的匹配用户。例如,媒体指南应用可以将具有最多匹配特征的用户识别为语音命令的说话者。
在一些实施例中,媒体指南应用可以在生成用于显示的用户已经被识别的指示时,采取以下动作。媒体指南应用可以从存储装置中检索用户的简档。例如,媒体指南应用可以从机顶盒或远程服务器检索用户设置。
媒体指南应用可以基于用户的简档来确定用户已经选择头像。例如,用户的简档可以包括用户偏好的头像的标识。媒体指南应用可以生成用于显示的覆盖在一部分媒体资产上的头像。
在一些实施例中,媒体指南应用可以将语音签名存储在与用户相关联的所有设备上。例如,除了多个机顶盒(例如,在家庭的多个房间中)之外,用户还可能具有电子平板电脑。媒体指南应用可以将语音签名发送到所有设备,以供以后使用。
在一些实施例中,媒体指南应用可以使用语音签名更新用户的简档。具体而言,媒体指南应用可以在用户的语音简档中存储语音签名和媒体资产的指示,并且在检测到后续语音命令时,确定与后续语音命令相关联的后续语音签名与该语音签名匹配。媒体指南应用可以将后续语音命令的内容存储在用户的语音简档中。媒体指南应用可以将信息存储在平板电脑和与用户相关联的其它设备以及可以将信息推送到新获取的设备的服务器的存储器中。
在一些实施例中,媒体指南应用可以识别不是家庭成员的用户。例如,家庭中用户的来访亲戚或朋友可能说出要由媒体指南应用执行的命令。为了识别不是家庭成员的用户,媒体指南应用可以确定是否先前已经识别家庭中的所有用户。例如,媒体指南应用可以遍历家庭中的每个用户并检索用户的相应简档。在一些实施例中,媒体指南应用可以仅访问用户的简档。媒体指南应用可以根据用户简档中的标记来确定用户是否已被识别。如果家庭中的所有用户在简档中均具有已识别该用户的标记,那么媒体指南应用可以确定来访用户正在使用系统。但是,如果尚未识别家庭的所有用户,那么媒体指南应用可以在确定中使用使用频率。例如,媒体指南应用可以将用户的声纹与用于访问系统的其它声纹进行比较。例如,媒体指南应用可以存储用于访问系统的每个声纹和访问频率。如果说出命令的用户不是系统的频繁用户(两次或更少次数),那么媒体指南应用可以确定该用户不是家庭成员(例如,访客)。相反,如果用户经常使用系统(例如,二十次或更多次),那么媒体指南应用可以确定该用户是家庭成员。媒体指南应用还可以将定时与访问频率一起使用。例如,媒体指南应用可以确定特定月份或过去三十天的访问频率。在一些实施例中,媒体指南应用可以基于用户的设备来确定用户是否是访客。如果用户的设备是不经常连接到家庭网络的设备,那么该用户可能是访客。
在一些实施例中,控制电路系统可以基于用户的语音输入的频率来确定用户是访客还是家庭成员。例如,如果特定用户经常在家庭中使用语音输入设备(例如,每月十次),那么控制电路系统可以确定该用户是家庭成员。但是,如果输入频率很小(例如,上个月是一次或两次),那么媒体指南应用可以确定该用户是家庭中的访客。
如果用户不是家庭成员,那么媒体指南应用可以为该用户设置访客简档。在一些实施例中,媒体指南应用可以生成用于显示的用于用户输入用户凭据以进行识别的提示或用于输入人口统计信息的提示。在又一些实施例中,媒体指南应用可以尝试使用其它方式来识别访客。例如,媒体指南应用可以分析用户的语音以获得人口统计数据(如上所述),并尝试使用与家庭成员相关联的简档(例如,社交媒体简档)来识别访客。例如,媒体指南应用可以遍历家庭中每个用户的简档,以识别与每个用户相关联的社交媒体账户。媒体指南应用可以通过比较例如每个用户的社交媒体连接的年龄和性别与语音命令人口统计数据来遍历每个社交媒体账户,以识别访客。
在一些实施例中,媒体指南应用可以将语音命令与人口统计信息一起使用,以便为用户生成完整的简档。例如,媒体指南应用可以从用户接收命令,并基于该语音命令来识别用户。具体而言,媒体指南应用可以将存储在媒体指南应用内的与用户相关联的语音样本与语音命令进行比较来识别用户。媒体指南应用可以从远程位置检索与家庭用户相关联的人口统计信息,并将从语音命令中提取的人口统计信息与接收到的人口统计信息进行比较。例如,媒体指南应用可以检索人口统计数据并将其存储在数据结构120中。媒体指南应用可以基于比较来识别用户。例如,数据结构120的用户1可以对应于数据结构100的6-16岁的男性。媒体指南应用可以将从远程服务器接收到的人口统计信息复制到用户的简档,以使用户的简档尽可能完整。
在任何给定内容交付系统中用户可用的内容量可以很大。因此,许多用户期望通过允许用户高效地导航内容选择并且容易地识别他们可能期望的内容的接口的媒体指南形式。提供这种指南的应用在本文中称为交互式媒体指南应用,或者有时被称为媒体指南应用或指南应用。
交互式媒体指南应用可以基于它们提供指南的内容而采取各种形式。一种典型的媒体指南应用类型是交互式电视节目指南。交互式电视节目指南(有时被称为电子节目指南)是众所周知的指南应用,除其它之外,尤其允许用户在多种类型的内容或媒体资产中导航和定位。交互式媒体指南应用可以生成图形用户接口屏幕,这使用户能够在内容之间导航、定位和选择。如本文所提到的,术语“媒体资产”和“内容”应当被理解为意指电子可消费的用户资产,诸如电视节目安排,以及按次计费节目、点播节目(如在点播视频(VOD)系统中)、互联网内容(例如,流传输内容、可下载内容、网络广播(Webcast)等等)、视频剪辑、音频、内容信息、图片、旋转图像、文档、播放列表、网站、文章、书籍、电子书籍、博客、聊天会话、社交媒体、应用、游戏和/或任何其它媒体或多媒体和/或其组合。指南应用还允许用户在内容之间进行导航和定位。如本文所提到的,术语“多媒体”应当被理解为意指利用上述至少两种不同内容形式(例如文本、音频、图像、视频或交互内容形式)的内容。内容可以被用户装备设备记录、播放、显示或访问,但也可以是实况表演的一部分。
用于执行本文讨论的任何实施例的媒体指南应用和/或任何指令可以被编码在计算机可读介质上。计算机可读介质包括能够存储数据的任何介质。计算机可读介质可以是暂态的,包括但不限于传播的电信号或电磁信号,或者可以是非暂态的,包括但不限于易失性和非易失性计算机存储器或存储设备,诸如硬盘、软盘、USB驱动器、DVD、CD、介质卡、寄存器存储器、处理器高速缓存、随机存取存储器(“RAM”),等等。
随着互联网、移动计算和高速无线网络的出现,用户在他们传统上不访问媒体的用户装备设备上访问媒体。如本文所提到的,短语“用户装备设备”、“用户装备”、“用户设备”、“电子设备”、“电子装备”、“媒体装备设备”或“媒体设备”应当被理解为意指用于访问上述内容的任何设备,诸如电视机、智能TV、机顶盒、用于处理卫星电视的集成接收器解码器(IRD)、数字存储设备、数字媒体接收器(DMR)、数字媒体适配器(DMA)、流传输媒体设备、DVD播放器、DVD记录器、连接的DVD、本地媒体服务器、BLU-RAY播放器、BLU-RAY记录器、个人计算机(PC)、膝上型计算机、平板计算机、WebTV盒、个人计算机电视(PC/TV)、PC媒体服务器、PC媒体中心、手持式计算机、固定电话、个人数字助理(PDA)、移动电话、便携式视频播放器、便携式音乐播放器、便携式游戏机、智能手机或任何其它电视装备、计算装备或无线设备,和/或其组合。在一些实施例中,用户装备设备可以具有面向前方的屏幕和面向后方的屏幕、多个前方屏幕或多个有角度的屏幕。在一些实施例中,用户装备设备可以具有面向前方的摄像机和/或面向后方的摄像机。在这些用户装备设备上,用户可以能够在通过电视机可用的相同内容中进行导航和定位。因此,媒体指南也可以在这些设备上可用。所提供的指南可以用于仅通过电视机可用的内容,用于仅通过一个或多个其它类型的用户装备设备可用的内容,或用于既通过电视机又通过一个或多个其它类型的用户装备设备可用的内容。媒体指南应用可以作为在线应用(即,在网站上提供)或作为用户装备设备上的独立应用或客户端来提供。下面将更详细地描述可以实现媒体指南应用的各种设备和平台。
媒体指南应用的功能之一是向用户提供媒体指南数据。如本文所提到的,短语“媒体指南数据”或“指南数据”应当被理解为意指与在操作指南应用中使用的内容或数据相关的任何数据。例如,指南数据可以包括节目信息、指南应用设置、用户偏好、用户简档信息、媒体列表、媒体相关信息(例如,广播时间、广播频道、标题、描述、评级信息(例如,父母控制评级、评论家的评级,等等)、流派或类别信息、演员信息、用于广播公司或提供商的徽标的徽标数据,等等)、媒体格式(例如,标准清晰度、高清晰度、3D,等等)、点播信息、博客、网站以及有助于用户在期望的内容选择中进行导航和定位的任何其它类型的指南数据。
图2-3示出了可以用于提供媒体指南数据的说明性显示屏幕。图2-3中显示的显示屏幕可以在任何合适的用户装备设备或平台上实现。虽然图2-3的显示被示为全屏显示,但它们也可以完全或部分地覆盖在正在显示的内容上。用户可以通过选择在显示屏幕中提供的可选选项(例如,菜单选项、列表选项、图标、超链接等)或按下遥控器或其它用户输入接口或设备上的专用按钮(例如,GUIDE按钮)来指示访问内容信息的期望。响应于用户的指示,媒体指南应用可以向显示屏提供以若干方式之一组织的媒体指南数据,诸如按网格中的时间和频道、按时间、按频道、按来源、按内容类型、按类别(例如,电影、体育、新闻、儿童或其它节目类别)或其它预定义的、用户定义的或其它组织标准。
图2示出了按照时间和频道布置的节目列表显示200的说明性网格,其也使得能够访问单个显示中的不同类型的内容。显示200可以包括网格202,其具有:(1)频道/内容类型标识符的列204,其中每个频道/内容类型标识符(其是列中的单元格)识别可得到的不同频道或内容类型;和(2)时间标识符的行206,其中每个时间标识符(其是行中的单元格)识别节目的时间块。网格202还包括节目列表的单元格,诸如节目列表208,其中每个列表提供在列表的相关联频道和时间上提供的节目的标题。利用用户输入设备,用户可以通过移动高亮区域210来选择节目列表。可以在节目信息区域212中提供与由高亮区域210选择的节目列表有关的信息。区域212可以包括例如节目标题、节目描述、节目被提供的时间(如果适用的话)、节目所在的频道(如果适用的话)、节目的评级以及其它期望的信息。
除了提供对线性节目的访问(例如,被安排在预定时间发送到多个用户装备设备并且根据时间表提供的内容),媒体指南应用还提供对非线性节目的访问(例如,在任何时间用户装备设备可访问和不按照时间表提供的内容)。非线性节目可以包括来自不同内容源的内容,包括点播内容(例如VOD)、互联网内容(例如,流传输媒体、可下载的媒体等等)、本地存储的内容(例如,存储在如上所述的任何用户装备设备或其它存储设备上的内容)或其它与时间无关的内容。点播内容可以包括电影或由特定内容提供商(例如,提供“TheSopranos”和“Curb Your Enthusiasm”的HBO On Demand)提供的任何其它内容。HBO ONDEMAND是时代华纳(Time Warner)公司L.P.等人拥有的服务标志,并且THE SOPRANOS和CURB YOUR ENTHUSIASM是由Home Box Office公司拥有的商标。互联网内容可以包括web事件(诸如聊天会话或网络广播),或者可通过互联网网站或其它互联网访问(例如,FTP)作为流传输内容或可下载内容按需可得到的内容。
网格202可以提供用于非线性节目的媒体指南数据,包括点播列表214、记录的内容列表216和互联网内容列表218。组合来自不同类型的内容源的内容的媒体指南数据的显示有时被称为“混合媒体”显示。可以被显示的、与显示200不同的媒体指南数据的类型的各种变换(permutations)可以基于用户选择或指南应用定义(例如,仅记录和广播的列表、仅点播和广播的列表等等的显示)。如图所示,列表214、216和218被示为跨越网格202中显示的整个时间块,以指示这些列表的选择可以分别提供对专用于点播列表、记录的列表或互联网列表的显示的访问。在一些实施例中,可以将用于这些内容类型的列表直接包括在网格202中。附加的媒体指南数据可以响应于用户选择导航图标220之一而被显示。(按下用户输入设备上的箭头键可以以与选择导航图标220类似的方式影响显示。)
显示200还可以包括视频区域222和选项区域226。视频区域222可以允许用户收看和/或预览用户当前可用、将可用或曾经可用的节目。视频区域222的内容可以与网格202中显示的列表之一对应或者与其无关。包括视频区域的网格显示有时被称为画中画(PIG)显示。在2003年5月13日授予Satterfield等人的美国专利No.6,564,378和2001年5月29日授予Yuen等人的美国专利No.6,239,794中更详细地描述了PIG显示及其功能,这两个专利的全部内容整体上通过引用并入本文。PIG显示可以被包括在本文描述的实施例的其它媒体指南应用显示屏幕中。
选项区域226可以允许用户访问不同类型的内容、媒体指南应用显示和/或媒体指南应用特征。选项区域226可以是显示200(以及本文描述的其它显示屏幕)的部分,或者可以由用户通过选择屏幕上的选项或按下用户输入设备上的专用或可指派按钮来调用。选项区域226内的可选择选项可以涉及与网格202中的节目列表相关的特征,或者可以包括从主菜单显示中可得到的选项。与节目列表相关的特征可以包括搜索接收节目、记录节目、启用节目的系列记录、将节目和/或频道设置为喜爱、购买节目或其它特征的其它的播放时间(air times)或者方式。从主菜单显示中可得到的选项可以包括搜索选项、VOD选项、父母控制选项、互联网选项、基于云的选项、设备同步选项、第二屏幕设备选项、访问各种类型的媒体指南数据显示的选项、订阅高级服务的选项、编辑用户的简档的选项、访问浏览覆盖层的选项或其它选项。
媒体指南应用可以基于用户的偏好被个性化。个性化的媒体指南应用允许用户定制显示和特征,以创建利用媒体指南应用的个性化“体验”。这种个性化体验可以通过允许用户输入这些定制和/或通过媒体指南应用监视用户活动以确定各种用户偏好来创建。用户可以通过登录或以其它方式向指南应用识别他们自己来访问其个性化指南应用。媒体指南应用的定制可以根据用户简档进行。定制可以包括不同的呈现方案(例如,显示器的颜色方案、文本的字体大小等等)、所显示的内容列表的各个方面(例如,仅HDTV或仅3D节目、基于最喜爱的频道选择的用户指定的广播频道、重新排序频道的显示、推荐的内容等等)、期望的记录特征(例如,针对特定用户的记录或系列记录、记录质量等等)、父母控制设置、互联网内容的定制呈现(例如,社交媒体内容、电子邮件、电子交付的文章等等)以及其它期望的定制。
媒体指南应用可以允许用户提供用户简档信息,或者可以自动编译用户简档信息。媒体指南应用可以例如监视用户访问的内容和/或用户可能与指南应用的其它交互。此外,媒体指南应用可以获得与特定用户相关的其它用户简档的全部或部分(例如,从互联网上用户访问的其它网站(诸如www.Tivo.com)、从用户访问的其它媒体指南应用、从用户访问的其它交互式应用、从用户的另一个用户装备设备等等),和/或从媒体指南应用可以访问的其它源获得关于用户的信息。因此,可以在用户的不同用户装备设备上为用户提供统一的指南应用体验。下面结合图5更详细地描述这种类型的用户体验。在Ellis等人于2005年7月11日提交的美国专利申请公开No.2005/0251827、于2007年1月16日授予Boyer等人的美国专利No.7,165,098以及Ellis等人于2002年2月21日提交的美国专利申请公开No.2002/0174430中更详细地描述了附加的个性化媒体指南应用特征,这些通过引用整体上并入本文。
用于提供媒体指南的另一种显示布置在图3中示出。视频马赛克显示300包括用于基于内容类型、流派和/或其它组织标准组织的内容信息的可选选项302。在显示300中,电视列表选项304被选择,因此提供列表306、308、310和312作为广播节目列表。在显示300中,列表可以提供包括封面艺术的图形图像、来自内容的静止图像、视频剪辑预览、来自内容的实况视频或向用户指示内容由列表中的媒体指南数据描述的其它类型的内容。每个图形列表还可以附带有文本,以提供关于与列表相关联的内容的进一步信息。例如,列表308可以包括多于一个部分,包括媒体部分314和文本部分316。媒体部分314和/或文本部分316可以是可选择的,以全屏收看内容或者收看与媒体部分314中显示的内容相关的信息(例如,收看用于显示视频的频道的列表)。
显示300中的列表具有不同的尺寸(即,列表306大于列表308、310和312),但是如果期望的话,那么所有列表可以是相同的尺寸。列表可以具有不同的尺寸或以图形方式加强,以指示用户感兴趣的程度或者强调某些内容,如内容提供者所期望的或者基于用户偏好。在例如2009年11月12日提交的Yates的美国专利申请公开No.2010/0153885中讨论了用于以图形方式加强内容列表的各种系统和方法,其通过引用整体上并入本文。
用户可以从其一个或多个用户装备设备访问内容和媒体指南应用(及其上面和下面描述的显示屏幕)。图4示出了说明性用户装备设备400的一般化实施例。下面结合图5讨论用户装备设备的更具体的实现。用户装备设备400可以经由输入/输出(以下称为“I/O”)路径402接收内容和数据。I/O路径402可以向控制电路系统404提供内容(例如,广播节目、点播节目、互联网内容、局域网(LAN)或广域网(WAN)上可用的内容,和/或其它内容)和数据,控制电路系统404包括处理电路系统406和存储器408。控制电路系统404可以被用来使用I/O路径402发送和接收命令、请求和其它合适的数据。I/O路径402可以将控制电路系统404(具体而言是处理电路系统406)连接到一个或多个通信路径(下面描述)。I/O功能可以由这些通信路径中的一个或多个提供,但是在图4中被示为单个路径,以避免使图过于复杂。
控制电路系统404可以基于任何合适的处理电路系统,诸如处理电路系统406。如本文所提到的,处理电路系统应当被理解为意指基于一个或多个微处理器、微控制器、数字信号处理器、可编程逻辑设备、现场可编程门阵列(FPGA)、专用集成电路(ASIC)等等的电路系统,并且可以包括多核处理器(例如,双核、四核、六核或任何合适数量的核)或超级计算机。在一些实施例中,处理电路系统可以分布在多个单独的处理器或处理单元上,例如多个相同类型的处理单元(例如,两个Intel Core i7处理器)或多个不同的处理器(例如,IntelCore i5处理器和Intel Core i7处理器)。在一些实施例中,控制电路系统404执行存储在存储器(即,存储装置408)中的、用于媒体指南应用的指令。具体而言,控制电路系统404可以由媒体指南应用指示,以执行上面和下面讨论的功能。例如,媒体指南应用可以向控制电路系统404提供指令,以生成媒体指南显示。在一些实施例中,由控制电路系统404执行的任何动作可以基于从媒体指南应用接收的指令。
在基于客户端-服务器的实施例中,控制电路系统404可以包括适于与指南应用服务器或其它网络或服务器进行通信的通信电路系统。用于执行上述功能的指令可以存储在指南应用服务器上。通信电路系统可以包括用于与其它装备通信的电缆调制解调器、综合业务数字网络(ISDN)调制解调器、数字订户线路(DSL)调制解调器、电话调制解调器、以太网卡或无线调制解调器,或者任何其它合适的通信电路系统。这种通信可以涉及互联网或任何其它合适的通信网络或路径(结合图5更详细地描述)。此外,通信电路系统可以包括使得能够实现用户装备设备的对等通信或者在彼此远离的位置的用户装备设备的通信的电路系统(下面更详细地描述)。
存储器可以是作为存储装置408提供的电子存储设备,存储装置408是控制电路系统404的一部分。如本文所提到的,短语“电子存储设备”或“存储设备”应当被理解为意指用于存储电子数据、计算机软件或固件的任何设备,诸如随机存取存储器、只读存储器、硬盘驱动器、光盘驱动器、数字视频光盘(DVD)记录器、光盘(CD)记录器、BLU-RAY盘(BD)记录器、BLU-RAY 3D盘片记录器、数字视频记录器(DVR,有时称为个人录像机或PVR)、固态设备、量子存储设备、游戏控制台、游戏介质或任何其它合适的固定或可移动存储设备,和/或其任意组合。存储装置408可以被用来存储本文描述的各种类型的内容以及上述的媒体指南数据。非易失性存储器也可以被使用(例如,发起启动例程和其它指令)。关于图5描述的基于云的存储装置可以被用来补充存储装置408或代替存储装置408。
控制电路系统404可以包括视频生成电路系统和调谐电路系统,诸如一个或多个模拟调谐器、一个或多个MPEG-2解码器或其它数字解码电路系统、高清晰度调谐器或者任何其它合适的调谐或视频电路,或者这种电路的组合。还可以提供编码电路系统(例如,用于将空中(over-the-air)、模拟或数字信号转换成MPEG信号以供存储)。控制电路系统404还可以包括用于将内容上变频和下变频成用户装备设备400的优选输出格式的缩放器电路系统。电路系统404还可以包括用于在数字和模拟信号之间转换的数模转换器电路系统和模数转换器电路系统。调谐和编码电路系统可以被用户装备设备用来接收和显示、播放或记录内容。调谐和编码电路系统也可以被用来接收指南数据。本文描述的电路系统,包括例如调谐、视频生成、编码、解码、加密、解密、缩放器和模拟/数字电路系统,可以使用在一个或多个通用或专用处理器上运行的软件来实现。可以提供多个调谐器来处理同时调谐功能(例如,观看和记录功能、画中画(PIP)功能、多调谐器记录等等)。如果存储装置408被提供为与用户装备设备400分开的设备,那么调谐和编码电路系统(包括多个调谐器)可以与存储装置408相关联。
用户可以使用用户输入接口410向控制电路系统404发送指令。用户输入接口410可以是任何合适的用户接口,诸如遥控器、鼠标、轨迹球、小键盘、键盘、触摸屏、触摸板、触笔输入、游戏杆、语音识别接口或其它用户输入接口。显示器412可以被提供为独立的设备或与用户装备设备400的其它元件集成。例如,显示器412可以是触摸屏或触敏显示器。在这种情况下,用户输入接口410可以与显示器412集成或者与显示器412结合。显示器412可以是监视器、电视机、用于移动设备的液晶显示器(LCD)、非晶硅显示器、低温多晶硅显示器、电子墨水显示器、电泳显示器、有源矩阵显示器、电润湿显示器、电流体显示器、阴极射线管显示器、发光二极管显示器、电致发光显示器、等离子体显示器、高性能寻址显示器、薄膜晶体管显示器、有机发光二极管显示器、表面传导电子发射显示器(SED)、激光电视、碳纳米管、量子点显示器、干涉式调制器显示器或用于显示视觉图像的任何其它合适的设备中的一个或多个。在一些实施例中,显示器412可以是具有HDTV能力的。在一些实施例中,显示器412可以是3D显示器,并且交互式媒体指南应用和任何合适的内容可以以3D显示。视频卡或图形卡可以将生成到显示器412的输出。视频卡可以提供各种功能,诸如3D场景和2D图形的加速渲染、MPEG-2/MPEG-4解码、TV输出或连接多个显示器的能力。视频卡可以是以上关于控制电路系统404描述的任何处理电路系统。视频卡可以与控制电路系统304集成。扬声器414可以被提供为与用户装备设备400的其它元件集成,或者可以是独立的单元。显示器412上显示的视频和其它内容的音频成分量可以通过扬声器414播放。在一些实施例中,音频可以分发给接收器(未示出),其经由扬声器414处理和输出音频。
指南应用可以使用任何合适的体系架构来实现。例如,它可以是完全在用户装备设备400上实现的独立应用。在这种方案中,应用的指令被本地存储(例如,存储在存储装置408中),并且由应用使用的数据被定期下载(例如,从带外馈送、从互联网资源,或使用其它合适的方案)。控制电路系统404可以从存储装置408检索应用的指令,并处理指令,以生成本文所讨论的任何显示。基于经处理的指令,控制电路系统404可以确定在从用户输入接口410接收到输入时要执行什么动作。例如,当用户输入接口410指示向上/向下按钮被选择时,可以通过将处理的指令来指示显示器上光标向上/向下的移动。
在一些实施例中,媒体指南应用是基于客户端-服务器的应用。通过向远离用户装备设备400的服务器发出请求,按需检索用于由用户装备设备400上实现的胖或瘦客户端使用的数据。在基于客户端-服务器的指南应用的一个示例中,控制电路系统404运行解释由远程服务器提供的网页的Web浏览器。例如,远程服务器可以将用于应用的指令存储在存储设备中。远程服务器可以使用电路系统(例如,控制电路系统404)来处理所存储的指令,并生成上面和下面讨论的显示。客户端设备可以接收由远程服务器生成的显示,并且可以在装备设备400上本地显示显示的内容。以这种方式,由服务器远程地执行指令的处理,同时在装备设备400上本地提供结果显示。装备设备400可以经由用户输入接口410接收来自用户的输入,并且将那些输入发送到远程服务器进行处理并生成对应的显示。例如,装备设备400可以向远程服务器发送指示经由用户输入接口410选择了向上/向下按钮的讯息。远程服务器可以根据那个输入来处理指令,并生成与该输入对应的应用的显示(例如,向上/向下移动光标的显示)。所生成的显示然后被发送到装备设备400以供呈现给用户。
在一些实施例中,媒体指南应用被下载并由(由控制电路系统404运行的)解释器或虚拟机解释或以其它方式运行。在一些实施例中,指南应用可以以ETV二进制交换格式(EBIF)编码,由控制电路系统404作为合适的馈送的一部分接收,并由在控制电路系统404上运行的用户代理解释。例如,指南应用可以是EBIF应用。在一些实施例中,可以由一系列基于JAVA的文件来定义指南应用,这些基于JAVA的文件是由本地虚拟机或由控制电路系统404执行的其它合适的中间件接收并运行的。在一些此类的实施例中(例如,采用MPEG-2或其它数字媒体编码方案的实施例),可以例如在具有节目的MPEG音频和视频分组的MPEG-2对象轮播中编码和发送指南应用。
图4的用户装备设备700可以在图5的系统500中实现,作为用户电视装备502、用户计算机装备504、无线用户通信设备506或适于访问内容的任何其它类型的用户装备(诸如非便携式游戏机)。为了简单起见,这些设备在本文可以被统称为用户装备或用户装备设备,并且可以基本上类似于上述的用户装备设备。在其上可以实现媒体指南应用的用户装备设备可以用作独立设备或者可以是设备的网络的一部分。设备的各种网络配置可以被实现并且在下面被更详细地讨论。
利用上面结合图4描述的系统特征中的至少一些的用户装备设备可能不仅仅被分类为用户电视装备502、用户计算机装备504或无线用户通信设备506。例如,用户电视装备502可以像一些用户计算机装备504一样启用互联网,以允许访问互联网内容,而用户计算机装备504可以像一些电视装备502一样包括调谐器,以允许访问电视节目。媒体指南应用可以在各种不同类型的用户装备上具有相同的布局,或者可以针对用户装备的显示能力而被裁剪。例如,在用户计算机装备504上,指南应用可以被提供为由web浏览器访问的网站。在另一个示例中,可以针对无线用户通信设备506缩小指南应用。
在系统500中,通常存在多于一个的每种类型的用户装备设备,但是在图5中仅示出了每种类型中的一个,以避免使图过于复杂。此外,每个用户可以利用多于一种类型的用户装备设备以及每种类型的用户装备设备中的多于一个。
在一些实施例中,用户装备设备(例如,用户电视装备502、用户计算机装备504、无线用户通信设备506)可以被称为“第二屏幕设备”。例如,第二屏幕设备可以补充在第一用户装备设备上呈现的内容。在第二屏幕设备上呈现的内容可以是补充在第一设备上呈现的内容的任何合适的内容。在一些实施例中,第二屏幕设备提供用于调整第一设备的设置和显示偏好的接口。在一些实施例中,第二屏幕设备被配置用于与其它第二屏幕设备交互或用于与社交网络交互。第二屏幕设备可以位于与第一设备相同的房间中、与第一设备不同的房间但在同一个房屋或建筑物中,或者与第一设备不同的建筑物中。
用户还可以设置各种设置,以在家用式设备和远程设备之间维持一致的媒体指南应用设置。设置包括本文描述的那些设置,以及指南应用用来做出节目推荐、显示偏好和其它期望的指南设置的频道和节目收藏、编程偏好。例如,如果用户将例如网站www.Tivo.com上的频道设置为其办公室的个人计算机上的收藏,那么相同的频道将在用户的家用式设备(例如,用户电视装备和用户计算机装备)以及用户的移动设备上出现为收藏。因此,在一个用户装备设备上进行的改变可以改变另一个用户装备设备上的指南体验,而不管它们是相同类型还是不同类型的用户装备设备。此外,所做的改变可以基于用户输入的设置以及由指南应用监视的用户活动。
用户装备设备可以耦合到通信网络514。即,用户电视装备502、用户计算机装备504和无线用户通信设备506分别经由通信路径508、510和512耦合到通信网络514。通信网络514可以是一个或多个网络,包括互联网、移动电话网络、移动语音或数据网络(例如,4G或LTE网络)、有线网络、公共交换电话网络或其它类型的通信网络,或者通信网络的组合。路径508、510和512可以单独地或一起包括一条或多条通信路径,诸如卫星路径、光纤路径、电缆路径、支持互联网通信(例如,IPTV)的路径、自由空间连接(例如,用于广播或其它无线信号)或任何其它合适的有线或无线通信路径或这种路径的组合。路径512用点线画出,以指示在图5所示的示例性实施例中它是无线路径,并且路径508和510被绘制为实线,以指示它们是有线路径(但是,如果期望,那么这些路径可以是无线路径)。与用户装备设备的通信可以由这些通信路径中的一个或多个提供,但是在图5中被示为单个路径,以避免使图过于复杂。
虽然在用户装备设备之间没有画出通信路径,但是这些设备可以经由通信路径(诸如上面结合路径508、510和512描述的那些)以及其它短程点到点通信路径(诸如USB电缆、IEEE 1394电缆、无线路径(例如,蓝牙、红外线、IEEE 802-11x等))或者经由有线或无线路径的其它短程通信彼此直接通信。蓝牙是Bluetooth SIG公司拥有的认证标志。用户装备设备也可以通过经由通信网络514的间接路径彼此直接通信。
系统500包括分别经由通信路径520和522耦合到通信网络514的内容源516和媒体指南数据源518。路径520和522可以包括上面结合路径508、510和512描述的任何通信路径。与内容源516和媒体指南数据源518的通信可以通过一条或多条通信路径交换,但是在图5中示为单条路径,以避免使绘图过于复杂。此外,内容源516和媒体指南数据源518中的每一个都存在多于一个,但是图5中每个仅示出了一个,以避免使绘图过于复杂。(下面讨论这些源中的每一个的不同类型。)如果期望,那么可以将内容源516和媒体指南数据源518集成为一个源设备。虽然源516和518与用户设备502、504和506之间的通信被示为通过通信网络514,但是在一些实施例中,源516和518可以经由通信路径(未示出)直接与用户设备502、504和506通信,通信路径为诸如上面结合路径508、510和512描述的那些。
内容源516可以包括一种或多种类型的内容分发装备,包括电视分发设施、有线系统头端、卫星分发设施、节目源(例如,电视广播公司,诸如NBC、ABC、HBO等)、中间分发设施和/或服务器、互联网提供商、点播媒体服务器及其它内容提供商。NBC是国家广播公司拥有的商标,ABC是美国广播公司拥有的商标,而HBO是Home Box Office公司拥有的商标。内容源516可以是内容的发起者(例如,电视广播公司、网络广播提供商等),或者可以不是内容的发起者(例如,点播内容提供商,用于下载的广播节目的内容的互联网提供商等)。内容源516可以包括有线源(cable source)、卫星提供商、点播提供商、互联网提供商、越顶内容提供商或其它内容提供者。内容源516还可以包括用来在远离任何用户装备设备的位置存储不同类型的内容(包括用户选择的视频内容)的远程媒体服务器。用于内容的远程存储以及向用户装备提供远程存储的内容的系统和方法结合2010年7月20日授予Ellis等人的美国专利No.7,761,892更详细地讨论,该专利整体上通过引用并入本文。
媒体指南数据源518可以提供媒体指南数据,诸如上述的媒体指南数据。媒体指南数据可以使用任何合适的方案提供给用户装备设备。在一些实施例中,指南应用可以是经由数据馈送(例如,连续馈送或涓流(trickle)馈送)接收节目指南数据的独立交互式电视节目指南。可以使用带内数字信号、使用带外数字信号或通过任何其它合适的数据传输技术在电视频道边带上向用户装备提供节目安排数据和其它指南数据。可以在多个模拟或数字电视频道上向用户装备提供节目安排数据和其它媒体指南数据。
在一些实施例中,可以使用客户端-服务器方案将来自媒体指南数据源518的指南数据提供给用户的装备。例如,用户装备设备可以从服务器拉取媒体指南数据,或者服务器可以将媒体指南数据推送到用户装备设备。在一些实施例中,驻留在用户装备上的指南应用客户端可以发起与源518的会话,以在需要时获得指南数据,例如,当指南数据过时时或者当用户装备设备从用户接收到接收数据的请求时。可以以任何适当的频率(例如,连续地、每天、用户指定的时间段、系统指定的时间段、响应于来自用户装备的请求等)向用户装备提供媒体指南。媒体指南数据源518可以向用户装备设备502、504和506提供媒体指南应用本身或者针对媒体指南应用的软件更新。
在一些实施例中,媒体指南数据可以包括观看者数据。例如,观看者数据可以包括当前和/或历史用户活动信息(例如,用户通常观看什么内容、用户在什么时间观看内容,用户是否与社交网络交互、用户在什么时间与社交网络交互以发布信息、用户通常观看什么类型的内容(例如,付费电视或免费电视)、心情、大脑活动信息等)。媒体指南数据还可以包括订阅数据。例如,订阅数据可以识别给定用户订阅哪些源或服务和/或给定用户先前订阅但后来终止访问了哪些源或服务(例如,用户是否已经订阅了高级频道、用户是否已经添加了高级别服务、用户是否已经提高了互联网速度)。在一些实施例中,观看者数据和/或订阅数据可以识别给定用户达超过一年的时间段的模式。媒体指南数据可以包括用于生成指示给定用户将终止对服务/源的访问的可能性的得分的模型(例如,幸存者模型)。例如,媒体指南应用可以使用该模型处理具有订阅数据的观看者数据,以生成指示给定用户是否将终止对特定服务或源的访问的可能性的值或得分。特别地,越高的得分可以指示用户将终止对特定服务或源的访问的越高级别的置信度。基于得分,媒体指南应用可以生成诱使用户保持通过得分被指示为用户可能终止对其的访问的特定服务或源的促销。
媒体指南应用可以是例如在用户装备设备上实现的独立应用。例如,媒体指南应用可以被实现为可以存储在存储器408中并由用户装备设备400的控制电路系统404执行的软件或可执行指令集。在一些实施例中,媒体指南应用可以是客户端-服务器应用,其中仅客户端应用驻留在用户装备设备上,而服务器应用驻留于远程服务器上。例如,媒体指南应用可以部分地被实现为在用户装备设备400的控制电路系统404上的客户端应用,并且部分地作为在远程服务器的控制电路系统上运行的服务器应用(例如,媒体指南数据源518)。当由远程服务器的控制电路系统执行时(诸如媒体指南数据源518),媒体指南应用可以指示控制电路系统生成指南应用显示,并将生成的显示发送到用户装备设备。服务器应用可以指示媒体指南数据源518的控制电路系统发送要存储在用户装备上的数据。客户端应用可以指示接收方用户装备的控制电路系统生成指南应用显示。
交付到用户装备设备502、504和506的内容和/或媒体指南数据可以是越顶(OTT)内容。OTT内容交付还允许启用互联网的用户设备(包括上述任何用户装备设备)接收经互联网传送的内容(包括上述任何内容,除了经有线或卫星连接接收的内容)。OTT内容经由由互联网服务提供商(ISP)提供的互联网连接交付,但第三方分发该内容。ISP可以不负责查看能力、版权或内容的再分发,并且可以仅传送由OTT内容提供商提供的IP分组。OTT内容提供商的示例包括经由IP分组提供音频和视频的YOUTUBE、NETFLIX和HULU。Youtube是Google公司拥有的商标,Netflix是Netflix公司拥有的商标,Hulu是Hulu公司拥有的商标。OTT内容提供商可以附加地或可替代地提供上述媒体指南数据。除了内容和/或媒体指南数据,OTT内容的提供商可以分发媒体指南应用(例如,基于web的应用或基于云的应用),或者可以通过存储在用户装备设备上的媒体指南应用来显示内容。
媒体指南系统500旨在说明多个方案或网络配置,通过它们,用户装备设备和内容和指南数据源可以为了访问内容和提供媒体指南而彼此通信。本文所述的实施例可以在这些方案中的任何一个或子集中应用,或者在采用用于交付内容并提供媒体指南的其它方案的系统中应用。以下四种方案提供了图5的一般化示例的具体说明。
在一种方案中,用户装备设备可以在家庭网络内彼此通信。用户装备设备可以经由上述短程点到点通信方案、经由通过在家庭网络上提供的集线器或其它类似设备的间接路径或者经由通信网络514直接彼此通信。单个家庭中的多个个人中的每一个人可以操作在家庭网络上的不同用户装备设备。因此,可能期望在不同的用户装备设备之间传送各种媒体指南信息或设置。例如,如在2005年7月11日Ellis等人提交的美国专利公开No.2005/0251827中更详细描述的,用户可能期望在家庭网络内的不同用户装备设备上维持一致的媒体指南应用设置。家庭网络中的不同类型的用户装备设备也可以彼此通信,以发送内容。例如,用户可以将内容从用户计算机装备发送到便携式视频播放器或便携式音乐播放器。
在第二种方案中,用户可以具有多种类型的用户装备,他们通过这些用户装备访问内容并获得媒体指南。例如,一些用户可以具有由家用式和移动设备访问的家庭网络。用户可以通过在远程设备上实现的媒体指南应用来控制家用式设备。例如,用户可以经由他们办公室的个人计算机或移动设备(诸如PDA或启用web的移动电话)访问网站上的在线媒体指南应用。用户可以在在线指南应用上设置各种设置(例如,记录、提醒或其它设置)来控制用户的家用式设备。在线指南可以直接控制用户的装备,或者通过与用户的家用式设备上的媒体指南应用通信。例如,Ellis等人在2011年10月25日被授予的美国专利No.8,046,801中讨论了用于用户装备设备通信的各种系统和方法,其中用户装备设备处于彼此远离的位置,该专利整体上通过引用并入本文。
在第三种方案中,在家内部和外部的用户装备设备的用户可以使用他们的媒体指南应用来直接与内容源516通信,以访问内容。具体而言,在家里,用户电视装备502和用户计算机装备504的用户可以访问媒体指南应用,以在期望的内容之间导航并定位。用户还可以使用无线用户通信设备506在家外面访问媒体指南应用,以在期望的内容之间导航并定位。
在第四种方案中,用户装备设备可以在云计算环境中操作,以访问云服务。在云计算环境中,用于内容共享、存储或分发的各种类型的计算服务(例如,视频共享站点或社交网站)由被称为“云”的网络可访问的计算和存储资源的集合提供。例如,云可以包括服务器计算设备的集合,其可以位于集中或分布的位置,其通过通信网络514向经由网络(诸如互联网)连接的各种类型的用户和设备提供基于云的服务。这些云资源可以包括一个或多个内容源516和一个或多个媒体指南数据源518。此外或在替代方案中,远程计算站点可以包括其它用户装备设备,诸如用户电视装备502、用户计算机装备504和无线用户通信设备506。例如,其它用户装备设备可以提供对存储的视频副本或流传输视频的访问。在这种实施例中,用户装备设备可以以对等方式操作,而不与中央服务器通信。
除了其它示例,对于用户装备设备,云还提供对服务(诸如内容存储、内容共享或社交联网服务)的访问,以及对上述任何内容的访问。可以通过云计算服务提供商或通过其它在线服务的提供商在云中提供。例如,基于云的服务可以包括内容存储服务、内容共享站点、社交联网站点、或者用户来源的内容经由其分发以供所连接的设备上的其他人收看的其它服务。这些基于云的服务可以允许用户装备设备将内容存储到云并且从云接收内容,而不是在本地存储内容并访问本地存储的内容。
用户可以使用各种内容捕获设备(诸如摄像机、具有视频模式的数码相机、音频记录器、移动电话和手持式计算设备)来记录内容。用户可以直接地(例如,从用户计算机装备504或具有会话捕获特征的无线用户通信设备506)将内容上载到云上的内容存储服务。可替代地,用户可以首先将内容传送到用户装备设备(诸如用户计算机装备504)。存储内容的用户装备设备使用通信网络514上的数据传送服务将内容上传到云。在一些实施例中,用户装备设备本身是云资源,并且其它用户装备设备可以直接从用户在其上存储内容的用户装备设备访问内容。
云资源可以由用户装备设备使用例如web浏览器、媒体指南应用、桌面应用、移动应用和/或其访问应用的任意组合来访问。用户装备设备可以是依赖云计算进行应用交付的云客户端,或者用户装备设备可以具有某些功能而无需访问云资源。例如,在用户装备设备上运行的一些应用可以是云应用,即,作为服务经互联网交付的应用,而其它应用可以在用户装备设备上存储和运行。在一些实施例中,用户设备可以同时从多个云资源接收内容。例如,用户设备可以从一个云资源流传输音频,同时从第二个云资源下载内容。或者用户设备可以从多个云资源下载内容,以便更高效的下载。在一些实施例中,用户装备设备可以使用云资源来处理操作,诸如由关于图4描述的处理电路系统执行的处理操作。
如本文所提到的,术语“响应于…”是指由于...而被发起。例如,第一动作响应于第二动作而被执行可以包括第一动作和第二动作之间的插入式步骤。如本文所提到的,术语“直接响应于...”是指由...造成的。例如,第一动作响应于第二动作而被直接执行可以不包括第一动作和第二动作之间的插入式步骤。
图6是根据本公开的一些实施例的用于基于语音数据和媒体消费数据来识别用户的说明性动作的流程图。在602处,控制电路系统404根据从用户接收的语音命令生成语音签名。例如,控制电路系统404可以经由用户输入接口410从用户接收语音输入,并且分析用户输入以生成语音签名并将语音签名存储在存储装置408中。在一些实施例中,控制电路系统可以将语音签名存储在远程服务器(例如,与媒体内容源516和/或媒体指南数据源518相关联的服务器)处。
在604处,控制电路系统404基于语音签名识别与用户相关联的多个语音特征,其中多个语音特征中的每一个对应于与用户相关联的人口统计数据。例如,控制电路系统404可以从存储装置408检索存储的语音签名,并对语音签名执行算法以识别语音特征。
在606处,控制电路系统404将多个人口统计学特征和在与与家庭相关联的多个用户相关联的多个简档中的每个简档内的人口统计信息进行比较。控制电路系统可以对从语音签名提取的人口统计学特征与从远程服务器(例如,与媒体内容源516或媒体指南数据源518相关联的远程服务器)接收的人口统计信息执行比较算法。例如,控制电路系统可以将从语音命令提取的人口统计数据(例如,存储在数据结构100中)与从远程源接收的人口统计数据(例如,存储在数据结构120中的人口统计数据)进行比较。
在606处,控制电路系统404基于比较确定多个简档中的两个或更多个简档与多个人口统计学特征匹配。例如,控制电路系统404可以确定两个或更多个简档包括与从语音签名提取的人口统计数据相等地匹配的人口统计学特征。例如,控制电路系统404可以基于将外部人口统计数据与从语音命令提取的人口统计数据(例如,数据结构100中的数据和数据结构120中的数据)进行比较来确定两个简档与提取的人口统计数据相等地匹配。
在608处,控制电路系统404基于比较确定多个简档中的两个或更多个简档与多个人口统计学特征匹配。例如,控制电路系统404可以标记条目124的那些匹配的条目。应当注意的是,如果仅一个简档匹配,那么媒体指南应用可以确定用户识别已经完成并且跳过动作610。
在610处,响应于确定多个简档中的两个或更多个简档与多个人口统计学特征匹配,控制电路系统404基于来自两个或更多个简的语音命令的内容来识别用户的简档。例如,控制电路系统可以识别与媒体资产的元数据最匹配的用户简档。在612处,控制电路系统404生成用于显示的指示已经识别出用户的指示。例如,控制电路系统可以生成用于在显示器412上显示的指示。
图7是根据本公开的一些实施例的用于基于语音数据和媒体消费数据来识别用户的说明性动作的另一个流程图。在702处,控制电路系统404根据从用户接收的语音命令生成语音签名。例如,控制电路系统404可以经由用户输入接口410从用户接收语音输入,并且分析用户输入以生成语音签名并将语音签名存储在存储装置408中。在一些实施例中,控制电路系统可以将语音签名存储在远程服务器(例如,与媒体内容源516和/或媒体指南数据源518相关联的服务器)处。
在704处,控制电路系统404从语音签名中确定与用户相关联的多个语音特征,其中多个语音特征对应于多个人口统计学特征。例如,控制电路系统404可以从存储装置408中检索存储的语音签名,并对语音签名执行算法以识别语音特征。
在706处,控制电路系统404发送对与用户的家庭相关联的用户信息的请求。例如,控制电路系统可以将查询(例如,经由I/O接口402)发送到远程服务器(例如,媒体内容源516或媒体指南数据源518)。
在708处,控制电路系统404接收用户信息,其中用户信息包括家庭内每个用户的相应人口统计信息。例如,控制电路系统可以接收数据结构(例如,数据结构120),并将该数据结构存储在存储装置408中(例如,在随机存取存储器中)。在710处,控制电路系统404将多个人口统计学特征与用户信息内的人口统计信息进行比较。例如,控制电路系统404可以(例如,从存储装置408中)检索接收到的人口统计信息以进行比较。
在712处,控制电路系统404基于比较确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配。例如,控制电路系统可以将匹配的指示符与匹配条目一起存储(例如,在存储装置408中)。在714处,响应于确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配,控制电路系统404执行以下动作。
在716处,控制电路系统404确定语音命令包括对媒体资产的请求。例如,控制电路系统404可以分析语音命令并提取所请求的媒体资产的标识符。在718处,控制电路系统404将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较。例如,控制电路系统404可以比较用于人口统计信息的串值(例如,年龄范围和年龄)和/或用于其它人口统计信息的布尔值(例如,用于性别)。
在720处,控制电路系统404基于将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较来确定两个或更多个用户中的第一用户构成最佳匹配。响应于确定第一用户是最佳匹配,控制电路系统404生成用于显示的用户已经被识别出的指示。例如,控制电路系统可以生成用于在显示器412上显示的指示。
图8是根据本公开的一些实施例的用于确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配的说明性动作的流程图。在802处,控制电路系统404检索条目表,其中每个条目与用户相关联。例如,控制电路系统可以检索包括多个条目124的数据结构120。在804处,控制电路系统404从多个条目中选择先前未选择的条目,其中每个条目表示家庭用户。例如,每个条目可以经由数据结构来选择。控制电路系统可以遍历每个条目。
在808处,控制电路系统404将所选择的条目中的每个字段与从语音命令提取的人口统计信息的对应字段进行比较。例如,控制电路系统可以在对应字段之间执行串比较或另一类型的比较。在810处,控制电路系统404确定所选择的条目的任何字段是否与从语音命令提取的人口统计信息的对应字段匹配。例如,控制电路系统404可以确定一个或多个字段匹配。如果所选择的条目的字段均不匹配人口统计信息,那么处理800移动到动作814。如果所选择的条目的至少一个字段与人口统计信息的对应字段匹配,那么处理800移动到812。
在812处,控制电路系统404存储所选择的条目的与人口统计信息的对应字段匹配的每个字段的指示。例如,控制电路系统可以在每个字段内存储是否已经发生匹配的指示。在814处,控制电路系统404确定在多个条目中是否还有任何先前未选择的条目。如果在多个条目中存在更多先前未选择的条目,那么处理800移动到动作804,在那里选择另一个先前未选择的条目进行处理。如果在多个条目中不再有先前未选择的条目,那么处理800移动到动作816。在816处,控制电路系统404通过比较多个条目中的每个条目的匹配字段的数量来识别具有最高匹配人口统计学特征量的两个或更多个用户。
图9是根据本公开的一些实施例的用于将语音签名与用户匹配的说明性动作的流程图。在902处,控制电路系统404在用户的语音简档中存储语音签名和媒体资产的指示。控制电路系统可以将语音简档存储在存储装置408中。在904处,控制电路系统404检测后续语音命令。例如,控制电路系统可以检测来自用户输入接口410的语音输入。
在906处,控制电路系统404基于后续语音命令来生成后续语音签名。例如,控制电路系统404可以以与原始语音签名相同的方式生成后续语音签名。在908处,控制电路系统404将语音签名与后续语音签名进行比较。例如,可以针对特定于语音的数据分析语音签名,并且可以比较特定于语音的数据。
在910处,控制电路系统404确定语音签名是否与后续语音签名匹配。如果控制电路系统404确定语音签名与后续语音签名匹配,那么处理900移动到912,其中控制电路系统404将后续语音命令的内容存储在用户的语音简档中。但是,如果控制电路系统404确定语音签名与后续语音签名不匹配,那么处理900移动到914,其中控制存储后续的语音命令。例如,控制电路系统404可以为未识别的语音命令实例化数据结构。控制电路系统可以将该数据结构存储在存储装置408中。
在916处,控制电路系统404周期性地将后续语音命令的语音签名与新识别出的用户的语音签名进行比较。例如,当新用户加入系统并被识别时,可以比较语音命令中的语音签名,如果找到匹配,那么用户的语音命令内容可以存储在用户的简档中或以其它方式进行处理。应当注意的是,语音简档可以存储在位置的组合中。例如,包括人口统计数据的用户简档可以存储在用户设备(例如,用户电视装备502、用户计算机装备504和/或无线通信设备506)上的存储装置408中。附加地或替代地,用户的简档可以存储在远程服务器(例如,与媒体内容源516和/或媒体指南数据源518相关联的服务器)上。
上面讨论的处理旨在是说明性而非限制性的。本领域技术人员将认识到的是,可以省略、修改、组合和/或重新布置本文所讨论的处理的动作,并且可以在不脱离本发明的范围的情况下执行任何附加动作。更一般而言,以上公开内容旨在是示例性而非限制性的。仅下面的权利要求旨在设置关于本公开包括的内容的界限。此外,应当注意的是,在任何一个实施例中描述的特征和限制可以应用到本文的任何其它实施例,并且与一个实施例相关的流程图或示例可以以合适的方式与任何其它实施例组合,以不同的次序完成,或并行完成。此外,本文所述的系统和方法可以被实时地执行。还应当注意的是,上述系统和/或方法可以应用到其它系统和/或方法,或者根据其它系统和/或方法来使用。
Claims (51)
1.一种用于基于语音数据和媒体消费数据来识别用户的方法,所述方法包括:
根据从用户接收到的语音命令生成语音签名;
基于语音签名识别与用户相关联的多个语音特征,其中所述多个语音特征中的每个语音特征对应于与用户相关联的人口统计数据;
将多个人口统计学特征与在和与家庭相关联的多个用户相关联的多个简档中的每个简档内的人口统计信息进行比较;
基于所述比较,确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配;
响应于确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配,基于语音命令的内容从所述两个或更多个简档识别用户的简档;以及
生成用于显示的指示已经识别出用户的指示。
2.一种用于基于语音数据和媒体消费数据识别用户的方法,所述方法包括:
根据从用户接收到的语音命令生成语音签名;
从语音签名中确定与用户相关联的多个语音特征,其中所述多个语音特征对应于多个人口统计学特征;
发送对与用户的家庭相关联的用户信息的请求;
接收用户信息,其中用户信息包括家庭内每个用户的相应人口统计信息;
将所述多个人口统计学特征与用户信息内的人口统计信息进行比较;
基于所述比较,确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配;
响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配:
确定语音命令包括对媒体资产的请求;
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较;
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较,确定所述两个或更多个用户中的第一用户构成最佳匹配;以及
响应于确定第一用户是最佳匹配,生成用于显示的用户已经被识别出的指示。
3.如权利要求2所述的方法,其中发送对与用户的家庭相关联的用户信息的请求包括:
确定与接收语音命令的用户装备设备相关联的标识串;
生成针对家庭用户信息的查询,其中查询包括所述标识串;以及
将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。
4.如权利要求3所述的方法,其中接收用户信息还包括将用户信息存储在数据结构中,所述数据结构包括:
多个条目,其中所述多个条目包括家庭内每个用户的条目;以及
用于每个条目的多个字段,其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。
5.如权利要求4所述的方法,其中将所述多个人口统计学特征与用户信息内的人口统计信息进行比较包括:
从所述多个条目中检索第一条目;
将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较;以及
基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较,从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。
6.如权利要求5所述的方法,其中确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征包括:
将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较;以及
基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较,识别具有最高匹配的人口统计信息量的两个或更多个用户。
7.如权利要求2所述的方法,其中将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较包括:
接收多个用户简档,其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户,并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征;
将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较;以及
基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较,为所述两个或更多个用户中的每个用户确定匹配的特征量。
8.如权利要求7所述的方法,其中从所述两个或更多个用户中确定具有最高匹配元数据量的用户包括:
检索与所述多个特征中的每个特征相关联的权重;
使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量;以及
选择具有最高匹配特征量的匹配用户。
9.如权利要求2所述的方法,其中生成用于显示的用户已经被识别出的指示包括:
从存储装置中检索用户的简档;
基于用户的简档,确定用户已选择头像;以及
生成用于显示的覆盖在一部分媒体资产上的头像。
10.如权利要求2所述的方法,还包括将语音签名存储在与用户相关联的所有设备上。
11.如权利要求2所述的方法,还包括:
在用户的语音简档中存储语音签名和媒体资产的指示;
检测后续语音命令;
确定与后续语音命令相关联的后续语音签名与所述语音签名匹配;以及
将后续语音命令的内容存储在用户的语音简档中。
12.一种用于基于语音数据和媒体消费数据识别用户的系统,所述系统包括:
通信电路系统;以及
控制电路系统,被配置为:
根据从用户接收到的语音命令生成语音签名;
从语音签名中确定与用户相关联的多个语音特征,其中所述多个语音特征对应于多个人口统计学特征;
使用通信电路系统发送对与用户的家庭相关联的用户信息的请求;
使用通信电路系统接收用户信息,其中用户信息包括家庭内每个用户的相应人口统计信息;
将所述多个人口统计学特征与用户信息内的人口统计信息进行比较;
基于所述比较,确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配;
响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配:
确定语音命令包括对媒体资产的请求;
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较;
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较,确定所述两个或更多个用户中的第一用户构成最佳匹配;以及
响应于确定第一用户是最佳匹配,生成用于显示的用户已经被识别出的指示。
13.如权利要求12所述的系统,其中所述控制电路系统还被配置为,当发送对与用户的家庭相关联的用户信息的请求时:
确定与接收语音命令的用户装备设备相关联的标识串;
生成针对家庭用户信息的查询,其中查询包括所述标识串;以及
将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。
14.如权利要求13所述的系统,其中所述控制电路系统还被配置为,当接收用户信息时将用户信息存储在数据结构中,所述数据结构包括:
多个条目,其中所述多个条目包括家庭内每个用户的条目;以及
用于每个条目的多个字段,其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。
15.如权利要求14所述的系统,其中所述控制电路系统还被配置为,当将所述多个人口统计学特征与用户信息内的人口统计信息进行比较时:
从所述多个条目中检索第一条目;
将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较;以及
基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较,从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。
16.如权利要求15所述的系统,其中所述控制电路系统还被配置为,当确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征时:
将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较;以及
基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较,识别具有最高匹配的人口统计信息量的两个或更多个用户。
17.如权利要求12所述的系统,其中所述控制电路系统还被配置为:当将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较时:
接收多个用户简档,其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户,并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征;
将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较;以及
基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较,为所述两个或更多个用户中的每个用户确定匹配的特征量。
18.如权利要求17所述的系统,其中所述控制电路系统还被配置为,当从所述两个或更多个用户中确定具有最高匹配元数据量的用户时:
检索与所述多个特征中的每个特征相关联的权重;
使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量;以及
选择具有最高匹配特征量的匹配用户。
19.如权利要求12所述的系统,其中所述控制电路系统还被配置为,当生成用于显示的用户已经被识别出的指示时:
从存储装置中检索用户的简档;
基于用户的简档,确定用户已选择头像;以及
生成用于显示的覆盖在一部分媒体资产上的头像。
20.如权利要求12所述的系统,其中所述控制电路系统还被配置为将语音签名存储在与用户相关联的所有设备上。
21.如权利要求12所述的系统,其中所述控制电路系统还被配置为:
在用户的语音简档中存储语音签名和媒体资产的指示;
检测后续语音命令;
确定与后续语音命令相关联的后续语音签名与所述语音签名匹配;以及
将后续语音命令的内容存储在用户的语音简档中。
22.一种用于基于语音数据和媒体消费数据识别用户的系统,所述系统包括:
用于根据从用户接收到的语音命令生成语音签名的装置;
用于从语音签名中确定与用户相关联的多个语音特征的装置,其中所述多个语音特征对应于多个人口统计学特征;
用于发送对与用户的家庭相关联的用户信息的请求的装置;
用于接收用户信息的装置,其中用户信息包括家庭内每个用户的相应人口统计信息;
用于将所述多个人口统计学特征与用户信息内的人口统计信息进行比较的装置;
用于基于所述比较,确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配的装置;
用于响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配,执行以下操作的装置:
确定语音命令包括对媒体资产的请求;
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较;
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较,确定所述两个或更多个用户中的第一用户构成最佳匹配;以及
用于响应于确定第一用户是最佳匹配,生成用于显示的用户已经被识别出的指示的装置。
23.如权利要求22所述的系统,其中用于发送对与用户的家庭相关联的用户信息的请求的装置包括:
用于确定与接收语音命令的用户装备设备相关联的标识串的装置;
用于生成针对家庭用户信息的查询的装置,其中查询包括所述标识串;以及
用于将查询发送到存储与用户的家庭相关联的用户信息的远程服务器的装置。
24.如权利要求23所述的系统,其中用于接收用户信息的装置还包括用于将用户信息存储在数据结构中的装置,所述数据结构包括:
多个条目,其中所述多个条目包括家庭内每个用户的条目;以及
用于每个条目的多个字段,其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。
25.如权利要求24所述的系统,其中用于将所述多个人口统计学特征与用户信息内的人口统计信息进行比较的装置包括:
用于从所述多个条目中检索第一条目的装置;
用于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较的装置;以及
用于基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较,从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合的装置。
26.如权利要求25所述的系统,其中用于确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征的装置包括:
用于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较的装置;以及
用于基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较,识别具有最高匹配的人口统计信息量的两个或更多个用户的装置。
27.如权利要求22所述的系统,其中用于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较的装置包括:
用于接收多个用户简档的装置,其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户,并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征;
用于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较的装置;以及
用于基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较,为所述两个或更多个用户中的每个用户确定匹配的特征量的装置。
28.如权利要求27所述的系统,其中用于从所述两个或更多个用户确定具有最高匹配元数据量的用户的装置包括:
用于检索与所述多个特征中的每个特征相关联的权重的装置;
用于使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量的装置;以及
用于选择具有最高匹配特征量的匹配用户的装置。
29.如权利要求22所述的系统,其中用于生成用于显示的用户已经被识别出的指示的装置包括:
用于从存储装置中检索用户的简档的装置;
用于基于用户的简档,确定用户已选择头像的装置;以及
用于生成用于显示的覆盖在一部分媒体资产上的头像的装置。
30.如权利要求22所述的系统,还包括用于将语音签名存储在与用户相关联的所有设备上的装置。
31.如权利要求22所述的系统,还包括:
用于在用户的语音简档中存储语音签名和媒体资产的指示的装置;
用于检测后续语音命令的装置;
用于确定与后续语音命令相关联的后续语音签名与所述语音签名匹配的装置;以及
用于将后续语音命令的内容存储在用户的语音简档中的装置。
32.一种非暂态计算机可读介质,包括在其上编码的用于基于语音数据和媒体消耗数据来识别用户的非暂态计算机可读指令,所述指令包括:
用于根据从用户接收到的语音命令生成语音签名的指令;
用于从语音签名中确定与用户相关联的多个语音特征的指令,其中所述多个语音特征对应于多个人口统计学特征;
用于发送对与用户的家庭相关联的用户信息的请求的指令;
用于接收用户信息的指令,其中用户信息包括家庭内每个用户的相应人口统计信息;
用于将所述多个人口统计学特征与用户信息内的人口统计信息进行比较的指令;
用于基于所述比较,确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配的指令;
用于响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配,执行以下操作的指令:
确定语音命令包括对媒体资产的请求;
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较;
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较,确定所述两个或更多个用户中的第一用户构成最佳匹配;以及
用于响应于确定第一用户是最佳匹配,生成用于显示的用户已经被识别出的指示的指令。
33.如权利要求32所述的非暂态机器可读介质,其中用于发送对与用户的家庭相关联的用户信息的请求的指令包括:
用于确定与接收语音命令的用户装备设备相关联的标识串的指令;
用于生成针对家庭用户信息的查询的指令,其中查询包括所述标识串;以及
用于将查询发送到存储与用户的家庭相关联的用户信息的远程服务器的指令。
34.如权利要求33所述的非暂态机器可读介质,其中用于接收用户信息的指令还包括用于将用户信息存储在数据结构中的指令,所述数据结构包括:
多个条目,其中所述多个条目包括家庭内每个用户的条目;以及
用于每个条目的多个字段,其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。
35.如权利要求34所述的非暂态机器可读介质,其中用于将所述多个人口统计学特征与用户信息内的人口统计信息进行比较的指令包括:
用于从所述多个条目中检索第一条目的指令;
用于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较的指令;以及
用于基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较,从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合的指令。
36.如权利要求35所述的非暂态机器可读介质,其中用于确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征的指令包括:
用于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较的指令;以及
用于基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较,识别具有最高匹配的人口统计信息量的两个或更多个用户的指令。
37.如权利要求32所述的非暂态机器可读介质,其中用于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较的指令包括:
用于接收多个用户简档的指令,其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户,并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征;
用于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较的指令;以及
用于基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较,为所述两个或更多个用户中的每个用户确定匹配的特征量的指令。
38.如权利要求37所述的非暂态机器可读介质,其中用于从所述两个或更多个用户确定具有最高匹配元数据量的用户的指令包括:
用于检索与所述多个特征中的每个特征相关联的权重的指令;
用于使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量的指令;以及
用于选择具有最高匹配特征量的匹配用户的指令。
39.如权利要求32所述的非暂态机器可读介质,其中用于生成用于显示的用户已经被识别出的指示的指令包括:
用于从存储装置中检索用户的简档的指令;
用于基于用户的简档,确定用户已选择头像的指令;以及
用于生成用于显示的覆盖在一部分媒体资产上的头像的指令。
40.如权利要求32所述的非暂态机器可读介质,还包括用于将语音签名存储在与用户相关联的所有设备上的指令。
41.如权利要求32所述的非暂态机器可读介质,还包括:
用于在用户的语音简档中存储语音签名和媒体资产的指示的指令;
用于检测后续语音命令的指令;
用于确定与后续语音命令相关联的后续语音签名与所述语音签名匹配的指令;以及
用于将后续语音命令的内容存储在用户的语音简档中的指令。
42.一种用于基于语音数据和媒体消费数据识别用户的方法,所述方法包括:
使用控制电路系统根据从用户接收到的语音命令生成语音签名;
使用控制电路系统从语音签名中确定与用户相关联的多个语音特征,其中所述多个语音特征对应于多个人口统计学特征;
使用通信电路系统发送对与用户的家庭相关联的用户信息的请求;
使用通信电路系统接收用户信息,其中用户信息包括家庭内每个用户的相应人口统计信息;
使用控制电路系统将所述多个人口统计学特征与用户信息内的人口统计信息进行比较;
基于所述比较,使用控制电路系统确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配;
响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配:
使用控制电路系统确定语音命令包括对媒体资产的请求;
使用控制电路系统将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较;
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较,使用控制电路系统确定所述两个或更多个用户中的第一用户构成最佳匹配;以及
响应于确定第一用户是最佳匹配,使用控制电路系统生成用于显示的用户已经被识别出的指示。
43.如权利要求42所述的方法,其中发送对与用户的家庭相关联的用户信息的请求包括:
确定与接收语音命令的用户装备设备相关联的标识串;
生成针对家庭用户信息的查询,其中查询包括所述标识串;以及
将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。
44.如权利要求43所述的方法,其中接收用户信息还包括将用户信息存储在数据结构中,所述数据结构包括:
多个条目,其中所述多个条目包括家庭内每个用户的条目;以及
用于每个条目的多个字段,其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。
45.如权利要求44所述的方法,其中将所述多个人口统计学特征与用户信息内的人口统计信息进行比较包括:
从所述多个条目中检索第一条目;
将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较;以及
基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较,从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。
46.如权利要求45所述的方法,其中确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征包括:
将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较;以及
基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较,识别具有最高匹配的人口统计信息量的两个或更多个用户。
47.如权利要求42-46中的任一项所述的方法,其中将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较包括:
接收多个用户简档,其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户,并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征;
将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较;以及
基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较,为所述两个或更多个用户中的每个用户确定匹配的特征量。
48.如权利要求47所述的方法,其中从所述两个或更多个用户确定具有最高匹配元数据量的用户包括:
检索与所述多个特征中的每个特征相关联的权重;
使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量;以及
选择具有最高匹配特征量的匹配用户。
49.如权利要求42-48中的任一项所述的方法,其中生成用于显示的用户已经被识别出的指示包括:
从存储装置中检索用户的简档;
基于用户的简档,确定用户已选择头像;以及
生成用于显示的覆盖在一部分媒体资产上的头像。
50.如权利要求42-49中的任一项所述的方法,还包括将语音签名存储在与用户相关联的所有设备上。
51.如权利要求42-50中的任一项所述的方法,还包括:
在用户的语音简档中存储语音签名和媒体资产的指示;
检测后续语音命令;
确定与后续语音命令相关联的后续语音签名与所述语音签名匹配;以及
将后续语音命令的内容存储在用户的语音简档中。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2017/068581 WO2019132896A1 (en) | 2017-12-27 | 2017-12-27 | Systems and methods for identifying users based on voice data and media consumption data |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111527541A true CN111527541A (zh) | 2020-08-11 |
Family
ID=61018017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780097947.0A Pending CN111527541A (zh) | 2017-12-27 | 2017-12-27 | 基于语音数据和媒体消费数据识别用户的系统和方法 |
Country Status (9)
Country | Link |
---|---|
US (3) | US10937431B2 (zh) |
EP (2) | EP3732675B1 (zh) |
JP (1) | JP7127131B2 (zh) |
KR (1) | KR102451348B1 (zh) |
CN (1) | CN111527541A (zh) |
AR (1) | AR113680A1 (zh) |
AU (1) | AU2017444907B2 (zh) |
CA (1) | CA3083453A1 (zh) |
WO (1) | WO2019132896A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113785595A (zh) * | 2019-05-01 | 2021-12-10 | 尼尔森(美国)有限公司 | 对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210001529A (ko) * | 2019-06-28 | 2021-01-06 | 엘지전자 주식회사 | 로봇, 그와 연결되는 서버, 및 로봇을 이용한 음성 인식 방법 |
US20210304259A1 (en) * | 2020-03-31 | 2021-09-30 | Salesforce.Com, Inc. | Methods and systems for delivery of customized content via voice recognition |
KR20220021277A (ko) | 2020-08-13 | 2022-02-22 | 주식회사 엘지에너지솔루션 | 배터리 관리 시스템, 배터리 관리 방법, 배터리 팩 및 전기 차량 |
EP4057165B1 (de) * | 2021-03-11 | 2024-07-17 | Deutsche Telekom AG | Sprachassistenzsteuerung |
CN114121014A (zh) * | 2021-10-26 | 2022-03-01 | 云知声智能科技股份有限公司 | 多媒体数据的控制方法及设备 |
EP4202738A1 (de) * | 2021-12-22 | 2023-06-28 | Deutsche Telekom AG | Nutzeridentifikation anhand einer spracheingabe |
US11641505B1 (en) * | 2022-06-13 | 2023-05-02 | Roku, Inc. | Speaker-identification model for controlling operation of a media player |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6239794B1 (en) | 1994-08-31 | 2001-05-29 | E Guide, Inc. | Method and system for simultaneously displaying a television program and information about the program |
US7613659B1 (en) * | 1994-11-28 | 2009-11-03 | Yt Acquisition Corporation | System and method for processing tokenless biometric electronic transmissions using an electronic rule module clearinghouse |
US6564378B1 (en) | 1997-12-08 | 2003-05-13 | United Video Properties, Inc. | Program guide system with browsing display |
CN1867068A (zh) | 1998-07-14 | 2006-11-22 | 联合视频制品公司 | 交互式电视节目导视系统及其方法 |
AR020608A1 (es) | 1998-07-17 | 2002-05-22 | United Video Properties Inc | Un metodo y una disposicion para suministrar a un usuario acceso remoto a una guia de programacion interactiva por un enlace de acceso remoto |
CN101383946A (zh) | 1998-07-17 | 2009-03-11 | 联合视频制品公司 | 点播节目的系统及其相关方法 |
US7165098B1 (en) | 1998-11-10 | 2007-01-16 | United Video Properties, Inc. | On-line schedule system with personalization features |
JP3735209B2 (ja) * | 1999-03-03 | 2006-01-18 | 富士通株式会社 | 話者認識装置及び方法 |
WO2002069636A1 (en) | 2001-02-21 | 2002-09-06 | United Video Properties, Inc. | Systems and methods for interactive program guides with personal video recording features |
KR20040105999A (ko) * | 2003-06-10 | 2004-12-17 | 온오프코리아 주식회사 | 네트워크 기반 소리 아바타 생성 방법 및 시스템 |
US20100153885A1 (en) | 2005-12-29 | 2010-06-17 | Rovi Technologies Corporation | Systems and methods for interacting with advanced displays provided by an interactive media guidance application |
US7627641B2 (en) * | 2006-03-09 | 2009-12-01 | Watchguard Technologies, Inc. | Method and system for recognizing desired email |
US20080092156A1 (en) * | 2006-09-29 | 2008-04-17 | United Video Properties, Inc. | Systems and methods for automatically identifying a user profile |
US8442824B2 (en) * | 2008-11-26 | 2013-05-14 | Nuance Communications, Inc. | Device, system, and method of liveness detection utilizing voice biometrics |
US8340974B2 (en) * | 2008-12-30 | 2012-12-25 | Motorola Mobility Llc | Device, system and method for providing targeted advertisements and content based on user speech data |
US20100169809A1 (en) | 2008-12-31 | 2010-07-01 | Mccarthy Ann Lerene | Method And System For Managing Visually Related Multimedia Information By Means Of Dimensional Classification |
KR101420189B1 (ko) * | 2010-03-03 | 2014-07-17 | 한국전자통신연구원 | 연령 및 성별을 이용한 사용자 인식 장치 및 방법 |
CN102404287A (zh) * | 2010-09-14 | 2012-04-04 | 盛乐信息技术(上海)有限公司 | 用数据复用法确定声纹认证阈值的声纹认证系统及方法 |
US9031848B2 (en) * | 2012-08-16 | 2015-05-12 | Nuance Communications, Inc. | User interface for searching a bundled service content data source |
WO2014098477A1 (ko) * | 2012-12-18 | 2014-06-26 | 삼성전자 주식회사 | 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치 |
US9299350B1 (en) * | 2013-03-15 | 2016-03-29 | Amazon Technologies, Inc. | Systems and methods for identifying users of devices and customizing devices to users |
WO2014199602A1 (ja) * | 2013-06-10 | 2014-12-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 話者識別方法、話者識別装置及び情報管理方法 |
US11170089B2 (en) * | 2013-08-22 | 2021-11-09 | Staton Techiya, Llc | Methods and systems for a voice ID verification database and service in social networking and commercial business transactions |
US9426525B2 (en) * | 2013-12-31 | 2016-08-23 | The Nielsen Company (Us), Llc. | Methods and apparatus to count people in an audience |
US10127911B2 (en) * | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10165322B2 (en) * | 2014-09-30 | 2018-12-25 | Rovi Guides, Inc. | Methods and systems for controlling user devices |
DK3257043T3 (en) * | 2015-02-11 | 2019-01-14 | Bang & Olufsen As | Speaker recognition in a multimedia system |
US10067985B2 (en) * | 2015-03-05 | 2018-09-04 | Telenav, Inc. | Computing system with crowd-source mechanism and method of operation thereof |
US10834454B2 (en) * | 2015-12-17 | 2020-11-10 | Interdigital Madison Patent Holdings, Sas | Personalized presentation enhancement using augmented reality |
US9772817B2 (en) * | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10026403B2 (en) * | 2016-08-12 | 2018-07-17 | Paypal, Inc. | Location based voice association system |
WO2018106971A1 (en) * | 2016-12-07 | 2018-06-14 | Interactive Intelligence Group, Inc. | System and method for neural network based speaker classification |
KR20180074316A (ko) * | 2016-12-23 | 2018-07-03 | 삼성전자주식회사 | 장소 정보를 제공하기 위한 시스템 및 이를 지원하는 방법 및 전자 장치 |
US11044525B2 (en) * | 2016-12-27 | 2021-06-22 | Rovi Guides, Inc. | Systems and methods for dynamically adjusting media output based on presence detection of individuals |
US20180204133A1 (en) * | 2017-01-18 | 2018-07-19 | Facebook, Inc. | Demographic prediction for users in an online system with unidirectional connection |
US10522154B2 (en) * | 2017-02-13 | 2019-12-31 | Google Llc | Voice signature for user authentication to electronic device |
US10438594B2 (en) * | 2017-09-08 | 2019-10-08 | Amazon Technologies, Inc. | Administration of privileges by speech for voice assistant system |
-
2017
- 2017-12-27 JP JP2020535629A patent/JP7127131B2/ja active Active
- 2017-12-27 CN CN201780097947.0A patent/CN111527541A/zh active Pending
- 2017-12-27 CA CA3083453A patent/CA3083453A1/en active Pending
- 2017-12-27 EP EP17832867.0A patent/EP3732675B1/en active Active
- 2017-12-27 AU AU2017444907A patent/AU2017444907B2/en active Active
- 2017-12-27 WO PCT/US2017/068581 patent/WO2019132896A1/en unknown
- 2017-12-27 KR KR1020207019382A patent/KR102451348B1/ko active IP Right Grant
- 2017-12-27 EP EP23170882.7A patent/EP4246508A3/en active Pending
- 2017-12-27 US US16/308,620 patent/US10937431B2/en active Active
-
2018
- 2018-12-26 AR ARP180103853A patent/AR113680A1/es unknown
-
2021
- 2021-01-21 US US17/154,571 patent/US11798565B2/en active Active
-
2023
- 2023-08-29 US US18/239,619 patent/US20230402042A1/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113785595A (zh) * | 2019-05-01 | 2021-12-10 | 尼尔森(美国)有限公司 | 对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计 |
CN113785595B (zh) * | 2019-05-01 | 2024-07-23 | 尼尔森(美国)有限公司 | 对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计 |
Also Published As
Publication number | Publication date |
---|---|
US10937431B2 (en) | 2021-03-02 |
EP3732675B1 (en) | 2023-05-03 |
US20230402042A1 (en) | 2023-12-14 |
AR113680A1 (es) | 2020-05-27 |
CA3083453A1 (en) | 2019-07-04 |
US11798565B2 (en) | 2023-10-24 |
EP3732675A1 (en) | 2020-11-04 |
AU2017444907B2 (en) | 2023-08-17 |
AU2017444907A1 (en) | 2020-06-11 |
WO2019132896A1 (en) | 2019-07-04 |
EP4246508A3 (en) | 2023-11-15 |
EP4246508A2 (en) | 2023-09-20 |
US20200395021A1 (en) | 2020-12-17 |
KR20200101934A (ko) | 2020-08-28 |
JP2021516356A (ja) | 2021-07-01 |
JP7127131B2 (ja) | 2022-08-29 |
KR102451348B1 (ko) | 2022-10-06 |
US20210233542A1 (en) | 2021-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7423719B2 (ja) | メディアアセットの部分を識別し記憶するためのシステムおよび方法 | |
US11561955B2 (en) | Systems and methods for updating a knowledge graph through user input | |
US9807436B2 (en) | Systems and methods for providing media asset recommendations for a group | |
CN109416789B (zh) | 基于第二用户的查看活动向第一用户推荐媒体资产以包括在第二用户的播放列表中的方法和系统 | |
JP2023105206A (ja) | 会話におけるコンテキスト切替を決定するためのシステムおよび方法 | |
US11798565B2 (en) | Systems and methods for identifying users based on voice data and media consumption data | |
CN109565619B (zh) | 用于针对自然语言查询执行补充功能的系统和方法 | |
US9734244B2 (en) | Methods and systems for providing serendipitous recommendations | |
US11617020B2 (en) | Systems and methods for enabling and monitoring content creation while consuming a live video | |
US20190172498A1 (en) | Systems and methods for determining playback points in media assets | |
US9398343B2 (en) | Methods and systems for providing objects that describe media assets | |
US20230308711A1 (en) | System and method for classifying recorded content for deletion | |
US20180367857A1 (en) | Systems and methods for ranking content sources based on a number of media assets identified to be interesting to a user | |
US11960516B2 (en) | Methods and systems for playing back indexed conversations based on the presence of other people | |
US20160179803A1 (en) | Augmenting metadata using commonly available visual elements associated with media content | |
US9578393B2 (en) | Systems and methods for detecting and acting on easter eggs hidden in media assets | |
CN110799962A (zh) | 用更适合用户的版本替换媒体的存储版本的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200811 |
|
WD01 | Invention patent application deemed withdrawn after publication |