CN110741365A - 用于管理多媒体内容中的加载时间的数据结构查询 - Google Patents
用于管理多媒体内容中的加载时间的数据结构查询 Download PDFInfo
- Publication number
- CN110741365A CN110741365A CN201780092060.2A CN201780092060A CN110741365A CN 110741365 A CN110741365 A CN 110741365A CN 201780092060 A CN201780092060 A CN 201780092060A CN 110741365 A CN110741365 A CN 110741365A
- Authority
- CN
- China
- Prior art keywords
- processing system
- data processing
- time
- quantized
- computing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 91
- 238000000034 method Methods 0.000 claims abstract description 61
- 238000013139 quantization Methods 0.000 claims abstract description 43
- 230000005236 sound signal Effects 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims description 198
- 238000004891 communication Methods 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 description 42
- 230000008569 process Effects 0.000 description 15
- 238000013500 data storage Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 12
- 230000009471 action Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 101100264195 Caenorhabditis elegans app-1 gene Proteins 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000009877 rendering Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/433—Query formulation using audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
提供了用于管理多媒体内容的加载时间的系统和方法数据结构查询。一种系统从计算装置接收输入音频信号并且识别请求。所述系统识别量化日期值和量化时间值。所述系统经由在具有所述量化日期值和量化时间值的多维矩阵数据结构中进行查找来针对所述量化日期值和所述量化时间值检索信号。所述系统用所述信号生成查询,并且将所述查询应用于多媒体内容数据结构以识别与所述多个信号相匹配的多个多媒体内容项。所述系统提供对所述多个多媒体内容项的指示,所述多个多媒体内容项与从所述多维矩阵数据结构检索到的、针对所述量化日期值和所述量化时间值的所述信号相匹配。
Description
背景技术
具有有限的接口的计算装置可能对大型数据集合进行过滤提出挑战,这可能使得多媒体内容项或者其部分的加载时间延迟或者导致过多的内存使用。
发明内容
本公开大体上涉及管理数据结构查询的响应时间和有效性以及经由数据结构查询识别到的多媒体内容项的加载时间。本公开的系统和方法涉及:通过使用存储用信号填充的多维矩阵的第一数据结构来构建查询,并且然后将查询应用于第二数据结构以对数据集合进行过滤以识别响应请求的多媒体内容项。系统可以利用多维矩阵数据结构,该多维矩阵数据结构包括可以用于生成查询的信号的值。多维矩阵数据结构可以是信号中的每个信号的二乘二矩阵,其中,第一维度与日期对应,并且第二维度与时间对应。可以使第一维度和第二维度量化,从而提供与未被量化的值相比较,具有减少的数量的行和列的多维矩阵数据结构。通过产生较小的矩阵结构,数据处理系统可以以减少的延迟和等待时间来响应第一数据结构的查询。数据处理系统可以通过使用矩阵结构中的信号的值来生成第二查询,并且然后,将第二查询应用于存储多媒体内容项的第二数据结构。因此,通过使用减少的矩阵数据结构来生成查询,数据处理系统可以减少响应于请求而加载多媒体内容项的等待时间和延迟。
至少一个方面涉及一种用于数据结构查询以管理多媒体内容的加载时间的系统。该系统可以包括:数据处理系统,该数据处理系统包括由一个或者多个处理器执行的数字助理组件。该数字助理组件可以按照会话方式来提供针对以及来自用户的音频输入和输出,并且可以包括自然语言处理器组件和查询生成器组件或者与其接口连接。数据处理系统可以经由数据处理系统的接口来接收包括由计算装置的传感器检测到的输入音频信号的数据包。数据处理系统可以对输入音频信号进行解析以识别请求。数据处理系统可以响应于请求而识别与请求对应的量化日期值和量化时间值。数据处理系统可以经由在具有量化日期值和量化时间值的多维矩阵数据结构中进行查找,来检索用于量化日期值和量化时间值的多个信号中的每个信号的一个或者多个值。多维矩阵数据结构的第一维度可以具有量化日期,并且多维矩阵数据结构的第二维度具有量化时间。数字处理系统可以用从具有量化日期值和量化时间值的多维矩阵结构检索到的、所述多个信号中的每个信号的所述一个或者多个值来生成查询。数据处理系统可以将查询应用于多媒体内容数据结构以响应于查询而识别与所述多个信号中的每个信号的所述一个或者多个值相匹配的多个多媒体内容项。数据处理系统可以向计算装置提供对所述多个多媒体内容项的指示以便经由由计算装置渲染的图形用户接口进行呈现,该多个多媒体内容项与从多维矩阵数据结构检索到的、用于量化日期值和量化时间值的所述多个信号中的每个信号的所述一个或者多个值相匹配。
至少一个方面涉及一种对用于管理多媒体内容的加载时间的数据结构进行查询的方法。该方法可以包括:数据处理系统经由接口来接收包括由计算装置的传感器检测到的输入音频信号的数据包。该方法可以包括:数据处理系统对输入音频信号进行解析以识别请求。该方法可以包括:数据处理系统响应于请求而识别与请求对应的量化日期值和量化时间值。该方法可以包括:数据处理系统经由在具有量化日期值和量化时间值的多维矩阵数据结构中进行查找,来检索用于量化日期值和量化时间值的多个信号中的每个信号的一个或者多个值。多维矩阵数据结构的第一维度可以具有量化日期,并且多维矩阵数据结构的第二维度可以具有量化时间。该方法可以包括:数字处理系统用从具有量化日期值和量化时间值的多维矩阵结构检索到的、所述多个信号中的每个信号的所述一个或者多个值来生成查询。该方法可以包括:数据处理系统将查询应用于多媒体内容数据结构以响应于查询而识别与所述多个信号中的每个信号的所述一个或者多个值相匹配的多个多媒体内容项。该方法可以包括:数据处理系统向计算装置提供对所述多个多媒体内容项的指示以便经由由计算装置渲染的图形用户接口进行呈现,该多个多媒体内容项与从多维矩阵数据结构检索到的、用于量化日期值和量化时间值的所述多个信号中的每个信号的所述一个或者多个值相匹配。
下面详细讨论了这些和其它方面以及实施方式。前述信息和以下详细描述包括各个方面和实施方式的说明性示例,并且提供了用于理解所要求保护的方面和实施方式的性质和特性的概况或者框架。附图提供了对各个方面和实施方式的说明和进一步理解,并且被并入本说明书以及构成本说明书的一部分。
附图说明
附图不旨在按比例绘制。各个附图中的相同附图标记和标号指示相同的元件。为了清楚起见,并非可以在每个附图中标记每个组件。在附图中:
图1是用于数据结构查询以管理多媒体内容的加载时间的系统的图示。
图2是用于数据结构查询以管理多媒体内容的加载时间的系统的操作的图示。
图3是对用于管理多媒体内容的加载时间的数据结构进行查询的方法的图示。
图4是图示了计算机系统的一般架构的框图,该计算机系统可以被采用来实施本文所描述和图示的系统和方法的元件。
具体实施方式
以下是对与经由计算机网络来对封包化动作进行路由的方法、设备和系统有关的各种概念以及这些方法、设备和系统的实施方式的更详细的描述。可以按照许多方式中的任何方式来实施在上面介绍的并且在下面更详细地讨论的各种概念。
本公开大体上涉及管理数据结构查询的响应时间和有效性以及经由数据结构查询识别到的多媒体内容项的加载时间。本公开的系统和方法涉及:通过使用存储用信号填充的多维矩阵的第一数据结构来构建查询,并且然后将查询应用于第二数据结构以对数据集合进行过滤以识别响应请求的多媒体内容项。系统可以利用多维矩阵数据结构,该多维矩阵数据结构包括可以用于生成查询的信号的值。多维矩阵数据结构可以是信号中的每个信号的二乘二矩阵,其中,第一维度与日期对应,并且第二维度与时间对应。可以使第一维度和第二维度量化,从而提供与未被量化的值相比较,具有减少的数量的行和列的多维矩阵数据结构。通过产生较小的矩阵结构,数据处理系统可以以减少的延迟和等待时间来响应第一数据结构的查询。数据处理系统可以通过使用矩阵结构中的信号的值来生成第二查询,并且然后,将第二查询应用于存储多媒体内容项的第二数据结构。因此,通过使用减少的矩阵数据结构来生成查询,数据处理系统可以减少响应于请求而加载多媒体内容项的等待时间和延迟。
本解决方案可以利用双数据结构查询技术来以通过使响应于请求而识别的多媒体内容项的数量减到最少来减少资源消耗、处理器利用、带宽利用、数据文件的大小或者图形引擎所消耗的时间量的方式来识别多媒体内容项。例如,从用户装置接收到的对多媒体内容的请求可能缺少关键字或者搜索词语。请求可能不包括用于构建查询以执行搜索的参数。例如,请求可以包括语音输入,诸如,“What is there to watch?(有什么可以观看?)”。在该示例中,请求缺少附加关键字或者词语来生成查询。因此,数据处理系统可以提供大量(例如,50个、60个、75个、90个、100个、150个或者更多)候选多媒体内容项。然而,在无法访问遥控器(例如,无线控制器装置)的远场方式下的语音交互模式下,对大量搜索结果进行导航或者与其进行交互可能具有挑战性。进一步地,提供要通过由计算装置提供的图形用户接口渲染的大量多媒体内容项可能是资源密集型的,并且由于识别大量多媒体内容项并且将其提供至计算装置以便进行呈现,等待时间或者延迟可能增加。
本解决方案可以促进与无法达到或者没有触摸输入的这种计算装置的具有有限的接口的计算装置进行交互,其中,主要的交互是基于语音的。为此,本解决方案可以提供构建查询的新技术,该查询被应用于多媒体数据结构以识别要在图形用户接口中被提供以便显示在显示装置上的最少的候选多媒体内容项。例如,数据处理系统可以接收当前的时间戳和日期戳,将这些值映射至量化值,并且在多维矩阵中执行查找以检索与量化值对应的信号。
例如,计算装置可以接收携带请求的声信号。该声信号可以与来自用户的话音对应。请求可以包括“What is there to watch?”即使请求可能不包括附加搜索词语或者关键字,数据处理系统也可以针对多媒体内容项提供相关的、最少的建议。系统可以提供超时结果。系统可以只提供5个响应,而不是提供100个响应,例如,该5个响应可以是与100个部分重叠,或者与100个响应不同的100个的子集。为此,系统利用两种信号:偏好信号和上下文信号。偏好信号可以包括:1)对用于提供多媒体内容项的一个或者多个应用的偏好(例如,优选的多媒体内容的提供商或者多媒体内容的源);2)对交易类型(例如,免费的内容、要购买的内容、订阅服务)的偏好;3)对媒体消费模式(例如,计算装置先前未渲染的新的多媒体内容项;继续系列,重新观看多媒体内容项;背景模式)的偏好。上下文信号可以包括:1)对媒体消耗持续时间(例如,15分钟;30分钟;1小时;或者90分钟)的偏好;以及2)对媒体类型(例如,电影、电视节目、直播电视或者先前录制的内容)的偏好。系统可以将这些值填充在2×2矩阵中:周末/工作日×白天/夜晚。系统可以确定信号的度量或者值。此后,响应于查询,系统可以确定矩阵中与时间/日期对应的索引,并且然后使用那些偏好和上下文来构建查询以应用于多媒体内容数据结构以识别要呈现的候选多媒体内容项。
图1图示了用于数据结构查询以管理多媒体内容的加载时间的示例系统100。该系统100可以包括数据处理系统102。该数据处理系统102可以经由网络105来与一个或者多个数据提供商装置108或者一个或者多个计算装置104通信。网络105可以包括计算机网络,诸如,互联网、局域网、广域网、城域网或者其它区域网络、内联网、卫星网络以及其它通信网络,诸如,语音或者数据移动电话网。网络105可以用于访问信息资源,诸如,可以在诸如,膝上型计算机、台式计算机、平板、个人数字助理、智能电话、便携式计算机、扬声器、智能电视、机顶盒、数字媒体播放器、微控制台、网络家电或者娱乐装置的至少一个计算装置104上呈现、输出、渲染或者显示的电子内容项、媒体内容、网页、网站、域名或者统一资源定位符。例如,经由网络105,计算装置104的用户可以访问由数据提供商108提供的信息或者数据。计算装置104可以包括或者不包括显示器;例如,计算装置可以包括有限类型的用户接口,诸如,显示装置132、传感器134(例如,麦克风)、扬声器136或者遥控器装置134。在一些情况下,计算装置104的主要用户接口可以是麦克风和扬声器136。
网络105可以包括或者构成显示网络,例如,在互联网上可用的信息资源的子集,这些信息资源与内容布置或者搜索引擎结果系统相关联,或者有资格包括第三方内容项作为内容项布置活动的一部分。网络105可以由计算装置104或者数据处理系统102用于访问信息资源,诸如,可以由客户端计算装置104呈现、输出、渲染或者显示的网页、网站、域名或者统一资源定位符。例如,经由网络105,客户端计算装置104的用户可以访问由数据提供商计算装置108提供的信息或者数据。
网络105可以是任何类型或者形式的网络,并且可以包括以下中的任何一个:点对点网络、广播网络、广域网、局域网、电信网络、数据通信网络、计算机网络、ATM(异步传输模式)网络、SONET(同步光纤网络)网络、SDH(同步数字体系)网络、无线网络或者有线网络。网络105可以包括无线链路,诸如,红外信道或者卫星频带。网络105的拓扑可以包括总线、星形或者环形网络拓扑。网络可以包括移动电话网络,该移动电话网络使用用于在移动装置之间进行传送的任何一种协议或者多种协议,其包括:高级移动电话协议(“AMPS”)、时分多址(“TDMA”)、码分多址(“CDMA”)、全球移动通信系统(“GSM”)、通用分组无线业务(“GPRS”)或者通用移动电信系统(“UMTS”)。可以经由不同的协议来发送不同类型的数据,或者可以经由不同的协议来发送相同类型的数据。
系统100可以包括至少一个数据处理系统102。该数据处理系统102可以包括至少一个逻辑装置,诸如,具有用于经由网络105来与例如,计算装置104或者数据提供商装置108通信的处理器的计算装置。数据处理系统102可以包括至少一个计算资源、服务器、处理器或者存储器。例如,数据处理系统102可以包括位于至少一个数据中心中的多个计算资源或者服务器。数据处理系统102可以包括多个逻辑分组的服务器,并且促进分布式计算技术。可以将逻辑服务器组称为数据中心、服务器场或者机器场。服务器还可以在地理上分散。可以将数据中心或者机器场作为单个实体来进行管理,或者机器场可以包括多个机器场。每个机器场内的服务器可以是异构的—服务器或者机器中的一个或者多个可以根据一种或者多种类型的操作系统平台来进行操作。
机器场中的服务器可以存储在高密度机架系统以及相关联的存储系统中,并且位于企业数据中心中。例如,以这种方式来整合服务器可以通过在本地化的高性能网络上对服务器和高性能存储系统进行定位来改进系统可管理性、数据安全性、系统的物理安全性以及系统性能。使数据处理系统102组件中的全部或者一些组件(包括服务器和存储系统)集中并且将它们与高级系统管理工具耦合允许更有效地使用服务器资源,这节省了功率和处理要求,并且减少了带宽使用。
系统100可以包括、访问至少一个数据提供商装置108或者以其它方式与其交互。数据提供商装置108可以包括至少一个逻辑装置,诸如,具有用于经由网络105来与例如,计算装置104或者数据处理系统102通信的处理器的计算装置。数据提供商装置108可以包括至少一个计算资源、服务器、处理器或者存储器。例如,数据提供商装置108可以包括位于至少一个数据中心中的多个计算资源或者服务器。数据提供商装置108可以包括数据处理系统102的一个或者多个组件或者功能。
计算装置104可以包括至少一个自然语言处理器(“NLP”)组件112和接口110,与它们接口连接,或者以其它方式与它们通信。计算装置104还可以包括至少一个显示装置132、传感器134、扬声器136或者遥控器装置134,与它们接口连接,或者以其它方式与它们通信。计算装置104可以经由有线或者无线通信技术来与这些组件接口连接或者通信。
显示装置132可以包括在图4中描绘的显示器435的一个或者多个组件或者功能。传感器134可以包括:例如,麦克风、环境光传感器、接近传感器、温度传感器、加速度计、陀螺仪、运动检测器、GPS传感器、位置传感器或者触摸传感器。扬声器136可以包括将电脉冲或者磁脉冲转换为声音的换能器、扩音器或者设备。计算装置104可以包括接口,该接口包括向硬件扬声器136提供软件接口的音频驱动器。接口的音频驱动器可以执行由计算装置104或者数据处理系统102的组件提供的其它指令或者音频文件或者音频流以控制扬声器136生成对应的声波或者音波。
可以设计、配置、构造或者操作计算装置104的接口110以通过使用例如,数据包来接收和发送信息。接口110可以通过使用诸如网络协议的一个或者多个协议来接收和发送信息。接口110可以包括硬件接口、软件接口、有线接口或者无线接口。接口110可以包括或者提供图形用户接口或者语音交互接口。接口110可以经由显示装置132来渲染图形输出。接口110可以促进将数据从一种格式转换为或者格式化为另一种格式。例如,接口110可以包括应用编程接口,该应用编程接口包括针对在诸如软件组件的各个组件之间的通信的限定。
遥控器装置134可以意指控制计算装置104的方面或者功能或者以其它方式与计算装置104或者数据处理系统102通信的无线控制器装置或者其它装置。例如,遥控器装置134可以包括用于接收输入并且提供向计算装置104或者数据处理系统102提供对输入的指示的一个或者多个电路、无线模块、发送器、电源、输入接口(例如,在图4中描绘的输入装置430)以及一个或者多个传感器(例如,传感器134)。遥控器装置134可以经由按钮、开关、触摸接口或者手势来接收输入。在一些情况下,遥控器装置134可以是可操作以传送或者控制计算装置104的独立遥控器。在一些情况下,遥控器装置134可以意指在一种计算装置上执行的软件应用,其中,软件应用被配置为与计算装置104或者数据处理系统102通信。例如,遥控器装置104可以包括由智能电话、平板、智能手表或者平板执行的应用。
当遥控器装置138未在使用中、被禁用或者出故障时,遥控器装置138可以被停用,是不活动的,被关闭,处于睡眠状态或者处于待机状态。当遥控器装置138未在使用中时,计算装置104可以利用语音接口,其中,计算装置104至少部分地使用由计算装置104执行的NLP组件112或者结合由数据处理系统102执行的NLP组件112来接收来自用户的语音命令,并且处理语音命令。
计算装置104可以包括NLP组件112,该NLP组件112被配置为检测关键字,并且基于关键字来执行动作。NLP组件112可以在将词语发送至数据处理系统102以便进行进一步处理之前过滤掉一个或者多个词语或者修改词语。可以将计算装置104的或者由计算装置104执行的NLP组件112称为本地NLP组件或者客户端侧NLP组件。计算装置102的NLP组件112可以将由麦克风检测到的模拟音频信号转换为数字音频信号,并且经由网络105来将携带数字音频信号的一个或者多个数据包发送至数据处理系统102。在一些情况下,NLP组件112可以响应于检测到执行这种发送的指令来发送携带输入音频信号中的一些或者全部输入音频信号的数据包。指令可以包括:例如,触发关键字、热词或者针对将包括输入音频信号的数据包发送至数据处理系统102以便由数据处理系统102的NLP组件112进行进一步处理的其它关键字或者批准,可以将该NLP组件112称为服务器NLP组件或者云NLP组件。
客户端计算装置104可以与终端用户相关联,该终端用户将语音查询作为音频输入键入到客户端计算装置104中(例如,经由传感器134),并且以可以从数据处理系统102(或者数据提供商计算装置)提供至客户端计算装置104并且通过扬声器136输出的计算机生成的声音的形式来接收音频输出。计算机生成的语音可以包括来自真实的人的录音或者计算机生成的语言。
计算装置104的接口110和NLP组件112可以分别包括至少一个处理单元或者其它逻辑装置,诸如,被配置为与计算装置104或者数据处理系统102的一个或者多个组件通信的可编程逻辑阵列引擎或者模块。接口110和NLP组件112可以是单独的组件、单个组件或者计算装置104的一部分。系统100及诸如计算装置104的其组件可以包括硬件元件,诸如,一个或者多个处理器、逻辑装置或者电路。
数据处理系统102可以包括或者执行至少一个接口110。可以将数据处理系统的接口110称为服务器侧接口、数据处理系统接口、远程接口或者系统接口。数据处理系统的接口110可以包括计算装置104的接口110的一个或者多个组件或者功能。数据处理系统102可以包括至少一个NLP组件112,与其接口连接,或者以其它方式与其通信。可以将数据处理系统的NLP组件112称为数据处理系统NLP组件、服务器NLP组件或者云NLP组件。数据处理系统的NLP组件112可以包括计算装置104的NLP组件112的一个或者多个组件或者功能。
数据处理系统102可以包括至少一个数字助理组件114,与其接口连接,或者以其它方式与其通信。数字助理组件114可以意指数据处理系统102的系统或者组件,该数据处理系统102包括以下中的一个或者多个或者与其接口连接:用于促进在基于语音的环境中对基于语音的查询进行解析并且提供响应的NLP组件112、接口110、查询生成器组件116、内容选择器组件118或者音频信号生成器组件120。数据处理系统102可以包括至少一个查询生成器组件116,与其接口连接,或者以其它方式与其通信。数据处理系统102可以包括至少一个内容选择器组件118,与其接口连接,或者以其它方式与其通信。数据处理系统102可以包括至少一个音频信号生成器120,与其接口连接,或者以其它方式与其通信。数据处理系统102可以包括至少一个数据储存库122,与其接口连接,或者以其它方式与其通信。数据储存库122可以包括一个或者多个本地的或者分布式数据库,并且可以包括数据库管理系统。数据储存库122可以包括计算机数据存储或者存储器。至少一个数据储存库122可以被包括或者存储在一个或者多个数据结构或者数据库中,其包括:例如,矩阵数据结构124、历史数据数据结构126和多媒体内容数据结构128。该多媒体内容数据结构128可以存储多媒体内容项、电子内容项或者在线文档。矩阵数据结构124可以存储具有信号的值的一个或者多个多维矩阵。历史数据数据结构126可以存储在时间间隔内来自计算装置104的历史信号信息或者来自多个计算装置的聚集信号信息。
在一些情况下,内容选择器组件118可以从数据储存库122中选择电子内容项,并且经由计算装置104的接口110来提供电子内容项的所选择的子集以便进行呈现。
接口110、NLP组件112、数字助理组件114、查询生成器组件116、内容选择器组件118或者音频信号生成器组件120可以分别包括至少一个处理单元或者其它逻辑装置,诸如,配置为与数据库储存库或者数据库140通信的可编程逻辑阵列引擎或者模块。接口110、NLP组件112、数字助理组件114、查询生成器组件116、内容选择器组件118、音频信号生成器组件120和数据储存库122可以是单独的组件、单个组件或者数据处理系统102的一部分。系统100及其组件(诸如,数据处理系统102)可以包括硬件元件,诸如,一个或者多个处理器、逻辑装置或者电路。
数据处理系统102可以获得与多个计算装置104相关联的匿名计算机网络活动信息。计算装置104的用户可以肯定地授权数据处理系统102获得与用户的计算装置104对应的网络活动信息。例如,数据处理系统102可以提示计算装置104的用户同意获得一种或者多种类型的网络活动信息。计算装置104的用户的身份可以保持匿名,并且计算装置104可以与唯一标识符(例如,用户或者由数据处理系统提供的计算装置或者计算装置的用户的唯一标识符)相关联。数据处理系统可以将每个观察与对应的唯一标识符相关联。
数据处理系统102可以包括安装在客户端计算装置104处的助理应用、应用、脚本或者程序,诸如,用于向计算装置104的接口110传送输入音频信号并且驱动客户端计算装置的组件渲染输出音频信号的应用。数据处理系统102可以接收数据包或者包括或者识别音频输入信号的其它信号。例如,数据处理系统102可以执行或者运行NLP组件112以接收或者获得音频信号并且对音频信号进行解析。例如,NLP组件112可以促进人类与计算机之间的交互。NLP组件112可以配置有用于理解自然语言并且允许数据处理系统102从人类或者自然语言输入中导出含义的技术。NLP组件112可以包括或者配置有基于诸如统计机器学习的机器学习的技术。NLP组件112可以利用决策树、统计模型或者概率模型来对输入音频信号进行解析。NLP组件112可以执行例如,功能,诸如,命名实体识别(例如,在给定文本流的情况下,组件可以确定文本中的哪些项映射至适当的名称(诸如,人或者地方)以及每个这种名称的类型是什么(诸如,个人、位置或者组织))、自然语言生成(例如,将计算机数据库或者语义意图中的信息转换为可理解的人类语言)、自然语言理解(例如,将文本转换为更正式的表示,诸如,计算机模块可以操纵的一阶逻辑结构)、机器翻译(例如,自动将文本从一种人类语言翻译成另一种人类语言)、形态学分割(例如,将单词分成单独的词素并且识别词素的种类,基于所考虑的语言的单词的形态学或者结构的复杂度,这可能具有挑战性)、问题解答(例如,确定人类语言问题的答案,该答案可以是具体的或者开放性的)以及语义处理(例如,可以在识别单词并且对其含义进行编码以使识别到的单词与具有相似含义的其它单词有关之后发生的处理)。
NLP组件112可以通过将输入信号与(例如,在数据储存库124中)存储的、有代表性的音频波形集合相比较并且选择最接近的匹配来将音频输入信号转换为识别文本。可以将音频波形集合存储在数据储存库122或者数据处理系统102可访问的其它数据库中。跨大型用户集合生成有代表性的波形,并且然后,可以用来自用户的话音样本来增强有代表性的波形。在将音频信号被转换为识别文本之后,NLP组件112将文本与例如,经由跨用户的训练或者通过手动指定关联于数据处理系统102可以服务的动作的单词相匹配。
音频输入信号可以由客户端计算装置104的传感器134检测。客户端计算装置104可以将音频输入信号提供至数据处理系统102(例如,经由网络105),在该数据处理系统102处,可以接收音频输入信号并且将其提供至NLP组件112或者存储在数据储存库122中以便进行进一步处理。客户端计算装置104可以只提供音频输入信号的一部分。例如,客户端计算装置104可以执行本地NLP组件112以检测触发词或者热词。热词可以意指唤醒计算装置104或者发起计算装置104的功能的关键字或者短语。热词可以意指计算装置104的NLP 112的脚本或者模块,该脚本或者模块被配置为侦听被选择以激活语音接口的特定关键字单词。在检测到热词之后,系统准备好进行基于语音的搜索、提问或者命令。在热词之后,计算装置104然后可以向数据处理系统102发送音频输入。客户端计算装置104可以在预定时间间隔(例如,一秒、两秒、三秒、四秒或者五秒)的音频输入中检测到暂停或者会话中断之后终止音频发送。
NLP组件112可以获得输入音频信号。通过输入音频信号,NLP组件112可以识别至少一个请求或者与请求对应的至少一个触发关键字。请求可以指示输入音频信号的意图或者主题。触发关键字可以指示可能采取的动作的类型。例如,NLP组件112可以对输入音频信号进行解析以识别经由显示装置132来提供用于显示的多媒体内容的至少一个请求。触发关键字可以包括至少一个单词、短语、词根或者部分单词、或者指示要采取的动作的派生词。例如,输入音频信号中的触发关键字“show(显示)”或者“show me something to watch(向我显示可以观看的内容)”可以指示需要执行搜索。在该示例中,输入音频信号(或者识别到的请求)不直接表达对传输的意图,然而,触发关键字指示对于请求所指示的至少一个其它动作而言,传输是辅助动作。
NLP组件112可以对输入音频信号进行解析以识别、确定、检索或者以其它方式获得请求。例如,NLP组件112可以将语义处理技术应用于输入音频信号以识别请求。NLP组件112可以将语义处理技术应用于输入音频信号以识别包括诸如,第一触发关键词和第二触发关键词的一个或者多个触发关键字的触发短语。例如,输入音频信号可以包括句子“showme something to watch”。NLP组件112可以向包括句子的数据包应用语义处理技术或者其它自然语言处理技术以识别触发短语及其关键字,诸如,“show”和“watch(观看)”。
数据处理系统102可以包括、执行查询生成器组件116或者以其它方式与其通信以构建或者生成要应用于多媒体内容数据结构128以响应于来自计算装置104的请求而识别候选内容项的查询。为了构建查询以响应于请求而获得多媒体内容,查询生成器组件116可以访问矩阵数据结构124以检索信号的值。为了获得信号的值,查询生成器组件124可以在矩阵数据结构124的一个或者多个矩阵中执行查找。查询生成器组件116可以通过使用与矩阵中的坐标对应的索引值来执行查找。可以基于与请求相关联的属性或者特点来确定索引值。
数据处理系统102可以识别多维矩阵数据结构,从该多维矩阵数据结构检索用于构建查询的信号。多维矩阵数据结构可以具有与计算装置104的标识符对应的标识符,诸如,账户标识符。多维矩阵数据结构可以与计算装置的地理区域或者位置对应。多维矩阵数据结构可以与关联于计算装置104的一个或者多个属性或者特点对应。例如,第一多维矩阵数据结构可以与第一装置类型对应,并且第二多维矩阵数据结构可以与第二装置类型对应。
可以基于与一个或者多个计算装置104相关联的历史网络活动信息来填充或者生成多维矩阵数据结构。矩阵数据结构可以是如下面在表1中图示的二乘二矩阵。
白天 | 夜晚 | |
工作日 | ||
周末 |
表1:2×2多维矩阵数据结构的说明性示例。
可以用信号的值来填充矩阵。值可以是数字值、字符串、字符或者字母数字。值的类型可以基于信号的类型。信号的值可以包括值列表。数据处理系统102可以为每个信号存储不同的矩阵,或者数据处理系统可以创建三维矩阵,在该三维矩阵中,第一维度是量化日期,第二维度是量化时间,并且第三维度是信号。因此,可以通过如下三个坐标来识别矩阵中的特定的一个或者多个值:(工作日,白天,Signal_1)。可以基于与多个信号中的每个信号相关联的历史网络活动信息来填充或生成多维矩阵数据结构。数据处理系统102可以利用一种或者多种类型的信号,诸如,偏好信号和上下文信号。偏好信号可以意指指示与计算装置104或者其用户相关联的偏好的信号,偏好诸如:1)对用于提供多媒体内容项的一个或者多个应用的偏好(例如,优选的多媒体内容的提供商或者多媒体内容的源);2)对交易类型(例如,免费的内容、要购买的内容、订阅服务)的偏好;3)对媒体消费模式(例如,计算装置先前未渲染的新的多媒体内容项;继续系列,重新观看多媒体内容项;背景模式)的偏好。数据处理系统102可以利用额外的或者更少的偏好信号。
数据处理系统102可以基于历史网络活动信息来确定针对计算装置104或者与该计算装置相关联的账户的偏好或者上下文。数据处理系统104可以利用一种或者多种统计技术或者机器学习技术来确定偏好或者上下文,对偏好或者上下文进行建模、预测,或者以其它方式识别偏好或者上下文。例如,数据处理系统104可以使用模式函数来识别在预定时间间隔(例如,7天、30天、45天或者60天)信号的最常见的值。取决于信号的类型,数据处理系统可以使用平均函数或者移动平均(例如,从连续区段导出的、用于识别信号的值的一系列平均)。数据处理系统104可以对偏好或者上下文值进行排名,并且使用阈值来确定若干排名最高的值以选择作为要包括在矩阵中的偏好或者上下文。
例如,计算装置104可以在预定时间间隔(例如,7天、30天、45天或者60天)的过程中执行以下五个应用以渲染或者播放多媒体内容项:app_1、app_2、app_3、app_4和app_5。数据处理系统102可以确定在预定时间间隔内,与app_4和app_5相比较,以更高的频率执行app_1、app_2和app_3。数据处理系统102可以将排名最高的前3个app识别为app_1、app_2和app_3以用作偏好信号的值。在一些情况下,数据处理系统102可以基于每个量化的日期和时间值确定排名最高的app(例如,在周末夜晚更频繁地执行的前3个app)。例如,如果数据处理系统102在最近4个星期内在周末夜晚执行相同的两个应用,则数据处理系统102可以将针对周末夜晚的第一偏好信号建立为以下两个应用的列表:app_2和app_3。
进一步地,数据处理系统102可以建立对量化日期和量化时间的偏好。数据处理系统102可以确定在工作日夜晚,计算装置更喜欢执行用于播放多媒体内容的application_1,而在周末,用户更喜欢application_2和application_3。因此,可以在表2中图示出针对第一偏好信号的多维矩阵数据结构。
表2:针对应用偏好信号的2×2多维矩阵数据结构的说明性示例。
如在表2中图示的,第一偏好信号可以指示对要执行以播放多媒体内容的应用的偏好。对于不同的量化日期索引和量化时间索引,信号可以具有不同的值。对于不同的计算装置104,信号可以具有不同的值,因为不同的计算装置可以表现出对要执行的应用的不同偏好。在该示例中,如果数据处理系统102在星期二晚上10:30接收到对内容的请求,则数据处理系统102可以将日期戳和时间戳映射至量化日期值“工作日”和量化时间值“夜晚”。数据处理系统102可以访问用与数据处理系统102从其接收数据的计算装置104对应的值来填充的矩阵数据结构。数据处理系统102可以使用量化值“工作日”和“夜晚”来在矩阵数据结构中执行查找以将针对信号的值识别为“app_1”。然后,数据处理系统102可以使用该值来生成查询或者对多媒体内容数据结构进行过滤以响应于请求而识别要呈现给计算装置104的候选多媒体内容项。
第二偏好信号可以包括对交易类型的偏好。交易类型可以意指计算装置104为了取得多媒体内容而进行的电子交易的类型。数据处理系统102可以基于历史网络活动信息来确定第二偏好信号的值。数据处理系统102可以确定计算装置104在预定时间段内进行的交易的类型以确定偏好。交易的类型可以包括:例如,免费的多媒体内容、购买的多媒体内容、租用的多媒体内容或者订阅服务。如在表3中的矩阵中图示的,数据处理系统102可以进一步基于量化的日期和时间值来确定偏好信号的值。
Preference_Signal_2 | 白天 | 夜晚 |
工作日 | 免费 | 租用 |
周末 | 订阅 | 购买 |
表3:针对交易类型偏好信号的2×2多维矩阵数据结构的说明性示例。
因此,如果请求与量化的日期和时间值“工作日”和“夜晚”对应,则如在针对用于计算装置104的第二偏好信号的表3矩阵中图示的,数据处理系统102可以将针对第二偏好信号的值检索为“租用”。
第三偏好信号可以包括对媒体消费模式的偏好。媒体消费模式信号可以意指计算装置104更喜欢播放的多媒体内容的类型。媒体消费模式可以包括计算装置先前未渲染的新的多媒体内容项(例如,计算装置先前未渲染);继续(例如,使多媒体内容系列继续);或者重新观看(例如,重新渲染相同的多媒体内容项)。数据处理系统102可以基于历史网络活动信息来确定第三偏好信号针对每个量化的日期和时间值的值,并且如在表4中图示的,将这些值填充在针对第三偏好信号的矩阵数据结构中。
Preference_Signal_3 | 白天 | 夜晚 |
工作日 | 重新观看 | 新的 |
周末 | 继续系列 | 继续系列 |
表4:针对媒体消费模式偏好信号的2×2多维矩阵数据结构的说明性示例。
因此,如果请求与工作日夜晚对应,则数据处理系统102可以针对用于计算装置104的第三偏好信号检索值“继续系列”。数据处理系统102可以使用该值来构建查询以响应于请求而将要呈现给计算装置104的多媒体内容项识别为候选多媒体内容项。
可以将一个或者多个偏好信号矩阵数据结构组合成单个多维矩阵结构或者存储为单独的矩阵结构。针对偏好信号的单个多维矩阵结构可以具有以下维度:2×2×3。例如,第一维度可以是工作日和工作夜晚;第二维度可以是白天和黑夜;第三维度可以是preference_signal_1、preference_signal_2和preference_signal_3。因此,为了获得针对量化日期和量化时间的所有值,数据处理系统102可以执行如下查找:检索所有信号的与工作日夜晚对应的值。这可以检索到如下的、偏好信号针对量化日期和量化时间(工作日夜晚)的值:app_1、租用、新的。数据处理系统102可以如下通过使用布尔逻辑来构建查询或者过滤:app_1并且是租用的并且是新的。
除了偏好信号之外,或者代替偏好信号,数据处理系统102还可以使用上下文信号的值来生成查询。上下文信号可以包括有关形成针对多媒体渲染事件的设定的情况的信息。上下文信号可以指示针对量化的日期和时间的情况。上下文信号可以包括:1)对媒体消耗持续时间(例如,15分钟;30分钟;1小时;或者90分钟)的偏好;以及2)对媒体类型(例如,电影、电视节目、直播电视或者先前录制的内容)的偏好。数据处理系统102可以利用附加的或者更少的上下文信号。数据处理系统102可以通过使用历史网络活动信息或者外部传感器数据来确定上下文信号。
第一上下文信号可以包括对媒体消费持续时间的偏好。持续时间可以意指用户必须查看多媒体内容项的时间量或者用户更喜欢观看多媒体内容的时间量。持续时间可以特定于量化的日期和时间。数据处理系统102可以基于在预定时间间隔内的历史网络活动信息来确定持续时间。例如,数据处理系统102可以确定在过去的30天内,计算装置104在工作日夜晚对多媒体内容渲染30分钟,并且在周末夜晚,大约为2小时。因此,如在表5中的矩阵中图示的,数据处理系统102可以将针对持续时间上下文信号的值设置为工作日夜晚30分钟以及周末夜晚2小时。
Context_Signal_1 | 白天 | 夜晚 |
工作日 | 15分钟 | 30分钟 |
周末 | 60分钟 | 120分钟 |
表5:针对消费持续时间上下文信号的2×2多维矩阵数据结构的说明性示例。
如在表5中的针对第一上下文信号的矩阵中图示的,可以针对每个量化的日期和时间值确定持续时间。数据处理系统102可以将持续时间值确定为针对在预定时间间隔(例如,4周、8周或者12周)内的量化日期值和量化时间值的平均、移动平均、模式或者其它统计确定。
数据处理系统102可以通过使用外部传感器反馈来确定持续时间。例如,数据处理系统102可以基于打开和关闭计算装置104的时间;照明装置经由打开或者关闭网络105连接至数据处理系统102的时间;在具有与计算装置104的账户标识符对应的账户标识符的日历数据结构中的条目;调整经由网络105连接至数据处理系统102的恒温器装置;或者家庭自动化查询或者与关联于计算装置的账户的账户相关联的一个或者多个装置的其它装置活动,来确定用于播放多媒体内容的开始和停止时间。例如,打开和关闭在具有计算装置104的房间中的灯的时间可以是可用于渲染多媒体内容的持续时间的指示符。灯可以由照明控制器或者被配置为经由网络105来与数据处理系统104通信并且向数据处理系统104提供对灯状态的指示的装置控制。
第二上下文信号可以包括对媒体类型(例如,电影、电视节目、直播电视或者先前录制的内容)的偏好。数据处理系统102可以基于历史网络活动来确定对媒体类型的偏好,并且如在表6中图示的,根据量化日期值和量化时间值来将偏好值存储在2×2矩阵中。
Context_Signal_2 | 白天 | 夜晚 |
工作日 | 片段 | 录制的 |
周末 | 直播电视 | 电影 |
表6:针对消费持续时间上下文信号的2×2多维矩阵数据结构的说明性示例。
如在表6中图示的,对于与工作日夜晚量化值对应的请求,媒体类型信号可以具有值“先前录制的内容”。数据处理系统102可以如下构建针对量化日期和时间“工作日夜晚”组合多个上下文信号的值的查询:例如,30分钟并且是录制的。录制的可以意指在通信地耦合至计算装置104的数字视频录像机装置上录制的多媒体内容。与当前现场播放的直播节目相反,录制的可以意指先前已经由另一数据提供商播出或者录制的内容。计算装置104的用户可能已经指示数字视频录像机装置录制多媒体内容。
数据处理系统104可以基于在预定时间间隔内的聚集历史数据来为多个信号中的每个信号生成二乘二矩阵。聚集信息可以是指单个账户或者计算装置104的聚集的多个数据点。数据处理系统104还可以跨与同一账户标识符相关联的多个计算装置104聚集信息。数据处理系统104可以跨具有不同账户标识符,但是具有其它共同特点的多个计算装置104聚集信息。
数据处理系统102可以针对多个信号中的每个信号组合二乘二矩阵中的每个二乘二矩阵以生成三维矩阵。数据处理系统102可以生成针对偏好信号的第一三维矩阵和针对上下文信号的第二三维矩阵。数据处理系统102可以生成组合了偏好信号和上下文信号的单个三维矩阵。数据处理系统102可以针对每个账户标识符生成不同的多维矩阵。数据处理系统102可以如下生成组合了所有信号和账户标识符的四维矩阵:(account_id、quantized_day、quantized_time、signal)。
响应于请求,数据处理系统102可以基于索引值来获得针对信号的值。取决于矩阵的维数,例如,索引值可以与量化日期值和量化时间值对应。例如,量化日期值可以意指日期类别。例如,矩阵可以具有2行,一行用于工作日,并且一行用于周末,而不是具有7行,其中一行用于一周中的每一天的矩阵。通过将日期值量化成2个量子或者类别,可以将矩阵的大小从7行大大减少到2行,从而减少了矩阵的内存消耗量,以及增加了查找时间。
例如,量化时间值可以意指一天中的时间类别。例如,不是具有针对一天中的每一秒、每分钟或者每小时的矩阵,而是数据处理系统102可以使用针对时间具有诸如白天和夜晚的2个量子的矩阵。通过将时间值量化成2个类别,可以将矩阵的大小从潜在的1440列(例如,针对每分钟)或者24列(例如,针对每小时)大大减少到2列。
为了确定用于识别矩阵中的值的行索引值和列索引值,数据处理系统可以接收与请求对应的日期戳和时间戳。与请求对应的日期戳和时间戳可以意指计算装置104何时接收到声信号,何时作出请求,计算装置104何时发送请求,数据处理系统102何时接收请求,或者数据处理系统102何时处理请求。在一些情况下,与请求对应的日期和时间戳可以意指用户打算观看所请求的节目的日期或者时间。例如,在星期五早上提出的请求可以包括“what should I watch Saturday night?(星期六晚上我应该观看什么?)”在该示例中,数据处理系统102(例如,经由NLP组件112)可以识别关键字“tonight(今晚)”,并且将请求中的日期和时间指示符映射至量化日期值和量化时间值(例如,周末和夜晚)。
日期戳和时间戳可以比矩阵中的量化日期值和量化时间值更细化。计算装置104可以在将日期戳和时间戳提供至数据处理系统104之前使这些值量化。数据处理系统102可以将日期戳映射至包括工作日或者周末中的一个的量化日期值。例如,如果当前日期是星期一、星期二、星期三、星期四或者星期五,则数据处理系统102可以将量化日期值确定为“工作日”。如果当前日期是星期六或者星期日,则数据处理系统可以将量化日期值确定为“周末”。
数据处理系统102可以将时间戳映射至包括白天或者夜晚中的一个的量化时间值。数据处理系统102可以使用预定时间边界来确定当前时间是与白天对应还是与夜晚对应。例如,在4:00AM与9:59PM之间的时间可以映射至“白天”,并且在10:00PM与3:59AM之间的时间可以映射至夜晚。在另一示例中,在4:00AM与7:59PM之间的时间可以映射至白天,并且在8:00PM与3:59AM之间的时间可以映射至夜晚。在一些情况下,可以动态地确定白天和夜晚。例如,可以基于特定位置的日出和日落时间来确定量化日期值。数据处理系统可以确定计算装置104的位置,并且然后基于与请求对应的日期来确定位置的日出时间和日落时间。如果时间与在日出时间和日落时间之间对应,则数据处理系统102可以将量化时间值设置为“白天”;否则,设置为“夜晚”。
数据处理系统102可以经由在具有量化日期值和量化时间值的多维矩阵数据结构中进行查找来针对量化日期值和量化时间值检索多个信号。例如,并且参照表2至表6,偏好和上下文信号针对“工作日”和“夜晚”的值可以是:app_1、租用、新的、30分钟、录制的。数据处理系统102可以使用这五个信号的值来构建要应用于多媒体内容数据结构的查询或者过滤。数字处理系统102可以利用从具有量化日期值和量化时间值的多维矩阵结构检索到的多个信号来生成查询。例如,查询可以是:查找由应用=app_1提供的、可用于租用的、计算装置先前未播放的、持续时间为30分钟的、并且是先前录制(例如,不是直播电视)的多媒体内容。
数据处理系统102可以包括、执行内容选择器组件118或者以其它方式与其通信以接收由查询生成器组件116生成的查询并且基于查询经由实时内容选择过程来选择一个或者多个多媒体内容项或者电子内容项。内容选择过程可以意指或者包括:在数据储存库122中执行对与由查询生成器组件116提供的查询、关键字或者其它项相匹配的多媒体内容项,或者向数据提供商装置108查询与查询或者关键字对应的电子内容项的查找。实时内容选择过程可以包括其中对由多个数据提供商提供的内容项进行解析、处理、加权或者匹配以选择要提供至计算装置104的一个或者多个内容项的服务。内容选择器组件118可以实时执行内容选择过程。实时执行内容选择过程可以意指响应于经由客户端计算装置104接收到的对内容的请求而执行内容选择过程。可以在接收请求的时间间隔(例如,5秒、10秒、20秒、30秒、1分钟、2分钟、3分钟、5分钟、10分钟或者20分钟)内执行(例如,发起或者完成)实时内容选择过程。可以在与客户端计算装置104的通信会话期间或者在通信会话终止之后的时间间隔内执行实时内容选择过程。
例如,数据处理系统102可以包括内容选择器组件118,该内容选择器组件118被设计为、构造为、配置为或者可操作以选择多媒体内容项对象。为了以管理加载时间和响应性的方式来选择要显示在基于语音的环境中的多媒体内容项,查询生成器组件116可以通过使用从多维矩阵检索到的信号来构建查询。内容选择器组件118可以对候选内容项的主题进行分析、解析或者以其它方式进行处理以确定候选内容项的主题是否与由查询生成器组件116生成的查询对应。内容选择器组件118可以通过使用图像处理技术、字符辨识技术、自然语言处理技术或者数据库查找来识别、分析或者辨识候选内容项中的语音、音频、项、字符、文本、符号或者图像。候选内容项可以包括指示候选内容项的主题的元数据,在这种情况下,内容选择器组件118可以处理元数据以确定候选内容项的主题是否与输入音频信号对应。
内容选择器组件118可以将查询应用于多媒体内容数据结构128以响应于查询而识别与多个信号相匹配的多媒体内容项。响应于请求,数据处理系统102可以从数据储存库122或者与数据提供商108相关联的数据库中选择一个或者多个电子内容项(例如,内容项对象),并且经由网络105来提供电子内容项以便经由计算装置104进行呈现。数据处理系统102可以向计算装置104提供对多媒体内容项的指示(例如,图标、列表、文本或者其它标识符)以便经由由计算装置104渲染的图形用户接口进行呈现,这些多媒体内容项与从多维矩阵数据结构检索到的、针对量化日期值和量化时间值的多个信号相匹配。计算装置104可以与内容项对象交互。
计算装置104可以接收针对内容项的音频响应。计算装置104可以接收选择与使得或者允许计算装置104执行与电子内容项对象相关联的功能的内容项对象相关联的按钮、超链接或者其它小部件的指示。
数据处理系统102可以包括、执行音频信号生成器组件122或者与其通信以生成输出信号。该输出信号可以包括一个或者多个部分。输出信号可以与由内容选择器组件118在实时内容选择过程期间选择的多媒体内容项对应。
图2是用于从存储器传递数据以管理图形输出等待时间的系统的操作的图示。操作200可以由在图1和图4中描绘的一个或者多个系统或者组件执行,其包括:例如,数据处理系统102、接口110、NLP组件112、数字助理组件114、查询生成器组件116、内容选择器组件118或者计算装置104。在ACT 202中,数据处理系统或者计算装置可以基于来自计算装置的用户的语音或者话音来接收声信号。在ACT 204中,数据处理系统或者计算装置可以识别请求。如果计算装置识别到请求,则计算装置可以将请求提供或者发送至数据处理系统以便进行进一步处理。
在ACT 206中,数据处理系统可以确定矩阵是否可用。矩阵可以意指具有信号的值的矩阵,数据处理系统被配置为从这些信号生成查询。数据处理系统可以确定矩阵数据结构是否可用于与计算装置对应的账户标识符。在一些情况下,矩阵数据结构可能不可用于计算装置,因为数据处理系统可能没有足够的历史信息来填充矩阵,或者因为计算装置禁用了矩阵数据结构或者没有选择加入矩阵数据结构。因此,如果矩阵数据结构不可用于计算装置,则数据处理系统可以继续至ACT 208。
在ACT 208中,数据处理系统可以检索没有通过使用来自矩阵数据结构中的值构建的默认查询。默认查询可以是“显示所有多媒体内容项”或者某一其它查询。在ACT 210中,数据处理系统可以将默认查询应用于诸如多媒体内容数据结构的内容数据结构,并且然后如在框212中图示的那样经由示例图形用户接口来在显示装置上渲染结果。由于矩阵不可用于利用针对量化日期值和量化时间值的信号来构建查询,因此,数据处理系统可以识别与默认查询相匹配的许多多媒体内容项(例如,25个、50个、75个、100个或者更多)。由于有限的语音接口,在许多多媒体内容项中进行导航可能具有挑战性。进一步地,经由图形输出来渲染许多多媒体内容项可能消耗过多的计算资源(例如,存储器或者处理器利用)或者网络带宽。
在ACT 206中,如果数据处理系统确定矩阵可用于计算装置,则数据处理系统可以继续至ACT 216。在ACT 216中,数据处理系统可以确定与请求对应的量化索引值,诸如,针对请求的量化日期值和量化时间值。在ACT 218中,数据处理系统可以使用量化日期值和量化时间值来检索矩阵中的信号的值。数据处理系统可以选择与计算装置对应的多维矩阵,并且然后针对量化日期值和量化时间值来识别信号的值。
数据处理系统可以在ACT 218中访问一个或者多个矩阵。数据处理系统可以访问每个信号的单独的二维矩阵或者组合多个信号的一个或者多个三维矩阵。例如,数据处理系统可以访问多个2×2矩阵226a至226e,其中,矩阵226a至226e分别与表2至6对应。在另一示例中,数据处理系统可以访问单个三维矩阵,在该单个三维矩阵中,维度是:量化日期、量化时间和信号。第一维度可以是工作日228和周末230;第二维度可以是白天232和夜晚234;并且第三维度可以具有信号226a、226b、226c、226d和226e(例如,与如在表2至表6中图示的第一偏好信号、第二偏好信号、第三偏好信号、第一上下文信号和第二上下文信号对应的信号)。
值236、238、240和242可以被存储在矩阵中,并且可以通过使用量化日期值和量化时间值来由数据处理系统检索。例如,对于工作日夜晚,数据处理系统可以检索值238,该值238可以与信号226a对应。
在ACT 220中,数据处理系统可以针对每个量化日期值和量化时间值通过使用针对每个信号检索到的值来构建或者生成查询。在ACT222中,数据处理系统可以将生成的查询应用于内容数据结构。数据处理系统可以将查询应用为过滤或者将查询用作过滤。数据处理系统然后可以通过使用图形用户接口212来在连接至计算装置的显示装置上渲染结果。图形用户接口可以渲染候选多媒体内容项224。与使用默认查询相比较,通过使用用于生成查询的矩阵渲染的多媒体内容项的数量可以不同。例如,多媒体内容项224的数量可以少于多媒体内容项214的数量。使用矩阵来构建查询可能导致在给定确定的偏好和上下文信号的情况下可能更相关的更少的结果。通过使用用于构建查询的矩阵数据结构和量化值来渲染更少的结果可以减少资源利用(例如,存储器或者处理器利用)和网络带宽使用。
图3是从存储器传递数据以管理图形输出等待时间的方法的图示。方法300可以由在图1和图4中描绘的一个或者多个系统或者组件执行,其包括:例如,数据处理系统102、接口110、NLP组件112、数字助理组件114、查询生成器组件116、内容选择器组件118或者计算装置104。在ACT 305中,数据处理系统或者计算装置可以检索声信号并且识别请求。计算装置可以通过使用麦克风来感测或者检测声信号。计算装置可以识别声信号中的触发词或者热词。计算装置或者远离计算装置的数据处理系统可以识别声信号中的请求。在一些情况下,计算装置可以接收声信号,确定声信号要被转发至数据处理系统,并且然后将声信号或者其一部分转发至数据处理系统。
数据处理系统可以经由包括由一个或者多个处理器执行的数字助理的数据处理系统的接口来接收包括由计算装置的传感器检测到的输入音频信号(例如,声信号)的数据包。声信号可以包括多个部分。例如,声信号的第一部分可以包括用信号向计算装置通知用户正在请求动作、功能或者信息的唤醒词语、激活词语、触发词或者热词。计算装置可以使用本地NLP组件来识别激活词语。在识别激活词语之后,计算装置可以接收声信号的第二部分。可以将声信号的该第二部分转发至数据处理系统以便进行进一步处理。数据处理系统可以识别由数据处理系统接收到的声信号的第二部分中的请求。计算装置可以对声信号进行解析或者处理声信号以识别请求。
在ACT 310中,数据处理系统可以识别与请求对应的量化日期值和量化时间值。数据处理系统可以识别与请求相关联的时间戳以确定量化值。数据处理系统可以识别接收或者发送请求的时间,并且将识别到的时间映射至量化日期值和量化时间值。数据处理系统可以对请求进行解析以识别要渲染多媒体内容的时间,该时间可以与生成、发送或者接收请求的时间不同。如果数据处理系统在请求中识别到与生成、发送或者接收请求的时间或者日期不同的时间或者日期,则数据处理系统可以选择请求中的时间来进行映射。例如,请求中的时间可以指示要播放多媒体内容的时间。数据处理系统可以用由用户在请求中指示的时间来覆盖接收或者发送请求的时间。
数据处理系统可以将识别到的日期和时间映射至量化日期值和量化时间值。通过将日期和时间映射至量化日期值和量化时间值,数据处理系统可以减少每个矩阵数据结构的内存占用,并且提高矩阵查找速度。
在ACT 315中,数据处理系统可以针对量化日期值和量化时间值检索信号。数据处理系统可以经由在具有量化日期值和量化时间值的多维矩阵数据结构中进行查找来针对量化日期值和量化时间值检索信号的值。矩阵可以包括至少两个维度,其中,多维矩阵数据结构的第一维度具有量化日期,并且多维矩阵数据结构的第二维度具有量化时间。数据处理系统可以为每个信号存储单独的矩阵,或者将两个或者更多个信号组合成三维矩阵,在该三维矩阵中,第三维度与不同的信号对应。
在ACT 320中,数据处理系统可以通过使用从多维矩阵检索到的信号的值来生成查询。数据处理系统可以通过使用布尔逻辑、查询字段或者过滤来生成查询。该查询可以包括针对每个字段的附加函数,诸如,求和、求平均、求最小或者求最大。
在ACT 325中,数据处理系统可以将查询应用于多媒体内容数据结构。数据处理系统可以将查询应用于多媒体内容数据结构以识别与信号的值相匹配的多媒体内容项。应用查询可以包括:用值来执行查找,向数据结构应用过滤,执行脚本,或者检索或者选择与从矩阵检索到的信号的值对应的数据的其它技术。
在ACT 330中,数据处理系统可以将来自将查询应用于多媒体数据结构的结果提供至计算装置以便进行呈现。计算装置可以经由连接至计算装置的显示装置来呈现结果。计算装置可以通过使用音频输出来呈现结果。计算装置可以接收执行或者播放所呈现的结果的指示。
图4是示例计算系统400的框图。计算机系统或者计算装置400可以包括或者用于实施系统100或者其组件,诸如,计算装置104或者数据处理系统102。计算装置104或者数据处理系统102可以包括智能个人助理或者基于语音的数字助理。计算系统400包括总线405或者用于传送信息的其它通信组件以及耦合至总线405以便处理信息的处理器410或者处理电路。计算系统400还可以包括耦合至总线405以便处理信息的一个或者多个处理器410或者处理电路。计算系统400还包括耦合至总线405以便存储信息和要由处理器410执行的指令的主存储器415,诸如,随机存取存储器(RAM)或者其它动态存储装置。主存储器415可以是或者包括数据储存库122或者数据储存库118。主存储器415还可以用于存储位置信息、临时变量或者在处理器410执行指令期间的其它中间信息。计算系统400可以进一步包括耦合至总线405以便存储用于处理器410的静态信息和指令的只读存储器(ROM)420或者其它静态存储装置。可以将诸如固态装置、磁盘或者光盘的存储装置425耦合至总线405以持久地存储信息和指令。存储装置425可以包括数据储存库122或者数据储存库118,或者是其一部分。
计算系统400可以经由总线405耦合至诸如液晶显示器或者有源矩阵显示器的显示器435以便向用户显示信息。可以将诸如包括字母数字键和其它键的键盘的输入装置430耦合至总线405以便向处理器410传送信息和命令选择。输入装置430可以包括触摸屏显示器435。输入装置430还可以包括用于向处理器410传送方向信息和命令选择并且用于控制在显示器435上的光标移动的光标控件,诸如,鼠标、轨迹球或者光标方向键。例如,显示器435可以是计算装置104、数据处理系统102或者图1中的其它组件的一部分。
本文所描述的过程、系统和方法可以由计算系统400响应于处理器410执行包括在主存储器415中的指令的布置而实施。可以通过诸如存储装置425的另一计算机可读介质来将这种指令读取到主存储器415中。执行包括在主存储器415中的指令的布置使得计算系统400执行本文所描述的说明性过程。还可以采用在多处理布置中的一个或者多个处理器来执行包括在主存储器415中的指令。代替软件指令,可以使用硬连线电路系统,或者其可以结合软件指令与本文所描述的系统和方法一起使用。本文所描述的系统和方法不限于硬件电路系统和软件的任何特定组合。
虽然已经在图4中描述了示例计算系统,但是可以在包括在本说明书中所公开的结构及其结构等效物的其它类型的数字电子电路中或者在计算机软件、固件或者硬件中或者在它们中的一个或者多个的组合中实施包括在本说明书中所描述的操作的主题。
对于本文所讨论的系统收集有关用户的个人信息或者可以利用个人信息的情况,可以为用户提供如下机会:控制程序或者特征是否可以采集个人信息(例如,有关用户的社交网络、社交动作或者活动、用户的偏好或者用户的位置的信息),或者控制是否和/或如何从内容服务器或者其它数据处理系统接收可能与用户更有关的内容。另外,在存储或者使用特定数据之前,可以益一种或者多种方式来使该特定数据匿名,从而使得在生成参数时去除了个人身份信息。例如,可以使用户的身份匿名,从而使得无法确定用户的个人身份信息,或者可以将用户的可以从中获得位置信息(诸如,城市、邮政编码或者州县等级)的地理位置一般化,从而使得无法确定用户的特定位置。由此,用户可以对内容服务器收集和使用有关他或者她的信息的方式进行控制。
可以在包括本说明书中所公开的结构及其结构等效物的数字电子电路系统中、或者在计算机软件、固件、或者硬件中、或者在它们中的一个或者多个的组合中实施本说明书中所描述的主题和操作。可以将本说明书中描述的主题实施为一个或者多个计算机程序,例如,编码在一个或者多个计算机存储介质上以由数据处理设备执行或者以控制数据处理设备的操作的计算机程序指令的一个或者多个电路。可替代地或者另外,程序指令可以被编码在人工生成的传播信号上,例如,机器生成的电、光学或者电磁信号,该信号被生成以对信息进行编码以便发送至合适的接收器设备用于由数据处理设备执行。计算机存储介质可以包括在计算机可读存储装置、计算机可读存储基板、随机或者串行存取存储器阵列或者装置或者它们中的一个或者多个的组合中。当计算机存储介质不是传播信号时,计算机存储介质可以是编码在人工生成的传播信号中的计算机程序指令的源或者目的地。计算机存储介质还可以被包括在一个或者多个单独的组件或者介质(例如,多个CD、磁盘或者其它存储装置)中。可以将本说明书中描述的操作实施为由数据处理设备对存储在一个或者多个计算机可读存储装置或者从其它源接收到的数据执行的操作。
词语“数据处理系统”、“计算装置”、“组件”和“数据处理设备”涵盖用于处理数据的各种设备、装置和机器,其包括:例如,可编程处理器、计算机、片上系统或者前述内容的多个或者其组合。该设备可以包括专用逻辑电路系统,例如,FPGA(现场可编程门阵列)或者ASIC(专用集成电路)。除了硬件之外,该设备还可以包括为探讨中的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时间环境、虚拟机或者它们中的一个或者多个的组合的代码。该设备和执行环境可以实现各种不同的计算模型基础架构,诸如,网络服务、分布式计算和网格计算基础架构。例如,音频信号生成器组件120、内容选择器组件118、NLP组件112以及其它数据处理系统102组件可以包括或者共享一个或者多个数据处理设备、系统、计算装置或者处理器。例如,接口110、NLP组件112、模式检测器组件114、获取组件116以及其它计算装置104组件可以包括或者共享一个或者多个数据处理设备、系统、计算装置或者处理器。
可以用包括编译语言或者解释语言和陈述性语言或者程序语言的编程语言的任何形式来编写计算机程序(也称为程序、软件、软件应用、app、脚本或者代码),并且可以以包括作为独立式程序或者模块、组件、子例程、对象或者适合用于计算环境的其它单元的任何形式来部署计算机程序。计算机程序可以与文件系统中的文件对应。可以将计算机程序存储在保持其它程序或者数据(例如,存储在标记语言文档中的一个或者多个脚本)的文件的一部分中,或者存储在专用于所探讨中的程序的单个文件中,或者存储在多个协作文件(例如,存储一个或者多个模块、子程序或者部分代码的文件)中。计算机程序可以被部署为在一个计算机上执行或者在位于一个站点处或者分布在多个站点中并且通过通信网络互相连接的多个计算机上执行。
可以通过一个或者多个可编程处理器来执行本说明书中描述的过程和逻辑流程,该一个或者多个可编程处理器执行一个或者多个计算机程序(例如,数据处理系统102的组件)以通过操作输入数据并且生成输出来执行动作。还可以由例如FPGA(现场编程门阵列)或者ASIC(专用集成电路)的专用逻辑电路来执行过程和逻辑流,并且还可以将设备实施为例如,FPGA(现场编程门阵列)或者ASIC(专用集成电路)的专用逻辑电路。适合于存储计算机程序指令和数据的装置包括所有形式的非易失性存储器、介质和存储器装置,其包括:例如,半导体存储器装置(例如,EPROM、EEPROM和闪速存储器装置)、磁盘(例如,内部硬盘或者可移动盘)、磁光盘、CD-ROM盘和DVD-ROM盘。处理器和存储器可以由专用逻辑电路系统补充或者可以并入该专用逻辑电路系统中。
可以将本文描述的主题实施在包括后端组件的计算系统(例如,作为数据服务器)、或者包括中间件组件的计算系统(例如,应用服务器)、或者包括前端组件的计算系统(例如,具有图形用户接口或者网络浏览器的客户端计算机,通过该图形用户接口或者网络浏览器,用户可以与本说明书中所描述的主题的实施方式交互)、或者包括一个或者多个这种后台组件、中间件组件、或者前端组件的组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的组件相互连接。通信网络的示例包括:局域网(“LAN”)和广域网(“WAN”)、网际网(例如,互联网)以及点对点网络(例如,ad hoc点对点网络)。
诸如,系统100或者系统400的计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此,并且通常通过通信网络(例如,网络105)进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。在一些实施方式中,服务器向客户端装置发送数据(例如,表示内容项的数据包)(例如,为了向与客户端装置进行交互的用户显示数据和接收来自该用户的用户输入)。可以在服务器处从客户端装置接收在客户端装置处生成的数据(例如,用户交互的结果)(例如,由数据处理系统102从计算装置104或者数据提供商装置108接收)。
虽然在附图中按照特定顺序来描述操作,但是不需要按照示出的特定顺序或者顺序顺序来执行这种操作,并且不需要执行所有图示的操作。可以按照不同的顺序来执行本文描述的动作。
各个系统组件的分离不要求在所有实施方式中都分离,并且描述的程序组件可以被包括在单个硬件或者软件产品中。例如,NLP组件112或者内容选择器组件118可以是单个组件、app或者程序或者具有一个或者多个处理电路或者数据处理系统102的一个或者多个服务器的一部分的逻辑装置。
现在已经描述了一些说明性实施方式,显而易见的是,前述内容是说明性的,而非限制性的,已经通过示例的方式进行了呈现。具体地,虽然本文所呈现的示例中的许多示例涉及方法动作或者系统元件的特定组合,但是可以按照其它方式来组合那些动作和那些元件以实现相同的目的。结合一种实施方式讨论的动作、元件和特征不旨在从其它实施方式或者实施方式中的相似作用中排除。
本文所使用的措辞和术语是为了进行描述,并且不应该将其视为是限制性的。本文对“包括(including”)”、“包括(comprising)”、“具有”、“包括(containing)”、“涉及”、“以…为特征”、“特征在于”及其变型的使用是指涵盖其后列出的项、其等效物和附加项以及由其后排外地列出的项组成的替代实施方式。在一种实施方式中,本文所描述的系统和方法由所描述的元件、动作或者组件中的一个、所描述的元件、动作或者组件中的一个以上的各种组合或者所有所描述的元件、动作或者组件组成。
对本文中以单数表示的系统和方法的实施方式或者元件或者动作的任何引用还可以包含包括多个这些元件的实施方式,并且本文中以复数形式对任何实施方式或者元件或者动作的任何引用还可以包含只包括单个元件的实施方式。以单数或者复数形式的引用不旨在将目前所公开的系统或者方法、其组件、动作或者元件限制为单个或者多个配置。对任何动作或者元件的引用基于任何信息、动作或者元件可以包括动作或者元件至少部分地基于任何信息、动作或者元件的实施方式。
本文公开的任何实施方式可以与任何其它实施方式或者实施例组合,并且对“实施方式”、“一些实施方式”、“一种实施方式”等的引用不一定是相互排斥的,并且旨在指示结合实施方式描述的特定特征、结构或者特点可以被包括在至少一种实施方式或者至少一个实施例中。如本文使用的这种词语不一定都是指相同的实施方式。可以按照与本文所公开的方面和实施方式一致的任何方式来包括地或者排外地将任何实施方式与任何其它实施方式组合。
可以将对“或者”的引用解释为包括的,使得通过使用“或者”描述的任何词语可以指示单个所描述的词语、一个以上所描述的词语和所有所描述的词语中的任何一种。对“‘A和‘B’中的至少一个”的引用可以包括:只有“A”、只有“B”以及“A”和“B”两者。结合“包括”或者其它开放性术语使用的这些引用可以包括附加项。
在附图、详细描述或者任何权利要求中的技术特征带有附图标记的情况下,已经将附图标记包括进来以增加附图、详细描述和权利要求的可懂度。因此,附图标记和附图标记的缺少都对任何权利要求要素的范围没有任何限制。
在不脱离本文所描述的系统和方法的特点的情况下,可以按照其它特定形式来体现本文所描述的系统和方法。前述实施方式是说明性的,而不是限制所描述的系统和方法。因此,本文所描述的系统和方法的范围由所附权利要求而不是前述描述指示,并且在权利要求的等效含义和范围内的变化被包含在其中。
Claims (20)
1.一种用于数据结构查询以管理多媒体内容的加载时间的系统,包括:
数据处理系统,所述数据处理系统包括由一个或者多个处理器执行的数字助理组件;
所述数字助理组件的自然语言处理器组件,所述自然语言处理器组件用于:
经由所述数据处理系统的接口来接收包括由计算装置的传感器检测到的输入音频信号的数据包;
对所述输入音频信号进行解析以识别请求;
所述数字助理的查询生成器组件,所述查询生成器组件用于:
响应于所述请求而识别与所述请求对应的量化日期值和量化时间值;
经由在具有所述量化日期值和所述量化时间值的多维矩阵数据结构中进行查找,来检索用于所述量化日期值和所述量化时间值的多个信号中的每个信号的一个或者多个值,所述多维矩阵数据结构的第一维度具有量化日期并且所述多维矩阵数据结构的第二维度具有量化时间;
用从具有所述量化日期值和所述量化时间值的所述多维矩阵结构检索到的所述多个信号中的每个信号的所述一个或者多个值来生成查询;
将所述查询应用于多媒体内容数据结构以响应于所述查询而识别与所述多个信号相匹配的多个多媒体内容项;以及
所述数据处理系统,所述数据处理系统用于向所述计算装置提供对所述多个多媒体内容项的指示以便经由由所述计算装置渲染的图形用户接口进行呈现,所述多个多媒体内容项与从所述多维矩阵数据结构检索到的用于所述量化日期值和所述量化时间值的所述多个信号中的每个信号的所述一个或者多个值相匹配。
2.根据权利要求1所述的系统,包括所述数据处理系统,所述数据处理系统用于:
接收与所述请求对应的日期戳和时间戳;
将所述日期戳映射至包括工作日或者周末中的一个的所述量化日期值;以及
将所述时间戳映射至包括白天或者夜晚中的一个的所述量化时间值。
3.根据权利要求1所述的系统,包括所述数据处理系统,所述数据处理系统用于:
确定所述计算装置的位置;
确定所述位置的日落时间;以及
基于所述日落时间将所述时间戳映射至所述量化时间值。
4.根据权利要求1所述的系统,其中,与所述请求对应的时间戳是所述请求被所述数据处理系统识别的时间。
5.根据权利要求1所述的系统,其中,与所述请求对应的时间戳是在所述请求中指示的要播放多媒体内容项的时间。
6.根据权利要求1所述的系统,包括所述数据处理系统,所述数据处理系统用于:
基于与所述多个信号中的每个信号相关联的历史网络活动信息,用所述多个信号来填充所述多维矩阵。
7.根据权利要求1所述的系统,包括所述数据处理系统,所述数据处理系统用于:
基于移动平均来生成所述一个或者多个值中的至少一个值。
8.根据权利要求1所述的系统,其中,所述多个信号包括以下中的至少一个:
对用于提供所述多媒体内容项的一个或者多个应用的偏好;
对交易类型的偏好;
对媒体消费模式的偏好;
对媒体消费持续时间的偏好;以及
对媒体类型的偏好。
9.根据权利要求8所述的系统,包括所述数据处理系统,所述数据处理系统用于:
基于与一个或者多个装置相关联的装置活动来确定对所述媒体消费持续时间的所述偏好,所述一个或者多个装置与关联于所述计算装置的账户相关联,所述一个或者多个装置与所述数据处理系统通信。
10.根据权利要求8所述的系统,包括所述数据处理系统,所述数据处理系统用于:
基于在预定时间间隔内聚集历史数据来针对所述多个信号中的每个信号生成二乘二矩阵。
11.根据权利要求1所述的系统,包括所述数据处理系统,所述数据处理系统用于:
基于所述多个信号中的每个信号的历史信息来针对所述多个信号中的每个信号生成二乘二矩阵。
12.根据权利要求11所述的系统,包括所述数据处理系统,所述数据处理系统用于:将针对所述多个信号中的每个信号的所述二乘二矩阵组合以生成三维矩阵。
13.根据权利要求1所述的系统,包括所述数据处理系统,所述数据处理系统用于:
基于机器学习技术来针对所述多个信号中的每个信号生成二乘二矩阵。
14.一种对用于管理多媒体内容的加载时间的数据结构进行查询的方法,包括:
经由包括由一个或者多个处理器执行的数字助理的数据处理系统的接口,来接收包括由计算装置的传感器检测到的输入音频信号的数据包;
由所述数字助理的自然语言组件对所述输入音频信号进行解析以识别请求;
通过由所述数字助理执行的查询生成器响应于所述请求而识别与所述请求对应的量化日期值和量化时间值;
由所述数字助理经由在具有所述量化日期值和所述量化时间值的多维矩阵数据结构中进行查找,来检索用于所述量化日期值和所述量化时间值的多个信号中的每个信号的一个或者多个值,所述多维矩阵数据结构的第一维度具有量化日期并且所述多维矩阵数据结构的第二维度具有量化时间;
由所述数字助理用从具有所述量化日期值和所述量化时间值的所述多维矩阵结构检索到的所述多个信号中的每个信号的所述一个或者多个值来生成查询;
由所述数字助理将所述查询应用于多媒体内容数据结构以响应于所述查询而识别与所述多个信号中的每个信号的所述一个或者多个值相匹配的多个多媒体内容项;以及
由所述数字助理向所述计算装置提供对所述多个多媒体内容项的指示以便经由由所述计算装置渲染的图形用户接口进行呈现,所述多个多媒体内容项与从所述多维矩阵数据结构检索到的用于所述量化日期值和所述量化时间值的所述多个信号中的每个信号的所述一个或者多个值相匹配。
15.根据权利要求14所述的方法,包括:
接收与所述请求对应的日期戳和时间戳;
将所述日期戳映射至包括工作日或者周末中的一个的所述量化日期值;以及
将所述时间戳映射至包括白天或者夜晚中的一个的所述量化时间值。
16.根据权利要求14所述的方法,包括:
确定所述计算装置的位置;
确定所述位置信息的日落时间;以及
基于所述日落时间将所述时间戳映射至所述量化时间值。
17.根据权利要求14所述的方法,其中,与所述请求对应的所述时间戳是所述请求被所述数据处理系统识别的时间。
18.根据权利要求14所述的方法,包括:
基于与所述多个信号中的每个信号相关联的历史网络活动信息,用所述多个信号中的每个信号的所述一个或者多个值填充所述多维矩阵。
19.根据权利要求14所述的方法,其中,所述多个信号包括以下中的至少一个:
对用于提供所述多媒体内容项的一个或者多个应用的偏好;
对交易类型的偏好;
对媒体消费模式的偏好;
对媒体消费持续时间的偏好;以及
对媒体类型的偏好。
20.根据权利要求14所述的方法,包括:
所述数据处理系统用于基于与一个或者多个装置相关联的装置活动来确定对所述媒体消费持续时间的所述偏好,所述一个或者多个装置与关联于所述计算装置的账户相关联,所述一个或者多个装置与所述数据处理系统通信。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2017/054940 WO2019070244A1 (en) | 2017-10-03 | 2017-10-03 | DATA STRUCTURE INTERROGATIONS TO MANAGE LOADING TIME IN MULTIMEDIA CONTENT |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110741365A true CN110741365A (zh) | 2020-01-31 |
CN110741365B CN110741365B (zh) | 2023-12-15 |
Family
ID=60153461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780092060.2A Active CN110741365B (zh) | 2017-10-03 | 2017-10-03 | 用于管理多媒体内容中的加载时间的数据结构查询 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11409783B2 (zh) |
EP (1) | EP3622408A1 (zh) |
CN (1) | CN110741365B (zh) |
WO (1) | WO2019070244A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110741339B (zh) * | 2017-10-03 | 2023-09-05 | 谷歌有限责任公司 | 具有延迟考虑的显示模式相关响应生成 |
CN110741365B (zh) | 2017-10-03 | 2023-12-15 | 谷歌有限责任公司 | 用于管理多媒体内容中的加载时间的数据结构查询 |
US10930278B2 (en) * | 2018-04-09 | 2021-02-23 | Google Llc | Trigger sound detection in ambient audio to provide related functionality on a user interface |
CN113934869A (zh) * | 2021-09-23 | 2022-01-14 | 阿里云计算有限公司 | 一种数据库构建方法、多媒体文件的检索方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090157702A1 (en) * | 2007-12-13 | 2009-06-18 | Harris Scott C | Preference setting in a computer system |
CN101488346A (zh) * | 2009-02-24 | 2009-07-22 | 深圳先进技术研究院 | 语音可视化系统及语音可视化方法 |
CN103425727A (zh) * | 2012-05-14 | 2013-12-04 | 国际商业机器公司 | 上下文语音查询扩大方法和系统 |
US20140280292A1 (en) * | 2013-03-14 | 2014-09-18 | Apple Inc. | Refining a search based on schedule items |
CN104584010A (zh) * | 2012-09-19 | 2015-04-29 | 苹果公司 | 基于语音的媒体搜索 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5559940A (en) * | 1990-12-14 | 1996-09-24 | Hutson; William H. | Method and system for real-time information analysis of textual material |
US8490136B2 (en) * | 2009-05-07 | 2013-07-16 | Sirius Xm Radio Inc. | Method and apparatus for providing enhanced electronic program guide with personalized selection of broadcast content using affinities data and user preferences |
US9262446B1 (en) * | 2005-12-29 | 2016-02-16 | Google Inc. | Dynamically ranking entries in a personal data book |
US8712944B1 (en) * | 2011-05-13 | 2014-04-29 | Google Inc. | Adaptive contact window wherein the probability that an answering user/expert will respond to a question corresponds to the answering users having response rates that are based on the time of day |
US9443029B2 (en) * | 2011-08-15 | 2016-09-13 | Verizon Patent And Licensing Inc. | Method and system for providing context-based view content management |
US9253282B2 (en) * | 2011-10-18 | 2016-02-02 | Qualcomm Incorporated | Method and apparatus for generating, using, or updating an enriched user profile |
US9524487B1 (en) * | 2012-03-15 | 2016-12-20 | Google Inc. | System and methods for detecting temporal music trends from online services |
WO2014011208A2 (en) * | 2012-07-10 | 2014-01-16 | Venor, Inc. | Systems and methods for discovering content of predicted interest to a user |
US9338493B2 (en) * | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10073861B2 (en) * | 2015-09-03 | 2018-09-11 | Disney Enterprises, Inc. | Story albums |
US11496579B2 (en) * | 2016-01-19 | 2022-11-08 | Comcast Cable Communications, Llc | Connection manager |
US20190340564A1 (en) * | 2017-03-29 | 2019-11-07 | WeWork Companies Inc. | Monitoring Network Traffic to Determine Asset Utilization |
CN110741365B (zh) | 2017-10-03 | 2023-12-15 | 谷歌有限责任公司 | 用于管理多媒体内容中的加载时间的数据结构查询 |
-
2017
- 2017-10-03 CN CN201780092060.2A patent/CN110741365B/zh active Active
- 2017-10-03 EP EP17787726.3A patent/EP3622408A1/en not_active Withdrawn
- 2017-10-03 WO PCT/US2017/054940 patent/WO2019070244A1/en unknown
- 2017-10-03 US US16/463,763 patent/US11409783B2/en active Active
-
2022
- 2022-08-08 US US17/882,920 patent/US11841894B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090157702A1 (en) * | 2007-12-13 | 2009-06-18 | Harris Scott C | Preference setting in a computer system |
CN101488346A (zh) * | 2009-02-24 | 2009-07-22 | 深圳先进技术研究院 | 语音可视化系统及语音可视化方法 |
CN103425727A (zh) * | 2012-05-14 | 2013-12-04 | 国际商业机器公司 | 上下文语音查询扩大方法和系统 |
CN104584010A (zh) * | 2012-09-19 | 2015-04-29 | 苹果公司 | 基于语音的媒体搜索 |
US20140280292A1 (en) * | 2013-03-14 | 2014-09-18 | Apple Inc. | Refining a search based on schedule items |
Also Published As
Publication number | Publication date |
---|---|
US11841894B2 (en) | 2023-12-12 |
CN110741365B (zh) | 2023-12-15 |
US20190278795A1 (en) | 2019-09-12 |
WO2019070244A1 (en) | 2019-04-11 |
US11409783B2 (en) | 2022-08-09 |
US20220391431A1 (en) | 2022-12-08 |
EP3622408A1 (en) | 2020-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111033492B (zh) | 为自动化助手提供命令束建议 | |
US11520610B2 (en) | Crowdsourced on-boarding of digital assistant operations | |
CN110770692B (zh) | 从存储器传输数据以管理图形输出延时 | |
US11841894B2 (en) | Data structure queries to manage loading time in multimedia content | |
US20160055245A1 (en) | Systems and methods for providing information discovery and retrieval | |
JP2021190086A (ja) | マルチメディアリソースの推薦方法、マルチメディアリソースの推薦装置、電子機器、非一時的なコンピュータ読み取り可能な記憶媒体及びコンピュータプログラム | |
KR20150100921A (ko) | 검색 피처들을 제공하기 위한 시스템들 및 방법들 | |
KR20110039233A (ko) | 입력 문자 시퀀스로부터의 리소스 로케이터 제안들 | |
JP2023116607A (ja) | 口頭またはタイプされた発話のオンデバイス分析を可能にするためのクライアントデバイスにおけるアシスタントアクションコンテンツのプロアクティブキャッシング | |
JP7200277B2 (ja) | ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
JP2023506341A (ja) | 音声コマンド推奨を提供するためのシステムおよび方法 | |
JP2022547598A (ja) | コンテキストデータを使用した対話処理のための技術 | |
US20230376531A1 (en) | Media contextual information for a displayed resource | |
CN104954824B (zh) | 一种用于进行视频设置的方法、设备与系统 | |
CN110741339A (zh) | 具有延迟考虑的显示模式相关响应生成 | |
CN110741366A (zh) | 跨越多个设备协调音频查询的并行处理 | |
CN110741362A (zh) | 音频查询的重叠处理的协调 | |
US20220276067A1 (en) | Method and apparatus for guiding voice-packet recording function, device and computer storage medium | |
CN109491499B (zh) | 一种电器设备控制方法、装置、电器设备和介质 | |
CN111949821A (zh) | 视频推荐方法、装置、电子设备和存储介质 | |
EP3799658A1 (en) | Systems and methods for crowdsourced actions and commands | |
CN106815288A (zh) | 一种视频相关信息生成方法及其装置 | |
CN117809651A (zh) | 语音交互设备和语音交互方法 | |
CN113742573A (zh) | 一种多媒体资源搜索方法、装置、计算机设备和存储介质 | |
JP2015109087A (ja) | 書籍データ推薦の方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |