CN113543861A

CN113543861A - 用于多任务学习的方法及系统

Info

Publication number: CN113543861A
Application number: CN202080018225.3A
Authority: CN
Inventors: 马修·霍尔布鲁克; 詹尼弗·霍布斯; 帕特里克·约瑟夫·卢西
Original assignee: Statos
Current assignee: Statos; Stats LLC
Priority date: 2019-03-01
Filing date: 2020-02-28
Publication date: 2021-10-22
Also published as: US20240160921A1; WO2020180703A1; US20200279160A1; EP3911424A4; EP3911424A1; US11593647B2; US20230222340A1; US11900254B2

Abstract

本文公开了一种生成多模态预测的方法。计算系统从数据存储装置中检索赛事数据。赛事数据包括跨多个赛季的多个赛事的信息。计算系统通过混合密度网络学习与赛事数据中每场比赛之后的下一场比赛相关联的多个值，通过从赛事数据生成输入向量，来使用混合密度网络生成预测模型。混合密度网络被训练成几乎同时输出多个值。计算系统接收针对竞赛中的赛事的赛事数据集。赛事数据集包括至少针对比赛场地位置和当前得分的信息。计算系统经由预测模型，基于赛事数据集生成与赛事之后的下一个赛事相关联的多个值。

Description

用于多任务学习的方法及系统

相关申请的交叉引用

本申请要求于2019年3月1日提交的美国申请序列号为62/812,511的优先权，该申请通过引用整体并入本文。

技术领域

本公开总体上涉及用于生成多模态预测的系统和方法。

背景技术

在过去十年的体育分析中，圣杯是找到的“一个最佳指标”，它可以通过获胜的镜头最好地捕捉球员和球队的表现。例如，棒球中的胜利贡献值(WAR)、篮球中的预期得分(EPV)和效率指标以及足球中的预期目标值等预期指标被用作团队和球员分析的“黄金标准”。在美式橄榄球中，防守调整平均价值(DVOA)可能是全国橄榄球联盟(NationalFootball League，NFL)中最受尊重和使用的高级指标。DVOA利用预期值和效率指标，并分析与每次比赛的预期相比的比赛值，同时团队、驱动力和比赛环境的价值进行规范化。

发明内容

本文公开的实施例总体涉及用于生成多模态预测的系统和方法。在一些实施例中，本文公开了一种生成多模态预测的方法。计算系统从数据存储装置中检索赛事数据。该赛事数据包括跨多个赛季的多个赛事的信息。计算系统通过混合密度网络学习与赛事数据中每场比赛之后的下一场比赛相关联的多个值，通过从赛事数据生成输入向量，来使用混合密度网络生成预测模型。输入向量包括与赛事数据中的每场比赛相关联的一个或更多个参数。混合密度网络被训练成几乎同时输出多个值。计算系统接收针对竞赛中的赛事的赛事数据集。赛事数据集包括至少针对比赛场地位置和当前得分的信息。计算系统经由预测模型，基于赛事数据集生成与赛事之后的下一个赛事相关联的多个值。多个值几乎同时被确定。

在另一实施例中，本文公开了一种用于生成多模态预测的系统。该系统包括处理器和存储器。存储器上存储有编程指令，编程指令在由处理器执行时，执行一个或更多个操作。一个或更多个操作包括从数据存储装置中检索赛事数据。该赛事数据包括跨多个赛季的多个赛事的信息。一个或更多个操作还包括：通过从赛事数据生成输入向量并且通过混合密度网络学习与赛事数据中每场比赛之后的下一场比赛相关联的多个值，来使用混合密度网络生成预测模型。输入向量包括与赛事数据中的每场比赛相关联的一个或更多个参数。混合密度网络被训练成几乎同时输出多个值。一个或更多个操作包括接收针对竞赛中的赛事的赛事数据集。赛事数据集包括至少针对比赛场地位置和当前得分的信息。一个或更多个操作包括经由预测模型，基于赛事数据集生成与赛事之后的下一个赛事相关联的多个值。多个值几乎同时被确定。

在另一实施例中，一种非暂时性计算机可读介质包括一个或更多个指令序列，当由一个或更多个处理器执行时，该指令序列引起一个或更多个操作。计算系统从数据存储装置中检索赛事数据。该赛事数据包括跨多个赛季的多个赛事的信息。计算系统通过混合密度网络学习与赛事数据中每场比赛之后的下一场比赛相关联的多个值，通过从赛事数据生成输入向量，来使用混合密度网络生成预测模型。输入向量包括与赛事数据中的每场比赛相关联的一个或更多个参数。混合密度网络被训练成几乎同时输出多个值。计算系统接收针对竞赛中的赛事的赛事数据集。该赛事数据集包括至少针对比赛场地位置和当前得分的信息。计算系统经由预测模型，基于赛事数据集生成与赛事之后的下一个赛事相关联的多个值。多个值几乎同时被确定。

附图说明

为了能够详细理解本公开的上述特征，可以参照实施例对以上简要概述的本公开进行更具体的描述，其中一些实施例在附图中示出。然而，应注意，附图仅示出了本公开的典型实施例，因此不应被视为对本公开范围的限制，因为本公开可以允许其它等效实施例。

图1是示出根据示例实施例的计算环境的框图。

图2是示出根据示例实施例的混合密度网络的结构的框图。

图3是示出根据示例实施例的生成全训练预测模型的方法的流程图。

图4是示出根据示例实施例的使用全训练预测模型生成多任务预测的方法的流程图。

图5是根据示例实施例的图形用户界面的框图。

图6A是根据示例实施例的图形用户界面的框图。

图6B是根据示例实施例的图形用户界面的框图。

图6C是根据示例实施例的图形用户界面的框图。

图7A是示出了根据示例实施例的计算设备的框图。

图7B是示出了根据示例实施例的计算设备的框图。

为了便于理解，在可能的情况下，使用相同的附图标记来表示附图中共有的相同元件。可以预期，在一个实施例中公开的元件可以有利地用于其它实施例而无需具体叙述。

具体实施方式

体育分析的传统方法试图使用单个指标来解释所有表现。然而，用单一指标来解释所有表现的假设是受限的。就其本质而言，运动是复杂的，并且适用于针对不同背景和时间分辨率的许多查询。可能需要使用预测因子来启用此类分析，而不是使用单个预测因子(或指标)。例如，如果一支球队赢得了冠军，则可以使用各种预测因子来突出球队整个赛季的主要属性(例如，进攻和/或防守强大，如果是的话，哪些地点和时间)。在另一个示例中，如果球队赢了单场比赛或输了单场比赛，则可以使用各种预测因子来突出显示哪些比赛或哪场比赛是决定性的或是值得注意的。

虽然可以使用多种预测因子来实现多分辨率分析，但是应该有一个单一的来源或大脑来生成这样的预测因子。例如，如果一个系统正在预测美式橄榄球比赛中的预期得分，并且根据一场大比赛进行跳跃，那么这应该与获胜概率的跳跃相关/共同发生，否则，这可能是矛盾的并导致用户不信任该模型。此外，预测因子应该超越“预期指标”，这些指标仅与联盟平均值进行比较，并生成分布以进行更深入的分析(例如，与排名前20％或10％的球队比较，而不是与联盟平均值进行比较)。为了有效地提供这样的预测，系统可能需要几个要素：(1)在比赛级别上对表现的细粒度表示，可以聚合到不同的分辨率；(2)使能表示的细粒度的空间数据；(3)同时训练预测因子的多任务学习方法；以及(4)一种可以生成分布而不是点值的方法。

本文描述的一个或更多个技术提供了一种执行多分辨率或多任务预测的方法。例如，下面的讨论侧重于橄榄球运动，以及系统如何学习和进行多任务预测。尽管以下讨论集中在橄榄球运动上，但本领域技术人员理解这样的操作不应限于橄榄球。例如，这样的操作可以应用于篮球、足球、曲棍球、棒球、英式足球等，用类似的数据代替本文使用的数据。

橄榄球联赛是由13名球员(例如，七名前锋和六名后卫)组成的两支球队在两个40分钟的半场比赛中进行的连续和动态的比赛，其目标是“尝试得分”并通过将球带过对手的球门线来获得积分。橄榄球联盟与美式橄榄球有许多相似之处：它是在类似大小的球场(例如，100米x70米)上进行的，每回合有6次抢断(与美式橄榄球中的4次抢断相比)，其中一支球队有机会尝试得分。橄榄球联赛的计分规则是：一次尝试得四分，后续成功转换得两分；罚球成功得两分；和一个成功的任意球得一分。

世界上最受欢迎的橄榄球联盟竞赛是全国橄榄球联盟(NRL)，它包括横跨澳大利亚和新西兰的十六支球队。NRL是世界上观看次数最多、参与人数最多的橄榄球联赛。2018年NRL赛季尤其值得注意，因为这是联盟历史上(也可能是所有运动中)竞争最激烈的常规赛。经过二十五轮常规赛(每支球队打二十五场比赛)后，前八名的球队以一场胜利相隔。具体来说，前四支球队(Roosters、Storm、Rabbitohs和Sharks)都以16胜结束比赛。接下来的四支球队(Panthers,Broncos,Warriors,and Tigers)以15胜结束比赛。小型联赛——常规赛中排名第一的球队——由积分差异决定。悉尼Roosters队在过去六年中第四次赢得小型联赛的冠军。为了实现这一壮举，Roosters队不得不在常规赛的最后一天以27分的优势击败Parramatta Eels，他们以44-10获胜。结果意味着他们将墨尔本Storm队赶出了榜首，积分差仅为+8。鉴于比赛的激烈程度，拥有许多衡量工具来剖析联赛是如何获胜的将很有用。

本文描述的一种或更多种方法通过机器学习方法的组合提供这种多任务预测技术。首先，这里描述的系统利用用于推荐任务的广泛而深入的模型(wide and deepmodel)。其次，广泛而深入模型被映射为一种多任务学习方法，预测来自同一模型的所有结果，从而在整个过程中共享共同特征。最后，系统可以实现混合密度网络，该混合密度网络可以产生结果的分布，从而捕获网络的不确定性。这种方法提供了几个优点。首先，混合密度网络的贝叶斯性质允许系统根据概率可能性处理所有损失，因此允许同时执行回归和分类任务。其次，该方法是多任务的，它迫使模型学习关于比赛的全局相关特征。最后，通过将输出建模为多维分布，系统捕获输出之间的关系并提供有关预测的不确定性。

图1是示出了根据示例实施例的计算环境100的框图。计算环境100可以包括经由网络105通信的跟踪系统102、组织计算系统104以及一个或更多个客户端设备108。

网络105可以是任何合适的类型，包括经由因特网的单独连接，诸如蜂窝或Wi-Fi网络。在一些实施例中，网络105可以使用直接连接来连接终端、服务和移动设备，直接连接诸如射频识别(RFID)、近场通信(NFC)、蓝牙^TM、低功耗蓝牙^TM(BLE)、Wi-Fi^TM、ZigBee^TM、环境反向散射通信(ABC)协议、USB、WAN或LAN。由于所传输的信息可能是个人的或机密的，出于安全考虑可以指示这些类型的连接中的一个或更多个被加密或以其他方式保护。然而，在一些实施例中，被传输的信息可能不太个人化，因此，为了方便而不是安全，可以选择网络连接。

网络105可以包括用于交换数据或信息的任何类型的计算机网络布置。例如，网络105可以是因特网、专用数据网络、使用公共网络的虚拟专用网络和/或使计算环境100中的组件能够在环境100的组件之间发送和接收信息的(一个或更多个)其它合适的连接。

跟踪系统102可以位于地点106中。例如，地点106可以被配置为举办包括一个或更多个代理112的运动赛事。跟踪系统102可以被配置为记录比赛台面上的所有代理(即，运动员)的运动，以及一个或更多个其它相关对象(例如，球、裁判等)。在一些实施例中，跟踪系统102可以是使用例如多个固定摄像机的基于光学的系统。例如，可以使用六个固定的、校准的摄像机的系统，这些摄像机将运动员和球的三维位置投影到球场的二维俯视图上。在一些实施例中，跟踪系统102可以是使用例如由运动员佩戴的或嵌入在要跟踪的对象中的射频识别(RFID)标签的基于无线电的系统。通常，跟踪系统102可以被配置为以高帧速率(例如，25Hz)进行采样和记录。跟踪系统102可以被配置为至少为比赛文件110中的每个帧存储比赛台面上的所有代理和对象的运动员身份和位置信息(例如，(x，y)位置)。

比赛文件110可以用与赛事数据相对应的其他赛事信息来扩充，赛事数据诸如但不限于比赛赛事信息(比赛、抢断、占有等)和背景信息(当前分数、剩余时间等)。

跟踪系统102可以被配置为经由网络105与组织计算系统104通信。组织计算系统104可以被配置为管理和分析由跟踪系统102捕获的数据。组织计算系统104可以至少包括web客户端应用服务器114、预处理引擎116、数据存储装置118和多任务预测代理120。预处理引擎116和多任务预测代理120中的每个都可以包括一个或更多个软件模块。一个或更多个软件模块可以是存储在介质(例如，组织计算系统104的存储器)上的代码或指令的集合物，代码或指令的集合物表示实施一个或更多个算法步骤的一系列机器指令(例如，程序代码)。这样的机器指令可以是组织计算系统104的处理器解释以实施指令的实际计算机代码，或者可替换地，可以是被解释以获得实际计算机代码的指令的更高级编码。一个或更多个软件模块还可以包括一个或更多个硬件组件。示例算法的一个或更多个方面可以由硬件组件(例如，电路)本身来执行，而不是作为指令的结果。

数据存储装置118可以被配置为存储一个或更多个比赛文件124。每个比赛文件124可以包括空间赛事数据和非空间赛事数据。例如，空间赛事数据可以对应于由跟踪系统102从特定比赛或赛事捕获的原始数据。非空间赛事数据可以对应于描述在没有相关联的空间信息的情况下在特定竞赛中发生的事件的一个或更多个变量。例如，非空间赛事数据可以包括每场竞赛的逐场信息。在一些实施例中，非空间赛事数据可以从空间赛事数据导出。例如，预处理引擎116可以被配置为解析空间赛事数据以导出关于赛事的信息。在一些实施例中，非空间赛事数据可以独立于空间赛事数据而被导出。例如，与组织计算系统相关联的管理员或实体可以分析每个竞赛以生成这样的非空间赛事数据。这样，为了本申请的目的，赛事数据可以对应于空间赛事数据和非空间赛事数据。

预处理代理116可以被配置为处理从数据存储装置118检索的数据。例如，预处理代理116可以被配置为生成一个或更多个信息集，一个或更多个信息集可以用于训练与多任务预测代理120相关联的一个或更多个神经网络。预处理代理116可以扫描存储在数据存储装置118中的一个或更多个比赛文件中的每个，以识别对应于每个抢断的一个或更多个指标。例如，预处理代理116可以扫描数据存储装置118中的一个或更多个比赛文件中的每个，以识别在每场比赛中的一个或更多个比赛动作(例如，一个或更多个抢断、一个或更多个进攻配对等)，并且识别与比赛相关联的一个或更多个指标(例如，当前比分、球的位置、随后的逐场赛事顺序、涉及的球员和球队、控球球队、抢断次数、剩余时间等。)

多任务预测代理120可以被配置为基于竞赛的当前状态生成多模态预测。例如，多任务预测代理120可以被配置为跨多个时间分辨率分析比赛的状态：比赛动作、局和比赛。因此，在任何给定情况下，多任务预测代理120可以被配置为预测：

·比赛动作选择[y_p]：球队进行某个比赛动作的可能性(例如，进攻踢、防守踢、在下一次抢断时进行正常进攻等)

·预期米数(抢断)[y_m]：在比赛动作(例如，下一次抢断)中获得/失去的预计米数。

·预期尝试(抢断)[y_tt]：在比赛中尝试得分的可能性(例如，下一次抢断)。

·预期尝试(局)[y_ts]：在该控球期间(例如局)的某个点上尝试得分的可能性。

·获胜概率[y_w]：赢得比赛的可能性。

·得分线预测[y_s]：预测每个团队的最终分数。

通过战略性地将问题构建为其输出可以被认为是竞赛的状态向量的模型，多任务预测代理120改进了传统的预测系统，传统的预测系统无法共享跨任务通用的信息和结构，并且在生产环境中通常难以维护。。

多任务预测代理120可以包括混合密度网络126和接口模块128。混合密度网络126可以被配置为在给定比赛状态的情况下跨多个时间分辨率(例如，比赛动作、局和比赛)提供多模态预测，例如，多任务预测代理120可以被配置为基于特定竞赛的空间和背景信息生成多模态预测。

混合密度网络是一类结合了神经网络和混合密度模型的模型。因此，混合密度网络自然是贝叶斯的并且允许多任务预测代理120对条件概率分布p(t|x)建模，其中t可以表示描述生成比赛状态向量

的分布的参数，其中x可以表示输入向量。因此，预测可能存在单个损失，即在给定当前比赛状态的情况下可以观察到比赛状态的负对数似然。此外，完整分布的损失可能会限制模型学习输出之间的一个或更多个关系，例如，对于获得的米数，不太可能观察到高值，但对于预期的尝试，不太可能观察到低值。

混合密度网络126的混合部分可以允许多任务预测代理120捕捉潜在分布的多模态。这可能会产生比赛的各种“模式”，例如不平衡的竞赛或非常接近的场景。混合密度网络126还可以通过允许多任务预测代理120为任何给定预测生成结果分布——而不仅仅是平均值——来提供对这种模型的不确定性的洞察。

接口代理128可以被配置为生成与由混合密度网络126生成的多模态预测对应的一个或更多个图形表示。例如，接口代理128可以被配置为生成一个或更多个图形用户界面(GUI)，其包括在多个生成的预测中由混合密度网络126生成的每个预测的图形表示。下面结合图5-6C讨论示例性GUI。

客户端设备108可以经由网络105与组织计算系统104通信。客户端设备108可以由用户操作。例如，客户端设备108可以是移动设备、平板电脑、台式计算机或具有本文描述的能力的任何计算系统。用户可包括但不限于诸如与组织计算系统104相关联的实体的订阅者、客户、预期客户或顾客的个人，诸如已从与组织计算系统104相关联的实体获得、将从与组织计算系统104相关联的实体获得、或可从与组织计算系统104相关联的实体获得产品、服务或咨询的个人。

客户端设备108可以至少包括应用126。应用126可以表示允许访问网站的web浏览器或独立应用。客户端设备108可以访问应用126以访问组织计算系统104的一个或更多个功能。客户端设备108可以通过网络105通信以例如从组织计算系统104的web客户端应用服务器114请求网页。例如，客户端设备108可以被配置为执行应用126以访问由web客户端应用服务器114管理的内容。显示给客户端设备108的内容可以从web客户端应用服务器114传输到客户端设备108，并且随后由应用126处理以通过客户端设备108的图形用户界面(GUI)显示。

图2是示出根据示例实施例的混合密度网络(MDN)结构200的框图。MDN结构200可以表示混合密度网络126。

多任务预测代理120利用空间和背景信息来对比赛动作、控球和/或比赛级别的结果进行预测。在对这些信息进行建模时面临的一些挑战包括：

·原始空间数据是低维且密集表示的。

·空间特征本质上是非线性的。

·背景特征(例如，球队、抢断)是离散的并且可能是稀疏的。

·空间特征和背景特征之间的关系是非线性的。

为了解决这些问题，多任务预测代理120可以利用混合密度网络126。混合密度网络126可以包括网络的一个或更多个深层部分，该网络被配置为从最初的稀疏输入构建更高层次的密集特征。

例如，如图所示，MDN结构200可以包括一个或更多个输入202₁-202₇(通常为“输入202”)、一个或更多个嵌入层204₁-204₄(以下称为“嵌入层204”)、一个或更多个输入206、全连接层208、全连接层210、混合密度层212和输出层214。

一个或更多个输入202可以从数据存储装置208中选择。每组输入202可以对应于相应的抢断。输入202₁可以针对在相应的比赛动作或抢断时的得分差。输入202₂可以针对在相应的比赛动作或抢断时竞赛中剩余的时间。输入202₃可以针对在相应的比赛动作或抢断时球的位置(例如，x,y坐标)。输入202₁-202₃可被视为“连续”特征或密集特征。

输入202₄可以对应于在相应的比赛动作或抢断时球的位置(例如，x,y坐标)。输入202₅可以对应于抢断编号和后卫到后卫。输入202₆可以对应于球队ID和赛季ID。输入202₇可以对应于对手ID和赛季ID。输入202₄-202₇可被视为稀疏特征。

在一些实施例中，为了训练的目的，多任务预测代理120可以实现来自多个赛季的联赛数据的数据。使用特定示例，多任务预测代理120可以实现来自2015-2018全国橄榄球联盟的数据。此类数据可能包括超过750场比赛和超过250,000次不同的抢断(即比赛动作)。在每次抢断时，数据集可能包括球的位置、随后的逐场赛事序列、涉及的球员和球队、控球球队和比赛背景(例如，抢断数、得分、剩余时间等)。

多任务预测代理120所采用的方法的独特之处在于如何表示分类(即，背景)特征，例如赛季和球队/对手身份。例如，这样的特征可以表示为独热(one-hot)向量。例如，与独立地为赛季、球队和对手创建嵌入相反，多任务预测代理120可以将赛季的独热向量与球队的独热向量(对于对手类似)级联起来。这使得多任务预测代理120能够跨赛季共享身份信息，捕捉球队可以跨年份保持一定程度的相似性的概念，同时还可以了解不同赛季的全联盟动态。可以采用类似的方法来捕获抢断编号(例如，抢断#1到抢断#6)和后卫到后卫集合(例如，由二进制标志表示)。

对于每个分类特征(例如，输入202₅-205₇)，多任务预测代理120可以通过其自身的混合密度网络126的“深”部分传递每个特征，以从最初的稀疏输入构造更高级别的密集特征，从而创建嵌入向量。例如，多任务预测代理120可以通过专用嵌入层204传递每个分类特征。如图所示，输入202₅可以通过嵌入层204₂传递；输入202₆可以通过嵌入层204₃传递；以及输入202₇可以通过嵌入层204₄传递。来自嵌入层204₂-204₄的输出可以是嵌入向量，嵌入向量包括对应于由输入202₅-202₇表示的原始特征的更高级别的密集特征。嵌入向量可以与一个或更多个密集输入202(例如，输入202₁-202₃)级联。

如图所示，针对位置的输入被两次提供给MDN结构200。例如，位置被示为密集输入(例如，输入202₁)和稀疏输入(例如，输入202₄)。通常，比赛场地位置可以被认为是密集的二维(例如，x,y)输入。在传统的广泛而深入的模型中，这些值将简单地在嵌入层级联。然而，这些模型的宽部分的浅度阻碍了从比赛场地位置数据中提取高级空间特征。为了解决这个问题，比赛场地位置可以被视为稀疏特征和密集特征。

对于输入202(例如，输入202₄)的稀疏部分，多任务预测代理120可以通过类似于一个或更多个分类特征的若干层(例如，层204₁)传递稀疏输入。在一些实施例中，多任务预测代理120最初可以在第一隐藏层将输入数据从原始二维提升至五十维。这可以为网络提供足够的维度来混合输入并创建更高级别的特征。传统上，空间输入的低维性已经通过完全离散比赛场地位置来解决，即通过将比赛场地位置视为网格，并将该位置表示为指示该仓(bin)占用情况的独热向量。这种方法有几个局限性。首先，离散表示可能本质上是有损的，因为在仓形成过程中位置被有效地舍入。其次，由此产生的维度可能很大(例如，70m×100m的比赛场地被分成1/3m×1/3m的仓，导致63000维输入)。将维度扩展到数千或数万可能会不必要地高，并可能导致稀疏表示，需要更多的神经元和更多的数据。本方法通过直接处理原始空间输入、适度增加第一隐藏层的维度、然后允许混合密度网络126从该数据中提取空间关系来避免此类缺陷。因此，由于比赛场地位置在所有预测任务中的重要性，比赛场地位置不仅被包括作为密集特征，还被包括作为稀疏特征，从而允许混合密度网络126捕获低级别(例如，原始)空间信息，以及高级(例如，嵌入式)空间信息。因此，来自层204₁的输出可以与输入202₁-202₃和嵌入向量级联。这样的级联数据集可以被认为是输入层206。

可以将来自输入层206的一个或更多个输入提供给全连接层208。可以将来自全连接层208的输出作为输入提供给全连接层210。

混合密度层212可以包括一种或更多种混合(例如，五种)，每个混合具有对μ和σ的预测。混合密度层212可以接收来自全连接层210的输出作为输入。

混合密度层212可以生成一个或更多个输出214。例如，混合密度层212可以生成预期米数(y_m)、预期尝试抢断(y_tt)、预期尝试局(y_ts)、获胜概率(y_w)和最终得分线(y_s)——统称为状态向量的同时(或接近同时)的预测作为输出。

在一些实施例中，在训练期间，可以使用交叉熵作为损失函数。例如，可能会在整个状态向量上生成单个损失。因此，即使一个预测中的几个成分非常好，如果状态不一致，损失可能相当高(例如，最终得分线预测为正，但低获胜概率不一致，因此可能具有高损失)。

图3是示出了根据示例实施例的生成全训练预测模型的方法300的流程图。方法300可以在步骤302开始。

在步骤302，组织计算系统104可以检索多场竞赛的赛事数据。例如，预处理代理120可以从数据存储装置118中检索空间赛事数据。空间赛事数据可以用x,y坐标和时间戳来捕获球的每次触碰以及非空间赛事数据，非空间赛事数据即描述在没有相关联的空间信息的情况下的一个或更多个赛事的一个或更多个变量。在一些实施例中，预处理代理112可以被配置为解析所检索的赛事数据，以生成与每场竞赛中的每个比赛动作或抢断相对应的一个或更多个数据组。在一些实施例中，组织计算系统104可进一步从数据存储装置118中检索非空间赛事数据。

在步骤304，组织计算系统104可以将赛事数据(例如，空间赛事数据和非空间赛事数据中的至少一种)转换成一个或更多个分段数据集。例如，预处理代理116可以为赛事数据中标识的每个比赛动作或每个抢断生成分段数据集。此类分段数据集可包括但不限于比赛场地位置、随后的逐比赛动作事件序列、涉及的球员和球队、控球球队和比赛背景(例如，比赛动作、抢断数、分数、剩余时间等)。

在步骤306，组织计算系统104可以创建一个或更多个分段数据集中包含的稀疏数据的密集表示。例如，多任务预测代理120可选择一个或更多个分段数据集的子集以生成密集表示。在一些实施例中，该子集可以包括“稀疏”数据，该数据包括但不限于比赛背景信息(例如，比赛号码、抢断数、后卫到后卫信息等)、球队ID/赛季ID、和对手ID/赛季ID。多任务预测代理120可以将每个数据集提供给相应的嵌入层。例如，多任务预测代理120可以向第一嵌入层提供比赛背景信息作为输入，向第二嵌入层提供球队ID/赛季ID信息，向第三嵌入层提供对手ID/赛季ID信息。每个嵌入层可以产生相应输入数据的密集表示作为输出。总的来说，这样的信息可以被称为嵌入向量。

在步骤308，组织计算系统104可以使用嵌入向量生成一个或更多个输入数据集。例如，多任务预测代理120可以将嵌入向量与一个或更多个连续特征级联起来。这种连续特征可以包括但不限于得分差、剩余时间和比赛场地位置(例如，x,y坐标)。在一些实施例中，一个或更多个输入数据集还可以包括更高级别的空间信息。例如，多任务预测代理120可以基于比赛场地位置特征(例如x,y坐标)生成更高级别的空间信息。多任务预测代理120可以通过将位置信息传递到多个层来生成这样的高级空间信息。由多个层生成的输出可以与连续特征和嵌入层级联以生成一个或更多个输入数据集。

在步骤310，组织计算系统104可以基于一个或更多个输入数据集学习多模态预测。例如，多任务预测代理120可以被配置为使用一个或更多个输入数据集来训练混合密度网络126以生成多模态预测。

在一些实施例中，混合密度网络126可以同时或接近同时地为以下至少一项生成预测：预期米数(y_m)、预期尝试抢断(y_tt)、预期尝试局(y_ts)、获胜概率(y_w)、预期比赛选择(y_p)以及最终得分线(y_s)。因此，混合密度网络可以为每个输入向量x输出一个比赛状态向量[y_p,y_m,y_tt,y_st,y_w,y_s]。

尽管上面说明的示例是专门针对橄榄球联盟描述的，但是本领域技术人员认识到这种方法可以推广到任何运动，每个预测因子代表比赛的不同特征。例如，在英式足球中，预测因子可以是预期进球(y_g)、预期射门(y_s)、预期犯规/罚球(y_p)、预期角球(y_c)、获胜概率(y_w)和最终得分线(y_sl)。在另一个示例中，对于网球，预测因子可以是预期的发球得分(y_a)、预期的得分(y_p)、预期破发(y_b)、获胜概率(y_p)或最终得分(或最终得分统计)。在另一个示例中，对于篮球，预测因子可以是特定球员和特定球队预测因子，例如特定球员得分的预期分数(y_ps)、每个特定球员的预期篮板数(y_pr)、获胜概率(y_w)和最终得分预测(y_s)。

在步骤312，组织计算系统104可以减少预测因子和实际值之间的任何损失。例如，作为训练过程的一部分，多任务预测代理120可以降低在给定当前比赛状态的情况下观察到比赛状态的负对数可能性。在一些实施例中，多任务预测代理120可以将交叉熵函数用于这样的过程。

图4是示出根据示例实施例的使用全训练预测模型生成多任务预测的方法400的流程图。方法400可以在步骤402处开始。

在步骤402，组织计算系统104可以接收给定竞赛的竞赛数据。例如，预处理代理116可以接收针对特定竞赛中的给定比赛的信息(例如，抢断信息)。在一些实施例中，预处理代理116可以从跟踪系统102接收竞赛数据。在一些实施例中，预处理代理116可以从客户端设备108接收竞赛数据。例如，用户可以经由应用132请求对给定比赛中的给定抢断进行多模态预测。

在步骤404，组织计算系统104可以从竞赛数据提取与赛事相关联的一个或更多个参数。例如，预处理代理116可以被配置为通过选择性地提取与赛事(例如，抢断)相关联的一个或更多个参数，来生成人工神经网络126的一个或更多个输入值。在一些实施例中，一个或更多个参数可以包括但不限于比赛场地位置、随后的逐比赛动作事件序列、涉及的球员和球队、拥有球的球队以及比赛背景(例如，抢断次数、得分、剩余时间等)。

在步骤406，组织计算系统104可以从一个或更多个提取的参数生成输入数据集。例如，多任务预测代理120可以创建包含在一个或更多个分段数据集中的稀疏数据的密集表示。多任务预测代理120可选择一个或更多个分段数据集的子集以生成密集表示。在一些实施例中，该子集可以包括“稀疏”数据，该数据包括但不限于比赛背景信息(例如，比赛号码、抢断数、后卫到后卫信息等)、球队ID/赛季ID、和对手ID/赛季ID。多任务预测代理120可以将每个数据集提供给相应的嵌入层。例如，多任务预测代理120可以向第一嵌入层提供比赛背景信息作为输入，向第二嵌入层提供球队ID/赛季ID信息，向第三嵌入层提供对手ID/赛季ID信息。每个嵌入层可以产生作为输出的相应输入数据的密集表示。总的来说，这样的信息可以被称为嵌入向量。多任务预测代理120可以基于比赛场地位置特征(例如x,y坐标)生成更高级别的空间信息。多任务预测代理120可以通过将位置信息传递到多个层来生成这样的高级空间信息。由多个层生成的输出可以与嵌入层和一个或更多个连续特征(例如，得分差、剩余时间和比赛场地位置(例如，x,y坐标))级联以生成一个或更多个输入数据集。

在步骤408，组织计算系统104可以基于输入数据集生成多模态预测。例如，多任务预测代理120可以在比赛动作、控球和比赛级别生成关于特定抢断的一个或更多个预测。多任务预测代理120可以使用混合密度网络126生成一个或更多个预测。例如，多任务预测代理120可以向混合密度网络126提供提取的一个或更多个与赛事相关联的参数作为输入。多任务预测代理120可以生成作为输出的多模态预测。例如，混合密度网络126可以同时或接近同时地为以下至少一项生成预测：预期米数(y_m)、预期尝试抢断(y_tt)、预期尝试局(y_ts)、获胜概率(y_w)、预期比赛动作选择(y_p)以及最终得分线(y_s)。因此，混合密度网络可以为每个输入向量x输出一个比赛状态向量[y_p,y_m,y_tt,y_st,y_w,y_s]

在步骤410，组织计算系统104可以生成多模态预测的一个或更多个图形表示。例如，接口代理128可以生成一个或更多个图形表示，其图示了由混合密度网络126预测的一个或更多个指标。下面结合图5可以找到示例性图形表示。

图5是根据示例实施例的图形用户界面(GUI)502的框图。GUI 502可以包括第一部分504、第二部分506、第三部分508和第四部分510。

第一部分504可以包括给定竞赛的视频和比赛信息。例如，如图所示，第一部分504可以包括得分信息、半场信息、时间信息以及赛事信息。第一部分504还可以包括竞赛的视频信息。在一些实施例中，第一部分504可以包括竞赛实况(或延迟)馈送。在一些实施例中，第一部分504可以包括特定竞赛的视频集锦。第一部分504还可以包括大比赛集锦图表。大比赛集锦图表可以说明竞赛的大比赛。

第二部分506可以直观地说明每个抢断的空间信息，以及每个抢断处该局的预期尝试局值。第二部分506可以说明2018年NRL赛季第25轮比赛的完整“局”(即橄榄球联盟相当于美式足球中的“驱动力”)，其中，Roosters队对战Eels队。在“局总结”中，接口代理128可以图形化地说明Roosters在每次抢断开始时在该比赛中得分的可能性。如图所示，Roosters队最初在糟糕的场地位置投球，只有3.5％的得分机会。然而，巨大的回击球将Roosters队在第一次抢断开始时得分的可能性提高到7.4％。在第二次抢断期间的巨大跑动将得分的可能性进一步提高到11.5％，而在第四次抢断时良好的中场位置使其得分的可能性增加到15.2％。对于Roosters队来说不幸的是，在第五次糟糕的抢断之后，他们选择踢球以试图找回球并将球翻转过来。第二部分506还可以包括通过探索“背景空间洞察”面板中随场位置而变化的预期获得米数来图示大抢断的背景的图形表示。该面板说明了预期米数不仅随场位置而变化，也是随全背景(即抢断、号码、球队、赛事数据和对手)而变化。在图中，接口代理128可以说明通过在球场中间(即场地)附近开始抢断而获得的优势。

第三部分508可以提供团队动力的视觉表示。一组六次抢断的动量可能被认为是橄榄球联盟的一个重要概念。多任务预测代理120可以被配置为通过将当前尝试局与该背景(即场地位置、时间、比分、球队身份等)的平均值进行比较来跟踪动量。在图5所示的示例中，显示了从第一次控球后的减速以及第二次抢断时的大跑动带来的动量增强。多任务预测代理120可以允许用户识别大跑动，不仅根据获得的米数，而且根据给定环境的跑步的异常程度。

第四部分510可以提供得分线预测的视觉表示。在该图中，接口代理128不仅可以说明由多跟踪预测代理确定的当前分数差异(虚线)，而且还可以说明对竞赛结束分数差异的预测。换句话说，多任务预测代理120不限于预测最终值，还可以预测分数分布。

在一些实施例中，多任务预测代理120可以利用来自混合密度网络126的输出来生成橄榄球联盟的DVOA值。例如，与美式橄榄球类似，橄榄球联盟包括分段比赛，其中争夺比赛场地位置是关键，并且并非所有码数/米数都是相等的，即使它们可能在禁区中得分。预期尝试局预测(例如y_ts)可能代表在每个比赛动作(例如抢断)的集合中预测的得分机会。该预测类似于足球的DVOA，考虑了比分、时间、对手和位置。取期望值和实际值之间的差值，多任务预测代理120可以输出团队是否超出他们的期望。在一些实施例中，为了创建更可判断的DVOA，多任务预测代理120可以用零均值缩放这些值。积极的进攻DVOA和消极的防守DVOA可以分别对应于强进攻和强防守。

图6A是根据示例实施例的图形用户界面(GUI)602的框图。图6B是根据示例实施例的图形用户界面(GUI)612的框图。如图所示，GUI 602包括一个图表，该图表将Roosters队在一个赛季的过程中的进攻强度与联盟平均水平进行比较。GUI 612包括一个图表，该图表将Roosters在整个赛季过程中的防守强度与联盟平均水平进行比较。

最初，Roosters队开局缓慢，基本上与联盟平均水平持平(他们以4-4的战绩开始本赛季)。然而，到了赛季中期，Roosters队开始找回状态。进攻DVOA允许用户跟踪Roosters队在赛季后半段是如何从平均水平变为优秀。如GUI 612所示，在防守方面，Roosters队在整个赛季都处于统治地位。即使联盟在防守DVOA方面的表现有所恶化，他们仍保持着强势的状态。

图6C是根据示例实施例的图形用户界面(GUI)622的框图。由于多任务预测代理120还可以在单个玩家级别上进行预测，因此用户可以更深入地了解Roosters队的成功，并揭示他们的防守表现优于对手的地方。如图所示，GUI 622显示，在比赛场地的前四分之三的比赛中，Roosters队的防守是平均的(注意，在这些情况下，Roosters队和联盟平均水平的DVOA都是负数，因为它们很少得分)。然而，在关键时刻，比如球场的最后25米，Roosters队的防守DVOA保持在0.12左右，而在关键情况下联盟平均超过0.15的情况下，Roosters队表现出令人难以置信的强大。

图7A示出了根据示例实施例的系统总线计算系统架构700。系统700可以表示组织计算系统104的至少一部分。系统700的一个或更多个组件可以使用总线705彼此电通信。系统700可以包括处理单元(CPU或处理器)710和系统总线705，系统总线705将包括诸如只读存储器(ROM)720和随机存取存储器(RAM)725等系统存储器715的各种系统组件耦接至处理器710。系统700可以包括高速存储器的高速缓存，高速存储器的高速缓存直接与处理器710连接、与处理器710紧密接近或集成为处理器710的一部分。系统700可以将数据从存储器715和/或存储设备730复制到高速缓存712，以便由处理器710快速访问。这样，高速缓存712可以提供性能提升，该性能提升避免了处理器710在等待数据时的延迟。这些和其它模块可以控制或被配置为控制处理器710执行各种动作。也可以使用其它系统存储器715。存储器715可以包括具有不同性能特性的多种不同类型的存储器。处理器710可以包括任何通用处理器和硬件模块或软件模块，诸如存储在存储设备730中的服务1732、服务2734和服务3736，硬件模块或软件模块被配置为控制处理器710以及专用处理器，其中，软件指令被并入到实际的处理器设计中。处理器710本质上可以是完全独立的计算系统，包含多个核或处理器、总线、存储器控制器、高速缓存等。多核处理器可以是对称的或非对称的。

为了使用户能够与计算设备700交互，输入设备745可以表示任何数量的输入机制，诸如用于语音的麦克风、用于手势或图形输入的触敏屏幕、键盘、鼠标、运动输入、语音等。输出设备735还可以是本领域技术人员已知的多种输出机制中的一种或更多种。在一些实例中，多模态系统可以使用户能够提供多种类型的输入以与计算设备700通信。通信接口740通常可以支配和管理用户输入和系统输出。对任何特定硬件布置上的操作没有限制，因此这里的基本特征可以容易地替换为开发的改进的硬件或固件布置。

存储设备730可以是非易失性存储器，并且可以是硬盘或可以存储可由计算机访问的数据的其它类型的计算机可读介质，诸如磁带盒、闪存卡、固态存储器设备、数字多功能盘、盒式磁带、随机存取存储器(RAM)725、只读存储器(ROM)720以及它们的混合。

存储设备730可以包括用于控制处理器710的服务732、734和736。可以考虑其它硬件或软件模块。存储设备730可以连接到系统总线705。在一个方面中，执行特定功能的硬件模块可以包括存储在计算机可读介质中的软件组件，该软件组件与诸如处理器710、总线705、显示器735等必要硬件组件连接以执行该功能。

图7B示出了具有芯片组架构的计算机系统750，该芯片组架构可以表示组织计算系统104的至少一部分。计算机系统750可以是可用于实现所公开的技术的计算机硬件、软件和固件的示例。系统750可以包括处理器755，其表示能够执行被配置为执行所识别的计算指令的软件、固件和硬件的任何数量的物理上和/或逻辑上不同的资源。处理器755可以与芯片组760通信，该芯片组760可以控制到处理器755的输入以及从处理器755的输出。在该示例中，芯片组760将信息输出到诸如显示器的输出765，并且可以将信息读取和写入到存储设备770，存储设备770可以包括例如磁介质和固态介质。芯片组760还可以从RAM 775读取数据并向RAM 775写入数据。可以提供用于与各种用户接口组件785接口连接的桥780，以便与芯片组760接口连接。这样的用户接口组件785可以包括键盘、麦克风、触摸检测和处理电路、诸如鼠标之类的指示设备等。通常，对系统750的输入可以来自机器生成和/或人为生成的各种源中的任何一种。

芯片组760还可以与一个或更多个通信接口790接口连接，一个或更多个通信接口790可以具有不同物理接口。这样的通信接口可以包括用于有线和无线局域网、用于宽带无线网络以及个人局域网的接口。用于生成、显示和使用本文公开的GUI的方法的一些应用可以包括通过物理接口接收有序数据集，或者通过处理器755分析存储在存储装置770或775中的数据而由机器本身生成。此外，机器可以通过用户接口组件785接收来自用户的输入，并通过使用处理器755解释这些输入来执行适当的功能，例如浏览功能。

可以理解，示例系统700和750可以具有多于一个处理器710，或者可以是联网在一起以提供更大处理能力的一组计算设备或计算设备集群的一部分。

虽然前述内容是针对本文所述的实施例，但在不脱离本文的基本范围的情况下，可以设计出其它和另外的实施例。例如，本公开的各方面可以用硬件或软件或硬件和软件的组合来实现。本文描述的一个实施例可以被实现为与计算机系统一起使用的程序产品。程序产品的(一个或更多个)程序定义了实施例(包括本文描述的方法)的功能，并且可以包含在各种计算机可读存储介质上。示例性计算机可读存储介质包括但不限于：(i)在其上永久地存储信息的不可写存储介质(例如，计算机内的只读存储器(ROM)设备，诸如可由CD-ROM驱动器读取的CD-ROM盘、闪存、ROM芯片或任何类型的固态非易失性存储器)；以及(ii)在其上存储可改变的信息的可写存储介质(例如，磁盘驱动器内的软盘或硬盘驱动器或任何类型的固态随机存取存储器)。当承载指导所公开的实施例的功能的计算机可读指令时，这样的计算机可读存储介质是本公开的实施例。

本领域技术人员将理解，前述示例是示例性的而非限制性的。在阅读说明书和研究附图之后，旨在对本领域技术人员显而易见的所有置换、增强、等同物和改进都将包括在本公开的真实精神和范围内。因此，所附权利要求旨在包括落入这些教导的真实精神和范围内的所有这些修改、置换和等同物。

Claims

1.一种生成多模态预测的方法，包括：

由计算系统从数据存储装置中检索赛事数据，所述赛事数据包括跨多个赛季的多个赛事的信息；

由所述计算系统使用混合密度网络，通过以下步骤生成预测模型：

从所述数据生成输入向量，所述输入向量包括一个或更多个与赛事数据中的每场比赛相关联的参数；以及

通过所述混合密度网络学习与所述赛事数据中每场比赛之后的下一场比赛相关联的多个值，其中，所述混合密度网络被训练成几乎同时输出所述多个值；

由所述计算系统接收针对竞赛中的赛事的数据集，所述数据集包括至少针对比赛场地位置和当前得分的信息；以及

由所述计算系统经由所述预测模型，基于所述数据集生成与所述赛事之后的下一个赛事相关联的多个值，其中，所述多个值几乎同时被确定。

2.如权利要求1所述的方法，其中，从所述数据生成所述输入向量包括：

对于所述赛事数据中的每场比赛，对所述每场比赛对应的数据进行分段。

3.如权利要求1所述的方法，其中，所述赛事数据中的每场比赛的所述数据包括分类特征和连续特征。

4.如权利要求3所述的方法，其中，从所述数据生成所述输入向量包括：

通过相应的嵌入层传递所述分类特征以创建每个分类特征的密集表示。

5.如权利要求4所述的方法，还包括：

将每个分类特征的所述密集表示与所述连续特征级联起来以生成所述输入向量。

6.如权利要求4所述的方法，其中，所述输入向量包括比赛场地位置数据的密集表示和比赛场地位置数据的原始表示。

7.如权利要求1所述的方法，其中，由所述计算系统经由所述预测模型，基于所述数据集生成与所述赛事之后的所述下一个赛事相关联的所述多个值包括：

生成输出向量，所述输出向量包括一个或更多个预期获得的米数、预期的比赛选择、在所述下一个赛事上得分的可能性、在包括所述下一个赛事的一系列赛事中得分的可能性、赢得比赛的可能性、得分线预测、预期分数、预期射门、预期犯规/罚球、预期角球、获胜概率、最终得分线、预期发球得分、预期得分、预期破发、获胜概率、最终得分、特定球员得分的预期分数、每个特定球员的预期篮板数、获胜概率以及最终得分预测，取决于所识别的运动。

8.一种用于生成多模态预测的系统，包括：

处理器；以及

存储器，所述存储器存储有编程指令，当所述编程指令由所述处理器执行时，执行一个或更多个操作，包括：由计算系统从数据存储装置中检索数据，所述数据包括跨多个赛季的多个赛事的信息；

通过以下步骤使用混合密度网络生成预测模型：

接收针对竞赛中的赛事的数据集，所述数据集包括至少针对比赛场地位置和当前得分的信息；以及

经由所述预测模型，基于所述数据集生成与所述赛事之后的下一个赛事相关联的多个值，其中，所述多个值几乎同时被确定。

9.如权利要求8所述的系统，其中，从所述数据生成所述输入向量包括：

10.如权利要求8所述的系统，其中，所述赛事数据中的每场比赛的所述数据包括分类特征和连续特征。

11.如权利要求10所述的系统，其中，从所述数据生成所述输入向量包括：

12.如权利要求11所述的系统，还包括：

13.如权利要求12所述的系统，其中，所述输入向量包括比赛场地位置数据的密集表示和比赛场地位置数据的原始表示。

14.如权利要求8所述的系统，其中，经由所述预测模型，基于所述数据集生成与所述赛事之后的所述下一个赛事相关联的所述多个值包括：

15.一种非暂时性计算机可读介质，包括一个或更多个指令序列，所述一个或更多个指令序列在由一个或更多个处理器执行时使得：

16.如权利要求15所述的非暂时性计算机可读介质，其中，从所述数据生成所述输入向量包括：

17.如权利要求15所述的非暂时性计算机可读介质，其中，所述赛事数据中的每场比赛的所述数据包括分类特征和连续特征。

18.如权利要求17所述的非暂时性计算机可读介质，其中，从所述数据生成所述输入向量包括：

19.如权利要求18所述的非暂时性计算机可读介质，还包括：

20.如权利要求15所述的非暂时性计算机可读介质，其中，由所述计算系统经由所述预测模型，基于所述数据集生成与所述赛事之后的所述下一个赛事相关联的所述多个值包括：