CN104200090B

CN104200090B - 基于多源异构数据的预测方法和装置

Info

Publication number: CN104200090B
Application number: CN201410427849.7A
Authority: CN
Inventors: 王擎; 胡伟; 沈志勇
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2014-08-27
Filing date: 2014-08-27
Publication date: 2017-07-14
Anticipated expiration: 2034-08-27
Also published as: JP2016048535A; JP6251668B2; KR102118754B1; US9760832B2; KR20160025433A; EP2990957A1; US20160063383A1; CN104200090A

Abstract

本发明实施例提供一种基于多源异构数据的预测方法和装置。该方法包括：对于设定类型事件，获取能反映事件结果的至少两类历史数据；建立设定类型事件的属性数据与所述至少两类历史数据的联合似然模型，并根据最大后验原则确定所述属性数据的最优估计；对于属于所述设定类型事件的待预测事件，基于所述联合似然模型中与属性数据关联的概率分布，确定所述概率分布中的参数，作为所述待预测事件的预测结果。本发明实施例，使用层次模型,在不同数据层引入不同来源数据,将异构数据统一在一个联合似然模型里进行分析,通过有效的融合,得到更加精准、即时和稳定的预测结果。

Description

基于多源异构数据的预测方法和装置

技术领域

本发明实施例涉及数据处理技术，尤其涉及一种基于多源异构数据的预测方法和装置。

背景技术

现有技术中，基于历史数据和模型对事件结果进行预测是一种常见的预测方法。典型的应用场景是对各种比赛结果进行预测。

基于历史比赛数据的预测模型，主要通过分析历史比赛数据里各支队伍的表现来估计赛队攻守能力,并以此为依据预测之后比赛的赛果。

该技术方案的缺陷主要在于，由于各支赛队的比赛在时间上分布比较稀疏，还存在赛队球员的变化以及球员自身的状态起伏,以及比赛的偶然性等，所以基于此获得的预测模型很难对所有赛队之间的即时相对强弱做出较好的估计，导致预测准确性差、不够稳定。此外，还不能对于赛程中出现的情况作出及时的反映。并且数据源单一，信息量较少而不能有效地预测未来的比赛赛果。

发明内容

本发明实施例提供一种基于多源异构数据的预测方法和装置，以提高预测的准确性。

本发明实施例提供了一种基于多源异构数据的预测方法，包括：

对于设定类型事件，获取能反映事件结果的至少两类历史数据；

建立设定类型事件的属性数据与所述至少两类历史数据的联合似然模型，并根据最大后验原则确定所述属性数据的最优估计；

对于属于所述设定类型事件的待预测事件，基于所述联合似然模型中与属性数据关联的概率分布，确定所述概率分布中的参数，作为所述待预测事件的预测结果。

本发明实施例还提供了一种基于多源异构数据的预测装置，包括：

数据获取模块，用于对于设定类型事件，获取能反映事件结果的至少两类历史数据；

模型估计模块，用于建立设定类型事件的属性数据与所述至少两类历史数据的联合似然模型，并根据最大后验原则确定所述属性数据的最优估计；

结果预测模块，用于对于属于所述设定类型事件的待预测事件，基于所述联合似然模型中与属性数据关联的概率分布，确定所述概率分布中的参数，作为所述待预测事件的预测结果。

本发明实施例，使用层次模型,在不同数据层引入不同来源数据,将异构数据统一在一个联合似然模型里进行分析,通过有效的融合,得到更加精准、即时和稳定的预测结果。

附图说明

图1为本发明实施例一提供的基于多源异构数据的预测方法的流程图；

图2为本发明实施例二提供的基于多源异构数据的预测方法的流程图；

图3为本发明实施例二所适用的模型和参数之间关系示意图；

图4为本发明实施例三提供的基于多源异构数据的预测装置的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的基于多源异构数据的预测方法的流程图。本发明实施例适用于对事件的结果进行预测，具体包括如下：

S110、对于设定类型事件，获取能反映事件结果的至少两类历史数据；

设定类型事件是指本发明实施例方法能够预测的事件，一般是事件结果符合某种概率分布的事件，典型的如足球比赛、篮球比赛等。历史数据是指此类事件的历史结果数据。事件的结果往往可以从多个角度来表述，每个角度的结果数据可视为一类。例如，对于足球比赛，比分数据可视为一类能反映比赛结果的数据，从主队和客队不同的角度来看比分，可记为主队比分和客队比分；赔率数据则可视为另一类能反映比赛结果的数据，赔率数据一般是从体彩等组织获取的，其往往体现了投注者以及组织者对比赛结果的期望值，赔率数据可包括主赔、平赔和客赔。多类的历史数据实际上构成了多源异构的数据形式，而不像现有技术那样局限于某一种单一的数据源类型。

S120、建立设定类型事件的属性数据与所述至少两类历史数据的联合似然模型，并根据最大后验原则确定所述属性数据的最优估计；

属性数据是指事件的内在属性，随可包含一些偶然因素，但一般是静态稳定的。例如，比赛的赛队攻守能力参数即可视为属性数据，赛队水平的发挥虽然可能受到天气、伤病的影响，但大体应该是稳定的，也是预测比赛结果的重要依据。本操作建立事件的属性数据与至少两类历史数据的联合似然模型，即综合考虑了多源异构的历史数据，从多层次来确定事件的属性数据。

该操作具体可以是：根据所述至少两类历史数据与所述属性数据之间的关系，以及用于修正所述关系满足正态分布的修正函数，建立所述联合似然模型。

联合似然模型将各类历史数据与属性数据之间的关系进行综合考虑，每类历史数据和属性数据之间的关系可采用某种分布概率函数来表示。所述历史数据与所述属性数据之间的关系优选包括泊松分布函数和/或伽马分布函数。例如，赔率与攻守能力参数之间的关系可基于泊松分布函数来表示，比分与攻守能力参数之间的关系可基于伽马分布函数来表示。当然，分布概率函数并不限于此，也可以采用其他满足事件关系的分布概率函数来表示。

在此基础上，优选是联合似然模型中还包括用于修正所述关系满足正态分布的修正函数，即由于属性数据中，以及其与比赛结果之间的关系一般都是满足正态关系的，不太可能会出现极端情况，所以针对由于某些偶然因素或历史数据过少而导致的畸形关系，避免确定的属性数据偏差过大。

S130、对于属于所述设定类型事件的待预测事件，基于所述联合似然模型中与属性数据关联的概率分布，确定所述概率分布中的参数，作为所述待预测事件的预测结果。

在确定了设定类型事件的属性数据之后，对于同类事件，即可采用该属性数据，并基于联合似然模型中与属性数据关联的概率分布确定所述概率分布中的参数。这实际上是基于历史数据确定属性数据的逆向过程。

本发明实施例，使用层次模型(hierarchical model),在不同数据层引入不同来源数据,将异构数据统一在一个联合似然模型里进行分析,通过有效的融合,得到更加精准、即时和稳定的预测结果。

实施例二

图2为本发明实施例二提供的基于多源异构数据的预测方法的流程图，图3为本发明实施例二所适用的模型和参数之间关系示意图，本实施例给出了具体的执行方案，具体以比赛预测为例进行说明。该方法具体包括：

S210、对于比赛，获取能反映比赛结果的历史比分和历史赔率，作为两类历史数据；

本操作取多场比赛的历史结果，多场比赛中每场比赛可记为比赛m，m为比赛的序号，m的取值范围为1至M。每场比赛m的比分记为主队比分s_m,1和客队比分s_m,2，每场比赛m的赔率记为主赔p_m,1、平赔p_m,2和客赔p_m,3。

S220、对所述历史赔率进行归一化处理。

本操作为可选步骤，以使赔率适应于分布概率函数的参数形式。优选可以基于如下公式对赔率进行归一化处理：

p′_m,1＝p_m，1/(p_m,1+p_m,2+p_m,3) (1)

p′_m,2＝p_m,2/(p_m,1+p_m,2+p_m,3) (2)

p′_m,3＝p_m,3/(p_m,1+p_m,2+p_m,3) (3)

p′_m,1、p′_m,2和p′_m,3为归一化处理后的赔率，为下文描述统一，将归一化处理后的赔率仍记为p_m,1、p_m，2和p_m,3。

S230、对于比赛m，采用所述比赛m的主赔p_m,1、平赔p_m,2和客赔p_m,3，基于如下关系式确定所述比赛m的泊松分布的主队进球参数λ_m,1和客队进球参数λ_m2：

其中，P()为分布概率，即满足括号内关系式的概率。

Poisson(λ)表示以λ作为参数的泊松分布，其含义为若随机变量X只取非负整数值0,1,2,...,且其概率分布服从Poisson(λ)。则p_m,1＝P(Poisson(λ_m,1)＞Poisson(λ_m,2))的含义为，主队进球参数λ_m,1和客队进球参数λ_m2的取值使得出现Poisson(λ_m,1)＞Poisson(λ_m,2)的概率等于主赔p_m,1。另两个公式的含义类似，主队进球参数λ_m,1和客队进球参数λ_m2应满足上述三个关系式。

各场比赛的主队进球参数λ_m,1和客队进球参数λ_m2均按照如上关系式来确定。由于比赛本身不同，例如天气、日期、比赛的重要性、比分、赔率等不同，所以即使参赛的赛队相同，确定的主队进球参数λ_m,1和客队进球参数λ_m2也不完全相同。各个赛队在参与比赛而确定的主队进球参数λ_m,1和客队进球参数λ_m2相互独立。

S240、将基于赔率确定的各比赛的主队进球参数λ_m,1和客队进球参数λ_m,2，以及各场比赛中的主队比分s_m,1和客队比分s_m,2，代入下式，构造如下关于赛队攻守能力参数θ的联合似然模型，并使用最大后验方式确定各赛队的攻守能力参数θ：

其中，

θ＝({a_i}_i＝1...n，{d_j}_j＝1...n，{b_k，b_k′}_{k，k′＝1...K})

θ为各赛队的攻守能力参数集合。n为赛队的序号，a_i为赛队i的攻击能力参数，d_j为赛队j的防守能力参数，b_k和b_k′为比赛的状态调整参数，分别用于根据比赛的状态修正赛队作为主队和客队时的攻击能力参数和防守能力参数。所谓状态调整参数，即根据比赛状态对赛队的攻守能力参数进行调整的修正系数。因为即使参赛的赛队相同，也会由于比赛自然的状态而使攻守能力发生变化。例如，比赛时的天气情况，比赛的类型是友谊赛还是世界杯、联赛等，所以可设置b_k作为对主队攻守能力的修正系数，设置b_k′作为对客队攻守能力的修正系数，两者均可从模型中估计得出。

P(θ)的含义为θ的分布概率，即表示θ作为连续分布随机变量的概率密度。

关系式(5)中的第一项如下：

当s取值为s_m,1时，

当s取值为s_m,2时，

P(s|θ)用于表示攻守能力参数θ与比分s之间的关系。

关系式(5)中的第二项如下：

当λ取值为λ_m,1时，

当λ取值为λ_m2时，

P(λ|θ)用于表示攻守能力参数θ与进球参数λ之间的关系。

g为预设权重值，可通过调整权重值调整比分和赔率对攻守能力参数的影响；β为预设的第一预设调整参数值，σ₁为预设的第二调整参数值，σ₂为预设的第三调整参数值；上述参数值均可根据经验或实验进行预先设定，也可以根据预测情况进行调整。

Γ()为伽马函数；logN()函数是对数正态分布函数；

关系式(5)中的第三项如下：

用于对历史数据低于设定门限值的赛队进行修正，即当赛队的历史数据较少时，未避免因样本数据较少而导致确定的赛队攻守能力偏差大，而设定此调整项，因为赛队的攻守能力一般符合正态分布，不会在各场比赛中出现过大的浮动。

关系式(5)中的第四项如下：

用于对赛队攻守能力的平衡性进行修正。即对于每个赛队而言，其攻击和防守的能力之间不会有过大差距，一般是关联的，所以采用此调整项进行修正。

基于调整项，即通过调节模型超参数，也可以控制模型在使用历史数据及赔率数据之间的平衡性，以及控制时间较久远的数据对即时数据的重要程度比值。

S250、对于待预测比赛c，按照参赛的主队i和客队j的攻守能力参数θ，基于如下关系式确定所述待预测比赛c的主队分布参数λ_c,1和客队分布参数λ_c,2：

其中，为根据所述待预测比赛c确定的主队修正系数，为主队i的攻击能力参数，为客队j的防守能力参数，为根据所述待预测比赛c确定的客队修正系数，为客队j的攻击能力参数，为主队的防守能力参数；

S260、对于待预测比赛c，按照所述主队分布参数λ_c,1和客队分布参数λ_c,2基于如下关系式确定赔率p_c,1、p_c,2和p_c,3：

S270、对于待预测比赛c，按照所述主队分布参数λ_c,1和客队分布参数λ_c,2基于如下关系式确定比分s_c,1和s_c,2：

s_c，1～Poisson(λ_c，1) (9)

s_c，2～Poisson(λ_c，2) (10)

本发明实施例的技术方案，对赛队的攻守能力参数进行建模分析，并基于此对未来比赛的可能赛果做模拟计算。对于每场比赛的赛果使用两个泊松(Poisson)分布进行建模，并依次建立了从比分到泊松分布参数的模型关系，从赔率到泊松分布参数的模型关系，并进一步使用攻守能力参数对泊松分布参数的分布进行建模，使用有(深度)层次结构的模型将两种数据整合起来，最终根据模型结果给出未来比赛可能结果的概率估计及其他输出。其中，比分的分布用两个泊松分布来刻画，并且同时由赔率数据反向推算比分分布的泊松模型的参数值，采用伽马分布刻画泊松模型参数值的分布，并将伽马分布的参数与主客场赛队的攻守能力参数及其他特征相联系，综合两方面得到的泊松分布参数，建立队伍攻守能力与比赛结果和赔率数据的联合似然。

本发明实施例的技术方案，可以有效地利用不同来源的不同结构的数据，相对于现有技术而言，现有的足球预测模型大部分只考虑用历史比分数据，并没有多源数据融合方面的内容。而本发明实施例通过整合多源异构数据，该方案可以获得更好的准确性，更快的时效性，以及更优的稳定性。

实施例三

图4为本发明实施例三提供的基于多源异构数据的预测装置的结构示意图，该装置包括：数据获取模块410、模型估计模块420和结果预测模块430。其中，数据获取模块410，用于对于设定类型事件，获取能反映事件结果的至少两类历史数据；模型估计模块420，用于建立设定类型事件的属性数据与所述至少两类历史数据的联合似然模型，并根据最大后验原则确定所述属性数据的最优估计；结果预测模块430，用于对于属于所述设定类型事件的待预测事件，基于所述联合似然模型中与属性数据关联的概率分布，确定所述概率分布中的参数，作为所述待预测事件的预测结果。

在上述技术方案中，模型估计模块420具体可用于：根据所述至少两类历史数据与所述属性数据之间的关系，以及用于修正所述关系满足正态分布的修正函数，建立所述联合似然模型。

所述历史数据与所述属性数据之间的关系优选包括泊松分布函数和/或伽马分布函数。

基于上述技术方案提供的优选实例为：

数据获取模块410具体用于对于比赛，获取能反映比赛结果的历史比分和历史赔率，作为两类历史数据；

模型估计模块420具体用于：

对于比赛m，采用所述比赛m的主赔p_m,1、平赔p_m,2和客赔p_m,3，基于如下关系式确定所述比赛m的泊松分布的主队进球参数λ_m,1和客队进球参数λ_m2：

其中，P()为分布概率；m为比赛的序号，m的取值范围为1至M；

将基于赔率确定的各比赛的主队进球参数λ_m,1和客队进球参数λ_m,2，以及各场比赛中的主队比分s_m,1和客队比分s_m,2，代入下式，构造如下关于赛队攻守能力参数θ的联合似然模型，并使用最大后验方式确定各赛队的攻守能力参数θ：

其中，

θ＝({a_i}_i＝1...n，{d_j}_j＝1...n，{b_k，b_k′}_{k，k′＝1...K})

n为赛队的序号，a_i为赛队i的攻击能力参数，d_j为赛队j的防守能力参数，b_k和b_k′为比赛的状态调整参数，分别用于根据比赛的状态修正赛队作为主队和客队时的攻击能力参数和防守能力系数；

P(θ)的含义为θ的分布概率；

当s取值为s_m,1时，

当s取值为s_m,2时，

当λ取值为λ_m,1时，

当λ取值为λ_m2时，

g为预设权重值，β为预设的第一预设调整参数值，σ₁为预设的第二调整参数值，σ₂为预设的第三调整参数值；

Γ()为伽马函数；

logN()函数是对数正态分布函数；

用于对历史数据低于设定门限值的赛队进行修正；

用于对赛队攻守能力的平衡性进行修正。

结果预测模块430具体用于：

对于待预测比赛c，按照参赛的主队i和客队j的攻守能力参数θ，基于如下关系式确定所述待预测比赛c的主队分布参数λ_c,1和客队分布参数λ_c,2：

其中，为根据所述待预测比赛c确定的主队修正系数，为主队i的攻击能力，为客队j的防守能力，为根据所述待预测比赛c确定的客队修正系数，为客队j的攻击能力，为主队的防守能力；

对于待预测比赛c，按照所述主队分布参数λ_c,1和客队分布参数λ_c,2基于如下关系式确定赔率p_c,1、p_c,2和p_c,3：

对于待预测比赛c，按照所述主队分布参数λ_c,1和客队分布参数λ_c,2基于如下关系式确定比分s_c,1和s_c,2：

s_c，1～Poisson(λ_c，1)

s_c,2～Poisson(λ_c,2)。

所述模型估计模块430中，在对于比赛，获取能反映比赛结果的历史比分和历史赔率，作为两类历史数据之后，还具体用于对所述历史赔率进行归一化处理。

本发明实施例提供的基于多源异构数据的预测装置，用于执行本发明实施例提供的基于多源异构数据的预测装置，能够执行相应的操作，具备相对应的功能和有益效果。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种基于多源异构数据的预测方法，其特征在于，包括：

建立设定类型事件的属性数据与所述至少两类历史数据的联合似然模型，并根据最大后验原则确定所述属性数据的最优估计；其中,每类历史数据与属性数据之间的关系采用对应的分布概率函数；

2.根据权利要求1所述的方法，其特征在于，建立设定类型事件的属性数据与所述至少两类历史数据的联合似然模型包括：

根据所述至少两类历史数据与所述属性数据之间的关系，以及用于修正所述关系满足正态分布的修正函数，建立所述联合似然模型。

3.根据权利要求2所述的方法，其特征在于，所述历史数据与所述属性数据之间的关系包括泊松分布函数和/或伽马分布函数。

4.根据权利要求1-3任一所述的方法，其特征在于，所述方法具体包括：

对于比赛，获取能反映比赛结果的历史比分和历史赔率，作为两类历史数据；

\{\begin{matrix} p_{m, 1} = P (P o i s s o n (λ_{m, 1}) > P o i s s o n (λ_{m, 2})) \\ p_{m, 2} = P (P o i s s o n (λ_{m, 1}) = P o i s s o n (λ_{m, 2})) \\ p_{m, 3} = P (P o i s s o n (λ_{m, 1}) < P o i s s o n (λ_{m, 2})) \end{matrix}

其中，P()为分布概率；m为比赛的序号，m的取值范围为1至M；

\log P (θ) = g \log P (s | θ) + (1 - g) \log P (λ | θ) + \log N (θ; 0, σ_{1}^{2}) + \log N (α_{i} - d_{i}; 0, σ_{2}^{2})

其中，θ＝({a_i}_i＝1…n,{d_j}_j＝1…n,{b_k,b_k'}_k,k'＝1…K)

n为赛队的序号，a_i为赛队i的攻击能力参数，d_j为赛队j的防守能力参数，其中，i＝1…n，j＝1…n，b_k和b_k′为比赛的状态调整参数，分别用于根据比赛的状态修正赛队作为主队和客队时的攻击能力参数和防守能力参数；

P(θ)的含义为θ的分布概率；

P (s | θ) = \frac{Γ (\exp (x) + s)}{Γ (\exp (x))} . \frac{β^{\exp (x)}}{{(β + 1)}^{\exp (x) + s}} . \frac{1}{s!}

当s取值为s_m,1时，

当s取值为s_m,2时，

P (λ | θ) = \frac{β^{\exp (x)}}{Γ (\exp (x))} . λ^{\exp (x) - 1} . \exp (- β λ)

当λ取值为λ_m,1时，

当λ取值为λ_m2时，

g为预设权重值，β为预设的第一预设调整参数值，σ₁为预设的第二调整参数值，σ₂为预设的第三调整参数值，为根据比赛m确定的主队修正系数，为比赛m中主队i的攻击能力参数，为比赛m中客队j的防守能力参数，为根据比赛m确定的客队修正系数，为比赛m中客队j的攻击能力参数，为比赛m中主队i的防守能力参数；

Γ()为伽马函数；

log N()函数是对数正态分布函数；

用于对历史数据低于设定门限值的赛队进行修正；

用于对赛队攻守能力的平衡性进行修正。

5.根据权利要求4所述的方法，其特征在于，对于属于所述设定类型事件的待预测事件，基于所述联合似然模型中与属性数据关联的概率分布，确定所述概率分布中的参数，作为所述待预测事件的预测结果包括：

λ_{c, 1} ~ G a m m a (\exp (b_{k_{c}} + a_{i_{c}} - d_{j_{c}}), β)

λ_{c, 2} ~ G a m m a (\exp (b_{k_{c}^{'}} + a_{j_{c}} - d_{i_{c}}), β)

\{\begin{matrix} p_{c, 1} = P (P o i s s o n (λ_{c, 1}) > P o i s s o n (λ_{c, 2})) \\ p_{c, 2} = P (P o i s s o n (λ_{c, 1}) = P o i s s o n (λ_{c, 2})) \\ p_{c, 3} = P (P o i s s o n (λ_{c, 1}) < P o i s s o n (λ_{c, 2})) \end{matrix}

s_c,1～Poisson(λ_c,1)

s_c,2～Poisson(λ_c,2)。

6.根据权利要求4所述的方法，其特征在于，在对于比赛，获取能反映比赛结果的历史比分和历史赔率，作为两类历史数据之后，还包括：

对所述历史赔率进行归一化处理。

7.一种基于多源异构数据的预测装置，其特征在于，包括：

模型估计模块，用于建立设定类型事件的属性数据与所述至少两类历史数据的联合似然模型，并根据最大后验原则确定所述属性数据的最优估计；其中,每类历史数据与属性数据之间的关系采用对应的分布概率函数；

8.根据权利要求7所述的装置，其特征在于，模型估计模块具体用于：

9.根据权利要求8所述的装置，其特征在于，所述历史数据与所述属性数据之间的关系包括泊松分布函数和/或伽马分布函数。

10.根据权利要求7-9任一所述的装置，其特征在于：

数据获取模块具体用于对于比赛，获取能反映比赛结果的历史比分和历史赔率，作为两类历史数据；

模型估计模块具体用于：

\{\begin{matrix} p_{m, 1} = P (P o i s s o n (λ_{m, 1}) > P o i s s o n (λ_{m, 2})) \\ p_{m, 2} = P (P o i s s o n (λ_{m, 1}) = P o i s s o n (λ_{m, 2})) \\ p_{m, 3} = P (P o i s s o n (λ_{m, 1}) < P o i s s o n (λ_{m, 2})) \end{matrix}

其中，P()为分布概率；m为比赛的序号，m的取值范围为1至M；

\log P (θ) = g \log P (s | θ) + (1 - g) \log P (λ | θ) + \log N (θ; 0, σ_{1}^{2}) + \log N (α_{i} - d_{i}; 0, σ_{2}^{2})

其中，θ＝({a_i}_i＝1…n,{d_j}_j＝1…n,{b_k,b_k′}_{k,k′＝1…K})

P(θ)的含义为θ的分布概率；

P (s | θ) = \frac{Γ (\exp (x) + s)}{Γ (\exp (x))} . \frac{β^{\exp (x)}}{{(β + 1)}^{\exp (x) + s}} . \frac{1}{s!}

当s取值为s_m,1时，

当s取值为s_m,2时，

P (λ | θ) = \frac{β^{\exp (x)}}{Γ (\exp (x))} . λ^{\exp (x) - 1} . \exp (- β λ)

当λ取值为λ_m,1时，

当λ取值为λ_m2时，

g为预设权重值，β为预设的第一预设调整参数值，σ₁为预设的第二调整参数值，σ₂为预设的第三调整参数值，为根据比赛m确定的主队修正系数，为比赛m中主队i的攻击能力参数，为比赛m中客队j的防守能力参数，为根据比赛m确定的客队修正系数，为比赛m中客队j的攻击能力参数，为比赛m中主队的防守能力参数；

Γ()为伽马函数；

log N()函数是对数正态分布函数；

用于对历史数据低于设定门限值的赛队进行修正；

用于对赛队攻守能力的平衡性进行修正。

11.根据权利要求10所述的装置，其特征在于，结果预测模块具体用于：

λ_{c, 1} ~ G a m m a (\exp (b_{k_{c}} + a_{i_{c}} - d_{j_{c}}), β)

λ_{c, 2} ~ G a m m a (\exp (b_{k_{c}^{'}} + a_{j_{c}} - d_{i_{c}}), β)

\{\begin{matrix} p_{c, 1} = P (P o i s s o n (λ_{c, 1}) > P o i s s o n (λ_{c, 2})) \\ p_{c, 2} = P (P o i s s o n (λ_{c, 1}) = P o i s s o n (λ_{c, 2})) \\ p_{c, 3} = P (P o i s s o n (λ_{c, 1}) < P o i s s o n (λ_{c, 2})) \end{matrix}

S_c,1～Poisson(λ_c,1)

s_c,2～Poisson(λ_c,2)。

12.根据权利要求10所述的装置，其特征在于，所述模型估计模块中，在对于比赛，获取能反映比赛结果的历史比分和历史赔率，作为两类历史数据之后，还具体用于对所述历史赔率进行归一化处理。