CN113240190A - 基于多周期演化熵技术的运动员赛前状态评价方法 - Google Patents

基于多周期演化熵技术的运动员赛前状态评价方法 Download PDF

Info

Publication number
CN113240190A
CN113240190A CN202110615902.6A CN202110615902A CN113240190A CN 113240190 A CN113240190 A CN 113240190A CN 202110615902 A CN202110615902 A CN 202110615902A CN 113240190 A CN113240190 A CN 113240190A
Authority
CN
China
Prior art keywords
athlete
attribute
data
entropy
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110615902.6A
Other languages
English (en)
Inventor
孟强
李妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Physical Education College of Zhengzhou University
Original Assignee
Physical Education College of Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Physical Education College of Zhengzhou University filed Critical Physical Education College of Zhengzhou University
Priority to CN202110615902.6A priority Critical patent/CN113240190A/zh
Publication of CN113240190A publication Critical patent/CN113240190A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明涉及基于多周期演化熵技术的运动员赛前状态评价方法,属于数据处理领域,该方法按照不同的属性对运动员的历史比赛数据进行处理,得到运动员状态数据的熵和运动项目的属性熵,从而建立运动员状态数据在各个属性下的综合熵,选取综合熵最大值的属性作为决策树的第一个分类层级;然后,在第一分类层级下确定的几个待分类数据中,再分别求剩余属性下的综合熵,再按照综合熵最大的原则选取决策树的第二个分类层级;以此类推,直到决策树构建完成;最后,利用决策树结合运动员的赛前状态数据的属性情况,能够预测该运动员在n个周期后的比赛结果。本发明的方法能够较为客观的预测了运动员的比赛胜负结果,准确性较高,市场应用前景较好。

Description

基于多周期演化熵技术的运动员赛前状态评价方法
技术领域
本发明属于数据处理领域,具体涉及基于多周期演化熵技术的运动员赛前状态评价方法。
背景技术
在体育专业中,通常将运动员分为训练型选手与竞赛型选手,前者是指在训练时发挥较好,但一到比赛就容易发挥失常的选手。后者是指训练时发挥一般,而一到比赛通常能够超长发挥的选手。运动员的赛前心理状态是造成这一现象的根本原因,心理因素能够很大程度左右比赛结果,但却是是难以量化的,只能由教练根据主观经验事先预判运动员的比赛结果,因此,运动员的比赛胜负手结果的预测准确性均较低,不具有参考性。
发明内容
本发明的目的是提供一种基于多周期演化熵技术的运动员赛前状态评价方法,用于解决现有方法根据主观经验预测运动员比赛结果准确性低的问题。
基于上述目的,基于多周期演化熵技术的运动员赛前状态评价方法的技术方案如下:
(1)获取运动员在某一时间段的历史比赛数据,包括不理影响运动员心理状态的数据,和影响运动员心理状态的数据,对数据属性进行划分,对各属性下的运动员状态数据进行频率化处理,得到各属性的初始频率分布;
(2)根据运动员在历史比赛数据中的比赛结果,计算该运动员赛前状态数据的熵,计算式如下:
Figure BDA0003098001090000011
其中,Ea表示运动员的某一赛前状态数据的熵,f(a)表示运动员在某运动项目时,最后比赛结果为a的频率;
根据各属性的初始频率分布,结合对运动员施加的心理状态转移矩阵,计算得到运动员在设定周期后各属性的心理影响频率分布,利用此心理影响频率分布,计算运动员在比赛运动项目的属性熵,计算式如下:
Figure BDA0003098001090000012
其中,
Figure BDA0003098001090000013
表示运动员在运动项目上的第k属性的子熵,fb(k)表示第k属性下发生第b种比赛结果的频率,其具体是指k属性下竞技所有可能结果中第b种结果所占的比例;nk表示第k属性下,运动员出现的所有结果种类的个数;
(3)根据运动员赛前状态数据的熵Ea,以及运动员在比赛运动项目的属性熵
Figure BDA0003098001090000021
计算运动员在各属性下的状态大数据综合熵,计算式如下:
Figure BDA0003098001090000022
式中,
Figure BDA0003098001090000023
表示运动员关于属性k的状态大数据综合熵,Sv表示属性k下某一类属性值出现的个数,N表示属性k包含的值的总个数;
(4)在所有属性的综合熵中,选取综合熵最大的属性k1为第一个分类层级,将运动员的历史状态数据划分为nki类,每个子类中的状态数据重新形成一个新的待分类系统。对每一个新的待分类系统按照步骤(3)中的内容,再次分别求各属性下的状态大数据综合熵,取最大的综合熵的属性k2作为第二个层级,并以此迭代类推,生成运动员的赛前数据动态决策树;
(5)根据运动员即将参赛的比赛历程的状态数据,确定状态数据的属性情况,在所述的赛前数据动态决策树中,找到与该属性情况一致的分支节点,输出比赛结果的预测分类。
上述技术方案的有益效果是:
本发明考虑到不同的运动员具有不同的比赛历史数据,按照不同的属性对运动员的历史比赛数据进行处理,得到运动员状态数据的熵和运动项目的属性熵,从而建立运动员状态数据在各个属性下的n次综合熵,选取综合熵最大值的属性k1作为决策树的第一个分类层级;然后,在第一分类层级下确定的一个或几个待分类数据中,再分别求剩余属性(k2,k3,…)下的n次综合熵,再按照综合熵最大的原则选取决策树的第二个分类层级;以此类推,直到决策树构建完成;最后,根据运动员的赛前状态数据的属性情况,比对构建的决策树,能够预测该运动员在n个周期后的比赛结果。本发明的方法通过大数据处理的方式,较为客观的预测了运动员的比赛胜负结果,准确性较高,市场应用前景较好。
进一步的,为了体现不同运动员的心理差异因素影响,提高运动员在n个周期后频率的客观性,需要在根据历史比赛成绩统计出的原始频率基础上,施加心理状态转移因子,因此,步骤(2)中,第k属性下发生第b种比赛结果的频率fb(k)通过心理差异频率分布求得,心理差异频率分布的表达式如下:
Figure BDA0003098001090000031
式中,F(k)n表示经过n次周期后,运动员在第k属性下值的心理差异频率分布,n≥1,[f1(k1)0 f2(k2)0 … fn(kn)0]表示初始时刻统计出的原始频率,p(k)ij为预设的的心理状态转移概率,Pn(k)为n个周期后的状态转移矩阵,[f1(k1)n f2(k2)n ... fn(kn)n]为心理差异频率分布中的元素,即n个周期后在属性k1到kn下分别发生第b种比赛结果的频率。
效果是:本发明利用了随机过程演化模型,该模型的思想是不直接对心理因素进行量化,而是承认心理因素会对运动员的比赛表现产生影响,并将这种影响设计成一种只用统计一次心理加成效果概率矩阵形式,借助随机过程原理可以计算出任意多个周期后心理状态对属性的影响程度。然后,将心理状态的演化模型结合到信息论中,构建了运动员赛前大数据的综合熵模型,并由此给出了一种生成运动员的赛前大数据动态决策树流程,将新的赛前数据代入后能够输出预测的比赛结果。
进一步的,步骤(1)中,对各属性下的运动员状态数据进行频率化处理包括:
对离散状态数据的处理,按照待考察数据值占该数据属性下所有值的比例进行统计;或者,将待考察数据所在属性的值域划分为多个范围,统计待考察数据所在范围出现次数占所有范围出现次数的比例。
进一步的,步骤(1)中,对各属性下的运动员状态数据进行频率化处理包括:
对连续状态数据的处理,将待考察的连续数据所在属性值域划分为多个范围,统计待考察数据所在范围出现次数占所有范围出现次数的比例。
进一步的,步骤(1)中,对各属性下的运动员状态数据进行频率化处理包括:
对非数值型数据的处理,将待考察数据进行数值赋值,并统计其出现频率。
进一步的,步骤(1)中,不理影响运动员心理状态的数据包括:身高、体重,平均心跳频率,血压,血氧,肺扩量。
进一步的,步骤(1)中,影响运动员心理状态的数据包括:比赛地点气温,比赛的主客场,比赛的重要性排序,比赛中存在的强劲对手。
附图说明
图1是本发明实施例中的运动员赛前状态评价方法流程图;
图2是本发明实施例中生成动态决策树的示意图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的说明。
本实施例提出一种基于大数据下多周期演化熵技术的运动员赛前状态评价方法,其实现流程如图1所示,具体实现步骤如下:
步骤一,对运动员的状态数据进行划分,这种划分方式是可以根据运动员的具体情况来定的,例如,有些特定属性会对一部分运动员产生较强的心理影响,而对另外一部分运动员不产生心理作用,举例如下:
1)不理影响运动员心理状态的数据,比如:身高体重,平均心跳频率,血压,血氧,肺扩量等。
2)会影响运动员心理状态的数据,比如:比赛地点气温(高温、适温、低温),是否是主客场,之前特定长度时期内已经参加过几次比赛,本次比赛的重要性排序,是否存在强劲对手(强敌、弱敌)等。
本步骤中,获取运动员的状态数据是运动员在参赛前一段时间的各项历史状态数据,由于本方法的目的是对单个运动员的比赛结果进行预测,因此,针对不同的运动员,本步骤中需要选取的数据可以根据运动员的具体情况进行设定,例如,可以只选择影响该运动员心理状态的数据,或者选择可能会产生心理状态影响的状态数据,选择其中的一项或几项。
步骤二,对运动员状态数据进行频率化处理。
由于运动员的状态数据类型各不相同,数据结构差异很大,为了对数据进行有效分析,需要对数据进行格式统一,本发明利用频率化处理对数据格式进行统一,不考察数据本身的值,而是考察数据的值或范围在整个属性值中所占的比例。
因此,按照状态数据的类型(离散数据,连续数据,非数值型数据),本步骤的频率化处理包括对离散状态数据的频率化处理、对连续状态数据的频率化处理,以及对非数值型状态数据的频率化处理,具体处理过程如下:
2.1对离散状态数据的处理,包括两种:
(1)可按照待考察数据值占该数据属性下所有值的比例进行统计。
(2)将待考察数据所在属性的值域划分为多个范围,统计待考察数据所在范围出现次数占所有范围出现次数的比例。
2.2对连续状态数据的处理,将待考察的连续数据所在属性值域划分为多个范围,统计待考察数据所在范围出现次数占所有范围出现次数的比例。
2.3对非数值型数据的处理,将待考察数据进行数值赋值,并统计其出现频率。
经过本步骤,通过对数据进行频率化,无论输入数据是何种格式,相应的输出皆统一为频率。
步骤三,计算运动员状态数据的熵。
运动员状态数据被频率化后,就可以知道在该属性下特定一项数据在所有相应数据中出现的频率分布,因此,可以对该运动员状态数据进行熵化。
运动员的某一赛前状态数据的熵计算式如下:
Figure BDA0003098001090000051
其中,Ea表示运动员的某一赛前状态数据的熵,f(a)表示运动员在某运动项目时,最后比赛结果为a的频率,例如,令a表示胜利,10次比赛,胜7次,则a的频率为0.7。这种频率具体是指出现第a结果占所有出现的结果的中的比例。N表示所有结果的总体个数,对数函数log的底数为2。
因此,根据该公式可知,当运动员的赛前各项数据较为稳定时,比赛结果也是趋于稳定的,则出现特定比赛结果的可能性较高,信息量大,运动员在这一项目上的状态熵是较小的。反之,当运动员的各项数据不稳定时,竞技项目的结果也越不可测,因此运动员关于此项目的状态熵会教较大。
步骤四,计算运动项目的属性熵。
由于运动员在参与运动项目时,其比赛结果的所有可能性是确定的,通常包含赢(胜),输(负),平手等,这意味着结果a的取值通常是有限且少量的离散值。但是每个竞技项目本身却蕴含了大量与运动员状态相关的属性(连续客场数、连续强敌数等),根据步骤一中记载的内容,至少可分为不理影响心理状态的数据与会影响心理状态的数据,称他们的熵为运动项目的属性熵。
因此,给出运动项目的属性熵的计算式如下:
Figure BDA0003098001090000052
其中,
Figure BDA0003098001090000053
表示运动员在运动项目上的第k属性的子熵,fb(k)表示第k属性下发生第b种比赛结果的频率,其具体是指k属性下竞技所有可能结果中第b种结果所占的比例。nk表示第k属性下,运动员出现的所有结果种类的个数。上式中,属性熵的大小能够描述该属性对竞技结果施加影响的程度。当其值越大时,说明在该属性下的竞技结果稳定性小,属性对竞技结果的决定性较小。当其值越大时,说明在该属性下的竞技结果稳定性大,属性对竞技结果的决定性较大。
本步骤中,fb(k)需要根据构建的运动项目属性熵的心理演化模型得到,该模型的表达式如下:
Figure BDA0003098001090000061
式中,F(k)1表示运动员在第k属性的值在一个训练或竞赛周期后(下文简称一个周期)的心理影响频率分布(心理差异频率分布)。fi(ki)t表示表示t时刻下,k属性值为ki时对应的取该值的频率fi,[f1(k1)0 f2(k2)0 ... fn(kn)0]表示初始时刻统计出的原始频率,矩阵P(k)表示一次训练或竞赛对运动员施加的心理状态转移矩阵,其中元素p(k)ij表示运动员在初始时刻第k属性取第i频率值,经一个周期后,取到第j频率值的概率。
本步骤中,心理差异频率分布F(k)1的本质是在取值原始频率上施加的一个心理影响因素后得到的新频率。其概率值和转移后的概率可以通过运动员对第k属性的敏感度来具体定义,例如k属性表示接下来客场比赛的次数对运动员发挥失利的影响,此时,F(k)中越靠后的频率会变得越大,而对于连续客场较为敏感的运动员,其连续客场对其发挥失利会有加成作用,对应列的转移概率值可以设定为较大,表示当连续多次客场后,敏感的运动员发挥失利的可能性会比不敏感的运动员大。
因此,在心理因素的随机演化模型下只需统计一次向量[f1(k1)0 f2(k2)0 ... fn(kn)0]与矩阵P(k),就能完成一次随机过程转移,求解出一个训练或竞赛周期后的运动员心理差异频率分布。需要注意的是,心理演化模型通常只用施加到受心理因素影响的属性上,而不受心理因素影响的属性不需要施加。
作为其他实施方式,如果需要预测多个周期后运动员的比赛结果,那么此时需要计算多个周期后的心理差异频率分布,计算式如下:
Figure BDA0003098001090000071
其中,F(k)n表示经过n次周期后(对应实际中的n次训练或比赛),运动员在第k属性下值的心理差异频率分布。在实际应用中,对于训练型选手,主要考察其比赛周期的心理加成属性,对于竞赛型选手,主要考察其训练时的心理加成影响。根据上式可知,只要统计出一个周期内的心理状态转移概率p(k)ij,就可以计算出任意周期n后的状态转移矩阵Pn(k),以此估算任意周期后的运动员属性状态的频率分布F(k)n
这里要注意的是,心理状态转移矩阵是可以根据实际情况来定义或统计的,例如运动员可以自己说明其对连续客场这种状态很敏感,由此来设置矩阵内的初始转移概率。也可以通过运动员过去比赛数据的,按指标统计出各自转移情况下的初始转移概率。
由于运动员的赛前心理因素是决定其比赛发挥的重要因素,而心理因素是难以量化的,因此设计了一种随机演化模型,该模型的思想是不直接对心理因素进行量化,而是承认心理因素会对运动员的比赛表现产生影响,且将这种影响设计成一种可以积累的形式,即使运动员的其他属性因素对比赛结果的影响相当稳定,心理因素的积累演化都可能使得比赛结果出现反转。而这种会左右比赛实际发挥的随机因素是一种积累演化的过程,其积累结果会趋近于估计出更加精确的影响。
步骤五,根据运动员状态数据的熵和运动项目的属性熵,构建运动员赛前大数据的综合熵,即运动员状态数据的n次综合熵,表达式如下:
Figure BDA0003098001090000072
其中,
Figure BDA0003098001090000073
表示运动员关于属性k的状态大数据综合熵,Ea表示运动员某一项目的状态数据的熵,fb(k)n表示经过n次周期后运动员第k属性值受心理差异影响在第b结果下的修正频率,它通过原始频率分布与n次心理状态转移矩阵的乘法计算取得。nk表示第k属性下,运动员出现的所有结果的个数。Sv表示属性k下某一类属性值出现的个数。N表示属性k包含的值的总个数。综合熵的数值大小反应了运动员第k属性对运动员赛前状态的影响程度,其值越大,表明k属性对运动员的影响程度越高。
对于一个运动员而言,当统计得到其所有观测属性中每个属性的值的出现频率时,就可以根据运动员的一次心理状态转移矩阵求出运动员在接下来的比赛中的综合熵。
步骤六,生成运动员的赛前数据动态决策树,并结合运动员将参赛的赛程数据,估计运用于的比赛结果。
具体的,生成动态决策树的具体步骤如下:
1)动员赛前的属性可以有多种,因此对求出所有属性的综合熵
Figure BDA0003098001090000081
按照大小进行排序,选取综合熵最大的属性k1作为第一个分类标准,属性k1为第一个层级,如属性k1可取nki个值,则根据该属性的分类标准,将运动员的历史状态数据划分为nki类,相当于nki个子集数据。
2)当运动员的状态被属性k1划分为nk1个后,nk1中每个子类中的状态数据重新形成一个新的待分类系统。对每一个新的待分类系统按照步骤五中的内容,再次分别求综合熵,得到每个子系统下的属性排序,取最大的综合熵的属性k2作为第二个层级,并以此迭代类推。
在依次求每个层级下各属性的综合熵时,每一层级下不能再求上一层级的划分属性,当计算得当前层级下每个分支节点内只包含相同的分类结果时,该分支的综合熵计算结束。
根据上述方法,可以将运动员的历史状态数据与参赛结果进行算法分类,生成一个运动员的动态状态决策树,决策树的每一层都是一个属性,从上到下,各个属性对比赛结果的影响逐渐变小。并且,由于运动员的动态决策树已经生成完成,每一层级的属性分支均有对应的概率值,因此只需带入该运动员本次即将参赛比赛历程的状态数据的各个属性情况,找出与该属性情况一致的分支节点,即可输出评估到的比赛结果预测分类。
在现有技术中,通常的决策树是固定的,输出与输入一一对应,但是由于属性子熵在每一次输入前都会由心理因素决定一个状态转移矩阵,因此得到的综合熵大小排序也是动态变化的,这就使得决策树本身在动态变化,本次最有影响力的属性可能在下一轮由于心理因素施加影响而变得不重要。因此,动态的决策树才能够较准确的预测出运动员的比赛结果。
本发明的方法是一种结合了大数据技术与心理演化技术对运动赛前状态数据进行评估,并预测比赛结果的方法。运动选手的赛前心理状态是能够很大程度左右比赛结果的关键因素,而心理因素是难以量化的,因此本发明利用了随机过程演化模型,该模型的思想是不直接对心理因素进行量化,而是承认心理因素会对运动员的比赛表现产生影响,并将这种影响设计成一种只用统计一次心理加成效果概率矩阵形式,借助随机过程原理可以计算出任意多个周期后心理状态对属性的影响程度。然后,将心理状态的演化模型结合到信息论中,构建了运动员赛前大数据的综合熵模型,并由此给出了一种生成运动员的赛前大数据动态决策树流程,将新的赛前数据代入后能够输出预测的比赛结果。
下面以运动员甲的参赛历史数据,举例说明本方法中各步骤的实现过程:
运动员甲在过去一段时间参加了16次比赛,在比赛历史数据中,胜利9场,输7场,那么,可求得运动员甲的状态数据的熵为:
Figure BDA0003098001090000091
式中,a=1为胜利a=2为失败。
并且,在运动员甲参加的16场比赛中,影响比赛发挥的属性包括:连续客场数目,该属性下取值有0,1,2三种。则有如下关系:
属性K=连续客场数目K下共有16场比赛N=16;
V=连续0客场={5场次,胜3输2},Sv=5;
V=连续1客场={6场次,胜3输3},Sv=6;
V=连续2客场={5场次,胜1输4},Sv=5;
则可求得初始时刻统计出的原始频率
Figure BDA0003098001090000092
设定心理状态转移矩阵,如下:
Figure BDA0003098001090000093
该矩阵中,主对角线元素与初始频率是一致的,由统计得到,而非主对角线元素可以通过对历史数据统计或对运动员心理状态调查估计出一个合适大小的概率。这种估计不需要非常精细,只需要估计的概率大小合适即可,这里实际表达的意思是,运动员心理状态从1转移到1,2,3的概率,不用估计的很精确,只要知道转移到这1,2,3三个状态的谁大谁小即可。比如估计转移到状态1的概率最大,转移到状态3的概率最小,那么实际上取0.6、0.35、0.25和取0.6、0.45、0.15或者取0.6、0.3、0.1在效果都一样,因此只要概率大小排序能够反映大小排序就行,具体取值满足这个大小关系即可,因为在n次的转移后,这种累积效用会逐渐放大或缩小。对于不受心理状态影响的属性则不需要乘以状态转移矩阵,直接取初始分布中的对应元素即可。
将上面得到的原始频率[f1(k1)0 f2(k2)0 f3(k2)0],和心理状态转移矩阵P(k)代入运动项目属性熵的心理演化模型中,得到:
Figure BDA0003098001090000101
上式是采用一次转移概率,N次转移概率乘以矩阵的N次方即可,不再赘述。
上述心理差异频率分布的元素为赢的频率,那么,输的频率计算式为:
Figure BDA0003098001090000102
f1 2
Figure BDA0003098001090000103
为输的频率,f1 1
Figure BDA0003098001090000104
为赢的频率。
因此,可计算属性为连续客场的综合熵为:
Figure BDA0003098001090000105
K属性的综合熵
Figure BDA0003098001090000106
的本质是信息的增益,当属性k对赛前状态越重要时,得到的综合熵则越大。
在确定动态决策树时,假设本例中的属性包括k1连续客场数(属性值包含0,1,2),k2下一场为是否为强敌(属性值包含1是,2否),k3运动员是否遇到高温天气(属性值包含1是,2否)。
则按照上面的计算过程,求出各属性k1 k2 k3的综合熵
Figure BDA0003098001090000107
取最大的为第一个分叉依据,比如k1的综合熵值最大,则取k1为第一分叉依据,k1中的三个值0,1,2分别成为一个分支节点,记为k11 k12 k13。这三个节点将所有数据划分为三个子集。
其中,每个子集又组成了一个带评估的系统,且这个子集中已经不再包含k1属性。对每个子集都计算其k2,k3的的综合熵,选出其中最大的,作为第二分叉依据。比如k2比k 3的综合熵大,则k2为第二分叉依据,由于K2只有两个属性值,则k11 k12 k13中每个子集又可按k2的属性值划分为两类,总体一共六类k111、k112、k121、k122、k131、k132,如图2所示,以此类推,直到某一类别下只有一个数据。
那么,本路径代表对应的结果则为预测的比赛结果。以图2为例,假设k111下只有一个数据,即一场比赛数据,k112下也只有一场比赛数据,那根据运动员甲将比赛的赛程数据,如果其属性数据与k111相同,那么,其预测比赛结果为k111属性下这一场的胜负结果,例如在k111只有一场比赛且为胜利的情况下,预测运动员的比赛结果为胜;同理,如果未来的赛程属性数据与k112相同,其预测比赛结果为k112属性下这一场比赛的胜负结果。
生成一条决策树的好处在于,只要确定了路径,就能预测比赛的结果,而并非所有运动员的历史赛程都能与接下来赛程有刚好一致的路径,此时只需要选取其他运动员有相同的决策树路径的结果进行预测即可。
本实施例中,是以一个运动员为例说明生成的动态决策树,并体现了心理状态转移的结果,其他运动员的决策树生成中并不一定有心理状态转移的计算过程,但是每一个分叉依据的排序本质是一系列心理与非心理属性叠加的结果,因此比赛结果的分类也是从各个属性影响的结果来判断的,这意味着相同的路径具有等价性。
在本例中没有选取非心理因素,而在生成树的过程中必须加入非心理因素,例如运动员的身体水平,历史胜率等,只有这样生成的预测路径与其他相同的结果路径才具有自然等价性。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (7)

1.基于多周期演化熵技术的运动员赛前状态评价方法,其特征在于,包括以下步骤:
(1)获取运动员在某一时间段的历史比赛数据,包括不理影响运动员心理状态的数据,和影响运动员心理状态的数据,对数据属性进行划分,对各属性下的运动员状态数据进行频率化处理,得到各属性的初始频率分布;
(2)根据运动员在历史比赛数据中的比赛结果,计算该运动员赛前状态数据的熵,计算式如下:
Figure FDA0003098001080000011
其中,Ea表示运动员的某一赛前状态数据的熵,f(a)表示运动员在某运动项目时,最后比赛结果为a的频率;
根据各属性的初始频率分布,结合对运动员施加的心理状态转移矩阵,计算得到运动员在设定周期后各属性的心理影响频率分布,利用此心理影响频率分布,计算运动员在比赛运动项目的属性熵,计算式如下:
Figure FDA0003098001080000012
其中,
Figure FDA0003098001080000013
表示运动员在运动项目上的第k属性的子熵,fb(k)表示第k属性下发生第b种比赛结果的频率,其具体是指k属性下竞技所有可能结果中第b种结果所占的比例;nk表示第k属性下,运动员出现的所有结果种类的个数;
(3)根据运动员赛前状态数据的熵Ea,以及运动员在比赛运动项目的属性熵
Figure FDA0003098001080000014
计算运动员在各属性下的状态大数据综合熵,计算式如下:
Figure FDA0003098001080000015
式中,
Figure FDA0003098001080000016
表示运动员关于属性k的状态大数据综合熵,Sv表示属性k下某一类属性值出现的个数,N表示属性k包含的值的总个数;
(4)在所有属性的综合熵中,选取综合熵最大的属性k1为第一个分类层级,将运动员的历史状态数据划分为nki类,每个子类中的状态数据重新形成一个新的待分类系统。对每一个新的待分类系统按照步骤(3)中的内容,再次分别求各属性下的状态大数据综合熵,取最大的综合熵的属性k2作为第二个层级,并以此迭代类推,生成运动员的赛前数据动态决策树;
(5)根据运动员即将参赛的比赛历程的状态数据,确定状态数据的属性情况,在所述的赛前数据动态决策树中,找到与该属性情况一致的分支节点,输出比赛结果的预测分类。
2.根据权利要求1所述的基于多周期演化熵技术的运动员赛前状态评价方法,其特征在于,步骤(2)中,第k属性下发生第b种比赛结果的频率fb(k)通过心理差异频率分布求得,心理差异频率分布的表达式如下:
Figure FDA0003098001080000021
式中,F(k)n表示经过n次周期后,运动员在第k属性下值的心理差异频率分布,n≥1,[f1(k1)0 f2(k2)0 … fn(kn)0]表示初始时刻统计出的原始频率,p(k)ij为预设的的心理状态转移概率,Pn(k)为n个周期后的状态转移矩阵,[f1(k1)n f2(k2)n … fn(kn)n]为心理差异频率分布中的元素,即n个周期后在属性k1到kn下分别发生第b种比赛结果的频率。
3.根据权利要求1所述的基于多周期演化熵技术的运动员赛前状态评价方法,其特征在于,步骤(1)中,对各属性下的运动员状态数据进行频率化处理包括:
对离散状态数据的处理,按照待考察数据值占该数据属性下所有值的比例进行统计;或者,将待考察数据所在属性的值域划分为多个范围,统计待考察数据所在范围出现次数占所有范围出现次数的比例。
4.根据权利要求1所述的基于多周期演化熵技术的运动员赛前状态评价方法,其特征在于,步骤(1)中,对各属性下的运动员状态数据进行频率化处理包括:
对连续状态数据的处理,将待考察的连续数据所在属性值域划分为多个范围,统计待考察数据所在范围出现次数占所有范围出现次数的比例。
5.根据权利要求1所述的基于多周期演化熵技术的运动员赛前状态评价方法,其特征在于,步骤(1)中,对各属性下的运动员状态数据进行频率化处理包括:
对非数值型数据的处理,将待考察数据进行数值赋值,并统计其出现频率。
6.根据权利要求1-5任一项所述的基于多周期演化熵技术的运动员赛前状态评价方法,其特征在于,步骤(1)中,不理影响运动员心理状态的数据包括:身高、体重,平均心跳频率,血压,血氧,肺扩量。
7.根据权利要求1-5任一项所述的基于多周期演化熵技术的运动员赛前状态评价方法,其特征在于,步骤(1)中,影响运动员心理状态的数据包括:比赛地点气温,比赛的主客场,比赛的重要性排序,比赛中存在的强劲对手。
CN202110615902.6A 2021-06-02 2021-06-02 基于多周期演化熵技术的运动员赛前状态评价方法 Pending CN113240190A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110615902.6A CN113240190A (zh) 2021-06-02 2021-06-02 基于多周期演化熵技术的运动员赛前状态评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110615902.6A CN113240190A (zh) 2021-06-02 2021-06-02 基于多周期演化熵技术的运动员赛前状态评价方法

Publications (1)

Publication Number Publication Date
CN113240190A true CN113240190A (zh) 2021-08-10

Family

ID=77136551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110615902.6A Pending CN113240190A (zh) 2021-06-02 2021-06-02 基于多周期演化熵技术的运动员赛前状态评价方法

Country Status (1)

Country Link
CN (1) CN113240190A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015076682A1 (en) * 2013-11-21 2015-05-28 Crichq Limited System and method for assessing or predicting a match outcome in a sporting event
CN104899413A (zh) * 2015-04-14 2015-09-09 湘潭大学 基于最大熵模型的团体比赛结果预测方法
CN108905095A (zh) * 2018-08-06 2018-11-30 百度在线网络技术(北京)有限公司 运动员比赛状态评估方法和设备
CN109948896A (zh) * 2019-01-31 2019-06-28 软通智慧科技有限公司 一种比赛阵容确定方法、装置、服务器及存储介质
US20190224556A1 (en) * 2018-01-21 2019-07-25 Stats Llc Method and System for Interactive, Interpretable, and Improved Match and Player Performance Predictions in Team Sports
CN110147524A (zh) * 2019-05-10 2019-08-20 深圳市腾讯计算机系统有限公司 一种基于机器学习的比赛结果预测方法、装置及设备
CN111695680A (zh) * 2020-06-15 2020-09-22 北京百度网讯科技有限公司 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN111837123A (zh) * 2017-11-20 2020-10-27 国家美式足球联盟球员公司 评估和预测体育成绩的混合方法
US20210110476A1 (en) * 2019-08-19 2021-04-15 Joshua Farshid Ebrahim Real-Time Financial and Performance Sports Index Platform using Artificial Intelligence for Professional Athletes and Teams

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015076682A1 (en) * 2013-11-21 2015-05-28 Crichq Limited System and method for assessing or predicting a match outcome in a sporting event
CN104899413A (zh) * 2015-04-14 2015-09-09 湘潭大学 基于最大熵模型的团体比赛结果预测方法
CN111837123A (zh) * 2017-11-20 2020-10-27 国家美式足球联盟球员公司 评估和预测体育成绩的混合方法
US20190224556A1 (en) * 2018-01-21 2019-07-25 Stats Llc Method and System for Interactive, Interpretable, and Improved Match and Player Performance Predictions in Team Sports
CN108905095A (zh) * 2018-08-06 2018-11-30 百度在线网络技术(北京)有限公司 运动员比赛状态评估方法和设备
CN109948896A (zh) * 2019-01-31 2019-06-28 软通智慧科技有限公司 一种比赛阵容确定方法、装置、服务器及存储介质
CN110147524A (zh) * 2019-05-10 2019-08-20 深圳市腾讯计算机系统有限公司 一种基于机器学习的比赛结果预测方法、装置及设备
US20210110476A1 (en) * 2019-08-19 2021-04-15 Joshua Farshid Ebrahim Real-Time Financial and Performance Sports Index Platform using Artificial Intelligence for Professional Athletes and Teams
CN111695680A (zh) * 2020-06-15 2020-09-22 北京百度网讯科技有限公司 成绩预测方法、成绩预测模型训练方法、装置及电子设备

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
JIAYI LI; DONGXU LIU; JIANJUN ZHU; TAO LIU: ""Application of Approximate Entropy in Evaluation of Motion State Based on Wearable Devices"", 《 2019 18TH INTERNATIONAL SYMPOSIUM ON DISTRIBUTED COMPUTING AND APPLICATIONS FOR BUSINESS ENGINEERING AND SCIENCE (DCABES)》 *
张洪杰等: "试论赛前情绪对运动员参加比赛成绩的影响――以跆拳道项目为例", 《科技促进发展》 *
曹海涛: "体育院校体操专修学生通级赛前心理准备的探析", 《科技信息(学术研究)》 *
杨波: "柔道运动员赛前技术水平准确评估仿真", 《计算机仿真》 *
苏新勇: "不同因素对运动员赛前心理状态的影响", 《赤峰学院学报(自然科学版)》 *
郑晓等: "优秀跳水运动员赛前脑功能训练适应状态的量化分析", 《中国运动医学杂志》 *

Similar Documents

Publication Publication Date Title
Scarf et al. A numerical study of designs for sporting contests
KR101796667B1 (ko) 빅데이터 환경에서 군집 및 연관규칙에 기반한 데이터 마이닝 기법을 이용한 시계열 자료 분석 시스템 및 방법
Gu et al. Expert system for ice hockey game prediction: Data mining with human judgment
Rico-González et al. Machine learning application in soccer: a systematic review
Percy Strategy selection and outcome prediction in sport using dynamic learning for stochastic processes
Dietl et al. Momentum in tennis: Controlling the match
Schutz A mathematical model for evaluating scoring systems with specific reference to tennis
Pugsee et al. Football match result prediction using the random forest classifier
Sikka et al. Basketball win percentage prediction using ensemble-based machine learning
CN113240190A (zh) 基于多周期演化熵技术的运动员赛前状态评价方法
Olthof et al. Biomechanical loads and their effects on player performance in NCAA DI male basketball games
KR20210004168A (ko) 가중치정보를 이용한 예상경기결과 정보제공 시스템 및 그 방법
Emerson et al. Gender differences in competition: running performance in 1,500 meter tournaments
Peiris et al. Player ranking in taekwondo: A bayesian elo rating system
Marveldoss An Elo-Based Approach to Model Team Players and Predict the Outcome of Games
Ferrante et al. How long does a tennis game last?
Coleman et al. NCAA tournament games: The real nitty-gritty
Sadurska et al. Fusion of a fuzzy rule-based method and other decision-making models in injury prediction problem in football
Seidl et al. Live Counter-Factual Analysis in Women’s Tennis using Automatic Key-Moment Detection
Josman et al. Fixture difficulty and team performance models for use in the Australian Football League
Romaniuk Fitting AdaBoost Models From Imbalanced Data with Applications in College Basketball
Wen et al. Football Momentum Analysis based on Logistic Regression
Kim et al. An analysis of the effects of physical abilities on RTS game outcome using machine learning approach
Andrews Comparing Predictive Models for English Premier League Games
Vatsvåg Analysis of injury time in a football game using machine learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210810

RJ01 Rejection of invention patent application after publication