CN118105716B - 对局匹配方法、装置、设备、可读存储介质及程序产品 - Google Patents

对局匹配方法、装置、设备、可读存储介质及程序产品 Download PDF

Info

Publication number
CN118105716B
CN118105716B CN202410510810.5A CN202410510810A CN118105716B CN 118105716 B CN118105716 B CN 118105716B CN 202410510810 A CN202410510810 A CN 202410510810A CN 118105716 B CN118105716 B CN 118105716B
Authority
CN
China
Prior art keywords
match
target
historical
history
opened
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410510810.5A
Other languages
English (en)
Other versions
CN118105716A (zh
Inventor
李云飞
陶文质
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202410510810.5A priority Critical patent/CN118105716B/zh
Publication of CN118105716A publication Critical patent/CN118105716A/zh
Application granted granted Critical
Publication of CN118105716B publication Critical patent/CN118105716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/70Game security or game management aspects
    • A63F13/79Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
    • A63F13/795Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories for finding other players; for building a team; for providing a buddy list
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/60Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
    • A63F13/67Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor adaptively or by learning from player actions, e.g. skill level adjustment or by storing successful combat sequences for re-use
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种对局匹配方法、装置、设备、可读存储介质及程序产品;方法包括:基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于待开启对局的历史其他对局,确定其他对局的其他对局特征,对待开启对局的第一历史对局以及目标对局特征进行对局预测,得到第一预测结果,对待开启对局的第一历史对局以及其他对局特征进行对局预测,得到第二预测结果,基于第一预测结果与第二预测结果之间的差值,确定待开启对局。通过本申请,能够提高预测用户继续对局的准确性,并根据用户完成待开启对局后继续对局的概率为用户匹配对局。

Description

对局匹配方法、装置、设备、可读存储介质及程序产品
技术领域
本申请涉及人工智能技术,尤其涉及一种对局匹配方法、装置、设备、可读存储介质及程序产品。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
在对局匹配中,目标对象继续对局受活动、节假日等多种因素影响,通过人工智能技术对目标对象继续对局的概率进行预测尤为重要,然而,为目标对象匹配不同难度的对局会影响目标对象继续对局的概率,降低了目标对象继续对局的准确性。
发明内容
本申请实施例提供一种对局匹配方法、装置、设备、可读存储介质及程序产品,能够提高预测用户继续对局的准确性。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种对局匹配方法,所述方法包括:
基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于所述待开启对局的历史其他对局,确定其他对局的其他对局特征,其中,所述其他对局为除所述目标对局以外的对局;
对所述待开启对局的第一历史对局以及所述目标对局特征进行对局预测,得到第一预测结果,其中,所述第一预测结果表征当所述待开启对局为所述目标对局时,完成所述待开启对局之后继续下一对局的概率;
对所述待开启对局的第一历史对局以及所述其他对局特征进行对局预测,得到第二预测结果,其中,所述第二预测结果表征当所述待开启对局为所述其他对局时,完成所述待开启对局之后继续下一对局的概率;
当所述第一预测结果与所述第二预测结果之间的差值大于结果阈值时,将所述待开启对局确定为所述目标对局,当所述第一预测结果与所述第二预测结果之间的差值小于或者等于所述结果阈值时,将所述待开启对局确定为所述其他对局。
本申请实施例提供一种对局匹配装置,包括:
特征采集模块,用于基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于所述待开启对局的历史其他对局,确定其他对局的其他对局特征,其中,所述其他对局为除所述目标对局以外的对局;
对局预测模块,用于对所述待开启对局的第一历史对局以及所述目标对局特征进行对局预测,得到第一预测结果,其中,所述第一预测结果表征当所述待开启对局为所述目标对局时,完成所述待开启对局之后继续下一对局的概率;对所述待开启对局的第一历史对局以及所述其他对局特征进行对局预测,得到第二预测结果,其中,所述第二预测结果表征当所述待开启对局为所述其他对局时,完成所述待开启对局之后继续下一对局的概率;
对局匹配模块,用于当所述第一预测结果与所述第二预测结果之间的差值大于结果阈值时,将所述待开启对局确定为所述目标对局,当所述第一预测结果与所述第二预测结果之间的差值小于或者等于所述结果阈值时,将所述待开启对局确定为所述其他对局。
本申请实施例提供一种电子设备,包括:
存储器,用于存储计算机可执行指令;
处理器,用于执行所述存储器中存储的计算机可执行指令时,实现本申请实施例提供的对局匹配方法。
本申请实施例提供一种计算机可读存储介质,存储有计算机程序或计算机可执行指令,用于被处理器执行时实现本申请实施例提供的对局匹配方法。
本申请实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,实现本申请实施例提供的对局匹配方法。
本申请实施例具有以下有益效果:
基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于待开启对局的历史其他对局,确定其他对局的其他对局特征,对待开启对局的第一历史对局以及目标对局特征进行对局预测,得到第一预测结果,如此,通过同时考虑第一历史对局和目标对局,提升了预测完成目标对局之后是否继续下一对局的准确性,对待开启对局的第一历史对局以及其他对局特征进行对局预测,得到第二预测结果,如此,通过同时考虑第一历史对局和其他对局,提升了预测完成其他对局之后是否继续下一对局的准确性,当第一预测结果与第二预测结果之间的差值大于结果阈值时,将待开启对局确定为目标对局,当第一预测结果与第二预测结果之间的差值小于或者等于结果阈值时,将待开启对局确定为其他对局,如此,基于第一预测结果与第二预测结果之间的差值确定待开启对局为目标对局或其他对局,增加目标对象继续游戏的概率,提升目标对象的对局体验。
附图说明
图1是本申请实施例提供的对局匹配系统100的架构示意图;
图2是本申请实施例提供的电子设备的结构示意图;
图3A是本申请实施例提供的对局匹配方法的第一流程示意图;
图3B是本申请实施例提供的对局匹配方法的第二流程示意图;
图3C是本申请实施例提供的对局匹配方法的第三流程示意图;
图3D是本申请实施例提供的对局匹配方法的第四流程示意图;
图3E是本申请实施例提供的对局匹配方法的第五流程示意图;
图3F是本申请实施例提供的对局匹配方法的第六流程示意图;
图3G是本申请实施例提供的对局匹配方法的第七流程示意图;
图4是本申请实施例提供的游戏对局匹配原理图;
图5A是本申请实施例提供的篮球游戏对局单对单匹配模式示意图;
图5B是本申请实施例提供的篮球游戏对局多对多匹配模式示意图;
图6是本申请实施例提供的游戏对局匹配架构的结构示意图;
图7是本申请实施例提供的线上部署示意图;
图8是本申请实施例提供的模型示意图;
图9是本申请实施例提供的向量输入示意图;
图10是本申请实施例提供的结果显示示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
本申请实施例中,术语“模块”或“单元”是指有预定功能的计算机程序或计算机程序的一部分,并与其他相关部分一起工作以实现预定目标,并且可以通过使用软件、硬件(如处理电路或存储器)或其组合来全部或部分实现。同样的,一个处理器(或多个处理器或存储器)可以用来实现一个或多个模块或单元。此外,每个模块或单元都可以是包含该模块或单元功能的整体模块或单元的一部分。
本申请实施例中相关数据收集处理在实例应用时应该严格根据相关国家法律法规的要求,获取个人信息主体的知情同意或单独同意,并在法律法规及个人信息主体的授权范围内,开展后续数据使用及处理行为。
除非另有定义,本申请实施例所使用的所有的技术和科学术语与所属技术领域的技术人员通常理解的含义相同。本申请实施例中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
相关技术中,通过将连续胜利的对象和连续失败的对象匹配到同一对局中,由于对象在对局的体验受到多种因素的影响,简单匹配的方式降低了对象继续对局的准确性。
基于以上分析,申请人发现相关技术的对局匹配方法无法提高预测用户继续对局的准确性,针对上述问题,本申请实施例提供一种对局匹配方法、装置、电子设备、计算机可读存储介质和计算机程序产品,能够提高预测用户继续对局的准确性,并根据用户完成待开启对局后继续对局的概率为用户匹配对局。
参见图1,图1是本申请实施例提供的对局匹配系统100的架构示意图,为实现支撑一个对局匹配应用,终端(示例性示出了终端400)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
终端400用于将待开启对局的开启指令通过网络300发送至服务器200,服务器200用于响应于待开启对局的开启指令,基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于待开启对局的历史其他对局,确定其他对局的其他对局特征,对待开启对局的第一历史对局以及目标对局特征进行对局预测,得到第一预测结果,对待开启对局的第一历史对局以及其他对局特征进行对局预测,得到第二预测结果,当第一预测结果与第二预测结果之间的差值大于结果阈值时,将待开启对局确定为目标对局,当第一预测结果与第二预测结果之间的差值小于或者等于结果阈值时,将待开启对局确定为其他对局,将待开启对局的对局场景返回至终端400,终端400通过图形界面410显示待开启对局的对局场景。
下面说明终端400进行对局匹配的示例。
在一些实施例中,终端400可以独立完成对局匹配任务,例如,终端400用于基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于待开启对局的历史其他对局,确定其他对局的其他对局特征,对待开启对局的第一历史对局以及目标对局特征进行对局预测,得到第一预测结果,对待开启对局的第一历史对局以及其他对局特征进行对局预测,得到第二预测结果,当第一预测结果与第二预测结果之间的差值大于结果阈值时,将待开启对局确定为目标对局,当第一预测结果与第二预测结果之间的差值小于或者等于结果阈值时,将待开启对局确定为其他对局,通过图形界面410显示待开启对局的对局场景。
在一个实施场景中,服务器或者终端可以对游戏对局进行对局匹配,基于待开启游戏比赛的历史目标游戏比赛,确定目标游戏比赛的目标游戏比赛特征,并基于待开启游戏比赛的历史其他游戏比赛,确定其他游戏比赛的其他游戏比赛特征,对待开启游戏比赛的第一历史游戏比赛以及目标游戏比赛特征进行游戏比赛预测,得到第一预测结果,对待开启游戏比赛的第一历史游戏比赛以及其他游戏比赛特征进行游戏比赛预测,得到第二预测结果,当第一预测结果与第二预测结果之间的差值大于结果阈值时,将待开启游戏比赛确定为目标游戏比赛,当第一预测结果与第二预测结果之间的差值小于或者等于结果阈值时,将待开启游戏比赛确定为其他游戏比赛。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电、车载终端、飞行器等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
本申请实施例,还可以通过云技术实现,云技术(Cloud Technology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,以及搜索服务、社会网络、移动商务和开放协作等需求的推动,将来每个物品都有可能存在自己的哈希编码识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
本申请实施例可以通过人工智能技术实现,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参见图2,图2是本申请实施例提供的用于实施对局匹配方法的电子设备的结构示意图,图2所示的电子设备500可以是图1中的终端400或者服务器200,电子设备500包括:至少一个处理器510、存储器550、至少一个网络接口520。服务器200中的各个组件通过总线系统540耦合在一起。可理解,总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统540。
处理器510可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,DigitalSignalProcessor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口530包括使得能够呈现媒体内容的一个或多个输出装置531,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口530还包括一个或多个输入装置532,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件;
在一些实施例中,当实施例由终端400独立完成对局匹配任务时,本申请实施例提供的服务器200不包括用户接口530。
存储器550可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。
存储器550包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类型的存储器。
在一些实施例中,存储器550能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统551,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块552,用于经由一个或多个(有线或无线)网络接口520到达其他计算设备,示例性的网络接口520包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal SerialBus)等;
呈现模块553,用于经由一个或多个与用户接口530相关联的输出装置531(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
在一些实施例中,当由终端400独立完成对局匹配任务时,本申请实施例提供的服务器200可以不包括呈现模块553;
输入处理模块554,用于对一个或多个来自一个或多个输入装置532之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动;在一些实施例中,当实施例由终端400独立完成对局匹配任务时,本申请实施例提供的服务器200可以不包括呈现模块553。
在一些实施例中,本申请实施例提供的装置可以采用软件方式实现,图2示出了存储在存储器550中的对局匹配装置555,其可以是程序和插件等形式的软件,包括以下软件模块:特征采集模块5551、对局预测模块5552、对局匹配模块5553以及模型训练模块5554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的装置可以采用硬件方式实现,作为示例,本申请实施例提供的装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的对局匹配方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(Application Specific Integrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、可编程逻辑器件(Programmable Logic Device,PLD)、复杂可编程逻辑器件(Complex Programmable Logic Device,CPLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或其他电子元件。
需要说明的是,下文中的对局匹配的示例中,本领域技术人员根据对下文的理解,可以将本申请实施例提供的对局匹配方法应用于游戏对局匹配的处理。
参见图3A,图3A是本申请实施例提供的对局匹配方法的第一流程示意图,将结合图3A示出的步骤进行说明,本申请实施例提供的对局匹配方法可以由服务器或终端单独实施,或者由服务器及终端协同实施,下面将以服务器和终端进行协同实施为例进行说明。
在步骤101中,基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于待开启对局的历史其他对局,确定其他对局的其他对局特征。
其中,其他对局为除目标对局以外的对局。
这里,待开启对局是当前尚未进行的需要开启的对局,也即完成当前对局之后尚未进行的当前对局的下一对局,待开启对局的历史目标对局是待开启对局之前的历史对局为目标对局的对局,待开启对局的历史其他对局是待开启对局之前的历史对局为其他对局的对局,目标对局为特定形式的对局,例如在游戏中,目标对局是指一种特殊的游戏对局,目标对局的具体形式因游戏而异,但通常包括以下几种形式:目标对局会提供一些特殊的游戏内物品,如皮肤、头像、背景等;目标对局会提供一些特殊的折扣或优惠,如获取游戏内物品时享受折扣、免费试用游戏等;目标对局会提供一些特殊的角色或英雄,这些角色或英雄通常具有独特的外观、技能或属性;目标对局提供一定的免费游戏时间,如一段时间内可以免费玩游戏,或者可以在特定的时间窗口内获得一些特定的游戏模式或等级的免费体验机会;目标对局会降低对局难度,也即目标对局是对局难度小于难度阈值的对局,如在游戏开启前为目标对象匹配机器人作为对手,从而降低目标对象的对局难度。
需要说明的是,从目标对局中提取的目标对局特征与从其他对局中提取的其他对局特征具有相同的属性,其中,本申请实施例对属性(即对局特征)的具体设定不做限制,属性可以是组队状态、险胜状态、碾压状态、绝杀状态、逆转状态等。
在一些实施例中,本申请实施例对组队状态、险胜状态、碾压状态、绝杀状态、逆转状态的设定不做限制,当对局的目标阵营的对象数量大于数量阈值时,组队状态可以是已组队;当对局的目标阵营的目标得分与其他阵营的其他得分的差值小于第一得分阈值时,险胜状态可以是险胜;当对局的目标阵营的目标得分与其他阵营的其他得分的差值大于第二得分阈值时,碾压状态可以是碾压;当对局的目标阵营在第一时间点的目标得分小于其他阵营的其他得分、并且对局的目标阵营在对局结束时的目标得分大于或者等于其他阵营的其他得分时,绝杀状态可以是绝杀;当对局的目标阵营在第二时间点的目标得分与其他阵营的其他得分的差值小于差值阈值、对局的目标阵营在第二时间点的目标得分小于其他阵营的其他得分、并且对局的目标阵营在对局结束时的目标得分大于或者等于其他阵营的其他得分时,逆转状态为逆转。
示例的,目标对象为A,对局的目标阵营中对象包括[A,B,C,D],当对局的目标阵营的对象数量(如4)大于数量阈值(如1)时,组队状态是已组队,组队人员为[B,C,D];当对局的目标阵营的目标得分(如20)与其他阵营的其他得分(如18)的差值(如2)小于第一得分阈值(如5)时,险胜状态是险胜;当对局的目标阵营的目标得分(如20)与其他阵营的其他得分(如2)的差值(如18)大于第二得分阈值(如6)时,碾压状态是碾压;当对局的目标阵营在第一时间点(如0600,其中,0600表示时间点是6小时0分钟)的目标得分(如20)小于其他阵营的其他得分(如24)、并且对局的目标阵营在对局结束时的目标得分(如30)大于或者等于其他阵营的其他得分(如26)时,绝杀状态可以是绝杀,其中,对局结束时间(如0620,其中,0620表示时间点是6小时20分钟)与第一时间点的差值(如0020)小于时间阈值(如0030);当对局的目标阵营在第二时间点(如0600)的目标得分(如20)与其他阵营的其他得分(如50)的差值(如-30)小于差值阈值(如-20)、对局的目标阵营在第二时间点的目标得分小于其他阵营的其他得分、并且对局的目标阵营在对局结束时的目标得分(如60)大于或者等于其他阵营的其他得分(如55)时,逆转状态为逆转,其中,第二时间点是开启对局时间与对局结束时间中任一时间。
在一些实施例中,参见图3B,图3B是本申请实施例提供的对局匹配方法的第二流程示意图,在步骤101之前,执行图3B的步骤201至步骤202,下面具体说明。
在步骤201中,对待开启对局的历史对局进行区间划分,得到多个历史对局区间。
其中,每个历史对局区间包括至少一个历史对局。
需要说明的是,每个历史对局区间可以是均匀划分,也可以是非均匀划分。
在一些实施例中,基于数量阈值对待开启对局的历史对局进行区间划分,得到至少一个历史对局区间,其中,历史对局区间包含至少一个待开启对局的历史对局。
示例的,历史对局区间可以进行均匀划分,还可以进行非均匀划分,通过不同的划分方式,将历史对局划分至不同的历史对局区间,历史对局的时间戳越低,对应的历史对局区间的时间戳越小,历史对局的时间戳越高,对应的历史对局区间的时间戳越大。
示例的,对历史对局区间进行均匀划分,当数量阈值为2,历史对局集合包含4个历史对局时,将历史对局划分为包括历史对局[1,2]的第一区间、包括历史对局[3,4]的第二区间,或者,对历史对局区间进行不均匀划分,当数量阈值为2,历史对局集合包含4个历史对局时,将历史对局划分为包括历史对局[1]的第一区间、包括历史对局[2,3,4]的第二区间,根据历史对局的时间戳从低到高进行排序,分别得到第一历史对局以及第二历史对局。
在一些实施例中,基于时间阈值对待开启对局的历史对局进行区间划分,得到至少一个历史对局区间,其中,历史对局区间中的相邻两个历史对局的间隔时间小于时间阈值,相邻两个历史对局的间隔时间为开启历史对局时的时间戳与完成历史对局的上一对局时的时间戳的差值。
承接上述实施例,基于时间阈值(如0100,0100表示时间间隔是1小时)对待开启对局的历史对局进行区间划分,得到至少一个历史对局区间,
当相邻两个历史对局的间隔时间小于时间阈值时,将相邻两个历史对局确定为同一个历史对局区间的历史对局,当相邻两个历史对局的间隔时间大于或者等于时间阈值时,将相邻两个历史对局确定为不同历史对局区间中历史对局。
示例的,完成历史对局A时的时间戳为0600,其中,0600表示完成历史对局A时的时间点时6小时,若进行历史对局B时的时间戳为0650,历史对局A与历史对局B的时间间隔为0050,其中,0050表示时间间隔为50分钟,由于相邻两个历史对局的间隔时间(如50分钟)小于时间阈值(如60分钟),将相邻两个历史对局确定为同一个历史对局区间的历史对局,得到历史对局区间[A,B],若进行历史对局B时的时间戳为0710,历史对局A与历史对局B的时间间隔为0110,其中0110表示时间间隔为70分钟,由于相邻两个历史对局的间隔时间(如70分钟)小于时间阈值(如60分钟),将相邻两个历史对局确定为不同历史对局区间的历史对局,得到第一历史对局区间[A]和第二历史对局区间[B]。
在步骤202中,当历史对局区间中的最后一个历史对局为其他对局时,将历史对局区间中的最后一个历史对局确定为待开启对局的历史其他对局。
这里,历史其他对局是每个历史对局区间的最后一个历史对局。
在一些实施例中,参见图3C,图3C是本申请实施例提供的对局匹配方法的第三流程示意图,针对图3A示出的步骤101,可以通过图3C的步骤1011至步骤1013实现,下面具体说明。
在步骤1011中,获取历史目标对局的第二历史对局。
其中,第二历史对局是历史目标对局之前的其他对局。
在一些实施例中,基于历史目标对局对历史对局进行区间划分,得到至少一个历史目标对局区间,其中,每个历史目标对局作为每个历史目标对局区间的最后一个历史对局,每个历史目标对局区间的其他对局即为历史目标对局的第二历史对局。
示例的,历史对局包括[A,B,C,D,E,F,G,H,I],历史目标对局包括D、G,基于历史目标对局对历史对局进行区间划分,得到第一历史目标对局区间(如[A,B,C,D])以及第二历史目标对局区间(如[E,F,G]),其中,对局D为第一历史目标对局区间的最后一个历史对局,第一历史目标对局的第二历史对局为[A,B,C],对局G为第二历史目标对局区间的最后一个历史对局,第二历史目标对局的第二历史对局为[E,F]。
在步骤1012中,对第二历史对局与第一历史对局之间的相似性进行归一化处理,得到历史目标对局的权重。
需要说明的是,一个第二历史对局对应一个历史目标对局的权重。
在步骤1012之前,针对每个第二历史对局进行以下处理,从第二历史对局中提取出第二历史对局特征;从待开启对局的第一历史对局中提取出第一历史对局特征;将第一历史对局特征与第二历史对局特征的相似性确定为第二历史对局与第一历史对局之间的相似性。
承接上述实施例,第二历史对局包括连续时间内的对局信息,其中,对局信息包括目标对象的组队每个时间点目标对象的得分、目标对象以及除目标对象外的其他对象的位置、以及目标对象在进行第二历史对局时每个时间点的触发操作,基于第二历史对局的对局信息计算第二历史对局特征(如组队状态为已组队、险胜状态为非险胜、碾压状态为碾压、绝杀状态为绝杀、逆转状态为非逆转),基于第二历史对局的对局信息计算第二历史对局特征(如组队状态为已组队、险胜状态为险胜、碾压状态为非碾压、绝杀状态为绝杀、逆转状态为非逆转),将第一历史对局特征与第二历史对局特征的相似性确定为第二历史对局与第一历史对局之间的相似性,其中,本申请实施例对第一历史对局特征与第二历史对局特征的相似性不做限制,相似性可以是余弦相似性或者杰卡德相似性。
在步骤1013中,从历史目标对局中提取历史目标对局特征,并基于历史目标对局的权重以及历史目标对局特征,确定目标对局的目标对局特征。
这里,历史目标对局特征包括历史目标对局的局内系统反馈体验特征和局内用户反馈体验特征,其中,局内系统反馈体验特征包括险胜、碾压或者反超,局内用户反馈体验特征包括投降或者强退。
在一些实施例中,在步骤1013之前,获取待开启对局对应的目标对象,并从对象集合中,获取与目标对象的相似性大于相似性阈值的候选对象,其中,对象集合包括多个对象;从候选对象的历史目标对局中提取候选历史目标对局特征,并确定候选对象的历史目标对局的权重。
承接上述实施例,获取目标对象的目标对象特征以及对象集合中每个对象的对象特征,将对象特征与目标对象特征之间的相似性大于相似性阈值的对象确定为候选对象。
示例的,获取目标对象A的目标对象特征AT,对象B的对象特征BT、以及对象C的对象特征CT,分别计算BT和AT之间的相似性(如0.85)、以及CT和AT之间的相似性(如0.35),当对象特征与目标对象特征之间的相似性如0.85)大于相似性阈值如0.75)时,将对象B确定为候选对象。
承接上述实施例,确定候选对象的历史目标对局以及候选对象的历史目标对局的第三历史对局,对第三历史对局与第一历史对局之间的相似性进行归一化处理,得到候选对象的历史目标对局的权重。
在一些实施例,基于待开启对局的历史目标对局的权重,对待开启对局的历史目标对局特征进行加权处理,得到目标对局的第一对局特征;基于候选对象的历史目标对局的权重,对候选对象的历史目标对局特征进行加权处理,得到目标对局的第二对局特征;融合第一对局特征以及第二对局特征,得到目标对局的目标对局特征。
示例的,待开启对局的历史目标对局分别包括对局A以及对局B,当对局A和对局B的权重不相同时,以对局A和对局B的权重分别为0.4和0.6为例,对局A的历史目标对局特征为[1,1,0,1,0],其中,对局特征数组的第一个数值(如1)表征组队状态为已组队,对局特征数组的第二个数值(如1)表征险胜状态为险胜,对局特征数组的第三个数值(如0)表征碾压状态为非碾压,对局特征数组的第四个数值(如1)表征绝杀状态为绝杀,对局特征数组的第五个数值(如0)表征状态为非逆转,对局B的历史目标对局特征为[1,0,1,1,1],对待开启对局的历史目标对局特征进行加权处理,得到目标对局的第一对局特征为[1,0.4,0.6,1,0.6],当对局A和对局B的权重相同时,以对局A和对局B的权重均为0.5为例,对待开启对局的历史目标对局特征进行加权处理,得到目标对局的第一对局特征为[1,0.5,0.5,1,0.5]。
承接上述示例,候选对象的历史目标对局分别包括对局C以及对局D,当对局C和对局D的权重不相同时,以对局C和对局D的权重分别为0.4和0.6为例,对局C的历史目标对局特征为[1,1,1,1,0],对候选对象的历史目标对局特征进行加权处理,得到目标对局的第二对局特征为[1,0.4,1,1,0.6],当对局C和对局D的权重相同时,以对局C和对局D的权重均为0.5为例,对候选对象的历史目标对局特征进行加权处理,得到目标对局的第二对局特征为[1,0.5,1,1,0.5]。
承接上述实施例,以目标对局的第一对局特征(如[1,0.5,0.5,1,0.5])以及目标对局的第二对局特征(如[1,0.5,1,1,0.5])为例,融合第一对局特征以及第二对局特征,当第一对局特征以及第二对局特征权重相同时,也即第一对局特征以及第二对局特征的权重均为0.5时,得到目标对局的目标对局特征(如[1,0.5,0.75,1,0.5]),当第一对局特征以及第二对局特征权重不相同时,第一对局特征的权重为0.4,第二对局特征的权重为0.6,得到目标对局的目标对局特征(如[1,0.5,0.8,1,0.5])。
通过本申请实施例,分别确定目标对局与其他对局的特征,以便于基于目标对局与其他对局分别预测目标对象在完成待开启对局后进行下一对局的概率,从而提高预测目标对象继续对局的准确性。
继续参见图3A,在步骤102中,对待开启对局的第一历史对局以及目标对局特征进行对局预测,得到第一预测结果。
其中,第一预测结果表征当待开启对局为目标对局时,完成待开启对局之后继续下一对局的概率。
在一些实施例中,参见图3D,图3D是本申请实施例提供的对局匹配方法的第四流程示意图,针对图3A示出的步骤102,可以通过图3D的步骤1021至步骤1025实现,下面具体说明。
在步骤1021中,从第一历史对局中提取第一历史对局特征。
在一些实施例中,第一历史对局包括连续时间内的对局信息,基于第一历史对局的对局信息计算第一历史对局特征(如组队状态为已组队、险胜状态为非险胜、碾压状态为碾压、绝杀状态为绝杀、逆转状态为非逆转)。
在步骤1022中,基于第一历史对局特征以及目标对局特征,确定第一时序特征。
这里,第一时序特征是由第一历史对局特征以及目标对局特征进行加权或者拼接得到的。
在一些实施例中,通过以下方式之一确定第一时序特征:拼接第一历史对局特征以及目标对局特征,得到第一时序特征;对第一历史对局特征以及目标对局特征加权,得到第一时序特征;获取待开启对局对应的目标对象特征,并拼接第一历史对局特征、目标对局特征以及目标对象特征,得到第一时序特征。
这里,对象特征包括对象等级、对象资金以及对象胜率等。
示例的,第一历史对局特征为[1,1,0,1,0],其中,对局特征数组的第一个数值(如1)表征组队状态为已组队,对局特征数组的第二个数值(如1)表征险胜状态为险胜,对局特征数组的第三个数值(如0)表征碾压状态为非碾压,对局特征数组的第四个数值(如1)表征绝杀状态为绝杀,对局特征数组的第五个数值(如0)表征状态为非逆转,目标对局特征为[1,0,1,1,0],拼接第一历史对局特征以及目标对局特征,得到第一时序特征(如[[1,1,0,1,0],[1,0,1,1,0]])。
承接上述示例,第一历史对局特征为[1,1,0,1,0],目标对局特征为[1,0,1,1,0],对第一历史对局特征以及目标对局特征加权,当第一历史对局特征与目标对局特征的权重相同时,也即第一历史对局特征与目标对局特征的权重均为0.5,得到第一时序特征(如[1,0.5,0.5,1,0.5]),当第一历史对局特征与目标对局特征的权重不相同时,第一历史对局特征的权重为0.7,目标对局特征的权重为0.3,得到第一时序特征(如[1,0.7,0.3,1,0.3])。
承接上述示例,第一历史对局特征为[1,1,0,1,0],目标对局特征为[1,0,1,1,0],获取待开启对局对应的目标对象特征(如[3,1000,0.70]),其中,对象特征数组的第一个数值(如3)用于表征目标对象的对象等级为3级,对象等级用于表征对象的对局能力,对象特征数组的第二个数值(如1000)用于表征目标对象的对象资金为1000,对象资金用于购买对局中的虚拟道具,对象资金可根据对局的对局特征得到,对象特征数组的第三个数值(如0.7)用于表征目标对象在历史对局的胜率为0.7,即每100场对局有70场对局获得胜利,每当完成一场对局,对对象胜率进行更新,拼接第一历史对局特征、目标对局特征以及目标对象特征,得到第一时序特征(如[[1,1,0,1,0],[1,0,1,1,0],[3,1000,0.70]])。
在步骤1023中,调用第一时序模型。
其中,第一时序模型包括第一编码器以及第一回归器。
这里,第一时序模型用于针对历史对局的特征预测在完成目标对局后继续下一对局的概率,第一时序模型由第一编码器以及第一回归器组成,第一编码器将输入的时序样本特征转换为能够表达目标对象在完成目标对局后进行下一对局的意愿的时序样本编码特征,第一回归器接收第一编码器输出的结果作为输入,输出对应的预测结果,预测结果用于表征目标对象在完成目标对局后进行下一对局的概率。
在一些实施例中,参见图3E,图3E是本申请实施例提供的对局匹配方法的第五流程示意图,在图3D示出的步骤1023之前,执行图3E的步骤301至步骤305,下面具体说明。
在步骤301中,基于历史目标对局构建第一时序样本以及第一时序样本的样本标签。
这里,第一时序样本为包括至少一个历史对局的历史对局集合,其中,历史对局集合的最后一个对局是目标对局,第一时序样本的样本标签是完成目标对局之后是否进行下一对局,第一时序样本的样本标签是由目标对局的时间戳与开启下一对局的时间戳确定的。
在一些实施例中,将历史目标对局的第二历史对局与历史目标对局进行拼接,得到第一时序样本;确定完成历史目标对局时的第一时间戳以及开启历史目标对局的下一对局时的第二时间戳;当第二时间戳与第一时间戳的差值大于时间阈值时,将第一时序样本的样本标签确定为第一预设标签,当第二时间戳与第一时间戳的差值小于或者等于时间阈值时,将第一时序样本的样本标签确定为第二预设标签。
这里,第二历史对局是进行历史目标对局之前完成的其他对局。
示例的,历史目标对局(如D)的第二历史对局(如[A,B,C])与历史目标对局进行拼接,得到第一时序样本(如[A,B,C,D]),其中,完成历史目标对局时的第一时间戳为0600,其中,0600表示完成历史目标对局时的时间点是6小时0分钟,开启历史目标对局的下一对局时的第二时间戳为0650,若时间阈值为30,当第二时间戳与第一时间戳的差值(如50)大于时间阈值(如30)时,将第一时序样本的样本标签确定为0,0表示在完成历史目标对局之后不在进行下一对局,若时间阈值为60,当第二时间戳与第一时间戳的差值(如50)小于或者等于时间阈值(如60)时,将第一时序样本的样本标签确定为1,1表示在完成历史目标对局之后继续进行下一对局。
在步骤302中,从第一时序样本中提取第一时序样本特征。
在一些实施例中,第一历史对局包括连续时间内的对局信息,基于第一历史对局的对局信息计算第一历史对局特征(如组队状态为已组队、险胜状态为非险胜、碾压状态为碾压、绝杀状态为绝杀、逆转状态为非逆转)。
在步骤303中,通过初始时序模型的编码器,对第一时序样本特征进行编码处理,得到时序编码特征样本。
在一些实施例中,初始时序模型的编码器包括多层的神经网络,第一层的神经网络的输入为第一时序样本特征,除第一层外的每一层神经网络的输入是上一层神经网络的输出,通过第一层神经网络对第一时序特征样本进行编码特征提取,将提取的编码特征进行归一化,得到第一层神经网络对应的第一时序样本编码特征,通过第二层神经网络对第一层神经网络对应的第一时序编码特征样本进行编码特征提取,进行多次迭代,将最后一层神经网路提取的第一时序编码特征样本确定为时序编码特征样本。
在步骤304中,通过初始时序模型的回归器,对时序编码特征样本进行回归处理,得到样本预测结果。
需要说明的是,初始时序模型的回归器包括多层的神经网络,第一层的神经网络的输入为时序编码特征样本,除第一层外的每一层神经网络的输入是上一层神经网络的输出,将最后一层神经网络得到的输出映射为大于或者等于0并且小于或者等于1的实数,也即样本预测结果。
在步骤305中,基于样本预测结果与样本标签,对初始时序模型的参数进行更新,将更新后的初始时序模型的参数确定为第一时序模型的参数。
在一些实施例中,基于样本预测结果与样本标签构建损失,基于损失在初始时序模型中进行反向传播处理,以得到参数梯度,反向传播通过导数链式法则计算损失对初始时序模型的参数的梯度,得到参数梯度,并基于参数梯度更新参数,将更新后的初始时序模型的参数确定为第一时序模型的参数,其中,本申请实施例对损失的构建方式不做限制,损失可以是基于样本预测结果与样本标签的差值构建的平均绝对误差损失、或者基于样本预测结果与样本标签的差值的平方构建的平均平方误差损失。
在步骤1024中,通过第一编码器对第一时序特征进行编码处理,得到第一时序编码特征。
在一些实施例中,第一编码器包括多层的神经网络,第一层的神经网络的输入为第一时序特征,除第一层外的每一层神经网络的输入是上一层神经网络的输出,通过第一层神经网络对第一时序特征进行编码特征提取,将提取的编码特征进行归一化,得到第一层神经网络对应的第一时序编码特征,通过第二层神经网络对第一层神经网络对应的第一时序编码特征进行编码特征提取,进行多次迭代,得到最后一层神经网路提取的第一时序编码特征。
在步骤1025中,通过第一回归器对第一时序编码特征进行回归处理,得到第一预测结果。
需要说明的是,第一回归器包括多层的神经网络,第一层的神经网络的输入为第一时序编码特征,除第一层外的每一层神经网络的输入是上一层神经网络的输出,将最后一层神经网络得到的输出映射为大于或者等于0并且小于或者等于1的实数,也即第一预测结果。
通过本申请实施例,同时考虑到第一历史对局与目标对局对于预测下一对局的影响,对第一历史对局特征与目标对局特征进行对局预测,提高了对局预测的准确性,并得到了当待开启对局为目标对局时,目标对象进行下一对局的概率。
继续参见图3A,在步骤103中,对待开启对局的第一历史对局以及其他对局特征进行对局预测,得到第二预测结果。
其中,第二预测结果表征当待开启对局为其他对局时,完成待开启对局之后继续下一对局的概率。
在一些实施例中,参见图3F,图3F是本申请实施例提供的对局匹配方法的第六流程示意图,针对图3A示出的步骤103,可以通过图3F的步骤1031至步骤1035实现,下面具体说明。
在步骤1031中,从第一历史对局中提取第一历史对局特征。
在一些实施例中,第一历史对局包括连续时间内的对局信息,基于第一历史对局的对局信息计算第一历史对局特征(如组队状态为已组队、险胜状态为非险胜、碾压状态为碾压、绝杀状态为绝杀、逆转状态为非逆转)。
在步骤1032中,基于第一历史对局特征以及其他对局特征,得到第二时序特征。
这里,第二时序特征是由第一历史对局特征以及其他对局特征进行加权或者拼接得到的。
在步骤1033中,调用第二时序模型。
其中,第二时序模型包括第二编码器以及第二回归器。
这里,第二时序模型用于针对历史对局的特征预测在完成其他对局后继续下一对局的概率,第二时序模型由第二编码器以及第二回归器组成,第二编码器将输入的时序样本特征转换为能够表达目标对象在完成其他对局后进行下一对局的意愿的时序样本编码特征,第二回归器接收第二编码器输出的结果作为输入,输出对应的预测结果,预测结果用于表征目标对象在完成其他对局后进行下一对局的概率。
在步骤1034中,通过第二编码器对第二时序特征进行编码处理,得到第二时序编码特征。
在一些实施例中,第二编码器包括多层的神经网络,第一层的神经网络的输入为第二时序特征,除第一层外的每一层神经网络的输入是上一层神经网络的输出,通过第一层神经网络对第二时序特征进行编码特征提取,将提取的编码特征进行归一化,得到第一层神经网络对应的第二时序编码特征,通过第二层神经网络对第一层神经网络对应的第二时序编码特征进行编码特征提取,进行多次迭代,得到最后一层神经网路提取的第二时序编码特征。
在步骤1035中,通过第二回归器对第二时序编码特征进行回归处理,得到第二预测结果。
需要说明的是,第二回归器包括多层的神经网络,第一层的神经网络的输入为第二时序编码特征,除第一层外的每一层神经网络的输入是上一层神经网络的输出,将最后一层神经网络得到的输出映射为大于或者等于0并且小于或者等于1的实数,也即第二预测结果。
通过本申请实施例,同时考虑到第一历史对局与其他对局对于预测下一对局的影响,对第一历史对局特征与其他对局特征进行对局预测,提高了对局预测的准确性,并得到了当待开启对局为其他对局时,目标对象进行下一对局的概率。
继续参见图3A,在步骤104中,当第一预测结果与第二预测结果之间的差值大于结果阈值时,将待开启对局确定为目标对局,当第一预测结果与第二预测结果之间的差值小于或者等于结果阈值时,将待开启对局确定为其他对局。
示例的,当第一预测结果(如0.85)与第二预测结果(如0.35)之间的差值(如0.5)大于结果阈值(如0.2)时,将待开启对局确定为目标对局,当第一预测结果(如0.85)与第二预测结果(如0.75)之间的差值(如0.1)小于或者等于结果阈值(如0.2)时,将待开启对局确定为其他对局。
在一些实施例中,参见图3G,图3G是本申请实施例提供的对局匹配方法的第七流程示意图,在图3A示出的步骤104之后,执行图3G的步骤401至步骤403,下面具体说明。
在步骤401中,将待开启对局的历史对局数量确定为第一历史对局数量。
这里,待开启对局的历史对局数量是进行待开启对局之前的历史对局的数量。
在步骤402中,将历史目标对局的历史对局数量确定为第二历史对局数量。
这里,历史目标对局的历史对局数量是进行历史目标对局之前的历史对局的数量。
在步骤403中,当第一历史对局数量与第二历史对局数量的差值小于数量间隔阈值时,将待开启对局由目标对局切换至其他对局。
示例的,以一个历史目标对局为例,第一历史对局数量(如20)与第二历史对局数量(如18)的差值(如2)小于数量间隔阈值(如5)时,将待开启对局由目标对局切换至其他对局,以两个历史目标对局为例,第一历史对局数量为20,历史目标对局A的与第二历史对局数量为18,历史目标对局B的与第二历史对局数量为5,第一历史对局数量与第二历史对局数量A的差值为2,第一历史对局数量与第二历史对局数量B的差值为15,由于存在差值(如2)小于数量间隔阈值(如5),将待开启对局由目标对局切换至其他对局。
通过本申请实施例,根据用户完成待开启对局后继续对局的概率为用户匹配对局。
下面,将说明本申请实施例提供的对局匹配方法在一个实际的应用场景中的示例性应用。
在对局匹配中,目前一般通过将连续胜利的对象和连续失败的对象匹配到同一对局中,由于对象在对局的体验受到多种因素的影响,简单匹配的方式降低了对象继续对局的准确性。
因此,在本申请实施例中,采用长短期记忆网络(Long Short Term Memory,LSTM)算法,保证了前序比赛(即第一历史对局)时序性,也可将单局体验特征(即对局特征)作为向量输入进去,单局体验和胜负同样重要,由于福利局(即目标对局)的难度可控,且相对比较恒定,所以在LSTM输入特征的构造过程中,第n+1局(即待开启对局)模拟了进行福利局的一些特征(即目标对局特征),作为反事实推断的结果。有一个正常预测用户下一把进行比赛概率的模型(即第二时序模型)和反事实的模型(即第一时序模型),两个模型预测差值(即第一预测结果与第二预测结果之间的差值)即为下一把是福利局所带来的增益,当增益达到一定阈值(即结果阈值)会进行福利局的触发(即将待开启对局确定为目标对局),从而解决了游戏对局匹配中单局体验和对象特征相结合判断流失,需要考虑到前序比赛顺序的问题,同时,采用反事实推断的方法论证假设没有福利局对用户留存(即完成待开启对局之后继续下一对局)的影响,两者的差值作为福利局的增量效果。
以游戏对局匹配为例,参见图4,图4是本申请实施例提供的游戏对局匹配原理图。
在图4中,图4中包含本申请实施例用于进行对局匹配的多个比赛(即对局),并为第n+1场比赛分别加入正常对局和福利局,得到正常对局模拟对局特征(即其他对局特征)以及福利局模拟对局特征(即目标对局特征),参见图5A和图5B,图5A是本申请实施例提供的篮球游戏对局单对单匹配模式示意图,图5B是本申请实施例提供的篮球游戏对局多对多匹配模式示意图,在匹配中加入福利局,包含所有的匹配模式,由于模型的不确定性,通过以下方式增加模型的确定性:福利局的触发具有冷却时间,为了避免福利局的一直触发,对福利局的触发设置冷却时间,或者,为福利局设置N场触发一次的条件。
当多对多的比赛触发福利局时,通过以下方式增强用户体验:一是把队友设置成对局能力大于能力阈值的机器人,二是当用户(即目标对象)组队匹配时,同阵营的用户被触发了福利局,需要和队友一起进入下一把的福利局比赛。
参见图6,图6是本申请实施例提供的游戏对局匹配架构的结构示意图,如图6所示,本申请实施例提供的技术方案包括对经过深度学习框架训练以及模型测试的深度学习框架进行封装,得到封装接口,并通过后台匹配服务调用深度学习框架,并将深度学习框架的使用情况发送至数据仓库离线日志数据,从数据仓库离线日志数据中获取表数据并发送至平台,本申请实施例提供的技术方案对硬件和网络条件没有显著限制,其中,深度学习框架可以是第二代人工智能学习系统,采用数据流图(Data Flow Graphs),并用于数值计算的开源软件库。
参见图7,图7是本申请实施例提供的线上部署示意图,在图7中显示每个模型的名称、编号、开发方式、所属项目、所属服务以及接口状态,其中,每个模型的名称、编号均不相同,每个模型的开发方式为模型开发,每个模型的所属项目为对局匹配服务机器学习项目,每个模型的所属服务用于表征每个模型的用途,模型的接口状态包括模拟上线、未上线以及上线,每个模型是深度学习方法训练得到的,通过调用图7中的多个模型,预测用户继续进行下一对局的概率,其中,多个模型包括模式1匹配福利局模型(即单对单的匹配模式下的第一时序模型)以及模式2匹配福利局模型(即多对多的匹配模式下的第一时序模型)。
继续参见图4,本申请实施例采用LSTM模型,参见图8,图8是本申请实施例提供的模型示意图,其中,通过LSTM模型对第一场比赛特征进行特征提取,得到输出结果,通过LSTM模型对第一场比赛特征和初始化参数0进行特征提取,得到输出结果,通过LSTM模型对第二场比赛特征和第一场比赛的输出结果进行特征提取,得到输出结果,依次类推,得到最后的输出结果,以4场比赛为例。当LSTM模型用于预测模拟福利局时继续对局的概率,则表示模拟福利局的福利局特征,表示在进行模拟福利局之前的近三场比赛的特征,通过对最终输出的结果进行回归预测,得到继续下一比赛的概率,如公式(1)所示。
(1)
其中,Y是继续下一比赛的概率,用于将数值映射到0-1的实数,V表示LSTM模型的权重,c表示LSTM模型的偏置,本申请实施例对特征提取方式不做限定,特征提取方式可以是通过双极性(tanh)层对输入特征和上一场比赛的输出结果进行线性处理、或者引入遗忘门对对输入特征或者上一场比赛的输出结果进行遗忘处理。
继续参见图4,将前序比赛的特征(即待开启对局的第一历史对局)作为向量进行输入,向量包含了前序比赛中所有的特征包括局内体验系统反馈(险胜/碾压/反超等)或者局内体验用户反馈(投降/强退等),每场比赛特征都不同。再加上对象特征,一般短时间每场比赛是相同的,对象特征可以是用户的段位以及胜率等。这些特征是第二时序模型(model2)的LSTM网络的输入,给定第一时序模型(model1),以便与第二时序模型进行反事实推断,model2的前n局的特征和model1都一样,第n+1局基于之前的正常比赛(即历史其他对局)和之前的福利局比赛(即历史目标对局)模拟了此场比赛的特征。
通过以下方法模拟第n+1局比赛为福利局比赛时的特征:获取用户历史对战中所有福利局的比赛,分别获得每个历史福利局的前n局正常比赛的历史正常比赛集合,将历史正常比赛集合与第n+1局的前n局的正常比赛集合进行相似度归一化,得到每个历史福利局的权重,并根据每个历史福利局的权重与每个历史福利局的特征的乘积,确定n+1局模拟用户进行福利局的特征。
通过以下方法模拟第n+1局比赛为正常比赛时的特征:获取用户历史对战中所有正常比赛的比赛,按照预设数量对正常比赛进行分段,例如每10个正常比赛作为一个正常比赛集合,按照预设的比例从每个正常比赛集合中筛选不定数量的正常比赛,将每个正常比赛集合中的除最后一个历史正常比赛之外的每个正常比赛,与第n+1局的前n局的正常比赛集合进行相似度归一化,得到每个历史正常比赛的权重,并根据每个历史正常比赛的权重与每个历史正常比赛的特征的乘积,确定n+1局模拟用户进行正常比赛的特征。
作为反事实推断,两个模型预测第n+2局比赛是否继续的结果p1(即第一预测结果)和p2(即第二预测结果)的差值即是第n+1场比赛插入福利局的收益。
参见图9,图9是本申请实施例提供的向量输入示意图,如图9所示,本申请实施例的数据输入是每次比赛序列的向量集合,比赛序列为近10场比赛,比赛序列的规则是,比赛前后间隔一小时内的比赛,如果超过1小时就算做另一个序列,序列内如果不足10场,用-1补齐,如图9中实例所示,当序列为三场时,将其余七场比赛的向量用-1填充,其中,每个向量的数值表示比赛的一个特征,然后,对输入的向量集合进行处理,得到对应的预测结果(如0.367551267)。
通过以下方式得到对应的预测结果:LSTM模型采用二分类损失函数,并用激活函数进行激活,公式如下:
(2)
其中,Loss是LSTM模型输入的预测结果,表示输入比赛特征的数量,为是否进行下一场比赛的真实标签,为是否进行下一场比赛的预测结果。
参见图10,图10是本申请实施例提供的结果显示示意图,如图10所示,采用的是多输入单输出的LSTM网络结构,首先采用轮数为50轮的64单元的1层LSTM网络(一层长短期记忆网络),然后采用轮数为50轮的64单元加32单元的2层LSTM网络(二层长短期记忆网络),经过几次调试后采用2层LSTM网络以及消除过拟合(dropout)(二层长短期记忆网络+消除过拟合),最后经过几次调优后在测试集中正负样本的召回率分别为84.68%、95.57%,精确率分别为95.12%、85.95%,具体结果详见表1至表3。
表1 单层LSTM网络结构的预测结果
表2 双层LSTM网络结构的预测结果
表3 融合双层LSTM网络与消除过拟合的结构的预测结果
由表1至表3可知,本申请实施例提供的对局匹配方法在实验取得了较大的增益,实验模拟上线后预测的单对单的匹配模式中人均比赛数提升了4.16%,多对多的匹配模式中人均比赛数提升了2.73%。
综上,本申请实施例提供的对局匹配方法,通过用户的对局序列建模,并加入到LSTM中训练,进行因果推断方式,来预测比赛序列中插入福利局对于用户活跃的贡献。同时感知用户历史对局中的单局体验,并结合用户游戏固有属性来在合适时候插入福利局,提升游戏匹配体验和用户粘性。
下面继续说明本申请实施例提供的对局匹配装置555的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器550的对局匹配装置555中的软件模块可以包括:
特征采集模块5551,用于基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于所述待开启对局的历史其他对局,确定其他对局的其他对局特征,其中,所述其他对局为除所述目标对局以外的对局。
对局预测模块5552,用于对所述待开启对局的第一历史对局以及所述目标对局特征进行对局预测,得到第一预测结果,其中,所述第一预测结果表征当所述待开启对局为所述目标对局时,完成所述待开启对局之后继续下一对局的概率;对所述待开启对局的第一历史对局以及所述其他对局特征进行对局预测,得到第二预测结果,其中,所述第二预测结果表征当所述待开启对局为所述其他对局时,完成所述待开启对局之后继续下一对局的概率。
对局匹配模块5553,用于当所述第一预测结果与所述第二预测结果之间的差值大于结果阈值时,将所述待开启对局确定为所述目标对局,当所述第一预测结果与所述第二预测结果之间的差值小于或者等于所述结果阈值时,将所述待开启对局确定为所述其他对局。
在一些实施例中,特征采集模块5551,还用于获取所述历史目标对局的第二历史对局,其中,所述第二历史对局是所述历史目标对局之前的其他对局;对所述第二历史对局与所述第一历史对局之间的相似性进行归一化处理,得到所述历史目标对局的权重;从所述历史目标对局中提取历史目标对局特征,并基于所述历史目标对局的权重以及所述历史目标对局特征,确定所述目标对局的目标对局特征。
在一些实施例中,特征采集模块5551,还用于获取所述待开启对局对应的目标对象,并从对象集合中,获取与所述目标对象的相似性大于相似性阈值的候选对象,其中,所述对象集合包括多个对象;从所述候选对象的历史目标对局中提取候选历史目标对局特征,并确定所述候选对象的历史目标对局的权重。
在一些实施例中,特征采集模块5551,还用于基于所述待开启对局的历史目标对局的权重,对所述待开启对局的历史目标对局特征进行加权处理,得到所述目标对局的第一对局特征;基于所述候选对象的历史目标对局的权重,对所述候选对象的历史目标对局特征进行加权处理,得到所述目标对局的第二对局特征;融合所述第一对局特征以及所述第二对局特征,得到所述目标对局的目标对局特征。
在一些实施例中,特征采集模块5551,还用于针对每个所述第二历史对局进行以下处理,从所述第二历史对局中提取出第二历史对局特征;从所述待开启对局的第一历史对局中提取出第一历史对局特征;将所述第一历史对局特征与所述第二历史对局特征的相似性确定为所述第二历史对局与所述第一历史对局之间的相似性。
在一些实施例中,特征采集模块5551,还用于对所述待开启对局的历史对局进行区间划分,得到多个历史对局区间,其中,每个所述历史对局区间包括至少一个所述历史对局;当所述历史对局区间中的最后一个历史对局为所述其他对局时,将所述历史对局区间中的最后一个历史对局确定为所述待开启对局的历史其他对局。
在一些实施例中,对局预测模块5552,还用于从所述第一历史对局中提取第一历史对局特征;基于所述第一历史对局特征以及所述目标对局特征,确定第一时序特征;调用第一时序模型,其中,所述第一时序模型包括第一编码器以及第一回归器;通过所述第一编码器对所述第一时序特征进行编码处理,得到第一时序编码特征;通过所述第一回归器对所述第一时序编码特征进行回归处理,得到所述第一预测结果。
在一些实施例中,对局预测模块5552,还用于通过以下方式之一确定所述第一时序特征:拼接所述第一历史对局特征以及所述目标对局特征,得到所述第一时序特征;对所述第一历史对局特征以及所述目标对局特征加权,得到所述第一时序特征;获取所述待开启对局对应的目标对象特征,并拼接所述第一历史对局特征、所述目标对局特征以及所述目标对象特征,得到所述第一时序特征。
在一些实施例中,模型训练模块5554,用于基于所述历史目标对局构建第一时序样本以及所述第一时序样本的样本标签;从所述第一时序样本中提取第一时序样本特征;通过初始时序模型的编码器,对所述第一时序样本特征进行编码处理,得到时序编码特征样本;通过所述初始时序模型的回归器,对所述时序编码特征样本进行回归处理,得到样本预测结果;基于所述样本预测结果与所述样本标签,对所述初始时序模型的参数进行更新,将更新后的所述初始时序模型的参数确定为所述第一时序模型的参数。
在一些实施例中,模型训练模块5554,还用于将所述历史目标对局的第二历史对局与所述历史目标对局进行拼接,得到第一时序样本;确定完成所述历史目标对局时的第一时间戳以及开启所述历史目标对局的下一对局时的第二时间戳;当所述第二时间戳与所述第一时间戳的差值大于时间阈值时,将所述第一时序样本的样本标签确定为第一预设标签,当所述第二时间戳与所述第一时间戳的差值小于或者等于所述时间阈值时,将所述第一时序样本的样本标签确定为第二预设标签。
在一些实施例中,对局预测模块5552,还用于从所述第一历史对局中提取第一历史对局特征;基于所述第一历史对局特征以及所述其他对局特征,得到第二时序特征;调用第二时序模型,其中,所述第二时序模型包括第二编码器以及第二回归器;通过所述第二编码器对所述第二时序特征进行编码处理,得到第二时序编码特征;通过所述第二回归器对所述第二时序编码特征进行回归处理,得到所述第二预测结果。
在一些实施例中,对局匹配模块5553,还用于将所述待开启对局的历史对局数量确定为第一历史对局数量;将所述历史目标对局的历史对局数量确定为第二历史对局数量;当所述第一历史对局数量与所述第二历史对局数量的差值小于数量间隔阈值时,将所述待开启对局由所述目标对局切换至所述其他对局。
本申请实施例提供了一种计算机程序产品,计算机程序产品包括计算机可执行指令,计算机可执行指令存储在计算机可读存储介质中,电子设备的处理器从计算机可读存储介质读取计算机可执行指令,处理器执行计算机可执行指令,使得电子设备执行本申请实施例上述的对局匹配方法。
本申请实施例提供一种存储有计算机可执行指令的计算机可读存储介质,其中存储有计算机可执行指令或者计算机程序,当计算机可执行指令或者计算机程序被处理器执行时,将引起处理器执行本申请实施例提供的对局匹配方法,例如,如图3A至图3G示出的对局匹配方法。
在一些实施例中,计算机可读存储介质可以是RAM、ROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,计算机可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,计算机可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(Hyper TextMarkup Language,HTML)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,计算机可执行指令可被部署为在一个电子设备上执行,或者在位于一个地点的多个电子设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行。
综上所述,通过本申请实施例借助于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于待开启对局的历史其他对局,确定其他对局的其他对局特征,对待开启对局的第一历史对局以及目标对局特征进行对局预测,得到第一预测结果,对待开启对局的第一历史对局以及其他对局特征进行对局预测,得到第二预测结果,当第一预测结果与第二预测结果之间的差值大于结果阈值时,将待开启对局确定为目标对局,当第一预测结果与第二预测结果之间的差值小于或者等于结果阈值时,将待开启对局确定为其他对局,如此,采用反事实推断的方法论证假设没有目标对局时对用户继续下一对局的影响,并为用户匹配待开启对局。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。

Claims (14)

1.一种对局匹配方法,其特征在于,所述方法包括:
基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于所述待开启对局的历史其他对局,确定其他对局的其他对局特征,其中,所述其他对局为除所述目标对局以外的对局,所述目标对局是对局难度小于难度阈值的对局,所述目标对局特征与所述其他对局特征具有相同的属性;
从所述待开启对局的第一历史对局中提取第一历史对局特征;
基于所述第一历史对局特征以及所述目标对局特征,确定第一时序特征;
调用第一时序模型,其中,所述第一时序模型包括第一编码器以及第一回归器;
通过所述第一编码器对所述第一时序特征进行编码处理,得到第一时序编码特征;
通过所述第一回归器对所述第一时序编码特征进行回归处理,得到第一预测结果,其中,所述第一预测结果表征当所述待开启对局为所述目标对局时,完成所述待开启对局之后继续下一对局的概率,所述待开启对局的第一历史对局是所述待开启对局的历史对局,所述历史对局包括所述历史目标对局以及所述历史其他对局;
对所述待开启对局的第一历史对局以及所述其他对局特征进行对局预测,得到第二预测结果,其中,所述第二预测结果表征当所述待开启对局为所述其他对局时,完成所述待开启对局之后继续下一对局的概率;
当所述第一预测结果与所述第二预测结果之间的差值大于结果阈值时,将所述待开启对局确定为所述目标对局,当所述第一预测结果与所述第二预测结果之间的差值小于或者等于所述结果阈值时,将所述待开启对局确定为所述其他对局。
2.根据权利要求1所述的方法,其特征在于,所述基于待开启对局的历史目标对局,确定目标对局的目标对局特征,包括:
获取所述历史目标对局的第二历史对局,其中,所述第二历史对局是所述历史目标对局之前的其他对局;
对所述第二历史对局与所述第一历史对局之间的相似性进行归一化处理,得到所述历史目标对局的权重;
从所述历史目标对局中提取历史目标对局特征,并基于所述历史目标对局的权重以及所述历史目标对局特征,确定所述目标对局的目标对局特征。
3.根据权利要求2所述的方法,其特征在于,
所述基于所述历史目标对局的权重以及所述历史目标对局特征,确定所述目标对局的目标对局特征之前,所述方法还包括:
获取所述待开启对局对应的目标对象,并从对象集合中,获取与所述目标对象的相似性大于相似性阈值的候选对象,其中,所述对象集合包括多个对象;
从所述候选对象的历史目标对局中提取候选历史目标对局特征,并确定所述候选对象的历史目标对局的权重;
所述基于所述历史目标对局的权重以及所述历史目标对局特征,确定所述目标对局的目标对局特征,包括:
基于所述待开启对局的历史目标对局的权重,对所述待开启对局的历史目标对局特征进行加权处理,得到所述目标对局的第一对局特征;
基于所述候选对象的历史目标对局的权重,对所述候选对象的历史目标对局特征进行加权处理,得到所述目标对局的第二对局特征;
融合所述第一对局特征以及所述第二对局特征,得到所述目标对局的目标对局特征。
4.根据权利要求2所述的方法,其特征在于,所述对所述第二历史对局与所述第一历史对局之间的相似性进行归一化处理,得到所述历史目标对局的权重之前,所述方法还包括:
针对每个所述第二历史对局进行以下处理:
从所述第二历史对局中提取出第二历史对局特征;
从所述待开启对局的第一历史对局中提取出第一历史对局特征;
将所述第一历史对局特征与所述第二历史对局特征的相似性确定为所述第二历史对局与所述第一历史对局之间的相似性。
5.根据权利要求1所述的方法,其特征在于,所述基于所述待开启对局的历史其他对局,确定其他对局的其他对局特征之前,所述方法还包括:
对所述待开启对局的历史对局进行区间划分,得到多个历史对局区间,其中,每个所述历史对局区间包括至少一个所述历史对局;
当所述历史对局区间中的最后一个历史对局为所述其他对局时,将所述历史对局区间中的最后一个历史对局确定为所述待开启对局的历史其他对局。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一历史对局特征以及所述目标对局特征,确定第一时序特征,包括:
通过以下方式之一确定所述第一时序特征:
拼接所述第一历史对局特征以及所述目标对局特征,得到所述第一时序特征;
对所述第一历史对局特征以及所述目标对局特征加权,得到所述第一时序特征;
获取所述待开启对局对应的目标对象特征,并拼接所述第一历史对局特征、所述目标对局特征以及所述目标对象特征,得到所述第一时序特征。
7.根据权利要求1所述的方法,其特征在于,所述调用第一时序模型之前,所述方法还包括:
基于所述历史目标对局构建第一时序样本以及所述第一时序样本的样本标签;
从所述第一时序样本中提取第一时序样本特征;
通过初始时序模型的编码器,对所述第一时序样本特征进行编码处理,得到时序编码特征样本;
通过所述初始时序模型的回归器,对所述时序编码特征样本进行回归处理,得到样本预测结果;
基于所述样本预测结果与所述样本标签,对所述初始时序模型的参数进行更新,将更新后的所述初始时序模型的参数确定为所述第一时序模型的参数。
8.根据权利要求7所述的方法,其特征在于,所述基于所述历史目标对局构建的第一时序样本以及所述第一时序样本的样本标签,包括:
将所述历史目标对局的第二历史对局与所述历史目标对局进行拼接,得到第一时序样本;
确定完成所述历史目标对局时的第一时间戳以及开启所述历史目标对局的下一对局时的第二时间戳;
当所述第二时间戳与所述第一时间戳的差值大于时间阈值时,将所述第一时序样本的样本标签确定为第一预设标签,当所述第二时间戳与所述第一时间戳的差值小于或者等于所述时间阈值时,将所述第一时序样本的样本标签确定为第二预设标签。
9.根据权利要求1所述的方法,其特征在于,所述对所述待开启对局的第一历史对局以及所述其他对局特征进行对局预测,得到第二预测结果,包括:
从所述第一历史对局中提取第一历史对局特征;
基于所述第一历史对局特征以及所述其他对局特征,得到第二时序特征;
调用第二时序模型,其中,所述第二时序模型包括第二编码器以及第二回归器;
通过所述第二编码器对所述第二时序特征进行编码处理,得到第二时序编码特征;
通过所述第二回归器对所述第二时序编码特征进行回归处理,得到所述第二预测结果。
10.根据权利要求1所述的方法,其特征在于,所述将所述待开启对局确定为所述目标对局之后,所述方法还包括:
将所述待开启对局的历史对局数量确定为第一历史对局数量;
将所述历史目标对局的历史对局数量确定为第二历史对局数量;
当所述第一历史对局数量与所述第二历史对局数量的差值小于数量间隔阈值时,将所述待开启对局由所述目标对局切换至所述其他对局。
11.一种对局匹配装置,其特征在于,所述装置包括:
特征采集模块,用于基于待开启对局的历史目标对局,确定目标对局的目标对局特征,并基于所述待开启对局的历史其他对局,确定其他对局的其他对局特征,其中,所述其他对局为除所述目标对局以外的对局,所述目标对局是对局难度小于难度阈值的对局,所述目标对局特征与所述其他对局特征具有相同的属性;
对局预测模块,用于从所述待开启对局的第一历史对局中提取第一历史对局特征;基于所述第一历史对局特征以及所述目标对局特征,确定第一时序特征;调用第一时序模型,其中,所述第一时序模型包括第一编码器以及第一回归器;通过所述第一编码器对所述第一时序特征进行编码处理,得到第一时序编码特征;通过所述第一回归器对所述第一时序编码特征进行回归处理,得到第一预测结果,其中,所述第一预测结果表征当所述待开启对局为所述目标对局时,完成所述待开启对局之后继续下一对局的概率,所述待开启对局的第一历史对局是所述待开启对局的历史对局,所述历史对局包括所述历史目标对局以及所述历史其他对局;对所述待开启对局的第一历史对局以及所述其他对局特征进行对局预测,得到第二预测结果,其中,所述第二预测结果表征当所述待开启对局为所述其他对局时,完成所述待开启对局之后继续下一对局的概率;
对局匹配模块,用于当所述第一预测结果与所述第二预测结果之间的差值大于结果阈值时,将所述待开启对局确定为所述目标对局,当所述第一预测结果与所述第二预测结果之间的差值小于或者等于所述结果阈值时,将所述待开启对局确定为所述其他对局。
12.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储计算机可执行指令;
处理器,用于执行所述存储器中存储的计算机可执行指令或者计算机程序时,实现权利要求1至10任一项所述对局匹配方法。
13.一种计算机可读存储介质,存储有计算机可执行指令或者计算机程序,其特征在于,所述计算机可执行指令或者计算机程序被处理器执行时实现权利要求1至10任一项所述对局匹配方法。
14.一种计算机程序产品,包括计算机可执行指令或计算机程序,其特征在于,所述计算机可执行指令或计算机程序被处理器执行时实现权利要求1至10任一项所述对局匹配方法。
CN202410510810.5A 2024-04-26 2024-04-26 对局匹配方法、装置、设备、可读存储介质及程序产品 Active CN118105716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410510810.5A CN118105716B (zh) 2024-04-26 2024-04-26 对局匹配方法、装置、设备、可读存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410510810.5A CN118105716B (zh) 2024-04-26 2024-04-26 对局匹配方法、装置、设备、可读存储介质及程序产品

Publications (2)

Publication Number Publication Date
CN118105716A CN118105716A (zh) 2024-05-31
CN118105716B true CN118105716B (zh) 2024-07-30

Family

ID=91208977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410510810.5A Active CN118105716B (zh) 2024-04-26 2024-04-26 对局匹配方法、装置、设备、可读存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN118105716B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107998661A (zh) * 2017-12-26 2018-05-08 苏州大学 一种在线对战游戏的辅助决策方法、装置及存储介质
CN116850601A (zh) * 2022-03-25 2023-10-10 腾讯科技(深圳)有限公司 一种游戏对象处理方法、装置、计算机设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5671501B2 (ja) * 2012-07-17 2015-02-18 株式会社コナミデジタルエンタテインメント マッチング機能を備えたゲームシステム及びそのマッチング制御方法
WO2018168291A1 (ja) * 2017-03-13 2018-09-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報処理方法、情報処理システム、及びプログラム
CN117056709A (zh) * 2023-10-11 2023-11-14 腾讯科技(深圳)有限公司 时序预测模型的训练方法、装置和存储介质及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107998661A (zh) * 2017-12-26 2018-05-08 苏州大学 一种在线对战游戏的辅助决策方法、装置及存储介质
CN116850601A (zh) * 2022-03-25 2023-10-10 腾讯科技(深圳)有限公司 一种游戏对象处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN118105716A (zh) 2024-05-31

Similar Documents

Publication Publication Date Title
CN109621422B (zh) 电子棋牌决策模型训练方法及装置、策略生成方法及装置
CN108888958B (zh) 虚拟场景中的虚拟对象控制方法、装置、设备及存储介质
US20220088474A1 (en) Automated dynamic custom game content generation
CN109460463A (zh) 基于数据处理的模型训练方法、装置、终端及存储介质
Yannakakis Game AI revisited
CN111282267B (zh) 信息处理方法、装置、介质及电子设备
US20220176252A1 (en) Automated prediction of user response states based on traversal behavior
US20230347245A1 (en) Operator interface for automated game content generation
US11465052B2 (en) Game definition file
CN112579909A (zh) 对象推荐方法及装置、计算机设备和介质
CN111738294B (zh) Ai模型的训练方法、使用方法、计算机设备及存储介质
US11565182B2 (en) Parametric player modeling for computer-implemented games
US12083436B2 (en) Automated assessment of custom game levels
US20220088485A1 (en) Automated generation of custom content for computer-implemented games
US20220088483A1 (en) On device game engine architecture
CN115951786B (zh) 一种利用aigc技术的多结局创意社交游戏的创作方法
CN114392560B (zh) 虚拟场景的运行数据处理方法、装置、设备及存储介质
CN113806512B (zh) 机器人对话模型的训练方法、装置、设备及存储介质
CN116975214A (zh) 文本生成方法、装置、存储介质及计算机设备
CN112973130A (zh) 虚拟场景的回放模型构建方法、装置、设备及存储介质
US11458397B1 (en) Automated real-time engagement in an interactive environment
CN111068329B (zh) 一种游戏关卡配置方法、装置、电子设备及存储介质
CN118105716B (zh) 对局匹配方法、装置、设备、可读存储介质及程序产品
CN116680391A (zh) 定制对话方法、定制对话模型的训练方法、装置和设备
CN116821693A (zh) 虚拟场景的模型训练方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant