CN113327141A - 一种基于模拟环境的出行平台优惠券发放优化方法 - Google Patents

一种基于模拟环境的出行平台优惠券发放优化方法 Download PDF

Info

Publication number
CN113327141A
CN113327141A CN202110886220.9A CN202110886220A CN113327141A CN 113327141 A CN113327141 A CN 113327141A CN 202110886220 A CN202110886220 A CN 202110886220A CN 113327141 A CN113327141 A CN 113327141A
Authority
CN
China
Prior art keywords
platform
model
user behavior
issuing
coupon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110886220.9A
Other languages
English (en)
Inventor
张超
胡南
刘泽琳
邢育超
刘昌鑫
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanqi Xiance Nanjing Technology Co ltd
Original Assignee
Nanqi Xiance Nanjing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanqi Xiance Nanjing Technology Co ltd filed Critical Nanqi Xiance Nanjing Technology Co ltd
Priority to CN202110886220.9A priority Critical patent/CN113327141A/zh
Publication of CN113327141A publication Critical patent/CN113327141A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0224Discounts or incentives, e.g. coupons or rebates based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开一种基于模拟环境的出行平台优惠券发放优化方法,基于机器学习构建出行平台优惠券发放的模拟环境,包括构建平台优惠券发放模型和用户行为模型;所述出行优惠券发放策略优化是根据所设定的优化目标,使得模拟环境内的平台优惠券发放模型和用户行为模型进行行为交互,优化后的平台优惠券发放策略;所述用户行为结果复盘将优化后的平台优惠券发放策略在现有的出行平台中进行投放,比对真实用户行为和模拟环境内的用户行为模型输出的差异性概率,对模拟环境中的用户行为模型进行修正,缩小模拟环境与真实环境误差,从而进一步在模拟环境内进行贴合实际场景的出行优惠券发放策略优化。

Description

一种基于模拟环境的出行平台优惠券发放优化方法
技术领域
本发明涉及一种基于模拟环境的出行平台优惠券发放优化方法,在基于机器学习技术构建的模拟环境,模拟平台发券和用户打车的交互过程,从而获得对出行平台优化的优惠券发放方法,属于智能出行技术领域。
背景技术
随着社会的发展、经济水平的提高以及人们生活水准的提高,公共交通设施已经不能满足部分用户的需求。众多出行平台应运而生,着力打造更快速、便捷、舒适的出行方式。但由于众多出行平台的参与,且出行领域用户粘性较小,所以各种出行优惠券的发放成为各出行平台的获客手段。
而出行优惠券发放过程高度依赖运营人员的经验。这些经验通常由运营人员之间交流以及实际优惠券发放中的试错获取,难以形成数字化的经验,新入行从业人员的学习成本较高,且在众多城市中,最优发券策略往往不同,运营人员难以快速调整策略。因此,现有的出行优惠券发放的整个过程需要大量的人力和高昂的费用,亟需一种数字化、自动化、智能化的优惠券发放方法。
机器学习中适用于序列决策过程的强化学习方法,其学习过程要求智能体与环境不断交互试错,以帮助智能体在环境中逐渐学得最优控制策略(即最优决策策略),从而自动完成决策任务。然而,强化学习是智能体与环境进行大量交互试错的过程,在现实环境中往往难以实行。例如,在实际的出行平台优惠券发放过程中直接用强化学习,则需要使用大量不同的优惠券发放方案在实际业务中进行试错,然后从对应用户的行为决策数据中,学习得到最优的平台优惠券发放策略。显然,这种方法会带来巨大的经济损失和时间成本,是出行平台无法接受的。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明提供一种基于模拟环境的出行平台优惠券发放优化方法。
技术方案:一种基于模拟环境的出行平台优惠券发放优化方法,主要包括出行平台优惠券发放的模拟环境构建、出行优惠券发放策略优化和用户行为结果复盘三个部分的实现,其中,出行平台优惠券发放的模拟环境构建包括构建平台优惠券发放模型和用户行为模型;出行优惠券发放策略优化根据所设定的优化目标,使得模拟环境内的平台优惠券发放模型和用户行为模型进行行为交互,优化后的平台优惠券发放策略;用户行为结果复盘将优化后的平台优惠券发放策略在现有的出行平台中进行投放,比对真实用户行为和模拟环境内的用户行为模型输出的差异性概率,对模拟环境中的用户行为模型进行修正。
所述出行平台优惠券发放的模拟环境构建过程中,对实际发生的历史平台发券内容和用户打车行为数据进行学习,构造平台优惠券发放模型和用户行为模型;学习过程中,首先基于出行平台视角,定义并抽象出状态数据s和平台发券的动作数据a p ;然后基于用户视角,定义并抽象出用户动作数据a u ;根据数据的时序关系,将实际发生的发券打车数据排列为对应的状态-动作序列,即
Figure DEST_PATH_IMAGE002
序列;利用机器学习算法,通过所述状态-动作序列学习得到两个策略模型,分别是平台优惠券发放模型和用户行为模型。
所述出行优惠券发放策略优化过程中,设定优化目标,给定随机初始状态数据s,基于所构建的平台优惠券发放的模拟环境内的平台优惠券发放模型与用户行为模型的行为交互,在模拟环境内根据优化目标持续寻优,优化平台优惠券发放模型的输出。
所述用户行为结果复盘中,将优化后的平台优惠券发放模型的输出内容,即优化后的出行优惠券发放内容,在现有出行平台中进行实际发放,获取出行平台中真实用户动作数据,并输出出行平台中真实用户动作数据和模拟环境内用户行为模型的差异性,对模拟环境中的用户行为模型的输出进行修正。
所述的出行平台优惠券发放的模拟环境中的平台优惠券发放模型,其输入为状态数据s,输出为平台发券的动作数据a p ;用户行为模型的输入为状态数据s和平台发券的动作数据a p 的拼接向量,输出为用户动作数据。
所述的用户行为结果复盘中的用户行为模型修正过程中,对于当前状态数据s,输入到模拟环境中的平台优惠券发放模型,输出平台发券的动作数据a p ,同时在模拟环境中的用户行为模型输出用户动作数据a u ,将平台发券的动作数据a p 在真实出行平台中进行实际投放,则现有出行平台的真实用户根据平台优惠券发放内容在出行平台中进行相应动作,根据真实用户动作数据和模拟环境内的用户动作数据a u 的差异性概率比较,将差异性概率作为用户行为模型输出的用户动作数据a u 的概率修正。
一种基于模拟环境的出行平台优惠券发放优化系统,主要包括出行平台优惠券发放的模拟环境构建模块、出行优惠券发放策略优化模块和用户行为结果复盘模块;所述出行平台优惠券发放的模拟环境构建模块包括构建平台优惠券发放模型和用户行为模型;所述出行优惠券发放策略优化模块,用于根据所设定的优化目标,使得模拟环境内的平台优惠券发放模型和用户行为模型进行行为交互,输出优化后的平台优惠券发放策略;所述用户行为结果复盘模块将优化后的平台优惠券发放策略在现有的出行平台中进行投放,比对真实用户行为和模拟环境模块的用户行为模型输出的差异性概率,对模拟环境模块的用户行为模型进行修正。
所述出行平台优惠券发放的模拟环境构建模块,对实际发生的历史出行平台发券内容和用户打车行为数据进行学习,构造平台优惠券发放模型和用户行为模型;学习过程中,首先基于出行平台视角,定义并抽象出状态数据s和平台发券的动作数据a p ;然后基于用户视角,定义并抽象出用户动作数据a u ;根据数据的时序关系,将实际发生的发券打车数据排列为对应的状态-动作序列,即
Figure 778742DEST_PATH_IMAGE002
序列;利用机器学习算法,通过所述状态-动作序列学习得到两个策略模型,分别是平台优惠券发放模型和用户行为模型。
所述出行优惠券发放策略优化模块中,设定优化目标,给定随机初始状态数据
Figure DEST_PATH_IMAGE004
,基于所述平台优惠券发放模型与用户行为模型的行为交互,在模拟环境内根据优化目标持续寻优,通过平台优惠券发放模型输出优化后平台优惠券发放策略。
所述用户行为结果复盘模块,将优化后的平台优惠券发放模型的输出内容,即优化后的出行优惠券发放策略,在现有出行平台中进行实际发放,获取出行平台中真实用户动作数据,并输出出行平台中真实用户动作数据和模拟环境内用户行为模型的差异性,对用户行为模型的输出进行修正。
一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述计算机程序时实现如上所述的基于模拟环境的出行平台优惠券发放优化方法。
一种计算机可读存储介质,该计算机可读存储介质存储有执行如上所述的基于模拟环境的出行平台优惠券发放优化方法的计算机程序。
有益效果:在出行平台优惠券发放过程中,一般都是人工根据经验发放,然后根据发放结果不断调整发放策略,大大增加试错成本和时间。为降本增效,本发明提出了一种基于模拟环境的出行平台优惠券发放优化方法,首先从历史真实发生的平台发券和用户打车的时序数据中构建出行平台优惠券发放模拟环境,模拟环境内包含平台优惠券发放模型和用户行为模型,然后设定优化目标,通过强化学习算法在模拟环境内进行平台优惠券发放模型和用户行为模型的行为交互,实现在模拟环境中低成本高效率地寻优平台优惠券发放策略。然后基于线下优惠券实际投放后的用户行为结果复盘,比对真实用户行为和模拟环境内的用户行为模型输出的差异性概率,对模拟环境中的用户行为模型进行修正,缩小模拟环境与真实环境误差,从而进一步在模拟环境内进行贴合实际场景的出行优惠券发放策略优化。
附图说明
图1是本发明实施例的方法流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,基于模拟环境的出行平台优惠券发放优化方法,包括出行平台优惠券发放的模拟环境构建、出行优惠券发放策略优化和用户行为结果复盘三个部分的实现:
出行平台优惠券发放的模拟环境构建:
出行平台优惠券发放的模拟环境包含平台优惠券发放模型和用户行为模型,且平台优惠券发放模型和用户行为模型均采用神经网络作为模型结构,学习过程中,首先基于出行平台视角,定义并抽象出状态数据s和平台发券的动作数据a p
其中,在本实施例中,状态数据s指:用户过去两个月打车频率、用户过去两个月打车金额、用户过去两个月打车所使用的最低折扣、用户过去两个月打车所使用的折扣金额等数据信息。动作数据a p 指:折扣券张数、折扣券有效期、折扣券的折扣力度(6折、6.5折、7折、7.5折、8折、8.5折、9折、9.5折) 等数据信息。
然后基于用户视角,定义并抽象出用户动作数据a u 。用户动作数据a u 是指:用户是否打车、用户打车金额、用户是否使用折扣券等数据信息。
根据数据的时序关系,将出行平台实际发生的发券打车数据排列为对应的状态-动作序列,即
Figure DEST_PATH_IMAGE005
序列,下标代表的含义为时间序列,0为初始时刻,1为0的下一时刻,以此类推。利用机器学习算法,通过此序列学习得到两个策略模型,即平台优惠券发放模型和用户行为模型。其中,平台优惠券发放模型,其输入为状态数据s,输出为平台发券的动作数据a p 。用户行为模型的输入为状态数据s和平台发券的动作数据a p 的拼接向量,输出为用户动作数据a u
出行优惠券发放策略优化:
设定优化目标,给定随机初始状态数据
Figure 712063DEST_PATH_IMAGE004
,基于所构建的平台优惠券发放的模拟环境内的平台优惠券发放模型和用户行为模型的行为交互,在模拟环境内根据优化目标持续寻优,优化平台优惠券发放模型的输出a p
用户行为结果复盘:
对于现有出行平台中真实的状态数据s,在模拟环境中由用户行为模型输出用户动作数据a u ,同时,将模拟环境中的平台优惠券发放模型的输出,即平台发券的动作数据a p 在现有出行平台中进行实际发放,则真实用户根据平台优惠券发放内容在出行平台上进行相应动作,获取出行平台中真实用户动作数,根据真实用户动作和模拟环境内的用户动作数据a u 的差异性概率比较,将差异性作为用户行为模型输出的用户动作数据a u 的概率修正。
一种基于模拟环境的出行平台优惠券发放优化系统,主要包括出行平台优惠券发放的模拟环境构建模块、出行优惠券发放策略优化模块和用户行为结果复盘模块;出行平台优惠券发放的模拟环境构建模块包括构建平台优惠券发放模型和用户行为模型;出行优惠券发放策略优化模块,用于根据所设定的优化目标,使得模拟环境内的平台优惠券发放模型和用户行为模型进行行为交互,输出优化后的平台优惠券发放策略;用户行为结果复盘模块将优化后的平台优惠券发放策略在现有的出行平台中进行投放,比对真实用户行为和模拟环境模块的用户行为模型输出的差异性概率,对模拟环境模块的用户行为模型进行修正。
出行平台优惠券发放的模拟环境构建模块,对实际发生的历史出行平台发券内容和用户打车行为数据进行学习,构造平台优惠券发放模型和用户行为模型;学习过程中,首先基于出行平台视角,定义并抽象出状态数据s和平台发券的动作数据a p ;然后基于用户视角,定义并抽象出用户动作数据a u ;根据数据的时序关系,将实际发生的发券打车数据排列为对应的状态-动作序列,即
Figure 584204DEST_PATH_IMAGE002
序列;利用机器学习算法,通过状态-动作序列学习得到两个策略模型,分别是平台优惠券发放模型和用户行为模型。
出行优惠券发放策略优化模块中,设定优化目标,给定随机初始状态数据
Figure 46410DEST_PATH_IMAGE004
,基于平台优惠券发放模型与用户行为模型的行为交互,在模拟环境内根据优化目标持续寻优,通过平台优惠券发放模型输出优化后平台优惠券发放策略。
用户行为结果复盘模块,将优化后的平台优惠券发放模型的输出内容,即优化后的出行优惠券发放策略,在现有出行平台中进行实际发放,获取出行平台中真实用户动作数据,并输出出行平台中真实用户动作数据和模拟环境内用户行为模型的差异性,对用户行为模型的输出进行修正。
显然,本领域的技术人员应该明白,上述的本发明实施例的基于模拟环境的出行平台优惠券发放优化系统各模块或基于模拟环境的出行平台优惠券发放优化方法各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。

Claims (10)

1.一种基于模拟环境的出行平台优惠券发放优化方法,其特征在于,包括出行平台优惠券发放的模拟环境构建、出行优惠券发放策略优化和用户行为结果复盘三个部分的实现,其中,出行平台优惠券发放的模拟环境构建包括构建平台优惠券发放模型和用户行为模型;所述出行优惠券发放策略优化是根据所设定的优化目标,使得模拟环境内的平台优惠券发放模型和用户行为模型进行行为交互,优化后的平台优惠券发放策略;所述用户行为结果复盘将优化后的平台优惠券发放策略在现有的出行平台中进行投放,比对真实用户行为和模拟环境内的用户行为模型输出的差异性概率,对模拟环境中的用户行为模型进行修正。
2.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述出行平台优惠券发放的模拟环境构建过程中,对实际发生的历史平台发券内容和用户打车行为数据进行学习,构造平台优惠券发放模型和用户行为模型;学习过程中,首先基于出行平台视角,定义并抽象出状态数据s和平台发券的动作数据a p ;然后基于用户视角,定义并抽象出用户动作数据a u ;根据数据的时序关系,将实际发生的发券打车数据排列为对应的状态-动作序列,即
Figure 818096DEST_PATH_IMAGE001
序列;利用机器学习算法,通 过所述状态-动作序列学习得到两个策略模型,分别是平台优惠券发放模型和用户行为模 型。
3.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述出行优惠券发放策略优化过程中,设定优化目标,给定随机初始状态数据s,基于所构建的平台优惠券发放的模拟环境内的平台优惠券发放模型与用户行为模型的行为交互,在模拟环境内根据优化目标持续寻优,优化平台优惠券发放模型的输出。
4.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述用户行为结果复盘中,将优化后的平台优惠券发放模型的输出内容,即优化后的出行优惠券发放内容,在现有出行平台中进行实际发放,获取出行平台中真实用户动作数据,并输出出行平台中真实用户动作数据和模拟环境内用户行为模型的差异性,对模拟环境中的用户行为模型的输出进行修正。
5.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述的出行平台优惠券发放的模拟环境中的平台优惠券发放模型,其输入为状态数据s,输出为平台发券的动作数据a p ;用户行为模型的输入为状态数据s和平台发券的动作数据a p 的拼接向量,输出为用户动作数据。
6.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述的用户行为结果复盘中的用户行为模型修正过程中,对于当前状态数据s,输入到模拟环境中的平台优惠券发放模型,输出平台发券的动作数据a p ,同时在模拟环境中的用户行为模型输出用户动作数据a u ,将a p 在真实出行平台中进行实际投放,则现有出行平台的真实用户根据平台优惠券发放内容进行相应动作,根据真实用户动作数据和模拟环境内的用户动作数据a u 的差异性概率比较,将差异性概率作为用户行为模型输出的用户动作数据a u 的概率修正。
7.一种基于模拟环境的出行平台优惠券发放优化系统,其特征在于,包括出行平台优惠券发放的模拟环境构建模块、出行优惠券发放策略优化模块和用户行为结果复盘模块;所述出行平台优惠券发放的模拟环境构建模块包括构建平台优惠券发放模型和用户行为模型;所述出行优惠券发放策略优化模块,用于根据所设定的优化目标,使得模拟环境内的平台优惠券发放模型和用户行为模型进行行为交互,输出优化后的平台优惠券发放策略;所述用户行为结果复盘模块将优化后的平台优惠券发放策略在现有的出行平台中进行投放,比对真实用户行为和模拟环境模块的用户行为模型输出的差异性概率,对模拟环境模块的用户行为模型进行修正。
8.根据权利要求7所述的基于模拟环境的出行平台优惠券发放优化系统,其特征在于,所述出行平台优惠券发放的模拟环境构建模块,对实际发生的历史出行平台发券内容和用户打车行为数据进行学习,构造平台优惠券发放模型和用户行为模型;学习过程中,首先基于出行平台视角,定义并抽象出状态数据s和平台发券的动作数据a p ;然后基于用户视角,定义并抽象出用户动作数据a u ;根据数据的时序关系,将实际发生的发券打车数据排列为对应的状态-动作序列,即
Figure 98381DEST_PATH_IMAGE001
序列;利用机器学习算法,通过所 述状态-动作序列学习得到两个策略模型,分别是平台优惠券发放模型和用户行为模型;
所述出行优惠券发放策略优化模块中,设定优化目标,给定随机初始状态数据
Figure 124105DEST_PATH_IMAGE002
,基于 所述平台优惠券发放模型与用户行为模型的行为交互,在模拟环境内根据优化目标持续寻 优,通过平台优惠券发放模型输出优化后平台优惠券发放策略;
所述用户行为结果复盘模块,将优化后的平台优惠券发放模型的输出内容,即优化后的出行优惠券发放策略,在现有出行平台中进行实际发放,获取出行平台中真实用户动作数据,并输出出行平台中真实用户动作数据和模拟环境内用户行为模型的差异性,对用户行为模型的输出进行修正。
9.一种计算机设备,其特征在于,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述计算机程序时实现如权利要求1-6中任一项所述的基于模拟环境的出行平台优惠券发放优化方法。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储有执行如权利要求1-6中任一项所述的基于模拟环境的出行平台优惠券发放优化方法的计算机程序。
CN202110886220.9A 2021-08-03 2021-08-03 一种基于模拟环境的出行平台优惠券发放优化方法 Pending CN113327141A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110886220.9A CN113327141A (zh) 2021-08-03 2021-08-03 一种基于模拟环境的出行平台优惠券发放优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110886220.9A CN113327141A (zh) 2021-08-03 2021-08-03 一种基于模拟环境的出行平台优惠券发放优化方法

Publications (1)

Publication Number Publication Date
CN113327141A true CN113327141A (zh) 2021-08-31

Family

ID=77427006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110886220.9A Pending CN113327141A (zh) 2021-08-03 2021-08-03 一种基于模拟环境的出行平台优惠券发放优化方法

Country Status (1)

Country Link
CN (1) CN113327141A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846041A (zh) * 2016-12-26 2017-06-13 携程计算机技术(上海)有限公司 优惠券的发放方法及系统
CN110390548A (zh) * 2018-04-20 2019-10-29 北京嘀嘀无限科技发展有限公司 优惠券派发策略的选择方法及装置
CN110634010A (zh) * 2018-06-25 2019-12-31 北京嘀嘀无限科技发展有限公司 一种确定优惠券发放策略的方法及装置
CN111339675A (zh) * 2020-03-10 2020-06-26 南栖仙策(南京)科技有限公司 基于机器学习构建模拟环境的智能营销策略的训练方法
CN112085517A (zh) * 2020-08-05 2020-12-15 北京三快在线科技有限公司 优惠券发放方法、装置、电子设备及可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106846041A (zh) * 2016-12-26 2017-06-13 携程计算机技术(上海)有限公司 优惠券的发放方法及系统
CN110390548A (zh) * 2018-04-20 2019-10-29 北京嘀嘀无限科技发展有限公司 优惠券派发策略的选择方法及装置
CN110634010A (zh) * 2018-06-25 2019-12-31 北京嘀嘀无限科技发展有限公司 一种确定优惠券发放策略的方法及装置
CN111339675A (zh) * 2020-03-10 2020-06-26 南栖仙策(南京)科技有限公司 基于机器学习构建模拟环境的智能营销策略的训练方法
CN112085517A (zh) * 2020-08-05 2020-12-15 北京三快在线科技有限公司 优惠券发放方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
Lins et al. Redundancy allocation problems considering systems with imperfect repairs using multi-objective genetic algorithms and discrete event simulation
CN110782042A (zh) 横向联邦和纵向联邦联合方法、装置、设备及介质
Strumberger et al. Enhanced firefly algorithm for constrained numerical optimization
CN110766038B (zh) 无监督式的地貌分类模型训练和地貌图构建方法
Shavandi et al. A fuzzy queuing location model with a genetic algorithm for congested systems
CN114139637B (zh) 多智能体信息融合方法、装置、电子设备及可读存储介质
CN110826725A (zh) 基于认知的智能体强化学习方法、装置、系统、计算机设备及存储介质
CN112488826A (zh) 基于深度强化学习对银行风险定价的优化方法和装置
CN114912357A (zh) 基于用户模型学习的多任务强化学习用户运营方法及系统
CN114290339A (zh) 基于强化学习和残差建模的机器人现实迁移系统和方法
CN114237222A (zh) 一种基于强化学习的取送货车辆路径规划方法
CN113327141A (zh) 一种基于模拟环境的出行平台优惠券发放优化方法
CN112541570A (zh) 一种多模型训练方法、装置、电子设备及存储介质
WO2021205542A1 (ja) 災害復旧計画生成装置、災害復旧計画生成方法、及びプログラム
CN112132219A (zh) 一种基于移动端的深度学习检测模型的通用部署方案
CN115743248A (zh) 列车时刻表确定方法、装置、设备及介质
CN114435165A (zh) 一种充电桩的充电方法、装置、电子设备和存储介质
CN116361138A (zh) 测试方法及设备
CN114242181A (zh) 沙漠砂混凝土强度预测模型训练方法、装置、设备及介质
CN113239034A (zh) 一种基于人工智能的大数据资源整合方法、系统及云平台
CN113971582A (zh) 一种广告投放计划的生成方法,系统,电子设备及存储介质
CN110414845A (zh) 针对目标交易的风险评估方法及装置
CN111882415A (zh) 一种质量检测模型的训练方法和相关装置
CN112288123B (zh) 资源属性的预测方法和系统、训练方法及相关设备
CN116935102B (zh) 一种轻量化模型训练方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210831