CN113055233A - 基于奖励机制的个性化信息协作发布方法 - Google Patents

基于奖励机制的个性化信息协作发布方法 Download PDF

Info

Publication number
CN113055233A
CN113055233A CN202110267391.3A CN202110267391A CN113055233A CN 113055233 A CN113055233 A CN 113055233A CN 202110267391 A CN202110267391 A CN 202110267391A CN 113055233 A CN113055233 A CN 113055233A
Authority
CN
China
Prior art keywords
user
information
intersection
reward
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110267391.3A
Other languages
English (en)
Other versions
CN113055233B (zh
Inventor
毕慧博
陈艳艳
黄文博
宋程程
尚文龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202110267391.3A priority Critical patent/CN113055233B/zh
Publication of CN113055233A publication Critical patent/CN113055233A/zh
Application granted granted Critical
Publication of CN113055233B publication Critical patent/CN113055233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • G08G1/0145Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/07Controlling traffic signals
    • G08G1/081Plural intersections under common control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于奖励机制的个性化信息协作发布方法属于电子信息领域,本发明以基于排队网络的信息发布影响分析综合优化算法和基于非线性规划算法的奖励值计算算法,实现了一种基于奖励机制的个性化信息协作发布方法,通过将采集的用户和环境信息进行分析和计算,实现在信息发布影响下的系统分析综合优化,并根据自定义系统目标函数下的最优用户流量比,借助非线性规划算法和用户遵从率关系,反向推导出最优的任务奖励值,刺激用户执行系统最优协作行为,提高了交通系统中用户的协作效率和信息化水平。

Description

基于奖励机制的个性化信息协作发布方法
技术领域
信息发布技术依赖于无线通信技术。
背景技术
它会实时将用户关注信息以无线电波方式通过无线电发射器发送至用户的移动设备。但由于传统信息发布技术多依赖于如图1所示的短信提示、可变信息板显示等方法,存在着信息类型单一、非定制化和用户遵从率低等问题,因此很难有效影响和改变用户行为。近年来出现的基于前端手机应用和后端云计算平台的新一代信息发布系统正在逐步发展,它通过前端手机应用提供多媒体资源来优化用户体验,并自动将复杂计算需求上传至后端云计算平台进行计算处理,能够有效解决上述传统信息发布技术存在的信息类型单一和非定制化问题。但是,针对信息发布后用户遵从率低等问题,目前尚没有好的解决方案。
鉴于此,本发明针对传统信息发布系统存在的缺点,设计了基于奖励机制和云计算技术的交通用户个性化信息协作发布系统。系统由如图2所示的移动终端应用程序、云计算平台和云计算服务软件组成。其中移动终端应用程序实时采集用户的状态信息和周围环境信息,并通过4G无线网络返回给云计算平台;基于云计算平台的服务软件不断接受用户状态和环境信息,并计算最优用户行为和用于驱动用户执行最优行为的动态奖励值。
如图2系统架构图所示,系统的实现过程主要包含采集、传输、计算和发布四个阶段,分别对应于移动终端设备的GPS位置数据、用户属性信息、和自定义信息采集、数据传输与解析、系统性能优化和奖励任务值计算、奖励任务发布。
(1)采集:用户随时携带的移动终端设备,是系统的数据采集平台,主要负责采集GPS位置数据、用户属性信息、和自定义信息采集。
(2)传输:数据的传输主要依靠移动终端设备的4G模块完成,该模块将采集的数据封装成具有一定格式的消息,并将其通过4G网络传输至云计算平台系统。
(3)计算:当云计算平台系统接收到移动终端设备采集的用户属性数据和自主发布的信息后,需要通过信息发布作用影响下的系统综合分析模型来计算各个节点的最优流量比,继而将求助型信息转化为奖励任务,并计算对应的任务奖励值。
(4)发布:根据任务和任务奖励值计算结果,云计算平台系统不断发布奖励任务,并对完成任务的用户给予奖励。
发明内容:
本发明所涉及主要内容如下:
(1)设计了集成移动终端应用程序和云计算平台的信息协作发布系统架构,并设计了一种用户自行发布求助信息的信息发布机制,增强用户间的协作行为,以及个性化信息发布和获取能力。
(2)设计了基于排队论算法的信息发布影响分析综合优化算法。
(3)设计了基于非线性规划算法的奖励值计算流程。
1.基于奖励机制的个性化信息协作发布方法,其特征在于,具体步骤如下所示:
(1)建立信息发布作用影响下的系统综合分析模型
通过用户随时携带的移动终端设备采集用户GPS位置数据、用户属性信息和自定义信息等,并上传至云计算平台系统,云计算平台软件根据基于排队网络的信息发布影响分析综合优化模型对自定义信息影响下的系统状态进行分析;
(2)通过梯度下降算法计算用户最优流量比
借助梯度下降算法来优化系统定义的优化目标函数,从而求解交叉路口的用户最优流量比;
(3)根据用户最优流量比配置奖励任务和相应奖励值
系统根据用户发布的求助型信息发布奖励任务,之后根据奖励任务数量和用户遵从率关系动态计算最优奖励值;
详细计算步骤如下:
(1)建立信息发布作用影响下的系统综合分析模型
采用一个排队网络模型来描述信息发布作用影响下系统的动态变化;以任意一个路口ni为观察点,则交通用户在此处的自主路径选择仅存在以下2种可能:自主通过某一连接的路段前往下一个路口;到达目的地或因其他原因停留路侧从而离开网络;
假设自主通过某一连接的路段前往下一个路口nj的概率为
Figure BDA0002972715410000021
到达目的地或因其他原因停留路侧从而离开网络的概率为
Figure BDA0002972715410000022
则容易得到公式(1-1):
Figure BDA0002972715410000031
Figure BDA0002972715410000032
Figure BDA0002972715410000033
的取值为0或1,N为交通网络中的路口即网络结点数量;参数i和j为路口的编号,取值范围为1,2,…,N;参数ni表示编号为i的路口;
其次,对受到发布的信息影响而改变路径或行为的用户,假设系统发布的有效诱导信息到达率为
Figure BDA0002972715410000034
定义为在单位时间内,路口ni接受诱导信息的交通用户数量;用户在接收各种因素影响后,去往路口j的概率为
Figure BDA0002972715410000035
则有公式(1-2):
Figure BDA0002972715410000036
结合排队论计算路口ni的交通密度为:
Figure BDA0002972715410000037
参数
Figure BDA0002972715410000038
为交通用户在路口ni的平均服务率;
Figure BDA0002972715410000039
为交通用户到达该路口ni的总达到率,其计算方法为公式(1-4):
Figure BDA00029727154100000310
在公式(1-4)中
Figure BDA00029727154100000311
为从外部进入系统的交通用户的平均到达率;
注意到,所要求解的任意一个交通密度
Figure BDA00029727154100000312
受到其他
Figure BDA00029727154100000313
影响,因此公式(1-3)为非线性方程,因此采取数值求解法进行求解;求解过程分为三步:
随机初始化网络中的
Figure BDA00029727154100000314
为(0,1)间的浮点数值;
利用公式(1-3)求解每一个
Figure BDA00029727154100000315
如果求解结果大于1,则用1替换;
计算
Figure BDA00029727154100000316
直到
Figure BDA00029727154100000317
其中,
Figure BDA00029727154100000318
Figure BDA00029727154100000319
最新值,
Figure BDA00029727154100000320
Figure BDA00029727154100000321
上一次计算值,t为自主设定误差阈值,设定为0.01,以降低计算量;
通过上述信息发布作用影响下的系统综合分析模型,易于分析当前系统中任意路口交通用户的排队情况,为进一步分析和优化系统中用户在路口的最优流量比进行铺垫,
(2)通过梯度下降算法计算用户最优流量比
为了求解用户在任意关键节点的最优流量比,首先需要定义优化目标函数;在本应用中,优化目标函数定义为用户在网络中的平均行程时间和用户发布信息以后的响应时间综合加权求和值,其计算公式为(1-5);
Figure BDA00029727154100000322
其中,参数Dt为用户在网络中的平均行程时间,参数PS为用户发布信息后的响应时间,参数∈为两者间的相关系数,用于调整Dt和PS单位差异,设定为20;
用户在网络中的平均行程时间Dt如下流程计算:
用户在路口ni的平均排队长度
Figure BDA0002972715410000041
可通过公式(1-6)计算:
Figure BDA0002972715410000042
将整个网络系统考虑为一个黑箱,则借助公式(1-7)所示的利特尔法计算用户在网络中的平均行程时间为:
Figure BDA0002972715410000043
用户发布信息以后的响应时间求解公式为(1-8):
Figure BDA0002972715410000044
其中,参数k为奖励任务的编号,取值范围为1…K;参数K为任务种类数;参数bk表示编号为k的奖励任务;参数
Figure BDA0002972715410000045
为用户遵从率,定义为在路口ni处愿意执行个性化信息发布任务bk的用户比例,通过统计单位时间内执行任务bk的用户数量和执行任务的总用户数量的比值获取;参数
Figure BDA0002972715410000046
定义为信息发布任务bk出现在路口ni的概率,求解公式为(1-9):
Figure BDA0002972715410000047
其中,参数
Figure BDA0002972715410000048
为用户信息发布任务bk在路口ni的到达率,通过统计单位时间内的奖励任务bk的出现次数获取;
Figure BDA0002972715410000049
为全部用户信息发布任务在网络中的到达率,通过统计单位时间内的全部奖励任务的发布次数获取;
为了求解用户最优流量比,采用梯度下降算法进行求解,因为直接进行计算比较困难,采用公式(1-10)所示的链式法则:
Figure BDA00029727154100000410
其中,
Figure BDA00029727154100000411
可能为如下(1-11)三种情况:
Figure BDA00029727154100000412
在梯度下降算法计算过程中,用户最优流量比的求解公式(1-12)为:
Figure BDA0002972715410000051
其中,参数η为设定的学习率,η取值过大会导致系统无法找到最优解,取值过小会加大计算量,设定为0.0001;参数z、u和v均为路口的编号,取值范围为1…N;引入参数u和v,
Figure BDA0002972715410000052
Figure BDA0002972715410000053
的相互影响见公式(1-11);参数
Figure BDA0002972715410000054
表示第n次迭代后
Figure BDA0002972715410000055
的数值;
(3)根据用户最优流量比配置奖励任务和相应奖励值
在获取每个路口处的最优用户流量比之后,根据公式(1-13)求得用户在不同信息发布任务bk影响下的用户遵从率
Figure BDA0002972715410000056
Figure BDA0002972715410000057
参数
Figure BDA0002972715410000058
为在路口ni处用户因受到信息发布任务bk影响而改变原有路径或目的地,前往路口nj的概率,计算公式如(1-14):
Figure BDA0002972715410000059
其中,参数
Figure BDA00029727154100000510
为通过前往路口nj而被完成的任务bk的数量,
Figure BDA00029727154100000511
表示从路口ni处前往任一直接相连路口而被完成的任务bk的总数量,参数m表示与路口ni直接相连的路口数量;
任务的奖励值通过如下非线性规划公式(1-15)求解:
Figure BDA00029727154100000512
其限制条件为公式(1-16):
Figure BDA00029727154100000513
其中,参数
Figure BDA00029727154100000514
表示在路口ni处被执行的信息发布任务bk的数量,
Figure BDA00029727154100000515
表示在路口ni处的信息发布任务bk的奖励值,为最终要求解的变量;参数
Figure BDA00029727154100000516
表示用户遵从率和奖励值简单线性关系,通过问卷调查统计不同奖励值下的愿意执行任务的用户数量统计获取。
本发明的效果:
1.个性化信息协作发布架构;现有技术:没有相关的用户可以自主发布任务和领取奖励任务的协作信息发布系统架构。改进架构:用户可以自主发布任务和领取奖励任务,从而提高交通系统的协作化水平。
2.基于排队论算法的信息发布影响分析综合优化算法;现有技术:没有考虑用户信息发布后对系统的影响。改进算法:引入基于排队论的控制因子来描述用户信息发布对系统的影响。
3.基于非线性规划算法的奖励值计算流程;现有技术:目前相关技术多是通过调整道路通行费实现对交通流量的控制。改进算法:通过引入奖励机制和用户自主奖励任务发布机制,有效调动交通用户积极性。
附图说明
图1传统信息发布系统框架图
图2本发明的系统架构图
图3系统应用场景举例图
图4应用场景举例对应的排队网络模型示意图
图5本发明的业务流程图
具体实施方式
本发明在前人研究成果基础上,改进并结合了基于排队网络的信息发布影响分析综合优化算法和基于非线性规划算法的奖励值计算算法,实现了一种基于奖励机制的交通用户协作信息发布方法,通过将采集的用户和环境信息进行分析和计算,实现在信息发布影响下的系统分析综合优化,并根据最优状态值,借助非线性规划算法和用户遵从率函数,反向推导出最优的奖励值,继而生成奖励任务,从而刺激用户执行最优协作行为,确保系统的高效运行。由于交通用户可以通过系统发布和获取个性化信息,实现信息共享,因此也提高了系统对个性化需求的满足能力。算法以交通用户位置信息和手机应用采集的个人实时信息作为基本数据,经过如图5所示三个步骤实现基于奖励机制的用户协作信息发布。
本发明采用一个排队网络模型来描述信息发布作用影响下系统的动态变化。如图3所示,以任意一个路口ni为观察点,则交通用户在此处的自主路径选择(未受到发布的信息影响前)仅存在以下2种可能:自主通过某一连接的路段前往下一个路口;到达目的地或因其他原因停留路侧从而离开网络。
假设自主通过某一连接的路段前往下一个路口nj的概率为
Figure BDA0002972715410000071
到达目的地或因其他原因停留路侧从而离开网络的概率为
Figure BDA0002972715410000072
则容易得到公式(1-1):
Figure BDA0002972715410000073
Figure BDA0002972715410000074
Figure BDA0002972715410000075
的取值为0或1,N为交通网络中的路口(网络结点)数量。参数i和j为路口的编号,取值范围为1,2,…,N。参数ni表示编号为i的路口。
例如,某用户在图3中从n1经n2走到n4离开,则
Figure BDA0002972715410000076
其次,对受到发布的信息影响而改变路径或行为的用户,假设系统发布的有效诱导信息到达率为
Figure BDA0002972715410000077
定义为在单位时间内,路口ni接受诱导信息的交通用户数量。用户在接收各种因素影响后,去往路口j的概率为
Figure BDA0002972715410000078
则有公式(1-2):
Figure BDA0002972715410000079
结合排队论可计算路口ni的交通密度(有一个以上交通用户的概率)为:
Figure BDA00029727154100000710
参数
Figure BDA00029727154100000711
为交通用户在路口ni的平均服务率。
Figure BDA00029727154100000712
为交通用户到达该路口ni的总达到率,其计算方法为公式(1-4):
Figure BDA00029727154100000713
在公式(1-4)中
Figure BDA00029727154100000714
为从外部进入系统(如从停车场驶入邻近路段)的交通用户的平均到达率。
可以注意到,所要求解的任意一个交通密度
Figure BDA00029727154100000715
受到其他
Figure BDA00029727154100000716
影响,因此公式(1-3)为非线性方程,因此采取数值求解法进行求解。求解过程分为三步:
随机初始化网络中的
Figure BDA00029727154100000717
为(0,1)间的浮点数值;
利用公式(1-3)求解每一个
Figure BDA00029727154100000718
如果求解结果大于1,则用1替换;
计算
Figure BDA00029727154100000719
直到
Figure BDA00029727154100000720
其中,
Figure BDA00029727154100000721
Figure BDA00029727154100000722
最新值,
Figure BDA00029727154100000723
Figure BDA00029727154100000724
上一次计算值,t为自主设定误差阈值,建议设定为0.01,以降低计算量。
通过上述信息发布作用影响下的系统综合分析模型,易于分析当前系统中任意路口交通用户的排队情况,为进一步分析和优化系统中用户在路口的最优流量比进行铺垫,排队网络系统描述如图4所示。
4.2梯度下降算法
为了求解用户在任意关键节点的最优流量比,首先需要定义优化目标函数。在本应用中,优化目标函数定义为用户在网络中的平均行程时间和用户发布信息以后的响应时间综合加权求和值,其计算公式为(1-5)。
Figure BDA0002972715410000081
其中,参数Dt为用户在网络中的平均行程时间,参数PS为用户发布信息后的响应时间,参数∈为两者间的相关系数,用于调整Dt和PS单位差异,设定为20。
用户在网络中的平均行程时间Dt可以如下流程计算:
用户在路口ni的平均排队长度
Figure BDA0002972715410000082
可通过公式(1-6)计算:
Figure BDA0002972715410000083
将整个网络系统考虑为一个黑箱,则可以借助公式(1-7)所示的利特尔法计算用户在网络中的平均行程时间为:
Figure BDA0002972715410000084
用户发布信息以后的响应时间求解公式为(1-8):
Figure BDA0002972715410000085
其中,参数k为奖励任务的编号,取值范围为1…K。参数K为任务种类数。参数bk表示编号为k的奖励任务。参数
Figure BDA0002972715410000086
为用户遵从率,定义为在路口ni处愿意执行个性化信息发布任务bk的用户比例,通过统计单位时间内执行任务bk的用户数量和执行任务的总用户数量的比值获取。参数
Figure BDA0002972715410000087
定义为信息发布任务bk出现在路口ni的概率,求解公式为(1-9):
Figure BDA0002972715410000088
其中,参数
Figure BDA0002972715410000089
为用户信息发布任务bk在路口ni的到达率,通过统计单位时间内的奖励任务bk的出现次数获取。
Figure BDA00029727154100000810
为全部用户信息发布任务在网络中的到达率,通过统计单位时间内的全部奖励任务的发布次数获取。
为了求解用户最优流量比,我们采用梯度下降算法进行求解,因为直接进行计算比较困难,我们采用公式(1-10)所示的链式法则:
Figure BDA0002972715410000091
其中,
Figure BDA0002972715410000092
可能为如下(1-11)三种情况:
Figure BDA0002972715410000093
在梯度下降算法计算过程中,用户最优流量比的求解公式(1-12)为:
Figure BDA0002972715410000094
其中,参数η为设定的学习率,η取值过大会导致系统无法找到最优解,取值过小会加大计算量,设定为0.0001。参数z、u和v均为路口的编号,取值范围为1…N。引入参数u和v,
Figure BDA0002972715410000095
Figure BDA0002972715410000096
的相互影响见公式(1-11)。参数
Figure BDA0002972715410000097
表示第n次迭代后
Figure BDA0002972715410000098
的数值。
4.3用户奖励机制
在获取每个路口处的最优用户流量比之后,可以根据公式(1-13)求得用户在不同信息发布任务bk影响下的用户遵从率
Figure BDA0002972715410000099
Figure BDA00029727154100000910
参数
Figure BDA00029727154100000911
为在路口ni处用户因受到信息发布任务bk影响而改变原有路径或目的地,前往路口nj的概率,计算公式如(1-14):
Figure BDA00029727154100000912
其中,参数
Figure BDA00029727154100000913
为可以通过前往路口nj而被完成的任务bk的数量,
Figure BDA00029727154100000914
表示从路口ni处前往任一直接相连路口而被完成的任务bk的总数量,参数m表示与路口ni直接相连的路口数量。
任务的奖励值可以通过如下非线性规划公式(1-15)求解:
Figure BDA00029727154100000915
其限制条件为公式(1-16):
Figure BDA0002972715410000101
其中,参数
Figure BDA0002972715410000102
表示在路口ni处被执行的信息发布任务bk的数量,
Figure BDA0002972715410000103
表示在路口ni处的信息发布任务bk的奖励值,为最终要求解的变量。参数
Figure BDA0002972715410000104
表示用户遵从率和奖励值简单线性关系,可以通过问卷调查统计不同奖励值下的愿意执行任务的用户数量统计获取。
通过移动无线通信技术支撑的基于奖励机制和云计算平台的个性化信息协作发布系统的搭建,可以实现用户的自主信息发布、信息转化为奖励任务和信息发布影响下的城市交通系统或赛会园区交通系统的综合性能优化。仿真实验数据证明,在对冬奥园区采用本方法后,可以使用户平均行程时间降低约13%,在赛事期间对用户个性化需求的响应速度提高约35%。本发明所研究的基于奖励机制和云计算平台的个性化信息协作发布系统为城市交通系统或赛会园区交通系统的智能化管理提供了一套完整的解决方案,提高了交通系统中用户的协作效率和信息化水平,本系统的设计方法和实现过程中所采用的技术也为智能交通系统的发展提供了一种新的思路。

Claims (1)

1.基于奖励机制的个性化信息协作发布方法,其特征在于,具体步骤如下所示:
(1)建立信息发布作用影响下的系统综合分析模型
通过用户随时携带的移动终端设备采集用户GPS位置数据、用户属性信息和自定义信息等,并上传至云计算平台系统,云计算平台软件根据基于排队网络的信息发布影响分析综合优化模型对自定义信息影响下的系统状态进行分析;
(2)通过梯度下降算法计算用户最优流量比
借助梯度下降算法来优化系统定义的优化目标函数,从而求解交叉路口的用户最优流量比;
(3)根据用户最优流量比配置奖励任务和相应奖励值
系统根据用户发布的求助型信息发布奖励任务,之后根据奖励任务数量和用户遵从率关系动态计算最优奖励值;
详细计算步骤如下:
(1)建立信息发布作用影响下的系统综合分析模型
采用一个排队网络模型来描述信息发布作用影响下系统的动态变化;以任意一个路口ni为观察点,则交通用户在此处的自主路径选择仅存在以下2种可能:自主通过某一连接的路段前往下一个路口;到达目的地或因其他原因停留路侧从而离开网络;
假设自主通过某一连接的路段前往下一个路口nj的概率为
Figure FDA0002972715400000011
到达目的地或因其他原因停留路侧从而离开网络的概率为
Figure FDA0002972715400000012
则容易得到公式(1-1):
Figure FDA0002972715400000013
Figure FDA0002972715400000014
Figure FDA0002972715400000015
的取值为0或1,N为交通网络中的路口即网络结点数量;参数i和j为路口的编号,取值范围为1,2,…,N;参数ni表示编号为i的路口;
其次,对受到发布的信息影响而改变路径或行为的用户,假设系统发布的有效诱导信息到达率为
Figure FDA0002972715400000018
Figure FDA0002972715400000016
定义为在单位时间内,路口ni接受诱导信息的交通用户数量;用户在接收各种因素影响后,去往路口j的概率为
Figure FDA0002972715400000017
则有公式(1-2):
Figure FDA0002972715400000021
结合排队论计算路口ni的交通密度为:
Figure FDA0002972715400000022
参数
Figure FDA0002972715400000023
为交通用户在路口ni的平均服务率;
Figure FDA0002972715400000024
为交通用户到达该路口ni的总达到率,其计算方法为公式(1-4):
Figure FDA0002972715400000025
在公式(1-4)中
Figure FDA0002972715400000026
为从外部进入系统的交通用户的平均到达率;
注意到,所要求解的任意一个交通密度
Figure FDA0002972715400000027
受到其他
Figure FDA0002972715400000028
影响,因此公式(1-3)为非线性方程,因此采取数值求解法进行求解;求解过程分为三步:
随机初始化网络中的
Figure FDA0002972715400000029
为(0,1)间的浮点数值;
利用公式(1-3)求解每一个
Figure FDA00029727154000000210
如果求解结果大于1,则用1替换;
计算
Figure FDA00029727154000000211
直到
Figure FDA00029727154000000212
其中,
Figure FDA00029727154000000213
Figure FDA00029727154000000214
最新值,
Figure FDA00029727154000000215
Figure FDA00029727154000000216
上一次计算值,t为自主设定误差阈值,设定为0.01,以降低计算量;
通过上述信息发布作用影响下的系统综合分析模型,易于分析当前系统中任意路口交通用户的排队情况,为进一步分析和优化系统中用户在路口的最优流量比进行铺垫,
(2)通过梯度下降算法计算用户最优流量比
为了求解用户在任意关键节点的最优流量比,首先需要定义优化目标函数;在本应用中,优化目标函数定义为用户在网络中的平均行程时间和用户发布信息以后的响应时间综合加权求和值,其计算公式为(1-5);
Figure FDA00029727154000000217
其中,参数Dt为用户在网络中的平均行程时间,参数PS为用户发布信息后的响应时间,参数∈为两者间的相关系数,用于调整Dt和PS单位差异,设定为20;
用户在网络中的平均行程时间Dt如下流程计算:
用户在路口ni的平均排队长度
Figure FDA0002972715400000031
可通过公式(1-6)计算:
Figure FDA0002972715400000032
将整个网络系统考虑为一个黑箱,则借助公式(1-7)所示的利特尔法计算用户在网络中的平均行程时间为:
Figure FDA0002972715400000033
用户发布信息以后的响应时间求解公式为(1-8):
Figure FDA0002972715400000034
其中,参数k为奖励任务的编号,取值范围为1…K;参数K为任务种类数;参数bk表示编号为k的奖励任务;参数
Figure FDA0002972715400000035
为用户遵从率,定义为在路口ni处愿意执行个性化信息发布任务bk的用户比例,通过统计单位时间内执行任务bk的用户数量和执行任务的总用户数量的比值获取;参数
Figure FDA0002972715400000036
定义为信息发布任务bk出现在路口ni的概率,求解公式为(1-9):
Figure FDA0002972715400000037
其中,参数
Figure FDA0002972715400000038
为用户信息发布任务bk在路口ni的到达率,通过统计单位时间内的奖励任务bk的出现次数获取;
Figure FDA0002972715400000039
为全部用户信息发布任务在网络中的到达率,通过统计单位时间内的全部奖励任务的发布次数获取;
为了求解用户最优流量比,采用梯度下降算法进行求解,因为直接进行计算比较困难,采用公式(1-10)所示的链式法则:
Figure FDA00029727154000000310
其中,
Figure FDA00029727154000000311
可能为如下(1-11)三种情况:
Figure FDA0002972715400000041
在梯度下降算法计算过程中,用户最优流量比的求解公式(1-12)为:
Figure FDA0002972715400000042
其中,参数η为设定的学习率,η取值过大会导致系统无法找到最优解,取值过小会加大计算量,设定为0.0001;参数z、u和v均为路口的编号,取值范围为1…N;引入参数u和v,
Figure FDA0002972715400000043
Figure FDA0002972715400000044
的相互影响见公式(1-11);参数
Figure FDA0002972715400000045
表示第n次迭代后
Figure FDA0002972715400000046
的数值;
(3)根据用户最优流量比配置奖励任务和相应奖励值
在获取每个路口处的最优用户流量比之后,根据公式(1-13)求得用户在不同信息发布任务bk影响下的用户遵从率
Figure FDA0002972715400000047
Figure FDA0002972715400000048
参数
Figure FDA0002972715400000049
为在路口ni处用户因受到信息发布任务bk影响而改变原有路径或目的地,前往路口nj的概率,计算公式如(1-14):
Figure FDA00029727154000000410
其中,参数
Figure FDA00029727154000000411
为通过前往路口nj而被完成的任务bk的数量,
Figure FDA00029727154000000412
表示从路口ni处前往任一直接相连路口而被完成的任务bk的总数量,参数m表示与路口ni直接相连的路口数量;
任务的奖励值通过如下非线性规划公式(1-15)求解:
Figure FDA00029727154000000413
其限制条件为公式(1-16):
Figure FDA0002972715400000051
其中,参数
Figure FDA0002972715400000052
表示在路口ni处被执行的信息发布任务bk的数量,
Figure FDA0002972715400000053
表示在路口ni处的信息发布任务bk的奖励值,为最终要求解的变量;参数
Figure FDA0002972715400000054
表示用户遵从率和奖励值简单线性关系,通过问卷调查统计不同奖励值下的愿意执行任务的用户数量统计获取。
CN202110267391.3A 2021-03-12 2021-03-12 基于奖励机制的个性化信息协作发布方法 Active CN113055233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110267391.3A CN113055233B (zh) 2021-03-12 2021-03-12 基于奖励机制的个性化信息协作发布方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110267391.3A CN113055233B (zh) 2021-03-12 2021-03-12 基于奖励机制的个性化信息协作发布方法

Publications (2)

Publication Number Publication Date
CN113055233A true CN113055233A (zh) 2021-06-29
CN113055233B CN113055233B (zh) 2023-02-10

Family

ID=76511584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110267391.3A Active CN113055233B (zh) 2021-03-12 2021-03-12 基于奖励机制的个性化信息协作发布方法

Country Status (1)

Country Link
CN (1) CN113055233B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113506445A (zh) * 2021-09-13 2021-10-15 四川国蓝中天环境科技集团有限公司 考虑出行者长期遵从行为变化的实时交通诱导系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170193614A1 (en) * 2015-12-30 2017-07-06 International Business Machines Corporation Verifiable reward system for influencing human travel patterns
CN107911242A (zh) * 2017-11-15 2018-04-13 北京工业大学 一种基于工业无线网络的认知无线电与边缘计算方法
CN111785045A (zh) * 2020-06-17 2020-10-16 南京理工大学 基于演员-评论家算法的分布式交通信号灯联合控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170193614A1 (en) * 2015-12-30 2017-07-06 International Business Machines Corporation Verifiable reward system for influencing human travel patterns
CN107911242A (zh) * 2017-11-15 2018-04-13 北京工业大学 一种基于工业无线网络的认知无线电与边缘计算方法
CN111785045A (zh) * 2020-06-17 2020-10-16 南京理工大学 基于演员-评论家算法的分布式交通信号灯联合控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113506445A (zh) * 2021-09-13 2021-10-15 四川国蓝中天环境科技集团有限公司 考虑出行者长期遵从行为变化的实时交通诱导系统及方法
CN113506445B (zh) * 2021-09-13 2021-11-30 四川国蓝中天环境科技集团有限公司 考虑出行者长期遵从行为变化的实时交通诱导系统及方法

Also Published As

Publication number Publication date
CN113055233B (zh) 2023-02-10

Similar Documents

Publication Publication Date Title
Zhu et al. Parallel transportation systems: Toward IoT-enabled smart urban traffic control and management
Kong et al. Urban traffic congestion estimation and prediction based on floating car trajectory data
Farkas et al. Crowdsending based public transport information service in smart cities
Estévez-Mauriz et al. Dynamic traffic noise assessment tool: A comparative study between a roundabout and a signalised intersection
Andrisano et al. The need of multidisciplinary approaches and engineering tools for the development and implementation of the smart city paradigm
Maerivoet et al. Transportation planning and traffic flow models
Li et al. Limits of predictability for large-scale urban vehicular mobility
CN102708698A (zh) 基于车联网的车辆最优路径导航方法
CN102169606A (zh) 一种城市轨道交通网络大客流影响的预测方法
Mikluščák et al. Using neural networks for route and destination prediction in intelligent transport systems
CN113055233B (zh) 基于奖励机制的个性化信息协作发布方法
Dai et al. Spatio-temporal deep learning framework for traffic speed forecasting in IoT
Pang et al. Development of people mass movement simulation framework based on reinforcement learning
Li et al. Potential predictability of vehicular staying time for large-scale urban environment
Li Space-time distribution model of visitor flow in tourism culture construction via back propagation neural network model
CN114710410A (zh) 基于深度强化学习的网络数据采集效率优化方法及系统
CN107995278B (zh) 一种基于城域级物联网感知数据的场景智能分析系统与方法
Zhang et al. Feature extraction of trajectories for mobility modeling in 5G NB-IoT networks
CN108897926A (zh) 一种人工车联网系统及其建立方法
Garg et al. Guest editorial special issue on intent-based networking for 5G-envisioned Internet of connected vehicles
CN113657606B (zh) 车联网场景下分压聚合的局域联邦学习方法
Zhang et al. Learning Decentralized Traffic Signal Controllers with Multi-Agent Graph Reinforcement Learning
CN116386323A (zh) 时长预测模型训练和车流速度的预估方法、装置和设备
Jomrich et al. rapid cellular network simulation framework for automotive scenarios (RACE framework)
Abdelatif et al. Extended iCanCloud simulation framework for VANET-Cloud architectures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant