CN114897444B - 一种城市分区域内服务设施需求识别方法及系统 - Google Patents

一种城市分区域内服务设施需求识别方法及系统 Download PDF

Info

Publication number
CN114897444B
CN114897444B CN202210812583.2A CN202210812583A CN114897444B CN 114897444 B CN114897444 B CN 114897444B CN 202210812583 A CN202210812583 A CN 202210812583A CN 114897444 B CN114897444 B CN 114897444B
Authority
CN
China
Prior art keywords
area
urban
service
service facility
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210812583.2A
Other languages
English (en)
Other versions
CN114897444A (zh
Inventor
王璞
陈伟
赵雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN202210812583.2A priority Critical patent/CN114897444B/zh
Publication of CN114897444A publication Critical patent/CN114897444A/zh
Application granted granted Critical
Publication of CN114897444B publication Critical patent/CN114897444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种城市分区域内服务设施需求识别方法及系统,包括以下步骤:基于各级行政区域划分方法对城市区域进行划分,并提取城市区域内的多维度特征;构建城市区域空间属性图;采用变分图自编码器对城市区域空间属性图编码,得到城市区域的潜在隐特征;融合Top‑k最相似功能城市区域的潜在隐特征;采用具有时空限制的贝叶斯模型,得到用户轨迹访问特征;结合城市区域的潜在隐特征和用户轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的城市区域内服务设施需求概率分布。本发明考虑区域特征数据的稀疏性和动态性,综合城市宏观大数据与居民微观位置社会化数据,准确预测城市区域缺少的各类服务设施。

Description

一种城市分区域内服务设施需求识别方法及系统
技术领域
本发明涉及城市规划技术领域,具体涉及一种城市分区域内服务设施需求识别方法及系统。
背景技术
城市是由土地空间、建筑设施和居民用户等组成的一个有机整体,城市的不断发展会逐步培育出不同的功能区域,例如教育区、商业区、工业区或居住区等,此外城市有着天然的行政区域划分,城市行政管理人员也会对不同区域的功能进行规划和设计。这些由居民的实际活动方式自然形成或管理者人为设计的功能区域,支撑着居民不同的城市工作生活需求,是一种有价值的组织形式,可以构建起整个城市的详细知识,并随着城市的发展而变化。理解城市区域的功能并掌握其变化趋势,根据区域内当前服务设施的配置和分布情况,可以预测服务设施在未来的需求或不足等情况,从而做到提前预知与提早规划,对服务城市居民和完善城市建设都有积极的作用。
服务设施一般包括了公共设施(如公共卫生间、共享自行车点和快递物流网点等)以及商业设施(如充电桩、商店和餐厅等)。城市区域服务设施的需求分析,需要考虑和评估一系列的影响因素,比如路网结构、交通流量、人群流动性、兴趣点和居民社交媒体网络等。这些复杂且变化的特征使得区域需求分析成为了一项非常具有挑战性的任务。传统意义上,城市规划者需要依靠劳动密集型调查来为他们的决策提供信息支持,比如随机发放一定数量的调查问卷或有针对性的排查走访等,然而通过该方法获得的资料可能不够充分和及时。近年来,城市规划者也会利用部分城市大数据来决策,例如道路网络、路网交通流量或居民流动性等,但是,他们缺乏对城市居民日常行为模式的真正理解和运用。居民作为城市的重要组成元素,设施的规划设计终究是要为居民服务的,“人”应当作为一个重要的感知计算单元参与到区域需求的研究过程中。
当前城市服务设施的区域需求分析研究工作主要从城市的宏观角度出发,分析城市时空大数据,提取城市区域的多维时空特征,然后再根据区域的流行程度进行推荐与分析。然而,随着传感器技术和位置社交媒体网络的发展应用,居民大量的位置社会化数据被记录下来。当前的研究缺乏从城市居民的微观角度来考虑服务设施的区域需求识别问题,没有深入挖掘用户的时空行为轨迹、服务设施位置签到和社交关系网络活动等数据,也没有充分提取用户社会化活动中相关的地理空间特征以及社会关系的关联特征,从而未能准确分析和了解居民用户还缺少什么设施、需要什么服务。
此外,城市的热点区域、服务设施和居民都是变化的,目前区域内设施缺失或不足的需求预测工作没有考虑区域特征数据的稀疏性和动态性等特征,也没有综合利用城市的宏观大数据与居民的微观位置社会化数据。同时,它们还忽略了用户访问服务设施的城市路网轨迹对途经区域设施需求的影响,以及城市宏观规划下不同区域的功能权重与设施限制等问题,从而导致了在区域设施的需求预测上存在着低准确率等问题。
发明内容
本发明的目的是提供一种城市分区域内服务设施需求识别方法及系统,考虑区域特征数据的稀疏性和动态性,综合城市宏观大数据与居民微观位置社会化数据,准确预测城市区域缺少的各类服务设施。
为了解决上述技术问题,本发明提供了一种城市分区域内服务设施需求识别方法,包括以下步骤:
S1、基于各级行政区域划分方法对城市区域进行划分,并提取城市区域内的多维度特征;其中,多维度特征包括城市区域内的地理特征、交通特征及现有服务设施分布特征,所述交通特征包括用户轨迹特征;
S2、根据城市区域划分和提取的多维度特征,构建城市区域空间属性图;其中,所述城市区域空间属性图为城市区域之间的邻接关系所构成的无向图结构,图中的节点为每一个划分后的城市区域,节点之间的无向边表示区域地理空间上的邻接关系;
S3、采用变分图自编码器对城市区域空间属性图编码,得到城市区域的潜在隐特征;同时,根据城市区域之间的功能相似性,融合Top-k最相似功能城市区域的潜在隐特征;
S4、根据用户轨迹特征和用户轨迹目的地附近的服务设施,采用具有时空限制的贝叶斯模型,计算用户轨迹目的地的服务设施访问概率,得到用户轨迹访问特征;
S5、结合城市区域的潜在隐特征和用户轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的城市区域内服务设施需求概率分布。
作为本发明的进一步改进,采用两级的行政区域划分方法对城市区域进行划分,包括:
按照第一级行政区域进行划分,在每一个第一级行政区域内再按照第二级行政区域划分,最终划分所有城市区域,其中,第一级行政区域包括市辖区,第二级行政区域包括行政街道、镇和乡。
作为本发明的进一步改进,所述地理特征包括:人口面积特征M、区域功能特征B和房地产价格特征V;
所述交通特征包括:公共交通特征O和私人交通特征U;其中,所述私人交通特征U包括用户轨迹特征;
所述现有服务设施分布特征为对每一个城市区域建立一个基于路网空间距离的网络结构E,网络节点为服务设施类别,网络节点之间的边两两相连,边权重为节点服务设施类别对应的所有具体服务设施之间归一化的平均路网空间距离。
作为本发明的进一步改进,所述城市区域空间属性图表示为
Figure 718932DEST_PATH_IMAGE001
,其中,节点集
Figure 569076DEST_PATH_IMAGE002
是划分的城市区域的集合,
Figure 80960DEST_PATH_IMAGE003
Figure 233724DEST_PATH_IMAGE004
为邻接矩阵表示节点之间的邻居关系,
Figure 195339DEST_PATH_IMAGE005
是区域内部代表性的汇总特征矩阵;结合区域之间的地理邻接关系,城市区域空间属性图
Figure 583595DEST_PATH_IMAGE006
的邻接矩阵
Figure 949986DEST_PATH_IMAGE004
为:
Figure 273651DEST_PATH_IMAGE007
作为本发明的进一步改进,所述步骤S3中采用无监督模型中的变分图自编码器将城市区域空间属性图
Figure 115705DEST_PATH_IMAGE006
的原始节点特征映射至低维度的潜在空间,从而得到节点区域的潜在特征嵌入;其中,在变分图自编码的编码阶段,通过两层图卷积,使模型学习得到区域潜在隐特征的正态分布,然后再从正态分布中采样获得真正的区域潜在隐特征表示;在解码阶段,使用向量内积操作,将编码阶段得到的区域潜在隐特征向量重构并还原为城市区域空间属性图的邻接矩阵
Figure 917439DEST_PATH_IMAGE004
作为本发明的进一步改进,获得真正的区域潜在隐特征表示,具体包括以下步骤:
变分图自编码的编码部分包含两层图卷积操作:第一层图卷积将整个区域空间属性图
Figure 138336DEST_PATH_IMAGE001
作为输入,得到低维空间的特征矩阵
Figure 23115DEST_PATH_IMAGE008
,该过程表示如下:
Figure 696673DEST_PATH_IMAGE009
其中,
Figure 302098DEST_PATH_IMAGE010
Figure 502135DEST_PATH_IMAGE004
的对角度矩阵,
Figure 433182DEST_PATH_IMAGE011
是可学习的权重矩阵,激活层使用了ReLU激活函数;
根据变分图自编码器的定义,潜在隐特征从一个高斯先验分布中采样得到的,第二层图卷积用于评估该先验分布的两个参数,该层的输入为
Figure 453090DEST_PATH_IMAGE008
Figure 124856DEST_PATH_IMAGE004
,输出为多维高斯分布的均值向量
Figure 320345DEST_PATH_IMAGE012
和协方差矩阵
Figure 15768DEST_PATH_IMAGE013
,整个计算过程为:
Figure 663919DEST_PATH_IMAGE014
其中,
Figure 876725DEST_PATH_IMAGE015
为可学习的权重矩阵;
在潜在隐特征的生成阶段,采用重参数化技巧近似采样操作:将变量的随机性转移到高斯分布的元变量中,模型通过学习将高斯分布的均值和方差进行调整,要求的区域潜在隐特征表示为:
Figure 51355DEST_PATH_IMAGE016
其中,
Figure 58625DEST_PATH_IMAGE017
服从标准正态分布
Figure 194071DEST_PATH_IMAGE018
,则
Figure 69623DEST_PATH_IMAGE016
服从正态分布
Figure 239705DEST_PATH_IMAGE019
,先采样一个标准正态分布
Figure 417876DEST_PATH_IMAGE017
,再通过
Figure 165252DEST_PATH_IMAGE020
变换得到真正的区域潜在隐特征z。
作为本发明的进一步改进,根据城市区域之间的功能相似性,融合Top-k最相似功能城市区域的潜在隐特征,具体包括以下步骤:
采用区域功能识别框架DRoF,计算所有区域
Figure 716932DEST_PATH_IMAGE003
对应的功能分布向量
Figure 741520DEST_PATH_IMAGE021
令当前的城市区域为
Figure 215226DEST_PATH_IMAGE022
,计算
Figure 59686DEST_PATH_IMAGE022
和其所在的一级行政区之外其他所有区域
Figure 417986DEST_PATH_IMAGE023
的功能相似度
Figure 156135DEST_PATH_IMAGE024
Figure 941688DEST_PATH_IMAGE025
Figure 398077DEST_PATH_IMAGE022
Figure 294489DEST_PATH_IMAGE023
的最短路网距离,则:
Figure 293669DEST_PATH_IMAGE026
其中,
Figure 109178DEST_PATH_IMAGE027
Figure 928230DEST_PATH_IMAGE028
Figure 625403DEST_PATH_IMAGE029
的功能分布向量
Figure 479089DEST_PATH_IMAGE030
Figure 465500DEST_PATH_IMAGE031
的余弦相似度,
Figure 37427DEST_PATH_IMAGE032
Figure 275641DEST_PATH_IMAGE033
内两个路网距离最远区域之间的最短路网距离,
Figure 108468DEST_PATH_IMAGE034
则表示
Figure 141146DEST_PATH_IMAGE028
Figure 934789DEST_PATH_IMAGE029
之间归一化的最短路网距离;
基于功能相似度
Figure 101329DEST_PATH_IMAGE024
从大到小对所有被评估的区域排序,得到Top-k最相关功能的区域集合
Figure 929607DEST_PATH_IMAGE035
Figure 133187DEST_PATH_IMAGE035
内所有的采样隐特征向量与区域
Figure 676776DEST_PATH_IMAGE028
的采样隐特征向量融合,即得到
Figure 381427DEST_PATH_IMAGE028
最终的潜在隐特征向量表示:
Figure 329791DEST_PATH_IMAGE036
其中,
Figure 704272DEST_PATH_IMAGE037
是所有区域之间共享且可学习的权重参数矩阵,代表区域
Figure 472508DEST_PATH_IMAGE028
Figure 980850DEST_PATH_IMAGE029
之间隐特征的相关性;
Figure 518141DEST_PATH_IMAGE038
Figure 594682DEST_PATH_IMAGE039
分别代表了区域
Figure 584634DEST_PATH_IMAGE028
与区域
Figure 896667DEST_PATH_IMAGE029
的采样隐特征向量,同时,
Figure 288465DEST_PATH_IMAGE038
本身作为隐特征融合的一部分参与计算。
作为本发明的进一步改进,所述步骤S4具体包括以下步骤:
S41、给定一个用户的时空行为轨迹
Figure 290835DEST_PATH_IMAGE040
,贝叶斯概率推断模型首先选择轨迹目的地位置点
Figure 892718DEST_PATH_IMAGE041
周围的在路网空间距离阈值
Figure 618229DEST_PATH_IMAGE042
内一系列服务设施作为访问推断候选设施集
Figure 864533DEST_PATH_IMAGE043
Figure 282876DEST_PATH_IMAGE044
S42、定义服务设施访问的影响因素:路网距离、服务设施流行时间段、服务设施吸引力和用户访问喜好;综合影响因素因子,令用户
Figure 637634DEST_PATH_IMAGE045
的轨迹为
Figure 635677DEST_PATH_IMAGE040
,轨迹目的地位置点
Figure 267647DEST_PATH_IMAGE041
所在的区域是
Figure 450367DEST_PATH_IMAGE046
Figure 902208DEST_PATH_IMAGE047
S43、用户
Figure 969521DEST_PATH_IMAGE045
在轨迹目的地区域
Figure 315051DEST_PATH_IMAGE046
内访问了某个服务设施
Figure 806688DEST_PATH_IMAGE048
的概率表示为:
Figure 604880DEST_PATH_IMAGE049
其中,
Figure 475884DEST_PATH_IMAGE050
为位置点
Figure 551287DEST_PATH_IMAGE041
到服务设施
Figure 482334DEST_PATH_IMAGE048
的最短路网距离,
Figure 33401DEST_PATH_IMAGE051
为非负的参数;
Figure 442517DEST_PATH_IMAGE052
表示目的地时间戳
Figure 638006DEST_PATH_IMAGE053
对应的前后时间段
Figure 599009DEST_PATH_IMAGE054
Figure 778318DEST_PATH_IMAGE048
所属服务设施类别
Figure 991124DEST_PATH_IMAGE055
的流行度,从整个服务设施签到数据的设施类别分布中得出,其最终值表示为0~1之间的一个归一化权重;
Figure 303769DEST_PATH_IMAGE056
是服务设施
Figure 576619DEST_PATH_IMAGE048
的服务吸引力,通过用户对该服务设施的评价或打分等文本数据中提取分析得出,其最终值表示为0~1之间的一个归一化权重;
Figure 977644DEST_PATH_IMAGE057
是用户
Figure 853196DEST_PATH_IMAGE045
对服务设施类别为
Figure 757698DEST_PATH_IMAGE058
的访问喜好程度,从用户对所有服务设施签到记录中和服务设施类别为
Figure 201449DEST_PATH_IMAGE058
的服务设施的签到之比得出,其最终值表示为0~1之间的一个归一化权重;
S44、根据以上S43中公式,求得用户对行程轨迹目的位置点
Figure 824192DEST_PATH_IMAGE041
附近的距离阈值
Figure 503435DEST_PATH_IMAGE042
范围内所有服务设施
Figure 528022DEST_PATH_IMAGE048
的访问概率,再反向推断出用户轨迹对应区域内缺少的服务设施概率;
S45、综合用户轨迹出发位置点
Figure 877095DEST_PATH_IMAGE059
所在区域的服务设施缺失情况,除了轨迹目的地位置点
Figure 249783DEST_PATH_IMAGE041
所在的区域
Figure 732717DEST_PATH_IMAGE046
之外,轨迹经过的其他所有区域也都认为需求对应的服务设施:令用户
Figure 611812DEST_PATH_IMAGE045
在其行程轨迹
Figure 131786DEST_PATH_IMAGE040
中顺序经过的区域集合为
Figure 853754DEST_PATH_IMAGE060
,其中,出发地区域为
Figure 750166DEST_PATH_IMAGE061
,目的地区域为
Figure 749346DEST_PATH_IMAGE046
Figure 440221DEST_PATH_IMAGE062
,则,对于集合
Figure 649486DEST_PATH_IMAGE063
中的每一个区域
Figure 615168DEST_PATH_IMAGE064
,在时间段
Figure 734434DEST_PATH_IMAGE065
内,服务设施
Figure 858860DEST_PATH_IMAGE066
缺失的概率为
Figure 165207DEST_PATH_IMAGE067
S46、设在时间段
Figure 403422DEST_PATH_IMAGE065
内,
Figure 501828DEST_PATH_IMAGE068
为所有从区域
Figure 534506DEST_PATH_IMAGE069
出发和经过
Figure 328150DEST_PATH_IMAGE069
的轨迹用户集合,用户
Figure 494689DEST_PATH_IMAGE070
对应的行程轨迹为
Figure 588547DEST_PATH_IMAGE071
,那么
Figure 792126DEST_PATH_IMAGE069
在时间段
Figure 338645DEST_PATH_IMAGE065
内服务设施
Figure 915732DEST_PATH_IMAGE072
缺失的概率如下:
Figure 864097DEST_PATH_IMAGE073
其中,
Figure 769736DEST_PATH_IMAGE074
表示在区域
Figure 662606DEST_PATH_IMAGE069
中用户
Figure 46314DEST_PATH_IMAGE070
对应的行程轨迹
Figure 583605DEST_PATH_IMAGE071
里所隐含的服务设施
Figure 394566DEST_PATH_IMAGE072
缺失的概率,
Figure 774732DEST_PATH_IMAGE075
在区域
Figure 962131DEST_PATH_IMAGE069
中用户
Figure 353929DEST_PATH_IMAGE076
对应的行程轨迹
Figure 332862DEST_PATH_IMAGE077
里所隐含的服务设施
Figure 200324DEST_PATH_IMAGE078
缺失的概率;
对于区域
Figure 925834DEST_PATH_IMAGE069
,得到对应服务设施类别为
Figure 437718DEST_PATH_IMAGE079
的需求概率
Figure 590482DEST_PATH_IMAGE080
,定义为:
Figure 679661DEST_PATH_IMAGE081
其中,
Figure 208862DEST_PATH_IMAGE082
代表类别为c的具体服务设施
Figure 309673DEST_PATH_IMAGE072
Figure 23552DEST_PATH_IMAGE083
表示类别为c的设施集,
Figure 475393DEST_PATH_IMAGE084
表示区域
Figure 542706DEST_PATH_IMAGE069
中类别为c的服务设施
Figure 26252DEST_PATH_IMAGE072
的需求概率,
Figure 645452DEST_PATH_IMAGE085
表示区域
Figure 584590DEST_PATH_IMAGE069
中服务设施
Figure 455594DEST_PATH_IMAGE086
的需求概率。
作为本发明的进一步改进,所述步骤S5具体包括:
多层感知机的输入为区域空间潜在隐特征
Figure 796576DEST_PATH_IMAGE087
,全连接隐藏层的激活部分使用ReLU激活函数,多层感知机的输出通过归一化指数函数Softmax映射得到最终的设施需求概率,在时间区间段t内,该过程表示如下:
Figure 727623DEST_PATH_IMAGE088
Figure 278690DEST_PATH_IMAGE089
Figure 422227DEST_PATH_IMAGE090
其中,
Figure 617716DEST_PATH_IMAGE091
表示最终向多层感知机输入的时间段t内区域
Figure 844298DEST_PATH_IMAGE069
的潜在隐特征,
Figure 23606DEST_PATH_IMAGE092
为隐藏层的状态,
Figure 991342DEST_PATH_IMAGE093
Figure 41337DEST_PATH_IMAGE094
Figure 173241DEST_PATH_IMAGE095
Figure 574267DEST_PATH_IMAGE096
是需要学习的参数,
Figure 325185DEST_PATH_IMAGE097
代表了多层感知机的输出,
Figure 495266DEST_PATH_IMAGE098
是归一化指数函数的输出。
一种城市分区域内服务设施需求识别系统,采用如上所述的一种城市分区域内服务设施需求识别方法进行服务设施需求识别。
本发明的有益效果:由于城市区域发展的不平衡以及持续建设的需要,本发明采用基于变分图自编码器的区域设施需求预测模型,通过图结构表示城市区域划分的关联关系、除了用户轨迹所在的起止区域外还考虑了轨迹对经过的其他所有城市区域里的设施需求影响情况,能够准确的分析和识别区域内还缺少哪些服务设施;宏观层面,为城市管理者提供科学层面的决策参考,完善城市的功能布局和促进城市的健康发展,并改善城市的环境和交通等问题;微观层面,对于商户和居民,可以最大化城市资源的调配和利用,在提高商家经济收益的同时,也为居民提供了更加便捷的工作和生活服务。
附图说明
图1是本发明方法流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
参考图1,本发明提供了一种城市分区域内服务设施需求识别方法,包括以下步骤:
S1、基于各级行政区域划分方法对城市区域进行划分,并提取城市区域内的多维度特征;其中,多维度特征包括城市区域内的地理特征、交通特征及现有服务设施分布特征,所述交通特征包括用户轨迹特征;
S2、根据城市区域划分和提取的多维度特征,构建城市区域空间属性图;其中,所述城市区域空间属性图为城市区域之间的邻接关系所构成的无向图结构,图中的节点为每一个划分后的城市区域,节点之间的无向边表示区域地理空间上的邻接关系;
S3、采用变分图自编码器对城市区域空间属性图编码,得到城市区域的潜在隐特征;同时,根据城市区域之间的功能相似性,融合Top-k最相似功能城市区域的潜在隐特征;
S4、根据用户轨迹特征和用户轨迹目的地附近的服务设施,采用具有时空限制的贝叶斯模型,计算用户轨迹目的地的服务设施访问概率,得到用户轨迹访问特征;
S5、结合城市区域的潜在隐特征和用户轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的城市区域内服务设施需求概率分布。
城市的热点区域、服务设施和居民都是随着时间动态变化的,同时获取的各类数据也存在着稀疏性和不确定性等情况,为了解决这些问题与不足,从而能够准确的预测城市区域目前缺少的各类服务设施,提出了基于变分图自编码器的区域设施需求预测模型。具体来说,本发明先基于各级行政区划对城市区域进行划分,然后提取区域内的多维度特征,采用变分图自编码器对不确定的区域特征编码,并将每个潜在特征表示为概率分布形式;同时,根据区域之间的功能相似性,进一步融合Top-k区域的潜在特征;接下来,分析用户轨迹目的地附近设施的特性,采用贝叶斯概率方法推断目的地所访问的具体服务设施;最后,结合城市区域的潜在特征和用户的轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的区域设施需求概率分布。本发明能够准确的分析和识别区域内还缺少哪些服务设施,从而为城市管理者提供科学层面的决策参考,完善城市的功能布局和促进城市的健康发展,并改善城市的环境和交通等问题;对于商户和居民,可以最大化城市资源的调配和利用,在提高商家经济收益的同时,为居民提供了更加便捷的工作和生活服务。
下面通过具体步骤内容展开进行说明本发明包括的实施过程及效果:
一、城市区域的划分:
在城市的宏观规划中,不同的行政区域通常具有不同的主体功能定位,此外,由于行政管理主体的不同,即使是同一类功能的区域,在不同的行政区划下也可能会有一定的差异。因此,采用两级的行政区域划分方法,首先按照市辖区(一级行政区划)进行划分,然后在每一个市辖区内再按照行政街道(二级行政区划,例如镇、乡等)划分。最终划分后的所有区域集合可以表示为
Figure 63651DEST_PATH_IMAGE003
二、区域特征的提取与表示:
在城市两级行政划分的基础上,从区域的地理和交通统计信息、区域内现有服务设施分布这两大类具有代表性的特征入手进行处理。
2.1 人口和面积:
人口和面积从宏观层面描述了区域的特性,表示为特征向量M;
2.2 区域功能:
功能定位是区域的另一个宏观特征,对服务设施规划有着重要的影响。通过城市区域功能识别模型计算,最终得到的区域功能描述通过词嵌入(Word Embedding)技术编码,其特征向量表示为B;
2.3 房地产价格:
房地产价格是区域价值的一种重要体现,可以用未来时间段内的平均价值变动趋势来表示。采用最小二乘法(Least Squares Method)预测接下来一段时间内(如3个月)的房价变化趋势,并表示为向量形式V;
2.4 公共交通:
由于便捷和廉价等特性,公共交通是居民出行的首选方式之一,可以用来描述人群流量的整体移动模式。提取区域内的公交线路和地铁线路,以及对应站点的客流量信息,统一表示为向量O;
2.5 私人交通:
私人交通描述了居民个性化的移动模式,例如出租车和共享单车的行驶轨迹等,它是理解居民出行行为意图的主要数据源之一。通过区域内的轨迹流入量/流出量,以及车辆平均移动速度等信息来描述,特征向量表示为U;
2.6 区域服务设施分布网络:
为了描述区域内部现有服务设施的空间分布和类别配置等信息,对每一个城市区域建立一个基于路网空间距离的网络结构(图结构)。网络节点是服务设施类别,节点之间的边两两相连,边权重为节点服务设施类别对应的所有具体服务设施之间归一化的平均路网空间距离,形式化的表示为
Figure 686393DEST_PATH_IMAGE099
Figure 241003DEST_PATH_IMAGE100
为全连接网络,其中,
Figure 265590DEST_PATH_IMAGE101
表示服务设施类别集合,
Figure 4876DEST_PATH_IMAGE102
是节点的邻接矩阵,
Figure 111985DEST_PATH_IMAGE103
代表两个服务设施类别节点
Figure 939127DEST_PATH_IMAGE104
Figure 208434DEST_PATH_IMAGE105
包含的所有服务设施之间的路网平均距离,
Figure 993987DEST_PATH_IMAGE106
为节点的特征矩阵,且
Figure 856901DEST_PATH_IMAGE106
的每个元素都代表了区域内某一类服务设施的总数量。然后,再通过神经网络中的“压平”(Flatten)操作将
Figure 487734DEST_PATH_IMAGE100
转换为向量形式E。
接下来,将地理、交通和服务设施分布等统计特征信息连接在一起,综合的描述城市区域,最终的汇总特征向量表示为
Figure 345968DEST_PATH_IMAGE005
。对于某一类的单个向量不对齐情况,可以通过补零的方式将它们都对齐后再合并汇总。
三、区域属性图的构建:
在城市区域划分和区域特征提取的基础上,创建区域空间属性图,用于区域潜在空间隐特征的学习和表示。区域空间属性图是由城市区域之间的邻接关系所构成的无向图结构,图节点为每一个划分后的城市区域,节点之间的无向边表示区域地理空间上的邻接关系。形式化的定义为
Figure 302423DEST_PATH_IMAGE107
,其中,节点集
Figure 387054DEST_PATH_IMAGE108
是划分区域的集合,
Figure 946211DEST_PATH_IMAGE004
为邻接矩阵,表示节点之间的邻居关系,
Figure 799898DEST_PATH_IMAGE005
是区域内部代表性的汇总特征矩阵。结合区域之间的地理邻接关系,区域空间属性图
Figure 658745DEST_PATH_IMAGE109
的邻接矩阵
Figure 230671DEST_PATH_IMAGE004
可以定义为:
Figure 593520DEST_PATH_IMAGE007
四、用户轨迹目的地访问服务设施推断:
居民用户的日常交通出行轨迹一般都代表了他们的移动行为模式,根据用户出行轨迹目的地所要访问的服务设施,可以反向推断出用户的出行计划。然后,汇总区域内所有用户的出行目的地信息,就可以得到该区域(轨迹出发地)和所有经过区域里缺少的服务设施。然而,通过车辆传感器获得的用户出行轨迹数据信息是有限的,一般只包含了路线一系列位置点的GPS信息和时间戳,无法直接获得用户轨迹目的地具体访问的服务设施。因此,采用了一种基于时空限制的贝叶斯模型,计算用户轨迹行程目的地的服务设施访问概率。
给定一个用户的行为轨迹
Figure 567292DEST_PATH_IMAGE040
,贝叶斯概率推断模型首先选择轨迹目的地位置
Figure 599970DEST_PATH_IMAGE110
周围的在路网空间距离阈值
Figure 518247DEST_PATH_IMAGE042
内一系列服务设施作为访问推断候选设施集
Figure 560153DEST_PATH_IMAGE043
Figure 122852DEST_PATH_IMAGE111
Figure 592011DEST_PATH_IMAGE112
。然后,从四个方面考虑服务设施访问的影响因素:(1)路网距离;(2)服务设施流行时间段;(3)服务设施吸引力;(4)用户访问喜好。综合这四类影响因子,令用户
Figure 732005DEST_PATH_IMAGE045
的轨迹为
Figure 577601DEST_PATH_IMAGE040
,轨迹目的地位置
Figure 257457DEST_PATH_IMAGE110
所在的区域是
Figure 163096DEST_PATH_IMAGE046
Figure 55966DEST_PATH_IMAGE047
。因此,用户
Figure 439674DEST_PATH_IMAGE045
在轨迹目的地区域
Figure 976965DEST_PATH_IMAGE046
内访问了某个服务设施
Figure 787927DEST_PATH_IMAGE113
的概率可以表示为:
Figure 168092DEST_PATH_IMAGE049
其中,
Figure 89912DEST_PATH_IMAGE050
为位置点
Figure 481710DEST_PATH_IMAGE041
到服务设施
Figure 729152DEST_PATH_IMAGE048
的最短路网距离,
Figure 331034DEST_PATH_IMAGE051
为非负的参数;
Figure 319195DEST_PATH_IMAGE052
表示目的地时间戳
Figure 641198DEST_PATH_IMAGE053
对应的前后时间段
Figure 590700DEST_PATH_IMAGE054
Figure 961769DEST_PATH_IMAGE048
所属服务设施类别
Figure 753620DEST_PATH_IMAGE055
的流行度,从整个服务设施签到数据的设施类别分布中得出,其最终值表示为0~1之间的一个归一化权重;
Figure 244644DEST_PATH_IMAGE056
是服务设施
Figure 302730DEST_PATH_IMAGE048
的服务吸引力,通过用户对该服务设施的评价或打分等文本数据中提取分析得出,其最终值表示为0~1之间的一个归一化权重;
Figure 20150DEST_PATH_IMAGE057
是用户
Figure 212097DEST_PATH_IMAGE045
对服务设施类别为
Figure 432994DEST_PATH_IMAGE058
的访问喜好程度,从用户对所有服务设施签到记录中和服务设施类别为
Figure 927561DEST_PATH_IMAGE058
的签到之比得出,其最终值表示为0~1之间的一个归一化权重;
根据以上公式,首先可以求得用户对行程轨迹目的位置点
Figure 991332DEST_PATH_IMAGE041
附近的距离阈值
Figure 596756DEST_PATH_IMAGE042
范围内所有服务设施
Figure 672160DEST_PATH_IMAGE048
的访问概率,然后再反向推断出用户轨迹对应区域内缺少的服务设施概率。
为了提高预测准确性,不仅考虑了用户轨迹出发位置
Figure 727841DEST_PATH_IMAGE059
所在区域的服务设施缺失情况,除了轨迹目的地位置点
Figure 154274DEST_PATH_IMAGE041
所在的区域
Figure 318318DEST_PATH_IMAGE046
之外,轨迹经过的其他所有区域也都认为需求对应的服务设施:令用户
Figure 638441DEST_PATH_IMAGE045
在其行程轨迹
Figure 740389DEST_PATH_IMAGE040
中顺序经过的区域集合为
Figure 388539DEST_PATH_IMAGE060
,其中,出发地区域为
Figure 601346DEST_PATH_IMAGE061
,目的地区域为
Figure 775975DEST_PATH_IMAGE046
Figure 783246DEST_PATH_IMAGE062
,则,对于集合
Figure 184271DEST_PATH_IMAGE063
中的每一个区域
Figure 59823DEST_PATH_IMAGE064
,在时间段
Figure 964325DEST_PATH_IMAGE065
内,服务设施
Figure 142497DEST_PATH_IMAGE066
缺失的概率为
Figure 155452DEST_PATH_IMAGE067
。设在时间段
Figure 441553DEST_PATH_IMAGE065
内,
Figure 466140DEST_PATH_IMAGE068
为所有从区域
Figure 205426DEST_PATH_IMAGE069
出发和经过
Figure 315465DEST_PATH_IMAGE069
的轨迹用户集合,用户
Figure 142606DEST_PATH_IMAGE070
对应的行程轨迹为
Figure 411914DEST_PATH_IMAGE071
,那么
Figure 666309DEST_PATH_IMAGE069
在时间段
Figure 263643DEST_PATH_IMAGE065
内服务设施
Figure 284689DEST_PATH_IMAGE072
缺失的概率可以表示如下:
Figure 283869DEST_PATH_IMAGE073
其中,
Figure 974744DEST_PATH_IMAGE074
表示在区域
Figure 184009DEST_PATH_IMAGE069
中用户
Figure 615603DEST_PATH_IMAGE070
对应的行程轨迹
Figure 203710DEST_PATH_IMAGE071
里所隐含的服务设施
Figure 455700DEST_PATH_IMAGE072
缺失的概率,
Figure 762047DEST_PATH_IMAGE075
在区域
Figure 262DEST_PATH_IMAGE069
中用户
Figure 833089DEST_PATH_IMAGE076
对应的行程轨迹
Figure 865767DEST_PATH_IMAGE077
里所隐含的服务设施
Figure 924990DEST_PATH_IMAGE078
缺失的概率;
对于区域
Figure 825949DEST_PATH_IMAGE069
,也可以得到对应服务设施类别为
Figure 654228DEST_PATH_IMAGE079
的需求概率
Figure 857808DEST_PATH_IMAGE080
,定义为:
Figure 263381DEST_PATH_IMAGE081
其中,
Figure 106048DEST_PATH_IMAGE082
代表类别为c的具体服务设施
Figure 523254DEST_PATH_IMAGE072
Figure 287947DEST_PATH_IMAGE083
表示类别为c的设施集,
Figure 790604DEST_PATH_IMAGE084
表示区域
Figure 908733DEST_PATH_IMAGE069
中类别为c的服务设施
Figure 836237DEST_PATH_IMAGE072
的需求概率,
Figure 647199DEST_PATH_IMAGE085
表示区域
Figure 637151DEST_PATH_IMAGE069
中服务设施
Figure 683605DEST_PATH_IMAGE086
的需求概率。
五、区域特征的嵌入和动态表示:
为了处理城市区域众多的原始特征,采用无监督模型中的变分图自编码器(Variational Graph Auto-Encoder,VGAE),将区域空间属性图
Figure 75403DEST_PATH_IMAGE109
的原始节点特征映射至低维度的潜在空间,从而得到节点区域的潜在特征嵌入,支撑接下来的服务设施需求预测任务。在变分图自编码器的编码阶段,通过两层图卷积,使模型学习得到区域潜在隐特征的正态分布,然后再从这些正态分布中采样获得真正的区域隐特征表示;在解码阶段,使用向量内积操作,将编码阶段得到的区域隐特征向量重构并还原为区域空间属性图
Figure 57265DEST_PATH_IMAGE114
的邻接矩阵
Figure 659148DEST_PATH_IMAGE115
VGAE的编码部分包含两层图卷积操作,第一层图卷积将整个区域空间属性图
Figure 381729DEST_PATH_IMAGE107
作为输入,得到低维空间的特征矩阵
Figure 893613DEST_PATH_IMAGE008
,该过程表示如下:
Figure 905431DEST_PATH_IMAGE009
其中,
Figure 869976DEST_PATH_IMAGE010
Figure 399178DEST_PATH_IMAGE115
的对角度矩阵,
Figure 890202DEST_PATH_IMAGE011
是可学习的权重矩阵,激活层使用了ReLU激活函数。
根据变分图自编码器的定义,潜在空间隐特征z是从一个高斯先验分布中采样得到的,因此第二层图卷积用于评估这个先验分布的两个参数。该层的输入为
Figure 948288DEST_PATH_IMAGE008
Figure 665708DEST_PATH_IMAGE115
,输出为多维高斯分布的均值向量
Figure 857655DEST_PATH_IMAGE012
和协方差矩阵
Figure 812972DEST_PATH_IMAGE013
,整个计算过程定义为:
Figure 573118DEST_PATH_IMAGE014
其中,
Figure 371310DEST_PATH_IMAGE116
为可学习的权重矩阵。
在隐特征
Figure 973805DEST_PATH_IMAGE117
的生成阶段,采用重参数化技巧(Reparameterization Trick)近似采样操作。将变量的随机性转移到高斯分布的元变量中,使原先无法求导或不能梯度传播的中间节点可以求导,而模型需要学习的是如何将高斯分布的均值和方差进行调整。要求的隐特征可以表示为:
Figure 314788DEST_PATH_IMAGE118
其中,
Figure 370468DEST_PATH_IMAGE017
服从标准正态分布
Figure 531322DEST_PATH_IMAGE018
,那么
Figure 206017DEST_PATH_IMAGE118
也就服从正态分布
Figure 260561DEST_PATH_IMAGE119
。因此,先采样一个标准正态分布
Figure 96930DEST_PATH_IMAGE017
,再通过
Figure 745080DEST_PATH_IMAGE120
变换就可以得到隐特征z。
六、潜在特征的融合:
基于变分图自编码器对区域空间属性图编码,能够充分利用邻居区域的特征信息,得到节点合适的潜在特征分布表示。然而,由于两层图卷积的局部性,并不能捕捉位于较远空间距离但功能相似的区域之间的关联性。因此,考虑城市区域的全局关系,引入基于全局空间关联的区域特征融合模块,通过整合Top-k最相似功能区域的特征,使得区域的潜在空间隐特征具有更加完善的表达性。
在区域特征的融合过程中,首先使用区域功能识别框架DRoF,计算所有区域
Figure 82520DEST_PATH_IMAGE121
对应的功能分布向量
Figure 132516DEST_PATH_IMAGE021
。令当前的城市区域为
Figure 405366DEST_PATH_IMAGE022
,计算
Figure 537882DEST_PATH_IMAGE022
和其所在的一级行政区(市辖区)之外其他所有区域
Figure 679013DEST_PATH_IMAGE023
的功能相似度
Figure 849095DEST_PATH_IMAGE024
。设
Figure 27266DEST_PATH_IMAGE025
Figure 915588DEST_PATH_IMAGE022
Figure 594831DEST_PATH_IMAGE023
的最短路网距离,那么有:
Figure 619419DEST_PATH_IMAGE026
其中,
Figure 968492DEST_PATH_IMAGE122
Figure 78530DEST_PATH_IMAGE022
Figure 561464DEST_PATH_IMAGE023
的功能分布向量
Figure 174979DEST_PATH_IMAGE123
Figure 957603DEST_PATH_IMAGE124
的余弦相似度,
Figure 679571DEST_PATH_IMAGE125
Figure 310404DEST_PATH_IMAGE033
内两个路网距离最远区域之间的最短路网距离,
Figure 309584DEST_PATH_IMAGE034
则表示
Figure 390672DEST_PATH_IMAGE022
Figure 209724DEST_PATH_IMAGE023
之间归一化的最短路网距离。
基于功能相似度
Figure 644247DEST_PATH_IMAGE024
从大到小对所有被评估的区域排序,就可以得到Top-k最相关功能的区域集合
Figure 622568DEST_PATH_IMAGE035
。然后,将它们的采样隐特征向量与区域
Figure 484344DEST_PATH_IMAGE022
的采样隐特征向量融合,即可得到
Figure 56271DEST_PATH_IMAGE022
最终的隐特征向量表示:
Figure 153540DEST_PATH_IMAGE036
其中,
Figure 861733DEST_PATH_IMAGE037
是所有区域之间共享且可学习的权重参数矩阵,代表了区域
Figure 180498DEST_PATH_IMAGE022
Figure 98776DEST_PATH_IMAGE023
之间隐特征的相关性。
Figure 140681DEST_PATH_IMAGE038
Figure 703381DEST_PATH_IMAGE039
分别代表了区域
Figure 297173DEST_PATH_IMAGE028
与区域
Figure 578113DEST_PATH_IMAGE029
的采样隐特征向量,同时,
Figure 892550DEST_PATH_IMAGE038
本身作为隐特征融合的一部分参与计算。
七、区域服务设施的需求预测:
城市区域设施需求预测的目的是分析区域内目前还缺少哪些服务设施,从具体服务设施(Brand)和服务设施类别(Category)两个方面分别预测它们的需求概率分布情况。从设施类别角度考虑,可能有快餐店、学校、加油站或超市等服务设施大类。而从服务设施的角度考虑,则需要预测设施类别里面的具体品牌,例如快餐店可能包含了肯德基、麦当劳、德克士和必胜客等,学校也可能包含了幼儿园、小学和中学等。因此,对于区域设施需求的预测结果,设施类别的概率分布结果为一个向量,每个向量元素代表了一种服务设施类别;服务设施的概率分布结果为一个矩阵,矩阵的每一行为一种设施类别,每一列为一种具体的设施品牌。此外,设施需求预测问题还要考虑时间片的影响,例如,以周次或者月份为时间片,在若干个连续的周次或者若干个月份之间,识别区域内设施需求的概率变化情况。
在区域服务设施需求预测模型的输出阶段,采用了具有一个隐藏层的多层感知机(Multi-Layer Perceptron,MLP)和归一化指数函数(Softmax)以获得最终的概率分布结果。多层感知机的输入为区域潜在空间隐特征
Figure 699969DEST_PATH_IMAGE126
,全连接隐藏层的激活部分使用了ReLU激活函数,多层感知机的输出通过Softmax映射得到最终的设施需求概率。在时间片t内,该过程表示如下:
Figure 74450DEST_PATH_IMAGE088
Figure 842686DEST_PATH_IMAGE089
Figure 351028DEST_PATH_IMAGE090
其中,
Figure 888319DEST_PATH_IMAGE091
表示最终向多层感知机输入的时间段t内区域
Figure 696351DEST_PATH_IMAGE069
的潜在隐特征,
Figure 810937DEST_PATH_IMAGE092
为隐藏层的状态,
Figure 732757DEST_PATH_IMAGE093
Figure 390135DEST_PATH_IMAGE094
Figure 231052DEST_PATH_IMAGE095
Figure 708300DEST_PATH_IMAGE096
是需要学习的参数,
Figure 292866DEST_PATH_IMAGE097
代表了多层感知机的输出,
Figure 804749DEST_PATH_IMAGE098
是归一化指数函数的输出。
近年来,传感器技术和位置社交网络得到了迅速的发展与应用。通过GPS设备,移动对象越来越多的时空轨迹数据都被记录下来,例如出租车、私家车和共享单车等的行驶轨迹数据。此外,社交媒体网络平台的使用也十分普遍,例如新浪微博和豆瓣等,越来越多的用户在这些平台上相互关注并发布了大量的内容数据。这些社交媒体含有关于用户行为的丰富信息,主要包括了以图结构表示的社会网络,代表用户之间的关注关系、相互依赖或交往互动,以及由用户主动生成的位置社交媒体数据,例如签到文本、照片和视频等。因此,充分融合与利用城市的宏观结构大数据和居民的微观行为活动数据,能够准确的预测城市区域目前缺少的服务设施,供城市管理者决策参考使用。
本发明还提供了一种城市分区域内服务设施需求识别系统,采用如上所述的一种城市分区域内服务设施需求识别方法进行服务设施需求识别。原理和过程一致,重复之处不再赘述,可根据功能性将系统分为四个模块:
输入模块,包括原有服务设施信息输入、城市区域统计信息、城市区域路网信息和用户及公共交通时空轨迹等基本信息输入;
预处理模块,包括城市区域的划分、区域特征的提取与表示、区域属性图的构建和用户轨迹目的地访问服务设施推断;
图特征嵌入模块,包括区域特征的嵌入和动态表示,以及区域潜在隐特征的融合;
需求预测输出模块,用于区域服务设施的需求预测。
本发明采用图结构表示城市区域划分的关联关系,使用一种时空限制的贝叶斯模型推断用户轨迹目的地访问设施的概率,变分图自编码器生成区域潜在隐特征的概率分布,除了用户轨迹所在的起止区域外,还考虑了轨迹对经过的其他所有城市区域里的设施需求影响情况,克服了城市的热点区域、服务设施和居民都是随着时间动态变化的,各类数据存在稀疏性和不确定性的问题,准确的分析和识别区域内服务设施,从城市全局视角出发,识别不同区域内的各类服务设施需求,对于城市管理者、商户和居民等都具有重要的意义。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims (9)

1.一种城市分区域内服务设施需求识别方法,其特征在于:包括以下步骤:
S1、基于各级行政区域划分方法对城市区域进行划分,并提取城市区域内的多维度特征;其中,多维度特征包括城市区域内的地理特征、交通特征及现有服务设施分布特征,所述交通特征包括用户轨迹特征;
S2、根据城市区域划分和提取的多维度特征,构建城市区域空间属性图;其中,所述城市区域空间属性图为城市区域之间的邻接关系所构成的无向图结构,图中的节点为每一个划分后的城市区域,节点之间的无向边表示区域地理空间上的邻接关系;
S3、采用变分图自编码器对城市区域空间属性图编码,得到城市区域的潜在隐特征;同时,根据城市区域之间的功能相似性,融合Top-k最相似功能城市区域的潜在隐特征;
S4、根据用户轨迹特征和用户轨迹目的地附近的服务设施,采用具有时空限制的贝叶斯模型,计算用户轨迹目的地的服务设施访问概率,得到用户轨迹访问特征;
S5、结合城市区域的潜在隐特征和用户轨迹访问特征,通过多层感知机和归一化指数函数,得到最终的城市区域内服务设施需求概率分布;
所述步骤S4具体包括以下步骤:
S41、给定一个用户的时空行为轨迹
Figure DEST_PATH_IMAGE001
,贝叶斯概率推断模型首先选择轨迹目的地位置点
Figure DEST_PATH_IMAGE002
周围的在路网空间距离阈值
Figure DEST_PATH_IMAGE003
内一系列服务设施作为访问推断候选设施集
Figure DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
S42、定义服务设施访问的影响因素:路网距离、服务设施流行时间段、服务设施吸引力和用户访问喜好;综合影响因素因子,令用户
Figure DEST_PATH_IMAGE006
的轨迹为
Figure 341335DEST_PATH_IMAGE001
,轨迹目的地位置点
Figure 992897DEST_PATH_IMAGE002
所在的区域是
Figure DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE008
S43、用户
Figure 585683DEST_PATH_IMAGE006
在轨迹目的地区域
Figure 449734DEST_PATH_IMAGE007
内访问了某个服务设施
Figure DEST_PATH_IMAGE009
的概率表示为:
Figure DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE011
为位置点
Figure 670631DEST_PATH_IMAGE002
到服务设施
Figure 227514DEST_PATH_IMAGE009
的最短路网距离,
Figure DEST_PATH_IMAGE012
为非负的参数;
Figure DEST_PATH_IMAGE013
表示目的地时间戳
Figure DEST_PATH_IMAGE014
对应的前后时间段
Figure DEST_PATH_IMAGE015
Figure 104334DEST_PATH_IMAGE009
所属服务设施类别
Figure DEST_PATH_IMAGE016
的流行度,从整个服务设施签到数据的设施类别分布中得出,其最终值表示为0~1之间的一个归一化权重;
Figure DEST_PATH_IMAGE017
是服务设施
Figure 631131DEST_PATH_IMAGE009
的服务吸引力,通过用户对该服务设施的评价或打分文本数据中提取分析得出,其最终值表示为0~1之间的一个归一化权重;
Figure DEST_PATH_IMAGE018
是用户
Figure 378638DEST_PATH_IMAGE006
对服务设施类别为
Figure DEST_PATH_IMAGE019
的访问喜好程度,从用户对所有服务设施签到记录中和服务设施类别为
Figure 699898DEST_PATH_IMAGE019
的服务设施的签到之比得出,其最终值表示为0~1之间的一个归一化权重;
S44、根据以上S43中公式,求得用户对行程轨迹目的位置点
Figure 923069DEST_PATH_IMAGE002
附近的距离阈值
Figure 4288DEST_PATH_IMAGE003
范围内所有服务设施
Figure 262094DEST_PATH_IMAGE009
的访问概率,再反向推断出用户轨迹对应区域内缺少的服务设施概率;
S45、综合用户轨迹出发位置点
Figure DEST_PATH_IMAGE020
所在区域的服务设施缺失情况,除了轨迹目的地位置点
Figure 754256DEST_PATH_IMAGE002
所在的区域
Figure 464723DEST_PATH_IMAGE007
之外,轨迹经过的其他所有区域也都认为需求对应的服务设施:令用户
Figure 84054DEST_PATH_IMAGE006
在其行程轨迹
Figure 461946DEST_PATH_IMAGE001
中顺序经过的区域集合为
Figure DEST_PATH_IMAGE021
,其中,出发地区域为
Figure DEST_PATH_IMAGE022
,目的地区域为
Figure 859429DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE023
,则,对于集合
Figure DEST_PATH_IMAGE024
中的每一个区域
Figure DEST_PATH_IMAGE025
,在时间段
Figure DEST_PATH_IMAGE026
内,服务设施
Figure DEST_PATH_IMAGE027
缺失的概率为
Figure DEST_PATH_IMAGE028
S46、设在时间段
Figure 198138DEST_PATH_IMAGE026
内,
Figure DEST_PATH_IMAGE029
为所有从区域
Figure DEST_PATH_IMAGE030
出发和经过
Figure 90001DEST_PATH_IMAGE030
的轨迹用户集合,用户
Figure DEST_PATH_IMAGE031
对应的行程轨迹为
Figure DEST_PATH_IMAGE032
,那么
Figure 260083DEST_PATH_IMAGE030
在时间段
Figure 766150DEST_PATH_IMAGE026
内服务设施
Figure DEST_PATH_IMAGE033
缺失的概率如下:
Figure DEST_PATH_IMAGE034
其中,
Figure DEST_PATH_IMAGE035
表示在区域
Figure 513526DEST_PATH_IMAGE030
中用户
Figure 130453DEST_PATH_IMAGE031
对应的行程轨迹
Figure 827144DEST_PATH_IMAGE032
里所隐含的服务设施
Figure 504113DEST_PATH_IMAGE033
缺失的概率,
Figure DEST_PATH_IMAGE036
表示在区域
Figure 269944DEST_PATH_IMAGE030
中用户
Figure DEST_PATH_IMAGE037
对应的行程轨迹
Figure DEST_PATH_IMAGE038
里所隐含的服务设施
Figure DEST_PATH_IMAGE039
缺失的概率;
对于区域
Figure 238031DEST_PATH_IMAGE030
,得到对应服务设施类别为
Figure DEST_PATH_IMAGE040
的需求概率
Figure DEST_PATH_IMAGE042
,定义为:
Figure DEST_PATH_IMAGE041
其中,
Figure DEST_PATH_IMAGE043
代表类别为c的具体服务设施
Figure 585967DEST_PATH_IMAGE033
Figure DEST_PATH_IMAGE044
表示类别为c的设施集,
Figure DEST_PATH_IMAGE045
表示区域
Figure 761733DEST_PATH_IMAGE030
中类别为c的服务设施
Figure 31172DEST_PATH_IMAGE033
的需求概率,
Figure DEST_PATH_IMAGE046
表示区域
Figure 724321DEST_PATH_IMAGE030
中服务设施
Figure DEST_PATH_IMAGE047
的需求概率,C为服务设施类别集合。
2.如权利要求1所述的一种城市分区域内服务设施需求识别方法,其特征在于:采用两级的行政区域划分方法对城市区域进行划分,包括:
按照第一级行政区域进行划分,在每一个第一级行政区域内再按照第二级行政区域划分,最终划分所有城市区域,其中,第一级行政区域包括市辖区,第二级行政区域包括行政街道、镇和乡。
3.如权利要求1所述的一种城市分区域内服务设施需求识别方法,其特征在于:所述地理特征包括:人口面积特征向量M、区域功能特征向量B和房地产价格特征向量V;
所述交通特征包括:公共交通特征向量O和私人交通特征向量U;其中,所述私人交通特征向量U包括用户轨迹特征;
所述现有服务设施分布特征为对每一个城市区域建立一个基于路网空间距离的网络结构向量E,网络节点为服务设施类别,网络节点之间的边两两相连,边权重为节点服务设施类别对应的所有具体服务设施之间归一化的平均路网空间距离。
4.如权利要求3所述的一种城市分区域内服务设施需求识别方法,其特征在于:所述城市区域空间属性图表示为
Figure DEST_PATH_IMAGE048
,其中,节点集
Figure DEST_PATH_IMAGE049
是划分的城市区域的集合,
Figure DEST_PATH_IMAGE050
,m是划分区域的个数,
Figure DEST_PATH_IMAGE051
为邻接矩阵表示节点之间的邻居关系,
Figure DEST_PATH_IMAGE052
是区域内部代表性的汇总特征矩阵;结合区域之间的地理邻接关系,城市区域空间属性图
Figure DEST_PATH_IMAGE053
的邻接矩阵
Figure 457922DEST_PATH_IMAGE051
为:
Figure DEST_PATH_IMAGE054
5.如权利要求4所述的一种城市分区域内服务设施需求识别方法,其特征在于:所述步骤S3中采用无监督模型中的变分图自编码器将城市区域空间属性图
Figure 820902DEST_PATH_IMAGE053
的原始节点特征映射至低维度的潜在空间,从而得到节点区域的潜在特征嵌入;其中,在变分图自编码的编码阶段,通过两层图卷积,使模型学习得到区域潜在隐特征的正态分布,然后再从正态分布中采样获得真正的区域潜在隐特征表示;在解码阶段,使用向量内积操作,将编码阶段得到的区域潜在隐特征向量重构并还原为城市区域空间属性图的邻接矩阵
Figure 967849DEST_PATH_IMAGE051
6.如权利要求5所述的一种城市分区域内服务设施需求识别方法,其特征在于:获得真正的区域潜在隐特征表示,具体包括以下步骤:
变分图自编码的编码部分包含两层图卷积操作:第一层图卷积将整个区域空间属性图
Figure 854903DEST_PATH_IMAGE048
作为输入,得到低维空间的特征矩阵
Figure DEST_PATH_IMAGE055
,过程表示如下:
Figure DEST_PATH_IMAGE056
其中,
Figure DEST_PATH_IMAGE057
Figure 318376DEST_PATH_IMAGE051
的对角度矩阵,
Figure DEST_PATH_IMAGE058
是可学习的权重矩阵,激活层使用了ReLU激活函数;
根据变分图自编码器的定义,潜在隐特征从一个高斯先验分布中采样得到的,第二层图卷积用于评估该先验分布的两个参数,该层的输入为
Figure 835945DEST_PATH_IMAGE055
Figure 470189DEST_PATH_IMAGE051
,输出为多维高斯分布的均值向量
Figure DEST_PATH_IMAGE059
和协方差矩阵
Figure DEST_PATH_IMAGE060
,整个计算过程为:
Figure DEST_PATH_IMAGE061
其中,
Figure DEST_PATH_IMAGE062
为可学习的权重矩阵;
在潜在隐特征的生成阶段,采用重参数化技巧近似采样操作:将变量的随机性转移到高斯分布的元变量中,模型通过学习将高斯分布的均值和方差进行调整,要求的真正的区域潜在隐特征表示为:
Figure DEST_PATH_IMAGE063
其中,
Figure DEST_PATH_IMAGE064
服从标准正态分布
Figure DEST_PATH_IMAGE065
,则
Figure 724715DEST_PATH_IMAGE063
服从正态分布
Figure DEST_PATH_IMAGE066
,先采样一个标准正态分布
Figure 619858DEST_PATH_IMAGE064
,再通过
Figure DEST_PATH_IMAGE067
变换得到真正的区域潜在隐特征z。
7.如权利要求1所述的一种城市分区域内服务设施需求识别方法,其特征在于:根据城市区域之间的功能相似性,融合Top-k最相似功能城市区域的潜在隐特征,具体包括以下步骤:
采用区域功能识别框架DRoF,计算所有区域
Figure 183695DEST_PATH_IMAGE050
对应的功能分布向量
Figure DEST_PATH_IMAGE068
令当前的城市区域为
Figure DEST_PATH_IMAGE069
,计算
Figure 383863DEST_PATH_IMAGE069
和其所在的一级行政区之外其他所有区域
Figure DEST_PATH_IMAGE070
的功能相似度
Figure DEST_PATH_IMAGE071
Figure DEST_PATH_IMAGE072
Figure 425769DEST_PATH_IMAGE069
Figure 50785DEST_PATH_IMAGE070
的最短路网距离,则:
Figure DEST_PATH_IMAGE073
其中,
Figure DEST_PATH_IMAGE074
Figure DEST_PATH_IMAGE075
Figure DEST_PATH_IMAGE076
的功能分布向量
Figure DEST_PATH_IMAGE077
Figure DEST_PATH_IMAGE078
的余弦相似度,
Figure DEST_PATH_IMAGE079
Figure DEST_PATH_IMAGE080
内两个路网距离最远区域之间的最短路网距离,
Figure DEST_PATH_IMAGE081
则表示
Figure 254364DEST_PATH_IMAGE075
Figure 472987DEST_PATH_IMAGE076
之间归一化的最短路网距离;
基于功能相似度
Figure 380900DEST_PATH_IMAGE071
从大到小对所有被评估的区域排序,得到Top-k最相关功能的区域集合
Figure DEST_PATH_IMAGE082
Figure 719478DEST_PATH_IMAGE082
内所有的采样变换隐特征向量与区域
Figure 421855DEST_PATH_IMAGE075
的采样变换隐特征向量融合,即得到区域
Figure 986828DEST_PATH_IMAGE075
最终的潜在隐特征向量表示:
Figure DEST_PATH_IMAGE083
其中,
Figure DEST_PATH_IMAGE084
是所有区域之间共享且可学习的权重参数矩阵,代表区域
Figure 777061DEST_PATH_IMAGE075
Figure 235724DEST_PATH_IMAGE076
之间采样变换隐特征的相关性;
Figure DEST_PATH_IMAGE085
Figure DEST_PATH_IMAGE086
分别代表了区域
Figure 577844DEST_PATH_IMAGE075
与区域
Figure 482042DEST_PATH_IMAGE076
的采样变换隐特征向量,同时,
Figure 200599DEST_PATH_IMAGE085
本身作为隐特征融合的一部分参与计算。
8.如权利要求1所述的一种城市分区域内服务设施需求识别方法,其特征在于:所述步骤S5具体包括:
多层感知机的输入为区域空间最终的潜在隐特征
Figure DEST_PATH_IMAGE087
,1≤i≤m,全连接隐藏层的激活部分使用ReLU激活函数,多层感知机的输出通过归一化指数函数Softmax映射得到最终的设施需求概率,在时间区间段t内,过程表示如下:
Figure DEST_PATH_IMAGE088
Figure DEST_PATH_IMAGE089
Figure DEST_PATH_IMAGE090
其中,
Figure DEST_PATH_IMAGE091
表示向多层感知机输入的时间段t内区域
Figure 326818DEST_PATH_IMAGE030
最终的潜在隐特征,
Figure DEST_PATH_IMAGE092
为隐藏层的状态,
Figure DEST_PATH_IMAGE093
Figure DEST_PATH_IMAGE094
Figure DEST_PATH_IMAGE095
Figure DEST_PATH_IMAGE096
是需要学习的参数,
Figure DEST_PATH_IMAGE097
代表了多层感知机的输出,
Figure DEST_PATH_IMAGE098
是归一化指数函数的输出,即
Figure 105418DEST_PATH_IMAGE098
表示时间段t内区域
Figure 644984DEST_PATH_IMAGE030
的设施需求概率。
9.一种城市分区域内服务设施需求识别系统,其特征在于:采用如权利要求1-8中任一项所述的一种城市分区域内服务设施需求识别方法进行服务设施需求识别。
CN202210812583.2A 2022-07-12 2022-07-12 一种城市分区域内服务设施需求识别方法及系统 Active CN114897444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210812583.2A CN114897444B (zh) 2022-07-12 2022-07-12 一种城市分区域内服务设施需求识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210812583.2A CN114897444B (zh) 2022-07-12 2022-07-12 一种城市分区域内服务设施需求识别方法及系统

Publications (2)

Publication Number Publication Date
CN114897444A CN114897444A (zh) 2022-08-12
CN114897444B true CN114897444B (zh) 2022-10-04

Family

ID=82729608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210812583.2A Active CN114897444B (zh) 2022-07-12 2022-07-12 一种城市分区域内服务设施需求识别方法及系统

Country Status (1)

Country Link
CN (1) CN114897444B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689106A (zh) * 2022-10-14 2023-02-03 中国测绘科学研究院 复杂网络视角的区域空间结构定量识别方法、装置及设备
CN115880036B (zh) * 2023-02-23 2023-06-06 山东金潮交通设施有限公司 一种车位级动态共享智能管控交易平台
CN117132178B (zh) * 2023-10-27 2023-12-29 南京国准数据有限责任公司 一种基于智慧城市的场景应用模型构建方法
CN117829375B (zh) * 2024-02-29 2024-05-28 华侨大学 城际往返客运的多区域需求预测方法、装置、设备和介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834666A (zh) * 2015-03-06 2015-08-12 中山大学 基于路网和兴趣点的声环境功能区划分方法
CN110046787A (zh) * 2019-01-15 2019-07-23 重庆邮电大学 一种城市区域电动汽车充电需求时空预测方法
CN109902930B (zh) * 2019-01-28 2023-06-27 同济大学 一种基于实有人口指标的配套设施规划辅助系统
CN111382224B (zh) * 2020-03-06 2022-06-21 厦门大学 一种基于多源数据融合的城市区域功能智能识别方法
CN112989080A (zh) * 2021-04-25 2021-06-18 西湖大学 基于图测地相似度的图节点嵌入方法

Also Published As

Publication number Publication date
CN114897444A (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
Ma et al. Analyzing driving factors of land values in urban scale based on big data and non-linear machine learning techniques
Yuan et al. A survey of traffic prediction: from spatio-temporal data to intelligent transportation
Zhong et al. Inferring building functions from a probabilistic model using public transportation data
CN114897444B (zh) 一种城市分区域内服务设施需求识别方法及系统
Wang et al. Unsupervised machine learning in urban studies: A systematic review of applications
Thakuriah et al. Introduction to seeing cities through big data: Research, methods and applications in urban informatics
Sun et al. DxNAT—Deep neural networks for explaining non-recurring traffic congestion
Jiang et al. Geospatial analysis and modelling of urban structure and dynamics
Besussi et al. The structure and form of urban settlements
US20160125307A1 (en) Air quality inference using multiple data sources
Chang et al. Understanding user’s travel behavior and city region functions from station-free shared bike usage data
McKenzie et al. Measuring urban regional similarity through mobility signatures
Gong et al. Agent-based modelling with geographically weighted calibration for intra-urban activities simulation using taxi GPS trajectories
Guo et al. A deep spatio-temporal learning network for continuous citywide air quality forecast based on dense monitoring data
Wang et al. Using space syntax and information visualization for spatial behavior analysis and simulation
Banihashemi et al. Data-centric regenerative built environment: big data for sustainable regeneration
Hu et al. Uncovering the association between traffic crashes and street-level built-environment features using street view images
CN110309953B (zh) 采用目标流动性分布预测的城市安防监控布局系统及方法
Behara Origin-destination matrix estimation using big traffic data: A structural perspective
Zhong et al. Spatiotemporal multi-task learning for citywide passenger flow prediction
Mohammadi et al. Probabilistic prediction of trip travel time and its variability using hierarchical Bayesian learning
Liu et al. Comparing spatial interaction models and flow interpolation techniques for predicting “cold start” bike‐share trip demand
CN115545758A (zh) 城市服务设施自适应增量选址的方法和系统
Zhou et al. Refined taxi demand prediction with ST-Vec
Dorosan et al. Use of machine learning in understanding transport dynamics of land use and public transportation in a developing city

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant