CN117151322A - 城市属性的获取方法、装置及计算机可读存储介质 - Google Patents

城市属性的获取方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN117151322A
CN117151322A CN202310751827.5A CN202310751827A CN117151322A CN 117151322 A CN117151322 A CN 117151322A CN 202310751827 A CN202310751827 A CN 202310751827A CN 117151322 A CN117151322 A CN 117151322A
Authority
CN
China
Prior art keywords
data
city
mobile communication
public transportation
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310751827.5A
Other languages
English (en)
Other versions
CN117151322B (zh
Inventor
吴乃星
周剑明
蔡勇
秦保根
黄啟志
卢忱
甘玉玺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Corp Ltd Shenzhen Branch
Original Assignee
China United Network Communications Corp Ltd Shenzhen Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Corp Ltd Shenzhen Branch filed Critical China United Network Communications Corp Ltd Shenzhen Branch
Priority to CN202310751827.5A priority Critical patent/CN117151322B/zh
Publication of CN117151322A publication Critical patent/CN117151322A/zh
Application granted granted Critical
Publication of CN117151322B publication Critical patent/CN117151322B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了城市属性的获取方法、装置及计算机可读存储介质,包括步骤:S1:采集城市内移动通信数据、公共交通数据;S2:对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量;S3:将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型;S4:通过计算和综合分析,得出城市的属性信息,包括人口密度值、人口流动性值;S5:可视化展示,将计算得出的城市属性信息进行整理和输出至LCD显示屏;S6:结束。本申请通过采用利用随机森林算法从预处理后的人口移动数据中提取特征,采用改进双线性插值算法生成具有视觉效果的图像,考虑距离等因素,大大增强了计算效率。

Description

城市属性的获取方法、装置及计算机可读存储介质
技术领域
本发明涉及城市属性判断领域,具体涉及一种城市属性的获取方法、装置及计算机可读存储介质。
背景技术
人口迁移是当今社会中的重要现象,对城市规划和社会管理具有重要意义。然而,传统的人口迁移数据分析方法存在信息量大、处理复杂等问题,难以直观地展示人口迁移的模式和规律。因此,需要一种新的方法和系统,能够利用图像处理技术将人口迁移数据转化为直观的图像形式,以便决策者能够更好地理解和分析人口迁移的动态变化。
且现有技术中的人口移动演化的显示方法,只是根据人口移动量和移动频率等简单的进行数据呈现,而没有将人口移动距离等因素进一步进行加入到呈现的形式考虑因素当中,且现有的人口统计只是简单的根据单一的数据源进行统计,没有根据重要特征进行关键性的提取,导致数据冗余性较差,且特征考虑过多导致的计算效率下降,准确性降低,且统计数据出现一定的鲁棒性。
发明内容
针对现有技术中提到的上述问题,为解决上述技术问题,本发明提供了一种城市属性的获取方法、装置及计算机可读存储介质,该方法通过将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,实现了城市人口密度等属性及时准确动态的图示。
本发明的一种城市属性的获取方法,包括步骤:
S1:采集城市内移动通信数据、公共交通数据,移动通信数据包括用户的通话记录、位置信息、签到记录、微信、微博状态位置状态数据,公共交通数据包括公交车、地铁、火车、飞机乘车记录数据;
S2:对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量;
S3:将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,改进的多层感知机算法采用的激活函数如下:
其中,x代表神经元的输入综合特征向量,learning_rate为学习率;
S4:可视化展示,将计算得出的城市属性信息进行整理和输出至LCD显示屏;
S5:结束。
优选地,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量,包括移动通信数据特征提取,从移动通信数据中提取通话时长、短信数量、数据流量、平均通话时长、平均短信数量、平均数据流量、通信频率、通信范围特征数据,统计每个公共交通线路或站点在特定时间段内的乘客数量总和、车辆行驶速度平均值、乘车次数总和、平均乘客数量、平均车辆行驶速度、平均乘车次数。
优选地,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量还包括:将移动通信数据特征和公共交通数据特征进行归一化,消除不同特征的量纲差异,将归一化后的特征值按照顺序组合成特征向量,每个特征对应向量中的一个元素,最终得到每个用户或每个公共交通线路/站点的特征向量,该特征向量包含了从移动通信数据和公共交通数据中提取的特征信息。
优选地,所述综合特征向量还包括通过车站入口摄像头获取的图像数据提取的人头或人体姿态图像像素特征数据,包括图像画面中识别出的单位时间内人头或人体姿态平均数量。
本申请还提供一种城市属性的获取装置,包括:
数据采集器,采集城市内移动通信数据、公共交通数据,移动通信数据包括用户的通话记录、位置信息、签到记录、微信、微博状态位置状态数据,公共交通数据包括公交车、地铁、火车、飞机乘车记录数据;
综合特征向量拼接器,对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量;
改进多层感知机计算器,将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,改进的多层感知机算法采用的激活函数如下:
其中,x代表神经元的输入综合特征向量,learning_rate为学习率;
可视化展示器,将计算得出的城市属性信息进行整理和输出至LCD显示屏;
结束模块。
优选地,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量,包括移动通信数据特征提取,从移动通信数据中提取通话时长、短信数量、数据流量、平均通话时长、平均短信数量、平均数据流量、通信频率、通信范围特征数据,统计每个公共交通线路或站点在特定时间段内的乘客数量总和、车辆行驶速度平均值、乘车次数总和、平均乘客数量、平均车辆行驶速度、平均乘车次数。
优选地,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量还包括:将移动通信数据特征和公共交通数据特征进行归一化,消除不同特征的量纲差异,将归一化后的特征值按照顺序组合成特征向量,每个特征对应向量中的一个元素,最终得到每个用户或每个公共交通线路/站点的特征向量,该特征向量包含了从移动通信数据和公共交通数据中提取的特征信息。
优选地,所述综合特征向量还包括通过车站入口摄像头获取的图像数据提取的人头或人体姿态图像像素特征数据,包括图像画面中识别出的单位时间内人头或人体姿态平均数量。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有城市属性的获取程序,所述城市属性的获取程序被处理器执行时实现所述的城市属性的获取方法的步骤。
本发明还提供一种计算机电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现所述的城市属性的获取方法的步骤。
本发明提供了一种城市属性的获取方法、装置及计算机可读存储介质,所能实现的有益技术效果如下:
1、本申请通过将移动通信数据、公共交通数据的数据特征拼接形成综合特征向量,进而对城市属性进行预测判断,确定人口密度等指标,大大增强了数据判断准确度,提高了数据处理效率,并实现实时性监测提供了准确度。
2、本发明通过改进多层感知机计算器,将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,改进的多层感知机算法采用的激活函数如下:
其中,x代表神经元的输入综合特征向量,learning_rate为学习率;采用的激活函数综合多种函数性能实现计算准确度和训练时间大幅度提供,大大实现了高质量数据的筛选判断,增强了数据计算效率提高了数据计算准确度。
3、提供了一种高效、准确的城市属性获取方法,代替了传统的人工调查和统计方法。基于人口相关特征进行分析,能够更全面地了解城市的发展趋势和特征,为城市规划、社会管理、商业决策等领域提供重要参考数据。通过建立人口特征模型,可以对城市属性进行实时监测和预测,为决策者提供更及时的信息支持。
4、将学习率加入到激活函数中,实现了将历史数据因素加入到特征的计算考虑,learning_rate为学习率;增强了特征计算准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的一种人口移动演化的显示方法步骤示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1:
针对现有技术中提到的上述问题,为解决上述技术问题,如附图1所示:本发明提供了一种城市属性的获取方法,包括步骤:
S1:采集城市内移动通信数据、公共交通数据,移动通信数据包括用户的通话记录、位置信息、签到记录、微信、微博状态位置状态数据,公共交通数据包括公交车、地铁、火车、飞机乘车记录数据;
采集移动通信数据:
移动通信数据可以提供人口流动性的信息,包括人口迁徙、人口聚集等。一种常见的采集方法是通过与电信运营商合作,获取移动网络基站的信令数据。这些信令数据记录了手机用户在不同基站之间的切换情况,从而可以推测人口在不同区域的流动情况。例如,可以获取到某个城市不同时间段内手机用户从家庭区域到商业区域的流动趋势,进而分析人口流动的规律和特征。
采集公共交通数据:
公共交通数据可以提供人口流动性和人口分布的信息。一种常见的采集方法是通过公共交通运营部门或相关机构获取公交车、地铁、火车等公共交通工具的乘客流量数据。这些数据可以记录不同时间段、不同线路的乘客数量,从而推测人口在城市中的分布情况和人口密度。例如,可以获取某个城市地铁各个站点每日进出站的乘客数量,进而分析人口在不同区域的分布和人口密度的变化。
S2:对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量;当采集城市内移动通信数据和公共交通数据后,可以进行特征提取以形成特征向量。下面是具体的操作示例:
移动通信数据特征提取:
a.从移动通信数据中提取通话时长、短信数量、数据流量等通信行为指标。
b.统计每个用户在特定时间段内的通话时长总和、短信数量总和、数据流量总和等。
c.进一步计算每个用户的平均通话时长、平均短信数量、平均数据流量等指标。
d.根据需要,还可以考虑提取其他与人口特征相关的信息,如通信频率、通信范围等。
公共交通数据特征提取:
a.从公共交通数据中提取乘客数量、车辆行驶速度、乘车次数等交通行为指标。
b.统计每个公共交通线路或站点在特定时间段内的乘客数量总和、车辆行驶速度平均值、乘车次数总和等。
c.进一步计算每个公共交通线路或站点的平均乘客数量、平均车辆行驶速度、平均乘车次数等指标。
d.根据需要,还可以考虑提取其他与人口特征相关的信息,如公共交通线路的覆盖范围、交通拥堵程度等。
特征向量形成:
a.将移动通信数据特征和公共交通数据特征进行归一化处理,以消除不同特征的量纲差异。
b.将归一化后的特征值按照一定的顺序组合成特征向量,每个特征对应向量中的一个元素。
c.最终得到每个用户或每个公共交通线路/站点的特征向量,该特征向量包含了从移动通信数据和公共交通数据中提取的相关特征信息。
S3:将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,改进的多层感知机算法采用的激活函数如下:
其中,x代表神经元的输入综合特征向量,learning_rate为学习率;在上述激活函数的公式中,变量"x"代表神经元的输入。具体来说,它表示输入层或隐藏层的加权输入。城市属性信息包括人口密度指数、人口流动性指数;
在神经网络的每个神经元中,输入是通过对输入特征向量进行加权求和得到的。这个加权求和的结果就是神经元的输入,也就是变量"x"。
对于每个神经元,它会将输入"x"输入激活函数中,通过激活函数的计算得到神经元的输出。激活函数的作用是对输入进行非线性变换,将其映射到一定的范围内,从而引入非线性关系。
因此,当在公式中看到变量"x"时,它代表神经元的输入,是通过加权求和计算得到的值。
当建立人口特征模型时,除了循环神经网络算法,还有其他神经网络算法可供选择。以下是一个例子,使用多层感知机(Multilayer Perceptron,MLP)算法建立人口模型。
多层感知机是一种前馈神经网络,由多个层次的神经元组成,每个神经元与上一层的所有神经元相连接。下面是具体步骤:
数据准备:准备用于建立人口模型的数据集。数据集应包含多个特征(如人口数量、区域面积、经济发展水平等)和对应的人口特征值(如人口密度指数)。
构建神经网络模型:使用多层感知机算法构建人口模型。该模型包含输入层、隐藏层和输出层。隐藏层可以有多个,其数量和每个隐藏层的神经元数量可以根据问题的复杂程度进行选择。
初始化权重和偏置:对神经网络模型中的权重和偏置进行随机初始化。
前向传播:将输入特征向量输入到神经网络模型中,通过前向传播计算每个神经元的输出值。
激活函数:对隐藏层和输出层的神经元进行激活函数的处理。常用的激活函数包括Sigmoid函数、ReLU函数等,用于引入非线性关系。计算损失函数:使用损失函数衡量预测值与真实值之间的差异。常见的损失函数包括均方误差(Mean Square Error,MSE)。
反向传播:通过反向传播算法,根据损失函数计算梯度,并利用梯度下降方法更新模型的权重和偏置,以减小损失函数的值。
重复步骤4至7,直到达到预定的迭代次数或损失函数收敛。
MLP神经网络的公式表示主要涉及前向传播和反向传播过程中的数学计算,具体公式如下:
前向传播:
a.输入层到隐藏层的计算:
z_h=W_h*x+b_h
a_h=activation_function(z_h)
b.隐藏层到输出层的计算:
z_o=W_o*a_h+b_o
a_o=activation_function(z_o)
反向传播:
a.输出层的误差项计算:
delta_o=(a_o-y)*activation_function_derivative(z_o)
b.隐藏层的误差项计算:
delta_h=(W_o^T*delta_o)*activation_function_derivative(z_h)
c.权重和偏置的更新:
W_o=W_o-learning_rate*delta_o*a_h^T
b_o=b_o-leaming_rate*delta_o
W_h=W_h-learning_rate*delta_h*x^T
b_h=b_h-leaming_rate*delta_h
需要注意的是,激活函数的选择和参数调整会对模型的性能产生影响,可以根据实际情况进行调整和优化
S4:通过计算和综合分析,得出城市的属性信息,包括人口密度值、人口流动性值;
S5:可视化展示,将计算得出的城市属性信息进行整理和输出至LCD显示屏;
S6:结束。
在一些实施例中,多层感知机(Multilayer Perceptron,MLP)算法建立人口模型的公式表示如下:
输入层到隐藏层的计算:
zh=Wh*x+bh
ah=activation_function(zh)
隐藏层到输出层的计算:
zo=Wo*ah+bo
ao=activation_function(zo)
输出层的误差项计算:
zo=Wo*ah+bo
δo=(ao-y)*activation_function_derivative(zo)
隐藏层的误差项计算:
δh=(Wo To)*activation_function_derivative(zh)
权重和偏置的更新:
bo=bo-1-learning_rate*δo
Wh=Wh-1-learning_rate*δh*xT
bh=bh-1-learning_rate*δh
x是输入特征向量,
Wh是输入层到隐藏层的权重矩阵,Wh-1是上一时刻的输入层到隐藏层的权重矩阵;
bh是隐藏层的偏置向量,bh-1是上一时刻隐藏层的偏置向量;
Wo是隐藏层到输出层的权重矩阵,Wo-1是上一时刻隐藏层到输出层的权重矩阵
bo是输出层的偏置向量,bo-1是上一时刻输出层的偏置向量
zh是隐藏层的加权输入
ah是隐藏层的输出(经过激活函数处理后),
zo是输出层的加权输入,
ao是输出层的输出(经过激活函数处理后),
y是人口特征值(真实值),
δo是输出层的误差项,
δh是隐藏层的误差项,
activation_function是激活函数
activation_function_derivative是激活函数的倒数
activation_function_derivative是激活函数的导数,
learning_rate是学习率,用于控制权重和偏置的更新步长。
在一些实施例中,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量,包括移动通信数据特征提取,从移动通信数据中提取通话时长、短信数量、数据流量、平均通话时长、平均短信数量、平均数据流量、通信频率、通信范围特征数据,统计每个公共交通线路或站点在特定时间段内的乘客数量总和、车辆行驶速度平均值、乘车次数总和、平均乘客数量、平均车辆行驶速度、平均乘车次数。
在一些实施例中,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量还包括:将移动通信数据特征和公共交通数据特征进行归一化,消除不同特征的量纲差异,将归一化后的特征值按照顺序组合成特征向量,每个特征对应向量中的一个元素,最终得到每个用户或每个公共交通线路/站点的特征向量,该特征向量包含了从移动通信数据和公共交通数据中提取的特征信息。
在一些实施例中,所述综合特征向量还包括通过车站入口摄像头获取的图像数据提取的人头或人体姿态图像像素特征数据,包括图像画面中识别出的单位时间内人头或人体姿态平均数量。
本申请还提供一种城市属性的获取装置,包括:
数据采集器,采集城市内移动通信数据、公共交通数据,移动通信数据包括用户的通话记录、位置信息、签到记录、微信、微博状态位置状态数据,公共交通数据包括公交车、地铁、火车、飞机乘车记录数据;
综合特征向量拼接器,对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量;
改进多层感知机计算器,将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,改进的多层感知机算法采用的激活函数如下:
其中,x代表神经元的输入综合特征向量,learning_rate为学习率;
城市属性计算器,通过计算和综合分析,得出城市的属性信息,包括人口密度值、人口流动性值;
通过改进多层感知机计算器可以实时监测及预测当前的人口流动性值、人口密度值,以下时未结合历史数据计算人口流动性值、人口密度值的步骤,针对人口流动性和人口结构的计算示例:
人口流动性指标计算:
a.人口流入流出比例:假设我们有一段时间内的人口流动数据,记录了每个区域的人口流入和流出人数。我们可以计算城市的人口流入流出比例来衡量人口流动情况。
人口流入流出比例=(总人口流入数/总人口数)*100%
例如,某城市总人口数为1,000,000人,总人口流入数为100,000人,那么该城市的人口流入流出比例为(100,000/1,000,000)*100%=10%
b.人口流动指数:除了简单比例,我们还可以使用人口流动指数来综合考虑人口流入和流出的数量和趋势。可以使用公式:
人口流动指数=(人口流入数-人口流出数)/总人口数
这个指数可以为正数表示净流入,为负数表示净流出,绝对值越大表示人口流动越活跃。
人口结构指标计算:
a.不同年龄段的人口比例:假设我们有一份包含不同年龄段人口数量的数据,可以计算不同年龄段的人口比例来了解城市的人口结构。
人口比例=(特定年龄段的人口数量/总人口数)*100%
例如,某城市的0-14岁人口数量为100,000人,总人口数为1,000,000人,那么0-14岁人口的比例为(100,000/1,000,000)*100%=10%。
b.年龄结构指数:为了更全面地了解人口构成情况,可以计算年龄结构指数。这个指数可以反映城市的年龄分布情况与某个基准年龄分布的相似程度。
年龄结构指数=∑(各年龄段人口比例*ln(各年龄段人口比例/基准年龄段人口比例))。
基准年龄段人口比例可以是某个参考年份或标准的人口结构数据。计算时,各年龄段人口比例需要进行归一化处理,确保总和为1。
以上示例提供了一种可能的计算方法,实际计算中还需要根据具体的数据和需求进行调整和适应。
在步骤4中的计算城市属性,以下是一个具体例子说明:
假设我们已经提取了关键特征参数,包括人口数量和区域面积,我们可以基于这些参数计算城市的人口密度。
数据准备:首先,我们需要获取城市的人口数量数据和对应的区域面积数据。这些数据可以从政府机构、统计局或相关数据平台获得。
计算人口密度:根据所提取的关键特征参数,计算城市的人口密度。人口密度可以定义为单位面积内的人口数量。
人口密度=人口数量/区域面积
例如,如果某城市的人口数量为1,000,000人,区域面积为100平方公里,那么该城市的人口密度为1,000,000/100=10,000人/平方公里。
综合分析其他城市属性:除了人口密度,根据需要可以计算和综合分析其他城市属性信息。例如,可以结合人口流动性数据,计算城市的人口流入流出比例或人口流动指数,以衡量城市的人口流动情况。另外,可以根据人口结构数据,计算不同年龄段的人口比例或年龄结构指数,以了解城市的人口构成情况。
需要注意的是,在计算城市属性时,应确保数据的准确性和完整性。同时,根据具体需求和研究目的,可以使用不同的计算方法和指标,以获得更全面和准确的城市属性信息。
可视化展示器,将计算得出的城市属性信息进行整理和输出至LCD显示屏;
结束模块。
在一些实施例中,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量,包括移动通信数据特征提取,从移动通信数据中提取通话时长、短信数量、数据流量、平均通话时长、平均短信数量、平均数据流量、通信频率、通信范围特征数据,统计每个公共交通线路或站点在特定时间段内的乘客数量总和、车辆行驶速度平均值、乘车次数总和、平均乘客数量、平均车辆行驶速度、平均乘车次数。
在一些实施例中,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量还包括:将移动通信数据特征和公共交通数据特征进行归一化,消除不同特征的量纲差异,将归一化后的特征值按照顺序组合成特征向量,每个特征对应向量中的一个元素,最终得到每个用户或每个公共交通线路/站点的特征向量,该特征向量包含了从移动通信数据和公共交通数据中提取的特征信息。
在一些实施例中,所述综合特征向量还包括通过车站入口摄像头获取的图像数据提取的人头或人体姿态图像像素特征数据,包括图像画面中识别出的单位时间内人头或人体姿态平均数量。使用计算机视觉技术,对摄像头拍摄的图像数据进行人体姿态或人脸图像的提取和分析。
对于人体姿态,可以使用姿态估计算法提取关节点位置,如肩膀、手臂、腿部等。对于人脸图像,可以使用adaboost算法实现人脸检测和识别算法提取人脸区域和关键特征点,根据像素灰度图像的像素均值、方差值等特征,如眼睛、鼻子、嘴巴等,形成图像特征向量。
进一步计算人体姿态或人脸图像的特征描述子,如角度、比例、特征点位置等。
将移动通信数据、公共交通数据和图像数据中提取的特征进行归一化处理,以消除不同特征的量纲差异。将归一化后的特征值按照一定的顺序组合成特征向量,每个特征对应向量中的一个元素。最终得到每个用户或每个公共交通线路/站点的综合特征向量,该特征向量包含了从移动通信数据、公共交通数据和图像数据中提取的相关特征信息。
在机器学习和深度学习中,学习率(learning_rate)是用于控制模型参数在每次迭代中更新的步长大小。它决定了模型在学习过程中对于每次梯度下降的调整幅度。
学习率的选择对模型的训练过程和结果影响很大。如果学习率过小,模型收敛速度可能很慢;如果学习率过大,模型可能会在参数空间中来回跳动,无法收敛到最优解。
学习率的计算通常是基于经验和实验来确定的,而不是通过固定的数学公式。下面是一个示例说明:
假设我们正在训练一个基于梯度下降算法的神经网络模型。初始时,我们可以选择一个较大的学习率,比如0.1。然后观察模型在训练集上的表现。
如果发现模型在训练过程中出现了不稳定的情况,损失函数不收敛或发散,我们可以尝试降低学习率。例如,将学习率调整为0.01,再次观察模型的表现。
如果模型在训练集上的性能改善不明显,我们可以进一步降低学习率,比如调整为0.001。继续观察模型的训练过程和结果。
通过反复尝试不同的学习率,并观察模型在训练集上的性能,最终选择一个使得模型收敛稳定且达到较好性能的学习率。
需要注意的是,学习率的选择是一个经验性的调参过程,没有固定的计算公式。不同的模型和数据集可能需要不同的学习率。因此,建议通过实验和验证来确定最佳的学习率。
本发明还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有城市属性的获取程序,所述城市属性的获取程序被处理器执行时实现如权利要求1至4中任一项所述的城市属性的获取方法的步骤。
本发明提供了一种城市属性的获取方法、装置及计算机可读存储介质,所能实现的有益技术效果如下:
1、本申请通过将移动通信数据、公共交通数据的数据特征拼接形成综合特征向量,进而对城市属性进行预测判断,确定人口密度等指标,大大增强了数据判断准确度,提高了数据处理效率,并实现实时性监测提供了准确度。
2、本发明通过改进多层感知机计算器,将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,改进的多层感知机算法采用的激活函数如下:
其中,x代表神经元的输入综合特征向量,learning_rate为学习率;采用的激活函数综合多种函数性能实现计算准确度和训练时间大幅度提供,大大实现了高质量数据的筛选判断,增强了数据计算效率提高了数据计算准确度。
3、提供了一种高效、准确的城市属性获取方法,代替了传统的人工调查和统计方法。基于人口相关特征进行分析,能够更全面地了解城市的发展趋势和特征,为城市规划、社会管理、商业决策等领域提供重要参考数据。通过建立人口特征模型,可以对城市属性进行实时监测和预测,为决策者提供更及时的信息支持。
4、将学习率加入到激活函数中,实现了将历史数据因素加入到特征的计算考虑,learning_rate为学习率;增强了特征计算准确率。
以上对一种人口流动数据的获取方法方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想;同时,对于本领域的一般技术人员,依据本发明的思想和方法,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种城市属性的获取方法,其特征在于,包括步骤:
S1:采集城市内移动通信数据、公共交通数据,移动通信数据包括用户的通话记录、位置信息、签到记录、微信、微博状态位置状态数据,公共交通数据包括公交车、地铁、火车、飞机乘车记录数据;
S2:对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量;
S3:将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,改进的多层感知机算法采用的激活函数如下:
其中,x代表神经元的输入综合特征向量,learning_rate为学习率;
S4:可视化展示,将计算得出的城市属性信息输出至LCD显示屏;
S5:结束。
2.如权利要求1所述的一种城市属性的获取方法,其特征在于,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量,包括移动通信数据特征提取,从移动通信数据中提取通话时长、短信数量、数据流量、平均通话时长、平均短信数量、平均数据流量、通信频率、通信范围特征数据,统计每个公共交通线路或站点在特定时间段内的乘客数量总和、车辆行驶速度平均值、乘车次数总和、平均乘客数量、平均车辆行驶速度、平均乘车次数。
3.如权利要求2所述的一种城市属性的获取方法,其特征在于,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量还包括:将移动通信数据特征和公共交通数据特征进行归一化,消除不同特征的量纲差异,将归一化后的特征值按照顺序组合成特征向量,每个特征对应向量中的一个元素,最终得到每个用户或每个公共交通线路/站点的特征向量,该特征向量包含了从移动通信数据和公共交通数据中提取的特征信息。
4.如权利要求3所述的一种城市属性的获取方法,其特征在于,所述综合特征向量还包括通过车站入口摄像头获取的图像数据提取的人头或人体姿态图像像素特征数据,包括图像画面中识别出的单位时间内人头或人体姿态平均数量。
5.一种城市属性的获取装置,其特征在于,包括:
数据采集器,采集城市内移动通信数据、公共交通数据,移动通信数据包括用户的通话记录、位置信息、签到记录、微信、微博状态位置状态数据,公共交通数据包括公交车、地铁、火车、飞机乘车记录数据;
综合特征向量拼接器,对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量;
改进多层感知机计算器,将综合特征向量输入至采用改进的多层感知机算法建立的城市人口特征模型,得到城市整体或区域的实时监测或预测的人口密度指数、人口流动性指数,改进的多层感知机算法采用的激活函数如下:
其中,x代表神经元的输入综合特征向量,learning_rate为学习率;
可视化展示器,将计算得出的城市属性信息输出至LCD显示屏;
结束模块。
6.如权利要求5所述的一种城市属性的获取装置,其特征在于,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量,包括移动通信数据特征提取,从移动通信数据中提取通话时长、短信数量、数据流量、平均通话时长、平均短信数量、平均数据流量、通信频率、通信范围特征数据,统计每个公共交通线路或站点在特定时间段内的乘客数量总和、车辆行驶速度平均值、乘车次数总和、平均乘客数量、平均车辆行驶速度、平均乘车次数。
7.如权利要求5所述的一种城市属性的获取装置,其特征在于,所述对采集到的城市内移动通信数据、公共交通数据进行预处理,形成综合特征向量还包括:将移动通信数据特征和公共交通数据特征进行归一化,消除不同特征的量纲差异,将归一化后的特征值按照顺序组合成特征向量,每个特征对应向量中的一个元素,最终得到每个用户或每个公共交通线路/站点的特征向量,该特征向量包含了从移动通信数据和公共交通数据中提取的特征信息。
8.如权利要求5所述的一种城市属性的获取装置,其特征在于,所述综合特征向量还包括通过车站入口摄像头获取的图像数据提取的人头或人体姿态图像像素特征数据,包括图像画面中识别出的单位时间内人头或人体姿态平均数量。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有城市属性的获取程序,所述城市属性的获取程序被处理器执行时实现如权利要求1至4中任一项所述的城市属性的获取方法的步骤。
10.一种计算机电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的城市属性的获取方法的步骤。
CN202310751827.5A 2023-06-21 2023-06-21 城市属性的获取方法、装置及计算机可读存储介质 Active CN117151322B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310751827.5A CN117151322B (zh) 2023-06-21 2023-06-21 城市属性的获取方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310751827.5A CN117151322B (zh) 2023-06-21 2023-06-21 城市属性的获取方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN117151322A true CN117151322A (zh) 2023-12-01
CN117151322B CN117151322B (zh) 2024-06-04

Family

ID=88901489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310751827.5A Active CN117151322B (zh) 2023-06-21 2023-06-21 城市属性的获取方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117151322B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254142A (zh) * 2016-09-05 2016-12-21 电子科技大学成都研究院 一种基于移动通信运营数据的城市群体行为监测系统
CN108898533A (zh) * 2018-06-26 2018-11-27 中国联合网络通信有限公司深圳市分公司 人口流动数据的获取方法、装置及计算机可读存储介质
CN109165779A (zh) * 2018-08-12 2019-01-08 北京清华同衡规划设计研究院有限公司 一种基于多源大数据与长短期记忆神经网络模型的人口数量预测方法
CN112801340A (zh) * 2020-12-16 2021-05-14 北京交通大学 一种基于多层级城市信息单元画像的人群密度预测方法
CN115049159A (zh) * 2022-08-12 2022-09-13 北京大学 人口分布预测方法和装置、存储介质及电子设备
CN115083112A (zh) * 2022-08-22 2022-09-20 枫树谷(成都)科技有限责任公司 一种智能预警应急管理系统及其部署方法
WO2023272726A1 (zh) * 2021-07-02 2023-01-05 深圳先进技术研究院 云服务器集群负载调度方法、系统、终端以及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254142A (zh) * 2016-09-05 2016-12-21 电子科技大学成都研究院 一种基于移动通信运营数据的城市群体行为监测系统
CN108898533A (zh) * 2018-06-26 2018-11-27 中国联合网络通信有限公司深圳市分公司 人口流动数据的获取方法、装置及计算机可读存储介质
CN109165779A (zh) * 2018-08-12 2019-01-08 北京清华同衡规划设计研究院有限公司 一种基于多源大数据与长短期记忆神经网络模型的人口数量预测方法
CN112801340A (zh) * 2020-12-16 2021-05-14 北京交通大学 一种基于多层级城市信息单元画像的人群密度预测方法
WO2023272726A1 (zh) * 2021-07-02 2023-01-05 深圳先进技术研究院 云服务器集群负载调度方法、系统、终端以及存储介质
CN115049159A (zh) * 2022-08-12 2022-09-13 北京大学 人口分布预测方法和装置、存储介质及电子设备
CN115083112A (zh) * 2022-08-22 2022-09-20 枫树谷(成都)科技有限责任公司 一种智能预警应急管理系统及其部署方法

Also Published As

Publication number Publication date
CN117151322B (zh) 2024-06-04

Similar Documents

Publication Publication Date Title
CN110070713B (zh) 一种基于双向嵌套lstm神经网络的交通流预测方法
CN109344736B (zh) 一种基于联合学习的静态图像人群计数方法
Hartono et al. Implementation of Artifical Neural Networks with Multilayer Perceptron for Analysis of Acceptance of Permanent Lecturers
CN110110707A (zh) 人工智能cnn、lstm神经网络动态识别系统
CN109902546A (zh) 人脸识别方法、装置及计算机可读介质
CN108427921A (zh) 一种基于卷积神经网络的人脸识别方法
CN109034119A (zh) 一种基于优化的全卷积神经网络的人脸检测方法
CN109902912B (zh) 一种基于性格特征的个性化图像美学评价方法
CN111783589B (zh) 基于场景分类和多尺度特征融合的复杂场景人群计数方法
CN109214263A (zh) 一种基于特征复用的人脸识别方法
CN109522372A (zh) 民航领域旅客价值的预测方法
CN110310479A (zh) 一种城市交通流量预测系统及方法
CN110705428B (zh) 一种基于脉冲神经网络的脸部年龄识别系统及方法
WO2021068781A1 (zh) 一种疲劳状态识别方法、装置和设备
CN111488855A (zh) 疲劳驾驶检测方法、装置、计算机设备和存储介质
CN112598165B (zh) 基于私家车数据的城市功能区转移流量预测方法及装置
CN112396587A (zh) 一种基于协同训练和密度图的公交车厢内拥挤度检测方法
CN114360067A (zh) 一种基于深度学习的动态手势识别方法
CN111738044A (zh) 一种基于深度学习行为识别的校园暴力评估方法
CN109800635A (zh) 一种基于光流法的受限局部人脸关键点检测与跟踪方法
Dai et al. Spatio-temporal deep learning framework for traffic speed forecasting in IoT
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
Son et al. Partial convolutional LSTM for spatiotemporal prediction of incomplete data
CN111626197B (zh) 一种基于人体行为识别网络模型的识别方法
CN117151322B (zh) 城市属性的获取方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant