CN116777243A - 居民出行指标的评估方法、装置及计算机可读存储介质 - Google Patents

居民出行指标的评估方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN116777243A
CN116777243A CN202310748313.4A CN202310748313A CN116777243A CN 116777243 A CN116777243 A CN 116777243A CN 202310748313 A CN202310748313 A CN 202310748313A CN 116777243 A CN116777243 A CN 116777243A
Authority
CN
China
Prior art keywords
travel
data
evaluation
trip
mobile phone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310748313.4A
Other languages
English (en)
Other versions
CN116777243B (zh
Inventor
吴乃星
周剑明
秦保根
黄啟志
戴鹏
蔡勇
甘玉玺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Corp Ltd Shenzhen Branch
Original Assignee
China United Network Communications Corp Ltd Shenzhen Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Corp Ltd Shenzhen Branch filed Critical China United Network Communications Corp Ltd Shenzhen Branch
Priority to CN202310748313.4A priority Critical patent/CN116777243B/zh
Publication of CN116777243A publication Critical patent/CN116777243A/zh
Application granted granted Critical
Publication of CN116777243B publication Critical patent/CN116777243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了居民出行指标的评估方法、装置及计算机可读存储介质,包括步骤:S1:获取手机信令数据流,解析手机信令数据流,提取数据流中出行关联数据字段;S2:数据预处理;S3:从数据预处理后的数据中提取出行特征,包括出行距离、出行时间、出行频率f;S4:建立评估模型,采用支持向量机建立出行指标评估模型;S5:利用建立的评估模型,对居民的出行行为进行指标计算,计算出行效率值、出行便利度值、出行可持续性值;S6:结果展示与存储。本申请通过采用支持向量机建立出行指标评估模型,并考虑出行频率f,实现了出行人口流动的及时准确动态的图示,考虑频率特征等因素,大大增强了计算效率和准确度。

Description

居民出行指标的评估方法、装置及计算机可读存储介质
技术领域
本发明涉及居民出行指标统计领域,具体涉及居民出行指标的评估方法、装置及计算机可读存储介质。
背景技术
在当前社会,居民出行的效率、便利度和可持续性成为城市交通管理和规划的重要关注点。然而,要全面评估和优化居民出行指标,需要大量的出行数据和高效的分析方法。传统的数据收集方法存在成本高、效率低等问题,因此需要一种基于手机信令数据的评估方法,能够有效获取、处理和分析大规模的出行数据。手机信令数据是指手机用户与移动通信基站或网络之间的交互数据,记录了用户的通信行为和位置信息。这些数据蕴含了丰富的出行行为特征,如出行距离、出行时间、出行频率等,可以为出行指标评估提供重要的参考。
然而,直接利用原始的手机信令数据进行分析存在一些问题,包括数据的噪声和杂乱性、数据格式的多样性等。因此,需要进行数据预处理,包括数据清洗、格式转换和噪声过滤,以确保数据的准确性和一致性。为了从预处理后的数据中提取出行特征,需要采用合适的特征提取方法。出行特征包括出行距离、出行时间、出行频率、行程起点、目的地和出行方式等。通过提取这些特征,可以量化和描述居民的出行行为,为后续的评估和决策提供依据。
但现有技术中的居民出行指标统计并没有考虑居民的出行次数频率特点,只是简单的对摄像头或手机信号的统计,没有对人口出行相关特征的深入分析,导致对出行预测结果的精准的较低,且计算效率低下。且现有的出行人口统计没有根据重要特征进行关键性的提取,导致数据冗余性较差,且特征考虑过多导致的计算效率下降,准确性降低,且统计数据出现一定的鲁棒性。
发明内容
针对现有技术中提到的上述问题,为解决上述技术问题,本发明提供了一种居民出行指标的评估方法、装置及计算机可读存储介质,该方法通过采用支持向量机建立出行指标评估模型,并考虑出行频率f,实现了出行人口流动的及时准确动态的图示。
本发明的一种居民出行指标的评估方法,包括步骤:
S1:获取手机信令出行数据,包括:获取手机信令数据流,解析手机信令数据流,提取数据流中出行关联数据字段;
S2:数据预处理,对获取的手机信令出行数据进行预处理,包括数据清洗、格式转换、噪声过滤;
S3:特征提取,从数据预处理后的数据中提取出行特征,包括出行距离、出行时间、出行频率f、行程起点、目的地、出行方式;
S4:建立评估模型,采用支持向量机建立出行指标评估模型,该模型通过历史出行数据和历史评估指标进行训练,自动计算出行指标,评估模型预测函数f(x)表示如下:
f(x)=sign(∑(αi*i**(x,xi))+b)
其中,K(xi,)为改进的径向基核函数,xi是输入样本的特征向量,||x-xi|表示输入样本的特征向量与输入的出行特征向量间的欧式距离,γ是径向基核函数的带宽参数,x为输入的出行特征向量,αi为支持向量对应的拉格朗日乘子,yi是对应的类别标签,b是偏置项,f为出行频率;
S5:评估指标计算,利用建立的评估模型,对居民的出行行为进行指标计算,计算出行效率值、出行便利度值、出行可持续性值;
S6:结果展示与存储,将评估结果保存在存储器中并通过显示设备展示给用户。
优选地,所述获取手机信令数据流,包括使用TLS(Transport Layer Security)协议建立与移动通信基站的通信安全连接,获取手机信令数据流数据;采用加密算法AES(Advanced Encryption Standard)对手机信令数据流数据加密。
优选地,所述数据清洗、格式转换、噪声过滤,包括噪声过滤采用中值滤波进行过滤;所述格式转换包括时间戳转换和地理位置转换。
优选地,所述出行频率f包括采用将数据按照时间窗口划分,统计每个时间窗口内的出行次数。
本申请还提供一种居民出行指标的评估装置,其特征在于,包括数据采集器、预处理器、特征提取模块、评估模型模块、评估指标计算模块、结果展示与存储:
数据采集器获取手机信令出行数据,包括:获取手机信令数据流,解析手机信令数据流,提取数据流中出行关联数据字段;
预处理器对获取的手机信令出行数据进行预处理,包括数据清洗、格式转换、噪声过滤;
特征提取模块,从数据预处理后的数据中提取出行特征,包括出行距离、出行时间、出行频率f、行程起点、目的地、出行方式;
评估模型模块,采用支持向量机建立出行指标评估模型,该模型通过历史出行数据和历史评估指标进行训练,自动计算出行指标,评估模型预测函数f(x)表示如下:
f(x)=sign(∑(αi*yi*f*K(x,xi))+b)
其中,K(xi,x)为改进的径向基核函数,xi是输入样本的特征向量,||x-xi|表示输入样本的特征向量与输入的出行特征向量间的欧式距离,γ是径向基核函数的带宽参数,x为输入的出行特征向量,αi为支持向量对应的拉格朗日乘子,yi是对应的类别标签,b是偏置项,f为出行频率;
评估指标计算模块,利用建立的评估模型,对居民的出行行为进行指标计算,计算出行效率值、出行便利度值、出行可持续性值;
结果展示与存储,将评估结果保存在存储器中并通过显示设备展示给用户。
优选地,所述对采集到的人口移动数据进行预处理,包括采用时间窗口滤波对人口迁移数据滤波,公式如下:
F=(x(n-t)+x(n-t+1)+……x(n))/t
其中,x(n)表示第n个时间点的人口移动数量,t为窗口大小。
优选地,所述获取手机信令数据流,包括使用TLS(Transport Layer Security)协议建立与移动通信基站的通信安全连接,获取手机信令数据流数据;采用加密算法AES(Advanced Encryption Standard)对手机信令数据流数据加密。
优选地,所述数据清洗、格式转换、噪声过滤,包括噪声过滤采用中值滤波进行过滤;所述格式转换包括时间戳转换和地理位置转换。
优选地,所述出行频率f包括采用将数据按照时间窗口划分,统计每个时间窗口内的出行次数。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有居民出行指标的评估应用程序,所述居民出行指标的评估应用程序被处理器执行时实现如权利要求1至4中任一项所述一种居民出行指标的评估方法的步骤。
本申请还提供一种计算机电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的居民出行指标的评估方法的步骤。
本发明提供了一种居民出行指标的评估方法、装置及计算机可读存储介质,所能实现的有益技术效果如下:
1、本申请通过采用支持向量机建立出行指标评估模型,该模型通过历史出行数据和历史评估指标进行训练,自动计算出行指标,评估模型预测函数f(x)表示如下:
其中,K(xi,)为改进的径向基核函数,xi是输入样本的特征向量,||x-xi|表示输入样本的特征向量与输入的出行特征向量间的欧式距离,γ是径向基核函数的带宽参数,x为输入的出行特征向量,αi为支持向量对应的拉格朗日乘子,yi是对应的类别标签,b是偏置项,f为出行频率,将出行频率f加入到支持向量基核函数及计算过程中,考虑历史出行频率因素,大大增强了数据判断准确度,提高了数据处理效率。
2、本发明通过数据清洗、格式转换、噪声过滤,包括噪声过滤采用中值滤波进行过滤;所述格式转换包括时间戳转换和地理位置转换;大大实现了高质量数据的筛选判断,增强了数据计算效率提高了数据计算准确度。
3、本发明通过将出行频率f包括采用将数据按照时间窗口划分,统计每个时间窗口内的出行次数,选择影响较大的特征值作为支持向量机的数据基础,大大克服了数据冗余性,大大增强了计算效率,实现了快速实时显示人口流动显示。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的一种居民出行指标的评估方法步骤示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1:
针对现有技术中提到的上述问题,为解决上述技术问题,如附图1所示:本发明的一种居民出行指标的评估方法,包括步骤:
S1:获取手机信令出行数据,包括:获取手机信令数据流,解析手机信令数据流,提取数据流中出行关联数据字段;
当涉及获取手机信令数据流、解析数据流并提取出行关联数据字段时,具体的实施方式会根据所采用的技术和平台而有所不同。以下是一种可能的示例方法来说明这一过程,并使用公式表示相关步骤:
获取手机信令数据流:
通过与移动通信基站或网络提供商建立连接,获取手机信令数据流。
假设手机信令数据流表示为S。
解析手机信令数据流,提取出行关联数据字段:
对手机信令数据流进行解析,识别出与出行相关的数据字段。
假设解析后的数据表示为D。
提取出行关联数据字段:
从解析后的数据中提取出行关联数据字段。
假设从解析后的数据D中提取出的出行关联数据字段表示为F。
公式表示:可以使用以下公式表示上述步骤:
S=获取手机信令数据流
D=解析手机信令数据流(S)
F=提取出行关联数据字段(D)
其中,S表示获取的手机信令数据流,D表示解析后的数据流,F表示提取的出行关联数据字段。
建立连接并进行保密传输手机信令数据流通常需要使用安全通信协议和加密技术来确保数据的保密性和完整性。以下是一种可能的示例方法来说明建立连接和进行保密传输的步骤:建立连接:
移动通信基站或网络提供商提供了相应的接口或API来与其系统进行通信。
开发人员可以使用这些接口或API与移动通信基站或网络提供商建立连接,以获取手机信令数据流。
建立连接的具体方法和技术可能因不同的系统和接口而有所不同,需要遵循供应商提供的文档和规范进行操作。
保密传输数据流:
在建立连接的基础上,为了确保数据流的保密传输,可以采用以下步骤:
a)使用安全通信协议:例如,可以使用TLS(Transport Layer Security)协议或SSL(Secure Sockets Layer)协议来建立安全连接。
b)加密数据流:使用加密算法对手机信令数据流进行加密,以确保数据在传输过程中的保密性。常见的加密算法包括AES(Advanced Encryption Standard)等。
c)身份认证:进行身份验证,确保连接的两端是合法的,并且具有访问和传输数据的权限。
d)数据完整性检查:在数据传输过程中使用哈希算法或其他完整性检查机制,以验证数据在传输过程中是否被篡改或损坏。
请注意,实际的建立连接和保密传输方法会根据具体的移动通信基站或网络提供商、安全协议和加密技术而有所不同。在实际应用中,建议根据供应商提供的安全通信规范和相关文档,结合具体的技术要求和实施方案,选择合适的方法来建立连接并进行保密传输数据流。同时,在专利申请中,需要详细描述所采用的技术和方法,以确保专利申请的清晰性和准确性。
S2:数据预处理,对获取的手机信令出行数据进行预处理,包括数据清洗、格式转换、噪声过滤;
在居民出行指标评估方法中,数据预处理包括数据清洗、格式转换和噪声过滤等步骤。以下是具体举例说明如何进行这些处理,并使用常见的算法公式表示:
数据清洗:
数据清洗是指对获取的手机信令出行数据进行去除无效或错误数据的操作。下面是数据清洗的一些常见步骤:
去除重复数据:识别并去除重复的数据记录,以避免对后续分析和计算产生重复影响。
处理缺失值:识别并处理缺失的数据,可以选择删除缺失数据记录或进行合理的填充。
异常值处理:检测和处理异常值,可以通过统计方法或领域知识来识别异常数据并进行适当处理。
数据清洗算法公式示例:
去除重复数据:
cleaned_data=remove_duplicates(raw_data)
处理缺失值:
cleaned_data=handle_missing_values(raw_data)
异常值处理:
cleaned_data=handle_outliers(raw_data)
格式转换:
格式转换是将数据转换为适合后续处理和分析的格式。以下是格式转换的一些常见步骤:
时间戳转换:将时间戳数据转换为特定的日期时间格式,以便后续计算和分析。
地理位置转换:将原始数据中的地理位置信息转换为可识别的地理坐标或地址形式,以便后续计算和可视化展示。
格式转换算法公式示例:
时间戳转换:
formatted_data=convert_timestamp(raw_data)
地理位置转换:
formatted_data=convert_location(raw_data)
噪声过滤:
噪声过滤是消除数据中的干扰和噪声,以提高数据质量和准确性。以下是噪声过滤的一些常见方法:
平滑滤波:使用平滑滤波算法(如移动平均、中值滤波等)来消除数据中的突然波动和噪声。
孤立值检测:使用统计方法或机器学习算法检测和移除孤立的异常数据点。噪声过滤算法公式示例:
平滑滤波:
filtered_data=smooth_filter(raw_data)
孤立值检测:
filtered_data=outlier_detection(raw_data)
请注意,以上示例算法公式仅用于说明目的,实际的数据预处理过程和所采用的算法可能因具体应用和数据特点而有所不同。在实际应用中,建议根据数据的特点、领域知识和所采用的预处理算法,选择适当的方法进行数据清洗、格式转换和噪声过滤,并在专利申请中提供更加详细和准确的描述和公式。
S3:特征提取,从数据预处理后的数据中提取出行特征,包括出行距离、出行时间、出行频率f、行程起点、目的地、出行方式;
从数据预处理后的数据中提取出行特征需要根据具体的数据结构和内容进行分析和处理。以下是具体举例说明如何提取出行特征,并使用一些常见的算法公式表示:
出行距离:
出行距离是指出行的起点和目的地之间的实际距离。以下是一种常见的提取出行距离的方法:
利用地理坐标数据:根据行程的起点和目的地的地理坐标,使用经纬度计算公式(如Haversine公式)计算两点之间的距离。
出行距离提取算法公式示例:
distance=calculate_distance(start_location,end_location)
出行时间:
出行时间是指出行的起始时间和结束时间之间的时间间隔。以下是一种常见的提取出行时间的方法:
利用时间戳数据:根据行程的起始时间戳和结束时间戳,计算时间差得出出行时间。
出行时间提取算法公式示例:
travel_time=end_timestamp-start_timestamp
出行频率:
出行频率是指某一时间段内的出行次数。以下是一种常见的提取出行频率的方法:
利用时间窗口和计数:将数据按照时间窗口划分,统计每个时间窗口内的出行次数。
出行频率提取算法公式示例:
frequency=count_trips_within_time_window(data,time_window)
行程起点、目的地和出行方式:
行程起点、目的地和出行方式是出行的基本属性信息。以下是一种常见的提取方法:
利用数据字段或特定规则:根据数据中的指定字段或特定规则,提取行程起点、目的地和出行方式的信息。
行程起点、目的地和出行方式提取示例:
start_location=extract_start_location(data)
end_location=extract_end_location(data)
travel_mode=extract_travel_mode(data)
请注意,以上示例仅提供了一种常见的提取方法和示例算法公式。实际的出行特征提取过程可能涉及更多的数据处理和分析技术,根据具体应用和数据特点,需要选择合适的方法和算法来提取出行特征。在专利申请中,建议根据实际实施方案提供更加详细和准确的描述和公式,以确保专利申请的清晰性和准确性。
S4:建立评估模型,采用支持向量机建立出行指标评估模型,该模型通过历史出行数据和历史评估指标进行训练,自动计算出行指标,评估模型预测函数f(x)表示如下:
f(x)=sign(Σ(αi*yi*f*K(x,xi))+b)
其中,K(xi,x)为改进的径向基核函数,xi是输入样本的特征向量,||x-xi|表示输入样本的特征向量与输入的出行特征向量间的欧式距离,γ是径向基核函数的带宽参数,x为输入的出行特征向量,αi为支持向量对应的拉格朗日乘子,yi是对应的类别标签,b是偏置项,f为出行频率;
如果要采用支持向量机(Support Vector Machine,SVM)替代关联规则挖掘算法建立出行指标评估模型,以下是一个示例:
数据准备:
准备训练数据集,包含历史的出行数据以及对应的评估指标。
将出行数据转换为特征向量表示,例如使用出行距离、出行时间、出行频率等作为特征。
根据评估指标,将出行评价分为几个类别,例如高效、一般、低效。
支持向量机模型建立:
根据准备好的训练数据集,采用支持向量机算法建立出行指标评估模型。
支持向量机是一种监督学习算法,用于分类或回归问题。
SVM的目标是找到一个超平面,将不同类别的数据点尽可能分开,并最大化数据点与超平面之间的间隔。
训练模型:
使用训练数据集进行模型训练。
SVM的训练过程涉及选择合适的核函数(如线性核、多项式核、径向基函数等)和调整超参数(如惩罚因子C和核函数参数)。
根据训练数据和指定的参数,求解支持向量机的优化问题,找到最优的超平面。
模型预测:
使用训练好的模型对新的出行数据进行预测。
将新的出行数据转换为特征向量表示,然后输入到训练好的SVM模型中。
SVM模型根据学习到的超平面将新的出行数据分类到相应的评估指标类别中。
支持向量机的示例数学表达式如下:
给定训练数据集{(x1,y1),(x2,y2),...,(xn,yn)},其中xi是特征向量,yi是类别标签(评估指标类别):
w,b=SVM.train(x1,y1,x2,y2,...,xn,yn)
其中,w是超平面的法向量,b是超平面的截距。
SVM模型的计算过程包括选择合适的核函数和超参数、构建优化问题、使用优化算法(如序列最小最优化算法)求解最优的超平面,使得目标函数最大化。
请注意,上述是一个简化的示例,实际中的支持向量机算法还涉及到处理非线性问题、核函数的选择、正则化等复杂的细节。
径向基核函数(Radial Basis Function,RBF)是支持向量机中常用的核函数之一,用于处理非线性问题。
径向基核函数衡量了两个样本之间的相似度,距离越近,核函数的值越大,说明样本之间更相似。带宽参数γ控制了径向基核函数的衰减速度,较小的γ值会使核函数的影响范围变大,而较大的γ值会使核函数的影响范围变小。
径向基核函数将输入样本映射到高维特征空间,使得支持向量机能够在非线性空间中找到线性可分的超平面,从而解决非线性分类问题。
请注意,上述数学表达式中的核函数是径向基核函数的一种常见形式,实际中也可以使用其他类型的核函数,如多项式核函数、sigmoid核函数等,具体选择取决于问题的特性和需求。
S5:评估指标计算,利用建立的评估模型,对居民的出行行为进行指标计算,计算出行效率值、出行便利度值、出行可持续性值;
在上述方案中,评估指标计算是基于建立的评估模型和居民的出行行为进行的。具体计算方法可以根据实际需求和模型设计进行定义。以下是一个示例,说明如何计算出行效率、出行便利度和出行可持续性评估指标。
假设我们已经建立了一个支持向量机(SVM)模型,用于预测出行的评估指标类别(高效或低效)。同时,我们有一组居民的出行数据,包括出行特征和对应的预测结果。
出行效率评估指标:
假设我们的模型预测结果中,将高效出行标记为类别1,低效出行标记为类别0。
对于每个居民的出行数据,根据模型的预测结果判断其属于高效出行还是低效出行。
出行效率评估指标可以定义为高效出行的比例,即高效出行的数量除以总出行数量。
示例公式:
出行效率=高效出行数量/总出行数量
出行便利度评估指标:
假设我们的模型预测结果中,高效出行的置信度越高,表示出行越便利。
对于每个居民的出行数据,可以计算出模型预测结果中高效类别的置信度平均值作为出行便利度评估指标。
示例公式:
出行便利度=高效出行类别的置信度平均值
出行可持续性评估指标:
假设我们的模型预测结果中,将可持续出行标记为类别1,不可持续出行标记为类别0。
对于每个居民的出行数据,根据模型的预测结果判断其属于可持续出行还是不可持续出行。
出行可持续性评估指标可以定义为可持续出行的比例,即可持续出行的数量除以总出行数量。
示例公式:
出行可持续性=可持续出行数量/总出行数量。
S6:结果展示与存储,将评估结果保存在存储器中并通过显示设备展示给用户。
优选地,所述获取手机信令数据流,包括使用TLS(Transport Layer Security)协议建立与移动通信基站的通信安全连接,获取手机信令数据流数据;采用加密算法AES(Advanced Encryption Standard)对手机信令数据流数据加密。
优选地,所述数据清洗、格式转换、噪声过滤,包括噪声过滤采用中值滤波进行过滤;所述格式转换包括时间戳转换和地理位置转换。
优选地,所述出行频率f包括采用将数据按照时间窗口划分,统计每个时间窗口内的出行次数。
本申请还提供一种居民出行指标的评估装置,其特征在于,包括数据采集器、预处理器、特征提取模块、评估模型模块、评估指标计算模块、结果展示与存储:
数据采集器获取手机信令出行数据,包括:获取手机信令数据流,解析手机信令数据流,提取数据流中出行关联数据字段;
预处理器对获取的手机信令出行数据进行预处理,包括数据清洗、格式转换、噪声过滤;
特征提取模块,从数据预处理后的数据中提取出行特征,包括出行距离、出行时间、出行频率f、行程起点、目的地、出行方式;
评估模型模块,采用支持向量机建立出行指标评估模型,该模型通过历史出行数据和历史评估指标进行训练,自动计算出行指标,评估模型预测函数f(x)表示如下:
f(x)=sign(∑(αi*i**(x,xi))+b)
其中,K(xi,)为改进的径向基核函数,xi是输入样本的特征向量,||x-xi|表示输入样本的特征向量与输入的出行特征向量间的欧式距离,γ是径向基核函数的带宽参数,x为输入的出行特征向量,αi为支持向量对应的拉格朗日乘子,yi是对应的类别标签,b是偏置项,f为出行频率;
假设我们要采用支持向量机(Support Vector Machine,SVM)取代关联规则挖掘算法建立出行指标评估模型。以下是一个具体的示例:
数据准备:
假设我们有一个出行数据集,其中包括出行特征(如出行距离、出行时间、出行频率)和评估指标(如出行效率)。
准备训练数据集,其中包括一组已标记的出行数据,即每个数据点都有对应的特征向量和评估指标类别(高效或低效)。
支持向量机模型建立:
使用支持向量机算法建立出行指标评估模型。
SVM是一种监督学习算法,用于分类问题。
SVM的目标是找到一个最优超平面,将不同类别的数据点尽可能分开,并最大化数据点与超平面之间的间隔。
模型表示:
使用数学符号表示支持向量机模型。
假设我们使用线性核函数,模型可以表示为:f(x)是预测函数,x是输入的出行特征向量,αi是支持向量对应的拉格朗日乘子,yi是对应的类别标签(高效或低效),K(xi,x)是核函数(例如线性核函数),b是偏置项。
训练模型:
使用训练数据集进行模型训练。
SVM的训练过程涉及选择合适的核函数和调整超参数(如惩罚因子C和核函数参数)。
通过求解优化问题来确定超平面,以最大化间隔并最小化错误分类。
模型预测:
使用训练好的模型对新的出行数据进行预测。
将新的出行数据转换为特征向量表示,然后输入到训练好的SVM模型中。
SVM模型根据学习到的超平面将新的出行数据分类到相应的评估指标类别(高效或低效)中。
支持向量机算法的具体计算过程包括选择合适的核函数、构建优化问题、使用优化算法(如序列最小最优化算法)求解最优超平面,使得目标函数最大化。同时,还需要考虑支持向量的选择、软间隔等问题,以适应不同的数据集和问题场景。
评估指标计算模块,利用建立的评估模型,对居民的出行行为进行指标计算,计算出行效率值、出行便利度值、出行可持续性值;
结果展示与存储,将评估结果保存在存储器中并通过显示设备展示给用户。
优选地,所述对采集到的人口移动数据进行预处理,包括采用时间窗口滤波对人口迁移数据滤波,公式如下:
F=(x(n-t)+x(n-t+1)+......x(n))/t
其中,x(n)表示第n个时间点的人口移动数量,t为窗口大小。
优选地,所述获取手机信令数据流,包括使用TLS(Transport Layer Security)协议建立与移动通信基站的通信安全连接,获取手机信令数据流数据;采用加密算法AES(Advanced Encryption Standard)对手机信令数据流数据加密。
优选地,所述数据清洗、格式转换、噪声过滤,包括噪声过滤采用中值滤波进行过滤;所述格式转换包括时间戳转换和地理位置转换。
优选地,所述出行频率f包括采用将数据按照时间窗口划分,统计每个时间窗口内的出行次数。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有居民出行指标的评估应用程序,所述居民出行指标的评估应用程序被处理器执行时实现如权利要求1至4中任一项所述一种居民出行指标的评估方法的步骤。
如果采用支持向量机(SVM)取代关联规则挖掘算法,我们可以利用SVM的分类能力来自动识别出行行为与指标之间的关联规律。具体步骤如下:
数据准备:
准备训练数据集,包括出行特征和评估指标类别(高效或低效)的标记。
数据集应包含一组已标记的出行数据,以便训练SVM模型。
特征选择和提取:
从数据集中选择适当的出行特征作为输入特征向量,如出行距离、出行时间、出行频率等。
将每个出行数据表示为特征向量的形式,以便用于训练SVM模型。
训练支持向量机模型:
使用训练数据集训练SVM模型,使其能够根据输入的出行特征向量预测评估指标的类别(高效或低效)。
在训练过程中,SVM会根据已标记的数据点寻找一个最优超平面,以最大化数据点与超平面之间的间隔,并将不同类别的数据点尽可能分开。
模型预测:
使用训练好的SVM模型对新的出行数据进行预测。
将新的出行数据表示为特征向量形式,并输入到训练好的SVM模型中。
SVM模型将根据学习到的超平面将新的出行数据分类到相应的评估指标类别(高效或低效)中。
举例来说,假设我们的训练数据集中包含多个出行数据,每个数据点都有出行距离和出行时间作为特征,以及对应的评估指标类别(高效或低效)。
训练数据集示例:
通过训练SVM模型,模型会学习到一个最优超平面,将特征空间中的数据点分为高效和低效两类。然后,我们可以使用该模型对新的出行数据进行预测,判断其评估指标类别。
例如,我们有一个新的出行数据点,其特征向量为(7,35)。通过输入该特征向量到训练好的SVM模型中,模型会预测该出行数据点的评估指标类别。如果预测结果为高效,则说明该出行数据点与出行距离和出行时间之间存在一定的关联规律,表明出行距离较短、出行时间较短的出行通常被评估为高效。如果预测结果为低效,则说明相反的关联规律存在。
支持向量机通过学习训练数据集中的样本点的分布,以及找到合适的超平面来划分不同类别的样本点,从而自动识别出行行为与指标之间的关联规律。
本发明提供了一种居民出行指标的评估方法、装置及计算机可读存储介质,所能实现的有益技术效果如下:
1、本申请通过采用支持向量机建立出行指标评估模型,该模型通过历史出行数据和历史评估指标进行训练,自动计算出行指标,评估模型预测函数f(x)表示如下:
f(x)=sign(∑(αi*i**(x,xi))+b)
其中,K(xi,)为改进的径向基核函数,xi是输入样本的特征向量,||x-xi|表示输入样本的特征向量与输入的出行特征向量间的欧式距离,γ是径向基核函数的带宽参数,x为输入的出行特征向量,αi为支持向量对应的拉格朗日乘子,yi是对应的类别标签,b是偏置项,f为出行频率,将出行频率f加入到支持向量基核函数及计算过程中,考虑历史出行频率因素,大大增强了数据判断准确度,提高了数据处理效率。
2、本发明通过数据清洗、格式转换、噪声过滤,包括噪声过滤采用中值滤波进行过滤;所述格式转换包括时间戳转换和地理位置转换;大大实现了高质量数据的筛选判断,增强了数据计算效率提高了数据计算准确度。
3、本发明通过将出行频率f包括采用将数据按照时间窗口划分,统计每个时间窗口内的出行次数,选择影响较大的特征值作为支持向量机的数据基础,大大克服了数据冗余性,大大增强了计算效率,实现了快速实时显示人口流动显示。
以上对一种人口流动数据的获取方法方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想;同时,对于本领域的一般技术人员,依据本发明的思想和方法,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种居民出行指标的评估方法,其特征在于,包括步骤:
S1:获取手机信令出行数据,包括:获取手机信令数据流,解析手机信令数据流,提取数据流中出行关联数据字段;
S2:数据预处理,对获取的手机信令出行数据进行预处理,包括数据清洗、格式转换、噪声过滤;
S3:特征提取,从数据预处理后的数据中提取出行特征,包括出行距离、出行时间、出行频率f、行程起点、目的地、出行方式;
S4:建立评估模型,采用支持向量机建立出行指标评估模型,该模型通过历史出行数据和历史评估指标进行训练,自动计算出行指标,评估模型预测函数f(x)表示如下:
f(x)=sign(∑(αi*i**(x,xi))+b)
其中,K(xi,)为改进的径向基核函数,xi是输入样本的特征向量,||x-xi|表示输入样本的特征向量与输入的出行特征向量间的欧式距离,γ是径向基核函数的带宽参数,x为输入的出行特征向量,αi为支持向量对应的拉格朗日乘子,yi是对应的类别标签,b是偏置项,f为出行频率;
S5:评估指标计算,利用建立的评估模型,对居民的出行行为进行指标计算,计算出行效率值、出行便利度值、出行可持续性值;
S6:结果展示与存储,将评估结果保存在存储器中并通过显示设备展示给用户。
2.如权利要求1所述的一种居民出行指标的评估方法,其特征在于,所述获取手机信令数据流,包括使用TLS(Transport Layer Security)协议建立与移动通信基站的通信安全连接,获取手机信令数据流数据;采用加密算法AES(Advanced Encryption Standard)对手机信令数据流数据加密。
3.如权利要求1所述的一种居民出行指标的评估方法,其特征在于,所述数据清洗、格式转换、噪声过滤,包括噪声过滤采用中值滤波进行过滤;所述格式转换包括时间戳转换和地理位置转换。
4.如权利要求1所述的一种居民出行指标的评估方法,其特征在于,所述出行频率f包括采用将数据按照时间窗口划分,统计每个时间窗口内的出行次数。
5.一种居民出行指标的评估装置,其特征在于,包括数据采集器、预处理器、特征提取模块、评估模型模块、评估指标计算模块、结果展示与存储:
数据采集器获取手机信令出行数据,包括:获取手机信令数据流,解析手机信令数据流,提取数据流中出行关联数据字段;
预处理器对获取的手机信令出行数据进行预处理,包括数据清洗、格式转换、噪声过滤;
特征提取模块,从数据预处理后的数据中提取出行特征,包括出行距离、出行时间、出行频率f、行程起点、目的地、出行方式;
评估模型模块,采用支持向量机建立出行指标评估模型,该模型通过历史出行数据和历史评估指标进行训练,自动计算出行指标,评估模型预测函数f(x)表示如下:
f(x)=sign(∑(αi*i**(x,xi))+b)
其中,K(xi,)为改进的径向基核函数,xi是输入样本的特征向量,||x-xi|表示输入样本的特征向量与输入的出行特征向量间的欧式距离,γ是径向基核函数的带宽参数,x为输入的出行特征向量,αi为支持向量对应的拉格朗日乘子,yi是对应的类别标签,b是偏置项,f为出行频率;
评估指标计算模块,利用建立的评估模型,对居民的出行行为进行指标计算,计算出行效率值、出行便利度值、出行可持续性值;
结果展示与存储,将评估结果保存在存储器中并通过显示设备展示给用户。
6.如权利要求5所述的一种居民出行指标的评估装置,其特征在于,所述获取手机信令数据流,包括使用TLS(Transport Layer Security)协议建立与移动通信基站的通信安全连接,获取手机信令数据流数据;采用加密算法AES(Advanced Encryption Standard)对手机信令数据流数据加密。
7.如权利要求5所述的一种居民出行指标的评估装置,其特征在于,所述数据清洗、格式转换、噪声过滤,包括噪声过滤采用中值滤波进行过滤;所述格式转换包括时间戳转换和地理位置转换。
8.如权利要求5所述的一种居民出行指标的评估装置,其特征在于,所述出行频率f包括采用将数据按照时间窗口划分,统计每个时间窗口内的出行次数。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有居民出行指标的评估应用程序,所述居民出行指标的评估应用程序被处理器执行时实现如权利要求1至4中任一项所述一种居民出行指标的评估方法的步骤。
10.一种计算机电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的居民出行指标的评估方法的步骤。
CN202310748313.4A 2023-06-21 2023-06-21 居民出行指标的评估方法、装置及计算机可读存储介质 Active CN116777243B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310748313.4A CN116777243B (zh) 2023-06-21 2023-06-21 居民出行指标的评估方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310748313.4A CN116777243B (zh) 2023-06-21 2023-06-21 居民出行指标的评估方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN116777243A true CN116777243A (zh) 2023-09-19
CN116777243B CN116777243B (zh) 2024-02-09

Family

ID=87987441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310748313.4A Active CN116777243B (zh) 2023-06-21 2023-06-21 居民出行指标的评估方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN116777243B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985586A (zh) * 2018-06-28 2018-12-11 中国联合网络通信有限公司深圳市分公司 居民出行指标的评估方法、装置及计算机可读存储介质
CN109389240A (zh) * 2017-08-14 2019-02-26 南京理工大学 基于大数据机器学习的出行方式辨识方法
CN110517491A (zh) * 2019-08-23 2019-11-29 长沙理工大学 一种考虑路径冗余和出行效率的路段重要度排序方法
CN110727714A (zh) * 2019-10-21 2020-01-24 西南交通大学 融合时空聚类和支持向量机的居民出行特征提取方法
CN111667098A (zh) * 2020-05-14 2020-09-15 湖北工业大学 一种基于多模型组合优化的风力电站输出功率预测方法
CN112351394A (zh) * 2020-11-03 2021-02-09 崔毅 一种基于手机信令数据的交通出行模型构建方法
CN112668822A (zh) * 2020-09-14 2021-04-16 徐辉 科技成果转化平台共享系统、方法、存储介质、手机app
CN113569977A (zh) * 2021-08-05 2021-10-29 东南大学 一种基于手机信令数据的出行目的识别方法
CN113837383A (zh) * 2021-10-18 2021-12-24 中国联合网络通信集团有限公司 模型训练方法、装置、电子设备及存储介质
CN115086880A (zh) * 2022-08-22 2022-09-20 广州市城市规划勘测设计研究院 一种出行特征识别方法、装置、设备及存储介质
CN116017407A (zh) * 2022-12-15 2023-04-25 东南大学 一种手机信令数据驱动的居民出行方式可靠辨识方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389240A (zh) * 2017-08-14 2019-02-26 南京理工大学 基于大数据机器学习的出行方式辨识方法
CN108985586A (zh) * 2018-06-28 2018-12-11 中国联合网络通信有限公司深圳市分公司 居民出行指标的评估方法、装置及计算机可读存储介质
CN110517491A (zh) * 2019-08-23 2019-11-29 长沙理工大学 一种考虑路径冗余和出行效率的路段重要度排序方法
CN110727714A (zh) * 2019-10-21 2020-01-24 西南交通大学 融合时空聚类和支持向量机的居民出行特征提取方法
CN111667098A (zh) * 2020-05-14 2020-09-15 湖北工业大学 一种基于多模型组合优化的风力电站输出功率预测方法
CN112668822A (zh) * 2020-09-14 2021-04-16 徐辉 科技成果转化平台共享系统、方法、存储介质、手机app
CN112351394A (zh) * 2020-11-03 2021-02-09 崔毅 一种基于手机信令数据的交通出行模型构建方法
CN113569977A (zh) * 2021-08-05 2021-10-29 东南大学 一种基于手机信令数据的出行目的识别方法
CN113837383A (zh) * 2021-10-18 2021-12-24 中国联合网络通信集团有限公司 模型训练方法、装置、电子设备及存储介质
CN115086880A (zh) * 2022-08-22 2022-09-20 广州市城市规划勘测设计研究院 一种出行特征识别方法、装置、设备及存储介质
CN116017407A (zh) * 2022-12-15 2023-04-25 东南大学 一种手机信令数据驱动的居民出行方式可靠辨识方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
万传风;周涛;陈莉娇;: "基于乘客出行价值效用函数的P&R规模预测", 北京交通大学学报, no. 01 *

Also Published As

Publication number Publication date
CN116777243B (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
US20120323866A1 (en) Efficient development of a rule-based system using crowd-sourcing
Zhang et al. A deep learning approach to infer employment status of passengers by using smart card data
Zeng et al. Data Fusion for Traffic Incident Detector Using DS Evidence Theory with Probabilistic SVMs.
CN112465231B (zh) 地区人口健康状态预测方法、设备和可读存储介质
CN104103011A (zh) 一种基于纳税人利益关联网络的可疑纳税人识别方法
CN116340524A (zh) 一种基于关系自适应网络的小样本时态知识图谱补全方法
CN113553577B (zh) 基于超球面变分自动编码器的未知用户恶意行为检测方法及系统
CN116777243B (zh) 居民出行指标的评估方法、装置及计算机可读存储介质
CN112163019A (zh) 基于区块链的可信电子批记录处理方法及区块链服务平台
Wang et al. Contrastive GNN-based Traffic Anomaly Analysis Against Imbalanced Dataset in IoT-based ITS
CN115392351A (zh) 风险用户识别方法、装置、电子设备及存储介质
CN115239215A (zh) 一种基于深度异常检测的企业风险识别方法和系统
CN114298712A (zh) 一种加密货币异常交易检测方法及应用
Jenson et al. Mining location information from users' spatio-temporal data
CN113011990A (zh) 虚拟连接网络系统及其信息获取方法
Zhang et al. Improving data quality of smartphone‐based activity–travel survey: a framework for data post‐processing
CN113569879B (zh) 异常识别模型的训练方法、异常账号识别方法及相关装置
CN111626887A (zh) 一种社交关系评估方法及装置
CN113919447B (zh) 基于DNA分子加密和LightGBM算法的数字资产交易管理方法及系统
CN117850714B (zh) 一种云打印机数据审计方法以及相关装置
US20230409422A1 (en) Systems and Methods for Anomaly Detection in Multi-Modal Data Streams
CN114154564A (zh) 基于异质图的关联度确定方法、装置、电子设备及存储介质
Reddy et al. Network Traffic Prediction for 5G Network
CN116244661A (zh) 基于空-天-地多源异构监测数据的边坡滑动面识别方法
Khattab et al. T2D2: A Time Series Tester, Transformer, and Decomposer Framework for Outlier Detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant