CN111724002A - 基于kNN对用户即将乘坐的公交预测及到站信息提醒方法 - Google Patents

基于kNN对用户即将乘坐的公交预测及到站信息提醒方法 Download PDF

Info

Publication number
CN111724002A
CN111724002A CN202010616563.9A CN202010616563A CN111724002A CN 111724002 A CN111724002 A CN 111724002A CN 202010616563 A CN202010616563 A CN 202010616563A CN 111724002 A CN111724002 A CN 111724002A
Authority
CN
China
Prior art keywords
data
user
bus
information
knn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010616563.9A
Other languages
English (en)
Other versions
CN111724002B (zh
Inventor
刘在友
宋设
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Original Assignee
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaozhou Zhuoshu Big Data Industry Development Co Ltd filed Critical Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority to CN202010616563.9A priority Critical patent/CN111724002B/zh
Publication of CN111724002A publication Critical patent/CN111724002A/zh
Application granted granted Critical
Publication of CN111724002B publication Critical patent/CN111724002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于kNN对用户即将乘坐的公交预测及到站信息提醒方法,属于公交技术领域,本发明要解决的技术问题为如何利用kNN对位置信息数据进行处理,缓解用户等公交时的焦虑,节约成本的同时解放人力,采用的技术方案为:该方法是基于用户在等公交时的位置信息及乘坐公交时的公交信息,把用户的位置信息及公交信息关联起来,当用户再次到达该位置时,利用kNN算法预测出用户将要乘坐的公交,主动推送公交站点及位置信息给用户,无需用户去查询站点信息;具体如下:对用户位置信息数据及公交信息数据进行数据预处理;利用kNN算法预测用户将要乘坐的公交;调用公交实时位置接口服务,并将公交信息发送给用户。

Description

基于kNN对用户即将乘坐的公交预测及到站信息提醒方法
技术领域
本发明涉及公交技术领域,具体地说是一种基于kNN对用户即将乘坐的公交预测及到站信息提醒方法。
背景技术
随着社会和科学技术的不断进步,特别是各种提供位置信息服务的移动终端应用越来越成熟,位置数据的数据量发生了剧烈的增长,位置信息的数据结构也越来越复杂,往常的数据处理方式已经不能解决现代社会越来越严重的“数据剧增而知识贫乏”的现象,怎样对包含位置信息的数据进行深度挖掘以发现其潜在的有用知识成为一个急需解决的问题。
近年来随着地理信息系统的在我国的发展,地理信息系统被广泛应用于各个领域,基于位置信息的空间数据的数据量和复杂性急剧增加,处理这些数据所面临的问题也日趋巨大。
邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。kNN方法在类别决策时,只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,kNN方法较其他方法更为适合。
LBS(Location Based Services)是一种基于地理定位的信息或娱乐服务。其发展基于现代社会中人们普遍带有的“移动性”这一根本特征,位置信息与移动服务的融合具有巨大的市场潜力,是移动互联网发展的有机组成部分。随着5G和移动互联网的发展,基于用户的位置所提供的服务,极大方便了人们的生活。在交通出行方面,手机用户会用APP去查自己的公交线路及到站信息,然后利用支付宝、微信或者云闪付等APP的乘车码去支付。基于位置的服务(Location Based Services,LBS)是利用各类型的定位技术来获取定位设备当前的所在位置,通过移动互联网向定位设备提供信息资源和基础服务。LBS首先用户可利用定位技术确定自身的空间位置,随后用户便可通过移动互联网来获取与位置相关资源和信息。LBS服务中融合了移动通讯、互联网络、空间定位、位置信息、大数据等多种信息技术,利用移动互联网络服务平台进行数据更新和交互,使用户可以通过空间定位来获取相应的服务。
故如何利用kNN对位置信息数据进行处理,缓解用户等公交时的焦虑,节约成本的同时解放人力是目前亟待解决的技术问题。
发明内容
本发明的技术任务是提供一种基于kNN对用户即将乘坐的公交预测及到站信息提醒方法,来解决如何利用kNN对位置信息数据进行处理,缓解用户等公交时的焦虑,节约成本的同时解放人力的问题。
本发明的技术任务是按以下方式实现的,一种基于kNN对用户即将乘坐的公交预测及到站信息提醒方法,该方法是基于用户在等公交时的位置信息及乘坐公交时的公交信息,把用户的位置信息及公交信息关联起来,当用户再次到达该位置时,利用kNN算法预测出用户将要乘坐的公交,主动推送公交站点及位置信息给用户,无需用户去查询站点信息;具体如下:
对用户位置信息数据及公交信息数据进行数据预处理;
利用kNN算法预测用户将要乘坐的公交;
调用公交实时位置接口服务,并将公交信息发送给用户。
作为优选,所述数据预处理具体如下:
数据清理:通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决数据不一致性实现数据格式标准化、清除异常数据、纠正错误数据以及清除重复数据的目的;
数据集成:将多个数据源的数据结合起来并统一存储,建立数据仓库;
数据变换:通过平滑聚集、数据概化、规范化的方式将数据转换成适用于数据挖掘的形式;
数据归约:将得到的数据集用归约表示,简化了数据,保证原始数据的完整性的同时确保结果与归约前结果相同。
作为优选,所述利用kNN算法预测用户将要乘坐的公交具体如下:
输入:训练数据集T={x1,x2,…,xn},测试数据x;
输出:实例x所属的类别y,类别指的是具体的几路公交;
(1)、根据给定的距离度量,在训练集T中找到与x距离最近的k个样本,涵盖这k个点的x的邻域记作Nk(x),距离计算公式为:
Figure BDA0002563942620000031
(2)、在Nk(x)中根据多数表决规则确定x的类别y:
Figure BDA0002563942620000032
其中,i=1,2,…,n;j=1,2,…,k。
更优地,所述调用公交实时位置接口服务,并将公交信息发送给用户具体如下:
根据预测的公交路线信息,查询该公交实时位置,并利用微信服务号的方式发送给用户,用户便能查看即将乘坐的公交信息。
一种基于kNN对用户即将乘坐的公交预测及到站信息提醒系统,该系统包括,
数据预处理单元,用于对用户位置信息数据及公交信息数据进行数据预处理;
公交信息预测单元,用于利用kNN算法预测用户将要乘坐的公交;
公交信息推送单元,用于调用公交实时位置接口服务,并将公交信息发送给用户。
作为优选,所述数据预处理单元包括,
数据清理模块,用于通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决数据不一致性实现数据格式标准化、清除异常数据、纠正错误数据以及清除重复数据的目的;
数据集成模块,用于将多个数据源的数据结合起来并统一存储,建立数据仓库;
数据变换模块,用于通过平滑聚集、数据概化、规范化的方式将数据转换成适用于数据挖掘的形式;
数据归约模块,用于将得到的数据集用归约表示,简化了数据,保证原始数据的完整性的同时确保结果与归约前结果相同。
作为优选,所述公交信息预测单元的工作过程具体如下:
输入:训练数据集T={x1,x2,…,xn},测试数据x;
输出:实例x所属的类别y,类别指的是具体的几路公交;
(1)、根据给定的距离度量,在训练集T中找到与x距离最近的k个样本,涵盖这k个点的x的邻域记作Nk(x),距离计算公式为:
Figure BDA0002563942620000041
(2)、在Nk(x)中根据多数表决规则确定x的类别y:
Figure BDA0002563942620000042
其中,i=1,2,…,n;j=1,2,…,k。
更优地,所述公交信息推送单元具体是根据预测的公交路线信息,查询该公交实时位置,并利用微信服务号的方式发送给用户,用户便能查看即将乘坐的公交信息。
一种电子设备,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上述的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行时,实现如上述的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法。
本发明的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法具有以下优点:
(一)本发明节约成本,解放人力,同时也为了缓解用户等公交时的焦虑;
(二)本发明将乘坐公交的历史数据与位置数据整合,结合数据挖掘模型,1)利用公交数据与位置信息对用户即将乘坐的公交进行预测,并有针对性的将公交位置信息推送给用户;
(三)本发明利用KNN算法对用户即将乘坐的公交线路进行预测,将KNN算法模型引入到交通出行应用中,扩展了KNN算法的应用场景。
附图说明
下面结合附图对本发明进一步说明。
附图1为基于kNN对用户即将乘坐的公交预测及到站信息提醒方法的流程框图。
具体实施方式
参照说明书附图和具体实施例对本发明的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法作以下详细地说明。
实施例1:
如附图1所示,本发明的基于KNN对用户即将乘坐的公交预测及到站信息提醒方法,该方法是基于用户在等公交时的位置信息及乘坐公交时的公交信息,把用户的位置信息及公交信息关联起来,当用户再次到达该位置时,利用kNN算法预测出用户将要乘坐的公交,主动推送公交站点及位置信息给用户,无需用户去查询站点信息;具体如下:
S1、对用户位置信息数据及公交信息数据进行数据预处理;具体如下:
S101、数据清理:通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决数据不一致性实现数据格式标准化、清除异常数据、纠正错误数据以及清除重复数据的目的;
S102、数据集成:将多个数据源的数据结合起来并统一存储,建立数据仓库;
S103、数据变换:通过平滑聚集、数据概化、规范化的方式将数据转换成适用于数据挖掘的形式;
S104、数据归约:将得到的数据集用归约表示,简化了数据,保证原始数据的完整性的同时确保结果与归约前结果相同。
S2、利用kNN算法预测用户将要乘坐的公交;具体如下:
k近邻算法,也称为KNN算法,是一种基本分类与回归算法。KNN就是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(K个邻居),这K个实例的多数属于某个类,就把该输入实例分类到这个类中。
如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K近邻算法使用的模型实际上对应于对特征空间的划分。
输入:训练数据集T={x1,x2,…,xn},测试数据x;
输出:实例x所属的类别y,类别指的是具体的几路公交;
(1)、根据给定的距离度量,在训练集T中找到与x距离最近的k个样本,涵盖这k个点的x的邻域记作Nk(x),距离计算公式为:
Figure BDA0002563942620000061
(2)、在Nk(x)中根据多数表决规则确定x的类别y:
Figure BDA0002563942620000062
其中,i=1,2,…,n;j=1,2,…,k。
S3、调用公交实时位置接口服务,并将公交信息发送给用户;具体如下:
根据预测的公交路线信息,查询该公交实时位置,并利用微信服务号的方式发送给用户,用户便能查看即将乘坐的公交信息。
实施例2:
本发明的基于kNN对用户即将乘坐的公交预测及到站信息提醒系统,该系统包括,
数据预处理单元,用于对用户位置信息数据及公交信息数据进行数据预处理;数据预处理单元包括,
数据清理模块,用于通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决数据不一致性实现数据格式标准化、清除异常数据、纠正错误数据以及清除重复数据的目的;
数据集成模块,用于将多个数据源的数据结合起来并统一存储,建立数据仓库;
数据变换模块,用于通过平滑聚集、数据概化、规范化的方式将数据转换成适用于数据挖掘的形式;
数据归约模块,用于将得到的数据集用归约表示,简化了数据,保证原始数据的完整性的同时确保结果与归约前结果相同。
公交信息预测单元,用于利用kNN算法预测用户将要乘坐的公交;
其中,公交信息预测单元的工作过程具体如下:
输入:训练数据集T={x1,x2,…,xn},测试数据x;
输出:实例x所属的类别y,类别指的是具体的几路公交;
(1)、根据给定的距离度量,在训练集T中找到与x距离最近的k个样本,涵盖这k个点的x的邻域记作Nk(x),距离计算公式为:
Figure BDA0002563942620000071
(2)、在Nk(x)中根据多数表决规则确定x的类别y:
Figure BDA0002563942620000072
其中,i=1,2,…,n;j=1,2,…,k。
公交信息推送单元,用于调用公交实时位置接口服务,并将公交信息发送给用户。公交信息推送单元具体是根据预测的公交路线信息,查询该公交实时位置,并利用微信服务号的方式发送给用户,用户便能查看即将乘坐的公交信息。
实施例3:
本发明实施例还提供了一种电子设备,包括:存储器和一个处理器;
其中,所述存储器存储计算机执行指令;
所述一个处理器执行所述存储器存储的计算机执行指令,使得所述一个处理器执行如实施例1中的基于KNN对用户即将乘坐的公交预测及到站信息提醒方法。
实施例4:
本发明实施例还提供了一种计算机可读存储介质,其中存储有多条指令,指令由处理器加载,使处理器执行本发明任一实施例中的基于KNN对用户即将乘坐的公交预测及到站信息提醒方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-R基于kNN对用户即将乘坐的公交预测及到站信息提醒方法M、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于kNN对用户即将乘坐的公交预测及到站信息提醒方法,其特征在于,该方法是基于用户在等公交时的位置信息及乘坐公交时的公交信息,把用户的位置信息及公交信息关联起来,当用户再次到达该位置时,利用kNN算法预测出用户将要乘坐的公交,主动推送公交站点及位置信息给用户,无需用户去查询站点信息;具体如下:
对用户位置信息数据及公交信息数据进行数据预处理;
利用kNN算法预测用户将要乘坐的公交;
调用公交实时位置接口服务,并将公交信息发送给用户。
2.根据权利要求1所述的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法,其特征在于,所述数据预处理具体如下:
数据清理:通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决数据不一致性实现数据格式标准化、清除异常数据、纠正错误数据以及清除重复数据的目的;
数据集成:将多个数据源的数据结合起来并统一存储,建立数据仓库;
数据变换:通过平滑聚集、数据概化、规范化的方式将数据转换成适用于数据挖掘的形式;
数据归约:将得到的数据集用归约表示,简化了数据,保证原始数据的完整性的同时确保结果与归约前结果相同。
3.根据权利要求1所述的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法,其特征在于,所述利用kNN算法预测用户将要乘坐的公交具体如下:
输入:训练数据集T={x1,x2,…,xn},测试数据x;
输出:实例x所属的类别y,类别指的是具体的几路公交;
(1)、根据给定的距离度量,在训练集T中找到与x距离最近的k个样本,涵盖这k个点的x的邻域记作Nk(x),距离计算公式为:
Figure FDA0002563942610000021
(2)、在Nk(x)中根据多数表决规则确定x的类别y:
Figure FDA0002563942610000022
其中,i=1,2,…,n;j=1,2,…,k。
4.根据权利要求1-3中任一所述的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法,其特征在于,所述调用公交实时位置接口服务,并将公交信息发送给用户具体如下:
根据预测的公交路线信息,查询该公交实时位置,并利用微信服务号的方式发送给用户,用户便能查看即将乘坐的公交信息。
5.一种基于kNN对用户即将乘坐的公交预测及到站信息提醒系统,其特征在于,该系统包括,
数据预处理单元,用于对用户位置信息数据及公交信息数据进行数据预处理;
公交信息预测单元,用于利用kNN算法预测用户将要乘坐的公交;
公交信息推送单元,用于调用公交实时位置接口服务,并将公交信息发送给用户。
6.根据权利要求5所述的基于kNN对用户即将乘坐的公交预测及到站信息提醒系统,其特征在于,所述数据预处理单元包括,
数据清理模块,用于通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决数据不一致性实现数据格式标准化、清除异常数据、纠正错误数据以及清除重复数据的目的;
数据集成模块,用于将多个数据源的数据结合起来并统一存储,建立数据仓库;
数据变换模块,用于通过平滑聚集、数据概化、规范化的方式将数据转换成适用于数据挖掘的形式;
数据归约模块,用于将得到的数据集用归约表示,简化了数据,保证原始数据的完整性的同时确保结果与归约前结果相同。
7.根据权利要求5所述的基于kNN对用户即将乘坐的公交预测及到站信息提醒系统,其特征在于,所述公交信息预测单元的工作过程具体如下:
输入:训练数据集T={x1,x2,…,xn},测试数据x;
输出:实例x所属的类别y,类别指的是具体的几路公交;
(1)、根据给定的距离度量,在训练集T中找到与x距离最近的k个样本,涵盖这k个点的x的邻域记作Nk(x),距离计算公式为:
Figure FDA0002563942610000031
(2)、在Nk(x)中根据多数表决规则确定x的类别y:
Figure FDA0002563942610000032
其中,i=1,2,…,n;j=1,2,…,k。
8.根据权利要求5-7中任一所述的基于kNN对用户即将乘坐的公交预测及到站信息提醒系统,其特征在于,所述公交信息推送单元具体是根据预测的公交路线信息,查询该公交实时位置,并利用微信服务号的方式发送给用户,用户便能查看即将乘坐的公交信息。
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至4任一项所述的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行时,实现如权利要求1至4中所述的基于kNN对用户即将乘坐的公交预测及到站信息提醒方法。
CN202010616563.9A 2020-07-01 2020-07-01 基于kNN对用户即将乘坐的公交预测及到站信息提醒方法 Active CN111724002B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010616563.9A CN111724002B (zh) 2020-07-01 2020-07-01 基于kNN对用户即将乘坐的公交预测及到站信息提醒方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010616563.9A CN111724002B (zh) 2020-07-01 2020-07-01 基于kNN对用户即将乘坐的公交预测及到站信息提醒方法

Publications (2)

Publication Number Publication Date
CN111724002A true CN111724002A (zh) 2020-09-29
CN111724002B CN111724002B (zh) 2022-07-05

Family

ID=72570631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010616563.9A Active CN111724002B (zh) 2020-07-01 2020-07-01 基于kNN对用户即将乘坐的公交预测及到站信息提醒方法

Country Status (1)

Country Link
CN (1) CN111724002B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096639A (zh) * 2014-05-23 2015-11-25 中国电信股份有限公司 用于预测公交到站时间的方法、装置和系统
CN106203965A (zh) * 2016-07-27 2016-12-07 Tcl移动通信科技(宁波)有限公司 一种公交乘车提醒方法、系统及移动终端
CN110069720A (zh) * 2017-11-03 2019-07-30 北京嘀嘀无限科技发展有限公司 公交乘车路线推送方法及装置、计算机设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096639A (zh) * 2014-05-23 2015-11-25 中国电信股份有限公司 用于预测公交到站时间的方法、装置和系统
CN106203965A (zh) * 2016-07-27 2016-12-07 Tcl移动通信科技(宁波)有限公司 一种公交乘车提醒方法、系统及移动终端
CN110069720A (zh) * 2017-11-03 2019-07-30 北京嘀嘀无限科技发展有限公司 公交乘车路线推送方法及装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111724002B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
CN110555640B (zh) 路由规划的方法和装置
CN108920135B (zh) 一种自定义业务生成方法、装置、计算机设备及存储介质
CN104346921A (zh) 基于位置信息的出租车信息通讯服务系统、终端和方法
CN112650790B (zh) 目标点云平面确定方法,装置,电子设备及存储介质
CN1496509A (zh) 信息管理系统、信息管理系统用服务器以及信息管理系统用信息终端
CN111464352A (zh) 调用链路数据处理方法及装置
CN113190538A (zh) 一种基于轨迹数据的道路构建方法、装置、存储介质及终端
CN113449895A (zh) 车辆调度方法和装置
CN112836991B (zh) 站点规划方法、装置、终端设备和可读存储介质
CN109945886B (zh) 行政区划切换提示的方法、装置、设备及介质
CN111813529B (zh) 数据处理方法、装置、电子设备及存储介质
CN111724002B (zh) 基于kNN对用户即将乘坐的公交预测及到站信息提醒方法
CN113255950B (zh) 一种优化物流网络的方法和装置
CN113220281A (zh) 一种信息生成方法、装置、终端设备及存储介质
CN115563522B (zh) 交通数据的聚类方法、装置、设备及介质
CN116321004A (zh) 一种确定目标位置的方法、装置、系统及存储介质
CN111400520A (zh) 人脸识别库的构建方法、人脸支付方法、装置和系统
CN116822002A (zh) 设施构件的自动化布置方法,装置,电子设备及存储介质
CN112052276B (zh) 乘车路线的挖掘方法和装置
CN112613955A (zh) 订单处理方法、装置、电子设备及存储介质
CN112488624A (zh) 物流路由信息计算方法、装置、设备以及存储介质
CN116541421B (zh) 地址查询信息生成方法、装置、电子设备与计算机介质
CN115456262A (zh) 一种车辆调度方法、装置、电子设备及存储介质
CN110648208B (zh) 群组识别方法、装置和电子设备
CN110619087B (zh) 用于处理信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Song She

Inventor after: Liu Zaiyou

Inventor before: Liu Zaiyou

Inventor before: Song She

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant