CN107563789A - 数据处理方法、系统、终端及计算机可读存储介质 - Google Patents

数据处理方法、系统、终端及计算机可读存储介质 Download PDF

Info

Publication number
CN107563789A
CN107563789A CN201710638237.6A CN201710638237A CN107563789A CN 107563789 A CN107563789 A CN 107563789A CN 201710638237 A CN201710638237 A CN 201710638237A CN 107563789 A CN107563789 A CN 107563789A
Authority
CN
China
Prior art keywords
project
data
commercial circle
created
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710638237.6A
Other languages
English (en)
Inventor
过弋
万锋
方旭
孙卫
陈苏
王家辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Shihezi University
Original Assignee
East China University of Science and Technology
Shihezi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology, Shihezi University filed Critical East China University of Science and Technology
Priority to CN201710638237.6A priority Critical patent/CN107563789A/zh
Publication of CN107563789A publication Critical patent/CN107563789A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及通信技术领域,公开了一种数据处理方法、系统、终端及计算机可读存储介质。在本发明中,数据处理方法应用于商圈中的项目创建,包括获取待创建项目的项目信息;根据项目信息,在预先建立的项目数据表中查找与项目信息匹配的项目数据,并根据项目数据确定待创建项目所属的商圈;其中,项目数据表用于存储商圈数据和/或居民区数据,且商圈数据按照预设的项目类型分类;根据五力模型,确定待创建项目在商圈中的项目评分,并显示项目评分。本发明实施方式提供的数据处理方法、系统、终端及计算机可读存储介质,能够在商圈中创建项目时,快速得到准确度较高的参考数据,使得最终创建的项目更贴近实际需求。

Description

数据处理方法、系统、终端及计算机可读存储介质
技术领域
本发明涉及通信技术领域,特别涉及一种数据处理方法、系统、终端及计算机可读存储介质。
背景技术
大数据时代的到来,意味着数据成为了驱动企业发展的重要动力。数据已经成为企业生产、经营、战略等经营活动正常运行,所不可或缺的因素。同样地,数据对商圈的发展同样有着重要作用。对商圈发展产生作用的因素包括城市规模、地理位置、周围环境、交通状况、人流量、店铺数量以及店铺品牌等级等等。因此,越来越多的企业在建设商圈以及开设店铺时会以数据作为决策支撑,而不是单靠个人经验去选择商圈或店铺开设地点。
但是在实现本发明的过程中,发明人发现现有技术中存在一些问题:目前在选择商圈或店铺开设地点时,作为决策支撑的数据往往是通过人为获取,比如实地考察等,然后对获取的大量数据进行筛选,最终得出的。这一过程不仅耗费人力、物力,并且会在筛选过程中,由于人为因素导致数据筛选错误,使得最终作为建设商圈以及开设店铺的决策支撑不够准确,参考价值不大。
发明内容
本发明实施方式的目的在于提供一种数据处理方法、系统、终端及计算机可读存储介质,能够在商圈中创建项目时,快速得到准确度较高的参考数据,使得最终创建的项目更贴近实际需求。
为解决上述技术问题,本发明的实施方式提供了一种数据处理方法。该数据处理方法应用于商圈中的项目创建,包括获取待创建项目的项目信息;其中,项目信息至少包括项目位置及以下任意一种或任意组合:项目名称、开业时间、经营面积;根据项目信息,在预先建立的项目数据表中查找与项目信息匹配的项目数据,并根据项目数据确定待创建项目所属的商圈;其中,项目数据表用于存储商圈数据和/或居民区数据,且商圈数据按照预设的项目类型分类;根据五力模型,确定待创建项目在商圈中的项目评分,并显示项目评分;其中,五力模型中的五力根据待创建项目确定。
本发明的实施方式还提供了一种数据处理系统包括:获取模块、存储模块、商圈确定模块、项目评分确定模块和显示模块;获取模块用于获取待创建项目的项目信息;其中,项目信息至少包括项目位置及以下任意一种或任意组合:项目名称、开业时间、经营面积;存储模块用于存储预先建立的项目数据表;其中,项目数据表用于存储商圈数据和/或居民区数据,且商圈数据按照预设的项目类型分类;商圈确定模块用于根据项目信息,在项目数据表中查找与项目信息匹配的项目数据,并根据项目数据确定待创建项目所属的商圈;项目评分确定模块用于根据五力模型,确定待创建项目在商圈中的项目评分,并触发显示模块显示项目评分;其中,五力模型中的五力根据待创建项目确定。
本发明的实施方式还提供了一种终端,包括至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本发明任意实施方式中涉及的数据处理方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,且计算机程序被处理器执行时能够实现本发明任意实施方式中涉及的数据处理方法。
本发明实施方式相对于现有技术而言,提供了一种在商圈中创建项目时,能够精准处理与待创建项目相关数据的数据处理方法。本发明实施方式提供的数据处理方法,在需要创建项目时,通过在预先建立的项目数据表中查找与获取到的待创建项目的项目信息匹配的项目数据,来确定待创建项目所属的商圈,从而可以帮助用户准确定位自己所要创建的项目所属的商圈,方便用户后续对相应商圈的了解,避免做无用投入。另外,通过利用五力模型,确定待创建项目在商圈中的项目评分,并将结果进行显示供用户查看,从而可以方便用户获知自己所要创建的项目是否在当前商圈中有前景。
另外,数据处理方法还包括:根据项目信息,在项目数据表中查找与项目信息匹配的项目数据,根据项目数据确定与商圈相似的商圈,并显示与商圈相似的商圈。通过确定与待创建项目所属的商圈相似的商圈,并将确定的相似的商圈进行显示,使得用户在商圈中创建项目时,可以得到更多的参考数据。
另外,在根据项目数据确定与商圈相似的商圈之后,数据处理方法还包括:确定与商圈相似的商圈中,与待创建项目相似的项目,并显示相似的项目。通过确定并显示相似的商圈中与待创建项目相似的项目,从而可以进一步丰富用户在商圈中创建项目时,可以参考的数据,使得最终创建的项目更贴近实际需求。
另外,在获取待创建项目的项目信息之后,确定待创建项目所属的商圈之前,数据处理方法还包括:检测项目数据表中是否存在与项目信息中的项目位置相关的项目数据;若确定项目数据表中未存在与项目信息中的项目位置相关的项目数据,采集以项目位置为中心的预设范围内的商圈数据和/或居民区数据,并将采集到的商圈数据和/或居民区数据存储到项目数据表。在项目数据表中未存在与待创建项目的项目位置相关的项目数据时,通过采集以项目位置为中心的预设范围内的商圈数据和/或居民区数据,使得项目数据表中存储的项目数据与待创建项目的项目信息匹配度更高,从而进一步保障了数据处理过程中确定的待创建项目所属的商圈及待创建项目所属的项目评分的准确性。
另外,项目数据表中存储的项目数据为数据去重和/或数据丢弃后的项目数据;其中,在项目数据表中存储的任意两条项目数据相同时,删除或标记任意两条项目数据中的一条;和/或,在项目数据表中存储的任一项目数据存在缺失项时,删除存在缺失项的项目数据。通过对项目数据表中存储的项目数据进行数据去重和/或数据丢弃的清洗操作,保证了项目数据表存储的项目数据均为有效数据,使得进行数据处理操作后得到的结果具有较高的准确性。
附图说明
一个或多个实施方式通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施方式的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本发明第一实施方式的数据处理方法的流程图;
图2是本发明第二实施方式的数据处理方法的流程图;
图3是本发明第三实施方式的数据处理系统的结构框图;
图4是本发明第四实施方式的数据处理系统的结构框图;
图5是本发明第五实施方式的终端的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种数据处理方法,具体流程如图1所示。
图1所示的数据处理方法主要应用于商圈中的项目创建,并且数据处理方法可以在用户终端中使用,其中该用户终端可以为例如个人计算机、智能手机、平板电脑等等。
具体的说,本发明实施方式中所说的商圈,是指商店以其所在地点为中心,沿着一定的方向和距离扩展,吸引顾客的辐射范围。简单地说,也就是来店顾客所居住的区域范围。无论大商场还是小商店,它们的销售总是有一定的地理范围。这个地理范围就是以商场为中心,向四周辐射至可能来店购买的消费者所居住的地点。基于商圈的概念,本发明实施方式中涉及的商圈数据及居民区数据均是建立在这个基础上的,具体而言,图1涉及的数据处理方法的流程可以包括:
在步骤101中,获取待创建项目的项目信息。
需要说明的是,本发明实施方式中的项目信息至少需要包括项目位置,另外为了保证后续处理结果的准确性,还可以包括项目名称、开业时间、经营面积等任意一种或任意几种的组合,在实际应用中可以根据需要输入,此处不做限制。
在步骤102中,确定待创建项目所属的商圈。
具体的说,待创建项目所属的商圈的确认,需要根据项目信息,在预先建立的项目数据表中查找与项目信息匹配的项目数据,并根据项目数据确定,另外,本发明实施方式中项目数据表存储的项目数据主要为商圈数据和/或居民区数据,具体可以根据实际应用场景选择设定,此处不做限制。
需要说明的是,本发明实施方式中采集的商圈数据主要包括商圈内拥有的店铺数量、店铺的类型、店铺的具体位置、周边环境、店内环境、商家服务等等,此处不再一一列举,具体可以根据需要筛选。
另外,为了方便用户查看和后续的数据处理过程,商圈数据可以按照预设的项目类型分类,如美食、酒店、休闲娱乐、购物等等,此处不再一一列举。
居民区数据主要包括小区名称、小区的具体位置、小区的户数、小区的入住率、户主年龄段等等,此处不再一一列举,具体可以根据需要筛选。
另外,为了保证存储在项目数据表中的项目数据足够多,保证后续进行数据处理的过程能够得到更加准确的结果,通常会采用网络爬虫等数据爬取程序从各大网站爬取相关数据,如大众点评、美团等购物点评网站,以及百度地图,在保证数据量的同时也可以保证爬取的数据具有足够的准确性。
在采用网络爬虫爬取网络数据时,通过爬取各大权威网站的数据,具体可以是携带有数据的一个网页地址URL,然后根据该URL地址中包含的字段进行解析,从而将相应的数据获取下来,并存储到项目数据表中,具体的实现方式,本领域的技术人员可以根据实际需要实现,此处不再赘述。
在步骤103中,确定并显示待创建项目在商圈中的项目评分。
具体的说,待创建项目在商圈中的项目评分,需要根据五力模型确定,另外,本发明实施方式中采用的五力模型中的五力需要根据待创建项目确定。比如,待创建项目跟美食相关,则五力模型中的五力可以设定为环境分数、服务分数、口味分数、平均可达时间(用户达到目的地所需时间)、店铺数量,具体的可以根据用户实际关注的重点来进行设定,此处不做限制。
需要说明的是,本发明实施方式中采用的五力模型为基于麦克尔·波特于80年代初提出的用于竞争战略的分析的模型,因而,可以有效的分析客户的竞争环境,关于五力模型的应用,具体如下:
比如说待创建的项目与美食相关,此时五力模型中的四力可以分别确定为:口味分、环境分、服务分、平均可达时间,并为这四力分别设置对应的权重,另一力可以为与美食相关的店铺的数量。其中,口味分、服务分、环境分为商圈中店铺对应各项的平均值,平均可达时间为商圈内各小区户数乘以各小区距商圈距离的积,除以商圈内所有居民区的总户数,根据这种计算方式,得到的平均可达时间越小得分越高。
经过以上计算后,可以得到四力的具体得分,然后将得到的分数乘以相应的权重之后即可得到最终得分。最后对得分进行归一化处理,由于四力的满分都为10分,四力的权重之和为1,为了保证最终得分的满分不大于10分,因此,还需要在得到最终得分后,将最终得分除以10,从而将最终得分标准化,经过上述一系列操作之后,既可得到待创建项目在商圈中的项目评分,具体的实现过程本领域的技术人员可以根据现有技术实现,此处不再赘述。
另外,值得一提的是,在实际应用中,为了给用户提供更丰富具体的参考数据,还可以根据项目信息,在项目数据表中查找与项目信息匹配的项目数据,根据项目数据确定与商圈相似的商圈,并将确定的相似的商圈显示在用户终端的显示界面,供用户进行参考。
进一步的,还可以在根据项目数据确定与商圈相似的商圈之后,确定并显示相似的商圈中与待创建项目相似的项目,从而可以进一步丰富用户在商圈中创建项目时,可以参考的数据,使得最终创建的项目更贴近实际需求。
具体的说,上述确定与商圈相似的商圈以及从相似的商圈中确定与待创建项目相似的项目具体可以通过在用户界面输入的项目信息中的项目位置定位项目所在的坐标,再从项目数据表中选取项目所在的商圈,得到商圈后再选取与该商圈相似的几个商圈信息,如将该商圈与其他商圈对应的字段值的值进行做差,在把各项差值的绝对值进行相加,得到和较小的几个商圈即为该商圈的相似商圈,在得到相似的商圈后,再从相似的商圈中找与该项目相似的几个相似项目,如分别将该项目的各个字段与项目数据表中项目对应字段做差,再把各项差的绝对值相加,得到的和较小的几个项目即为该项目的相似项目,具体的计算方式,本领域的技术人员可以根据实际需要,选取合适的计算方法获得,此处不做限制。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式提供了一种在商圈中创建项目时,能够精准处理与待创建项目相关数据的数据处理方法。本发明实施方式提供的数据处理方法,在需要创建项目时,通过在预先建立的项目数据表中查找与获取到的待创建项目的项目信息匹配的项目数据,来确定待创建项目所属的商圈,从而可以帮助用户准确定位自己所要创建的项目所属的商圈,方便用户后续对相应商圈的了解,避免做无用投入。另外,通过利用五力模型,确定待创建项目在商圈中的项目评分,并将结果进行显示供用户查看,从而可以方便用户获知自己所要创建的项目是否在当前商圈中有前景。
本发明的第二实施方式涉及一种数据处理方法。本实施方式在第一实施方式的基础上做了进一步改进,具体改进之处为:在获取待创建项目的项目信息之后,确定待创建项目所属的商圈之前,需要先检测项目数据表中是否存在与项目信息中的项目位置相关的项目数据,具体流程如图2所示。
具体的说,在本实施方式中,包含步骤201至步骤205,其中,步骤201、步骤204和步骤205分别与第一实施方式中的步骤101至步骤103大致相同,此处不再赘述。下面主要介绍不同之处:
在步骤202中,检测项目数据表中是否存在与项目信息中的项目位置相关的项目数据。
具体的说,在确定项目数据表中未存在与项目信息中的项目位置相关的项目数据时,进入步骤203;否则,直接进入步骤204。
在步骤203中,采集商圈数据和/或居民区数据,并存储到项目数据表。
具体的说,在项目数据表中未存在与项目信息中的项目位置相关的项目数据时,利用网络爬虫采集的商圈数据和/或居民区数据,是以项目位置为中心的预设范围内的商圈数据和/或居民区数据,即以用户输入的待创建项目的项目信息中的项目位置的经纬度坐标点为中心,沿着一定的方向和距离扩散,如以坐标点为圆心,半径为1000米形成的圆形区域中的商圈数据和/或居民区数据。
另外,值得一提的是,本发明实施方式中存储于项目数据表中的项目数据,如商圈数据和/或居民区数据均为进行过数据去重和/或数据丢弃等数据清洗操作的项目数据,即在项目数据表中存储的任意两条项目数据相同时,删除或标记任意两条项目数据中的一条;和/或,在项目数据表中存储的任一项目数据存在缺失项时,删除存在缺失项的项目数据。为了方便理解,下面对数据去重和数据丢弃进行具体说明:
数据去重就是对网络爬虫爬取得到的重复的数据进行删除。由于爬取来的数据全部存放在数据库中的项目数据表中,在实际应用中,存放商圈店铺数据的数据表内可以设置很多字段,其中可以包括商圈、城市和店铺名等字段。在进行数据去重是,通过选取商圈、城市和店铺名字段作为参照对象,即每条数据比较一下商圈、城市和店铺名字段,如果这三个字段全部重复即可定义这条数据在项目数据表中出已经存在,因此,这条数据属于重复数据,需要删除此条数据或对此条数据进行标记。
数据丢弃就是对不符合规范的数据进行抛弃。例如在采用网络爬虫爬取居民区数据时,会遇到很多数据不符合规范,如某一字段没有信息,获取到的为空数据,针对这种情况,可以根据应用场景预先设置一套判断规则,然后按照预设的判断规则进行判断,当符合丢弃条件时,就将此条数据删除。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定,在实际应用中,可以根据需要进行合理设置,此处不做具体限定。
与现有技术相比,本实施方式中提供的数据处理方法,在确定待创建项目所属的商圈之前,通过判断在项目数据表中是否存在与待创建项目的项目位置相关的项目数据,并在项目数据表中未存在与待创建项目的项目位置相关的项目数据时,采集以项目位置为中心的预设范围内的商圈数据和/或居民区数据,使得项目数据表中存储的项目数据与待创建项目的项目信息匹配度更高,从而进一步保障了数据处理过程中确定的待创建项目所属的商圈及待创建项目所属的项目评分的准确性。另外,通过对项目数据表中存储的项目数据进行数据去重和/或数据丢弃的清洗操作,保证了项目数据表存储的项目数据均为有效数据,使得进行数据处理操作后得到的结果具有较高的准确性。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包含相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明的第三实施方式涉及一种数据处理系统,如图3所示。
图3所示的数据处理系统300具体包括:获取模块301、存储模块302、商圈确定模块303、项目评分确定模块304、显示模块305、相似商圈确定模块306及相似项目确定模块307。
具体的说,获取模块301用于获取待创建项目的项目信息。
需要说明的是,本发明实施方式中的项目信息至少需要包括项目位置,另外为了保证后续处理结果的准确性,还可以包括项目名称、开业时间、经营面积等任意一种或任意几种的组合,在实际应用中可与根据需要输入,此处不做限制。
存储模块302用于存储预先建立的项目数据表。
其中,项目数据表用于存储商圈数据和/或居民区数据,具体可以根据实际应用场景选择设定,此处不做限制。
另外,为了方便用户查看和数据处理过程,商圈数据可以按照预设的项目类型分类,如美食、酒店、休闲娱乐、购物等等,此处不再一一列举。
另外,获取模快301获取到的待创建项目的项目信息也可以存储到存储模块302中,使得用户在进行相同的数据处理操作时,无需重新输入项目信息。另外,还可以提供操作入口,供用户对已经录入保存的项目信息进行增、删、改、查等操作,从而大大方便用户使用,具体可以根据实际应用进行设定,此处不做限制。
另外,值得一提的是,存储模块302中存储的项目数据表中存储的数据,如商圈数据和/或居民区数据,具体可以通过网络爬虫等数据采集程序自动爬虫,从而无需人工采集输入,大大节省了时间,且能够采集的数据量也相对较大、速度也更加快。
商圈确定模块303用于根据项目信息,在项目数据表中查找与项目信息匹配的项目数据,并根据项目数据确定待创建项目所属的商圈。
项目评分确定模块304用于根据五力模型,确定待创建项目在商圈中的项目评分,并触发显示模块305显示项目评分。
需要说明的是,本发明实施方式中采用的五力模型中的五力需要根据待创建项目确定。
比如说,待创建项目跟美食相关,则五力模型中的五力可以设定为环境分数、服务分数、口味分数、平均可达时间(用户达到目的地所需时间)、店铺数量,具体的可以根据用户实际关注的重点来进行设定,此处不做限制。
相似商圈确定模块306用于根据项目信息,在项目数据表中查找与项目信息匹配的项目数据,并根据项目数据确定与商圈相似的商圈。
相似项目确定模块307用于在相似商圈确定模块确定与商圈相似的商圈之后,确定与商圈相似的商圈中,与待创建项目相似的项目。
需要说明的是,本发明实施方式中确定与待创建商圈相似的商圈以及相似商圈中与待创建项目相似的项目均可以通过显示模块进行显示,供用户进行查看,并且显示的样式可以根据实际需要进行设置,方便用户查看。
另外,值得一提的是,本发明实施方式中提供的数据处理系统,可以在个人计算机中安装使用,也可以在用户的移动终端,如智能手机、平板电脑中安装使用。另外,为了节省开发成本,使得一套数据处理系统可以在多种系统,如windows操作系统(MicrosoftWindows,微软视窗操作系统)、安卓系统、苹果移动设备操作系统中使用,数据处理系统也可以直接在网页中访问使用,无需安装,更加方便,具体可以根据实际应用选择合适的开发环境进行开发,此处不做限制。
与现有技术相比,本实施方式提供了一种在商圈中创建项目时,能够精准处理与待创建项目相关数据的数据处理系统。本发明实施方式提供的数据处理系统,在需要创建项目时,通过在预先建立的项目数据表中查找与获取到的待创建项目的项目信息匹配的项目数据,来确定待创建项目所属的商圈,从而可以帮助用户准确定位自己所要创建的项目所属的商圈,方便用户后续对相应商圈的了解,避免做无用投入。另外,通过利用五力模型,确定待创建项目在商圈中的项目评分,并将结果进行显示供用户查看,从而可以方便用户获知自己所要创建的项目是否在当前商圈中有前景。
不难发现,本实施方式为与第一实施方式相对应的装置实施方式,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明的第四实施方式涉及一种数据处理系统。本实施方式在第三实施方式的基础上做了进一步改进,具体改进之处为:项目数据表中存储的项目数据为数据去重和/或数据丢弃后的项目数据。
如图4所示,数据处理系统300除了包括图3中所示的模块之外,还包括数据清洗模块308。数据清洗模块308用于对存储在存储模块302中项目数据表中的项目数据进行数据清洗,如数据去重和/或数据丢弃。
具体的说,在项目数据表中存储的任意两条项目数据相同时,删除或标记任意两条项目数据中的一条;和/或,在项目数据表中存储的任一项目数据存在缺失项时,删除存在缺失项的项目数据。
另外,值得一提的是,为了保证数据处理过程能够顺利进行,数据处理系统300中还可以增设检测模块。在获取待创建项目的项目信息之后,确定待创建项目所属的商圈之前,通过检测模块检测项目数据表中是否存在与项目信息中的项目位置相关的项目数据,并在确定项目数据表中未存在与项目信息中的项目位置相关的项目数据时,利用网络爬虫采集以项目位置为中心的预设范围内的商圈数据和/或居民区数据,并将采集到的商圈数据和/或居民区数据存储到项目数据表,使得项目数据表中存储的项目数据与待创建项目的项目信息匹配度更高,从而进一步保障了数据处理过程中确定的待创建项目所属的商圈及待创建项目所属的项目评分的准确性。
与现有技术相比,本实施方式中提供的数据处理系统,在确定待创建项目所属的商圈之前,通过判断在项目数据表中是否存在与待创建项目的项目位置相关的项目数据,并在项目数据表中未存在与待创建项目的项目位置相关的项目数据时,采集以项目位置为中心的预设范围内的商圈数据和/或居民区数据,使得项目数据表中存储的项目数据与待创建项目的项目信息匹配度更高,从而进一步保障了数据处理过程中确定的待创建项目所属的商圈及待创建项目所属的项目评分的准确性。另外,通过对项目数据表中存储的项目数据进行数据去重和/或数据丢弃的清洗操作,保证了项目数据表存储的项目数据均为有效数据,使得进行数据处理操作后得到的结果具有较高的准确性。
不难发现,本实施方式为与第二实施方式相对应的装置实施方式,本实施方式可与第二实施方式互相配合实施。第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第二实施方式中。
本发明的第五实施方式涉及一种终端,包括存储器和处理器,存储器中保存有预设程序,处理器读取存储器中保存的程序,并按照该程序执行上述任意实施方式中的数据处理方法。
具体的说,终端的结构框图如图5所示。
该终端包括:一个或多个处理器501以及存储器502,图5中以一个处理器501为例。处理器501、存储器502可以通过总线或者其他方式连接,图5中以通过总线连接为例。存储器502作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施方式中的项目数据表及项目数据表中存储的项目数据就存储于存储器502中。处理器501通过运行存储在存储器502中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述方法实施方式所述的数据处理方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器502中,当被一个或者多个处理器501执行时,执行上述任意方法实施方式中的数据处理方法。
上述产品可执行本申请实施方式所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施方式中详尽描述的技术细节,可参见本申请实施方式所提供的方法。
本申请第六实施方式涉及一种计算机可读存储介质,存储有计算机程序。本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分流程,是可以通过计算机程序来指令相关的硬件完成,在实际应用中存储在计算机可读存储介质中的计算机程序可包括上述任意方法实施方式的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
本领域技术人员可以理解实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施方式,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.一种数据处理方法,其特征在于,应用于商圈中的项目创建,所述数据处理方法包括:
获取待创建项目的项目信息;其中,所述项目信息至少包括项目位置及以下任意一种或任意组合:项目名称、开业时间、经营面积;
根据所述项目信息,在预先建立的项目数据表中查找与所述项目信息匹配的项目数据,并根据所述项目数据确定所述待创建项目所属的商圈;其中,所述项目数据表用于存储商圈数据和/或居民区数据,且所述商圈数据按照预设的项目类型分类;
根据五力模型,确定所述待创建项目在所述商圈中的项目评分,并显示所述项目评分;其中,所述五力模型中的五力根据所述待创建项目确定。
2.根据权利要求1所述的数据处理方法,其特征在于,所述数据处理方法还包括:
根据所述项目信息,在所述项目数据表中查找与所述项目信息匹配的项目数据,根据所述项目数据确定与所述商圈相似的商圈,并显示与所述商圈相似的商圈。
3.根据权利要求2所述的数据处理方法,其特征在于,在根据所述项目数据确定与所述商圈相似的商圈之后,所述数据处理方法还包括:
确定与所述商圈相似的商圈中,与所述待创建项目相似的项目,并显示所述相似的项目。
4.根据权利要求1至3任意一项所述的数据处理方法,其特征在于,在获取所述待创建项目的项目信息之后,确定所述待创建项目所属的商圈之前,所述数据处理方法还包括:
检测所述项目数据表中是否存在与所述项目信息中的所述项目位置相关的项目数据;
若确定所述项目数据表中未存在与所述项目信息中的所述项目位置相关的项目数据,采集以所述项目位置为中心的预设范围内的所述商圈数据和/或所述居民区数据,并将采集到的所述商圈数据和/或所述居民区数据存储到所述项目数据表。
5.根据权利要求4所述的数据处理方法,其特征在于,所述项目数据表中存储的项目数据为数据去重和/或数据丢弃后的项目数据;
其中,在所述项目数据表中存储的任意两条项目数据相同时,删除或标记所述任意两条项目数据中的一条;和/或,在所述项目数据表中存储的任一项目数据存在缺失项时,删除存在缺失项的项目数据。
6.一种数据处理系统,其特征在于,包括:获取模块、存储模块、商圈确定模块、项目评分确定模块和显示模块;
所述获取模块用于获取待创建项目的项目信息;其中,所述项目信息至少包括项目位置及以下任意一种或任意组合:项目名称、开业时间、经营面积;
所述存储模块用于存储预先建立的项目数据表;其中,所述项目数据表用于存储商圈数据和/或居民区数据,且所述商圈数据按照预设的项目类型分类;
所述商圈确定模块用于根据所述项目信息,在所述项目数据表中查找与所述项目信息匹配的项目数据,并根据所述项目数据确定所述待创建项目所属的商圈;
所述项目评分确定模块用于根据五力模型,确定所述待创建项目在所述商圈中的项目评分,并触发所述显示模块显示所述项目评分;其中,所述五力模型中的五力根据所述待创建项目确定。
7.根据权利要求6所述的数据处理系统,其特征在于,所述数据处理系统还包括相似商圈确定模块;
所述相似商圈确定模块用于根据所述项目信息,在所述项目数据表中查找与所述项目信息匹配的项目数据,并根据所述项目数据确定与所述商圈相似的商圈;
所述显示模块还用于显示所述与所述商圈相似的商圈。
8.根据权利要求7所述的数据处理系统,其特征在于,所述数据处理系统还包括相似项目确定模块;
所述相似项目确定模块用于在所述相似商圈确定模块确定与所述商圈相似的商圈之后,确定与所述商圈相似的商圈中,与所述待创建项目相似的项目。
9.一种终端,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5中任意一项所述的数据处理方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任意一项所述的数据处理方法。
CN201710638237.6A 2017-07-31 2017-07-31 数据处理方法、系统、终端及计算机可读存储介质 Pending CN107563789A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710638237.6A CN107563789A (zh) 2017-07-31 2017-07-31 数据处理方法、系统、终端及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710638237.6A CN107563789A (zh) 2017-07-31 2017-07-31 数据处理方法、系统、终端及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN107563789A true CN107563789A (zh) 2018-01-09

Family

ID=60974116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710638237.6A Pending CN107563789A (zh) 2017-07-31 2017-07-31 数据处理方法、系统、终端及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107563789A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596648A (zh) * 2018-03-20 2018-09-28 阿里巴巴集团控股有限公司 一种商圈判定方法和装置
CN110020226A (zh) * 2018-08-20 2019-07-16 中国平安人寿保险股份有限公司 基于大数据的数据展示方法、用户设备、存储介质及装置
CN111369284A (zh) * 2020-03-03 2020-07-03 浙江网商银行股份有限公司 目标对象类型确定方法及装置
CN112199940A (zh) * 2020-11-12 2021-01-08 深圳供电局有限公司 一种项目评审方法、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440589A (zh) * 2013-09-17 2013-12-11 上海商学院 门店选址系统及方法
CN104820699A (zh) * 2015-05-08 2015-08-05 上海玖道信息科技股份有限公司 一种智能选址及跟踪系统
CN106372857A (zh) * 2016-08-31 2017-02-01 上海锐鸿通信技术有限公司 自动创建项目的方法和系统
CN106528611A (zh) * 2016-09-28 2017-03-22 西南交通大学 一种基于互联网点评数据的分析方法
CN106651392A (zh) * 2016-12-07 2017-05-10 中国联合网络通信集团有限公司 一种智能商业选址方法、装置及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440589A (zh) * 2013-09-17 2013-12-11 上海商学院 门店选址系统及方法
CN104820699A (zh) * 2015-05-08 2015-08-05 上海玖道信息科技股份有限公司 一种智能选址及跟踪系统
CN106372857A (zh) * 2016-08-31 2017-02-01 上海锐鸿通信技术有限公司 自动创建项目的方法和系统
CN106528611A (zh) * 2016-09-28 2017-03-22 西南交通大学 一种基于互联网点评数据的分析方法
CN106651392A (zh) * 2016-12-07 2017-05-10 中国联合网络通信集团有限公司 一种智能商业选址方法、装置及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596648A (zh) * 2018-03-20 2018-09-28 阿里巴巴集团控股有限公司 一种商圈判定方法和装置
CN108596648B (zh) * 2018-03-20 2020-07-17 阿里巴巴集团控股有限公司 一种商圈判定方法和装置
CN110020226A (zh) * 2018-08-20 2019-07-16 中国平安人寿保险股份有限公司 基于大数据的数据展示方法、用户设备、存储介质及装置
CN110020226B (zh) * 2018-08-20 2023-07-21 中国平安人寿保险股份有限公司 基于大数据的数据展示方法、用户设备、存储介质及装置
CN111369284A (zh) * 2020-03-03 2020-07-03 浙江网商银行股份有限公司 目标对象类型确定方法及装置
CN111369284B (zh) * 2020-03-03 2023-08-15 浙江网商银行股份有限公司 目标对象类型确定方法及装置
CN112199940A (zh) * 2020-11-12 2021-01-08 深圳供电局有限公司 一种项目评审方法、存储介质
CN112199940B (zh) * 2020-11-12 2023-09-15 深圳供电局有限公司 一种项目评审方法、存储介质

Similar Documents

Publication Publication Date Title
CN104965920B (zh) 用于确定目标地址的方法和装置
Wang et al. Estimating O–D travel time matrix by Google Maps API: implementation, advantages, and implications
RU2541890C2 (ru) Системы, устройства и способы использования контекстной информации
CN107563789A (zh) 数据处理方法、系统、终端及计算机可读存储介质
US8682881B1 (en) System and method for extracting structured data from classified websites
TW201237665A (en) Determining preferred categories based on user access attribute values
CN106919641A (zh) 一种兴趣点搜索方法及装置、电子设备
CN107993085A (zh) 模型训练方法、基于模型的用户行为预测方法及装置
Baumgarten et al. User-driven navigation pattern discovery from internet data
CN108596695B (zh) 实体推送方法及系统
US20120203760A1 (en) Automatically obtaining real-time, geographically-relevant product information from heterogeneus sources
US9607091B2 (en) Methods, systems, and computer program products for implementing intelligent agent services
CN103186666B (zh) 基于收藏进行搜索的方法、装置与设备
CN104537070A (zh) 挖掘旅游目的地景点的方法和设备
Ying et al. Semantic trajectory-based high utility item recommendation system
CN106293119A (zh) 一种在输入法中进行信息推荐的方法与装置
CN103377240B (zh) 信息提供方法、处理服务器及合并服务器
CN108153824A (zh) 目标用户群体的确定方法及装置
KR20210063649A (ko) 빅 데이터 기반의 감성정보를 반영한 관광지 정보 제공 시스템 및 그 구동방법
CN105894310A (zh) 一种个性化推荐方法
US20100042575A1 (en) Methods, systems, and computer program products for implementing ontological domain services
Levin et al. TARS: traffic-aware route search
CN102880716B (zh) 被识别实体的相关任务的主动交付
CN106897198B (zh) 一种日志数据的处理方法及装置
CN103235786B (zh) 一种用于提供长尾搜索结果的方法与设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109