CN108304872A - 本地生活服务信息处理方法及装置 - Google Patents

本地生活服务信息处理方法及装置 Download PDF

Info

Publication number
CN108304872A
CN108304872A CN201810088952.1A CN201810088952A CN108304872A CN 108304872 A CN108304872 A CN 108304872A CN 201810088952 A CN201810088952 A CN 201810088952A CN 108304872 A CN108304872 A CN 108304872A
Authority
CN
China
Prior art keywords
cluster
final
location information
information
specified services
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810088952.1A
Other languages
English (en)
Inventor
叶孝璐
郭华洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koubei Shanghai Information Technology Co Ltd
Original Assignee
Koubei Shanghai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koubei Shanghai Information Technology Co Ltd filed Critical Koubei Shanghai Information Technology Co Ltd
Priority to CN201810088952.1A priority Critical patent/CN108304872A/zh
Publication of CN108304872A publication Critical patent/CN108304872A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种本地生活服务信息处理方法及装置,其中,本地生活服务信息处理方法包括:获取对应于指定服务场所的交易信息;将交易信息中的位置信息作为聚类元素,并对聚类元素进行聚类处理,得到多个最终聚类集合;根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。根据本发明提供的技术方案,不仅能够自动、方便地确定服务场所的位置信息,提高了本地生活服务信息处理效率,极大地节省了人力成本,而且还有效地去除了噪声数据的干扰,提高了所确定的服务场所的位置信息的准确度,优化了本地生活服务信息处理方法。

Description

本地生活服务信息处理方法及装置
技术领域
本发明涉及互联网技术领域,具体涉及一种本地生活服务信息处理方法及装置。
背景技术
在日常生活中,店铺、商圈等本地生活服务场所的位置信息得到了广泛的使用。例如,越来越多的人喜欢通过提供生活服务的应用程序或者网上地图等来查找店铺、商圈等服务场所,当人们需要去往某个店铺等服务场所时,经常会通过应用程序页面或者网上地图的POI页面中所展示的服务场所的位置信息进行导航定位。另外,推荐系统向用户推荐店铺等服务场所时,推荐系统也会根据服务场所的位置信息进行推荐。然而,现有技术中的服务场所的位置信息大多是通过人工输入方式确定的,存在较多错误,那么根据服务场所的位置信息进行导航定位或推荐服务场所时,则很有可能出现定位错误或推荐结果不准确的情况,使得用户体验感较差。因此,现有技术中缺少一种能够方便、准确地确定服务场所的位置信息的方法。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的本地生活服务信息处理方法及装置。
根据本发明的一个方面,提供了一种本地生活服务信息处理方法,该方法包括:
获取对应于指定服务场所的交易信息;
将交易信息中的位置信息作为聚类元素,并对聚类元素进行聚类处理,得到多个最终聚类集合;
根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。
进一步地,对聚类元素进行聚类处理,得到多个最终聚类集合进一步包括:
从聚类元素中随机选取K个聚类元素,将选取得到的K个聚类元素作为K个初始聚类中心,其中K大于1;
根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合。
进一步地,根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合进一步包括:
步骤1,对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的欧式距离;
步骤2,从K个初始聚类中心中选择与任一聚类元素之间的欧式距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到K个聚类集合;
步骤3,计算K个聚类集合的聚类中心,并判断K个聚类中心是否与K个初始聚类中心相同;若是,则执行步骤4;若否,则执行步骤5;
步骤4,将K个聚类中心确定为K个最终聚类中心,并将K个聚类集合确定为K个最终聚类集合;
步骤5,根据K个聚类中心更新K个初始聚类中心,并跳转执行步骤1。
进一步地,根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息进一步包括:
计算多个最终聚类集合中每一个最终聚类集合包含的聚类元素的数量,将多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合确定为参考聚类集合;
将参考聚类集合的最终聚类中心对应的位置信息确定为指定服务场所的位置信息。
进一步地,在确定指定服务场所的位置信息之后,该方法还包括:
根据所确定的指定服务场所的位置信息,在HTML页面、应用程序页面、和/或网上地图的POI页面中更新指定服务场所的位置信息。
进一步地,在将交易信息中的位置信息作为聚类元素之前,该方法还包括:
根据交易信息中的交易时间信息,对交易信息进行筛选处理,筛选得到交易时间信息符合预设时间范围的交易信息;
将交易信息中的位置信息作为聚类元素具体为:将筛选得到的交易信息中的位置信息作为聚类元素。
根据本发明的另一方面,提供了一种本地生活服务信息处理装置,该装置包括:
获取模块,适于获取对应于指定服务场所的交易信息;
聚类模块,适于将交易信息中的位置信息作为聚类元素,并对聚类元素进行聚类处理,得到多个最终聚类集合;
确定模块,适于根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。
进一步地,聚类模块进一步适于:
从聚类元素中随机选取K个聚类元素,将选取得到的K个聚类元素作为K个初始聚类中心,其中K大于1;
根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合。
进一步地,聚类模块进一步适于:
对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的欧式距离;
从K个初始聚类中心中选择与任一聚类元素之间的欧式距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到K个聚类集合;
计算K个聚类集合的聚类中心,并判断K个聚类中心是否与K个初始聚类中心相同;
若是,则将K个聚类中心确定为K个最终聚类中心,并将K个聚类集合确定为K个最终聚类集合;若否,则根据K个聚类中心更新K个初始聚类中心,并跳转执行对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的欧式距离。
进一步地,确定模块进一步适于:
计算多个最终聚类集合中每一个最终聚类集合包含的聚类元素的数量,将多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合确定为参考聚类集合;
将参考聚类集合的最终聚类中心对应的位置信息确定为指定服务场所的位置信息。
进一步地,该装置还包括:更新模块,适于根据所确定的指定服务场所的位置信息,在HTML页面、应用程序页面、和/或网上地图的POI页面中更新指定服务场所的位置信息。
进一步地,该装置还包括:筛选模块,适于根据交易信息中的交易时间信息,对交易信息进行筛选处理,筛选得到交易时间信息符合预设时间范围的交易信息;
聚类模块进一步适于:将筛选模块筛选得到的交易信息中的位置信息作为聚类元素。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述本地生活服务信息处理方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述本地生活服务信息处理方法对应的操作。
根据本发明提供的技术方案,获取对应于指定服务场所的交易信息,接着将交易信息中的位置信息作为聚类元素,并对聚类元素进行聚类处理,得到多个最终聚类集合,然后根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。本发明提供的技术方案通过对服务场所的交易信息进行聚类处理来确定服务场所的位置信息,与现有技术相比,不仅能够自动、方便地确定服务场所的位置信息,提高了本地生活服务信息处理效率,极大地节省了人力成本,而且还有效地去除了噪声数据的干扰,提高了所确定的服务场所的位置信息的准确度,优化了本地生活服务信息处理方法。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的本地生活服务信息处理方法的流程示意图;
图2示出了根据本发明另一实施例的本地生活服务信息处理方法的流程示意图;
图3示出了根据本发明实施例的本地生活服务信息处理装置的结构框图;
图4示出了根据本发明实施例的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的本地生活服务信息处理方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤S100,获取对应于指定服务场所的交易信息。
在许多实际的业务场景中,用户需要在店铺、商圈、机场、车站等本地生活服务场所中来获取业务服务,例如用户在餐饮店铺中获取菜品、在美发店铺中获取美发服务或者在商圈中获取美甲服务、游乐服务等。在服务场所中获取业务服务时,用户需要与提供该业务服务的服务场所进行交易,例如支付业务服务对应的费用和/或核销服务场所对应的优惠券或服务商品券,其中,优惠券可以为适用于服务场所的折扣券或满减券等,服务商品券可以为代金券或用于兑换实际业务服务的兑换券等。在服务场所中的业务人员确定该交易无误后,完成此次交易。
考虑到用户一般是在服务场所内完成交易的,因此,本发明提供了一种通过对服务场所的交易信息进行聚类处理来确定服务场所的位置信息的技术方案。在本发明中,将需要确定位置信息的服务场所称为指定服务场所。为了准确地确定指定服务场所的位置信息,在步骤S100中获取对应于该指定服务场所的交易信息。例如可从交易平台等中获取对应于该指定服务场所的所有的交易信息。交易信息可包括位置信息、交易时间信息、用户账号信息、服务场所信息、交易项目、交易金额等信息。具体地,交易信息中的位置信息可为进行交易时用户所处的经纬度信息,该位置信息可在用户通过手机等终端进行交易时利用GPS等定位方式来确定。其中,对应于指定服务场所的交易信息是指交易信息中的服务场所信息为该指定服务场所或者该指定服务场所的子场所的交易信息。
以指定服务场所为餐饮店铺A为例,那么获取对应于餐饮店铺A的交易信息即为获取服务场所信息为餐饮店铺A的交易信息。以指定服务场所为商圈B为例,商圈B的子场所包括店铺C、店铺D和店铺E,那么获取对应于商圈B的交易信息即为获取服务场所信息为店铺C的交易信息、服务场所信息为店铺D的交易信息以及服务场所信息为店铺E的交易信息。
步骤S101,将交易信息中的位置信息作为聚类元素,并对聚类元素进行聚类处理,得到多个最终聚类集合。
由于所获取的对应于指定服务场所的交易信息除了包含有用户实际在指定服务场所进行交易所产生的交易信息之外,还可能包含有例如交易测试、刷单等过程中所产生的交易信息,这类交易信息中的位置信息无法真实地反映指定服务场所的位置信息,因此可将这类交易信息称为噪声数据。为了能够有效地去除噪声数据所带来的干扰,从而准确地确定指定服务场所的位置信息,可在获取了对应于指定服务场所的交易信息之后,将交易信息中的位置信息作为聚类元素,然后对聚类元素进行聚类处理,得到多个最终聚类集合。本领域技术人员可根据实际需要选择具体的聚类算法,此处不做限定。例如,可采用K-means(K均值)聚类算法、层次聚类算法、SOM(自组织映射神经网络,Self-organizingMaps)聚类算法或者FCM(模糊,Fuzzy C-Means)聚类算法等对聚类元素进行聚类处理。
步骤S102,根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。
每一个最终聚类集合包含的聚类元素的数量可能不尽相同,其中,与包含的聚类元素的数量较少的最终聚类集合相比,包含的聚类元素的数量最多的最终聚类集合能够更为准确地反映指定服务场所的位置信息,因此,可根据包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。具体地,可将该最终聚类中心对应的位置信息确定为指定服务场所的位置信息。
本实施例提供的本地生活服务信息处理方法,获取对应于指定服务场所的交易信息,接着将交易信息中的位置信息作为聚类元素,并对聚类元素进行聚类处理,得到多个最终聚类集合,然后根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。本发明提供的技术方案通过对服务场所的交易信息进行聚类处理来确定服务场所的位置信息,与现有技术相比,不仅能够自动、方便地确定服务场所的位置信息,提高了本地生活服务信息处理效率,极大地节省了人力成本,而且还有效地去除了噪声数据的干扰,提高了所确定的服务场所的位置信息的准确度,优化了本地生活服务信息处理方法。
图2示出了根据本发明另一实施例的本地生活服务信息处理方法的流程示意图,如图2所示,该方法包括如下步骤:
步骤S200,获取对应于指定服务场所的交易信息。
具体地,可从交易平台等中获取对应于指定服务场所的所有的交易信息。其中,交易信息可包括位置信息、交易时间信息、用户账号信息、服务场所信息、交易项目、交易金额等信息。
步骤S201,根据交易信息中的交易时间信息,对交易信息进行筛选处理,筛选得到交易时间信息符合预设时间范围的交易信息。
在实际的业务场景中,还存在着服务场所更换位置信息的情况,例如,餐饮店铺A从位置信息1搬迁至位置信息2,为了更为准确地确定指定服务场所的位置信息,在获取了对应于指定服务场所的交易信息之后,根据交易信息中的交易时间信息,对交易信息进行筛选处理,筛选得到交易时间信息符合预设时间范围的交易信息。本领域技术人员可根据实际需要对预设时间范围进行设置,此处不做限定。例如,可将预设时间范围设置为距离当前时间3个月之内。
步骤S202,将筛选得到的交易信息中的位置信息作为聚类元素。
步骤S203,从聚类元素中随机选取K个聚类元素,将选取得到的K个聚类元素作为K个初始聚类中心。
本领域技术人员可根据实际需要选择合适的聚类算法对聚类元素进行聚类处理,此处不做限定。在本实施例中,以采用K-means聚类算法为例,介绍具体如何对聚类元素进行聚类处理。具体地,从聚类元素中随机选取K个聚类元素,将选取得到的K个聚类元素作为K个初始聚类中心,其中K大于1。在确定了K个初始聚类中心之后,然后根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合,在本实施例中,可通过步骤S204至步骤S208进行实现。
步骤S204,对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的欧式距离。
为了实现对聚类元素的聚类处理,需要计算任一聚类元素与K个初始聚类中心之间的欧式距离,其中,欧式距离是指欧几里得距离,具体指在m维空间中两个点之间的真实距离,或者向量的自然长度。若一共有100个聚类元素,则需要计算这100个聚类元素分别与K个初始聚类中心之间的欧式距离。
步骤S205,从K个初始聚类中心中选择与任一聚类元素之间的欧式距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到K个聚类集合。
在计算了任一聚类元素与K个初始聚类中心之间的欧式距离之后,根据计算得到的欧式距离,将该任一聚类元素归类到相异度最低的集合中。具体地,从K个初始聚类中心中选择与任一聚类元素之间的欧式距离最小的初始聚类中心,然后将任一聚类元素归类到所选择的初始聚类中心对应的集合中,在所有的聚类元素都完成归类处理之后,从而得到K个聚类集合。
假设K为3,3个初始聚类中心分别为中心1、中心2和中心3,若一共有100个聚类元素,这100个聚类元素分别为元素1至元素100,经计算得到,其中,对于元素1,其与中心1之间的欧式距离为0.2,与中心2之间的欧式距离为0.5,与中心2之间的欧式距离为0.7;对于元素2,其与中心1之间的欧式距离为0.5,与中心2之间的欧式距离为0.1,与中心2之间的欧式距离为0.3,那么将元素1归类到中心1对应的集合中,将元素2归类到中心2对应的集合中。按照上述归类方式,完成对100个聚类元素的归类处理,从而将100个聚类元素分别归类到3个集合中,得到3个聚类集合。
步骤S206,计算K个聚类集合的聚类中心。
其中,可计算每一个聚类集合中包含的所有的聚类元素各自维度的算术平均数,然后将计算得到的各自维度的算术平均数确定为K个聚类集合的聚类中心。例如,聚类元素包含有2个维度,对于某个聚类集合,经计算得到该聚类集合包含的所有的聚类元素在这2个维度的算术平均数分别为0.21和0.35,那么将{0.21,0.35}确定为该聚类集合的聚类中心。
步骤S207,判断K个聚类中心是否与K个初始聚类中心相同;若是,则执行步骤S208;若否,则执行步骤S209。
在得到K个聚类集合之后,需要判断这K个聚类集合是否符合预设收敛条件。例如,预设收敛条件为K个聚类集合的聚类中心不发生变化,那么可判断K个聚类中心是否与K个初始聚类中心相同。如果判断得到K个聚类中心与K个初始聚类中心相同,说明K个聚类集合符合预设收敛条件,则执行步骤S208;如果判断得到K个聚类中心不与K个初始聚类中心相同,说明K个聚类集合还不符合预设收敛条件,则执行步骤S209。
步骤S208,将K个聚类中心确定为K个最终聚类中心,并将K个聚类集合确定为K个最终聚类集合。
在经步骤S207判断得到K个聚类中心与K个初始聚类中心相同,说明K个聚类集合符合预设收敛条件,则将K个聚类中心确定为K个最终聚类中心,并将K个聚类集合确定为K个最终聚类集合。
步骤S209,根据K个聚类中心更新K个初始聚类中心。
在经步骤S207判断得到K个聚类中心不与K个初始聚类中心相同,说明K个聚类集合还不符合预设收敛条件,仍需进行聚类处理,则根据K个聚类中心更新K个初始聚类中心,也就是将K个聚类中心作为更新后的K个初始聚类中心。在根据K个聚类中心更新了K个初始聚类中心之后,跳转执行步骤S204,计算任一聚类元素与更新后的K个初始聚类中心之间的欧式距离,然后根据计算得到的欧式距离重新对聚类元素进行归类处理。
步骤S210,根据K个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。
具体地,计算K个最终聚类集合中每一个最终聚类集合包含的聚类元素的数量,将K个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合确定为参考聚类集合,然后将参考聚类集合的最终聚类中心对应的位置信息确定为指定服务场所的位置信息。假设K为3,3个最终聚类集合分别为最终聚类集合1、最终聚类集合2和最终聚类集合3,这3个最终聚类集合所包含的聚类元素的数量分别为80、15和5,那么将最终聚类集合1确定为参考聚类集合,然后将参考聚类集合的最终聚类中心对应的位置信息确定为指定服务场所的位置信息。
步骤S211,根据所确定的指定服务场所的位置信息,在HTML页面、应用程序页面、和/或网上地图的POI页面中更新指定服务场所的位置信息。
在确定了指定服务场所的位置信息之后,根据所确定的指定服务场所的位置信息,在HTML页面、应用程序页面、和/或网上地图的POI页面中更新指定服务场所的位置信息,以便用户能够根据HTML页面、应用程序页面、和/或网上地图的POI页面中的指定服务场所的位置信息准确地进行导航定位,另外,也便于推荐系统根据指定服务场所的位置信息准确地进行服务场所推荐,从而有助于提高用户体验感。
本实施例提供的本地生活服务信息处理方法,采用K-means聚类算法对服务场所的交易信息进行聚类处理,将所包含的聚类元素的数量最多的最终聚类集合的最终聚类中心确定为指定服务场所的位置信息,从而有效地去除了噪声数据的干扰,所确定的服务场所的位置信息能够更为准确地反映服务场所实际的位置信息;并且还实现了对HTML页面、应用程序页面、和/或网上地图的POI页面中服务场所的位置信息的及时更新,有助于准确地进行导航定位和服务场所推荐,有效地提高了用户体验感。
图3示出了根据本发明实施例的本地生活服务信息处理装置的结构框图,如图3所示,该装置包括:获取模块310、聚类模块320和确定模块330。
获取模块310适于:获取对应于指定服务场所的交易信息。
聚类模块320适于:将交易信息中的位置信息作为聚类元素,并对聚类元素进行聚类处理,得到多个最终聚类集合。
其中,聚类模块320进一步适于:从聚类元素中随机选取K个聚类元素,将选取得到的K个聚类元素作为K个初始聚类中心,其中K大于1;根据K个初始聚类中心,对聚类元素进行聚类处理,确定K个最终聚类中心以及与K个最终聚类中心相对应的K个最终聚类集合。
具体地,聚类模块320进一步适于:对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的欧式距离;从K个初始聚类中心中选择与任一聚类元素之间的欧式距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到K个聚类集合;计算K个聚类集合的聚类中心,并判断K个聚类中心是否与K个初始聚类中心相同;若是,则将K个聚类中心确定为K个最终聚类中心,并将K个聚类集合确定为K个最终聚类集合;若否,则根据K个聚类中心更新K个初始聚类中心,并跳转执行对于任一聚类元素,计算任一聚类元素与K个初始聚类中心之间的欧式距离。
确定模块330适于:根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。
可选地,确定模块330进一步适于:计算多个最终聚类集合中每一个最终聚类集合包含的聚类元素的数量,将多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合确定为参考聚类集合;将参考聚类集合的最终聚类中心对应的位置信息确定为指定服务场所的位置信息。
另外,该装置还可包括:更新模块340,适于根据所确定的指定服务场所的位置信息,在HTML页面、应用程序页面、和/或网上地图的POI页面中更新指定服务场所的位置信息。
可选地,该装置还可包括:筛选模块350,适于根据交易信息中的交易时间信息,对交易信息进行筛选处理,筛选得到交易时间信息符合预设时间范围的交易信息。在这种情况下,聚类模块320进一步适于:将筛选模块筛选得到的交易信息中的位置信息作为聚类元素。
本实施例提供的本地生活服务信息处理装置,获取模块获取对应于指定服务场所的交易信息,聚类模块将交易信息中的位置信息作为聚类元素,并对聚类元素进行聚类处理,得到多个最终聚类集合,确定模块根据多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定指定服务场所的位置信息。本发明提供的技术方案通过对服务场所的交易信息进行聚类处理来确定服务场所的位置信息,与现有技术相比,不仅能够自动、方便地确定服务场所的位置信息,提高了本地生活服务信息处理效率,极大地节省了人力成本,而且还有效地去除了噪声数据的干扰,提高了所确定的服务场所的位置信息的准确度,优化了本地生活服务信息处理方法。
本发明还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的本地生活服务信息处理方法。
图4示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图4所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:
处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述本地生活服务信息处理方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行上述任意方法实施例中的本地生活服务信息处理方法。程序410中各步骤的具体实现可以参见上述本地生活服务信息处理实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种本地生活服务信息处理方法,所述方法包括:
获取对应于指定服务场所的交易信息;
将所述交易信息中的位置信息作为聚类元素,并对所述聚类元素进行聚类处理,得到多个最终聚类集合;
根据所述多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定所述指定服务场所的位置信息。
2.根据权利要求1所述的本地生活服务信息处理方法,其中,所述对所述聚类元素进行聚类处理,得到多个最终聚类集合进一步包括:
从所述聚类元素中随机选取K个聚类元素,将选取得到的K个聚类元素作为K个初始聚类中心,其中K大于1;
根据所述K个初始聚类中心,对所述聚类元素进行聚类处理,确定K个最终聚类中心以及与所述K个最终聚类中心相对应的K个最终聚类集合。
3.根据权利要求2所述的本地生活服务信息处理方法,其中,所述根据所述K个初始聚类中心,对所述聚类元素进行聚类处理,确定K个最终聚类中心以及与所述K个最终聚类中心相对应的K个最终聚类集合进一步包括:
步骤1,对于任一聚类元素,计算任一聚类元素与所述K个初始聚类中心之间的欧式距离;
步骤2,从所述K个初始聚类中心中选择与所述任一聚类元素之间的欧式距离最小的初始聚类中心,将所述任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到K个聚类集合;
步骤3,计算所述K个聚类集合的聚类中心,并判断K个聚类中心是否与K个初始聚类中心相同;若是,则执行步骤4;若否,则执行步骤5;
步骤4,将所述K个聚类中心确定为K个最终聚类中心,并将所述K个聚类集合确定为K个最终聚类集合;
步骤5,根据所述K个聚类中心更新K个初始聚类中心,并跳转执行步骤1。
4.根据权利要求1-3任一项所述的本地生活服务信息处理方法,其中,所述根据所述多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定所述指定服务场所的位置信息进一步包括:
计算所述多个最终聚类集合中每一个最终聚类集合包含的聚类元素的数量,将所述多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合确定为参考聚类集合;
将所述参考聚类集合的最终聚类中心对应的位置信息确定为所述指定服务场所的位置信息。
5.根据权利要求1-4任一项所述的本地生活服务信息处理方法,其中,在确定所述指定服务场所的位置信息之后,所述方法还包括:
根据所确定的所述指定服务场所的位置信息,在HTML页面、应用程序页面、和/或网上地图的POI页面中更新所述指定服务场所的位置信息。
6.根据权利要求1-5任一项所述的本地生活服务信息处理方法,其中,在将所述交易信息中的位置信息作为聚类元素之前,所述方法还包括:
根据所述交易信息中的交易时间信息,对所述交易信息进行筛选处理,筛选得到交易时间信息符合预设时间范围的交易信息;
所述将所述交易信息中的位置信息作为聚类元素具体为:将筛选得到的交易信息中的位置信息作为聚类元素。
7.一种本地生活服务信息处理装置,所述装置包括:
获取模块,适于获取对应于指定服务场所的交易信息;
聚类模块,适于将所述交易信息中的位置信息作为聚类元素,并对所述聚类元素进行聚类处理,得到多个最终聚类集合;
确定模块,适于根据所述多个最终聚类集合中包含的聚类元素的数量最多的最终聚类集合的最终聚类中心,确定所述指定服务场所的位置信息。
8.根据权利要求7所述的本地生活服务信息处理装置,其中,所述聚类模块进一步适于:
从所述聚类元素中随机选取K个聚类元素,将选取得到的K个聚类元素作为K个初始聚类中心,其中K大于1;
根据所述K个初始聚类中心,对所述聚类元素进行聚类处理,确定K个最终聚类中心以及与所述K个最终聚类中心相对应的K个最终聚类集合。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-6中任一项所述的本地生活服务信息处理方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-6中任一项所述的本地生活服务信息处理方法对应的操作。
CN201810088952.1A 2018-01-30 2018-01-30 本地生活服务信息处理方法及装置 Pending CN108304872A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810088952.1A CN108304872A (zh) 2018-01-30 2018-01-30 本地生活服务信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810088952.1A CN108304872A (zh) 2018-01-30 2018-01-30 本地生活服务信息处理方法及装置

Publications (1)

Publication Number Publication Date
CN108304872A true CN108304872A (zh) 2018-07-20

Family

ID=62867391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810088952.1A Pending CN108304872A (zh) 2018-01-30 2018-01-30 本地生活服务信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN108304872A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109813318A (zh) * 2019-02-12 2019-05-28 北京百度网讯科技有限公司 坐标修正方法及装置、设备及存储介质
CN111753200A (zh) * 2020-06-23 2020-10-09 支付宝(杭州)信息技术有限公司 一种数据确定方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279311A1 (en) * 2013-03-15 2014-09-18 Capital One Financial Corporation System and method for determining transaction locations based on geocoded information
CN107578238A (zh) * 2017-08-08 2018-01-12 阿里巴巴集团控股有限公司 一种风险控制方法及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279311A1 (en) * 2013-03-15 2014-09-18 Capital One Financial Corporation System and method for determining transaction locations based on geocoded information
CN107578238A (zh) * 2017-08-08 2018-01-12 阿里巴巴集团控股有限公司 一种风险控制方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
武森等: "《数据仓库与数据挖掘》", 30 September 2003 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109813318A (zh) * 2019-02-12 2019-05-28 北京百度网讯科技有限公司 坐标修正方法及装置、设备及存储介质
CN111753200A (zh) * 2020-06-23 2020-10-09 支付宝(杭州)信息技术有限公司 一种数据确定方法、装置、设备及介质
CN111753200B (zh) * 2020-06-23 2021-03-30 支付宝(杭州)信息技术有限公司 一种数据确定方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN107465741B (zh) 信息推送方法和装置
JP5108012B2 (ja) 協調フィルタリングを用いてカードメンバーの支出を予測するための方法
US10127595B1 (en) Categorization of items based on attributes
US10366436B1 (en) Categorization of items based on item delivery time
US9760840B1 (en) Geospatial data analysis
CN107730311A (zh) 一种推荐信息的推送方法、装置及服务器
CN108352035A (zh) 用于高效索赔处理的动态拓扑系统和方法
CN105354719A (zh) 应用于电子商务平台的信用评估系统及方法
CN108596695A (zh) 实体推送方法及系统
CN107547214A (zh) 基于电子书的群组阅读方法、电子设备及计算机存储介质
US20200234218A1 (en) Systems and methods for entity performance and risk scoring
CN110866771A (zh) 信息处理方法、系统、介质和计算机系统
US10142187B2 (en) Predicting an effect of performing an action on a node of a geographical network
CN106767835A (zh) 定位方法和装置
CN108596693A (zh) 门店匹配方法及装置
US20200334694A1 (en) Behavioral data analytics platform
CN107807997A (zh) 基于大数据的用户画像构造方法、装置及计算设备
US11645700B2 (en) Utilizing machine learning to generate vehicle information for a vehicle captured by a user device in a vehicle lot
CN109118316A (zh) 线上店铺真实性的识别方法和装置
CN108304872A (zh) 本地生活服务信息处理方法及装置
WO2021036184A1 (zh) 目标交易码铺设区域推荐方法及系统
Tobing A food ordering system with delivery routing optimization using global positioning system (GPS) technology and google maps
US20200234327A1 (en) Systems and methods for dynamic product offerings
Lin et al. A crowdsourcing matching and pricing strategy in urban distribution system
CN108388555A (zh) 基于行业类别的商品去重方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180720

RJ01 Rejection of invention patent application after publication