CN111125272B - 一种区域特征获取方法、装置、计算机设备及介质 - Google Patents

一种区域特征获取方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN111125272B
CN111125272B CN201811293495.6A CN201811293495A CN111125272B CN 111125272 B CN111125272 B CN 111125272B CN 201811293495 A CN201811293495 A CN 201811293495A CN 111125272 B CN111125272 B CN 111125272B
Authority
CN
China
Prior art keywords
user
geographic area
user behavior
feature vector
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811293495.6A
Other languages
English (en)
Other versions
CN111125272A (zh
Inventor
杨敬
杨旭虹
陈程
万程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811293495.6A priority Critical patent/CN111125272B/zh
Publication of CN111125272A publication Critical patent/CN111125272A/zh
Application granted granted Critical
Publication of CN111125272B publication Critical patent/CN111125272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种区域特征获取方法、装置、计算机设备及介质。所述方法包括:从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;基于提取的至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;根据构建的二部图,使用图嵌入算法得到地理区域单元的特征向量。该方法通过用户互联网行为数据来表达地理区域背后的隐含语义,得到地理区域的特征向量,能够精准的提取地理区域的特征,进而能够基于特征向量对地理区域进行分类等,解决城市管理、城市规划、商业选址等与区域相关的问题。

Description

一种区域特征获取方法、装置、计算机设备及介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种区域特征获取方法、装置、计算机设备及介质。
背景技术
随着城市化的不断推进,为了满足人们不同的城市生活需求,每个地理区域都包含了不同的社会功能,甚至有的地理区域形成了以某种社会功能为主的功能区,例如住宅区、商业区、工业园区等等。如果对地理区域的社会功能进行识别,可以有针对性地进行广告投放、商业投资和城市规划等。
现有的获取地理区域的特征的方案主要包括以下两种:
第一种,使用城市区域内的兴趣点(Point Of Interest,POI)来表征地理区域的特征。比如,可以使用区域内商业建筑的数量、住宅建筑的数量等来表征区域的特征,若商业建筑的数量较多,则该区域可划分为商业区,若住宅建筑的数量较多,则该区域可划分为住宅区。
第二种,使用人的签到(check-in)数据和人员流动数据来表征地理区域的特征。比如,签到(check-in)数据可以是人在某个时间到达某个地点的数据,若在白天到达某一区域的人数较多,则可将该区域划分为办公区,若在晚上到达某一区域的人数较多,则可将该区域划分为住宅区。又比如,人员流动数据可以是到达某一区域的人员的固定程度,若到达某一区域的人员相对固定,则可将该区域划分为办公区,若到达某一区域的人员不固定、流动性大,则可将该区域划分为商业区。
但是,上述获取地理区域的特征时所使用的信息有限,不能精准的反映地理区域的特征。
发明内容
本发明实施例提供了一种区域特征获取方法、装置、计算机设备及介质,以实现精准的提取地理区域的特征。
第一方面,本发明实施例提供了一种区域特征获取方法,包括:
从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;
基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;
根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
第二方面,本发明实施例还提供了一种区域特征获取装置,所述装置包括:
互联网数据获取模块,用于从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;
二部图构建模块,用于基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;
特征向量计算模块,用于根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
第三方面,本发明实施例还提供了一种计算机设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的区域特征获取方法。
第四方面,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的区域特征获取方法。
本发明实施例通过从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。本发明实施例所提供的区域特征获取方法通过用户互联网行为数据来表达地理区域背后的隐含语义,将地理位置相关的用户行为表达成连续的特征向量,能够精准的提取地理区域的特征,进而可以基于特征向量对地理区域进行分类等,解决目前城市管理、城市规划、商业选址等应用中与区域相关的问题。
附图说明
图1a是本发明实施例一所提供的区域特征获取方法的流程图;
图1b是本发明实施例一所提供的区域特征获取方法的流程示意图;
图2a是本发明实施例二所提供的区域特征获取方法的流程图;
图2b是本发明实施例二所提供的区域特征获取方法中地理区域单元与用户搜索词之间的二部图的示意图;
图3是本发明实施例三所提供的区域特征获取方法的流程图;
图4是本发明实施例四所提供的区域特征获取方法的流程图;
图5是本发明实施例五所提供的区域特征获取装置的结构示意图;
图6是本发明实施例六所提供的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1a是本发明实施例一所提供的区域特征获取方法的流程图,本实施例可适用于获取地理区域的特征时的情形。该方法可以由区域特征获取装置执行,该区域特征获取装置可以采用软件和/或硬件的方式实现,例如,该区域特征获取装置可配置于计算机设备中。如图1a所示,该方法具体包括:
S110、从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳。
在本实施例中,充分利用用户通过网络的搜索、访问、软件安装和使用等操作信息,从网络日志信息所记载的用户的互联网活动中提取出地理区域的特征。可选的,首先从网络日志中提取出多条用户互联网数据,其中,每条用户互联网数据均包括用户行为类型、用户行为内容、地理位置和时间戳。
一般的,当用户通过网络执行某些操作时,网络日志能够记载该用户所执行的历史操作等数据信息,如用户具体行为、用户执行操作所在位置、用户执行操作时的时间等数据信息。示例性的,当用户通过网络访问某一网站时,网络后台服务器可以获取用户访问该网站时的定位信息,并将该用户的用户标识、用户的访问行为、用户所访问的目标网站的地址、用户的定位信息及用户访问时间对应存储至网络日志中。当需要根据用户互联网数据确定地理区域的特征时,可以从网络日志中获取至少一条包含有用户行为类型、用户行为内容、地理位置及时间戳的用户互联网数据。
可选的,用户行为类型包括搜索行为、软件安装行为、软件使用行为以及网站访问行为中的至少一种。用户行为内容是指与用户行为类型所对应的行为特征,是用户所执行的目标操作的标识。可选的,所述搜索行为对应的用户行为内容包括:搜索词,所述软件安装行为对应的用户行为内容包括所安装软件的标识(如所安装软件的名称、所安装软件的唯一识别码等),所述软件使用行为对应的用户行为内容包括所使用软件的标识(如所使用软件的名称、所使用软件的唯一识别码等),所述网站访问行为对应的用户行为内容包括所访问网站的地址;地理位置是指用户执行相应的用户行为内容时所在的地理位置;时间戳是指用户执行相应的用户行为内容时的时间。
示例性的,若用户在A位置,于B时刻以搜索词“美食”进行搜索,则从网络日志中提取出的与该用户此次行为所对应的用户互联网数据中可以得到:该用户行为所对应的用户行为类型为搜索行为,与该用户行为所对应的用户行为内容为“美食”,与该用户行为所对应的地理位置为A位置,与该用户行为所对应的时间戳为B时刻。
S120、基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图。
在本实施例中,基于所提取出的用户互联网数据,构建地理区域单元与用户行为内容之间的二部图。可选的,从网络日志中所提取出的用户互联网数据对应各种不同的用户行为,分别针对至少一种用户行为,构建地理区域单元与该种用户行为所对应的用户行为内容之间的二部图。
可选的,可以预先根据区域划分规则将区域划分为多个地理区域单元,根据用户执行用户行为时的位置与地理区域单元的位置关系,将用户行为与地理区域单元进行关联,建立地理区域单元与用户行为所对应的用户行为内容之间的二部图。可选的,区域划分规则可以根据实际需求及地理位置特征进行设定。可选的,可以将区域均匀划分为相同大小的地理区域单元,也可以将区域进行不均匀划分,得到大小不同的地理区域单元。
可选的,在建立地理区域单元与某种用户行为对应的用户行为内容之间的二部图时,还可以计算地理区域单元所对应的所有用户行为内容的权重,并将该权重显示在该地理区域单元与该用户行为内容之间的连线上。可选的,针对某一用户行为内容,该用户行为内容在某一地理区域单元的权重可以为该用户行为内容所对应的用户行为的次数与在该地理区域单元内该用户行为的所有次数的比值。示例性的,若在地理区域单元1内所执行的搜索次数共1000次,搜索词“教材”所对应的搜索行为有400次,则搜索词“教材”在地理区域单元1所对应的搜索行为的权重为0.4。
在本实施例中,可以根据用户行为对应的用户行为内容构建如下二部图。示例性的,地理区域单元与用户搜索行为之间的二部图可以表示为<地理区域单元1,搜索词1,权重1>、<地理区域单元2,搜索词2,权重2>,…,<地理区域单元N,搜索词N,权重N>,地理区域单元与用户软件安装行为之间的二部图可以表示为<地理区域单元1,所安装软件的标识1,权重1>、<地理区域单元2,所安装软件的标识2,权重2>,…,<地理区域单元N,所安装软件的标识N,权重N>,地理区域单元与用户软件使用行为之间的二部图可以表示为<地理区域单元1,所使用软件的标识1,权重1>、<地理区域单元2,所使用软件的标识2,权重2>,…,<地理区域单元N,所使用软件的标识N,权重N>,地理区域单元与用户网站访问行为之间的二部图可以表示为<地理区域单元1,所访问网站的地址1,权重1>、<地理区域单元2,所访问网站的地址2,权重2>,…,<地理区域单元N,所访问网站的地址N,权重N>等。例如,<地理区域单元1,教材,0.4>为地理区域单元与用户搜索行为之间的二部图中地理区域单元1与用户搜索行为内容“教材”的对应关系,其使用搜索词“教材”在地理区域单元1内所执行的搜索操作占用户在地理区域单元1内所执行的所有搜索操作的权重为0.4。
S130、根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
在本实施例中,构建好地理区域单元与用户行为所对应的用户行为内容之间的二部图后,使用预设的图嵌入(Graph Embedding)算法提取二部图中每一个节点的向量表征,从而从二部图中得到每个地理区域单元的特征向量。可选的,预设的图嵌入算法可以为:网络表示学习Deepwalk算法或网络结构特征提取Node2Vec算法。在本实施例中,对提取二部图中各节点向量表征的图嵌入算法不做限制,可以为网络表示学习Deepwalk算法或网络结构特征提取Node2Vec算法,也可以为其他的图嵌入算法。
可选的,基于从网络日志中提取的用户行为特征信息所构建的地理区域单元与用户行为所对应的用户行为内容之间的二部图数量可能为一个,也有可能为多个。可选的,所述根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量,包括:
若构建出一个二部图,则使用图嵌入算法提取该二部图中所述地理区域单元的特征向量;
若构建出多个二部图,则针对每个二部图,分别使用图嵌入算法提取当前二部图中所述地理区域单元的特征向量,将提取的相同地理区域单元的特征向量进行拼接,得到对应地理区域单元的最终的特征向量。
在本实施例中,若基于用户行为数据所构建的地理区域单元与用户行为所对应的用户行为内容之间的二部图数量为一个,则只需使用预先设置的图嵌入算法提取该二部图中各地理区域单元的特征向量即可,所提取出的各地理区域单元的特征向量即为各地理区域单元的最终特征向量。若基于用户行为数据所构建的地理区域单元与用户行为所对应的用户行为内容之间的二部图数量为多个,则需要针对各个二部图,分别使用预先设置的图嵌入算法提取各二部图中各地理区域单元的特征向量,并将相同地理区域单元的特征向量进行拼接,得到各地理区域单元的最终特征向量。
示例性的,若基于用户行为数据仅构建了地理区域单元与用户搜索行为所对应的用户搜索行为内容之间的二部图A,则使用预先设置的图嵌入算法,分别提取出二部图A中所包含的地理区域单元1、地理区域单元2、地理区域单元3、……、地理区域单元N的特征向量,并将所提取出的各特征向量作为各地理区域单元的最终特征向量。
若基于用户行为数据构建了地理区域单元与用户搜索行为所对应的用户搜索行为内容之间的二部图A、地理区域单元与软件安装行为所对应的软件安装行为内容之间的二部图B及地理区域单元与网站访问行为所对应的网站访问行为内容之间的二部图C,则使用预先设置的图嵌入算法,分别提取出二部图A、二部图B及二部图C中所包含的各地理区域单元的特征向量。假设从二部图A中提取出地理区域单元1的特征向量为A1,地理区域单元2的特征向量为A2,…,地理区域单元N的特征向量为AN,从二部图B中提取出地理区域单元1的特征向量为B1,地理区域单元2的特征向量为B2,…,地理区域单元N的特征向量为BN,从二部图C中提取出地理区域单元1的特征向量为C1,地理区域单元2的特征向量为C2,…,地理区域单元N的特征向量为CN,则将特征向量A1与特征向量B1和特征向量C1进行拼接,形成特征向量Z1,将特征向量Z1作为地理区域单元1的最终特征向量,将特征向量A2、特征向量B2和特征向量C2进行拼接,形成特征向量Z2,将特征向量Z2作为地理区域单元2的最终特征向量,将特征向量A3与特征向量B3和特征向量C3进行拼接,形成特征向量Z3,将特征向量Z3作为地理区域单元3的最终特征向量,等等,依此类推,得到地理区域单元N的最终特征向量。
图1b是本发明实施例一所提供的区域特征获取方法的流程示意图,图1b中示意性的示出了一种区域特征获取方法的优选流程。如图1b所示,一种优选的区域特征获取方法包括:
100:从全网用户的搜索、地理位置、网站访问、APP使用等日志中抽取用户的行为、时间戳、位置坐标,抽取的基础数据用于后续步骤的处理。
200:将区域划分为固定大小的网格(如100m×100m),将用户的到访位置坐标关联的对应的网格上。
300:结合100和200中处理的数据,以用户为单位打通用户所有的线上行为(搜索、APP安装、APP使用、网站访问等)和线下到访的网格,建立用户线上行为与线下到访网格之间的对应关系。
400:根据300所建立的对应关系,构建区域网格和用户行为之间的二部图,如:<区域网格,搜索词,权重(频次)>,<区域网格,所安装软件的标识,权重(频次)>,<区域网格,所使用软件的标识,权重(频次)>,<区域网格,所访问网站的地址,权重(频次)>等关系对构建二部图。
500:针对400中构建的每一个二部图,使用Deepwalk,Node2Vec等图嵌入(GraphEmbedding)算法,提取二部图中每一个节点的向量表征,从而从二部图得到每个区域网格的特征向量。
600:将500中多个二部图得到的区域网格向量进行拼接,得到用户行为在区域网格的完整向量表征。
本发明实施例通过从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。本发明实施例所提供的区域特征获取方法通过用户互联网行为数据来表达地理区域背后的隐含语义,将地理位置相关的用户行为表达成连续的特征向量,能够精准的提取地理区域的特征,进而可以基于特征向量对地理区域进行分类等,解决目前城市管理、城市规划、商业选址等应用中与区域相关的问题。
实施例二
图2a是本发明实施例二所提供的区域特征获取方法的流程图,本实施例在上述实施例的基础上进行进一步地优化。如图2a所示,所述方法包括:
S210、从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳。
S220、将地理区域划分为固定大小的至少一个网格,将每个网格作为一个地理区域单元,并建立各条用户互联网数据与所述至少一个网格的对应关系。
在本实施例中,将地理区域进行均匀划分,划分为大小相同的地理区域单元。可选的,可以预先将区域划分为固定大小的网格,每个网格对应一个地理区域单元,将用户执行用户行为时的位置坐标关联至对应的网格上,建立用户互联网数据与至少一个网格的对应关系。可选的,网格的大小可以根据实际需求,并结合具体的地理位置特点设置。可选的,网格的大小可以为100m×100m。
示例性的,若用户互联网数据包括某用户在A位置执行了用户搜索行为,某用户在B位置执行了用户软件安装行为及某用户在A位置执行了用户网站访问行为,则根据A位置、B位置与各网格的位置关系,建立用户行为与网格的对应关系。假设A位置位于网格1内,B位置位于网格2内,则分别建立用户搜索行为与网格1的对应关系、用户网站访问行为与网格1的对应关系,及用户软件安装行为与网格2的对应关系。
S230、根据各条用户互联网数据和建立的所述对应关系,针对各用户,汇总得到该用户的用户行为内容与所述至少一个网格的对应关系。
在本实施例中,根据建立的用户互联网数据及用户互联网数据与网格的对应关系,以用户为单位,对用户行为内容与网格的对应关系进行汇总,得到各用户的用户行为内容与至少一个网格的对应关系。
示例性的,若已建立某用户的搜索行为与网格1的对应关系、网站访问行为与网格1的对应关系,及软件安装行为与网格2的对应关系,则从该用户的用户互联网数据中获取该用户的各用户行为所对应的用户行为内容,得到用户行为内容与网格的对应关系。假设搜索行为所对应的用户行为内容为“教育”,网站访问行为所对应的用户行为内容为“网址A”,软件安装行为所对应的用户行为内容为“思博”,则分别建立“教育”与网格1的对应关系、“网址A”与网格1的对应关系及“思博”与网格2的对应关系。
S240、分别针对至少一种用户行为,根据各用户的用户行为内容与所述至少一个网格的对应关系,获得预先划分出的至少一个网格与该种用户行为对应的用户行为内容之间的二部图。
在本实施例中,建立各用户的用户行为内容与网格之间的对应关系后,将相同的用户行为所对应的用户行为内容与网格之间的对应关系进行汇总,得到网格与该种用户行为所对应的用户行为内容之间的二部图。
示例性的,以搜索行为为例,若所提取的用户互联网数据中所包含的用户搜索行为所对应的用户为用户A和用户B,且根据用户A的用户互联网数据所建立的用户行为内容与网格之间的对应关系为:“教材”、“考试”与网格1之间的对应关系,“教材”与网格2之间的对应关系,“考试”与网格3之间的对应关系,“计算机”与网格N之间的对应关系,根据用户B的用户互联网数据所建立的用户行为内容与网格之间的对应关系为:“计算机”与网格1之间的对应关系,“孕期”与网格2之间的对应关系,“考试”与网格3、网格N之间的对应关系,“计算机”与网格1之间的对应关系等,则将上述各用户行为内容与网格之间的对应关系进行汇总后,得到网格与用户搜索行为所对应的用户行为内容之间的二部图。
图2b是本发明实施例二所提供的区域特征获取方法中地理区域单元与用户搜索词之间的二部图的示意图。图2b以上述示例为例,示意性的示出了地理区域单元与用户搜索词之间的二部图。由图2b中可以看出,网格1所对应的地理位置区域所对应的用户搜索词有“教材”、“考试”、“计算机”,网格2所对应的地理位置区域所对应的用户搜索词有“教材”、“孕期”,网格3所对应的地理位置区域所对应的用户搜索词有“考试”,……,网格N所对应的地理位置区域所对应的用户搜索词有“考试”、“计算机”。
S250、根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
本发明实施例的技术方案,在上述实施例的基础上,具体化了基于提取的至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图的操作,通过将地理区域划分为固定大小的至少一个网格,将每个网格作为一个地理区域单元,并建立各条用户互联网数据与至少一个网格的对应关系;根据各条用户互联网数据和建立的对应关系,针对各用户,汇总得到该用户的用户行为内容与至少一个网格的对应关系;分别针对至少一种用户行为,根据各用户的用户行为内容与至少一个网格的对应关系,获得预先划分出的至少一个网格与该种用户行为对应的用户行为内容之间的二部图,使得所构建的地理区域单元与用户行为对应的用户行为内容之间的二部图更加准确,进而使根据二部图所得到的地理区域单元的特征更加准确。
实施例三
图3是本发明实施例三所提供的区域特征获取方法的流程图,本实施例在上述实施例的基础上进行进一步地优化。如图3所示,所述方法包括:
S310、从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳。
S320、基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图。
S330、根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
S340、将所述地理区域单元的特征向量输入第一机器学习模型,得到所述第一机器学习模型输出的所述地理区域单元的分类信息。
在本实施例中,可以根据地理区域单元的特征向量确定地理区域单元的分类信息。可选的,地理区域单元的分类信息可以为办公区、住宅区或商业区。可选的,根据用户行为所对应的用户行为内容与地理区域单元之间的二部图得到各地理区域单元的特征向量之后,将各地理区域单元的特征向量作为输入,输入至预先训练好的第一机器学习模型中,获得第一机器学习模型输出的各地理区域单元的分类信息。
可选的,所述第一机器学习模型是预先采用机器学习算法基于输入的区域分类样本数据训练得到的,所述区域分类样本数据包括至少一个区域的特征向量和人工标注的分类信息。
在本实施例中,可以预先获取部分地理位置区域的特征向量,并对各地理位置区域的分类信息进行人工标注,基于人工标注的地理位置区域的分类信息及各地理位置区域的特征向量生成样本对,对预先建立好的第一机器学习模型进行训练,获得训练好的第一机器学习模型,便可以通过训练好的第一机器学习模型确定地理位置区域的分类信息。
本发明实施例的技术方案,在上述实施例的基础上,增加了根据地理区域单元的特征向量得到地理区域单元的分类信息的操作,通过将地理区域单元的特征向量输入第一机器学习模型,得到第一机器学习模型输出的地理区域单元的分类信息,实现了根据用户互联网数据确定地理区域单元的分类信息,并且使得地理区域单元的分类更加准确。
实施例四
图4是本发明实施例四所提供的区域特征获取方法的流程图,本实施例在上述实施例的基础上进行进一步地优化。如图4所示,所述方法包括:
S410、从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳。
S420、基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图。
S430、根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
S440、根据地理区域单元的特征向量获得指定用户的特征向量,将指定用户的特征向量输入第二机器学习模型,得到第二机器学习模型输出的指定用户的分类信息。
在本实施例中,可以确定某一指定用户的分类信息。可选的,可以根据地理区域单元的特征向量及用户互联网数据确定某一用户的特征向量,并根据该用户的特征向量确定该用户的分类信息。可选的,根据用户行为所对应的用户行为内容与地理区域单元之间的二部图得到各地理区域单元的特征向量之后,可以根据用户的用户标识确定该用户的特征向量,将该用户的特征向量作为输入,输入至预先训练好的第二机器学习模型中,获得第二机器学习模型输出的该用户的分类信息。
其中,所述第二机器学习模型是预先采用机器学习算法基于输入的用户分类样本数据训练得到的,所述用户分类样本数据包括至少一个用户的特征向量和人工标注的分类信息。
在本实施例中,可以预先获取部分用户的特征向量,并对用户的分类信息进行人工标注,基于人工标注的用户的分类信息及各用户的特征向量生成样本对,对预先建立好的第二机器学习模型进行训练,获得训练好的第二机器学习模型,便可以通过训练好的第二机器学习模型确定用户的分类信息。可选的,用户的分类信息可以根据不同的标注设置,例如,可以根据用户的年龄、需求或职业等进行设置。
可选的,所述根据所述地理区域单元的特征向量获得指定用户的特征向量,包括:
确定所述指定用户的用户行为所对应的地理区域单元,将确定的所述地理区域单元的特征向量相加,得到所述指定用户的特征向量。
可选的,还可以根据用户的用户行为从各地理区域单元中获取该用户在各地理区域单元中所对应的特征向量,再将各地理区域单元的特征向量相加,将相加所得到的特征向量作为该用户的最终特征向量,使用该用户的最终特征向量作为第二机器学习模型的输入,获得第二机器学习模型输出的该用户的分类信息。
本发明实施例的技术方案,在上述实施例的基础上,增加了根据用户的特征向量得到用户的分类信息的操作,通过根据地理区域单元的特征向量获得指定用户的特征向量,将指定用户的特征向量输入第二机器学习模型,得到第二机器学习模型输出的指定用户的分类信息,实现了根据用户的用户互联网数据确定用户的分类信息,并且使得用户的分类更加准确。
实施例五
图5是本发明实施例五所提供的区域特征获取装置的结构示意图。该区域特征获取装置可以采用软件和/或硬件的方式实现,例如该区域特征获取装置可以配置于计算机设备中,如图5所示,所述装置包括互联网数据获取模块510、二部图构建模块520及特征向量计算模块530,其中:
互联网数据获取模块510,用于从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;
二部图构建模块520,用于基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;
特征向量计算模块530,用于根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
本发明实施例通过互联网数据获取模块从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;二部图构建模块基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;特征向量计算模块根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。通过用户互联网行为数据来表达地理区域背后的隐含语义,将地理位置相关的用户行为表达成连续的特征向量,从而更精准的表达一个区域背后的隐含语义,进而可以基于特征向量对地理区域进行分类等,解决目前城市管理、城市规划、商业选址等应用中与区域相关的问题。
在上述方案的基础上,二部图构建模块520包括:
对应关系建立单元,用于将地理区域划分为固定大小的至少一个网格,将每个网格作为一个地理区域单元,并建立各条用户互联网数据与所述至少一个网格的对应关系;
对应关系汇总单元,用于根据各条用户互联网数据和建立的所述对应关系,针对各用户,汇总得到该用户的用户行为内容与所述至少一个网格的对应关系;
二部图获取单元,用于分别针对至少一种用户行为,根据各用户的用户行为内容与所述至少一个网格的对应关系,获得预先划分出的至少一个网格与该种用户行为对应的用户行为内容之间的二部图。
在上述方案的基础上,所述特征向量计算模块530,具体用于:
若构建出一个二部图,则使用图嵌入算法提取该二部图中所述地理区域单元的特征向量;
若构建出多个二部图,则针对每个二部图,分别使用图嵌入算法提取当前二部图中所述地理区域单元的特征向量,将提取的相同地理区域单元的特征向量进行拼接,得到对应地理区域单元的最终的特征向量。
在上述方案的基础上,所述装置还包括地理分类获取模块,用于:
在所述使用图嵌入算法得到所述地理区域单元的特征向量之后,将所述地理区域单元的特征向量输入第一机器学习模型,得到所述第一机器学习模型输出的所述地理区域单元的分类信息;
其中,所述第一机器学习模型是预先采用机器学习算法基于输入的区域分类样本数据训练得到的,所述区域分类样本数据包括至少一个区域的特征向量和人工标注的分类信息。
在上述方案的基础上,所述装置还包括用户分类获取模块,用于:
在所述使用图嵌入算法得到所述地理区域单元的特征向量之后,根据所述地理区域单元的特征向量获得指定用户的特征向量,将所述指定用户的特征向量输入第二机器学习模型,得到所述第二机器学习模型输出的所述指定用户的分类信息;
其中,所述第二机器学习模型是预先采用机器学习算法基于输入的用户分类样本数据训练得到的,所述用户分类样本数据包括至少一个用户的特征向量和人工标注的分类信息。
在上述方案的基础上,所述用户分类获取模块具体用于:
在所述使用图嵌入算法得到所述地理区域单元的特征向量之后,确定所述指定用户的用户行为所对应的地理区域单元,将确定的所述地理区域单元的特征向量相加,得到所述指定用户的特征向量,将所述指定用户的特征向量输入第二机器学习模型,得到所述第二机器学习模型输出的所述指定用户的分类信息。
在上述方案的基础上,所述用户行为包括搜索行为、软件安装行为、软件使用行为以及网站访问行为中的至少一种;
其中,所述搜索行为对应的用户行为内容包括:搜索词,所述软件安装行为对应的用户行为内容包括所安装软件的标识,所述软件使用行为对应的用户行为内容包括所使用软件的标识,所述网站访问行为对应的用户行为内容包括所访问网站的地址。
本发明实施例所提供的区域特征获取装置可执行任意实施例所提供的区域特征获取方法,具备执行方法相应的功能模块和有益效果。
实施例六
图6是本发明实施例六所提供的计算机设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性计算机设备612的框图。图6显示的计算机设备612仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备612以通用计算设备的形式表现。计算机设备612的组件可以包括但不限于:一个或者多个处理器616,系统存储器628,连接不同系统组件(包括系统存储器628和处理器616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器616或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备612访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)630和/或高速缓存存储器632。计算机设备612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储装置634可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储器628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块642的程序/实用工具640,可以存储在例如存储器628中,这样的程序模块642包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块642通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备612也可以与一个或多个外部设备614(例如键盘、指向设备、显示器624等)通信,还可与一个或者多个使得用户能与该计算机设备612交互的设备通信,和/或与使得该计算机设备612能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口622进行。并且,计算机设备612还可以通过网络适配器620与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器620通过总线618与计算机设备612的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备612使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器616通过运行存储在系统存储器628中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的区域特征获取方法,该方法包括:
从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;
基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;
根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的区域特征获取方法的技术方案。
实施例七
本发明实施例七还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的区域特征获取方法,该方法包括:
从网络日志中提取至少一条用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;
基于提取的所述至少一条用户互联网数据,分别针对至少一种用户行为,构建预先划分出的地理区域单元与该种用户行为对应的用户行为内容之间的二部图;
根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的区域特征获取方法中的相关操作。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种区域特征获取方法,其特征在于,包括:
当需要根据用户互联网数据确定地理区域的特征时,从网络日志中提取至少一条所述用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;
将地理区域划分为固定大小的至少一个网格,将每个网格作为一个地理区域单元,并建立各条用户互联网数据与所述至少一个网格的对应关系;
根据各条用户互联网数据和建立的所述对应关系,针对各用户,汇总得到该用户的用户行为内容与所述至少一个网格的对应关系;
分别针对至少一种用户行为,根据各用户的用户行为内容与所述至少一个网格的对应关系,获得预先划分出的至少一个网格与该种用户行为对应的用户行为内容之间的二部图;
根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
2.根据权利要求1所述的方法,其特征在于,所述根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量,包括:
若构建出一个二部图,则使用图嵌入算法提取该二部图中所述地理区域单元的特征向量;
若构建出多个二部图,则针对每个二部图,分别使用图嵌入算法提取当前二部图中所述地理区域单元的特征向量,将提取的相同地理区域单元的特征向量进行拼接,得到对应地理区域单元的最终的特征向量。
3.根据权利要求1所述的方法,其特征在于,在所述使用图嵌入算法得到所述地理区域单元的特征向量之后,还包括:
将所述地理区域单元的特征向量输入第一机器学习模型,得到所述第一机器学习模型输出的所述地理区域单元的分类信息;
其中,所述第一机器学习模型是预先采用机器学习算法基于输入的区域分类样本数据训练得到的,所述区域分类样本数据包括至少一个区域的特征向量和人工标注的分类信息。
4.根据权利要求1所述的方法,其特征在于,在所述使用图嵌入算法得到所述地理区域单元的特征向量之后,还包括:
根据所述地理区域单元的特征向量获得指定用户的特征向量,将所述指定用户的特征向量输入第二机器学习模型,得到所述第二机器学习模型输出的所述指定用户的分类信息;
其中,所述第二机器学习模型是预先采用机器学习算法基于输入的用户分类样本数据训练得到的,所述用户分类样本数据包括至少一个用户的特征向量和人工标注的分类信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述地理区域单元的特征向量获得指定用户的特征向量,包括:
确定所述指定用户的用户行为所对应的地理区域单元,将确定的所述地理区域单元的特征向量相加,得到所述指定用户的特征向量。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述用户行为包括搜索行为、软件安装行为、软件使用行为以及网站访问行为中的至少一种;
其中,所述搜索行为对应的用户行为内容包括:搜索词;所述软件安装行为对应的用户行为内容包括:所安装软件的标识;所述软件使用行为对应的用户行为内容包括:所使用软件的标识;所述网站访问行为对应的用户行为内容包括:所访问网站的地址。
7.一种区域特征获取装置,其特征在于,所述装置包括:
互联网数据获取模块,用于当需要根据用户互联网数据确定地理区域的特征时,从网络日志中提取至少一条所述用户互联网数据,每条用户互联网数据包括用户行为类型、用户行为内容、地理位置和时间戳;
二部图构建模块,包括:
对应关系建立单元,用于将地理区域划分为固定大小的至少一个网格,将每个网格作为一个地理区域单元,并建立各条用户互联网数据与所述至少一个网格的对应关系;
对应关系汇总单元,用于根据各条用户互联网数据和建立的所述对应关系,针对各用户,汇总得到该用户的用户行为内容与所述至少一个网格的对应关系;
二部图获取单元,用于分别针对至少一种用户行为,根据各用户的用户行为内容与所述至少一个网格的对应关系,获得预先划分出的至少一个网格与该种用户行为对应的用户行为内容之间的二部图;
特征向量计算模块,用于根据构建的所述二部图,使用图嵌入算法得到所述地理区域单元的特征向量。
8.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的区域特征获取方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的区域特征获取方法。
CN201811293495.6A 2018-10-31 2018-10-31 一种区域特征获取方法、装置、计算机设备及介质 Active CN111125272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811293495.6A CN111125272B (zh) 2018-10-31 2018-10-31 一种区域特征获取方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811293495.6A CN111125272B (zh) 2018-10-31 2018-10-31 一种区域特征获取方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN111125272A CN111125272A (zh) 2020-05-08
CN111125272B true CN111125272B (zh) 2023-07-25

Family

ID=70494697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811293495.6A Active CN111125272B (zh) 2018-10-31 2018-10-31 一种区域特征获取方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN111125272B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190730A (zh) * 2021-04-30 2021-07-30 中国人民银行数字货币研究所 一种区块链地址的分类方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106327227A (zh) * 2015-06-19 2017-01-11 北京航天在线网络科技有限公司 一种信息推荐系统及信息推荐方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9507909B2 (en) * 2012-10-12 2016-11-29 The Boeing Company System and method for computational planning in a data-dependent constraint management system
JP6637054B2 (ja) * 2015-01-27 2020-01-29 ベイジン ディディ インフィニティ テクノロジー アンド ディベロップメント カンパニー リミティッド オン・デマンドサービスの情報を提供する方法及びシステム
CN106445988A (zh) * 2016-06-01 2017-02-22 上海坤士合生信息科技有限公司 一种大数据的智能处理方法和系统
CN106682212B (zh) * 2016-12-31 2020-10-30 复旦大学 一种基于用户移动行为的社会关系分类方法与装置
CN107133262B (zh) * 2017-03-30 2019-09-06 浙江大学 一种基于多影响嵌入的个性化poi推荐方法
CN107612938A (zh) * 2017-10-27 2018-01-19 朱秋华 一种网络用户异常行为检测方法、装置、设备及存储介质
CN108304526B (zh) * 2018-01-25 2022-02-11 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN108322473B (zh) * 2018-02-12 2020-05-01 京东数字科技控股有限公司 用户行为分析方法与装置
CN108650614B (zh) * 2018-03-19 2020-07-28 复旦大学 一种自动推断社会关系的移动用户位置预测方法与装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106327227A (zh) * 2015-06-19 2017-01-11 北京航天在线网络科技有限公司 一种信息推荐系统及信息推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Authentication graphs: Analyzing user behavior within an enterprise network;Alexander D. Kent, Lorie M. Liebrock b, Joshua C. Neil a;《 ScienceDirect》;全文 *
基于用户签到行为的兴趣点推荐;任星怡;宋美娜;宋俊德;;计算机学报(01);全文 *
网络地理信息应用中用户行为数据获取与分析研究;赵龙;《中国优秀硕士学位论文全文数据库》;全文 *

Also Published As

Publication number Publication date
CN111125272A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN110008300B (zh) Poi别名的确定方法、装置、计算机设备和存储介质
CN110019616B (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
US9990639B1 (en) Automatic detection of fraudulent real estate listings
CN111212383B (zh) 区域常住人口数量的确定方法、装置、服务器和介质
CN110750654A (zh) 知识图谱获取方法、装置、设备和介质
CN110633381A (zh) 一种识别虚假房源的方法、装置、存储介质及电子设备
US20190147468A1 (en) Location evaluation
CN110020144B (zh) 一种推荐模型建立方法及其设备、存储介质、服务器
CN112861972B (zh) 一种展业区域的选址方法、装置、计算机设备和介质
CN110633726A (zh) 一种房源识别方法、装置、存储介质及电子设备
CN108182240B (zh) 兴趣点新增率预测模型训练及预测方法、装置及存储介质
CN110619039A (zh) 一种房产信息的校验方法、装置、存储介质及电子设备
CN111522838A (zh) 地址相似度计算方法及相关装置
CN110688434B (zh) 一种兴趣点处理方法、装置、设备和介质
CN113221565A (zh) 实体识别模型的训练方法、装置、电子设备及存储介质
US10762089B2 (en) Open ended question identification for investigations
US20150379112A1 (en) Creating an on-line job function ontology
CN111126422B (zh) 行业模型的建立及行业的确定方法、装置、设备及介质
CN109657148B (zh) 针对上报poi的异常操作识别方法、装置、服务器和介质
CN110674208B (zh) 用于确定用户的职住地信息的方法和装置
CN111125272B (zh) 一种区域特征获取方法、装置、计算机设备及介质
CN112818072A (zh) 旅游知识图谱更新方法、系统、设备及存储介质
CN110647595B (zh) 一种新增兴趣点的确定方法、装置、设备和介质
CN111930891A (zh) 基于知识图谱的检索文本扩展方法及相关装置
CN110457705B (zh) 一种兴趣点数据处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant