CN112000763B - 兴趣点竞争关系确定方法、装置、设备和介质 - Google Patents

兴趣点竞争关系确定方法、装置、设备和介质 Download PDF

Info

Publication number
CN112000763B
CN112000763B CN202011025731.3A CN202011025731A CN112000763B CN 112000763 B CN112000763 B CN 112000763B CN 202011025731 A CN202011025731 A CN 202011025731A CN 112000763 B CN112000763 B CN 112000763B
Authority
CN
China
Prior art keywords
poi
service
data
determining
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011025731.3A
Other languages
English (en)
Other versions
CN112000763A (zh
Inventor
李双利
周景博
徐童
熊辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011025731.3A priority Critical patent/CN112000763B/zh
Publication of CN112000763A publication Critical patent/CN112000763A/zh
Priority to US17/480,780 priority patent/US11789985B2/en
Application granted granted Critical
Publication of CN112000763B publication Critical patent/CN112000763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Remote Sensing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种兴趣点竞争关系确定方法、装置、设备和介质,涉及人工智能和大数据技术。具体时实现方案为:根据两个目标POI的服务关联数据,确定所述目标POI之间的POI表征数据;根据所述POI表征数据,确定所述目标POI之间的竞争关系。本申请实施例提高了兴趣点竞争关系的确定效率和准确度。

Description

兴趣点竞争关系确定方法、装置、设备和介质
技术领域
本申请涉及数据处理技术领域,尤其涉及人工智能和大数据技术,具体涉及一种兴趣点竞争关系确定方法、装置、设备和介质。
背景技术
在地理信息系统中,POI(Point of Interest,兴趣点)指的是用户感兴趣的地理对象,指代一个物理实体如公园、商场或店铺等。在现实生活中,用户出行时基于多方面考虑,往往需要在多个POI之间做出选择,使得不同POI之间构成了竞争关系。
由于在对POI数据进行处理时,往往会更专注POI之间的聚合关系,使得POI竞争关系的分析还处于初级阶段,通常采用人工经验或统计方式加以实现,准确度较差、确定效率也较低。
发明内容
本申请提供了一种效率更高、准确度更好的兴趣点竞争关系确定方法、装置、设备和介质。
根据本申请的一方面,提供了一种兴趣点竞争关系确定方法,包括:
根据两个目标兴趣点POI的服务关联数据,确定所述目标POI之间的POI表征数据;
根据所述POI表征数据,确定所述目标POI之间的竞争关系。
根据本申请的另一方面,提供了一种兴趣点竞争关系确定装置,包括:
POI表征数据确定模块,用于根据两个目标兴趣点POI的服务关联数据,确定所述目标POI之间的POI表征数据;
竞争关系确定模块,用于根据所述POI表征数据,确定所述目标POI之间的竞争关系。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例提供的任意一种兴趣点竞争关系确定方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例提供的任意一种兴趣点竞争关系确定方法。
根据本申请的技术方案,提高了兴趣点竞争关系的确定效率和准确度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的一种兴趣点竞争关系确定方法的流程图;
图2是本申请实施例提供的另一种兴趣点竞争关系确定方法的流程图;
图3是本申请实施例提供的一种POI异构信息网络示意图;
图4是本申请实施例提供的另一种POI异构信息网络示意图;
图5是本申请实施例提供的另一种POI异构信息网络示意图;
图6是本申请实施例提供的另一种兴趣点竞争关系确定方法的流程图;
图7是本申请实施例提供的一种兴趣点竞争关系确定过程示意图;
图8是本申请实施例提供的一种POI竞争关系预测框架示意图;
图9是本申请实施例提供的一种POI异构信息网络示意图;
图10是本申请实施例提供的一种竞争关系预测模型结构示意图;
图11是本申请实施例提供的基于SA-GNN的POI空间表征确定过程示意图;
图12是本申请实施例提供的一种RA Conv模型结构示意图;
图13是本申请实施例提供的一种兴趣点竞争关系确定装置的结构图;
图14是用来实现本申请实施例的兴趣点竞争关系确定方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本申请实施例提供的各兴趣点竞争关系确定方法和兴趣点竞争关系确定装置,适用于在大数据技术领域中对兴趣点之间的竞争关系进行预测的情况,该兴趣点竞争关系确定方法可以由兴趣点竞争关系确定装置执行,该装置采用软件和/或硬件实现,并具体配置于电子设备中。
图1是本申请实施例提供的一种兴趣点竞争关系确定方法的流程图,该方法包括:
S101、根据两个目标POI的服务关联数据,确定目标POI之间的POI表征数据。
其中,目标POI可以理解为进行竞争关系预测的两个兴趣点。其中,服务关联数据可以理解为与目标POI所提供功能服务相关联的结构化数据,其中,功能服务包括目标POI所提供的商品服务和/或体验服务。举例说明,一个餐馆所售卖的菜品即为商品服务,该餐馆所提供的环境和服务员的服务态度等即为体验服务。
可选的,服务关联数据可以预先存储在电子设备本地、与电子设备关联的其他存储设备或云端中,相应的,在进行兴趣点竞争关系确定时,从电子设备、与电子设备关联的其他存储设备或云端中,进行服务关联数据的查找获取。
或者可选的,随着时间的推移,目标POI的服务管理关联数据可能会产生一定的变化。为了保证所确定的POI表征数据的准确度,进而为POI竞争关系确定结果的准确度奠定基础,还可以在进行POI竞争关系确定过程中,进行目标POI的服务关联数据的实时确定。
示例性地,可以根据目标POI的评论数据的相似关系,确定服务关联数据,进而根据所确定的服务关联数据,进行目标POI之间的POI表征数据的确定。其中,目标POI的评论数据包括用户到访目标POI后,对目标POI所提供的功能服务进行的评价。
可以理解的是,由于不同目标POI的评论数据能够在功能服务层面对目标POI进行描述,从而基于目标POI的评论数据的相似关系所确定的服务关联数据,在功能服务层面能够映射出目标POI之间的竞争关系。例如评论数据中涉及的功能服务相同或近似,则表征目标POI之间所提供服务相同或近似,相应的,目标POI之间具备潜在的竞争关系。
由于部分目标POI所包含的评论数据较少,因此仅根据目标POI自身的评论数据所确定的服务关联数据的全面性较差,进而影响所确定的POI表征数据的准确度。为了避免上述情况的发生,在根据目标POI的评论数据的相似关系,确定服务关联数据时,还可以确定目标POI的聚合点,并将目标POI的聚合点的评论数据,作为目标POI的评论数据,从而扩充目标POI的评论数据的数据量,进而丰富服务关联数据的全面性。其中,聚合点可以是目标POI的品牌等。
在一可选实施例中,根据各目标POI的服务关联数据,确定目标POI之间的POI表征数据,可以是:根据服务关联数据,确定POI服务表征;根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据。
示例性地,根据服务关联数据,确定POI服务表征,可以是:采用设定特征提取网络,分别提取各目标POI的服务关联数据中的POI服务表征。其中,设定特征提取网络中的网络参数可以通过大量样本数据训练得到。该特征提取网络可以采用人工智能技术领域中诸如神经网络等机器学习模型或深度学习模型加以实现,本申请对该特征提取网络的网络结构不做任何限定。
上述技术方案通过引入服务关联数据进行POI表征数据的确定,从而使所确定的目标POI表征数据中包含有目标POI之间在服务层面的隐含关系,为目标POI之间的竞争关系确定结果的准确度的提高奠定了基础。
可选的,根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据,可以是:将目标POI的POI服务表征进行拼接融合,得到目标POI之间的POI表征数据,用于进行目标POI之间的竞争关系的确定。
需要说明的是,由于不同目标POI所提供的功能服务的种类不同,相应的服务关联数据的大小不同,进而导致最终确定的POI服务表征的数据长度不同。而直接将数据长度不同的两个POI服务表征进行拼接融合,将会由于POI服务表征拼接先后顺序的不同,将会出现数据不对称的问题,导致后续竞争关系确定结果的稳定性较差。为了提高后续竞争关系确定结果的稳定性,可选的,根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据,还可以引入平均全连接层,对各目标POI的POI服务表征进行处理,以消除POI服务表征的不对称问题。其中,POI服务表征中的网络参数可以通过大量样本数据训练得到。
示例性地,引入平均全连接层,对各目标POI的POI服务表征进行处理,可以是:根据第一顺序将各目标POI的POI服务表征进行融合,得到第一融合数据;根据第二顺序将各目标POI的POI服务表征进行融合,得到第二融合数据;其中,第一顺序和第二顺序相反;根据第一融合数据和第二融合数据,确定POI表征数据。
可以理解的是,通过将两个POI服务表征采用顺序拼接融合和逆序拼接融合的方式,进行第一融合数据和第二融合数据的确定,进而根据第一融合数据和第二融合数据进行POI表征数据的确定,忽略了目标POI的POI服务表征的先后顺序,因此也消除了不同目标POI的POI服务表征的不对称情况,从而为后续竞争关系确定结果的稳定性的,提高奠定了基础。
S102、根据POI表征数据,确定目标POI之间的竞争关系。
示例性地,可以对POI表征数据进行处理,得到竞争关系的预测概率;若预测概率大于设定概率阈值,则表明目标POI之间具备竞争关系;若预测概率不大于设定概率阈值,则表征目标POI之间不具备竞争关系。其中,设定概率阈值可以由技术人员根据需要或经验值进行确定,或通过大量试验反复确定。
本申请实施例通过在进行目标POI之间的竞争关系的确定过程中,引入基于目标POI之间的POI表征数据,使得POI表征数据中携带了目标POI在服务层面相关联的隐含表征。由于服务层面相关联的隐含表征能够反映出目标POI之间的竞争关系,例如所提供服务相同或近似,因此基于服务层面相关联的隐含表征,进行目标POI之间的竞争关系的确定,提高了竞争关系确定结果的准确度。另外,采用POI表征数据确定的方式,替代传统人工经验确定或统计确定的方式,无需投入大量的时间成本和人力成本,提高了目标POI之间的竞争关系确定的时间效率。
上述可选实施例采用目标POI的评论数据的相似关系,进行服务关联数据的实时确定,此种方式虽然能够保证服务关系数据的时效性,但是会带来计算量的增大,同时还会牺牲一定的计算效率。为了进一步提升竞争关系确定效率,同时尽可能减少数据运算量,在本申请一可选实施例中,还可以引入POI先验知识,进行服务关联数据的确定。
参见图2所示的一种兴趣点竞争关系确定方法,包括:
S201、根据预先构建的POI异构信息网络,确定目标POI的服务关联数据;其中,POI异构信息网络通过如下方式构建:提取多个候选POI的评论数据的服务关键词;根据各候选POI的共现关系以及服务关键词的相似关系,构建POI异构信息网络。
可选的,提取多个候选POI的评论数据的服务关键词,可以是:针对每一候选POI,对该候选POI的评论数据进行分词;根据分词结果,确定该候选POI的服务关键词。
进一步地,为了避免分词结果中无关词的影响,在根据分词结果,确定该候选POI的服务关键词时,还可以确定各分词结果的贡献度;根据贡献度排序结果,筛选分词结果中的服务关键词。示例性地,各分词结果的贡献度可以采用TF-IDF(term frequenc6–inversedocument frequenc6,词频-逆向文件频率)加以表征。当然,贡献度还可以采用其他参数进行表征,本申请实施例对此不做任何限定。
由于部分候选POI的评论数据可能存在数据量较小的情况,因此,通过单个候选POI的评论数据进行服务关键词的确定,所确定的服务关键词全面性较差,从而为竞争关系确定结果的准确度带来一定影响。为了提高服务关键词的全面性,进而提高竞争关系确定结果的准确度,可选的,提取多个候选POI的评论数据的服务关键词,还可以是:获取候选POI的聚合点关联的聚合评论数据;提取聚合评论数据中的服务关键词。其中,聚合点可以是候选POI的品牌等。
可以理解的是,通过引入候选POI的聚合点,将聚合点的聚合评论数据作为候选POI的评论数据,显著提升了单一候选POI的评论数据的数据量,进而基于聚合评论数据进行服务关键词的提取,提升了服务关键词提取结果的丰富度和全面性,从而为竞争关系确定结果的准确度的提升,奠定了基础。
由于在构建POI异构信息图时候选POI的数据量较大,如果提取过多的服务关键词,将会导致POI异构信息图中存在大量的冗余,同时庞大的POI异构信息图的使用过程,也将需要投入大量的数据运算量。为了减少POI异构信息图使用过程的数据运算量,还可以在构建POI异构信息图时,对重要性不高的服务关键词加以剔除,以缩减POI异构信息图中的信息量。
示例性地,可以在提取聚合评论数据中的服务关键词时,对服务关键词进行筛选,从而减少所提取的服务关键词的数量,进而达到缩减POI异构信息图中信息量的目的。具体的,可以对聚合评论数据进行分词,并确定各分词结果的贡献度;根据贡献度排序结果,筛选分词结果中的服务关键。其中,各分词结果的贡献度可以采用TF-IDF加以表征。当然,贡献度还可以采用其他参数进行表征,本申请实施例对此不做任何限定。
举例说明,可以针对每一候选POI,获取候选POI关联的品牌;将该品牌下各POI的评论数据作为聚合评论数据,描述品牌的语义特征。由于聚合评论数据中包含有大量的词语,其中能够体现出品牌的功能服务的词即为服务关键词,因此需要从聚合评论数据中对服务关键词进行挖掘。可选的,对聚合评论数据进行分词处理,并消除分词结果中的无意义词,以更新分词结果;确定分词结果中各分词的贡献度(如TF-IDF),并选取贡献度较高的分词结果作为服务关键词。
其中,候选POI的共现关系可以理解为至少两个候选POI在相同时间段内被用户共同搜索或共同到访。相应的,共现关系可以通过用户搜索数据、用户到访数据和POI空间距离等中的至少一种确定。
可选的,可以根据用户搜索数据,确定第一设定时间段内用户共同搜索的至少两个候选POI之间具备共现关系;或者可选的,可以根据用户到访数据,确定第二设定时间段内用户共同到访的至少两个候选POI之间具备共现关系;或者可选的,可以根据POI空间分布数据,确定POI空间距离小于设定距离阈值的两个候选POI之间具备共现关系。其中,第一设定时间段、第二设定时间段和设定距离阈值可以由技术人员根据需要或经验值进行确定,还可以通过大量试验反复确定。其中,第一设定时间段和第二设定时间段时长可以相同或不同。
为了降低噪声干扰,同时减少后续所构建的POI异构信息网络的规模,还可以对共现关系进行筛选。可选的,针对共同搜索所确定的共现关系,可以设定搜索次数阈值,将小于搜索次数阈值的共现关系删除;或者可选的,针对共同到访所确定的共现关系,可以设定到访次数阈值,将小于到访次数阈值的共现关系删除。其中,搜索次数阈值或到访次数阈值可以由技术人员根据需要或经验值进行确定,还可以通过大量试验反复确定。
其中,服务关键词的相似关系可以理解为基于服务关键词之间的相似性所确定的相似关系。示例性地,可以采用语义相似度来表征不同服务关键词之间的相似关系。
为了清楚地介绍基于候选POI的共现关系以及服务关键词的相似关系所构建的POI异构信息网络,参见图3所示的一种POI异构信息网络示意图,对异构信息网络的结构进行详细说明。
其中,POI异构信息网络中包括节点和关系边。其中,节点包括与候选POI相对应的POI节点,以及与服务关键词相对应的关键词节点。其中,关系边包括服务关系边,用于表征关键词节点之间的关联关系;关系边还包括第一关系边,用于表征POI节点和关键词节点之间的关联关系。为了对服务关系边所连接的关键词节点之间关联关系的强弱加以表征,还引入了服务边属性。
在一个可选实施例中,根据各候选POI的共现关系以及服务关键词的相似关系,构建POI异构信息网络,可以是:根据服务关键词的相似关系,构建服务关键词的关键词节点之间的服务关系边;根据服务关键词与候选POI之间的所属关系,构建候选POI的POI节点与服务关键词的关键词节点之间的第一关系边;根据服务关系边所连接的服务关键词之间的相似性,确定服务边属性。相应的,根据预先构建的POI异构信息网络,确定目标POI的服务关联数据,包括:根据POI异构信息网络中的第一关系边,确定目标POI关联的目标关键词节点;根据各目标关键词节点之间的服务边属性,确定目标POI的服务类型的服务关联数据。
可以理解的是,通过上述技术方案,能够在确定候选POI自身的服务关键词的基础上,进行POI异构信息网络的构建,进而基于所构建的POI异构信息网络进行服务关联数据的确定,为后续进行POI服务表征的确定提供了数据支撑,进而为POI竞争关系的确定奠定了基础。
在另一可选实施例中,根据各候选POI的共现关系以及服务关键词的相似关系,构建POI异构信息网络,还可以是:根据服务关键词的相似关系,构建服务关键词的关键词节点之间的服务关系边;根据候选POI和服务关键词所属聚合点的一致性,构建该候选POI的POI节点与该服务关键词的关键词节点之间的第一关系边;根据服务关系边所连接的服务关键词之间的相似性,确定服务边属性。相应的,根据预先构建的POI异构信息网络,确定目标POI的服务关联数据,包括:根据POI异构信息网络中的第一关系边和服务关系边,确定目标POI关联的目标关键词节点;根据各目标关键词节点之间的服务边属性,确定目标POI的服务类型的服务关联数据。
示例性地,若两个服务关键词之间具备相似关系,则构建服务关键词的关键词节点之间的服务关系边;若候选POI与服务关键词属于同一聚合点,则构建候选POI的POI节点与服务关键词的关键词节点之间的第一关系边;根据具备服务关系边的两个服务关键词之间的相似性,确定服务边属性。相应的,确定与目标POI具备第一关系边的目标关键词节点,并将目标关键词节点具备服务关系边连接关系的邻居关键词节点也作为目标关键词节点。根据各目标关键词节点之间的服务边属性的属性值,构建各目标POI的结构化的服务类型的服务关联数据。其中,服务类型的服务关联数据中包含有服务关键词对应的服务层面的隐含关系数据。
可以理解的是,通过上述技术方案,能够在引入候选POI的聚合点的基础上,进行聚合点的服务关键词的确定,并基于聚合点的服务关键词进行POI异构信息网络的构建,进而基于所构建的POI异构信息网络进行服务关联数据的确定,为后续进行POI服务表征的确定提供了数据支撑,进而为POI竞争关系的确定奠定了基础。
示例性地,根据服务关系边所连接的服务关键词之间的相似性,确定服务边属性,可以是:确定服务关系边所连接的服务关键词之间的语义相似度;将语义相似度作为服务边属性。
可选的,确定服务关系边所连接的服务关键词之间的语义相似度,可以是:确定服务关系边所连接的服务关键词之间的PMI(Pointwise Mutual Information,点互信息);将PMI作为服务关系边所连接的服务关键词之间的语义相似度。
或者可选的,确定服务关系边所连接的服务关键词之间的语义相似度,还可以是:对服务关系边所连接的服务关键词进行编码处理,得到对应的词向量;将词向量之间的相似度作为语义相似度。
可以理解的是,通过引入语义相似度进行服务边属性的确定,完善了POI异构信息网络的构建机制,为服务关联数据的确定奠定了基础。需要说明的是,本申请仅示例性给出了两种语义相似度确定方式,还可以采用现有技术的其他相似度确定方式中的至少一种进行语义相似度的确定,本申请实施例对此不做任何限定。
为了进一步降低噪声干扰,同时减少后续所构建的POI异构信息网络的规模,还可以对服务关系边进行筛选,以剔除服务关键词之间关联强度较弱的服务关系边。
示例性地,过滤相似度不满足相似度阈值的服务关系边。可选的,在前述可选实施方式中进行语义相似度确定之后,将语义相似度与预先设定的相似度阈值进行比较;若语义相似度小于预先设定的相似度阈值,则表明对应的两个服务关键词之间的关联强度较弱,因此可以在服务关系边构建完成后,将此类服务关系边剔除,或在进行服务关系边构建时,禁止此类服务关系边的构建;若语义相似度不小于预先设定的相似度阈值,则表明对应的两个服务关键词之间的关联强度较强,因此可以在服务关系边构建完成后,保留此类服务关系边,或在进行服务关系边构建时,允许此类服务关系边的构建。其中,相似度阈值可以由技术人员根据需要或经验值进行确定,或通过大量试验反复确定。
参见图4所示的另一种POI异构信息网络示意图,为了便于更新POI异构信息网络中的信息,还可以在POI异构信息网络中引入与聚合点对应的聚合点节点,并建立聚合点节点与POI节点和关键词节点之间的关系边。
示例性地,根据候选POI和服务关键词所属聚合点的一致性,构建该候选POI的POI节点与该服务关键词的关键词节点之间的第一关系边,可以是:根据候选POI与聚合点的所属关系,构建POI节点与聚合点节点之间的第一子关系边;根据聚合点与服务关键词的所属关系,构建聚合点节点与关键词节点之间的第二子关系边。
可以理解的是,在POI异构信息网络中引入聚合点节点以及第一子关系边和第二子关系边,从而在需要进行已有聚合点所包含的POI节点添加时,仅需在现有POI异构信息网络的基础上,根据POI与聚合点的所属关系,建立POI节点与聚合点节点之间的第一关系边,无需再次进行聚合点节点与关键词节点之间关系边的构建,提高了POI异构信息网络的更新效率。
参见图5所示的另一种POI异构信息网络示意图,为了为服务关联数据确定结果的丰富性和全面性奠定基础,在进行POI异构信息网络构建时,在一个可选实施例中,还引入了第二子关系边的第二边属性和聚合关系边的聚合边属性。
示例性地,在进行POI异构信息网络构建时,还包括以下操作:根据候选POI的共现关系,构建候选POI所属聚合点的聚合点节点之间的聚合关系边;根据聚合关系边所连接的聚合点之间的连通数据,确定聚合边属性;根据第二子关系边所连接的服务关键词在所连接聚合点的聚合评论数据的贡献度,确定第二边属性。相应的,根据预先构建的POI异构信息网络,确定目标POI的服务关联数据,还包括:根据第一子关系边和第二子关系边,分别确定目标POI关联的目标聚合点节点和目标关键词节点;根据各目标聚合点节点之间的聚合边属性,确定目标POI的聚合类型的服务关联数据;根据聚合点节点与目标关键词节点之间的第二边属性,确定目标POI的异节点类型的服务关联数据。
可以理解的是,通过在POI异构信息网络中引入聚合节点之间的聚合关系边、聚合关系边的聚合边属性、以及第二子关系边的第二边属性,为聚合类型和异节点类型的服务关联数据的确定,提供了数据支撑,从而获取到能够在聚合点层面进行目标POI表征的聚合类型的服务关联数据,以及在以及聚合点和功能服务交互层面进行目标POI表征的异节点类型的服务关系数据,提高了服务关联数据的丰富性和全面性,为POI表征数据确定结果的准确度的提高奠定了基础,进而为POI竞争关系确定结果的准确度提供了保障。
在一实施例中,根据聚合关系边所连接的聚合点之间的连通数据,确定聚合边属性,可以是:确实聚合关系边所连接的聚合点之间元路径数量;根据元路径数量,确定聚合边属性;其中,元路径为聚合关系边所连接的聚合点,经由候选POI的POI节点和/或POI节点间的POI关系边所连通的路径;其中,POI关系边根据各候选POI的共现关系构建。
其中,聚合边属性用于表征聚合关系边所连接的聚合点之间的关联强度。其中,聚合边属性的属性值越大,则表明聚合关系边所连接的聚合点之间的关联强度越强;聚合边属性的属性值越小,则表明聚合关系边所连接的聚合点之间的关联强度越弱。可以理解的是,通过引入聚合边属性,能够对聚合点之间的关联强度进行量化,进一步丰富了服务关联数据中的信息量,从而提高了POI表征数据所携带内容的丰富性和全面性,进而为POI竞争关系确定结果的准确度提供了保障。
可选的,根据元路径数量,确定聚合边属性,可以是:直接将元路径数量作为聚合点属性。
由于元路径数量与POI节点数量相关,当聚合点节点所连接的POI节点较多,也即聚合点所包含的候选POI数量较多时,将会导致聚合点之间关联强度较弱,但聚合点属性的属性值数值却较大的情况,进而对最终确定的POI竞争关系的准确度带来影响。为了避免上述情况的发生,可选的,根据元路径数量,确定聚合边属性,还可以是:确定聚合关系边所连接的各聚合点具备第一子关系边的候选POI的POI数量;根据元路径数量和POI数量,确定聚合边属性。
示例性地,确定聚合关系边所连接的各聚合点具备第一子关系边的候选POI的POI数量;通过各POI数量对元路径数量进行标准化,将标准化结果作为聚合点属性的属性值。
具体的,确定各POI数量的平方根的乘积,得到标准化因子;确定元路径数量与标准化因子的比值,将比值作为聚合点属性的属性值。
S202、根据各目标POI的服务关联数据,确定目标POI之间的POI表征数据。
在一个可选实施例中,根据各目标POI的服务关联数据,确定目标POI之间的POI表征数据,可以是:根据服务关联数据,确定POI服务表征;根据各目标POI的服务表征,确定目标POI之间的POI表征数据。
示例性地,根据服务关联数据,确定POI服务表征,可以是:采用设定特征提取网络,分别提取各目标POI的服务关联数据中的POI服务表征。其中,设定特征提取网络中的网络参数可以通过大量样本数据训练得到。该特征提取网络可以采用诸如神经网络等机器学习模型或深度学习模型加以实现,本申请对该特征提取网络的网络结构不做任何限定。
在另一可选实施例中,根据各目标POI的服务关联数据,确定目标POI之间的POI表征数据,可以是:根据服务类型的服务关联数据,确定POI服务表征;根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据。
示例性地,根据服务关联数据,确定POI服务表征,可以是:采用设定特征提取网络,分别提取各目标POI的服务关联数据中的POI服务表征。其中,设定特征提取网络中的网络参数可以通过大量样本数据训练得到。可选的,可以采用图卷积网络对图3或图4所示的POI异构信息网络进行特征提取,得到POI服务表征。可选的,图卷积网络可以基于R-GCN(Relational graph convolutional network,关系图卷积网络)加以实现。需要说明的是,本申请实施例对图卷积层网络的数量不做任何限定,例如,可以采用至少两个级联的图卷积网络形成网络组,通过网络组对图3或图4所示的POI异构信息网络进行特征提取,得到POI服务表征。
在又一可选实施例中,根据各目标POI的服务关联数据,确定目标POI之间的POI表征数据,可以是:根据服务类型的服务关联数据和异节点类型的服务关联数据,确定POI服务表征;根据聚合类型的服务关联数据和异节点类型的服务关联数据,确定POI聚合表征;根据POI聚合表征,更新POI服务表征;根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据。
示例性地,根据服务关联数据,确定POI服务表征,可以是:采用设定特征提取网络中的服务表征提取模块,提取各目标POI的服务关联数据中的POI服务表征,以及采用设定特征提取网络中的聚合表征提取模块,提取各目标POI的服务关联数据中的POI聚合表征;采用POI聚合表征对POI服务表征进行更新。其中,设定特征提取网络中的网络参数可以通过大量样本数据训练得到。可选的,可以采用图卷积网络对图5所示的POI异构信息网络进行特征提取,得到POI服务表征和POI聚合表征。可选的,图卷积网络可以基于R-GCN网络加以实现。需要说明的是,本申请实施例对图卷积层网络的数量不做任何限定,例如,可以采用至少两个级联的图卷积网络形成网络组,通过网络组对图5所示的POI异构信息网络进行特征提取,得到POI服务表征和POI聚合表征。
示例性地,根据服务类型的服务关联数据和异节点类型的服务关联数据,确定POI服务表征,可以是:分别根据服务类型的服务关联数据和异节点类型的服务关联数据,确定服务邻接矩阵和第一异节点邻接矩阵;对服务邻接矩阵和第一异节点邻接矩阵进行处理,得到POI服务表征。
具体的,可以分别对服务类型的服务关联数据和异节点类型的服务关联数据进行正则化处理,得到服务邻接矩阵和第一异节点邻接矩阵。其中,异节点类型的服务关联数据可以是与服务类型不同的聚合类型的服务关联数据。根据图卷积层网络中的服务表征提取模块对服务邻接矩阵和第一异节点邻接矩阵进行处理,得到POI服务表征。其中,正则化处理可以采用拉普拉斯正则化方式,或现有技术中的其他正则化方式中的任意一种,本申请实施例对此不做任何限定。
示例性地,根据聚合类型的服务关联数据和异节点类型的服务关联数据,确定POI聚合表征,可以是:分别根据聚合类型的服务关联数据和异节点类型的服务关联数据,确定聚合邻接矩阵和第二异节点邻接矩阵;对聚合邻接矩阵和第二异节点邻接矩阵进行处理,得到POI聚合表征。
具体的,可以分别对聚合类型的服务关联数据和异节点类型的服务关联数据进行正则化处理,得到聚合邻接矩阵和第二异节点邻接矩阵。其中,异节点类型的服务关联数据可以是与聚合类型不同的服务类型的服务关联数据。根据图卷积层网络中的聚合表征提取模块对聚合邻接矩阵和第二异节点邻接矩阵进行处理,得到POI聚合表征。其中,正则化处理可以采用拉普拉斯正则化方式,或现有技术中的其他正则化方式中的任意一种,本申请实施例对此不做任何限定。
上述技术方案完善了POI服务表征和POI聚合表征的确定机制,为后续进行POI表征数据的确定提供了数据支撑,进而为POI竞争关系的确定奠定了基础。
上述各可选实施例的技术方案,通过对包含有不能内容结构的服务关联数据,采用不同的确定方式进行POI服务表征的确定,为POI表征数据的确定奠定了基础,同时实现了POI表征数据确定方式的多样性,完善了POI表征数据的确定机制,为POI竞争关系的确定,提供了可靠的数据支撑。
可选的,根据POI聚合表征,更新POI服务表征,可以是:按照设定顺序将POI聚合表征和POI服务表征拼接融合,以更新POI表征数据。
或者可选的,根据POI聚合表征,更新POI服务表征,可以是:根据一个目标POI的POI聚合表征和另一目标POI的POI服务表征,确定注意力权重;根据注意权重对另一目标POI的POI服务表征进行加权,以更新POI服务表征。
在一个可选实施例中,根据POI聚合表征和POI服务表征,确定注意力权重,可以是:确定一个目标POI的POI聚合表征和另一目标POI的POI服务表征的余弦相似度;根据余弦相似度确定注意力权重。例如,可以直接将余弦相似度作为注意力权重,还可以对余弦相似度进行标准化,并将标准化后得到的余弦相似度作为注意力权重。
需要说明的是,上述技术方案在进行一个目标POI的注意力权重过程中,引入另一目标POI的POI聚合表征,能够将另一目标POI在聚合层面对该一个目标POI的影响区别对待,强化影响力较强的POI服务表征,弱化影响力较弱的POI服务表征,从而使得最终确定的该一个目标POI的服务表征中,所携带的语义特征与该另一目标POI关联性较强,进而使得后续确定的POI表征数据能够更加准确的体现POI之间的竞争关系,为POI竞争关系确定结果的准确度的进一步提高,奠定了基础。
在上述各实施例的技术方案的基础上,根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据,可以是:将目标POI的POI服务表征进行拼接融合,得到目标POI之间的POI表征数据,用于进行目标POI之间的竞争关系的确定。
需要说明的是,由于不同目标POI所提供的功能服务的种类不同,相应的服务关联数据的大小不同,进而导致最终确定的POI服务表征的数据长度不同。而直接将数据长度不同的两个POI服务表征进行拼接融合,将会由于POI服务表征拼接先后顺序的不同,将会出现数据不对称的问题,导致后续竞争关系确定结果的稳定性较差。为了提高后续竞争关系确定结果的稳定性,可选的,根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据,还可以引入平均全连接层,对各目标POI的POI服务表征进行处理,以消除POI服务表征的不对称问题。其中,POI服务表征中的网络参数可以通过大量样本数据训练得到。
示例性地,引入平均全连接层,对各目标POI的POI服务表征进行处理,可以是:根据第一顺序将各目标POI的POI服务表征进行融合,得到第一融合数据;根据第二顺序将各目标POI的POI服务表征进行融合,得到第二融合数据;其中,第一顺序和第二顺序相反;根据第一融合数据和第二融合数据,确定POI表征数据。
可以理解的是,通过将两个POI服务表征采用顺序拼接融合和逆序拼接融合的方式,进行第一融合数据和第二融合数据的确定,进而根据第一融合数据和第二融合数据进行POI表征数据的确定,忽略了目标POI的POI服务表征的先后顺序,因此也消除了不同目标POI的POI服务表征的不对称情况,从而为后续竞争关系确定结果的稳定性的提高,奠定了基础。
S203、根据POI表征数据,确定目标POI之间的竞争关系。
本申请实施例的技术方案,将服务关联数据确定操作,细化为根据预先构建额POI异构信息网络,确定目标POI的服务关联数据;其中POI异构信息网络通过如下方式构建:提取多个候选POI的评论数据的服务关键词;根据各候选POI的共现关系以及服务关键词的相似关系,构建POI异构信息网络,从而能够利用POI异构信息网络这一先验知识,进行服务关联数据的辅助确定,无需进行服务关联数据的实时计算,减少了服务关联数据确定时的数据运算量,同时提高了服务关联数据的确定效率,进而提高了POI竞争关系的确定效率。
为了进一步提高POI竞争关系确定结果的准确度,在一个可选实施例中,在进行POI表征数据确定过程中,还引入了与POI属性层面的表征数据。参见图6所示的一种兴趣点竞争关系确定方法,包括:
S301、根据目标POI的评论数据的相似关系,确定服务关联数据。
S302、根据服务关联数据,确定POI服务表征。
S303、根据目标POI的空间分布热图,确定目标POI的空间热度表征。
其中,空间分布热图用于表征目标POI的受欢迎程度。
示例性地,可以根据目标POI的周围区域所分布POI的特征,进行目标POI的空间分布热图的构建。
可选的,目标POI的周围区域所分布POI的特征,可以是目标POI的周围区域所分布POI的热度特征。其中,热度特征可以是POI的访问热度、搜索热度、实际光顾热度和点击热度等中的至少一种。其中,访问热度用于表征用户对POI的访问频次,访问频次越高,访问热度越高。搜索热度用于表征用户对POI的搜索频次,搜索频次越高,搜索热度越高。实际光顾热度用于表征用户实际光顾目标POI的频次,实际光顾POI的频次越高,实际光顾热度越高。点击热度用于表征用户对POI进行点击查看的频次,用户对POI进行点击查看的频次越高,点击热度越高。本申请实施例并不对POI的热度特征的具体特征类型进行限定。相应的,空间分布热图可以是包括目标POI周围区域中各邻居POI热度的空间分布情况,也即,空间分布热图可以反应POI周围区域的空间分布数据。
示例性地,可以将目标POI的周围区域划为空间网格,将每个空间网络中所分布POI的设定特征进行统计;根据目标POI设定区域范围内空间网格所分布POI的设定特征统计值,构建目标POI的空间分布热图。其中,设定区域范围可以由技术人员根据需要或经验值进行确定,或通过大量试验反复确定。其中,设定特征统计值可以是热度统计值。
在本申请实施例中,针对每个目标POI,均可以根据该目标POI的周围区域所分布POI的热度特征,构建该POI对应的空间分布热图。空间分布热图可以是基于POI类别的多通道热图。由此可见,本申请实施例中的空间分布热图可以充分体现各POI丰富的空间特征。
在一个可选实施例中,根据目标POI的空间分布热图,确定目标POI的空间热度表征,可以是:基于设定学习模型,根据目标POI的空间分布热图,确定POI的空间热度表征。其中,设定学习模型可以是对图数据进行学习的模型,如图神经网络模型等,本申请实施例并不对设定学习模型的具体类型进行限定。
S304、根据包括目标POI的POI关系图,确定目标POI的区域聚合表征;其中,POI关系图基于多个候选POI的共现关系构建。
其中,POI关系图可以表征各候选POI之间的共现关系,该共现关系可以理解为至少两个候选POI在相同时间段内被用户共同搜索或共同到访。相应的,共现关系可以通过用户搜索数据、用户到访数据和POI空间距离等中的至少一种确定。
可选的,可以根据用户搜索数据,确定第一设定时间段内用户共同搜索的至少两个候选POI之间具备共现关系;或者可选的,可以根据用户到访数据,确定第二设定时间段内用户共同到访的至少两个候选POI之间具备共现关系;或者可选的,可以根据POI空间分布数据,确定POI空间距离小于设定距离阈值的两个候选POI之间具备共现关系。其中,第一设定时间段、第二设定时间段和设定距离阈值可以由技术人员根据需要或经验值进行确定,还可以通过大量试验反复确定。其中,第一设定时间段和第二设定时间段时长可以相同或不同。
为了降低噪声干扰,同时减少后续所构建的POI异构信息网络的规模,还可以对共现关系进行筛选。可选的,针对共同搜索所确定的共现关系,可以设定搜索次数阈值,将小于搜索次数阈值的共现关系删除;或者可选的,针对共同到访所确定的共现关系,可以设定到访次数阈值,将小于到访次数阈值的共现关系删除。其中,搜索次数阈值或到访次数阈值可以由技术人员根据需要或经验值进行确定,还可以通过大量试验反复确定。
在一个具体的例子中,可以通过向量(pi,pj,wij)表示pi和pj这两个POI在设定时间间隔Δt时间内被所有用户检索了wij次。在最初构建POI关系图时,可以设置检索次数上限阈值θm,当wijm时,表明pi和pj两个POI之间存在共现关系,即可添加pi和pj之间的关系边。例如,可以设置θm=0。也即,只要pi和pj两个POI在设定时间间隔Δt时间内被用户检索,即可表明pi和pj两个POI之间存在共现关系,并构建对应的关系边。同时,为了降低噪声干扰和减小POI关系图的规模,还可以设置检索次数下限阈值θn来过滤关联程度比较弱的POI关系。如果wijn,则在最终的POI关系图中删除pi和pj之间的关系边。例如,可以设置θn="5",也即,如果wij的数值小于5,则表明pi和pj之间的关联程度比较弱,此时可以删除pi和pj之间的关系边。
上述方案中,通过设置检索次数阈值对POI关系图进行更新,可以有效降低噪声干扰和POI关系图的规模,从而提高POI关系图的可靠性和精准性。
在一可选实施例中,根据包括目标POI的POI关系图,确定目标POI的区域聚合表征,可以是:基于设定学习模型,根据POI关系图,确定目标POI的区域聚合表征。其中,设定学习模型可以是对图数据进行学习的模型,如图神经网络模型等,本申请实施例并不对设定学习模型的具体类型进行限定。其中,设定学习模型可以与空间热度表征确定所采用的学习模型相同或不同,或者,本实施例所涉及的设定学习模型与孔家耐热度表征确定所采用的设定学习模型为相同模型中的不同模块。
示例性地,根据包括目标POI的POI关系图,确定目标POI的区域聚合表征,可以是:将目标POI周围设定区域划分为多个空间子区域;确定各空间子区域中目标POI的邻居POI集合;根据邻居POI集合中各邻居POI与目标POI之前的边连接关系,确定各空间子区域中目标POI的区域聚合表征;根据各空间子区域中目标POI的区域聚合表征,确定目标POI在目标POI周围设定区域的区域聚合表征。
可以理解的是,通过引入POI关系图进行目标POI的区域聚合表征的确定,使得所确定的POI空间聚合表征中包含了与目标POI具备边连接关系的邻居POI的关联信息,从而使区域聚合表征中携带了目标POI的区域空间信息。
在本申请的一个可选实施例中,在构建各POI的POI关系图之后,还可以包括:根据POI关系图中各POI的类别,将POI关系图拆分为扩散子图和关联子图;其中,扩散子图中通过关系边相连的POI之间的类别不同;关联子图中通过关系边相连的POI之间的类别相同。
可以理解的是,POI的类别是POI的重要属性。不同类别POI之间的共现关系往往表示互补性质的关联关系。比如商场和餐厅A,两者属于不同的类别。如果商场和餐厅A存在共现关系,说明用户去逛商场和去餐厅A是有依存关联的。而相同类别POI之间的共现的关系往往表示潜在的竞争关联。比如餐厅A和餐厅B,两者属于相同类别。如果餐厅A和餐厅B存在共现关系,说明用户在去餐厅消费时会在餐厅A和餐厅B两个POI之间进行竞争选择。所以,在本申请实施例中,可以POI关系图中各POI的类别,将POI关系图拆分为扩散子图和关联子图。其中,扩散子图的所有关系边都是不同类别POI之间的关联,关联子图的所有关系边都是相同类别POI之间的关联。
将POI关系图拆分为扩散子图和关联子图,能够进一步明确存在依存关联和竞争关联的POI,从而对各POI之间的关联关系进行细化,能够提高学习样本的精准性,从而提高学习模型的POI表征学习效果。
S305、根据目标POI的相对位置数据,确定目标POI的相对位置表征。
其中,相对位置数据可以表征目标POI之间的空间依赖关系。
示例性地,相对位置数据可以采用以下方式加以确定:根据目标POI的设定空间范围内的邻居POI与目标POI的相对位置在经纬度方向上分别编码,得到经度向量和维度向量;将经度向量和维度向量拼接融合,得到相对位置数据。
可选在一个可选实施例中的,根据目标POI的相对位置数据,确定目标POI的相对位置表征,可以是:根据相对位置数据,确定各邻居POI对目标POI的注意力权重;根据注意力权重,对各邻居POI的区域聚合表征和/或空间热度表征进行聚合,得到相对位置表征。
可以理解的是,通过引入相对位置数据,能够在POI空间相对位置层面处理POI的聚合,解决了直接编码经纬度等特征学习能力的不足,充分挖掘了POI的距离依赖特征和地域分布特征,提高了POI相对位置表征的性能。
S306、根据空间热度表征、区域聚合表征和相对位置表征中的至少一种,确定目标POI的POI空间表征。
示例性地,将空间热度表征、区域聚合表征和相对位置表征中的至少一种,按照设定顺序进行拼接融合,得到目标POI的POI空间表征,用于反映目标POI在POI层面上的关联性。其中,拼接顺序可以由技术人员根据需要或经验值进行确定。
S307、根据各目标POI的POI空间表征和POI服务表征,确定目标POI之间的POI表征数据。
示例性地,可以针对每个目标POI,将该目标POI的POI空间表征和POI服务表征拼接融合,得到融合表征数据;将各目标POI的融合表征数据再次进行拼接融合,得到POI表征数据。
需要说明的是,在针对每个目标POI进行拼接融合得到融合表征数据时,本申请实施例对拼接融合的先后顺序不做任何限定,进步保证不同目标POI的拼接顺序相同即可。在确定POI表征数据过程中,对各目标POI的融合表征数据的拼接顺序不做任何限定。
S308、根据POI表征数据,确定目标POI之间的竞争关系。
对POI表征数据进行处理,得到竞争关系的预测概率;若预测概率大于设定概率阈值,则表明目标POI之间具备竞争关系;若预测概率不大于设定概率阈值,则表征目标POI之间不具备竞争关系。其中,设定概率阈值可以由技术人员根据需要或经验值进行确定,或通过大量试验反复确定。
本申请实施例通过在进行POI表征数据确定过程中,引入基于空间分布热图确定的空间热度表征、基于POI关系图确定的区域聚合表征和基于相对位置数据确定的相对位置表征中的至少一种,进而进行POI空间表征的确定,从而在POI表征数据中引入POI层面的空间位置关联数据,提高了POI表征数据中携带内容的丰富性和全面性,为提高POI竞争关系确定结果准确度的提高奠定了基础。
参见图7,本申请实施例在上述各技术方案的基础上,还提供了一种优选实施方式。
如图7所示的一种兴趣点竞争关系确定过程示意图,包括:POI异构信息网络构建阶段410、竞争关系确定模型训练阶段420和竞争关系确定模型使用阶段430,并结合图8所示的POI竞争关系预测框架示意图和图9所示的POI异构信息网络示意图,进行说明。
示例性地,POI异构信息网络构建阶段410,包括POI空间分布热图构建411、POI连接图构建412和服务连接图构建413。
示例性地,POI空间分布热图构建411,包括:根据POI空间分布数据,确定POI空间分布热图。
具体的,定义兴趣点pi周围的空间分布热图Mi∈RC×L×L来表示区域周围的空间分布特征。Mi是大小为C×L×L的张量,表示有C个基于标签类别的热图通道,每个标签通道对应的热图是如图9中(a)图所示的二维矩阵,其中,L标识空间范围的网格数。其中,标签类别可以是根据POI的功能属性或行业标准,对各POI进行类别划分后得到的类别。
具体构建方式可以是:以每个POI为中心将其周围的区域按照一定大小(如500m×500m)进行网格划分,共有L×L个网格。在每个网格统计该周围区域的区域空间Sk内每个标签类别c对应的POI的综合热度作为该网格对应的矩阵元素值
示例性地,可以采用以下公式进行矩阵元素值的确定:
其中,fhot(pt)标识兴趣点pt的热度值;tag(pt)=c限制选择所有标签类型为c的POI,具体实现中采用max-pooling(最大池化)作为区域空间内的聚合方法,当然还可以采用其他池化函数作为区域空间内的聚合方法,本申请实施例对此不做任何限定。
示例性地,POI连接图构建412,包括:基于用户在地图类应用中的地图搜索数据,构建POI连接图。
可选的,根据地图搜索数据,确定POI之间的共现关系,其中共现关系可以采用以下方式定义:若两个POI在设定时间段内被相同用户搜索,则确定两个POI之间具备共现关系。需要说明的是,本申请示例性给出了以共同搜索(Co-search)关系进行共现关系的呈现,当然还可以通过共同访问(Co-visit)或其他用户行为活动对共现关系加以表征,本申请实施例对此不做任何限定。
在一具体实现方式中,用(pi,pj,wij)表示pi和pj这两个POI在设定时间段Δt内被所有用户搜索了wij次。为了降低噪声干扰和减小POI连接图的规模,还可以预先设置阈值θm过滤关联程度比较弱的POI关系:如果wijm,则删除pi和pj之间的边。根据以上过程可以构建出图9中(b)图所示的POI连接图。其中,θm可以由技术人员根据需要或经验值进行设定。
进一步地,由于标签是POI的重要属性。不同类别POI之间的共现关系往往表示互补性质的关联,比如商场和餐厅(两者属于不同的标签类别)存在关系,说明用户去逛商场和用餐是有依存关联的。而相同类别POI之间的共现关系表示潜在的竞争关联,比如快餐店A和快餐店B(两者属于相同标签)存在关系说明用户在去快餐店消费时会在两个POI之间进行竞争选择。所以,基于POI标签可以将POI连接图划分为两个子图:POI扩散图(diffusiongraph)和POI关联图(affinity graph)。POI扩散图的所有关系边都是不同标签类别POI之间的关联,POI关联图的所有关系变都是相同标签类别POI之间的关联。
示例性地,服务连接图构建413,包括:根据用户评论数据,构建服务连接图。
可选的,每个POI都对应一个品牌,由于很多很多POI的评论数据很少(可能只有几条),难以准确描述POI,并且文本评论的内容绝大部分是针对品牌的功能服务(包括商品服务和体验服务),因此我们把同属于一个品牌的POI用户评论数据聚合在一起构成一篇品牌文档,描述品牌的语义特征。品牌文档由多个词构成,其中,能够体现出品牌的功能服务的关键词即为服务关键词,因此需要从文档中挖掘出有价值的服务关键词。
在一具体实现方式中,可以使用TF-IDF抽取了得分最高的k个词作为品牌的服务关键词,即建立了品牌和服务关键词之间的品牌-服务边关系,并将TF-IDF的值作为边属性。
需要说明的是,本申请实施例仅示例性给出采用TF-IDF对品牌文档中的服务关键词的筛选,还可以采用现有技术中其他重要性参数替代TF-IDF加以实现,本申请实施例对此不做任何限定。
此外,服务关键词之间也存在关联关系,在评论数据中共现频率越高的服务关联性就越强,例如汉堡和薯条经常会一起在评论中出现。
在一具体实现方式中,可以使用PMI计算各POI所提取的服务关键词之间的语义相似度;根据语义相似度构建服务关键词之间的服务边关系,并将语义相似度作为边属性。
具体的,针对两个服务关键词a1和a2,采用以下公式进行PMI计算:
其中,p(a)表示服务关键词a在品牌文档中的出现次数。
为了降低噪声干扰和减小服务连接图的规模,还可以预先设置阈值θPMI来过滤关联度比较低的服务关系边:如果两个服务关键词a1和a2的PMI(a1,a2)<θPMI,则删除a1和a2之间的边。根据以上过程可以构建出图9中(d)图所示的服务关系图。其中,θPMI可以由技术人员根据需要或经验值进行设定。
此外,品牌之间也存在关联关系,但是从品牌文档或POI的评论数据中难以提取出品牌关系。
示例性地,可以根据POI连接图和POI与品牌之间的关系,定义元路径,并根据元路径进行品牌边关系的构建,得到图9中(c)图所示的品牌关系图。
参见图9中(b)图,根据定义一个元路径Φ:其中,b表示品牌节点;p表示POI节点,Rpb表示POI和品牌之间的所属关系,Rpp表示POI之间的共现关系。
为了便于描述对品牌之间关联关系的强弱,还可以采用以下公式进行品牌bi和品牌bj之间的联系强度进行计算,并将联系强度作为品牌边属性:
其中,s(bi,bj)表示联系强度,符号表示从bi到bj的路径/>满足定义的元路径Φ,/>表示品牌节点bi的POI数量,用于标准化联系强度。
将构建的品牌关系图、服务关系图以及品牌和服务之间的连接边所形成的图,作为服务连接图。
综上,将POI异构信息网络构建阶段410所构建的POI空间分布热图、POI连接图和服务连接图,统称为POI异构信息网络。
示例性地,竞争关系确定模型训练阶段420,包括:基于POI异构信息网络和POI之间的竞争关系标签值,对深度学习网络中的网络参数进行训练。
参见图10所示的基于图神经网络的深度学习模型实现的竞争关系预测模型,包括SA-GNN(Spatial adaptive graph neural network,基于空间自适应的图神经网络)模块、PKE(POI Knowledge Extraction,POI知识抽取)模块和预测模块。
在一个可选实施例中,参见图11所示的基于SA-GNN的POI空间表征确定过程示意图,基于POI连接图(包括POI扩散图和POI关联图)和空间分布热图,对POI空间表征进行学习。其中,POI空间表征包括与POI扩散图对应的POI空间扩散表征和与POI关联图对应的POI空间关联表征。
在一个可选实施例中,采用图12所示的RA Conv(Relation-aware AspectConvolution,关系感知层面卷积)对服务关系图进行POI知识表征提取。其中,RA Conv网络能够识别服务关系图中三种不同关系:品牌关系(brand-brand)、品牌-服务关系(brand-aspect)和服务关系(aspect-aspect)。其中,可以采用至少两个RA Conv进行级联的方式进行深度特征提取。以l表示RA Conv的级联层数,则可以采用以下方式确定第l层的服务表征和品牌表征:
其中,和/>分别表示第l层的服务表征和品牌表征,/>表示aspect-aspect关系的拉普拉斯正则化的邻接矩阵,表示为/>其中,Da为服务关键词节点(aspect节点)的邻居数量,Aa为aspect节点的度矩阵,IN为单位矩阵。同理,/>和/>分别表示brand-brand和aspect-brand关系的拉普拉斯正则化的邻接矩阵,计算方法与/>类似。/>表示与aspect节点具备边连接的aspect邻居节点集合、/>表示与品牌(brand)节点具备边连接的brand邻居节点集合、/>表示与aspect节点具备边连接的brand邻居节点集合或与brand节点具备边连接的aspect邻居节点集合。W、Wa、Wb和Wt为待学习网络参数。
其中,σ()为ReLU激活函数,当然还可以采用其他激活函数实现,本申请实施例对此不做任何限定。
需要说明的是,第1层的输入数据为对aspect节点对应的服务关键词或brand节点对应的品牌进行编码后得到的词向量,编码可以采用word2Vect等方式加以实现,本申请实施例不做任何限定。
经过RA Conv学习得到每个POI节点的服务表征和品牌表征,一对POI对应得到一对品牌表征bi和bj,并且两个品牌对应两个列表的服务表征和/>由于bi对bj中每个服务表征的影响力存在差异,因此还可以在进行POI知识表征确定时,引入注意力机制,确定一个品牌bi对另一个品牌bj中每个服务表征的注意力权重。
示例性地,可以采用以下公式计算余弦相似度:
根据余弦相似度确定bj对bi中各服务表征的注意力权重:
最终,采用以下公式确定属于品牌bi的POI节点的POI知识表征ai
属于品牌bj的POI节点的POI知识表征aj的确定方式与ai类似,在此不再赘述。
进一步地,采用全连接层将两个POI的POI知识表征ai和aj融合,得到POI知识表征对。
考虑到直接拼接POI知识表征ai和aj,存在由于拼接先后顺序的问题导致POI知识表正对存在不对称的问题,进而影响模型精度,因此在使用全连接层对POI知识表征ai和aj融合时,采用平均全连接层gs(e1,e2),以消除不对称的影响:
其中,Wg为待学习的网络参数。
具体的,将POI知识表征ai和aj输入至平均全连接层,得到POI知识表征对ai,j
ai,j=gs(ai,aj)。
由于针对每个POI,通过竞争关系确定模型的SA-GNN模块得到了POI空间扩散表征和POI空间关联表征/>同样采用前述平均全连接层得到POI空间表征对:
其中,Wt为待学习的网络参数。
在上述技术方案的基础上,根据POI知识表征对ai,j和POI空间表征对pi,j,对两POI之间的竞争关系进行预测,得到预测概率:
其中,为预测结果,sigmoid()为激活函数,Wo为待学习的网络参数。
引入目标损失函数对竞争关系预测网络中的网络参数进行调整。在一个具体实施例中,目标损失函数可以采用如下交叉熵损失函数:
其中,表示POI竞争关系训练样本数据,yi,j为竞争关系标签值。具体的,若存在竞争关系,则标签值可以是1;不存在竞争关系,则标签值可以是0。
示例性地,竞争关系确定模型使用阶段430,包括:获取两个目标POI的空间分布热图、POI连接图和服务连接图中的POI标识;采用训练好的竞争关系预测模型,对目标POI之间的竞争关系进行预测。其中,POI连接图和服务连接图分别属于训练过程所采用的POI连接图和服务连接图的子图,也即在训练过程中所采用的POI连接图和服务连接图中,均包含有两个目标POI。
本申请实施例结合POI所属品牌的评论数据的语义信息(服务表征)和POI的空间特征,进行POI竞争关系预测,相较于传统人工经验方法进行竞争关系预测,投入的人力成本较低,不依赖于领域知识,同时确定效率较高,可以有效量化竞争关系,便于长期分析应用。另外,基于深度学习模型进行竞争关系的自动化确定,泛化能力较强,能够有效避免噪声数据的影响,从空间分布和POI所属品牌的功能服务等多角度进行竞争关系的全面分析,提高了竞争关系确定结果的准确度。
作为上述各实施例所示的兴趣点竞争关系确定方法的实现,本申请实施例还提供了一种兴趣点竞争关系确定装置,参见图13,该兴趣点竞争关系确定装置500,包括:POI表征数据确定模块501和竞争关系确定模块502。其中,
POI表征数据确定模块501,用于根据两个目标兴趣点POI的服务关联数据,确定目标POI之间的POI表征数据;
竞争关系确定模块502,用于根据POI表征数据,确定目标POI之间的竞争关系。
本申请实施例通过在进行目标POI之间的竞争关系的确定过程中,引入基于目标POI之间的POI表征数据,使得POI表征数据中携带了目标POI在服务层面相关联的隐含表征。由于服务层面相关联的隐含表征能够反映出目标POI之间的竞争关系,例如所提供服务相同或近似,因此基于服务层面相关联的隐含表征,进行目标POI之间的竞争关系的确定,提高了竞争关系确定结果的准确度。另外,采用POI表征数据确定的方式,替代传统人工经验确定或统计确定的方式,无需投入大量的时间成本和人力成本,提高了目标POI之间的竞争关系确定的时间效率。
进一步地,POI表征数据确定模块501,包括:
服务关联数据确定单元,用于根据目标POI的评论数据的相似关系,确定服务关联数据;
POI表征数据确定单元,用于根据各目标POI的服务关联数据,确定目标POI之间的POI表征数据。
进一步地,服务关联数据确定单元,包括:
服务关联数据确定子单元,用于根据预先构建的POI异构信息网络,确定目标POI的服务关联数据;
其中,POI异构信息网络通过如下方式构建:提取多个候选POI的评论数据的服务关键词;根据各候选POI的共现关系以及服务关键词的相似关系,构建POI异构信息网络。
进一步地,装置还包括POI异构信息网络构建模块,具体包括:
服务关键词提取单元,用于提取多个候选POI的评论数据的服务关键词;
POI异构信息网络构建单元,用于根据各候选POI的共现关系以及服务关键词的相似关系,构建POI异构信息网络;
服务关键词提取单元,包括:
聚合评论数据获取子单元,用于获取候选POI的聚合点关联的聚合评论数据;
服务关键词提取子单元,用于提取聚合评论数据中的服务关键词。
进一步地,POI异构信息网络构建单元,包括:
服务关系边构建子单元,用于根据服务关键词的相似关系,构建服务关键词的关键词节点之间的服务关系边;
第一关系边构建子单元,用于根据候选POI和服务关键词所属聚合点的一致性,构建该候选POI的POI节点与该服务关键词的关键词节点之间的第一关系边;
服务边属性确定子单元,用于根据服务关系边所连接的服务关键词之间的相似性,确定服务边属性;
服务关联数据确定子单元,包括:
目标关键词节点确定从单元,用于根据POI异构信息网络中的第一关系边和服务关系边,确定目标POI关联的目标关键词节点;
服务类型数据确定从单元,用于根据各目标关键词节点之间的服务边属性,确定目标POI的服务类型的服务关联数据。
进一步地,第一关系边构建子单元,包括:
第一子关系边构建从单元,用于根据候选POI与聚合点的所属关系,构建POI节点与聚合点节点之间的第一子关系边;
第二子关系边构建从单元,用于根据聚合点与服务关键词的所属关系,构建聚合点节点与关键词节点之间的第二子关系边。
进一步地,POI异构信息网络构建单元,还包括:
聚合关系边构建子单元,用于根据候选POI的共现关系,构建候选POI所属聚合点的聚合点节点之间的聚合关系边;
聚合边属性构建子单元,用于根据聚合关系边所连接的聚合点之间的连通数据,确定聚合边属性;
第二边属性确定子单元,用于根据第二子关系边所连接的服务关键词在所连接聚合点的聚合评论数据的贡献度,确定第二边属性;
服务关联数据确定子单元,还包括:
节点确定从单元,用于根据第一子关系边和第二子关系边,分别确定目标POI关联的目标聚合点节点和目标关键词节点;
聚合类型数据确定从单元,用于根据各目标聚合点节点之间的聚合边属性,确定目标POI的聚合类型的服务关联数据;
异节点类型数据确定从单元,用于根据聚合点节点与目标关键词节点之间的第二边属性,确定目标POI的异节点类型的服务关联数据。
进一步地,服务边属性确定子单元,包括:
语义相似度确定从单元,用于确定服务关系边所连接的服务关键词之间的语义相似度;
服务边属性确定从单元,用于将语义相似度作为服务边属性。
进一步地,聚合边属性构建子单元,包括:
元路径数量确定从单元,用于确实聚合关系边所连接的聚合点之间元路径数量;
聚合边属性确定从单元,用于根据元路径数量,确定聚合边属性;
其中,元路径为聚合关系边所连接的聚合点,经由候选POI的POI节点和/或POI节点间的POI关系边所连通的路径;
其中,POI关系边根据各候选POI的共现关系构建。
进一步地,聚合边属性确定从单元,包括:
POI数量确定甲从单元,用于确定聚合关系边所连接的各聚合点具备第一子关系边的候选POI的POI数量;
聚合边属性确定甲从单元,用于根据元路径数量和POI数量,确定聚合边属性。
进一步地,服务关键词提取单元,包括:
贡献度确定子单元,用于对聚合评论数据进行分词,并确定各分词结果的贡献度;
服务关键词筛选子单元,用于根据贡献度排序结果,筛选分词结果中的服务关键词。
进一步地,POI异构信息网络构建单元,还包括:
服务关系边过滤子单元,用于过滤相似性不满足相似度阈值的服务关系边。
进一步地,POI表征数据确定单元,包括:
POI服务表征确定甲子单元,用于根据服务关联数据,确定POI服务表征;
POI表征数据确定子单元,用于根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据。
进一步地,POI表征数据确定单元,包括:
POI服务表征确定乙子单元,用于根据服务类型的服务关联数据,确定POI服务表征;
POI表征数据确定子单元,用于根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据。
进一步地,POI表征数据确定单元,包括:
POI服务表征确定丙子单元,用于根据服务类型的服务关联数据和异节点类型的服务关联数据,确定POI服务表征;
POI聚合表征确定丙子单元,用于根据聚合类型的服务关联数据和异节点类型的服务关联数据,确定POI聚合表征;
POI服务表征更新丙子单元,用于根据POI聚合表征,更新POI服务表征;
POI表征数据确定子单元,用于根据各目标POI的POI服务表征,确定目标POI之间的POI表征数据。
进一步地,所述POI服务表征确定丙子单元,包括:
服务邻接矩阵确定丙从单元,用于分别根据所述服务类型的服务关联数据和所述异节点类型的服务关联数据,确定服务邻接矩阵和第一异节点邻接矩阵;
POI服务表征得到丙从单元,用于对所述服务邻接矩阵和所述第一异节点邻接矩阵进行处理,得到所述POI服务表征;
所述POI聚合表征确定丙子单元,包括:
聚合邻接矩阵确定丙从单元,用于分别根据所述聚合类型的服务关联数据和所述异节点类型的服务关联数据,确定聚合邻接矩阵和第二异节点邻接矩阵;
POI聚合表征得到丙从单元,用于对所述聚合邻接矩阵和所述第二异节点邻接矩阵进行处理,得到所述POI聚合表征。
进一步地,POI服务表征更新丙子单元,包括:
POI服务表征更新丙从单元,用于根据POI聚合表征确定注意力权重,并根据注意力权重对POI服务表征进行加权,以更新POI服务表征。
进一步地,POI表征数据确定子单元,包括:
第一融合数据得到从单元,用于根据第一顺序将各目标POI的POI服务表征进行融合,得到第一融合数据;
第二融合数据得到从单元,用于根据第二顺序将各目标POI的POI服务表征进行融合,得到第二融合数据;其中,第二顺序和第一顺序相反;
POI表征数据确定从单元,用于根据第一融合数据和第二融合数据,确定POI表征数据。
进一步地,POI表征数据确定子单元,包括:
空间热度表征确定从单元,用于根据目标POI的空间分布热图,确定目标POI的空间热度表征;
区域聚合表征确定从单元,用于根据包括目标POI的POI关系图,确定目标POI的区域聚合表征;其中,POI关系图基于多个候选POI的共现关系构建;
相对位置表征确定从单元,用于根据目标POI的相对位置数据,确定目标POI的相对位置表征;
POI空间表征确定从单元,用于根据空间热度表征、区域聚合表征和相对位置表征中的至少一种,确定目标POI的POI空间表征;
POI表征数据确定从单元,用于根据各目标POI的POI空间表征和POI服务表征,确定目标POI之间的POI表征数据。
上述兴趣点竞争关系确定装置可执行本发明任意实施例所提供的兴趣点竞争关系确定方法,具备执行兴趣点竞争关系确定方法相应的功能模块和有益效果。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图14所示,是实现本申请实施例的兴趣点竞争关系确定方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图14所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图14中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的兴趣点竞争关系确定方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的兴趣点竞争关系确实方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的兴趣点竞争关系确定方法对应的程序指令/模块(例如,附图13所示的POI表征数据确定模块501和竞争关系确定模块502)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的兴趣点竞争关系确定方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储实现兴趣点竞争关系确实方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至实现兴趣点竞争关系确定方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现兴趣点竞争关系确定方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图14中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与实现兴趣点竞争关系确定方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
根据本申请实施例的技术方案,通过在进行目标POI之间的竞争关系的确定过程中,引入基于目标POI之间的POI表征数据,使得POI表征数据中携带了目标POI在服务层面相关联的隐含表征。由于服务层面相关联的隐含表征能够反映出目标POI之间的竞争关系,例如所提供服务相同或近似,因此基于服务层面相关联的隐含表征,进行目标POI之间的竞争关系的确定,提高了竞争关系确定结果的准确度。另外,采用POI表征数据确定的方式,替代传统人工经验确定或统计确定的方式,无需投入大量的时间成本和人力成本,提高了目标POI之间的竞争关系确定的时间效率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
需要说明的是,本申请实施例涉及热人工智能技术,是研究使用计算机来模拟人的某些思维过程和智能学习(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语义处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

Claims (18)

1.一种兴趣点竞争关系确定方法,包括:
根据预先构建的兴趣点POI异构信息网络,确定两个目标POI的服务关联数据;
根据各所述目标POI的所述服务关联数据,确定所述目标POI之间的POI表征数据;
根据所述POI表征数据,确定所述目标POI之间的竞争关系;
其中,所述POI异构信息网络通过如下方式构建:
提取多个候选POI的评论数据的服务关键词;
根据各所述候选POI的共现关系以及所述服务关键词的相似关系,构建所述POI异构信息网络;
其中,所述根据各所述候选POI的共现关系以及所述服务关键词的相似关系,构建所述POI异构信息网络,包括:
根据服务关键词的相似关系,构建服务关键词的关键词节点之间的服务关系边;
根据服务关键词与候选POI之间的所属关系,构建候选POI的POI节点与服务关键词的关键词节点之间的第一关系边;
根据服务关系边所连接的服务关键词之间的相似性,确定服务边属性;
其中,所述根据预先构建的兴趣点POI异构信息网络,确定两个目标POI的服务关联数据,包括:
根据POI异构信息网络中的第一关系边,确定目标POI关联的目标关键词节点;
根据各目标关键词节点之间的服务边属性,确定目标POI的服务类型的服务关联数据;
其中,所述根据服务关系边所连接的服务关键词之间的相似性,确定服务边属性,包括:
采用如下公式,确定所述服务关系边所连接的服务关键词之间的语义相似度,并将所述语义相似度作为所述服务边属性;
其中,p(a i)表示服务关键词a i在品牌文档中的出现次数;为服务关键词a 1a 2之间的语义相似度;
其中,所述品牌文档为属于相同品牌的候选POI的评论数据的聚合结果。
2.根据权利要求1所述的方法,其中,所述提取多个候选POI的评论数据的服务关键词,包括:
获取所述候选POI的聚合点关联的聚合评论数据;
提取所述聚合评论数据中的服务关键词。
3.根据权利要求2所述的方法,其中,所述提取所述聚合评论数据中的服务关键词,包括:
对所述聚合评论数据进行分词,并确定各分词结果的贡献度;
根据贡献度排序结果,筛选所述分词结果中的服务关键词。
4.根据权利要求1所述的方法,其中,所述方法还包括:
过滤所述相似性不满足相似度阈值的服务关系边。
5.根据权利要求1所述的方法,其中,所述根据各所述目标POI的所述服务关联数据,确定所述目标POI之间的POI表征数据,包括:
根据所述服务关联数据,确定POI服务表征;
根据各所述目标POI的所述POI服务表征,确定所述目标POI之间的POI表征数据。
6.根据权利要求1所述的方法,其中,所述根据各所述目标POI的所述服务关联数据,确定所述目标POI之间的POI表征数据,包括:
根据所述服务类型的服务关联数据,确定POI服务表征;
根据各所述目标POI的所述POI服务表征,确定所述目标POI之间的POI表征数据。
7.根据权利要求5或6所述的方法,其中,所述根据各所述目标POI的所述POI服务表征,确定所述目标POI之间的POI表征数据,包括:
根据第一顺序将各所述目标POI的所述POI服务表征进行融合,得到第一融合数据;
根据第二顺序将各所述目标POI的所述POI服务表征进行融合,得到第二融合数据;其中,所述第二顺序和所述第一顺序相反;
根据所述第一融合数据和所述第二融合数据,确定所述POI表征数据。
8.根据权利要求1-6任一项所述的方法,其中,所述根据各所述目标POI的所述POI服务表征,确定所述目标POI之间的POI表征数据,包括:
根据所述目标POI的空间分布热图,确定所述目标POI的空间热度表征;
根据包括所述目标POI的POI关系图,确定所述目标POI的区域聚合表征;其中,所述POI关系图基于多个候选POI的共现关系构建;
根据所述目标POI的相对位置数据,确定所述目标POI的相对位置表征;
根据所述空间热度表征、所述区域聚合表征和所述相对位置表征中的至少一种,确定所述目标POI的POI空间表征;
根据各所述目标POI的所述POI空间表征和所述POI服务表征,确定所述目标POI之间的POI表征数据。
9.一种兴趣点竞争关系确定装置,包括:
POI表征数据确定模块中的服务关联数据确定单元,用于根据预先构建的兴趣点POI异构信息网络,确定两个目标POI的服务关联数据;
所述POI表征数据确定模块中的POI表征数据确定单元,用于根据各所述目标POI的所述服务关联数据,确定所述目标POI之间的POI表征数据;
竞争关系确定模块,用于根据所述POI表征数据,确定所述目标POI之间的竞争关系;
其中,所述装置还包括POI异构信息网络构建模块,具体包括:
服务关键词提取单元,用于提取多个候选POI的评论数据的服务关键词;
POI异构信息网络构建单元,用于根据各所述候选POI的共现关系以及所述服务关键词的相似关系,构建所述POI异构信息网络;
其中,所述POI异构信息网络构建单元,具体用于:
根据服务关键词的相似关系,构建服务关键词的关键词节点之间的服务关系边;根据服务关键词与候选POI之间的所属关系,构建候选POI的POI节点与服务关键词的关键词节点之间的第一关系边;根据服务关系边所连接的服务关键词之间的相似性,确定服务边属性;
其中,所述服务关联数据确定单元,具体用于:
根据POI异构信息网络中的第一关系边,确定目标POI关联的目标关键词节点;根据各目标关键词节点之间的服务边属性,确定目标POI的服务类型的服务关联数据;
其中,所述POI异构信息网络构建单元,在执行“根据服务关系边所连接的服务关键词之间的相似性,确定服务边属性”时,具体用于:
采用如下公式,确定所述服务关系边所连接的服务关键词之间的语义相似度,并将所述语义相似度作为所述服务边属性;
其中,p(a i)表示服务关键词a i在品牌文档中的出现次数;为服务关键词a 1a 2之间的语义相似度;
其中,所述品牌文档为属于相同品牌的候选POI的评论数据的聚合结果。
10.根据权利要求9所述的装置,其中,所述服务关键词提取单元,包括:
聚合评论数据获取子单元,用于获取所述候选POI的聚合点关联的聚合评论数据;
服务关键词提取子单元,用于提取所述聚合评论数据中的服务关键词。
11.根据权利要求10所述的装置,其中,所述服务关键词提取单元,包括:
贡献度确定子单元,用于对所述聚合评论数据进行分词,并确定各分词结果的贡献度;
服务关键词筛选子单元,用于根据贡献度排序结果,筛选所述分词结果中的服务关键词。
12.根据权利要求9所述的装置,其中,所述POI异构信息网络构建单元,还包括:
服务关系边过滤子单元,用于过滤所述相似性不满足相似度阈值的服务关系边。
13.根据权利要求9所述的装置,其中,所述POI表征数据确定单元,包括:
POI服务表征确定甲子单元,用于根据所述服务关联数据,确定POI服务表征;
POI表征数据确定子单元,用于根据各所述目标POI的所述POI服务表征,确定所述目标POI之间的POI表征数据。
14.根据权利要求9所述的装置,其中,所述POI表征数据确定单元,包括:
POI服务表征确定乙子单元,用于根据所述服务类型的服务关联数据,确定POI服务表征;
POI表征数据确定子单元,用于根据各所述目标POI的所述POI服务表征,确定所述目标POI之间的POI表征数据。
15.根据权利要求13或14所述的装置,其中,所述POI表征数据确定子单元,包括:
第一融合数据得到从单元,用于根据第一顺序将各所述目标POI的所述POI服务表征进行融合,得到第一融合数据;
第二融合数据得到从单元,用于根据第二顺序将各所述目标POI的所述POI服务表征进行融合,得到第二融合数据;其中,所述第二顺序和所述第一顺序相反;
POI表征数据确定从单元,用于根据所述第一融合数据和所述第二融合数据,确定所述POI表征数据。
16.根据权利要求9-14任一项所述的装置,其中,所述POI表征数据确定子单元,包括:
空间热度表征确定从单元,用于根据所述目标POI的空间分布热图,确定所述目标POI的空间热度表征;
区域聚合表征确定从单元,用于根据包括所述目标POI的POI关系图,确定所述目标POI的区域聚合表征;其中,所述POI关系图基于多个候选POI的共现关系构建;
相对位置表征确定从单元,用于根据所述目标POI的相对位置数据,确定所述目标POI的相对位置表征;
POI空间表征确定从单元,用于根据所述空间热度表征、所述区域聚合表征和所述相对位置表征中的至少一种,确定所述目标POI的POI空间表征;
POI表征数据确定从单元,用于根据各所述目标POI的所述POI空间表征和所述POI服务表征,确定所述目标POI之间的POI表征数据。
17. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的一种兴趣点竞争关系确定方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的一种兴趣点竞争关系确定方法。
CN202011025731.3A 2020-09-25 2020-09-25 兴趣点竞争关系确定方法、装置、设备和介质 Active CN112000763B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011025731.3A CN112000763B (zh) 2020-09-25 2020-09-25 兴趣点竞争关系确定方法、装置、设备和介质
US17/480,780 US11789985B2 (en) 2020-09-25 2021-09-21 Method for determining competitive relation of points of interest, device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011025731.3A CN112000763B (zh) 2020-09-25 2020-09-25 兴趣点竞争关系确定方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN112000763A CN112000763A (zh) 2020-11-27
CN112000763B true CN112000763B (zh) 2023-08-29

Family

ID=73474375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011025731.3A Active CN112000763B (zh) 2020-09-25 2020-09-25 兴趣点竞争关系确定方法、装置、设备和介质

Country Status (2)

Country Link
US (1) US11789985B2 (zh)
CN (1) CN112000763B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989211B (zh) * 2021-05-17 2021-08-13 北京搜狐新媒体信息技术有限公司 一种确定信息相似度的方法及系统
CN113918837B (zh) * 2021-10-15 2024-02-06 山东大学 城市兴趣点类别表示的生成方法及系统
CN114529588B (zh) * 2022-04-24 2022-07-26 中国电子科技集团公司第二十八研究所 一种基于相对位置的动目标聚合方法
CN114817774B (zh) * 2022-05-12 2023-08-22 中国人民解放军国防科技大学 确定时空共现区、非公共场所及用户社会行为关系的方法
CN118313772B (zh) * 2024-06-05 2024-08-16 四川省菜蓝子科技有限公司 一种线上线下数据联动显示方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241225A (zh) * 2018-08-27 2019-01-18 百度在线网络技术(北京)有限公司 兴趣点竞争关系挖掘方法、装置、计算机设备及存储介质
CN110119475A (zh) * 2019-01-29 2019-08-13 成都信息工程大学 一种poi推荐方法及推荐系统
CN111553279A (zh) * 2020-04-28 2020-08-18 北京百度网讯科技有限公司 兴趣点的表征学习、识别方法、装置、设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8543143B2 (en) * 2009-12-23 2013-09-24 Nokia Corporation Method and apparatus for grouping points-of-interest according to area names
US9378504B2 (en) * 2012-07-18 2016-06-28 Google Inc. Highlighting related points of interest in a geographical region
US11893543B2 (en) 2018-05-15 2024-02-06 International Business Machines Corporation Optimized automatic consensus determination for events
CN110633406B (zh) 2018-06-06 2023-08-01 北京百度网讯科技有限公司 事件专题的生成方法、装置、存储介质和终端设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241225A (zh) * 2018-08-27 2019-01-18 百度在线网络技术(北京)有限公司 兴趣点竞争关系挖掘方法、装置、计算机设备及存储介质
CN110119475A (zh) * 2019-01-29 2019-08-13 成都信息工程大学 一种poi推荐方法及推荐系统
CN111553279A (zh) * 2020-04-28 2020-08-18 北京百度网讯科技有限公司 兴趣点的表征学习、识别方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Competitive Analysis for Points of Interest;Shuangli Li et al;《KDD’20》;全文 *

Also Published As

Publication number Publication date
CN112000763A (zh) 2020-11-27
US11789985B2 (en) 2023-10-17
US20220075808A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
CN112000763B (zh) 兴趣点竞争关系确定方法、装置、设备和介质
JP7222022B2 (ja) 情報検索方法、装置、設備、記憶媒体、及びプログラム
CN111931067B (zh) 兴趣点推荐方法、装置、设备和介质
CN111522967B (zh) 知识图谱构建方法、装置、设备以及存储介质
CN111708876B (zh) 生成信息的方法和装置
CN111091006B (zh) 一种实体意图体系的建立方法、装置、设备和介质
CN111553279B (zh) 兴趣点的表征学习、识别方法、装置、设备及存储介质
KR102487040B1 (ko) 아이템 유사도를 모델링하고 아이템 정보를 상관시키기 위한 시스템 및 방법
US20180253653A1 (en) Rich entities for knowledge bases
CN113656698B (zh) 兴趣特征提取模型的训练方法、装置和电子设备
JP7242994B2 (ja) ビデオイベント識別方法、装置、電子デバイス及び記憶媒体
CN114357197B (zh) 事件推理方法和装置
CN114357105A (zh) 地理预训练模型的预训练方法及模型微调方法
CN112765452B (zh) 搜索推荐方法、装置及电子设备
CN118297741A (zh) 一种异质社会信息网络智能数据服务方法
CN112115387B (zh) 兴趣点poi推荐模型的训练方法、装置和电子设备
US11645563B2 (en) Data filtering with fuzzy attribute association
CN116309002B (zh) 图数据存储、访问、处理方法、训练方法、设备及介质
CN114329231A (zh) 对象特征处理方法、装置、电子设备及存储介质
CN114547416A (zh) 一种媒体资源排序方法及电子设备
CN114547417B (zh) 一种媒体资源排序方法及电子设备
CN115935027B (zh) 目标对象拓扑图的数据处理方法及图分类模型的训练方法
CN115795023B (zh) 文档推荐方法、装置、设备以及存储介质
CN117131197B (zh) 一种招标书的需求类别处理方法、装置、设备及存储介质
CN116932913A (zh) 一种信息推送方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant