CN111429200A - 一种内容关联方法及装置、存储介质、计算机设备 - Google Patents

一种内容关联方法及装置、存储介质、计算机设备 Download PDF

Info

Publication number
CN111429200A
CN111429200A CN202010112593.6A CN202010112593A CN111429200A CN 111429200 A CN111429200 A CN 111429200A CN 202010112593 A CN202010112593 A CN 202010112593A CN 111429200 A CN111429200 A CN 111429200A
Authority
CN
China
Prior art keywords
content
target
platform
category
content category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010112593.6A
Other languages
English (en)
Other versions
CN111429200B (zh
Inventor
方思维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Koubei Network Technology Co Ltd filed Critical Zhejiang Koubei Network Technology Co Ltd
Priority to CN202010112593.6A priority Critical patent/CN111429200B/zh
Publication of CN111429200A publication Critical patent/CN111429200A/zh
Application granted granted Critical
Publication of CN111429200B publication Critical patent/CN111429200B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种内容关联方法及装置、存储介质、计算机设备,该方法包括:从关联平台对应的关键特征词中提取出中心特征词;获取所述关联平台对应的内容属性标签中与所述中心特征词相匹配的目标标签;根据所述关联平台对应的第一内容类目与所述内容属性标签的映射关系,确定所述目标标签对应的关联内容类目;基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目。本申请解决了现有技术中由于缺乏用户历史数据目标平台的运营缺乏数据支撑的问题,利用关联平台对目标平台的目标内容类目为目标平台的运营提供了重要的数据支持,从而有助于提高目标平台的竞争力,提高目标平台的用户留存率。

Description

一种内容关联方法及装置、存储介质、计算机设备
技术领域
本申请涉及互联网技术领域,尤其是涉及到一种内容关联方法及装置、存储介质、计算机设备。
背景技术
随着互联网技术的不断发展进步,越来越多的用户的购物、信息浏览等行为习惯于在线上进行,这也就促使了更多软件的衍生,以购物类软件为例,一款新的购物软件在为用户进行商品推荐时,由于没有用户的历史浏览、搜索等数据作为支持,商品推荐往往很难进行,只能向用户推荐商家近期重点销售的主打商品,但所推荐的主打商品并不一定符合用户的期望,容易导致推荐效果较差,不利于用户留存。
但是,目前已经投入使用的购物类软件数量已经很多,用户在其他购物类软件上的历史浏览、搜索等数据在一定程度上能够体现出用户的购物偏好,若能够基于其他软件的历史数据为当前软件提供推荐依据,有助于更好的提高软件的数据推荐效果,提升软件的竞争力。
发明内容
有鉴于此,本申请提供了一种内容关联方法及装置、存储介质、计算机设备,利用关联平台对目标平台的目标内容类目为目标平台的运营提供了重要的数据支持,从而有助于提高目标平台的竞争力,提高目标平台的用户留存率。
根据本申请的一个方面,提供了一种内容关联方法,包括:
从关联平台对应的关键特征词中提取出中心特征词;
获取所述关联平台对应的内容属性标签中与所述中心特征词相匹配的目标标签;
根据所述关联平台对应的第一内容类目与所述内容属性标签的映射关系,确定所述目标标签对应的关联内容类目;
基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目。
具体地,所述从关联平台对应的关键特征词中提取出中心特征词,具体包括:
对关联平台对应的关键特征词进行聚类,得到至少一个关键特征词簇;
从任一所述关键特征词簇中抽取一个目标关键词,计算所述目标关键词与同一所述关键特征词簇中其他关键特征词的相似度;
筛选出所述相似度从大至小排序前M个和/或所述相似度大于相似度阈值的所述其他关键特征词作为所述中心特征词。
具体地,所述获取所述关联平台对应的内容属性标签中与所述中心特征词相匹配的目标标签,具体包括:
对所述中心特征词以及所述内容属性标签进行聚类,得到至少一个标签簇;
将任一所述标签簇包含的所述内容属性标签确定为与任一所述标签簇包含的所述中心特征词相匹配的所述目标标签。
具体地,所述基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目,具体包括:
查找所述目标平台对应的第二内容类目中与所述关联内容类目一致的类目,将一致的类目确定为所述关联平台对所述目标平台的目标内容类目。
具体地,所述基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目之后,所述方法还包括:
获取所述目标平台的内容列表,其中,所述内容列表包括所述目标平台提供的内容与所述第二内容类目的对应关系;
按照所述内容列表以及所述目标内容类目,输出与所述目标内容类目对应的目标内容。
具体地,所述从关联平台对应的关键特征词中提取出中心特征词之前,所述方法还包括:
获取目标时间段中所述关联平台对应的搜索特征词;
统计每个所述搜索特征词的搜索次数,并筛选出所述搜索次数从多至少排序前N个和/或所述搜索次数大于搜索次数阈值的所述搜索特征词作为所述关键特征词。
具体地,所述基于所述中心特征词与所述关联平台对应的内容属性标签之间的匹配度,从所述内容属性标签中筛选出与所述中心特征词相匹配的目标标签之前,所述方法还包括:
获取所述关联平台的内容列表,其中,所述内容列表包括所述关联平台提供的每一条内容以及与每一条所述内容对应的个体内容属性标签;
提取与每一条所述内容对应的个体内容属性标签,并对所述个体内容属性标签进行去重处理得到所述关联平台对应的所述内容属性标签。
根据本申请的另一方面,提供了一种内容关联装置,包括:
中心特征词提取模块,用于从关联平台对应的关键特征词中提取出中心特征词;
目标标签获取模块,用于获取所述关联平台对应的内容属性标签中与所述中心特征词相匹配的目标标签;
关联内容类目确定模块,用于根据所述关联平台对应的第一内容类目与所述内容属性标签的映射关系,确定所述目标标签对应的关联内容类目;
目标内容类目确定模块,用于基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目。
具体地,所述中心特征词提取模块,具体包括:
关键特征词聚类单元,用于对关联平台对应的关键特征词进行聚类,得到至少一个关键特征词簇;
相似度计算单元,用于从任一所述关键特征词簇中抽取一个目标关键词,计算所述目标关键词与同一所述关键特征词簇中其他关键特征词的相似度;
中心特征词筛选单元,用于筛选出所述相似度从大至小排序前M个和/或所述相似度大于相似度阈值的所述其他关键特征词作为所述中心特征词。
具体地,所述目标标签获取模块,具体包括:
标签簇聚类单元,用于对所述中心特征词以及所述内容属性标签进行聚类,得到至少一个标签簇;
目标标签确定单元,用于将任一所述标签簇包含的所述内容属性标签确定为与任一所述标签簇包含的所述中心特征词相匹配的所述目标标签。
具体地,所述目标内容类目确定模块,具体用于:
查找所述目标平台对应的第二内容类目中与所述关联内容类目一致的类目,将一致的类目确定为所述关联平台对所述目标平台的目标内容类目。
具体地,所述装置还包括:
内容-类目列表获取模块,用于基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目之后,获取所述目标平台的内容列表,其中,所述内容列表包括所述目标平台提供的内容与所述第二内容类目的对应关系;
目标内容输出模块,用于按照所述内容列表以及所述目标内容类目,输出与所述目标内容类目对应的目标内容。
具体地,所述装置还包括:
搜索特征词获取模块,用于从关联平台对应的关键特征词中提取出中心特征词之前,获取目标时间段中所述关联平台对应的搜索特征词;
特征关键词筛选模块,用于统计每个所述搜索特征词的搜索次数,并筛选出所述搜索次数从多至少排序前N个和/或所述搜索次数大于搜索次数阈值的所述搜索特征词作为所述关键特征词。
具体地,所述装置还包括:
内容-标签列表获取模块,用于基于所述中心特征词与所述关联平台对应的内容属性标签之间的匹配度,从所述内容属性标签中筛选出与所述中心特征词相匹配的目标标签之前,获取所述关联平台的内容列表,其中,所述内容列表包括所述关联平台提供的每一条内容以及与每一条所述内容对应的个体内容属性标签;
标签去重模块,用于提取与每一条所述内容对应的个体内容属性标签,并对所述个体内容属性标签进行去重处理得到所述关联平台对应的所述内容属性标签。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述内容关联方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述内容关联方法。
借由上述技术方案,本申请提供的一种内容关联方法及装置、存储介质、计算机设备,利用关联平台的关键特征词,首先,减少特征词数据量并提取出差异化较大的中心特征词,其次,根据关联平台后台预设的内容属性标签以及内容属性标签与内容类目之间的映射关系,确定与中心特征词所对应的目标标签及其关联内容类目,以利用类目来表征关联平台中所反映出的用户行为偏好,最后,基于关联内容类目以及目标平台对应的内容类目,实现了关联平台向目标平台的内容关联。本申请实现了以关联平台的用户数据为依据向目标平台进行内容关联,解决了现有技术中由于缺乏用户历史数据目标平台的运营缺乏数据支撑的问题,利用关联平台对目标平台的目标内容类目为目标平台的运营提供了重要的数据支持,从而有助于提高目标平台的竞争力,提高目标平台的用户留存率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种内容关联方法的流程示意图;
图2示出了本申请实施例提供的另一种内容关联方法的流程示意图;
图3示出了本申请实施例提供的一种内容关联装置的结构示意图;
图4示出了本申请实施例提供的另一种内容关联装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种内容关联方法,如图1所示,该方法包括:
步骤101,从关联平台对应的关键特征词中提取出中心特征词。
本申请实施例提供的内容关联方法可以适用于多种场景,例如,手机天猫等购物类软件场景、口碑等带有店铺点评的生活推荐类软件场景、虾米音乐等视听类软件场景、以及可以提供新闻信息等内容的信息类软件场景等等。将一个或者多个平台的用户历史使用数据进行整合分析,从而为目标平台的数据推荐提供依据,这里获取用户历史使用数据的一个或多个平台可以成为关联平台,本申请实施例旨在解决如何将在关联平台中获取到的用户历史使用数据转换为目标平台的数据推荐依据。
在上述实施例中,关联平台所对应的关键特征词可以包括用户在一个或多个关联平台上输入的搜索词、点击的推荐词等等,一般来说,在对目标平台进行内容关联时,会选用用户使用量较大、产生关键特征词较多的平台,对于一个使用较为成熟的关联平台来说,关键特征词数据量较大,并且其中可能存在很多相似度较高的关键特征词,为了适当减少关键特征词的数据量以及尽量避免选用很多相似度较高的关键特征词数据,以提高内容关联的效率,需要先进行中心特征词的提取,从关键特征词中筛选出最能够体现特征词差异并且相似度较低的特征词,从而利用这部分中心特征词来代表关联平台的用户历史使用数据,以便后续对目标平台进行内容关联。
步骤102,获取关联平台对应的内容属性标签中与中心特征词相匹配的目标标签。
在上述实施例中,一般来说关联平台为了方便对用户的分析,平台在前台中所提供、展示的每个内容的背后都对应有后台为其贴上的内容属性标签,从而便于分析用户在前台的每一个搜索、点击动作都体现了用户对哪些标签的内容感兴趣,因此,获取到关联平台的中心特征词以后,就可以进一步挖掘出中心特征词所对应的内容属性标签来确定用户的兴趣偏好,以便更好的将关联平台中能体现用户偏好的数据关联到目标平台中。
本申请实施例以购物类软件场景为例进行阐述,但本申请实施例不限于该场景,购物软件内涵盖的商品(即内容),后台都会对其贴上商品属性标签(即内容属性标签),例如肌底液A,带有三个商品属性标签,分别为“女性”、“美妆”、“修复肌肤”,眼影B,带有三个商品属性标签,分别为“女性”、“眼部美容”、“美妆”。在获取到关联平台对应的中心特征词以后,可以基于这些中心特征词,分别计算每一个中心特征词与每个商品属性标签的匹配度,从而找出与每个中心特征词匹配度最高的一个或几个商品属性标签作为与该中心特征词对应的目标标签,这样就可以将关联平台的中心特征词转换为目标标签,从而用目标标签来反应关联平台所对应的用户历史使用数据特征。
步骤103,根据关联平台对应的第一内容类目与内容属性标签的映射关系,确定目标标签对应的关联内容类目。
在上述实施例中,可以进一步的利用关联平台后台设置的商品类目(即第一内容类目)与商品属性标签之间的对应关系,来挖掘目标标签所对应的商品类目。具体可以将中心特征词对应的商品属性标签再和相应关联平台的商品类目表中进行匹配,商品类目表中一个商品属性标签对应着若干个商品,不同商品对应着若干个商品类目,比如标签“眼部美容”对应有2个商品“眼影A”和“眼影B”,“眼影A”不仅可以当做眼影使用,还可以当做高光使用,“眼影A”对应于两个商品类目,分别是“眼部美妆”和“脸部美妆”,那么就可以先找出“眼部美容”标签对应的关联内容类目“眼部美妆”和“脸部美妆”,然后再按照上述方法继续查找“眼影B”对应的类目。通过上述步骤可以实现将关联平台对应的关键特征词转换为关联内容类目,在进行不同平台之间的内容关联时,通常会选用品类较为相似的平台进行关联,平台之间的内容类目相似度较高,因此利用类目来表征关联平台的用户历史特征更有助于向目标平台的内容关联。
步骤104,基于关联内容类目筛选目标平台对应的第二内容类目,得到关联平台对目标平台的目标内容类目。
在上述实施例中,利用关联平台对应的关联内容类目来表征用户在关联平台上所反映出的购物偏好,基于关联内容类目可以从目标平台提供的全部的第二内容类目筛选出用户偏好的目标内容类目。例如关联内容类目包括A、B,目标平台提供的第二内容类目包括A、B、C、D,那么可以从中筛选出A和B作为目标内容类目,以实现关联平台向目标平台的内容关联,即用户的偏好为A和B两个类目,在后续的推荐商品选取、商品推荐位置设计等工作中可以重点突出A和B两个类目,更好的为目标平台留存用户,提高目标平台竞争力。
通过应用本实施例的技术方案,利用关联平台的关键特征词,首先,减少特征词数据量并提取出差异化较大的中心特征词,其次,根据关联平台后台预设的内容属性标签以及内容属性标签与内容类目之间的映射关系,确定与中心特征词所对应的目标标签及其关联内容类目,以利用类目来表征关联平台中所反映出的用户行为偏好,最后,基于关联内容类目以及目标平台对应的内容类目,实现了关联平台向目标平台的内容关联。本申请实施例实现了以关联平台的用户数据为依据向目标平台进行内容关联,解决了现有技术中由于缺乏用户历史数据目标平台的运营缺乏数据支撑的问题,利用关联平台对目标平台的目标内容类目为目标平台的运营提供了重要的数据支持,从而有助于提高目标平台的竞争力,提高目标平台的用户留存率。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种内容关联方法,如图2所示,该方法包括:
步骤201,获取目标时间段中关联平台对应的搜索特征词。
在上述实施例中,从关联平台对应的用户历史使用数据中,提取出目标时间段所对应的搜索特征词,其中,目标时间段可以为关联平台创建开始到当前时间中的任意一段时间,当然,为了保证关联内容的时效性和合理性,目标时间段可以设置为以当前时间为终点向前一个月或其他任意一段时间长度,而获取到的与目标时间段对应的搜索特征词主要是指用户在关联平台上手动输入或者从推荐词中选择的能够充分反应用户主观搜索意愿的词条,使得获取到的搜索特征词可以更好的反应用户的偏好,以保证后续关联内容时用户对所关联的内容符合用户兴趣偏好。
步骤202,统计每个搜索特征词的搜索次数,并筛选出搜索次数从多至少排序前N个和/或搜索次数大于搜索次数阈值的搜索特征词作为关键特征词。
统计每个搜索特征词的出现次数,即搜索特征词对应的搜索次数,取搜索次数最多的前N个,或者搜索次数大于预先设置的搜索次数阈值的搜索特征词,或者搜索次数占全部搜索特征词的搜索次数比例超过特定比例阈值的搜索特征词,或者满足以上条件的任意组合的搜索特征词作为关键特征词,对用户的个别或少数搜索行为产生的搜索特征词进行删减,更好的反应大部分用户的搜索偏好。
步骤203,对关联平台对应的关键特征词进行聚类,得到至少一个关键特征词簇。
步骤204,从任一关键特征词簇中抽取一个目标关键词,计算目标关键词与同一关键特征词簇中其他关键特征词的相似度。
步骤205,筛选出相似度从大至小排序前M个和/或相似度大于相似度阈值的其他关键特征词作为中心特征词。
在步骤203至步骤205中,提供了一种从关键特征词中提取中心特征词的方法,具体来说,首先,对关键特征词进行聚类,将关键特征词划分为若干个关键特征词簇,聚类过程中可以设置每个簇中包含的元素最小数量,以保证每个关键特征词簇中至少包含若干个关键特征词,然后,对于每个关键特征词簇来说,在簇中随机取一个关键特征词作为目标关键词,计算该簇中其他的关键特征词与目标关键词的相似度,最后,基于目标关键词与其他的关键特征词之间的相似度来确定中心特征词,可以选取相似度最高的前M个,或者相似度大于预先设置的相似度阈值的关键特征词,或者满足这两个条件的关键特征词都选取,或者同时满足这两个条件的关键特征词。通过上述的中心特征词的提取,可以进一步减少内容关联的数据量以及提取关键数据,提高内容关联效率以及准确性。
步骤206,对中心特征词以及内容属性标签进行聚类,得到至少一个标签簇。
步骤207,将任一标签簇包含的内容属性标签确定为与任一标签簇包含的中心特征词相匹配的目标标签。
在步骤206和步骤207中,提供了一种提取中心特征词对应的目标标签的方法,对中心特征词以及内容属性标签组成数据集合进行聚类,将中心特征词和内容属性标签构成的数据集合划分为若干个标签簇,对于任意一个标签簇来说,标签簇中的内容属性标签可以记为该标签簇中的中心特征词所对应的目标标签,例如一个标签簇中包含中心特征词a1、a2,内容属性标签b1、b2,那么就可以确定中心特征词a1对应的目标标签为b1、b2,中心特征词a2对应的目标标签也为b1、b2。基于上述聚类的方式,可以获取到与中心特征词相似度最高的若干个内容属性标签,并将其作为目标标签。
作为步骤206和步骤207的替代方案,提取中心特征词对应的目标标签的方法具体还可以为:计算中心特征词与关联平台对应的内容属性标签之间的匹配度;筛选出匹配度从大至小排序前Q个和/或匹配大于匹配度阈值的内容属性标签作为目标标签。
步骤208,根据关联平台对应的第一内容类目与内容属性标签的映射关系,确定目标标签对应的关联内容类目。
在上述实施例中,利用关联平台后台设置的第一内容类目与内容属性标签之间的映射关系,确定目标标签所对应的关联内容类目。
另外,本申请实施例中的内容属性标签通过下述方法获得,具体地,获取关联平台的内容列表,其中,内容列表包括关联平台提供的每一条内容以及与每一条内容对应的个体内容属性标签;提取与每一条内容对应的个体内容属性标签,并对个体内容属性标签进行去重处理得到关联平台对应的内容属性标签。
例如,一个商品A(化妆品),带有三个标签属性:女性、美妆、修复肌肤;另外一个商品B(眼影)也带有三个标签属性:女性、眼部美容、美妆;那么这两个商品A和B,拆分出来所有的标签属性有6个标签,分别是:女性、美妆、修复肌肤、女性、眼部美容、美妆,我们对其进行聚类整合(去重)之后,就是只有4个标签:女性、美妆、修复肌肤、眼部美容,以此类推,将关联平台对应的每个商品所对应的属性标签提取出来,然后进行去重处理,就可以得到该关联平台对应的全部的内容属性标签。
步骤209,查找目标平台对应的第二内容类目中与关联内容类目一致的类目,将一致的类目确定为关联平台对目标平台的目标内容类目。
在上述实施例中,找出目标平台对应的第二内容类目中与关联内容类目相同的部分,作为目标内容类目,或者分别计算每个关联内容类目与第二内容类目的相似度,取相似度最高的第二内容类目作为该目标内容类目,当然,相似度还可以满足一定的其他条件,例如不小于特定阈值(比如0.9),以确保关联平台向目标平台中关联的内容符合用户在关联平台中的搜索偏好。
步骤210,获取目标平台的内容列表,其中,内容列表包括目标平台提供的内容与第二内容类目的对应关系。
步骤211,按照内容列表以及目标内容类目,输出与目标内容类目对应的目标内容。
在步骤210和步骤211中,基于目标内容类目,可以进一步确地目标平台的推荐内容,具体来说,得到目标内容类目后,可以基于目标内容类目以及目标内容类目下包含的内容向用户进行内容推荐,例如目标内容类目为“眼部美容”,目标平台的内容列表中指示目标平台的“眼部美容”类目下包括的商品为眼影1、眼影2、眼线笔、睫毛膏等等,那么就可以向用户推荐这些符合用户偏好的商品。
当然,目标内容类目的应用不局限于内容推荐,还可以用于确定商品推荐位置等等,例如将目标内容类目下包含的商品放到更显眼的主推位置,使用户更容易看到符合其偏好的商品,增加用户的留存率,提高用户对目标平台的使用体验感,提高平台的竞争力。
通过应用本实施例的技术方案,通过对多端关联平台热搜关键词特征词及其对应的中心特征词的提取,对中心特征词与商品标签属性进行匹配,进而找到商品类目的映射关系,然后根据目标平台的内容类目表进行筛选过滤,形成最终目标平台的目标内容类目,从而实现了基于关联平台的搜索特征词向目标平台进行内容关联的效果,解决了没有历史数据作为运营参考数据的目标平台缺乏运营依据的问题,基于这个转换过程,可以快速获知特定时间段内,用户感兴趣的内容类目是什么,从而对应到目标平台对应的商品,以便运营人员知道在相应时间段内应将工作重点放在哪些内容上。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种内容关联装置,如图3所示,该装置包括:中心特征词提取模块31、目标标签获取模块32、关联内容类目确定模块33、目标内容类目确定模块34。
中心特征词提取模块31,用于从关联平台对应的关键特征词中提取出中心特征词;
目标标签获取模块32,用于获取关联平台对应的内容属性标签中与中心特征词相匹配的目标标签;
关联内容类目确定模块33,用于根据关联平台对应的第一内容类目与内容属性标签的映射关系,确定目标标签对应的关联内容类目;
目标内容类目确定模块34,用于基于关联内容类目筛选目标平台对应的第二内容类目,得到关联平台对目标平台的目标内容类目。
在具体的应用场景中,如图4所示,中心特征词提取模块31,具体包括:关键特征词聚类单元311、相似度计算单元312、中心特征词筛选单元313。
关键特征词聚类单元311,用于对关联平台对应的关键特征词进行聚类,得到至少一个关键特征词簇;
相似度计算单元312,用于从任一关键特征词簇中抽取一个目标关键词,计算目标关键词与同一关键特征词簇中其他关键特征词的相似度;
中心特征词筛选单元313,用于筛选出相似度从大至小排序前M个和/或相似度大于相似度阈值的其他关键特征词作为中心特征词。
在具体的应用场景中,如图4所示,目标标签获取模块32,具体包括:标签簇聚类单元321、目标标签确定单元322。
标签簇聚类单元321,用于对中心特征词以及内容属性标签进行聚类,得到至少一个标签簇;
目标标签确定单元322,用于将任一标签簇包含的内容属性标签确定为与任一标签簇包含的中心特征词相匹配的目标标签。
在具体的应用场景中,如图4所示,目标内容类目确定模块34,具体用于:查找目标平台对应的第二内容类目中与关联内容类目一致的类目,将一致的类目确定为关联平台对目标平台的目标内容类目。
在具体的应用场景中,如图4所示,该装置还包括:内容-类目列表获取模块35、目标内容输出模块36。
内容-类目列表获取模块35,用于基于关联内容类目筛选目标平台对应的第二内容类目,得到关联平台对目标平台的目标内容类目之后,获取目标平台的内容列表,其中,内容列表包括目标平台提供的内容与第二内容类目的对应关系;
目标内容输出模块36,用于按照内容列表以及目标内容类目,输出与目标内容类目对应的目标内容。
在具体的应用场景中,如图4所示,该装置还包括:搜索特征词获取模块37、特征关键词筛选模块38。
搜索特征词获取模块37,用于从关联平台对应的关键特征词中提取出中心特征词之前,获取目标时间段中关联平台对应的搜索特征词;
特征关键词筛选模块38,用于统计每个搜索特征词的搜索次数,并筛选出搜索次数从多至少排序前N个和/或搜索次数大于搜索次数阈值的搜索特征词作为关键特征词。
在具体的应用场景中,如图4所示,该装置还包括:内容-标签列表获取模块39、标签去重模块310。
内容-标签列表获取模块39,用于基于中心特征词与关联平台对应的内容属性标签之间的匹配度,从内容属性标签中筛选出与中心特征词相匹配的目标标签之前,获取关联平台的内容列表,其中,内容列表包括关联平台提供的每一条内容以及与每一条内容对应的个体内容属性标签;
标签去重模块310,用于提取与每一条内容对应的个体内容属性标签,并对个体内容属性标签进行去重处理得到关联平台对应的内容属性标签。
需要说明的是,本申请实施例提供的一种内容关联装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的内容关联方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2所示的方法,以及图3、图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的内容关联方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现利用关联平台的关键特征词,首先,减少特征词数据量并提取出差异化较大的中心特征词,其次,根据关联平台后台预设的内容属性标签以及内容属性标签与内容类目之间的映射关系,确定与中心特征词所对应的目标标签及其关联内容类目,以利用类目来表征关联平台中所反映出的用户行为偏好,最后,基于关联内容类目以及目标平台对应的内容类目,实现了关联平台向目标平台的内容关联。本申请实现了以关联平台的用户数据为依据向目标平台进行内容关联,解决了现有技术中由于缺乏用户历史数据目标平台的运营缺乏数据支撑的问题,利用关联平台对目标平台的目标内容类目为目标平台的运营提供了重要的数据支持,从而有助于提高目标平台的竞争力,提高目标平台的用户留存率。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种内容关联方法,其特征在于,包括:
从关联平台对应的关键特征词中提取出中心特征词;
获取所述关联平台对应的内容属性标签中与所述中心特征词相匹配的目标标签;
根据所述关联平台对应的第一内容类目与所述内容属性标签的映射关系,确定所述目标标签对应的关联内容类目;
基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目。
2.根据权利要求1所述的方法,其特征在于,所述从关联平台对应的关键特征词中提取出中心特征词,具体包括:
对关联平台对应的关键特征词进行聚类,得到至少一个关键特征词簇;
从任一所述关键特征词簇中抽取一个目标关键词,计算所述目标关键词与同一所述关键特征词簇中其他关键特征词的相似度;
筛选出所述相似度从大至小排序前M个和/或所述相似度大于相似度阈值的所述其他关键特征词作为所述中心特征词。
3.根据权利要求2所述的方法,其特征在于,所述获取所述关联平台对应的内容属性标签中与所述中心特征词相匹配的目标标签,具体包括:
对所述中心特征词以及所述内容属性标签进行聚类,得到至少一个标签簇;
将任一所述标签簇包含的所述内容属性标签确定为与任一所述标签簇包含的所述中心特征词相匹配的所述目标标签。
4.根据权利要求3所述的方法,其特征在于,所述基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目,具体包括:
查找所述目标平台对应的第二内容类目中与所述关联内容类目一致的类目,将一致的类目确定为所述关联平台对所述目标平台的目标内容类目。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目之后,所述方法还包括:
获取所述目标平台的内容列表,其中,所述内容列表包括所述目标平台提供的内容与所述第二内容类目的对应关系;
按照所述内容列表以及所述目标内容类目,输出与所述目标内容类目对应的目标内容。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述从关联平台对应的关键特征词中提取出中心特征词之前,所述方法还包括:
获取目标时间段中所述关联平台对应的搜索特征词;
统计每个所述搜索特征词的搜索次数,并筛选出所述搜索次数从多至少排序前N个和/或所述搜索次数大于搜索次数阈值的所述搜索特征词作为所述关键特征词。
7.根据权利要求1至4中任一项所述的方法,其特征在于,所述基于所述中心特征词与所述关联平台对应的内容属性标签之间的匹配度,从所述内容属性标签中筛选出与所述中心特征词相匹配的目标标签之前,所述方法还包括:
获取所述关联平台的内容列表,其中,所述内容列表包括所述关联平台提供的每一条内容以及与每一条所述内容对应的个体内容属性标签;
提取与每一条所述内容对应的个体内容属性标签,并对所述个体内容属性标签进行去重处理得到所述关联平台对应的所述内容属性标签。
8.一种内容关联装置,其特征在于,包括:
中心特征词提取模块,用于从关联平台对应的关键特征词中提取出中心特征词;
目标标签获取模块,用于获取所述关联平台对应的内容属性标签中与所述中心特征词相匹配的目标标签;
关联内容类目确定模块,用于根据所述关联平台对应的第一内容类目与所述内容属性标签的映射关系,确定所述目标标签对应的关联内容类目;
目标内容类目确定模块,用于基于所述关联内容类目筛选目标平台对应的第二内容类目,得到所述关联平台对所述目标平台的目标内容类目。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述的内容关联方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的内容关联方法。
CN202010112593.6A 2020-02-24 2020-02-24 一种内容关联方法及装置、存储介质、计算机设备 Active CN111429200B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010112593.6A CN111429200B (zh) 2020-02-24 2020-02-24 一种内容关联方法及装置、存储介质、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010112593.6A CN111429200B (zh) 2020-02-24 2020-02-24 一种内容关联方法及装置、存储介质、计算机设备

Publications (2)

Publication Number Publication Date
CN111429200A true CN111429200A (zh) 2020-07-17
CN111429200B CN111429200B (zh) 2023-04-28

Family

ID=71547050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010112593.6A Active CN111429200B (zh) 2020-02-24 2020-02-24 一种内容关联方法及装置、存储介质、计算机设备

Country Status (1)

Country Link
CN (1) CN111429200B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364247A (zh) * 2020-11-20 2021-02-12 北京五八信息技术有限公司 一种信息处理方法及装置
CN112598471A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 一种产品的推荐方法、推荐装置及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130006905A1 (en) * 2010-12-28 2013-01-03 Nhn Business Platform Corporation System and method for recommending keyword based on indirect selection
EP2605206A1 (en) * 2011-12-16 2013-06-19 France Télécom Method and system to recommend applications from an application market place to an electronic device
CN104765609A (zh) * 2015-04-03 2015-07-08 安一恒通(北京)科技有限公司 软件关联资源推荐方法、获取方法及相应的装置
CN105893440A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关联应用的推荐方法及装置
CN106469151A (zh) * 2015-08-14 2017-03-01 腾讯科技(深圳)有限公司 应用服务信息关联的方法、应用关联平台服务器和客户端
CN107092608A (zh) * 2016-04-16 2017-08-25 口碑控股有限公司 一种目标对象的搜索、推荐方法和设备
CN107402967A (zh) * 2017-06-26 2017-11-28 口碑控股有限公司 业务对象的类目更新方法、装置及设备
CN108664513A (zh) * 2017-03-31 2018-10-16 北京京东尚科信息技术有限公司 用于推送关键词的方法、装置以及设备
WO2018188460A1 (zh) * 2017-04-12 2018-10-18 腾讯科技(深圳)有限公司 数据分享方法及装置
CN109145280A (zh) * 2017-06-15 2019-01-04 北京京东尚科信息技术有限公司 信息推送的方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130006905A1 (en) * 2010-12-28 2013-01-03 Nhn Business Platform Corporation System and method for recommending keyword based on indirect selection
EP2605206A1 (en) * 2011-12-16 2013-06-19 France Télécom Method and system to recommend applications from an application market place to an electronic device
CN104765609A (zh) * 2015-04-03 2015-07-08 安一恒通(北京)科技有限公司 软件关联资源推荐方法、获取方法及相应的装置
CN106469151A (zh) * 2015-08-14 2017-03-01 腾讯科技(深圳)有限公司 应用服务信息关联的方法、应用关联平台服务器和客户端
CN105893440A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关联应用的推荐方法及装置
CN107092608A (zh) * 2016-04-16 2017-08-25 口碑控股有限公司 一种目标对象的搜索、推荐方法和设备
CN108664513A (zh) * 2017-03-31 2018-10-16 北京京东尚科信息技术有限公司 用于推送关键词的方法、装置以及设备
WO2018188460A1 (zh) * 2017-04-12 2018-10-18 腾讯科技(深圳)有限公司 数据分享方法及装置
CN109145280A (zh) * 2017-06-15 2019-01-04 北京京东尚科信息技术有限公司 信息推送的方法和装置
CN107402967A (zh) * 2017-06-26 2017-11-28 口碑控股有限公司 业务对象的类目更新方法、装置及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364247A (zh) * 2020-11-20 2021-02-12 北京五八信息技术有限公司 一种信息处理方法及装置
CN112364247B (zh) * 2020-11-20 2022-03-04 北京五八信息技术有限公司 一种信息处理方法及装置
CN112598471A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 一种产品的推荐方法、推荐装置及电子设备

Also Published As

Publication number Publication date
CN111429200B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN105808685B (zh) 推广信息的推送方法及装置
Chen et al. Visualizing market structure through online product reviews: Integrate topic modeling, TOPSIS, and multi-dimensional scaling approaches
CN103678335B (zh) 商品标识标签的方法、装置及商品导航的方法
CN107193962B (zh) 一种互联网推广信息的智能配图方法及装置
CN110457577B (zh) 数据处理方法、装置、设备和计算机存储介质
CN109492180A (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN108255316B (zh) 动态调整表情符号的方法、电子装置及计算机可读存储介质
CN105574089B (zh) 知识图谱的生成方法及装置、对象对比方法及装置
CN107590267A (zh) 基于图片的信息推送方法及装置、终端和可读存储介质
CN112733042A (zh) 推荐信息的生成方法、相关装置及计算机程序产品
CN110781307A (zh) 目标物品关键词和标题生成方法、搜索方法以及相关设备
CN111429200B (zh) 一种内容关联方法及装置、存储介质、计算机设备
CN108492160A (zh) 信息推荐方法和装置
CN104951770A (zh) 人脸图像数据库的构建方法、应用方法及相应装置
CN111105294A (zh) 一种vr导览方法、系统、客户端、服务器及其存储介质
CN112860850B (zh) 人机交互方法、装置、设备及存储介质
CN107944946B (zh) 商品标签生成方法及装置
US20220309534A1 (en) Information pushing method and electronic device utilizing method
CN110968670B (zh) 一种流行商品的属性获取方法、装置、设备及存储介质
CN110351183B (zh) 即时通讯中的资源收藏方法以及装置
CN111124209A (zh) 一种界面的显示调整方法及装置
CN112417264A (zh) 一种信息搜索的方法及装置
CN112286879B (zh) 基于元数据的数据资产构建方法及装置
CN114782125A (zh) 产品配置方法、装置、计算机设备和存储介质
CN114969427A (zh) 歌单生成方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant