CN115203395A - 基于大数据的商品关键词确定方法、装置、介质及设备 - Google Patents

基于大数据的商品关键词确定方法、装置、介质及设备 Download PDF

Info

Publication number
CN115203395A
CN115203395A CN202210873281.6A CN202210873281A CN115203395A CN 115203395 A CN115203395 A CN 115203395A CN 202210873281 A CN202210873281 A CN 202210873281A CN 115203395 A CN115203395 A CN 115203395A
Authority
CN
China
Prior art keywords
library
keyword
target
commodity
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210873281.6A
Other languages
English (en)
Inventor
田峥嵘
罗绍欢
余修方
雷德仁
刘任红
刘颖慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Guangdian Technology Co ltd
Original Assignee
Shenzhen Guangdian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Guangdian Technology Co ltd filed Critical Shenzhen Guangdian Technology Co ltd
Priority to CN202210873281.6A priority Critical patent/CN115203395A/zh
Publication of CN115203395A publication Critical patent/CN115203395A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于大数据的商品关键词确定方法、装置、介质及设备,该方法包括:通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库;对所述初始关键词库中的每个初始关键词进行模拟搜索,获取每个所述初始关键词对应的搜索商品库;分别计算每个所述搜索商品库与所述竞品库的相关度,并筛选与所述竞品库的相关度大于预设阈值的所述搜索商品库作为强相关搜索商品库;获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词。本申请有助于提升关键词的效果,供运营人员快速的推广从而提升产品流量,获得更多成交订单。

Description

基于大数据的商品关键词确定方法、装置、介质及设备
技术领域
本申请涉及数据处理技术领域,尤其是涉及到一种基于大数据的商品关键词确定方法、装置、介质及设备。
背景技术
随着跨境电商的运营越来越专业,面向的市场背景繁杂多变,拿中国在亚马逊平台运营的跨境电商企业来说,当中就有大量亚马逊卖家由以前的那种海量铺货这种盲目蹭流量的模式转而注重产品本身与客户之间的联系,深挖当地国家人们的需求,按需求进行有针对的推广,而这种深挖当地国家的需求,目前做法就是通过客户输入关键词进行搜索行为来获得客户的真实需求;而客户的搜索行为根据使用场景、颜色、属性等等会衍生出海量不同的关键词,以此逻辑类推,通常一个上架后的产品看似相关的关键词可能会有成千上万、十万、百万的关键词。而要在海量关键词中筛查出真实与产品相关的关键词来有效的推广,对于亚马逊运营人员来说非常痛苦且低效。
发明内容
有鉴于此,本申请提供了一种基于大数据的商品关键词确定方法、装置、介质及设备,有助于提升关键词的效果,供运营人员快速的推广从而提升产品流量,获得更多成交订单。
根据本申请的一个方面,提供了一种基于大数据的商品关键词确定方法,所述方法包括:
通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库;
对所述初始关键词库中的每个初始关键词进行模拟搜索,获取每个所述初始关键词对应的搜索商品库;
分别计算每个所述搜索商品库与所述竞品库的相关度,并筛选与所述竞品库的相关度大于预设阈值的所述搜索商品库作为强相关搜索商品库;
获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词。
可选地,所述通过反查工具,获取目标商品在目标平台上的竞品库和初始关键词库之后,所述方法还包括:
获取所述初始关键词库中每个初始关键词对应的第一历史购物信息,其中,所述第一历史购物信息包括所述初始关键词对应的搜索量、点击量以及出单量;
依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,其中,所述有效关键词条件包括搜索量大于预设第一阈值和/或点击量大于预设第二阈值和/或出单量大于预设第三阈值。
可选地,所述分别计算每个所述搜索商品库与所述竞品库的相关度,具体包括:
统计所述搜索商品库中命中所述竞品库的命中商品数量;
计算所述命中商品数量与所述搜索商品库的总商品数量的比值,作为所述搜索商品库与所述竞品库的相关度。
可选地,所述获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词之后,所述方法还包括:
对所述目标关键词进行分词,并重组所述目标关键词的分词得到重组关键词;
将所述重组关键词合并到所述目标关键词中,并筛选与所述目标平台提供的商品词库匹配的目标关键词;
依据筛选后的目标关键词对应的第二历史购物信息,对所述筛选后的目标关键词进行排序,并依据所述筛选后的目标关键词的排序,获取优选关键词。
可选地,所述获取所述初始关键词库中每个初始关键词对应的第一历史购物信息,具体包括:
将所述初始关键词库中的所述初始关键词划分为多个关键词筛选任务;
为每个所述关键词筛选任务建立一个线程,通过每个所述线程获取对应的关键词筛选任务包含的所述初始关键词对应的第一历史购物信息;
依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,具体包括:
通过每个所述线程,依据所述第一历史购物信息删除对应的所述关键词筛选任务中不满足有效关键词条件的初始关键词。
可选地,所述通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库之前,所述方法还包括:
建立目标商品在源平台的源竞品库以及源关键词库;
相应地,所述通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库,具体包括:
通过所述信息采集器,获取所述源竞品库中的竞品在所述目标平台上的所述竞品库以及所述源关键词库中的关键词在所述目标平台上的所述初始关键词库。
根据本申请的另一方面,提供了一种基于大数据的商品关键词确定装置,所述装置包括:
获取模块,用于通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库;
搜索模块,用于对所述初始关键词库中的每个初始关键词进行模拟搜索,获取每个所述初始关键词对应的搜索商品库;
筛选模块,用于分别计算每个所述搜索商品库与所述竞品库的相关度,并筛选与所述竞品库的相关度大于预设阈值的所述搜索商品库作为强相关搜索商品库;
确定模块,用于获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词。
可选地,所述筛选模块,还用于:
所述通过反查工具,获取目标商品在目标平台上的竞品库和初始关键词库之后,获取所述初始关键词库中每个初始关键词对应的第一历史购物信息,其中,所述第一历史购物信息包括所述初始关键词对应的搜索量、点击量以及出单量;
依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,其中,所述有效关键词条件包括搜索量大于预设第一阈值和/或点击量大于预设第二阈值和/或出单量大于预设第三阈值。
可选地,所述筛选模块,还用于:
统计所述搜索商品库中命中所述竞品库的命中商品数量;
计算所述命中商品数量与所述搜索商品库的总商品数量的比值,作为所述搜索商品库与所述竞品库的相关度。
可选地,所述装置还包括:关键词优选模块,用于:
所述获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词之后,对所述目标关键词进行分词,并重组所述目标关键词的分词得到重组关键词;
将所述重组关键词合并到所述目标关键词中,并筛选与所述目标平台提供的商品词库匹配的目标关键词;
依据筛选后的目标关键词对应的第二历史购物信息,对所述筛选后的目标关键词进行排序,并依据所述筛选后的目标关键词的排序,获取优选关键词。
可选地,所述筛选模块,还用于:
将所述初始关键词库中的所述初始关键词划分为多个关键词筛选任务;
为每个所述关键词筛选任务建立一个线程,通过每个所述线程获取对应的关键词筛选任务包含的所述初始关键词对应的第一历史购物信息;
依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,具体包括:
通过每个所述线程,依据所述第一历史购物信息删除对应的所述关键词筛选任务中不满足有效关键词条件的初始关键词。
可选地,所述获取模块,还用于:
所述通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库之前,建立目标商品在源平台的源竞品库以及源关键词库;
通过所述信息采集器,获取所述源竞品库中的竞品在所述目标平台上的所述竞品库以及所述源关键词库中的关键词在所述目标平台上的所述初始关键词库。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述商品关键词的确定方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述商品关键词的确定方法。
借由上述技术方案,本申请提供的一种基于大数据的商品关键词确定方法、装置、介质及设备,通过目标平台对应的信息采集器,获得目标商品在目标平台上的竞品库和初始关键词库,从而通过对初始关键词进行模拟搜索获得搜索商品库,基于搜索商品库与竞品库的相关度对初始关键词进行筛选,确定初始关键词中与目标商品强相关的目标关键词。本申请实施例有助于提升关键词的效果,供运营人员快速的推广从而提升产品流量,获得更多成交订单,能够帮助跨境电商运营人员突破语言障碍,通过有效的软件设计和充分利用计算机的大数据处理能力快速地帮助跨境电商运营人员获得客户的真实需求外,又能在服务器设备上极大的控制成本,同时部署方便易扩展。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种基于大数据的商品关键词确定方法的流程示意图;
图2示出了本申请实施例提供的另一种基于大数据的商品关键词确定方法的流程示意图;
图3示出了本申请实施例提供的一种软件架构示意图;
图4示出了本申请实施例提供的一种基于大数据的商品关键词确定装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种基于大数据的商品关键词确定方法,如图1所示,该方法包括:
步骤101,通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库;
本申请实施例中,预先建立目标商品在源平台的源竞品库以及源关键词库,通过信息采集器,获取源竞品库中的竞品在目标平台上的竞品库以及源关键词库中的关键词在目标平台上的初始关键词库。例如,如图2所示,跨境电商运营人员选择需要上架的产品,在运营平台获得与自己运营的产品相关的竞品(竞争对手的产品)以及与产品相关对应当地语言强相关的关键词(核心关键词),并在关键词系统创建一个项目,该项目包括运营人员输入的关键词以及竞品,即源关键词库和源竞品库。系统得到运营人员收集的部分竞品和核心关键词后,通过采集器到对应平台、第三方工具进行反向收集竞品和关键词,对源竞品库和源关键词库进行进一步的扩充,最终形成两个数据集,即初始关键词库和竞品库。此时关键词库和竞品库的数据量将会达到一定的规模,拿亚马逊跨境电商平台如果一个产品在美国站销售,那么单词量会有近20万个的(竞品相对较少一般在100到3000左右),多站点多产品的运营势必就会有数亿甚至数十亿上百亿级别的数据规模。
进一步,本申请实施例中,为减少数据量并得到效果更好的关键词,还可以对初始关键词库中的初始关键词按其对应的历史购物相关信息进行筛选,将效果差的初始关键词进行初步过滤。可选地,步骤101之后,还包括:获取所述初始关键词库中每个初始关键词对应的第一历史购物信息,其中,所述第一历史购物信息包括所述初始关键词对应的搜索量、点击量以及出单量;依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,其中,所述有效关键词条件包括搜索量大于预设第一阈值和/或点击量大于预设第二阈值和/或出单量大于预设第三阈值。
在上述实施例中,系统会将关键词按项目(一个目标产品即一个项目)进行表分区存储,并设计一套关键词数据清洗的应用服务器,对有效(有搜索量、点击量、出单量)的初始关键词进行收录,其他不相关的词进行舍弃,具体可以只保留初始关键词库中搜索量、点击量、出单量达到一定规模的初始关键词,而搜索量、点击量、出单量较少的初始关键词删除掉。
本申请实施例中,可选地,将所述初始关键词库中的所述初始关键词划分为多个关键词筛选任务;为每个所述关键词筛选任务建立一个线程,通过每个所述线程获取对应的关键词筛选任务包含的所述初始关键词对应的第一历史购物信息;通过每个所述线程,依据所述第一历史购物信息删除对应的所述关键词筛选任务中不满足有效关键词条件的初始关键词。
在该实施例中,为提升计算效率,可以通过多线程对初始关键词进行筛选,将全部初始关键词划分为多个关键词筛选任务,建立多个线程,每个线程处理一个关键词筛选任务,针对任意一个线程来说,获取自身关键词筛选任务下的初始关键词对应的第一历史购物信息,具体包括搜索量、点击量、出单量,并删除其中不满足有效关键词条件的初始关键词。
步骤102,对所述初始关键词库中的每个初始关键词进行模拟搜索,获取每个所述初始关键词对应的搜索商品库;
在该实施例中,为确定对应上述初筛后的关键词是否与实际运营产品是否相关,系统会提供一个模拟人工搜索并获得结果产品的采集工具,该工具将上面初筛获得的关键词进行模拟人工搜索并收录结果产品,得到每个初始关键词对应的搜索商品库。
步骤103,分别计算每个所述搜索商品库与所述竞品库的相关度,并筛选与所述竞品库的相关度大于预设阈值的所述搜索商品库作为强相关搜索商品库;
在该实施例中,通过计算每个搜索商品库与竞品库的相关度来判断搜索商品库对应的初始关键词是否与目标商品强相关,保留其中相关度大于预设阈值的搜索商品库作为强相关搜索商品库。
可选地,通过以下方式计算相关度:统计所述搜索商品库中命中所述竞品库的命中商品数量;计算所述命中商品数量与所述搜索商品库的总商品数量的比值,作为所述搜索商品库与所述竞品库的相关度。
其中,对模拟搜索得到搜索商品库与竞品库进行相交计算,当达到40%,则保留,具体计算公式如:假如搜索商品库为A,竞品库为B,则相关度=A∩B的数量与A的数量的比值。
步骤104,获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词。
在本申请实施例中,确定强相关搜索商品库之后,可以将强相关搜索商品库对应的初始关键词作为目标商品在目标平台上的目标关键词,从而保证最终得到的目标关键词与目标商品的竞品强相关,有助于提升关键词的效果,使得目标商品能够更容易的被搜索到。
进一步,本申请实施例中,为进一步扩充目标关键词,供运营人员快速的推广从而提升产品流量,获得更多成交订单,可选地,步骤104之后还包括:
步骤105,对所述目标关键词进行分词,并重组所述目标关键词的分词得到重组关键词;将所述重组关键词合并到所述目标关键词中,并筛选与所述目标平台提供的商品词库匹配的目标关键词;依据筛选后的目标关键词对应的第二历史购物信息,对所述筛选后的目标关键词进行排序,并依据所述筛选后的目标关键词的排序,获取优选关键词。
在上述实施例中,将强相关的词进行拆分词根,重新组合再进一步对接第三方平台(如亚马逊)获得“搜索量、点击量、出单量”等数据后,通过这些指标数据最终判断关键词的最优指数。具体地,可以将目标关键词拆分为单个词组,如目标关键词有ABC三个词根,那么系统就会将ABC拆分为A B C三个词根然后再重新组合,如BAC、CBA、ACB得到三个不同词序的组合,比如在线上购物的搜索行为如跑步鞋男或男士跑步鞋;词义相同但是词根顺序不同。将重组的目标关键词与目标平台的商品词库中的客户搜索词进行同类词适配得到搜索量、点击量、出单量;再进行降序,找出最优组合关键词供销售进行推广。
通过应用本实施例的技术方案,通过目标平台对应的信息采集器,获得目标商品在目标平台上的竞品库和初始关键词库,从而通过对初始关键词进行模拟搜索获得搜索商品库,基于搜索商品库与竞品库的相关度对初始关键词进行筛选,确定初始关键词中与目标商品强相关的目标关键词。本申请实施例有助于提升关键词的效果,供运营人员快速的推广从而提升产品流量,获得更多成交订单,能够帮助跨境电商运营人员突破语言障碍,通过有效的软件设计和充分利用计算机的大数据处理能力快速地帮助跨境电商运营人员获得客户的真实需求外,又能在服务器设备上极大的控制成本,同时部署方便易扩展。
在一个具体实施例中,系统架构层面具体实施方案如下:
一、硬件设备需求:
网络设备:网络带宽一般要求较高,至少100M以上,其中采集器的应用服务器对网络资源要求高,一般为千兆以上;
应用服务器:一台中台调度应用处理服务器,设备对CPU要求较高,至少8核,来满足运算效率;
数据服务器:两台,做读写分离,并配置redis临时存储;数据存储对硬盘和CPU要求最高,硬盘存储10T以上,CPU8核以上。
二、如图3所示,为软件架构示意图,分为如下几个层:
1、访问层:本系统基于WEB网页端研发,用PC和笔记本打开游览器访问效果最佳;
2、展示层:运用比较流行的VUE UI组件,并通过HTTP协议实现前后端分离;
3、逻辑层:运用PHP为后端主要开发语言,PYTHON为采集器的开发语言;
4、数据层:持久存储运用Mysql,缓存运用了Redis和MemCached以及文件存储;
5、基础实施:本地网络带宽为100M,采集器用云服务器,带宽为千兆;系统为CentOS7.9
进一步的,作为图1方法的具体实现,本申请实施例提供了一种基于大数据的商品关键词确定装置,如图4所示,该装置包括:
获取模块,用于通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库;
搜索模块,用于对所述初始关键词库中的每个初始关键词进行模拟搜索,获取每个所述初始关键词对应的搜索商品库;
筛选模块,用于分别计算每个所述搜索商品库与所述竞品库的相关度,并筛选与所述竞品库的相关度大于预设阈值的所述搜索商品库作为强相关搜索商品库;
确定模块,用于获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词。
可选地,所述筛选模块,还用于:
所述通过反查工具,获取目标商品在目标平台上的竞品库和初始关键词库之后,获取所述初始关键词库中每个初始关键词对应的第一历史购物信息,其中,所述第一历史购物信息包括所述初始关键词对应的搜索量、点击量以及出单量;
依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,其中,所述有效关键词条件包括搜索量大于预设第一阈值和/或点击量大于预设第二阈值和/或出单量大于预设第三阈值。
可选地,所述筛选模块,还用于:
统计所述搜索商品库中命中所述竞品库的命中商品数量;
计算所述命中商品数量与所述搜索商品库的总商品数量的比值,作为所述搜索商品库与所述竞品库的相关度。
可选地,所述装置还包括:关键词优选模块,用于:
所述获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词之后,对所述目标关键词进行分词,并重组所述目标关键词的分词得到重组关键词;
将所述重组关键词合并到所述目标关键词中,并筛选与所述目标平台提供的商品词库匹配的目标关键词;
依据筛选后的目标关键词对应的第二历史购物信息,对所述筛选后的目标关键词进行排序,并依据所述筛选后的目标关键词的排序,获取优选关键词。
可选地,所述筛选模块,还用于:
将所述初始关键词库中的所述初始关键词划分为多个关键词筛选任务;
为每个所述关键词筛选任务建立一个线程,通过每个所述线程获取对应的关键词筛选任务包含的所述初始关键词对应的第一历史购物信息;
依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,具体包括:
通过每个所述线程,依据所述第一历史购物信息删除对应的所述关键词筛选任务中不满足有效关键词条件的初始关键词。
可选地,所述获取模块,还用于:
所述通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库之前,建立目标商品在源平台的源竞品库以及源关键词库;
通过所述信息采集器,获取所述源竞品库中的竞品在所述目标平台上的所述竞品库以及所述源关键词库中的关键词在所述目标平台上的所述初始关键词库。
需要说明的是,本申请实施例提供的一种商品关键词的确定装置所涉及各功能单元的其他相应描述,可以参考图1方法中的对应描述,在此不再赘述。
基于上述如图1所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述如图1所示的商品关键词的确定方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1所示的方法,以及图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1所示的商品关键词的确定方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现通过目标平台对应的信息采集器,获得目标商品在目标平台上的竞品库和初始关键词库,从而通过对初始关键词进行模拟搜索获得搜索商品库,基于搜索商品库与竞品库的相关度对初始关键词进行筛选,确定初始关键词中与目标商品强相关的目标关键词。本申请实施例有助于提升关键词的效果,供运营人员快速的推广从而提升产品流量,获得更多成交订单,能够帮助跨境电商运营人员突破语言障碍,通过有效的软件设计和充分利用计算机的大数据处理能力快速地帮助跨境电商运营人员获得客户的真实需求外,又能在服务器设备上极大的控制成本,同时部署方便易扩展。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种基于大数据的商品关键词确定方法,其特征在于,所述方法包括:
通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库;
对所述初始关键词库中的每个初始关键词进行模拟搜索,获取每个所述初始关键词对应的搜索商品库;
分别计算每个所述搜索商品库与所述竞品库的相关度,并筛选与所述竞品库的相关度大于预设阈值的所述搜索商品库作为强相关搜索商品库;
获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词。
2.根据权利要求1所述的方法,其特征在于,所述通过反查工具,获取目标商品在目标平台上的竞品库和初始关键词库之后,所述方法还包括:
获取所述初始关键词库中每个初始关键词对应的第一历史购物信息,其中,所述第一历史购物信息包括所述初始关键词对应的搜索量、点击量以及出单量;
依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,其中,所述有效关键词条件包括搜索量大于预设第一阈值和/或点击量大于预设第二阈值和/或出单量大于预设第三阈值。
3.根据权利要求1所述的方法,其特征在于,所述分别计算每个所述搜索商品库与所述竞品库的相关度,具体包括:
统计所述搜索商品库中命中所述竞品库的命中商品数量;
计算所述命中商品数量与所述搜索商品库的总商品数量的比值,作为所述搜索商品库与所述竞品库的相关度。
4.根据权利要求1所述的方法,其特征在于,所述获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词之后,所述方法还包括:
对所述目标关键词进行分词,并重组所述目标关键词的分词得到重组关键词;
将所述重组关键词合并到所述目标关键词中,并筛选与所述目标平台提供的商品词库匹配的目标关键词;
依据筛选后的目标关键词对应的第二历史购物信息,对所述筛选后的目标关键词进行排序,并依据所述筛选后的目标关键词的排序,获取优选关键词。
5.根据权利要求2至4中任一项所述的方法,其特征在于,所述获取所述初始关键词库中每个初始关键词对应的第一历史购物信息,具体包括:
将所述初始关键词库中的所述初始关键词划分为多个关键词筛选任务;
为每个所述关键词筛选任务建立一个线程,通过每个所述线程获取对应的关键词筛选任务包含的所述初始关键词对应的第一历史购物信息;
所述依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,具体包括:
通过每个所述线程,依据所述第一历史购物信息删除对应的所述关键词筛选任务中不满足有效关键词条件的初始关键词。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库之前,所述方法还包括:
建立目标商品在源平台的源竞品库以及源关键词库;
相应地,所述通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库,具体包括:
通过所述信息采集器,获取所述源竞品库中的竞品在所述目标平台上的所述竞品库以及所述源关键词库中的关键词在所述目标平台上的所述初始关键词库。
7.一种基于大数据的商品关键词确定装置,其特征在于,所述装置包括:
获取模块,用于通过目标平台对应的信息采集器,获取目标商品在所述目标平台上的竞品库和初始关键词库;
搜索模块,用于对所述初始关键词库中的每个初始关键词进行模拟搜索,获取每个所述初始关键词对应的搜索商品库;
筛选模块,用于分别计算每个所述搜索商品库与所述竞品库的相关度,并筛选与所述竞品库的相关度大于预设阈值的所述搜索商品库作为强相关搜索商品库;
确定模块,用于获取所述强相关搜索商品库对应的所述初始关键词作为所述目标商品在所述目标平台上的目标关键词。
8.根据权利要求7所述的装置,其特征在于,所述筛选模块,还用于:
所述通过反查工具,获取目标商品在目标平台上的竞品库和初始关键词库之后,获取所述初始关键词库中每个初始关键词对应的第一历史购物信息,其中,所述第一历史购物信息包括所述初始关键词对应的搜索量、点击量以及出单量;
依据所述第一历史购物信息,删除不满足有效关键词条件的初始关键词,其中,所述有效关键词条件包括搜索量大于预设第一阈值和/或点击量大于预设第二阈值和/或出单量大于预设第三阈值。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述商品关键词的确定方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述商品关键词的确定方法。
CN202210873281.6A 2022-07-22 2022-07-22 基于大数据的商品关键词确定方法、装置、介质及设备 Pending CN115203395A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210873281.6A CN115203395A (zh) 2022-07-22 2022-07-22 基于大数据的商品关键词确定方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210873281.6A CN115203395A (zh) 2022-07-22 2022-07-22 基于大数据的商品关键词确定方法、装置、介质及设备

Publications (1)

Publication Number Publication Date
CN115203395A true CN115203395A (zh) 2022-10-18

Family

ID=83584798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210873281.6A Pending CN115203395A (zh) 2022-07-22 2022-07-22 基于大数据的商品关键词确定方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN115203395A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116645147A (zh) * 2023-07-27 2023-08-25 深圳千亚商务科技有限公司 基于亚马逊平台的自动化广告方法与系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116645147A (zh) * 2023-07-27 2023-08-25 深圳千亚商务科技有限公司 基于亚马逊平台的自动化广告方法与系统
CN116645147B (zh) * 2023-07-27 2024-01-23 深圳千亚商务科技有限公司 基于亚马逊平台的自动化广告方法与系统

Similar Documents

Publication Publication Date Title
US10475102B2 (en) Providing personalized item recommendations using scalable matrix factorization with randomness
US11023545B2 (en) Method and device for displaying recommended contents
CN108509617A (zh) 知识库构建、基于知识库的智能问答方法及装置、存储介质、终端
US10459888B2 (en) Method, apparatus and system for data analysis
CN107590267B (zh) 基于图片的信息推送方法及装置、终端和可读存储介质
Vandic et al. Dynamic facet ordering for faceted product search engines
TWI559158B (zh) 於商業分析中之關係發現之方法、電腦系統及電腦程式產品
KR101491627B1 (ko) 모바일 애플리케이션 평가를 위한 리뷰 정량화 방법, 장치 및 시스템
CN110750697B (zh) 商户分类方法、装置、设备及存储介质
CN108959453A (zh) 基于文本聚类的信息提取方法、装置及可读存储介质
CN115203395A (zh) 基于大数据的商品关键词确定方法、装置、介质及设备
CN105989114A (zh) 一种收藏内容推荐方法及终端
CN111444438A (zh) 召回策略的准召率的确定方法、装置、设备及存储介质
CN107944946B (zh) 商品标签生成方法及装置
CN111429200A (zh) 一种内容关联方法及装置、存储介质、计算机设备
CN110968670B (zh) 一种流行商品的属性获取方法、装置、设备及存储介质
CN105095385B (zh) 一种检索结果的输出方法及装置
CN111654714A (zh) 信息处理方法、装置、电子设备和存储介质
CN115860865A (zh) 商品组合构造方法及其装置、设备、介质、产品
JP7354329B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN109299378A (zh) 搜索结果的展示方法、装置、终端及存储介质
CN115423555A (zh) 一种商品推荐方法、装置、电子设备及存储介质
CN111475721B (zh) 信息推送方法、装置、设备及存储介质
CN113221004A (zh) 一种关键词展示方法及装置
CN104077366B (zh) 一种在网络设备中用于确定特征信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination