CN103778548B - 商品信息与关键词匹配方法、商品信息投放方法及装置 - Google Patents

商品信息与关键词匹配方法、商品信息投放方法及装置 Download PDF

Info

Publication number
CN103778548B
CN103778548B CN201210401320.9A CN201210401320A CN103778548B CN 103778548 B CN103778548 B CN 103778548B CN 201210401320 A CN201210401320 A CN 201210401320A CN 103778548 B CN103778548 B CN 103778548B
Authority
CN
China
Prior art keywords
merchandise news
keyword
user
launched
merchandise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210401320.9A
Other languages
English (en)
Other versions
CN103778548A (zh
Inventor
景栽君
姚臻
孙大明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210401320.9A priority Critical patent/CN103778548B/zh
Publication of CN103778548A publication Critical patent/CN103778548A/zh
Application granted granted Critical
Publication of CN103778548B publication Critical patent/CN103778548B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种商品信息与关键词匹配方法、商品信息投放方法及装置,投放服务器首先确定用于投放的商品信息集合,然后针对该商品信息集合中的每个商品,匹配相应的关键词,并在用户添加关键词之后,将用户添加的关键词也与商品信息进行匹配操作,将投放服务器确定出的商品信息与其匹配的关键词的结合和用户添加的关键词及其匹配的关键词的集合进行合并,生成最终要投放的关键词集合,进行投放操作,本申请解决现有技术中需投放的商品信息和关键词之间的关联度不高,关键词与商品信息的匹配灵活度较差,影响网站的商品信息投放效果,以及投放服务器投放流程效率较低的问题。

Description

商品信息与关键词匹配方法、商品信息投放方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种商品信息与关键词匹配方法、商品信息投放方法及装置。
背景技术
随着网络的逐步普及,卖家用户经常会使用网站提供的信息投放服务器来推广自己的商品。其技术实现原理通常是,根据商品匹配的关键词,卖家用户可以针对每个匹配的关键词进行信息投放,网站可以根据浏览的买家用户输入的关键词,向买家用户投放该关键词所匹配的商品信息。
具体来说,对于投放服务器而言,目前在投放服务器上常见的投放商品信息的方式基本上可通过下述流程实现:投放服务器以被用户设置的投放的实体,例如包含商品信息的页面、具体的某个商品信息等为维度,匹配用户添加的关键词(也可以是其他形式的单元),并在投放系统引擎触发搜索关键词时,向作为买家的用户返回出现该关键词匹配的被投放的商品信息。
如图1所示,对于作为卖家的用户而言,商品信息的投放流程大体包括;
1、卖家用户在投放服务器上新建一个投放;
2、卖家用户在投放服务器上手动设置需要投放的商品信息;
3、从网站推荐的关键词中选择该需要投放的商品对应的关键词;
4、用户确认将所选择的关键词进行投放;
5、结束流程。
从现有流程可以看出,投放服务器回流被投放的商品信息主要依据用户添加的关键词所匹配的商品信息,这种仅依赖用户选择关键词的方式,会使得需投放的商品信息和关键词之间的关联度不高,关键词与商品信息的匹配灵活度较差,影响网站的商品信息投放效果。
另外,按照现有技术,用户只能通过按照自己的需要,逐一选择需投放的商品信息和选择对应的关键词,每需要投放一件商品时,都需要发起一个上述投放的流程,例如,在投放服务器上新建一个投放,对于用户和投放服务器来说,随着网站商品信息和关键词信息量日趋庞大,上述流程不但会造成整个投放的流程的效率低下,而且加重了投放服务器的访问负担。
发明内容
本申请实施例提供了一种商品信息与关键词匹配方法、商品信息投放方法及装置,用以解决现有技术中需投放的商品信息和关键词之间的关联度不高,关键词与商品信息的匹配灵活度较差,影响网站的商品信息投放效果,以及服务器投放流程效率较低、访问负担重的问题。
基于上述问题,本申请实施例提供的一种商品信息与关键词匹配方法,包括:
投放服务器确定用于投放的商品信息集合;
服务器针对所述商品信息集合中的每个商品信息,匹配对应的关键词,将各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
服务器接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合。
本申请实施例提供的一种商品信息投放方法,包括:
投放服务器确定用于投放的商品信息集合;
服务器针对所述商品信息集合中的每个商品信息,匹配对应的关键词,将各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
服务器接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合;
服务器将所述最终需要投放的关键词集合进行投放。
对应地,本申请实施例提供的一种商品信息与投放关键词的匹配装置,包括:
商品信息优选模块,用于确定用于投放的商品信息集合;
关键词推荐模块,用于针对所述商品信息集合中的每个商品信息,匹配对应的关键词,并各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
加词匹配模块,用于接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合。
本申请实施例提供的一种投放服务器,包括:
商品信息优选模块,用于确定用于投放的商品信息集合;
关键词推荐模块,用于针对所述商品信息集合中的每个商品信息,匹配对应的关键词,并各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
加词匹配模块,用于接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合;
投放模块,用于对所述最终需要投放的关键词集合进行投放。
本申请实施例的有益效果包括:
本申请实施例提供的上述商品信息与关键词匹配方法、商品信息投放方法及装置,投放服务器首先确定用于投放的商品信息集合,然后针对该商品信息集合中的每个商品,匹配相应的关键词,并在用户添加关键词之后,将用户添加的关键词也与商品信息进行匹配操作,将投放服务器确定出的商品信息与其匹配的关键词的结合和用户添加的关键词及其匹配的关键词的集合进行合并,生成最终要投放的关键词集合,进行投放操作,从投放服务器的上述处理流程可以看出,本申请实施例对对原有的投放流程进行了较大改进,由投放服务器确定用于投放的商品集合,并将用于投放的商品信息集合与关键词进行自动匹配,使得最终用于投放的商品信息集合与关键词的关联度较高,同时充分考虑系统自动匹配的关键词与用户自动添加的关键词与商品信息匹配的方式,也使得商品信息和关键词的匹配的灵活度较好,避免了现有技术中需投放的商品信息和关键词之间的关联度不高,关键词与商品信息的匹配灵活度较差,影响网站的商品信息投放效果,浪费投放资源的问题。另外,本申请实施例中,用户投放只需在投放服务器推荐的关键词的基础上,根据自己的需要在添加相应的关键词,投放服务器会在后台自动为用户添加的关键词关联对应的商品信息,相比较现有投放流程中,用户针对每个需要投放的商品,都需要手动选择该商品,然后再选择对应的关键词的流程来说,用户的操作被大大简化,大大减少了用户的工作量,并且一次操作就可以实现对用户对应的所有商品信息中适合投放以及需要投放的商品的投放,提高了投放流程的效率,减轻了服务器的访问负担。
附图说明
图1为现有技术中作为卖家的用户的商品信息的投放流程图;
图2为本申请实施例提供的商品信息与关键词匹配方法的流程图;
图3为本申请实施例提供的投放服务器确定用于投放的商品信息集合的流程图;
图4为本申请实施例提供的初步筛选出用于投放的第一商品信息集合的流程示意图;
图5为本申请实施例提供的商品信息的投放方法的流程图;
图6为本申请实施例提供的一个投放流程的实例的流程图;
图7为本申请实施例提供的商品信息与关键词的匹配装置的结构示意图;
图8为本申请实施例提供的投放服务器的结构示意图。
具体实施方式
下面结合说明书附图,对本申请实施例提供的一种商品信息与关键词匹配方法、商品信息投放方法及装置的具体实施方式进行说明。
首先对本申请实施例提供的一种商品信息与关键词匹配投放方法进行说明,如图2所示,该方法具体包括以下步骤:
S201、投放服务器确定用于投放的商品信息集合;
本申请实施例在具体实施时,上述步骤S201可以离线进行,也就是说,在用户发起投放流程之前,投放服务器可以在后台对用户对应的所有商品信息进行初步的筛选并保存,当用户上线新建一个投放时,可以直接使用之前初步筛选的结果生成最终需要投放的商品集合。当然,该步骤也可以在线进行,当用户发起流程时执行也可。
进一步地,本步骤S201具体可以通过如图3所示流程实现:
S301、投放服务器首先可按照设定的算法,从用户所对应的商品信息中,初步筛选出适合投放的第一商品信息集合;具体地,服务器可从用户所对应的所有商品信息(例如,在网站中该用户开设的网络店铺所对应的网页中的所有商品信息)中,初步筛选出适合投放的商品的集合;
S302、投放服务器将用户设置的第二商品信息集合中包含的各商品信息,与所述第一商品集合中包含的各商品信息进行合并和过滤运算,生成最终用于投放的商品信息集合。
进一步地,上述步骤S301中初步筛选出用于投放的第一商品信息集合,如图4所示,具体可以通过下述过程实现:
S401、根据网站上被投放的商品信息的历史搜索数据进行训练,拟合出用户对应的需要投放的商品信息中每个商品信息对应的预测权值;
其中该预测权值可以是点击率、访问率等等,也可以是预测投放投入产出比例值(ROI,即投放该商品所带来的成交收益/投放所花费的成本)等;
具体来说,每一个通过投放服务器在网络流量上展现出的内容,以后作为买家的用户对于这些内容的后续行为(例如,用户搜索、点击网页、浏览网页、问询、购买商品等操作)系统都会做详细的日志记录,这部分称之为呈现日志数据,而对于每个投放内容产生的动作(例如,点击扣费、无效过滤、成交转化等)系统也会做详细的日志记录,这部分称之为结算与效果日志数据,投放服务器主要就是将这两部分的底层日志数据作为历史搜索数据,从中提取出有效的分析信息与相关数据进行训练。
由于用户所对应的所有商品信息并未真实得到投放,不可能使用真实的投入产出数据,所以在S401中,可通过历史搜索数据进行训练,所拟合出的预测投放投入产出比例值是一个通过数学方式预测出来的数值,该数值用于准确反映该用户对应的商品信息中哪些具有投放的潜力和价值。具体的预测方式可以采用以下方式:一种可采用数学中线性回归的拟合方式,例如,可以使用现有梯度提高决策树(Gradient boost decision tree,GBDT,又称Treelink)机器学习技术提供的回归模型进行机器学习来实现。或者,在不使用机器学习技术的前提下,可以采用人工预设所有选择方案,然后进行线上测试,再设置优化权重比对不同的选择方案进行不断地优化实现,最终得到预测投放投入产出比例值,由于人工方式十分繁复,需要大量的时间与人工评测介入,相比较机器学习方式而言不具备较高的可行性。
具体来说,使用现有梯度提高决策树(Gradient boost decision tree,GBDT,又称Treelink)机器学习技术提供的回归模型进行机器学习来实现时,可以针对用户对应的所有商品信息中每个商品信息,利用Treelink的回归模型,对于已投放的商品的历史搜索数据进行训练,拟合出该商品信息对应的预测投放投入产出比例值相关的各因子的值及其权重;计算各因子的值及其权重乘积之和,得到该商品信息对应的预测投放投入产出比例值。
预测投放投入产出比例值的各因子,在具体实施时,可以参考投入和产出的各种因素来设计。在步骤S401中,对于用户对应的所有商品信息来说,由于投放服务器此时还未对其进行有效的投放操作,因而没有任何效果反馈的信息与数据,此时可参考其他因素的数据来拟合预测投放投入产出比例值。例如,采用扩大化聚类的方式,选择该用户之前已投放的其他同类商品、同类卖家的同类商品以及各种具有相同或类似属性的广义上同类商品的集合,用其各自对应的展现量、点击量、花费金额、转化能力以及其他投放效果的评估因子(具体来说可以是以下因子中的至少一项,点击率、跳失率、转化率、店内跳转率、店外跳转率、平均访问深度、实际的投入产出比等等)作为本次待投放的商品信息预测投入产出比例值的相关因子,或者,从其他环境下相关信息和数据,如网站搜索、浏览、定向推送等多种环境下的数据中抽取上述评估因子等作为预测投入产出比例值的相关因子。
预测投放投入产出比例值相关的各因子的权重,可以根据各因子在商品信息投放效果上的比重进行适当设置,例如,某个因子对于商品信息投放效果影响较大,那么相应地权重分配会向其倾斜,其权重值会较其他因子的权重值大,反之,权重值相对较小。
S402、对所计算出的每个商品信息对应的预测投放投入产出比例值按大小进行排序;
S403、筛选出投放投入比例值排序靠前的设定数量的商品信息,将筛选出的商品信息生成第一商品信息集合。
从上述流程S401~S403的步骤可以看出,上述筛选出第一商品信息集合的算法中,需要建立一个可以评估某商品信息是否适合投放的参数,在本申请实施例中,采用了预测投放投入产出比例值这一参数来评估某商品信息是否适合投放,这种的算法设计的原因在于,商品信息的预测投放投入产出比例值可以真实衡量该商品在投放环节在相同投入成本下能够给用户带来多大收益,使得筛选出来的商品信息更精确,有效提高投放的效率和投放资源的利用率。
由于用户对应的所有商品信息中,存在某些明显不适合投放的商品信息,例如,某些商品属性特性信息为赠品或邮费链接的商品信息,这些商品信息作为一种商品信息处理的噪声,需要进行过滤,较佳地,可以在步骤S301初步筛选出用于投放的第一商品信息集合之前或者之后,还可执行下述操作:筛除其中包含的商品属性特性信息为赠品或邮费链接的商品信息。
优选地,上述步骤S302中,将用户设定的第二商品信息集合,与步骤S301中筛选出的第一商品集合进行合并和过滤运算,生成最终需要投放的商品信息集合,具体可以是,用户通过投放服务器预先设置其添加的第二商品信息集合,为了简化用户的操作,这样的第二商品信息,可以包含需要投放的商品信息的白名单以及包含不需要投放的商品信息的黑名单;这样,在本步骤S302中,可以将用户设定的白名单中的各种商品信息,与步骤S301中筛选出的第一商品集合中的商品信息进行合并,并从中筛除掉用户设定的黑名单中的各商品信息,得到最终需要投放的商品信息集合。
如图2所示,在投放服务器确定用于投放的商品信息集合之后,继续执行下述步骤S202和S203:
S202、投放服务器针对所述商品信息集合中的每个商品信息,匹配对应的关键词,依据各关键词以及关键词与商品信息的匹配关系生成推荐关键词集合;
本步骤S202中,针对商品信息集合中的每个商品信息,匹配对应的关键词,可以采用现有的关键词推荐技术,推荐过程可以针对单个商品信息来进行。
为了更好地理解本申请实施例,下面对现有关键词推荐技术的实现过程简单介绍如下:
首先,从商品信息的特征值(例如对商品的文本描述)中初步抽取关键词,形成关键词集合;
其次,对该集合通过相关词分析以及使用文本挖掘技术,从网站的历史日志数据中获取推荐关键词召回集合;
然后,再通过相关性控制算法(利用类目特性、属性特性等商品的结构化信息,与关键词对应的结构化信息进行匹配等)对关键词集合进行过滤处理;
最后,对关键词集合中的各关键词按照对应的已发生的流量大小信息进行排序,选出排序靠前的关键词作为与商品信息匹配的关键词。
具体来说,关键词与商品信息的匹配可以有以下两个过程:
过程一,前置预处理的反向匹配:
也就是说,投放服务器基于已有的商品信息,根据该商品本身的信息(例如,类目、属性、标题、描述等信息)与聚类的其他信息(如同类商品信息、同类用户的相关信息)等有效的内容,从中提取出一批可用的关键词,这样,对于某一个关键词来说,就有了与其匹配的商品信息,这个过程也可以称之为是基于商品信息推荐关键词的过程;
过程二,后置实时处理的匹配:
在用户输入全新的关键词后,投放服务器分析该关键词,进行归一化等操作,并获取该关键词对应的类目、属性、相关词等结构化的数据信息,然后,将获取到的关键词对应的这些结构化的数据信息与各个商品信息所拥有的结构化信息进行一一的比对,看是否可以对应,通过这一过程即可筛选出与该关键词匹配度较高的商品信息;
这两个过程中,关键的是商品或者关键词所对应的结构化的信息,结构化信息包括商品类目、商品属性、核心关键词、语义描述等,通过两者一致性的程度来进行商品信息和关键词之间的匹配。
S203、投放服务器接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合。
如果在推荐关键词的基础上,用户需要添加关键词,那么在本步骤S203中,将用户添加的关键词与商品信息集合中的商品信息进行匹配,具体通过下述方式实现:
针对用户添加的每个关键词,将该关键词的结构化信息,与商品信息集合中每个商品信息的结构化信息进行匹配权重值的运算;结构化信息在前面已详细说明,在此不再赘述。
将匹配权重值最大的商品信息作为与用户添加的该关键词相匹配的商品信息。
使用关键词和商品信息的结构化信息进行匹配,可以使得商品信息和关键词在所属类别和属性上尽量匹配,使得匹配出的商品信息与关键词之间的关联度较高。
这样,最终需要投放的关键词集合就包含了推荐的关键词以及用户添加的关键词,以及各关键词与所匹配商品信息之间的映射关系。
另外,基于上述商品信息与关键词匹配方法,本申请实施例还提供了一种商品信息的投放方法,该方法如图5所示,包括下述步骤:
S501、投放服务器确定用于投放的商品信息集合;
S502、投放服务器针对所述商品信息集合中的每个商品信息,匹配对应的关键词,将各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
S503、投放服务器接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合;
S504、投放服务器将最终需要投放的关键词集合进行投放。
上述步骤S501-S503的具体实施方式与前述S201-S203的具体实施方式相同,在此不再赘述。
上述步骤S504对最终需要的关键词集合进行投放的具体实现方式,可以采用现有投放技术中关键词的投放方式,如出价投放等,在此不再赘述。
为了更好地说明本申请实施例提供的上述商品信息与关键词匹配方法和商品信息投放方法,下面结合图6所示的一个投放流程的实例进行说明,如图6所示,用户新建投放之后,用户可以实时设置投放的商品信息的黑白名单,同时,投放服务器可根据设定的算法进行商品信息的优选,生成商品信息候选集合,随后投放服务器对商品信息候选集合中的商品信息和黑白名单中的商品信息进行过滤合并操作,计算得到出最终需要投放的商品信息集合(即图6中的商品信息的最终集合);
然后,投放服务器对最终需要投放的商品信息集合中的每个商品,执行关键词推荐的步骤,即将推荐的关键词与对应商品信息进行匹配,生成推荐关键词集合(具体可包含关键词和与其匹配的商品信息的映射关系),并将推荐关键词集合推送给用户,提示用户是否需要添加关键词,如果用户选择了添加的关键词,那么投放服务器可将用户添加的关键词与最终需要投放的商品信息集合中的商品信息进行匹配,生成添加关键词集合(包含添加的关键词及其对应的商品信息的映射关系),然后将推荐关键词集合与用户添加的关键词集合进行合并,生成最终需要投放的关键词集合,最后将最终需要投放的关键词集合进行投放。
以下举一个简单的例子说明上述实施例。
假设用户在网上开设有一主营数码产品的网络店铺,为对其网络店铺中的相关商品的进行投放,可以在投放服务器提供的投放流程中,预先设置需要投放的商品的白名单例如多款数码相机,以及不需要投放的商品信息的黑名单例如多款手机等,投放服务器会从用户网络店铺中的商品中自动优选出适合投放的商品信息,与用户设置的商品信息的白名单和黑名单进行合并和过滤操作,得到最终进行投放的商品信息集合,然后,投放服务器在后台为最终投放的商品信息集合,例如包含多款数码相机的商品信息自动匹配出相应的关键词,例如“数码相机”、“单反相机”、“微单相机”等,将商品信息和与其匹配的关键词的映射关系生成推荐关键词集合,向用户展示时,仅展示出其推荐的各个关键词。
如果用户在投放服务器推荐的关键词基础上,根据自身的需求,又添加了关键词例如“明基相机”、“三星相机”等,投放服务器会在用户添加关键词的基础上,为其匹配对应的商品信息,然后将包含“数码相机”、“单反相机”、“微单相机”、“明基相机”、“三星相机”等关键词和对应的商品信息的映射关系的最终需要投放的关键词集合进行投放。
由于图6所示的流程中,投放服务器向用户推荐关键词集合时,以及用户在添加关键词时,对用户而言,其看到的是投放服务器向其推荐的关键词和添加的关键词,而此时投放服务器其实在后台已经为各个关键词匹配上了对应的商品信息,这样的好处在于,可以使得投放服务器的计算成本较小,且拥有较好的嵌入性,对于原有投放服务器改造难度小。
并且,从上述流程看出,一方面,投放服务器侧确定用于投放的商品信息集合,实现了对适用于投放的商品信息的自动优选和用户选择商品信息两者的结合,并将用于投放的商品信息集合与关键词进行自动匹配,使得最终用于投放的商品信息集合与关键词的关联度较高,同时充分考虑系统自动匹配的关键词与用户自动添加的关键词与商品信息匹配的方式,也使得商品信息和关键词的匹配的灵活度较好,避免了现有技术中需投放的商品信息和关键词之间的关联度不高,关键词与商品信息的匹配灵活度较差,影响网站的商品信息投放效果的问题,另一方面,在图6所示的流程图中,用户只需要根据自己的需要设置需要投放和不需要投放的商品的名单(该名单可以包含多件商品信息),以及根据自己的需要添加关键词而已,相比较现有投放流程中,用户针对每个需要投放的商品,都需要一一手动选择该商品,然后选择对应的关键词的流程来说,用户的操作被大大简化,大大减少了用户的工作量,并且一次操作就可以实现用户网络店铺中所有商品中适合投放以及用户需要投放的商品的投放,提高了投放流程的效率。
基于同一申请构思,本申请实施例还提供了一种商品信息与关键词的匹配装置和投放服务器,由于该装置和投放服务器所解决问题的原理与前述商品信息与关键词匹配方法、商品信息投放方法相似,因此该装置的实施可以参见前述方法的实施,重复之处不再赘述。
本申请实施例提供的商品信息与投放关键词的匹配装置,如图7所示,包括:
商品信息优选模块701,用于确定用于投放的商品信息集合;
关键词推荐模块702,用于针对所述商品信息集合中的每个商品信息,匹配对应的关键词,并各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
加词匹配模块703,用于接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合。
进一步地,上述商品信息优选模块701,具体用于按照设定的算法,从用户所对应的商品信息中,初步筛选出适合投放的第一商品信息集合;将用户设置的第二商品信息集合中包含的各商品信息,与所述第一商品集合中包含的各商品信息进行合并和过滤运算,生成所述用于投放的商品信息集合。
进一步地,上述商品信息优选模块701,具体用于根据网站上被投放的商品信息的历史搜索数据进行训练,拟合出用户对应的所有商品信息中每个商品信息对应的预测权值;对每个商品信息对应的预测权值按大小进行排序,筛选出投放预测权值排序靠前的设定数量的商品信息,将筛选出的商品信息生成第一商品信息集合。
进一步地,上述预测权值为预测投放投入产出比例值,上述商品信息优选模块701,进一步用于针对用户对应的所有商品信息中每个商品信息,利用Treelink的回归模型,对于所述已投放的商品的历史搜索数据进行训练,拟合出该商品信息对应的预测投放投入产出比例值相关的各因子的值及其权重;计算各因子的值及其权重乘积之和,得到该商品信息对应的预测投放投入产出比例值。
进一步地,上述商品信息优选模块701,还用于将筛选出的商品信息生成第一商品信息集合之后,从第一商品信息集合中的商品信息中,进一步筛除其中包含的商品属性特性信息为赠品或邮费链接的商品信息。
进一步地,上述商品信息优选模块701,上述商品信息优选模块,具体用于将第二商品信息集合包含的需要投放的商品信息的白名单中的各商品信息,与所述第一商品集合中的商品信息进行合并,并筛除掉第二商品信息集合包含的不需要投放的商品信息的黑名单中的各商品信息,得到最终需要投放的商品信息集合。
进一步地,上述加词匹配模块703,具体用于针对用户添加的每个关键词,将该关键词的结构化信息,与商品信息集合中每个商品信息的结构化信息进行匹配权重值的运算;所述结构化信息包括类目特性信息和/或属性特性信息;将匹配权重值最大的商品信息作为与用户添加的该关键词相匹配的商品信息。
本申请实施例提供的投放服务器,如图8所示,包括:
商品信息优选模块801,用于确定用于投放的商品信息集合;
关键词推荐模块802,用于针对所述商品信息集合中的每个商品信息,匹配对应的关键词,并各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
加词匹配模块803,用于接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合;
投放模块804,用于对所述最终需要投放的关键词集合进行投放。
上述商品信息优选模块801、关键词推荐模块802和加词匹配模块803的具体实施方式与前述商品信息与关键词的匹配装置相同,在此不再赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请实施例可以通过硬件实现,也可以借助软件加必要的通用硬件服务器的方式来实现。基于这样的理解,本申请实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本申请实施例提供的上述商品信息与关键词匹配方法、商品信息投放方法及装置,投放服务器首先确定用于投放的商品信息集合,然后针对该商品信息集合中的每个商品,匹配相应的关键词,并在用户添加关键词之后,将用户添加的关键词也与商品信息进行匹配操作,将投放服务器确定出的商品信息与其匹配的关键词的结合和用户添加的关键词及其匹配的关键词的集合进行合并,生成最终要投放的关键词集合,进行投放操作,从投放服务器的上述处理流程可以看出,本申请实施例对对原有的投放流程进行了较大改进,由投放服务器确定用于投放的商品集合,并将用于投放的商品信息集合与关键词进行自动匹配,使得最终用于投放的商品信息集合与关键词的关联度较高,同时充分考虑系统自动匹配的关键词与用户自动添加的关键词与商品信息匹配的方式,也使得商品信息和关键词的匹配的灵活度较好,避免了现有技术中需投放的商品信息和关键词之间的关联度不高,关键词与商品信息的匹配灵活度较差,影响网站的商品信息投放效果,浪费投放资源的问题。另外,本申请实施例中,用户投放只需在投放服务器推荐的关键词的基础上,根据自己的需要在添加相应的关键词,投放服务器会在后台自动为用户添加的关键词关联对应的商品信息,相比较现有投放流程中,用户针对每个需要投放的商品,都需要手动选择该商品,然后再选择对应的关键词的流程来说,用户的操作被大大简化,大大减少了用户的工作量,并且一次操作就可以实现对用户对应的所有商品信息中适合投放以及需要投放的商品的投放,提高了投放流程的效率,减轻了服务器的访问负担。
进一步地,本申请实施例在初步选出需要投放的商品信息的过程中,使用机器学习技术例如Treelink的回归模型,对已投放的商品的历史搜索数据进行训练,拟合出该商品信息对应的预测投放投入产出比例值,通过商品的投放投入产出比例值,可以从海量商品中更精确地筛选出更适合投放的商品信息,并且结合用户根据自身需要预先设置的需要投放的商品信息集合的黑白名单,得到最终用于投放的商品信息集合,实现了适用于投放的商品信息的自动优选和用户选择商品信息两者的结合,进一步扩展了最终进行投放的商品信息的来源,满足了用户的需求的同时进一步提升了投放流程的使用效果。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (16)

1.一种商品信息与关键词匹配方法,其特征在于,包括:
投放服务器确定用于投放的商品信息集合;
投放服务器针对所述商品信息集合中的每个商品信息,匹配对应的关键词,将各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
投放服务器接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合。
2.如权利要求1所述的方法,其特征在于,投放服务器确定需要投放的商品信息集合,包括:
投放服务器按照设定的算法,从用户所对应的商品信息中,初步筛选出适合投放的第一商品信息集合;
投放服务器将用户设置的第二商品信息集合中包含的各商品信息,与所述第一商品信息集合中包含的各商品信息进行合并和过滤运算,生成所述用于投放的商品信息集合。
3.如权利要求2所述的方法,其特征在于,按照设定的算法,从用户所对应的所有商品信息中,筛选出需要投放的第一商品信息集合,包括:
根据网站上被投放的商品信息的历史搜索数据进行训练,拟合出用户对应的所有商品信息中每个商品信息对应的预测权值;
对每个商品信息对应的预测权值按大小进行排序,筛选出预测权值排序靠前的设定数量的商品信息,将筛选出的商品信息生成第一商品信息集合。
4.如权利要求3所述的方法,其特征在于,所述预测权值为预测投放投入产出比例值;所述拟合出用户对应的所有商品信息中每个商品信息对应的预测权值,包括:
针对用户对应的所有商品信息中每个商品信息,利用梯度提高决策树Treelink的回归模型,对于所述已投放的商品信息的历史搜索数据进行训练,拟合出所有商品信息中每个商品信息对应的预测投放投入产出比例值相关的各因子的值及其权重;
计算各因子的值及其权重乘积之和,得到所有商品信息中每个商品信息对应的预测投放投入产出比例值。
5.如权利要求3或4所述的方法,其特征在于,将筛选出的商品信息生成第一商品信息集合之后,还包括:
从第一商品信息集合中的商品信息中,进一步筛除其中包含的商品属性特性信息为赠品或邮费链接的商品信息。
6.如权利要求2-4任一项所述的方法,其特征在于,所述第二商品信息集合中包括:包含需要投放的商品信息的白名单以及包含不需要投放的商品信息的黑名单;
所述将用户设定的第二商品信息集合中包含的各商品信息,与所述第一商品信息集合中包含的各商品信息进行合并和过滤运算,生成所述用于投放的商品信息集合,具体包括:
将所述白名单中的各商品信息,与所述第一商品信息集合中的商品信息进行合并,并筛除掉所述黑名单中的各商品信息,得到所述用于投放的商品信息集合。
7.如权利要求1-4任一项所述的方法,其特征在于,将用户添加的关键词与所述商品信息集合中的商品信息进行匹配,包括:
针对用户添加的每个关键词,将该关键词的结构化信息,与商品信息集合中每个商品信息的结构化信息进行匹配权重值的运算;所述结构化信息包括类目特性信息和/或属性特性信息;
将匹配权重值最大的商品信息作为与用户添加的该关键词相匹配的商品信息。
8.一种商品信息投放方法,其特征在于,包括:
投放服务器确定用于投放的商品信息集合;
投放服务器针对所述商品信息集合中的每个商品信息,匹配对应的关键词,将各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
投放服务器接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系和所述推荐关键词集合进行合并,生成最终需要投放的关键词集合;
投放服务器将所述最终需要投放的关键词集合进行投放。
9.一种商品信息与投放关键词的匹配装置,其特征在于,包括:
商品信息优选模块,用于确定用于投放的商品信息集合;
关键词推荐模块,用于针对所述商品信息集合中的每个商品信息,匹配对应的关键词,并各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
加词匹配模块,用于接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合。
10.如权利要求9所述的装置,其特征在于,所述商品信息优选模块,具体用于按照设定的算法,从用户所对应的商品信息中,初步筛选出适合投放的第一商品信息集合;将用户设置的第二商品信息集合中包含的各商品信息,与所述第一商品信息集合中包含的各商品信息进行合并和过滤运算,生成所述用于投放的商品信息集合。
11.如权利要求10所述的装置,其特征在于,所述商品信息优选模块,具体用于根据网站上被投放的商品信息的历史搜索数据进行训练,拟合出用户对应的所有商品信息中每个商品信息对应的预测权值;对每个商品信息对应的预测权值按大小进行排序,筛选出预测权值排序靠前的设定数量的商品信息,将筛选出的商品信息生成第一商品信息集合。
12.如权利要求11所述的装置,其特征在于,所述预测权值为预测投放投入产出比例值;所述商品信息优选模块,进一步用于针对用户对应的所有商品信息中每个商品信息,利用梯度提高决策树Treelink的回归模型,对于所述已投放的商品信息的历史搜索数据进行训练,拟合出所有商品信息中每个商品信息对应的预测投放投入产出比例值相关的各因子的值及其权重;计算各因子的值及其权重乘积之和,得到所有商品信息中每个商品信息对应的预测投放投入产出比例值。
13.如权利要求10-12任一项所述的装置,其特征在于,所述商品信息优选模块,还用于将筛选出的商品信息生成第一商品信息集合之后,从第一商品信息集合中的商品信息中,进一步筛除其中包含的商品属性特性信息为赠品或邮费链接的商品信息。
14.如权利要求10-12任一项所述的装置,其特征在于,所述商品信息优选模块,具体用于将第二商品信息集合包含的需要投放的商品信息的白名单中的各商品信息,与所述第一商品信息集合中的商品信息进行合并,并筛除掉第二商品信息集合包含的不需要投放的商品信息的黑名单中的各商品信息,得到最终需要投放的商品信息集合。
15.如权利要求10-12任一项所述的装置,其特征在于,所述加词匹配模块,具体用于针对用户添加的每个关键词,将该关键词的结构化信息,与商品信息集合中每个商品信息的结构化信息进行匹配权重值的运算;所述结构化信息包括类目特性信息和/或属性特性信息;将匹配权重值最大的商品信息作为与用户添加的该关键词相匹配的商品信息。
16.一种投放服务器,其特征在于,包括:
商品信息优选模块,用于确定用于投放的商品信息集合;
关键词推荐模块,用于针对所述商品信息集合中的每个商品信息,匹配对应的关键词,并各关键词和关键词与商品信息的匹配关系生成推荐关键词集合;
加词匹配模块,用于接收用户添加的关键词,在完成用户添加的关键词与商品信息的匹配后,将用户添加的关键词与商品信息的匹配关系与所述推荐关键词集合进行合并,生成最终需要投放的关键词集合;
投放模块,用于对所述最终需要投放的关键词集合进行投放。
CN201210401320.9A 2012-10-19 2012-10-19 商品信息与关键词匹配方法、商品信息投放方法及装置 Active CN103778548B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210401320.9A CN103778548B (zh) 2012-10-19 2012-10-19 商品信息与关键词匹配方法、商品信息投放方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210401320.9A CN103778548B (zh) 2012-10-19 2012-10-19 商品信息与关键词匹配方法、商品信息投放方法及装置

Publications (2)

Publication Number Publication Date
CN103778548A CN103778548A (zh) 2014-05-07
CN103778548B true CN103778548B (zh) 2018-05-29

Family

ID=50570749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210401320.9A Active CN103778548B (zh) 2012-10-19 2012-10-19 商品信息与关键词匹配方法、商品信息投放方法及装置

Country Status (1)

Country Link
CN (1) CN103778548B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808541B (zh) * 2014-12-29 2019-11-08 阿里巴巴集团控股有限公司 一种信息匹配处理方法和装置
CN105049487A (zh) * 2015-06-18 2015-11-11 上海斐讯数据通信技术有限公司 无线ap业务推送系统及其推送方法
US10846276B2 (en) 2015-06-30 2020-11-24 Ebay Inc. Search engine optimization by selective indexing
CN105095396A (zh) * 2015-07-03 2015-11-25 北京京东尚科信息技术有限公司 模型创建方法、质量评估方法及装置
CN106445965B (zh) * 2015-08-11 2019-12-24 阿里巴巴集团控股有限公司 信息推广处理方法及装置
CN105117440A (zh) * 2015-08-11 2015-12-02 北京奇虎科技有限公司 确定待推荐应用app的方法及装置
CN105608125B (zh) * 2015-12-15 2020-11-06 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
CN107291718B (zh) * 2016-03-30 2021-10-08 阿里巴巴集团控股有限公司 页面资源投放方法及装置
CN107808333A (zh) * 2016-09-08 2018-03-16 阿里巴巴集团控股有限公司 一种商品投放决策系统、方法及装置
CN108280651A (zh) * 2016-12-30 2018-07-13 阿里巴巴集团控股有限公司 一种商品对象审核方法、装置及系统
CN107301238A (zh) * 2017-06-28 2017-10-27 北京京东尚科信息技术有限公司 用户请求的处理方法和系统
CN107169806B (zh) * 2017-06-29 2020-11-03 北京京东尚科信息技术有限公司 用于确定商品属性对于购买决策的影响度的方法及装置
CN107590678A (zh) * 2017-08-07 2018-01-16 北京京东尚科信息技术有限公司 商品推荐方法和系统
CN109597973A (zh) * 2017-09-30 2019-04-09 阿里巴巴集团控股有限公司 一种文案信息的推荐、生成方法和装置
CN107832432A (zh) * 2017-11-15 2018-03-23 北京百度网讯科技有限公司 一种搜索结果排序方法、装置、服务器和存储介质
CN110020905A (zh) * 2018-01-09 2019-07-16 阿里巴巴集团控股有限公司 一种数据化选品的方法、装置及系统
CN108171586A (zh) * 2018-01-23 2018-06-15 北京值得买科技股份有限公司 一种商品聚类方法及装置
CN108563713B (zh) * 2018-03-29 2021-08-10 创新先进技术有限公司 关键词规则生成方法及装置和电子设备
CN108573408B (zh) * 2018-04-13 2021-07-27 浙江工业大学 一种最大化利益的热门商品榜单制定方法
CN109829115B (zh) * 2019-02-14 2020-02-04 上海晓材科技有限公司 搜索引擎关键词优化方法
CN113421106A (zh) * 2020-11-30 2021-09-21 阿里巴巴集团控股有限公司 商品数据的处理方法、装置及电子设备
CN112884520A (zh) * 2021-03-09 2021-06-01 拉扎斯网络科技(上海)有限公司 对象处理方法、装置、电子设备、存储介质及程序产品
CN112801720B (zh) * 2021-04-12 2021-07-09 连连(杭州)信息技术有限公司 一种店铺类目识别模型生成、店铺类目识别的方法及装置
CN114997927A (zh) * 2022-06-28 2022-09-02 北京趣云万维信息技术有限公司 提升数字商城广告转化效果的实时竞价排序方法、系统、存储介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102110269A (zh) * 2011-02-25 2011-06-29 中兴通讯股份有限公司 广告投放方法及系统
CN102129431A (zh) * 2010-01-13 2011-07-20 阿里巴巴集团控股有限公司 应用于网上交易平台的检索方法和系统
CN102339438A (zh) * 2010-07-22 2012-02-01 阿里巴巴集团控股有限公司 一种商品信息的网络发布方法、系统和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080065491A1 (en) * 2006-09-11 2008-03-13 Alexander Bakman Automated advertising optimizer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129431A (zh) * 2010-01-13 2011-07-20 阿里巴巴集团控股有限公司 应用于网上交易平台的检索方法和系统
CN102339438A (zh) * 2010-07-22 2012-02-01 阿里巴巴集团控股有限公司 一种商品信息的网络发布方法、系统和设备
CN102110269A (zh) * 2011-02-25 2011-06-29 中兴通讯股份有限公司 广告投放方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
竞价排名绩效及其影响因素的实证分析;汤珊珊;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;20120115;第J145-92页 *

Also Published As

Publication number Publication date
CN103778548A (zh) 2014-05-07

Similar Documents

Publication Publication Date Title
CN103778548B (zh) 商品信息与关键词匹配方法、商品信息投放方法及装置
US11645319B1 (en) Systems and methods for identifying issues in electronic documents
CN111444395B (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
CN108885624B (zh) 信息推荐系统及方法
US9064212B2 (en) Automatic event categorization for event ticket network systems
TW201812689A (zh) 惡意地址/惡意訂單的識別系統、方法及裝置
CN107609960A (zh) 推荐理由生成方法及装置
CN108596695B (zh) 实体推送方法及系统
Dhingra et al. Spam analysis of big reviews dataset using Fuzzy Ranking Evaluation Algorithm and Hadoop
CN105677780A (zh) 可拓展的用户意图挖掘方法及其系统
CN104992347A (zh) 一种视频匹配广告的方法及装置
CN111639253B (zh) 一种数据判重方法、装置、设备及存储介质
CN105069036A (zh) 一种信息推荐方法及装置
CN103902579A (zh) 获取信息的方法和装置
CN111931069B (zh) 用户兴趣确定方法、装置及计算机设备
Eide et al. Deep neural network marketplace recommenders in online experiments
CN106447397A (zh) 基于决策树算法的烟草零售户定价方法
CN105786810B (zh) 类目映射关系的建立方法与装置
CN109255676A (zh) 商品推荐方法、装置、计算机设备及存储介质
CN109727125A (zh) 借款金额预测方法、装置、服务器、存储介质
CN108074122A (zh) 产品试用推荐方法、装置及服务器
CN116823410A (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN116308615A (zh) 产品推荐方法、装置、电子设备及存储介质
Wen et al. An imbalanced learning method based on graph tran-smote for fraud detection
Zhao et al. Detecting fake reviews via dynamic multimode network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant