CN115169337B - 一种商品标题优化中关键词得分的计算方法 - Google Patents

一种商品标题优化中关键词得分的计算方法 Download PDF

Info

Publication number
CN115169337B
CN115169337B CN202211024351.7A CN202211024351A CN115169337B CN 115169337 B CN115169337 B CN 115169337B CN 202211024351 A CN202211024351 A CN 202211024351A CN 115169337 B CN115169337 B CN 115169337B
Authority
CN
China
Prior art keywords
keyword
ranking
function
commodity
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211024351.7A
Other languages
English (en)
Other versions
CN115169337A (zh
Inventor
杨德江
邢光浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongjiao Changxiang Technology Co ltd
Original Assignee
Chinese Education Changxiang Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Education Changxiang Beijing Technology Co ltd filed Critical Chinese Education Changxiang Beijing Technology Co ltd
Priority to CN202211024351.7A priority Critical patent/CN115169337B/zh
Publication of CN115169337A publication Critical patent/CN115169337A/zh
Application granted granted Critical
Publication of CN115169337B publication Critical patent/CN115169337B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种商品标题优化中关键词得分的计算方法,属于信息处理技术领域,包括如下步骤,S1:获取商品标题相关联的用于描述商品特征的描述信息;S2:从获取的商品特征的描述信息中得到相关关键词,由全部相关关键词组成相关词词库;S3:建立排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数;S4:通过上述构建的三个函数对所有相关关键词进行计算,分别求得对应函数下的相关关键词的分数;S5:对商品特征的不同描述信息所包含的各相关关键词的得分分别求和,得出标题优化后的最终得分。筛选高得分的一个或者多个相关关键词组合,在有限篇幅内,简练精准的描述商品特征,改善现有商品标题盲目拆词或者组合。

Description

一种商品标题优化中关键词得分的计算方法
技术领域
本发明涉及信息处理技术领域,尤其涉及一种商品标题优化中关键词得分的计算方法。
背景技术
随着信息网络技术的发展,以商品交换为中心的商务活动,即电子商务,以电子方式进行的营销、交易或者服务,电子商务利用计算机技术和互联网,连接了商品/服务的提供者、广告商、推广平台、物流提供商、客户或者合作伙伴。电商已广泛应用在全球各领域的贸易中。根据交易方的不同,电子商务分为ABC、B2C、B2B、C2C、B2M或者M2C等等模式。在电商平台中,进行产品或者服务推广时,需要提供包含若干关键字的标题,进行商品特征的描述,给予买家或者用户一定的指导,使买家能够在短时间内找到自己需要的商品或者服务,另外精准化的标题引导,能够提高标题的默认排名的权重,进一步增加商品的曝光率或者点击量。如何让商品的标题搜索既符合商品的特征,又有利于买家检索,成了电阻商务平台检索的核心问题。因此,做好标题内容优化能够为商家或者卖家的商品流量的转化带来正向影响。
但是就实际情况而言,卖家自己制定标题时相当随意,其所制定的标题名一般很难获得好的搜索排名。而卖家如果想通过自己对标题名规则的学习、以及通过各大数据库来寻找最优的商品标题,其工作量过于繁重复杂且难实现。专利文献CN111651722A公开了一种针对广告主广告投放效果的风险评估方法,其采用线性插值模型预测关键词的展示量,用概率模型预测关键词的点击量,并用线性插值和概率模型预测关键词的价格,通过预测的关键词的效果来调整当天的关键词的竞价,该方案关注的是广告主的投入与关键词竞价预期效果之间的风险关系,但是对于有多种关键词组合形式的若干待投放的商品标题缺乏充分的比较和筛选能力。因此,如何更有效地帮助用户进行商品对象的标题优化,筛选有竞争力、便于筛选和提高搜索排名的商品标题成为需要本领域技术人员解决的技术问题。
发明内容
有鉴于此,本发明提出了一种根据商品标题内容中不同关键字形成的组合内容,量化考核商品标题中关键词得分以及不同组合的商品标题总体得分的计算方法。
本发明的技术方案是这样实现的:本发明提供了一种商品标题优化中关键词得分的计算方法,包括如下步骤,
S1:获取商品标题相关联的用于描述商品特征的描述信息;
S2:从获取的商品特征的描述信息中得到相关关键词,由全部相关关键词组成相关关键词词库;
S3:建立排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数;
S4:通过上述构建的三个函数对所有相关关键词进行计算,得到相关关键词的排名与关键词覆盖率函数的得分、排名与点击量函数的得分或者增量与基数函数的得分;
S5:从相关关键词词库中选取不同的相关关键词进行组合得到商品标题,对商品标题内的各相关关键词的得分进行累计求和,即对各相关关键词分别利用排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数求取对应的相关关键词得分并依次累加,得到各种相关关键词组合情形的商品标题的总得分。
在以上技术方案的基础上,优选的,步骤S2中所述获取商品特征的描述信息中的标题关键词,是通过lucene全文搜索得到标题关键词,对标题关键词进行索引、查询并进行拆词处理得到相关关键词。
在以上技术方案的基础上,优选的,所述排名与关键词覆盖率函数表达式为:
Figure 628918DEST_PATH_IMAGE001
;其中
Figure 77217DEST_PATH_IMAGE002
为指定排名零点,
Figure 122533DEST_PATH_IMAGE003
Figure 48901DEST_PATH_IMAGE004
为搜索排名,
Figure 879585DEST_PATH_IMAGE005
Figure 967626DEST_PATH_IMAGE006
为最大覆盖率,
Figure 765818DEST_PATH_IMAGE007
Figure 495877DEST_PATH_IMAGE008
为覆盖率,
Figure 430335DEST_PATH_IMAGE009
;求得的排名与关键词覆盖率相互影响下的相关关键词得分
Figure 689278DEST_PATH_IMAGE010
≤100。
优选的,当不同的相关关键词具有相同的搜索排名时,且搜索排名不超过指定排名零点
Figure 224033DEST_PATH_IMAGE002
时,相关关键词得分
Figure 226624DEST_PATH_IMAGE010
与最大覆盖率
Figure 281168DEST_PATH_IMAGE006
成正比;当不同的相关关键词具有相同的最大覆盖率时,且搜索排名不超过指定排名零点
Figure 976591DEST_PATH_IMAGE002
时,相关关键词得分
Figure 749375DEST_PATH_IMAGE010
与相关关键词的搜索排名成反比。
优选的,当搜索排名
Figure 40811DEST_PATH_IMAGE004
不小于指定排名零点
Figure 215440DEST_PATH_IMAGE002
时,相关关键词得分
Figure 816186DEST_PATH_IMAGE010
=0。
优选的,所述排名与点击量函数,表达式为
Figure 810686DEST_PATH_IMAGE011
;其中
Figure 420659DEST_PATH_IMAGE012
为点击量;
Figure 184216DEST_PATH_IMAGE013
为搜索排名,
Figure 736289DEST_PATH_IMAGE014
;求得相关关键词的排名与点击量函数的得分
Figure 218086DEST_PATH_IMAGE015
;当搜索排名
Figure 366170DEST_PATH_IMAGE013
为1时,相关关键词得分
Figure 984234DEST_PATH_IMAGE015
具有最大值100;相关关键词得分
Figure 457940DEST_PATH_IMAGE015
随着搜索排名增大而降低。
优选的,所述增量与基数函数,表达式为
Figure 177766DEST_PATH_IMAGE017
其中,
Figure 863962DEST_PATH_IMAGE018
为增量;
Figure 867690DEST_PATH_IMAGE019
为基数;根据增量
Figure 246719DEST_PATH_IMAGE018
所在的不同区间,采用不同的排名与点击量函数计算相关关键词得分
Figure 703108DEST_PATH_IMAGE020
优选的,步骤S5所述从相关关键词词库中选取不同的相关关键词进行组合得到商品标题,对商品标题内的各相关关键词的得分进行累计求和,是对各相关关键词分别利用排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数求取对应的相关关键词得分并依次累加,得到各种相关关键词组合情形商品标题的总得分。
本发明提供的一种商品标题优化中关键词得分的计算方法,相对于现有技术,具有以下有益效果:
(1)本方案通过设定排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数,分别对商品标题中获取的各相关关键词,对各管线关键词进行量化得分,便于筛选高得分的一个或者多个相关关键词组合,在有限篇幅内,简练精准的描述商品特征,改善现有商品标题盲目拆词或者组合,推广和检索排名不理想的缺点;
(2)专门构建了相关函数,分别针对排名与关键词覆盖率、检索排名与点击量或者增量与基数的关系,为商品标题对应的商品带来更多流量的同时,提高商品检索的精确性;通过对标题优化得分的从高到低排列,可以直观的展现标题的预估的推广程度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种商品标题优化中关键词得分的计算方法的流程图;
图2为本发明一种商品标题优化中关键词得分的计算方法的排名与关键词覆盖率函数的示意图;
图3为本发明一种商品标题优化中关键词得分的计算方法的排名与点击量函数的示意图;
图4为本发明一种商品标题优化中关键词得分的计算方法的增量与基数函数的示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,本发明提供了一种商品标题优化中关键词得分的计算方法,包括如下步骤,
S1:获取商品标题相关联的用于描述商品特征的描述信息;
S2:从获取的商品特征的描述信息中得到相关关键词,由全部相关关键词组成相关关键词词库;
此处所述的从获取的商品特征的描述信息中的标题关键词,是通过lucene全文搜索得到标题关键词,对标题关键词进行索引、查询并进行拆词处理得到相关关键词。lucene全文搜索是一个高效的、基于Java的全文检索库,全文检索大体分为两个过程:索引创建和搜索索引;索引创建是从结构化数据或者非结构化的数据中提取信息,并创建索引;搜索索引,是得到用户的查询请求,搜索已创建的索引,然后返回结果的过程。索引使保持的信息与要检索的信息一致,可加快搜索索引的速度。只需创建一次索引,后续即可多次使用。lucene全文搜索的分词组件会将商品特征的描述信息分成一个一个独立的单词,去除标点符号和停词后得到词元;词元进一步传输至语言处理组件,语言处理组件将词元转变为词。利用的到的词创建字典,对字典进行排序合并相同的词成为文档倒排链表,由此完成索引的创建。搜索索引时,根据用户输入的商品特征的描述信息中得到相关关键词,是对输入内容进行语义分析,识别其中的标题关键字,根据词出现的频率和词之间的相互关系实现搜索过程。lucene全文搜索是一种开源的搜索引擎,其代码和操作方法在互联网上容易获取,属于本领域的公知常识,在此不再赘述。
S3:建立排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数;此处分别对函数的推导过程展开说明如下。
排名与关键词覆盖率函数其要求为具有开口向下的抛物线性质,且具有相同的搜索排名时,具有更高的关键词覆盖率的相关关键词的得分更高;具有相同的关键词覆盖率。而且,在经过指定排名零点以后,即使搜索排名继续增加,对应的排名与关键词覆盖率函数取值一律为零,对应抛物线的Y轴正半部分的右半部分。令拥有最大覆盖率且搜索排名第一的相关关键词得分最高为100分。令开口向下抛物线的简易方程为
Figure 442263DEST_PATH_IMAGE021
;到达指定排名零点
Figure 34918DEST_PATH_IMAGE002
后,函数值为0,则
Figure 584848DEST_PATH_IMAGE022
;故排名与关键词覆盖率函数的表达式可以改为
Figure 262954DEST_PATH_IMAGE023
;此处系数A与关键词覆盖率有关,且覆盖率最大时搜索排名第一为100分,故
Figure 822111DEST_PATH_IMAGE024
;其中
Figure 269273DEST_PATH_IMAGE002
为指定排名零点,
Figure 740837DEST_PATH_IMAGE003
Figure 906239DEST_PATH_IMAGE006
为最大覆盖率,
Figure 3508DEST_PATH_IMAGE007
Figure 570756DEST_PATH_IMAGE008
为覆盖率,
Figure 196909DEST_PATH_IMAGE025
;搜索排名
Figure 382032DEST_PATH_IMAGE004
Figure 17413DEST_PATH_IMAGE026
在平方并取负后缩放很快,会导致结果偏小,需要在排名与关键词覆盖率函数的表达式上增加附加系数来调整结果的大小,且在增加附加系数后使
Figure 439167DEST_PATH_IMAGE010
仍不超过100。令该附加系数为
Figure 501801DEST_PATH_IMAGE027
。即排名与关键词覆盖率函数的表达式修改为
Figure 376216DEST_PATH_IMAGE028
。为保证
Figure 80867DEST_PATH_IMAGE010
不超过100,需要保证
Figure 373439DEST_PATH_IMAGE029
;即
Figure 606974DEST_PATH_IMAGE030
;又
Figure 234265DEST_PATH_IMAGE031
的值域为
Figure 477027DEST_PATH_IMAGE032
,在该值域范围内上述不等式始终是成立的。由图2可知,当不同的相关关键词具有相同的搜索排名时,且搜索排名不超过指定排名零点
Figure 607794DEST_PATH_IMAGE002
时,相关关键词得分
Figure 527078DEST_PATH_IMAGE010
与最大覆盖率
Figure 376085DEST_PATH_IMAGE006
成正比;当不同的相关关键词具有相同的最大覆盖率时,且搜索排名不超过指定排名零点
Figure 891380DEST_PATH_IMAGE002
时,相关关键词得分
Figure 407812DEST_PATH_IMAGE010
与相关关键词的搜索排名成反比。如图2所示的指定排名零点为69或者70,搜索排名不能无限增加,且超过该指定排名零点的抛物线的Y轴取值均为负值,即对应的相关关键词得分
Figure 983150DEST_PATH_IMAGE010
小于0,为便于后续计算,将超过指定排名零点的相关关键词得分
Figure 335765DEST_PATH_IMAGE010
均置0。
排名与点击量函数是依靠搜索排名与点击量计算的分的函数,与搜索排名或者点击量均是成反比的特性;当相关关键词的搜索排名为第一时,排名与点击量函数取值100,此时不必考虑点击量;当不同的相关关键词具有相同的搜索排名时,点击量越少的相关关键词的得分越高;当不同的相关关键词具有相同的点击量时,排名更靠前的相关关键词具有更高的得分。将排名与点击量函数写成
Figure 654751DEST_PATH_IMAGE033
,D的值为100;
Figure 760110DEST_PATH_IMAGE013
为搜索排名,
Figure 771928DEST_PATH_IMAGE034
;注意此处搜索排名
Figure 329948DEST_PATH_IMAGE013
与前述
Figure 452625DEST_PATH_IMAGE004
的取值范围不同。由图3可知,在前半段曲线下降速度很快,因此需要缩小分母,此处引入一个与
Figure 927338DEST_PATH_IMAGE035
自身相关的系数,初步将检索排名与点击量函数改写成
Figure 844478DEST_PATH_IMAGE036
;由于该模型对点击量不够敏感,故在分子与分母的前半段分别乘以点击量
Figure 420953DEST_PATH_IMAGE012
,点击量
Figure 81742DEST_PATH_IMAGE012
的取值范围为(0,+∞);分母的后半段乘以
Figure 161693DEST_PATH_IMAGE012
的对数使其既不会过大改变结果,又不至于被约分掉,并截取图3曲线的右段部分,即以cut为起点截取起点右侧的部分曲线,改进后的模型为
Figure 515314DEST_PATH_IMAGE038
;cut的取值范围为[1,2,…,10];作为本方案的一种优选的实施方式,当cut=1时,并截取点击量10以后的曲线,则检索排名与点击量函数表达式可以改写为:
Figure 64238DEST_PATH_IMAGE039
作为本方案的另一种优选方式,可以令cut取值为10。
增量与基数函数的要求是依靠增量
Figure 528718DEST_PATH_IMAGE018
与基数
Figure 463175DEST_PATH_IMAGE019
计算得分的函数;设计为分段曲线,当增量
Figure 987698DEST_PATH_IMAGE018
小于1000时,增量与基数函数为抛物线函数,当增量
Figure 7606DEST_PATH_IMAGE018
等于1000时,不必考虑基数
Figure 525044DEST_PATH_IMAGE019
,给定增量与基数函数的相关关键词得分为
Figure 314009DEST_PATH_IMAGE020
为k,k<100;当增量大于等于1000后,增量与基数函数为反比例函数。且该函数需要满足如下特性:除开增量
Figure 275011DEST_PATH_IMAGE018
等于1000的情形,当不同的相关关键词具有相同的基数时,增量更大的相关关键词的得分更高;当不同的相关关键词具有相同的增量时,基数小的相关关键词得分更高;当不同的相关关键词具有不相同的基数与增量,且具有相同的增长倍数时,基数大的相关关键词的得分更高,此处的增长倍数是增量
Figure 516637DEST_PATH_IMAGE018
与基数
Figure 322919DEST_PATH_IMAGE019
的比值。
如图4所示,假定k=20,增量与基数函数计算的相关关键词得分
Figure 497548DEST_PATH_IMAGE020
的最大值为100,即相关关键词得分
Figure 114606DEST_PATH_IMAGE020
在增量
Figure 109106DEST_PATH_IMAGE018
无穷大处收敛于100。分段函数的前一段具有开口向上的抛物线的特性,其表达式简写为为
Figure 719079DEST_PATH_IMAGE040
;在增量
Figure 482636DEST_PATH_IMAGE018
取值[0,1000]的范围内,该端抛物线具有固定的端点,即(0,0)和(1000,20),可求得抛物线的系数为E=2×10-5;为调整增量
Figure 254283DEST_PATH_IMAGE018
小于1000时抛物线函数非端点位置的斜率,在此引入一个1与正弦函数的差值项,因为正弦函数在半个周期内具有首尾端点值不变的特性;同时为了控制正弦函数的变化速度,进一步使正弦函数除以一个设定系数,这里采用对数函数作为分母。在增量
Figure 256786DEST_PATH_IMAGE018
取值[1000,+∞]的范围内,令该分段反比例函数的表达式为
Figure 404871DEST_PATH_IMAGE041
,G=100;在k=20时,
Figure 288513DEST_PATH_IMAGE042
的取值范围为[—80,0];k=20时,对应的增量
Figure 496640DEST_PATH_IMAGE018
在1600附近;另外,在该分段增量
Figure 465733DEST_PATH_IMAGE018
的最小值为1000,表达式中需要减去1000,因此将该段反比例函数的表达式改写为:
Figure 151930DEST_PATH_IMAGE043
,但是该表达式与基数
Figure 906390DEST_PATH_IMAGE019
无关;因基数
Figure 19840DEST_PATH_IMAGE019
对相关关键词得分
Figure 476229DEST_PATH_IMAGE020
起负面影响,分数部分还与增长倍数,即增量
Figure 966116DEST_PATH_IMAGE018
与基数
Figure 558771DEST_PATH_IMAGE019
的比值有关联,故将该段反比例函数的自变量
Figure 623548DEST_PATH_IMAGE044
,引入一个与基数
Figure 301654DEST_PATH_IMAGE019
相关联的对数项,得到该段反比例函数的表达式。具体的,增量与基数函数的相关关键词得分
Figure 329653DEST_PATH_IMAGE020
的分段表达式为:
Figure 42394DEST_PATH_IMAGE046
根据输入的增量
Figure 28805DEST_PATH_IMAGE018
与基数
Figure 194207DEST_PATH_IMAGE019
即可选择不同分段函数来计算对应的相关关键词得分
Figure 42208DEST_PATH_IMAGE020
S4:通过上述构建的三个函数对所有相关关键词进行计算,得到相关关键词的排名与关键词覆盖率函数的得分、排名与点击量函数的得分或者增量与基数函数的得分;
S5:从相关关键词词库中选取不同的相关关键词进行组合得到商品标题,对商品标题内的各相关关键词的得分进行累计求和,即对各相关关键词分别利用排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数求取对应的相关关键词得分并依次累加,得到各种相关关键词组合情形的商品标题的总得分。
如果标题具有多个相关关键词,对每一个相关关键字进行上述计算,并求和得到商品特征的描述信息中相关关键词的总分。通常,宣传标题有字数限制,或者在图幅中占有面积不能过大,通过选择有限总字数或者不超过图幅总面积一定比例情形下,将各类输入的商品特征的描述信息进行相关关键词的分数求和的排名,直观感受标题优化的预估推广效果,能改善现有商家盲目拆词和自由组合时,难以获得较好的搜索排名的现状。
下面以某品牌手机的商品标题作为实例,简述本方案的实现过程。
S10:获取商品标题相关联的用于描述商品特征的描述信息;输入具体商品对象的标题前,可以重复观测商品的大小、颜色、型号或者具体参数,来作为描述信息,如标题名称为:A品牌手机5G拍照手机官网智能手机;简介:品牌:A;产品名称:手机;名称:5G数字移动电话;机身颜色:白色/灰色/蓝色;运行内存:8GB/12GB;存储容量:128GB/256GB/512GB;网络模式:双卡双待;CPU型号:骁龙888;屏幕类型:电容屏、多点触控、直板;屏幕尺寸:6.18英寸/6.53英寸;摄像头类型:四摄像头,前一后三。
S20:从获取的商品特征的描述信息中得到相关关键词,由全部相关关键词组成相关关键词词库;用户查阅到商品特征的描述信息,利用lucene全文搜索得到标题关键词,对标题关键词进行索引、查询并进行拆词处理得到相关关键词,由全部相关关键词构成相关关键词词库。还是以A品牌手机为例,输入上述商品特征的描述信息后,通过拆词,得到了标题关键词如A品牌、手机、拍照、官网、智能以及对应的参数;通过搜索对应的词,得到大量的相关关键词,将全部相关关键词组成相关关键词词库。
S30:建立排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数;该部分内容可参见前述推导过程。参照附图2—4所示,根据获取的相关关键词和预置的排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数,如相关关键词为:A品牌手机,其覆盖率0.2,排名为1,商品发布前或者商品发布后一段时期获取的网络总的点击量为50000,增量2000,基数为10这里的增量可以理解为商品发布前或者商品发布后一段时期内固定时间间隔内的点击量增量,如日点击量或者周点击量,根据排名与关键词覆盖率函数
Figure 343877DEST_PATH_IMAGE047
求得该相关关键词的得分为100分;同时,根据排名与点击量函数
Figure 235609DEST_PATH_IMAGE011
得到的得分为100分;根据增量与基数函数计算的相关关键词得分为48.91分。
S40:通过上述构建的三个函数对所有相关关键词进行计算,得到相关关键词的排名与覆盖率、点击量或者增量相互影响下的相关关键词的分数;对相关关键词为:A品牌手机的各项得分进行累加,即该相关关键词的总得分248.91分。
S50:从相关关键词词库中选取不同的相关关键词进行组合得到商品标题,对商品标题内的各相关关键词的得分进行累计求和。从以上计算过程可以看出,相关关键词A品牌手机为商品标题“A品牌手机5G拍照手机官网智能手机”获取了248.91分,但是并不是商品标题的总得分,需要将该商品标题内的所有相关关键词分别进行上述计算并求和后得到商品标题的总体得分。用户可以根据需要,在一定篇幅内,输入特定的相关关键词组合,来获取最高的分数及较高的排名,从而为商品带来更多流量,便于被目标群体检索。
这里还可以进一步设定在一定字体下,商品标题每行水平长度不超过移动设备的屏幕宽度的0.8倍,或者限制商品标题的内容不超过图幅面积20%—30%,从而限定商标标题的篇幅长度或者面积,在尽可能少的关键词组合下得到更高的商品标题的总体得分。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种商品标题优化中关键词得分的计算方法,其特征在于,包括如下步骤,
S1:获取商品标题相关联的用于描述商品特征的描述信息;
S2:从获取的商品特征的描述信息中得到相关关键词,由全部相关关键词组成相关词词库;
S3:建立排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数;
S4:通过上述构建的三个函数对所有相关关键词进行计算,得到相关关键词的排名与关键词覆盖率函数的得分、排名与点击量函数的得分或者增量与基数函数的得分;
S5:从相关关键词词库中选取不同的相关关键词进行组合得到商品标题,对商品标题内的各相关关键词的得分进行累计求和,即对各相关关键词分别利用排名与关键词覆盖率函数、排名与点击量函数和增量与基数函数求取对应的相关关键词得分并依次累加,得到各种相关关键词组合情形的商品标题的总得分。
2.根据权利要求1所述的一种商品标题优化中关键词得分的计算方法,其特征在于,步骤S2中所述获取商品特征的描述信息中的标题关键词,是通过lucene全文搜索得到标题关键词,对标题关键词进行索引、查询并进行拆词处理得到相关关键词。
3.根据权利要求1所述的一种商品标题优化中关键词得分的计算方法,其特征在于,所述排名与关键词覆盖率函数,是令函数表达式为:
Figure 282821DEST_PATH_IMAGE001
;其中
Figure 130691DEST_PATH_IMAGE002
为指定排名零点,
Figure 790342DEST_PATH_IMAGE003
Figure 873705DEST_PATH_IMAGE004
为搜索排名,
Figure 669623DEST_PATH_IMAGE005
Figure 688394DEST_PATH_IMAGE006
为最大覆盖率,
Figure 835342DEST_PATH_IMAGE007
Figure 971663DEST_PATH_IMAGE008
为覆盖率,
Figure 887666DEST_PATH_IMAGE009
;求得的排名与关键词覆盖率相互影响下的相关关键词得分
Figure 811760DEST_PATH_IMAGE010
≤100。
4.根据权利要求3所述的一种商品标题优化中关键词得分的计算方法,其特征在于,当不同的相关关键词具有相同的搜索排名时,且搜索排名不超过指定排名零点
Figure 446003DEST_PATH_IMAGE002
时,相关关键词得分
Figure 871169DEST_PATH_IMAGE010
与最大覆盖率
Figure 641679DEST_PATH_IMAGE011
成正比;当不同的相关关键词具有相同的最大覆盖率时,且搜索排名不超过指定排名零点
Figure 736673DEST_PATH_IMAGE002
时,相关关键词得分
Figure 733579DEST_PATH_IMAGE010
与相关关键词的搜索排名成反比。
5.根据权利要求3所述的一种商品标题优化中关键词得分的计算方法,其特征在于,当搜索排名
Figure 837802DEST_PATH_IMAGE012
不小于指定排名零点
Figure 462818DEST_PATH_IMAGE002
时,相关关键词得分
Figure 994294DEST_PATH_IMAGE010
=0。
6.根据权利要求4所述的一种商品标题优化中关键词得分的计算方法,其特征在于,所述排名与点击量函数,是令函数表达式为
Figure DEST_PATH_IMAGE013
;其中
Figure 196605DEST_PATH_IMAGE014
为点击量;
Figure 104518DEST_PATH_IMAGE015
为搜索排名,
Figure 849620DEST_PATH_IMAGE016
;求得相关关键词的排名与点击量函数的得分
Figure 949336DEST_PATH_IMAGE017
;当搜索排名
Figure 779888DEST_PATH_IMAGE015
为1时,相关关键词得分
Figure 225913DEST_PATH_IMAGE017
具有最大值100;相关关键词得分
Figure 825522DEST_PATH_IMAGE017
随着搜索排名增大而降低。
7.根据权利要求4所述的一种商品标题优化中关键词得分的计算方法,其特征在于,所述增量与基数函数,是令
Figure 557855DEST_PATH_IMAGE018
其中,
Figure 875703DEST_PATH_IMAGE019
为增量;
Figure 859840DEST_PATH_IMAGE020
为基数;根据增量
Figure 454900DEST_PATH_IMAGE019
所在的不同区间,采用不同的排名与点击量函数计算相关关键词得分
Figure 499080DEST_PATH_IMAGE021
CN202211024351.7A 2022-08-24 2022-08-24 一种商品标题优化中关键词得分的计算方法 Active CN115169337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211024351.7A CN115169337B (zh) 2022-08-24 2022-08-24 一种商品标题优化中关键词得分的计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211024351.7A CN115169337B (zh) 2022-08-24 2022-08-24 一种商品标题优化中关键词得分的计算方法

Publications (2)

Publication Number Publication Date
CN115169337A CN115169337A (zh) 2022-10-11
CN115169337B true CN115169337B (zh) 2023-02-14

Family

ID=83482142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211024351.7A Active CN115169337B (zh) 2022-08-24 2022-08-24 一种商品标题优化中关键词得分的计算方法

Country Status (1)

Country Link
CN (1) CN115169337B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923694A (zh) * 2009-06-16 2010-12-22 埃森哲环球服务有限公司 用于大众的产品植入
AU2014200552A1 (en) * 2013-02-01 2014-08-21 Uchoose Holdings Ltd A computerized method and software product for customer search and product matching
CN106355432A (zh) * 2016-08-19 2017-01-25 焦点科技股份有限公司 一种付费广告效果监测调控的方法
CN108804541A (zh) * 2018-05-08 2018-11-13 苏州闻道网络科技股份有限公司 电商标题优化系统及优化方法
CN110807083A (zh) * 2018-08-02 2020-02-18 北京京东尚科信息技术有限公司 关键词评估方法和装置
CN111191022A (zh) * 2019-12-27 2020-05-22 苏宁云计算有限公司 商品短标题生成方法及装置
CN111651722A (zh) * 2020-04-08 2020-09-11 西窗科技(苏州)有限公司 一种针对广告主广告投放效果的风险评估方法及平台
CN113220983A (zh) * 2020-02-06 2021-08-06 北京沃东天骏信息技术有限公司 基于深度学习的选品方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103383685A (zh) * 2012-05-02 2013-11-06 腾讯科技(深圳)有限公司 一种基于用户点击数据的关键词属性量化方法及装置
CN104063523B (zh) * 2014-07-21 2017-02-22 焦点科技股份有限公司 一种电子商务搜索评分与排名的方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923694A (zh) * 2009-06-16 2010-12-22 埃森哲环球服务有限公司 用于大众的产品植入
AU2014200552A1 (en) * 2013-02-01 2014-08-21 Uchoose Holdings Ltd A computerized method and software product for customer search and product matching
CN106355432A (zh) * 2016-08-19 2017-01-25 焦点科技股份有限公司 一种付费广告效果监测调控的方法
CN108804541A (zh) * 2018-05-08 2018-11-13 苏州闻道网络科技股份有限公司 电商标题优化系统及优化方法
CN110807083A (zh) * 2018-08-02 2020-02-18 北京京东尚科信息技术有限公司 关键词评估方法和装置
CN111191022A (zh) * 2019-12-27 2020-05-22 苏宁云计算有限公司 商品短标题生成方法及装置
CN113220983A (zh) * 2020-02-06 2021-08-06 北京沃东天骏信息技术有限公司 基于深度学习的选品方法和装置
CN111651722A (zh) * 2020-04-08 2020-09-11 西窗科技(苏州)有限公司 一种针对广告主广告投放效果的风险评估方法及平台

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
Featured Keywords: Enabling Product Discovery in E-Commerce Through Unstructured Product Attributes;Janani Balaji et al;《SIGIR eCom’21》;20210715;1-8 *
Keywords Generation Improves E-Commerce Session-based Recommendation;Yuanxing Liu et al;《Proceedings of The Web Conference 2020》;20200430;1604–1614 *
Research on the Application of Correlation Model in Keyword Optimization of e-Commerce Data Operation;Jiquan Wen;《2019 International Seminar on Education, Teaching, Business and Management》;20191231;327-332 *
TOOR: A Novel Product Title Optimization Method Based on Online Reviews in E-commerce;Liye Wang et al;《Front. Bus. Res.》;20151231;第9卷(第4期);536–558 *
基于淘宝平台的竞价广告自动投放系统设计与实现;徐升;《中国优秀硕士学位论文全文数据库信息科技辑》;20160315(第3期);I138-2907 *
如何进行关键词分析;解忧拾玖;《https://www.zhihu.com/question/355876925》;20191114;1 *
电商平台商品标题优化的有效性及其杠杆机制;袁海霞 等;《北京理工大学学报(社会科学版)》;20191231;第21卷(第2期);116-126 *

Also Published As

Publication number Publication date
CN115169337A (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
US20190139058A1 (en) Analyzing sentiment in product reviews
TWI609278B (zh) Method and system for recommending search words
JP6022056B2 (ja) 検索結果の生成
US10242105B2 (en) Comment ranking by search engine
WO2018053966A1 (zh) 点击率预估
US10489474B1 (en) Techniques to leverage machine learning for search engine optimization
WO2008144444A1 (en) Ranking online advertisements using product and seller reputation
US20160306890A1 (en) Methods and systems for assessing excessive accessory listings in search results
US20210366006A1 (en) Ranking of business object
US9330071B1 (en) Tag merging
CN105468649B (zh) 一种待展示对象匹配的判断方法及其装置
US11682060B2 (en) Methods and apparatuses for providing search results using embedding-based retrieval
TW201401088A (zh) 搜索方法和裝置
CN110706028A (zh) 基于属性特征的商品评价情感分析系统
CN111159341A (zh) 基于用户投资理财偏好的资讯推荐方法及装置
Prasetyo Searching cheapest product on three different e-commerce using k-means algorithm
CN114969566A (zh) 一种距离度量的政务服务事项协同过滤推荐方法
Guo et al. An opinion feature extraction approach based on a multidimensional sentence analysis model
Bang et al. Product recommendation system based on user purchase priority
CN108229990B (zh) 一种广告标题生成方法、装置和设备
US20140201620A1 (en) Method and system for intelligent web site information aggregation with concurrent web site access
CN115169337B (zh) 一种商品标题优化中关键词得分的计算方法
CN112862553A (zh) 一种商品推荐的方法和装置
WO2023159766A1 (zh) 餐饮数据分析方法、装置、电子设备及存储介质
CN116402569A (zh) 基于知识图谱的商品推荐方法、装置、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Unit 202, 3rd Floor, Building 9, West District, No. 9 Linglong Road, Haidian District, Beijing, 100000 RMB

Patentee after: Zhongjiao Changxiang Technology Co.,Ltd.

Country or region after: China

Address before: No. 55, Building 119, No. 12, Zhongguancun South Street, Haidian District, Beijing 100089

Patentee before: Chinese Education Changxiang (Beijing) Technology Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address