CN106933912B - 关键词的获取方法和装置 - Google Patents

关键词的获取方法和装置 Download PDF

Info

Publication number
CN106933912B
CN106933912B CN201511032440.6A CN201511032440A CN106933912B CN 106933912 B CN106933912 B CN 106933912B CN 201511032440 A CN201511032440 A CN 201511032440A CN 106933912 B CN106933912 B CN 106933912B
Authority
CN
China
Prior art keywords
keywords
keyword
preset threshold
index
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201511032440.6A
Other languages
English (en)
Other versions
CN106933912A (zh
Inventor
王天祎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201511032440.6A priority Critical patent/CN106933912B/zh
Publication of CN106933912A publication Critical patent/CN106933912A/zh
Application granted granted Critical
Publication of CN106933912B publication Critical patent/CN106933912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种关键词的获取方法和装置。其中,该方法包括:获取目标时间段内的多个关键词和多个关键词中每个关键词的指标量;根据第一预设阈值从多个关键词中选取中间关键词,确定出中间关键词的指标量,其中,中间关键词为多个关键词中的至少一个;根据多个关键词的指标量的总和,得到第一总指标量;计算中间关键词的指标量的总和,得到第二总指标量;根据第一总指标量和第二总指标量确定中间关键词是否为目标关键词,其中,目标关键词为多个关键词中重要的关键词。本申请解决了现有技术中确定重要关键词的精确度较差的技术问题。

Description

关键词的获取方法和装置
技术领域
本申请涉及计算机领域,具体而言,涉及一种关键词的获取方法和装置。
背景技术
在现有的搜索引擎营销业务系统中,储存大量的搜索关键词。由于关键词的海量积累,大大增加了业务人员分析关键词的强度和难度,使得业务人员难以快速精准地定位大量关键词中重要的关键词。
在现有技术中,业务人员只能按照某一指标对关键词进行排序,然后筛选那些排名靠前的关键词。现有技术中确定重要关键词的方法,导致鲁棒性不足,难以确定和量化关键词在大量关键词中的重要程度,并加大了业务人员的工作量。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种关键词的获取方法和装置,以至少解决解决了现有技术中确定重要关键词的精确度较差的技术问题。
根据本申请实施例的一个方面,提供了一种关键词的获取方法,包括:获取目标时间段内的多个关键词和所述多个关键词中每个关键词的指标量;根据第一预设阈值从所述多个关键词中选取中间关键词,确定出所述中间关键词的指标量,其中,所述中间关键词为所述多个关键词中的至少一个;计算所述多个关键词的指标量的总和,得到第一总指标量;计算所述中间关键词的指标量的总和,得到第二总指标量;根据所述第一总指标量和所述第二总指标量确定所述中间关键词是否为目标关键词,其中,所述目标关键词为所述多个关键词中重要的关键词。
进一步地,根据所述第一总指标量和所述第二总指标量确定所述中间关键词是否为目标关键词包括:计算所述第二总指标量与所述第一总指标量的比值;判断所述比值是否大于或者等于第二预设阈值;在判断出所述比值大于或者等于所述第二预设阈值的情况下,确定所述中间关键词为所述目标关键词。
进一步地,在判断出所述比值小于所述第二预设阈值的情况下,所述方法还包括:调整所述第一预设阈值的大小;根据调整后的所述第一预设阈值重新从所述多个关键词中选取中间关键词,确定出重新选取的中间关键词的指标量;计算所述重新选取的中间关键词指标量的总和,得到重新计算得到的第二总指标量;计算所述重新计算得到的第二总指标量和所述第一总指标量的比值;判断所述重新计算得到的第二总指标量和所述第一总指标量的比值是否大于或者等于所述第二预设阈值;在判断出大于或者等于所述第二预设阈值的情况下,确定所述重新选取的中间关键词为所述目标关键词。
进一步地,在判断出所述比值小于所述第二预设阈值的情况下,所述方法还包括:调整所述第二预设阈值的大小;再次判断所述比值是否大于或者等于重新调整之后的所述第二预设阈值;在判断出所述比值大于或者等于重新调整之后的所述第二预设阈值的情况下,确定所述重新选取的中间关键词为所述目标关键词。
进一步地,根据第一预设阈值从所述多个关键词中选取中间关键词包括:在所述多个关键词中选取指标量大于或者等于所述第一预设阈值的关键词为所述中间关键词;或者按照指标量的大小对所述多个关键词进行排序,在排序队列中选取前n个关键词为所述中间关键词,其中,n为所述第一预设阈值。
根据本申请实施例的另一方面,还提供了一种关键词的获取装置,包括:获取单元,用于获取目标时间段内的多个关键词和所述多个关键词中每个关键词的指标量;选取单元,用于根据第一预设阈值从所述多个关键词中选取中间关键词,确定出所述中间关键词的指标量,其中,所述中间关键词为所述多个关键词中的至少一个;第一计算单元,用于计算所述多个关键词的指标量的总和,得到第一总指标量;第二计算单元,用于计算所述中间关键词的指标量的总和,得到第二总指标量;确定单元,用于根据所述第一总指标量和所述第二总指标量确定所述中间关键词是否为目标关键词,其中,所述目标关键词为所述多个关键词中重要的关键词。
进一步地,所述确定单元包括:第一计算模块,用于计算所述第二总指标量与所述第一总指标量的比值;第一判断模块,用于判断所述比值是否大于第二预设阈值;第一确定模块,用于在判断出所述比值大于或者等于所述第二预设阈值的情况下,确定所述中间关键词为所述目标关键词。
进一步地,所述装置还包括:第一调整模块,用于在所述第一判断模块判断出所述比值小于所述第二预设阈值的情况下,调整所述第一预设阈值的大小;选取模块,用于根据调整后的所述第一预设阈值重新从所述多个关键词中选取中间关键词,确定出重新选取的中间关键词的指标量;第二计算模块,用于计算所述重新选取的中间关键词指标量的总和,得到重新计算得到的第二总指标量;第三计算模块,用于计算所述重新计算得到的第二总指标量和所述第一总指标量的比值;第二判断模块,用于判断所述重新计算得到的第二总指标量和所述第一总指标量的比值是否大于或者等于所述第二预设阈值;第二确定模块,用于在判断出大于或者等于所述第二预设阈值的情况下,确定所述重新选取的中间关键词为所述目标关键词。
进一步地,所述装置还包括:第二调整模块,用于在所述第一判断模块判断出所述比值小于所述第二预设阈值的情况下,调整所述第二预设阈值的大小;第三判断模块,用于再次判断所述比值是否大于或者等于重新调整之后的所述第二预设阈值;第三确定模块,用于在判断出所述比值大于或者等于重新调整之后的所述第二预设阈值的情况下,直至判断出所述比值大于或者等于调整之后的所述第二预设阈值的情况下,确定所述重新选取的中间关键词为所述目标关键词。
进一步地,所述选取单元包括:第四确定模块,用于在所述多个关键词中选取指标量大于或者等于第一预设阈值的关键词为所述中间关键词;或者第五确定模块,用于按照指标量的大小对所述多个关键词进行排序,在排序队列中选取前n个关键词作为所述中间关键词,其中,n为所述第一预设阈值。
在本申请实施例中,采用获取目标时间段内的多个关键词和所述多个关键词中每个关键词的指标量;根据第一预设阈值从所述多个关键词中选取中间关键词,确定出所述中间关键词的指标量,其中,所述中间关键词为所述多个关键词中的至少一个;根据所述多个关键词的指标量的总和,得到第一总指标量;计算所述中间关键词的指标量的总和,得到第二总指标量;根据所述第一总指标量和所述第二总指标量确定所述中间关键词是否为目标关键词,其中,所述目标关键词为所述多个关键词中重要的关键词的方式,通过在获取到的多个关键词中选取中间关键词,并计算中间关键词的指标量的总和(即,第二总指标量)与多个关键词的指标量的总和(即,第一总指标量),进而根据第一总指标量和第二总指标量确定中间关键词是否为目标关键词,即多个关键词中的重要关键词,相对于现有技术中按照多个关键词的指标量对多个关键词进行排序,并在排序队列中选取目标关键词的方法,达到了提高重要关键词确定精度的目的,从而实现了在多个关键词中准确选取出重要关键词的技术效果,进而解决了现有技术中确定重要关键词的精确度较差的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种关键词的获取方法的流程图;以及
图2是根据本申请实施例的一种关键词的获取装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例,提供了一种关键词的获取方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的一种关键词的获取方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取目标时间段内的多个关键词和多个关键词中每个关键词的指标量。
在本申请实施例中,关键词可以为“可口可乐”、“天猫双十一”等词汇,每个关键词的指标量可以为“可口可乐”的点击量,或者“可口可乐”的访问量等指标信息。目标时间段可以选取为一周、一个月或者更长时间,目标时间段可以根据实际需要来选取。
步骤S104,根据第一预设阈值从多个关键词中选取中间关键词,确定出中间关键词的指标量,其中,中间关键词为多个关键词中的至少一个。
步骤S106,根据多个关键词的指标量的总和,得到第一总指标量。
具体地,多个关键词的指标量均为相同指标的值,例如,“可口可乐”的点击量,“天猫双十一”的点击量;或者“可口可乐”的访问量,“天猫双十一”的访问量等信息。
步骤S108,计算中间关键词的指标量的总和,得到第二总指标量。
具体地,中间关键词的指标量同样均为相同指标的值,如步骤S106所描述,此处不再赘述。
步骤S110,根据第一总指标量和第二总指标量确定中间关键词是否为目标关键词,其中,目标关键词为多个关键词中重要的关键词。
在本申请实施例中,通过结合考虑第一总指标量和第二总指标量,可以反映出中间关键词在多个关键词中的重要程度,进而根据该重要程度确定中间关键词是否为目标关键词,即多个关键词中重要的关键词。
在本申请实施例中,通过在获取到的多个关键词中选取中间关键词,并计算中间关键词的指标量的总和(即,第二总指标量)与多个关键词的指标量的总和(即,第一总指标量),进而根据第一总指标量和第二总指标量确定中间关键词是否为目标关键词,即多个关键词中的重要关键词,相对于现有技术中按照多个关键词的指标量对多个关键词进行排序,并在排序队列中选取目标关键词的方法,达到了提高重要关键词确定精度的目的,从而实现了在多个关键词中准确选取出重要关键词的技术效果,进而解决了现有技术中确定重要关键词的精确度较差的技术问题。
通过第一总指标量和第二总指标量判断中间关键词是否为目标关键词的方式可以有很多种,在本申请实施例中,可以通过下述步骤确定目标关键词:
步骤S1101,计算第二总指标量与第一总指标量的比值。
步骤S1103,判断比值是否大于第二预设阈值。
步骤S1105,在判断出比值大于或者等于第二预设阈值的情况下,确定中间关键词为目标关键词。
具体地,中间关键词的数量为a,第二总指标量为x,多个关键词的数量为b,第一总指标量为y,第二预设阈值为K。
计算x与y的比值,即x/y,判断x/y≥K是否成立,如果x/y≥K,则确定出该中间关键词中的每个关键词均为目标关键词,即重要关键词。在本申请实施例中,第二预设阈值K为目标关键词在多个关键词中重要程度的最小值,在一般情况下,K为小于等于1,且大于0的数值。
例如,b=100,a=10,x=9900,y=10000,K=0.8,通过计算可知x/y=9900/10000=0.99,判断可知,0.99>0.8,则确定在100个关键词中选取的10个中间关键词为目标关键词。
在本申请实施例中,并不局限于通过上述步骤S1101至步骤S1105所描述的方法判断中间关键词是否为目标关键词,还可以通过其他的方法判断中间关键词是否为目标关键词,例如,通过下述方式进行判断:
方式一:
计算第一总指标量和第二总指标量的差值;判断该差值是否小于或者等于第二预设阈值;在判断出该差值小于或者等于第二预设阈值的情况下,确定该中间关键词为目标关键词。
在方式一中,第二预设阈值同样为目标关键词在多个关键词中重要程度的最小值,但是,在方式一中,第二预设阈值还可以理解为:第一总指标量和第二总指标量的差值的最小值。
方式二:
计算第一总指标量的平均值和第二总指标量的平均值;计算第二总指标量的平均值和第一总指标量的平均值的比值;判断比值是否大于或者等于第二预设阈值;在判断出比值大于或者等于第二预设阈值的情况下,确定中间关键词为目标关键词。
在方式二中,第二预设阈值同样为目标关键词在多个关键词中重要程度的最小值,但是,第二预设阈值不同于上述方式一中的第二预设阈值和步骤S1101至步骤S1105中的第二预设阈值,在方式二中,该第二预设阈值为大于等于1的数值,且小于等于100的数值。
例如,b=100,a=10,x=9900,y=10000,则计算第一总指标量的平均值y/b=100,计算第二总指标量的平均值为x/a=99,计算(x/a)/(y/b)=99,其中,可以设定第二预设阈值为80。通过判断可知,99>80,即可确定该中间关键词为目标关键词。
根据第一预设阈值从多个关键词中选取中间关键词的方法可以有很多种,在本申请实施例中,可以在多个关键词中选取指标量大于或者等于第一预设阈值的关键词为中间关键词;或者按照指标量的大小对多个关键词进行排序,在排序队列中选取前n个关键词为中间关键词,其中,n为第一预设阈值。
具体地,第一预设阈值可以选取为指标量的阈值,即在选取中间关键词时,可以按照设定的第一预设阈值在多个关键词中选取指标量满足第一预设阈值的关键词。当关键词的指标量差异较大时,若采用本方法选取中间关键词,则需调整第一预设阈值的大小,因此具有一定的局限性。
除上述方法之外,还可以将第一预设阈值选取一个百分比,例如,按照指标量的大小对多个关键次进行排序,得到一个排序队列,在该排序队列中选取前10%的关键词为中间关键词,则该10%即为第一预设阈值。
需要说明的是,通过第一预设阈值在多个关键词中选取中间关键词的方法并不局限于上述描述的方法,还可以通过其他的方式进行中间关键词的选取。
可选地,在判断出比值小于第二预设阈值的情况下,本申请实施例所提供的关键词的获取方法还包括如下步骤:
步骤S1,调整第一预设阈值的大小。
步骤S2,根据调整后的第一预设阈值重新从多个关键词中选取中间关键词,确定出重新选取的中间关键词的指标量。
步骤S3,计算重新选取的中间关键词指标量的总和,得到重新计算得到的第二总指标量。
步骤S4,计算重新计算得到的第二总指标量和第一总指标量的比值。
步骤S5,判断重新计算得到的第二总指标量和第一总指标量的比值是否大于或者等于第二预设阈值。
步骤S6,在判断出大于或者等于第二预设阈值的情况下,确定重新选取的中间关键词为目标关键词。
具体地,若判断出上述计算出的比值(或者差值、平均值)小于第二预设阈值的情况下,需重新调整第一预设阈值的大小,或者重新调整第二预设阈值的大小。
现以调整第一预设阈值为例进行说明。若第一预设阈值为指标量的阈值时,则可以减小第一预设阈值。减小第一预设阈值之后,按照第一预设阈值在多个关键词中重新选取中间关键词,此时,重新选取的中间关键词的数量将增大。重新选取中间关键词之后,重新计算第一总指标量和第二总指标量,并重新计算第一总指标量和第二总指标量的比值(或者差值、平均值等)。通过计算可知,重新计算出的比值增大(或者重新计算出的差值减小、重新计算出的平均值增大)。若判断出重新计算出的比值(或者差值、平均值等)满足第二预设阈值时,即可确定重新选取的中间关键词为目标关键词。
若第一预设阈值为百分比时,则可以增大第一预设阈值。增大第一预设阈值之后,按照第一预设阈值在多个关键词中重新选取中间关键词,此时,重新选取的中间关键词的数量将增大。重新选取中间关键词之后,重新计算第一总指标量和第二总指标量,并重新计算第一总指标量和第二总指标量的比值(或者差值、平均值等)。通过计算可知,重新计算出的比值增大(或者重新计算出的差值减小、重新计算出的平均值增大)。若判断出重新计算出的比值(或者差值、平均值等)满足第二预设阈值时,即可确定重新选取的中间关键词为目标关键词。
通过上述方法调整第一预设阈值可以快速并准确地在多个关键词中确定重要的关键词,避免了重要关键词的丢失。
可选地,在判断出比值小于第二预设阈值的情况下,本申请实施例所提供的关键词的获取方法还包括如下步骤:
S7,调整第二预设阈值的大小。
S8,再次判断比值是否大于或者等于重新调整之后的第二预设阈值。
S9,在判断出比值大于或者等于重新调整之后的第二预设阈值的情况下,直至判断出比值大于或者等于调整之后的第二预设阈值。
具体地,除上述调整第一预设阈值的大小之外,还可以调整第二预设阈值的大小。若计算第一总指标量和第二总指标量的比值(或者平均值),则可以减小第二预设阈值的大小,然后,再次判断比值与调整之后的第二预设阈值的大小,若判断出比值仍小于第二预设阈值则继续调整第二预设阈值的大小,直至判断出比值大于或者等于第二预设阈值。
若计算第一总指标量和第二总指标量的比值,则可以增大第二预设阈值的大小,然后,再次判断比值与调整之后的第二预设阈值的大小,若判断出比值仍小于第二预设阈值则继续调整第二预设阈值的大小,直至判断出比值大于或者等于第二预设阈值。
需要说明的是,除上述调整第一预设阈值或者调整第二预设阈值之外,还可以考虑调整第一预设阈值和第二预设阈值。例如,增大第一预设阈值至某一个值时,若上述计算出的比值仍不满足第二预设阈值,则可以相应地调整第二预设阈值。
若业务人员想要筛选一段时间内展现高的关键词,通过现有将关键词按高至低降序排列的方法,但难以确定一个合理的阈值,例如,取前10%或前100个关键词,都不是一个鲁棒性强的做法,且不能量化这批筛选出的关键词在总体中的重要程度。通过本申请提出的关键词的获取方法,业务人员不仅可以定义一个标准度量,还可以验证这个度量的可行性,以及这个度量可以获取多大的指标重要性占比。例如,业务人员预期获得的目标关键词的数量不超过多个关键词的10%,但是目标关键词的总展现量需为多个关键词的总体展现量90%以上,通过本申请提供的方法可以告知业务人员该预期是否可实现,而且可以输出重要关键词,以及当未输出重要关键词时,可以建议调整第一预设阈值或者第二预设阈值。
本申请实施例还提供了一种关键词的获取装置,该获取装置主要用于执行本申请实施例上述内容所提供的关键词的获取方法,以下对本申请实施例所提供的关键词的获取装置做具体介绍。
图2是根据本申请实施例的一种关键词的获取装置的示意图,如图2所示,该关键词的获取装置主要包括获取单元10、选取单元20、第一计算单元30、第二计算单元40和确定单元50,其中:
获取单元10,用于获取目标时间段内的多个关键词和多个关键词中每个关键词的指标量。
在本申请实施例中,关键词可以为“可口可乐”、“天猫双十一”等词汇,每个关键词的指标量可以为“可口可乐”的点击量,或者“可口可乐”的访问量等指标信息。
选取单元20,用于根据第一预设阈值从多个关键词中选取中间关键词,确定出中间关键词的指标量,其中,中间关键词为多个关键词中的至少一个。
第一计算单元30,用于计算多个关键词的指标量的总和,得到第一总指标量。
具体地,多个关键词的指标量均为相同指标的值,例如,“可口可乐”的点击量,“天猫双十一”的点击量;或者“可口可乐”的访问量,“天猫双十一”的访问量等信息。
第二计算单元40,用于计算中间关键词的指标量的总和,得到第二总指标量。
具体地,中间关键词的指标量同样均为相同指标的值,如步骤S106所描述,此处不再赘述。
确定单元50,用于根据第一总指标量和第二总指标量确定中间关键词是否为目标关键词,其中,目标关键词为多个关键词中重要的关键词。
在本申请实施例中,通过结合考虑第一总指标量和第二总指标量,可以反映出中间关键词在多个关键词中的重要程度,进而根据该重要程度确定中间关键词是否为目标关键词,即多个关键词中重要的关键词。
在本申请实施例中,通过在获取到的多个关键词中选取中间关键词,并计算中间关键词的指标量的总和(即,第二总指标量)与多个关键词的指标量的总和(即,第一总指标量),进而根据第一总指标量和第二总指标量确定中间关键词是否为目标关键词,即多个关键词中的重要关键词,相对于现有技术中按照多个关键词的指标量对多个关键词进行排序,并在排序队列中选取目标关键词的方法,达到了提高重要关键词确定精度的目的,从而实现了在多个关键词中准确选取出重要关键词的技术效果,进而解决了现有技术中确定重要关键词的精确度较差的技术问题。
可选地,确定单元50包括:第一计算模块,用于计算第二总指标量与第一总指标量的比值;第一判断模块,用于判断比值是否大于第二预设阈值;第一确定模块,用于在判断出比值大于或者等于第二预设阈值的情况下,确定中间关键词为目标关键词。
具体地,中间关键词的数量为a,第二总指标量为x,多个关键词的数量为b,第一总指标量为y,第二预设阈值为K。
计算x与y的比值,即x/y,判断x/y≥K是否成立,如果x/y≥K,则确定出该中间关键词中的每个关键词均为目标关键词,即重要关键词。在本申请实施例中,第二预设阈值K为目标关键词在多个关键词中重要程度的最小值,在一般情况下,K为小于等于1,且大于0的数值。
可选地,选取单元20包括:第四确定模块,用于在多个关键词中选取指标量大于或者等于第一预设阈值的关键词为中间关键词;或者第五确定模块,用于按照指标量的大小对多个关键词进行排序,在排序队列中选取前n个关键词作为中间关键词,其中,n为第一预设阈值。
具体地,第一预设阈值可以选取为指标量的阈值,即在选取中间关键词时,可以按照设定的第一预设阈值在多个关键词中选取指标量满足第一预设阈值的关键词。当关键词的指标量差异较大时,若采用本方法选取中间关键词,则需调整第一预设阈值的大小,因此具有一定的局限性。
可选地,在第一判断模块判断出比值小于第二预设阈值的情况下,该获取装置还包括:第一调整模块,用于调整第一预设阈值的大小;选取模块,用于根据调整后的第一预设阈值重新从多个关键词中选取中间关键词,确定出重新选取的中间关键词的指标量;第二计算模块,用于计算重新选取的中间关键词指标量的总和,得到重新计算得到的第二总指标量;第三计算模块,用于计算重新计算得到的第二总指标量和第一总指标量的比值;第二判断模块,用于判断重新计算得到的第二总指标量和第一总指标量的比值是否大于或者等于第二预设阈值;第二确定模块,用于在判断出大于或者等于第二预设阈值的情况下,确定重新选取的中间关键词为目标关键词。
具体地,若判断出计算出的比值(或者差值、平均值)小于第二预设阈值,则通过调用第一调整模块调整第一预设阈值的大小,调整之后,通过调用选取模块重选选取中间关键词,并通过调用第二计算模块计算重新选取的中间关键词的第二总指标量,并通过调用第三计算模块重新计算第一总指标量和第二总指标量的比值(或者差值、平均值),进而判断重新计算出的比值(或者差值、平均值)是否大于或者等于第二预设阈值,若大于或者等于第二预设阈值,则输出目标关键词;若仍小于第二预设阈值,则通过第一调整模块继续调整第一预设阈值的大小。
可选地,在第一判断模块判断出比值小于第二预设阈值的情况下,该获取装置还包括:第二调整模块,用于调整第二预设阈值的大小;第三判断模块,用于再次判断比值是否大于或者等于重新调整之后的第二预设阈值;第三确定模块,用于在判断出比值大于或者等于重新调整之后的第二预设阈值的情况下,直至判断出比值大于或者等于调整之后的第二预设阈值的情况下,确定中间关键词为目标关键词。
具体地,若判断出计算出的比值(或者差值、平均值)小于第二预设阈值,则通过调用第二调整模块调整第二预设阈值的大小,调整之后,通过调用第三判断判断计算出的比值(或者差值、平均值)是否大于或者等于调整之后的第二预设阈值,若大于或者等于第二预设阈值,则输出目标关键词;若仍小于第二预设阈值,则通过第二调整模块继续调整第二预设阈值的大小。
所述关键词的获取装置包括处理器和存储器,上述获取单元10、选取单元20、第一计算单元30、第二计算单元40和确定单元50等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高重要关键词确定精度,从而实现了在多个关键词中准确选取出重要关键词的技术效果,进而解决了现有技术中确定重要关键词的精确度较差的技术问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取目标时间段内的多个关键词和所述多个关键词中每个关键词的指标量;根据第一预设阈值从所述多个关键词中选取中间关键词,确定出所述中间关键词的指标量,其中,所述中间关键词为所述多个关键词中的至少一个;根据所述多个关键词的指标量的总和,得到第一总指标量;计算所述中间关键词的指标量的总和,得到第二总指标量;根据所述第一总指标量和所述第二总指标量确定所述中间关键词是否为目标关键词,其中,所述目标关键词为所述多个关键词中重要的关键词。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (8)

1.一种关键词的获取方法,其特征在于,包括:
获取目标时间段内的多个关键词和所述多个关键词中每个关键词的指标量;
根据第一预设阈值从所述多个关键词中选取中间关键词,确定出所述中间关键词的指标量,其中,所述中间关键词为所述多个关键词中的至少一个;
计算所述多个关键词的指标量的总和,得到第一总指标量;
计算所述中间关键词的指标量的总和,得到第二总指标量;
根据所述第一总指标量和所述第二总指标量确定所述中间关键词是否为目标关键词,其中,所述目标关键词为所述多个关键词中重要的关键词,
其中,根据所述第一总指标量和所述第二总指标量确定所述中间关键词是否为目标关键词包括:计算所述第二总指标量与所述第一总指标量的比值;判断所述比值是否大于或者等于第二预设阈值;在判断出所述比值大于或者等于所述第二预设阈值的情况下,确定所述中间关键词为所述目标关键词。
2.根据权利要求1所述的方法,其特征在于,在判断出所述比值小于所述第二预设阈值的情况下,所述方法还包括:
调整所述第一预设阈值的大小;
根据调整后的所述第一预设阈值重新从所述多个关键词中选取中间关键词,确定出重新选取的中间关键词的指标量;
计算所述重新选取的中间关键词指标量的总和,得到重新计算得到的第二总指标量;
计算所述重新计算得到的第二总指标量和所述第一总指标量的比值;
判断所述重新计算得到的第二总指标量和所述第一总指标量的比值是否大于或者等于所述第二预设阈值;
在判断出大于或者等于所述第二预设阈值的情况下,确定所述重新选取的中间关键词为所述目标关键词。
3.根据权利要求1所述的方法,其特征在于,在判断出所述比值小于所述第二预设阈值的情况下,所述方法还包括:
调整所述第二预设阈值的大小;
再次判断所述比值是否大于或者等于重新调整之后的所述第二预设阈值;
在判断出所述比值大于或者等于重新调整之后的所述第二预设阈值的情况下,确定所述重新选取的中间关键词为所述目标关键词。
4.根据权利要求1所述的方法,其特征在于,根据第一预设阈值从所述多个关键词中选取中间关键词包括:
在所述多个关键词中选取指标量大于或者等于所述第一预设阈值的关键词为所述中间关键词;或者
按照指标量的大小对所述多个关键词进行排序,在排序队列中选取前n个关键词为所述中间关键词,其中,n为所述第一预设阈值。
5.一种关键词的获取装置,其特征在于,包括:
获取单元,用于获取目标时间段内的多个关键词和所述多个关键词中每个关键词的指标量;
选取单元,用于根据第一预设阈值从所述多个关键词中选取中间关键词,确定出所述中间关键词的指标量,其中,所述中间关键词为所述多个关键词中的至少一个;
第一计算单元,用于计算所述多个关键词的指标量的总和,得到第一总指标量;
第二计算单元,用于计算所述中间关键词的指标量的总和,得到第二总指标量;
确定单元,用于根据所述第一总指标量和所述第二总指标量确定所述中间关键词是否为目标关键词,其中,所述目标关键词为所述多个关键词中重要的关键词,
所述确定单元包括:第一计算模块,用于计算所述第二总指标量与所述第一总指标量的比值;第一判断模块,用于判断所述比值是否大于第二预设阈值;第一确定模块,用于在判断出所述比值大于或者等于所述第二预设阈值的情况下,确定所述中间关键词为所述目标关键词。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第一调整模块,用于在所述第一判断模块判断出所述比值小于所述第二预设阈值的情况下,调整所述第一预设阈值的大小;
选取模块,用于根据调整后的所述第一预设阈值重新从所述多个关键词中选取中间关键词,确定出重新选取的中间关键词的指标量;
第二计算模块,用于计算所述重新选取的中间关键词指标量的总和,得到重新计算得到的第二总指标量;
第三计算模块,用于计算所述重新计算得到的第二总指标量和所述第一总指标量的比值;
第二判断模块,用于判断所述重新计算得到的第二总指标量和所述第一总指标量的比值是否大于或者等于所述第二预设阈值;
第二确定模块,用于在判断出大于或者等于所述第二预设阈值的情况下,确定所述重新选取的中间关键词为所述目标关键词。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第二调整模块,用于在所述第一判断模块判断出所述比值小于所述第二预设阈值的情况下,调整所述第二预设阈值的大小;
第三判断模块,用于再次判断所述比值是否大于或者等于重新调整之后的所述第二预设阈值;
第三确定模块,用于在判断出所述比值大于或者等于重新调整之后的所述第二预设阈值的情况下,直至判断出所述比值大于或者等于调整之后的所述第二预设阈值的情况下,确定所述重新选取的中间关键词为所述目标关键词。
8.根据权利要求5所述的装置,其特征在于,所述选取单元包括:
第四确定模块,用于在所述多个关键词中选取指标量大于或者等于第一预设阈值的关键词为所述中间关键词;或者
第五确定模块,用于按照指标量的大小对所述多个关键词进行排序,在排序队列中选取前n个关键词作为所述中间关键词,其中,n为所述第一预设阈值。
CN201511032440.6A 2015-12-31 2015-12-31 关键词的获取方法和装置 Active CN106933912B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511032440.6A CN106933912B (zh) 2015-12-31 2015-12-31 关键词的获取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511032440.6A CN106933912B (zh) 2015-12-31 2015-12-31 关键词的获取方法和装置

Publications (2)

Publication Number Publication Date
CN106933912A CN106933912A (zh) 2017-07-07
CN106933912B true CN106933912B (zh) 2020-07-03

Family

ID=59444495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511032440.6A Active CN106933912B (zh) 2015-12-31 2015-12-31 关键词的获取方法和装置

Country Status (1)

Country Link
CN (1) CN106933912B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109727049A (zh) * 2017-10-31 2019-05-07 北京国双科技有限公司 指标变化率分析方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446171A (zh) * 2010-09-30 2012-05-09 百度在线网络技术(北京)有限公司 基于加权平均点进率评测推广关键词质量度的方法与设备
CN102890725A (zh) * 2012-11-02 2013-01-23 瑞庭网络技术(上海)有限公司 搜索引擎的结果排序方法
CN102929873A (zh) * 2011-08-08 2013-02-13 腾讯科技(深圳)有限公司 一种基于情境搜索提取搜索价值词的方法及装置
CN102930054A (zh) * 2012-11-19 2013-02-13 北京奇虎科技有限公司 数据搜索方法及系统
CN103399901A (zh) * 2013-07-25 2013-11-20 三星电子(中国)研发中心 一种关键词抽取方法
CN103593350A (zh) * 2012-08-14 2014-02-19 阿里巴巴集团控股有限公司 一种推荐推广关键词价格参数的方法和装置
CN103593444A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 网络关键词识别处理方法和装置
CN103678366A (zh) * 2012-09-14 2014-03-26 腾讯科技(深圳)有限公司 为浏览器提供推荐信息的方法及服务器
CN104408191A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 关键词的关联关键词的获取方法和装置
CN104715022A (zh) * 2015-02-28 2015-06-17 北京奇艺世纪科技有限公司 一种相关搜索方法和装置
CN105069102A (zh) * 2015-08-03 2015-11-18 百度在线网络技术(北京)有限公司 信息推送方法和装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446171A (zh) * 2010-09-30 2012-05-09 百度在线网络技术(北京)有限公司 基于加权平均点进率评测推广关键词质量度的方法与设备
CN102929873A (zh) * 2011-08-08 2013-02-13 腾讯科技(深圳)有限公司 一种基于情境搜索提取搜索价值词的方法及装置
CN103593350A (zh) * 2012-08-14 2014-02-19 阿里巴巴集团控股有限公司 一种推荐推广关键词价格参数的方法和装置
CN103678366A (zh) * 2012-09-14 2014-03-26 腾讯科技(深圳)有限公司 为浏览器提供推荐信息的方法及服务器
CN102890725A (zh) * 2012-11-02 2013-01-23 瑞庭网络技术(上海)有限公司 搜索引擎的结果排序方法
CN102930054A (zh) * 2012-11-19 2013-02-13 北京奇虎科技有限公司 数据搜索方法及系统
CN103399901A (zh) * 2013-07-25 2013-11-20 三星电子(中国)研发中心 一种关键词抽取方法
CN103593444A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 网络关键词识别处理方法和装置
CN104408191A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 关键词的关联关键词的获取方法和装置
CN104715022A (zh) * 2015-02-28 2015-06-17 北京奇艺世纪科技有限公司 一种相关搜索方法和装置
CN105069102A (zh) * 2015-08-03 2015-11-18 百度在线网络技术(北京)有限公司 信息推送方法和装置

Also Published As

Publication number Publication date
CN106933912A (zh) 2017-07-07

Similar Documents

Publication Publication Date Title
KR101999471B1 (ko) 정보 추천 방법 및 장치
CN106156791B (zh) 业务数据分类方法和装置
CN106294508B (zh) 一种刷量工具检测方法及装置
US20180246962A1 (en) Playlist list determining method and device, electronic apparatus, and storage medium
CN106936778B (zh) 网站流量异常的检测方法和装置
CN110704677B (zh) 一种节目推荐方法、装置、可读存储介质及终端设备
CN107948256B (zh) App的推送方法及计算机可读存储介质
CN114780606B (zh) 一种大数据挖掘方法及系统
CN111858245A (zh) 一种异常数据的分析方法、装置、电子设备及存储介质
CN112446717B (zh) 广告投放方法及装置
CN106933912B (zh) 关键词的获取方法和装置
CN112346951A (zh) 业务的测试方法及装置
CN106611339B (zh) 种子用户筛选方法、产品的用户影响力评价方法及装置
CN106651408B (zh) 一种数据分析方法及装置
CN110690987B (zh) 账号信息管理方法、装置及设备
CN109753585B (zh) 一种推荐视频的确定方法、装置、电子设备及存储介质
CN108961071B (zh) 自动预测组合业务收益的方法及终端设备
CN110633304A (zh) 组合特征筛选方法、装置、计算机设备及存储介质
CN108090089B (zh) 探测网站中热点数据的方法、装置和系统
CN110223108B (zh) 点击通过率的预测方法、装置及设备
CN115033456A (zh) 一种内网前端性能监控方法、装置、计算机设备及存储介质
CN110264333B (zh) 一种风险规则确定方法和装置
CN113535038A (zh) 前端菜单树生成方法、装置、计算机设备及存储介质
CN107203551B (zh) 一种数据处理方法及装置
CN108629610B (zh) 推广信息曝光量的确定方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant