CN108984735A - 标签词库更新方法、装置及电子设备 - Google Patents

标签词库更新方法、装置及电子设备 Download PDF

Info

Publication number
CN108984735A
CN108984735A CN201810769081.XA CN201810769081A CN108984735A CN 108984735 A CN108984735 A CN 108984735A CN 201810769081 A CN201810769081 A CN 201810769081A CN 108984735 A CN108984735 A CN 108984735A
Authority
CN
China
Prior art keywords
label
search word
tag
tag search
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810769081.XA
Other languages
English (en)
Other versions
CN108984735B (zh
Inventor
马建华
杨晴龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zibao Technology Co Ltd
Original Assignee
Guangzhou Zibao Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Zibao Technology Co Ltd filed Critical Guangzhou Zibao Technology Co Ltd
Priority to CN201810769081.XA priority Critical patent/CN108984735B/zh
Publication of CN108984735A publication Critical patent/CN108984735A/zh
Application granted granted Critical
Publication of CN108984735B publication Critical patent/CN108984735B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种标签词库更新方法、装置及电子设备,涉及标签更新技术领域,该方法包括获取用户输入的标签搜索词;查找与标签搜索词对应的搜索服务日志;对搜索服务日志进行日志分析,以确定标签搜索词的关键指标;根据关键指标更新标签词库。本发明能够动态更新标签词库,以便于标签词库能够能好地满足搜索需求。

Description

标签词库更新方法、装置及电子设备
技术领域
本发明涉及标签更新技术领域,尤其是涉及一种标签词库更新方法、装置及电子设备。
背景技术
在搜索系统中,标签搜索是一个常用的功能,能让用户方便快速地搜索到某个标签或专题的内容集,而标签是基于标签词库进行搜索的,标签词库的及时更新对于标签搜索结果的准确性有非常重要的作用。而现有技术中的标签词库通常是静态的,不能根据实际使用情况进行实时更新和完善,难以较好地满足搜索需求。
发明内容
有鉴于此,本发明的目的在于提供一种标签词库更新方法、装置及电子设备,以使标签词库可以实时更新。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种标签词库更新方法,该方法包括:获取用户输入的标签搜索词;查找与标签搜索词对应的搜索服务日志;其中,搜索服务日志包括标签搜索词、标签搜索词的使用记录、标签搜索词的历史搜索结果、历史搜索结果对应的用户行为数据中的多种;对搜索服务日志进行日志分析,以确定标签搜索词的关键指标;其中,关键指标包括权重和/或热度;根据关键指标更新标签词库。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,对搜索服务日志进行日志分析,以确定标签搜索词的关键指标的步骤,包括:根据搜索服务日志确定标签搜索词的标签命中率和标签转换率;判断标签命中率是否小于或等于预设第一阈值;如果否,获取标签搜索词对应的用户行为数据,根据用户行为数据确定标签搜索词的当前权重和当前热度;如果是,判断标签转换率是否小于预设第二阈值;当标签转换率小于预设第二阈值,且标签搜索词的权重的变化量大于预设第三阈值时,基于预设第一步长和标签搜索词的原有权重,确定标签搜索词的当前权重;当标签转换率小于预设第二阈值,且标签搜索词的热度低于预设第四阈值时,基于预设第二步长和标签搜索词的原有热度,确定标签搜索词的当前热度。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,根据用户行为数据确定标签搜索词的当前权重和当前热度的步骤,包括:根据用户行为数据计算标签搜索词的标签翻页率;判断标签翻页率是否大于预设第五阈值;如果是,根据标签搜索词的原有权重和原有热度确定标签搜索词的当前权重和当前热度。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,根据关键指标更新标签词库的步骤,包括:根据关键指标判断标签搜索词是否为新词;如果是,将标签搜索词加入至标签词库中;如果否,判断标签搜索词的关键指标与标签词库中记录的标签搜索词的关键指标的相似度是否低于预设相似度阈值;如果是,更新标签词库中记录的标签搜索词的关键指标。
结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,方法还包括:根据标签搜索词的关键指标更新标签词库中的各种标签搜索词的优先级顺序。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,方法还包括:定期将更新后的标签词库加载至搜索系统,以使搜索系统通过更新后的标签词库为用户提供搜索服务。
第二方面,本发明实施例还提供了一种标签词库更新装置,包括:获取模块,用于获取用户输入的标签搜索词;查找模块,用于查找与标签搜索词对应的搜索服务日志;其中,搜索服务日志包括标签搜索词、标签搜索词的使用记录、标签搜索词的历史搜索结果、历史搜索结果对应的用户行为数据中的多种;日志分析模块,用于对搜索服务日志进行日志分析,以确定标签搜索词的关键指标;其中,关键指标包括权重和/或热度;更新模块,用于根据关键指标更新标签词库。
第三方面,本发明实施例提供了一种电子设备,包括:处理器和存储器;存储器上存储有计算机程序,计算机程序在被处理器运行时执行如第一方面至第一方面的第五种可能的实施方式任一项的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述第一方面至第一方面的第五种可能的实施方式任一项的方法的步骤。
本发明实施例提供了一种标签词库更新方法、装置及电子设备,通过获取用户输入的标签搜索词,查找与标签搜索词对应的搜索服务日志,进而对搜索服务日志进行日志分析,以确定标签搜索词的关键指标,根据关键指标更新标签词库。本实施例通过关键指标能够动态更新标签词库,以便于标签词库能够能好地满足搜索需求。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例所提供的一种标签词库更新方法的流程图;
图2示出了本发明实施例所提供的另一种标签词库更新方法的流程图;
图3示出了本发明实施例所提供的一种标签词库更新装置的结构框图;
图4示出了本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到现有技术中的标签词库通常是静态的,不能快速地根据实际使用情况进行更新和完善,本发明实施例提供了一种标签词库更新方法、装置及电子设备,能够动态更新标签词库,以下对本发明实施例进行详细介绍。
参见图1所示的一种标签词库更新方法的流程图,该方法可以由诸如计算机、手机、iPad等电子设备执行,该方法包括以下步骤:
步骤S102,获取用户输入的标签搜索词。
步骤S104,查找与标签搜索词对应的搜索服务日志;其中,搜索服务日志包括标签搜索词、标签搜索词的使用记录、标签搜索词的历史搜索结果、历史搜索结果对应的用户行为数据中的多种。用户行为数据可以包括用户针对搜索结果的浏览行为、订购行为、下载行为、评论行为、分享行为等行为记录数据。
在具体实施时,可以在界面上为用户提供标签输入框,通过标签输入框获取用户输入的标签搜索词,也可以为用户提供包含有多个标签的页面,将用户点击选中的标签作为用户输入的标签搜索词。如用户输入标签搜索词“支付”后,查找与“支付”对应的搜索服务日志;
步骤S106,对搜索服务日志进行日志分析,以确定标签搜索词的关键指标;其中,关键指标包括权重和/或热度。
在实际应用中,如用户在微信中输入“聊天”,对标签搜索词“聊天”对应的搜索服务日志进行分析,分析标签搜索词“聊天”的使用情况、历史搜索情况以及历史搜索情况对应的用户对“聊天”的搜索结果的浏览、分析等,从而确定标签搜索词“聊天”的关键指标。关键指标包括权重和/或热度,如对于用户在微信中输入的标签搜索词“聊天”,其在微信中相对于微信的重要程度是权重;若其权重为0.5,即在微信中聊天相对于微信的重要程度为0.5,若游戏权重为0.2,即在微信中游戏相对于微信的重要程度为0.2,权重总和为1,则其它的权重为0.3。
步骤S108,根据关键指标更新标签词库。
如对于用户在微信中输入的标签搜索词“游戏”,根据“游戏”的关键指标,可以参考关键指标中的权重和热度,判断是否跟新标签词库中记录的标签搜索词的关键指标。具体的,如用户在微信中输入标签搜索词“游戏”,标签词库中记录的“游戏”的关键指标中的权重是0.3,又由于微信中某款游戏现阶段比较流行,用户搜索较多,关键指标可能会产生变化。基于此,需要更新标签词库中记录的标签搜索词的关键指标,如“游戏”的关键指标中的权重更新为0.5。
在实际应用中,可以定期将更新后的标签词库加载至搜索系统,以使搜索系统通过更新后的标签词库为用户提供搜索服务。
本发明实施例提供的上述标签词库更新方法,通过获取用户输入的标签搜索词,查找与标签搜索词对应的搜索服务日志,进而对搜索服务日志进行日志分析,以确定标签搜索词的关键指标,然后根据关键指标更新标签词库。本实施例通过关键指标能够动态更新标签词库,改善了标签词库不能适时适应实际标签搜索应用环境的问题。
为便于理解,以下给出基于本实施例提供的标签词库更新方法的一种具体实施方式,参见图2所示的另一种标签词库更新方法的流程图,该方法包括以下步骤:
步骤S202,获取用户输入的标签搜索词。
步骤S204,查找与标签搜索词对应的搜索服务日志;其中,搜索服务日志包括标签搜索词、标签搜索词的使用记录、标签搜索词的历史搜索结果、历史搜索结果对应的用户行为数据中的多种。
具体的,用户行为数据可以包括用户针对搜索结果的浏览行为、订购行为、下载行为、评论行为、分享行为等行为记录数据,但不仅限于这些。
步骤S206,根据搜索服务日志确定标签搜索词的标签命中率和标签转换率。
标签命中率是指用户在搜索页中获得自己想要的信息的次数除以用户总搜索次数的比例,如用户在微信中输入标签搜索词“聊天”,用户总共搜索了5次,想要得到的信息是其中搜索的3次包含的信息,即标签命中率为60%;标签转换率是指针对标签搜索词,用户浏览详情页次数或者订购次数除以搜索次数的比例,根据搜索服务日志和当前的互联网热点确定标签转换率。如对于用户在微信中输入的标签搜索词“聊天”,得到关于标签“聊天”的搜索服务日志,根据搜索服务日志的信息,如对于“聊天”的历史搜索次数和历史搜索结果以及在历史搜索结果中用户对此标签的搜索结果进行的浏览等数据信息,确定标签“聊天”的命中率和转换率。
步骤S208,判断标签命中率是否小于或等于预设第一阈值;如果否,执行步骤S210;如果是,执行步骤S216。
步骤S210,获取标签搜索词对应的用户行为数据,根据用户行为数据计算标签搜索词的标签翻页率。
标签翻页率是指用户搜索标签时,搜索到的信息用户需要翻页占不翻页和翻页总的比率。如用户在微信中输入标签搜索词“游戏”,此标签命中率不小于或等于预设第一阈值,则根据获取的标签“游戏”对应的用户行为数据,如用户对标签“游戏”的分享、评论和下载等,计算“游戏”的翻页率。
步骤S212,判断标签翻页率是否大于预设第五阈值;如果是,执行步骤S214;如果否,执行步骤S228:不更新标签词库中记录的标签搜索词的关键指标。
步骤S214,根据标签搜索词的原有权重和原有热度确定标签搜索词的当前权重和当前热度。
也即,如果标签翻页率大于预设第五阈值,根据标签搜索词的原有权重和原有热度即用户搜索标签之前计算的权重和热度,确定标签搜索词的当前权重和当前热度。
步骤S216,判断标签转换率是否小于预设第二阈值。如果是,执行步骤S218;如果否,执行步骤S228:不更新标签词库中记录的标签搜索词的关键指标。
步骤S218,当标签搜索词的权重的变化量大于预设第三阈值时,基于预设第一步长和标签搜索词的原有权重,确定标签搜索词的当前权重;当标签搜索词的热度低于预设第四阈值时,基于预设第二步长和标签搜索词的原有热度,确定标签搜索词的当前热度。
如用户在微信中输入标签搜索词“游戏”,当标签“游戏”的标签命中率小于或等于预设第一阈值,标签转换率小于预设第二阈值,且标签搜索词的权重的变化量大于预设第三阈值时,根据预设第一步长和标签“游戏”的原有权重,确定其当前权重;当标签“游戏”的标签转换率小于预设第二阈值,且热度低于预设第四阈值时,基于预设第二步长和标签“游戏”的原有热度,确定其当前热度。预设第一阈值是基于标签转命中率预先设定的值,预设第二阈值是基于标签转换率预先设定的值,其它阈值均是基于对应的数据信息预先设定的,可以根据实际情况进行不断调整和优化,在此不再赘述。
步骤S220,根据关键指标判断标签搜索词是否为新词。如果是,执行步骤S222;如果否,执行步骤S224。
具体的,通过关键指标判断标签搜索词是否为标签词库中还未存储的词,如用户在微信中输入标签搜索词“射击”,得到此标签的关键指标中权重为0和/或没有热度,说明此标签搜索词为新词。
步骤S222,将标签搜索词加入至标签词库中。
步骤S224,判断标签搜索词的关键指标与标签词库中记录的标签搜索词的关键指标的相似度是否低于预设相似度阈值;如果是,执行步骤S226;如果否,执行步骤S228:不更新标签词库中记录的标签搜索词的关键指标。
在一种实施方式中,如果标签搜索词不是新词,如对于用户在微信中输入的标签搜索词“游戏”,根据“游戏”的关键指标,可以参考关键指标中的权重和热度,判断相似度是否低于预设相似度阈值。具体的,如用户在微信中输入标签搜索词“游戏”,标签词库中记录的“游戏”的关键指标中的权重是0.3,又由于微信中某款游戏现阶段比较流行,用户搜索较多,可能使得“游戏”的权重会上升到0.5,若预设的相似度阈值为98%,而对于权重由0.3上升为0.5,相似度明显低于98%,则标签“游戏”的关键指标的相似度低于预设相似度阈值。其中,预设相似度阈值是可根据实际情况调整的。
步骤S226,更新标签词库中记录的标签搜索词的关键指标。
在具体实施时,如果标签搜索词的关键指标与标签词库中记录的标签搜索词的关键指标的相似度低于预设相似度阈值,则需要更新标签词库中记录的标签搜索词的关键指标。如标签“游戏”的关键指标中的权重由0.3上升到0.5,判断相似度阈值低于预设阈值,则标签“游戏”的权重更新为0.5,若关键指标包括的数据有相似度低于预设相似度阈值的,均需更新。
在实际应用中,可以根据标签搜索词的关键指标更新标签词库中的各种标签搜索词的优先级顺序。
综上所述,采用本实施例提供的上述标签词库更新方法,通过标签命中率、标签翻页率和标签转换率以及标签关键指标的相似度,对标签词库中的标签搜索词的关键指标进行更新。本实施例通过关键指标能够动态更新标签词库,改善了标签词库不能适时适应实际标签搜索应用环境的问题。
对应于前述标签词库更新方法,本发明实施例提供了一种标签词库更新装置,参见图3示出的一种标签词库更新装置的结构框图,该装置包括以下模块:
获取模块302,用于获取用户输入的标签搜索词;
查找模块304,用于查找与标签搜索词对应的搜索服务日志;其中,搜索服务日志包括标签搜索词、标签搜索词的使用记录、标签搜索词的历史搜索结果、历史搜索结果对应的用户行为数据中的多种;
日志分析模块306,用于对搜索服务日志进行日志分析,以确定标签搜索词的关键指标;其中,关键指标包括权重和/或热度;
更新模块308,用于根据关键指标更新标签词库。
本发明实施例提供的上述标签词库更新装置,通过获取用户输入的标签搜索词,查找与标签搜索词对应的搜索服务日志,进而对搜索服务日志进行日志分析,以确定标签搜索词的关键指标,根据关键指标更新标签词库。本实施例通过关键指标能够动态更新标签词库,改善了标签词库不能适时适应实际标签搜索应用环境的问题。
上述日志分析模块304进一步用于:根据搜索服务日志确定标签搜索词的标签命中率和标签转换率;判断标签命中率是否小于或等于预设第一阈值;如果否,获取标签搜索词对应的用户行为数据,根据用户行为数据确定标签搜索词的当前权重和当前热度;如果是,判断标签转换率是否小于预设第二阈值;当标签转换率小于预设第二阈值,且标签搜索词的权重的变化量大于预设第三阈值时,基于预设第一步长和标签搜索词的原有权重,确定标签搜索词的当前权重;当标签转换率小于预设第二阈值,且标签搜索词的热度低于预设第四阈值时,基于预设第二步长和标签搜索词的原有热度,确定标签搜索词的当前热度。
本实施例所提供的装置,其实现原理及产生的技术效果和前述实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例提供了一种电子设备,参见图4所示的一种电子设备的结构示意图,该电子设备包括:处理器40、存储器41、总线42和通信接口43,所述处理器40、通信接口43和存储器41通过总线42连接;处理器40用于执行存储器41中存储的可执行模块,例如计算机程序。
其中,存储器41可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线42可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器41用于存储程序,所述处理器40在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中,或者由处理器40实现。
处理器40可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41,处理器40读取存储器41中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行前述实施例任一项的方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统具体工作过程,可以参考前述实施例中的对应过程,在此不再赘述。
本发明实施例所提供的标签词库更新方法、装置及电子设备的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种标签词库更新方法,其特征在于,包括:
获取用户输入的标签搜索词;
查找与所述标签搜索词对应的搜索服务日志;其中,所述搜索服务日志包括所述标签搜索词、所述标签搜索词的使用记录、所述标签搜索词的历史搜索结果、所述历史搜索结果对应的用户行为数据中的多种;
对所述搜索服务日志进行日志分析,以确定所述标签搜索词的关键指标;其中,所述关键指标包括权重和/或热度;
根据所述关键指标更新标签词库。
2.根据权利要求1所述的方法,其特征在于,所述对搜索服务日志进行日志分析,以确定所述标签搜索词的关键指标的步骤,包括:
根据所述搜索服务日志确定所述标签搜索词的标签命中率和标签转换率;
判断所述标签命中率是否小于或等于预设第一阈值;
如果否,获取所述标签搜索词对应的用户行为数据,根据所述用户行为数据确定标签搜索词的当前权重和当前热度;
如果是,判断所述标签转换率是否小于预设第二阈值;当所述标签转换率小于所述预设第二阈值,且所述标签搜索词的权重的变化量大于预设第三阈值时,基于预设第一步长和所述标签搜索词的原有权重,确定所述标签搜索词的当前权重;当所述标签转换率小于所述预设第二阈值,且所述标签搜索词的热度低于预设第四阈值时,基于预设第二步长和所述标签搜索词的原有热度,确定所述标签搜索词的当前热度。
3.根据权利要求2所述的方法,其特征在于,所述根据所述用户行为数据确定所述标签搜索词的当前权重和当前热度的步骤,包括:
根据所述用户行为数据计算所述标签搜索词的标签翻页率;
判断所述标签翻页率是否大于预设第五阈值;
如果是,根据所述标签搜索词的原有权重和原有热度确定所述标签搜索词的当前权重和当前热度。
4.根据权利要求1所述的方法,其特征在于,所述根据关键指标更新标签词库的步骤,包括:
根据所述关键指标判断所述标签搜索词是否为新词;
如果是,将所述标签搜索词加入至所述标签词库中;
如果否,判断所述标签搜索词的关键指标与所述标签词库中记录的所述标签搜索词的关键指标的相似度是否低于预设相似度阈值;如果是,更新所述标签词库中记录的所述标签搜索词的关键指标。
5.根据权利要求4所述的方法,其特征在于,方法还包括:
根据所述标签搜索词的关键指标更新所述标签词库中的各种标签搜索词的优先级顺序。
6.根据权利要求1所述的方法,其特征在于,方法还包括:
定期将更新后的所述标签词库加载至搜索系统,以使所述搜索系统通过所述更新后的所述标签词库为用户提供搜索服务。
7.一种标签词库更新装置,其特征在于,包括:
获取模块,用于获取用户输入的标签搜索词;
查找模块,用于查找与所述标签搜索词对应的搜索服务日志;其中,所述搜索服务日志包括所述标签搜索词、所述标签搜索词的使用记录、所述标签搜索词的历史搜索结果、所述历史搜索结果对应的用户行为数据中的多种;
日志分析模块,用于对所述搜索服务日志进行日志分析,以确定所述标签搜索词的关键指标;其中,所述关键指标包括权重和/或热度;
更新模块,用于根据所述关键指标更新标签词库。
8.根据权利要求7所述的装置,其特征在于,日志分析模块用于:
根据所述搜索服务日志确定所述标签搜索词的标签命中率和标签转换率;
判断所述标签命中率是否小于或等于预设第一阈值;
如果否,获取所述标签搜索词对应的用户行为数据,根据所述用户行为数据确定标签搜索词的当前权重和当前热度;
如果是,判断所述标签转换率是否小于预设第二阈值;当所述标签转换率小于所述预设第二阈值,且所述标签搜索词的权重的变化量大于预设第三阈值时,基于预设第一步长和所述标签搜索词的原有权重,确定所述标签搜索词的当前权重;当所述标签转换率小于所述预设第二阈值,且所述标签搜索词的热度低于预设第四阈值时,基于预设第二步长和所述标签搜索词的原有热度,确定所述标签搜索词的当前热度。
9.一种电子设备,其特征在于,包括处理器和存储器;
所述存储器上存储有计算机程序,所述计算机程序在被所述处理器运行时执行如权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至6任一项所述的方法的步骤。
CN201810769081.XA 2018-07-12 2018-07-12 标签词库更新方法、装置及电子设备 Active CN108984735B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810769081.XA CN108984735B (zh) 2018-07-12 2018-07-12 标签词库更新方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810769081.XA CN108984735B (zh) 2018-07-12 2018-07-12 标签词库更新方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN108984735A true CN108984735A (zh) 2018-12-11
CN108984735B CN108984735B (zh) 2019-08-13

Family

ID=64537222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810769081.XA Active CN108984735B (zh) 2018-07-12 2018-07-12 标签词库更新方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108984735B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177501A (zh) * 2019-12-13 2020-05-19 杭州首展科技有限公司 一种标签处理方法、装置及系统
CN111324771A (zh) * 2020-02-26 2020-06-23 腾讯科技(深圳)有限公司 视频标签的确定方法、装置、电子设备及存储介质
CN111967262A (zh) * 2020-06-30 2020-11-20 北京百度网讯科技有限公司 实体标签的确定方法和装置
CN115732036A (zh) * 2022-12-06 2023-03-03 云舟生物科技(广州)股份有限公司 调整转录本基础库存的方法、计算机存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008014702A1 (fr) * 2006-07-25 2008-02-07 Beijing Sogou Technology Development Co., Ltd. Procédé et système d'extraction de mots nouveaux
CN105320706A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 搜索结果的处理方法和装置
CN105677867A (zh) * 2016-01-08 2016-06-15 浪潮软件集团有限公司 一种用户标签的生成方法和装置
CN106126582A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 推荐方法及装置
CN106649308A (zh) * 2015-10-28 2017-05-10 卓望数码技术(深圳)有限公司 一种分词词库更新方法及系统
CN107515853A (zh) * 2016-06-17 2017-12-26 北京搜狗科技发展有限公司 一种细胞词库推送方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008014702A1 (fr) * 2006-07-25 2008-02-07 Beijing Sogou Technology Development Co., Ltd. Procédé et système d'extraction de mots nouveaux
CN105320706A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 搜索结果的处理方法和装置
CN106649308A (zh) * 2015-10-28 2017-05-10 卓望数码技术(深圳)有限公司 一种分词词库更新方法及系统
CN105677867A (zh) * 2016-01-08 2016-06-15 浪潮软件集团有限公司 一种用户标签的生成方法和装置
CN107515853A (zh) * 2016-06-17 2017-12-26 北京搜狗科技发展有限公司 一种细胞词库推送方法及装置
CN106126582A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 推荐方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177501A (zh) * 2019-12-13 2020-05-19 杭州首展科技有限公司 一种标签处理方法、装置及系统
CN111177501B (zh) * 2019-12-13 2023-11-17 杭州首展科技有限公司 一种标签处理方法、装置及系统
CN111324771A (zh) * 2020-02-26 2020-06-23 腾讯科技(深圳)有限公司 视频标签的确定方法、装置、电子设备及存储介质
CN111967262A (zh) * 2020-06-30 2020-11-20 北京百度网讯科技有限公司 实体标签的确定方法和装置
CN111967262B (zh) * 2020-06-30 2024-01-12 北京百度网讯科技有限公司 实体标签的确定方法和装置
CN115732036A (zh) * 2022-12-06 2023-03-03 云舟生物科技(广州)股份有限公司 调整转录本基础库存的方法、计算机存储介质及电子设备
CN115732036B (zh) * 2022-12-06 2023-11-28 云舟生物科技(广州)股份有限公司 调整转录本基础库存的方法、计算机存储介质及电子设备

Also Published As

Publication number Publication date
CN108984735B (zh) 2019-08-13

Similar Documents

Publication Publication Date Title
CN108984735B (zh) 标签词库更新方法、装置及电子设备
CN110400103B (zh) 补货量确定方法、装置、计算机装置及存储介质
CN109544166A (zh) 一种风险识别方法和装置
CN109299981A (zh) 一种广告推荐方法及装置
CN106295832A (zh) 产品信息推送方法及装置
WO2013138516A1 (en) Publishing product information
CN106970912A (zh) 中文语句相似度计算方法、计算装置以及计算机存储介质
WO2015188006A1 (en) Method and apparatus of matching text information and pushing a business object
CN111966912B (zh) 基于知识图谱的推荐方法、装置、计算机设备及存储介质
CN107908616B (zh) 预测趋势词的方法和装置
CN102339448B (zh) 团购平台信息处理方法及装置
CN109241449A (zh) 一种物品推荐方法及装置
CN108345601A (zh) 搜索结果排序方法及装置
CN112613938B (zh) 模型训练方法、装置及计算机设备
CN108550046A (zh) 一种资源和营销推荐方法、装置及电子设备
CN110827112A (zh) 深度学习的商品推荐方法、装置、计算机设备及存储介质
CN110428139A (zh) 基于标签传播的信息预测方法及装置
CN108664605B (zh) 一种模型评估方法及系统
CN107622413A (zh) 一种价格敏感度计算方法、装置及其设备
CN116823409A (zh) 一种基于目标搜索数据的智能筛选方法及系统
CN107590387A (zh) El表达式注入漏洞检测方法、装置及电子设备
CN104077288B (zh) 网页内容推荐方法和网页内容推荐设备
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN103324641A (zh) 信息记录推荐方法和装置
CN108563648B (zh) 数据显示方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant