CN115599768B - 一种联想词库构建方法、联想词推荐方法及设备 - Google Patents

一种联想词库构建方法、联想词推荐方法及设备 Download PDF

Info

Publication number
CN115599768B
CN115599768B CN202211282433.1A CN202211282433A CN115599768B CN 115599768 B CN115599768 B CN 115599768B CN 202211282433 A CN202211282433 A CN 202211282433A CN 115599768 B CN115599768 B CN 115599768B
Authority
CN
China
Prior art keywords
word
commodity
search
commodities
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211282433.1A
Other languages
English (en)
Other versions
CN115599768A (zh
Inventor
韦国迎
张炜
罗雪兵
陈婷
李志平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Lingzhi Digital Technology Co ltd
Original Assignee
Shenzhen Lingzhi Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Lingzhi Digital Technology Co ltd filed Critical Shenzhen Lingzhi Digital Technology Co ltd
Priority to CN202211282433.1A priority Critical patent/CN115599768B/zh
Publication of CN115599768A publication Critical patent/CN115599768A/zh
Application granted granted Critical
Publication of CN115599768B publication Critical patent/CN115599768B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于计算机技术领域,提供了一种联想词库构建方法、联想词推荐方法及设备,该联想词库构建方法包括:在第一目标业态下获取预设时间段内的第一搜索词、每个第一搜索词关联的商品点击次数和用户已点击的商品数量;获取第一上架商品对应的品牌词、类目词和历史搜索词、第一品牌关联商品数量和第一类目关联商品数量;根据预设时间段内的第一搜索词以及第一上架商品对应的品牌词、类目词和历史搜索词,得到联想词集合;并根据第一搜索词关联的商品点击次数和用户已点击的商品数量、第一品牌关联商品数量以及第一类目关联商品数量对联想词评分。上述方法构建出的联想词库其词源丰富,有利于提高用户的搜索体验,便于用户搜索到其想要的商品。

Description

一种联想词库构建方法、联想词推荐方法及设备
技术领域
本申请属于计算机技术领域,尤其涉及一种联想词库构建方法、联想词推荐方法及设备。
背景技术
随着互联网的蓬勃发展,越来越多企业投入研发购物APP,通过购物APP能够使用户便捷地购买商品,提高用户的购物体验。
在通过购物APP购买商品的过程中,搜索联想得到了广泛的应用,具体地,搜索联想是指用户在搜索控件中输入搜索词时,基于下拉框等展现形式显示出关联的联想词,以简化用户输入操作,便于用户搜索到需要购入的商品。
搜索联想往往是基于联想词库进行的,而联想词库中包含的联想词来源较为单一,一般是基于用户的历史行为记录建立的,难以支撑用户日益增长搜索联想需求,不利于改善用户的搜索效率和购物体验。
发明内容
本申请实施例提供了一种联想词库构建方法、联想词推荐方法及设备,可以解决上述技术问题。
第一方面,本申请实施例提供了一种联想词库构建方法,包括:获取预设时间段内的第一搜索词,以及获取每个所述第一搜索词关联的商品点击次数以及每个所述第一搜索词关联的用户已点击的商品数量;其中,所述第一搜索词为第一目标业态下的搜索词;获取第一上架商品对应的品牌词、所述第一上架商品对应的类目词以及所述第一上架商品对应的历史搜索词,并根据所述第一上架商品对应的品牌词和所述第一上架商品对应的类目词,得到第一品牌关联商品数量和第一类目关联商品数量;其中,所述第一上架商品为所述第一目标业态下的上架商品;根据所述预设时间段内的第一搜索词、所述第一上架商品对应的历史搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词,得到联想词集合;根据所述第一搜索词关联的商品点击次数、所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,确定所述联想词集合中各个联想词的分数;根据所述联想词集合和所述联想词集合中各个联想词的分数,构建所述第一目标业态下的联想词库。
进一步地,所述根据所述预设时间段内的第一搜索词、所述第一上架商品对应的历史搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词,得到联想词集合,包括:根据所述预设时间段内的第一搜索词和所述第一上架商品对应的历史搜索词之间的交集,得到过滤后的第一搜索词;根据所述过滤后的第一搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词之间的并集,得到联想词集合。
进一步地,所述根据所述第一搜索词关联的商品点击次数、所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,确定所述联想词集合中各个联想词的分数,包括:根据所述第一搜索词关联的商品点击次数,计算所述联想词集合中各个联想词的第一分数;根据所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,计算所述联想词集合中各个联想词的第二分数;根据所述联想词集合中各个联想词的第一分数和所述联想词集合中各个联想词的第二分数之和,得到所述联想词集合中各个联想词的分数。
进一步地,所述方法还包括:获取预设时间段内的第二搜索词、每个所述第二搜索词关联的商品点击次数以及每个所述第二搜索词关联的用户已点击的商品数量;其中,所述第二搜索词为第二目标业态下的搜索词;获取第二上架商品对应的品牌词、所述第二上架商品对应的类目词以及所述第二上架商品对应的历史搜索词,并根据所述第二上架商品对应的品牌词和所述第二上架商品对应的类目词,得到第二品牌关联商品数量和第二类目关联商品数量;其中,所述第二上架商品为所述第二目标业态下的上架商品;根据所述预设时间段内的第二搜索词、所述第二上架商品对应的历史搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词,得到所述第二上架商品对应的联想词集合;根据所述第二搜索词关联的商品点击次数、所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,确定所述第二上架商品对应的联想词集合中各个联想词的分数;获取所述第二目标业态下各个门店的第二上架商品;根据所述第二上架商品对应的联想词集合和各个所述门店的第二上架商品,得到各个所述门店的第二上架商品对应的联想词集合;根据各个所述门店的第二上架商品对应的联想词集合和所述第二上架商品对应的联想词集合中各个联想词的分数,构建所述第二目标业态下的联想词库。
进一步地,所述根据所述预设时间段内的第二搜索词、所述第二上架商品对应的历史搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词,得到所述第二上架商品对应的联想词集合,包括:根据所述预设时间段内的第二搜索词和所述第二上架商品对应的历史搜索词之间的交集,得到所述第二上架商品对应的过滤后的第二搜索词;根据所述第二上架商品对应的过滤后的第二搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词之间的并集,得到所述第二上架商品对应的联想词集合。
进一步地,所述根据所述第二搜索词关联的商品点击次数、所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,确定所述第二上架商品对应的联想词集合中各个联想词的分数,包括:根据所述第二搜索词关联的商品点击次数,计算所述第二上架商品对应的联想词集合中各个联想词的第一分数;所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,计算所述第二上架商品对应的联想词集合中各个联想词的第二分数;根据所述第二上架商品对应的联想词集合中各个联想词的第一分数和所述第二上架商品对应的联想词集合中各个联想词的第二分数之和,得到所述第二上架商品对应的联想词集合中各个联想词的分数。
第二方面,本申请实施例提供了一种联想词推荐方法,包括:根据第一方面所述的联想词库构建方法,构建第一目标业态下的联想词库;获取所述第一目标业态下的当前搜索词,并根据所述当前搜索词,从所述第一目标业态下的联想词库中,获取并推荐目标联想词。
第三方面,本申请实施例提供了一种联想词推荐方法,包括:根据第一方面所述的联想词库构建方法,构建第二目标业态下的联想词库;获取所述第二目标业态下的当前搜索词和门店标识,并根据所述当前搜索词和所述门店标识,从所述第二目标业态下的联想词库中,获取并推荐目标联想词。
第四方面,本申请实施例提供了一种联想词库构建装置,包括:第一获取单元,用于获取预设时间段内的第一搜索词,以及获取每个所述第一搜索词关联的商品点击次数以及每个所述第一搜索词关联的用户已点击的商品数量;其中,所述第一搜索词为第一目标业态下的搜索词;第二获取单元,用于获取第一上架商品对应的品牌词、所述第一上架商品对应的类目词以及所述第一上架商品对应的历史搜索词,并根据所述第一上架商品对应的品牌词和所述第一上架商品对应的类目词,得到第一品牌关联商品数量和第一类目关联商品数量;其中,所述第一上架商品为所述第一目标业态下的上架商品;第三获取单元,根据所述预设时间段内的第一搜索词、所述第一上架商品对应的历史搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词,得到联想词集合;第一确定单元,用于根据所述第一搜索词关联的商品点击次数、所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,确定所述联想词集合中各个联想词的分数;第一构建单元,用于根据所述联想词集合和所述联想词集合中各个联想词的分数,构建所述第一目标业态下的联想词库。
进一步地,第三获取单元,具体用于:根据所述预设时间段内的第一搜索词和所述第一上架商品对应的历史搜索词之间的交集,得到过滤后的第一搜索词;根据所述过滤后的第一搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词之间的并集,得到联想词集合。
进一步地,第一确定单元,具体用于:根据所述第一搜索词关联的商品点击次数,计算所述联想词集合中各个联想词的第一分数;根据所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,计算所述联想词集合中各个联想词的第二分数;根据所述联想词集合中各个联想词的第一分数和所述联想词集合中各个联想词的第二分数之和,得到所述联想词集合中各个联想词的分数。
进一步地,所述联想词库构建装置,还包括:第四获取单元,用于获取预设时间段内的第二搜索词、每个所述第二搜索词关联的商品点击次数以及每个所述第二搜索词关联的用户已点击的商品数量;其中,所述第二搜索词为第二目标业态下的搜索词;第五获取单元,用于获取第二上架商品对应的品牌词、所述第二上架商品对应的类目词以及所述第二上架商品对应的历史搜索词,并根据所述第二上架商品对应的品牌词和所述第二上架商品对应的类目词,得到第二品牌关联商品数量和第二类目关联商品数量;其中,所述第二上架商品为所述第二目标业态下的上架商品;第六获取单元,用于根据所述预设时间段内的第二搜索词、所述第二上架商品对应的历史搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词,得到所述第二上架商品对应的联想词集合;第二确定单元,用于根据所述第二搜索词关联的商品点击次数、所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,确定所述第二上架商品对应的联想词集合中各个联想词的分数;第七获取单元,用于获取所述第二目标业态下各个门店的第二上架商品;第八获取单元,用于根据所述第二上架商品对应的联想词集合和各个所述门店的第二上架商品,得到各个所述门店的第二上架商品对应的联想词集合;第二构建单元,用于根据各个所述门店的第二上架商品对应的联想词集合和所述第二上架商品对应的联想词集合中各个联想词的分数,构建所述第二目标业态下的联想词库。
进一步地,第六获取单元,具体用于:根据所述预设时间段内的第二搜索词和所述第二上架商品对应的历史搜索词之间的交集,得到所述第二上架商品对应的过滤后的第二搜索词;根据所述第二上架商品对应的过滤后的第二搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词之间的并集,得到所述第二上架商品对应的联想词集合。
进一步地,第二确定单元,具体用于:根据所述第二搜索词关联的商品点击次数,计算所述第二上架商品对应的联想词集合中各个联想词的第一分数;所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,计算所述第二上架商品对应的联想词集合中各个联想词的第二分数;根据所述第二上架商品对应的联想词集合中各个联想词的第一分数和所述第二上架商品对应的联想词集合中各个联想词的第二分数之和,得到所述第二上架商品对应的联想词集合中各个联想词的分数。
第五方面,本申请实施例提供了一种联想词推荐装置,包括:第二构建单元,用于根据第一方面所述的联想词库构建方法,构建第一目标业态下的联想词库;第一推荐单元,用于获取所述第一目标业态下的当前搜索词,并根据所述当前搜索词,从所述第一目标业态下的联想词库中,获取并推荐目标联想词。
第六方面,本申请实施例提供了一种联想词推荐装置,包括:第三构建单元,用于根据第一方面所述的联想词库构建方法,构建第二目标业态下的联想词库;第二推荐单元,用于获取所述第二目标业态下的当前搜索词和门店标识,并根据所述当前搜索词和所述门店标识,从所述第二目标业态下的联想词库中,获取并推荐目标联想词。
第七方面,本申请实施例提供了一种设备,包括处理器、存储器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述第一方面、第二方面和/或第三方面的方法。
第八方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面、第二方面和/或第三方面的方法。
一方面,本申请实施例中,在第一目标业态下,不仅通过埋点的方式获取了预设时间段内的第一搜索词、每个第一搜索词关联的商品点击次数和用户已点击的商品数量,还获取了第一上架商品对应的品牌词、类目词和历史搜索词以及获取了第一品牌关联商品数量和第一类目关联商品数量,之后,根据预设时间段内的第一搜索词以及第一上架商品对应的品牌词、类目词和历史搜索词,得到了词源丰富的联想词集合,并且,根据第一搜索词关联的商品点击次数和用户已点击的商品数量、第一品牌关联商品数量以及第一类目关联商品数量,对联想词集合中联想词进行评分,使得构建的第一目标业态下的联想词库不仅词源丰富,且能够基于联想词的分数指导联想词的排序。
进一步地,在使用上述方式构建第一目标业态下的联想词库后,设备获取第一目标业态下的当前搜索词,并根据当前搜索词,从第一目标业态下的联想词库中,获取并推荐目标联想词,能够使得目标联想词更贴合用户需求,进而有利于提高用户的搜索体验,更便于其搜索到其想要的商品。
另一方面,在本申请实施例中,在第二目标业态下若采用上述方式构建联想词库,容易导致用户定位在某一门店下,由于该门店没有某一联想词对应的商品,导致用户点击了联想词而商品结果为空,以及在新开设门店下,由于没有获取充足的埋点数据,历史搜索词也相对有限,导致无法获取到联想词,为此,设备通过与上述类似的方式,获取到第二目标业态下第二上架商品对应的联想词集合以及第二上架商品对应的联想词集合中各个联想词的分数,之后,设备获取第二目标业态下各个门店的第二上架商品,根据第二上架商品对应的联想词集合和各个门店的第二上架商品,得到各个门店的第二上架商品对应的联想词集合,再根据各个门店的第二上架商品对应的联想词集合和第二上架商品对应的联想词集合中各个联想词的分数,构建第二目标业态下的联想词库,通过此种方式构建的第二目标业态下的联想词库,能够支撑不同门店下的搜索联想。
进一步地,在使用上述方式构建第二目标业态下的联想词库后,设备获取第二目标业态下的当前搜索词和门店标识,并根据当前搜索词和门店标识,从第二目标业态下的联想词库中,获取并推荐目标联想词,能够防止用户点击了联想词而商品结果为空以及无法获取到联想词的情况,进一步提高了第二目标业态下的用户搜索体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请第一实施例提供的一种联想词库构建方法的示意流程图;
图2是本申请第一实施例提供的一种联想词库构建方法中S103的示意流程图;
图3是本申请第一实施例提供的一种联想词库构建方法中S104的示意流程图;
图4是本申请实施例提供的一种联想词库的数据存储示意图;
图5是本申请第一实施例提供的一种联想词库构建方法的另一示意流程图;
图6是本申请第一实施例提供的一种联想词库构建方法中S108的示意流程图;
图7是本申请第一实施例提供的一种联想词库构建方法中S109的示意流程图;
图8是本申请实施例提供的一种联想词库的数据存储示意图;
图9是本申请第二实施例提供的一种联想词推荐方法的示意流程图;
图10是本申请实施例提供的搜索联想的界面示意图;
图11是本申请第三实施例提供的一种联想词推荐方法的示意流程图;
图12是本申请第四实施例提供的联想词库构建装置的示意图;
图13是本申请第五实施例提供的联想词推荐装置的示意图;
图14是本申请第六实施例提供的联想词推荐装置的示意图;
图15是本申请第七实施例提供的设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
请参见图1,图1是本申请第一实施例提供的一种联想词库构建方法的示意流程图。本实施例中一种联想词库构建方法的执行主体为具有联想词库构建功能的设备,该联想词库构建设备可以为个人计算机以及服务器等,也可以为处理器、微处理器等。本申请实施例以联想词库构建设备(以下简称为设备)为联想词库构建方法的执行主体进行下述解释说明,不具体对设备进行限定。如图1所示的联想词库构建方法可以包括:
S101:获取预设时间段内的第一搜索词,以及获取每个所述第一搜索词关联的商品点击次数以及每个所述第一搜索词关联的用户已点击的商品数量;其中,所述第一搜索词为第一目标业态下的搜索词。
设备获取预设时间段内的第一搜索词,以及获取每个第一搜索词关联的商品点击次数以及每个第一搜索词关联的用户已点击的商品数量。
在本申请实施例中,预设时间段内的第一搜索词表示为SET1,简单理解,预设时间段内的第一搜索词是一个集合。
在一个可选的实施例中,预设时间段的终止日期是指构建联想词库的日期,预设时间段的起始日期是指构建联想词库的日期向前推n(单位:天、月或年),故,预设时间段的长度为n(单位:天、月或年)。可以选,预设时间段的长度为1(单位:月)。
联想词库是采用T+1模式更新,也就是指,当前构建的联想词库,在下一日更新使用。
其中,第一搜索词为第一目标业态下的搜索词,第一目标业态在本实施例中是指电商业态和百货业态。
企业研发的购物APP中包含不同的搜索入口。处于购物APP的首页搜索入口,用户能够搜索到第一目标业态下的商品,也就是说,能搜索到电商业态和百货业态下的商品。
为了便于理解,先在此处说明第二目标业态,第二目标业态为基于定位限定门店的业态,例如:超市业态。处于第二目标业态下的搜索入口,用户只能搜索到当前定位门店的商品,例如:在超市业态下的搜索入口,用户只能搜索到当前定位超市的商品。
基于定位限定门店的业态,一般是由于该业态下的商品,对于配送时效要求较高。
在一个可选的实施方式中,设备会对用户输入的第一搜索词进行预处理,仅保留字母、数字以及中文。例如:“xx篮球鞋_45码”预处理后为“xx篮球鞋45码”。
每个第一搜索词关联的商品点击次数是指相同的第一搜索词下不同用户进行商品点击的次数之和。
在本实施例中,每个第一搜索词关联的商品点击次数表示为SUM1。
在一个可选的实施方式中,埋点的是搜索点击事件,那么,仅在用户输入第一搜索词后,点击了至少一个商品,设备才能捕捉到该搜索点击事件,从而获取到该第一搜索词以及在该搜索点击事件中第一搜索词关联的商品点击次数。
每个第一搜索词关联的用户已点击的商品数量是指相同的第一搜索词下不同用户已点击的商品数量之和。
在本实施例中,每个第一搜索词关联的用户已点击的商品数量表示为SUM_20。
在一个可选的实施方式中,埋点的是搜索点击事件,那么,仅在用户输入第一搜索词后,点击了至少一个商品,设备才能捕捉到该搜索点击事件,从而获取到该第一搜索词以及在该搜索点击事件中第一搜索词关联的该用户已点击的商品数量。
上述相同的第一搜索词可以是指预处理后相同的第一搜索词。
在一个可选的实施例中,设备会过滤掉关联的商品点击次数SUM1不大于预设点击次数阈值(例如:10)的第一搜索词,即,SUM1需大于预设点击次数阈值(例如:10)。
S102:获取第一上架商品对应的品牌词、所述第一上架商品对应的类目词以及所述第一上架商品对应的历史搜索词,并根据所述第一上架商品对应的品牌词和所述第一上架商品对应的类目词,得到第一品牌关联商品数量和第一类目关联商品数量;其中,所述第一上架商品为所述第一目标业态下的上架商品。
设备获取第一上架商品对应的品牌词、第一上架商品对应的类目词以及第一上架商品对应的历史搜索词。
其中,第一上架商品为第一目标业态下的上架商品,在本实施例中,第一上架商品为电商业态和百货业态下的上架商品。
每个第一上架商品均有对应的品牌和类目,故,设备能够获取到第一上架商品对应的品牌词和第一上架商品对应的类目词。
其中,类目是指商品的品类,例如:球鞋、面膜都是一个类目。
设备也能够根据历史搜索记录,得到第一上架商品对应的历史搜索词,在本实施例中,第一上架商品对应的历史搜索词表示为SET2。
设备根据第一上架商品对应的品牌词和第一上架商品对应的类目词,分别得到第一品牌关联商品数量和第一类目关联商品数量。
具体地,设备根据第一上架商品对应的品牌词,得到该品牌词关联的商品的数量,即,第一品牌关联商品数量,表示为SUM_21。
设备根据第一上架商品对应的类目词,得到该类目词关联的商品的数量,即,第一类目关联商品数量,表示为SUM_22。
S103:根据所述预设时间段内的第一搜索词、所述第一上架商品对应的历史搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词,得到联想词集合。
设备根据预设时间段内的第一搜索词、第一上架商品对应的历史搜索词、第一上架商品对应的品牌词以及第一上架商品对应的类目词,得到联想词集合。
在一个可选的实施方式中,请参阅图2,图2是本申请第一实施例提供的一种联想词库构建方法中S103的示意流程图,S103包括:
S1031:根据所述预设时间段内的第一搜索词和所述第一上架商品对应的历史搜索词之间的交集,得到过滤后的第一搜索词。
设备根据预设时间段内的第一搜索词SET1和第一上架商品对应的历史搜索词SET2之间的交集,得到过滤后的第一搜索词SET1∩SET2。
S1032:根据所述过滤后的第一搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词之间的并集,得到联想词集合。
设备根据过滤后的第一搜索词、第一上架商品对应的品牌词以及第一上架商品对应的类目词之间的并集,得到联想词集合。
其中,联想词集合中包括若干个联想词,联想词表示为keyword。
S104:根据所述第一搜索词关联的商品点击次数、所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,确定所述联想词集合中各个联想词的分数。
设备根据第一搜索词关联的商品点击次数、第一搜索词关联的用户已点击的商品数量、第一品牌关联商品数量以及第一类目关联商品数量,确定联想词集合中各个联想词的分数。
在一个可选的实施方式中,请参阅图3,图3是本申请第一实施例提供的一种联想词库构建方法中S104的示意流程图,S104包括:
S1041:根据所述第一搜索词关联的商品点击次数,计算所述联想词集合中各个联想词的第一分数。
设备根据第一搜索词关联的商品点击次数,计算联想词集合中各个联想词的第一分数。
具体地,设备根据第一搜索词关联的商品点击次数SUM1和对数函数,计算联想词集合中各个联想词的第一分数
Figure BDA0003898697960000101
其中,关于a的值符合对数函数定义即可,在此不限定其具体大小。
在一个可选的实施方式中,设备先对第一搜索词关联的商品点击次数进行取如下操作,令SUM1=MAX(SUM1,0),其中,MAX是指取最大值。
S1042:根据所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,计算所述联想词集合中各个联想词的第二分数。
设备根据第一搜索词关联的用户已点击的商品数量、第一品牌关联商品数量以及第一类目关联商品数量,计算联想词集合中各个联想词的第二分数。
具体地,设备根据第一搜索词关联的用户已点击的商品数量SUM_20、第一品牌关联商品数量SUM_21、第一类目关联商品数量SUM_22和对数函数,计算联想词集合中各个联想词的第二分数
Figure BDA0003898697960000111
其中,SUM_2=MAX(SUM_20,SUM_21,SUM_22)。
或者,SUM_2=MIN(MAX(SUM_20,SUM_21,SUM_22),M),其中,MIN是指取最小值,M的值可取1000。
S1043:根据所述联想词集合中各个联想词的第一分数和所述联想词集合中各个联想词的第二分数之和,得到所述联想词集合中各个联想词的分数。
设备根据联想词集合中各个联想词的第一分数
Figure BDA0003898697960000112
和联想词集合中各个联想词的第二分数/>
Figure BDA0003898697960000113
之和,得到联想词集合中各个联想词的分数。
S105:根据所述联想词集合和所述联想词集合中各个联想词的分数,构建所述第一目标业态下的联想词库。
设备根据联想词集合和联想词集合中各个联想词的分数,构建第一目标业态下的联想词库。
请参阅图4,图4是本申请实施例提供的一种联想词库的数据存储示意图。可以看到联想词库中的联想词指图4中的keyword,联想词的分数指图4中的score。图4所示联想词库是以表格形式进行存储的,可以确认的是,联想词库的存储可以是其他现有形式,在此不进行限定。
本申请实施例中,在第一目标业态下,不仅通过埋点的方式获取了预设时间段内的第一搜索词、每个第一搜索词关联的商品点击次数和用户已点击的商品数量,还获取了第一上架商品对应的品牌词、类目词和历史搜索词以及获取了第一品牌关联商品数量和第一类目关联商品数量,之后,根据预设时间段内的第一搜索词以及第一上架商品对应的品牌词、类目词和历史搜索词,得到了词源丰富的联想词集合,并且,根据第一搜索词关联的商品点击次数和用户已点击的商品数量、第一品牌关联商品数量以及第一类目关联商品数量,对联想词集合中联想词进行评分,使得构建的第一目标业态下的联想词库不仅词源丰富,且能够基于联想词的分数指导联想词的排序。
前述已经对第二目标业态进行解释,在第二目标业态下若采用上述方式构建联想词库,容易导致用户定位在某一门店下,由于该门店没有某一联想词对应的商品,导致用户点击了联想词而商品结果为空,以及在新开设门店下,由于没有获取充足的埋点数据,历史搜索词也相对有限,导致无法获取到联想词。
为此,考虑到在第二目标业态下,一个商品可能在多家门店销售,若在A门店搜索词语C,并且召回点击了上架序号1-10的商品,而B门店虽然从来没有用户搜索过词语C,但是,可以考虑根据商品与门店之间的关系,将词语C同步到B门店作为联想词使用,具体地,在另一个可选的实施方式中,请参阅图5,图5是本申请第一实施例提供的一种联想词库构建方法的另一示意流程图,联想词库构建方法还包括:
S106:获取预设时间段内的第二搜索词、每个所述第二搜索词关联的商品点击次数以及每个所述第二搜索词关联的用户已点击的商品数量;其中,所述第二搜索词为第二目标业态下的搜索词。
设备获取预设时间段内的第二搜索词、每个第二搜索词关联的商品点击次数以及每个第二搜索词关联的用户已点击的商品数量。
预设时间段内的第二搜索词也是一个集合。同上所述,预设时间段的终止日期是指构建联想词库的日期,预设时间段的起始日期是指构建联想词库的日期向前推n(单位:天、月或年),故,预设时间段的长度为n(单位:天、月或年)。可以选,预设时间段的长度为1(单位:月)。
本实施例中的联想词库也是采用T+1模式更新,也就是指,当前构建的联想词库,在下一日更新使用。
其中,第二搜索词为第二目标业态下的搜索词,第二目标业态在本实施例中是指超市业态。
在一个可选的实施方式中,设备也会对用户输入的第二搜索词进行预处理,仅保留字母、数字以及中文。
每个第二搜索词关联的商品点击次数是指相同的第二搜索词下不同用户进行商品点击的次数之和。
在一个可选的实施方式中,埋点的是搜索点击事件,那么,仅在用户输入第二搜索词后,点击了至少一个商品,设备才能捕捉到该搜索点击事件,从而获取到该第二搜索词以及在该搜索点击事件中第二搜索词关联的商品点击次数。
每个第二搜索词关联的用户已点击的商品数量是指相同的第二搜索词下不同用户已点击的商品数量之和。
在一个可选的实施方式中,埋点的是搜索点击事件,那么,仅在用户输入第二搜索词后,点击了至少一个商品,设备才能捕捉到该搜索点击事件,从而获取到该第二搜索词以及在该搜索点击事件中第二搜索词关联的该用户已点击的商品数量。
上述相同的第二搜索词可以是指预处理后相同的第二搜索词。
S107:获取第二上架商品对应的品牌词、所述第二上架商品对应的类目词以及所述第二上架商品对应的历史搜索词,并根据所述第二上架商品对应的品牌词和所述第二上架商品对应的类目词,得到第二品牌关联商品数量和第二类目关联商品数量;其中,所述第二上架商品为所述第二目标业态下的上架商品。
设备第二上架商品对应的品牌词、第二上架商品对应的类目词以及第二上架商品对应的历史搜索词。
其中,第二上架商品为第二目标业态下的上架商品,在本实施例中,第二上架商品为超市业态下的上架商品。
每个第二上架商品均由对应的品牌和类目,故,设备能够获取到第二上架商品对应的品牌词、第二上架商品对应的类目词。
其中,类目是指商品的品类,例如:水果、水产都是一个类目。
设备也能够根据历史搜索记录,得到第二上架商品对应的历史搜索词。
设备根据第二上架商品对应的品牌词和第二上架商品对应的类目词,得到第二品牌关联商品数量和第二类目关联商品数量。
具体地,设备根据第二上架商品对应的品牌词,得到该品牌词关联的商品的数量,即,第二品牌关联商品数量。
设备根据第二上架商品对应的类目词,得到该类目词关联的商品的数量,即,第二类目关联商品数量。
S108:根据所述预设时间段内的第二搜索词、所述第二上架商品对应的历史搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词,得到所述第二上架商品对应的联想词集合。
设备根据预设时间段内的第二搜索词、第二上架商品对应的历史搜索词、第二上架商品对应的品牌词以及第二上架商品对应的类目词,得到第二上架商品对应的联想词集合。
在一个可选的实施方式中,请参阅图6,图6是本申请第一实施例提供的一种联想词库构建方法中S108的示意流程图,S108包括:
S1081:根据所述预设时间段内的第二搜索词和所述第二上架商品对应的历史搜索词之间的交集,得到所述第二上架商品对应的过滤后的第二搜索词。
设备根据预设时间段内的第二搜索词和第二上架商品对应的历史搜索词之间的交集,得到第二上架商品对应的过滤后的第二搜索词。
这一步是为了保证不会因为商品下架而使得该搜索词在历史中有召回结果,而在当前没有召回结果。
S1082:根据所述第二上架商品对应的过滤后的第二搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词之间的并集,得到所述第二上架商品对应的联想词集合。
设备根据第二上架商品对应的过滤后的第二搜索词、第二上架商品对应的品牌词以及第二上架商品对应的类目词之间的并集,得到第二上架商品对应的联想词集合。
在本实施例中,设备不是直接统计联想词集合,而是针对不同的第二上架商品,分别统计第二上架商品对应的联想词集合。
S109:根据所述第二搜索词关联的商品点击次数、所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,确定所述第二上架商品对应的联想词集合中各个联想词的分数。
设备根据第二搜索词关联的商品点击次数、第二搜索词关联的用户已点击的商品数量、第二品牌关联商品数量以及第二类目关联商品数量,确定第二上架商品对应的联想词集合中各个联想词的分数。
在一个可选的实施方式中,请参阅图7,图7是本申请第一实施例提供的一种联想词库构建方法中S109的示意流程图,S109包括:
S1091:根据所述第二搜索词关联的商品点击次数,计算所述第二上架商品对应的联想词集合中各个联想词的第一分数。
设备根据第二搜索词关联的商品点击次数和对数函数,计算第二上架商品对应的联想词集合中各个联想词的第一分数。
具体地,设备计算以a为底,第二搜索词关联的商品点击次数的对数,得到对应的联想词的第一分数。其中,关于a的值符合对数函数定义即可,在此不限定其具体大小。
需要说明的是,在本实施例中,仅当第二搜索词作为联想词存在于某一第二上架商品对应的联想词集合中,其关联的商品点击次数才会用于计算该第二上架商品对应的联想词集合中该联想词的第一分数。
S1092:根据所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,计算所述第二上架商品对应的联想词集合中各个联想词的第二分数。
设备根据第二搜索词关联的用户已点击的商品数量、第二品牌关联商品数量、第二类目关联商品数量以及对数函数,计算第二上架商品对应的联想词集合中各个联想词的第二分数。
具体地,设备先获取第二搜索词关联的用户已点击的商品数量、第二品牌关联商品数量和第二类目关联商品数量中的最大值,之后,计算以a为底,该最大值的对数,得到对应的联想词的第二分数。其中,关于a的值符合对数函数定义即可,在此不限定其具体大小。
需要说明的是,在本实施例中,仅当第二搜索词作为联想词存在于某一第二上架商品对应的联想词集合中,其关联的用户已点击的商品数量才会用于计算该第二上架商品对应的联想词集合中该联想词的第二分数。
可选的,设备获取到第二搜索词关联的用户已点击的商品数量、第二品牌关联商品数量和第二类目关联商品数量中的最大值之后,还会求取最大值与M之间的最小值,再用于计算第二分数,可选的,M取值为1000。
S1093:根据所述第二上架商品对应的联想词集合中各个联想词的第一分数和所述第二上架商品对应的联想词集合中各个联想词的第二分数之和,得到所述第二上架商品对应的联想词集合中各个联想词的分数。
设备第二上架商品对应的联想词集合中各个联想词的第一分数和第二上架商品对应的联想词集合中各个联想词的第二分数之和,得到第二上架商品对应的联想词集合中各个联想词的分数。
S110:获取所述第二目标业态下各个门店的第二上架商品。
S111:根据所述第二上架商品对应的联想词集合和各个所述门店的第二上架商品,得到各个所述门店的第二上架商品对应的联想词集合。
S112:根据各个所述门店的第二上架商品对应的联想词集合和所述第二上架商品对应的联想词集合中各个联想词的分数,构建所述第二目标业态下的联想词库。
由于第二目标业态下的搜索入口,用户正常只能搜索到当前定位门店的商品,而各个门店的第二上架商品是可能存在差异的,因此,为了防止用户点击了某一联想词后,显示的商品为空,故,设备会先获取第二目标业态下各个门店的第二上架商品。
之后,设备再根据各个门店的第二上架商品和第二上架商品对应的联想词集合,得到各个门店的第二上架商品对应的联想词集合。
最后,根据各个门店的第二上架商品对应的联想词集合和第二上架商品对应的联想词集合中各个联想词的分数,构建第二目标业态下的联想词库。
请参阅图8,图8是本申请实施例提供的一种联想词库的数据存储示意图。可以看到,图8中联想词库还包含store_id字段,该字段为门店对应的标识,联想词指图8中的keyword,联想词的分数指图8中的score。图8所示联想词库是以表格形式进行存储的,可以确认的是,联想词库的存储可以是其他现有形式,在此不进行限定。
在本申请实施例中,在第二目标业态下若采用上述方式构建联想词库,容易导致用户定位在某一门店下,由于该门店没有某一联想词对应的商品,导致用户点击了联想词而商品结果为空,以及在新开设门店下,由于没有获取充足的埋点数据,历史搜索词也相对有限,导致无法获取到联想词,为此,设备通过与上述类似的方式,获取到第二目标业态下第二上架商品对应的联想词集合以及第二上架商品对应的联想词集合中各个联想词的分数,之后,设备获取第二目标业态下各个门店的第二上架商品,根据第二上架商品对应的联想词集合和各个门店的第二上架商品,得到各个门店的第二上架商品对应的联想词集合,再根据各个门店的第二上架商品对应的联想词集合和第二上架商品对应的联想词集合中各个联想词的分数,构建第二目标业态下的联想词库,通过此种方式构建的第二目标业态下的联想词库,能够支撑不同门店下的搜索联想。
请参见图9,图9是本申请第二实施例提供的一种联想词推荐方法的示意流程图。本实施例中一种联想词推荐方法的执行主体为具有联想词推荐功能的设备,该联想词推荐设备可以为个人计算机以及服务器等,也可以为处理器、微处理器等。本申请实施例以联想词推荐设备(以下简称为设备)为联想词推荐方法的执行主体进行下述解释说明,不具体对设备进行限定。如图9所示的联想词推荐方法可以包括:
S201:根据第一实施例所述的联想词库构建方法,构建第一目标业态下的联想词库。
设备根据第一实施例的联想词库构建方法,构建第一目标业态下的联想词库。关于具体说明请参见步骤S101~步骤S105的相关说明。
S202:获取所述第一目标业态下的当前搜索词,并根据所述当前搜索词,从所述第一目标业态下的联想词库中,获取并推荐目标联想词。
设备获取第一目标业态下的当前搜索词,并根据当前搜索词,从第一目标业态下的联想词库中,获取并推荐目标联想词。
具体地,设备可以前缀匹配方式根据当前搜索词,从第一目标业态下的联想词库中,获取并推荐目标联想词。
请参阅图10,图10是本申请实施例提供的搜索联想的界面示意图。该界面示意图中显示有搜索框101,当前搜索词为“牛”,目标联想词包括若干个,均已显示在图10中。
在一个可选的实施方式中,设备从第一目标业态下的联想词库中提取分数靠前的联想词作为目标联想词,且按照分数从高到低推荐目标联想词。
本实施例中,在使用第一实施例的方式构建第一目标业态下的联想词库后,设备获取第一目标业态下的当前搜索词,并根据当前搜索词,从第一目标业态下的联想词库中,获取并推荐目标联想词,能够使得目标联想词更贴合用户需求,进而有利于提高用户的搜索体验,更便于其搜索到其想要的商品。
请参见图11,图11是本申请第三实施例提供的一种联想词推荐方法的示意流程图。本实施例中一种联想词推荐方法的执行主体为具有联想词推荐功能的设备,该联想词推荐设备可以为个人计算机以及服务器等,也可以为处理器、微处理器等。本申请实施例以联想词推荐设备(以下简称为设备)为联想词推荐方法的执行主体进行下述解释说明,不具体对设备进行限定。如图11所示的联想词推荐方法可以包括:
S301:根据第一实施例所述的联想词库构建方法,构建第二目标业态下的联想词库。
设备根据第一实施例的联想词库构建方法,构建第二目标业态下的联想词库。关于具体说明请参见步骤S105~步骤S112的相关说明。
S302:获取所述第二目标业态下的当前搜索词和门店标识,并根据所述当前搜索词和所述门店标识,从所述第二目标业态下的联想词库中,获取并推荐目标联想词。
设备获取第二目标业态下的当前搜索词和门店标识,并根据当前搜索词和门店标识,从第二目标业态下的联想词库中,获取并推荐目标联想词。
具体地,设备可以先根据门店标识,获取到门店标识对应的联想词,之后,再采用前缀匹配方式根据当前搜索词,从门店标识对应的联想词中,获取并推荐目标联想词。
可以理解的是,设备也可以先进行前缀匹配,再进行门店标识的匹配,在此不限定其具体执行顺序。
本实施例中,在使用第一实施例的方式构建第二目标业态下的联想词库后,设备获取第二目标业态下的当前搜索词和门店标识,并根据当前搜索词和门店标识,从第二目标业态下的联想词库中,获取并推荐目标联想词,能够防止用户点击了联想词而商品结果为空以及无法获取到联想词的情况,进一步提高了第二目标业态下的用户搜索体验。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
请参见图12,图12是本申请第四实施例提供的联想词库构建装置的示意图。包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图12,联想词库构建装置12包括:
第一获取单元121,用于获取预设时间段内的第一搜索词,以及获取每个所述第一搜索词关联的商品点击次数以及每个所述第一搜索词关联的用户已点击的商品数量;其中,所述第一搜索词为第一目标业态下的搜索词;
第二获取单元122,用于获取第一上架商品对应的品牌词、所述第一上架商品对应的类目词以及所述第一上架商品对应的历史搜索词,并根据所述第一上架商品对应的品牌词和所述第一上架商品对应的类目词,得到第一品牌关联商品数量和第一类目关联商品数量;其中,所述第一上架商品为所述第一目标业态下的上架商品;
第三获取单元123,根据所述预设时间段内的第一搜索词、所述第一上架商品对应的历史搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词,得到联想词集合;
第一确定单元124,用于根据所述第一搜索词关联的商品点击次数、所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,确定所述联想词集合中各个联想词的分数;
第一构建单元125,用于根据所述联想词集合和所述联想词集合中各个联想词的分数,构建所述第一目标业态下的联想词库。
进一步地,第三获取单元123,具体用于:根据所述预设时间段内的第一搜索词和所述第一上架商品对应的历史搜索词之间的交集,得到过滤后的第一搜索词;根据所述过滤后的第一搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词之间的并集,得到联想词集合。
进一步地,第一确定单元124,具体用于:根据所述第一搜索词关联的商品点击次数,计算所述联想词集合中各个联想词的第一分数;根据所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,计算所述联想词集合中各个联想词的第二分数;根据所述联想词集合中各个联想词的第一分数和所述联想词集合中各个联想词的第二分数之和,得到所述联想词集合中各个联想词的分数。
进一步地,所述联想词库构建装置12,还包括:
第四获取单元,用于获取预设时间段内的第二搜索词、每个所述第二搜索词关联的商品点击次数以及每个所述第二搜索词关联的用户已点击的商品数量;其中,所述第二搜索词为第二目标业态下的搜索词;
第五获取单元,用于获取第二上架商品对应的品牌词、所述第二上架商品对应的类目词以及所述第二上架商品对应的历史搜索词,并根据所述第二上架商品对应的品牌词和所述第二上架商品对应的类目词,得到第二品牌关联商品数量和第二类目关联商品数量;其中,所述第二上架商品为所述第二目标业态下的上架商品;
第六获取单元,用于根据所述预设时间段内的第二搜索词、所述第二上架商品对应的历史搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词,得到所述第二上架商品对应的联想词集合;
第二确定单元,用于根据所述第二搜索词关联的商品点击次数、所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,确定所述第二上架商品对应的联想词集合中各个联想词的分数;
第七获取单元,用于获取所述第二目标业态下各个门店的第二上架商品;
第八获取单元,用于根据所述第二上架商品对应的联想词集合和各个所述门店的第二上架商品,得到各个所述门店的第二上架商品对应的联想词集合;
第二构建单元,用于根据各个所述门店的第二上架商品对应的联想词集合和所述第二上架商品对应的联想词集合中各个联想词的分数,构建所述第二目标业态下的联想词库。
进一步地,第六获取单元,具体用于:根据所述预设时间段内的第二搜索词和所述第二上架商品对应的历史搜索词之间的交集,得到所述第二上架商品对应的过滤后的第二搜索词;根据所述第二上架商品对应的过滤后的第二搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词之间的并集,得到所述第二上架商品对应的联想词集合。
进一步地,第二确定单元,具体用于:根据所述第二搜索词关联的商品点击次数,计算所述第二上架商品对应的联想词集合中各个联想词的第一分数;所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,计算所述第二上架商品对应的联想词集合中各个联想词的第二分数;根据所述第二上架商品对应的联想词集合中各个联想词的第一分数和所述第二上架商品对应的联想词集合中各个联想词的第二分数之和,得到所述第二上架商品对应的联想词集合中各个联想词的分数。
请参见图13,图13是本申请第五实施例提供的联想词推荐装置的示意图。包括的各单元用于执行图9对应的实施例中的各步骤。具体请参阅图9对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图13,联想词推荐装置13包括:
第二构建单元131,用于根据第一实施例所述的联想词库构建方法,构建第一目标业态下的联想词库;
第一推荐单元132,用于获取所述第一目标业态下的当前搜索词,并根据所述当前搜索词,从所述第一目标业态下的联想词库中,获取并推荐目标联想词。
请参见图14,图14是本申请第六实施例提供的联想词推荐装置的示意图。包括的各单元用于执行图11对应的实施例中的各步骤。具体请参阅图11对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图14,联想词推荐装置14包括:
第三构建单元141,用于根据第一实施例所述的联想词库构建方法,构建第二目标业态下的联想词库;
第二推荐单元142,用于获取所述第二目标业态下的当前搜索词和门店标识,并根据所述当前搜索词和所述门店标识,从所述第二目标业态下的联想词库中,获取并推荐目标联想词。
请参见图15,图15是本申请第七实施例提供的设备的示意图。如图15所示,该实施例的设备15包括:处理器150、存储器151以及存储在所述存储器151中并可在所述处理器150上运行的计算机程序152,例如联想词库构建程序和/或联想词推荐程序。所述处理器150执行所述计算机程序152时实现上述各个联想词库构建方法实施例中的步骤,例如图1所示的步骤S101至S105,和/或,实现上述各个联想词推荐方法实施例中的步骤,例如图9所示的步骤S201至S202。或者,所述处理器150执行所述计算机程序152时实现上述各装置实施例中各模块/单元的功能,例如:图12、图13和/或图14所示各个单元的功能。
示例性的,所述计算机程序152可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器151中,并由所述处理器150执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序152在设备15中的执行过程。例如,所述计算机程序152可以被分割成第一获取单元、第二获取单元、第三获取单元、第一确定单元以及第一构建单元,各单元具体功能如下:
第一获取单元,用于获取预设时间段内的第一搜索词,以及获取每个所述第一搜索词关联的商品点击次数以及每个所述第一搜索词关联的用户已点击的商品数量;其中,所述第一搜索词为第一目标业态下的搜索词;
第二获取单元,用于获取第一上架商品对应的品牌词、所述第一上架商品对应的类目词以及所述第一上架商品对应的历史搜索词,并根据所述第一上架商品对应的品牌词和所述第一上架商品对应的类目词,得到第一品牌关联商品数量和第一类目关联商品数量;其中,所述第一上架商品为所述第一目标业态下的上架商品;
第三获取单元,根据所述预设时间段内的第一搜索词、所述第一上架商品对应的历史搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词,得到联想词集合;
第一确定单元,用于根据所述第一搜索词关联的商品点击次数、所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,确定所述联想词集合中各个联想词的分数;
第一构建单元,用于根据所述联想词集合和所述联想词集合中各个联想词的分数,构建所述第一目标业态下的联想词库。
所述设备15可包括,但不仅限于,处理器150、存储器151。本领域技术人员可以理解,图15仅仅是设备15的示例,并不构成对设备15的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如设备15还可以包括输入输出设备、网络接入设备、总线等。
所称处理器150可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器151可以是设备15的内部存储单元,例如设备15的硬盘或内存。所述存储器151也可以是设备15的外部存储设备,例如设备15上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,设备15还可以既包括设备15的内部存储单元也包括外部存储设备。所述存储器151用于存储所述计算机程序以及设备15所需的其他程序和数据。所述存储器151还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
本申请实施例还提供了一种网络设备,该网络设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种联想词库构建方法,其特征在于,包括:
获取预设时间段内的第一搜索词,以及获取每个所述第一搜索词关联的商品点击次数以及每个所述第一搜索词关联的用户已点击的商品数量;其中,所述第一搜索词为第一目标业态下的搜索词;
获取第一上架商品对应的品牌词、所述第一上架商品对应的类目词以及所述第一上架商品对应的历史搜索词,并根据所述第一上架商品对应的品牌词和所述第一上架商品对应的类目词,得到第一品牌关联商品数量和第一类目关联商品数量;其中,所述第一上架商品为所述第一目标业态下的上架商品;
根据所述预设时间段内的第一搜索词、所述第一上架商品对应的历史搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词,得到联想词集合;
根据所述第一搜索词关联的商品点击次数、所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,确定所述联想词集合中各个联想词的分数;
根据所述联想词集合和所述联想词集合中各个联想词的分数,构建所述第一目标业态下的联想词库。
2.如权利要求1所述的联想词库构建方法,其特征在于,所述根据所述预设时间段内的第一搜索词、所述第一上架商品对应的历史搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词,得到联想词集合,包括:
根据所述预设时间段内的第一搜索词和所述第一上架商品对应的历史搜索词之间的交集,得到过滤后的第一搜索词;
根据所述过滤后的第一搜索词、所述第一上架商品对应的品牌词以及所述第一上架商品对应的类目词之间的并集,得到联想词集合。
3.如权利要求1所述的联想词库构建方法,其特征在于,所述根据所述第一搜索词关联的商品点击次数、所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,确定所述联想词集合中各个联想词的分数,包括:
根据所述第一搜索词关联的商品点击次数,计算所述联想词集合中各个联想词的第一分数;
根据所述第一搜索词关联的用户已点击的商品数量、所述第一品牌关联商品数量以及所述第一类目关联商品数量,计算所述联想词集合中各个联想词的第二分数;
根据所述联想词集合中各个联想词的第一分数和所述联想词集合中各个联想词的第二分数之和,得到所述联想词集合中各个联想词的分数。
4.如权利要求1至3任意一项所述的联想词库构建方法,其特征在于,所述方法还包括:
获取预设时间段内的第二搜索词、每个所述第二搜索词关联的商品点击次数以及每个所述第二搜索词关联的用户已点击的商品数量;其中,所述第二搜索词为第二目标业态下的搜索词;
获取第二上架商品对应的品牌词、所述第二上架商品对应的类目词以及所述第二上架商品对应的历史搜索词,并根据所述第二上架商品对应的品牌词和所述第二上架商品对应的类目词,得到第二品牌关联商品数量和第二类目关联商品数量;其中,所述第二上架商品为所述第二目标业态下的上架商品;
根据所述预设时间段内的第二搜索词、所述第二上架商品对应的历史搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词,得到所述第二上架商品对应的联想词集合;
根据所述第二搜索词关联的商品点击次数、所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,确定所述第二上架商品对应的联想词集合中各个联想词的分数;
获取所述第二目标业态下各个门店的第二上架商品;
根据所述第二上架商品对应的联想词集合和各个所述门店的第二上架商品,得到各个所述门店的第二上架商品对应的联想词集合;
根据各个所述门店的第二上架商品对应的联想词集合和所述第二上架商品对应的联想词集合中各个联想词的分数,构建所述第二目标业态下的联想词库。
5.如权利要求4所述的联想词库构建方法,其特征在于,所述根据所述预设时间段内的第二搜索词、所述第二上架商品对应的历史搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词,得到所述第二上架商品对应的联想词集合,包括:
根据所述预设时间段内的第二搜索词和所述第二上架商品对应的历史搜索词之间的交集,得到所述第二上架商品对应的过滤后的第二搜索词;
根据所述第二上架商品对应的过滤后的第二搜索词、所述第二上架商品对应的品牌词以及所述第二上架商品对应的类目词之间的并集,得到所述第二上架商品对应的联想词集合。
6.如权利要求4所述的联想词库构建方法,其特征在于,所述根据所述第二搜索词关联的商品点击次数、所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,确定所述第二上架商品对应的联想词集合中各个联想词的分数,包括:
根据所述第二搜索词关联的商品点击次数,计算所述第二上架商品对应的联想词集合中各个联想词的第一分数;
所述第二搜索词关联的用户已点击的商品数量、所述第二品牌关联商品数量以及所述第二类目关联商品数量,计算所述第二上架商品对应的联想词集合中各个联想词的第二分数;
根据所述第二上架商品对应的联想词集合中各个联想词的第一分数和所述第二上架商品对应的联想词集合中各个联想词的第二分数之和,得到所述第二上架商品对应的联想词集合中各个联想词的分数。
7.一种联想词推荐方法,其特征在于,包括:
根据权利要求1至3任意一项所述的联想词库构建方法,构建第一目标业态下的联想词库;
获取所述第一目标业态下的当前搜索词,并根据所述当前搜索词,从所述第一目标业态下的联想词库中,获取并推荐目标联想词。
8.一种联想词推荐方法,其特征在于,包括:
根据权利要求4至6任意一项所述的联想词库构建方法,构建第二目标业态下的联想词库;
获取所述第二目标业态下的当前搜索词和门店标识,并根据所述当前搜索词和所述门店标识,从所述第二目标业态下的联想词库中,获取并推荐目标联想词。
9.一种电子设备,其特征在于,包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任意一项、权利要求7和/或权利要求8所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如求1至6任意一项、权利要求7和/或权利要求8所述方法的步骤。
CN202211282433.1A 2022-10-19 2022-10-19 一种联想词库构建方法、联想词推荐方法及设备 Active CN115599768B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211282433.1A CN115599768B (zh) 2022-10-19 2022-10-19 一种联想词库构建方法、联想词推荐方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211282433.1A CN115599768B (zh) 2022-10-19 2022-10-19 一种联想词库构建方法、联想词推荐方法及设备

Publications (2)

Publication Number Publication Date
CN115599768A CN115599768A (zh) 2023-01-13
CN115599768B true CN115599768B (zh) 2023-06-09

Family

ID=84849456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211282433.1A Active CN115599768B (zh) 2022-10-19 2022-10-19 一种联想词库构建方法、联想词推荐方法及设备

Country Status (1)

Country Link
CN (1) CN115599768B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117271869B (zh) * 2023-11-22 2024-03-29 深圳市灵智数字科技有限公司 用户搜索词推荐方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010205224A (ja) * 2009-03-06 2010-09-16 Yahoo Japan Corp 商品情報提供装置、商品情報の提供方法及びプログラム
CN107679119A (zh) * 2017-09-19 2018-02-09 北京京东尚科信息技术有限公司 生成品牌衍生词的方法和装置
CN109635198A (zh) * 2018-12-17 2019-04-16 杭州柚子街信息科技有限公司 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备
CN111488434A (zh) * 2019-01-25 2020-08-04 北京字节跳动网络技术有限公司 输入联想词的推荐方法、装置、存储介质及电子设备
CN111782913A (zh) * 2019-08-28 2020-10-16 北京京东尚科信息技术有限公司 用于确定品牌意图词的方法和装置
CN114154064A (zh) * 2021-12-01 2022-03-08 北京鸥鹭数据科技有限公司 一种商品关键词优化方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010205224A (ja) * 2009-03-06 2010-09-16 Yahoo Japan Corp 商品情報提供装置、商品情報の提供方法及びプログラム
CN107679119A (zh) * 2017-09-19 2018-02-09 北京京东尚科信息技术有限公司 生成品牌衍生词的方法和装置
CN109635198A (zh) * 2018-12-17 2019-04-16 杭州柚子街信息科技有限公司 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备
CN111488434A (zh) * 2019-01-25 2020-08-04 北京字节跳动网络技术有限公司 输入联想词的推荐方法、装置、存储介质及电子设备
CN111782913A (zh) * 2019-08-28 2020-10-16 北京京东尚科信息技术有限公司 用于确定品牌意图词的方法和装置
CN114154064A (zh) * 2021-12-01 2022-03-08 北京鸥鹭数据科技有限公司 一种商品关键词优化方法及装置

Also Published As

Publication number Publication date
CN115599768A (zh) 2023-01-13

Similar Documents

Publication Publication Date Title
US7912852B1 (en) Search-caching and threshold alerting for commerce sites
CN108717407B (zh) 实体向量确定方法及装置,信息检索方法及装置
CN103678365B (zh) 数据的动态获取方法、装置及系统
EP2782029A2 (en) Re-ranking results in a search
CN110196904B (zh) 一种获取推荐信息的方法、装置及计算机可读存储介质
US20100191758A1 (en) System and method for improved search relevance using proximity boosting
CN109635198B (zh) 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备
US7702700B2 (en) Automatic matching method and automatic matching system
EP3252696A1 (en) Dynamic content item creation
CN106062743A (zh) 用于关键字建议的系统和方法
CN103412881A (zh) 提供搜索结果的方法及系统
CN110111167A (zh) 一种确定推荐对象的方法和装置
CN107885888A (zh) 信息处理方法及装置、终端设备以及计算机可读存储介质
CN113077317A (zh) 基于用户数据的物品推荐方法、装置、设备及存储介质
US20170287041A1 (en) Information processing apparatus, information processing method, and information processing program
CN109582155B (zh) 输入联想词的推荐方法、装置、存储介质及电子设备
CN107609192A (zh) 一种搜索引擎的补充搜索方法和装置
CN115599768B (zh) 一种联想词库构建方法、联想词推荐方法及设备
US20170200141A1 (en) Methods and systems for managing electronic contents in electronic publication
US7949576B2 (en) Method of providing product database
CN112118489B (zh) 群组管理的方法、装置、设备和介质
CN106599082B (zh) 一种检索方法、相关装置及电子设备
CN110827101B (zh) 一种店铺推荐的方法和装置
US11487835B2 (en) Information processing system, information processing method, and program
CN115687756A (zh) 一种搜索推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant