CN110781365A - 商品搜索方法、装置、系统及电子设备 - Google Patents

商品搜索方法、装置、系统及电子设备 Download PDF

Info

Publication number
CN110781365A
CN110781365A CN201810770906.XA CN201810770906A CN110781365A CN 110781365 A CN110781365 A CN 110781365A CN 201810770906 A CN201810770906 A CN 201810770906A CN 110781365 A CN110781365 A CN 110781365A
Authority
CN
China
Prior art keywords
search
word
commodity
determining
intervened
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810770906.XA
Other languages
English (en)
Other versions
CN110781365B (zh
Inventor
李珊珊
王国栋
陆雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810770906.XA priority Critical patent/CN110781365B/zh
Publication of CN110781365A publication Critical patent/CN110781365A/zh
Application granted granted Critical
Publication of CN110781365B publication Critical patent/CN110781365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了商品搜索方法、装置和系统,商品倒排索引构建方法和装置,干预词库构建方法和装置,以及电子设备。其中,商品搜索方法包括:接收客户端发送的针对用户指定搜索词的商品搜索请求;根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的分词;根据所述商品标题的分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;向所述客户端回送所述商品信息。采用这种处理方式,使得结合生鲜类商品的商品特性构建生鲜类搜索词与离线分词的对应关系集,根据该对应关系集确定生鲜类商品搜索词的离线分词;因此,可以有效提升搜索准确度,从而提升商品销售率和用户体验。

Description

商品搜索方法、装置、系统及电子设备
技术领域
本申请涉及搜索引擎技术领域,具体涉及商品搜索方法、装置和系统,商品倒排索引构建方法和装置,干预词库构建方法和装置,以及电子设备。
背景技术
生鲜产品电子商务,简称生鲜电商,指用电子商务的手段在互联网上直接销售生鲜类产品,如新鲜水果、蔬菜、生鲜肉类等。生鲜电商随着电子商务的发展大趋势而发展。
用户在生鲜电商购买生鲜类商品时,通常要先通过商品搜索引擎进行商品搜索。一种典型的生鲜类商品搜索方法如下所述。生鲜电商的前台系统与后台管理系统连接,用户在前台的商品搜索框,输入关键词(搜索词),点击搜索按钮,然后通过储存在服务器中的数据库响应,将与关键词相关的内容呈现出来。其中,搜索引擎采用传统电商的通用分词技术对搜索词进行分词处理,以及对生鲜类商品的标题进行分词处理,并依据商品标题的分词结果,构建各个分词的商品倒排索引。例如,采用通用分词技术对商品标题包括“三文鱼”的商品A、B、C的标题进行分词的结果包括“三文鱼”,则“三文鱼”对应的倒排索引包括商品A、B、C;当用户输入搜索词“三文鱼”时,检索结果包括商品A、B、C。
然而,在实现本发明过程中,发明人发现该技术方案至少存在如下问题:生鲜电商属于新零售的新兴产业,平台运营初期时商品数量较少,特别是生鲜类商品具有特殊性,使得在采用基于通用分词技术搭建的生鲜电商的搜索引擎进行商品搜索时,线上搜索服务有很多坏例(badcase),例如,搜索不到平台销售的商品(即有商品却无结果);只搜索到少量商品(即有商品但少结果);召回商品与预期不符;运营期望商品未被搜索到等问题。综上所述,现有技术存在搜索准确度低的问题。
发明内容
本申请提供商品搜索方法,以解决现有技术存在的搜索准确度低的问题。本申请另外提供商品搜索装置和系统,商品倒排索引构建方法和装置,干预词库构建方法和装置,以及电子设备。
本申请提供一种商品搜索方法,包括:
接收客户端发送的针对用户指定搜索词的商品搜索请求;
根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;
向所述客户端回送所述商品信息。
可选的,还包括:
根据所述待干预搜索词与在线分词之间的对应关系集,确定所述指定搜索词的在线分词;
所述根据所述商品倒排索引,并确定所述指定搜索词对应的商品信息,包括:
根据所述商品倒排索引,确定所述在线分词对应的商品信息;
将各个在线分词共同对应的商品信息,作为所述指定搜索词对应的商品信息。
可选的,还包括:
确定所述待干预搜索词;
确定所述待干预搜索词的子词;
根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
可选的,所述确定所述待干预搜索词,包括:
根据所述历史搜索记录,确定历史搜索词及其搜索次数;
根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
可选的,还包括:
获取所述待干预搜索词的在线分词;
将所述在线分词作为与所述待干预搜索词对应的离线分词。
可选的,还包括:
选取符合在线分词规则的所述离线分词,作为与所述待干预搜索词对应的在线分词。
可选的,所述在线分词规则包括:所述在线分词组合成所述待干预搜索词。
可选的,还包括:
将所述待干预搜索词作为与所述待干预搜索词对应的在线分词。
本申请还提供一种商品搜索方法,包括:
向服务器发送针对用户指定搜索词的商品搜索请求;
接收所述服务器回送的所述指定搜索词对应的商品信息;
展示所述商品信息;
所述商品信息,采用如下方式确定:
根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
本申请还提供一种商品搜索装置,包括:
请求接收单元,用于接收客户端发送的针对用户指定搜索词的商品搜索请求;
离线分词确定单元,用于根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
商品倒排索引确定单元,用于根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
商品信息确定单元,用于根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;
商品信息回送单元,用于向所述客户端回送所述商品信息。
可选的,还包括:
在线分词确定单元,用于根据所述待干预搜索词与在线分词之间的对应关系集,确定所述指定搜索词的在线分词;
所述商品信息确定单元包括:
第一商品信息确定子单元,用于根据所述商品倒排索引,确定所述在线分词对应的商品信息;
第二商品信息确定子单元,用于将各个在线分词共同对应的商品信息,作为所述指定搜索词对应的商品信息。
可选的,还包括:
第一对应关系集确定单元,用于根据商品的历史搜索记录,确定所述对应关系集;
所述第一对应关系集确定单元,包括:
待干预搜索词确定子单元,用于确定所述待干预搜索词;
子词确定子单元,用于确定所述待干预搜索词的子词;
子词搜索次数确定子单元,用于根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
第一离线分词确定子单元,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
可选的,所述待干预搜索词确定子单元包括:
历史搜索词及搜索次数确定子单元,用于根据所述历史搜索记录,确定历史搜索词及其搜索次数;
候选词选取子单元,用于根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
待干预搜索词选取子单元,用于将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
可选的,所述第一对应关系集确定单元还包括:
在线分词获取子单元,用于获取所述待干预搜索词的在线分词;
第二离线分词确定子单元,用于将所述在线分词作为所述待干预搜索词对应的离线分词。
可选的,还包括:
第二对应关系集确定单元,用于选取符合在线分词规则的所述离线分词,作为与所述待干预搜索词对应的在线分词。
可选的,所述在线分词规则包括:所述线分词组合成所述待干预搜索词。
可选的,所述第二对应关系集确定单元,还用于将所述待干预搜索词作为所述待干预搜索词对应的在线分词。
本申请还提供一种商品搜索装置,包括:
请求发送单元,用于向服务器发送针对用户指定搜索词的商品搜索请求;
商品信息接收单元,用于接收所述服务器回送的所述指定搜索词对应的商品信息;
商品信息展示单元,用于展示所述商品信息;
所述商品信息,采用如下方式确定:
根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
本申请还提供一种商品搜索系统,包括:
根据上述服务器侧的商品搜索装置,以及,根据上述客户端侧的商品搜索装置。
本申请还提供一种商品倒排索引构建方法,包括:
获取待干预搜索词与离线分词之间的对应关系集;
根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
本申请还提供一种商品倒排索引构建装置,包括:
对应关系集获取单元,用于获取待干预搜索词与离线分词之间的对应关系集;
离线分词确定单元,用于根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;
商品倒排索引确定单元,用于根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
本申请还提供一种干预词库构建方法,包括:
确定待干预搜索词;
确定所述待干预搜索词的子词;
根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
可选的,所述确定待干预搜索词,包括:
根据所述历史搜索记录,确定历史搜索词及其搜索次数;
根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
本申请还提供一种干预词库构建装置,包括:
待干预搜索词确定单元,用于确定待干预搜索词;
子词确定单元,用于确定所述待干预搜索词的子词;
子词搜索次数确定单元,用于根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
离线分词确定单元,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
可选的,所述待干预搜索词确定单元包括:
历史搜索词及搜索次数确定子单元,用于根据所述历史搜索记录,确定历史搜索词及其搜索次数;
候选词选取子单元,用于根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
待干预搜索词选取子单元,用于将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
本申请还提供一种干预词库构建方法,包括:
确定待干预搜索词;
确定所述待干预搜索词的子词;
根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;
将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
本申请还提供一种干预词库构建装置,包括:
待干预搜索词确定单元,用于确定待干预搜索词;
子词确定单元,用于确定所述待干预搜索词的子词;
子词搜索次数确定单元,用于根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
候选在线分词确定单元,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;
在线分词确定单元,用于将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现商品搜索方法的程序,该设备通电并通过所述处理器运行该商品搜索方法的程序后,执行下述步骤:接收客户端发送的针对用户指定搜索词的商品搜索请求;根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;向所述客户端回送所述商品信息。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现商品搜索方法的程序,该设备通电并通过所述处理器运行该商品搜索方法的程序后,执行下述步骤:向服务器发送针对用户指定搜索词的商品搜索请求;接收所述服务器回送的所述指定搜索词对应的商品信息;展示所述商品信息;所述商品信息,采用如下方式确定:根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现商品倒排索引构建方法的程序,该设备通电并通过所述处理器运行该商品倒排索引构建方法的程序后,执行下述步骤:获取待干预搜索词与离线分词之间的对应关系集;根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现干预词库构建方法的程序,该设备通电并通过所述处理器运行该干预词库构建方法的程序后,执行下述步骤:确定待干预搜索词;确定所述待干预搜索词的子词;根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现干预词库构建方法的程序,该设备通电并通过所述处理器运行该干预词库构建方法的程序后,执行下述步骤:确定待干预搜索词;确定所述待干预搜索词的子词;根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各种方法。
本申请还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种方法。
与现有技术相比,本申请具有以下优点:
本申请实施例提供的商品搜索方法,通过接收客户端发送的针对用户指定搜索词的商品搜索请求;根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的分词;根据所述商品标题的分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;向所述客户端回送所述商品信息;这种处理方式,使得结合生鲜类商品的商品特性构建生鲜类搜索词与离线分词的对应关系集,根据该对应关系集确定生鲜类商品搜索词的离线分词;因此,可以有效提升搜索准确度,从而提升商品销售率和用户体验。
附图说明
图1是本申请提供的一种商品搜索方法的实施例的流程图;
图2是本申请提供的一种商品搜索方法的实施例的生成待干预搜索词与离线分词之间的对应关系集的流程图;
图3是本申请提供的一种商品搜索方法的实施例的生成待干预搜索词与在线分词之间的对应关系集的流程图;
图4是本申请提供的一种商品搜索方法的实施例的查询结果对比示意图;
图5是本申请提供的一种商品搜索装置的实施例的示意图;
图6是本申请提供的一种商品搜索装置的实施例的具体示意图;
图7是本申请提供的一种商品搜索装置的实施例的第一对应关系集确定单元的具体示意图;
图8是本申请提供的一种商品搜索装置的实施例的具体示意图;
图9是本申请提供的一种电子设备的实施例的示意图;
图10是本申请提供的另一种商品搜索方法的实施例的流程图;
图11是本申请提供的另一种商品搜索装置的实施例的示意图;
图12是本申请提供的一种电子设备的实施例的示意图;
图13是本申请提供的一种商品搜索系统的实施例的结构示意图;
图14是本申请提供的一种商品倒排索引构建方法的实施例的流程图;
图15是本申请提供的一种商品倒排索引构建装置的实施例的示意图;
图16是本申请提供的一种电子设备的实施例的示意图;
图17是本申请提供的一种干预词库构建方法的实施例的流程图;
图18是本申请提供的一种干预词库构建装置的实施例的示意图;
图19是本申请提供的一种电子设备的实施例的示意图;
图20是本申请提供的一种干预词库构建方法的实施例的流程图;
图21是本申请提供的一种干预词库构建装置的实施例的示意图;
图22是本申请提供的一种电子设备的实施例的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请中,提供了商品搜索方法、装置及系统,商品倒排索引构建方法和装置,干预词库构建方法和装置,以及电子设备。在下面的实施例中逐一进行详细说明。
本申请提供的技术方案,其发明构思为:根据生鲜类商品对应的干预词库,该词库包括待干预搜索词与离线分词之间的对应关系集,确定搜索词作为商品标题的离线分词,并根据该离线分词构建生鲜类商品搜索词对应的商品倒排索引,再根据该商品倒排索引确定搜索词对应的商品信息。由于结合生鲜类商品的商品特性构建干预词库,根据干预词库确定生鲜类商品搜索词的离线分词,因此可以有效提升搜索准确度,从而提升商品销售率和用户体验。
需要说明的是,本申请提供的技术方案不仅适用于搜索生鲜类商品,也同样适用于搜索具有搜索结果召全率低、召准率低特征的其它类商品。为了便于描述,以下实施例仅以生鲜类商品搜索为例进行说明。
第一实施例
请参见图1,其为本申请实施例提供的一种商品搜索方法的流程图。该方法的执行主体为商品搜索装置,又可称为商品搜索引擎,该装置通常部署于服务器,但并不局限于服务器,也可以是能够实现所述商品搜索方法的任何设备。在本实施例中,本申请提供的一种商品搜索方法包括:
步骤S101:接收客户端发送的针对用户指定搜索词的商品搜索请求。
所述客户端包括但不限于移动通讯设备,即:通常所说的手机或者智能手机,还包括个人电脑、PAD、iPad等终端设备。
所述用户,包括生鲜电商的消费者。用户可在所述客户端显示的商品搜索页面的商品搜索框,输入搜索词,点击搜索按钮,然后客户端响应用户的搜索指令,向商品搜索引擎发送针对用户指定搜索词的商品搜索请求。所述商品搜索请求,可包括所述搜索词。
步骤S102:根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词。
所述商品搜索引擎,要根据商品倒排索引确定与用户搜索词对应的商品信息。商品倒排索引(Inverted Index),又叫反向索引,是一种商品索引方法,常被用于商品搜索系统中的一种关键词与商品之间的映射结构,可包括与商品标题的各个分词分别对应的商品信息。商品倒排索引是一种逆向思维运算,实现了通过了关键词对商品进行映射,可以帮助用户快速定位到目标商品信息,极大地降低了信息获取难度。
本申请提供的方法与现有技术不同之处包括:根据生鲜类商品专用的待干预搜索词与离线分词之间的对应关系集,确定生鲜类商品标题内的所述待干预搜索词部分的分词,即该分词并非采用现有的分词技术确定的分词,而是基于结合生鲜类商品的商品特性构建干预词库(包括所述对应关系集),并根据该词库确定生鲜类商品的所述待干预搜索词作为商品标题内容时的分词。
由于商品倒排索引通常以离线方式构建,因此通常将搜索词作为商品标题内容时的分词称为该搜索词的离线分词,将搜索词作为在线检索词时的分词称为该搜索词的在线分词。例如,搜索词“金菠萝”的在线分词包括“金菠萝”,离线分词包括“菠萝”和“金菠萝”。
所述待干预搜索词与离线分词之间的对应关系集,包括多个待干预搜索词与离线分词之间的对应关系。要实施本申请提供的方法,先要生成所述待干预搜索词与离线分词之间的对应关系集。
所述待干预搜索词与离线分词之间的对应关系集,可以由人工设定,也可以根据算法自动生成。请参见图2,其为本申请实施例提供的一种生成所述待干预搜索词与离线分词之间的对应关系集的流程图。在本实施例中,要生成所述待干预搜索词与离线分词之间的对应关系集,可包括如下步骤:
步骤S201:确定所述待干预搜索词。
针对生鲜类商品的搜索,并非所有搜索词都需要干预,例如,无需对搜索频率很少的长尾词或只包括1个字的搜索词进行分词干预等等。因此,首先要确定待干预搜索词。
待干预搜索词,可以直接由人工设定,也可以根据预设的待干预搜索词确定算法从历史搜索词中选取获得。
在一个示例中,步骤S201可包括如下子步骤:1)根据生鲜类商品的历史搜索记录,确定历史搜索词及其搜索次数;2)根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;3)将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
1)根据生鲜类商品的历史搜索记录,确定历史搜索词及其搜索次数。
本实施例针对生鲜电商的具有较高搜索频次的搜索词进行离线分词干预,因此,首先从所述生鲜类商品的搜索日志(包括历史搜索记录)中提取历史搜索词,并统计历史搜索词的搜索次数。
具体实施时,可从生鲜电商的搜索日志提取生鲜类商品的历史搜索词及其搜索次数(使用次数)。所述搜索日志包括用户搜索生鲜类商品的历史搜索行为涉及的多种数据,例如,搜索词、搜索时间、搜索结果等等。
2)根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词。
在一个示例中,选取所述搜索次数排在高位的历史搜索词,作为候选的待干预搜索词(以下简称候选词)。例如,选取搜索次数排在前10000名的历史搜索词。候选词包括高频搜索词和目标搜索词。采用这种处理方式,使得确定的待干预搜索词具有较高的搜索频次,避免对较低搜索频次的搜索词进行干预;因此,可以有效节省计算资源。
不同用户具有不同的搜索经验和搜索习惯,在搜索商品时会使用不同的搜索词,例如,有经验的用户使用简短精准的搜索词,而经验少的用户使用口语化且较长的搜索词。通常,将简短精准的搜索词称为目标关键词,将较长的搜索词称为非目标关键词,非目标关键词是与目标关键词相关的也可以带来搜索流量的组合型关键词。
3)将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
考虑到生鲜类商品的搜索特性,可选取字数为2、3、4的搜索词作为待干预搜索词,如三文鱼排,三文鱼片,三文鱼,鱼,鱼类,三文;羊肉片,羊羔片,羊羔肉片等等。采用这种处理方式,使得排除掉5元以上的候选词及1元候选词。
在确定所述生鲜类商品的待干预搜索词后,就可以进入下一步确定所述待干预搜索词的子词。
步骤S202:确定所述待干预搜索词的子词。
所述待干预搜索词的离线分词,包括所述待干预搜索词的子词。因此,需要获取所述待干预搜索词的子词。以4元词“三文鱼片”为例,其子词包括:三文鱼,文鱼片,三文,文鱼,鱼片,三,文,鱼,片。
为了便于描述,本申请将包括4个字的搜索词称为4元词,将包括3个字的搜索词称为3元词,将包括2个字的搜索词称为2元词,将包括1个字的搜索词称为1元词。
步骤S203:根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数。
所述待干预搜索词的子词,并非都适于作为所述待干预搜索词的离线分词,例如,搜索词“金菠萝”的子词“金”不适于作为离线分词,而子词“菠萝”适于作为离线分词。
本申请提供的方法,根据所述待干预搜索词的子词的历史搜索次数,自动确定所述子词是否为离线分词。因此,先要根据历史搜索记录,统计子词的历史搜索次数。
步骤S204:根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
在确定所述子词作为搜索词的搜索次数后,就可以根据历史搜索次数对子词进行筛选,选出历史搜索次数符合选取规则的子词作为待干预搜索词对应的离线分词。由于该类离线分词是受到干预后确定的离线分词,因此又称为离线干预词。
在一个示例中,将所有子词构成的第一集合与上述步骤中所有候选的待干预搜索词构成的第二集合之间的共有词作为所述待干预搜索词的离线干预词。通过求解第一词集与第二词集的交集,将交集词(共有词)提取出来,使得离线干预词本身就是高频搜索词。采用这种处理方式,使得提高了离线干预词对应的商品倒排索引包括的商品数量,同时离线干预词本身就是高频搜索词;因此,可以有效提升搜索召全率和召准率。
通过上述步骤获得所述待干预搜索词及其对应的所述离线干预词后,就可以根据这两方面信息生成所述待干预搜索词与离线分词之间的对应关系集。
在一个示例中,将待干预搜索词本身及其离线干预词均作为离线分词。
在另一个示例中,所述方法还包括如下步骤:1)获取所述待干预搜索词的在线分词;2)将所述在线分词作为所述待干预搜索词对应的离线分词。采用这种处理方式,使得离线分词还包括所述待干预搜索词对应的在线分词,由此提高了在线分词对应的商品倒排索引包括的商品数量;因此,可以有效提升搜索召全率和召准率。
所述在线分词,可以是采用通用分词技术确定的在线分词;也可以是人工设定的在线分词,即在线分词由人工干预;还可以是通过算法自动生成的受到干预的在线分词。
表1示出了本申请实施例的所述待干预搜索词与离线分词之间的对应关系集。
Figure BDA0001730228970000141
表1、待干预搜索词与离线分词之间的对应关系集
由表1可见,干预前的离线分词只包括传统词汇,而干预后的离线分词可包括非传统词汇,如“提拉米苏”和“六月黄”等等。对于待干预搜索词的任意子词,只要其搜索次数满足一定的要求,即使是非传统词汇,也可以作为离线分词,由此极大扩充了离线分词的数量。
步骤S103:根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
通过上述步骤确定商品标题内所述待干预搜索词的离线分词后,就可以根据确定的所述离线分词,确定所述离线分词对应的商品倒排索引。
离线分词的结果会影响搜索词对应的商品倒排索引。例如,搜索词为“金菠萝”,商品A的商品标题的完整文本中包括“金菠萝”字样,如果“金菠萝”的离线分词包括“金菠萝”,但不包括“菠萝”,则搜索词“菠萝”的商品倒排索引不包括该商品A,而搜索词“金菠萝”的商品倒排索引包括该商品,由此将导致只有在用户输入搜索词“金菠萝”时,才能搜索到商品A,而当用户输入搜索词“菠萝”时,将无法搜索到商品A,即出现有商品但少结果的情况;如果“金菠萝”的离线分词包括“金菠萝”和“菠萝”,则不仅搜索词“金菠萝”的商品倒排索引包括该商品,搜索词“菠萝”的商品倒排索引也包括该商品,由此使得无论用户输入搜索词“金菠萝”或“菠萝”,都可以搜索到商品A。
表2示出了商品倒排索引表。
搜索词 分词干预前对应的商品 分词干预后对应的商品
金菠萝 商品A 商品A
菠萝 商品B 商品A,商品B
活鱼类 商品C 商品C
鱼类 商品D 商品C,商品D
商品E 商品C,商品E
表2、商品倒排索引表
表2给出了搜索词、搜索词在离线分词干预前对应的商品信息、搜索词在离线分词干预后对应的商品信息之间的对应记录。由表2可见,在现有技术下并未对“金菠萝”进行离线分词干预,因此,只有搜索词是“金菠萝”时,其对应的商品倒排索引才包括商品A,而当搜索词是“菠萝”时,其对应的商品倒排索引并不包括商品A,其中,商品A的标题包括“金菠萝”子文本。采用本申请提供的方法,对“金菠萝”进行离线分词干预后,“金菠萝”的离线分词包括“金菠萝”和“菠萝”,由此导致搜索词“菠萝”的商品倒排索引不仅包括商品B,还包括商品A。
步骤S104:根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
通过上述步骤确定所述离线分词对应的商品倒排索引后,就可以根据所述商品倒排索引,获取所述指定搜索词对应的商品信息。
例如,由于对商品标题包括的“金菠萝”子文本进行离线分词干预后的离线分词包括“金菠萝”和“菠萝”,因此搜索词“金菠萝”和“菠萝”对应的商品倒排索引都包括商品标题包括“金菠萝”子文本的商品信息,这样就使得无论用户搜索词为“金菠萝”还是“菠萝”,均可以找回商品标题包括“金菠萝”子文本的商品。
再例如,由于对商品标题包括的“活鱼类”子文本进行离线分词干预后的离线分词包括“活鱼”、“类”、“鱼”和“鱼类”,因此搜索词“活鱼类”、“活鱼”、“类”、“鱼”和“鱼类”对应的商品倒排索引都包括商品标题包括“活鱼类”子文本的商品信息,这样就可以使得无论用户搜索词为“活鱼类”、“活鱼”、“类”、“鱼”还是“鱼类”,均可找回商品标题包括“活鱼类”的商品。
在一个示例中,所述方法还包括如下步骤:根据所述待干预搜索词与在线分词之间的对应关系集,确定所述指定搜索词的在线分词;相应的,步骤S104可包括如下子步骤:1)根据所述商品倒排索引,确定各个在线分词对应的商品信息;2)将各个在线分词共同对应的商品信息,作为所述指定搜索词对应的商品信息。
所述在线分词,是指根据待干预搜索词与在线分词之间的对应关系集,对所述指定搜索词进行干预后的分词。所述在线分词,包括指定搜索词本身,还可包括能够组合成所述指定搜索词的多个在线分词,例如,搜索词“活鱼类”的在线分词包括“活鱼”和“类”,以及“活鱼类”。
需要注意的是,除了搜索词本身作为在线分词外,搜索词的其它在线分词(包括子词)需要满足如下条件:所有其它在线分词应可组合成搜索词本身,组合成搜索词既不能少词,也不能跳词,还不能多词。例如,搜索词“活鱼类”的其它在线分词不能只包括“活鱼”,或只包括“类”,“活鱼”和“类”应同时是“活鱼类”的在线分词。
本申请提供的方法,通过根据所述待干预搜索词与在线分词之间的对应关系集,确定所述指定搜索词的在线分词,并根据所述商品倒排索引,确定各个在线分词对应的商品信息,再将各个在线分词共同对应的商品信息,作为所述指定搜索词对应的商品信息;这种处理方式,使得可以搜索到搜索词本身不是商品标题的内容,但搜索词的每个字又都在商品标题中的商品,避免出现有商品但未搜索到,搜索到的商品与预期不符,未检索到运营期望的商品等问题;因此,可以有效提升搜索召全率和召准率。
例如,当用户搜索词为“活鱼类”时,由于对该词进行在线分词干预后的在线分词包括“活鱼”、“类”;使得当商品标题包括“活鱼的类”时,由于其离线分词包括“活鱼”和“类”,且在线分词之间为逻辑与的关系;因此,能够找回商品标题包括“活鱼的类”的商品。
所述待干预搜索词与在线分词之间的对应关系集,包括多个待干预搜索词与在线分词之间的对应关系。要实施本申请提供的方法,先要生成所述待干预搜索词与在线分词之间的对应关系集。
所述待干预搜索词与在线分词之间的对应关系集,可以由人工设定,也可以根据算法自动生成。请参见图3,其为本申请实施例提供的一种生成所述待干预搜索词与在线分词之间的对应关系集的流程图。在本实施例中,要生成所述待干预搜索词与在线分词之间的对应关系集,可在步骤S204之后,包括如下步骤:
步骤S301:选取符合在线分词规则的所述离线分词,作为与所述待干预搜索词对应的在线分词。
由于离线干预词是待干预搜索词的具有一定搜索次数的子词,因此,可从离线干预词中选取子词作为待干预搜索词对应的在线分词,选取的子词应是满足在线分词规则的子词。由于该类在线分词是受到干预后确定的在线分词,因此又称为在线干预词。
所述在线分词规则,包括但不限于:除了搜索词本身作为在线分词外,搜索词的其它在线分词(包括子词)需要满足如下条件:所有其它在线分词应可组合成搜索词本身,组合成搜索词既不能少词,也不能跳词,还不能多词。
通过上述步骤获得所述待干预搜索词及其对应的所述在线干预词后,就可以根据这两方面信息生成所述待干预搜索词与在线分词之间的对应关系集。
在一个示例中,将所述待干预搜索词和所述在线干预词作为所述待干预搜索词对应的所述在线分词。
表3示出了本申请实施例的所述待干预搜索词与在线分词之间的对应关系集。
Figure BDA0001730228970000171
Figure BDA0001730228970000181
表3、待干预搜索词与在线分词之间的对应关系集
由表3可见,干预前的在线分词并不符合生鲜类搜索词的业务特性,例如,“活”是一个辨识度较低的词,通常不会作为搜索词,也就不会是在线干预词,因此,“活”和“鱼类”也就不会是在线干预词;而“活鱼”和“类”均是辨识度较高的词,经常作为搜索词适用,因此,“活鱼”和“类”可作为在线干预词,即作为干预后的在线分词,由此极大扩充了在线分词的数量。表3中的干预后的在线分词包括原搜索词,采用这种处理方式使得可确保根据全文搜索到相关商品。
再例如,“三文”通常不会作为搜索词,也就不会是在线干预词,因此,“三文”和“鱼”也就不会是在线干预词。
通过对比表3和表1可见,当通过现有分词技术确定生鲜类商品搜索词对应的离线分词和在线分词时,由于未考虑生鲜类商品的业务特性,因此无法准确检索到符合条件的生鲜类商品;而通过本申请提供的技术方案获得的分词干预后在线、离线分词结果,更加符合生鲜类商品的业务特性,因此可以有效提升商品搜索的准确度。
步骤S105:向所述客户端回送所述商品信息。
通过前述步骤获得所述指定搜索词对应的商品信息后,就可将其回送至客户端,将商品信息作为搜索结果展示给客户端用户。
本申请提供的方法,在对生鲜类商品的商品标题进行分词时,如果商品标题涉及所述待干预搜索词,则根据所述待干预搜索词与离线分词之间的对应关系,确定该搜索词的离线分词。对于商品标题包括的所述待干预搜索词以外的文本,可采用如下步骤确定该文本的离线分词。下面以文本“VeroModa的牛皮靴子,很漂亮”作为分词对象,说明对商品标题进行文本分词的过程。该分词过程包括如下步骤:
(1)归一化
归一化要做的是大写转小写、全角转半角。转完后结果为:“veromoda的牛皮靴子,很漂亮”
(2)文本分块
分词器通常对分词对象的文本长度不做限制,但是分词时,是以“句”为单位进行处理的,所以先要对输入文本分块,然后逐块分词。分块时,最简单的就是用标点符号分隔,比如逗号、句号等,当然如果输入文档没有这些标点符号,那就最大1024个字符为一块。分块后,示例变为两块:“veromoda的牛皮靴子,”,及“很漂亮”。
接下来,以第一块“veromoda的牛皮靴子,”为例处理。
(3)DFA识别(命名实体识别)
DFA是确定有限状态机(Deterministic Finite Automation)的缩写,用它来识别大多数命名实体。
命名实体识别(NE)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。其中人名、地名、组织机构名是最常用到的三种。
对于文本“veromoda的牛皮靴子”,可以把英文字符串单独识别出来,即:[veromoda]的牛皮靴子。
(4)分词(最大正向匹配+CRF)
接下来就是分词过程(含消歧),这个过程相对复杂,且属于现有技术范畴,因此在这里不展开说明。需注意的是,整个分词过程是以最小语义单元进行的,也就是说,在这个过程中,分词结果只有一层粒度。对于检索单元,其是最小语义单元的附属内容,有了最小语义单元后,直接可以得到对应的检索单元;对于最大语义单元,是在分词完成后,再去查另一个词典(最大语义词典),对最小语义单元进行合并得到的。分完词后,结果为:[veromoda][的][牛皮][靴子][,]。
(5)分词修正(Reviser)
分词reviser,就是对分词结果的各种修正。这里有两个修正,分别是:
(i)纠错词典
纠错词典是一个后门,是人工强行干预分词结果的接口。纠错词典的格式可以是”原分词结果|纠错后分词结果“,通过纠错词典可把原分词结果强制改写为纠错后分词结果。本示例中,没有需要纠错的词。
(ii)短语词典
短语词典即最大语义词典,根据这个词典,可以把最小语义单元合并为最大语义单元。本示例中,可以把”牛皮“、”靴子“合并为一个最大语义单元”牛皮靴子“:[veromoda][的][[牛皮][靴子]][,]
(6)添加跨语义单元
上述1-5步的分词过程是按照最小语义单元进行的,但是这种分法有遗漏,比如本例中,”牛皮“和”靴子“是两个最小语义单元,但是”皮靴“也是这个例子中的一个合理的分词结果。为了处理这种情况,增加了一个跨语义词典,就是看能否从相邻的两个最小语义单元中再拆分出一个词。本例中,经过该步后的分词结果为:[veromoda][的][[牛皮][靴子]][,],其中,牛皮+靴子-->皮靴。
(7)反归一化
上述第1步是归一化的处理步骤,但是分词结果不应该对原文做任何修改,所以需要返回原文本。本示例反归一化后为:[VeroModa][的][[牛皮][靴子]][,]。
上述1-7步说明了文本分词过程,可应用该方法,根据多类商品对应的通用词库,确定待干预搜索词作为商品标题内容的分词。
请参见图4,其为本申请实施例提供的商品搜索方法的查询结果对比示意图。由a图可见,通过现有技术进行离线分词,将出现有商品但未搜索到的问题;由b图可见,通过本申请提供的方法进行离线分词,可有效提升商品搜索的召全率和召准率,避免出现有商品但未搜索到的问题。
表4示出了干预词一期上线前后周数据对比结果:
项目 加购数量 加购引导订单数 成交额度 一天平均召回总量
提升百分比 36.29% 29.19% 31.29% 27.85%
表4、干预词一期上线前后周数据对比结果
表5示出了干预词二期上线前后周数据对比结果:
项目 加购数量 加购引导订单数 成交额度 一天平均召回总量
提升百分比 10.44% 10.25% 10.75% 3.90%
表5、干预词二期上线前后周数据对比结果
由表4和表5可见,二期词量比一期词量大,但是提升效果没有一期明显,其原因在于:由于所有的待干预搜索词都是一期提取的,这些词在一期处理时属于搜索热词,期间暂停调整待干预搜索词,二期处理时由于季节变化,这些词在当时已经不属于热词,所以效果没有一期明显。
为了解决上述问题,本申请提供的方法,可定期重新确定待干预搜索词,例如,每个季度都会重新提取搜索次数排面前10000的词,将这些词作为待干预搜索词处理,来不断丰富新零售生鲜类的干预词库,即所述待干预搜索词与离线分词之间的对应关系集。
从上述实施例可见,本申请实施例提供的商品搜索方法,通过接收客户端发送的针对用户指定搜索词的商品搜索请求;根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的分词;根据所述商品标题的分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;向所述客户端回送所述商品信息;这种处理方式,使得结合生鲜类商品的商品特性构建生鲜类搜索词与离线分词的对应关系集,根据该对应关系集确定生鲜类商品搜索词的离线分词;因此,可以有效提升搜索准确度,从而提升商品销售率和用户体验。
第二实施例
在上述的实施例中,提供了一种商品搜索方法,与之相对应的,本申请还提供一种商品搜索装置。该装置是与上述方法的实施例相对应。
请参看图5,其为本申请的商品搜索装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请另外提供一种商品搜索装置,包括:
请求接收单元501,用于接收客户端发送的针对用户指定搜索词的商品搜索请求;
离线分词确定单元502,用于根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
商品倒排索引确定单元503,用于根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
商品信息确定单元504,用于根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;
商品信息回送单元505,用于向所述客户端回送所述商品信息。
请参看图6,其为本申请的商品搜索装置的实施例的具体示意图。可选的,所述装置还包括:
在线分词确定单元601,用于根据所述待干预搜索词与在线分词之间的对应关系集,确定所述指定搜索词的在线分词;
所述商品信息确定单元504包括:
第一商品信息确定子单元5041,用于根据所述商品倒排索引,确定所述在线分词对应的商品信息;
第二商品信息确定子单元5042,用于将各个在线分词共同对应的商品信息,作为所述指定搜索词对应的商品信息。
请参看图7,其为本申请的商品搜索装置的实施例的具体示意图。可选的,所述装置还包括:
第一对应关系集确定单元701,用于根据所述生鲜类商品的历史搜索记录,确定所述对应关系集;
所述第一对应关系集确定单元701,包括:
待干预搜索词确定子单元7011,用于确定所述待干预搜索词;
子词确定子单元7012,用于确定所述待干预搜索词的子词;
子词搜索次数确定子单元7013,用于根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
第一离线分词确定子单元7014,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
可选的,所述待干预搜索词确定子单元7011包括:
历史搜索词及搜索次数确定子单元,用于根据所述历史搜索记录,确定历史搜索词及其搜索次数;
候选词选取子单元,用于根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
待干预搜索词选取子单元,用于将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
可选的,所述第一对应关系集确定单元701还包括:
在线分词获取子单元,用于获取所述待干预搜索词的在线分词;
第二离线分词确定子单元,用于将所述在线分词作为所述待干预搜索词对应的离线分词。
请参看图8,其为本申请的商品搜索装置的实施例的具体示意图。可选的,所述装置还包括:
第二对应关系集确定单元801,用于选取符合在线分词规则的所述离线分词,作为与所述待干预搜索词对应的在线分词。
可选的,所述在线分词规则包括:所述线分词组合成所述待干预搜索词。
可选的,所述第二对应关系集确定单元801,还用于将所述待干预搜索词作为所述待干预搜索词对应的在线分词。
第三实施例
请参考图9,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器901和存储器902;存储器,用于存储实现商品搜索方法的程序,该设备通电并通过所述处理器运行该商品搜索方法的程序后,执行下述步骤:接收客户端发送的针对用户指定搜索词的商品搜索请求;根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;向所述客户端回送所述商品信息。
第四实施例
与上述的商品搜索方法相对应,本申请还提供一种商品搜索方法,该方法的执行主体包括但不限于移动通讯设备、个人电脑、PAD、iPad、RF枪等终端设备。
请参考图10,其为本申请提供的一种商品搜索方法实施例的流程图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种商品搜索方法包括:
步骤S1001:向服务器发送针对用户指定搜索词的商品搜索请求。
步骤S1032:接收所述服务器回送的所述指定搜索词对应的商品信息。
所述商品信息,采用如下步骤确定:1)根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;2)根据确定的离线分词,确定所述离线分词对应的商品倒排索引;3)根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
步骤S1001:展示所述商品信息。
从上述实施例可见,本申请实施例提供的商品搜索方法,通过接收客户端发送的针对用户指定搜索词的商品搜索请求;根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的分词;根据所述商品标题的分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;向所述客户端回送所述商品信息;这种处理方式,使得结合生鲜类商品的商品特性构建生鲜类搜索词与离线分词的对应关系集,根据该对应关系集确定生鲜类商品搜索词的离线分词;因此,可以有效提升搜索准确度,从而提升商品销售率和用户体验。
第五实施例
在上述的实施例中,提供了一种商品搜索方法,与之相对应的,本申请还提供一种商品搜索装置。该装置是与上述方法的实施例相对应。
请参看图11,其为本申请的商品搜索装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请另外提供一种商品搜索装置,包括:
请求发送单元1101,用于向服务器发送针对用户指定搜索词的商品搜索请求;
商品信息接收单元1102,用于接收所述服务器回送的所述指定搜索词对应的商品信息;
商品信息展示单元1103,用于展示所述商品信息;
所述商品信息,采用如下方式确定:
根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
第六实施例
请参考图12,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器1201和存储器1202;所述存储器,用于存储实现商品搜索方法的程序,该设备通电并通过所述处理器运行该商品搜索方法的程序后,执行下述步骤:向服务器发送针对用户指定搜索词的商品搜索请求;接收所述服务器回送的所述指定搜索词对应的商品信息;展示所述商品信息。
其中,所述商品信息,采用如下方式确定:根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
第七实施例
在上述的实施例中,提供了一种商品搜索方法,与之相对应的,本申请还提供一种商品搜索系统。该系统是与上述方法的实施例相对应。
请参看图13,其为本申请的商品搜索系统的实施例的示意图。由于系统实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。
本申请另外提供一种商品搜索系统,包括:上述实施例二所述的商品搜索装置1301和上述实施例五所述的商品搜索装置1301。
所述商品搜索装置1301通常部署于服务器,但并不局限于服务器,也可以是能够实现所述商品搜索方法的任何设备;所述商品搜索装置1301通常部署于移动通讯设备、个人电脑、PAD、iPad等终端设备。
例如,商品搜索装置1302部署在智能手机上,能够向服务器发送针对用户指定搜索词的商品搜索请求;所述商品搜索装置1301部署在服务器上,通过根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;商品搜索装置1302接收并展示所述服务器回送的所述指定搜索词对应的商品信息。
从上述实施例可见,本申请实施例提供的商品搜索系统,通过接收客户端发送的针对用户指定搜索词的商品搜索请求;根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的分词;根据所述商品标题的分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;向所述客户端回送所述商品信息;这种处理方式,使得结合生鲜类商品的商品特性构建生鲜类搜索词与离线分词的对应关系集,根据该对应关系集确定生鲜类商品搜索词的离线分词;因此,可以有效提升搜索准确度,从而提升商品销售率和用户体验。
第八实施例
与上述的商品搜索方法相对应,本申请还提供一种商品倒排索引构建方法。
请参考图14,其为本申请提供的一种商品倒排索引构建方法实施例的流程图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种商品倒排索引构建方法包括:
步骤S1401:获取待干预搜索词与离线分词之间的对应关系集。
所述待干预搜索词与离线分词之间的对应关系集,可采用如下步骤构建:1)确定所述待干预搜索词;2)确定所述待干预搜索词的子词;3)根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;4)根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
步骤S1402:根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词。
步骤S1403:根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
从上述实施例可见,本申请实施例提供的商品倒排索引构建方法,通过获取待干预搜索词与离线分词之间的对应关系集;根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引;这种处理方式,使得结合生鲜类商品的商品特性构建生鲜类搜索词的商品倒排索引;因此,可以有效提升搜索准确度,从而提升商品销售率和用户体验。
第九实施例
在上述的实施例中,提供了一种商品倒排索引构建方法,与之相对应的,本申请还提供一种商品倒排索引构建装置。该装置是与上述方法的实施例相对应。
请参看图15,其为本申请的商品倒排索引构建装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请另外提供一种商品倒排索引构建装置,包括:
对应关系集获取单元1501,用于获取待干预搜索词与离线分词之间的对应关系集;
离线分词确定单元1502,用于根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;
商品倒排索引确定单元1503,用于根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
第十实施例
请参考图16,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器1601和存储器1602;所述存储器,用于存储实现商品倒排索引构建方法的程序,该设备通电并通过所述处理器运行该商品倒排索引构建方法的程序后,执行下述步骤:获取待干预搜索词与离线分词之间的对应关系集;根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
第十一实施例
与上述的商品搜索方法相对应,本申请还提供一种干预词库构建方法。
请参考图17,其为本申请提供的一种干预词库构建方法实施例的流程图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种干预词库构建方法包括:
步骤S1701:确定生鲜类商品的待干预搜索词。
在一个示例中,步骤S1701可包括如下子步骤:1)根据所述历史搜索记录,确定历史搜索词及其搜索次数;2)根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;3)将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
步骤S1702:确定所述待干预搜索词的子词。
步骤S1703:根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数。
步骤S1704:根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
从上述实施例可见,本申请实施例提供的干预词库构建方法,通过确定生鲜类商品的待干预搜索词;确定所述待干预搜索词的子词;根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词;这种处理方式,使得结合生鲜类商品的商品特性构建生鲜类搜索词的干预词库,该词库包括待干预搜索词与离线分词之间的对应关系,以便根据该词库确定生鲜类商品搜索词的离线分词;因此,可以有效确保离线分词满足生鲜类商品的商品特性,从而提升搜索准确度,进而提升商品销售率和用户体验。
第十二实施例
在上述的实施例中,提供了一种干预词库构建方法,与之相对应的,本申请还提供一种干预词库构建装置。该装置是与上述方法的实施例相对应。
请参看图18,其为本申请的干预词库构建装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请另外提供一种干预词库构建装置,包括:
待干预搜索词确定单元1801,用于确定生鲜类商品的待干预搜索词;
子词确定单元1802,用于确定所述待干预搜索词的子词;
子词搜索次数确定单元1803,用于根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
离线分词确定单元1804,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
可选的,所述待干预搜索词确定单元1801包括:
历史搜索词及搜索次数确定子单元,用于根据所述历史搜索记录,确定历史搜索词及其搜索次数;
候选词选取子单元,用于根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
待干预搜索词选取子单元,用于将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
第十三实施例
请参考图19,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器1901和存储器1902;所述存储器,用于存储实现干预词库构建方法的程序,该设备通电并通过所述处理器运行该干预词库构建方法的程序后,执行下述步骤:确定生鲜类商品的待干预搜索词;确定所述待干预搜索词的子词;根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
第十四实施例
与上述的商品搜索方法相对应,本申请还提供一种干预词库构建方法。
请参考图20,其为本申请提供的一种干预词库构建方法实施例的流程图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种干预词库构建方法包括:
步骤S2001:确定生鲜类商品的待干预搜索词。
在一个示例中,步骤S2001可包括如下子步骤:1)根据所述历史搜索记录,确定历史搜索词及其搜索次数;2)根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;3)将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
步骤S2002:确定所述待干预搜索词的子词。
步骤S2003:根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数。
步骤S2004:根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词。
步骤S2005:将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
从上述实施例可见,本申请实施例提供的干预词库构建方法,通过确定生鲜类商品的待干预搜索词;确定所述待干预搜索词的子词;根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词;这种处理方式,使得结合生鲜类商品的商品特性构建生鲜类搜索词的干预词库,该词库包括待干预搜索词与在线分词之间的对应关系,以便根据该词库确定生鲜类商品搜索词的在线分词;因此,可以有效确保在线分词满足生鲜类商品的商品特性,从而提升搜索准确度,进而提升商品销售率和用户体验。
第十五实施例
在上述的实施例中,提供了一种干预词库构建方法,与之相对应的,本申请还提供一种干预词库构建装置。该装置是与上述方法的实施例相对应。
请参看图21,其为本申请的干预词库构建装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请另外提供一种干预词库构建装置,包括:
待干预搜索词确定单元2101,用于确定生鲜类商品的待干预搜索词;
子词确定单元2102,用于确定所述待干预搜索词的子词;
子词搜索次数确定单元2103,用于根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
候选在线分词确定单元2104,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;
在线分词确定单元2105,用于将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
第十六实施例
请参考图22,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器2201和存储器2202;所述存储器,用于存储实现干预词库构建方法的程序,该设备通电并通过所述处理器运行该干预词库构建方法的程序后,执行下述步骤:确定生鲜类商品的待干预搜索词;确定所述待干预搜索词的子词;根据所述生鲜类商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (32)

1.一种商品搜索方法,其特征在于,包括:
接收客户端发送的针对用户指定搜索词的商品搜索请求;
根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;
向所述客户端回送所述商品信息。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据所述待干预搜索词与在线分词之间的对应关系集,确定所述指定搜索词的在线分词;
所述根据所述商品倒排索引,并确定所述指定搜索词对应的商品信息,包括:
根据所述商品倒排索引,确定所述在线分词对应的商品信息;
将各个在线分词共同对应的商品信息,作为所述指定搜索词对应的商品信息。
3.根据权利要求1所述的方法,其特征在于,还包括:
确定所述待干预搜索词;
确定所述待干预搜索词的子词;
根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
4.根据权利要求3所述的方法,其特征在于,所述确定所述待干预搜索词,包括:
根据所述历史搜索记录,确定历史搜索词及其搜索次数;
根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
5.根据权利要求3所述的方法,其特征在于,还包括:
获取所述待干预搜索词的在线分词;
将所述在线分词作为与所述待干预搜索词对应的离线分词。
6.根据权利要求3所述的方法,其特征在于,还包括:
选取符合在线分词规则的所述离线分词,作为与所述待干预搜索词对应的在线分词。
7.根据权利要求6所述的方法,其特征在于,所述在线分词规则包括:所述在线分词组合成所述待干预搜索词。
8.根据权利要求6所述的方法,其特征在于,还包括:
将所述待干预搜索词作为与所述待干预搜索词对应的在线分词。
9.一种商品搜索方法,其特征在于,包括:
向服务器发送针对用户指定搜索词的商品搜索请求;
接收所述服务器回送的所述指定搜索词对应的商品信息;
展示所述商品信息;
所述商品信息,采用如下方式确定:
根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
10.一种商品搜索装置,其特征在于,包括:
请求接收单元,用于接收客户端发送的针对用户指定搜索词的商品搜索请求;
离线分词确定单元,用于根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
商品倒排索引确定单元,用于根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
商品信息确定单元,用于根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;
商品信息回送单元,用于向所述客户端回送所述商品信息。
11.根据权利要求10所述的装置,其特征在于,还包括:
在线分词确定单元,用于根据所述待干预搜索词与在线分词之间的对应关系集,确定所述指定搜索词的在线分词;
所述商品信息确定单元包括:
第一商品信息确定子单元,用于根据所述商品倒排索引,确定所述在线分词对应的商品信息;
第二商品信息确定子单元,用于将各个在线分词共同对应的商品信息,作为所述指定搜索词对应的商品信息。
12.根据权利要求10所述的装置,其特征在于,还包括:
第一对应关系集确定单元,用于根据商品的历史搜索记录,确定所述对应关系集;
所述第一对应关系集确定单元,包括:
待干预搜索词确定子单元,用于确定所述待干预搜索词;
子词确定子单元,用于确定所述待干预搜索词的子词;
子词搜索次数确定子单元,用于根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
第一离线分词确定子单元,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
13.根据权利要求12所述的装置,其特征在于,所述待干预搜索词确定子单元包括:
历史搜索词及搜索次数确定子单元,用于根据所述历史搜索记录,确定历史搜索词及其搜索次数;
候选词选取子单元,用于根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
待干预搜索词选取子单元,用于将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
14.根据权利要求12所述的装置,其特征在于,所述第一对应关系集确定单元还包括:
在线分词获取子单元,用于获取所述待干预搜索词的在线分词;
第二离线分词确定子单元,用于将所述在线分词作为所述待干预搜索词对应的离线分词。
15.根据权利要求12所述的装置,其特征在于,还包括:
第二对应关系集确定单元,用于选取符合在线分词规则的所述离线分词,作为与所述待干预搜索词对应的在线分词。
16.根据权利要求15所述的装置,其特征在于,所述在线分词规则包括:所述线分词组合成所述待干预搜索词。
17.根据权利要求15所述的装置,其特征在于,所述第二对应关系集确定单元,还用于将所述待干预搜索词作为所述待干预搜索词对应的在线分词。
18.一种商品搜索装置,其特征在于,包括:
请求发送单元,用于向服务器发送针对用户指定搜索词的商品搜索请求;
商品信息接收单元,用于接收所述服务器回送的所述指定搜索词对应的商品信息;
商品信息展示单元,用于展示所述商品信息;
所述商品信息,采用如下方式确定:
根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引;
根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
19.一种商品搜索系统,其特征在于,包括:
根据上述权利要求10-17所述的商品搜索装置,以及,根据上述权利要求18所述的商品搜索装置。
20.一种商品倒排索引构建方法,其特征在于,包括:
获取待干预搜索词与离线分词之间的对应关系集;
根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;
根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
21.一种商品倒排索引构建装置,其特征在于,包括:
对应关系集获取单元,用于获取待干预搜索词与离线分词之间的对应关系集;
离线分词确定单元,用于根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;
商品倒排索引确定单元,用于根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
22.一种干预词库构建方法,其特征在于,包括:
确定待干预搜索词;
确定所述待干预搜索词的子词;
根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
23.根据权利要求22所述的方法,其特征在于,所述确定待干预搜索词,包括:
根据所述历史搜索记录,确定历史搜索词及其搜索次数;
根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
24.一种干预词库构建装置,其特征在于,包括:
待干预搜索词确定单元,用于确定待干预搜索词;
子词确定单元,用于确定所述待干预搜索词的子词;
子词搜索次数确定单元,用于根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
离线分词确定单元,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
25.根据权利要求24所述的装置,其特征在于,所述待干预搜索词确定单元包括:
历史搜索词及搜索次数确定子单元,用于根据所述历史搜索记录,确定历史搜索词及其搜索次数;
候选词选取子单元,用于根据所述历史搜索词的搜索次数,从所述历史搜索词中选取候选的待干预搜索词;
待干预搜索词选取子单元,用于将所述候选的待干预搜索词的字数符合字数规则的词作为所述待干预搜索词。
26.一种干预词库构建方法,其特征在于,包括:
确定待干预搜索词;
确定所述待干预搜索词的子词;
根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;
将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
27.一种干预词库构建装置,其特征在于,包括:
待干预搜索词确定单元,用于确定待干预搜索词;
子词确定单元,用于确定所述待干预搜索词的子词;
子词搜索次数确定单元,用于根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;
候选在线分词确定单元,用于根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;
在线分词确定单元,用于将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
28.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现商品搜索方法的程序,该设备通电并通过所述处理器运行该商品搜索方法的程序后,执行下述步骤:接收客户端发送的针对用户指定搜索词的商品搜索请求;根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息;向所述客户端回送所述商品信息。
29.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现商品搜索方法的程序,该设备通电并通过所述处理器运行该商品搜索方法的程序后,执行下述步骤:向服务器发送针对用户指定搜索词的商品搜索请求;接收所述服务器回送的所述指定搜索词对应的商品信息;展示所述商品信息;所述商品信息,采用如下方式确定:根据待干预搜索词与离线分词之间的对应关系集,确定商品标题的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引;根据所述商品倒排索引,确定所述指定搜索词对应的商品信息。
30.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现商品倒排索引构建方法的程序,该设备通电并通过所述处理器运行该商品倒排索引构建方法的程序后,执行下述步骤:获取待干预搜索词与离线分词之间的对应关系集;根据所述对应关系集,确定商品标题包括的所述待干预搜索词的离线分词;根据确定的离线分词,确定所述离线分词对应的商品倒排索引。
31.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现干预词库构建方法的程序,该设备通电并通过所述处理器运行该干预词库构建方法的程序后,执行下述步骤:确定待干预搜索词;确定所述待干预搜索词的子词;根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的离线分词。
32.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现干预词库构建方法的程序,该设备通电并通过所述处理器运行该干预词库构建方法的程序后,执行下述步骤:确定待干预搜索词;确定所述待干预搜索词的子词;根据商品的历史搜索记录,确定所述子词作为搜索词的搜索次数;根据所述子词的搜索次数选取所述子词,作为与所述待干预搜索词对应的候选在线分词;将符合在线分词规则的所述候选在线分词作为与所述待干预搜索词对应的在线分词。
CN201810770906.XA 2018-07-13 2018-07-13 商品搜索方法、装置、系统及电子设备 Active CN110781365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810770906.XA CN110781365B (zh) 2018-07-13 2018-07-13 商品搜索方法、装置、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810770906.XA CN110781365B (zh) 2018-07-13 2018-07-13 商品搜索方法、装置、系统及电子设备

Publications (2)

Publication Number Publication Date
CN110781365A true CN110781365A (zh) 2020-02-11
CN110781365B CN110781365B (zh) 2023-04-28

Family

ID=69377145

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810770906.XA Active CN110781365B (zh) 2018-07-13 2018-07-13 商品搜索方法、装置、系统及电子设备

Country Status (1)

Country Link
CN (1) CN110781365B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989190A (zh) * 2021-03-09 2021-06-18 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102339294A (zh) * 2010-07-27 2012-02-01 卓望数码技术(深圳)有限公司 一种对关键词进行预处理的搜索方法和系统
CN103226618A (zh) * 2013-05-21 2013-07-31 焦点科技股份有限公司 基于数据集市挖掘的相关词提取方法及系统
CN103810198A (zh) * 2012-11-09 2014-05-21 阿里巴巴集团控股有限公司 一种商品信息的搜索方法及装置
CN104915860A (zh) * 2015-06-10 2015-09-16 无线生活(杭州)信息科技有限公司 一种商品推荐方法及装置
CN104933081A (zh) * 2014-03-21 2015-09-23 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置
CN105354194A (zh) * 2014-08-19 2016-02-24 上海中怡通信息科技有限公司 商品智能归类方法和系统
CN106547794A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 信息搜索方法和装置
CN107247798A (zh) * 2017-06-27 2017-10-13 北京京东尚科信息技术有限公司 构建搜索词库的方法和装置
WO2017219696A1 (zh) * 2016-06-24 2017-12-28 中兴通讯股份有限公司 文本信息处理方法、装置及终端
US20180060419A1 (en) * 2016-08-31 2018-03-01 Alibaba Group Holding Limited Generating Prompting Keyword and Establishing Index Relationship

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102339294A (zh) * 2010-07-27 2012-02-01 卓望数码技术(深圳)有限公司 一种对关键词进行预处理的搜索方法和系统
CN103810198A (zh) * 2012-11-09 2014-05-21 阿里巴巴集团控股有限公司 一种商品信息的搜索方法及装置
CN103226618A (zh) * 2013-05-21 2013-07-31 焦点科技股份有限公司 基于数据集市挖掘的相关词提取方法及系统
CN104933081A (zh) * 2014-03-21 2015-09-23 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置
CN105354194A (zh) * 2014-08-19 2016-02-24 上海中怡通信息科技有限公司 商品智能归类方法和系统
CN104915860A (zh) * 2015-06-10 2015-09-16 无线生活(杭州)信息科技有限公司 一种商品推荐方法及装置
CN106547794A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 信息搜索方法和装置
WO2017219696A1 (zh) * 2016-06-24 2017-12-28 中兴通讯股份有限公司 文本信息处理方法、装置及终端
US20180060419A1 (en) * 2016-08-31 2018-03-01 Alibaba Group Holding Limited Generating Prompting Keyword and Establishing Index Relationship
CN107247798A (zh) * 2017-06-27 2017-10-13 北京京东尚科信息技术有限公司 构建搜索词库的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHANG L 等: "A New Cross-Language Commodity Information Retrieval Approach in Book Searching" *
朱瀛: "商品搜索系统中商品名称分析子系统的设计与实现" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989190A (zh) * 2021-03-09 2021-06-18 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质
CN112989190B (zh) * 2021-03-09 2024-03-01 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN110781365B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
US20130060769A1 (en) System and method for identifying social media interactions
US11907659B2 (en) Item recall method and system, electronic device and readable storage medium
US11016997B1 (en) Generating query results based on domain-specific dynamic word embeddings
US20130339369A1 (en) Search Method and Apparatus
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
US11741094B2 (en) Method and system for identifying core product terms
CN110019669B (zh) 一种文本检索方法及装置
US10936630B2 (en) Inferring topics with entity linking and ontological data
CN111444304A (zh) 搜索排序的方法和装置
CN107609192A (zh) 一种搜索引擎的补充搜索方法和装置
CN111078842A (zh) 查询结果的确定方法、装置、服务器及存储介质
CN110633398A (zh) 中心词的确认方法、搜索方法、装置和存储介质
CN110909120A (zh) 简历搜索/投递方法、装置、系统及电子设备
CN114579104A (zh) 数据分析场景的生成方法、装置、设备及存储介质
CN114756570A (zh) 采购场景的垂直搜索方法、装置和系统
CN111737607B (zh) 数据处理方法、装置、电子设备以及存储介质
CN110781365B (zh) 商品搜索方法、装置、系统及电子设备
CN116383340A (zh) 信息搜索方法、装置、电子设备和存储介质
US9378277B1 (en) Search query segmentation
CN110019702B (zh) 数据挖掘方法、装置和设备
CN115827864A (zh) 一种公告自动化分类的处理方法
CN111144122A (zh) 评价处理方法、装置和计算机系统及介质
CN115129864A (zh) 文本分类方法、装置、计算机设备和存储介质
US20180157744A1 (en) Comparison table automatic generation method, device and computer program product of the same
CN114048315A (zh) 确定文档标签的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant