CN114547064B - 一种产品搜索方法、系统、计算机设备及可读存储介质 - Google Patents
一种产品搜索方法、系统、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN114547064B CN114547064B CN202111679541.8A CN202111679541A CN114547064B CN 114547064 B CN114547064 B CN 114547064B CN 202111679541 A CN202111679541 A CN 202111679541A CN 114547064 B CN114547064 B CN 114547064B
- Authority
- CN
- China
- Prior art keywords
- keywords
- score
- result
- keyword
- product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及计算机软件的技术领域,尤其是一种产品搜索方法、系统、计算机设备及可读存储介质。该方法包括:接收输入的搜索词,根据搜索词关联提示词,并获取用户根据搜索词输入的关键词;对关键词进行命中预处理,使关键词形成规范化的格式;根据关键词中的内容进行关联判断,若存在关联结果,则跳转至产品页面,若没有关联结果,则对关键词进行单位转换;由单位转换后的关键词根据预设权重规则计算得分,并按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果,根据排序结果跳转至列表页,得到搜索结果。本申请解决现有在产品树检索产品速度较慢且需要浪费较多资源的技术问题。
Description
技术领域
本申请涉及计算机软件的技术领域,尤其是一种产品搜索方法、系统、计算机设备及可读存储介质。
背景技术
目前,在产品存储管理系统中,常见以树的形式进行展现产品存储数据,如文件夹、组织结构树、内容管理系统中的栏目树、协同任务系统中的任务树等。
现有的在产品树中检索产品的位置的时候,需要根据关键词按照树的路径一层一层展开分组来查找产品的位置,这样的搜索量就会比较大,且随着关键字的实时变化,定位也实时触发,每输入一个关键字就会触发定位一次,这样需要一次性将所有的节点都加载到本地,在数据量非常多的情况下,加载需要很长的时间,也会造成服务器巨大的负担,导致搜索速度慢,且所需资源较多。
发明内容
为此,本申请的实施例提供了一种产品搜索方法、系统、计算机设备及可读存储介质,能够解决现有在产品树检索产品速度较慢且需要浪费较多资源的技术问题,具体技术方案内容如下:
第一方面,本申请的实施例提供一种产品搜索方法,所述方法包括:
接收输入的搜索词,根据搜索词关联提示词,并获取用户根据搜索词输入的关键词;
对关键词进行命中预处理,使关键词形成规范化的格式;
根据关键词中的内容进行关联判断,若存在关联结果,则跳转至产品页面,若没有关联结果,则对关键词进行单位转换;
由单位转换后的关键词根据预设权重规则计算得分,并按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果,根据排序结果跳转至列表页,得到搜索结果。
通过采用上述技术方案,在产品树检索产品的时候,通过关联提示词,提高用户输入速度,通过对关键词进行预处理,转换为规范化格式,提高索引分析关键词含义时的速度,而后根据关键词关联跳转对应的产品页面,提高检索速度,减少资源浪费,且本方案中,在关联索引时若没有获取结果,在对关键词进行单位转换以进一步规范关键词的格式,然后将关键词按照权重计算,并结合业务逻辑以及数据挖掘算法,对得分进行修正、调整,从而得到较为精准的搜索结果。
优选的,所述若没有关联结果,则对关键词进行单位转换包括:
若没有关联结果,则进行品牌命中判断,调用中文数据库、英文数据库和中英文数据库判断品牌的中文名或英文名或中英文名是否命中;若命中,则跳转至品牌页面得到搜索结果;若否,则对关键词进行单位转换。
优选的,所述对关键词进行命中预处理,使关键词形成规范化的格式包括:
将关键词中的符号转换为空格,并按照空格进行分隔形成关键字。
优选的,所述预设权重规则包括按颗粒度及其对应的权重分进行分数计算,根据各计算结果进行求和得到得分。
优选的,所述按颗粒度及其对应的权重分进行分数计算,根据各计算结果进行求和得到得分包括:
分别计算关键词以及中文SKU、英文SKU的字符长度,由字符长度乘以预设权重得到该关键字的分数,并由该关键词所有关键字的分数求和为该关键词的得分。
优选的,所述按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果包括:
由业务逻辑为是否停止销售、是否有图片、品牌类型、是否新品、价格区间、是否促销、是否清仓、库存数量综合评分形成产品质量考核因素配合Data Mining算法计算点击率、客户购买数、销量生成产品质量考核因子,由产品质量考核因子与得分的乘积得到最终得分,由最终得分排序得到排序结果。
优选的,所述关联判断包括依次进行的SKU命中判断、MPG命中判断。
优选的,所述对关键词进行单位转换包括:对关键词中的符号进行中转英、中转符号、英转符号的单位转换,对转换后的关键词进行汇总,并对汇总结果进行符号过滤。
第二方面,本申请的实施例提供一种产品搜索系统,所述系统包括:
输入模块,用于接收输入的搜索词,根据搜索词关联提示词,并获取用户根据搜索词输入的关键词;
预处理模块,用于对关键词进行命中预处理,使关键词形成规范化的格式;
搜索模块,用于由单位转换后的关键词根据预设权重规则计算得分,并按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果,根据排序结果跳转至列表页,得到搜索结果。
第三方面,本申请的实施例提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述任意一项所述的产品搜索方法的步骤。
第四方面,本申请的实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前述任意一项所述的产品搜索方法的步骤。
综上所述,与现有技术相比,本申请实施例提供的技术方案带来的有益效果至少包括:
1、在产品树检索产品的时候,通过关联提示词,提高用户输入速度,通过对关键词进行预处理,转换为规范化格式,提高索引分析关键词含义时的速度,而后根据关键词关联跳转对应的产品页面,提高检索速度,减少资源浪费,且本方案中,在关联索引时若没有获取结果,在对关键词进行单位转换以进一步规范关键词的格式,然后将关键词按照权重计算,并结合业务逻辑以及数据挖掘算法,对得分进行修正、调整,从而得到较为精准的搜索结果;
2、对关键词进行命中预处理时,将关键词中的符号转换为空格,以简单的判断转换逻辑,减少关键词中的无用信息,简化关键词的数据结构,且将关键词中的关键字进行划分,便于后续预设权重的计算,既统一了数据格式,也便于计算,节省计算机资源。
附图说明
图1是本申请其中一实施例提供的一种产品搜索方法的流程示意图。
图2是本申请其中一实施例提供的一种产品搜索系统的结构示意图。
具体实施方式
本具体实施例仅仅是对本申请的解释,其并不是对本申请的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本申请的权利要求范围内都受到专利法的保护。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
另外,本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本申请中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
下面结合说明书附图对本申请实施例作进一步详细描述。
参照图1,在本申请的一个实施例中,提供一种产品搜索方法,所述方法的主要步骤描述如下:
S1:接收输入的搜索词,根据搜索词关联提示词,并获取用户根据搜索词输入的关键词;
S2:对关键词进行命中预处理,使关键词形成规范化的格式;
S3:根据关键词中的内容进行关联判断,若存在关联结果,则跳转至产品页面,若没有关联结果,则对关键词进行单位转换;
S4:由单位转换后的关键词根据预设权重规则计算得分,并按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果,根据排序结果跳转至列表页,得到搜索结果。
具体的,在本实施例中,本申请方法可以软件程序实现,且本申请多使用于工厂、商户等产品生产方和/或销售方,用户使用本申请软件时,在本申请软件对应的搜索框内输入搜索词,当本申请软件检索到搜索词的输入时,识别搜索词的语义,并根据搜索词的输入操作激活提示词关联,根据搜索词的语义进行同义词提示搜索以及汉字提示词组,用户可选定提示词或仅由手动输入或两者结合的方式,点击确认以生成关键词。
生成关键词之后,对关键词进行命中预处理,将关键词的格式形成预定的规范化的格式,具体的,在本实施例中,转换关键词格式的方式可以为调用预设语义库对关键词进行语义识别,判断关键词中是否存在无用词,若存在则将无用词替换,然后将替换后的关键词按照预定规则分段,预定规则可以为预定字数、预定关联词意、预定分隔符号等方式将关键词分段为各个关键字,在本实施例中,采用预定规则为预定字数。
根据关键词中识别文字的语义关联,如果该语义仅能关联到一个关联结果,由该关联结果直接跳转至产品页面,结束搜索;如果该语义关联到多个关联结果,将关联结果整合形成集合列表页,并跳转至该集合列表页,结束搜索。若没有关联结果,则说明此时关键词存在模糊含义,此时对关键词进行单位转换。
本实施例中,单位转换的含义为将关键词的不同的语言按照某一预定规则转换为统一语言规则的格式,比如说将英文转换为中文或将中文转换为英文或将某种语言的符号转换为同一含义的符号等,根据转换之后的各个关键词进行预设权重规则计算,将关键词进行单位转换之后,可以使关键词的含义更为准确。
所述预设权重规则为预先设置了对应不同的关键字的权重,在本实施例中,识别关键词中的关键字,并由关键字对应的权重计算分数,将关键词中所有关键字的分数相加则为该关键词的得分;业务逻辑算法为根据实际的生产中搜索情况设置的,在本实施方式中,业务逻辑算法为根据该关键词对应的产品的以往的销售情况对得分进行加减分,预设销售情况中销售业绩的阈值,若该关键词对应的产品的销售业绩大于阈值则加分,若关键词对应的产品的销售业绩小于阈值则减分,在其他的实施方式中,业务逻辑算法可以为其他方式,在此不作赘述。根据Data Mining算法对得分进行加减分,即可得到查询到的各项产品的排序结果,根据排序结果中得分最高的项跳转产品页面完成搜索结果。
通过本方案的设置,在进行产品搜索的时候,可以由关键词快速且精准的定位到产品对应的页面,实现快速产品搜索。
进一步的,在另一实施方式中,在关联提示词时,关联为SKU、MPG以及品牌等相关的文字,关联判断包括依次进行的SKU命中判断、MPG命中判断,SKU为由产品名称与订货号组成,MPG为制造商。
关键词命中预处理之后,进行SKU命中判断,若关键词全为SKU号且若命中一个或多个SKU号,则根据命中SKU与产品页面的映射关系跳转至对应的SKU页面或跳转至集合列表页,若包含其他字符串且命中一个或多个SKU号时跳转至集合列表页,结束搜索。
若进行SKU命中判断有多个SKU号,则跳转至MPG命中判断,若关键词全为MPG号且命中一个或多个SKU号,则根据命中SKU与产品页面的映射关系跳转至对应的SKU页面或集合列表页;若关键词不全为MPG号,判断品牌名称是否唯一,是唯一且命中一个SKU号,此时,根据SKU号映射跳转至集合列表页,结束搜索,否则对关键词进行单位转换。
通过本实施方式的设置,在进行搜索时,通过命中关联跳转,使存在命中结果的情况下,无需进行后续的关键词单位转换,简化搜索逻辑,实现快速搜索。
进一步的,在另一实施方式中,步骤S2包括:将关键词中的符号转换为空格,并按照空格进行分隔形成关键字。
具体的,在本实施方式中,将关键词中的中文符号转换为空格,用于将关键词切割为各个关键字,可快速统一关键词的格式,且将关键词切割,便于后续安装预设权重计算时,无需再次分割关键字。在其他实施方式中,符号也可以为其他语言符号,在此不作限定。
进一步的,在另一实施方式中,按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果包括:
由业务逻辑为是否停止销售、是否有图片、品牌类型、是否新品、价格区间、是否促销、是否清仓、库存数量综合评分形成产品质量考核因素配合Data Mining算法计算点击率、客户购买数、销量生成产品质量考核因子,由产品质量考核因子与得分的乘积得到最终得分,由最终得分排序得到排序结果。
具体的,预设关于是否停止销售、是否有图片、品牌类型、是否新品、价格区间、是否促销、是否清仓、库存数量对应的评分。
比如进行单位转换之后的关键词A关联的产品的业务逻辑算法为:若已经停售,则评分0.5分,若没有停售评分1分;若有图片,评分1分,若没有图片评分0.8分;若品牌类型为B则评分为0.8,若品牌类型为C,则评分0.9等;若为新品,则评分1分,若不为新品,则评分0.8分;价格区间为D到E元,则评分1分,价格区间为F到G元,则评分为2分等;若促销,则评分为2分,若不促销,则评分0.8分;若清仓,则评分为1分,若不清仓,则评分0.8分;若库存数量为H到I,则评分1分,若库存数量为J-K,则评分0.9等,若关键词A关联的产品已停售、有图片、品牌类型为B、不为新品、价格区间为D到E元、不促销、清仓、库存数量为H到I,产品质量考核因素=0.5*1*0.8*0.8*1*0.8*1*1。
由数据库中的历史数据基于Data Mining算法计算点击率、客户购买数、销量并形成对应点击率、客户购买数、销量对应的评分,在本实施例中,由产品质量考核因素与该评分的乘积生成产品质量考核因子并与得分相乘,从而得到的得分与原始得分相比数值增加或减少,实现得分的加减。
本实施方式的限制并不用于限制本申请的其他实施方式中的业务逻辑的设置,以及Data Mining算法计算内容。进一步的,在其他实施方式中,若业务逻辑中某一项不能获取到评分,则默认评分为1分。
进一步的,在另一实施方式中,也可将业务逻辑算法加减分与Data Mining算法加减分进行拆分,分别对得分进行加减处理,由不同的判断维度对关键词关联的产品进行打分,从而实现由不同维度体现关键词关联程度。
进一步的,在另一实施方式中,若没有关联结果,则对关键词进行单位转换包括:
若没有关联结果,则进行品牌命中判断,调用中文数据库、英文数据库和中英文数据库判断品牌的中文名或英文名或中英文名是否命中;若命中,则跳转至品牌页面得到搜索结果;若否,则对关键词进行单位转换。
具体的,在本实施方式中,中文数据库、英文数据库以及中英文数据库中存储有各种品牌的中文名、英文名或中英文名,由品牌名进行关联,进一步细化对关键词关联判断的维度,若命中了品牌名称,直接跳转品牌名称关联的品牌页面,即可实现快速搜索的效果。
进一步的,在另一实施方式中,预设权重规则包括按颗粒度及其对应的权重分进行分数计算,根据各计算结果进行求和得到得分。
在本实施方式中,颗粒度为关键词中的关键字对应的搜索次数,且关键字预设有权重,根据预设权重与关键字的搜索次数的乘积计算分数,关键词的得分由关键字的分数求和得到,通过本实施方式的设置,使在搜索的时候,通过简单的计算实现精准搜索。
进一步的,在另一实施方式中,按颗粒度及其对应的权重分进行分数计算,根据各计算结果进行求和得到得分具体为:分别计算关键词以及中文SKU、英文SKU的字符长度,由字符长度乘以预设权重得到该关键字的分数,并由该关键词所有关键字的分数求和为该关键词的得分。
在本实施方式中,颗粒度为该关键词的关键字在索引中命中次数除以关键词长度与该关键词的关键字在索引中命中次数除以SKU长度之和。
本实施方式的一个例子如下:
①根据关键词长度计算得到关键词词长度K_length;
②过滤关键词中的特殊符号及无意义符号,替换成空格,对关键词进行空格分割,中文和其他字符直接进行空格分割;
③关键词经过①②步骤后,则分成中文和英文数字符号两大部分,假设中文由KCN1、KCN2…组成,英文数字符号由KEN1、KEN2…组成:
1)中文最小颗粒度为一个汉字,进行中文颗粒度命中逻辑,颗粒度组合从2-4;
产品数据单位为SKU,一个SKU中文目前由品牌+产品名称组成,长度为SCN_length,进行颗粒度2-4建索引,权重系数为预设;
1.1 KCN1在索引中命中次数为KCN_COUNT_1;
KCN_COUNT_1除以关键词长度K_length得到KCN_Score1,KCN_Score1乘以权重系数,得到WKCN_Score1;
KCN_COUNT_1除以中文长度SCN_length得到SCN_Score1,SCN_Score1乘以权重系数,得到WSCN_Score1;
KCN1中文得分为WKCN_Score1+WSCN_Score1=CN_Score1;
1.2 KCN2在索引中命中次数为KCN_COUNT_2;
KCN_COUNT_2除以关键词长度K_length得到KCN_Score2,KCN_Score2乘以权重系数,得到WKCN_Score2;
KCN_COUNT_2除以中文长度SCN_length得到SCN_Score2,SCN_Score2乘以权重系数,得到WSCN_Score2;
KCN1中文得分为WKCN_Score2+WSCN_Score2=CN_Score2;
累加CN_Score1+CN_Score2+...+CN_ScoreN得到CN_Score。
...
2)英文数字符号部分最小颗粒度为一个KEN1;
产品数据单位为SKU,一个SKU英文数字符号目前由MFG+品牌英文符号+产品Title英文数字符号组成,长度为SEN_length,同样按照KEN1颗粒度建立索引。
2.1 KEN1在索引中命中次数KEN_COUNT_1;
KEN_COUNT_1除以关键词长度K_length得到KEN_Score1,KEN_Score1乘以权重系数,得到WKEN_Score1;
KEN_COUNT_1除以英文长度SEN_length得到SEN_Score1,SEN_Score1乘以权重系数,得到WSEN_Score1;
KEN1英文数字符号得分为WKEN_Score1+WSEN_Score1=EN_Score1;
2.2 KEN2在索引中命中次数KEN_COUNT_2;
KEN_COUNT_2除以关键词长度K_length得到KEN_Score2,KEN_Score2乘以权重系数,得到WKEN_Score2;
KEN_COUNT_2除以英文长度SEN_length得到SEN_Score2,SEN_Score2乘以权重系数,得到WSEN_Score2;
KEN1英文数字符号得分为WKEN_Score2+WSEN_Score2=EN_Score2;
...
累加EN_Score1+EN_Score2+...+EN_ScoreN得到EN_Score。
3)关键词在一个SKU的中文得分CN_Score,英文得分为EN_Score,累加得分为最终关键词和产品匹配度得分KE_SCORE。
通过本实施方式的设置,使用简单的计算方式,对关键词进行快速评分,从而实现精准查找。
进一步的,在另一实施方式中,所述对关键词进行单位转换包括:对关键词中的符号进行中转英、中转符号、英转符号的单位转换,对转换后的关键词进行汇总,并对汇总结果进行符号过滤。
具体的,在本实施方式中,将关键词中的特殊符号进行处理,使关键词中的中英文含义相同的符号转换为统一的符号格式,便于搜索,在本实施方式中,符号过滤为将关键词中无用符号过滤。
进一步的,在进行符号过滤后,还进行有意义符号包、无意义符号包匹配流程,将无意义符号包流程匹配的无意义符号转换为空格,以统一关键词的格式,且减少关键词中无效数据,便于检索。
具体的,本实施方式的一个例子如下:
1、按提示词功能(即关联提示词)、命中预处理、SKU命中、MFG命中、品牌命中、单位转换、权重MAP规则(由单位转换后的关键词根据预设权重规则计算得分)、精准排序(即生成排序结果)的流程顺序执行,并获取排序结果,基于排序结果跳转至列表页,找到所需产品;
2、提示词功能包括按同义词提示搜索和按汉字提示词组;
3、命中预处理包括空格分隔;
4、SKU命中包括判断是否只包含SKU号,是且则命中一个或多个SKU号,此时,命中一个SKU号时跳转至SKU页面,命中多个SKU号跳转至集合列表页;否则判断是否包含其他字符串,是且命中一个或多个SKU号,此时,命中一个或多个SKU号时跳转至集合列表页;若无命中SKU号,则跳转至MFG命中;
5、MFG命中包括判断是否全部是MFG号,是且命中一个或多个SKU号,此时,命中一个SKU号时跳转至SKU页面,命中多个SKU号跳转至集合列表页;否则判断品牌名称是否唯一,是且命中一个或多个SKU号,此时,命中一个SKU号时跳转至集合列表页,命中多个SKU号跳转至集合列表页,若品牌名称不唯一,则跳转至品牌命中;
6、品牌命中基于中文数据库、英文数据库和中英文数据库,判断品牌的中文名、英文名或中英文名是否命中,是则跳转至品牌页面;否则跳转至单位转换;
7、单位转换包括中转英、中转符号、英转符号的单位转换,再使转换结果汇总,依次进行符号过滤、有意义符号包匹配、无意义符号包匹配的流程,最后跳转至权重MAP规则;
8、权重MAP规则包括按颗粒度及其对应的权重分别进行分数计算,使各计算结果进行求和跳转至精准排序;
9、精准排序包括业务逻辑算法(产品质量考核的因素,是否停止销售、是否有图片、品牌类型、是否新品、价格区间、是否促销、是否清仓、库存数量)和Data Mining算法(点击率、客户购买数、销量),以对权重MAP规则的求和结果进行加减分,得到排序结果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
参照图2,在本申请的一个实施例中,提供一种产品搜索系统,该产品搜索系统与上述实施例中的产品搜索方法一一对应。该产品搜索系统包括:
输入模块,用于接收输入的搜索词,根据搜索词关联提示词,并获取用户根据搜索词输入的关键词;
预处理模块,用于对关键词进行命中预处理,使关键词形成规范化的格式;
搜索模块,用于由单位转换后的关键词根据预设权重规则计算得分,并按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果,根据排序结果跳转至列表页,得到搜索结果。
上述的产品搜索系统各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在本申请实施例的一个实施例中,提供一种计算机设备,该计算机设备可以是服务器。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,易失性或非易失性存储设备包括但不限于:磁盘,光盘,EEPROM(Electrically-Erasable Programmable Read Only Memory,电可擦除可编程只读存储器),EPROM(Erasable Programmable Read Only Memory,可擦除可编程只读存储器),SRAM(Static Random Access Memory,静态随时存取存储器),ROM(Read-OnlyMemory,只读存储器),磁存储器,快闪存储器,PROM(Programmable Read-Only Memory,可编程只读存储器)。该计算机设备的存储器为存储于其内部的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时实现上述实施例所述的产品搜索方法步骤。
在本申请的一个实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例所述的产品搜索方法步骤。所述计算机可读存储介质包括ROM(Read-Only Memory,只读存储器)、RAM(Random-Access Memory,随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory,只读光盘)、磁盘、软盘等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将本申请所述系统的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
Claims (6)
1.一种产品搜索方法,其特征在于,所述方法包括:
接收输入的搜索词,根据搜索词关联提示词,并获取用户根据搜索词输入的关键词;
对关键词进行命中预处理,使关键词形成规范化的格式;
根据关键词中的内容进行关联判断,若存在关联结果,则跳转至产品页面,若没有关联结果,则对关键词进行单位转换;所述关联判断包括依次进行的SKU命中判断、MPG命中判断,SKU为由产品名称与订货号组成,MPG为制造商;
所述若没有关联结果,则对关键词进行单位转换包括:
若没有关联结果,则进行品牌命中判断,调用中文数据库、英文数据库和中英文数据库判断品牌的中文名或英文名或中英文名是否命中;若命中,则跳转至品牌页面得到搜索结果;若否,则对关键词进行单位转换;
由单位转换后的关键词根据预设权重规则计算得分,并按照业务逻辑算法以及DataMining算法对得分进行加减分得到排序结果,根据排序结果跳转至列表页,得到搜索结果;
所述预设权重规则包括按颗粒度及其对应的权重分进行分数计算,根据各计算结果进行求和得到得分;
所述按颗粒度及其对应的权重分进行分数计算,根据各计算结果进行求和得到得分包括:分别计算关键词以及中文SKU、英文SKU的字符长度,由该关键词的关键字在索引中命中次数除以字符长度乘以预设权重得到该关键字的分数,并由该关键词所有关键字的分数求和为该关键词的得分;
所述按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果包括:
由业务逻辑为是否停止销售、是否有图片、品牌类型、是否新品、价格区间、是否促销、是否清仓、库存数量综合评分形成产品质量考核因素配合Data Mining算法计算点击率、客户购买数、销量生成产品质量考核因子,由产品质量考核因子与得分的乘积得到最终得分,由最终得分排序得到排序结果。
2.根据权利要求1所述的一种产品搜索方法,其特征在于,所述对关键词进行命中预处理,使关键词形成规范化的格式包括:
将关键词中的符号转换为空格,并按照空格进行分隔形成关键字。
3.根据权利要求1所述的一种产品搜索方法,其特征在于,所述对关键词进行单位转换包括:对关键词中的符号进行中转英、中转符号、英转符号的单位转换,对转换后的关键词进行汇总,并对汇总结果进行符号过滤。
4.一种产品搜索系统,其特征在于,所述系统包括:
输入模块,用于接收输入的搜索词,根据搜索词关联提示词,并获取用户根据搜索词输入的关键词;
预处理模块,用于对关键词进行命中预处理,使关键词形成规范化的格式;
搜索模块,用于根据关键词中的内容进行关联判断,若存在关联结果,则跳转至产品页面,若没有关联结果,则对关键词进行单位转换;所述关联判断包括依次进行的SKU命中判断、MPG命中判断,SKU为由产品名称与订货号组成,MPG为制造商;所述若没有关联结果,则对关键词进行单位转换包括:若没有关联结果,则进行品牌命中判断,调用中文数据库、英文数据库和中英文数据库判断品牌的中文名或英文名或中英文名是否命中;若命中,则跳转至品牌页面得到搜索结果;若否,则对关键词进行单位转换;由单位转换后的关键词根据预设权重规则计算得分,并按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果,根据排序结果跳转至列表页,得到搜索结果;所述预设权重规则包括按颗粒度及其对应的权重分进行分数计算,根据各计算结果进行求和得到得分;所述按颗粒度及其对应的权重分进行分数计算,根据各计算结果进行求和得到得分包括:分别计算关键词以及中文SKU、英文SKU的字符长度,由该关键词的关键字在索引中命中次数除以字符长度乘以预设权重得到该关键字的分数,并由该关键词所有关键字的分数求和为该关键词的得分;所述按照业务逻辑算法以及Data Mining算法对得分进行加减分得到排序结果包括:由业务逻辑为是否停止销售、是否有图片、品牌类型、是否新品、价格区间、是否促销、是否清仓、库存数量综合评分形成产品质量考核因素配合Data Mining算法计算点击率、客户购买数、销量生成产品质量考核因子,由产品质量考核因子与得分的乘积得到最终得分,由最终得分排序得到排序结果。
5.一种计算机设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-3任意一项所述的产品搜索方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-3任意一项所述的产品搜索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111679541.8A CN114547064B (zh) | 2021-12-31 | 2021-12-31 | 一种产品搜索方法、系统、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111679541.8A CN114547064B (zh) | 2021-12-31 | 2021-12-31 | 一种产品搜索方法、系统、计算机设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114547064A CN114547064A (zh) | 2022-05-27 |
CN114547064B true CN114547064B (zh) | 2023-07-07 |
Family
ID=81669994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111679541.8A Active CN114547064B (zh) | 2021-12-31 | 2021-12-31 | 一种产品搜索方法、系统、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114547064B (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101206672A (zh) * | 2007-12-25 | 2008-06-25 | 北京科文书业信息技术有限公司 | 商品搜索无结果智能处理系统及方法 |
CN103793388B (zh) * | 2012-10-29 | 2017-08-25 | 阿里巴巴集团控股有限公司 | 搜索结果的排序方法和装置 |
CN106776741A (zh) * | 2016-11-18 | 2017-05-31 | 北京奇虎科技有限公司 | 一种搜索方法和装置 |
CN111597294A (zh) * | 2019-02-20 | 2020-08-28 | 北京京东尚科信息技术有限公司 | 信息搜索方法和装置 |
CN111597219B (zh) * | 2020-05-22 | 2021-12-10 | 安徽机器猫电子商务有限公司 | 一种基于关系属性的搜索方法及系统 |
CN113254588B (zh) * | 2021-06-02 | 2023-08-22 | 竹间智能科技(上海)有限公司 | 一种数据搜索方法及系统 |
-
2021
- 2021-12-31 CN CN202111679541.8A patent/CN114547064B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114547064A (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9864741B2 (en) | Automated collective term and phrase index | |
US20180005293A1 (en) | Platform for enabling personalized recommendations using intelligent dialog | |
CN109299219B (zh) | 数据查询方法、装置、电子设备及计算机可读存储介质 | |
JP7451747B2 (ja) | コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 | |
US20130339369A1 (en) | Search Method and Apparatus | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
CN111008265A (zh) | 企业信息搜索方法及装置 | |
CN111125086B (zh) | 获取数据资源的方法、装置、存储介质及处理器 | |
CN111125343A (zh) | 适用于人岗匹配推荐系统的文本解析方法及装置 | |
CN107767273B (zh) | 基于社交数据的资产配置方法、电子装置及介质 | |
JP2013531289A (ja) | 検索におけるモデル情報群の使用 | |
CN112269816B (zh) | 一种政务预约事项相关性检索方法 | |
US20240070209A1 (en) | Method and system for providing alternative result for an online search previously with no result | |
CN109857853B (zh) | 基于电子书的搜索方法、电子设备及计算机存储介质 | |
CN111369294A (zh) | 软件造价估算方法及装置 | |
CN110781365B (zh) | 商品搜索方法、装置、系统及电子设备 | |
CN109033082B (zh) | 语义模型的学习训练方法、装置及计算机可读存储介质 | |
KR101941594B1 (ko) | 도서 관리 시스템 및 도서 관리 방법 | |
CN111737607B (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN114547064B (zh) | 一种产品搜索方法、系统、计算机设备及可读存储介质 | |
CN113204697A (zh) | 一种搜索方法、装置、电子设备及存储介质 | |
CN112487181B (zh) | 关键词确定方法和相关设备 | |
US11922326B2 (en) | Data management suggestions from knowledge graph actions | |
CN108509571A (zh) | 一种网页信息数据挖掘通用方法 | |
CN115309995A (zh) | 一种基于需求文本的科技资源推送方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 510000 Ruitai Road, Huangpu District, Guangzhou, Guangdong Applicant after: Guangzhou All Things Collection Industrial Internet Technology Co.,Ltd. Address before: 510000 Ruitai Road, Huangpu District, Guangzhou, Guangdong Applicant before: Guangzhou gaimengda Industrial Products Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |