CN117216423A - 电商商品的搜索方法、系统、终端设备及存储介质 - Google Patents
电商商品的搜索方法、系统、终端设备及存储介质 Download PDFInfo
- Publication number
- CN117216423A CN117216423A CN202311056494.0A CN202311056494A CN117216423A CN 117216423 A CN117216423 A CN 117216423A CN 202311056494 A CN202311056494 A CN 202311056494A CN 117216423 A CN117216423 A CN 117216423A
- Authority
- CN
- China
- Prior art keywords
- search
- word segmentation
- commodity
- word
- search keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000011218 segmentation Effects 0.000 claims abstract description 191
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 54
- 230000014509 gene expression Effects 0.000 claims description 50
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000013140 knowledge distillation Methods 0.000 claims description 8
- 238000012896 Statistical algorithm Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Abstract
本发明提供了一种电商商品的搜索方法、系统、终端设备及存储介质,方法包括响应对搜索按钮的点击操作,获取搜索框中输入的搜索关键词句;利用多种分词算法对搜索关键词句进行分词获得多种分词结果;判断搜索关键词句的字符数是否大于等于预设阈值;若搜索关键词句的字符数大于等于预设阈值,则通过广度优先算法获得多种分词结果对应的第一搜索结果;若搜索关键词句的字符数小于预设阈值,则通过深度优先算法获得多种分词结果对应的第二搜索结果。本发明电商商品的搜索方法采用了多种分词算法,分词结果多样,在依据分词匹配时可以自动匹配广度优先或深度优先,提高了商品匹配的成功率和效率,降低了空白结果返回的概率,提高了用户体验。
Description
技术领域
本发明涉及搜索技术领域,尤其涉及一种电商商品的搜索方法、系统、终端设备及存储介质。
背景技术
随着互联网技术的快速发展,电子商务迅速兴起,各种电商平台提供了多种多样的线上商品交易渠道,极大地方便了人们的工作和生活。商品搜索是目前电商网站都提供有的一项功能,不同电商网站的商品搜索算法是不相同的。
现有电商平台的商品搜索算法在面对用户输入的搜索关键词句内容是随机,文字存在错别字或字符长度较长,导致无法精确的定位到对应商品时,通常返回的搜索为空的搜索结果,这极大的影响了用户的购物体验。
因此,现有技术还有待于改进和发展。
发明内容
本发明的主要目的在于提供一种电商商品的搜索方法、系统、终端设备及存储介质,以解决上述背景技术中所提到的现有技术所存在的技术问题。
本发明第一方面提供了一种电商商品的搜索方法,包括以下步骤:
响应对搜索按钮的点击操作,获取搜索框中输入的搜索关键词句;
利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果;
判断所述搜索关键词句的字符数是否大于等于预设阈值;
若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果;
若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果。
在本发明第一方面一种可选的实施方式中,所述利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果包括:
基于预置的词典匹配算法对所述搜索关键词句进行词典匹配分词,获得第一分词结果;
基于预置的基于经验的语言模型统计算法获得所述搜索关键词句的经验切分路径,基于所述经验切分路径对所述搜索关键词句进行分词,获得第二分词结果;
基于预置的知识蒸馏神经网络算法获得基于权重的所述搜索关键词句的权重切分路径,基于所述权重切分路径对所述搜索关键词句进行分词,获得第三分词结果。
在本发明第一方面一种可选的实施方式中,所述基于预置的知识蒸馏神经网络算法获得基于权重的所述搜索关键词句的权重切分路径,基于所述权重切分路径对所述搜索关键词句进行分词,获得第三分词结果之后包括:
基于预设的分词数以及字符数最少优先删除原则,对所述第一分词结果、所述第二分词结果和所述第三分词结果中多余的分词进行删除。
在本发明第一方面一种可选的实施方式中,所述若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果包括:
对多种所述分词结果进行分析,获得多种所述分词结果中的差异词语节点;
以任一种所述分词结果开始构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配;
在匹配过程中,当包含所述差异词语节点的搜索表达式无法匹配到满足设定条件的商品描述的商品时,则切换所述差异词语节点为另一同级的所述差异词语节点并更改所述搜索表达式,继续匹配满足设定条件的商品描述的商品;若当前词语节点并非所述差异词语节点,则继续生成深度方向搜索表达式,继续匹配满足设定条件的商品描述的商品;
当匹配到满足设定条件的商品描述的商品时,获取所述商品描述对应的商品信息作为第一搜索结果。
在本发明第一方面一种可选的实施方式中,所述若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果包括:
每次随机从多种所述分词结果中非重复的选出一种所述分词结果;
利用选出的所述分词结果构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配,当匹配到满足设定条件的商品描述的商品时,获取所述商品描述对应的商品信息作为第二搜索结果。
在本发明第一方面一种可选的实施方式中,所述以任一种所述分词结果开始构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配或所述利用选出的所述分词结果构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配包括:
预先基于所述分词结果生成搜索表达式;
将所述搜索表达式中的各个词语与商品数据库中的各种商品的商品描述进行匹配,并判断所述搜索表达式与商品数据库中的各种商品的商品描述是否达到预设的匹配率。
在本发明第一方面一种可选的实施方式中,所述电商商品的搜索方法还包括:
获取所述第一搜索结果或所述第二搜索结果中各种商品的销售数量和频率数量;
基于各种商品的所述销售数量和所述频率数量,获得各种所述商品的评分;
基于各种所述商品的所述评分调整各种所述商品在所述第一搜索结果或所述第二搜索结果中的展示排序。本发明第二方面提供了一种电商商品的搜索系统,所述电商商品的搜索系统包括:
搜索关键词句获取模块,用于响应对搜索按钮的点击操作,获取搜索框中输入的搜索关键词句;
分词模块,用于利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果;
字符长度判断模块,用于判断所述搜索关键词句的字符数是否大于等于预设阈值;
第一搜索结果反馈模块,用于若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果;
第二搜索结果反馈模块,用于若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果。
本发明第三方面提供了一种终端设备,所述终端设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述终端设备执行如上述任一项所述的电商商品的搜索方法。
本发明第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的电商商品的搜索方法。
有益效果:本发明提供了一种电商商品的搜索方法、系统、终端设备及存储介质,方法包括响应对搜索按钮的点击操作,获取搜索框中输入的搜索关键词句;利用预置的多种分词算法对搜索关键词句进行分词获得多种分词结果;判断搜索关键词句的字符数是否大于等于预设阈值;若搜索关键词句的字符数大于等于预设阈值,则通过广度优先算法获得多种分词结果对应的第一搜索结果;若搜索关键词句的字符数小于预设阈值,则通过深度优先算法获得多种分词结果对应的第二搜索结果。本发明电商商品的搜索方法采用了多种分词算法,分词结果多样,在依据分词匹配时,可以自动匹配广度优先或深度优先,提高了搜索商品匹配的成功率和效率,降低了空白结果返回的概率,提高了用户体验。
附图说明
图1为本发明一种电商商品的搜索方法的一个实施例示意图;
图2为本发明一种电商商品的搜索系统的一个实施例示意图;
图3为本发明一种终端设备的一个实施例示意图。
具体实施方式
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明第一方面提供了一种电商商品的搜索方法,包括以下步骤:
S100、响应对搜索按钮的点击操作,获取搜索框中输入的搜索关键词句;本发明的电商商品的搜索方法适用于电商平台,用户在电商网站的搜索框中复制粘贴或输入了一段文字和/或字符,再点击按钮进行搜索时,系统后台就会获取搜索框中输入的搜索关键词句,需要说明的是所述搜索关键词句不仅限于中文汉字,也可以是包含有字母或符号。
S200、利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果;举例来说,“小明研究生物学”这样一段文字,在基于不同的分词算法的情况下可以获得,例如小/明/研/究/生/物/学,小明/研究/生物学,小明/研究生/物学之类的不同分词结果,本发明的目的在于获得更多的分词结果以便于于根据分词结果更大几率的匹配到符合要求的商品。
在本发明步骤S200一种可选的实施方式中,所述利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果包括:
基于预置的词典匹配算法对所述搜索关键词句进行词典匹配分词,获得第一分词结果;一般来讲,词典匹配发取决于词库中收纳的字词数,对于无法匹配的到词库中所述搜索关键词句的词语,一般都是进行单词切割,另外词典匹配的方法也难以解决错别字的问题;
基于预置的基于经验的语言模型统计算法获得所述搜索关键词句的经验切分路径,基于所述经验切分路径对所述搜索关键词句进行分词,获得第二分词结果;一般来讲,基于经验的语言模型会根据之前切割语句的经验,在遇到同样的词句切割时,会选择之前切割重复次数最多的方式对语句进切割,来获得最终的语句切割结果;
基于预置的知识蒸馏神经网络算法获得基于权重的所述搜索关键词句的权重切分路径,基于所述权重切分路径对所述搜索关键词句进行分词,获得第三分词结果;一版来讲,知识蒸馏神经网络算法在对语句进行切割时,会为每个词或词组分配一个权重值,然后计算每种切割方式的总权重值的和,最终会选择权重值最大的切割方式对语句进行切割,在本发明中,多种分词算法对所述搜索关键词句进行分词的结果也可能会相同,在出现相同时,本发明会将重复的结果删除。
在本发明第一方面一种可选的实施方式中,所述基于预置的知识蒸馏神经网络算法获得基于权重的所述搜索关键词句的权重切分路径,基于所述权重切分路径对所述搜索关键词句进行分词,获得第三分词结果之后包括:基于预设的分词数以及字符数最少优先删除原则,对所述第一分词结果、所述第二分词结果和所述第三分词结果中多余的分词进行删除。
具体来说,本发明的搜索方法中,是可以设置分词数量的,这个分词的数量可以是固定的,例如固定设置为a,也可以是动态的,例如用户输入的一段文字的字数为A,属于第一区间,对应的分词就为a,用户输入的一段文字的字数为B,属于第二区间,对应的分词就为b,示例性的,分词数量为动态的,控制分词数量的目的是控制后续匹配的时间,提高搜索结果的效率,在出现分词多出来的时候,一般来讲,字符(包括文字)少的分词一般来讲都为一些语气词或符号,对于后续匹配没有什么意义,所以在本发明在在分词出现超出预设值时,优先删除字符数最少的分词。
S300、判断所述搜索关键词句的字符数是否大于等于预设阈值;在本发明中,所述搜索关键词句的字符数越多,得到的分词数也会越多,分词数越多,对于每种分词结果进行匹配的耗时就会越长,如果有几种分词结果一直匹配不到,最终得到反馈的结果的时间也会变长,为此,本发明设计了依据所述搜索关键词句的字符数分为深度优先和广度优先两种匹配方式,以提高返回搜索结果的效率。
S400、若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果;在发明中,广度优先算法简单理解就是在依据分词结果进行商品匹配的过程中,依据某条所述分词结果的前面部分分词没有获得搜索结果时,就会切换到另一分词结果的前面部分分词进行搜索,直到多种所述分词结果的前面部分分词都没搜索到结果才会回到起始的分词结果,进行后续的商品匹配,在后续匹配时,同样基于广度优先的原则进行匹配,广度优先算法不会对一条所述分词结果全部检索完。
在本发明步骤S400一种可选的实施方式中,所述若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果包括:
对多种所述分词结果进行分析,获得多种所述分词结果中的差异词语节点;在本发明中,对于一段文字,不同的分词算法得到的分词结果中大部分的分词是会相同的,只有少部分组词不确定的词句分出来的词语会不相同,本发明在进行广度优先算法商品匹配之前,会先找出多种所述分词结果中的差异词语节点;
以任一种所述分词结果开始构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配;在本发明中,匹配时,预先基于所述分词结果生成搜索表达式;将所述搜索表达式中的各个词语与商品数据库中的各种商品的商品描述进行匹配,并判断所述搜索表达式与商品数据库中的各种商品的商品描述是否达到预设的匹配率。示例性的来说,一种分词结果为a、b、c、d、e、…,生成搜索表达式就是例如先选取a、b、c组成(a and b and c)的表达式,之后用a、b和c这三个词与商品数据库中的各种商品的商品描述进行匹配,判断a、b和c这几个词中有几个在商品描述中,示例的,例如只要有2个词匹配的到,就判定匹配的这个商品是符合的,在获得预设数量(一般以界面首页可以呈现的商品数量确定)的符合条件的商品时,就会把搜索结果反馈给用户。
在匹配过程中,当包含所述差异词语节点的搜索表达式无法匹配到满足设定条件的商品描述的商品时,则切换所述差异词语节点为另一同级的所述差异词语节点并更改所述搜索表达式,继续匹配满足设定条件的商品描述的商品;若当前词语节点并非所述差异词语节点,则继续生成深度方向搜索表达式,继续匹配满足设定条件的商品描述的商品;当匹配到满足设定条件的商品描述的商品时,获取所述商品描述对应的商品信息作为第一搜索结果。简单来理解,本发明在包含a、b、c的检索表达式匹配完成之后,再进行a、b、d,b、c、d或a、c、d的检索式的商品匹配,如果a、b、c的检索表达式中包含差异词语节点c,那么在a、b、c的检索表达式没有检索到匹配的时,就会将a、b、c中的c替换为另一分词结果中同级别的节点c1,当c1也没有检索匹配的时,就是替换成c2,以此类推,c同级别的所有分词都没检索匹配到,那么就会继续a、b、d,b、c、d或a、c、d的检索式的商品匹配。
S500、若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果。在本发明中,当所述搜索关键词句的字符数比较少的时候,本发明依次执行完一种分词结果对应的搜索结果再获取下一种分词结果对应的搜索结果。
在本发明步骤S500一种可选的实施方式中,所述若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果包括:
每次随机从多种所述分词结果中非重复的选出一种所述分词结果;在本发明中,所述搜索关键词句的字符数少,匹配所需的时间短,每种分词结果的地位是相同的,所以本发明先匹配的所述分词结果可以随机选择;
利用选出的所述分词结果构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配,当匹配到满足设定条件的商品描述的商品时,获取所述商品描述对应的商品信息作为第二搜索结果。在本发明的深度优先算法的实施方式中,就无需考虑差异词语节点的影响,以一种分词结果为a、b、c、d、e、…为例,该中实施方式就是按照顺序依次进行a、b、c,a、b、d,b、c、d,a、c、d,…的各项检索式的商品匹配,知道检索匹配完这种分词结果,再执行下一种分词结果的匹配。
在本发明第一方面一种可选的实施方式中,所述电商商品的搜索方法还包括:获取所述第一搜索结果或所述第二搜索结果中各种商品的销售数量和频率数量;基于各种商品的所述销售数量和所述频率数量,获得各种所述商品的评分;基于各种所述商品的所述评分调整各种所述商品在所述第一搜索结果或所述第二搜索结果中的展示排序。在本发明中,在匹配得到商品结果之后,在展示给用户时,本发明会根据各种商品的销售和评价的一些情况获得各种商品的推荐指数,之后依据推荐指数对各种商品进行重新排序,以使得更符合要求的商品展示的更靠前,以使得用户获得更好的购物体验。
参见图2,本发明第二方面提供了一种电商商品的搜索系统,所述电商商品的搜索系统包括:
搜索关键词句获取模块10,用于响应对搜索按钮的点击操作,获取搜索框中输入的搜索关键词句;
分词模块20,用于利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果;
字符长度判断模块30,用于判断所述搜索关键词句的字符数是否大于等于预设阈值;
第一搜索结果反馈模块40,用于若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果;
第二搜索结果反馈模块50,用于若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果。
在本发明第二方面一种可选的实施方式中,所述分词模块包括:
第一分词单元,用于基于预置的词典匹配算法对所述搜索关键词句进行词典匹配分词,获得第一分词结果;
第二分词单元,用于基于预置的基于经验的语言模型统计算法获得所述搜索关键词句的经验切分路径,基于所述经验切分路径对所述搜索关键词句进行分词,获得第二分词结果;
第三分词单元,用于基于预置的知识蒸馏神经网络算法获得基于权重的所述搜索关键词句的权重切分路径,基于所述权重切分路径对所述搜索关键词句进行分词,获得第三分词结果。
在本发明第二方面一种可选的实施方式中,所述分词模块还包括:
分词筛选单元,用于基于预设的分词数以及字符数最少优先删除原则,对所述第一分词结果、所述第二分词结果和所述第三分词结果中多余的分词进行删除。
在本发明第二方面一种可选的实施方式中,所述第一搜索结果反馈模块包括:
分词结果分析单元,用于对多种所述分词结果进行分析,获得多种所述分词结果中的差异词语节点;
第一分词匹配单元,用于以任一种所述分词结果开始与商品数据库中的商品的商品描述进行匹配;在匹配过程中,当包含所述差异词语节点的搜索表达式无法匹配到满足设定条件的商品描述的商品时,则切换所述差异词语节点为另一同级的所述差异词语节点并更改所述搜索表达式,继续匹配满足设定条件的商品描述的商品;若当前词语节点并非所述差异词语节点,则继续生成深度方向搜索表达式,继续匹配满足设定条件的商品描述的商品;
第一搜索结果生成单元,用于当匹配到满足设定条件的商品描述的商品时,获取所述商品的商品描述对应的商品信息作为第一搜索结果。
在本发明第二方面一种可选的实施方式中,所述第二搜索结果反馈模块包括:
分词结果选择单元,用于每次随机从多种所述分词结果中非重复的选出一种所述分词结果;
第二分词匹配单元,用于利用选出的所述分词结果与商品数据库中的商品的商品描述进行匹配;
第二搜索结果生成单元,用于当匹配到满足设定条件的商品描述的商品时,获取所述商品的商品描述对应的商品信息作为第二搜索结果。
在本发明第二方面一种可选的实施方式中,所述第一分词匹配单元和第二分词匹配单元包括:
搜索表达式生成子单元,用于预先基于所述分词结果生成搜索表达式;
词语匹配子单元,用于将所述搜索表达式中的各个词语与商品数据库中的各种商品的商品描述进行匹配,并判断所述搜索表达式与商品数据库中的各种商品的商品描述是否达到预设的匹配率。
图3是本发明实施例提供的一种终端设备的结构示意图,该终端设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器60(central processingunits,CPU)(例如,一个或一个以上处理器)和存储器70,一个或一个以上存储应用程序或数据的存储介质80(例如一个或一个以上海量存储设备)。其中,存储器和存储介质可以是短暂存储或持久存储。存储在存储介质的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括终端设备中的一系列指令操作。更进一步地,处理器可以设置为与存储介质通信,在终端设备上执行存储介质中的一系列指令操作。
本发明的终端设备还可以包括一个或一个以上电源90,一个或一个以上有线或无线网络接口100,一个或一个以上输入输出接口110,和/或,一个或一个以上操作系统,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图3示出的终端设备结构并不构成对本发明终端设备的具体限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述的电商商品的搜索方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统或装置、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种电商商品的搜索方法,其特征在于,包括以下步骤:
响应对搜索按钮的点击操作,获取搜索框中输入的搜索关键词句;
利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果;
判断所述搜索关键词句的字符数是否大于等于预设阈值;
若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果;
若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果。
2.根据权利要求1所述的电商商品的搜索方法,其特征在于,所述利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果包括:
基于预置的词典匹配算法对所述搜索关键词句进行词典匹配分词,获得第一分词结果;
基于预置的基于经验的语言模型统计算法获得所述搜索关键词句的经验切分路径,基于所述经验切分路径对所述搜索关键词句进行分词,获得第二分词结果;
基于预置的知识蒸馏神经网络算法获得基于权重的所述搜索关键词句的权重切分路径,基于所述权重切分路径对所述搜索关键词句进行分词,获得第三分词结果。
3.根据权利要求2所述的电商商品的搜索方法,其特征在于,所述基于预置的知识蒸馏神经网络算法获得基于权重的所述搜索关键词句的权重切分路径,基于所述权重切分路径对所述搜索关键词句进行分词,获得第三分词结果之后包括:
基于预设的分词数以及字符数最少优先删除原则,对所述第一分词结果、所述第二分词结果和所述第三分词结果中多余的分词进行删除。
4.根据权利要求1所述的电商商品的搜索方法,其特征在于,所述若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果包括:
对多种所述分词结果进行分析,获得多种所述分词结果中的差异词语节点;
以任一种所述分词结果开始构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配;
在匹配过程中,当包含所述差异词语节点的搜索表达式无法匹配到满足设定条件的商品描述的商品时,则切换所述差异词语节点为另一同级的所述差异词语节点并更改所述搜索表达式,继续匹配满足设定条件的商品描述的商品;若当前词语节点并非所述差异词语节点,则继续生成深度方向搜索表达式,继续匹配满足设定条件的商品描述的商品;
当匹配到满足设定条件的商品描述的商品时,获取所述商品描述对应的商品信息作为第一搜索结果。
5.根据权利要求1所述的电商商品的搜索方法,其特征在于,所述若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果包括:
每次随机从多种所述分词结果中非重复的选出一种所述分词结果;
利用选出的所述分词结果构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配,当匹配到满足设定条件的商品描述的商品时,获取所述商品描述对应的商品信息作为第二搜索结果。
6.根据权利要求4或5所述的电商商品的搜索方法,其特征在于,所述以任一种所述分词结果开始构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配或所述利用选出的所述分词结果构建搜索表达式与商品数据库中的各种商品的商品描述进行匹配包括:
预先基于所述分词结果生成搜索表达式;
将所述搜索表达式中的各个词语与商品数据库中的各种商品的商品描述进行匹配,并判断所述搜索表达式与商品数据库中的各种商品的商品描述是否达到预设的匹配率。
7.根据权利要求6所述的电商商品的搜索方法,其特征在于,所述电商商品的搜索方法还包括:
获取所述第一搜索结果或所述第二搜索结果中各种商品的销售数量和频率数量;
基于各种商品的所述销售数量和所述频率数量,获得各种所述商品的评分;
基于各种所述商品的所述评分调整各种所述商品在所述第一搜索结果或所述第二搜索结果中的展示排序。
8.一种电商商品的搜索系统,其特征在于,所述电商商品的搜索系统包括:
搜索关键词句获取模块,用于响应对搜索按钮的点击操作,获取搜索框中输入的搜索关键词句;
分词模块,用于利用预置的多种分词算法对所述搜索关键词句进行分词,获得多种分词结果;
字符长度判断模块,用于判断所述搜索关键词句的字符数是否大于等于预设阈值;
第一搜索结果反馈模块,用于若所述搜索关键词句的字符数大于等于所述预设阈值,则通过广度优先算法获得多种所述分词结果对应的第一搜索结果;
第二搜索结果反馈模块,用于若所述搜索关键词句的字符数小于所述预设阈值,则通过深度优先算法获得多种所述分词结果对应的第二搜索结果。
9.一种终端设备,其特征在于,所述终端设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述终端设备执行如权利要求1-7中任一项所述的电商商品的搜索方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的电商商品的搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311056494.0A CN117216423A (zh) | 2023-08-21 | 2023-08-21 | 电商商品的搜索方法、系统、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311056494.0A CN117216423A (zh) | 2023-08-21 | 2023-08-21 | 电商商品的搜索方法、系统、终端设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117216423A true CN117216423A (zh) | 2023-12-12 |
Family
ID=89034316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311056494.0A Pending CN117216423A (zh) | 2023-08-21 | 2023-08-21 | 电商商品的搜索方法、系统、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117216423A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070185847A1 (en) * | 2006-01-31 | 2007-08-09 | Intellext, Inc. | Methods and apparatus for filtering search results |
CN101751434A (zh) * | 2008-12-16 | 2010-06-23 | 北大方正集团有限公司 | 一种元搜索引擎的排名方法及元搜索引擎 |
CN105138511A (zh) * | 2015-08-10 | 2015-12-09 | 北京思特奇信息技术股份有限公司 | 一种对搜索关键词进行语义分析的方法和系统 |
US20170109435A1 (en) * | 2016-07-15 | 2017-04-20 | Hisense Co., Ltd. | Apparatus and method for searching for information |
CN110727862A (zh) * | 2019-09-24 | 2020-01-24 | 苏宁云计算有限公司 | 一种商品搜索的查询策略的生成方法及装置 |
CN111881316A (zh) * | 2020-07-28 | 2020-11-03 | 腾讯音乐娱乐科技(深圳)有限公司 | 搜索方法、装置及服务器和计算机可读存储介质 |
CN112380244A (zh) * | 2020-12-02 | 2021-02-19 | 杭州筑龙信息技术股份有限公司 | 一种分词搜索方法、装置、电子设备及可读存储介质 |
CN115827823A (zh) * | 2022-12-12 | 2023-03-21 | 浙江大学 | 基于文本大数据与卷积神经网络的期刊匹配推荐方法 |
-
2023
- 2023-08-21 CN CN202311056494.0A patent/CN117216423A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070185847A1 (en) * | 2006-01-31 | 2007-08-09 | Intellext, Inc. | Methods and apparatus for filtering search results |
CN101751434A (zh) * | 2008-12-16 | 2010-06-23 | 北大方正集团有限公司 | 一种元搜索引擎的排名方法及元搜索引擎 |
CN105138511A (zh) * | 2015-08-10 | 2015-12-09 | 北京思特奇信息技术股份有限公司 | 一种对搜索关键词进行语义分析的方法和系统 |
US20170109435A1 (en) * | 2016-07-15 | 2017-04-20 | Hisense Co., Ltd. | Apparatus and method for searching for information |
CN110727862A (zh) * | 2019-09-24 | 2020-01-24 | 苏宁云计算有限公司 | 一种商品搜索的查询策略的生成方法及装置 |
CN111881316A (zh) * | 2020-07-28 | 2020-11-03 | 腾讯音乐娱乐科技(深圳)有限公司 | 搜索方法、装置及服务器和计算机可读存储介质 |
CN112380244A (zh) * | 2020-12-02 | 2021-02-19 | 杭州筑龙信息技术股份有限公司 | 一种分词搜索方法、装置、电子设备及可读存储介质 |
CN115827823A (zh) * | 2022-12-12 | 2023-03-21 | 浙江大学 | 基于文本大数据与卷积神经网络的期刊匹配推荐方法 |
Non-Patent Citations (3)
Title |
---|
李金生 等: "在线健康社区信息有用性评价影响因素研究", 医学信息学杂志, 25 March 2022 (2022-03-25) * |
许鑫;黄仲清;邓三鸿;: "互联网侨情信息采集系统设计与实现", 现代图书情报技术, no. 1, 25 August 2010 (2010-08-25) * |
颜翔: "基于WEB页面的主题搜索的研究与实现", 信息科技, 15 April 2015 (2015-04-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8825628B2 (en) | System and method of identifying web page semantic structures | |
CN109508414B (zh) | 一种同义词挖掘方法及装置 | |
KR101508260B1 (ko) | 문서 특징을 반영하는 요약문 생성 장치 및 방법 | |
US20100205198A1 (en) | Search query disambiguation | |
CN104794154B (zh) | 基于文本挖掘的医疗器械o2o服务质量评价模型 | |
US10678769B2 (en) | Artificial intelligence system and method for auto-naming customer tree nodes in a data structure | |
CN111159363A (zh) | 一种基于知识库的问题答案确定方法及装置 | |
CN109819015B (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
US20130339369A1 (en) | Search Method and Apparatus | |
CN107357777B (zh) | 提取标签信息的方法和装置 | |
JP2009026195A (ja) | 商品分類装置、商品分類方法及びプログラム | |
CN112989208B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN111611356A (zh) | 信息查找方法、装置、电子设备及可读存储介质 | |
Petz et al. | On text preprocessing for opinion mining outside of laboratory environments | |
CN111767725A (zh) | 一种基于情感极性分析模型的数据处理方法及装置 | |
CN110060132B (zh) | 基于细粒度数据的可解释商品推荐方法 | |
CN111984845B (zh) | 网站错别字识别方法和系统 | |
CN113761114A (zh) | 短语生成方法、装置和计算机可读存储介质 | |
CN113157888A (zh) | 支持多知识来源的询问答复方法、装置和电子设备 | |
Balaguer et al. | CatSent: a Catalan sentiment analysis website | |
CN110516175B (zh) | 一种确定用户标签的方法、装置、设备和介质 | |
CN117216423A (zh) | 电商商品的搜索方法、系统、终端设备及存储介质 | |
US20190384812A1 (en) | Portfolio-based text analytics tool | |
CN116644148A (zh) | 关键词识别方法、装置、电子设备及存储介质 | |
CN114722188A (zh) | 基于运营数据的广告生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |