一种商品搜索方法、系统及存储介质
技术领域
本发明属于商品搜索技术领域,具体而言是一种商品搜索方法、系统及存储介质。
背景技术
随着网络时代的到来,计算机和互联网进入了千家万户,网络购物成为众多消费者首选的购物方式,各种电商平台如雨后春笋般涌现出来,人们已经习惯在电商平台进行商品搜索,以选择自己喜欢的商品进行购物。
目前电商平台的商品搜索模式是基于用户在搜索界面上输入的搜索文字确定用户需要搜索的商品名称和商品需求特征,进而从商品存储库中筛选出符合用户需要搜索商品名称和商品需求特征的商品链接,从而进行搜索结果显示,其中商品需求特征的筛选方式是基于商品链接的标题名称与商品需求特征的匹配度进行筛选,在实现本申请的过程中,发明人发现该筛选方式至少存在如下问题:
1.单独只根据商品链接的标题名称进行匹配,忽略了商品链接对应展示图片对筛选结果的影响,一般情况商品链接的展示图片都能够反映商品实物的状态,而商品链接的标题名称是卖家命名的,极有可能出现卖家为吸引用户偏好或以提高搜索排名为导向过度堆砌或美化标题名称,从而导致命名的标题名称与商品实物不符合,进而降低了筛选结果与商品需求特征的匹配度,致使搜索结果无法满足用户需求,从而影响用户的购物体验感。
2.当前该筛选方式在确定用户需要搜索商品对应的需求特征时,对提取的所有需求特征都平等对待,没有依据用户对各需求特征的偏好状况进行个性区分,进而导致在分析商品链接的标题名称与商品需求特征的匹配度过程中缺乏针对性,不够深入,从而导致筛选结果与用户的偏好迎合度不高。
发明内容
有鉴于此,本发明提供了一种商品搜索方法、系统及存储介质,来解决上述存在的技术问题,具体采用以下技术方案来实现。
第一方面,本发明提供一种商品搜索方法,包括以下步骤:
S1:从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
S2:根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
S3:基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数;
S4:根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,并将提取出的各条商品链接分别编号为1,2,...,i,...,n;
S5:分别获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度;
S6:将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接,同时记录各标题匹配商品链接的编号,可记为1,2,...,j,...,m;
S7:分别获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片分别与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度;
S8:将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的标题匹配商品链接,并将筛选出的标题匹配商品链接记为目标商品链接,同时记录目标商品链接的编号,可记为1,2,...,k,...,u;
S9:根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
在本发明第一方面的一种能够实现的方式中,所述S1中从搜索文字中筛选出搜索主体和搜索特征词对应的筛选步骤如下:
S11:将搜索文字进行分词处理,得到若干词组;
S12:将各词组进行词性标注,并从中提取词性为名词和修饰词的词组;
S13:从提取的词性为名词的词组中筛选出搜索主体,并从提取的词性为修饰词的词组中筛选出搜索特征词。
在本发明第一方面的一种能够实现的方式中,所述S3中基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数包括以下解析步骤:
S31:根据筛选出的搜索主体从目标用户对应的历史购物记录中识别出关联历史购物记录;
S32:从各条关联历史购物记录对应的商品展示图片中提取商品外形特征;
S33:将各条关联历史购物记录对应的商品外形特征分别与各搜索特征词进行匹配,由此统计各搜索特征词对应匹配成功的频次;
S34:将各搜索特征词对应匹配成功的频次导入偏好指数计算公式,由此计算出目标用户对搜索主体所属各搜索特征词的偏好指数,其中偏好指数计算公式为
在本发明第一方面的一种能够实现的方式中,所述S31中根据筛选出的搜索主体从目标用户对应的历史购物记录中识别出关联历史购物记录具体参照如下步骤:
S311:从各条历史购物记录中提取商品名称;
S312:将各条历史购物记录对应的商品名称与搜索主体进行对比,若某条历史购物记录对应的商品名称与搜索主体相同,则将该条历史购物记录记为关联历史购物记录。
在本发明第一方面的一种能够实现的方式中,所述计算各条商品链接对应的标题名称匹配度具体包括如下步骤:
S51:将各条商品链接对应的标题名称进行分词拆分,得到若干词组;
S52:将各条商品链接所属标题名称拆分的各词组进行去重处理,得到各单独词组,并对各条商品链接所属标题名称存在的各单独词组按照预设顺序进行编号;
S53:将各条商品链接所属标题名称存在的各单独词组分别与各搜索特征词进行匹配,统计匹配成功的单独词组数量,并将匹配成功的单独词组记为适配词组,此时获取各适配词组的编号,可记为1,2,...,a,...,l,同时记录各适配词组对应匹配成功的搜索特征词编号;
S54:基于各条商品链接所属标题名称中各适配词组对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条商品链接所属标题名称中各适配词组对应匹配成功搜索特征词的偏好指数,并将其作为各条商品链接所属标题名称中各适配词组对应的匹配权重系数;
S55:根据各条商品链接所属标题名称中适配词组的数量及各适配词组对应的匹配权重系数计算各条商品链接对应的标题名称匹配度,其计算公式为
TD
i表示为第i条商品链接对应的标题名称匹配度,λ
ai表示为第i条商品链接所属标题名称中第a个适配词组对应的匹配权重系数,li表示为第i条商品链接对应的适配词组数量,Yi表示为第i条商品链接对应的单独词组数量。
在本发明第一方面的一种能够实现的方式中,所述计算各条标题匹配商品链接对应的展示图片匹配度具体包括如下步骤:
S71:将各条标题匹配商品链接对应的展示图片进行商品外形特征提取,并将提取的各商品外形特征按照设定的顺序进行编号;
S72:将各条标题匹配商品链接所属展示图片的各商品外形特征分别与各搜索特征词进行匹配,统计匹配成功的商品外形特征数量,并将匹配成功的商品外形特征记为适配外形特征,此时获取各适配外形特征的编号,可记为1,2,...,b,...,h,同时记录各适配外形特征对应匹配成功的搜索特征词编号;
S73:基于各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功搜索特征词的偏好指数,并将其作为各条标题匹配商品链接所属标题名称中各适配外形特征对应的匹配权重系数;
S74:基于各条标题匹配商品链接所属展示图片对应的适配外形特征数量及各适配外形特征对应的匹配权重系数计算各条标题匹配商品链接对应的展示图片匹配度,其计算公式为
PD
j表示为第j条标题匹配商品链接对应的展示图片匹配度,ε
bj表示为第j条标题匹配商品链接所属展示图片中第b个适配外形特征对应的匹配权重系数,hj表示为第j条标题匹配商品链接对应的适配外形特征数量,Xj表示为第j条标题匹配商品链接对应的商品外形特征数量。
在本发明第一方面的一种能够实现的方式中,所述各目标商品链接对应的综合匹配度评估公式为
表示为第k条目标商品链接对应的综合匹配度,A、B分别表示为标题名称匹配、展示图片匹配对应的占比系数,e表示为自然常数。
第二方面,本发明提供一种商品搜索系统,包括以下模块:
搜索文字提取处理模块,用于从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
历史购物记录提取模块,用于根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
搜索特征词偏好指数解析模块,用于基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数;
商品链接提取模块,用于根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接;
商品存储库,用于存储各商品名称对应的若干商品链接;
商品链接标题名称匹配度分析模块,用于获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度;
标题匹配商品链接筛选模块,用于将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接;
展示图片匹配度分析模块,用于获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度;
目标商品链接筛选模块,用于将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的商品链接,并将筛选出的标题匹配商品链接记为目标商品链接;
目标商品链接排序显示模块,用于根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
第三方面,本发明提供一种商品搜索存储介质,所述商品搜索存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种商品搜索方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
(1)本发明通过从电商平台的搜索界面中提取目标用户输入的搜索文字,并对搜索文字进行处理,从中筛选出搜索主体和搜索特征词,并基于筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,进而分别对各条商品链接的标题名称和展示图片与搜索特征词进行匹配,从中筛选出标题名称匹配度和展示图片匹配度均符合预设阈值的商品链接,从而对筛选出的商品链接进行综合排序,实现了商品链接的双重筛选匹配,提高了筛选结果与搜索特征词的匹配度,有效降低了筛选出的商品标题名称与商品实物不符合的发生率,大大满足了用户需求,在一定程度上提升了用户的购物体验感。
(2)本发明在筛选出搜索特征词后根据用户的历史购物记录解析出目标用户对搜索主体所属各搜索特征词的偏好指数,并据此对筛选出的搜索特征词进行个性区分,进而为后续分析商品链接的标题名称与搜索特征词的匹配度过程中提供针对性的匹配根据,深化了匹配过程,从而提高了筛选结果与用户的偏好迎合度。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明的方法实施步骤流程图;
图2为本发明的系统模块连接示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参照图1所示,第一方面,本发明提供一种商品搜索方法,包括以下步骤:
S1:从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
需要说明的是上述提到的搜索主体是指商品名称,搜索特征词是指用户需要搜索商品的需求特征,示例性地,若搜索主体为连衣裙,搜索特征词可以为颜色、材质、裙型、袖型等;
上述中搜索主体和搜索特征词对应的筛选步骤如下:
S11:将搜索文字进行分词处理,得到若干词组;
S12:将各词组进行词性标注,并从中提取词性为名词和修饰词的词组;
S13:从提取的词性为名词的词组中筛选出搜索主体,并从提取的词性为修饰词的词组中筛选出搜索特征词。
在一个具体实施例中,基于搜索文字中各词组的词性来确定搜索主体和搜索特征词的目的在于:搜索主体都是固定的名称,一般情况下是以名词为代表,而搜索特征词是用于修饰搜索主体的,一般情况下是以修饰词为代表,示例性地,若搜索文字为鱼尾型雪纺田园风连衣裙,其中搜索主体为连衣裙,“鱼尾型”、“雪纺”、“田园风”都是用于修饰连衣裙的,可作为搜索特征词;
S2:根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
S3:基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数,其解析步骤:
S31:根据筛选出的搜索主体从目标用户对应的历史购物记录中识别出关联历史购物记录,具体筛选过程参照如下步骤:
S311:从各条历史购物记录中提取商品名称;
S312:将各条历史购物记录对应的商品名称与搜索主体进行对比,若某条历史购物记录对应的商品名称与搜索主体相同,则将该条历史购物记录记为关联历史购物记录;
S32:从各条关联历史购物记录对应的商品展示图片中提取商品外形特征;
S33:将各条关联历史购物记录对应的商品外形特征分别与各搜索特征词进行匹配,由此统计各搜索特征词对应匹配成功的频次;
S34:将各搜索特征词对应匹配成功的频次导入偏好指数计算公式,由此计算出目标用户对搜索主体所属各搜索特征词的偏好指数,其中偏好指数计算公式为
其中某搜索特征词对应匹配成功的频次越多,该搜索特征词的偏好指数越大,表明该搜索特征词的权重越大;
本发明实施例在筛选出搜索特征词后根据用户的历史购物记录解析出目标用户对搜索主体所属各搜索特征词的偏好指数,并据此对筛选出的搜索特征词进行个性区分,进而为后续分析商品链接的标题名称与搜索特征词的匹配度过程中提供针对性的匹配根据,深化了匹配过程,从而提高了筛选结果与用户的偏好迎合度。
S4:根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,并将提取出的各条商品链接分别编号为1,2,...,i,...,n;
S5:分别获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度,具体包括如下步骤:
S51:将各条商品链接对应的标题名称进行分词拆分,得到若干词组;
S52:将各条商品链接所属标题名称拆分的各词组进行去重处理,得到各单独词组,并对各条商品链接所属标题名称存在的各单独词组按照预设顺序进行编号;
需要说明的是,本发明对各条商品链接所属标题名称拆分的各词组进行去重处理的原因在于:避免某些商品链接所属标题名称中一些词组重复出现导致匹配结果不准确情况的发生。
S53:将各条商品链接所属标题名称存在的各单独词组分别与各搜索特征词进行匹配,统计匹配成功的单独词组数量,并将匹配成功的单独词组记为适配词组,此时获取各适配词组的编号,可记为1,2,...,a,...,l,同时记录各适配词组对应匹配成功的搜索特征词编号;
S54:基于各条商品链接所属标题名称中各适配词组对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条商品链接所属标题名称中各适配词组对应匹配成功搜索特征词的偏好指数,并将其作为各条商品链接所属标题名称中各适配词组对应的匹配权重系数;
S55:根据各条商品链接所属标题名称中适配词组的数量及各适配词组对应的匹配权重系数计算各条商品链接对应的标题名称匹配度,其计算公式为
TD
i表示为第i条商品链接对应的标题名称匹配度,λ
ai表示为第i条商品链接所属标题名称中第a个适配词组对应的匹配权重系数,li表示为第i条商品链接对应的适配词组数量,Yi表示为第i条商品链接对应的单独词组数量,其中某条商品链接所属标题名称中适配词组的数量越多,各适配词组对应的匹配权重系数越大,该条商品链接对应的标题名称匹配度越大;
S6:将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接,同时记录各标题匹配商品链接的编号,可记为1,2,...,j,...,m;
S7:分别获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度,具体包括如下步骤:
S71:将各条标题匹配商品链接对应的展示图片进行商品外形特征提取,并将提取的各商品外形特征按照设定的顺序进行编号;
S72:将各条标题匹配商品链接所属展示图片的各商品外形特征分别与各搜索特征词进行匹配,统计匹配成功的商品外形特征数量,并将匹配成功的商品外形特征记为适配外形特征,此时获取各适配外形特征的编号,可记为1,2,...,b,...,h,同时记录各适配外形特征对应匹配成功的搜索特征词编号;
S73:基于各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功搜索特征词的偏好指数,并将其作为各条标题匹配商品链接所属标题名称中各适配外形特征对应的匹配权重系数;
S74:基于各条标题匹配商品链接所属展示图片对应的适配外形特征数量及各适配外形特征对应的匹配权重系数计算各条标题匹配商品链接对应的展示图片匹配度,其计算公式为
PD
j表示为第j条标题匹配商品链接对应的展示图片匹配度,ε
bj表示为第j条标题匹配商品链接所属展示图片中第b个适配外形特征对应的匹配权重系数,hj表示为第j条标题匹配商品链接对应的适配外形特征数量,Xj表示为第j条标题匹配商品链接对应的商品外形特征数量,其中某条标题匹配商品链接所属展示图片中适配外形特征的数量越多,各适配外形特征对应的匹配权重系数越大,该条标题匹配商品链接对应的展示图片匹配度越大;
S8:将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的标题匹配商品链接,并将筛选出的标题匹配商品链接记为目标商品链接,同时记录目标商品链接的编号,可记为1,2,...,k,...,u;
S9:根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,其评估公式为
表示为第k条目标商品链接对应的综合匹配度,A、B分别表示为标题名称匹配、展示图片匹配对应的占比系数,e表示为自然常数,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
本发明实施例通过从电商平台的搜索界面中提取目标用户输入的搜索文字,并对搜索文字进行处理,从中筛选出搜索主体和搜索特征词,并基于筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,进而分别对各条商品链接的标题名称和展示图片与搜索特征词进行匹配,从中筛选出标题名称匹配度和展示图片匹配度均符合预设阈值的商品链接,从而对筛选出的商品链接进行综合排序,实现了商品链接的双重筛选匹配,提高了筛选结果与搜索特征词的匹配度,有效降低了筛选出的商品标题名称与商品实物不符合的发生率,大大满足了用户的搜索需求,在一定程度上提升了用户的购物体验感。
实施例2
参照图2所示,本发明提供一种商品搜索系统,包括以下模块:
搜索文字提取处理模块,用于从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
历史购物记录提取模块,用于根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
搜索特征词偏好指数解析模块,分别与搜索文字提取处理模块和历史购物记录提取模块连接,用于基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数;
商品链接提取模块,分别与搜索文字提取处理模块和商品存储库连接,用于根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接;
商品存储库,用于存储各商品名称对应的若干商品链接;
商品链接标题名称匹配度分析模块,分别与搜索文字提取处理模块、商品链接提取模块和搜索特征词偏好指数解析模块连接,用于获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度;
标题匹配商品链接筛选模块,与商品链接标题名称匹配度分析模块连接,用于将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接;
展示图片匹配度分析模块,分别与标题匹配商品链接筛选模块、搜索文字提取处理模块和搜索特征词偏好指数解析模块连接,用于获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度;
目标商品链接筛选模块,与展示图片匹配度分析模块连接,用于将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的商品链接,并将筛选出的标题匹配商品链接记为目标商品链接;
目标商品链接排序显示模块,与目标商品链接筛选模块连接,用于根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
实施例3
本发明提供一种商品搜索存储介质,所述商品搜索存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种商品搜索方法。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。