CN115033799A - 一种商品搜索方法、系统及存储介质 - Google Patents

一种商品搜索方法、系统及存储介质 Download PDF

Info

Publication number
CN115033799A
CN115033799A CN202210785638.5A CN202210785638A CN115033799A CN 115033799 A CN115033799 A CN 115033799A CN 202210785638 A CN202210785638 A CN 202210785638A CN 115033799 A CN115033799 A CN 115033799A
Authority
CN
China
Prior art keywords
commodity
search
matching
title
links
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210785638.5A
Other languages
English (en)
Other versions
CN115033799B (zh
Inventor
杨梦林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yisenuo Digital Technology Co ltd
Original Assignee
Wuhan Liliqingchuan Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Liliqingchuan Network Technology Co ltd filed Critical Wuhan Liliqingchuan Network Technology Co ltd
Priority to CN202210785638.5A priority Critical patent/CN115033799B/zh
Publication of CN115033799A publication Critical patent/CN115033799A/zh
Application granted granted Critical
Publication of CN115033799B publication Critical patent/CN115033799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种商品搜索方法、系统及存储介质,通过从电商平台的搜索界面中提取目标用户输入的搜索文字,并对搜索文字进行处理,从中筛选出搜索主体和搜索特征词,并基于筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,进而分别对各条商品链接的标题名称和展示图片与搜索特征词进行匹配,从中筛选出标题名称匹配度和展示图片匹配度均符合预设阈值的商品链接,从而对筛选出的商品链接进行综合排序,实现了商品链接的双重筛选匹配,提高了筛选结果与搜索特征词的匹配度,有效降低了筛选出的商品标题名称与商品实物不符合的发生率,大大满足了用户需求,在一定程度上提升了用户的购物体验感。

Description

一种商品搜索方法、系统及存储介质
技术领域
本发明属于商品搜索技术领域,具体而言是一种商品搜索方法、系统及存储介质。
背景技术
随着网络时代的到来,计算机和互联网进入了千家万户,网络购物成为众多消费者首选的购物方式,各种电商平台如雨后春笋般涌现出来,人们已经习惯在电商平台进行商品搜索,以选择自己喜欢的商品进行购物。
目前电商平台的商品搜索模式是基于用户在搜索界面上输入的搜索文字确定用户需要搜索的商品名称和商品需求特征,进而从商品存储库中筛选出符合用户需要搜索商品名称和商品需求特征的商品链接,从而进行搜索结果显示,其中商品需求特征的筛选方式是基于商品链接的标题名称与商品需求特征的匹配度进行筛选,在实现本申请的过程中,发明人发现该筛选方式至少存在如下问题:
1.单独只根据商品链接的标题名称进行匹配,忽略了商品链接对应展示图片对筛选结果的影响,一般情况商品链接的展示图片都能够反映商品实物的状态,而商品链接的标题名称是卖家命名的,极有可能出现卖家为吸引用户偏好或以提高搜索排名为导向过度堆砌或美化标题名称,从而导致命名的标题名称与商品实物不符合,进而降低了筛选结果与商品需求特征的匹配度,致使搜索结果无法满足用户需求,从而影响用户的购物体验感。
2.当前该筛选方式在确定用户需要搜索商品对应的需求特征时,对提取的所有需求特征都平等对待,没有依据用户对各需求特征的偏好状况进行个性区分,进而导致在分析商品链接的标题名称与商品需求特征的匹配度过程中缺乏针对性,不够深入,从而导致筛选结果与用户的偏好迎合度不高。
发明内容
有鉴于此,本发明提供了一种商品搜索方法、系统及存储介质,来解决上述存在的技术问题,具体采用以下技术方案来实现。
第一方面,本发明提供一种商品搜索方法,包括以下步骤:
S1:从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
S2:根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
S3:基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数;
S4:根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,并将提取出的各条商品链接分别编号为1,2,...,i,...,n;
S5:分别获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度;
S6:将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接,同时记录各标题匹配商品链接的编号,可记为1,2,...,j,...,m;
S7:分别获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片分别与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度;
S8:将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的标题匹配商品链接,并将筛选出的标题匹配商品链接记为目标商品链接,同时记录目标商品链接的编号,可记为1,2,...,k,...,u;
S9:根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
在本发明第一方面的一种能够实现的方式中,所述S1中从搜索文字中筛选出搜索主体和搜索特征词对应的筛选步骤如下:
S11:将搜索文字进行分词处理,得到若干词组;
S12:将各词组进行词性标注,并从中提取词性为名词和修饰词的词组;
S13:从提取的词性为名词的词组中筛选出搜索主体,并从提取的词性为修饰词的词组中筛选出搜索特征词。
在本发明第一方面的一种能够实现的方式中,所述S3中基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数包括以下解析步骤:
S31:根据筛选出的搜索主体从目标用户对应的历史购物记录中识别出关联历史购物记录;
S32:从各条关联历史购物记录对应的商品展示图片中提取商品外形特征;
S33:将各条关联历史购物记录对应的商品外形特征分别与各搜索特征词进行匹配,由此统计各搜索特征词对应匹配成功的频次;
S34:将各搜索特征词对应匹配成功的频次导入偏好指数计算公式,由此计算出目标用户对搜索主体所属各搜索特征词的偏好指数,其中偏好指数计算公式为
Figure BDA0003728431920000041
在本发明第一方面的一种能够实现的方式中,所述S31中根据筛选出的搜索主体从目标用户对应的历史购物记录中识别出关联历史购物记录具体参照如下步骤:
S311:从各条历史购物记录中提取商品名称;
S312:将各条历史购物记录对应的商品名称与搜索主体进行对比,若某条历史购物记录对应的商品名称与搜索主体相同,则将该条历史购物记录记为关联历史购物记录。
在本发明第一方面的一种能够实现的方式中,所述计算各条商品链接对应的标题名称匹配度具体包括如下步骤:
S51:将各条商品链接对应的标题名称进行分词拆分,得到若干词组;
S52:将各条商品链接所属标题名称拆分的各词组进行去重处理,得到各单独词组,并对各条商品链接所属标题名称存在的各单独词组按照预设顺序进行编号;
S53:将各条商品链接所属标题名称存在的各单独词组分别与各搜索特征词进行匹配,统计匹配成功的单独词组数量,并将匹配成功的单独词组记为适配词组,此时获取各适配词组的编号,可记为1,2,...,a,...,l,同时记录各适配词组对应匹配成功的搜索特征词编号;
S54:基于各条商品链接所属标题名称中各适配词组对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条商品链接所属标题名称中各适配词组对应匹配成功搜索特征词的偏好指数,并将其作为各条商品链接所属标题名称中各适配词组对应的匹配权重系数;
S55:根据各条商品链接所属标题名称中适配词组的数量及各适配词组对应的匹配权重系数计算各条商品链接对应的标题名称匹配度,其计算公式为
Figure BDA0003728431920000051
TDi表示为第i条商品链接对应的标题名称匹配度,λai表示为第i条商品链接所属标题名称中第a个适配词组对应的匹配权重系数,li表示为第i条商品链接对应的适配词组数量,Yi表示为第i条商品链接对应的单独词组数量。
在本发明第一方面的一种能够实现的方式中,所述计算各条标题匹配商品链接对应的展示图片匹配度具体包括如下步骤:
S71:将各条标题匹配商品链接对应的展示图片进行商品外形特征提取,并将提取的各商品外形特征按照设定的顺序进行编号;
S72:将各条标题匹配商品链接所属展示图片的各商品外形特征分别与各搜索特征词进行匹配,统计匹配成功的商品外形特征数量,并将匹配成功的商品外形特征记为适配外形特征,此时获取各适配外形特征的编号,可记为1,2,...,b,...,h,同时记录各适配外形特征对应匹配成功的搜索特征词编号;
S73:基于各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功搜索特征词的偏好指数,并将其作为各条标题匹配商品链接所属标题名称中各适配外形特征对应的匹配权重系数;
S74:基于各条标题匹配商品链接所属展示图片对应的适配外形特征数量及各适配外形特征对应的匹配权重系数计算各条标题匹配商品链接对应的展示图片匹配度,其计算公式为
Figure BDA0003728431920000061
PDj表示为第j条标题匹配商品链接对应的展示图片匹配度,εbj表示为第j条标题匹配商品链接所属展示图片中第b个适配外形特征对应的匹配权重系数,hj表示为第j条标题匹配商品链接对应的适配外形特征数量,Xj表示为第j条标题匹配商品链接对应的商品外形特征数量。
在本发明第一方面的一种能够实现的方式中,所述各目标商品链接对应的综合匹配度评估公式为
Figure BDA0003728431920000071
Figure BDA0003728431920000072
表示为第k条目标商品链接对应的综合匹配度,A、B分别表示为标题名称匹配、展示图片匹配对应的占比系数,e表示为自然常数。
第二方面,本发明提供一种商品搜索系统,包括以下模块:
搜索文字提取处理模块,用于从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
历史购物记录提取模块,用于根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
搜索特征词偏好指数解析模块,用于基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数;
商品链接提取模块,用于根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接;
商品存储库,用于存储各商品名称对应的若干商品链接;
商品链接标题名称匹配度分析模块,用于获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度;
标题匹配商品链接筛选模块,用于将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接;
展示图片匹配度分析模块,用于获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度;
目标商品链接筛选模块,用于将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的商品链接,并将筛选出的标题匹配商品链接记为目标商品链接;
目标商品链接排序显示模块,用于根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
第三方面,本发明提供一种商品搜索存储介质,所述商品搜索存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种商品搜索方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
(1)本发明通过从电商平台的搜索界面中提取目标用户输入的搜索文字,并对搜索文字进行处理,从中筛选出搜索主体和搜索特征词,并基于筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,进而分别对各条商品链接的标题名称和展示图片与搜索特征词进行匹配,从中筛选出标题名称匹配度和展示图片匹配度均符合预设阈值的商品链接,从而对筛选出的商品链接进行综合排序,实现了商品链接的双重筛选匹配,提高了筛选结果与搜索特征词的匹配度,有效降低了筛选出的商品标题名称与商品实物不符合的发生率,大大满足了用户需求,在一定程度上提升了用户的购物体验感。
(2)本发明在筛选出搜索特征词后根据用户的历史购物记录解析出目标用户对搜索主体所属各搜索特征词的偏好指数,并据此对筛选出的搜索特征词进行个性区分,进而为后续分析商品链接的标题名称与搜索特征词的匹配度过程中提供针对性的匹配根据,深化了匹配过程,从而提高了筛选结果与用户的偏好迎合度。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明的方法实施步骤流程图;
图2为本发明的系统模块连接示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参照图1所示,第一方面,本发明提供一种商品搜索方法,包括以下步骤:
S1:从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
需要说明的是上述提到的搜索主体是指商品名称,搜索特征词是指用户需要搜索商品的需求特征,示例性地,若搜索主体为连衣裙,搜索特征词可以为颜色、材质、裙型、袖型等;
上述中搜索主体和搜索特征词对应的筛选步骤如下:
S11:将搜索文字进行分词处理,得到若干词组;
S12:将各词组进行词性标注,并从中提取词性为名词和修饰词的词组;
S13:从提取的词性为名词的词组中筛选出搜索主体,并从提取的词性为修饰词的词组中筛选出搜索特征词。
在一个具体实施例中,基于搜索文字中各词组的词性来确定搜索主体和搜索特征词的目的在于:搜索主体都是固定的名称,一般情况下是以名词为代表,而搜索特征词是用于修饰搜索主体的,一般情况下是以修饰词为代表,示例性地,若搜索文字为鱼尾型雪纺田园风连衣裙,其中搜索主体为连衣裙,“鱼尾型”、“雪纺”、“田园风”都是用于修饰连衣裙的,可作为搜索特征词;
S2:根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
S3:基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数,其解析步骤:
S31:根据筛选出的搜索主体从目标用户对应的历史购物记录中识别出关联历史购物记录,具体筛选过程参照如下步骤:
S311:从各条历史购物记录中提取商品名称;
S312:将各条历史购物记录对应的商品名称与搜索主体进行对比,若某条历史购物记录对应的商品名称与搜索主体相同,则将该条历史购物记录记为关联历史购物记录;
S32:从各条关联历史购物记录对应的商品展示图片中提取商品外形特征;
S33:将各条关联历史购物记录对应的商品外形特征分别与各搜索特征词进行匹配,由此统计各搜索特征词对应匹配成功的频次;
S34:将各搜索特征词对应匹配成功的频次导入偏好指数计算公式,由此计算出目标用户对搜索主体所属各搜索特征词的偏好指数,其中偏好指数计算公式为
Figure BDA0003728431920000111
其中某搜索特征词对应匹配成功的频次越多,该搜索特征词的偏好指数越大,表明该搜索特征词的权重越大;
本发明实施例在筛选出搜索特征词后根据用户的历史购物记录解析出目标用户对搜索主体所属各搜索特征词的偏好指数,并据此对筛选出的搜索特征词进行个性区分,进而为后续分析商品链接的标题名称与搜索特征词的匹配度过程中提供针对性的匹配根据,深化了匹配过程,从而提高了筛选结果与用户的偏好迎合度。
S4:根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,并将提取出的各条商品链接分别编号为1,2,...,i,...,n;
S5:分别获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度,具体包括如下步骤:
S51:将各条商品链接对应的标题名称进行分词拆分,得到若干词组;
S52:将各条商品链接所属标题名称拆分的各词组进行去重处理,得到各单独词组,并对各条商品链接所属标题名称存在的各单独词组按照预设顺序进行编号;
需要说明的是,本发明对各条商品链接所属标题名称拆分的各词组进行去重处理的原因在于:避免某些商品链接所属标题名称中一些词组重复出现导致匹配结果不准确情况的发生。
S53:将各条商品链接所属标题名称存在的各单独词组分别与各搜索特征词进行匹配,统计匹配成功的单独词组数量,并将匹配成功的单独词组记为适配词组,此时获取各适配词组的编号,可记为1,2,...,a,...,l,同时记录各适配词组对应匹配成功的搜索特征词编号;
S54:基于各条商品链接所属标题名称中各适配词组对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条商品链接所属标题名称中各适配词组对应匹配成功搜索特征词的偏好指数,并将其作为各条商品链接所属标题名称中各适配词组对应的匹配权重系数;
S55:根据各条商品链接所属标题名称中适配词组的数量及各适配词组对应的匹配权重系数计算各条商品链接对应的标题名称匹配度,其计算公式为
Figure BDA0003728431920000131
TDi表示为第i条商品链接对应的标题名称匹配度,λai表示为第i条商品链接所属标题名称中第a个适配词组对应的匹配权重系数,li表示为第i条商品链接对应的适配词组数量,Yi表示为第i条商品链接对应的单独词组数量,其中某条商品链接所属标题名称中适配词组的数量越多,各适配词组对应的匹配权重系数越大,该条商品链接对应的标题名称匹配度越大;
S6:将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接,同时记录各标题匹配商品链接的编号,可记为1,2,...,j,...,m;
S7:分别获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度,具体包括如下步骤:
S71:将各条标题匹配商品链接对应的展示图片进行商品外形特征提取,并将提取的各商品外形特征按照设定的顺序进行编号;
S72:将各条标题匹配商品链接所属展示图片的各商品外形特征分别与各搜索特征词进行匹配,统计匹配成功的商品外形特征数量,并将匹配成功的商品外形特征记为适配外形特征,此时获取各适配外形特征的编号,可记为1,2,...,b,...,h,同时记录各适配外形特征对应匹配成功的搜索特征词编号;
S73:基于各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功搜索特征词的偏好指数,并将其作为各条标题匹配商品链接所属标题名称中各适配外形特征对应的匹配权重系数;
S74:基于各条标题匹配商品链接所属展示图片对应的适配外形特征数量及各适配外形特征对应的匹配权重系数计算各条标题匹配商品链接对应的展示图片匹配度,其计算公式为
Figure BDA0003728431920000141
PDj表示为第j条标题匹配商品链接对应的展示图片匹配度,εbj表示为第j条标题匹配商品链接所属展示图片中第b个适配外形特征对应的匹配权重系数,hj表示为第j条标题匹配商品链接对应的适配外形特征数量,Xj表示为第j条标题匹配商品链接对应的商品外形特征数量,其中某条标题匹配商品链接所属展示图片中适配外形特征的数量越多,各适配外形特征对应的匹配权重系数越大,该条标题匹配商品链接对应的展示图片匹配度越大;
S8:将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的标题匹配商品链接,并将筛选出的标题匹配商品链接记为目标商品链接,同时记录目标商品链接的编号,可记为1,2,...,k,...,u;
S9:根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,其评估公式为
Figure BDA0003728431920000151
Figure BDA0003728431920000152
表示为第k条目标商品链接对应的综合匹配度,A、B分别表示为标题名称匹配、展示图片匹配对应的占比系数,e表示为自然常数,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
本发明实施例通过从电商平台的搜索界面中提取目标用户输入的搜索文字,并对搜索文字进行处理,从中筛选出搜索主体和搜索特征词,并基于筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,进而分别对各条商品链接的标题名称和展示图片与搜索特征词进行匹配,从中筛选出标题名称匹配度和展示图片匹配度均符合预设阈值的商品链接,从而对筛选出的商品链接进行综合排序,实现了商品链接的双重筛选匹配,提高了筛选结果与搜索特征词的匹配度,有效降低了筛选出的商品标题名称与商品实物不符合的发生率,大大满足了用户的搜索需求,在一定程度上提升了用户的购物体验感。
实施例2
参照图2所示,本发明提供一种商品搜索系统,包括以下模块:
搜索文字提取处理模块,用于从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
历史购物记录提取模块,用于根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
搜索特征词偏好指数解析模块,分别与搜索文字提取处理模块和历史购物记录提取模块连接,用于基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数;
商品链接提取模块,分别与搜索文字提取处理模块和商品存储库连接,用于根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接;
商品存储库,用于存储各商品名称对应的若干商品链接;
商品链接标题名称匹配度分析模块,分别与搜索文字提取处理模块、商品链接提取模块和搜索特征词偏好指数解析模块连接,用于获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度;
标题匹配商品链接筛选模块,与商品链接标题名称匹配度分析模块连接,用于将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接;
展示图片匹配度分析模块,分别与标题匹配商品链接筛选模块、搜索文字提取处理模块和搜索特征词偏好指数解析模块连接,用于获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度;
目标商品链接筛选模块,与展示图片匹配度分析模块连接,用于将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的商品链接,并将筛选出的标题匹配商品链接记为目标商品链接;
目标商品链接排序显示模块,与目标商品链接筛选模块连接,用于根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
实施例3
本发明提供一种商品搜索存储介质,所述商品搜索存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现本发明所述的一种商品搜索方法。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (9)

1.一种商品搜索方法,其特征在于,包括以下步骤:
S1:从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
S2:根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
S3:基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数;
S4:根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接,并将提取出的各条商品链接分别编号为1,2,...,i,...,n;
S5:分别获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度;
S6:将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接,同时记录各标题匹配商品链接的编号,可记为1,2,...,j,...,m;
S7:分别获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度;
S8:将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的标题匹配商品链接,并将筛选出的标题匹配商品链接记为目标商品链接,同时记录目标商品链接的编号,可记为1,2,...,k,...,u;
S9:根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
2.根据权利要求1所述的一种商品搜索方法,其特征在于:所述S1中从搜索文字中筛选出搜索主体和搜索特征词对应的筛选步骤如下:
S11:将搜索文字进行分词处理,得到若干词组;
S12:将各词组进行词性标注,并从中提取词性为名词和修饰词的词组;
S13:从提取的词性为名词的词组中筛选出搜索主体,并从提取的词性为修饰词的词组中筛选出搜索特征词。
3.根据权利要求1所述的一种商品搜索方法,其特征在于:所述S3中基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数包括以下解析步骤:
S31:根据筛选出的搜索主体从目标用户对应的历史购物记录中识别出关联历史购物记录;
S32:从各条关联历史购物记录对应的商品展示图片中提取商品外形特征;
S33:将各条关联历史购物记录对应的商品外形特征分别与各搜索特征词进行匹配,由此统计各搜索特征词对应匹配成功的频次;
S34:将各搜索特征词对应匹配成功的频次导入偏好指数计算公式,由此计算出目标用户对搜索主体所属各搜索特征词的偏好指数,其中偏好指数计算公式为
Figure FDA0003728431910000031
4.根据权利要求3所述的一种商品搜索方法,其特征在于:所述S31中根据筛选出的搜索主体从目标用户对应的历史购物记录中识别出关联历史购物记录具体参照如下步骤:
S311:从各条历史购物记录中提取商品名称;
S312:将各条历史购物记录对应的商品名称与搜索主体进行对比,若某条历史购物记录对应的商品名称与搜索主体相同,则将该条历史购物记录记为关联历史购物记录。
5.根据权利要求1所述的一种商品搜索方法,其特征在于:所述计算各条商品链接对应的标题名称匹配度具体包括如下步骤:
S51:将各条商品链接对应的标题名称进行分词拆分,得到若干词组;
S52:将各条商品链接所属标题名称拆分的各词组进行去重处理,得到各单独词组,并对各条商品链接所属标题名称存在的各单独词组按照预设顺序进行编号;
S53:将各条商品链接所属标题名称存在的各单独词组分别与各搜索特征词进行匹配,统计匹配成功的单独词组数量,并将匹配成功的单独词组记为适配词组,此时获取各适配词组的编号,可记为1,2,...,a,...,l,同时记录各适配词组对应匹配成功的搜索特征词编号;
S54:基于各条商品链接所属标题名称中各适配词组对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条商品链接所属标题名称中各适配词组对应匹配成功搜索特征词的偏好指数,并将其作为各条商品链接所属标题名称中各适配词组对应的匹配权重系数;
S55:根据各条商品链接所属标题名称中适配词组的数量及各适配词组对应的匹配权重系数计算各条商品链接对应的标题名称匹配度,其计算公式为
Figure FDA0003728431910000041
TDi表示为第i条商品链接对应的标题名称匹配度,λai表示为第i条商品链接所属标题名称中第a个适配词组对应的匹配权重系数,li表示为第i条商品链接对应的适配词组数量,Yi表示为第i条商品链接对应的单独词组数量。
6.根据权利要求1所述的一种商品搜索方法,其特征在于:所述计算各条标题匹配商品链接对应的展示图片匹配度具体包括如下步骤:
S71:将各条标题匹配商品链接对应的展示图片进行商品外形特征提取,并将提取的各商品外形特征按照设定的顺序进行编号;
S72:将各条标题匹配商品链接所属展示图片的各商品外形特征分别与各搜索特征词进行匹配,统计匹配成功的商品外形特征数量,并将匹配成功的商品外形特征记为适配外形特征,此时获取各适配外形特征的编号,可记为1,2,...,b,...,h,同时记录各适配外形特征对应匹配成功的搜索特征词编号;
S73:基于各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功的搜索特征词编号从目标用户对搜索主体所属各搜索特征词的偏好指数中提取各条标题匹配商品链接所属展示图片中各适配外形特征对应匹配成功搜索特征词的偏好指数,并将其作为各条标题匹配商品链接所属标题名称中各适配外形特征对应的匹配权重系数;
S74:基于各条标题匹配商品链接所属展示图片对应的适配外形特征数量及各适配外形特征对应的匹配权重系数计算各条标题匹配商品链接对应的展示图片匹配度,其计算公式为
Figure FDA0003728431910000051
PDj表示为第j条标题匹配商品链接对应的展示图片匹配度,εbj表示为第j条标题匹配商品链接所属展示图片中第b个适配外形特征对应的匹配权重系数,hj表示为第j条标题匹配商品链接对应的适配外形特征数量,Xj表示为第j条标题匹配商品链接对应的商品外形特征数量。
7.根据权利要求1所述的一种商品搜索方法,其特征在于:所述各目标商品链接对应的综合匹配度评估公式为
Figure FDA0003728431910000052
Figure FDA0003728431910000053
表示为第k条目标商品链接对应的综合匹配度,A、B分别表示为标题名称匹配、展示图片匹配对应的占比系数,e表示为自然常数。
8.一种商品搜索系统,其特征在于,包括以下模块:
搜索文字提取处理模块,用于从电商平台的搜索界面中提取目标用户输入的搜索文字,并从搜索文字中筛选出搜索主体和搜索特征词,同时统计搜索特征词的数量,进而将各搜索特征词进行编号;
历史购物记录提取模块,用于根据目标用户的账号从电商平台后台提取目标用户对应的历史购物记录;
搜索特征词偏好指数解析模块,用于基于目标用户的历史购物记录解析目标用户对搜索主体所属各搜索特征词的偏好指数;
商品链接提取模块,用于根据筛选的搜索主体从电商平台对应的商品存储库中提取出该搜索主体对应的若干商品链接;
商品存储库,用于存储各商品名称对应的若干商品链接;
商品链接标题名称匹配度分析模块,用于获取各条商品链接对应的标题名称,并将各条商品链接对应的商品标题名称与各搜索特征词进行匹配,计算各条商品链接对应的标题名称匹配度;
标题匹配商品链接筛选模块,用于将各条商品链接对应的标题名称匹配度与设置的标题名称匹配度阈值进行对比,从中筛选出大于标题名称匹配度阈值的商品链接,并将筛选出的商品链接记为标题匹配商品链接;
展示图片匹配度分析模块,用于获取各条标题匹配商品链接对应的展示图片,并将各条标题匹配商品链接对应的展示图片与各搜索特征词进行匹配,计算各条标题匹配商品链接对应的展示图片匹配度;
目标商品链接筛选模块,用于将各条标题匹配商品链接对应的展示图片匹配度与设置的展示图片匹配度阈值进行对比,从中筛选出大于展示图片匹配度阈值的商品链接,并将筛选出的标题匹配商品链接记为目标商品链接;
目标商品链接排序显示模块,用于根据各目标商品链接对应的标题名称匹配度和展示图片匹配度评估各目标商品链接对应的综合匹配度,进而将各目标商品链接按照综合匹配度由大到小的顺序进行排序,得到各目标商品链接的排序结果,并将其显示在电商平台的搜索结果界面。
9.一种商品搜索存储介质,其特征在于:所述商品搜索存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1-7任一项所述的方法。
CN202210785638.5A 2022-07-04 2022-07-04 一种商品搜索方法、系统及存储介质 Active CN115033799B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210785638.5A CN115033799B (zh) 2022-07-04 2022-07-04 一种商品搜索方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210785638.5A CN115033799B (zh) 2022-07-04 2022-07-04 一种商品搜索方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN115033799A true CN115033799A (zh) 2022-09-09
CN115033799B CN115033799B (zh) 2023-01-17

Family

ID=83127961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210785638.5A Active CN115033799B (zh) 2022-07-04 2022-07-04 一种商品搜索方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN115033799B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228342A (zh) * 2022-10-24 2023-06-06 广州麦乐数字科技有限公司 一种商品推荐方法、装置及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180210961A1 (en) * 2015-09-22 2018-07-26 Alibaba Group Holding Limited Information search method and apparatus
CN112102037A (zh) * 2020-09-16 2020-12-18 汤涛 一种基于大数据的直播电商平台商品内容智能推送管理系统
CN112381623A (zh) * 2020-12-04 2021-02-19 南京浪脆电子商务有限公司 一种基于大数据分析的电子商务平台商品智能推荐方法
CN112884558A (zh) * 2021-04-15 2021-06-01 武汉沃丰电子商务有限公司 基于特征识别和线上线下联动的电子商务平台商品数据库建立方法
CN113034238A (zh) * 2021-04-13 2021-06-25 武汉畅来电子商务有限公司 基于电子商务平台交易的商品品牌特征提取及智能推荐管理方法
CN113282834A (zh) * 2021-06-16 2021-08-20 武汉瑞通慧行电子商务有限公司 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180210961A1 (en) * 2015-09-22 2018-07-26 Alibaba Group Holding Limited Information search method and apparatus
CN112102037A (zh) * 2020-09-16 2020-12-18 汤涛 一种基于大数据的直播电商平台商品内容智能推送管理系统
CN112381623A (zh) * 2020-12-04 2021-02-19 南京浪脆电子商务有限公司 一种基于大数据分析的电子商务平台商品智能推荐方法
CN113034238A (zh) * 2021-04-13 2021-06-25 武汉畅来电子商务有限公司 基于电子商务平台交易的商品品牌特征提取及智能推荐管理方法
CN112884558A (zh) * 2021-04-15 2021-06-01 武汉沃丰电子商务有限公司 基于特征识别和线上线下联动的电子商务平台商品数据库建立方法
CN113282834A (zh) * 2021-06-16 2021-08-20 武汉瑞通慧行电子商务有限公司 基于移动互联网数据深度挖掘的网页搜索智能排序方法、系统和计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张俊伟等: "基于文本挖掘的商品推荐", 《哈尔滨商业大学学报(自然科学版)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228342A (zh) * 2022-10-24 2023-06-06 广州麦乐数字科技有限公司 一种商品推荐方法、装置及计算机可读存储介质
CN116228342B (zh) * 2022-10-24 2024-02-06 广州麦乐数字科技有限公司 一种商品推荐方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN115033799B (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
CA2423033C (en) A document categorisation system
CN112102037B (zh) 一种基于大数据的直播电商平台商品内容智能推送管理系统
CN110825877A (zh) 一种基于文本聚类的语义相似度分析方法
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
CN110489523B (zh) 一种基于网购评价的细粒度情感分析方法
CN111191022A (zh) 商品短标题生成方法及装置
CN106096609B (zh) 一种基于ocr的商品查询关键字自动生成方法
CN112015721A (zh) 一种基于大数据的电商平台存储数据库的优化方法
EP1590798A2 (en) Method for automatic and semi-automatic classification and clustering of non-deterministic texts
CN110287341B (zh) 一种数据处理方法、装置以及可读存储介质
CN113159881B (zh) 一种数据聚类及b2b平台客户偏好获取方法、系统
CN108734159A (zh) 一种图像中敏感信息的检测方法及系统
TWI645348B (zh) 商品相關網路文章之自動圖文摘要方法及系統
CN110287314A (zh) 基于无监督聚类的长文本可信度评估方法及系统
CN110489649A (zh) 标签关联内容的方法及装置
CN110866102A (zh) 检索处理方法
CN115033799B (zh) 一种商品搜索方法、系统及存储介质
CN112749330A (zh) 信息推送方法、装置、计算机设备和存储介质
CN113722443B (zh) 一种融合文本相似度和协同过滤的标签推荐方法和系统
CN112784056B (zh) 一种基于视频智能识别及智能语义搜索的短视频生成方法
CN115470322B (zh) 一种基于人工智能的关键词生成系统及方法
CN111339428A (zh) 基于受限玻尔兹曼机驱动的交互式个性化搜索方法
CN114511027B (zh) 通过大数据网络进行英语远程数据提取方法
CN115270790A (zh) 一种基于大数据的样本标识方法、设备及介质
CN114996571A (zh) 一种信息推送方法及装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230104

Address after: Room 1704, Building 12, University Science Park, No. 279, West Third Ring Road, Zhengzhou Hi tech Industrial Development Zone, 450000 Henan Province

Applicant after: Zhengzhou Yisino Information Technology Co.,Ltd.

Address before: No. 164, Fazhan Avenue, Jianghan District, Wuhan, Hubei 430021

Applicant before: Wuhan liliqingchuan Network Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240701

Address after: Room 1702, Building 12, University Science and Technology Park, No. 279 West Third Ring Road, Zhengzhou High tech Industrial Development Zone, Henan Province, 450000

Patentee after: Zhengzhou Yisenuo Digital Technology Co.,Ltd.

Country or region after: China

Address before: Room 1704, Building 12, University Science Park, No. 279, West Third Ring Road, Zhengzhou Hi tech Industrial Development Zone, 450000 Henan Province

Patentee before: Zhengzhou Yisino Information Technology Co.,Ltd.

Country or region before: China