CN111597219B - 一种基于关系属性的搜索方法及系统 - Google Patents
一种基于关系属性的搜索方法及系统 Download PDFInfo
- Publication number
- CN111597219B CN111597219B CN202010438912.2A CN202010438912A CN111597219B CN 111597219 B CN111597219 B CN 111597219B CN 202010438912 A CN202010438912 A CN 202010438912A CN 111597219 B CN111597219 B CN 111597219B
- Authority
- CN
- China
- Prior art keywords
- part number
- user
- result
- product
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于关系属性的搜索方法及系统,通过成套系统制造商提供的零件目录,提取和归纳出从属性和相邻性数据关系链,并据此构建零件号索引数据库,在用户以关系属性为日常表达习惯使用搜索时,先通过系统检索和确认产品的零件号,再通过零件号精准匹配到能满足用户可替代性或可互换性需求的结果;而无需用户具备艰深的专业知识和技能,以解决现有技术中由于关系属性数据的缺失,搜索只能推荐以置信度为依据的可能性结果,导致用户不得不在缺乏专业知识的情况下,面对无从选择的尴尬局面,进而造成无法达成交易的后果。当用户直接输入零件号时,可直接通过零件号精准匹配到能满足用户可替代性或可互换性需求的结果。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及应用于垂直专业领域的一种基于关系属性的搜索方法及系统。
背景技术
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。本申请涉及到的搜索方法,是介于垂直搜索引擎和目录搜索引擎之间,依赖于对目录搜索数据的预处理,来支持对相应专业垂直领域的数据进行快速检索的一种专业搜索方式。
随着互联网快速向细分领域发展,传统搜索引擎基于统计学的排名技术已不能满足专业垂直领域的搜索需求。在专业垂直领域成套系统(如机械设备、机动车辆等)的售后市场,为维持成套系统的正常运转,需要对成套系统进行例行保养和维护,而保养维护所用的零部件需要与原组装所用的零部件之间须具有可替代性或可互换性。因此,用户搜索是为了检索到能满足可替代性或可互换性需求的零部件。如果以产品的外观、安装尺寸、连接尺寸、技术参数和性能参数等专业数据来判断搜索结果是否满足可替代性或可互换性的需求,需要用户掌握多技术领域、非常艰深的专业知识,但用户往往缺乏相应的知识和技能,无法直接从传统搜索引擎的搜索结果中判断哪个结果能满足可替代性或可互换性的需求。
在专业垂直领域售后市场的线下交易场景,用户是通过检索成套系统制造商提供的零件目录,通过目录检索查到对应的产品零件号(产品唯一识别代码),并依据零件号来查找对应产品。在成套系统制造商提供的零件目录中,为便于使用者查询,零件目录会按品牌、型号(版本号)、系统、子系统、总成及零部件等严格的层级关系呈现,同时对不同零部件之间的替代性和互换性关系,会以零件号为唯一识别特征做明确的记载。因此,专业人员通过传统零件目录的检索,能保证做到满足可替代性或可互换性的需求,并据此最终完成交易。
在长期的生产实践中,用户形成了以直观的关系属性即从属关系和相邻关系来表达对产品可替代性或可互换性需求的习惯。一旦某一产品作为零部件被组装进入某一专业垂直领域的成套系统,就客观上与该成套系统的品牌、型号、系统、总成等之间形成从属关系,并与邻近组装的零部件构成相邻关系,通过关系属性能准确表达可替代性或可互换性的需求。在用户与商家的线下需求沟通过程中,用户习惯凭直觉以上述关系属性来表达需求,即以“**品牌、**型号、**(零件名称)”来描述所需的零部件,所以,这种表达习惯很自然地被带到线上交易场景。
但现有搜索技术没有对成套系统制造商提供的零件目录中的数据进行预处理,未能提取、归纳和预置零部件从属关系和相邻关系的零件号索引数据库,因而无法获取和精准解读出以关系属性表达所对应的产品零件号,因此无法准确的匹配和输出满足用户可替代性或可互换性需求的搜索结果,从而导致线上交易无法完成。
以电子商务为例,用户希望通过搜索获得所需产品的相关信息并完成交易。从计算机数据处理的过程来看,通常包括以下过程:计算机针对用户搜索需求给出产品反馈信息,用户查看产品相关信息并确定交易,计算机依据用户指示完成交易(上述过程可能涉及到一些线下过程)。
上述数据处理过程中,当用户缺乏艰深的专业知识,无法从搜索输出产品信息的结果排序中,判断和选择满足可替代性或可互换性需求的结果,仍需要借助于人工客服。由于一个垂直专业领域往往涉及机械、电子、液压、气动、制冷等不同技术领域,因而人工客服不可能同时具备这些技术领域的专业知识和技能,从而造成交易的中断和商机的流失。
迫切需要本领域专业技术人员解决的问题是:如何根据用户使用搜索时的表达习惯,依据用户所表达的关系属性,模拟线下交易场景的思维和解决方式,先通过搜索系统检索和确认产品的零件号,再通过零件号来实现精准匹配,推荐能满足可替代性或可互换性需求的结果,以帮助线上交易的达成。
发明内容
本发明目的就是为了弥补已有技术的缺陷,提供一种基于关系属性的搜索方法及系统,通过成套系统制造商提供的零件目录,提取和归纳出从属性和相邻性数据关系链,并据此构建零件号索引数据库,在用户以关系属性为日常表达习惯使用搜索时,先通过系统检索和确认产品的零件号,再通过零件号精准匹配到能满足用户可替代性或可互换性需求的结果;而无需用户具备艰深的专业知识和技能,以解决现有技术中由于关系属性数据的缺失,搜索只能推荐以置信度为依据的可能性结果,导致用户不得不在缺乏专业知识的情况下,面对无从选择的尴尬局面,进而造成无法达成交易的后果。
本发明是通过以下技术方案实现的:
一种基于关系属性的搜索方法,具体包括以下步骤:
基于零部件之间的关系属性,构建能反映零部件从属关系与相邻关系的零件号索引数据库;
根据用户可能错误录入的同音字、词,笔误、俗称、别称以及错别字等,以及品牌特有产品序列代码建立关联词典,其作用是保证即使在用户输入包含专名的搜索字符串时输入别名或出现笔误的情况下,也可以得出准确的输出结果;
将零部件的品牌、型号、系统名称、总成名称、零件名称和零件号等数据提取出来,按层级收录,构建形成专名词典;
收录商户逐个上传或批量上传的商品数据,建立商品数据库,或对接商户库存管理软件中包含零件号的产品数据;
将用户输入的查询词串根据预置词典进行分词处理;
将处理结果与零件号索引数据库进行检索匹配;
对匹配结果进行处理并输出包含零件号的结果;
通过输出结果中的零件号这个零部件唯一标识查询商品数据库或商户库存管理软件中包含零件号的产品数据;
输出与搜索所得零件号匹配一致的商品;
具体的搜索过程包括:
接收用户端的查询词串;
对所述查询词串根据预置词典进行分词处理;
将处理结果与零件号索引数据库进行检索匹配;
对匹配结果进行处理并输出包含零件号的结果,供用户选择和确认;
根据用户选择和确认的结果所对应的零件号来匹配商品库中商品;
输出与搜索所得零件号匹配一致的商品。
所述的查询词串是用户以关系属性为日常表达习惯,即以“**品牌、**型号、**(零件名称)”,来表述须能适配于“**品牌、**型号”成套系统的“**(零件名称)”,并满足可替代性和可互换性的搜索需求;所述的关系属性是针对专业垂直领域售后市场,在某一产品作为零部件被组装进入专业垂直领域的成套系统后,与该成套系统的品牌、型号、系统名称、总成名称、零件名称和零件号之间形成从属关系,并与邻近组装的零部件构成相邻关系;通过关系属性来表达可替代性或可互换性的需求;基于零部件之间的关系属性,构建反映零部件从属关系与相邻关系的零件号索引数据库。
所述的预置词典包括专名词典和关联词典,其中专名词典是将零部件的品牌、型号、系统名称、总成名称、零件名称和零件号数据提取出来,按层级收录,构建形成所述的专名词典;关联词典是根据用户输入包含专名的搜索字符串时可能错误录入的同音字、词、笔误、俗称、别称、错别字以及品牌特有产品序列代码建立,保证即使在用户输入别名或出现笔误的情况下,也可以得出准确的输出结果。
收录商户逐个上传或批量上传的商品数据,建立所述的商品数据库,或对接商户库存管理软件中包含零件号的产品数据。
所述输出包含零件号的结果,是结果输出的首次输出,展示的是零部件关系属性信息以及零部件对应的零件号,其中零件号是某一产品作为零部件被组装进入专业垂直领域的成套系统后,由成套系统制造商根据一定的编码规则给该产品设定的唯一识别代码,输出包含零件号的结果,是供用户确认可替代性和可互换性需求是否得到满足。
所述根据对应的零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据,是在首次输出包含零件号的结果并经用户确认后的最终结果输出,输出的是满足可替代性和可互换性的商品列表,展示信息为商品属性信息,以供用户做最终交易决策。所述根据零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据,是在用户直接输入零件号进行搜索时,直接输出是满足可替代性和可互换性的商品列表。
一种基于关系属性的搜索系统,包括:
搜索数据初始化模块,用于对原数据进行清洗处理,构建零件号索引数据库,完成基础数据的导入;
搜索词串获取模块,用于接收用户端文字、语音输入得到的字串;
搜索词串处理模块,用于对搜索字串进行纠错及中文分词处理;
搜索匹配模块,用于将分词处理得到的结果与零件号索引数据库做检索匹配,再与商品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配,匹配过程分两个环节执行,先将分词处理得到的结果与零件号索引数据库做检索匹配,得到包含零件号的结果,再将用户选择和确认的零部件结果所对应的零件号来与商品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配;
搜索结果处理模块,用于将上述符合输出标准的数据进行去重、排序处理;
搜索结果输出模块用于展示零部件关系属性和产品匹配结果,分为一次输出和二次输出两种情况:一次输出是当用户直接输入零件号进行搜索,直接输出满足可替代性和可互换性的商品列表,展示信息为商品属性信息;二次输出是当用户以关系属性表达时,首先输出满足可替代性和可互换性的零件列表,展示的是零部件关系属性信息以及零部件对应的零件号,以供用户确认可替代性和可互换性需求是否得到满足,在用户确认后再输出商品列表,展示信息为商品属性信息,以供用户做最终交易决策。
上述搜索结果输出过程中,前后两次结果的关系是通过零件号这个零部件唯一标识,检索商品数据库或商户库存管理软件中包含零件号的产品数据,最终输出与搜索需求对应、前后零件号一致、且满足可替换性或可互换性的商品列表。
本发明的优点是:
本发明引入了该成套系统制造商已客观形成的品牌、型号、版本号、系统、总成及零件名称等纵向从属性关系链,以及零部件邻近安装组合形成的相邻关系链,从而在用户根据日常表达习惯来搜索时得到的产品结果数据,能保证任何一个结果都能满足可替代性或可互换性的需求,而无需用户依据产品的外观、安装尺寸、连接尺寸、技术参数和性能参数等专业数据来判断搜索结果是否满足可替代性或可互换性的需求。
为了保证搜索时得到产品结果能满足用户可替代性或可互换性的需求,搜索时须先检索零件号索引数据库,找出满足搜索词串表述的从属关系和相邻关系的零部件名称以及所对应的零件号,再根据零件号这一产品唯一识别代码去匹配产品。
为了简化搜索流程,当用户直接输入零件号进行搜索时,可直接输出满足可替代性或可互换性的商品列表,能保证任何一个结果都能满足用户需求。
由于零件号是产品唯一标识,通过零件号来匹配和识别产品,无须借助产品外观、安装尺寸、连接尺寸、技术参数和性能参数等来判断是否能满足可替代性或可互换性需求,因此商户可按系统提供的Excel表格模板批量上传商品数据,或提供数据接口授权系统调取商户存货管理软件中可公开向用户展示、包含零件号的产品数据,而无需经过繁琐的商品逐个上架的过程。
附图说明
图 1 是本发明方法的流程示意图;
图 2 是本发明系统的结构示意图。
具体实施方式
本申请的核心思想是满足用户对零部件的可替代性或可互换性需求,在以直觉习惯的关系特征表达时,仍能实现精准检索,先获得产品的唯一识别代码-零件号,再依据零件号来准确匹配产品。
如图1所示,一种基于关系属性的搜索方法,具体包括以下步骤:
接收用户端的查询词串;
对所述查询词串根据预置词典进行分词处理;
将分词处理结果与零件号索引数据库进行检索匹配;
对匹配结果进行处理并输出包含零件号的结果,供用户选择和确认;
根据用户选择和确认的结果所对应的零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据;
输出与搜索所得零件号匹配一致的商品。
所述的查询词串是用户以关系属性为日常表达习惯,,即以“**品牌、**型号、**(零件名称)”,来表述须能适配于“**品牌、**型号”成套系统的“**(零件名称)”,并满足可替代性和可互换性的搜索需求;所述的关系属性是针对专业垂直领域售后市场,在某一产品作为零部件被组装进入专业垂直领域的成套系统后,与该成套系统的品牌、型号、系统名称、总成名称、零件名称和零件号之间形成从属关系,并与邻近组装的零部件构成相邻关系;通过关系属性来表达可替代性或可互换性的需求;基于零部件之间的关系属性,构建反映零部件从属关系与相邻关系的零件号索引数据库。
所述的预置词典包括专名词典和关联词典,所述的专名词典是将零部件的品牌、型号、系统名称、总成名称、零件名称和零件号数据提取出来,按层级收录,构建形成所述的专名词典;所述关联词典是根据用户输入包含专名的搜索字符串时可能错误录入的同音字、词、笔误、俗称、别称、错别字以及品牌特有产品序列代码建立,保证即使在用户输入别名或出现笔误的情况下,也可以得出准确的输出结果。
收录商户逐个上传或批量上传的商品数据,建立所述的商品数据库,或对接商户库存管理软件中包含零件号的产品数据。
所述输出包含零件号的结果,是结果输出的首次输出,展示的是零部件关系属性信息以及零部件对应的零件号,其中零件号是某一产品作为零部件被组装进入专业垂直领域的成套系统后,为便于识别,由成套系统制造商根据一定的编码规则给该产品设定的唯一识别代码,输出包含零件号的结果,是供用户能方便的确认可替代性和可互换性需求是否得到满足。
所述根据对应的零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据,是在首次输出包含零件号的结果并经用户确认后的最终结果输出,输出的是满足可替代性和可互换性的商品列表,展示信息为商品属性信息,以供用户做最终交易决策。所述根据零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据,是在用户直接输入零件号进行搜索时,直接输出是满足可替代性和可互换性的商品列表。
如图2所示,一种基于关系属性的搜索系统,包括:
搜索数据初始化模块1,用于对原数据进行清洗处理,构建零件号索引数据库,完成基础数据的导入;
搜索词串获取模块2,用于接收用户端文字、语音输入得到的字串;
搜索字串处理模块3,用于对搜索字串进行纠错及中文分词处理;
搜索匹配模块4,用于将分词处理得到的结果与零件号索引数据库做检索匹配,得到包含零件号的搜索结果,再将用户选择和确认的零部件结果所对应的零件号来与商品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配。如果用户直接输入零件号进行搜索,则不再与零件号索引数据库做检索匹配,而是直接将零件号来与商品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配;
搜索结果处理模块5,用于将上述符合输出标准的数据进行去重、排序处理;
搜索结果输出模块6,用于展示零部件关系属性和产品匹配结果。
所述搜索数据初始化模块1,是对成套系统制造商提供的零件目录进行数据处理,提取、归纳和预置零部件从属关系和相邻关系的零件号索引数据库。
所述搜索匹配模块4,匹配过程分两个环节执行,先将分词处理得到的结果与零件号索引数据库做检索匹配,得到包含零件号的搜索结果,再将用户选择和确认的零部件结果所对应的零件号来与商品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配。
所述搜索结果输出模块6分为一次输出和二次输出两种情况:一次输出是当用户直接输入零件号进行搜索,直接输出满足可替代性和可互换性的商品列表,展示信息为商品属性信息;二次输出是用户以关系属性表达时,首先输出满足可替代性和可互换性的零件列表,展示的是零部件关系属性信息以及零部件对应的零件号,以供用户确认可替代性和可互换性需求是否得到满足;在用户确认后再输出商品列表,展示信息为商品属性信息,以供用户做最终交易决策。
在本发明系统接收用户查询词串之前,还包括:
搜索数据的初始化,包括源数据获取、数据清洗以及构建数据库;
产品从属的零件目录数据库的基础数据,来源于厂家公开的零件手册、EPC系统、PDF版零件手册等;
产品的商品属性,包括产品外观、安装尺寸、连接尺寸、技术参数和性能参数,以及用于识别零部件的零件号等数据来源于商家自行录入;
将已提取的零件数据进行归类处理,划为七个维度,分别为:品牌、型号、系统、底级子系统、总成、零件名称、零件号;
其中上述“零件号”是指各品牌型号下原零件目录中产品的唯一识别代码;
上述“系统”是指各品牌、型号下原零件目录中的第一级目录;
上述“底级子系统”是指各品牌、型号下原零件目录中最后一级子目录;
上述“总成”是指各品牌型号的零件目录中,由零部件组成、能独立实现特定功能,在零件名称中含有“总成””字样的零部件统称。
根据市场实际需求,本搜索引擎需对市场上各品牌成套系统在售型号和代际,以及向前延伸若干代际的数据进行提取、归纳和整理;
对已得到的数据进行数据清洗,其中包括系统纠错、人工纠错、翻译纠错等;
所述系统纠错部分,是通过“关联词典”对笔误、别名进行纠错和关联,其中包括“易错字词典”、 “别名词典”等,其作用是保证即使在用户输入包含专名的搜索字符串时出现笔误、别名的情况下,也可以得出准确的输出结果;
所述“易错字词典”是通过对用户可能录入的同音字、词,笔误、错别字等, 以及品牌特有产品序列代码内容的收集分析形成;
所述“别名词典”是为了解决同一零件号对应的产品在不同型号、系统中名称不同,以及对针对产品在市场上有多种通俗叫法,与零件目录中的产品名称不能直接对应的问题,此数据库是通过对别名、俗称的收集分析形成;
所述人工纠错部分,是针对零件手册的字符缺失以及错行错字问题等;
所述翻译纠错部分,是针对计算机批量翻译与原始人工翻译结果发生冲突时,以原始人工翻译为准的数据处理策略;
基于产品之间的关系特征,在构建能反映产品从属(层级)关系与相邻关系的零件号索引数据库时,将品牌、型号、系统名称、总成名称、零件名称和零件号按层级收录,再分别构建 “品牌”、“型号”、“系统”、“底级子系统”、“总成”、“零件名称”、“零件号”数据库以及对应的词典;
所述词典用于解决中文分词时的专名识别;
所述零件号索引数据库用来做中文分词后的数据检索;
进一步地,具体的搜索过程如下:
当用户有搜索产品的需求时,向搜索引擎以习惯的表述方式,录入能反映关系特征需求的语音或文字;
搜索引擎首先接收用户录入的语音和文字(即查询字串),并对此查询词串与预置词典进行分词;
上述搜索引擎中接收的查询字串为语音时,系统会将其转化为文字;
将分词处理得到的结果与零件号索引数据库做检索匹配,匹配规则为,优先进行“专名识别”,其次进行“动态匹配”,最后进行“模糊匹配”;
“专名识别”与预置词典中专名词典进行多维度的检索与匹配,匹配的顺序为:零件号词典、品牌词典、型号词典、系统词典、底级子系统词典、总成词典、零件名称词典,同时与关联词典中“易错字词典”、 “别名词典”匹配,即与零件号词典、品牌词典、型号词典、系统词典、底级子系统词典、总成词典、零件名称词典对应的易错字和别名进行多维度的检索与匹配;
“专名识别”能检索和匹配到对应的零件时,输出结果为包含零件号的零件列表,且以输出精准、唯一结果为目标;
当“专名识别”不能检索和匹配到对应的零件时,继续进行“动态匹配”;
所述“动态匹配”是指同时匹配数据库中的三个库,分别为:底级子系统库、总成库、商品名称库;
其中,在相关性评分的不同区间:评分高>评分低,即评分高的结果将优先显示;
匹配的评分范围为30-100分,共分为8个区间,分别为100、[90,100)、[80-90)、[70-80)、[60-70)、[50-60)、[40-50)、[30-40),每10分为一个区间,最高分为100分,最低分为30分,<30分的按模糊匹配规则执行;
在相同相关性评分区间:按照自然语言的顺序排列;
所述“模糊匹配”是指按照品牌(40%)、型号(30%)、产品名称(30%)来分配权重,再依据相关性评分加权后由高到低排序;
在此方法中,用户只需具备基本的机械常识,不必经过专业训练, 就可以根据常识来判断和识别,完成零件号的检索环节。
所述搜索算法是对搜索关键词进行分析,确定内容中的句法结构或者句子中词汇之间的依存关系,结合预置词典将搜索关键词拆分、替换、补充,分别确定品牌、型号、系统名称、总成名称、零部件名称和零件号,用确定的参数匹配产品目录数据库,获取匹配度最高的搜索结果。
为减少重复性的搜索结果,降低用户搜索成本,需要对数据进行去重处理;
所述“去重”分为零件号去重、底级子系统去重和无零件号的关联特征去重;
所述“零件号去重”是指当搜索结果的零件号相同时,仅保留其中一个;
所述“底级子系统去重”是针对不同版本的同一个底级子系统数据相同时,则保留高版本的结果;
判断同一个底级子系统的数据是否相同,是通过比较产品列表中的内容(序号+零件号+数量),当所属内容相同时,则仅保留高版本的结果;
所述无零件号的关联特征去重是指可根据该零件所从属关联的、显示的零件号的上一级零部件,来比对零件号进行去重;
为使搜索结果更加精准、规范,对出现能满足可替代性或可互换性需求的多个结果时,还需对符合上述条件后输出的数据进行排序处理;
在列表页,仅显示产品的简略信息,包括从属的:品牌、名称(分为零件名、总成、底级子系统)、零件号、所属系统、所属型号、适配车号、装配关系略图等信息;
在详情页,显示产品的详细信息,包括:产品名称(别名)、零件号、所属型号、所属系统、适配系统、版本号、适配车号、零件表、装配关系图等;
通过上述搜索流程,辅之产品邻近安装组合形成的装配关系图中所示相邻关系,用户仅通过常识加以判断,便可识别出所需零部件以及零部件对应零件号;
最后通过零件号这一零部件的唯一识别代码,对商品数据库或商户库存管理软件中包含零件号的产品数据进行检索,得到目标商品列表。
Claims (4)
1.一种基于关系属性的搜索方法,其特征在于:具体包括以下步骤:
接收用户端的查询词串;
对所述查询词串根据预置词典进行分词处理;
将分词处理结果与零件号索引数据库进行检索匹配;
对匹配结果进行处理并输出包含零件号的结果,供用户选择和确认;
根据用户选择和确认的结果所对应的零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据;
输出与搜索所得零件号匹配一致的商品;
所述的查询词串是用户以关系属性为日常表达习惯,并满足可替代性和可互换性的搜索需求;所述的关系属性是针对专业垂直领域售后市场,在某一产品作为零部件被组装进入专业垂直领域的成套系统后,与该成套系统的品牌、型号、系统名称、总成名称、零件名称和零件号之间形成从属关系,并与邻近组装的零部件构成相邻关系;通过关系属性来表达可替代性或可互换性的需求;基于零部件之间的关系属性,构建反映零部件从属关系与相邻关系的零件号索引数据库;
所述的预置词典包括专名词典和关联词典,其中专名词典是将零部件的品牌、型号、系统名称、总成名称、零件名称和零件号数据提取出来,按层级收录,构建形成所述的专名词典;关联词典是根据用户输入包含专名的搜索字符串时可能错误录入的同音字、词、笔误、俗称、别称、错别字以及品牌特有产品序列代码建立,保证即使在用户输入别名或出现笔误的情况下,也可以得出准确的输出结果;
所述输出包含零件号的结果,是结果输出的首次输出,展示的是零部件关系属性信息以及零部件对应的零件号,其中零件号是某一产品作为零部件被组装进入专业垂直领域的成套系统后,由成套系统制造商根据一定的编码规则给该产品设定的唯一识别代码,输出包含零件号的结果,是供用户确认可替代性和可互换性需求是否得到满足;
所述根据对应的零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据,是在首次输出包含零件号的结果并经用户确认后的最终结果输出,输出的是满足可替代性和可互换性的商品列表,展示信息为商品属性信息,以供用户做最终交易决策;所述根据零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据,是在用户直接输入零件号进行搜索时,直接输出是满足可替代性和可互换性的商品列表。
2.根据权利要求1所述的一种基于关系属性的搜索方法,其特征在于:收录商户逐个上传或批量上传的商品数据,建立所述的商品数据库,或通过商户提供的数据接口调取所述商户库存管理软件中包含零件号的产品数据。
3.一种基于关系属性的搜索系统,其特征在于:包括:
搜索数据初始化模块,用于对原数据进行清洗处理,构建零件号索引数据库,完成基础数据的导入;
搜索词串获取模块,用于接收用户端文字、语音输入得到的字串;
搜索词串处理模块,用于对搜索字串进行纠错及中文分词处理;
搜索匹配模块,用于将分词处理得到的结果与零件号索引数据库做检索匹配,得到包含零件号的搜索结果,再将用户选择和确认的零部件结果所对应的零件号来与商品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配;
搜索结果处理模块,用于将用户选择和确认的零部件结果所对应的零件号来与商品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配后得到的符合输出标准的数据进行去重、排序处理;
搜索结果输出模块,用于展示零部件关系属性和产品匹配结果;
所述搜索数据初始化模块,是对成套系统制造商提供的零件目录进行数据处理,提取、归纳和预置零部件从属关系和相邻关系的零件号索引数据库;
所述搜索结果输出模块分为两次输出:首先输出满足可替代性和可互换性的零件列表,展示的是零部件关系属性信息以及零部件对应的零件号,以供用户确认可替代性和可互换性需求是否得到满足;在用户确认后再输出商品列表,展示信息为商品属性信息,以供用户做最终交易决策;
所述的关系属性是针对专业垂直领域售后市场,在某一产品作为零部件被组装进入专业垂直领域的成套系统后,与该成套系统的品牌、型号、系统名称、总成名称、零件名称和零件号之间形成从属关系,并与邻近组装的零部件构成相邻关系;通过关系属性来表达可替代性或可互换性的需求;基于零部件之间的关系属性,构建反映零部件从属关系与相邻关系的零件号索引数据库;
所述的零件号是某一产品作为零部件被组装进入专业垂直领域的成套系统后,由成套系统制造商根据一定的编码规则给该产品设定的唯一识别代码。
4.根据权利要求3所述一种基于关系属性的搜索系统,其特征在于:所述搜索匹配模块,匹配过程分两个环节执行,先将分词处理得到的结果与零件号索引数据库做检索匹配,得到包含零件号的搜索结果,再将用户选择和确认的零部件结果所对应的零件号来与商品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010438912.2A CN111597219B (zh) | 2020-05-22 | 2020-05-22 | 一种基于关系属性的搜索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010438912.2A CN111597219B (zh) | 2020-05-22 | 2020-05-22 | 一种基于关系属性的搜索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111597219A CN111597219A (zh) | 2020-08-28 |
CN111597219B true CN111597219B (zh) | 2021-12-10 |
Family
ID=72192498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010438912.2A Active CN111597219B (zh) | 2020-05-22 | 2020-05-22 | 一种基于关系属性的搜索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111597219B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559710A (zh) * | 2020-12-22 | 2021-03-26 | 鲁班(北京)电子商务科技有限公司 | 一种物料信息查询方法及查询装置 |
CN114547064B (zh) * | 2021-12-31 | 2023-07-07 | 广州万物集工业互联网科技有限公司 | 一种产品搜索方法、系统、计算机设备及可读存储介质 |
CN115757699B (zh) * | 2022-11-19 | 2023-07-25 | 深圳市宁远科技股份有限公司 | 基于模糊匹配的医疗平台智能用户实体搜索系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794309A (zh) * | 2010-03-04 | 2010-08-04 | 上海天呈科技有限公司 | 一种交互式商品分类和检索方法 |
US20150032728A1 (en) * | 2007-03-30 | 2015-01-29 | Ryan Rozich | System and method of generating a set of search results |
CN105786886A (zh) * | 2014-12-25 | 2016-07-20 | 上海通用汽车有限公司 | 车辆维修目录系统 |
CN106997390A (zh) * | 2017-04-05 | 2017-08-01 | 安徽机器猫电子商务股份有限公司 | 一种设备配件或零部件商品交易信息搜索方法 |
CN108153889A (zh) * | 2017-12-28 | 2018-06-12 | 深圳开思时代科技有限公司 | 汽车配件查询方法及系统、电子设备和介质 |
CN108874769A (zh) * | 2018-05-16 | 2018-11-23 | 深圳开思时代科技有限公司 | 配件名称标准化方法及装置、电子设备和介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413640B (zh) * | 2019-07-22 | 2022-03-04 | 武汉上善仿真科技有限责任公司 | 一种汽车车身零件查询系统及方法 |
CN110427372B (zh) * | 2019-07-22 | 2022-02-08 | 武汉上善仿真科技有限责任公司 | 一种汽车车身零件号指定系统及其使用方法 |
-
2020
- 2020-05-22 CN CN202010438912.2A patent/CN111597219B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150032728A1 (en) * | 2007-03-30 | 2015-01-29 | Ryan Rozich | System and method of generating a set of search results |
CN101794309A (zh) * | 2010-03-04 | 2010-08-04 | 上海天呈科技有限公司 | 一种交互式商品分类和检索方法 |
CN105786886A (zh) * | 2014-12-25 | 2016-07-20 | 上海通用汽车有限公司 | 车辆维修目录系统 |
CN106997390A (zh) * | 2017-04-05 | 2017-08-01 | 安徽机器猫电子商务股份有限公司 | 一种设备配件或零部件商品交易信息搜索方法 |
CN108153889A (zh) * | 2017-12-28 | 2018-06-12 | 深圳开思时代科技有限公司 | 汽车配件查询方法及系统、电子设备和介质 |
CN108874769A (zh) * | 2018-05-16 | 2018-11-23 | 深圳开思时代科技有限公司 | 配件名称标准化方法及装置、电子设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111597219A (zh) | 2020-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111597219B (zh) | 一种基于关系属性的搜索方法及系统 | |
US20200327172A1 (en) | System and method for processing contract documents | |
CN101408885B (zh) | 利用统计分布对主题进行建模 | |
CN101566997B (zh) | 确定与给定的词集相关的词 | |
CN107193962B (zh) | 一种互联网推广信息的智能配图方法及装置 | |
US10204121B1 (en) | System and method for providing query recommendations based on search activity of a user base | |
CN102640145B (zh) | 可信查询系统和方法 | |
US6826566B2 (en) | Identifier vocabulary data access method and system | |
CN105408890A (zh) | 基于声音输入执行与列表数据有关的操作 | |
CN101542475A (zh) | 用于对具有象形表意内容的数据进行搜索和匹配的系统和方法 | |
CN106997390B (zh) | 一种设备配件或零部件商品交易信息搜索方法 | |
CN103309886A (zh) | 一种基于交易平台的结构化信息搜索方法和装置 | |
CN111125491A (zh) | 商品信息的搜索方法和装置、存储介质及电子装置 | |
CN117112775A (zh) | 自动填写输入表单以生成列表的技术 | |
CN116010552A (zh) | 一种基于关键词词库的工程造价数据解析系统及其方法 | |
CN117725078B (zh) | 一种基于自然语言的多表格数据查询和分析方法 | |
US20050065947A1 (en) | Thesaurus maintaining system and method | |
CN118193806A (zh) | 一种目标检索方法、装置、电子设备及存储介质 | |
CN113792209A (zh) | 搜索词生成方法、系统及计算机可读存储介质 | |
CN113127597B (zh) | 搜索信息的处理方法、装置及电子设备 | |
CN117609468A (zh) | 生成检索语句的方法及装置 | |
CN117420998A (zh) | 一种客户端ui交互组件生成方法、装置、终端及介质 | |
CN110413757B (zh) | 一种词语释义确定方法、装置及系统 | |
US20230104661A1 (en) | System and method for improving e-commerce | |
CN112257439B (zh) | 一种通过舆情数据挖掘热度词根的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 230011 Room 401, Chunhui building, Jiaokou, Quanjiao Road, Changjiang East Road, Hefei, Anhui Applicant after: Anhui machine cat e-commerce Co., Ltd Address before: 230011 Room 401, Chunhui building, Jiaokou, Quanjiao Road, Changjiang East Road, Hefei, Anhui Applicant before: Anhui machine cat e-commerce Co., Ltd |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |