CN104933092A - 一种针对工业产品搜索的筛选式搜索方法 - Google Patents
一种针对工业产品搜索的筛选式搜索方法 Download PDFInfo
- Publication number
- CN104933092A CN104933092A CN201510255917.0A CN201510255917A CN104933092A CN 104933092 A CN104933092 A CN 104933092A CN 201510255917 A CN201510255917 A CN 201510255917A CN 104933092 A CN104933092 A CN 104933092A
- Authority
- CN
- China
- Prior art keywords
- search
- name
- screening
- brand name
- product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种针对工业产品搜索的筛选式搜索方法,包括以下几步:在线下构建品牌名称列表和产品名称列表;在线上利用品牌名称列表和产品名称列表进行筛选式搜索,包括第一层的产品名称筛选和第二层的品牌名称筛选,其中,第一层筛选通过产品名称列表对搜索词条进行最长匹配,获取搜索词条中所包含的产品名称列表中的最长词语;第二层筛选通过品牌名称筛选对搜索词条进行最长匹配,获取搜索词条中所包含的品牌名称筛选的最长词语;对于搜索结果按照匹配率进行降序排序,然后呈现给搜索用户。本发明涉及的搜索方法,提高了工业产品搜索的相关性,得到相关度高的搜索结果。
Description
技术领域
本发明属于搜索领域,尤其是工业产品的搜索,具体涉及一种针对工业产品搜索的筛选式搜索方法。
背景技术
B2B是指企业对企业之间的营销关系,将企业内部网通过B2B网站与客户紧密结合起来,通过网络的快速反应,为客户提供更好的服务,从而促进企业的业务发展。
在B2B领域中,一项核心技术为“基于互联网的工业产品搜索功能”,该功能为企业之间的产品贸易提供枢纽和入口。产品需求方为购买所需的工业产品,首先该企业需要在B2B互联网平台上,通过工业产品的搜索功能在互联网上搜索到其所需的工业产品,以获得其所需要的产品信息(供给方、价格、物流等等)。然后,在线下单订购,并开展后期的线下贸易行为。
然而,工业产品的搜索技术现在面临一个问题,即:有时搜索引擎的搜索结果无法搜索到准确的结果,也称搜索准确性问题。具体的说,在现有技术中,搜索结果一般大致反映了搜索者的搜索意图,但往往出现“相关但不够准”的现象,搜索结果无法真正反映用户搜索意图。
例如,若用户希望购买“SKF”品牌的汽车轴承,其在搜索引擎内搜索“SKF汽车轴承”,搜索引擎可能返回的结果有“SKF汽车轴承”、“SKF轴承”、“SKF汽车”、“哈尔滨牌汽车轴承”等。而在这些返回结果中,“SKF汽车”与用户的搜索意图完全不相关,“哈尔滨牌汽车轴承”与用户的搜索意图也无法完全吻合,因为工业产品贸易中,在指定了搜索SKF品牌的前提下,返回其他品牌的汽车轴承对用户并没有直接意义。工业产品搜索引擎的准确性问题,降低了工业产品搜索技术的实用性,为B2B业务的开展带来了不便。
现有的相关搜索技术一般为基于文本匹配的搜索技术,比如基于SQL数据查找的搜索技术、基于倒排表查找的搜索技术等。业务流程一般为:1.用户输入其所搜索的词条;2.工业产品搜索引擎将词条进行分词,将其切分为多个独立的词语;3.通过倒排表分别查找包含各个独立词语的工业产品;4.将所有结果进行整合、排序,并返回给用户。其中,第4步往往通过机器学习技术对搜索结果进行相关度分析,并根据搜索结果与搜索词条的相关程度对搜索结果进行排序,进而将相关结果在排序靠前的位置返回给用户。
例如,对于用户搜索“SKF汽车轴承”的例子,搜索引擎将进行如下操作:分词:将“SKF汽车轴承”进行分词,得到3个独立的词语,即SKF、汽车、轴承;查找:搜索引擎在数据库中,分别查找包含SKF、汽车、轴承三个词语的结果(至少包含三个词语之一的结果);呈现:搜索引擎对所有查找得到的结果进行排序,并将排序结果呈现给用户。
现有方法的不足在于:搜索结果中包含用户意图不相关的结果,增加了用户查找目标结果的工作量。其原因在于,简单的文本匹配和搜索无法将搜索到文本相关度高的搜索结果,即包含了搜索词条或包含了搜索词条某部分的搜索结果。而在工业产品搜索领域,包含了搜索词条文本的搜索结果未必是相关结果。
虽然,传统技术通过机器学习方法对搜索结果进行了基于相关度的排序,然而机器学习方法基于统计方法,存在一定的不稳定性,排序结果不可控,往往造成相关结果和不相关结果混合在一起的情况。
发明内容
为解决上述技术问题,本发明提供了一种稳定的、排序结果可控的、先惯性高的针对工业产品搜索的筛选式搜索方法。
为达到上述目的,本发明的技术方案如下:
一种针对工业产品搜索的筛选式搜索方法,其特征在于,包括以下几步:
第一步:在线下构建品牌名称列表和产品名称列表;
第二步:在线上利用品牌名称列表和产品名称列表进行筛选式搜索,包 括第一层的产品名称筛选和第二层的品牌名称筛选,
其中,第一层筛选通过产品名称列表对搜索词条进行最长匹配,获取搜索词条中所包含的产品名称列表中的最长词语;
第二层筛选通过品牌名称筛选对搜索词条进行最长匹配,获取搜索词条中所包含的品牌名称筛选的最长词语;
第三步:对于搜索结果按照匹配率进行降序排序,然后呈现给搜索用户。
在本发明的一个较佳实施例中,进一步包括,所述品牌名称列表包含商品的商标名称和商品的供应厂家名称,所述产品名称列表包含工业产品的产品名词。
在本发明的一个较佳实施例中,进一步包括,构建所述品牌名称列表的方法包括以下几种:
在工业产品搜索平台中,数据库中保存了搜索工业产品供应商的信息,通过数据库中的企业名称字段和品牌名称字段,获得大量供应厂家名称和品牌名称;
对现有的互联网平台页面进行爬取,爬取的HTML内容中包含了品牌名称和供应厂家名称,通过解析HTML获得品牌名称和供应厂家名称;
通过业务人员的工作经验来总结品牌名称和供应厂家名称;
对获得的品牌名称和供应厂家名称总结列表,为品牌名称列表。
在本发明的一个较佳实施例中,进一步包括,构建产品名称列表的方法包括以下:
在工业产品搜索平台的数据库中设置产品名称字段,工业产品信息的发布者填写所述字段,通过数据库中的产品名称字段获得产品名称;
人工录入产品名称进入产品名称列表。
在本发明的一个较佳实施例中,进一步包括,第二步中在第一次筛选时,获取搜索词条中包含的产品名称列表中的最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不予以搜索。
在本发明的一个较佳实施例中,进一步包括,第二步中在第二次筛选时, 获取搜索词条中所包含的品牌名称列表中最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不予以搜索。
本发明的有益效果是:
本发明涉及的搜索方法,首先通过线下挖掘数据,锁定了搜索词中的关键词,并且通过线上两层过滤的方法,过滤掉与用户工业产品搜索意图不相符的内容,筛选出相关的内容,提高了工业产品搜索的相关性,得到相关度高的搜索结果。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例中公开了一种针对工业产品搜索的筛选式搜索方法,其采用线下挖掘数据,线上搜索过滤的方式进行搜索,包括以下几步:
第一步:在线下构建品牌名称列表和产品名称列表,所述品牌名称列表包含商品的商标名称和商品的供应厂家名称。
第二步:在线上利用品牌名称列表和产品名称列表进行筛选式搜索,包括第一层的产品名称筛选和第二层的品牌名称筛选,所述产品名称列表包含工业产品的产品名词。
其中,第一层筛选通过产品名称列表对搜索词条进行最长匹配,获取搜索词条中所包含的产品名称列表中的最长词语;获取搜索词条中包含的产品名称列表中的最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不予以搜索。
第二层筛选通过品牌名称筛选对搜索词条进行最长匹配,获取搜索词条中所包含的品牌名称筛选的最长词语;获取搜索词条中所包含的品牌名称列表中最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不 予以搜索。
第三步:对于搜索结果按照匹配率进行降序排序,然后呈现给搜索用户。
具体的,在第一步中构建所述品牌名称列表的方法包括以下几种方式:
1.在工业产品搜索平台中,数据库中保存了搜索工业产品供应商的信息,通过数据库中的企业名称字段和品牌名称字段,获得大量供应厂家名称和品牌名称。
2.对现有的互联网平台(例如B2B、B2C、C2C互联网平台)页面进行爬取,爬取的HTML内容中包含了品牌名称和供应厂家名称,通过解析HTML获得品牌名称和供应厂家名称。
3.通过业务人员的工作经验来总结品牌名称和供应厂家名称。
4.对获得的品牌名称和供应厂家名称总结列表,为品牌名称列表。
第一步中构建产品名称列表的方法包括以下方式:
1.在工业产品搜索平台的数据库中设置产品名称字段,工业产品信息的发布者填写所述字段,通过数据库中的产品名称字段获得产品名称。
2.根据业务人员的业务经验,直接人工录入产品名称进入产品名称列表。
实施例2
实施例2以实施例1公开的方法,以实际的工业产品为例进行搜索。
数据基础:
假定,搜索引擎数据库中包含如下工业产品:SKF汽车轴承、SKF轴承、SKF汽车、SKF汽车轴承润滑油、哈尔滨牌汽车轴承、Kappa运动鞋。
线下:
数据库中,“品牌名称”字段包括SKF、哈尔滨牌、哈尔滨、Kappa;“产品名称”字段包括汽车、轴承、汽车轴承、汽车轴承润滑油、运动鞋。通过对数据库进行挖掘,获得“品牌名称列表”:SKF、哈尔滨牌、哈尔滨、Kappa。同时获得“产品名称列表”:汽车、轴承、汽车轴承、汽车轴承润滑油、运动鞋。
线上:
用户搜索“SKF汽车轴承”,按照本专利的方法,工业产品搜索引擎将进行:
1.搜索词条“SKF汽车轴承”与“产品名称列表”中的每个词条进行匹配。
2.匹配的项目包括:汽车、轴承、汽车轴承。取得其中最长的匹配项:“汽车轴承”。
3.利用“汽车轴承”对搜索引擎数据库内容进行筛选,保留包含“汽车轴承”的内容,即保留:SKF汽车轴承、SKF汽车轴承润滑油、哈尔滨牌汽车轴承;抛弃:SKF轴承、SKF汽车、Kappa运动鞋。
4.搜索词条“SKF汽车轴承”与“品牌名称列表”中的每个词条进行匹配,匹配的项目包括:SKF,取得其中最长的匹配项:“SKF”。
5.利用“SKF”对第3步的结果进行二次筛选,保留包含“汽车轴承”的内容,即保留:SKF汽车轴承、SKF汽车轴承润滑油;抛弃:哈尔滨牌汽车轴承。
6.通过对保留的项目(SKF汽车轴承、SKF汽车轴承润滑油)进行搜索,得到:SKF汽车轴承、SKF汽车轴承润滑油;
7.排序:“SKF汽车轴承”的匹配率为:(“SKF汽车轴承”的长度)/(“SKF汽车轴承”的长度)=7/7=1;“SKF汽车轴承润滑油”的匹配率为:(“SKF汽车轴承”的长度)/(“SKF汽车轴承润滑油”的长度)=7/10=0.7
排序结果为“匹配率”的逆序,即“SKF汽车轴承”靠前,“SKF汽车轴承润滑油”靠后。这样,用户可以很方便的得到其搜索的产品:“SKF汽车轴承”。
本实施例中涉及的搜索方法,首先通过线下挖掘数据,锁定了搜索词中的关键词,并且通过线上两层过滤的方法,过滤掉与用户工业产品搜索意图不相符的内容,筛选出相关的内容,提高了工业产品搜索的相关性,得到相关度高的搜索结果。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易 见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (6)
1.一种针对工业产品搜索的筛选式搜索方法,其特征在于,包括以下几步:
第一步:在线下构建品牌名称列表和产品名称列表;
第二步:在线上利用品牌名称列表和产品名称列表进行筛选式搜索,包括第一层的产品名称筛选和第二层的品牌名称筛选,
其中,第一层筛选通过产品名称列表对搜索词条进行最长匹配,获取搜索词条中所包含的产品名称列表中的最长词语;
第二层筛选通过品牌名称筛选对搜索词条进行最长匹配,获取搜索词条中所包含的品牌名称筛选的最长词语;
第三步:对于搜索结果按照匹配率进行降序排序,然后呈现给搜索用户。
2.根据权利要求1所述的一种针对工业产品搜索的筛选式搜索方法,其特征在于,所述品牌名称列表包含商品的商标名称和商品的供应厂家名称,所述产品名称列表包含工业产品的产品名词。
3.根据权利要求2所述的一种针对工业产品搜索的筛选式搜索方法,其特征在于,构建所述品牌名称列表的方法包括以下几种:
在工业产品搜索平台中,数据库中保存了搜索工业产品供应商的信息,通过数据库中的企业名称字段和品牌名称字段,获得大量供应厂家名称和品牌名称;
对现有的互联网平台页面进行爬取,爬取的HTML内容中包含了品牌名称和供应厂家名称,通过解析HTML获得品牌名称和供应厂家名称;
通过业务人员的工作经验来总结品牌名称和供应厂家名称;
对获得的品牌名称和供应厂家名称总结列表,为品牌名称列表。
4.根据根据权利要求2所述的一种针对工业产品搜索的筛选式搜索方法,其特征在于,构建产品名称列表的方法包括以下:
在工业产品搜索平台的数据库中设置产品名称字段,工业产品信息的发布者填写所述字段,通过数据库中的产品名称字段获得产品名称;
人工录入产品名称进入产品名称列表。
5.根据权利要求1所述的一种针对工业产品搜索的筛选式搜索方法,其特征在于,第二步中在第一次筛选时,获取搜索词条中包含的产品名称列表中的最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不予以搜索。
6.根据权利要求5所述的一种针对工业产品搜索的筛选式搜索方法,其特征在于,第二步中在第二次筛选时,获取搜索词条中所包含的品牌名称列表中最长词语,对数据库中待搜索内容中,将不包含词语的项目过滤掉,不予以搜索。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510255917.0A CN104933092B (zh) | 2015-05-19 | 2015-05-19 | 一种针对工业产品搜索的筛选式搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510255917.0A CN104933092B (zh) | 2015-05-19 | 2015-05-19 | 一种针对工业产品搜索的筛选式搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104933092A true CN104933092A (zh) | 2015-09-23 |
CN104933092B CN104933092B (zh) | 2018-09-21 |
Family
ID=54120260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510255917.0A Active CN104933092B (zh) | 2015-05-19 | 2015-05-19 | 一种针对工业产品搜索的筛选式搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104933092B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107463694A (zh) * | 2017-08-14 | 2017-12-12 | 安徽简道科技有限公司 | 互联网营销云服务平台使用方法 |
CN109657151A (zh) * | 2018-12-25 | 2019-04-19 | 华联世纪工程咨询股份有限公司 | 一种基于用户使用情景的工程材料搜索方法及装置 |
CN112347140A (zh) * | 2020-10-19 | 2021-02-09 | 上海微亿智造科技有限公司 | 面向工业大数据的数据处理方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101635002A (zh) * | 2009-08-21 | 2010-01-27 | 深圳市五巨科技有限公司 | 一种移动终端音乐搜索的方法和装置 |
CN102419746A (zh) * | 2010-09-28 | 2012-04-18 | 无锡诺宝科技发展有限公司 | 三维搜索系统及三维搜索方法 |
CN102446180A (zh) * | 2010-10-09 | 2012-05-09 | 腾讯科技(深圳)有限公司 | 一种商品搜索方法及其装置 |
CN102930022A (zh) * | 2012-10-31 | 2013-02-13 | 中国运载火箭技术研究院 | 面向用户的信息搜索引擎系统及方法 |
CN103092958A (zh) * | 2013-01-18 | 2013-05-08 | 深圳市龙视传媒有限公司 | 一种搜索结果展示方法和装置 |
-
2015
- 2015-05-19 CN CN201510255917.0A patent/CN104933092B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101635002A (zh) * | 2009-08-21 | 2010-01-27 | 深圳市五巨科技有限公司 | 一种移动终端音乐搜索的方法和装置 |
CN102419746A (zh) * | 2010-09-28 | 2012-04-18 | 无锡诺宝科技发展有限公司 | 三维搜索系统及三维搜索方法 |
CN102446180A (zh) * | 2010-10-09 | 2012-05-09 | 腾讯科技(深圳)有限公司 | 一种商品搜索方法及其装置 |
CN102930022A (zh) * | 2012-10-31 | 2013-02-13 | 中国运载火箭技术研究院 | 面向用户的信息搜索引擎系统及方法 |
CN103092958A (zh) * | 2013-01-18 | 2013-05-08 | 深圳市龙视传媒有限公司 | 一种搜索结果展示方法和装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107463694A (zh) * | 2017-08-14 | 2017-12-12 | 安徽简道科技有限公司 | 互联网营销云服务平台使用方法 |
CN109657151A (zh) * | 2018-12-25 | 2019-04-19 | 华联世纪工程咨询股份有限公司 | 一种基于用户使用情景的工程材料搜索方法及装置 |
CN112347140A (zh) * | 2020-10-19 | 2021-02-09 | 上海微亿智造科技有限公司 | 面向工业大数据的数据处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104933092B (zh) | 2018-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A bibliometric analysis of reverse logistics research (1992-2015) and opportunities for future research | |
CN104063523B (zh) | 一种电子商务搜索评分与排名的方法及系统 | |
CN102446180B (zh) | 一种商品搜索方法及其装置 | |
US9141713B1 (en) | System and method for associating keywords with a web page | |
US20100057717A1 (en) | System And Method For Generating A Search Ranking Score For A Web Page | |
CN101223525B (zh) | 关系网络 | |
US9690846B2 (en) | Intelligent navigation of a category system | |
US20140012840A1 (en) | Generating search results | |
CN103365839A (zh) | 一种搜索引擎的推荐搜索方法和装置 | |
CN104794154A (zh) | 基于文本挖掘的医疗器械o2o服务质量评价模型 | |
CN105930539A (zh) | 话题订阅方法和装置 | |
CN105205188A (zh) | 采购物料供应商的推荐方法及推荐装置 | |
KR20100101621A (ko) | 검색 쿼리 결과로부터 관련성을 추론하는 컴퓨터로 구현되는 방법 및 컴퓨터 판독가능한 매체 | |
CN103226618A (zh) | 基于数据集市挖掘的相关词提取方法及系统 | |
CN103309894B (zh) | 基于用户属性的搜索实现方法及系统 | |
CN104933092A (zh) | 一种针对工业产品搜索的筛选式搜索方法 | |
CN105468649A (zh) | 一种待展示对象匹配的判断方法及其装置 | |
CN102456057A (zh) | 基于网上交易平台的检索方法、装置和服务器 | |
CN101308507B (zh) | 互联网信息发布和搜索方法 | |
US20080052275A1 (en) | Structured match in a directory sponsored search system | |
CN104050243A (zh) | 一种将搜索与社交相结合的网络搜索方法及其系统 | |
CN102236662B (zh) | 数据库查询和控制方法 | |
CN104820713B (zh) | 一种基于用户历史数据获得工业产品名称同义词的方法 | |
Khider et al. | Social business process model recommender: An MDE approach | |
KR20220080628A (ko) | 소비자 데이터를 활용한 의류 브랜딩 및 판매 방법과 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |