CN114625935A - 场景化搜索的方法及系统 - Google Patents
场景化搜索的方法及系统 Download PDFInfo
- Publication number
- CN114625935A CN114625935A CN202210192786.6A CN202210192786A CN114625935A CN 114625935 A CN114625935 A CN 114625935A CN 202210192786 A CN202210192786 A CN 202210192786A CN 114625935 A CN114625935 A CN 114625935A
- Authority
- CN
- China
- Prior art keywords
- search
- scene
- data
- phrase
- builder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000011218 segmentation Effects 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了场景化搜索的方法及系统,通过加载根据行业数据动态预构建的搜索短语构建器,实现了灵活多变的搜索需求,并且当接收到输入的搜索词,可调用搜索短语构建器,识别搜索词所对应的场景,根据场景提取对应的场景搜索数据,根据搜索词和场景搜索数据构建搜索短语,从而以较为简单的方式描述搜索需求,规范构建搜索语句,精准提取与用户搜索相关的数据,并且避免开发人员在项目写相同代码重复工作,提高开发人员工作效率及代码的统一性。
Description
技术领域
本发明涉及搜索技术领域,尤其涉及一种场景化搜索的方法及系统。
背景技术
在如今这个信息爆炸的DT(数据处理技术)时代,人们被各种各样的信息所包围。人们获取信息的方式主要有被动获取和主动获取两种,其中被动获取就是推荐的方式,主动获取就是搜索的方式。在用户进行主动搜索时,由于数据种类繁杂且数据总量庞大,能否精准提取与用户搜索相关的数据就显得尤为重要。且在数据提取的过程中,面对灵活多变的搜索需求,数据的提取规则需要进行反复调整。
发明内容
本发明要解决的技术问题在于,针对现有技术存在的至少一个缺陷,提供一种场景化搜索的方法及系统。
本发明解决其技术问题所采用的技术方案是:构造一种场景化搜索的方法,包括以下步骤:
S10:加载根据行业数据动态预构建的搜索短语构建器;
S20:接收输入的搜索词;
S30:调用所述搜索短语构建器,识别所述搜索词所对应的场景;
S40:根据所述场景提取对应的场景搜索数据;
S50:根据所述搜索词和所述场景搜索数据构建搜索短语。
优选地,在本发明所述的场景化搜索的方法中,所述搜索短语构建器存储有根据不同行业数据配置的搜索场景词元和场景搜索数据;
步骤S20之后还包括:
S21:对搜索词进行分词处理,得到关键词;
步骤S30包括:
调用所述搜索短语构建器,读取存储的所述搜索场景词元,根据所述搜索场景词元对所述关键词进行场景识别,识别出所述搜索词所对应的场景。
优选地,在本发明所述的场景化搜索的方法中,所述搜索场景词元包括场景编码、名称、别名、曾用名和简称。
优选地,在本发明所述的场景化搜索的方法中,所述场景搜索数据包括分别与搜索场景对应的搜索索引、搜索维度和搜索方式。
优选地,在本发明所述的场景化搜索的方法中,所述搜索维度与所述搜索场景进行一对一或一对多的绑定。
优选地,在本发明所述的场景化搜索的方法中,步骤S50包括:将所述关键词转换为搜索值,根据所述搜索值和所述场景搜索数据构建搜索短语。
优选地,在本发明所述的场景化搜索的方法中,步骤S10包括:
S101:引入搜索组件;
S102:初始化所述搜索组件,并指定配置文件地址;所述配置文件包括根据不同行业数据配置的搜索场景词元和场景搜索数据;
S103:启动所述搜索组件,加载所述配置文件,并将配置文件数据存储至配置中心;
S104:完成所述搜索短语构建器的加载。
本发明还构造了一种场景化搜索的系统,包括:
加载模块,用于加载根据行业数据动态预构建的搜索短语构建器;
接收模块,用于接收输入的搜索词;
识别模块,用于调用所述搜索短语构建器,识别所述搜索词所对应的场景;
提取模块,用于根据所述场景提取对应的场景搜索数据;
构建模块,用于根据所述搜索词和所述场景搜索数据构建搜索短语。
优选地,在本发明所述的场景化搜索的系统中,所述搜索短语构建器存储有根据不同行业数据配置的搜索场景词元和场景搜索数据;
所述系统还包括:分词模块,用于对搜索词进行分词处理,得到关键词;
所述识别模块,进一步用于调用所述搜索短语构建器,读取存储的所述搜索场景词元,根据所述搜索场景词元对所述关键词进行场景识别,识别出所述搜索词所对应的场景。
优选地,在本发明所述的场景化搜索的系统中,所述加载模块包括:
引入模块,用于引入搜索组件;
初始化模块,用于初始化所述搜索组件,并指定配置文件地址;所述配置文件包括根据不同行业数据配置的搜索场景词元和场景搜索数据;
启动模块,用于启动所述搜索组件,加载所述配置文件;
存储模块,用于将配置文件数据存储至配置中心。
通过实施本发明,具有以下有益效果:
本发明通过加载根据行业数据动态预构建的搜索短语构建器,实现了灵活多变的搜索需求,并且当接收到输入的搜索词,可调用搜索短语构建器,识别搜索词所对应的场景,根据场景提取对应的场景搜索数据,根据搜索词和场景搜索数据构建搜索短语,从而以较为简单的方式描述搜索需求,规范构建搜索语句,精准提取与用户搜索相关的数据,并且避免开发人员在项目写相同代码重复工作,提高开发人员工作效率及代码的统一性。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明场景化搜索的方法流程图一;
图2是本发明场景化搜索的方法流程图二;
图3是本发明场景化搜索的系统模块框图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
需要说明的是,附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
如图1和2所示,本发明公开了一种场景化搜索的方法,用于识别用户搜索意图,动态构建搜索短语,该方法包括以下步骤:
步骤S10:加载根据行业数据动态预构建的搜索短语构建器;
步骤S20:接收输入的搜索词;
步骤S30:调用搜索短语构建器,识别搜索词所对应的场景;
步骤S40:根据场景提取对应的场景搜索数据;
步骤S50:根据搜索词和场景搜索数据构建搜索短语。
在一些实施例中,步骤S10:根据行业数据动态预构建搜索短语构建器,进一步包括:
步骤S101:引入搜索组件;
步骤S102:初始化搜索组件,并指定配置文件地址。其中,该配置文件是指启动该搜索组件所需要设置的参数,是由搜索组件使用方预先配置的。配置文件地址是指搜索组件使用方项目中的文件地址。
该配置文件包括根据不同行业数据配置的搜索场景词元和场景搜索数据,而场景搜索数据包括分别与搜索场景对应的搜索索引、搜索维度和搜索方式。并且,搜索维度与搜索场景进行一对一或一对多的绑定。
搜索场景都有对应的搜索场景词元,例如厂牌、型号、系列和品类等信息为搜索场景词元。而搜索场景词元包括场景编码、名称、别名、曾用名和简称,例如厂牌场景,将厂牌名称转换为该厂牌具有唯一性标识的编码或标准厂牌名称,也可以拓展为厂牌的别名、曾用名和简称进行识别。
步骤S103:启动搜索组件,加载配置文件,并将配置文件数据存储至配置中心,即将搜索场景词元、与搜索场景对应的搜索索引、搜索维度和搜索方式存储至配置中心;
步骤S104:完成搜索短语构建器的加载。
本实施例通过动态配置配置文件,从而可以实现灵活多变的搜索需求。
在一些实施例中,搜索短语构建器存储有根据不同行业数据配置的搜索场景词元和场景搜索数据;
相应地,步骤S20之后还包括S21:对搜索词进行分词处理,得到关键词;在另外一些实施例中,分词后还会进行过滤和/或重新组合。
步骤S30包括:调用搜索短语构建器,读取存储的搜索场景词元,例如从配置中心中读取搜索场景词元,根据搜索场景词元对关键词进行场景识别,识别出搜索词所对应的场景。具体地,会调用搜索短语构建器的场景识别组件,根据搜索场景词元对关键词进行场景识别,而场景识别组件属于搜索组件的功能点之一。
步骤S50包括:将关键词转换为搜索值,根据搜索值和场景搜索数据构建搜索短语。例如,用户搜索华为,当识别出aa是一个厂牌,会将【aa】替换对应的编码,即搜索值。具体地,搜索短语主要由搜索值、搜索索引、搜索维度和搜索方式组成。
如图3所示,本发明公开了一种场景化搜索的系统,用于识别用户搜索意图,动态构建搜索短语,包括:
加载模块,用于加载根据行业数据动态预构建的搜索短语构建器;
接收模块,用于接收输入的搜索词;
识别模块,用于调用搜索短语构建器,识别搜索词所对应的场景;
提取模块,用于根据场景提取对应的场景搜索数据;
构建模块,用于根据搜索词和场景搜索数据构建搜索短语。
在一些实施例中,加载模块进一步包括:
引入模块,用于引入搜索组件;
初始化模块,用于初始化搜索组件,并指定配置文件地址。其中,该配置文件是指启动该搜索组件所需要设置的参数,是由搜索组件使用方预先配置的。配置文件地址是指搜索组件使用方项目中的文件地址。
该配置文件包括根据不同行业数据配置的搜索场景词元和场景搜索数据,而场景搜索数据包括分别与搜索场景对应的搜索索引、搜索维度和搜索方式。并且,搜索维度与搜索场景进行一对一或一对多的绑定。
搜索场景都有对应的搜索场景词元,例如厂牌、型号、系列和品类等信息为搜索场景词元。而搜索场景词元包括场景编码、名称、别名、曾用名和简称,例如厂牌场景,将厂牌名称转换为该厂牌具有唯一性标识的编码或标准厂牌名称,也可以拓展为厂牌的别名、曾用名和简称进行识别。
启动模块,用于启动搜索组件,加载配置文件;
存储模块,用于将配置文件数据存储至配置中心,即将搜索场景词元、与搜索场景对应的搜索索引、搜索维度和搜索方式存储至配置中心,完成搜索短语构建器的加载。
本实施例通过动态配置配置文件,从而可以实现灵活多变的搜索需求。
在一些实施例中,搜索短语构建器存储有根据不同行业数据配置的搜索场景词元和场景搜索数据;
系统还包括:分词模块,用于对搜索词进行分词处理,得到关键词;在另外一些实施例中,系统还包括过滤模块,用于分词后进行过滤;和/或,组合模块,用于过滤后进行重新组合。
识别模块,进一步用于调用搜索短语构建器,读取存储的搜索场景词元,例如从配置中心中读取搜索场景词元,根据搜索场景词元对关键词进行场景识别,识别出搜索词所对应的场景。具体地,会调用搜索短语构建器的场景识别组件,根据搜索场景词元对关键词进行场景识别,而场景识别组件属于搜索组件的功能点之一。
构建模块,进一步用于将关键词转换为搜索值,根据搜索值和场景搜索数据构建搜索短语。例如,用户搜索华为,当识别出aa是一个厂牌,会将【aa】替换对应的编码,即搜索值。具体地,搜索短语主要由搜索值、搜索索引、搜索维度和搜索方式组成。
通过实施本发明,具有以下有益效果:
本发明通过加载根据行业数据动态预构建的搜索短语构建器,实现了灵活多变的搜索需求,并且当接收到输入的搜索词,可调用搜索短语构建器,识别搜索词所对应的场景,根据场景提取对应的场景搜索数据,根据搜索词和场景搜索数据构建搜索短语,从而以较为简单的方式描述搜索需求,规范构建搜索语句,精准提取与用户搜索相关的数据,并且避免开发人员在项目写相同代码重复工作,提高开发人员工作效率及代码的统一性。
可以理解的,以上实施例仅表达了本发明的优选实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,可以对上述技术特点进行自由组合,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,凡跟本发明权利要求范围所做的等同变换与修饰,均应属于本发明权利要求的涵盖范围。
Claims (10)
1.一种场景化搜索的方法,其特征在于,包括以下步骤:
S10:加载根据行业数据动态预构建的搜索短语构建器;
S20:接收输入的搜索词;
S30:调用所述搜索短语构建器,识别所述搜索词所对应的场景;
S40:根据所述场景提取对应的场景搜索数据;
S50:根据所述搜索词和所述场景搜索数据构建搜索短语。
2.根据权利要求1所述的场景化搜索的方法,其特征在于,所述搜索短语构建器存储有根据不同行业数据配置的搜索场景词元和场景搜索数据;
步骤S20之后还包括:
S21:对搜索词进行分词处理,得到关键词;
步骤S30包括:
调用所述搜索短语构建器,读取存储的所述搜索场景词元,根据所述搜索场景词元对所述关键词进行场景识别,识别出所述搜索词所对应的场景。
3.根据权利要求2所述的场景化搜索的方法,其特征在于,所述搜索场景词元包括场景编码、名称、别名、曾用名和简称。
4.根据权利要求1或2所述的场景化搜索的方法,其特征在于,所述场景搜索数据包括分别与搜索场景对应的搜索索引、搜索维度和搜索方式。
5.根据权利要求4所述的场景化搜索的方法,其特征在于,所述搜索维度与所述搜索场景进行一对一或一对多的绑定。
6.根据权利要求2所述的场景化搜索的方法,其特征在于,步骤S50包括:将所述关键词转换为搜索值,根据所述搜索值和所述场景搜索数据构建搜索短语。
7.根据权利要求1所述的场景化搜索的方法,其特征在于,步骤S10包括:
S101:引入搜索组件;
S102:初始化所述搜索组件,并指定配置文件地址;所述配置文件包括根据不同行业数据配置的搜索场景词元和场景搜索数据;
S103:启动所述搜索组件,加载所述配置文件,并将配置文件数据存储至配置中心;
S104:完成所述搜索短语构建器的加载。
8.一种场景化搜索的系统,其特征在于,包括:
加载模块,用于加载根据行业数据动态预构建的搜索短语构建器;
接收模块,用于接收输入的搜索词;
识别模块,用于调用所述搜索短语构建器,识别所述搜索词所对应的场景;
提取模块,用于根据所述场景提取对应的场景搜索数据;
构建模块,用于根据所述搜索词和所述场景搜索数据构建搜索短语。
9.根据权利要求8所述的场景化搜索的系统,其特征在于,所述搜索短语构建器存储有根据不同行业数据配置的搜索场景词元和场景搜索数据;
所述系统还包括:分词模块,用于对搜索词进行分词处理,得到关键词;
所述识别模块,进一步用于调用所述搜索短语构建器,读取存储的所述搜索场景词元,根据所述搜索场景词元对所述关键词进行场景识别,识别出所述搜索词所对应的场景。
10.根据权利要求8所述的场景化搜索的系统,其特征在于,所述加载模块包括:
引入模块,用于引入搜索组件;
初始化模块,用于初始化所述搜索组件,并指定配置文件地址;所述配置文件包括根据不同行业数据配置的搜索场景词元和场景搜索数据;
启动模块,用于启动所述搜索组件,加载所述配置文件;
存储模块,用于将配置文件数据存储至配置中心。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210192786.6A CN114625935A (zh) | 2022-02-28 | 2022-02-28 | 场景化搜索的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210192786.6A CN114625935A (zh) | 2022-02-28 | 2022-02-28 | 场景化搜索的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114625935A true CN114625935A (zh) | 2022-06-14 |
Family
ID=81900901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210192786.6A Pending CN114625935A (zh) | 2022-02-28 | 2022-02-28 | 场景化搜索的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114625935A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846037A (zh) * | 2018-05-29 | 2018-11-20 | 天津字节跳动科技有限公司 | 提示搜索词的方法和装置 |
CN109460499A (zh) * | 2018-10-16 | 2019-03-12 | 青岛聚看云科技有限公司 | 目标搜索词生成方法及装置、电子设备、存储介质 |
CN111459919A (zh) * | 2020-04-26 | 2020-07-28 | 深圳佰维存储科技股份有限公司 | 数据查询方法、加载组件、搜索组件和存储介质 |
CN112256952A (zh) * | 2020-10-22 | 2021-01-22 | 上海适享文化传播有限公司 | 基于图数据库技术满足电商场景化搜索的方法 |
CN112445895A (zh) * | 2020-11-16 | 2021-03-05 | 深圳市世强元件网络有限公司 | 一种识别用户搜索场景的方法及系统 |
CN113407828A (zh) * | 2021-06-11 | 2021-09-17 | 北京搜狗科技发展有限公司 | 一种搜索方法、装置和用于搜索的装置 |
CN114063982A (zh) * | 2021-11-10 | 2022-02-18 | 中国农业银行股份有限公司四川省分行 | 一种基于多场景应用的自动构建功能组件的方法 |
-
2022
- 2022-02-28 CN CN202210192786.6A patent/CN114625935A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846037A (zh) * | 2018-05-29 | 2018-11-20 | 天津字节跳动科技有限公司 | 提示搜索词的方法和装置 |
CN109460499A (zh) * | 2018-10-16 | 2019-03-12 | 青岛聚看云科技有限公司 | 目标搜索词生成方法及装置、电子设备、存储介质 |
CN111459919A (zh) * | 2020-04-26 | 2020-07-28 | 深圳佰维存储科技股份有限公司 | 数据查询方法、加载组件、搜索组件和存储介质 |
CN112256952A (zh) * | 2020-10-22 | 2021-01-22 | 上海适享文化传播有限公司 | 基于图数据库技术满足电商场景化搜索的方法 |
CN112445895A (zh) * | 2020-11-16 | 2021-03-05 | 深圳市世强元件网络有限公司 | 一种识别用户搜索场景的方法及系统 |
CN113407828A (zh) * | 2021-06-11 | 2021-09-17 | 北京搜狗科技发展有限公司 | 一种搜索方法、装置和用于搜索的装置 |
CN114063982A (zh) * | 2021-11-10 | 2022-02-18 | 中国农业银行股份有限公司四川省分行 | 一种基于多场景应用的自动构建功能组件的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106776544B (zh) | 人物关系识别方法及装置和分词方法 | |
CN109670163B (zh) | 信息识别方法、信息推荐方法、模板构建方法及计算设备 | |
CN101661391B (zh) | 一种对象序列化方法、对象反序列化方法、装置及系统 | |
CN105930362B (zh) | 搜索目标识别方法、装置及终端 | |
CN107784110B (zh) | 一种索引建立方法及装置 | |
CN110222238B (zh) | 字符串与识别符双向映射的查询方法和系统 | |
CN110851559B (zh) | 数据元自动识别方法和识别系统 | |
CN110532347B (zh) | 一种日志数据处理方法、装置、设备和存储介质 | |
CN111198936B (zh) | 一种语音搜索方法、装置、电子设备及存储介质 | |
CN112102840A (zh) | 语义识别方法、装置、终端及存储介质 | |
CN116089663A (zh) | 一种规则表达式匹配方法、装置及计算机可读存储介质 | |
CN115982416A (zh) | 一种数据处理方法、装置、可读存储介质及电子设备 | |
CN112800775B (zh) | 语义理解方法、装置、设备及存储介质 | |
CN111046145B (zh) | 交互意图路径的挖掘方法以及装置 | |
CN116340470B (zh) | 一种基于aigc的关键词关联检索系统 | |
CN114625935A (zh) | 场景化搜索的方法及系统 | |
CN109101630B (zh) | 一种应用程序搜索结果的生成方法、装置及设备 | |
CN108090034B (zh) | 基于集群的单证代码统一编码生成方法和系统 | |
CN112115228A (zh) | 搜索方法、装置、终端及存储介质 | |
CN110222051B (zh) | 以太坊区块链的智能合约压缩方法 | |
CN114610955A (zh) | 一种智能检索方法、装置、电子设备及存储介质 | |
CN111291208B (zh) | 前端页面元素的命名方法、装置及电子设备 | |
KR100769465B1 (ko) | 카테고리 매칭을 이용한 질의어 매칭 방법 및 질의어 매칭시스템 | |
CN104641367A (zh) | 用于格式化电子字符序列的格式化模块、系统和方法 | |
CN112835925B (zh) | 一种嵌入式芯片sql语句解析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |