CN110737677A - 一种数据搜索系统及方法 - Google Patents

一种数据搜索系统及方法 Download PDF

Info

Publication number
CN110737677A
CN110737677A CN201810805203.6A CN201810805203A CN110737677A CN 110737677 A CN110737677 A CN 110737677A CN 201810805203 A CN201810805203 A CN 201810805203A CN 110737677 A CN110737677 A CN 110737677A
Authority
CN
China
Prior art keywords
search
search condition
keywords
target
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810805203.6A
Other languages
English (en)
Other versions
CN110737677B (zh
Inventor
胡浩海
杨犀
陈昌敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Beacon Wisdom Star Technology Co Ltd
Original Assignee
Wuhan Beacon Wisdom Star Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Beacon Wisdom Star Technology Co Ltd filed Critical Wuhan Beacon Wisdom Star Technology Co Ltd
Priority to CN201810805203.6A priority Critical patent/CN110737677B/zh
Publication of CN110737677A publication Critical patent/CN110737677A/zh
Application granted granted Critical
Publication of CN110737677B publication Critical patent/CN110737677B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据搜索系统及方法,所述系统包括获得模块、第一搜索模块以及第二搜索模块,其中,所述获得模块,用于获得搜索请求,对所述搜索请求进行解析,得到搜索条件;所述第一搜索模块,用于利用所述搜索条件查找预设的核心数据库,得到符合所述搜索条件的关键词,作为目标关键词;所述核心数据库用于存储各个关键词和各个关键词所符合的搜索条件;所述第二搜索模块,用于利用所述目标关键词查找预设的专题数据库,得到目标关键词所关联的专题信息,所述专题数据库用于存储各个关键词所关联的专题信息,一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。应用本发明实施例,提高了搜索效率。

Description

一种数据搜索系统及方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据搜索系统及方法。
背景技术
随着计算机和网络技术的发展,搜索功能已经成为最常用的功能之一,用户通过搜索操作可以方便地获取所需的信息,由于网络数据的爆发式增长,通过搜索引擎能够搜索到的信息量越来越庞大,如何从海量数据中快速搜索到满足用户需求的信息成为研究热点。
传统的搜索方法搜索效率慢,查询范围单一,搜索结果之间的关联微弱,难以将海量的搜索结果转化为显而易见的关联信息,需要用户自己从成千上万的搜索结果中寻找符合自己需要的结果,造成搜索效率较低。
因此有必要设计一种新的数据搜索方法,以克服上述问题。
发明内容
本发明的目的在于克服现有技术之缺陷,提供了一种数据搜索系统及方法,以实现提高搜索效率。
本发明是这样实现的:
第一方面,本发明提供一种数据搜索系统,所述系统包括获得模块、第一搜索模块以及第二搜索模块,其中,
所述获得模块,用于获得搜索请求,对所述搜索请求进行解析,得到搜索条件;
所述第一搜索模块,用于利用所述搜索条件查找预设的核心数据库,得到符合所述搜索条件的关键词,作为目标关键词;所述核心数据库用于存储各个关键词和各个关键词所符合的搜索条件;
所述第二搜索模块,用于利用所述目标关键词查找预设的专题数据库,得到目标关键词所关联的专题信息,所述专题数据库用于存储各个关键词所关联的专题信息,一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。
可选的,所述系统还包括显示模块,
所述显示模块,用于显示目标关键词和目标关键词所关联的专题信息。
可选的,所述系统还包括安全认证模块,
所述安全认证模块,用于在利用所述搜索条件查找预设的核心数据库之前,对所述搜索条件进行安全认证;若判定所述搜索条件通过安全认证,则执行利用所述搜索条件查找预设的核心数据库;若判定所述搜索条件未通过安全认证,则不执行利用所述搜索条件查找预设的核心数据库。
可选的,所述安全认证模块对所述搜索条件进行安全认证,具体为:
检测所述搜索条件所携带的字符中是否存在非法字符;
若所述搜索条件所携带的字符中存在非法字符,则判定所述搜索条件未通过安全认证;
若所述搜索条件所携带的字符中不存在非法字符,判断预设的黑名单中是否存在符合所述搜索条件的关键词;若存在,则判定所述搜索条件未通过安全认证;若不存在,则判断预设的红名单中是否存在符合所述搜索条件的关键词,若预设的红名单中不存在符合所述搜索条件的关键词,则判定所述搜索条件通过安全认证。
可选的,所述安全认证模块还用于:
若预设的红名单中存在符合所述搜索条件的关键词,检测在预设时长内是否接收到通过指令,若在预设时长内接收到通过指令,判定所述搜索条件通过安全认证;若在预设时长内未接收到通过指令,判定所述搜索条件未通过安全认证。
可选的,所述获得模块对所述搜索请求进行解析,得到搜索条件,具体为:
检测目标字符串中是否存在运算符,其中,目标字符串由所述搜索请求中的所有字符形成;
若不存在,确定搜索条件为对目标字符串进行模糊搜索;
若存在,按照所述目标字符串中运算符的优先级,对所述目标字符串进行拆分,得到各个子字符串,确定搜索条件为基于所存在的运算符对各个子字符串进行组合搜索。
可选的,所述获得模块获得搜索请求,具体为:
获得用户通过人机交互界面输入的字符,在接收到用户的提交指令后,基于用户输入的字符,生成搜索请求;或者,
获得用户通过终端设备发送的搜索请求。
可选的,所述获得模块获得用户通过人机交互界面输入的字符,具体为:
检测用户通过人机交互界面输入的字符,用所检测到的字符查找所述核心数据库,得到包含所检测字符的搜索条件,作为提示词,显示提示词,获得用户从所显示的提示词中选择的目标提示词,作为用户通过人机交互界面输入的字符。
可选的,所述第一搜索模块还用于;
针对目标关键词有多个的情况,在得到目标关键词后,若获得二次搜索请求,对所述二次搜索请求进行解析,得到二次搜索条件;
利用所述二次搜索条件查找所有目标关键词,得到符合所述二次搜索条件的目标关键词,作为最终关键词;
利用所述最终关键词查找预设的专题数据库,得到所述最终关键词所关联的专题信息。
第二方面,本发明提供一种数据搜索方法,所述方法包括:
获得搜索请求,对所述搜索请求进行解析,得到搜索条件;
用所述搜索条件查找预设的核心数据库,得到符合所述搜索条件的关键词,作为目标关键词;所述核心数据库用于存储各个关键词和各个关键词所符合的搜索条件;
用所述目标关键词查找预设的专题数据库,得到目标关键词所关联的专题信息,所述专题数据库用于存储各个关键词所关联的专题信息,一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。
本发明具有以下有益效果:应用本发明实施例,获得搜索请求,对搜索请求进行解析,得到搜索条件;用搜索条件查找预设的核心数据库,得到符合搜索条件的关键词,作为目标关键词;核心数据库用于存储各个关键词和各个关键词所符合的搜索条件;用目标关键词查找预设的专题数据库,得到目标关键词所关联的专题信息,专题数据库用于存储各个关键词所关联的专题信息,一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。
可见,本发明实现了对核心数据库和专题数据库的关联管理,能够把关键词关联的各个属性信息整合成专题信息,实现了对数据的关联搜索,提高了搜索效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的数据搜索系统的一种结构示意图;
图2为本发明实施例提供的数据搜索方法的一种流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为解决现有技术问题,本发明实施例提供了一种数据搜索系统及方法。下面首先对本发明所提供的一种数据搜索系统进行说明。
参见图1,图1为本发明实施例提供的一种数据搜索系统的结构示意图,系统包括获得模块101、第一搜索模块102以及第二搜索模块103,其中获得模块101,用于获得搜索请求,对所述搜索请求进行解析,得到搜索条件;
第一搜索模块102,用于利用所述搜索条件查找预设的核心数据库,得到符合所述搜索条件的关键词,作为目标关键词;所述核心数据库用于存储各个关键词和各个关键词所符合的搜索条件;
第二搜索模块103,用于利用所述目标关键词查找预设的专题数据库,得到目标关键词所关联的专题信息,所述专题数据库用于存储各个关键词所关联的专题信息,一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。
获得模块、第一搜索模块和第二搜索模块可以均为独立存在的物理实体,可以为同一种类型的物理实体,也可以为不同类型的物理实体。获得模块、第一搜索模块和第二搜索模块也可以为逻辑功能模块,当它们为逻辑功能模块时,可以将它们设置于同一个物理实体中,也可以将它们设置于不同的物理实体中,本发明实施例对它们的存在形态不做限定。
例如,获得模块可以为手机、平板电脑、个人电脑、计算机等终端设备中的一种,第一搜索模块和第二搜索模块可以均为独立存在的一台服务器,也可以为由多个服务器构成的服务器集群中的某台服务器。
另外,系统还可以包括数据采集模块和数据存储模块,数据采集模块可以实时采集到各类数据,也可以同步接收各类业务的原始数据,例如,可以采集每个人的个人信息和所拥有的车辆信息,个人信息可以包括身份证、年龄、性别、籍贯、亲友关系等等,车辆信息可以包括车辆的行驶轨迹、车辆的颜色、车辆的型号、车牌号、车主的身份证号等等。数据采集模块可以为每个采集数据都可以设置至少一个关键词和该关键词所符合的搜索条件,例如采集数据包括姓名张三、湖北武汉人、张三的身份证号码和和张三所拥有汽车的车牌号,姓名张三和/或湖北武汉人可以作为搜索条件,符合该搜索条件的关键词可以包括张三的身份证号码和张三所拥有汽车的车牌号。
数据存储模块可以获得并存储数据采集模块的采集数据,并基于所获得的采集数据建立数据索引信息与数据模型,例如,可以建立以身份证号和车牌号为关键字的核心数据库,针对每个身份证号/车牌号,还可以建立用于存储该身份证号/车牌号所关联的人员专题信息的人员专题数据库,建立用于存储该身份证号/车牌号所关联的车辆专题信息的汽车专题数据库。本发明可以按业务分为不同的专题库,分别建立空间索引,从而可以方便查询,提高了搜索速度。
核心数据库的数量可以有一个或多个,专题数据库也可以有一个或多个,每个专题数据库可以包括至少一个数据表,本发明对核心数据库和专题数据库的数量不做限定。
一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。专题可以根据设计人员的需求事先设定,例如,可以包括车辆专题和人员专题,关键词可以包括身份证号、车牌号等。
一个关键词可以关联至少一个专题信息,每个专题信息可以包括该专题的属性信息,例如人员专题可以包括身份证号码、年龄、性别、籍贯、亲友关系等属性信息,车辆专题可以包括车辆的行驶轨迹、车辆的颜色、车辆的型号、车牌号、车主的身份证号等属性信息。
示例性的,身份证号A关联的车辆专题信息包括:身份证号A所有者所拥有汽车的属性信息,例如汽车的颜色、汽车的型号、车牌号等等,身份证号A关联的人员专题信息包括:该身份证所有者的个人信息,例如年龄、性别、籍贯、亲友关系等等。
可见,应用本发明实施提供的技术方案,实现了对核心数据库和专题数据库的关联管理,能够把关键词关联的各个信息整合成专题信息,实现了对数据的关联搜索,提高了搜索效率。
一种实现方式中,获得模块对搜索请求进行解析,得到搜索条件,具体为:
检测目标字符串中是否存在运算符;
若不存在,确定搜索条件为对目标字符串进行模糊搜索;
若存在,按照所述目标字符串中运算符的优先级,对所述目标字符串进行拆分,得到各个子字符串,确定搜索条件为基于所存在的运算符对各个子字符串进行组合搜索。
其中,目标字符串由搜索请求中的所有字符形成,字符包括数字、大写字母、小写字母、汉字、通配符(如*、?)、运算符等等,运算符包括:与运算符,如“AND”、“&&”;或运算符,如“OR”、“||”;非(排除)运算符,如“NOT”、“-”;关系运算符,如“=”,“!=”。
示例性的,目标字符串为张三AND湖北武汉人,则子字符串包括张三和湖北武汉人,搜索条件为:基于与运算符对“张三”和“湖北武汉人”进行组合搜索;若目标字符串为张三,则对字符串张三进行模糊搜索。
模糊搜索可以搜索用户所输入字符的同义词,提高搜索的精确性。当用户的摸索目标不是很明确的时候,比如用户只知道要搜索的人的姓氏,而不知道具体名字的时候,利用模糊搜索可以只对姓氏进行匹配,而不查找全称。
与运算符和或运算符的优先级可以相同,且优先级可以高于关系运算符,关系运算符的优先级可以高于非运算符,当非运算符若为检索词的第一个字符时,检索结果为空。具体的,按照目标字符串中运算符的优先级,对目标字符串进行拆分,得到各个子字符串,可以为:
若目标字符串中运算符有多个,则按照运算符的优先级顺序,依次对目标字符串进行拆分,例如,目标字符串中运算符包括与运算符和非运算符,则先对目标字符串进行拆分,得到与运算符两端的字符串,作为两个子字符串,在对两个子字符串中包含非运算符的子字符串进行拆分,得到非运算符两个的两个字符串,直至各个子字符串中均不含运算符。
例如,目标字符串为:张三AND武汉NOT男,由于与运算符的优先级高于非运算符,则先拆分与运算符两端的字符串,得到“张三”和“武汉”,然后拆分非运算符,得到“男”,进而,确定搜索条件为:基于与运算符对“张三”、“武汉”进行组合搜索,和基于非运算符对第一搜索条件的搜索结果和“男”进行组合搜索。
若目标字符串中运算符仅有一个,则直接对目标字符串进行拆分,例如,目标字符串为:张三AND武汉,则拆分得到“张三”和“武汉两个子字符串。
可以利用正则表达式对各子字符串进行组合搜索,也可以利用现有的组合搜索算法进行搜索。
一种实现方式中,获得模块获得搜索请求,具体可以为:
获得用户通过人机交互界面输入的字符,在接收到用户的提交指令后,基于用户输入的字符,生成搜索请求;或者,
获得用户通过终端设备发送的搜索请求。
获得模块可以提供人机交互界面,从而用户可以通过人机交互界面输入的字符,用户输入完成后,可以点击人机交互界面的提交按钮,从而人机交互界面可以生成提交指令,获得模块可以获得提交指令,并基于用户输入的字符,生成搜索请求;或者,终端设备可以获得用户输入的字符,并用所获得的字符生成搜索请求,进而可以将搜索请求发送给获得模块,终端设备可以是手机、个人电脑、平板等具有通讯功能的电子设备。
为了便于用户输入字符,一种实现方式中,获得模块获得用户通过人机交互界面输入的字符,具体为:
检测用户通过人机交互界面输入的字符,用所检测到的字符查找所述核心数据库,得到包含所检测字符的搜索条件,作为提示词,显示提示词,获得用户从所显示的提示词中选择的目标提示词,作为用户通过人机交互界面输入的字符。
例如,用户输入“张”,则获得模块可以检测到“张”,并用“张”查找核心数据库,若核心数据库含有“张”字的搜索条件包括张三、张三三、张文,则张三、张三三、张文为提示词,人机交互界面可以显示张三、张三三、张文,从而用户可以从中选择自己所需的目标提示词。
另外,在其他实施方式中,提示词还可以包括与用户输入的拼音字符相同的汉字,例如,若用户输入zhangsan,提示词可以包括张三、章三、章散等等。
由于通配符不能作为检索词第一个非空白字符,为了引导用户正确的输入字符,若检测到用户输入的第一个字符为通配符,则显示无效输入的提示信息,该提示信息还可以显示通配符不能作为检索词第一个非空白字符的内容,从而,避免了用户输入的第一个字符为通配符的情况,实现了引导用户正确的输入字符。例如用户输入的第一个字符为通配符“?”,则显示无效输入的提示信息。
应用本发明实施例,人机交互界面可以显示提示词,从而可以从提示词中选择所需的目标词,加快了用户输入字符的速度,提高了用户输入字符的便捷度。
一种实现方式中,所述系统还包括显示模块,
所述显示模块,用于显示目标关键词和目标关键词所关联的专题信息。
另外在其他实现方式中,若用户是通过终端设备发送的搜索请求,显示模块还可以用于向终端设备发送目标关键词和目标关键词所关联的专题信息。
目标关键词所关联的专题信息可以包括多个,例如身份证关联的专题信息可以包括汽车专题信息和人员专题信息,用户还可以向获得模块发送专题选择指令,专题选择指令包括用户所选择的专题名称,从而显示模块可以获得专题选择指令,并按照用户选择的专题进行显示,从而便于用户查看所选专题的详细信息。例如,目标关键词为身份证号码,用户选择汽车专题,在显示模块只显示该身份证号码所关联的汽车专题信息,由于一个车主可以拥有多辆汽车,故一个身份证号码所关联的汽车专题信息可以有多个,故为了便于用户查看,显示模块还可以显示命中的专题信息的条数。
应用本发明实体,实现了海量数据的关联搜索,搜索速度快,能实现秒级响应,信息全,把零碎的数据整合成专题信息,便于给用户查阅。
一种实现方式中,为了提高搜索的安全性,所述系统还包括安全认证模块,
所述安全认证模块,用于在利用所述搜索条件查找预设的核心数据库之前,对所述搜索条件进行安全认证;若判定所述搜索条件通过安全认证,则执行用所述搜索条件查找预设的核心数据库;若判定所述搜索条件未通过安全认证,则不执行用所述搜索条件查找预设的核心数据库。
安全认证模块对所述搜索条件进行安全认证,具体可以为:
检测所述搜索条件所携带的字符中是否存在非法字符;
若所述搜索条件所携带的字符中存在非法字符,则判定所述搜索条件未通过安全认证;
若所述搜索条件所携带的字符中不存在非法字符,判断预设的黑名单中是否存在符合所述搜索条件的关键词;若存在,则判定所述搜索条件未通过安全认证;若不存在,则判断预设的红名单中是否存在符合所述搜索条件的关键词,若预设的红名单中不存在符合所述搜索条件的关键词,则判定所述搜索条件通过安全认证。
可以根据需求预先设定非法字符,非法字符可以包括转义字符(如\0,\t,\n等)、单引号、冒号等不能直接用来进行数据库查询的字符,若搜索条件所携带的字符中存在非法字符,表明无法用该搜索条件来查询数据库,故可以判定所述搜索条件未通过安全认证。
可以预先设置黑名单和红名单,黑名单和红名单中均可以包括一些关键词,处于黑名单的关键词可以是不允许搜索的关键词,当搜索条件命中黑名单中的关键词,即黑名单中存在符合搜索条件的关键词时,可以判定所述搜索条件未通过安全认证,并且还可以向用户反馈无搜索结果的提示信息,例如,显示无搜索结果的提示信息或者向用户所使用的终端设备发送该提示信息。
处于红名单的关键词可以是可能允许搜索的关键词,若搜索条件既未命中黑名单,也未命中红名单,则可以判定搜索条件通过安全认证,进而第一搜索模块可以执行利用所述搜索条件查找预设的核心数据库。
应用本发明实施例,可以对用户的查询内容进行监控和记录,通过设置黑名单和红名单,实现了对搜索内容的管控。
一种实现方式中,所述安全认证模块还可以用于:
若预设的红名单中存在符合所述搜索条件的关键词,检测在预设时长内是否接收到通过指令,若在预设时长内接收到通过指令,判定所述搜索条件通过安全认证;若在预设时长内未接收到通过指令,判定所述搜索条件未通过安全认证。
预设时长可以事先设定,例如可以为1小时、两小时,也可以为1天、两天等等。通过指令可以是具有审查权限的审查工作者通过设备发出的指令,当搜索条件命中红名单时,即红名单中存在符合搜索条件的关键词时,安全认证模块可以用红名单中符合搜索条件的关键词生成搜索记录,并将搜索记录反馈给审查工作者,若审查工作者认为该搜索记录合法,则可以通过终端设备或者人机交互界面向安全认证模块发送通过指令,否则,不向安全认证模块发送通过指令,进而安全认证模块可以向用户反馈无搜索结果的提示信息。
为了提高搜索的精确度,一种实现方式中,所述第一搜索模块还用于;
针对目标关键词有多个的情况,在得到目标关键词后,若获得二次搜索请求,对所述二次搜索请求进行解析,得到二次搜索条件;
用所述二次搜索条件查找所有目标关键词,得到符合所述二次搜索条件的目标关键词,作为最终关键词;
用所述最终关键词查找预设的专题数据库,得到最终关键词所关联的专题信息。
用户在首次发出搜索请求后,第一搜索模块可以搜索到目标关键词,系统可以显示目标关键词,若目标关键词数量太多,用户可以进一步发送二次搜索请求,具体方式可以为:获得模块提供人机交互界面,用户通过人机交互界面再次输入的字符,用户输入完成后,可以点击人机交互界面的二次搜索按钮,从而人机交互界面可以生成二次搜索指令,获得模块可以获得二次搜索指令,并基于用户再次输入的字符,生成二次搜索请求,并将二次搜索请求发送给第一搜索模块。
第一搜索模块对二次搜索请求进行解析得到二次搜索条件的方式与前述获得模块对搜索请求进行解析得到搜索条件的方式可以相同,在此不再赘述。
相应于上述数据搜索系统实施例,本发明实施例提供了一种数据搜索方法,参见图2所示,方法包括:
S201、获得搜索请求,对所述搜索请求进行解析,得到搜索条件;
S202、利用所述搜索条件查找预设的核心数据库,得到符合所述搜索条件的关键词,作为目标关键词;所述核心数据库用于存储各个关键词和各个关键词所符合的搜索条件;
S203、利用所述目标关键词查找预设的专题数据库,得到目标关键词所关联的专题信息,所述专题数据库用于存储各个关键词所关联的专题信息,一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。
可见,本发明实现了对核心数据库和专题数据库的关联管理,能够把关键词关联的各个信息整合成专题信息,实现了对数据的关联搜索,提高了搜索效率。
可选的,所述方法还包括:
显示目标关键词和目标关键词所关联的专题信息。
可选的,在利用所述搜索条件查找预设的核心数据库之前,所述方法还包括:
对所述搜索条件进行安全认证;
若判定所述搜索条件通过安全认证,则执行利用所述搜索条件查找预设的核心数据库的步骤;
若判定所述搜索条件未通过安全认证,则不执行利用所述搜索条件查找预设的核心数据库的步骤。
可选的,对所述搜索条件进行安全认证,包括:
检测所述搜索条件所携带的字符中是否存在非法字符;
若所述搜索条件所携带的字符中存在非法字符,则判定所述搜索条件未通过安全认证。
可选的,若所述搜索条件所携带的字符中不存在非法字符,所述方法还包括:
判断预设的黑名单中是否存在符合所述搜索条件的关键词;
若存在,则判定所述搜索条件未通过安全认证;
若不存在,则判断预设的红名单中是否存在符合所述搜索条件的关键词,若预设的红名单中不存在符合所述搜索条件的关键词,则判定所述搜索条件通过安全认证。
可选的,若预设的红名单中存在符合所述搜索条件的关键词,所述方法还包括:
检测在预设时长内是否接收到通过指令;
若在预设时长内接收到通过指令,判定所述搜索条件通过安全认证;
若在预设时长内未接收到通过指令,判定所述搜索条件未通过安全认证。
可选的,对所述搜索请求进行解析,得到搜索条件,包括:
检测目标字符串中是否存在运算符,其中,目标字符串由所述搜索请求中的所有字符形成;
若不存在,确定搜索条件为对目标字符串进行模糊搜索;
若存在,按照所述目标字符串中存在的运算符的优先级,对所述目标字符串进行拆分,得到各个子字符串,确定搜索条件为用所存在的预设运算符对各个子字符串进行组合搜索。
可选的,获得搜索请求,包括:
获得用户通过人机交互界面输入的字符,在接收到用户的提交指令后,基于用户输入的字符,生成搜索请求;或者,
获得用户通过终端设备发送的搜索请求。
可选的,获得用户通过人机交互界面输入的字符,包括:
检测用户通过人机交互界面输入的字符,用所检测到的字符查找所述核心数据库,得到包含所检测到的字符的搜索条件,作为提示词,显示提示词,获得用户从所显示的提示词中选择的目标提示词,作为用户通过人机交互界面输入的字符。
可选的,针对目标关键词有多个的情况,在得到目标关键词后,所述方法还包括;
若获得二次搜索请求,对所述二次搜索请求进行解析,得到二次搜索条件;
用所述二次搜索条件查找所有目标关键词,得到符合所述二次搜索条件的目标关键词,作为最终关键词;
用所述最终关键词查找预设的专题数据库,得到最终关键词所关联的专题信息。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据搜索系统,其特征在于,所述系统包括获得模块、第一搜索模块以及第二搜索模块,其中,
所述获得模块,用于获得搜索请求,对所述搜索请求进行解析,得到搜索条件;
所述第一搜索模块,用于利用所述搜索条件查找预设的核心数据库,得到符合所述搜索条件的关键词,作为目标关键词;所述核心数据库用于存储各个关键词和各个关键词所符合的搜索条件;
所述第二搜索模块,用于利用所述目标关键词查找预设的专题数据库,得到目标关键词所关联的专题信息,所述专题数据库用于存储各个关键词所关联的专题信息,一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。
2.根据权利要求1所述的系统,其特征在于,所述系统还包括显示模块,
所述显示模块,用于显示目标关键词和目标关键词所关联的专题信息。
3.根据权利要求1或2所述的系统,其特征在于,所述系统还包括安全认证模块,
所述安全认证模块,用于在利用所述搜索条件查找预设的核心数据库之前,对所述搜索条件进行安全认证;若判定所述搜索条件通过安全认证,则执行利用所述搜索条件查找预设的核心数据库;若判定所述搜索条件未通过安全认证,则不执行利用所述搜索条件查找预设的核心数据库。
4.根据权利要求3所述的系统,其特征在于,所述安全认证模块对所述搜索条件进行安全认证,具体为:
检测所述搜索条件所携带的字符中是否存在非法字符;
若所述搜索条件所携带的字符中存在非法字符,则判定所述搜索条件未通过安全认证;
若所述搜索条件所携带的字符中不存在非法字符,判断预设的黑名单中是否存在符合所述搜索条件的关键词;若存在,则判定所述搜索条件未通过安全认证;若不存在,则判断预设的红名单中是否存在符合所述搜索条件的关键词,若预设的红名单中不存在符合所述搜索条件的关键词,则判定所述搜索条件通过安全认证。
5.根据权利要求4所述的系统,其特征在于,所述安全认证模块还用于:
若预设的红名单中存在符合所述搜索条件的关键词,检测在预设时长内是否接收到通过指令,若在预设时长内接收到通过指令,判定所述搜索条件通过安全认证;若在预设时长内未接收到通过指令,判定所述搜索条件未通过安全认证。
6.根据权利要求1所述的系统,其特征在于,所述获得模块对所述搜索请求进行解析,得到搜索条件,具体为:
检测目标字符串中是否存在运算符,其中,目标字符串由所述搜索请求中的所有字符形成;
若不存在,确定搜索条件为对目标字符串进行模糊搜索;
若存在,按照所述目标字符串中运算符的优先级,对所述目标字符串进行拆分,得到各个子字符串,确定搜索条件为基于所存在的运算符对各个子字符串进行组合搜索。
7.根据权利要求1所述的系统,其特征在于,所述获得模块获得搜索请求,具体为:
获得用户通过人机交互界面输入的字符,在接收到用户的提交指令后,基于用户输入的字符,生成搜索请求;或者,
获得用户通过终端设备发送的搜索请求。
8.根据权利要求7所述的系统,其特征在于,所述获得模块获得用户通过人机交互界面输入的字符,具体为:
检测用户通过人机交互界面输入的字符,用所检测到的字符查找所述核心数据库,得到包含所检测字符的搜索条件,作为提示词,显示提示词,获得用户从所显示的提示词中选择的目标提示词,作为用户通过人机交互界面输入的字符。
9.根据权利要求1或2所述的系统,其特征在于,所述第一搜索模块还用于;
针对目标关键词有多个的情况,在得到目标关键词后,若获得二次搜索请求,对所述二次搜索请求进行解析,得到二次搜索条件;
利用所述二次搜索条件查找所有目标关键词,得到符合所述二次搜索条件的目标关键词,作为最终关键词;
利用所述最终关键词查找预设的专题数据库,得到所述最终关键词所关联的专题信息。
10.一种数据搜索方法,其特征在于,所述方法包括:
获得搜索请求,对所述搜索请求进行解析,得到搜索条件;
用所述搜索条件查找预设的核心数据库,得到符合所述搜索条件的关键词,作为目标关键词;所述核心数据库用于存储各个关键词和各个关键词所符合的搜索条件;
用所述目标关键词查找预设的专题数据库,得到目标关键词所关联的专题信息,所述专题数据库用于存储各个关键词所关联的专题信息,一个关键词所关联的专题信息包括该关键词针对该专题所关联的各个属性信息。
CN201810805203.6A 2018-07-20 2018-07-20 一种数据搜索系统及方法 Active CN110737677B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810805203.6A CN110737677B (zh) 2018-07-20 2018-07-20 一种数据搜索系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810805203.6A CN110737677B (zh) 2018-07-20 2018-07-20 一种数据搜索系统及方法

Publications (2)

Publication Number Publication Date
CN110737677A true CN110737677A (zh) 2020-01-31
CN110737677B CN110737677B (zh) 2023-05-05

Family

ID=69234807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810805203.6A Active CN110737677B (zh) 2018-07-20 2018-07-20 一种数据搜索系统及方法

Country Status (1)

Country Link
CN (1) CN110737677B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112163104A (zh) * 2020-09-29 2021-01-01 北京字跳网络技术有限公司 搜索目标内容的方法、装置、电子设备及存储介质
CN113591853A (zh) * 2021-08-10 2021-11-02 北京达佳互联信息技术有限公司 关键词提取方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930054A (zh) * 2012-11-19 2013-02-13 北京奇虎科技有限公司 数据搜索方法及系统
CN105354215A (zh) * 2015-09-28 2016-02-24 北京橙鑫数据科技有限公司 搜索方法和装置
CN105574090A (zh) * 2015-12-10 2016-05-11 北京中科汇联科技股份有限公司 一种敏感词过滤方法及系统
CN105786869A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于搜索获取问答专题数据的方法和装置
WO2016135970A1 (ja) * 2015-02-27 2016-09-01 楽天株式会社 検索システム、検索方法およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930054A (zh) * 2012-11-19 2013-02-13 北京奇虎科技有限公司 数据搜索方法及系统
CN105786869A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于搜索获取问答专题数据的方法和装置
WO2016135970A1 (ja) * 2015-02-27 2016-09-01 楽天株式会社 検索システム、検索方法およびプログラム
CN105354215A (zh) * 2015-09-28 2016-02-24 北京橙鑫数据科技有限公司 搜索方法和装置
CN105574090A (zh) * 2015-12-10 2016-05-11 北京中科汇联科技股份有限公司 一种敏感词过滤方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
傅明建: "一种基于Java Web的敏感词过滤方法研究与实现", 《智能计算机与应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112163104A (zh) * 2020-09-29 2021-01-01 北京字跳网络技术有限公司 搜索目标内容的方法、装置、电子设备及存储介质
WO2022068496A1 (zh) * 2020-09-29 2022-04-07 北京字跳网络技术有限公司 搜索目标内容的方法、装置、电子设备及存储介质
CN113591853A (zh) * 2021-08-10 2021-11-02 北京达佳互联信息技术有限公司 关键词提取方法、装置及电子设备
CN113591853B (zh) * 2021-08-10 2024-04-19 北京达佳互联信息技术有限公司 关键词提取方法、装置及电子设备

Also Published As

Publication number Publication date
CN110737677B (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN110929125B (zh) 搜索召回方法、装置、设备及其存储介质
CN106682150B (zh) 一种信息处理的方法及装置
US20160275148A1 (en) Database query method and device
EP2849082B1 (en) Icon password setting apparatus and icon password setting method using keyword of icon
CN110909531B (zh) 信息安全的甄别方法、装置、设备及存储介质
US20020107871A1 (en) Method and system for database migration and association
WO2007001128A1 (en) Method and system for determining relation between search terms in the internet search system
US20110295877A1 (en) System and method for online handwriting recognition in web queries
CN109492081B (zh) 文本信息搜索和信息交互方法、装置、设备及存储介质
CN113297457B (zh) 一种高精准性的信息资源智能推送系统及推送方法
CN107832618A (zh) 一种基于细粒度权限控制的sql注入检测系统及其方法
CN111586695B (zh) 短信识别方法及相关设备
CN112328936A (zh) 一种网站识别方法、装置、设备及计算机可读存储介质
US20230205824A1 (en) Contextual Clarification and Disambiguation for Question Answering Processes
CN107085568A (zh) 一种文本相似度判别方法及装置
CN105786974A (zh) 一种计算机数据储存查询系统
CN110737677B (zh) 一种数据搜索系统及方法
CN113377876B (zh) 基于Domino平台的数据分库处理方法、装置及平台
CN113326363A (zh) 搜索方法及装置、预测模型训练方法及装置、电子设备
CN111488622A (zh) 一种网页篡改行为的检测方法、装置及相关组件
US20220269683A1 (en) Generating search results utilizing access control
CN114090076A (zh) 应用程序的合规性判别方法和装置
CN110462605A (zh) 用于终端用户的本地剖析的方法和用于搜索私人信息的方法
CN116521776B (zh) 一种信息快速查询系统
CN112883727B (zh) 一种确定人物间关联关系的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant