CN115392226A - 检索方法、装置和存储介质 - Google Patents

检索方法、装置和存储介质 Download PDF

Info

Publication number
CN115392226A
CN115392226A CN202110562070.6A CN202110562070A CN115392226A CN 115392226 A CN115392226 A CN 115392226A CN 202110562070 A CN202110562070 A CN 202110562070A CN 115392226 A CN115392226 A CN 115392226A
Authority
CN
China
Prior art keywords
retrieval
search
formula
searching
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110562070.6A
Other languages
English (en)
Inventor
刘光雄
匡一依
曾梓泽
赵宏波
黄腾辉
刘祉萱
李汶钢
洪雨水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN202110562070.6A priority Critical patent/CN115392226A/zh
Publication of CN115392226A publication Critical patent/CN115392226A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种检索方法、装置和计算机存储介质,该方法包括以下步骤:接收到检索指令后,获取检索指令对应的检索语句;按照当前的检索语言对检索语句进行补全以得到检索式;按照检索式在数据源中进行检索以得到检索结果。解决了现有的信息安全行业存在检索繁琐的问题。

Description

检索方法、装置和存储介质
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种检索方法、装置和计算机存储介质。
背景技术
随着信息安全行业的快速发展,往往需要搜索大量日志。
但是目前检索的条件日益复杂,普通的界面选项难以满足需求,检索人员需要掌握比较专业的检索语言。例如,对于SPL(Sangfor Process Language)语言来说,SPL语言是深信服科技股份有限公司为了实现管道式查询而开发的一门查询搜索语言;在使用SPL语言进行检索时,需要使用SPL语言对应的检索格式进行检索,需要检索人员掌握SPL语言专业的检索格式。也可能会根据需要编写UDF(User Define Function,用户自定义函数),导致检索繁琐。
因此,现有的信息安全行业存在检索繁琐的问题。
发明内容
本发明主要目的在于提供一种检索方法、装置和计算机存储介质,旨在解决信息安全行业的检索存在用户学习成本高的问题。
为实现上述目的,本发明提供一种检索方法,所述检索方法包括以下步骤:
接收到检索指令后,获取所述检索指令对应的检索语句;
按照当前的检索语言对所述检索语句进行补全以得到检索式;
按照所述检索式在数据源中进行检索,以得到检索结果。
在一实施例中,所述按照补全后的检索式在数据源中进行检索,以得到检索结果的步骤包括:
对检索式进行解析,以得到解析结果;
根据所述解析结果对所述检索式进行调整;
按照调整后的所述检索式在数据源中进行检索,以得到所述检索结果。
在一实施例中,所述解析包括词法分析、语法分析以及语义分析中的至少一个,所述词法分析包括判断所述检索式中的关键词与关键词库中的关键词是否匹配,所述语法分析包括判断所述检索式中关键词的顺序是否正确;所述语义分析包括生成所述语句信息对应的语义树,对所述语义树进行语义分析,得到语义分析结果。
在一实施例中,所述根据所述解析结果对所述检索式进行调整的步骤包括:
在所述解析结果包括所述关键词不匹配时,删除所述检索式中不匹配的关键词,或者将所述检索式中不匹配的关键词调整为所述关键词库中的目标关键词;
在所述解析结果包括所述关键词的顺序不正确时,调整所述检索式中关键词的顺序。
在一实施例中,所述按照所述检索式在数据源中进行检索,以得到检索结果的步骤包括:
将所述检索式的语言转换为各个数据源对应的语言;
采用每个所述数据源对应的语言的所述检索式在每个所述数据源中进行检索,以得到所述检索结果。
在一实施例中,所述按照当前的检索语言对所述检索语句进行补全以得到检索式的步骤包括:
按照当前的检索语言添加时间字段对应的检索式补全所述检索语句以得到检索式。
在一实施例中,所述按照当前的检索语言对所述检索语句进行补全以得到检索式的步骤包括:
按照当前的检索语言添加聚合字段对应的检索式补全所述检索语句以得到检索式。
在一实施例中,所述根据所述解析结果向预设数据源发起检索请求,得到检索结果的步骤之后,还包括:
对所述检索结果进行格式化处理,生成表单形式的数据。
为实现上述目的,本发明还提供一种检索装置,所述装置包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的检索程序,所述检索程序被所述处理器执行时实现如上所述的检索方法的各个步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有检索程序,所述检索程序被处理器执行时实现如上所述的检索方法的各个步骤。
本发明提供的检索方法、装置和计算机存储介质,检索中心接收到检索指令后,获取检索指令对应的检索语句;按照当前的检索语言对检索语句进行补全以得到检索式;检索人员在进行检索时,不用输入检索语言对应的专业检索式,检索中心会补全检索式,按照检索式在数据源中进行检索,以得到检索结果。使用本发明提供的检索方法,检索人员在进行检索时,不需要掌握专业的检索语言,而且不需要编写用户自定义函数;从而解决了现有的信息安全行业存在检索繁琐的问题。
附图说明
图1是本发明实施例方案涉及的装置的硬件架构示意图;
图2为本发明检索方法的第一实施例的流程示意图;
图3为本发明检索方法的第二实施例的流程示意图;
图4为本发明检索方法的第三实施例的流程示意图;
图5为本发明检索方法第四实施例的流程示意图;
图6为本发明检索方法第五实施例的流程示意图;
图7为本发明检索方法第六实施例的流程示意图;
图8为本发明检索方法第七实施例的流程示意图;
图9为使用SPL语言检索的工作流程示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:检索中心接收到检索指令后,获取检索指令对应的检索语句;按照当前的检索语言对检索语句进行补全以得到检索式;检索人员在进行检索时,不用输入检索语言对应的专业检索式,检索中心会补全检索式,按照检索式在数据源中进行检索,以得到检索结果。使用本发明提供的检索方法,检索人员在进行检索时,不需要掌握专业的检索语言,而且不需要编写用户自定义函数;从而解决了现有的信息安全行业存在检索繁琐的问题。
作为一种实现方式,可以如图1所示,图1是本发明实施例方案涉及的装置的硬件架构示意图。
本发明实施例方案涉及的是检索装置,装置包括:处理器101,例如CPU,存储器102,通信总线103。其中,通信总线103用于实现这些组件之间的连接通信。
存储器102可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。如图1所示,作为一种计算机存储介质的存储器102中可以包括检索程序;而处理器101可以用于调用存储器102中存储的检索程序,并执行以下操作:
接收到检索指令后,获取所述检索指令对应的检索语句;
按照当前的检索语言对所述检索语句进行补全以得到检索式;
按照所述检索式在数据源中进行检索,以得到检索结果。
在一实施例中,处理器101可以用于调用存储器102中存储的检索程序,并执行以下操作:
对检索式进行解析,以得到解析结果;
根据所述解析结果对所述检索式进行调整;
按照调整后的所述检索式在数据源中进行检索,以得到所述检索结果。
在一实施例中,所述解析包括词法分析、语法分析以及语义分析中的至少一个,所述词法分析包括判断所述检索式中的关键词与关键词库中的关键词是否匹配,所述语法分析包括判断所述检索式中关键词的顺序是否正确;所述语义分析包括生成所述语句信息对应的语义树,对所述语义树进行语义分析,得到语义分析结果。
在一实施例中,处理器101可以用于调用存储器102中存储的检索程序,并执行以下操作:
在所述解析结果包括所述关键词不匹配时,删除所述检索式中不匹配的关键词,或者将所述检索式中不匹配的关键词调整为所述关键词库中的目标关键词;
在所述解析结果包括所述关键词的顺序不正确时,调整所述检索式中关键词的顺序。
在一实施例中,处理器101可以用于调用存储器102中存储的检索程序,并执行以下操作:
将所述检索式的语言转换为各个数据源对应的语言;
采用每个所述数据源对应的语言的所述检索式在每个所述数据源中进行检索,以得到所述检索结果。
在一实施例中,处理器101可以用于调用存储器102中存储的检索程序,并执行以下操作:
按照当前的检索语言添加时间字段对应的检索式补全所述检索语句以得到检索式。
在一实施例中,处理器101可以用于调用存储器102中存储的检索程序,并执行以下操作:
按照当前的检索语言添加聚合字段对应的检索式补全所述检索语句以得到检索式。
在一实施例中,处理器101可以用于调用存储器102中存储的检索程序,并执行以下操作:
对所述检索结果进行格式化处理,生成表单形式的数据。
本实施例根据上述方案,检索中心接收到检索指令后,获取检索指令对应的检索语句;按照当前的检索语言对检索语句进行补全以得到检索式;检索人员在进行检索时,不用输入检索语言对应的专业检索式,检索中心会补全检索式,按照检索式在数据源中进行检索,以得到检索结果。使用本发明提供的检索方法,检索人员在进行检索时,不需要掌握专业的检索语言,而且不需要编写用户自定义函数;从而解决了现有的信息安全行业存在检索繁琐的问题。
基于上述装置的硬件构架,提出本发明检索方法的实施例。
参照图2,图2为本发明检索方法的第一实施例,所述检索方法包括以下步骤:
步骤S10,接收到检索指令后,获取所述检索指令对应的检索语句。
在本实施例中,检索中心接收到检索指令后,获取检索指令对应的检索语句。检索语句取决于使用的检索语言,例如,可将检索语言优选为SPL语言,则检索语句为SPL语句,SPL检索语句的标准格式为:search cluster.index|filter攻击源IP=55.1.1.1AND攻击类型=暴力破解攻击。而在此只需要获取检索人员输入的攻击源IP=55.1.1.1AND攻击类型=暴力破解攻击即可。SPL(Sangfor Process Language):是深信服科技股份有限公司为了实现管道式查询而开发的一门查询搜索语言。检索中心指的是使用SPL语言而开发的SPL检索中心,SPL作为一门检索语言,需要指定的界面来承载SPL的输入。因此检索中心提供了SPL的输入框,用户可以在输入框中输入SPL。
步骤S20,按照当前的检索语言对所述检索语句进行补全以得到检索式。
在本实施例中,检索中心按照当前的检索语言对检索语句进行补全以得到检索式。例如,获取的SPL语句为攻击源IP=55.1.1.1AND攻击类型=暴力破解攻击,则检索中心按照SPL语言的格式将SPL语句补全为:search cluster.index|filter攻击源IP=55.1.1.1AND攻击类型=暴力破解攻击。
步骤S30,按照所述检索式在数据源中进行检索,以得到检索结果。
在本实施例中,数据源是指数据库应用程序所使用的数据库或者数据库服务器。数据源(Data Source)顾名思义,数据的来源,是提供某种所需要数据的器件或原始媒体。在数据源中存储了所有建立数据库连接的信息。就像通过指定文件名称可以在文件系统中找到文件一样,通过提供正确的数据源名称,你可以找到相应的数据库连接。
检索中心按照检索式在数据源中进行检索,以得到检索结果。
在本实施例提供的技术方案中,检索中心接收到检索指令后,获取检索指令对应的检索语句;按照当前的检索语言对检索语句进行补全以得到检索式;检索人员在进行检索时,不用输入检索语言对应的专业检索式,检索中心会补全检索式,按照检索式在数据源中进行检索,以得到检索结果。使用本发明提供的检索方法,检索人员在进行检索时,不需要掌握专业的检索语言,而且不需要编写UDF(User Define Function):用户自定义函数,用于扩展原生语言因为自身功能的不足,而由用户自己编写的函数;从而解决了现有的信息安全行业存在检索繁琐的问题。
参照图3,图3为本发明检索方法的第二实施例,基于第一实施例提出本发明第二实施例,在本实施例中步骤S30包括:
步骤S31,对检索式进行解析,以得到解析结果。
在本实施例中,检索中心的解析层专用于解析检索式,解析包括词法分析、语法分析以及语义分析中的至少一个,词法分析包括判断检索式中的关键词与关键词库中的关键词是否匹配,例如,search cluster.index|filter攻击源IP=55.1.1.1AND攻击类型=暴力破解攻击此SPL语句的关键词包括:search、filter、AND,检索中心的关键词库将将这些关键词进行一一比对,从而判断检索式中的关键词与关键词库中的关键词是否匹配。关键词库是本领域技术人员在开发检索中心时预先存储检索语言对应的关键词。语法分析包括判断所述检索式中关键词的顺序是否正确;比如检索式search cluster.table|filteripType="ipv4"|agg count(id)BY srcIp|limit 10,关键词的顺序侧重关键词前后的约束,比如limit(限制)不能放到filter(过滤)和agg(聚合)前面,形成searchcluster.table|limit 10|filter ipType="ipv4"|agg count(id)BY srcIp这样的检索式。语义分析包括生成语句信息对应的语义树,对语义树进行语义分析,得到语义分析结果。语义树是由关键词和关键词对应的内容组成,语义分析结果:检索中心根据关键词和关键词对应的内容可以推断想要完成的功能,本质上还是一颗语义树。
步骤S32,根据所述解析结果对所述检索式进行调整。
在本实施例中,检索中心的解析层根据解析结果对检索式进行调整,例如,删除关键词、更正关键词和调整关键词顺序等。
步骤S33,按照调整后的所述检索式在数据源中进行检索,以得到所述检索结果。
在本实施例中,检索中心的处理层按照调整后的检索式在数据源中进行检索,以得到检索结果。
在本实施例提供的技术方案中,检索中心的解析层对检索式解析,解析包括词法分析、语法分析以及语义分析中的至少一个,词法分析包括判断检索式中的关键词与关键词库中的关键词是否匹配,语法分析包括判断检索式中关键词的顺序是否正确;根据解析结果对检索式进行调整,例如,删除关键词、更正关键词和调整关键词顺序等;检索中心的处理层按照调整后的检索式在数据源中进行检索,以得到检索结果。
参照图4,图4为本发明检索方法的第三实施例,基于第二实施例提出本发明第三实施例,在本实施例中步骤S32包括:
步骤S321,在所述解析结果包括所述关键词不匹配时,删除所述检索式中不匹配的关键词,或者将所述检索式中不匹配的关键词调整为所述关键词库中的目标关键词。
在本实施例中,检索中心的解析层的解析结果包括关键词不匹配时,例如,补全的关键词正确描述的是search,filter,agg,limit;但解析结果为seach,flter,aggr,limits。则可以删除检索式中不匹配的关键词,或者将检索式中不匹配的关键词调整为关键词库中的目标关键词。
步骤S322,在所述解析结果包括所述关键词的顺序不正确时,调整所述检索式中关键词的顺序。
在本实施例中,检索中心的解析层的解析结果包括关键词的顺序不正确时,例如检索式search cluster.table|limit 10|filter ipType="ipv4"|agg count(id)BYsrcIp,调整检索式中关键词的顺序:search cluster.table|filter ipType="ipv4"|aggcount(id)BY srcIp|limit 10。
参照图5,图5为本发明检索方法的第四实施例,基于第一实施例提出本发明第四实施例,在本实施例中步骤S30包括:
步骤S34,将所述检索式的语言转换为各个数据源对应的语言。
在本实施例中,检索中心的处理层将检索式的语言转换为各个数据源对应的语言。例如,当前检索式的语言为SPL语言,数据源为Elasticsearch,Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulweb接口。在SPL语言中过滤字段为filter,在Elasticsearch数据源中过滤字段为query,则将检索式中的filter同语义转换为Elasticsearch领域特定语言(DSL)领域特定语言query即可。DSL:为了满足特定领域的特定需求,不同厂商会定义特定的语言,这些语言总称DSL。
步骤S35,采用每个所述数据源对应的语言的所述检索式在每个所述数据源中进行检索,以得到所述检索结果。
在本实施例中,检索中心的处理层采用每个数据源对应的语言的检索式在每个数据源中进行检索,得到检索结果。
在本实施例提供的技术方案中,检索中心的处理层将检索式的语言转换为各个数据源对应的语言;采用每个数据源对应的语言的检索式在每个数据源中进行检索,得到检索结果。有效的降低了检索人员检索数据源的门槛,使用本发明提供的SPL检索中心即可向各个数据源获得检索结果。
参照图6,图6为本发明检索方法的第五实施例,基于第一实施例提出本发明第五实施例,在本实施例中步骤S20包括:
步骤S21,按照当前的检索语言添加时间字段对应的检索式补全所述检索语句以得到检索式。
在本实施例中,检索中心的预处理层按照当前的检索语言添加时间字段对应的检索式补全检索语句以得到检索式。因为检索人员在检索时会搜索到大量的数据,但一般仅利用其中一段时间的数据,因此,在当前的检索语言对应的检索式添加时间字段对应的检索式以补全检索语句以得到检索式。例如,添加时间字段形成:search cluster.index|filter occurTime>2020-12-19and filter occurTime<=2021-01-19|filter攻击源IP=55.1.1.1AND攻击类型=暴力破解攻击;表明查找在2020-12-19到2021-01-19时间段内攻击源IP=55.1.1.1AND攻击类型=暴力破解攻击的日志。检索人员在检索中心的用户界面上可选择这个时间范围。
需要说明的是,检索中心还具有收藏功能,在检索人员输入检索语句后,自动收藏该检索记录,例如,可优选收藏一个月内的检索记录。当检索人员输入相关的检索语句时,直接通过历史检索记录补全检索语句形成检索式进行检索。提高了检索人员对历史检索记录的再利用。
在本实施例提供的技术方案中,检索中心的预处理层按照当前的检索语言添加时间字段对应的检索式补全检索语句以得到检索式。通过添加时间字段补全检索语句,减少了检索人员输入检索语句的长度,而且得到的检索结果是一段时间内的,检索人员能迅速获取想要查找的数据。
参照图7,图7为本发明检索方法的第六实施例,基于第一实施例提出本发明第六实施例,在本实施例中步骤S20包括:
步骤S22,按照当前的检索语言添加聚合字段对应的检索式补全所述检索语句以得到检索式。
在本实施例中,检索中心的预处理层按照当前的检索语言添加聚合字段对应的检索式补全检索语句以得到检索式。例如,search cluster.index|filter occurTime>2020-12-19and filter occurTime<=2021-01-19|filter攻击源IP=55.1.1.1AND攻击类型=暴力破解攻击|agg count(occurTime)BY occurTime:[date:1d]。
在本实施例提供的技术方案中,检索中心的预处理层按照当前的检索语言添加聚合字段对应的检索式补全检索语句以得到检索式,减少了检索人员输入检索语句的长度。通过添加聚合字段的方式将同类型的数据聚合在一起,方便检索人员获取想要查找的数据。
参照图8,图8为本发明检索方法的第七实施例,基于第一实施例提出本发明第七实施例,在本实施例中步骤S30的步骤之后,还包括:
步骤S40,对所述检索结果进行格式化处理,生成表单形式的数据。
在本实施例中,检索中心的处理层对检索结果进行格式化处理,生成表单形式的数据。例如,Elasticsearch数据源返回的结果为JSON格式,展示也不够整洁,因此对JSON格式的结果再次格式化,变为表单形式的数据。
在本实施例提供的技术方案中,检索中心的处理层对检索结果进行格式化处理,生成表单形式的数据,方便检索人员阅读。
当利用基于SPL语言进行检索时,参照图9,图9为使用SPL语言检索的工作流程示意图。基于SPL的检索中心,按照处理流程可以划分为四层,分别是检索中心SPL访问层,检索中心SPL预处理层,检索中心SPL解析层,检索中心SPL处理层。每一层对有特定的处理逻辑。本发明给用户提供一种简单易懂的SPL语言进行日志检索,用户可以通过输入简单的命令完成复杂的计算。用户只要在检索栏中填写检索语句,再点击搜索按钮,即可完成数据检索。
本发明还提供一种检索装置,所述装置包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的检索程序,所述检索程序被所述处理器执行时实现如上所述的检索方法的各个步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有检索程序,所述检索程序被处理器执行时实现如上所述的检索方法的各个步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种检索方法,其特征在于,所述检索方法包括以下步骤:
接收到检索指令后,获取所述检索指令对应的检索语句;
按照当前的检索语言对所述检索语句进行补全以得到检索式;
按照所述检索式在数据源中进行检索,以得到检索结果。
2.如权利要求1所述的检索方法,其特征在于,所述按照补全后的检索式在数据源中进行检索,以得到检索结果的步骤包括:
对检索式进行解析,以得到解析结果;
根据所述解析结果对所述检索式进行调整;
按照调整后的所述检索式在数据源中进行检索,以得到所述检索结果。
3.如权利要求2所述的检索方法,其特征在于,所述解析包括词法分析、语法分析以及语义分析中的至少一个,所述词法分析包括判断所述检索式中的关键词与关键词库中的关键词是否匹配,所述语法分析包括判断所述检索式中关键词的顺序是否正确;所述语义分析包括生成所述语句信息对应的语义树,对所述语义树进行语义分析,得到语义分析结果。
4.如权利要求3所述的检索方法,其特征在于,所述根据所述解析结果对所述检索式进行调整的步骤包括:
在所述解析结果包括所述关键词不匹配时,删除所述检索式中不匹配的关键词,或者将所述检索式中不匹配的关键词调整为所述关键词库中的目标关键词;
在所述解析结果包括所述关键词的顺序不正确时,调整所述检索式中关键词的顺序。
5.如权利要求1所述的检索方法,其特征在于,所述按照所述检索式在数据源中进行检索,以得到检索结果的步骤包括:
将所述检索式的语言转换为各个数据源对应的语言;
采用每个所述数据源对应的语言的所述检索式在每个所述数据源中进行检索,以得到所述检索结果。
6.如权利要求1所述的检索方法,其特征在于,所述按照当前的检索语言对所述检索语句进行补全以得到检索式的步骤包括:
按照当前的检索语言添加时间字段对应的检索式补全所述检索语句以得到检索式。
7.如权利要求1所述的检索方法,其特征在于,所述按照当前的检索语言对所述检索语句进行补全以得到检索式的步骤包括:
按照当前的检索语言添加聚合字段对应的检索式补全所述检索语句以得到检索式。
8.如权利要求1所述的检索方法,其特征在于,所述根据所述解析结果向预设数据源发起检索请求,得到检索结果的步骤之后,还包括:
对所述检索结果进行格式化处理,生成表单形式的数据。
9.一种检索装置,其特征在于,所述装置包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的检索程序,所述检索程序被所述处理器执行时实现如权利要求1-8任一项所述的检索方法的各个步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有检索程序,所述检索程序被处理器执行时实现如权利要求1-8任一项所述的检索方法的各个步骤。
CN202110562070.6A 2021-05-24 2021-05-24 检索方法、装置和存储介质 Pending CN115392226A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110562070.6A CN115392226A (zh) 2021-05-24 2021-05-24 检索方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110562070.6A CN115392226A (zh) 2021-05-24 2021-05-24 检索方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN115392226A true CN115392226A (zh) 2022-11-25

Family

ID=84114142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110562070.6A Pending CN115392226A (zh) 2021-05-24 2021-05-24 检索方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN115392226A (zh)

Similar Documents

Publication Publication Date Title
US8849840B2 (en) Quick find for data fields
Laender et al. A brief survey of web data extraction tools
WO2020028527A1 (en) Open-source software vulnerability analysis
CN110555153A (zh) 一种基于领域知识图谱的问答系统及其构建方法
US10803061B2 (en) Software vulnerability graph database
CN109408811B (zh) 一种数据处理方法及服务器
US9275155B1 (en) Querying across a composite join of multiple database tables using a search engine index
US8788464B1 (en) Fast ingest, archive and retrieval systems, method and computer programs
US10437824B2 (en) Querying across a composite join of multiple database tables using a search engine index
US20200104241A1 (en) Behavior driven development integration with test tool
US20110106836A1 (en) Semantic Link Discovery
CN110442847B (zh) 基于代码仓库过程管理的代码相似性检测方法及装置
CN113190687A (zh) 知识图谱的确定方法、装置、计算机设备及存储介质
Ba et al. Uncertain version control in open collaborative editing of tree-structured documents
CN113297251A (zh) 多源数据检索方法、装置、设备及存储介质
CN101727451B (zh) 信息提取方法和装置
CN115392226A (zh) 检索方法、装置和存储介质
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
CN114676155A (zh) 代码提示信息的确定方法、数据集的确定方法及电子设备
JP2023502434A (ja) 迅速なデータ探索のためのユニバーサルデータインデックス
US20030028370A1 (en) System and method for providing a fixed grammar to allow a user to create a relational database without programming
CN115600556B (zh) 一种文档的目录信息推荐方法及系统
CN114969131B (zh) 一种信息的查询方法、装置及设备
CN113220800B (zh) 基于antlr的数据字段血缘分析方法及装置
US20240193135A1 (en) Systems, methods, and media for accessing derivative properties from a post relational database utilizing a logical schema instruction that includes a base object identifier

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination