CN114372082A - 基于人工智能的数据查询方法、装置、电子设备及介质 - Google Patents
基于人工智能的数据查询方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN114372082A CN114372082A CN202210039468.6A CN202210039468A CN114372082A CN 114372082 A CN114372082 A CN 114372082A CN 202210039468 A CN202210039468 A CN 202210039468A CN 114372082 A CN114372082 A CN 114372082A
- Authority
- CN
- China
- Prior art keywords
- query
- data
- node
- determining
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 43
- 238000007637 random forest analysis Methods 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 43
- 238000003066 decision tree Methods 0.000 claims description 46
- 230000008569 process Effects 0.000 claims description 33
- 238000012549 training Methods 0.000 claims description 32
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000012015 optical character recognition Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及人工智能技术领域,提供一种基于人工智能的数据查询方法、装置、电子设备及介质,所述方法包括:对待处理的查询数据进行结构化处理,得到结构化查询文本;提取所述结构化查询文本中的多个查询关键词;调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签;基于关系预测模型,确定每两个所述查询标签之间的依赖关系;根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词;对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。本申请提高了数据查询的效率。
Description
技术领域
本申请涉及人工智能技术领域,具体涉及一种基于人工智能的数据查询方法、装置、电子设备及介质。
背景技术
随着大数据时代的来临,数据量暴涨。一个数据查询任务中可能包含着多个查询内容,每个查询内容对应着不同的查询结果。系统会按照数据查询任务中查询内容所在的位置,依次进行查询数据任务中对应的每个查询内容对应的结果,得到该数据查询任务对应的结果。
针对多个查询内容的情况,如果某个或多个查询内容查询时间异常增多,会导致整体查询时间过长,数据查询效率低。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的数据查询方法、装置、电子设备及介质,提高了数据查询的效率。
第一方面,本申请提供了一种基于人工智能的数据查询方法,所述方法包括:
对待处理的查询数据进行结构化处理,得到结构化查询文本;
提取所述结构化查询文本中的多个查询关键词;
调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签;
基于关系预测模型,确定每两个所述查询标签之间的依赖关系;
根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词;
对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。
根据本申请的一个可选的实施方式,所述提取所述结构化查询文本中的多个查询关键词包括:
对所述结构化查询文本中每个句子进行分词处理,得到信息分词;
确定所述信息分词在所述信息分词所在的句子中的目标词性,并将所述目标词性为预设词性的信息分词确定为待选分词;
将所述待选分词与预设关键词数据库中的关键词进行匹配,并将与所述关键词匹配成功的待选分词确定为查询关键词。
根据本申请的一个可选的实施方式,所述随机森林模型的训练过程包括:
获取多个历史查询关键词,作为训练数据集;
从所述训练数据集中随机抽取M个训练样本集;
对所述M个训练样本集进行学习,以此生成M个决策树,并在所述M个决策树的生成过程中,从M个决策树的特征变量中随机抽取N个特征变量,各个决策树利用所述N个特征变量上最优的分裂方式来分支,且N值在随机森林模型的形成过程中设定为恒定常数;
当满足分支规则时,停止所述M个决策树的生成过程,得到所述随机森林模型。
根据本申请的一个可选的实施方式,所述M个决策树的生成过程包括:
随机地给每个所述特征变量加入噪声干扰;
依据准确率降低的程度来确定每个所述特征变量的重要度;
依据所述重要度对所述M个决策树的生成过程进行优化。
根据本申请的一个可选的实施方式,所述根据所述依赖关系,构建所述查询数据对应的查询树包括:
将所述查询标签中不存在依赖关系的查询标签对应的查询关键词确定为第一节点;
将所述查询标签中存在依赖关系的查询标签对应的查询关键词确定为第二节点;
根据所述第二节点的依赖关系,确定每个第二节点对应的节点层级;
基于所述第一节点和所述第二节点对应的节点层级,构建所述查询数据对应的查询树。
根据本申请的一个可选的实施方式,所述依次对每个节点的查询关键词进行数据查询包括:
获取对节点的查询关键词进行数据查询的目标查询时间;
基于所述节点的查询关键词进行数据查询的开始时刻和结束时刻,计算所述节点的查询关键词对应的实际查询时间;
计算所述目标查询时间和所述实际查询时间的差值,若所述差值大于预设时间阈值,生成异常提示。
根据本申请的一个可选的实施方式,对待处理的查询数据进行结构化处理之前,所述方法还包括:
确定所述待处理的查询数据对应的数据查询请求;
获取所述数据查询请求的源地址,并根据所述源地址确定触发终端;
获取所述数据查询请求的发送时间,并从所述触发终端中获取与所述发送时间对应的日志列表;
获取所述日志列表中的登录账号,并将与所述登录账号对应的用户确定为所述查询用户;
判断所述查询用户是否具有对所述数据查询请求的所述查询权限。
第二方面,本申请提供了一种基于人工智能的数据查询装置,所述装置包括:
数据处理模块,用于对待处理的查询数据进行结构化处理,得到结构化查询文本;
文本提取模块,用于提取所述结构化查询文本中的多个查询关键词;
标签预测模块,用于调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签;
关系预测模块,用于基于关系预测模型,确定每两个所述查询标签之间的依赖关系;
节点确定模块,用于根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词;
数据查询模块,用于对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。
第三方面,本申请提供了一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的基于人工智能的数据查询方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于人工智能的数据查询方法。
综上所述,本申请所述的基于人工智能的数据查询方法、装置、电子设备及介质,通过对待处理的查询数据进行结构化处理,得到结构化查询文本;提取所述结构化查询文本中的多个查询关键词,并调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签,基于关系预测模型,确定每两个所述查询标签之间的依赖关系,依赖关系用于确定每个查询关键词对应的查询先后,可提高后续构建查询关键树的速率。根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词,基于查询树可以对查询数据中的查询关键字进行并行处理。对所述查询树进行逐层遍历,依次对每个节点上查询关键词进行数据查询,得到所述查询数据对应的查询结果,基于查询树进行查询能够实现并行处理,本申请可以提高数据查询的速率。
附图说明
图1是本申请实施例一提供的基于人工智能的数据查询方法的流程图。
图2是本申请实施例二提供的基于人工智能的数据查询装置的结构图。
图3是本申请实施例三提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施例对本申请进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述在一个可选的实施方式中实施例的目的,不是旨在于限制本申请。
本申请实施例提供的基于人工智能的数据查询方法由电子设备执行,相应地,基于人工智能的数据查询装置运行于电子设备中。所述电子设备可以包括手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等。
本申请实施例可以基于人工智能技术对待处理的查询数据进行处理,提高了数据查询的效率。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
实施例一
图1是本申请实施例一提供的基于人工智能的数据查询方法的流程图。所述基于人工智能的数据查询方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,对待处理的查询数据进行结构化处理,得到结构化查询文本。
其中,待处理的查询数据为非结构化的查询文本,例如,图片格式,PDF格式。所述查询文本中记录了待查询的多个查询内容。
电子设备可以使用光学字符识别(Optical Character Recognition,OCR)技术对非结构化的待处理的查询数据进行OCR识别,将图片格式或者PDF格式的待处理的查询数据转化为可编辑的字体格式,然后将转换后的字体复制在空文本中,从而得到结构化的查询数据。将图片格式或者PDF格式的待处理的查询数据转化为可编辑的字体格式的过程中,可以基于预设的条件,在结构化的查询数据中加入标点符号。例如,图片格式或PDF格式中,每个方框内的内容转换完成后,在方框内的内容后加入句号。
在一个可选的实施方式中,对待处理的查询数据进行结构化处理之前,所述方法还包括:
确定所述待处理的查询数据对应的数据查询请求;
获取所述数据查询请求的源地址,并根据所述源地址确定触发终端;
获取所述数据查询请求的发送时间,并从所述触发终端中获取与所述发送时间对应的日志列表;
获取所述日志列表中的登录账号,并将与所述登录账号对应的用户确定为所述查询用户;
判断所述查询用户是否具有对所述数据查询请求的所述查询权限。
若所述查询用户具有对所述数据查询请求的所述查询权限,对待处理的查询数据进行结构化处理,得到结构化查询文本。若所述查询用户不具有对所述数据查询请求的所述查询权限,结束流程。通过对用户身份进行验证,可以提高数据的安全性。
所述查询用户是指触发所述数据查询请求生成的用户。通过上述实施方式,由于地址与终端存在映射关系,因此,通过所述源地址能够准确确定出所述触发终端,进一步地,根据所述发送时间能够快速确定出所述日志列表,进而由于账号与用户存在映射关系,因此,能够快速确定出所述查询用户。
S12,提取所述结构化查询文本中的多个查询关键词。
可以使用词频-逆文本频率指数(term frequency–inverse documentfrequency,TF-IDF)提取结构化查询文本中的查询关键词。
在一个可选的实施方式中,所述提取所述结构化查询文本中的多个目标关键词包括:
对所述结构化查询文本中每个句子进行分词处理,得到信息分词;
确定所述信息分词在所述信息分词所在的句子中的目标词性,并将所述目标词性为预设词性的信息分词确定为待选分词;
将所述待选分词与预设关键词数据库中的关键词进行匹配,并将与所述关键词匹配成功的待选分词确定为查询关键词。
对结构化查询文本中每个句子进行分词处理,得到信息分词。所述目标词性是指所述信息分词在句子中所充当的角色,例如,所述目标词性为名词,所述目标词性为动词等。所述预设词性可以根据大数据分析后确定的,所述预设词性可以设置为名词,本发明对所述预设词性的具体确定方式不作阐述。例如,预设词性可以设置为名词,一信息分词为型号,该信息分词对应的信息语句为:型号是什么?“型号”为预设词性,所以将“型号”确定为待选分词。
预先设置关键词数据库,关键词数据库中记录了多个查询关键字词,基于关键词数据库提取结构化查询文本中的查询关键词,例如,将得到的多个关键词与关键词数据库中记录的词进行匹配,将匹配成功的关键词确定为查询关键词。可以通过计算关键词与关键词数据库中记录的词之间的相关度来进行匹配。
S13,调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签。
其中,随机森林模型为预先训练好的机器学习模型,将多个查询关键词作为随机森林模型的输入,通过随机森林模型预测并输出每个所述查询关键词对应的查询标签。所述查询标签用于表示所述查询关键词对应的查询类型。预测每个查询关键词对应的查询标签可以用于确定每个查询关键词之间的依赖关系,可以将查询标签对应的依赖关系确定为查询关键词之间的依赖关系。依赖关系用于确定查询标签对应的查询先后或查询关键词对应的查询先后。具体地,一查询标签与另一查询标签存在依赖关系表示该查询标签的查询依赖于另一查询标签的查询完成,即另一查询标签查询完成后,该查询标签才能进行查询。例如,查询标签B与查询标签A存在依赖关系表示查询标签查询A完成后,查询标签B才能进行查询。在一个可选的实施方式中,所述随机森林模型的训练过程包括:
获取多个所述历史查询关键词,作为训练数据集;
从所述训练数据集中随机抽取M个训练样本集;
对所述M个训练样本集进行学习,以此生成M个决策树,并在所述M个决策树的生成过程中,从M个决策树的特征变量中随机抽取N个特征变量,各个决策树利用所述N个特征变量上最优的分裂方式来分支,且N值在随机森林模型的形成过程中设定为恒定常数;
当满足分支规则时,停止所述M个决策树的生成过程,得到所述随机森林模型。
历史查询关键词可以通过对历史查询语句或历史结构化查询文本进行解析得到。
可以采用自助法进行随机抽样,也可以采用Bootstrap法有放回地进行随机抽样,抽到的训练数据集组成训练样本集,未抽到的训练数据集则组成验证样本集,然后对训练样本集中全部训练样本逐一构造决策树,M个训练样本集构造M个决策树。
在决策树生长过程中,每个节点处从所有特征变量中随机抽取N个特征变量作为当前节点分裂的待选特征,从待选特征中进行分支生长,且不进行剪枝。如此重复,使得决策树继续分支和生长,直至满足分支规则而停止生长,并储存M个决策树。根据储存的M个决策树建立随机森林模型,对M个决策树的结果计算平均值得到最终的预测结果。
在一个可选的实施方式中,所述M个决策树的生成过程包括:
随机地给每个所述特征变量加入噪声干扰;
依据准确率降低的程度来确定每个所述特征变量的重要度;
依据所述重要度对所述M个决策树的生成过程进行优化。
可以给不同的特征变量加入不同的噪声干扰,也可以给所有的特征变量加入相同的噪声干扰,例如,加入高斯噪声等。
首先,使用验证样本集验证随机森林模型的第一预测准确率,然后每次从N个特征变量中随机选取一个特征变量加入噪声干扰,再使用验证样本集验证随机森林模型的第二预测准确率,从而根据第一预测准确率及第二预测准确率的差值,得到准确率降低的程度。当将N个特征变量中的每个特征变量依次加入了噪声干扰之后,可以得到N个第一预测准确率,从而得到N个准确率降低的程度。对这N个准确率降低的程度进行从大到小或者从小到大排序,根据排序结果确定每个特征变量的重要度。
当某个特征变量加入噪声干扰后,随机森林模型的准确率降低的程度越大,表明该特征变量对随机森林模型的影响程度越大,则该特征变量的重要度越高。当某个特征变量加入噪声干扰后,随机森林模型的准确率降低的程度越小,表明该特征变量对随机森林模型的影响程度越小,则该特征变量的重要度越低。
在确定特征变量的重要度之后,可以在对特征变量进行分裂的过程中依据重要度加入重要度权重,从而实现对M个决策树的生成过程的优化。
该可选的实施方式,通过找出变量特征的重要度,并依据所述重要度来对决策树生成过程进行优化,提高了随机森林模型的预测准确性。
S14,基于关系预测模型,确定每两个所述查询标签之间的依赖关系。
一查询标签与另一查询标签存在依赖关系表示该查询标签的查询依赖于另一查询标签的查询完成,即另一查询标签查询完成后,该查询标签才能进行查询。例如,查询标签B与查询标签A存在依赖关系表示查询标签查询A完成后,查询标签B才能进行查询。
所述关系预测模型的输入为两个查询标签,输出为两个查询标签的依赖关系,如存在依赖关系输出为1,不存在依赖关系输出为0。例如,输入的两个查询标签(查询标签A和查询标签E)不存在依赖关系,输出的结果为查询标签A(0)、查询标签E(0);输入的两个查询标签(查询标签A和查询标签B)存在依赖关系,输出的结果为查询标签A(0)、查询标签B(1)。
S15,根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词。
在一个可选的实施方式中,所述根据所述依赖关系,构建所述查询数据对应的查询树包括:
将所述查询标签中不存在依赖关系的查询标签对应的查询关键词确定为第一节点;
将所述查询标签中存在依赖关系的查询标签对应的查询关键词确定为第二节点;
根据所述第二节点的依赖关系,确定每个第二节点对应的节点层级;
基于所述第一节点和所述第二节点对应的节点层级,构建所述查询数据对应的查询树。
将不需要等待其他查询标签完成后才能进行的查询标签对应的查询关键词确定为第一节点;将需要等待其他查询标签完成后才能进行的查询标签对应的查询关键词确定为第二节点。
每个第二节点包括一个存在依赖关系的第一节点,每个第二节点也可能包括一个或多个存在依赖关系的第二节点。例如,第二节点B与第一节点A存在依赖,第二节点C与第二节点B存在依赖,第二节点D与第二节点C存在依赖,需要在第一节点A查询完成后才能进行第二节点B的查询,需要在第一节点A、第二节点B查询完成后才能进行第二节点C的查询;需要在第一节点A、第二节点B、第二节点C查询完成后才能进行第二节点D的查询。第二节点B依赖关系少于第二节点C和第二节点D、第二节点C依赖关系少于第二节点D,所以第二节点B对应的节点层级高于第二节点C,第二节点C对应的节点层级高于第二节点D。
可以将第一节点确定为根节点下的父节点,可以根据第二节点对应的节点层级确定第二节点与所述第一节点的连接关系。第二节点位于与该第二节点存在依赖关系的第一节点下。
S16,对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。
按照查询树中每个节点所在的位置,对节点对应的查询关键字进行数据查询。将所有节点对应的数据查询结果确定为所述查询数据对应的结果。具体的,并行处理所述查询树中的第一节点对应的查询关键字,接着随着第一节点的处理,依次处理第一节点下的第二节点。可以理解的是,若两个第一节点的处理速度不同,该两个第一节点下的第二节点对应的处理时间也不同。
在一个可选的实施方式中,所述依次对每个节点的查询关键词进行数据查询包括:
获取对节点的查询关键词进行数据查询的目标查询时间;
基于所述节点的查询关键词进行数据查询的开始时刻和结束时刻,计算所述节点的查询关键词对应的实际查询时间;
计算所述目标查询时间和所述实际查询时间的差值,若所述差值大于预设时间阈值,生成异常提示。
若所述目标查询时间和所述实际查询时间的差值小于或等于预设时间阈值,说明该节点的查询是正常被执行的,无需预警;若差值大于所述预设时间阈值,说明该节点的查询是执行异常,需要进行预警。通过对每个节点的数据查询情况进行监控,可以及时确定节点对应的查询异常情况,提高数据查询的效率。生成异常提示的方式可以根据实际情况进行设置,在此不做过多说明。
示例性的,若在预设时间内无法获取到一节点的查询关键词进行数据查询的结束时刻,确定该节点异常,生成异常提示。
本申请所述的基于人工智能的数据查询方法,通过对待处理的查询数据进行结构化处理,得到结构化查询文本。提取所述结构化查询文本中的多个查询关键词,并调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签,基于关系预测模型,确定每两个所述查询标签之间的依赖关系,依赖关系用于确定每个查询关键词对应的查询先后,可提高后续构建查询关键树的速率。根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词,基于查询树可以对查询数据中的查询关键字进行并行处理。对所述查询树进行逐层遍历,依次对每个节点上查询关键词进行数据查询,得到所述查询数据对应的查询结果,基于查询树进行查询能够实现并行处理,可以提高数据查询的速率。
实施例二
图2是本申请实施例二提供的基于人工智能的数据查询装置的结构图。
在一些实施例中,所述基于人工智能的数据查询装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的数据查询装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的数据查询方法的功能。
本实施例中,所述基于人工智能的数据查询装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:数据处理模块201、文本提取模块202、标签预测模块203、关系预测模块204、节点确定模块205及数据查询模块206。本申请所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
数据处理模块201,用于对待处理的查询数据进行结构化处理,得到结构化查询文本。
其中,待处理的查询数据为非结构化的查询文本,例如,图片格式,PDF格式。所述查询文本中记录了待查询的多个查询内容。
电子设备可以使用光学字符识别(Optical Character Recognition,OCR)技术对非结构化的待处理的查询数据进行OCR识别,将图片格式或者PDF格式的待处理的查询数据转化为可编辑的字体格式,然后将转换后的字体复制在空文本中,从而得到结构化的查询数据。将图片格式或者PDF格式的待处理的查询数据转化为可编辑的字体格式的过程中,可以基于预设的条件,在结构化的查询数据中加入标点符号。例如,图片格式或PDF格式中,每个方框内的内容转换完成后,在方框内的内容后加入句号。
在一个可选的实施方式中,文本提取模块202对待处理的查询数据进行结构化处理之前,所述方法还包括:
确定所述待处理的查询数据对应的数据查询请求;
获取所述数据查询请求的源地址,并根据所述源地址确定触发终端;
获取所述数据查询请求的发送时间,并从所述触发终端中获取与所述发送时间对应的日志列表;
获取所述日志列表中的登录账号,并将与所述登录账号对应的用户确定为所述查询用户;
判断所述查询用户是否具有对所述数据查询请求的所述查询权限。
若所述查询用户具有对所述数据查询请求的所述查询权限,对待处理的查询数据进行结构化处理,得到结构化查询文本。若所述查询用户不具有对所述数据查询请求的所述查询权限,结束流程。通过对用户身份进行验证,可以提高数据的安全性。
所述查询用户是指触发所述数据查询请求生成的用户。通过上述实施方式,由于地址与终端存在映射关系,因此,通过所述源地址能够准确确定出所述触发终端,进一步地,根据所述发送时间能够快速确定出所述日志列表,进而由于账号与用户存在映射关系,因此,能够快速确定出所述查询用户。
文本提取模块202,用于提取所述结构化查询文本中的多个查询关键词。
可以使用词频-逆文本频率指数(term frequency–inverse documentfrequency,TF-IDF)提取结构化查询文本中的查询关键词。
在一个可选的实施方式中,文本提取模块202提取所述结构化查询文本中的多个目标关键词包括:
对所述结构化查询文本中每个句子进行分词处理,得到信息分词;
确定所述信息分词在所述信息分词所在的句子中的目标词性,并将所述目标词性为预设词性的信息分词确定为待选分词;
将所述待选分词与预设关键词数据库中的关键词进行匹配,并将与所述关键词匹配成功的待选分词确定为查询关键词。
对结构化查询文本中每个句子进行分词处理,得到信息分词。所述目标词性是指所述信息分词在句子中所充当的角色,例如,所述目标词性为名词,所述目标词性为动词等。所述预设词性可以根据大数据分析后确定的,所述预设词性可以设置为名词,本发明对所述预设词性的具体确定方式不作阐述。例如,预设词性可以设置为名词,一信息分词为型号,该信息分词对应的信息语句为:型号是什么?“型号”为预设词性,所以将“型号”确定为待选分词。
预先设置关键词数据库,关键词数据库中记录了多个查询关键字词,基于关键词数据库提取结构化查询文本中的查询关键词,例如,将得到的多个关键词与关键词数据库中记录的词进行匹配,将匹配成功的关键词确定为查询关键词。可以通过计算关键词与关键词数据库中记录的词之间的相关度来进行匹配。
标签预测模块203,用于调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签。
其中,随机森林模型为预先训练好的机器学习模型,将多个查询关键词作为随机森林模型的输入,通过随机森林模型预测并输出每个所述查询关键词对应的查询标签。所述查询标签用于表示所述查询关键词对应的查询类型。预测每个查询关键词对应的查询标签可以用于确定每个查询关键词之间的依赖关系,可以将查询标签对应的依赖关系确定为查询关键词之间的依赖关系。依赖关系用于确定查询标签对应的查询先后或查询关键词对应的查询先后。
在一个可选的实施方式中,标签预测模块203对随机森林模型的训练包括:
获取多个所述历史查询关键词,作为训练数据集;
从所述训练数据集中随机抽取M个训练样本集;
对所述M个训练样本集进行学习,以此生成M个决策树,并在所述M个决策树的生成过程中,从M个决策树的特征变量中随机抽取N个特征变量,各个决策树利用所述N个特征变量上最优的分裂方式来分支,且N值在随机森林模型的形成过程中设定为恒定常数;
当满足分支规则时,停止所述M个决策树的生成过程,得到所述随机森林模型。
历史查询关键词可以通过对历史查询语句或历史结构化查询文本进行解析得到。
可以采用自助法进行随机抽样,也可以采用Bootstrap法有放回地进行随机抽样,抽到的训练数据集组成训练样本集,未抽到的训练数据集则组成验证样本集,然后对训练样本集中全部训练样本逐一构造决策树,M个训练样本集构造M个决策树。
在决策树生长过程中,每个节点处从所有特征变量中随机抽取N个特征变量作为当前节点分裂的待选特征,从待选特征中进行分支生长,且不进行剪枝。如此重复,使得决策树继续分支和生长,直至满足分支规则而停止生长,并储存M个决策树。根据储存的M个决策树建立随机森林模型,对M个决策树的结果计算平均值得到最终的预测结果。
在一个可选的实施方式中,标签预测模块203生成M个决策树包括:
随机地给每个所述特征变量加入噪声干扰;
依据准确率降低的程度来确定每个所述特征变量的重要度;
依据所述重要度对所述M个决策树的生成过程进行优化。
可以给不同的特征变量加入不同的噪声干扰,也可以给所有的特征变量加入相同的噪声干扰,例如,加入高斯噪声等。
首先,使用验证样本集验证随机森林模型的第一预测准确率,然后每次从N个特征变量中随机选取一个特征变量加入噪声干扰,再使用验证样本集验证随机森林模型的第二预测准确率,从而根据第一预测准确率及第二预测准确率的差值,得到准确率降低的程度。当将N个特征变量中的每个特征变量依次加入了噪声干扰之后,可以得到N个第一预测准确率,从而得到N个准确率降低的程度。对这N个准确率降低的程度进行从大到小或者从小到大排序,根据排序结果确定每个特征变量的重要度。
当某个特征变量加入噪声干扰后,随机森林模型的准确率降低的程度越大,表明该特征变量对随机森林模型的影响程度越大,则该特征变量的重要度越高。当某个特征变量加入噪声干扰后,随机森林模型的准确率降低的程度越小,表明该特征变量对随机森林模型的影响程度越小,则该特征变量的重要度越低。
在确定特征变量的重要度之后,可以在对特征变量进行分裂的过程中依据重要度加入重要度权重,从而实现对M个决策树的生成过程的优化。
该可选的实施方式,通过找出变量特征的重要度,并依据所述重要度来对决策树生成过程进行优化,提高了随机森林模型的预测准确性。
关系预测模块204,用于基于关系预测模型,确定每两个所述查询标签之间的依赖关系。
一查询标签与另一查询标签存在依赖关系表示该查询标签的查询依赖于另一查询标签的查询完成,即另一查询标签查询完成后,该查询标签才能进行查询。例如,查询标签B与查询标签A存在依赖关系表示查询标签查询A完成后,查询标签B才能进行查询。
所述关系预测模型的输入为两个查询标签,输出为两个查询标签的依赖关系,如存在依赖关系输出为1,不存在依赖关系输出为0。例如,输入的两个查询标签(查询标签A和查询标签E)不存在依赖关系,输出的结果为查询标签A(0)、查询标签E(0);输入的两个查询标签(查询标签A和查询标签B)存在依赖关系,输出的结果为查询标签A(0)、查询标签B(1)。
节点确定模块205,用于根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词。
在一个可选的实施方式中,节点确定模块205根据所述依赖关系,构建所述查询数据对应的查询树包括:
将所述查询标签中不存在依赖关系的查询标签对应的查询关键词确定为第一节点;
将所述查询标签中存在依赖关系的查询标签对应的查询关键词确定为第二节点;
根据所述第二节点的依赖关系,确定每个第二节点对应的节点层级;
基于所述第一节点和所述第二节点对应的节点层级,构建所述查询数据对应的查询树。
将不需要等待其他查询标签完成后才能进行的查询标签对应的查询关键词确定为第一节点;将需要等待其他查询标签完成后才能进行的查询标签对应的查询关键词确定为第二节点。
每个第二节点包括一个存在依赖关系的第一节点,每个第二节点也可能包括一个或多个存在依赖关系的第二节点。例如,第二节点B与第一节点A存在依赖,第二节点C与第二节点B存在依赖,第二节点D与第二节点C存在依赖,需要在第一节点A查询完成后才能进行第二节点B的查询,需要在第一节点A、第二节点B查询完成后才能进行第二节点C的查询;需要在第一节点A、第二节点B、第二节点C查询完成后才能进行第二节点D的查询。第二节点B依赖关系少于第二节点C和第二节点D、第二节点C依赖关系少于第二节点D,所以第二节点B对应的节点层级高于第二节点C,第二节点C对应的节点层级高于第二节点D。
可以将第一节点确定为根节点下的父节点,可以根据第二节点对应的节点层级确定第二节点与所述第一节点的连接关系。第二节点位于与该第二节点存在依赖关系的第一节点下。
数据查询模块206,用于对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。
按照查询树中每个节点所在的位置,对节点对应的查询关键字进行数据查询。将所有节点对应的数据查询结果确定为所述查询数据对应的结果。具体的,并行处理所述查询树中的第一节点对应的查询关键字,接着随着第一节点的处理,依次处理第一节点下的第二节点。可以理解的是,若两个第一节点的处理速度不同,该两个第一节点下的第二节点对应的处理时间也不同。
在一个可选的实施方式中,数据查询模块206依次对每个节点的查询关键词进行数据查询包括:
获取对节点的查询关键词进行数据查询的目标查询时间;
基于所述节点的查询关键词进行数据查询的开始时刻和结束时刻,计算所述节点的查询关键词对应的实际查询时间;
计算所述目标查询时间和所述实际查询时间的差值,若所述差值大于预设时间阈值,生成异常提示。
若所述目标查询时间和所述实际查询时间的差值小于或等于预设时间阈值,说明该节点的查询是正常被执行的,无需预警;若差值大于所述预设时间阈值,说明该节点的查询是执行异常,需要进行预警。通过对每个节点的数据查询情况进行监控,可以及时节点对应的查询异常情况,可以提高数据查询的效率。生成异常提示的方式可以根据实际情况进行设置,在此不做过多说明。
示例性的,若在预设时间内无法获取到一节点的查询关键词进行数据查询的结束时刻,确定该节点异常,生成异常提示。
本申请所述的基于人工智能的数据查询装置,通过对待处理的查询数据进行结构化处理,得到结构化查询文本。提取所述结构化查询文本中的多个查询关键词,并调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签,基于关系预测模型,确定每两个所述查询标签之间的依赖关系,依赖关系用于确定每个查询关键词对应的查询先后,可提高后续构建查询关键树的速率。根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词,基于查询树可以对查询数据中的查询关键字进行并行处理。对所述查询树进行逐层遍历,依次对每个节点上查询关键词进行数据查询,得到所述查询数据对应的查询结果,基于查询树进行查询能够实现并行处理,可以提高数据查询的速率。
实施例三
本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于人工智能的数据查询方法实施例中的步骤,例如图1所示的S11-S16:
S11,对待处理的查询数据进行结构化处理,得到结构化查询文本;
S12,提取所述结构化查询文本中的多个查询关键词;
S13,调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签;
S14,基于关系预测模型,确定每两个所述查询标签之间的依赖关系;
S15,根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词;
S16,对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。
或者,该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能,例如图2中的模块201-206:
数据处理模块201,用于对待处理的查询数据进行结构化处理,得到结构化查询文本;
文本提取模块202,用于提取所述结构化查询文本中的多个查询关键词;
标签预测模块203,用于调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签;
关系预测模块204,用于基于关系预测模型,确定每两个所述查询标签之间的依赖关系;
节点确定模块205,用于根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词;
数据查询模块206,用于对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。
实施例四
参阅图3所示,为本申请实施例三提供的电子设备的结构示意图。在本申请较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、收发器33及至少一条通信总线34。
本领域技术人员应该了解,图3示出的电子设备的结构并不构成本申请实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本申请,也应包含在本申请的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的数据查询方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述电子设备3的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本申请实施例中所述的基于人工智能的数据查询方法的全部或者部分步骤;或者实现基于人工智能的数据查询装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线34被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。
Claims (10)
1.一种基于人工智能的数据查询方法,其特征在于,所述方法包括:
对待处理的查询数据进行结构化处理,得到结构化查询文本;
提取所述结构化查询文本中的多个查询关键词;
调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签;
基于关系预测模型,确定每两个所述查询标签之间的依赖关系;
根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词;
对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。
2.如权利要求1所述的基于人工智能的数据查询方法,其特征在于,所述提取所述结构化查询文本中的多个查询关键词包括:
对所述结构化查询文本中每个句子进行分词处理,得到信息分词;
确定所述信息分词在所述信息分词所在的句子中的目标词性,并将所述目标词性为预设词性的信息分词确定为待选分词;
将所述待选分词与预设关键词数据库中的关键词进行匹配,并将与所述关键词匹配成功的待选分词确定为查询关键词。
3.如权利要求1所述的基于人工智能的数据查询方法,其特征在于,所述随机森林模型的训练过程包括:
获取多个历史查询关键词,作为训练数据集;
从所述训练数据集中随机抽取M个训练样本集;
对所述M个训练样本集进行学习,以此生成M个决策树,并在所述M个决策树的生成过程中,从M个决策树的特征变量中随机抽取N个特征变量,各个决策树利用所述N个特征变量上最优的分裂方式来分支,且N值在随机森林模型的形成过程中设定为恒定常数;
当满足分支规则时,停止所述M个决策树的生成过程,得到所述随机森林模型。
4.如权利要求3所述的基于人工智能的数据查询方法,其特征在于,所述M个决策树的生成过程包括:
随机地给每个所述特征变量加入噪声干扰;
依据准确率降低的程度来确定每个所述特征变量的重要度;
依据所述重要度对所述M个决策树的生成过程进行优化。
5.如权利要求1所述的基于人工智能的数据查询方法,其特征在于,所述根据所述依赖关系,构建所述查询数据对应的查询树包括:
将所述查询标签中不存在依赖关系的查询标签对应的查询关键词确定为第一节点;
将所述查询标签中存在依赖关系的查询标签对应的查询关键词确定为第二节点;
根据所述第二节点的依赖关系,确定每个第二节点对应的节点层级;
基于所述第一节点和所述第二节点对应的节点层级,构建所述查询数据对应的查询树。
6.如权利要求1所述的基于人工智能的数据查询方法,其特征在于,所述依次对每个节点的查询关键词进行数据查询包括:
获取对节点的查询关键词进行数据查询的目标查询时间;
基于所述节点的查询关键词进行数据查询的开始时刻和结束时刻,计算所述节点的查询关键词对应的实际查询时间;
计算所述目标查询时间和所述实际查询时间的差值,若所述差值大于预设时间阈值,生成异常提示。
7.如权利要求1至6中任意一项所述的基于人工智能的数据查询方法,其特征在于,对待处理的查询数据进行结构化处理之前,所述方法还包括:
确定所述待处理的查询数据对应的数据查询请求;
获取所述数据查询请求的源地址,并根据所述源地址确定触发终端;
获取所述数据查询请求的发送时间,并从所述触发终端中获取与所述发送时间对应的日志列表;
获取所述日志列表中的登录账号,并将与所述登录账号对应的用户确定为所述查询用户;
判断所述查询用户是否具有对所述数据查询请求的所述查询权限。
8.一种基于人工智能的数据查询装置,其特征在于,所述装置包括:
数据处理模块,用于对待处理的查询数据进行结构化处理,得到结构化查询文本;
文本提取模块,用于提取所述结构化查询文本中的多个查询关键词;
标签预测模块,用于调用随机森林模型对所述多个查询关键词进行预测,确定每个查询关键词对应的查询标签;
关系预测模块,用于基于关系预测模型,确定每两个所述查询标签之间的依赖关系;
节点确定模块,用于根据所述依赖关系,构建所述查询数据对应的查询树,所述查询树中每个节点对应一个查询关键词;
数据查询模块,用于对所述查询树进行逐层遍历,依次对每个节点的查询关键词进行数据查询,得到所述查询数据对应的查询结果。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的基于人工智能的数据查询方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于人工智能的数据查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210039468.6A CN114372082B (zh) | 2022-01-13 | 2022-01-13 | 基于人工智能的数据查询方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210039468.6A CN114372082B (zh) | 2022-01-13 | 2022-01-13 | 基于人工智能的数据查询方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114372082A true CN114372082A (zh) | 2022-04-19 |
CN114372082B CN114372082B (zh) | 2024-06-28 |
Family
ID=81144589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210039468.6A Active CN114372082B (zh) | 2022-01-13 | 2022-01-13 | 基于人工智能的数据查询方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114372082B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117931881A (zh) * | 2024-03-15 | 2024-04-26 | 四川鑫正工程项目管理咨询有限公司 | 一种工程造价查询管理方法 |
WO2024100933A1 (ja) * | 2022-11-07 | 2024-05-16 | 浜松ホトニクス株式会社 | 評価方法、評価プログラム、及び評価装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795455A (zh) * | 2019-09-06 | 2020-02-14 | 中国平安财产保险股份有限公司 | 依赖关系解析方法、电子装置、计算机设备及可读存储介质 |
CN111930785A (zh) * | 2020-08-05 | 2020-11-13 | 宝合工业工具(上海)有限公司 | 一种数据批量查询展示方法及系统 |
CN113064928A (zh) * | 2021-04-25 | 2021-07-02 | 深圳壹账通智能科技有限公司 | 报表数据查询方法、装置、电子设备及存储介质 |
CN113177062A (zh) * | 2021-05-25 | 2021-07-27 | 深圳前海微众银行股份有限公司 | 一种数据查询方法及装置 |
US20210342348A1 (en) * | 2020-04-29 | 2021-11-04 | Baidu Online Network Technology (Beijing) Co., Ltd | Method for parsing query, electronic device and readable storage medium |
-
2022
- 2022-01-13 CN CN202210039468.6A patent/CN114372082B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795455A (zh) * | 2019-09-06 | 2020-02-14 | 中国平安财产保险股份有限公司 | 依赖关系解析方法、电子装置、计算机设备及可读存储介质 |
US20210342348A1 (en) * | 2020-04-29 | 2021-11-04 | Baidu Online Network Technology (Beijing) Co., Ltd | Method for parsing query, electronic device and readable storage medium |
CN111930785A (zh) * | 2020-08-05 | 2020-11-13 | 宝合工业工具(上海)有限公司 | 一种数据批量查询展示方法及系统 |
CN113064928A (zh) * | 2021-04-25 | 2021-07-02 | 深圳壹账通智能科技有限公司 | 报表数据查询方法、装置、电子设备及存储介质 |
CN113177062A (zh) * | 2021-05-25 | 2021-07-27 | 深圳前海微众银行股份有限公司 | 一种数据查询方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024100933A1 (ja) * | 2022-11-07 | 2024-05-16 | 浜松ホトニクス株式会社 | 評価方法、評価プログラム、及び評価装置 |
CN117931881A (zh) * | 2024-03-15 | 2024-04-26 | 四川鑫正工程项目管理咨询有限公司 | 一种工程造价查询管理方法 |
CN117931881B (zh) * | 2024-03-15 | 2024-05-24 | 四川鑫正工程项目管理咨询有限公司 | 一种工程造价查询管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114372082B (zh) | 2024-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022078346A1 (zh) | 文本意图识别方法、装置、电子设备及存储介质 | |
CN111984793A (zh) | 文本情感分类模型训练方法、装置、计算机设备及介质 | |
CN114372082B (zh) | 基于人工智能的数据查询方法、装置、电子设备及介质 | |
CN113435582B (zh) | 基于句向量预训练模型的文本处理方法及相关设备 | |
CN114663223A (zh) | 基于人工智能的信用风险评估方法、装置及相关设备 | |
CN113221570A (zh) | 基于线上问诊信息的处理方法、装置、设备及存储介质 | |
CN114201328A (zh) | 基于人工智能的故障处理方法、装置、电子设备及介质 | |
CN113704410A (zh) | 情绪波动检测方法、装置、电子设备及存储介质 | |
WO2023040145A1 (zh) | 基于人工智能的文本分类方法、装置、电子设备及介质 | |
CN114201212B (zh) | 配置文件处理方法、装置、计算机设备及存储介质 | |
CN112395432B (zh) | 课程推送方法、装置、计算机设备及存储介质 | |
CN114020892A (zh) | 基于人工智能的答案选取方法、装置、电子设备及介质 | |
CN113468288A (zh) | 基于人工智能的文本课件的内容抽取方法及相关设备 | |
CN116796758A (zh) | 对话交互方法、对话交互装置、设备及存储介质 | |
CN116701752A (zh) | 基于人工智能的新闻推荐方法、装置、电子设备及介质 | |
CN116226315A (zh) | 基于人工智能的敏感信息检测方法、装置及相关设备 | |
CN114492446B (zh) | 法律文书处理方法、装置、电子设备及存储介质 | |
CN116108276A (zh) | 基于人工智能的信息推荐方法、装置及相关设备 | |
US12039266B2 (en) | Methods and system for the extraction of properties of variables using automatically detected variable semantics and other resources | |
CN112115212B (zh) | 参数识别方法、装置和电子设备 | |
CN114742061A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
CN114818685A (zh) | 关键词提取方法、装置、电子设备及存储介质 | |
CN114881313A (zh) | 基于人工智能的行为预测方法、装置及相关设备 | |
CN113139381A (zh) | 不均衡样本分类方法、装置、电子设备及存储介质 | |
CN118133046B (zh) | 产业数据匹配方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |