CN114528300B - 一种基于分布式索引的快捷信息检索系统 - Google Patents
一种基于分布式索引的快捷信息检索系统 Download PDFInfo
- Publication number
- CN114528300B CN114528300B CN202210432814.7A CN202210432814A CN114528300B CN 114528300 B CN114528300 B CN 114528300B CN 202210432814 A CN202210432814 A CN 202210432814A CN 114528300 B CN114528300 B CN 114528300B
- Authority
- CN
- China
- Prior art keywords
- information
- distributed
- distributed database
- index
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于分布式索引的快捷信息检索系统,包括:分布式数据库、检索控制模块、节点信息提取模块、时间序列索引模型、分布式计算引擎模块、数据交互模块和数据检索点,所述检索控制模块分别与分布式数据库、节点信息提取模块、时间序列索引模型、分布式计算引擎模块、数据交互模块和数据检索点连接,其中所述分布式数据库的输出端与时间序列索引模型的输入端连接,所述时间序列索引模型的输出端与分布式计算引擎模块的输入端连接,所述时间序列索引模型还通过数据交互模块实现检索输出,所述分布式数据库的输出端与分布式节点输入端连接,本发明大大提高了信息索引能力。
Description
技术领域
本发明涉及电数字数据处理领域,且更确切地涉及一种基于分布式索引的快捷信息检索系统。
背景技术
信息技术的飞速发展和计算机互联网的普及,给人们的生活带来了前所未有的变化,尤其是人们获取信息的途径得到丰富。在这个过程中,搜索引擎正扮演着越来越重要的地位。人们在要求搜索的查全率和查准率的同时,也对搜索的性能提出了要求。分布式系统与并行计算技术的发展是人们提高搜索引擎的性能的前提。如何提高数字数据信息的检索能力和信息处理能力,是目前基于分布式索引的关键。
在分布式索引过程中,为了提高快捷信息检索能力,现有技术也进行了相关技术申请,比如有一个文献设计和开发一个基于分布式索引的搜索引擎的信息检索系统。该系统设计和实现了一种基于集群系统的分布式信息检索系统,系统包括Server节点、Client节点、Proxy节点和Checker节点,这四种计算节点互相配合,完成一个完整的信息检索模块的功能,包括建立索引和索引查询等等,设计目标是为了实现整个系统性能上的提升。在分布式信息检索系统中,索引文件分布在不同的Client节点之上,由Server节点统一管理建立索引的过程和Cliem节点的生存状态,以此达到建立索引的并行化,提高建立索引的效率;在检索过程中,Proxy节点负责接收用户的查询请求,并将查询和全局数据一起进行封装,分发给负责具体查询工作的Client节点,再对Client节点返回的结果进行合并,返回给用户,这样就实现了检索的并行化,提高了检索的效率,该申请方法虽然具有一定的技术优越性,但对于检索系统内数据大于1000的情况的下,或者分布式索引的快捷信息检索内节点较多的情况下,检索效率仍旧低下。
发明内容
针对上述技术的不足,本发明公开一种基于分布式索引的快捷信息检索系统,通过引入计算机算法,能够提高快捷信息检索系统检索能力。
为了实现上述技术效果,本发明采用以下技术方案:
一种基于分布式索引的快捷信息检索系统,包括:
分布式数据库,数据节点分布地设置在不同站点上的开源分布式时序、事件或者指标信息数据库,用于容纳不同节点的数据信息;
检索控制模块,用于控制分布式数据库检索,并将检索结果输出至其他模块;
节点信息提取模块,用于提取分布式节点的数据信息,以提取不同节点数据信息,并将各种节点的数据信息的特征提炼出来;
时间序列索引模型,通过提取分布式数据库内的数据信息特征,按照时间序列对数据库内的信息特征进行标识、提取和统计,其中所述时间序列索引模型通过构建自回归模型实现所述节点信息提取模块所提取数据信息的分析;
分布式计算引擎模块,在检索控制模块控制下,通过改进型MMAS算法模型提高分布式数据库信息的索引能力,提高信息索引效率;
数据交互模块,用以实现不同模块之间的信息交互,以实现分布式数据库在检索过程中的传递、互通或者交互;
数据检索点,用于实现分布式数据库检索输出的节点,并外联有外部数据库,以实现不同分布式数据库节点的信息输出;
其中:所述检索控制模块分别与分布式数据库、节点信息提取模块、时间序列索引模型、分布式计算引擎模块、数据交互模块和数据检索点连接,其中所述分布式数据库的输出端与时间序列索引模型的输入端连接,所述时间序列索引模型的输出端与分布式计算引擎模块的输入端连接,所述时间序列索引模型还通过数据交互模块实现检索输出,所述分布式数据库的输出端与分布式节点输入端连接,所述分布式节点的输出端通过数据检索点实现检索输出,并通过检索输出接口与检索信息显示模块连接。
作为本发明进一步的技术方案,所述检索控制模块为16位MCU内核控制电路,其中所述16位MCU内核控制电路与可编程控制器双向连接,所述16位MCU内核控制电路为MSP430FG4619单片机电路,所述可编程控制器还连接有A/D转换模块,所述A/D转换模块连接有滤波电路。
作为本发明进一步的技术方案,所述时间序列索引模型的索引分布式数据库中的序列数据为:
作为本发明进一步的技术方案,所述分布式数据库内的数据信息特征序列的回归函数表示为:
式(2)中,表示分布式数据库不同数据信息索引序列自身之前的回归表示,表示自回归系数,表示在第个分布式数据库时的自回归系数,通过公式(2)得到分布式数据库不同数据信息序列的自回归模型,进而实现自身数据库信息的自预测;表示在索引第个分布式数据库时的不同数据信息损伤敏感因子,表示分布式数据库内的数据信息,t表示蚂蚁元素更新释放信息素的时间,表示分布式数据库输出的噪声信号。
作为本发明进一步的技术方案,所述时间序列索引模型通过节点信息提取模块确定数据信息维度,则节点信息提取模块的信息提取函数表示为:
式(3)中表示分布式数据库内不同数据信息的采样点,表示时间序列索引模型的维度,表示时间序列索引模型的方差;通过对分布式数据库不同数据信息索引,进而提高了时间序列索引模型工作过程中序列信息索引速度,其中在索引过程中,时间序列索引模型索引分布式数据库时,数据内不同数据信息索引范围通过以下函数表示:
其中、表示时间序列索引模型在索引分布式数据库内不同数据信息时,分布式数据库数据信息具有的索引范围上限值和下限值,表示时间序列索引模型工作过程中信息进行加速时的数据序列,表示分布式数据库不同数据信息在索引加速时,数据库内所以数据信息波动的均值,表示分布式数据库不同数据信息加速度波动的方差,表示时间序列索引模型的经验修正系数;
作为本发明进一步的技术方案,时间序列索引模型在分布式数据库下的损失特征函数定义为:
作为本发明进一步的技术方案,所述改进型MMAS算法模型为加入分类算法模型的最优搜索算法模型。
作为本发明进一步的技术方案,所述改进型MMAS算法模型工作包括以下步骤:
步骤一、将不同的分布式数据库内的数据信息记作为蚂蚁信息元素,通过第一分类算法模型实现一级分类,然后对MMAS算法模型进行初始化设置;
步骤二、设置不同的分布式数据库内的数据信息的索引轨迹,索引轨迹更新方法通过以下公式进行:
步骤四:对蚂蚁元素信息素轨迹进行平滑化处理,则处理公式为:
步骤五:通过第二分类算法模型对不同的信息元素进行二级分类。
作为本发明进一步的技术方案,所述第一分类算法模型和第二分类算法模型为决策树相似度矩阵分类模型。
在上述实施例中,所述决策树相似度矩阵分类模型的工作方法为:
步骤1、在分布式数据库中的信息素进行分类计算时,
其中公式(11)中的和表示不同分布式数据库数值综合差值,t为不同用户数据
信息在选择蚂蚁信息元素时容忍的最大相似度,则在分布式数据库内的蚂蚁元素进行信息
搜索计算时,分布式数据库内的蚂蚁元素检索路径平均值为:
选择两个不同蚂蚁决策树的相似度函数通过以下函数表示:
当蚂蚁信息元素大于1000时,在不断地进行迭代计算时,则任意两个蚂蚁元素的相似度计算公式表示为:
其中表示采用第n个蚂蚁元素与m个蚂蚁元素进行信息搜索时的元素相似度,通过数据集合的形式,能够使用户在任意时间下获取蚂蚁搜索信息,进而获取分布式数据库内的数据训练集合的最优解和相邻两个蚂蚁元素之间的相似程度。
积极有益效果
本发明构建了一套基于分布式索引的快捷信息检索系统,包括分布式数据库、检索控制模块、节点信息提取模块、时间序列索引模型、数据交互模块、数据检索点分布式计算引擎模块,在检索控制模块控制下,通过改进型MMAS算法模型提高分布式数据库信息的索引能力,提高信息索引效率。通过自回归模型(Autoregressive Model)将分布式数据库不同数据信息参数与分布式数据库时的自回归系数以及参数联系起来,提高了数据信息检索能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图,其中:
图1为本发明系统整体结构示意图;
图2为本发明系统中检索控制模块结构示意图;
图3为本发明系统中时间序列索引模型一种实施例工作示意图;
图4为发明系统中工作流程示意图;
图5为发明系统中改进型MMAS算法模型结构示意图;
图6为发明决策树相似度矩阵分类模型工作方法示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,一种基于分布式索引的快捷信息检索系统,包括:
分布式数据库,数据节点分布地设置在不同站点上的开源分布式时序、事件或者指标信息数据库,用于容纳不同节点的数据信息;
检索控制模块,用于控制分布式数据库检索,并将检索结果输出至其他模块;
节点信息提取模块,用于提取分布式节点的数据信息,以提取不同节点数据信息,并将各种节点的数据信息的特征提炼出来;
时间序列索引模型,通过提取分布式数据库内的数据信息特征,按照时间序列对数据库内的信息特征进行标识、提取和统计,其中所述时间序列索引模型通过构建自回归模型实现所述节点信息提取模块所提取数据信息的分析;
分布式计算引擎模块,在检索控制模块控制下,通过改进型MMAS算法模型提高分布式数据库信息的索引能力,提高信息索引效率;
数据交互模块,用以实现不同模块之间的信息交互,以实现分布式数据库在检索过程中的传递、互通或者交互;
数据检索点,用于实现分布式数据库检索输出的节点,并外联有外部数据库,以实现不同分布式数据库节点的信息输出;
其中:所述检索控制模块分别与分布式数据库、节点信息提取模块、时间序列索引模型、分布式计算引擎模块、数据交互模块和数据检索点连接,其中所述分布式数据库的输出端与时间序列索引模型的输入端连接,所述时间序列索引模型的输出端与分布式计算引擎模块的输入端连接,所述时间序列索引模型还通过数据交互模块实现检索输出,所述分布式数据库的输出端与分布式节点输入端连接,所述分布式节点的输出端通过数据检索点实现检索输出,并通过检索输出接口与检索信息显示模块连接。
在具体实施例中,输出外设设备能够通过检索输出获取分布式索引数据库点,该系统通过分布式数据库实现不同数据信息的存储,通过检索控制模块实现分布式数据库检索信息的控制,本申请能够提高分布式信息索引的速度,提高信息检索能力。
在上述实施例中,如图2所示,所述检索控制模块为16位MCU内核控制电路,其中所述16位MCU内核控制电路与可编程控制器双向连接,所述16位MCU内核控制电路为MSP430FG4619单片机电路,所述可编程控制器还连接有A/D转换模块,所述A/D转换模块连接有滤波电路。
如图2所示,在本申请的单片机电路中,采用的是单片机MSP430FG4619电路对输入的数据信息进行处理,该芯片采用的是16位功耗较低、性能比较高的MSP430单片机,该电路在运行过程中,其活动模式约为350μA左右,输入的漏电流数值大约为50nA,采用该电路具有较好的稳定性。其中外设电路还可以包括运算器电路、A/D转换模块、控制器电路、晶振电路、复位电路以及JTAG接口电路等多种数据输入数输出模块。在进行分布式索引数据控制时,还可以通过液晶显示电路显示分布式索引数据计量输出的数值,该模块为点阵图形式LCD显示形式,其工作电压为3.3V,显示图形模式为128(列)×64(行)。采用的信号调理放大电路为高精密运放MAX4238信号调理电路。后级放大电路采用的是OP07C运算放大电路。采用的A/D转换模块为具有12位放大电路。具有1M字节运算放大地址存储空间和分布式索引数据计量高速执行计算能力。具有的数据接口为64K FLASH ROM、1.5K RAM;带有41个可供检测人员使用的I/O接口,定时器具有4个,串行接口的数量为2个。
在上述实施例中,如图3所示,所述时间序列索引模型的索引分布式数据库中的序列数据为:
在上述实施例中,由于数据库的不同,其内的数据信息的维度不同,时间序列索引模型中很容易包含分布式数据节点的多项数据和噪声数据,通过将不同的分布式数据库划分不同的特征提取模块和和分布式数据库节点。通过数据函数(1)可以直观地表示索引分布式数据库中的序列数据信息,进而提高时间序列索引模型对不同数据库信息的索引能力。
在上述实施例中,公式(1)表示了时间序列索引模型中输入的分布式数据库内开源分布式时序、事件或者指标信息数据库监测数据,在时间序列索引模型的监测数据序列中加入了移后算子,得到分布式数据库内的数据信息特征序列的回归函数表示为:
式(2)中,表示分布式数据库不同数据信息索引序列自身之前的回归表示,表示自回归系数,表示在第个分布式数据库时的自回归系数,通过公式(2)得到分布式数据库不同数据信息序列的自回归模型,进而实现自身数据库信息的自预测;表示在索引第个分布式数据库时的不同数据信息损伤敏感因子,表示分布式数据库内的数据信息,t表示蚂蚁元素更新释放信息素的时间,表示分布式数据库输出的噪声信号。
自回归模型(Autoregressive Model)是用自身做回归变量的过程,即利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型,它是时间序列中的一种常见形式。但申请的函数模型为该模型中不常见的一种表示,将分布式数据库不同数据信息参数与分布式数据库时的自回归系数以及参数联系起来,提高了数据信息检索能力。
在上述实施例中,时间序列索引模型通过节点信息提取模块确定数据信息维度,则节点信息提取模块的信息提取函数表示为:
式(3)中表示分布式数据库内不同数据信息的采样点,表示时间序列索引模型的维度,表示时间序列索引模型的方差;通过对分布式数据库不同数据信息索引,进而提高了时间序列索引模型工作过程中序列信息索引速度,其中在索引过程中,时间序列索引模型索引分布式数据库时,数据内不同数据信息索引范围通过以下函数表示:
其中、表示时间序列索引模型在索引分布式数据库内不同数据信息时,分布式数据库数据信息具有的索引范围上限值和下限值,表示时间序列索引模型工作过程中信息进行加速时的数据序列,表示分布式数据库不同数据信息在索引加速时,数据库内所以数据信息波动的均值,表示分布式数据库不同数据信息加速度波动的方差,表示时间序列索引模型的经验修正系数;
通过上述实施例,通过时间序列索引模型提高了分布式数据库索引能力。时间序列简单的说就是各时间点上形成的数值序列,时间序列分析就是通过观察历史数据预测未来的值。在这里需要强调一点的是,时间序列分析并不是关于时间的回归,通过上述函数,提高了索引能力。
公式(5)表示了加速索引时的数据信息在各自的分布式数据库内子区间浮动的上下界,通过在索引时间评估分布式数据库内数据信息的浮动情况,进而提高了数据信息评估能力。
时间序列索引模型在分布式数据库下的损失特征函数定义为:
其中表示分布式数据库不同数据信息结构健康情况下的损伤平均值,表示测试样本的损伤平均值。公式(7)表示了在的情况下,分布式数据库不同数据信息结构没有明显的损坏,在的情况下,测试样本与正常情况下的损伤平均值存在差异。
综上所示,通过构建分布式数据库不同数据信息的时间序列分析模型,并应用实际分布式数据库加速采集不同数据内的信息,进而从模型中提取分布式数据库不同数据信息系统固有性质的参数,进而能够识别分布式数据库不同数据信息的整体损伤情况,完成分布式数据库不同数据信息整体状况的安全分析。
在上述实施例中,所述改进型MMAS算法模型为加入分类算法模型的最优搜索算法模型。
在上述实施例中,如图4和图5所示,所述改进型MMAS算法模型工作包括以下步骤:
步骤一、将不同的分布式数据库内的数据信息记作为蚂蚁信息元素,通过第一分类算法模型实现一级分类,然后对MMAS算法模型进行初始化设置;
步骤二、设置不同的分布式数据库内的数据信息的索引轨迹,索引轨迹更新方法通过以下公式进行:
步骤四:对蚂蚁元素信息素轨迹进行平滑化处理,则处理公式为:
步骤五:通过第二分类算法模型对不同的信息元素进行二级分类。
在上述步骤中,改进最大最小蚁群算法(Min Max Ant System,MMAS)与蚁群系统较为相似,但本申请的创新点在于在不断的分布式数据库信息索引过程中,能够不停地进行信息元素更新,进而提高了数据信息检索能力。
在上述实施例中,所述第一分类算法模型和第二分类算法模型为决策树相似度矩阵分类模型。
在上述实施例中,如图6所示,所述决策树相似度矩阵分类模型的工作方法为:
在分布式数据库中的信息素进行分类计算时,当时,则可以将信息素的轨迹进行转换,此时,可以重新进行初始化处理。当时,可以将平滑化机制关闭掉。当时,则可以将MMAS算法模型计算过程中的所信息元素积累进行部分保留。沉淀一部分数据元素信息。然后将这些元素信息重新返到上层步骤处理。
其中公式(12)中的和表示不同分布式数据库数值综合差值,t为不同用户数据
信息在选择蚂蚁信息元素时容忍的最大相似度,则在分布式数据库内的蚂蚁元素进行信息
搜索计算时,分布式数据库内的蚂蚁元素检索路径平均值为:
选择两个不同蚂蚁决策树的相似度函数通过以下函数表示:
当蚂蚁信息元素大于1000时,在不断地进行迭代计算时,则任意两个蚂蚁元素的相似度计算公式表示为:
其中表示采用第n个蚂蚁元素与m个蚂蚁元素进行信息搜索时的元素相似度,通过数据集合的形式,能够使用户在任意时间下获取蚂蚁搜索信息,进而获取分布式数据库内的数据训练集合的最优解和相邻两个蚂蚁元素之间的相似程度。
通过上述方法,提高了蚂蚁元素快速检索能力,提高了分布式数据信息的检索。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些具体实施方式仅是举例说明,本领域的技术人员在不脱离本发明的原理和实质的情况下,可以对上述方法和系统的细节进行各种省略、替换和改变。例如,合并上述方法步骤,从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此,本发明的范围仅由所附权利要求书限定。
Claims (9)
1.一种基于分布式索引的快捷信息检索系统,其特征在于:包括:
分布式数据库,数据节点分布地设置在不同站点上的开源分布式时序、事件或者指标信息数据库,用于容纳不同节点的数据信息;
检索控制模块,用于控制分布式数据库检索,并将检索结果输出至其他模块;
节点信息提取模块,用于提取分布式节点的数据信息,以提取不同节点数据信息,并将各种节点的数据信息的特征提炼出来;
时间序列索引模型,通过提取分布式数据库内的数据信息特征,按照时间序列对数据库内的信息特征进行标识、提取和统计,其中所述时间序列索引模型通过构建自回归模型实现所述节点信息提取模块所提取数据信息的分析;
分布式计算引擎模块,在检索控制模块控制下,通过改进型MMAS算法模型提高分布式数据库信息的索引能力,提高信息索引效率;
数据交互模块,用以实现不同模块之间的信息交互,以实现分布式数据库在检索过程中的传递、互通或者交互;
数据检索点,用于实现分布式数据库检索输出的节点,并外联有外部数据库,以实现不同分布式数据库节点的信息输出;
其中:所述检索控制模块分别与分布式数据库、节点信息提取模块、时间序列索引模型、分布式计算引擎模块、数据交互模块和数据检索点连接,其中所述分布式数据库的输出端与时间序列索引模型的输入端连接,所述时间序列索引模型的输出端与分布式计算引擎模块的输入端连接,所述时间序列索引模型还通过数据交互模块实现检索输出,所述分布式数据库的输出端与分布式节点输入端连接,所述分布式节点的输出端通过数据检索点实现检索输出,并通过检索输出接口与检索信息显示模块连接。
2.根据权利要求1所述的一种基于分布式索引的快捷信息检索系统,其特征在于:所述检索控制模块为16位MCU内核控制电路,其中所述16位MCU内核控制电路与可编程控制器双向连接,所述16位MCU内核控制电路为MSP430FG4619单片机电路,所述可编程控制器还连接有A/D转换模块,所述A/D转换模块连接有滤波电路。
5.根据权利要求1所述的一种基于分布式索引的快捷信息检索系统,其特征在于:所述时间序列索引模型通过节点信息提取模块确定数据信息维度,则节点信息提取模块的信息提取函数表示为:
式(3)中表示分布式数据库内不同数据信息的采样点,表示时间序列索引模型的维度,表示时间序列索引模型的方差;通过对分布式数据库不同数据信息索引,进而提高了时间序列索引模型工作过程中序列信息索引速度,其中在索引过程中,时间序列索引模型索引分布式数据库时,数据内不同数据信息索引范围通过以下函数表示:
其中、表示时间序列索引模型在索引分布式数据库内不同数据信息时,分布式数据库数据信息具有的索引范围上限值和下限值,表示时间序列索引模型工作过程中信息进行加速时的数据序列,表示分布式数据库不同数据信息在索引加速时,数据库内所以数据信息波动的均值,表示分布式数据库不同数据信息加速度波动的方差,表示时间序列索引模型的经验修正系数;
7.根据权利要求1所述的一种基于分布式索引的快捷信息检索系统,其特征在于:所述改进型MMAS算法模型为加入分类算法模型的最优搜索算法模型。
8.根据权利要求7所述的一种基于分布式索引的快捷信息检索系统,其特征在于:所述改进型MMAS算法模型工作包括以下步骤:
步骤一、将不同的分布式数据库内的数据信息记作为蚂蚁信息元素,通过第一分类算法模型实现一级分类,然后对MMAS算法模型进行初始化设置;
步骤二、设置不同的分布式数据库内的数据信息的索引轨迹,索引轨迹更新方法通过以下公式进行:
步骤四:对蚂蚁元素信息素轨迹进行平滑化处理,则处理公式为:
步骤五:通过第二分类算法模型对不同的信息元素进行二级分类。
9.根据权利要求8所述的一种基于分布式索引的快捷信息检索系统,其特征在于:所述第一分类算法模型和第二分类算法模型为决策树相似度矩阵分类模型;
所述决策树相似度矩阵分类模型的工作方法为:
步骤1、在分布式数据库中的信息素进行分类计算时,
其中公式(11)中的和表示不同分布式数据库数值综合差值,t为不同用户数据信息
在选择蚂蚁信息元素时容忍的最大相似度,则在分布式数据库内的蚂蚁元素进行信息搜索
计算时,分布式数据库内的蚂蚁元素检索路径平均值为:
选择两个不同蚂蚁决策树的相似度函数通过以下函数表示:
当蚂蚁信息元素大于1000时,在不断地进行迭代计算时,则任意两个蚂蚁元素的相似度计算公式表示为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210432814.7A CN114528300B (zh) | 2022-04-24 | 2022-04-24 | 一种基于分布式索引的快捷信息检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210432814.7A CN114528300B (zh) | 2022-04-24 | 2022-04-24 | 一种基于分布式索引的快捷信息检索系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114528300A CN114528300A (zh) | 2022-05-24 |
CN114528300B true CN114528300B (zh) | 2022-07-26 |
Family
ID=81628162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210432814.7A Active CN114528300B (zh) | 2022-04-24 | 2022-04-24 | 一种基于分布式索引的快捷信息检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114528300B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114969237B (zh) * | 2022-07-26 | 2022-10-28 | 广州晨安网络科技有限公司 | 一种地理信息系统的地址自动分析匹配方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106548016A (zh) * | 2016-10-24 | 2017-03-29 | 天津大学 | 基于张量时域相关性分解模型的时间序列分析方法 |
CN109241022A (zh) * | 2018-09-11 | 2019-01-18 | 天津理工大学 | 一种基于蓝光存储的档案管理系统及其蚁群搜索算法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7836056B2 (en) * | 2006-09-28 | 2010-11-16 | Microsoft Corporation | Location management of off-premise resources |
US20180189337A1 (en) * | 2016-12-30 | 2018-07-05 | Teradata Us, Inc. | Method and system for storing time series data in a relational database |
CN109409496A (zh) * | 2018-11-14 | 2019-03-01 | 重庆邮电大学 | 一种基于蚁群算法改进的ldtw序列相似度量方法 |
-
2022
- 2022-04-24 CN CN202210432814.7A patent/CN114528300B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106548016A (zh) * | 2016-10-24 | 2017-03-29 | 天津大学 | 基于张量时域相关性分解模型的时间序列分析方法 |
CN109241022A (zh) * | 2018-09-11 | 2019-01-18 | 天津理工大学 | 一种基于蓝光存储的档案管理系统及其蚁群搜索算法 |
Also Published As
Publication number | Publication date |
---|---|
CN114528300A (zh) | 2022-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | opengauss: An autonomous database system | |
Qian et al. | Hybrid approaches to attribute reduction based on indiscernibility and discernibility relation | |
CN110990638A (zh) | 基于fpga-cpu异构环境的大规模数据查询加速装置及方法 | |
CN114528300B (zh) | 一种基于分布式索引的快捷信息检索系统 | |
CN113962358A (zh) | 一种基于时序超图注意力神经网络的信息扩散预测方法 | |
CN113626612A (zh) | 一种基于知识图谱推理的预测方法和系统 | |
CN110032620A (zh) | 基于图搜索算法的自适应学习方法及计算机学习系统 | |
CN111581479A (zh) | 一站式数据处理的方法、装置、存储介质及电子设备 | |
CN110795469A (zh) | 基于Spark的高维序列数据相似性查询方法及系统 | |
Chen et al. | Leon: A new framework for ml-aided query optimization | |
CN116257663A (zh) | 面向无人地面车辆的异常检测与关联分析方法及相关设备 | |
WO2022116111A1 (en) | Computer-implemented method for defect analysis, computer-implemented method of evaluating likelihood of defect occurrence, apparatus for defect analysis, computer-program product, and intelligent defect analysis system | |
CN113946983A (zh) | 产品可靠性薄弱环节评估方法、装置和计算机设备 | |
CN113887717A (zh) | 一种基于深度学习预测神经网络训练时长的方法 | |
CN116910357A (zh) | 一种数据处理方法及相关装置 | |
CN115292672A (zh) | 一种基于机器学习的公式模型构建方法、系统及装置 | |
Trinks | A classification of real time analytics methods. an outlook for the use within the smart factory | |
CN114169731A (zh) | 一种科研机构评级系统、方法、设备和存储介质 | |
Nong | Construction and Simulation of Financial Risk Prediction Model Based on LSTM | |
CN115062300B (zh) | 一种基于多通道深度卷积的入侵检测方法和系统 | |
US12061935B2 (en) | Computer-implemented method for defect analysis, computer-implemented method of evaluating likelihood of defect occurrence, apparatus for defect analysis, computer-program product, and intelligent defect analysis system | |
CN116894057B (zh) | 基于Python的云服务数据收集处理方法、装置、设备及介质 | |
Sun et al. | Workload‐Aware Performance Tuning for Multimodel Databases Based on Deep Reinforcement Learning | |
CN116450768B (zh) | 面向低代码开发平台的工业数据处理方法、装置及设备 | |
Settewong et al. | Why Visualize Data When Coding? Preliminary Categories for Coding in Jupyter Notebooks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |