CN116303473B - 一种数据库的构建方法、装置、设备及可读存储介质 - Google Patents

一种数据库的构建方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN116303473B
CN116303473B CN202310527774.9A CN202310527774A CN116303473B CN 116303473 B CN116303473 B CN 116303473B CN 202310527774 A CN202310527774 A CN 202310527774A CN 116303473 B CN116303473 B CN 116303473B
Authority
CN
China
Prior art keywords
database
data
characteristic
feature
hash
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310527774.9A
Other languages
English (en)
Other versions
CN116303473A (zh
Inventor
武嘉艺
刘焱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changying Hengrong Electromagnetic Technology Chengdu Co ltd
Original Assignee
Changying Hengrong Electromagnetic Technology Chengdu Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changying Hengrong Electromagnetic Technology Chengdu Co ltd filed Critical Changying Hengrong Electromagnetic Technology Chengdu Co ltd
Priority to CN202310527774.9A priority Critical patent/CN116303473B/zh
Publication of CN116303473A publication Critical patent/CN116303473A/zh
Application granted granted Critical
Publication of CN116303473B publication Critical patent/CN116303473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据库的构建方法、装置、设备及可读存储介质,应用于数据库领域,包括对原始数据库中的数据进行特征提取,得到特征数据,并根据特征数据构建特征数据库;根据属性特征字符串,利用局部敏感哈希算法确定各属性特征字符串对应的哈希值;基于哈希值之间的汉明距离,和哈希位选择算法对特征数据库进行处理,得到目标数据库;其中,哈希位选择算法是基于信息熵得到特征数据库中各特征对应的哈希位参数,根据哈希位参数进行去重的算法。和当前直接接收人工操作时各阶段测试过程中的测试数据,进而对测试数据进行汇总的方式相比,本发明可以同时基于汉明距离和哈希位选择算法对数据进行去重处理,使得目标数据库的数据更加精简且全面。

Description

一种数据库的构建方法、装置、设备及可读存储介质
技术领域
本发明涉及数据库领域,特别涉及一种数据库的构建方法、装置、设备及可读存储介质。
背景技术
当前主要根据数据测试的位置数据或者测试信息数据等测试基础信息进行分类汇总,此种汇总方法因被试品种类多,被测项目繁杂,尤其在各阶段测试过程中接收机人工操作时,容易在同一位置多次测试,造成数据的重复。
因此,如何对测试数据进行归纳总结,实现数据库的结构构建、查询更新方法,包括删除都是必要的,而且由于大量数据的汇入,数据库应实现高效便捷查找、更新,服务于产品的设计和整改,帮助定位干扰源。
发明内容
有鉴于此,本发明的目的在于提供一种数据库的构建方法、装置、设备及可读存储介质,解决了现有技术中缺乏高效的数据库的技术问题。
为解决上述技术问题,本发明提供了一种数据库的构建方法,包括:
对原始数据库中的数据进行特征提取,得到特征数据,并根据所述特征数据构建特征数据库;
根据所述特征数据库构建与所述特征数据对应的属性特征字符串,并根据所述属性特征字符串,利用局部敏感哈希算法确定各所述属性特征字符串对应的哈希值;
基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库;其中,所述哈希位选择算法是基于信息熵得到所述特征数据库中各特征对应的哈希位参数值,根据所述哈希位参数值进行去重的算法。
可选的,所述对原始数据库中的数据进行特征提取,得到特征数据,包括:
对电磁发射原始数据库中的数据进行特征提取,得到所述特征数据;其中,所述原始数据库包括所述电磁发射原始数据库。
可选的,所述根据所述特征数据库构建与所述特征数据对应的属性特征字符串,包括:
根据所述特征数据库中所述特征数据对应的属性特征构建所述属性特征字符串;其中,所述属性特征包括被试品信息、测试位置、测试方法和测试时间点。
可选的,所述基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库,包括:
基于所述哈希值之间的所述汉明距离,对所述特征数据库进行处理,得到初始特征数据库;
基于所述哈希位选择算法对所述初始特征数据库进行处理,得到所述目标数据库。
可选的,所述对原始数据库中的数据进行特征提取,得到特征数据,包括:
根据结果特征数据提取所述原始数据库中数据的特征,得到所述特征数据;其中,所述结果特征数据为反映干扰源的数据。
可选的,所述根据结果特征数据提取所述原始数据库中数据的特征,得到所述特征数据,包括:
根据电磁发射测试数据对应的结果是否超标和/或整体波峰个数和/或整体幅值动态范围和/或尖峰个数和/或超标频段范围和/或超标波峰个数和/或超标幅值动态范围和/或超标尖峰个数提取所述原始数据库的特征,得到所述特征数据。
可选的,所述基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库,包括:
基于所述汉明距离,和所述哈希位选择算法对所述特征数据库进行处理,直到所述特征数据库的数据条目对应的所述结果特征数据达到预设个数的特征差距时,确定完成去重,得到所述目标数据库。
本发明还提供了一种数据库的构建装置,包括:
特征数据库构建模块,用于对原始数据库中的数据进行特征提取,得到特征数据,并根据所述特征数据构建特征数据库;
哈希值确定模块,用于根据所述特征数据库构建与所述特征数据对应的属性特征字符串,并根据所述属性特征字符串,利用局部敏感哈希算法确定各所述属性特征字符串对应的哈希值;
目标数据库构建模块,用于基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库;其中,所述哈希位选择算法是基于信息熵得到所述特征数据库中各特征对应的哈希位参数值,根据所述哈希位参数值进行去重的算法。
本发明还提供了一种数据库的构建设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述的数据库的构建方法。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现上述的数据库的构建方法。
可见,本发明通过提取测试数据的特征数据,构建特征数据库,从而利用汉明距离,和哈希位选择算法对特征数据库进行分类、匹配合并、重复条目删除、排序,得到目标数据库,和当前直接对各阶段测试过程中接收机人工操作时的测试数据进行汇总的方式相比,本发明可以同时基于汉明距离和哈希位选择算法对数据进行去重处理,使得目标数据库的结果数据更加符合要求。
此外,本发明还提供了一种数据库的构建装置、设备及可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种数据库的构建方法的流程图;
图2为本发明实施例提供的一种基于电磁发射数据的数据库构建方法的流程图;
图3为本发明实施例提供的另一种数据库的构建方法的流程图;
图4为本发明实施例提供的一种数据库的构建方法的流程示例图;
图5为本发明实施例提供的一种数据库的构建装置的结构示意图;
图6为本发明实施例提供的一种数据库的构建设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例提供的一种数据库的构建方法。该方法可以包括:
S100,对原始数据库中的数据进行特征提取,得到特征数据,并根据特征数据构建特征数据库。
该实施例并不限定原始数据库中数据的具体类型。例如,原始数据库中的数据可以是电气设备检测数据;或者原始数据库中的数据可以是电磁检测数据;或者原始数据库中的数据可以是电磁发射数据。该实施例并不限定特征提取的具体方法。例如,可以根据设备类型、设备电压等级和设备编号提取电气设备检测数据的特征数据;或者还可以根据红外图像原数据库中的数据条目提取红外图像的温度特征和图像熵特征;或者还可以根据结果是否超标,整体波峰个数,整体幅值动态范围,尖峰个数,超标频段范围,超标波峰个数,超标幅值动态范围,超标尖峰个数这8项特征信息提取电磁发射数据库中数据的特征数据。可以理解的是,具体提取什么特征可以根据具体需求进行设置,能够满足用户的需求即可。
进一步地,为了提高特征数据选取的准确性,上述对原始数据库中的数据进行特征提取,得到特征数据,可以包括:
根据结果特征数据提取原始数据库中数据的特征,得到特征数据;其中,结果特征数据为反映干扰源的数据。
该实施例可以根据结果特征数据对原始数据库中的数据进行特征提取,得到特征数据。可以理解的是,为了找到干扰源需要提取与干扰源相关的特征数据,以便精细化每条数据,得到更加符合要求的数据。
进一步地,为了提高电磁测试领域数据库构建的准确性,上述根据结果特征数据提取原始数据库中数据的特征,得到特征数据,可以包括:
根据电磁发射测试数据对应的结果是否超标和/或整体波峰个数和/或整体幅值动态范围和/或尖峰个数和/或超标频段范围和/或超标波峰个数和/或超标幅值动态范围和/或超标尖峰个数提取所述原始数据库的特征,得到特征数据。
该实施例对于电磁发射测试数据,根据结果是否超标,整体波峰个数,整体幅值动态范围,尖峰个数,超标频段范围,超标波峰个数,超标幅值动态范围,超标尖峰个数这8项特征信息进行电磁发射测试数据的针对性特征识别。电磁发射测试特征数据库的数据条目由属性特征字符串和8项特征信息构成电磁发射测试特征数据库。8项特征信息计算过程如下:1、结果是否超标:根据以国际无线电干扰特别委员会(CISPR)等国际组织以及美国和欧盟为代表的政府机构对不同类型电子设备的电磁发射提出了强制性要求及测量规范,而以MIL-461(美国标)系列为代表的美军标和我国的GJB-151B(军标)等军标则对军用装备的电磁发射的要求和测量提出了具体要求。根据相关电磁兼容标准的具体要求,可以判断测试得到被试品的电磁发射数据是否超过极限值标准;2、整体波峰个数:针对整体趋势的统计特征,发现大部分电磁发射数据的整体趋势具有波动性,无论波动程度如何,从整体趋势中可以看出代表这种趋势的曲线具有明显的波峰和波谷。波峰是在对电磁发射数据进行小波多分辨分析后,得到测试数据的整体趋势。在近似分量中逐点计算,选取幅值均大于左右相邻的 5 个点的位置记为波峰。3、整体幅值范围:不同设备的信号在幅值波动方面不同,在蕴含的能量大小方面也并不相同。即近似分量覆盖下的频谱幅值范围,反映了设备的噪声信号能量大小。具体计算方法为将电磁发射数据的幅值以10个点为一个区间分组,然后求每个区间内最大值与最小值的差,最后对所有分组求得的差值计算平均值,从而获得幅值动态范围这一指标;4、尖峰个数:尖峰数量的多少反映了设备能量的分布特性,若某频谱中只含有个别的尖峰,表明该设备的对外电磁发射能力有限,只能在个别频点输出能量。因此在排除掉谐波信息后,需要一对一地进行频点排查,控制其电磁发射。如果设备频谱图中含有了大量的尖峰,表明了该设备对外发射能力较高,能够在大量的频点产生电磁发射。定义尖峰:明显高于频谱图的整体趋势的频谱谱峰。具体的计算方法是在原始数据和整体趋势的差值(剩余分量)的基础上,逐点计算频谱幅值与幅值动态范围的比值。当这个比值大于1.5时,认为此处为尖峰位置,从而可进一步统计尖峰个数。5、超标频段范围:在指标1的判断中,根据相关电磁兼容标准的具体要求,会将测试得到被试品的电磁发射数据与极限值标准曲线进行对比,经过对比后可以得到超出标准曲线的频率上下限,两者相减即得到超标频段范围;6、超标波峰个数:根据参数2和参数5判断在超标频段范围内的波峰个数;7、超标幅值动态范围:根据参数3和参数5判断在超标频段范围内的幅值动态范围;8、超标尖峰个数:根据参数4和参数5判断在超标频段范围内的超标尖峰个数;以上这8项特征信息可以对电磁发射测试数据进行针对性的特征识别,结合工程师的基本经验可以对测试数据进行深入的总结归纳,从而有效反映产品的物理特性,进而找到引起被试品电磁发射超标的源头。比如同时拥有大量尖峰和明显的幅度包络特征的数据可以指向电源类的干扰源,具有大量周期性尖峰特征的数据可以指向频率源类干扰源。
S101,根据特征数据库构建与特征数据对应的属性特征字符串,并根据属性特征字符串,利用局部敏感哈希算法确定各属性特征字符串对应的哈希值。
该实施例并不限定具体的属性特征字符串,只要与该特征数据库的属性相关即可。例如,属性特征字符串可以是由设备信息和设备地理位置构成的字符串;或者该属性特征字符串还可以是由被试品信息、测试位置和测试方法构成的属性特征字符串;或者该属性特征字符串还可以是由测试时间、被试品信息、测试位置和测试方法构成的属性特征字符串。该实施例中的局部敏感哈希算法是一种空间域转换思想,整体算法基于一个假设,如果两个文本在原有的数据空间是相似的,那么分别经过哈希函数转换以后的它们也具有很高的相似度;相反,如果它们本身是不相似的,那么经过转换后它们应仍不具有相似性,局部敏感哈希算法可以保持最大可能的相似度。数据对应的信息量越大,相应构成的特征向量维度就越高,哈希函数从本质上完成了数据降维的作用。一般数据库多使用二叉查找树的方法进行建立,它的优点是算法复杂度低,但是对于电磁发射测试数据库的建立,需要构建测试数据的原始数据库,并且需要针对性地对电磁发射测试数据进行特征提取后,建立电磁发射测试数据特征数据库。在数据库中需要对各条数据进行按照属性特征的顺序排序,有助于电磁兼容工程师对干扰源的识别并进行电磁兼容设计工作。使用二叉查找树进行索引,对数据库排序、更新、删除等步骤较为繁琐,同时在排序过程中可能使得二叉树支链过长或者不平衡。使用局部敏感哈希算法可以非常优秀的完成数据的重复去重,并且优化数据库的排序、更新、删除多余项等方面的功能。
S102,基于哈希值之间的汉明距离,和哈希位选择算法对特征数据库进行处理,得到目标数据库;其中,哈希位选择算法是基于信息熵得到特征数据库中各特征对应的哈希位参数,根据哈希位参数进行去重的算法。
该实施例并不限定根据汉明距离和哈希位选择算法进行数据库构建的具体方式。例如,可以先基于哈希值之间的汉明距离进行处理,得到第一数据库,再利用哈希位选择算法对第一数据库进行处理,得到目标数据库。该实施例中的信息熵具有单调性、非负性和累加性;单调性,发生概率越高的事件,其携带的信息量越低;非负性,信息熵可以看作为一种广度量,非负性是一种合理的必然;累加性,即多随机事件同时发生存在的总不确定性的量度是可以表示为各事件不确定性的量度的和,这也是广度量的一种体现。该实施例中的哈希位选择算法可以根据所有数据条目各属性特征对应的哈希值,利用信息熵对哈希位进行评分,根据哈希位选择算法选择评分高的哈希位,其余的数据进行删除,该实施例中的哈希位参数可以理解为评分后的分值。可以理解的是,为了提高数据库构建的效率,可以先利用汉明距离进行数据库的构建,再利用哈希位选择算法进行去重。
进一步地,为了完成完整去重,上述基于哈希值之间的汉明距离,和哈希位选择算法对特征数据库进行处理,得到目标数据库,可以包括:
基于汉明距离,和哈希位选择算法对特征数据库进行处理,直到特征数据库的数据条目对应的结果特征数据达到预设个数的特征差距时,确定完成去重,得到目标数据库。
该实施例并不限定预设个数的具体个数。例如,预设个数可以是两个;或者预设个数可以是三个;或者预设个数可以是三个以上。该实施例可以基于汉明距离,和哈希位选择算法对特征数据库进行处理,直到特征数据库的数据条目对应的结果特征数据达到预设个数的特征差距时,确定完成去重,得到目标数据库。
本发明实施例提供的一种数据库的构建方法,包括:对原始数据库中的数据进行特征提取,得到特征数据,并根据特征数据构建特征数据库;根据特征数据库构建与特征数据对应的属性特征字符串,并根据属性特征字符串,利用局部敏感哈希算法确定各属性特征字符串对应的哈希值;基于哈希值之间的汉明距离,和哈希位选择算法对特征数据库进行处理,得到目标数据库;其中,哈希位选择算法是基于信息熵得到特征数据库中各特征对应的哈希位参数,根据哈希位参数进行去重的算法。可见,本发明通过提取测试数据的特征数据,构建特征数据库,从而利用汉明距离,和哈希位选择算法对特征数据库进行分类、匹配合并、重复条目删除、排序,得到目标数据库,和当前直接对各阶段测试过程中接收机人工操作时的测试数据进行汇总的方式相比,本发明可以同时基于汉明距离和哈希位选择算法对数据进行去重处理,使得目标数据库的结果数据更加符合要求。并且,特征数据选取的方式与结果数据相关,使得数据库构建时构建准确;并且可以选取电磁发射领域对应的特征数据,提高数据库构建的适用性;并且设置停止去重的条件,使得数据库去重更加完整。
为了使本发明更便于理解,具体请参考图2,图2为本发明实施例提供的一种基于电磁发射数据的数据库构建方法的流程图,该方法可以包括:
S200,对电磁发射原始数据库中的数据进行特征提取,得到特征数据;其中,原始数据库包括电磁发射原始数据库。
可以理解的是,在复杂系统研制过程中,需要进行多次电磁发射测量,用于指导电磁兼容性设计、整改,考核设备、系统的电磁兼容性。而电磁发射是产品的固有属性,可以反映产品的物理特性,因此,针对测试数据,可以使用数据处理方法进行处理,提取特征,进而找到引起被试品电磁发射超标的源头。该实施例中的电磁发射原始数据库中数据为电磁发射测试数据,该电磁发射测试数据是指在电子设备研制、整改等过程中,使用各种电磁干扰测试仪器对被试品 (EUT) 进行测量,得到的反映被试品电磁发射特点的数据。对电子设备而言,所获取电磁发射数据可以反映电子设备的特点。该实施并不限定当原始数据库是电磁发射原始数据库,提取特征数据的具体方式,只要可以提取的该特征可以确定干扰源即可。例如,特征数据可以根据结果是否超标和/或整体波峰个数和/或整体幅值动态范围和/或尖峰个数和/或超标频段范围进行确定;或者特征数据可以根据超标波峰个数和/或超标幅值动态范围和/或超标尖峰个数进行确定。需要说明的是,电磁发射测试数据以及综合使用多种手段对被试品测试得到其电磁发射数据。在系统或设备的研制、整改、定型阶段会产生大量的电磁兼容数据,尤其是类型丰富的电磁发射数据,但是目前针对测试数据及特征数据库的归纳方法较少。现有方法并没有很好地将这些宝贵的海量数据进行合适的归纳与总结,形成合适的数据库资源。并且因被试品种类多,被测项目繁杂,尤其在各阶段测试过程中接收机人工操作时,容易在同一位置多次测试,因此对电磁发射测试数据进行特征数据库的构建是十分必要的。通过数据特征的分析提取可以帮助工程师更好地对干扰源的特征进行认知,更好地进行针对系统或设备的电磁兼容设计。
进一步地,为了提高电磁测试领域数据库构建的准确性,上述根据结果特征数据提取原始数据库中数据的特征,得到特征数据,可以包括:
根据电磁发射测试数据对应的结果是否超标和/或整体波峰个数和/或整体幅值动态范围和/或尖峰个数和/或超标频段范围和/或超标波峰个数和/或超标幅值动态范围和/或超标尖峰个数提取所述原始数据库的特征,得到特征数据。
该实施例根据电磁发射测试数据对应的结果是否超标和/或整体波峰个数和/或整体幅值动态范围和/或尖峰个数和/或超标频段范围和/或超标波峰个数和/或超标幅值动态范围和/或超标尖峰个数提取所述原始数据库的特征,得到特征数据。
进一步地,为了完成完整去重,上述基于哈希值之间的汉明距离,和哈希位选择算法对特征数据库进行处理,得到目标数据库,可以包括:
基于汉明距离,和哈希位选择算法对所述特征数据库进行处理,直到特征数据库的数据条目对应的结果特征数据达到预设个数的特征差距时,确定完成去重,得到所述目标数据库。
S201,根据特征数据构建特征数据库。
该实施例根据提取的特征数据构建特征数据库。
S202,根据特征数据库构建与特征数据对应的属性特征字符串,并根据属性特征字符串,利用局部敏感哈希算法确定各属性特征字符串对应的哈希值。
该实施例确定属性特征字符串,以根据该属性特征字符串进行局部敏感哈希算法运算。
S203,基于哈希值之间的汉明距离,和哈希位选择算法对特征数据库进行处理,得到目标数据库;其中,哈希位选择算法是基于信息熵得到特征数据库中各特征对应的哈希位参数,根据哈希位参数进行去重的算法。
该实施例可以将数据库的构建方法应用于电磁领域,可以很好地对电磁测试数据进行归纳总结,服务于产品的设计和整改,帮助定位干扰源。
为了使本发明更便于理解,具体请参考图3,图3为本发明实施例提供的另一种数据库的构建方法的流程图,具体可以包括:
S300,对原始数据库中的数据进行特征提取,得到特征数据,并根据特征数据构建特征数据库。
S301,根据特征数据库构建与所述特征数据对应的属性特征字符串,并根据属性特征字符串,利用局部敏感哈希算法确定各属性特征字符串对应的哈希值。
S302,基于哈希值之间的汉明距离,对特征数据库进行处理,得到初始特征数据库。
该实施例首先基于哈希值之间的汉明距离,对特征数据库进行处理,得到初始特征数据库。该实施例并不限定基于汉明距离进行处理的具体过程。例如,构建数据结构,k1是平均哈希的前六位即为属性特征[被试品信息+测试位置+测试方法]的二值表示,k2是平均哈希的时间位,可以表示时间年月日的不同。计算各数据条目k1的汉明距离,实现数据条目按被试品信息、测试位置、测试方法等属性特征快速检索,如,编号1的条目和编号2的条目k1的汉明距离为1,说明属性特征有一定相似度,被试品信息都是一致的,编号1的条目与编号3的条目k1的汉明距离为2,说明属性特征相似度低,被试品信息、测试位置都是不同的,它们属性特征差异最大。对于属性特征相似度高的数据条目,对其进行分类,可以快速得到该数据条目属于哪一类别。对于电磁发射测试特征数据表合并,方法同上,对k1和k2数据结构拼接并求平均哈希的汉明距离,汉明距离为0的条目,表明两条数据的被试品信息、测试位置和测试方法一致,则在两数据表中按时间进行筛选,两者相同的直接合并,完成重复数据库的数据快速合并。由此,可以提高数据库的构建效率,利用属性和时间字符块实现高效的数据库查找、更新,且数据库可扩展性高。对同一数据库中的条目,若时间哈希值之间的汉明距离等于0,则说明该条目重复,删除重复的条目,避免数据重复导致出错。
S303,基于哈希位选择算法对初始特征数据库进行处理,得到目标数据库。
该实施例利用信息熵对哈希位进行评分,根据哈希位选择算法选择评分高的哈希位,进行二次去重(评分较低)。直到电磁发射测试特征数据库的数据条目的8项特征信息参数中具有三项及三项以上差距,及完成完整去重。
为了使本发明更便于理解,具体请参考图4,图4为本发明实施例提供的一种数据库的构建方法的流程示例图,具体可以包括:
S400,获取被试品的电磁发射测试数据。
S401,利用被试品电磁发射测试数据构建电磁发射测试原始数据库。
S402,根据电磁发射特征对电磁发射测试原始数据库进行特征提取,构建电磁发射特征数据库;其中,电磁发射特征包括:电磁发射数据的大小、整体波峰个数、整体幅值范围、尖峰个数、超标频段范围、超标波峰个数、超标幅值动态范围和超标尖峰个数。
S403,基于被试品信息、测试位置、测试方法、测试时间点构建属性特征字符串,利用局部敏感哈希算法确定各属性特征字符串对应的哈希值。
该实施例构建属性特征字符串,k1是平均哈希的前六位即为属性特征[被试品信息+测试位置+测试方法]的二值表示,k2是平均哈希的时间位,可以表示时间年月日的不同。
S404,根据哈希值通过汉明距离对电磁发射特征数据库进行数据条目进行分类、匹配合并、重复条目删除、排序,得到第一目标特征数据库。
该实施例计算各数据条目k1的汉明距离,实现数据条目按被试品信息、测试位置、测试方法等属性特征快速检索,如,编号1的条目和编号2的条目k1的汉明距离为1,说明属性特征有一定相似度,被试品信息都是一致的,编号1的条目与编号3的条目k1的汉明距离为2,说明属性特征相似度低,被试品信息、测试位置都是不同的,它们属性特征差异最大。对于属性特征相似度高的数据条目,对其进行分类,可以快速得到该数据条目属于哪一类别。对于电磁发射测试特征数据表合并,方法同上,对k1和k2数据结构拼接并求平均哈希的汉明距离,汉明距离为0的条目,表明两条数据的被试品信息、测试位置和测试方法一致,则在两数据表中按时间进行筛选,两者相同的直接合并,完成重复数据库的数据快速合并。由此,可以提高数据库的构建效率,利用属性和时间字符块实现高效的数据库查找、更新,且数据库可扩展性高。对同一数据库中的条目,若时间哈希值之间的汉明距离等于0,则说明该条目重复,删除重复的条目,避免数据重复导致出错。
S405,根据哈希值结合信息熵确定各哈希位对应的哈希位参数,根据哈希位参数对第一目标特征数据库进行去重,得到第二目标特征数据库;直到电磁发射测试特征数据库的数据条目的8项电磁发射特征参数中具有三项及三项以上差距,及完成完整去重。
该实施例使用信息熵对哈希位进行评分,根据哈希位选择算法选择评分高的哈希位,进行二次去重(评分较低)。直到电磁发射测试特征数据库的数据条目的8项特征信息参数中具有三项及三项以上差距,及完成完整去重。可以理解的是,哈希位的信息熵值越大,该哈希位的不确定性程度越高,包含的信息量越大,使用信息熵作为哈希位参数可以对哈希位进行筛选;根据如下公式算出哈希位的哈希位参数:
其中,/>表示各哈希位;/>表示/>取值的概率分布,m表示/>取值的个数,在哈希位中,m=2,即为/>中元素的取值只能为0或者1;通过上式计算每个哈希位的哈希位参数,记为/>,原哈希码长度记为L,将/>从大到小排序,将前L-1个数值所在的列号作为选取的哈希位,进行二次去重。
下面对本发明实施例提供的一种数据库的构建装置进行介绍,下文描述的一种数据库的构建装置与上文描述的一种数据库的构建方法可相互对应参照。
具体请参考图5,图5为本发明实施例提供的一种数据库的构建装置的结构示意图,可以包括:
特征数据库构建模块100,用于对原始数据库中的数据进行特征提取,得到特征数据,并根据所述特征数据构建特征数据库;
哈希值确定模块200,用于根据所述特征数据库构建与所述特征数据对应的属性特征字符串,并根据所述属性特征字符串,利用局部敏感哈希算法确定各所述属性特征字符串对应的哈希值;
目标数据库构建模块300,用于基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库;其中,所述哈希位选择算法是基于信息熵得到所述特征数据库中各特征对应的哈希位参数,根据所述哈希位参数进行去重的算法。
进一步地,基于上述实施例,上述特征数据库构建模块100,可以包括:
电磁发射特征提取单元,用于对电磁发射原始数据库中的数据进行特征提取,得到所述特征数据;其中,所述原始数据库包括所述电磁发射原始数据库。
进一步地,基于上述实施例,上述哈希值确定模块200,可以包括:
根据属性特征构建属性特征字符串单元,用于根据所述特征数据库中所述特征数据对应的属性特征构建所述属性特征字符串;其中,所述属性特征包括被试品信息、测试位置、测试方法和测试时间点。
进一步地,基于上述任意实施例,上述目标数据库构建模块300,可以包括:
基于汉明距离构建数据库单元,用于基于所述哈希值之间的所述汉明距离,对所述特征数据库进行处理,得到初始特征数据库;
基于哈希位选择算法构建目标数据库单元,用于基于所述哈希位选择算法对所述初始特征数据库进行处理,得到所述目标数据库。
进一步地,基于上述任意实施例,上述特征数据库构建模块100,可以包括:
基于结果特征数据提取特征数据单元,用于根据结果特征数据提取所述原始数据库中数据的特征,得到所述特征数据;其中,所述结果特征数据为反映干扰源的数据。
进一步,基于上述实施例,上述特征数据库构建模块100,包括:
特征数据库构建子单元,用于根据电磁发射测试数据对应的结果是否超标和/或整体波峰个数和/或整体幅值动态范围和/或尖峰个数和/或超标频段范围和/或超标波峰个数和/或超标幅值动态范围和/或超标尖峰个数提取所述原始数据库的特征,得到所述特征数据。
进一步地,基于上述实施例,上述目标数据库构建模块300,可以包括:
完成去重确定单元,用于基于所述汉明距离,和所述哈希位选择算法对所述特征数据库进行处理,直到所述特征数据库的数据条目对应的所述结果特征数据达到预设个数的特征差距时,确定完成去重,得到所述目标数据库。
需要说明的是,上述一种数据库的构建装置中的模块以及单元在不影响逻辑的情况下,其顺序可以前后进行更改。
本发明实施例提供的一种数据库的构建装置,包括:特征数据库构建模块100,用于对原始数据库中的数据进行特征提取,得到特征数据,并根据所述特征数据构建特征数据库;哈希值确定模块200,用于根据所述特征数据库构建与所述特征数据对应的属性特征字符串,并根据所述属性特征字符串,利用局部敏感哈希算法确定各所述属性特征字符串对应的哈希值;目标数据库构建模块300,用于基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库;其中,所述哈希位选择算法是基于信息熵得到所述特征数据库中各特征对应的哈希位参数,根据所述哈希位参数进行去重的算法。可见,本发明通过提取测试数据的特征数据,构建特征数据库,从而利用汉明距离,和哈希位选择算法对特征数据库进行分类、匹配合并、重复条目删除、排序,得到目标数据库,和当前直接对各阶段测试过程中接收机人工操作时的测试数据进行汇总的方式相比,本发明可以同时基于汉明距离和哈希位选择算法对数据进行去重处理,使得目标数据库的结果数据更加符合要求。并且,特征数据选取的方式与结果数据相关,使得数据库构建时构建准确;并且可以选取电磁发射领域对应的特征数据,提高数据库构建的适用性;并且设置停止去重的条件,使得数据库去重更加完整。并且,可以将数据库的构建方法应用于电磁领域,可以很好地对电磁测试数据进行归纳总结,服务于产品的设计和整改,帮助定位干扰源;并且,基于汉明距离进行初始数据库的构建,再基于哈希位选择算法进行二次去重,提高数据库的构建效率。
下面对本发明实施例提供的一种数据库的构建设备进行介绍,下文描述的数据库的构建设备与上文描述的一种数据库的构建方法可相互对应参照。
请参考图6,图6为本发明实施例提供的一种数据库的构建设备的结构示意图,可以包括:
存储器10,用于存储计算机程序;
处理器20,用于执行计算机程序,以实现上述的一种数据库的构建方法。
存储器10、处理器20、通信接口30均通过通信总线40完成相互间的通信。
在本发明实施例中,存储器10中用于存放一个或者一个以上程序,程序可以包括程序代码,程序代码包括计算机操作指令,在本发明实施例中,存储器10中可以存储有用于实现以下功能的程序:
对原始数据库中的数据进行特征提取,得到特征数据,并根据特征数据构建特征数据库;
根据特征数据库构建与特征数据对应的属性特征字符串,并根据属性特征字符串,利用局部敏感哈希算法确定各属性特征字符串对应的哈希值;
基于哈希值之间的汉明距离,和哈希位选择算法对特征数据库进行处理,得到目标数据库;其中,哈希位选择算法是基于信息熵得到特征数据库中各特征对应的哈希位参数,根据哈希位参数进行去重的算法。
在一种可能的实现方式中,存储器10可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及至少一个功能所需的应用程序等;存储数据区可存储使用过程中所创建的数据。
此外,存储器10可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括NVRAM。存储器存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可以包括各种系统程序,用于实现各种基础任务以及处理基于硬件的任务。
处理器20可以为中央处理器(Central Processing Unit,CPU)、特定应用集成电路、数字信号处理器、现场可编程门阵列或者其他可编程逻辑器件,处理器20可以是微处理器或者也可以是任何常规的处理器等。处理器20可以调用存储器10中存储的程序。
通信接口30可以为通信模块的接口,用于与其他设备或者系统连接。
当然,需要说明的是,图6所示的结构并不构成对本发明实施例中一种数据库的构建设备的限定,在实际应用中一种数据库的构建设备可以包括比图6所示的更多或更少的部件,或者组合某些部件。
下面对本发明实施例提供的计算机可读存储介质进行介绍,下文描述的计算机可读存储介质与上文描述的一种数据库的构建方法可相互对应参照。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的一种数据库的构建方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应该认为超出本发明的范围。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
以上对本发明所提供的一种数据库的构建方法、装置、设备及可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (5)

1.一种数据库的构建方法,其特征在于,包括:
对原始数据库中的数据进行特征提取,得到特征数据,并根据所述特征数据构建特征数据库;
根据所述特征数据库构建与所述特征数据对应的属性特征字符串,并根据所述属性特征字符串,利用局部敏感哈希算法确定各所述属性特征字符串对应的哈希值;
基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库;其中,所述哈希位选择算法是基于信息熵得到所述特征数据库中各特征对应的哈希位参数,根据所述哈希位参数进行去重的算法;
其中,所述对原始数据库中的数据进行特征提取,得到特征数据,包括:
根据电磁发射测试数据对应的结果是否超标、整体波峰个数、整体幅值动态范围、尖峰个数、超标频段范围、超标波峰个数、超标幅值动态范围和超标尖峰个数提取所述原始数据库的特征,得到所述特征数据;其中,所述结果是否超标是指是否超过军标规定的极限值标准;所述整体波峰个数的确定过程为在对所述电磁发射测试数据进行小波多分辨分析后,得到测试数据的整体趋势,将幅值均大于左右相邻的5个点的位置记为波峰;所述整体幅值动态范围确定过程为将所述电磁发射测试数据的幅值以10个点为一个区间分组,然后求每个区间内最大值与最小值的差,最后对所有分组求得的差值计算平均值,从而获得所述整体幅值动态范围;所述尖峰个数的确定过程为在所述原始数据库中的数据和整体幅值动态范围的差值的基础上,逐点计算原始频谱幅值与各个幅值动态范围的比值,当这个比值大于1.5时,确定为尖峰,从而统计尖峰个数;所述超标频段范围的确定过程为根据相关电磁兼容标准将测试得到被试品的电磁发射数据与极限值标准曲线进行对比,经过对比后得到超出标准曲线的频率上下限,两者相减得到超标频段范围;根据所述整体波峰个数和所述超标频段范围确定所述超标波峰个数;根据所述整体幅值动态范围和所述超标频段范围确定所述超标幅值动态范围;根据所述尖峰个数和所述超标频段范围确定所述超标尖峰个数;
其中,所述基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库,包括:
基于所述哈希值之间的所述汉明距离,对所述特征数据库进行处理,得到初始特征数据库;
基于所述哈希位选择算法对所述初始特征数据库进行处理,直到所述初始特征数据库的数据条目中的8项特征信息参数中具有三项及三项以上差距,得到所述目标数据库,其中,所述8项特征信息参数包括所述结果是否超标、所述整体波峰个数、所述整体幅值动态范围、尖峰个数、所述超标频段范围、所述超标波峰个数、所述超标幅值动态范围和所述超标尖峰个数。
2.根据权利要求1所述的数据库的构建方法,其特征在于,所述根据所述特征数据库构建与所述特征数据对应的属性特征字符串,包括:
根据所述特征数据库中所述特征数据对应的属性特征构建所述属性特征字符串;其中,所述属性特征包括被试品信息、测试位置、测试方法和测试时间点。
3.一种数据库的构建装置,其特征在于,包括:
特征数据库构建模块,用于对原始数据库中的数据进行特征提取,得到特征数据,并根据所述特征数据构建特征数据库;
哈希值确定模块,用于根据所述特征数据库构建与所述特征数据对应的属性特征字符串,并根据所述属性特征字符串,利用局部敏感哈希算法确定各所述属性特征字符串对应的哈希值;
目标数据库构建模块,用于基于所述哈希值之间的汉明距离,和哈希位选择算法对所述特征数据库进行处理,得到目标数据库;其中,所述哈希位选择算法是基于信息熵得到所述特征数据库中各特征对应的哈希位参数,根据所述哈希位参数进行去重的算法;
其中,所述特征数据库构建模块,包括:
多特征提取确定特征数据单元,用于根据电磁发射测试数据对应的结果是否超标、整体波峰个数、整体幅值动态范围、尖峰个数、超标频段范围、超标波峰个数、超标幅值动态范围和超标尖峰个数提取所述原始数据库的特征,得到所述特征数据;其中,所述结果是否超标是指是否超过军标规定的极限值标准;所述整体波峰个数的确定过程为在对所述电磁发射测试数据进行小波多分辨分析后,得到测试数据的整体趋势,将幅值均大于左右相邻的5个点的位置记为波峰;所述整体幅值动态范围确定过程为将所述电磁发射测试数据的幅值以10个点为一个区间分组,然后求每个区间内最大值与最小值的差,最后对所有分组求得的差值计算平均值,从而获得所述整体幅值动态范围;所述尖峰个数的确定过程为在所述原始数据库中的数据和整体幅值动态范围的差值的基础上,逐点计算原始频谱幅值与各个幅值动态范围的比值,当这个比值大于1.5时,确定为尖峰,从而统计尖峰个数;所述超标频段范围的确定过程为根据相关电磁兼容标准将测试得到被试品的电磁发射数据与极限值标准曲线进行对比,经过对比后得到超出标准曲线的频率上下限,两者相减得到超标频段范围;根据所述整体波峰个数和所述超标频段范围确定所述超标波峰个数;根据所述整体幅值动态范围和所述超标频段范围确定所述超标幅值动态范围;根据所述尖峰个数和所述超标频段范围确定所述超标尖峰个数;
其中,所述目标数据库构建模块,包括:
初始特征数据库构建单元,用于基于所述哈希值之间的所述汉明距离,对所述特征数据库进行处理,得到初始特征数据库;
目标数据库构建单元,用于基于所述哈希位选择算法对所述初始特征数据库进行处理,直到所述初始特征数据库的数据条目中的8项特征信息参数中具有三项及三项以上差距,得到所述目标数据库,其中,所述8项特征信息参数包括所述结果是否超标、所述整体波峰个数、所述整体幅值动态范围、尖峰个数、所述超标频段范围、所述超标波峰个数、所述超标幅值动态范围和所述超标尖峰个数。
4.一种数据库的构建设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1或2所述的数据库的构建方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1或2所述的数据库的构建方法。
CN202310527774.9A 2023-05-11 2023-05-11 一种数据库的构建方法、装置、设备及可读存储介质 Active CN116303473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310527774.9A CN116303473B (zh) 2023-05-11 2023-05-11 一种数据库的构建方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310527774.9A CN116303473B (zh) 2023-05-11 2023-05-11 一种数据库的构建方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN116303473A CN116303473A (zh) 2023-06-23
CN116303473B true CN116303473B (zh) 2024-04-19

Family

ID=86790867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310527774.9A Active CN116303473B (zh) 2023-05-11 2023-05-11 一种数据库的构建方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN116303473B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012022127A (ja) * 2010-07-14 2012-02-02 Alpine Electronics Inc 音声認識装置
CN106503106A (zh) * 2016-10-17 2017-03-15 北京工业大学 一种基于深度学习的图像哈希索引构建方法
CN109633222A (zh) * 2018-12-21 2019-04-16 广电计量检测(成都)有限公司 一种感应尖峰信号发生装置及系统
CN111368919A (zh) * 2020-02-25 2020-07-03 重庆大学 特征数据构建方法、数据集构建方法、数据分类方法、emc故障的诊断方法和系统
CN113341355A (zh) * 2021-05-08 2021-09-03 中国舰船研究设计中心 一种三维空间电磁场分布测量系统及测试方法
CN115658940A (zh) * 2022-10-24 2023-01-31 国网上海市电力公司 异源检测特征数据库构建与更新方法、装置及存储介质
CN115839845A (zh) * 2022-12-27 2023-03-24 江苏徐工国重实验室科技有限公司 一种传动部件异响识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012022127A (ja) * 2010-07-14 2012-02-02 Alpine Electronics Inc 音声認識装置
CN106503106A (zh) * 2016-10-17 2017-03-15 北京工业大学 一种基于深度学习的图像哈希索引构建方法
CN109633222A (zh) * 2018-12-21 2019-04-16 广电计量检测(成都)有限公司 一种感应尖峰信号发生装置及系统
CN111368919A (zh) * 2020-02-25 2020-07-03 重庆大学 特征数据构建方法、数据集构建方法、数据分类方法、emc故障的诊断方法和系统
CN113341355A (zh) * 2021-05-08 2021-09-03 中国舰船研究设计中心 一种三维空间电磁场分布测量系统及测试方法
CN115658940A (zh) * 2022-10-24 2023-01-31 国网上海市电力公司 异源检测特征数据库构建与更新方法、装置及存储介质
CN115839845A (zh) * 2022-12-27 2023-03-24 江苏徐工国重实验室科技有限公司 一种传动部件异响识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Enhancement in Dynamic Range of Amplitude-Modulated Continuous-Wave Laser Scanner Having a Coaxial Configuration;Chao Zhang等;IEEE Transactions on Instrumentation and Measurement;20200724;1-10 *
基于特征选择的局部敏感哈希位选择算法;周文桦等;大数据;第7卷(第6期);67-77 *
水力机械状态检修关键技术研究;邱华;中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑);20040615;C037-31 *

Also Published As

Publication number Publication date
CN116303473A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN102959624B (zh) 用于音频媒体识别的系统和方法
Gavazzi et al. A snapshot on galaxy evolution occurring in the Great Wall: the role of Nurture at z= 0
KR100862616B1 (ko) 인덱스 정보를 이용한 오디오 핑거프린트 검색 시스템 및방법
CN101477542B (zh) 一种抽样分析方法、系统和设备
CN106708990B (zh) 一种音乐片段提取方法和设备
KR101326096B1 (ko) 펄스 내 변조 분석을 위한 pdw 데이터 전처리 및 검출 방법
CN110322897B (zh) 一种音频检索识别方法及装置
CN103530321A (zh) 一种基于机器学习的排序系统
CN104034792A (zh) 基于质荷比误差识别能力的蛋白质二级质谱鉴定方法
CN108563793B (zh) 一种多显示级别地图的制图方法
CN104756113A (zh) 用于检测数据源中的偏差的方法、设备和计算机程序
US20090135052A1 (en) Robust pulse deinterleaving
CN111626346A (zh) 数据分类方法、设备、存储介质及装置
CN114153898A (zh) 梳理数据库表间关系的方法、装置及应用
CN105823883A (zh) 基于泊松分布模型的蛋白质二级质谱鉴定方法
CN116303473B (zh) 一种数据库的构建方法、装置、设备及可读存储介质
US5838820A (en) Pattern recognition apparatus and method
JP3204075B2 (ja) レーダ識別装置並びにその識別方法
JP4604097B2 (ja) 文書分類付与方法、システムまたはコンピュータプログラム
CN111831712B (zh) 一种基于深度学习的矿物光谱数据快速检索方法及系统
AU6436599A (en) Systems and method for finding new matches among records in databases
CN114816518A (zh) 基于simhash的源代码中开源成分筛选识别方法及系统
CN109408727B (zh) 基于多维感知数据的用户关注信息智能推荐方法及系统
CN112732972A (zh) 一种音频指纹生成系统及方法
CN117313111B (zh) 一种基于汽车信息安全测试用例的标注与索引方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant