CN110362580A - 一种bim建筑工程数据检索优化归类方法及其系统 - Google Patents
一种bim建筑工程数据检索优化归类方法及其系统 Download PDFInfo
- Publication number
- CN110362580A CN110362580A CN201910675789.3A CN201910675789A CN110362580A CN 110362580 A CN110362580 A CN 110362580A CN 201910675789 A CN201910675789 A CN 201910675789A CN 110362580 A CN110362580 A CN 110362580A
- Authority
- CN
- China
- Prior art keywords
- cryptographic hash
- keyword
- sorted
- data
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种BIM建筑工程数据检索优化归类方法及其系统,该方法包括以下步骤:S1,获取待进行数据分类操作的待分类关键词;S2,对步骤S1中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;S3,判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度。本发明能够对生成的BIM图纸进行快速分类归档,提高服务器的效率。
Description
技术领域
本发明涉及一种BIM资料信息技术领域,特别是涉及一种BIM建筑工程数据检索优化归类方法及其系统。
背景技术
建筑信息模型(Building Information Modeling)是以建筑工程项目的各项相关信息数据作为模型的基础,进行建筑模型的建立,通过数字信息仿真模拟建筑物所具有的真实信息。它具有信息完备性、信息关联性、信息一致性、可视化、协调性、模拟性、优化性和可出图性八大特点。在对生成的BIM图纸进行分类归档时,由于服务器上的数据量较大,如何快速对BIM图纸归类是现阶段亟待解决的问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种BIM建筑工程数据检索优化归类方法及其系统。
为了实现本发明的上述目的,本发明提供了一种BIM建筑工程数据检索优化归类方法,包括以下步骤:
S1,获取待进行数据分类操作的待分类关键词;
S2,对步骤S1中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
S3,判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
在本发明的一种优选实施方式中,步骤S2中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
在本发明的一种优选实施方式中,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
在本发明的一种优选实施方式中,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1,
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
在本发明的一种优选实施方式中,步骤S3中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
本发明还公开了一种BIM建筑工程数据检索优化归类方法的系统,包括获取模块、处理模块和分类模块;
所述获取模块用于获取待进行数据分类操作的待分类关键词;
所述处理模块用于对获取模块中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
分类模块用于判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
在本发明的一种优选实施方式中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
在本发明的一种优选实施方式中,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
在本发明的一种优选实施方式中,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1,
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
在本发明的一种优选实施方式中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
综上所述,由于采用了上述技术方案,本发明能够对生成的BIM图纸进行快速分类归档,提高服务器的效率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明流程示意框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
本发明提供了本发明提供了一种BIM建筑工程数据检索优化归类方法,如图1所示,包括以下步骤:
S1,获取待进行数据分类操作的待分类关键词;
S2,对步骤S1中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
S3,判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
在本发明的一种优选实施方式中,步骤S2中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
在本发明的一种优选实施方式中,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
在本发明的一种优选实施方式中,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1,
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
在本发明的一种优选实施方式中,步骤S3中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
本发明还公开了一种BIM建筑工程数据检索优化归类方法的系统,包括获取模块、处理模块和分类模块;
所述获取模块用于获取待进行数据分类操作的待分类关键词;
所述处理模块用于对获取模块中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
分类模块用于判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
在本发明的一种优选实施方式中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
在本发明的一种优选实施方式中,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
在本发明的一种优选实施方式中,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1,
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
在本发明的一种优选实施方式中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (10)
1.一种BIM建筑工程数据检索优化归类方法,其特征在于,包括以下步骤:
S1,获取待进行数据分类操作的待分类关键词;
S2,对步骤S1中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
S3,判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
2.根据权利要求1所述的BIM建筑工程数据检索优化归类方法,其特征在于,步骤S2中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
3.根据权利要求2所述BIM建筑工程数据检索优化归类方法,其特征在于,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
4.根据权利要求3所述BIM建筑工程数据检索优化归类方法,其特征在于,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1,
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
5.根据权利要求1所述BIM建筑工程数据检索优化归类方法,其特征在于,步骤S3中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
6.根据权利要求1~5之一所述的BIM建筑工程数据检索优化归类方法的系统,其特征在于,包括获取模块、处理模块和分类模块;
所述获取模块用于获取待进行数据分类操作的待分类关键词;
所述处理模块用于对获取模块中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
分类模块用于判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
7.根据权利要求6所述的BIM建筑工程数据检索优化归类方法的系统,其特征在于,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
8.根据权利要求7所述BIM建筑工程数据检索优化归类方法的系统,其特征在于,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
9.根据权利要求8所述BIM建筑工程数据检索优化归类方法的系统,其特征在于,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1,
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
10.根据权利要求6所述BIM建筑工程数据检索优化归类方法的系统,其特征在于,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910675789.3A CN110362580B (zh) | 2019-07-25 | 2019-07-25 | 一种bim建筑工程数据检索优化归类方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910675789.3A CN110362580B (zh) | 2019-07-25 | 2019-07-25 | 一种bim建筑工程数据检索优化归类方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110362580A true CN110362580A (zh) | 2019-10-22 |
CN110362580B CN110362580B (zh) | 2021-09-24 |
Family
ID=68221691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910675789.3A Active CN110362580B (zh) | 2019-07-25 | 2019-07-25 | 一种bim建筑工程数据检索优化归类方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110362580B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948370A (zh) * | 2019-11-26 | 2021-06-11 | 上海哔哩哔哩科技有限公司 | 数据分类方法、装置以及计算机设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077397A (zh) * | 2014-07-01 | 2014-10-01 | 成都康赛信息技术有限公司 | 一种分布式的大数据分类检索网页的响应方法 |
US9390240B1 (en) * | 2012-06-11 | 2016-07-12 | Dell Software Inc. | System and method for querying data |
CN107679153A (zh) * | 2017-09-27 | 2018-02-09 | 国家电网公司信息通信分公司 | 一种专利分类方法及装置 |
CN108768656A (zh) * | 2018-04-17 | 2018-11-06 | 无锡科技职业学院 | 一种应用于数据校验的哈希算法 |
CN109241274A (zh) * | 2017-07-04 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 文本聚类方法及装置 |
CN109960612A (zh) * | 2019-03-07 | 2019-07-02 | 腾讯科技(深圳)有限公司 | 一种确定数据存储占比的方法、装置及服务器 |
-
2019
- 2019-07-25 CN CN201910675789.3A patent/CN110362580B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9390240B1 (en) * | 2012-06-11 | 2016-07-12 | Dell Software Inc. | System and method for querying data |
CN104077397A (zh) * | 2014-07-01 | 2014-10-01 | 成都康赛信息技术有限公司 | 一种分布式的大数据分类检索网页的响应方法 |
CN109241274A (zh) * | 2017-07-04 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 文本聚类方法及装置 |
CN107679153A (zh) * | 2017-09-27 | 2018-02-09 | 国家电网公司信息通信分公司 | 一种专利分类方法及装置 |
CN108768656A (zh) * | 2018-04-17 | 2018-11-06 | 无锡科技职业学院 | 一种应用于数据校验的哈希算法 |
CN109960612A (zh) * | 2019-03-07 | 2019-07-02 | 腾讯科技(深圳)有限公司 | 一种确定数据存储占比的方法、装置及服务器 |
Non-Patent Citations (2)
Title |
---|
朱萍: "文本相似度算法在航班号管理中的应用", 《科技展望》 * |
杨旸: "加密云数据下基于simhash的模糊排序搜索方案", 《计算机学报》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948370A (zh) * | 2019-11-26 | 2021-06-11 | 上海哔哩哔哩科技有限公司 | 数据分类方法、装置以及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110362580B (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101710334B (zh) | 基于图像哈希的大规模图像库检索方法 | |
CN108984642B (zh) | 一种基于哈希编码的印花织物图像检索方法 | |
CN101079024A (zh) | 一种专业词表动态生成系统和方法 | |
CN103955543A (zh) | 基于多模态的服装图像检索方法 | |
CN112685504B (zh) | 一种面向生产过程的分布式迁移图学习方法 | |
Prabha et al. | Improved particle swarm optimization based k-means clustering | |
Jie et al. | A CSA-based clustering algorithm for large data sets with mixed numeric and categorical values | |
CN108985617B (zh) | 一种基于智能制造的产品生产流程调度方法及系统 | |
Sun et al. | Study on the improvement of K-nearest-neighbor algorithm | |
CN107291895B (zh) | 一种快速的层次化文档查询方法 | |
CN109190660A (zh) | 基于条件互信息的特征选择与评价方法 | |
CN106570166B (zh) | 一种基于多个局部敏感哈希表的视频检索方法及装置 | |
CN103020321B (zh) | 近邻搜索方法与系统 | |
CN109271427A (zh) | 一种基于近邻密度和流形距离的聚类方法 | |
CN104699804A (zh) | 一种基于基因表达式编程的n中心点分类方法 | |
CN105827603A (zh) | 未明协议特征库建立方法、未明报文分类方法及相关装置 | |
CN106874370A (zh) | 一种目录文件的快速检索方法 | |
CN110362580A (zh) | 一种bim建筑工程数据检索优化归类方法及其系统 | |
CN102521213A (zh) | 线性时间后缀数组构造方法 | |
CN1492359A (zh) | 一种多关键字自动状态机查找匹配方法 | |
CN107122412A (zh) | 一种海量电话号码快速匹配检索方法 | |
Giraud-Carrier | Unifying learning with evolution through baldwinian evolution and lamarckism | |
CN110413443A (zh) | 一种bim资料信息数据检验优化方法及其系统 | |
Lin et al. | Efficient updating of sequential patterns with transaction insertion | |
CN1878123A (zh) | 一种位图聚合的递推流分类方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220520 Address after: 400000 24-1, No. 58-7, shabin Road, Shapingba District, Chongqing Patentee after: Zhuzhijian Technology (Chongqing) Co.,Ltd. Address before: 400042 5-3, building 1, No.16 shijitian street, Yuzhong District, Chongqing Patentee before: Chongqing Zhuzhijian Information Technology Co.,Ltd. |