CN110362580A - 一种bim建筑工程数据检索优化归类方法及其系统 - Google Patents

一种bim建筑工程数据检索优化归类方法及其系统 Download PDF

Info

Publication number
CN110362580A
CN110362580A CN201910675789.3A CN201910675789A CN110362580A CN 110362580 A CN110362580 A CN 110362580A CN 201910675789 A CN201910675789 A CN 201910675789A CN 110362580 A CN110362580 A CN 110362580A
Authority
CN
China
Prior art keywords
cryptographic hash
keyword
sorted
data
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910675789.3A
Other languages
English (en)
Other versions
CN110362580B (zh
Inventor
赵亮
郭双清
张凤岐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuzhijian Technology Chongqing Co ltd
Original Assignee
Chongqing Zhuzhijian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Zhuzhijian Information Technology Co ltd filed Critical Chongqing Zhuzhijian Information Technology Co ltd
Priority to CN201910675789.3A priority Critical patent/CN110362580B/zh
Publication of CN110362580A publication Critical patent/CN110362580A/zh
Application granted granted Critical
Publication of CN110362580B publication Critical patent/CN110362580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种BIM建筑工程数据检索优化归类方法及其系统,该方法包括以下步骤:S1,获取待进行数据分类操作的待分类关键词;S2,对步骤S1中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;S3,判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度。本发明能够对生成的BIM图纸进行快速分类归档,提高服务器的效率。

Description

一种BIM建筑工程数据检索优化归类方法及其系统
技术领域
本发明涉及一种BIM资料信息技术领域,特别是涉及一种BIM建筑工程数据检索优化归类方法及其系统。
背景技术
建筑信息模型(Building Information Modeling)是以建筑工程项目的各项相关信息数据作为模型的基础,进行建筑模型的建立,通过数字信息仿真模拟建筑物所具有的真实信息。它具有信息完备性、信息关联性、信息一致性、可视化、协调性、模拟性、优化性和可出图性八大特点。在对生成的BIM图纸进行分类归档时,由于服务器上的数据量较大,如何快速对BIM图纸归类是现阶段亟待解决的问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种BIM建筑工程数据检索优化归类方法及其系统。
为了实现本发明的上述目的,本发明提供了一种BIM建筑工程数据检索优化归类方法,包括以下步骤:
S1,获取待进行数据分类操作的待分类关键词;
S2,对步骤S1中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
S3,判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
在本发明的一种优选实施方式中,步骤S2中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
在本发明的一种优选实施方式中,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
在本发明的一种优选实施方式中,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
在本发明的一种优选实施方式中,步骤S3中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
本发明还公开了一种BIM建筑工程数据检索优化归类方法的系统,包括获取模块、处理模块和分类模块;
所述获取模块用于获取待进行数据分类操作的待分类关键词;
所述处理模块用于对获取模块中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
分类模块用于判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
在本发明的一种优选实施方式中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
在本发明的一种优选实施方式中,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
在本发明的一种优选实施方式中,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
在本发明的一种优选实施方式中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
综上所述,由于采用了上述技术方案,本发明能够对生成的BIM图纸进行快速分类归档,提高服务器的效率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明流程示意框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
本发明提供了本发明提供了一种BIM建筑工程数据检索优化归类方法,如图1所示,包括以下步骤:
S1,获取待进行数据分类操作的待分类关键词;
S2,对步骤S1中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
S3,判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
在本发明的一种优选实施方式中,步骤S2中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
在本发明的一种优选实施方式中,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
在本发明的一种优选实施方式中,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
在本发明的一种优选实施方式中,步骤S3中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
本发明还公开了一种BIM建筑工程数据检索优化归类方法的系统,包括获取模块、处理模块和分类模块;
所述获取模块用于获取待进行数据分类操作的待分类关键词;
所述处理模块用于对获取模块中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
分类模块用于判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
在本发明的一种优选实施方式中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
在本发明的一种优选实施方式中,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
在本发明的一种优选实施方式中,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
在本发明的一种优选实施方式中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (10)

1.一种BIM建筑工程数据检索优化归类方法,其特征在于,包括以下步骤:
S1,获取待进行数据分类操作的待分类关键词;
S2,对步骤S1中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
S3,判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
2.根据权利要求1所述的BIM建筑工程数据检索优化归类方法,其特征在于,步骤S2中,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
3.根据权利要求2所述BIM建筑工程数据检索优化归类方法,其特征在于,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
4.根据权利要求3所述BIM建筑工程数据检索优化归类方法,其特征在于,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
5.根据权利要求1所述BIM建筑工程数据检索优化归类方法,其特征在于,步骤S3中,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
6.根据权利要求1~5之一所述的BIM建筑工程数据检索优化归类方法的系统,其特征在于,包括获取模块、处理模块和分类模块;
所述获取模块用于获取待进行数据分类操作的待分类关键词;
所述处理模块用于对获取模块中的待分类关键词进行关键词分类处理,得到待分类关键词的哈希值;
分类模块用于判断服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度:
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度小于或者等于预设近似度,则将待分类关键词与服务器上存在的哈希值相对应的关键词作为同一类别关键词;
如果服务器上存在的哈希值与步骤S2中得到的待分类关键词的哈希值的近似度大于预设近似度,则将待分类关键词单独作为一个类别。
7.根据权利要求6所述的BIM建筑工程数据检索优化归类方法的系统,其特征在于,得到待分类关键词的哈希值的计算方法包括以下步骤:
S21,规定一个二进制形式数据的位数M作为规定字长,将待分类关键词依照规定字长M由高位至低位进行分组,并保存各组数据,构成数据单元;
S22,利用预设分割系数P生成哈希初始值Q0,所述P为正数且P∈(0,1];其哈希初始值Q0的计算方法为:
Q0=int[P×(2M-1)],
其中,int[]为取整函数,P为预设分割系数,M为规定字长,Q0为哈希初始值;
S23,利用所述预设分割系数P生成哈希值的位移数N;其哈希值的位移数N的计算方法为:
N=int[P×M],
其中,N为哈希值的位移数;
若计算得到的位移数为奇数,则将计算得到的位移数作为最终的哈希值的位移数N,若计算得到的位移数为偶数,则将计算得到的位移数加1后作为最终的哈希值的位移数N;
S24,将当前的哈希值依照步骤S23得到的哈希值的位移数N进行循环左移,将循环左移后的哈希值与现存的数据单元中数值最大的那组数据相加,产生新的哈希值;首次进行循环左移计算时,哈希值使用步骤S22中生成的所述哈希初始值Q0进行计算;
S25,删除在步骤S24中参加过计算的当前数值最大的那组数据;
S26,返回步骤S24,直至步骤S21中数据单元中保存的各组数据都删除完毕为止,所获得的哈希值为最终的关键词的哈希值,采用所述关键词的哈希值进行数据分类。
8.根据权利要求7所述BIM建筑工程数据检索优化归类方法的系统,其特征在于,在步骤S21中,将待分类关键词依照规定字长M由高位至低位进行分组时,若待分类关键词的二进制形式的位数不是规定字长M的H倍,所述H为正整数,则对待分类关键词进行填充处理,填充后的待分类关键词为规定字长M的H倍。
9.根据权利要求8所述BIM建筑工程数据检索优化归类方法的系统,其特征在于,对待分类关键词进行填充处理的方法包括以下步骤:
S51,在待分类关键词的最低位填充预设填充数据的二进制形式,预设填充数据以0xX1为起点,该预设填充数据的形式为:
0xX1X2X3…XM-1
其中,Xi为0、1、2、……、F之一的十六进制数值,i为小于或者等于M-1且大于或者等于1的正整数;
S52,从预设填充数据的起点开始按照顺序每次取出一位数据,填充到待分类关键词的最低位,直至填充后的待分类关键词的最低位的二进制形式的位数为所述规定字长M的H倍。
10.根据权利要求6所述BIM建筑工程数据检索优化归类方法的系统,其特征在于,近似度的计算方法为:
其中,
φ为调节因子;
n为哈希值中的字母和数字个数;
为在哈希值l中第p的字母或者数字所占权重;
为服务器上所含哈希值l中相同字母或者数字之和;
nl,m为哈希值l与哈希值m中相同字母和数字的个数;
ωl为哈希值l在服务器上所占权重;
ωm为哈希值m在服务器上所占权重;
为在哈希值m中第p′的字母或者数字所占权重;
δ为服务器上所含哈希值m中相同字母或者数字之和;
l为服务器上的关键词l′所对应的哈希值;
m为待分类关键词m′所对应的哈希值。
CN201910675789.3A 2019-07-25 2019-07-25 一种bim建筑工程数据检索优化归类方法及其系统 Active CN110362580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910675789.3A CN110362580B (zh) 2019-07-25 2019-07-25 一种bim建筑工程数据检索优化归类方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910675789.3A CN110362580B (zh) 2019-07-25 2019-07-25 一种bim建筑工程数据检索优化归类方法及其系统

Publications (2)

Publication Number Publication Date
CN110362580A true CN110362580A (zh) 2019-10-22
CN110362580B CN110362580B (zh) 2021-09-24

Family

ID=68221691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910675789.3A Active CN110362580B (zh) 2019-07-25 2019-07-25 一种bim建筑工程数据检索优化归类方法及其系统

Country Status (1)

Country Link
CN (1) CN110362580B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948370A (zh) * 2019-11-26 2021-06-11 上海哔哩哔哩科技有限公司 数据分类方法、装置以及计算机设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077397A (zh) * 2014-07-01 2014-10-01 成都康赛信息技术有限公司 一种分布式的大数据分类检索网页的响应方法
US9390240B1 (en) * 2012-06-11 2016-07-12 Dell Software Inc. System and method for querying data
CN107679153A (zh) * 2017-09-27 2018-02-09 国家电网公司信息通信分公司 一种专利分类方法及装置
CN108768656A (zh) * 2018-04-17 2018-11-06 无锡科技职业学院 一种应用于数据校验的哈希算法
CN109241274A (zh) * 2017-07-04 2019-01-18 腾讯科技(深圳)有限公司 文本聚类方法及装置
CN109960612A (zh) * 2019-03-07 2019-07-02 腾讯科技(深圳)有限公司 一种确定数据存储占比的方法、装置及服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9390240B1 (en) * 2012-06-11 2016-07-12 Dell Software Inc. System and method for querying data
CN104077397A (zh) * 2014-07-01 2014-10-01 成都康赛信息技术有限公司 一种分布式的大数据分类检索网页的响应方法
CN109241274A (zh) * 2017-07-04 2019-01-18 腾讯科技(深圳)有限公司 文本聚类方法及装置
CN107679153A (zh) * 2017-09-27 2018-02-09 国家电网公司信息通信分公司 一种专利分类方法及装置
CN108768656A (zh) * 2018-04-17 2018-11-06 无锡科技职业学院 一种应用于数据校验的哈希算法
CN109960612A (zh) * 2019-03-07 2019-07-02 腾讯科技(深圳)有限公司 一种确定数据存储占比的方法、装置及服务器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱萍: "文本相似度算法在航班号管理中的应用", 《科技展望》 *
杨旸: "加密云数据下基于simhash的模糊排序搜索方案", 《计算机学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948370A (zh) * 2019-11-26 2021-06-11 上海哔哩哔哩科技有限公司 数据分类方法、装置以及计算机设备

Also Published As

Publication number Publication date
CN110362580B (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN101710334B (zh) 基于图像哈希的大规模图像库检索方法
CN108984642B (zh) 一种基于哈希编码的印花织物图像检索方法
CN101079024A (zh) 一种专业词表动态生成系统和方法
CN103955543A (zh) 基于多模态的服装图像检索方法
CN112685504B (zh) 一种面向生产过程的分布式迁移图学习方法
Prabha et al. Improved particle swarm optimization based k-means clustering
Jie et al. A CSA-based clustering algorithm for large data sets with mixed numeric and categorical values
CN108985617B (zh) 一种基于智能制造的产品生产流程调度方法及系统
Sun et al. Study on the improvement of K-nearest-neighbor algorithm
CN107291895B (zh) 一种快速的层次化文档查询方法
CN109190660A (zh) 基于条件互信息的特征选择与评价方法
CN106570166B (zh) 一种基于多个局部敏感哈希表的视频检索方法及装置
CN103020321B (zh) 近邻搜索方法与系统
CN109271427A (zh) 一种基于近邻密度和流形距离的聚类方法
CN104699804A (zh) 一种基于基因表达式编程的n中心点分类方法
CN105827603A (zh) 未明协议特征库建立方法、未明报文分类方法及相关装置
CN106874370A (zh) 一种目录文件的快速检索方法
CN110362580A (zh) 一种bim建筑工程数据检索优化归类方法及其系统
CN102521213A (zh) 线性时间后缀数组构造方法
CN1492359A (zh) 一种多关键字自动状态机查找匹配方法
CN107122412A (zh) 一种海量电话号码快速匹配检索方法
Giraud-Carrier Unifying learning with evolution through baldwinian evolution and lamarckism
CN110413443A (zh) 一种bim资料信息数据检验优化方法及其系统
Lin et al. Efficient updating of sequential patterns with transaction insertion
CN1878123A (zh) 一种位图聚合的递推流分类方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220520

Address after: 400000 24-1, No. 58-7, shabin Road, Shapingba District, Chongqing

Patentee after: Zhuzhijian Technology (Chongqing) Co.,Ltd.

Address before: 400042 5-3, building 1, No.16 shijitian street, Yuzhong District, Chongqing

Patentee before: Chongqing Zhuzhijian Information Technology Co.,Ltd.