CN110097137B - 工程概算项目数据的国标定额自定义特征数据提取方法 - Google Patents

工程概算项目数据的国标定额自定义特征数据提取方法 Download PDF

Info

Publication number
CN110097137B
CN110097137B CN201910387150.5A CN201910387150A CN110097137B CN 110097137 B CN110097137 B CN 110097137B CN 201910387150 A CN201910387150 A CN 201910387150A CN 110097137 B CN110097137 B CN 110097137B
Authority
CN
China
Prior art keywords
data
rule
quota
library
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910387150.5A
Other languages
English (en)
Other versions
CN110097137A (zh
Inventor
陈汝炫
黄懿珠
张涛
陈红仙
肖美娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Zhongjian Pulian Technology Co ltd
Original Assignee
Guangdong Zhongjian Pulian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Zhongjian Pulian Technology Co ltd filed Critical Guangdong Zhongjian Pulian Technology Co ltd
Priority to CN201910387150.5A priority Critical patent/CN110097137B/zh
Publication of CN110097137A publication Critical patent/CN110097137A/zh
Application granted granted Critical
Publication of CN110097137B publication Critical patent/CN110097137B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Accounting & Taxation (AREA)
  • Quality & Reliability (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种工程概算项目数据的国标定额自定义特征数据提取方法,其步骤如下:利用分布式计算机网络技术,建立标准库和样本库,并在标准库里分类录入各个版本的国家标准的定额编码数据和定额名称数据,在样本库里录入历史工程概算项目数据作为数据样本;将标准库里的每一个定额名称数据制定若干数据清洗用的规则,所述规则包括有特征项名称、规则值、规则编码和规则类型,在样本库中获取目标数据样本,在标准库中根据规则对目标数据样本进行数据清洗,最后提取样本库中目标数据的特征数据值。本发明的国标定额自定义特征数据提取方法,主要针对不同版本的国家标准定额,制定规则形成规则库,方便解读和管理历史工程概算数据。

Description

工程概算项目数据的国标定额自定义特征数据提取方法
技术领域
本发明涉及工程造价文件管理的方法,具体为一种工程概算项目数据的国标定额自定义特征数据提取方法。
背景技术
工程概算对工程投资与造价有着重大意义,但是由于建设项目较为复杂,施工单位繁多,各个施工单位的资质良莠不齐,所填写的定额、定额编码、工程项目或费用名称等等都不一定按照国家或省级标准完整地填写,造成历史的工程概算数据比较杂乱,而且国家和地方针对各个行业以及各个相近似的行业也曾发布过不同版本的标准定义;如何快速地从历史工程概算数据中获取相应的项目数据已经成为部门核算的一大难题。
发明内容
为了克服现有技术提及的缺点,本发明提供一种工程概算项目数据的国标定额自定义特征数据提取方法,辅助审计师快速地从历史工程概算中依据国标定额整理出相应的项目自定义特征数据,并形成规范化文件,方便解读和管理。
本发明解决其技术问题所采用技术方案为:工程概算项目数据的国标定额自定义特征数据提取方法,其步骤如下:
S1.利用分布式计算机网络技术,建立“标准库”和“样本库”,并在“标准库”里分类录入各个版本的国家标准的定额编码数据以及定额编码对应的定额名称数据,在“样本库”里录入历史工程概算项目数据作为数据样本;
S2.将所述“标准库”里的每一个定额名称数据制定若干数据清洗用的规则,所述“规则”定义包括有“特征项名称”、“规则值”、“规则编码”和“规则类型”四个要素:
所述“特征项名称”:通过人工解析国家标准中定额编码对应的定额名称,将国家标准中的定额名称按照其含义特征拆分成若干个不同特征项的关键词名称,形成“特征项名称”;
所述“规则值”:通过人工分析并用简短的描述性的“表述词”将相类似的“特征项名称”进行归类,是对“特征项名称”的进一步归类概括;此处“表述词”则定义为“规则值”;
所述“规则编码”:是所述“规则”中的数值编码,由“规则”中的与定额名称对应的定额编码加上“特征项名称”自定义编码组成,形成“规则编码”;
所述“规则类型”:是对“样本库”数据清洗所采取的逻辑函数规则,所述逻辑函数规则包括有“关键词(fun_keyword)”、“范围提取”、“分隔符”、“数值”、“枚举”、“屏蔽枚举”等等;
S3.在所述“样本库”中获取目标数据样本,在“标准库”中根据步骤S2中的“规则”对目标数据样本进行数据清洗,最后提取“样本库”中目标数据的特征数据值。所述清洗步骤如下:
S3.1根据“样本库”中目标定额名称数据对应的定额编码,对比匹配“标准库”中相同定额编码对应的国家标准定额名称数据;
S3.2进一步,在对比匹配“样本库”中目标定额名称数据对应的定额编码时,先对“样本库”中目标定额名称数据对应的定额编码进行去除干扰词的工作,具体去干扰词手段为:对该定额编码进行空格处理、删除干扰词和干扰符合等,使得该定额编码符合国家标准。
S3.3按照S2.所述“规则编码”的数值由小至大执行所述“规则类型”的函数规则,以所述“特征项名称”为依据在目标定额名称数据中搜寻所述“规则值”在目标定额名称数据中的数值作为特征数据值;
作为本发明方案的进一步改进,步骤S2中所述规则的制定的步骤如下:
S2.1.根据所述规则类型选择逻辑函数类型;
S2.2.根据所述规则值和函数类型,输入格式内容(对应的函数关键词、提取范围等等)和添加等级;
S2.3.设置所述规则的权重,该权重的大小是作为最后判断不同规则输出特征数据值的标准;
S2.4.形成所述规则。
S2.5.为了验证一个新建的规则是否合理,将新建的所述“规则”对“样本库”里的数据进行试清洗工作,检测所述“规则”试清洗的特征数据值是否存在于“标准库”里,如果存在,则说明该“规则”合理并添加到“特征规则库”里,如果不存在,则需要人工判断,试清洗的特征数据值是否合理,如果合理,即将试清洗的特征数据值补充到标准库,如果不合理,即需要重新制定规则,满足提取需求,或者标识为无效数据。
作为本发明方案的进一步改进,步骤S2中同一所述“规则编码”根据不同的所述“规则类型”可设置若干条所述“规则”,同一所述“规则编码”的不同的所述“规则”根据匹配度设置不同的权重,步骤S3中数据清洗时,同一所述“规则编码”的所述“规则”根据“权重大则优先执行”的原则进行清洗。
本发明的有益效果是:本发明的国标定额自定义特征数据提取方法,主要针对不同版本的国家标准定额,制定规则形成规则库,方便解读和管理历史工程概算数据。
附图说明
图1为本发明的规则建立的流程框图;
图2为本发明的实施例子的规则列举图表。
具体实施方式
下面结合附图对本发明进行进一步的说明。
如图1所示,工程概算项目数据的国标定额自定义特征数据提取方法,其步骤如下:
S1.利用分布式计算机网络技术,建立“标准库”和“样本库”,并在“标准库”里分类录入各个版本的国家标准的定额编码数据以及定额编码对应的定额名称数据,在“样本库”(样本库,即是样本训练库,样本训练库里会先人工收集部分客户具有代表性的数据,用于对规则进行样本训练,并且作为新增函数规则的参考样本)里录入历史工程概算项目数据作为数据样本;
S2.将所述“标准库”里的每一个定额名称数据制定若干数据清洗用的规则,所述“规则”定义包括有“特征项名称”、“规则值”、“规则编码”和“规则类型”四个要素:
所述“特征项名称”:通过人工解析国家标准中定额编码对应的定额名称,将国家标准中的定额名称按照其含义特征拆分成若干个不同特征项的关键词名称,形成“特征项名称”;例如:定额编码“1-8”对应的定额名称内容是“挖土机挖土或松碎石方明挖法不带支撑一、二类土”,通过人工解析将其含义特征拆分成如下关键词:
施工方法:明挖法;
开挖方式:挖土机挖;
土壤类别:一、二类土;
支撑结构施工:不带支撑下;
此述例子中的“明挖法”、“挖土机挖”、“一、二类土”和“不带支撑下”则是各个“特征项”的关键词;
所述“规则值”:通过人工分析并用简短的描述性的“表述词”将相类似的“特征项名称”进行归类,是对“特征项名称”的进一步归类概括;此处“表述词”则定义为“规则值”;上述例子中的“施工方法”、“开挖方式”、“土壤类别”、“支撑结构施工”是分别对各个“特征项”的简短的表述词,即所述“规则值”
所述“规则编码”:是所述“规则”中的数值编码,由“规则”中的与定额名称对应的定额编码加上“特征项名称”自定义编码组成,形成“规则编码”;
所述“规则类型”:是对“样本库”数据清洗所采取的逻辑函数规则,所述逻辑函数规则包括有“关键词(fun_keyword)”、“范围提取”、“分隔符”、“数值”、“枚举”、“屏蔽枚举”等等;
S3.在所述“样本库”中获取目标数据样本,在“标准库”中根据步骤S2中的“规则”对目标数据样本进行数据清洗,最后提取“样本库”中目标数据的特征数据值。所述清洗步骤如下:
S3.1根据“样本库”中目标定额名称数据对应的定额编码,对比匹配“标准库”中相同定额编码对应的国家标准定额名称数据;
S3.2进一步,在对比匹配“样本库”中目标定额名称数据对应的定额编码时,先对“样本库”中目标定额名称数据对应的定额编码进行去除干扰词的工作,具体去干扰词手段为:对该定额编码进行空格处理、删除干扰词和干扰符合等,使得该定额编码符合国家标准。
S3.3按照S2.所述“规则编码”的数值由小至大执行所述“规则类型”的函数规则,以所述“特征项名称”为依据在目标定额名称数据中搜寻所述“规则值”在目标定额名称数据中的数值作为特征数据值;
作为本发明方案的进一步改进,步骤S2中所述规则的制定的步骤如下:
S2.1.根据所述规则类型选择逻辑函数类型;
S2.2.根据所述规则值和函数类型,输入格式内容(对应的函数关键词、提取范围等等)和添加等级;
S2.3.设置所述规则的权重,该权重的大小是作为最后判断不同规则输出特征数据值的标准;
S2.4.形成所述规则;
S2.5.为了验证一个新建的规则是否合理,将新建的所述“规则”对“样本库”里的数据进行试清洗工作,检测所述“规则”试清洗的特征数据值是否存在于“标准库”里(标准库是预置的特征标准值库,第一批数据为人工整理入库,后面补充数据由下面步骤实现),如果存在,则说明该“规则”合理并添加到“特征规则库”里,如果不存在,则需要人工判断,试清洗的特征数据值是否合理,如果合理,即将试清洗的特征数据值补充到标准库,如果不合理,即需要重新制定规则,满足提取需求,或者标识为无效数据;图1中特征规则指的是通过函数规则和样本数据,获取的最终结果;
例如:函数规则:提取关键字‘桩径’后面数值,含关键字;样本数据:桩径:600mm、桩径800、桩径60等;
通过函数规则,提取的特征规则结果为:
桩径600(存在于标准库,有效规则,保存此条特征规则)
桩径800(存在于标准库,有效规则,保存此条特征规则)
桩径60(由于样本数据源有错,提取到错误结果,不存与标准库,无效规则,通过人工二次判断后,无效,不保存此条特征规则,并标识为-1,系统以后通过函数规则关键字‘桩径’后面数值提取到‘桩径60’,会自动判断其为-1无效结果)。
作为本发明方案的进一步改进,步骤S2中同一所述“规则编码”根据不同的所述“规则类型”可设置若干条所述“规则”,同一所述“规则编码”的不同的所述“规则”根据匹配度设置不同的权重,步骤S3中数据清洗时,同一所述“规则编码”的所述“规则”根据“权重大则优先执行”的原则进行清洗。
以下结合图2进一步阐明本方案:
以样本库里一条用自然语言描述的不标准的定额编码数据为例,假设其包括标准定额编码、定额名称等信息,具体如下:
标准定额编码:2-27(由原始定额标准清洗后结果)
原始定额名称:钻孔桩桩径800mm C25水下砼40石
定额编码‘2-27’对应特征规则如附图2所示,
根据权重大小,优先获取
规则1:2-2703 桩径 关键词【包含 前】 桩径 权重3
规则2:2-2703 桩径 关键词【包含 后】 桩径 权重3
把规则1应用到
原始定额名称:钻孔桩桩径800mm C25水下砼40石‘关键词,桩径,前’,无法提到数值,提取无结果,继续调取特征规则,即规则2,‘关键词,桩径,后’,截取关键词‘桩径’后面纯数字,提取特征值为‘800’,提取有结果,则不在继续执行下面规则。
保存标准定额编码:2-27、特征值:800,通过标准库判断,
定额编码:2-27
定额特征:桩径
定额特征值:800
判断所提取的特征值:800是否存在于标准库,如果存在,把规则2添加到特征规则库,如果不存在,则需要人工判断,提取值是否合理,如果合理,即补充到标准库,例如提取的特征值为600,而标准库里面只有800,此情况只需把600,补充到标准库即可;
如果不合理,即需要重新制定规则,满足提取需求,或者标识为无效数据。
以上所述者,仅为本发明的较佳实施例而已,当不能以此限定本发明实施的范围,即大凡依本发明申请专利范围及发明说明内容所作的简单等效变化与修饰,皆仍属本发明专利涵盖的范围内。

Claims (5)

1.工程概算项目数据的国标定额自定义特征数据提取方法,其特征在于,其步骤如下:
S1.利用分布式计算机网络技术,建立标准库和样本库,并在标准库里分类录入各个版本的国家标准的定额编码数据以及定额编码对应的定额名称数据,在样本库里录入历史工程概算项目数据作为数据样本;
S2.将所述标准库里的每一个定额名称数据制定若干数据清洗用的规则,每一所述规则包括有特征项名称、规则值、规则编码和规则类型四个要素:
所述特征项名称是国家标准中的定额名称按照其含义拆分成若干个不同特征项的关键词名称;
所述规则值是对所述特征项名称的进一步归类概括;
所述规则编码是所述规则中的数值编码;
所述规则类型是对样本库的数据清洗所采取的逻辑函数规则;
S3.在所述样本库中获取目标数据样本,在标准库中根据步骤S2中的规则对目标数据样本进行数据清洗,最后提取样本库中目标数据的特征数据值。
2.根据权利要求1所述的工程概算项目数据的国标定额自定义特征数据提取方法,其特征在于,步骤S3中所述数据清洗的步骤如下:
S3.1.根据样本库中目标定额名称数据对应的定额编码,对比匹配标准库中相同定额编码对应的国家标准定额名称数据;
S3.2.按照S2所述规则编码的数值由小至大执行所述规则类型的函数规则,在目标数据中搜寻所述规则值在目标定额名称数据中的数值作为特征数据值。
3.根据权利要求2所述的工程概算项目数据的国标定额自定义特征数据提取方法,其特征在于,步骤S3.1中,在对比匹配样本库中的定额编码时,先对样本库中的定额编码进行去除干扰词的工作。
4.根据权利要求2所述的工程概算项目数据的国标定额自定义特征数据提取方法,其特征在于,步骤S2中所述规则的制定的步骤如下:
S2.1.根据所述规则类型选择逻辑函数类型;
S2.2.根据所述规则值和函数类型,输入格式内容和添加等级;
S2.3.设置所述规则的权重,该权重的大小是作为最后判断不同规则输出特征数据值的标准;
S2.4.形成所述规则。
5.根据权利要求4所述的工程概算项目数据的国标定额自定义特征数据提取方法,其特征在于,为了验证一个新建的规则是否合理,将新建的所述“规则”对“样本库”里的数据进行试清洗工作,检测所述“规则”试清洗的特征数据值是否存在于“标准库”里,如果存在,则说明该“规则”合理并添加到“特征规则库”里,如果不存在,则需要人工判断,试清洗的特征数据值是否合理,如果合理,即将试清洗的特征数据值补充到标准库,如果不合理,即需要重新制定规则,满足提取需求,或者标识为无效数据。
CN201910387150.5A 2019-05-10 2019-05-10 工程概算项目数据的国标定额自定义特征数据提取方法 Active CN110097137B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910387150.5A CN110097137B (zh) 2019-05-10 2019-05-10 工程概算项目数据的国标定额自定义特征数据提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910387150.5A CN110097137B (zh) 2019-05-10 2019-05-10 工程概算项目数据的国标定额自定义特征数据提取方法

Publications (2)

Publication Number Publication Date
CN110097137A CN110097137A (zh) 2019-08-06
CN110097137B true CN110097137B (zh) 2022-11-25

Family

ID=67447647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910387150.5A Active CN110097137B (zh) 2019-05-10 2019-05-10 工程概算项目数据的国标定额自定义特征数据提取方法

Country Status (1)

Country Link
CN (1) CN110097137B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08190483A (ja) * 1995-01-09 1996-07-23 Fuji Xerox Co Ltd ファジィルール自動作成方法およびその実施装置
CN105447090A (zh) * 2015-11-05 2016-03-30 华中科技大学 一种自动化数据挖掘预处理方法
CN106372781A (zh) * 2016-08-26 2017-02-01 国家电网公司 标准化电网工程提资模板
CN106528684A (zh) * 2016-10-25 2017-03-22 北京瑞风协同科技股份有限公司 一种建立工程材料数据库的方法及系统
CN106934540A (zh) * 2017-03-07 2017-07-07 西安理工大学 一种基于Revit的建筑工程材料成本预算方法
CN106934536A (zh) * 2017-03-01 2017-07-07 广东中建普联科技股份有限公司 建设行业工程量计价清单数据自动编码与识别方法及系统
WO2017162083A1 (zh) * 2016-03-25 2017-09-28 阿里巴巴集团控股有限公司 数据清洗方法和装置
CN108830662A (zh) * 2018-07-18 2018-11-16 贵州汇杰兴邦电力工程有限公司 一种电力工程预算装置及方法
CN108921334A (zh) * 2018-06-15 2018-11-30 国家电网公司 一种特高压输变电工程的工程量控制目标确定方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8028322B2 (en) * 2005-03-14 2011-09-27 Time Warner Cable Inc. Method and apparatus for network content download and recording

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08190483A (ja) * 1995-01-09 1996-07-23 Fuji Xerox Co Ltd ファジィルール自動作成方法およびその実施装置
CN105447090A (zh) * 2015-11-05 2016-03-30 华中科技大学 一种自动化数据挖掘预处理方法
WO2017162083A1 (zh) * 2016-03-25 2017-09-28 阿里巴巴集团控股有限公司 数据清洗方法和装置
CN106372781A (zh) * 2016-08-26 2017-02-01 国家电网公司 标准化电网工程提资模板
CN106528684A (zh) * 2016-10-25 2017-03-22 北京瑞风协同科技股份有限公司 一种建立工程材料数据库的方法及系统
CN106934536A (zh) * 2017-03-01 2017-07-07 广东中建普联科技股份有限公司 建设行业工程量计价清单数据自动编码与识别方法及系统
CN106934540A (zh) * 2017-03-07 2017-07-07 西安理工大学 一种基于Revit的建筑工程材料成本预算方法
CN108921334A (zh) * 2018-06-15 2018-11-30 国家电网公司 一种特高压输变电工程的工程量控制目标确定方法及装置
CN108830662A (zh) * 2018-07-18 2018-11-16 贵州汇杰兴邦电力工程有限公司 一种电力工程预算装置及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于专家系统的铁路工程单项概算编制研究;陈瑜;《铁道标准设计》;20170131;第61卷(第01期);第154-158页 *
应用数据挖掘技术的土建工程概算平台规划;王亚君 等;《信息技术》;20100425;第34卷(第4期);第91-93页 *
应用计算机技术编制工程预(概)算;张坤;《北京建筑工程学院学报》;19970930;第13卷(第03期);第86-93页 *

Also Published As

Publication number Publication date
CN110097137A (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
CN106682257B (zh) 施工设施bim构件库构建方法
CN105550583B (zh) 基于随机森林分类方法的Android平台恶意应用检测方法
CN111459799B (zh) 一种基于Github的软件缺陷检测模型建立、检测方法及系统
CN110020433B (zh) 一种基于企业关联关系的工商高管人名消歧方法
CN107872454B (zh) 超大型互联网平台威胁信息监测与分析系统及方法
CN110309132B (zh) 一种工程概算表的定额标准化方法
CN109325019B (zh) 数据关联关系网络构建方法
CN109492106B (zh) 一种文本代码相结合的缺陷原因自动分类方法
CN109614433A (zh) 业务系统间数据血缘的识别方法、装置、设备及存储介质
CN105740477B (zh) 针对大规模嵌入式设备固件的函数搜索方法和搜索引擎
CN106484892A (zh) 数据操作方法及装置
CN106339455A (zh) 基于文本标签特征挖掘的网页正文提取方法
CN112597353A (zh) 一种文本信息自动提取方法
CN109918418A (zh) 一种基于遗传算法的关联规则的改进挖掘方法
CN109858025A (zh) 一种地址标准化语料的分词方法及系统
CN111177401A (zh) 一种电网自由文本知识抽取方法
CN110097137B (zh) 工程概算项目数据的国标定额自定义特征数据提取方法
CN106326746A (zh) 一种恶意程序行为特征库构建方法及装置
CN109063063B (zh) 基于多源数据的数据处理方法及装置
CN110941957A (zh) 交通科技数据标引方法及系统
CN114969467A (zh) 数据分析分类方法、装置、计算机设备及存储介质
CN113407495A (zh) 一种基于simhash的文件相似度判定方法及系统
CN107391695A (zh) 一种基于大数据的信息提取方法
CN111209158B (zh) 服务器集群的挖矿监控方法及集群监控系统
CN110766586A (zh) 一种环保投诉事件处理的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant