CN111651549A - 一种基于地质钻孔数据的相似度检索方法 - Google Patents

一种基于地质钻孔数据的相似度检索方法 Download PDF

Info

Publication number
CN111651549A
CN111651549A CN202010520736.7A CN202010520736A CN111651549A CN 111651549 A CN111651549 A CN 111651549A CN 202010520736 A CN202010520736 A CN 202010520736A CN 111651549 A CN111651549 A CN 111651549A
Authority
CN
China
Prior art keywords
data
drilling
data acquisition
geological drilling
scanning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010520736.7A
Other languages
English (en)
Inventor
王铮
赵晓京
田力
侯岩凯
高占玉
张春陆
林燕
张衡
白秀佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Survey and Research Institute of China Coal Geology Bureau
Original Assignee
General Survey and Research Institute of China Coal Geology Bureau
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Survey and Research Institute of China Coal Geology Bureau filed Critical General Survey and Research Institute of China Coal Geology Bureau
Priority to CN202010520736.7A priority Critical patent/CN111651549A/zh
Publication of CN111651549A publication Critical patent/CN111651549A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Remote Sensing (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明公开了一种基于地质钻孔数据的相似度检索方法,属于地质技术领域,包括以下步骤:S1:钻孔数据扫描工作;S2:煤炭地质钻孔数据采集工作;S3:坐标问题分析及修正处理;S4:数据采集入库;S5:数据汇总;S6:数据统计分析;S7:煤炭地质钻孔资料数字化;S8:煤炭地质钻孔数据标准化处理;S9:不规范的钻孔坐标处理;S10:煤炭地质钻孔资料扫描质量;S11:煤炭地质钻孔资料数据采集质量控制;S12:成果数据汇总质量控制。煤炭地质钻孔数据整理、扫描阶段,数据资料存储文档,质量问题及时纠正,对各数据采集人员提交的数据库进行整合,进行质量检查,首先查验煤炭地质钻孔数据量是否满足合同要求。

Description

一种基于地质钻孔数据的相似度检索方法
技术领域
本发明涉及地质技术领域,特别涉及一种基于地质钻孔数据的相似度检 索方法。
背景技术
地质钻孔的信息编录是地质工程勘察作业的重要基础。目前,地质钻孔 的信息编录方法基本是编录人员先采用人工方式将地质钻孔的名称、地质层 层底深度、取样深度、颜色、纹理、形状等性状信息记录在编录纸上,然后 经过现场核对后再将记录在编录纸上的信息录入至计算机中进行存储。由于 现有的信息编录方法中地质钻孔的性状信息的识别和判断依赖于编录人员的 专业能力和个人经验,其不易确保性状信息识别的准确性和可靠性,且信息 编录效率低
发明内容
本发明的目的在于提供一种基于地质钻孔数据的相似度检索方法,煤炭 地质钻孔数据整理、扫描阶段,数据资料存储文档,质量问题及时纠正,对 各数据采集人员提交的数据库进行整合,进行质量检查,首先查验煤炭地质 钻孔数据量是否满足合同要求,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于地质钻孔数据的 相似度检索方法,包括以下步骤:
S1:钻孔数据扫描工作:按照档案馆有关要求,查阅地质钻孔资料,随 后将借阅的纸质地质钻孔资料进行分类,筛选出符合要求的“三图一表”资料进 行扫描;
S2:煤炭地质钻孔数据采集工作:在煤炭地质钻孔数据采集工作开始前, 项目组首先对数据采集人员进行培训,将生成的数字“三图一表”存入相应的文 件夹,并详细的记录保管单位信息、项目信息、钻孔基础信息以及问题处理;
S3:坐标问题分析及修正处理:因为大地坐标系由大地基准面和地图投 影确定,由地图投影到特定椭圆柱面后在南北两极剪开展开而成,是对地球 表面的逼近,各国或地区有各自的大地基准面;
S4:数据采集入库:数据采集人员已经完全掌握了数据采集入库的操作 方法,并由负责人向各数据采集组成员分配文件包,分组实施煤炭勘查地质 钻孔资料数据采集工作;
S5:数据汇总:在数据采集过程中,多名数据采集人员分别同时进行数 据采集,在数据采集人员将各自的煤炭地质钻孔数据资料采集完毕,需要将 各分散的数据库进行合并处理方便向实物中心提交数据成果以及后期进行数 据质量检查;
S6:数据统计分析:对所采集的煤炭地质钻孔数据按照钻孔类型、成孔 年代、省份、工作程度以及钻孔数量方面进行了综合统计与分析;
S7:煤炭地质钻孔资料数字化:煤炭地质钻孔资料进行数字化,在建立 数字化“三图一表”之前,需要对相应文档资料进行分类,为了提高工作效率, 降低时间成本,在资料扫描开始前,项目组首先对应目标资料分类内容,建 立了相应的资料类别存储文件夹,用于实时存储扫描形成的数字化成果;
S8:煤炭地质钻孔数据标准化处理:按照相关技术要求对地质钻孔的“三 图一表”等资料进行数字化处理,纸质地质钻孔资料通过扫描方式,生成JPEG 格式电子文件;对通过不同方式扫描而生成的钻孔资料电子文档,通过数据 转换生成JPEG格式图片文件,确保清晰度达到300dpi以上;
S9:不规范的钻孔坐标处理:钻孔孔口坐标的准确性对开展重要地质钻 孔数据库建设工作,在煤炭地质钻孔数据采集过程中,针对地方坐标以及缺 位坐标等不适用性坐标等情况采取了相应的处理方法;
S10:煤炭地质钻孔资料扫描质量控制逐档逐件对钻孔资料进行分类扫 描,每扫描一张图,还要检查扫描图件的偏离程度;
S11:煤炭地质钻孔资料数据采集质量控制:在数据采集阶段,对于异常 检查孔或普查孔等零散数据,进行不定期质量抽检与统计;
S12:成果数据汇总质量控制:在全部完成数据采集时,各数据采集人员 提交的数据库进行整合,对整体数据进行质量检查,包括工程布置图、勘探 线剖面图、样品分析结果表的存储路径与数量,查验图件数量或页数的准确 度,查验钻孔坐标的正确性以及孔口高程等方面的错误数量。
进一步地,针对S1中,按照工作方案中的扫描流程,将生成的数字“三 图一表”存入相应的文件夹,在此过程中,质量检查人员随时查看扫描资料的 清晰度和准确度,对发现不符合要求的资料立即整改,重新扫描,项目组为 数据采集工作的顺利开展以及确保工作质量,由专人通过高清拍照仪器拍照 整套文字说明材料,为坐标的修正奠定准确依据。
进一步地,针对S2中,保管单位信息:要求数据采集人员按照工作方案 填写钻孔资料保管单位信息;
项目信息:要求数据采集人员首先按照项目目录,核对分配的钻孔数据 扫描文件夹中的项目名称;
钻孔基础信息:在填写完项目信息后,需要数据采集人员按照该项目文 件夹中提供的分类文件填写钻孔基础信息;
保管单位信息表格式与填写说明:按照技术要求,规范填写保管单位信 息。
进一步地,针对S3中,通常所说的高斯投影有三种,即投影后:
a)角度不变(正角投影),投影后经线和纬线仍然垂直;
b)长度不变;
c)面积不变;
Figure BDA0002531937360000041
Figure BDA0002531937360000042
在高斯投影反算公式中:
Figure BDA0002531937360000043
Figure BDA0002531937360000044
项目组根据公式原理,研究相关算法,并通过计算机编程语言实现算法 融合。
与现有技术相比,本发明的有益效果是:本发明提出的一种基于地质钻 孔数据的相似度检索方法,煤炭地质钻孔数据整理、扫描阶段,建立数据资 料存储文档,将扫描完成的资料自动存储进文件夹中分类归档,按照工作方 案与技术路线,采用专用设备进行整理与扫描;在数据采集阶段,采用实物 中心提供的软件完成。工作方法与技术路线主要围绕煤炭地质勘查钻孔数据 资料的筛选、整理以及“三图一表”资料的扫描、钻孔数据采集等主要工作内容 展开,在确定目标数据资料的坐标可以修正和转换的基础上,开始对资料进行整理和扫描,并按照上述文档存储结构将扫描完成的资料存入对应的文件 夹,并做好记录,在整个过程中,实时进行质量检查,对发现的质量问题及 时纠正,在全部完成数据采集时,项目组需要对各数据采集人员提交的数据 库进行整合,对整体数据进行质量检查,首先查验煤炭地质钻孔数据量是否 满足合同要求。
附图说明
图1为本发明的整体流程图;
图2为本发明的钻孔类型柱状图;
图3为本发明的钻孔年代柱状图;
图4为本发明的钻孔工作程度柱状图;
图5为本发明的钻孔资料数字化文档结构模型图;
图6为本发明的电子文档分类提取图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,一种基于地质钻孔数据的相似度检索方法,包括以下步骤:
步骤一:钻孔数据扫描工作:按照档案馆有关要求,查阅地质钻孔资料, 随后将借阅的纸质地质钻孔资料进行分类,筛选出符合要求的“三图一表”资料 进行扫描,按照工作方案中的扫描流程,将生成的数字“三图一表”存入相应的 文件夹,在此过程中,质量检查人员随时查看扫描资料的清晰度和准确度, 对发现不符合要求的资料立即整改,重新扫描,项目组为数据采集工作的顺 利开展以及确保工作质量,由专人通过高清拍照仪器拍照整套文字说明材料, 为坐标的修正奠定准确依据。
步骤二:煤炭地质钻孔数据采集工作:在煤炭地质钻孔数据采集工作开 始前,项目组首先对数据采集人员进行培训,将生成的数字“三图一表”存入相 应的文件夹,并详细的记录保管单位信息、项目信息、钻孔基础信息以及问 题处理,保管单位信息:要求数据采集人员按照工作方案填写钻孔资料保管 单位信息,主要内容包括组织机构代码、单位名称、地勘资质等级、所属行 业部门、通讯地址及联系人等内容。
项目信息:要求数据采集人员首先按照项目目录,核对分配的钻孔数据 扫描文件夹中的项目名称,主要包括项目名称、成果资料档号、项目结束时 间、工作程度或比例尺、主要矿种、工程布置图、勘探线剖面图和样品分析 结果表,重点采集勘探线剖面图、工程布置图和样品分析结果表的扫描图件。
钻孔基础信息:在填写完项目信息后,需要数据采集人员按照该项目文 件夹中提供的分类文件填写钻孔基础信息,要包括钻孔编号、原始资料档号、 钻孔类型、钻孔坐标填写与转换、终孔深度、终孔日期、施工单位以及钻孔 柱状图等内容。
保管单位信息表格式与填写说明:按照技术要求,规范填写保管单位信 息。
步骤三:坐标问题分析及修正处理:因为大地坐标系由大地基准面和地 图投影确定,由地图投影到特定椭圆柱面后在南北两极剪开展开而成,是对 地球表面的逼近,各国或地区有各自的大地基准面,通常所说的高斯投影有 三种,即投影后。
a)角度不变(正角投影),投影后经线和纬线仍然垂直;
b)长度不变;
c)面积不变;
Figure BDA0002531937360000061
Figure BDA0002531937360000071
在高斯投影反算公式中:
Figure BDA0002531937360000072
Figure BDA0002531937360000073
项目组根据公式原理,研究相关算法,并通过计算机编程语言实现算法 融合;
步骤四:数据采集入库:数据采集人员已经完全掌握了数据采集入库的 操作方法,并由负责人向各数据采集组成员分配文件包,分组实施煤炭勘查 地质钻孔资料数据采集工作,数据采集人员经过建立单位保管信息以及项目 信息,完成了煤炭地质钻孔项目的建立,在此基础上,在该项目中逐个填写 钻孔基础信息,直至该项目全部钻孔数据信息填写完毕,才开始下一个项目 的采集;
在钻孔基础信息填写过程中,行政区划代码、组织机构代码仍然不用重 新填写,在项目名称中选择在建立项目信息过程中填写的项目名称即可。在 钻孔基础信息填写过程中,行政区划代码、组织机构代码仍然不用重新填写, 在项目名称中选择在建立项目信息过程中填写的项目名称即可,不用手工填 写。此外,需要填写内容包括20项:
1.成果资料档号:这个需要数据采集人员填写钻孔资料存放在总局档案馆 原始地质资料库中的档案编号。
2.钻孔编号:数据采集人员根据钻孔柱状图上设计施工时给定的钻孔原始 编号进行填写。没有钻孔编号的钻孔,钻孔编号按钻孔名称填写。
3.勘探线号:这部分内容仍然可以填写设计施工时给定的钻孔所在勘探线 编号。
4.钻孔名称:数据采集人员填写设计施工时给定的钻孔名称。如果没有给 定钻孔名称,此项不填。
5.钻孔类型:这部分内容需要数据采集人员根据煤炭地质钻孔项目的分类 来确定,一般钻孔类型按地质工作类别分为8大类,包括:
①区调钻孔(1a.区域地质调查钻孔,1b.区域矿产调查钻孔,1c.区域水工环 调查钻孔,1d.其他区调钻孔)。
②矿产地质勘查钻孔(2a.综合矿产地质勘查钻孔,2b.煤田地质勘查钻孔, 2c.金属矿产地质勘查钻孔,2d.非金属矿产地质勘查钻孔,2e.放射性矿产地质 勘查钻孔,2f.地热、矿泉水、气体矿产地质勘查钻孔)。
③水文地质勘查钻孔。
④工程地质勘查钻孔。
⑤环境地质勘查钻孔。
⑥灾害地质勘查钻孔。
⑦城市地质勘查钻孔。
⑧地质科学研究钻孔。
⑨其他;
6.工作区名称:这部分内容是根据煤炭地质钻孔项目的施工地点或者报告 名称来确定,按矿产地行政区划+工作区名称填写,即:省(区、市)、县 (市、区)、乡(镇)、村+工作区名称。
7.钻孔位置:数据采集人员按照钻孔原始记录所记录的钻孔位置,填写钻 孔所在行政区详细位置,包括省(区、市)、县(市、区)、乡(镇)、村、 街道名称、钻孔具体位置。
8.坐标系:这部分内容较为重要且为必填项。一般情况下,数据采集人员 根据报告内容或者参考地形地质图、工程布置图等重要图件的坐标信息,依 据钻孔柱状图上的经纬度或者经纬距来确定,坐标系一般分为6项,可供选 择:
①北京1954-3°带。
②北京1954-6°带。
③国家1980-3°带。
④国家1980-6°带。
⑤地方坐标。
⑥地理坐标。
这部分内容在坐标处理组修正坐标后,由数据采集组成员进行录入。
9.矿区原点坐标X:根据技术要求,采用独立坐标(近似或假定坐标)的 测网原点相对于国家测网坐标值X。如果坐标系为:北京1954-3°带、北京 1954-6°带、国家1980-3°带、国家1980-6°带、地理坐标的钻孔,则此项不再 填写。
10.矿区原点坐标Y:根据技术要求,采用独立坐标(近似或假定坐标) 的测网原点相对于国家测网坐标值Y。如果坐标系为:北京1954-3°带、北京 1954-6°带、国家1980-3°带、国家1980-6°带、地理坐标的钻孔,则此项不再 填写。
11.孔口坐标X:根据钻孔柱状图图头信息的原始记录填写,精确到厘米。 如果该钻孔有孔口经纬度,则此项不再填写。
12.孔口坐标Y:与孔口坐标X类似。
13.孔口经度与纬度:由于钻孔柱状图坐标信息均按照钻孔原始记录填写, 此项未填写。
14.孔口高程:根据钻孔原始记录填写,并精确到厘米。当孔口高程为负 值的,数据采集人员在数值前加负号。
15.终孔深度:根据孔原始记录填写,精确到厘米。
16.终孔日期:根据钻孔原始记录填写,钻孔结束钻进的日期,在填写过 程中按照前四位为年,中间两位为月,后两位为日的格式填写。
17.施工单位:根据煤炭地质钻孔报告资料的内容或者钻孔柱状图上的单 位名称填写。
18.钻孔柱状图:这是核心内容,钻孔柱状图全幅扫描,包括图面中的钻 孔样品分析结果表等内容一并提供。按《图文地质资料扫描数字化规范(试 行)—SZ1999001-2000》的扫描要求,将钻孔柱状图扫描形成JPEG格式文件, 图件以单独文件形式存储,添加到地质钻孔数据采集软件系统中,在“钻孔基 础信息表”中存储全路径文件名;
19.钻孔柱状图数:一般情况下,一个钻孔对应一个钻孔柱状图,但由于 有些钻孔柱状图幅数较多,几张图作为一个钻孔的图件,因此,在填写该项 信息时,需要数据采集人员清点该钻孔编号下的所有图件数量,一并填入;
步骤五:数据汇总:在数据采集过程中,多名数据采集人员分别同时进 行数据采集,在数据采集人员将各自的煤炭地质钻孔数据资料采集完毕,需 要将各分散的数据库进行合并处理方便向实物中心提交数据成果以及后期进 行数据质量检查,采集系统软件安装路径下的“main”文件夹作为该软件的数据 库文件,首先将每个数据采集人员提交的“main”文件夹进行名称标注,并拷贝 到数据合并软件中的“subitem”文件夹中,通过系统软件的“数据管理”选项, 打开“数据汇总”对话框,可以看到在追加条目对话框中显示了各个数据采集人 员提交的数据库文件夹,通过多项选择,勾选相应数据库文件夹,并使用“汇总到主目录”功能,实现多数据库整合,通过数据质量汇总检查;
请参阅图2-4,步骤六:数据统计分析:对所采集的煤炭地质钻孔数据按 照钻孔类型、成孔年代、省份、工作程度以及钻孔数量方面进行了综合统计 与分析;
请参阅图5-6,步骤七:煤炭地质钻孔资料数字化:煤炭地质钻孔资料进 行数字化,在建立数字化“三图一表”之前,需要对相应文档资料进行分类,为 了提高工作效率,降低时间成本,在资料扫描开始前,项目组首先对应目标 资料分类内容,建立了相应的资料类别存储文件夹,用于实时存储扫描形成 的数字化成果;
步骤八:煤炭地质钻孔数据标准化处理:按照相关技术要求对地质钻孔 的“三图一表”等资料进行数字化处理,纸质地质钻孔资料通过扫描方式,生成 JPEG格式电子文件;对通过不同方式扫描而生成的钻孔资料电子文档,通过 数据转换生成JPEG格式图片文件,确保清晰度达到300dpi以上;
步骤九:不规范的钻孔坐标处理:钻孔孔口坐标的准确性对开展重要地 质钻孔数据库建设工作,在煤炭地质钻孔数据采集过程中,针对地方坐标以 及缺位坐标等不适用性坐标等情况采取了相应的处理方法,1.地方坐标钻孔有 坐标所对应国家坐标的矿区原点坐标的,则可利用简单公式得到:X=X0+a, Y=Y0+b。
2.地方坐标钻孔没有钻孔坐标所对应国家坐标的矿区原点坐标的,但有矿 区平面地形地质图。如果平面地形地质图上的坐标为国家坐标系,则可直接 在图上读取相应钻孔的坐标。如果平面地形地质图也是地方坐标(矿区坐标), 可用地形地质图与国家地形图进行对照,通过公共点的方式建立矿区坐标与 国家坐标之间的联系,再通过坐标转换系统进行换算。
3.地方坐标钻孔没有钻孔坐标所对应国家坐标的矿区原点坐标的,也没有 矿区平面地形地质图。则以项目为单元查找钻孔相对位置和钻孔位置的文字 描述等,利用地形图和坐标转换系统查找确定该项目中心点的经纬度坐标, 用该项目中心点的经纬度坐标作为此项目下的所有钻孔坐标,并在备注中说 明坐标获取方法。
4.城市地质勘查的钻孔地方坐标,主要集中在工程地质钻孔方面。城市坐 标系与国家坐标之间的转换公式属于保密范畴。经研究,项目组采用上述第 二种方法,用地形地质图与地形图进行对照,通过公共点的方式建立城市坐 标与国家坐标之间的联系,再通过坐标转换系统进行换算。
5.如果项目中有说明则正常填写;如果项目中没有说明,则统一为1985 年以前的项目则选择北京54坐标系;1985年以后的项目(含1985年)则选 择西安80坐标系。
6.关于3°带和6°带的区分:坐标(Y坐标,8位数,前两位是带号)带号 小于等于23的是6°带,大于等于24的是3°带。对于Y坐标小数点前位数为 6位的,要通过查找资料文字描述和地形地质图或工程布置图等资料,结合钻 孔柱状图上提供的坐标信息,使用坐标转换系统计算确定带号信息,补全坐 标位数;
步骤十:煤炭地质钻孔资料扫描质量控制逐档逐件对钻孔资料进行分类 扫描,每扫描一张图,还要检查扫描图件的偏离程度,在扫描的过程中,工 作人员逐档逐件对钻孔资料进行分类扫描。每扫描一张图,项目工作人员都 要查看扫描分辨率是否在300dpi,如果分辨率不符合技术要求,及时进行整 改修正。同时,项目组还要检查扫描图件的偏离程度,如果图件扫描偏离, 质检组要求重新进行扫描。如果报告已经入库,则需要重新登记借阅。
此外,在扫描的过程中发现由于部分资料年代久远,纸质资料有残破不 全的情况,或者纸张不能满足扫描要求,这部分资料按照总局档案馆有关规 定进行登记,经过与档案专家沟通,如果可以通过修补完成扫描,则继续将 资料数字化,否则登记备案;
步骤十一:煤炭地质钻孔资料数据采集质量控制:在数据采集阶段,对 于异常检查孔或普查孔等零散数据,进行不定期质量抽检与统计,对互检过 程中着重检查数据项是否丢失,数据数量是否不足以及图件的基础信息数据 是否采集完成,并严格控制数据表中采集的文字出错率≤3‰,以及坐标及换 算精度误差≤100米等关键点,此外,项目组按照如下项目进行不定期质量抽 检与统计;
步骤十二:成果数据汇总质量控制:在全部完成数据采集时,各数据采 集人员提交的数据库进行整合,对整体数据进行质量检查,包括工程布置图、 勘探线剖面图、样品分析结果表的存储路径与数量,查验图件数量或页数的 准确度,查验钻孔坐标的正确性以及孔口高程等方面的错误数量,审查数据 填报的正确性与完整性,钻孔资料基础信息填报与图表入库是否存在错误, 是否存在数据遗漏。详细检验“三图一表”的信息填写是否准确,包括工程布置 图、勘探线剖面图、样品分析结果表的存储路径与数量。查验图件数量或页数的准确度,查验钻孔坐标的正确性以及孔口高程等方面的错误数量。
检查方法包括:计算机检查软件自动检查、人机交互的计算机辅助检查 和人工判别检查。
质量审查方法包括:屏幕显示检查、图表打印输出检查、统计分析检查、 理论计算检查、人工判别检查。
该系统主要依据谱聚类算法对煤炭地质钻孔成果文本语义进行分析,通 过算法中矩阵特征值和特征向量求解相关问题,以拉普拉斯矩阵作为谱聚类 算法的基础,构造关于待聚类的煤炭地质钻孔成果文本集的全连接相似度图, 并通过该图的邻接矩阵为基础,进行谱聚类算法求解,从而得到相应文本文 集聚类结果。
为了便于算法实现,采用A=“A0A1……Am-1”和B=“B0B1……Bn-1”分别表 示长度为m和n的语义文本。基于相似度依赖于两个文本中相同文字位置,定 义
C(A,I,B)={k|Bk=Ai,k=0,1,……m-1}
作为A中第i个文字与B中相匹配文字的位置集合。当A的第i个文字在B 中无相关匹配文字时,C(A,i,B)为空集合
Figure BDA0002531937360000141
同时,定义
Figure RE-GDA0002569974950000142
为文字Ai的最小匹配偏移量,定义CC(A,i,B)=为文字Ai的匹配贡献量。定义 SC(A,B)=作为煤炭地质钻孔成果文本数据A相对于B的相似度
煤炭地质钻孔数据整理、扫描阶段,建立数据资料存储文档,将扫描完 成的资料自动存储进文件夹中分类归档,按照工作方案与技术路线,采用专 用设备进行整理与扫描;在数据采集阶段,采用实物中心提供的软件完成。 工作方法与技术路线主要围绕煤炭地质勘查钻孔数据资料的筛选、整理以及 “三图一表”资料的扫描、钻孔数据采集等主要工作内容展开。
在煤炭地质勘查项目资料扫描开始前,项目组要检查目标资料中坐标的 适用状态,如果在钻孔柱状图上显示的坐标是地方坐标或者位数不够的情况 下,需要查找对应项目的坐标表进行核对,如果坐标表上的坐标也存在不适 用性,则需要找出地形地质图或者工程布置图进行坐标位置比对和矿区确定, 再经过成果资料对矿区原点进行确认选取,同时要参照坐标修正方案中的情 况进行处理。
在坐标修正过程中,由于历史原因,需要咨询勘研总院有经验的煤炭地 质专家,通过进行坐标修正和转换。
在确定目标数据资料的坐标可以修正和转换的基础上,开始对资料进行 整理和扫描,并按照上述文档存储结构将扫描完成的资料存入对应的文件夹, 并做好记录,在整个过程中,实时进行质量检查,对发现的质量问题及时纠 正,在全部完成数据采集时,项目组需要对各数据采集人员提交的数据库进 行整合,对整体数据进行质量检查,首先查验煤炭地质钻孔数据量是否满足 合同要求;其次,审查数据填报的正确性与完整性,钻孔资料基础信息填报 与图表入库是否存在错误,是否存在数据遗漏。详细检验“三图一表”的信息填 写是否准确,包括工程布置图、勘探线剖面图、样品分析结果表的存储路径 与数量,查验图件数量或页数的准确度,查验钻孔坐标的正确性以及孔口高 程等方面的错误数。
综上所述:本基于地质钻孔数据的相似度检索方法,煤炭地质钻孔数据 整理、扫描阶段,建立数据资料存储文档,将扫描完成的资料自动存储进文 件夹中分类归档,按照工作方案与技术路线,采用专用设备进行整理与扫描; 在数据采集阶段,采用实物中心提供的软件完成。工作方法与技术路线主要 围绕煤炭地质勘查钻孔数据资料的筛选、整理以及“三图一表”资料的扫描、钻 孔数据采集等主要工作内容展开,在确定目标数据资料的坐标可以修正和转 换的基础上,开始对资料进行整理和扫描,并按照上述文档存储结构将扫描 完成的资料存入对应的文件夹,并做好记录,在整个过程中,实时进行质量 检查,对发现的质量问题及时纠正,在全部完成数据采集时,项目组需要对 各数据采集人员提交的数据库进行整合,对整体数据进行质量检查,首先查 验煤炭地质钻孔数据量是否满足合同要求。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不 局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根 据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明 的保护范围之内。

Claims (4)

1.一种基于地质钻孔数据的相似度检索方法,其特征在于,包括以下步骤:
S1:钻孔数据扫描工作:按照档案馆有关要求,查阅地质钻孔资料,随后将借阅的纸质地质钻孔资料进行分类,筛选出符合要求的“三图一表”资料进行扫描;
S2:煤炭地质钻孔数据采集工作:在煤炭地质钻孔数据采集工作开始前,项目组首先对数据采集人员进行培训,将生成的数字“三图一表”存入相应的文件夹,并详细的记录保管单位信息、项目信息、钻孔基础信息以及问题处理;
S3:坐标问题分析及修正处理:因为大地坐标系由大地基准面和地图投影确定,由地图投影到特定椭圆柱面后在南北两极剪开展开而成,是对地球表面的逼近,各国或地区有各自的大地基准面;
S4:数据采集入库:数据采集人员已经完全掌握了数据采集入库的操作方法,并由负责人向各数据采集组成员分配文件包,分组实施煤炭勘查地质钻孔资料数据采集工作;
S5:数据汇总:在数据采集过程中,多名数据采集人员分别同时进行数据采集,在数据采集人员将各自的煤炭地质钻孔数据资料采集完毕,需要将各分散的数据库进行合并处理方便向实物中心提交数据成果以及后期进行数据质量检查;
S6:数据统计分析:对所采集的煤炭地质钻孔数据按照钻孔类型、成孔年代、省份、工作程度以及钻孔数量方面进行了综合统计与分析;
S7:煤炭地质钻孔资料数字化:煤炭地质钻孔资料进行数字化,在建立数字化“三图一表”之前,需要对相应文档资料进行分类,为了提高工作效率,降低时间成本,在资料扫描开始前,项目组首先对应目标资料分类内容,建立了相应的资料类别存储文件夹,用于实时存储扫描形成的数字化成果;
S8:煤炭地质钻孔数据标准化处理:按照相关技术要求对地质钻孔的“三图一表”等资料进行数字化处理,纸质地质钻孔资料通过扫描方式,生成JPEG格式电子文件;对通过不同方式扫描而生成的钻孔资料电子文档,通过数据转换生成JPEG格式图片文件,确保清晰度达到300dpi以上;
S9:不规范的钻孔坐标处理:钻孔孔口坐标的准确性对开展重要地质钻孔数据库建设工作,在煤炭地质钻孔数据采集过程中,针对地方坐标以及缺位坐标等不适用性坐标等情况采取了相应的处理方法;
S10:煤炭地质钻孔资料扫描质量控制逐档逐件对钻孔资料进行分类扫描,每扫描一张图,还要检查扫描图件的偏离程度;
S11:煤炭地质钻孔资料数据采集质量控制:在数据采集阶段,对于异常检查孔或普查孔等零散数据,进行不定期质量抽检与统计;
S12:成果数据汇总质量控制:在全部完成数据采集时,各数据采集人员提交的数据库进行整合,对整体数据进行质量检查,包括工程布置图、勘探线剖面图、样品分析结果表的存储路径与数量,查验图件数量或页数的准确度,查验钻孔坐标的正确性以及孔口高程等方面的错误数量。
2.如权利要求1所述的一种基于地质钻孔数据的相似度检索方法,其特征在于,针对S1中,按照工作方案中的扫描流程,将生成的数字“三图一表”存入相应的文件夹,在此过程中,质量检查人员随时查看扫描资料的清晰度和准确度,对发现不符合要求的资料立即整改,重新扫描,项目组为数据采集工作的顺利开展以及确保工作质量,由专人通过高清拍照仪器拍照整套文字说明材料,为坐标的修正奠定准确依据。
3.如权利要求1所述的一种基于地质钻孔数据的相似度检索方法,其特征在于,针对S2中,保管单位信息:要求数据采集人员按照工作方案填写钻孔资料保管单位信息;
项目信息:要求数据采集人员首先按照项目目录,核对分配的钻孔数据扫描文件夹中的项目名称;
钻孔基础信息:在填写完项目信息后,需要数据采集人员按照该项目文件夹中提供的分类文件填写钻孔基础信息;
保管单位信息表格式与填写说明:按照技术要求,规范填写保管单位信息。
4.如权利要求1所述的一种基于地质钻孔数据的相似度检索方法,其特征在于,针对S3中,通常所说的高斯投影有三种,即投影后:
a)角度不变,投影后经线和纬线仍然垂直;
b)长度不变;
c)面积不变;
Figure FDA0002531937350000031
Figure FDA0002531937350000032
在高斯投影反算公式中:
Figure FDA0002531937350000033
Figure FDA0002531937350000034
项目组根据公式原理,研究相关算法,并通过计算机编程语言实现算法融合。
CN202010520736.7A 2020-06-10 2020-06-10 一种基于地质钻孔数据的相似度检索方法 Pending CN111651549A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010520736.7A CN111651549A (zh) 2020-06-10 2020-06-10 一种基于地质钻孔数据的相似度检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010520736.7A CN111651549A (zh) 2020-06-10 2020-06-10 一种基于地质钻孔数据的相似度检索方法

Publications (1)

Publication Number Publication Date
CN111651549A true CN111651549A (zh) 2020-09-11

Family

ID=72347466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010520736.7A Pending CN111651549A (zh) 2020-06-10 2020-06-10 一种基于地质钻孔数据的相似度检索方法

Country Status (1)

Country Link
CN (1) CN111651549A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116166729A (zh) * 2023-02-15 2023-05-26 中国科学院广州地球化学研究所 钻孔柱状图数据的处理方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王建军;高闻宇;李德忠;齐艳妮;: "矿山单位钻孔数据库的建立与应用" *
陈建峰等: "高斯-克吕格投影正反算公式的应用" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116166729A (zh) * 2023-02-15 2023-05-26 中国科学院广州地球化学研究所 钻孔柱状图数据的处理方法、装置、电子设备及存储介质
CN116166729B (zh) * 2023-02-15 2023-11-17 中国科学院广州地球化学研究所 钻孔柱状图数据的处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN112270027B (zh) 基于实体模型的城市设计无纸化智能交互审查方法
US7024402B2 (en) Spatial data mining method, spatial data mining apparatus and storage medium
US8402058B2 (en) Method and computer program product for geophysical and geologic data identification, geodetic classification, organization, updating, and extracting spatially referenced data records
CN106779417A (zh) 工程勘察信息数字化采集、管理及综合应用方法
CN109684428A (zh) 空间数据建设方法、装置、设备及存储介质
Tomlinson et al. The state of development of systems for handling natural resources inventory data
CN103412967A (zh) 野外地质信息采集系统、采集方法及采集系统的应用方法
CN103955558A (zh) 一种采集并处理不同行业工勘数据的方法
CN115617889A (zh) 一种基于gis的勘察数据采集与处理方法以及系统
CN113222540A (zh) 一种生态保护红线的管理系统
CN112199886A (zh) 一种prb数据深度学习地质图预测模型的处理方法
CN105069162A (zh) 一种勘探平洞编录的信息化数据采集系统和方法
CN111651549A (zh) 一种基于地质钻孔数据的相似度检索方法
Johnson Geographic information systems (GIS) and mapping: practices and standards
CN111582813A (zh) 一种城市体检指标采集方法及填报工具
Anichini et al. A database for archaeological data recording and analysis
CN104408316B (zh) 中美岩土工程土壤分类标准转换装置及方法
De Donatis et al. Landslide Field Mapping: IFFI-Restart Forms for Data Acquisition and Management for the Classification of Landslides in the Municipalities Affected by the 2016 Central Italy Earthquake
Veeger et al. Harnessing the power of relational databases for managing subsurface geotechnical and geologic data
CN116644116B (zh) 场地级岩溶塌陷危险性评价因子提取方法
Chiemelu et al. Multi-Purpose Cadastre (MPC) for Land Administration and Management of Bethel Estate, Enugu State, Nigeria.
CN118170856B (zh) 一种适用于人工智能地质图建模的数据池构建方法及系统
Sarris et al. A web-GIS approach to cultural resources management in Crete: The digital archaeological atlas of Crete
Matthews Documentation and databases
CN118656552A (zh) 一种基于gis技术的城建档案查询方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200911

WD01 Invention patent application deemed withdrawn after publication