CN117992620B - 一种基坑工程评估方法、系统、存储介质及电子设备 - Google Patents
一种基坑工程评估方法、系统、存储介质及电子设备 Download PDFInfo
- Publication number
- CN117992620B CN117992620B CN202410398287.1A CN202410398287A CN117992620B CN 117992620 B CN117992620 B CN 117992620B CN 202410398287 A CN202410398287 A CN 202410398287A CN 117992620 B CN117992620 B CN 117992620B
- Authority
- CN
- China
- Prior art keywords
- text
- preset
- vector
- data
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 171
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000000605 extraction Methods 0.000 claims abstract description 60
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 47
- 238000010276 construction Methods 0.000 claims abstract description 15
- 230000010354 integration Effects 0.000 claims abstract description 15
- 238000003672 processing method Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 12
- 230000005484 gravity Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 abstract description 6
- 238000012502 risk assessment Methods 0.000 abstract description 3
- 238000012544 monitoring process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000009430 construction management Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002620 method output Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基坑工程评估方法、系统、存储介质及电子设备,方法包括:获取参考数据,根据参考数据通过预设处理方法确定到标记文本数据;根据标记文本数据通过预设匹配算法确定特征数据,根据特征数据和参考数据通过预设构建算法确定图数据库,获取基坑描述文本,根据基坑描述文本通过预设提取转化算法确定关键词文本,根据关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本;根据提取文本和矢量文本通过预设整合算法确定整合数据,根据整合数据通过预设预测模型确定评估结果和工单。本发明解决了现有技术中基坑风险评估方法对于人工描述的内容无法做到准确快速的理解,导致评估的效率低且评估结果不够准确的问题。
Description
技术领域
本发明涉及基坑工程技术领域,特别涉及一种基坑工程评估方法、系统、存储介质及电子设备。
背景技术
随着人工智能技术的不断发展,各类工程类系统出现在人们的视野,为施工结构设计,施工流程决策,施工期间结构变形预测等提供一系类具有参考价值的方案,大大提高施工过程的效率,并降低施工过程中风险隐患。
其中,基坑开挖是开发地下空间的一个重要组成部分,但基坑开挖会影响周边环境与基础设施,造成地表沉降,地标倾斜,管道泄露,土体变形等。因此,为保证基坑工程施工的安全性,需要对基坑工程进行风险等级评估。在现有的基坑工程风险评估方法中,主要是利用自动化设备对基坑施工现场进行检监测得到检测数据,再监测数据进行定量化分析。然而,基坑自动化监测是当今的发展趋势,但目前我国的基坑工程的自动化监测未完全普及,且由于实际工程的不同,例如,基坑工程较小时自动化监测成本太高,基坑工程环境复杂时,监测设备难以运输安置等状况下,通常还是采用人工巡检的方式。
然而,人工巡检除了记录相应的检测数据外,还会对现场状况进行描述。现有的基坑风险评估方法,只能对监测数据进行快速处理,对于人工描述的内容无法做到准确快速的理解,导致评估的效率低且评估结果不够准确。
发明内容
基于此,本发明的目的是提供一种基坑工程评估方法、系统、存储介质及电子设备,旨在解决现有技术中基坑风险评估方法对于人工描述的内容无法做到准确快速的理解,导致评估的效率低且评估结果不够准确的问题。
根据本发明实施例的一种基坑工程评估方法,所述方法包括:
获取参考数据,并通过预设处理方法对所述参考数据进行标记处理得到标记文本数据;
根据所述标记文本数据通过预设匹配算法进行特征提取确定特征数据,并根据所述特征数据和所述参考数据通过预设构建算法确定图数据库,所述图数据库作为测试集用于训练预设预测模型;
获取基坑描述文本,根据所述基坑描述文本通过预设提取转化算法确定关键词文本,并根据所述关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本;
根据所述提取文本和矢量文本通过预设整合算法确定整合数据,并根据所述整合数据通过所述预设预测模型确定评估结果和工单。
另外,根据本发明上述实施例的一种基坑工程评估方法,还可以具有如下附加的技术特征:
进一步地,所述根据所述标记文本数据通过预设匹配算法进行特征提取确定特征数据的步骤包括:
对所述标记文本进行向量化操作得到第一向量,并根据所述第一向量和多个预设向量群的重心通过第一预设公式确定目标向量群,所述预设向量群由向量化后的基坑工程专有名称归类得到,所述目标向量群为向量群的重心与所述第一向量距离最近的向量群;
根据所述目标向量群和所述第一向量通过所述第一预设公式确定所述目标向量群内的第一目标向量,所述第一目标向量对应的文本数据为所述特征数据,所述第一目标向量为所述目标向量群中距离所述第一向量最近的向量;
所述第一预设公式为:
;
其中,代表向量中特定的向量希尔波特空间0点构成的直线,代表第一向量对应的值。
进一步地,所述根据所述关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本的步骤包括:
根据所述关键词文本和所述图数据库通过预设规则对所述图数据库进行文本提取得到所述提取文本,所述预设规则包括:根据所述关键词文本确定目标节点,提取目标节点下与之连接的节点,且连接的节点符合目标节点的下一级内容;
所述提取文本的提取表达式为:;
其中,代表对应第i个节点关键词,/>代表/>的内容,n代表关键词数,/>...,/>代表/>内容下一级内容和再下一级内容;
具体形式为:/>;
其中,代表/>内容的关键词,/>,...,/>代表/>内容下一级内容。
进一步地,所述根据所述关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本的步骤包括:
根据所述关键词文本和所述图数据库确定所述关键词文本对应的所述数据库内的目标节点,所述目标节点的表达式为;
对所述关键词文本、目标节点的内容和目标节点的下一阶关键词进行向量化操作,得到关键词向量和多个第二目标向量;
将关键词向量分别与多个所述第二目标向量进行距离求解,并将距离所述关键词向量最近的第二目标向量对应的文本作为矢量文本。
进一步地,所述根据所述提取文本和矢量文本通过预设整合算法确定整合数据的步骤包括:
获取所述提取文本和矢量文本并分别表示为:
和/>,其中,/>表示矢量匹配大小值第i个内容,/>表示匹配最为近似,k代表匹配前k个最优值;
根据所述提取文本和矢量文本通过预设匹配函数进行处理得到所述整合数据,表示形式为,/>;
所述预设匹配函数的表达式为:
;
其中表示为在/>上的投影,/>长度为一个句子为单位的向量,/>代表平行,代表不平行。
进一步地,所述根据所述整合数据通过所述预设预测模型确定评估结果和工单的步骤包括:
根据所述整合数据通过所述预测模型确定预测文本;
根据所述预测文本和所述图数据库通过预设优化算法进行优化得到当前基坑工程的评估结果和对应的工单。
进一步的,所述获取基坑描述文本的步骤包括:
接收外界输入的实时基坑工程数据和基坑状况文本;
根据所述实时基坑工程数据通过预设算法确定基坑状况数据,所述基坑状况数据和所述基坑状况文本构成所述基坑描述文本。
本发明实施例的另一个目的在于提供一种基坑工程评估系统,所述系统包括:
标记文本确定模块,用于获取参考数据,并通过预设处理方法对所述参考数据进行标记处理得到标记文本数据;
图数据库确定模块,用于根据所述标记文本数据通过预设匹配算法进行特征提取确定特征数据,并根据所述特征数据和所述参考数据通过预设构建算法确定图数据库,所述图数据库作为测试集用于训练预设预测模型;
文本提取模块,用于获取基坑描述文本,根据所述基坑描述文本通过预设提取转化算法确定关键词文本,并根据所述关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本;
评估模块,用于根据所述提取文本和矢量文本通过预设整合算法确定整合数据,并根据所述整合数据通过所述预设预测模型确定评估结果和工单。
本发明实施例的另一个目的是提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的基坑工程评估方法的步骤。
本发明实施例的另一个目的是提供一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的基坑工程评估方法的步骤。
本发明通过对包含历史案例、规范、资料等的参数数据进行处理得到格式一致的标记文本数据,再通过预设匹配算法对标记文本数据进行向量化处理,且与由基坑工程专有名称向量归类得到的预设向量群进行匹配,进而确定标记文本数据中各个内容对应的特征数据,即相应的关键词,通过关键词与标记文本数据的对应关系构建图数据库,使得由该图数据库训练得到的预测模型能够依据关键词进行快速预测,在进行评估时,通过对外界输入的基坑描述文本进行转换确定关键词文本,再分别通过提取检索方法和矢量检索方法依据关键词文本对图数据库进行检测,再对两者手段检测后得到的文本进行整合得到整合数据,通过这种方式使得人工输入的数据和文本描述经过初步关键词提取后,再分别通过两种检索方法于图数据库中进行检索后,整合两种检索数据的关键词,再用于预设预测模型进行评估并生成工单,使得人工输入的文本描述经过转换为符合预测模型输入的文本数据,进而使得该评估方法对于人工描述的内容能够做到准确快速的理解,使得评估的效率高且评估结果准确。此外,在进行文本转化时,是由关键词通过两种检索方式进行检索的,进一步加快了整体效率,且由两种不同的检索方式进行检索后,再整合确定最终输入预测模型的检索关键词,避免了信息遗漏的状况,提高了评估方法的准确性。
附图说明
图1为本发明第一实施例中的基坑工程评估方法的流程图;
图2为本发明第二实施例中的基坑工程评估系统的结果示意图;
图3为本发明第三实施例中的电子设备的结构示意图;
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一
请参阅图1,所示为本发明第一实施例中的基坑工程评估方法,该方法具体包括步骤S01-S04。
S01,获取参考数据,并通过预设处理方法对参考数据进行标记处理得到标记文本数据;
具体的,参考数据包括,大量现有基坑工程规范,基坑工程具体案例、设计资料、地质勘察资料、施工管理计划资料,注册岩土工程师专业案例试题等,并实时补充最新基坑工程案例。这些参数描述了基坑工程本身在设计施工过程中需要考虑的问题。
在具体实施时,需要先判断参考数据的格式,当参考数据为是txt,docx,doc格式,读取该文件,并进行数据切割。数据切割主要方法为:自动读取文件一级标题、二级标题、三级标题等,对存在标题的文件,以一级标题为单位进行分割,同时保留各标题格式;对不存在标题的文件,将数据以行为单位输入至Bert模型进行分类,分类结果共5种,分别为:一级标题、二级标题、三级标题、正文、无字符。并对分类结果进行特定格式自动标注。在正常的计算机读取的文本中,各个段落文本有一整串连续的字符串组成,通常通过在段落间增加‘\n’符号,用于使计算机区分不同段落的字符串,因此,在进行数据切割分类时,以行为单位主要依据为两个字符串‘\n’的符号为依据。对于该文件如果是pdf,png,jpg格式,读取该文件,并对文件统一转化为图像png格式,对转化为图像png格式数据进行文字提取,文字提取后利用上述数据切割方法进行自动标注。
具体的,图像文字提取方法可以为,对提取得到png图像进行自适应二值化处理,用于对png图像文字内容进行视觉加强,具体操作如下:分别提取数字图像RGB共三个维度数据内容,就RGB图像首先进行灰度化处理,同时从左向右,从上到下分别读取灰度化图像像素数据,并根据相关公式转化为某一特定数值大小,具体该公式描述为:当该像素的值小于50时强制赋值为0,否则为255。图像自适应二值化后进行自适应图像切割,切割用于图像文字提取算法进行逐个字符识别。自适应图像切割具体内容为,对原二值化处理后图像A进行粗切割,由用户确定需要识别的图像内容,并获得对角矩形的两个点坐标(x1,y1)和(x2,y2),根据提供坐标进行对图像A进行切割得到B,具体表示为B=A[x1:x2,y1:y2],其中x1:x2表示获取横坐标x1到x2内的所有数据,y1:y2表示获取纵坐标y1到y2内的所有数据。得到切割后图像B后进一步进行精操作,具体步骤为:由用户提供图像B中需要提取文字中的第一个字符,得到对角矩形的两个点坐标(x3,y3)和(x4,y4),由计算机自动读取该矩阵长宽,并以此向右向下自动化标注方框在图像B上,其中方框内容包含对角两点坐标,用户可通过拖动进行改变,具体表示为,其中i表示第i个方框,x3:x4表示获取横坐标x3到x4内的所有数据,y3:y4表示获取纵坐标y3到y4内的所有数据。用户在确认所有方框都只包含一个字符后进行精切割得到/>,具体表示为/>,其中i表示第i个方框,x3:x4表示获取横坐标x3到x4内的所有数据,y3:y4表示获取纵坐标y3到y4内的所有数据。对切割后的/>进行人工神经网络ANN汉字识别。
S02,根据标记文本数据通过预设匹配算法进行特征提取确定特征数据,并根据特征数据和参考数据通过预设构建算法确定图数据库,图数据库作为测试集用于训练预设预测模型;
具体的,对标记文本进行向量化操作得到第一向量,并根据第一向量和多个预设向量群的重心通过第一预设公式确定目标向量群,预设向量群由向量化后的基坑工程专有名称归类得到,目标向量群为向量群的重心与第一向量距离最近的向量群;根据目标向量群和第一向量通过第一预设公式确定目标向量群内的第一目标向量,第一目标向量对应的文本数据为特征数据,第一目标向量为目标向量群中距离第一向量最近的向量;第一预设公式为:;
其中,代表向量中特定的向量希尔波特空间0点构成的直线,代表第一向量对应的值。进而得到标记文本数据以及对应的特征数据,即关键词。对对应的关键词与标记文本数据细分内容进行对应,对于关键词和内容符合细分内容的,直接在具体方法下一级添加节点并赋值,对于关键词和内容不符合细分内容或细分内容没有的,进行标注待后续讨论确定。进而构造工程案例知识图谱。再将知识图谱转化为neo4j图数据,构成图数据库。
S03,获取基坑描述文本,根据基坑描述文本通过预设提取转化算法确定关键词文本,并根据关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本;
具体的,接收外界输入的实时基坑工程数据和基坑状况文本,其中实时基坑工程数据为携带设备监测到的对应监测数据,基坑状况文本为人工现场状况描述文本;根据实时基坑工程数据通过预设算法确定基坑状况数据,基坑状况数据和基坑状况文本构成基坑描述文本。基坑状况文本为基坑工程各结构受力变形情况。预设算法可以是被人工智能方法用神经网络、灰色预测、决策树等机器学习模型描述,也可以是被数值计算方法诸如ANSYS、ABAQUS、PLAXIS、FLAC、PFC 等有限元或离散元计算软件计算描述,这些描述的方法的核心点是能够考虑基坑工程中各结构部位的受力和超载状态,并整体计算或预测输出变形情况。
示例而非限定的,在一些可选的实施例中根据基坑描述文本通过预设提取转化算法确定关键词文本的具体步骤包括:对基坑描述文本进行提取并表示为:其中,/>表示第i个结构类型,/>,表示第i个结构截面面积,/>表示第i个材料参数,/>表示第i个头尾结点坐标,/>表示第i个结构受力,/>表示第i个变形结果最大值和最小值,/>表示第i个实际现场观察到的肯出现的问题及现象。再对提取的文本进行转化,具体的转化方式根据:提取/>中第i元素表示为(/>,/>,/>,/>,/>,/>,/>),描述方式以该结构不同参数类型用逗号进行区分,特别地:模型针对第i元素内不同参数类型进行关键词提取与格式转化,如对/>首先提取其中的关键信息,并通过“关键信息--”作为格式转化后的输出与/>处理后的输出进行数据连接,最终该第i个结构处理后表达为内容1--内容2--内容3--等。
另外的,根据关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本的步骤包括:根据关键词文本和图数据库通过预设规则对图数据库进行文本提取得到提取文本,预设规则包括:根据关键词文本确定目标节点,提取目标节点下与之连接的节点,且连接的节点符合目标节点的下一级内容;提取表达式为:;其中,/>代表对应第i个节点关键词,/>代表/>的内容,n代表关键词数,/>,.../>代表/>内容下一级内容和再下一级内容;/>具体形式为:;其中,/>代表/>内容的关键词,/>,.../>代表/>内容下一级内容。
此外,根据关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本的步骤包括:根据关键词文本和图数据库确定关键词文本对应的数据库内的目标节点,目标节点的表达式为;对关键词文本、目标节点的内容和目标节点的下一阶关键词进行向量化操作,得到关键词向量和多个第二目标向量;将关键词向量分别与多个第二目标向量进行距离求解,并将距离关键词向量最近的第二目标向量对应的文本作为矢量文本。
通过对基坑描述文本进行初步的提取和转化,得到初步的检索关键词,再通过对关键词进行根据两种检索不同方式的从图数据库中进行检索,得到对应的内容,之后再对两者对应的内容进行整合,使得预测模型的输入数据为模型容易理解的数据,进而使得该方式可以实现对于人工描述的内容做到准确快速的理解,并进行快速准确的评估。
S04,根据提取文本和矢量文本通过预设整合算法确定整合数据,并根据整合数据通过预设预测模型确定评估结果和工单;
具体的,根据提取文本和矢量文本通过预设整合算法确定整合数据的步骤包括:获取提取文本和矢量文本并分别表示为:和,其中,/>表示矢量匹配大小值第i个内容,/>表示匹配最为近似,k代表匹配前k个最优值;根据提取文本和矢量文本通过预设匹配函数进行处理得到整合数据,表示形式为/>,/>;预设匹配函数的表达式为:
;其中/>表示为在/>上的投影,/>长度为一个句子为单位的向量,/>代表平行,/>代表不平行。
此外,示例而非限定的,在一些可选的实施例中,根据整合数据通过预设预测模型确定评估结果和工单的步骤包括:根据整合数据通过预测模型确定预测文本;根据预测文本和图数据库通过预设优化算法进行优化得到当前基坑工程的评估结果和对应的工单。
示例而非限定的,在一些可选的实施例中,具体的优化步骤为:提取基坑工程预测输出文字转化为n元组,具体拆分方法根据大模型输出句子,表示为N=[n1,n2,...,nn],其中ni表示输出的一个句子;关键词提取根据函数G(*)对N数据内容进行名词提取,最终得到n元组Z,表示为Z=G(N)=G([n1,n2,...,nn])=[(z1,z2,...),(z2,z3,...),...]。其中对于句子ni重复名称z进行剔除,句子与句子之间的重复名词z不予剔除,提取得到的每一个句子用si表示。将提取的n元组si与构建的工程案例知识图谱进一步数据匹配,其中工程案例知识图谱表示为Q(V,E,F),其中V表示各个节点基坑工程数据内容,E代表节点与节点之间的关系,F代表与节点V连接的节点。具体表示形式为Q(V,E,F)={V:E:{Fi}},其中Fi表示第i个与节点V连接的节点。对各节点进行数据匹配,具体的,n元组si各名词与各节点进行数据匹配,当si名词数量与节点内容匹配数大于si名词数量k%,对该节点内容进行保留,并用O表示,其表示为O=[o1,o2,...,on],其中oi表示第i个节点数据内容,数据表示为Q(V,E,F),k为用户自定义值,对于低于名词数量k% ,oi为空。匹配公式表示为:,其中表示si中名词数,/>表示对节点V进行名词提取,/>表示计算/>与si相同名词数。将N与O结合作为最终输出内容Output,表示为Output=N+O=[n1+o1,n2+o2,...,nn+on]。通过优化
算法依据图数据库对预测文本进行优化,进而降低了模型在处理语言数据是产生的错误或不可预测的输出,进入提高了模型评估的准确性。
综上,本发明上述实施例中的基坑工程评估方法,通过对包含历史案例、规范、资料等的参数数据进行处理得到格式一致的标记文本数据,再通过预设匹配算法对标记文本数据进行向量化处理,且与由基坑工程专有名称向量归类得到的预设向量群进行匹配,进而确定标记文本数据中各个内容对应的特征数据,即相应的关键词,通过关键词与标记文本数据的对应关系构建图数据库,使得由该图数据库训练得到的预测模型能够依据关键词进行快速预测,在进行评估时,通过对外界输入的基坑描述文本进行转换确定关键词文本,再分别通过提取检索方法和矢量检索方法依据关键词文本对图数据库进行检测,再对两者手段检测后得到的文本进行整合得到整合数据,通过这种方式使得人工输入的数据和文本描述经过初步关键词提取后,再分别通过两种检索方法于图数据库中进行检索后,整合两种检索数据的关键词,再用于预设预测模型进行评估并生成工单,使得人工输入的文本描述经过转换为符合预测模型输入的文本数据,进而使得该评估方法对于人工描述的内容能够做到准确快速的理解,使得评估的效率高且评估结果准确。此外,在进行文本转化时,是由关键词通过两种检索方式进行检索的,进一步加快了整体效率,且由两种不同的检索方式进行检索后,再整合确定最终输入预测模型的检索关键词,避免了信息遗漏的状况,提高了评估方法的准确性。
实施例二
请参阅图2,所示为本发明第二实施例当中提出的基坑工程评估系统的结构框图,该基坑工程评估系统200包括:标记文本确定模块21、图数据库确定模块22、文本提取模块23、以及评估模块24,其中:
标记文本确定模块21,用于获取参考数据,并通过预设处理方法对参考数据进行标记处理得到标记文本数据;
图数据库确定模块22,用于根据标记文本数据通过预设匹配算法进行特征提取确定特征数据,并根据特征数据和参考数据通过预设构建算法确定图数据库,图数据库作为测试集用于训练预设预测模型;
文本提取模块23,用于获取基坑描述文本,根据基坑描述文本通过预设提取转化算法确定关键词文本,并根据关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本;
评估模块24,用于根据提取文本和矢量文本通过预设整合算法确定整合数据,并根据整合数据通过预设预测模型确定评估结果和工单。
进一步的,在本发明其它实施例当中,标记文本确定模块21包括:
接收单元,用于接收外界输入的实时基坑工程数据和基坑状况文本;
基坑描述文本确定单元,用于根据实时基坑工程数据通过预设算法确定基坑状况数据,基坑状况数据和基坑状况文本构成基坑描述文本;
向量化单元,用于对标记文本进行向量化操作得到第一向量,并根据第一向量和多个预设向量群的重心通过第一预设公式确定目标向量群,预设向量群由向量化后的基坑工程专有名称归类得到,目标向量群为向量群的重心与第一向量距离最近的向量群;
特征数据确定单元,用于根据目标向量群和第一向量通过第一预设公式确定目标向量群内的第一目标向量,第一目标向量对应的文本数据为特征数据,第一目标向量为目标向量群中距离第一向量最近的向量;
第一预设公式为:
;
其中,代表向量中特定的向量希尔波特空间0点构成的直线,代表第一向量对应的值。
进一步的,图数据库确定模块22包括:
提取文本确定单元,用于根据关键从文本和图数据库通过预设规则对图数据库进行文本提取得到提取文本,预设规则包括:根据关键词文本确定目标节点,提取目标节点下与之连接的节点,且连接的节点符合目标节点的下一级内容;提取表达式为:;其中,/>代表对应第i个节点关键词,/>代表/>的内容,n代表关键词数,/>.../>代表/>内容下一级内容和再下一级内容;/>具体形式为:;其中,/>代表/>内容的关键词,/>,.../>代表/>内容下一级内容。
目标节点单元,用于根据关键词文本和图数据库确定关键词文本对应的数据库内的目标节点,目标节点的表达式为;
目标向量确定单元,用于对关键词文本、目标节点的内容和目标节点的下一阶关键词进行向量化操作,得到关键词向量和多个第二目标向量;
矢量文本确定单元,用于将关键词向量分别与多个第二目标向量进行距离求解,并将距离关键词向量最近的第二目标向量对应的文本作为矢量文本。
进一步的,评估模块24包括:
提取转化单元,用于获取提取文本和矢量文本并分别表示为:和/>,其中,/>表示矢量匹配大小值第i个内容,/>表示匹配最为近似,k代表匹配前k个最优值;
整合单元,用于根据提取文本和矢量文本通过预设匹配函数进行处理得到整合数据,表示形式为,/>;
预设匹配函数的表达式为:
;
其中表示为在/>上的投影,/>长度为一个句子为单位的向量,/>代表平行,代表不平行;
预测文本确定单元,用于根据整合数据通过预测模型确定预测文本;
优化单元,用于根据预测文本和图数据库通过预设优化算法进行优化得到当前基坑工程的评估结果和对应的工单。
上述各模块被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。
实施例三
本发明另一方面还提出一种电子设备,请参阅图3,所示为本发明第三实施例当中的电子设备的示意图,包括存储器20、处理器10以及存储在存储器上并可在处理器上运行的计算机程序30,处理器10执行所述计算机程序30时实现如上述的基坑工程评估方法。
其中,处理器10在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据,例如执行访问限制程序等。
其中,存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的硬盘。存储器20在另一些实施例中也可以是电子设备的外部存储装置,例如电子设备上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(FlashCard)等。进一步地,存储器20还可以既包括电子设备的内部存储单元也包括外部存储装置。存储器20不仅可以用于存储电子设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
需要指出的是,图3示出的结构并不构成对电子设备的限定,在其它实施例当中,该电子设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的基坑工程评估方法。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (7)
1.一种基坑工程评估方法,其特征在于,所述方法包括:
获取参考数据,并通过预设处理方法对所述参考数据进行标记处理得到标记文本数据;
根据所述标记文本数据通过预设匹配算法进行特征提取确定特征数据,并根据所述特征数据和所述参考数据通过预设构建算法确定图数据库,所述图数据库作为测试集用于训练预设预测模型;
获取基坑描述文本,根据所述基坑描述文本通过预设提取转化算法确定关键词文本,并根据所述关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本;
根据所述提取文本和矢量文本通过预设整合算法确定整合数据,并根据所述整合数据通过所述预设预测模型确定评估结果和工单;
所述根据所述标记文本数据通过预设匹配算法进行特征提取确定特征数据的步骤包括:
对所述标记文本进行向量化操作得到第一向量,并根据所述第一向量和多个预设向量群的重心通过第一预设公式确定目标向量群,所述预设向量群由向量化后的基坑工程专有名称归类得到,所述目标向量群为向量群的重心与所述第一向量距离最近的向量群;
根据所述目标向量群和所述第一向量通过所述第一预设公式确定所述目标向量群内的第一目标向量,所述第一目标向量对应的文本数据为所述特征数据,所述第一目标向量为所述目标向量群中距离所述第一向量最近的向量;
所述第一预设公式为:
;
其中,代表向量中特定的向量希尔波特空间0点构成的直线,代表第一向量对应的值;
所述根据所述关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本的步骤包括:
根据所述关键词文本和所述图数据库通过预设规则对所述图数据库进行文本提取得到所述提取文本,所述预设规则包括:根据所述关键词文本确定目标节点,提取目标节点下与之连接的节点,且连接的节点符合目标节点的下一级内容;
所述提取文本的提取表达式为:;
其中,代表对应第i个节点关键词,/>代表/>的内容,n代表关键词数,/>,...代表/>内容下一级内容和再下一级内容;
具体形式为:/>;
其中,代表/>内容的关键词,/>,.../>代表/>内容下一级内容;
所述根据所述关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本的步骤包括:
根据所述关键词文本和所述图数据库确定所述关键词文本对应的所述数据库内的目标节点,所述目标节点的表达式为;
对所述关键词文本、目标节点的内容和目标节点的下一阶关键词进行向量化操作,得到关键词向量和多个第二目标向量;
将关键词向量分别与多个所述第二目标向量进行距离求解,并将距离所述关键词向量最近的第二目标向量对应的文本作为矢量文本。
2.根据权利要求1所述的基坑工程评估方法,其特征在于,所述根据所述提取文本和矢量文本通过预设整合算法确定整合数据的步骤包括:
获取所述提取文本和矢量文本并分别表示为:
和/>,其中,/>表示矢量匹配大小值第i个内容,/>表示匹配最为近似,k代表匹配前k个最优值;
根据所述提取文本和矢量文本通过预设匹配函数进行处理得到所述整合数据,表示形式为,/>;
所述预设匹配函数的表达式为:
;
其中表示为在/>上的投影,/>长度为一个句子为单位的向量,/>代表平行,/>代表不平行。
3.根据权利要求1所述的基坑工程评估方法,其特征在于,所述根据所述整合数据通过所述预设预测模型确定评估结果和工单的步骤包括:
根据所述整合数据通过所述预测模型确定预测文本;
根据所述预测文本和所述图数据库通过预设优化算法进行优化得到当前基坑工程的评估结果和对应的工单。
4.根据权利要求1所述的基坑工程评估方法,其特征在于,所述获取基坑描述文本的步骤包括:
接收外界输入的实时基坑工程数据和基坑状况文本;
根据所述实时基坑工程数据通过预设算法确定基坑状况数据,所述基坑状况数据和所述基坑状况文本构成所述基坑描述文本。
5.一种基坑工程评估系统,其特征在于,用于实现如权利要求1至4中任意一项所述的基坑工程评估方法,所述系统包括:
标记文本确定模块,用于获取参考数据,并通过预设处理方法对所述参考数据进行标记处理得到标记文本数据;
图数据库确定模块,用于根据所述标记文本数据通过预设匹配算法进行特征提取确定特征数据,并根据所述特征数据和所述参考数据通过预设构建算法确定图数据库,所述图数据库作为测试集用于训练预设预测模型;
文本提取模块,用于获取基坑描述文本,根据所述基坑描述文本通过预设提取转化算法确定关键词文本,并根据所述关键词文本分别通过预设提取检索方法和预设矢量检索方法确定提取文本和矢量文本;
评估模块,用于根据所述提取文本和矢量文本通过预设整合算法确定整合数据,并根据所述整合数据通过所述预设预测模型确定评估结果和工单。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至4中任意一项所述的基坑工程评估方法的步骤。
7.一种电子设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-4任一所述的基坑工程评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410398287.1A CN117992620B (zh) | 2024-04-03 | 2024-04-03 | 一种基坑工程评估方法、系统、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410398287.1A CN117992620B (zh) | 2024-04-03 | 2024-04-03 | 一种基坑工程评估方法、系统、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117992620A CN117992620A (zh) | 2024-05-07 |
CN117992620B true CN117992620B (zh) | 2024-06-04 |
Family
ID=90891399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410398287.1A Active CN117992620B (zh) | 2024-04-03 | 2024-04-03 | 一种基坑工程评估方法、系统、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117992620B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110738987A (zh) * | 2019-10-18 | 2020-01-31 | 清华大学 | 一种基于统一表征的关键词检索方法 |
CN112989827A (zh) * | 2021-05-20 | 2021-06-18 | 江苏数兑科技有限公司 | 一种基于多源异构特征的文本数据集质量评估方法 |
CN113987134A (zh) * | 2021-11-15 | 2022-01-28 | 中国银行股份有限公司 | 工单检索方法、装置、电子设备及存储介质 |
CN115036022A (zh) * | 2022-06-17 | 2022-09-09 | 中国平安人寿保险股份有限公司 | 健康风险评估方法和评估系统、计算机设备、存储介质 |
CN116049368A (zh) * | 2023-02-10 | 2023-05-02 | 南京智云兴禾信息科技有限公司 | 一种基于法律文本矢量分析的内容抓取系统 |
CN117632654A (zh) * | 2023-12-05 | 2024-03-01 | 中国农业银行股份有限公司 | 一种运维风险等级评估方法、装置、电子设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8392418B2 (en) * | 2009-06-25 | 2013-03-05 | University Of Tennessee Research Foundation | Method and apparatus for predicting object properties and events using similarity-based information retrieval and model |
US20230334365A1 (en) * | 2022-04-13 | 2023-10-19 | ExlService Holdings, Inc. | Feature engineering and analytics systems and methods |
-
2024
- 2024-04-03 CN CN202410398287.1A patent/CN117992620B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110738987A (zh) * | 2019-10-18 | 2020-01-31 | 清华大学 | 一种基于统一表征的关键词检索方法 |
CN112989827A (zh) * | 2021-05-20 | 2021-06-18 | 江苏数兑科技有限公司 | 一种基于多源异构特征的文本数据集质量评估方法 |
CN113987134A (zh) * | 2021-11-15 | 2022-01-28 | 中国银行股份有限公司 | 工单检索方法、装置、电子设备及存储介质 |
CN115036022A (zh) * | 2022-06-17 | 2022-09-09 | 中国平安人寿保险股份有限公司 | 健康风险评估方法和评估系统、计算机设备、存储介质 |
CN116049368A (zh) * | 2023-02-10 | 2023-05-02 | 南京智云兴禾信息科技有限公司 | 一种基于法律文本矢量分析的内容抓取系统 |
CN117632654A (zh) * | 2023-12-05 | 2024-03-01 | 中国农业银行股份有限公司 | 一种运维风险等级评估方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
软件外包项目工作日志质量评估方法;姚承昊;杜晶;肖俊超;;计算机系统应用;20151015(10);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117992620A (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107798136B (zh) | 基于深度学习的实体关系抽取方法、装置及服务器 | |
CN111639171A (zh) | 一种知识图谱问答方法及装置 | |
CN110033018B (zh) | 图形相似度判断方法、装置及计算机可读存储介质 | |
CN112949476B (zh) | 基于图卷积神经网络的文本关系检测方法、装置及存储介质 | |
CN109492230B (zh) | 一种基于感兴趣文本域卷积神经网络提取保险合同关键信息的方法 | |
CN113326380B (zh) | 基于深度神经网络的设备量测数据处理方法、系统及终端 | |
US11966455B2 (en) | Text partitioning method, text classifying method, apparatus, device and storage medium | |
CN114691866A (zh) | 面向多级标签的文本分类方法、装置、设备及存储介质 | |
CN111680506A (zh) | 数据库表的外键映射方法、装置、电子设备和存储介质 | |
CN117992620B (zh) | 一种基坑工程评估方法、系统、存储介质及电子设备 | |
CN115373982A (zh) | 基于人工智能的测试报告分析方法、装置、设备及介质 | |
CN115240145A (zh) | 基于场景识别的违章作业行为检测方法及系统 | |
CN115203415A (zh) | 一种简历文档信息提取方法及相关装置 | |
CN112329669B (zh) | 一种电子档案管理方法 | |
CN114417860A (zh) | 一种信息检测方法、装置及设备 | |
CN114398482A (zh) | 一种词典构造方法、装置、电子设备及存储介质 | |
CN111027318B (zh) | 基于大数据的行业分类方法、装置、设备及存储介质 | |
Joy et al. | Automation of material takeoff using computer vision | |
CN112579841B (zh) | 一种多模态数据库建立方法、检索方法及系统 | |
CN110795941B (zh) | 一种基于外部知识的命名实体识别方法、系统及电子设备 | |
CN118132738B (zh) | 针对桥梁检评文本的抽取式问答方法 | |
EP4390858A1 (en) | Model training method and device, and target detection method and device | |
CN117634006B (zh) | 基于bim技术的套管预埋工程管理系统及方法 | |
CN118227850A (zh) | 一种试题查重方法及系统 | |
CN117057022A (zh) | 一种基于多源数据自动建模方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |