CN110196925A - 一种用于实验室工程设计的信息检索系统 - Google Patents

一种用于实验室工程设计的信息检索系统 Download PDF

Info

Publication number
CN110196925A
CN110196925A CN201910319562.5A CN201910319562A CN110196925A CN 110196925 A CN110196925 A CN 110196925A CN 201910319562 A CN201910319562 A CN 201910319562A CN 110196925 A CN110196925 A CN 110196925A
Authority
CN
China
Prior art keywords
engineering design
engineering
data
information
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910319562.5A
Other languages
English (en)
Other versions
CN110196925B (zh
Inventor
迟海鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dynaflow Experiment Technology Co Ltd
Original Assignee
Beijing Dynaflow Experiment Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dynaflow Experiment Technology Co Ltd filed Critical Beijing Dynaflow Experiment Technology Co Ltd
Priority to CN202010064787.3A priority Critical patent/CN111309856B/zh
Priority to CN201910319562.5A priority patent/CN110196925B/zh
Publication of CN110196925A publication Critical patent/CN110196925A/zh
Application granted granted Critical
Publication of CN110196925B publication Critical patent/CN110196925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用于实验室工程设计的信息检索系统,该信息检索系统将工程设计数据库中关于工程设计的工程进度以及其子工程设计的构成情况作为相应的检索数据处理入口,并根据检索数据处理入口对用户经检索输入界面输入相应检索条件后得到的初步检索结果进行相应的筛选处理、排序处理和归整处理,从而生成关于工程设计信息数据的关键摘要信息,最后再根据该关键摘要信息对该工程设计信息数据进行匹配处理,以得到相应的一个或者多个工程设计目标信息。

Description

一种用于实验室工程设计的信息检索系统
技术领域
本发明涉及工程设计信息处理的技术领域,特别涉及一种用于实验室工程设计的信息检索系统。
背景技术
随着社会经济的发展,不同类型的工程设计也相应开展启动,而这些工程设计通常包括高层建筑物的设计、电力工程的设计,水利工程的设计、市政公用工程项目的设计、道路与轨道工程的设计和网络通信工程的设计等,并且这些工程设计往往涉及的工程量都较大并且工程施工期也相应较长,为了及时掌握这些工程设计的开展施工进度,监视单位需要实时地获得这些工程设计的进度状态;但是,这些工程设计包括较多不同方面的分工程和牵涉不同的设计方和施工方,监视单元不可能对这些工程设计进行实时实地的一一核实确认以获得相应的进度状态监控结果;实际上,现有的监视单位采用采样抽取的形式对相应的工程设计进行随机的进度状态抽查,这种方式能够在一定程度上真实地反映相应工程设计的实际施工进度,但是这种方式并不能全面地反映工程设计在不同时期的总工程设计及其分工程设计的开展进度状况。此外,现有的采样抽取方式依然需要依靠人力在实际工程设计场景中进行抽查确认,这种依靠人力的抽查方式不仅耗时较长,并且其抽查确认的精度也有待商榷。
为了克服上述传统抽查方式的缺陷,在实验室工程设计信息处理领域中,已经针对实验室工程设计的特点开发出相应的工程设计数据库,该工程设计数据库是通过工程设计相关人员在施工过程中实时采集并传送至数据终端整合形成的,这样监视单位通过对该工程设计数据库进行相应的关键词检索就能直接获得所需的实验室工程设计实施进度结果。但是,该工程设计数据库所对应的检索方式通常是关于若干不同关键词入口来实现的,这种检索方式虽然能够便于用户进行直观检索,但是其检索效率和检索结果精度却并不高,这对于涉及体量较大和分工程设计划分较细的实验室工程设计而言并不能快速有效地得出相应的检索结果,此外,这种检索方式并不能进一步地对用户关注的检索结果进行不同相关程度的排序,可见现有的关于工程设计数据库的检索方式并不能满足对检索过程和检索结果高效性和准确性的要求。
发明内容
在工程设计信息处理方面,特别是关于实验室工程设计的数据信息检索中,现有的信息检索方式都只是基于若干预先设定的关键词入口来进行所需工程设计信息数据的检索,虽然这种检索方式能够便于不同用户快速地确定检索策略,但是这种检索方式对于包含大量不同实验室工程设计信息的工程设计数据库并不能有效地和精确地获取所需检索结果,也就是说这种检索方式只能根据用选择的关键词确定可能的若干检索结果,而这若干检索结果的呈现方式只是简单的罗列,其并不能进一步根据这若干检索结果与用户真实需求之间的相关程度进行排序,这样用户还需要额外花费较长的时间来对上述罗列的若干检索结果进行逐一浏览筛选,以实现对无用的干扰信息进行剔除,这显然与工程设计信息处理对处理结果的时效性和准确性要求相悖,同时也不能满足用户对于检索方式和检索结果简便高效和准确的要求。
针对现有技术存在的缺陷,本发明提供一种用于实验室工程设计的信息检索系统,该用于实验室工程设计的信息检索系统是将工程设计数据库中关于工程设计的工程进度以及其子工程设计的构成情况作为相应的检索数据处理入口,并根据检索数据处理入口对用户经检索输入界面输入相应检索条件后得到的初步检索结果进行相应的筛选处理、排序处理和归整处理,从而生成关于工程设计信息数据的关键摘要信息,最后再根据该关键摘要信息对该工程设计信息数据进行匹配处理,以得到相应的一个或者多个工程设计目标信息,可见经过该信息检索系统得到的一个或者多个工程设计目标信息是与工程设计的工程进度以及其子工程设计的构成情况之间存在密切联系的,从而能够保证该信息检索系统检索的有效性和准确性。
本发明提供一种用于实验室工程设计的信息检索系统,所述信息检索系统包括工程设计信息数据输入模块、工程设计信息数据整理模块、工程设计信息数据匹配模块和工程设计信息检索反馈模块,其特征在于:
所述工程设计信息数据输入模块用于提供关于不同类型的工程设计信息数据的输入界面,并将所述工程设计信息数据传送至所述工程设计信息数据整理模块;
所述工程设计信息数据整理模块用于将接收到的所述工程设计信息数据进行筛选处理、排序处理和归整处理后,生成关于所述工程设计信息数据的关键摘要信息,并将所述关键摘要信息传送至所述工程设计信息数据匹配模块;
所述工程设计信息数据匹配模块用于将接收到的所述关键摘要信息与工程设计数据库中的工程设计数据进行匹配处理,以获得相应的一个或者多个工程设计目标信息;
所述工程设计信息检索反馈模块用于提供关于所述一个或者多个工程设计目标信息的推送或者查看;
进一步,所述工程设计信息数据输入模块包括数据输入界面子模块、数据属性判断子模块和数据准入确定子模块;其中,所述数据输入子模块用于提供所述输入界面,所述输入界面包括若干模式化的数据输入入口和/或若干数据编辑上传入口;所述数据属性判断子模块用于判断来自所述数据输入子模块输入的工程设计信息数据是否满足预设属性条件;所述数据准入确定子模块用于根据所述数据属性判断子模块关于所述预设属性条件的判断结果、生成关于对应工程设计信息数据能否传送至所述工程设计信息数据整理模块的控制指令;
进一步,所述数据属性判断子模块对所述工程设计信息数据进行关于是否满足预设属性条件的判断过程具体包括,获取所述工程设计信息数据对应的工程类型信息、工程启动时间信息或者工程所处地理位置信息中的至少一者,并判断所述工程类型信息、工程启动时间信息或者工程所处地理位置信息是否匹配于预设工程类型、预设工程启动时间区间或者预设地理区域范围,若是,则所述数据属性判断子模块向所述数据准入确定子模块发送第一判断信号,若否,则所述数据属性判断子模块向所述数据准入确定子模块发送第二判断信号;
进一步,所述数据准入确定子模块生成关于对应工程设计信息数据能否传送至所述工程设计信息数据整理模块的控制指令具体包括,若所述数据准入确定子模块接收到所述第一判断信号,所述数据准入确定子模块生成第一控制指令,以指示将当前对应的工程设计信息数据传送至所述工程设计信息数据整理模块;若所述数据准入确定子模块接收到所述第二判断信号,所述数据准入确定子模块生成第二控制指令,以指示将当前对应的工程设计信息数据进行屏蔽及不传送至所述工程设计信息数据整理模块;
进一步,所述工程设计信息数据包括关于不同类型工程对应的工程进度数据;其中,所述工程设计信息数据输入模块用于将输入的所述工程设计信息数据变换成相应的工程占比矩阵F和工程进度矩阵B,所述工程占比矩阵F是以工程设计中各个子工程设计占工程成设计对应的比例值作为矩阵元素的行向量矩阵,所述工程进度矩阵B是以工程设计中各个子工程设计各自对应的工程进度百分比作为矩阵元素的列向量矩阵,具体为F=(f1f2…fn),其中f1、f2、…、fn为各个子工程设计占工程成设计对应的比例值,b1、b2、…、bn为各个子工程设计各自对应的工程进度百分比,n为工程设计包含的子工程设计的总数;
进一步,所述工程设计信息数据整理模块还包括工程设计进度计算子模块,所述工程设计进度计算子模块用于根据所述工程占比矩阵F和所述工程进度矩阵B计算对应工程设计的整体进度值Z;其中,所述工程设计进度基端子模块计算所述整体进度值Z的具体过程为
进一步,所述工程设计信息数据整理模块包括用于执行所述筛选处理的筛选子模块、用于执行所述排序处理的排序子模块、以及用于执行所述归整处理的归整子模块;
进一步,所述筛选子模块执行所述筛选处理的过程具体为首先在所述工程设计数据库中筛选出与所述输入的工程设计的整体及其子工程设计构成情况两者均相同的若干第一筛选工程设计,并计算所述若干第一筛选工程设计中每一个对应的第一筛选评分值S1,其中,所述筛选评分值S1的计算公式为 其中,β为工程设计的整体进度值对工程设计整体的影响因子,Zi为所述工程设计数据库中第i个工程设计的整体进度值,α为工程设计中各个子工程设计对总工程设计整体的影响因子,Fi为所述工程设计数据库中第i个工程设计对应的工程占比矩阵,Bi为所述工程设计数据库中第i个工程设计对应的工程进度矩阵;
进一步,所述排序子模块执行所述排序处理的过程具体为所述排序子模块根据所述若干第一筛选工程设计中每一个对应的第一筛选评分值S,对所述若干第一筛选工程设计中每一个进行升序排列处理或者降序排列处理,从而得到关于所述若干第一筛选工程设计的第一排列顺序;随后,所述筛选子模块再从所述工程设计数据库中筛选出与所述输入的工程设计在整体上相同但子工程设计构成情况不同的若干第二筛选工程设计,并计算出所述若干第二筛选工程设计中每一个对应的第二筛选评分值S2,所述排序子模块还根据所述第二筛选评分值S2,对所述若干第二筛选工程设计中每一个进行升序排列处理或者降序排列处理,从而得到关于所述若干第二筛选工程设计的第二排列顺序;所述归整子模块根据所述第一排列顺序和所述第二排列顺序对所述若干第一筛选工程设计和所述若干第二筛选工程设计共同组成的工程设计集合进行所述归整处理;
进一步,所述工程设计信息数据匹配模块进行所述匹配处理的过程具体为所述工程设计信息数据匹配模块从所述关键摘要信息中提取关于其对应的工程设计的进度信息和/或子工程设计构造信息,在根据提取的所述进度信息和/或子工程设计构造信息计算所述对应的工程设计与所述工程设计数据库中不同工程设计之间匹配值,最后根据所述匹配值确定所述一个或者多个工程设计目标信息;
或者,
所述工程设计信息数据匹配模块进行所述匹配处理的过程具体包括如下步骤S1-S4:
S1、将接收到的所述关键摘要信息进行文本分词处理,其中,所述文本分词处理包括下面的步骤S101-S104,
S101、将所述关键摘要信息的第一个字标注为B;
S102、提取所述标注为B对应的后一个字,并将其标注为C,同时提取所述关键摘要信息中被标注为C对应的字中所有前一个字,经去重后组合成集合D,利用下面公式(1),判断被标注为B的字是否为词语的结束字段
在上述公式(1)中,P1,P2为中间函数,length(D)为集合D中间的字的个数,P(B)为出现标注为B所对应的字的概率,P(C)为出现标注为C所对应的字的概率,length(all)为关键摘要信息的总长度,P(BC)为标识为B所对应的字和标注为C所对应的字同时出现的概率,并且若B=B,则保持标注B不变,若B=E,则将所述标注B修改为标注E;
S103、判断所述标注C是否为关键摘要信息的最后一个字,若是,则将所述标注C修改为标注E,并结束所述文本分词处理,若否,则将所述标注B修改为所述标注C,并重复步骤S102和S103;
S104、在所述关键摘要信息的开始阶段和所有被标注为E的对应字段后面增加切割线,则任意两个切割线之间为一个词组,提取所有词组并剔除重复值,形成相应的词组集合,则将所述词组集合确定为所述文本分词处理的处理结果;
S2、设定所述工程设计数据库包含P条工程设计数据,将每条工程设计数据分别作为一条信息,通过所述文本分词处理形成相应的P个词组集合;
S3、利用下面公式(2),从所述工程设计数据库中提取待确定匹配数据
在上述公式(2)中,Qi为工程设计数据库中第i个工程设计数据的入选度,A为所述关键摘要信息经所述文本分词处理后得到的词组集合,Bi为所述第i个工程设计数据经所述文本分词处理后得到的词组结合,A∩Bi为A与Bi对应交集中词组的个数,A∪Bi为A与Bi对应并集中词组的个数,其中,i=1、2、…、P,当Qi大于0.5,则将当前Qi对应的工程设计数据库中的工程设计数据设定为待确定匹配数据,并将所有待确定匹配数据组成待确定匹配数据库,其中,所述待确定匹配数据库包括J条数据;
S4、利用下面公式(3),从所述待确定匹配数据库中选定最终确定匹配数据
在上述公式(3)中,ρt为待确定匹配数据库中第i个工程设计数据的匹配度,Ct为待确定匹配数据库中第t个工程设计数据经所述文本分词处理后的词组集合,A∩Ct为集合A和集合Ct对应交集中词组的个数,S(A∩Ct)i为集合A和集合Ct对应交集中第i个词组在所述待确定匹配数据的第t个工程设计数据中出现的次数,S(Ct)为所述待确定匹配数据库中第t个工程设计数据经所述文本分词处理后、在所述步骤S104中没有剔除重复词组时对应的词组总个数,其中,i=1、2、…、J,当ρt大于0.8时,将当前ρt对应的待确定匹配数据库中的工程设计数据设定为与所述关键摘要信息相匹配的数据,从而获得所需的工程设计目标信息。
相比于现有技术,本发明的用于实验室工程设计的信息检索系统通过将工程设计数据库中关于工程设计的工程进度以及其子工程设计的构成情况作为相应的检索数据处理入口,并根据检索数据处理入口对用户经检索输入界面输入相应检索条件后得到的初步检索结果进行相应的筛选处理、排序处理和归整处理,从而生成关于工程设计信息数据的关键摘要信息,最后再根据该关键摘要信息对该工程设计信息数据进行匹配处理,以得到相应的一个或者多个工程设计目标信息。该用于实验室工程设计的信息检索系统能够使得用户在关于工程设计的工程进度以及其子工程设计的构成情况的基础上,进行相应的信息数据检索,这样能够保证该信息检索系统执行检索操作的有效性和准确性,并且还能够使得该信息检索系统的检索结果能够按照用户的需求进行呈现,从而极大地提高信息检索系统的结果精准度和检索时效性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种用于实验室工程设计的信息检索系统的结构示意图。
图2为本发明提供的一种用于实验室工程设计的信息检索系统中工程设计信息数据输入模块的结构示意图。
图3为本发明提供的一种用于实验室工程设计的信息检索系统中工程设计信息数据整理模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,为本发明实施例提供的一种用于实验室工程设计的信息检索系统的结构示意图。该用于实验室工程设计的信息检索系统优选是在实验室工程设计过程中用于为实验室阶段的工程设计提供相应的工程相关信息数据的检索,实验室设计人员通过该信息检索系统能够实时地准确地检索获取所需要的工程设计信息数据。
优选地,该信息检索系统可包括但不限于是工程设计信息数据输入模块、工程设计信息数据整理模块、工程设计信息数据匹配模块和工程设计信息检索反馈模块;其中,该工程设计信息数据输入模块优选用于提供关于不同类型的工程设计信息数据的输入界面,并将工程设计信息数据传送至工程设计信息数据整理模块;该工程设计信息数据整理模块优选用于将接收到的工程设计信息数据进行筛选处理、排序处理和归整处理后,生成关于工程设计信息数据的关键摘要信息,并将关键摘要信息传送至工程设计信息数据匹配模块;该工程设计信息数据匹配模块优选用于将接收到的关键摘要信息与工程设计数据库中的工程设计数据进行匹配处理,以获得相应的一个或者多个工程设计目标信息;该工程设计信息检索反馈模块优选用于提供关于一个或者多个工程设计目标信息的推送或者查看。优选地,该信息检索系统可应用于个人计算机、手机或者平板电脑等便携式移动终端上;优选地,该信息检索系统可集成为具有APP等形式的应用程序,这样便于用户在任何地点和任何时间都能够进行工程设计相关信息数据的检索和查看。
优选地,该工程设计信息数据输入模块可包括但不限于是数据输入界面子模块、数据属性判断子模块和数据准入确定子模块。其中,该数据输入子模块可优选用于提供该输入界面,该输入界面包括若干模式化的数据输入入口和/或若干数据编辑上传入口;该数据属性判断子模块可优选用于判断来自该数据输入子模块输入的工程设计信息数据是否满足预设属性条件;该数据准入确定子模块可用于根据该数据属性判断子模块关于该预设属性条件的判断结果、生成关于对应工程设计信息数据能否传送至该工程设计信息数据整理模块的控制指令。
优选地,该数据属性判断子模块对该工程设计信息数据进行关于是否满足预设属性条件的判断过程可具体包括:获取该工程设计信息数据对应的工程类型信息、工程启动时间信息或者工程所处地理位置信息中的至少一者,并判断该工程类型信息、工程启动时间信息或者工程所处地理位置信息是否匹配于预设工程类型、预设工程启动时间区间或者预设地理区域范围,若是,则该数据属性判断子模块向该数据准入确定子模块发送第一判断信号,若否,则该数据属性判断子模块向该数据准入确定子模块发送第二判断信号。
优选地,该数据准入确定子模块生成关于对应工程设计信息数据能否传送至该工程设计信息数据整理模块的控制指令可具体包括:若该数据准入确定子模块接收到该第一判断信号,该数据准入确定子模块生成第一控制指令,以指示将当前对应的工程设计信息数据传送至该工程设计信息数据整理模块;若该数据准入确定子模块接收到该第二判断信号,该数据准入确定子模块生成第二控制指令,以指示将当前对应的工程设计信息数据进行屏蔽及不传送至该工程设计信息数据整理模块。
优选地,该工程设计信息数据可包括但不限于是关于不同类型工程对应的工程进度数据。相应地,该工程设计信息数据输入模块用于将输入的该工程设计信息数据变换成相应的工程占比矩阵F和工程进度矩阵B,该工程占比矩阵F是以工程设计中各个子工程设计占工程成设计对应的比例值作为矩阵元素的行向量矩阵,该工程进度矩阵B是以工程设计中各个子工程设计各自对应的工程进度百分比作为矩阵元素的列向量矩阵,具体为F=(f1f2…fn),其中f1、f2、…、fn为各个子工程设计占工程成设计对应的比例值,b1、b2、…、bn为各个子工程设计各自对应的工程进度百分比,n为工程设计包含的子工程设计的总数。
优选地,该工程设计信息数据整理模块还可包括工程设计进度计算子模块;相应地,该工程设计进度计算子模块可优选用于根据该工程占比矩阵F和该工程进度矩阵B计算对应工程设计的整体进度值Z;其中,该工程设计进度基端子模块计算该整体进度值Z的具体过程可为
优选地,该工程设计信息数据整理模块可包括但不限于是用于执行该筛选处理的筛选子模块、用于执行该排序处理的排序子模块、以及用于执行该归整处理的归整子模块。
优选地,该筛选子模块执行该筛选处理的过程具体可为:首先在该工程设计数据库中筛选出与该输入的工程设计的整体及其子工程设计构成情况两者均相同的若干第一筛选工程设计,并计算该若干第一筛选工程设计中每一个对应的第一筛选评分值S1,其中,该筛选评分值S1的计算公式可为
对应地,β为工程设计的整体进度值对工程设计整体的影响因子,Zi为该工程设计数据库中第i个工程设计的整体进度值,α为工程设计中各个子工程设计对总工程设计整体的影响因子,Fi为该工程设计数据库中第i个工程设计对应的工程占比矩阵,Bi为该工程设计数据库中第i个工程设计对应的工程进度矩阵。
优选地,该排序子模块执行所述排序处理的过程具体可为:该排序子模块根据该若干第一筛选工程设计中每一个对应的第一筛选评分值S,对该若干第一筛选工程设计中每一个进行升序排列处理或者降序排列处理,从而得到关于该若干第一筛选工程设计的第一排列顺序;随后,该筛选子模块再从该工程设计数据库中筛选出与该输入的工程设计在整体上相同但子工程设计构成情况不同的若干第二筛选工程设计,并计算出该若干第二筛选工程设计中每一个对应的第二筛选评分值S2;另外,该排序子模块还可根据该第二筛选评分值S2,对该若干第二筛选工程设计中每一个进行升序排列处理或者降序排列处理,从而得到关于该若干第二筛选工程设计的第二排列顺序;该归整子模块可根据该第一排列顺序和该第二排列顺序对该若干第一筛选工程设计和该若干第二筛选工程设计共同组成的工程设计集合进行该归整处理。
优选地,该工程设计信息数据匹配模块进行该匹配处理的过程具体为该工程设计信息数据匹配模块从该关键摘要信息中提取关于其对应的工程设计的进度信息和/或子工程设计构造信息,在根据提取的该进度信息和/或子工程设计构造信息计算该对应的工程设计与该工程设计数据库中不同工程设计之间匹配值,最后根据该匹配值确定该一个或者多个工程设计目标信息;
优选地,该工程设计信息数据匹配模块进行该匹配处理的过程具体包括如下步骤S1-S4:
S1、将接收到的该关键摘要信息进行文本分词处理,其中,该文本分词处理包括下面的步骤S101-S104,
S101、将该关键摘要信息的第一个字标注为B;
S102、提取该标注为B对应的后一个字,并将其标注为C,同时提取该关键摘要信息中被标注为C对应的字中所有前一个字,经去重后组合成集合D,利用下面公式(1),判断被标注为B的字是否为词语的结束字段
在上述公式(1)中,P1,P2为中间函数,length(D)为集合D中间的字的个数,P(B)为出现标注为B所对应的字的概率,P(C)为出现标注为C所对应的字的概率,length(all)为关键摘要信息的总长度,P(BC)为标识为B所对应的字和标注为C所对应的字同时出现的概率,并且若B=B,则保持标注B不变,若B=E,则将该标注B修改为标注E;
利用上述公式(1),可以在不借助额外的样本数据库的情况下,将该关键摘要信息进行文本分词处理,且在该文本分词处理的过程中,在考虑第j个字的时候仅仅需要判断第j+1个字的情况,从而使判断计算量大幅度减小;
S103、判断该标注C是否为关键摘要信息的最后一个字,若是,则将该标注C修改为标注E,并结束该文本分词处理,若否,则将该标注B修改为该标注C,并重复步骤S102和S103;
S104、在该关键摘要信息的开始阶段和所有被标注为E的对应字段后面增加切割线,则任意两个切割线之间为一个词组,提取所有词组并剔除重复值,形成相应的词组集合,则将该词组集合确定为该文本分词处理的处理结果;
S2、设定该工程设计数据库包含P条工程设计数据,将每条工程设计数据分别作为一条信息,通过该文本分词处理形成相应的P个词组集合;
S3、利用下面公式(2),从该工程设计数据库中提取待确定匹配数据
在上述公式(2)中,Qi为工程设计数据库中第i个工程设计数据的入选度,A为该关键摘要信息经该文本分词处理后得到的词组集合,Bi为该第i个工程设计数据经该文本分词处理后得到的词组结合,A∩Bi为A与Bi对应交集中词组的个数,A∪Bi为A与Bi对应并集中词组的个数,其中,i=1、2、…、P,当Qi大于0.5,则将当前Qi对应的工程设计数据库中的工程设计数据设定为待确定匹配数据,并将所有待确定匹配数据组成待确定匹配数据库,其中,该待确定匹配数据库包括J条数据;
利用上述公式(2)可以通过简单的统计得出工程设计数据库中每个工程设计数据能够入选待确定匹配数据库的匹配度;
S4、利用下面公式(3),从该待确定匹配数据库中选定最终确定匹配数据
在上述公式(3)中,ρt为待确定匹配数据库中第i个工程设计数据的匹配度,Ct为待确定匹配数据库中第t个工程设计数据经该文本分词处理后的词组集合,A∩Ct为集合A和集合Ct对应交集中词组的个数,S(A∩Ct)i为集合A和集合Ct对应交集中第i个词组在该待确定匹配数据的第t个工程设计数据中出现的次数,S(Ct)为该待确定匹配数据库中第t个工程设计数据经该文本分词处理后、在该步骤S104中没有剔除重复词组时对应的词组总个数,其中,i=1、2、…、J,当ρt大于0.8时,将当前ρt对应的待确定匹配数据库中的工程设计数据设定为与该关键摘要信息相匹配的数据,从而获得所需的工程设计目标信息;
利用上述公式(3),可以利用简单的概率从待确定匹配数据库中选取出与关键摘要信息匹配成功的数据,从而获得相应的工程设计目标信息;
可见,利用上述方法,可以将关键摘要信息与工程设计数据库中的工程设计数据进行匹配处理时的复杂的文本匹配问题变为简单的概率匹配问题,同时在匹配时通过文本分词技术和获取待定数据库分步进行匹配,使得提高了匹配效果的同时还简化了匹配方法,简化了计算步骤,提高了匹配的效率。
从上述实施例可以看出,该用于实验室工程设计的信息检索系统通过将工程设计数据库中关于工程设计的工程进度以及其子工程设计的构成情况作为相应的检索数据处理入口,并根据检索数据处理入口对用户经检索输入界面输入相应检索条件后得到的初步检索结果进行相应的筛选处理、排序处理和归整处理,从而生成关于工程设计信息数据的关键摘要信息,最后再根据该关键摘要信息对该工程设计信息数据进行匹配处理,以得到相应的一个或者多个工程设计目标信息。可见,该用于实验室工程设计的信息检索系统能够使得用户在关于工程设计的工程进度以及其子工程设计的构成情况的基础上,进行相应的信息数据检索,这样能够保证该信息检索系统执行检索操作的有效性和准确性,并且还能够使得该信息检索系统的检索结果能够按照用户的需求进行呈现,从而极大地提高信息检索系统的结果精准度和检索时效性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种用于实验室工程设计的信息检索系统,所述信息检索系统包括工程设计信息数据输入模块、工程设计信息数据整理模块、工程设计信息数据匹配模块和工程设计信息检索反馈模块,其特征在于:
所述工程设计信息数据输入模块用于提供关于不同类型的工程设计信息数据的输入界面,并将所述工程设计信息数据传送至所述工程设计信息数据整理模块;
所述工程设计信息数据整理模块用于将接收到的所述工程设计信息数据进行筛选处理、排序处理和归整处理后,生成关于所述工程设计信息数据的关键摘要信息,并将所述关键摘要信息传送至所述工程设计信息数据匹配模块;
所述工程设计信息数据匹配模块用于将接收到的所述关键摘要信息与工程设计数据库中的工程设计数据进行匹配处理,以获得相应的一个或者多个工程设计目标信息;
所述工程设计信息检索反馈模块用于提供关于所述一个或者多个工程设计目标信息的推送或者查看。
2.如权利要求1所述的用于实验室工程设计的信息检索系统,其特征在于:所述工程设计信息数据输入模块包括数据输入界面子模块、数据属性判断子模块和数据准入确定子模块;其中,所述数据输入子模块用于提供所述输入界面,所述输入界面包括若干模式化的数据输入入口和/或若干数据编辑上传入口;所述数据属性判断子模块用于判断来自所述数据输入子模块输入的工程设计信息数据是否满足预设属性条件;所述数据准入确定子模块用于根据所述数据属性判断子模块关于所述预设属性条件的判断结果、生成关于对应工程设计信息数据能否传送至所述工程设计信息数据整理模块的控制指令。
3.如权利要求2所述的用于实验室工程设计的信息检索系统,其特征在于:所述数据属性判断子模块对所述工程设计信息数据进行关于是否满足预设属性条件的判断过程具体包括,获取所述工程设计信息数据对应的工程类型信息、工程启动时间信息或者工程所处地理位置信息中的至少一者,并判断所述工程类型信息、工程启动时间信息或者工程所处地理位置信息是否匹配于预设工程类型、预设工程启动时间区间或者预设地理区域范围,若是,则所述数据属性判断子模块向所述数据准入确定子模块发送第一判断信号,若否,则所述数据属性判断子模块向所述数据准入确定子模块发送第二判断信号。
4.如权利要求3所述的用于实验室工程设计的信息检索系统,其特征在于:所述数据准入确定子模块生成关于对应工程设计信息数据能否传送至所述工程设计信息数据整理模块的控制指令具体包括,若所述数据准入确定子模块接收到所述第一判断信号,所述数据准入确定子模块生成第一控制指令,以指示将当前对应的工程设计信息数据传送至所述工程设计信息数据整理模块;若所述数据准入确定子模块接收到所述第二判断信号,所述数据准入确定子模块生成第二控制指令,以指示将当前对应的工程设计信息数据进行屏蔽及不传送至所述工程设计信息数据整理模块。
5.如权利要求1所述的用于实验室工程设计的信息检索系统,其特征在于:所述工程设计信息数据包括关于不同类型工程对应的工程进度数据;其中,所述工程设计信息数据输入模块用于将输入的所述工程设计信息数据变换成相应的工程占比矩阵F和工程进度矩阵B,所述工程占比矩阵F是以工程设计中各个子工程设计占工程成设计对应的比例值作为矩阵元素的行向量矩阵,所述工程进度矩阵B是以工程设计中各个子工程设计各自对应的工程进度百分比作为矩阵元素的列向量矩阵,具体为其中f1、f2、…、fn为各个子工程设计占工程成设计对应的比例值,b1、b2、…、bn为各个子工程设计各自对应的工程进度百分比,n为工程设计包含的子工程设计的总数。
6.如权利要求5所述的用于实验室工程设计的信息检索系统,其特征在于:所述工程设计信息数据整理模块还包括工程设计进度计算子模块,所述工程设计进度计算子模块用于根据所述工程占比矩阵F和所述工程进度矩阵B计算对应工程设计的整体进度值Z;其中,所述工程设计进度基端子模块计算所述整体进度值Z的具体过程为
7.如权利要求6所述的用于实验室工程设计的信息检索系统,其特征在于:所述工程设计信息数据整理模块包括用于执行所述筛选处理的筛选子模块、用于执行所述排序处理的排序子模块、以及用于执行所述归整处理的归整子模块。
8.如权利要求7所述的用于实验室工程设计的信息检索系统,其特征在于:所述筛选子模块执行所述筛选处理的过程具体为首先在所述工程设计数据库中筛选出与所述输入的工程设计的整体及其子工程设计构成情况两者均相同的若干第一筛选工程设计,并计算所述若干第一筛选工程设计中每一个对应的第一筛选评分值S1,其中,所述筛选评分值S1的计算公式为其中,β为工程设计的整体进度值对工程设计整体的影响因子,Zi为所述工程设计数据库中第i个工程设计的整体进度值,α为工程设计中各个子工程设计对总工程设计整体的影响因子,Fi为所述工程设计数据库中第i个工程设计对应的工程占比矩阵,Bi为所述工程设计数据库中第i个工程设计对应的工程进度矩阵。
9.如权利要求8所述的用于实验室工程设计的信息检索系统,其特征在于:所述排序子模块执行所述排序处理的过程具体为所述排序子模块根据所述若干第一筛选工程设计中每一个对应的第一筛选评分值S,对所述若干第一筛选工程设计中每一个进行升序排列处理或者降序排列处理,从而得到关于所述若干第一筛选工程设计的第一排列顺序;随后,所述筛选子模块再从所述工程设计数据库中筛选出与所述输入的工程设计在整体上相同但子工程设计构成情况不同的若干第二筛选工程设计,并计算出所述若干第二筛选工程设计中每一个对应的第二筛选评分值S2,所述排序子模块还根据所述第二筛选评分值S2,对所述若干第二筛选工程设计中每一个进行升序排列处理或者降序排列处理,从而得到关于所述若干第二筛选工程设计的第二排列顺序;所述归整子模块根据所述第一排列顺序和所述第二排列顺序对所述若干第一筛选工程设计和所述若干第二筛选工程设计共同组成的工程设计集合进行所述归整处理。
10.如权利要求1所述的用于实验室工程设计的信息检索系统,其特征在于:所述工程设计信息数据匹配模块进行所述匹配处理的过程具体为所述工程设计信息数据匹配模块从所述关键摘要信息中提取关于其对应的工程设计的进度信息和/或子工程设计构造信息,在根据提取的所述进度信息和/或子工程设计构造信息计算所述对应的工程设计与所述工程设计数据库中不同工程设计之间匹配值,最后根据所述匹配值确定所述一个或者多个工程设计目标信息;
或者,
所述工程设计信息数据匹配模块进行所述匹配处理的过程具体包括如下步骤S1-S4:
S1、将接收到的所述关键摘要信息进行文本分词处理,其中,所述文本分词处理包括下面的步骤S101-S104,
S101、将所述关键摘要信息的第一个字标注为B;
S102、提取所述标注为B对应的后一个字,并将其标注为C,同时提取所述关键摘要信息中被标注为C对应的字中所有前一个字,经去重后组合成集合D,利用下面公式(1),判断被标注为B的字是否为词语的结束字段
在上述公式(1)中,P1,P2为中间函数,length(D)为集合D中间的字的个数,P(B)为出现标注为B所对应的字的概率,P(C)为出现标注为C所对应的字的概率,length(all)为关键摘要信息的总长度,P(BC)为标识为B所对应的字和标注为C所对应的字同时出现的概率,并且若B=B,则保持标注B不变,若B=E,则将所述标注B修改为标注E;
S103、判断所述标注C是否为关键摘要信息的最后一个字,若是,则将所述标注C修改为标注E,并结束所述文本分词处理,若否,则将所述标注B修改为所述标注C,并重复步骤S102和S103;
S104、在所述关键摘要信息的开始阶段和所有被标注为E的对应字段后面增加切割线,则任意两个切割线之间为一个词组,提取所有词组并剔除重复值,形成相应的词组集合,则将所述词组集合确定为所述文本分词处理的处理结果;
S2、设定所述工程设计数据库包含P条工程设计数据,将每条工程设计数据分别作为一条信息,通过所述文本分词处理形成相应的P个词组集合;
S3、利用下面公式(2),从所述工程设计数据库中提取待确定匹配数据
在上述公式(2)中,Qi为工程设计数据库中第i个工程设计数据的入选度,A为所述关键摘要信息经所述文本分词处理后得到的词组集合,Bi为所述第i个工程设计数据经所述文本分词处理后得到的词组结合,A∩Bi为A与Bi对应交集中词组的个数,A∪Bi为A与Bi对应并集中词组的个数,其中,i=1、2、…、P,当Qi大于0.5,则将当前Qi对应的工程设计数据库中的工程设计数据设定为待确定匹配数据,并将所有待确定匹配数据组成待确定匹配数据库,其中,所述待确定匹配数据库包括J条数据;
S4、利用下面公式(3),从所述待确定匹配数据库中选定最终确定匹配数据
在上述公式(3)中,ρt为待确定匹配数据库中第i个工程设计数据的匹配度,Ct为待确定匹配数据库中第t个工程设计数据经所述文本分词处理后的词组集合,A∩Ct为集合A和集合Ct对应交集中词组的个数,S(A∩Ct)i为集合A和集合Ct对应交集中第i个词组在所述待确定匹配数据的第t个工程设计数据中出现的次数,S(Ct)为所述待确定匹配数据库中第t个工程设计数据经所述文本分词处理后、在所述步骤S104中没有剔除重复词组时对应的词组总个数,其中,i=1、2、…、J,当ρt大于0.8时,将当前ρt对应的待确定匹配数据库中的工程设计数据设定为与所述关键摘要信息相匹配的数据,从而获得所需的工程设计目标信息。
CN201910319562.5A 2019-04-19 2019-04-19 一种用于实验室工程设计的信息检索系统 Active CN110196925B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010064787.3A CN111309856B (zh) 2019-04-19 2019-04-19 一种用于实验室工程设计的信息检索系统
CN201910319562.5A CN110196925B (zh) 2019-04-19 2019-04-19 一种用于实验室工程设计的信息检索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910319562.5A CN110196925B (zh) 2019-04-19 2019-04-19 一种用于实验室工程设计的信息检索系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202010064787.3A Division CN111309856B (zh) 2019-04-19 2019-04-19 一种用于实验室工程设计的信息检索系统

Publications (2)

Publication Number Publication Date
CN110196925A true CN110196925A (zh) 2019-09-03
CN110196925B CN110196925B (zh) 2020-03-20

Family

ID=67752144

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910319562.5A Active CN110196925B (zh) 2019-04-19 2019-04-19 一种用于实验室工程设计的信息检索系统
CN202010064787.3A Active CN111309856B (zh) 2019-04-19 2019-04-19 一种用于实验室工程设计的信息检索系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202010064787.3A Active CN111309856B (zh) 2019-04-19 2019-04-19 一种用于实验室工程设计的信息检索系统

Country Status (1)

Country Link
CN (2) CN110196925B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020120490A1 (en) * 2001-02-26 2002-08-29 Gajewski Arthur Joseph Vehicle systems concept development process
CN102955982A (zh) * 2011-08-18 2013-03-06 大连博特软件科技有限公司 对工程建设项目承包进行控制管理的系统
CN103136618A (zh) * 2011-11-29 2013-06-05 北京建龙重工集团有限公司 工程进度计划的在线管理方法
CN103699953A (zh) * 2013-11-06 2014-04-02 北京驭时德隆科技有限公司 项目管理系统及其数据处理方法和装置
CN106096901A (zh) * 2015-04-27 2016-11-09 弘伦通讯有限公司 项目进度控管方法及其系统
CN107274073A (zh) * 2017-05-26 2017-10-20 北京戴纳实验科技有限公司 用于实验室工程设计的需求信息检索系统
CN107967399A (zh) * 2017-12-19 2018-04-27 广东建远建筑装配工业有限公司 一种基于bim软件的装配式建筑深化设计方法
CN107977345A (zh) * 2017-11-14 2018-05-01 福建亿榕信息技术有限公司 一种通用文本信息抽取方法以及系统
CN108596571A (zh) * 2018-05-01 2018-09-28 康佳男 一种煤矿钻探注浆防治水工程管理信息系统
CN109359125A (zh) * 2018-08-27 2019-02-19 中铁建工集团有限公司 一种用于建设工程的进度精细化管理方法及其系统
CN109559054A (zh) * 2018-12-04 2019-04-02 国网山东省电力公司无棣县供电公司 一种电力工程施工信息处理系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05250413A (ja) * 1992-03-06 1993-09-28 Nippon Telegr & Teleph Corp <Ntt> テキストデータ検索装置
CN102023989B (zh) * 2009-09-23 2012-10-10 阿里巴巴集团控股有限公司 一种信息检索方法及其系统
CN107423348A (zh) * 2017-05-17 2017-12-01 东莞市华睿电子科技有限公司 一种基于关键词的精确检索方法
CN107577763A (zh) * 2017-09-04 2018-01-12 北京京东尚科信息技术有限公司 检索方法和装置
CN109522392A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 基于语音的检索方法、服务器及计算机可读存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020120490A1 (en) * 2001-02-26 2002-08-29 Gajewski Arthur Joseph Vehicle systems concept development process
CN102955982A (zh) * 2011-08-18 2013-03-06 大连博特软件科技有限公司 对工程建设项目承包进行控制管理的系统
CN103136618A (zh) * 2011-11-29 2013-06-05 北京建龙重工集团有限公司 工程进度计划的在线管理方法
CN103699953A (zh) * 2013-11-06 2014-04-02 北京驭时德隆科技有限公司 项目管理系统及其数据处理方法和装置
CN106096901A (zh) * 2015-04-27 2016-11-09 弘伦通讯有限公司 项目进度控管方法及其系统
CN107274073A (zh) * 2017-05-26 2017-10-20 北京戴纳实验科技有限公司 用于实验室工程设计的需求信息检索系统
CN107977345A (zh) * 2017-11-14 2018-05-01 福建亿榕信息技术有限公司 一种通用文本信息抽取方法以及系统
CN107967399A (zh) * 2017-12-19 2018-04-27 广东建远建筑装配工业有限公司 一种基于bim软件的装配式建筑深化设计方法
CN108596571A (zh) * 2018-05-01 2018-09-28 康佳男 一种煤矿钻探注浆防治水工程管理信息系统
CN109359125A (zh) * 2018-08-27 2019-02-19 中铁建工集团有限公司 一种用于建设工程的进度精细化管理方法及其系统
CN109559054A (zh) * 2018-12-04 2019-04-02 国网山东省电力公司无棣县供电公司 一种电力工程施工信息处理系统

Also Published As

Publication number Publication date
CN111309856B (zh) 2023-06-13
CN111309856A (zh) 2020-06-19
CN110196925B (zh) 2020-03-20

Similar Documents

Publication Publication Date Title
CN110019616B (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
CN103577416B (zh) 扩展查询方法及系统
CN110825957A (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN103761254A (zh) 多领域服务主题匹配推荐方法
CN110968801A (zh) 地产产品搜索方法、存储介质及电子设备
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN111680165A (zh) 信息匹配方法、装置、可读存储介质和电子设备
CN115048571A (zh) 一种基于云平台的在线教育推荐管理系统
CN112346951B (zh) 业务的测试方法及装置
CN111896016A (zh) 位置信息的处理方法及装置、存储介质、终端
CN105069034A (zh) 一种生成推荐信息的方法及装置
CN115438142B (zh) 一种对话式交互数据分析报告系统
CN111126422A (zh) 行业模型的建立及行业的确定方法、装置、设备及介质
CN110196925B (zh) 一种用于实验室工程设计的信息检索系统
Yuhefizar et al. An Importance Performance Analysis (IPA) Model: Review E-government Web Portal Quality of Service
TWI684147B (zh) 雲端自助分析平台與其分析方法
CN112330387A (zh) 一种应用于看房软件的虚拟经纪人
CN105975508A (zh) 个性化元搜索引擎检索结果合成排序方法
CN109034938B (zh) 信息快速筛选匹配方法、装置、电子设备及存储介质
CN116703515A (zh) 基于人工智能的推荐方法、装置、计算机设备及存储介质
CN116467286A (zh) 一种建筑工程造价咨询数据库的建立方法及系统
CN116226526A (zh) 一种知识产权智能检索平台及方法
CN109743203B (zh) 一种基于量化信息流的分布式服务安全组合系统及方法
CN115080824A (zh) 目标词的挖掘方法、装置、电子设备及存储介质
CN114202149A (zh) 一种数字化楼宇信息管理方法、装置、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant