CN113051372A - 材料数据的处理方法、装置、计算机设备和存储介质 - Google Patents
材料数据的处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113051372A CN113051372A CN202110390205.5A CN202110390205A CN113051372A CN 113051372 A CN113051372 A CN 113051372A CN 202110390205 A CN202110390205 A CN 202110390205A CN 113051372 A CN113051372 A CN 113051372A
- Authority
- CN
- China
- Prior art keywords
- target material
- materials
- target
- processing
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000463 material Substances 0.000 title claims abstract description 519
- 238000003672 processing method Methods 0.000 title abstract description 18
- 239000013077 target material Substances 0.000 claims abstract description 176
- 238000012545 processing Methods 0.000 claims abstract description 109
- 238000000034 method Methods 0.000 claims abstract description 69
- 238000012795 verification Methods 0.000 claims description 53
- 239000013598 vector Substances 0.000 claims description 35
- 238000000605 extraction Methods 0.000 claims description 34
- 238000004422 calculation algorithm Methods 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 31
- 238000012216 screening Methods 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 13
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 8
- 230000009471 action Effects 0.000 description 7
- 238000010276 construction Methods 0.000 description 5
- 238000012550 audit Methods 0.000 description 4
- 230000006837 decompression Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000012776 electronic material Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- -1 i.e. Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 239000013072 incoming material Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及人工智能技术领域,可应用于智慧政务领域中,提供一种材料数据的处理方法、装置、计算机设备和存储介质,方法包括:获取输入的材料包;对材料包进行拆分处理,得到多份材料;生成与各材料分别对应的关键词集合;从指南标准数据库中获取与各材料分别对应的指定材料指南标准;基于各关键词集合,分别计算各材料与目标材料指南标准的匹配度数值;基于匹配度数值,从所有材料中确定与目标材料指南标准对应的目标材料;获取目标材料指南标准的目标材料类别,基于目标材料类别执行对于目标材料的上传处理。本申请能够提高材料上传的处理效率,保证了材料上传的准确性。本申请还可以应用于区块链领域,上述目标材料可以存储于区块链上。
Description
技术领域
本申请涉及人工智能技术领域,具体涉及一种材料数据的处理方法、装置、计算机设备和存储介质。
背景技术
当前的事项申报,例如政务事项申报一般需要提交各类电子材料,且不同的事项申报需要提交的材料的数量不尽相同。现有的材料上报方式是由申报者人工根据事项申报的要求,事先准备好相应的材料并根据每个材料类别一一对应上传,上传后还需由审核人员对上传的材料的材料内容进行校验以确保材料上传的准确性。这种材料上报方式需要花费申报者较长的材料上传时间且很容易出现上传错误事件。且审核人员也需要花费较多的时间进行对于上传材料的审核校验,这给申报者和审核人员都提供了巨大的工作量,使得材料上报的处理效率较低,同时材料上报的准确性也较低。
发明内容
本申请的主要目的为提供一种材料数据的处理方法、装置、计算机设备和存储介质,旨在解决现有的材料上报方式需要花费申报者较长的上传处理时间,材料上报的处理效率较低,且材料上报的准确性也较低的技术问题。
本申请提出一种材料数据的处理方法,所述方法包括步骤:
获取输入的材料包;
对所述材料包进行拆分处理,得到对应的多份材料;
基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合;
从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准;其中,所述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据;
基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值;其中,所述目标材料指南标准为所有所述指定材料指南标准中的任意一个;
基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料;
获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理。
可选地,所述基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合的步骤,包括:
分别对各所述材料进行分词处理,得到与各所述材料分别对应的检索词特征向量集合;
调用MLP特征提取器分别对各所述检索词特征向量集合进行特征提取处理,得到与各所述材料分别对应的语义特征向量集合;
通过TextRank算法分别对各所述语义特征向量集合进行词语提取处理,得到与各所述材料分别对应的所述关键词集合。
可选地,所述基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值的步骤,包括:
基于各所述关键词集合,调用预设的第一计算公式计算各所述关键词集合与所述目标材料指南标准之间的相似度数值;
分别获取各所述材料在经过所述特征提取处理后的损失值;
基于所述损失值与所述相似度数值,调用预设的第二计算公式分别计算各所述材料与所述目标材料指南标准之间的验证概率;
将所述验证概率作为所述匹配度数值。
可选地,所述基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料的步骤,包括:
获取与各所述材料分别对应的验证概率;
从所有所述验证概率中筛选出数值最大的指定验证概率;
从所有所述材料中筛选出与所述指定验证概率对应的第一指定材料;
将所述第一指定材料作为所述目标材料。
可选地,所述基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料的步骤,包括:
基于所述验证概率,调用预设的第三计算公式分别计算各所述材料与所述目标材料指南标准之间的差距量;
从所有所述差距量中筛选出数值最小的指定差距量;
从所有所述材料中筛选出与所述指定差距量对应的第二指定材料;
将所述第二指定材料作为所述目标材料。
可选地,所述从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准的步骤之前,包括:
接收输入的材料类别以及与各所述材料类别分别对应的材料指南标准;
为各所述材料类别与各所述材料指南标准建立一一对应的映射关系;
创建预设的数据库;
基于所述映射关系,将所述材料类别与所述材料指南标准对应存储于所述数据库内,得到所述指南标准数据库。
可选地,所述获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理的步骤之后,包括:
判断是否完成对于所有所述材料的上传处理;
若是,生成材料上传完毕的提醒信息;
获取与目标用户对应的用户终端信息;
将所述提醒信息发送至与所述用户终端信息对应的用户终端。
本申请还提供一种材料数据的处理装置,包括:
第一获取模块,用于获取输入的材料包;
第一处理模块,对所述材料包进行拆分处理,得到对应的多份材料;
第一生成模块,基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合;
第二获取模块,从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准;其中,所述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据;
计算模块,基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值;其中,所述目标材料指南标准为所有所述指定材料指南标准中的任意一个;
确定模块,基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料;
第二处理模块,获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中提供的材料数据的处理方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的材料数据的处理方法、装置、计算机设备和存储介质,不同于现有的人工根据每个材料类别对材料包内的多份材料进行一一对应上传的处理方法,本申请通过将材料包内的每份材料分别与相关的指定材料指南标准进行匹配度计算,并根据得到的匹配度数值来进行每份材料与每份材料指南标准的一一匹配,进而可以根据得到的匹配关系以及材料指南标准与材料类别的对应关系来准确地确定出每份材料的所属材料类别,以使得后续能够基于得到的每份材料的所属材料类别来准确地完成对于每份材料的数据上传处理。相较于传统的人工逐份上传材料的方式,本申请能够有效减少申报者的材料上传时间,减少申报者的工作量,提高了材料上传的处理效率且保证了材料上传的处理准确性。
附图说明
图1是本申请一实施例的材料数据的处理方法的流程示意图;
图2是本申请一实施例的材料数据的处理装置的结构示意图;
图3是本申请一实施例的计算机设备的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本方案可应用于智慧城市中的智慧政务领域中,从而推动智慧城市的建设。
参照图1,本申请一实施例的材料数据的处理方法,包括:
S1:获取输入的材料包;
S2:对所述材料包进行拆分处理,得到对应的多份材料;
S3:基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合;
S4:从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准;其中,所述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据;
S5:基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值;其中,所述目标材料指南标准为所有所述指定材料指南标准中的任意一个;
S6:基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料;
S7:获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理。
如上述步骤S1至S7所述,本方法实施例的执行主体为一种材料数据的处理装置。在实际应用中,上述材料数据的处理装置可以通过虚拟装置,例如软件代码实现,也可以通过写入或集成有相关执行代码的实体装置实现,且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。本实施例中的材料数据的处理装置,相较于传统的人工逐份上传材料数据的方式有效地减少了申报者的上传申报时间,减少审核者反复校验以及产生的反复退件等问题,提高了材料上传的处理效率且保证了材料上传的处理准确性。具体地,首先获取输入的材料包。其中,上述材料包可为申报者基于事件申报的材料需求事件准备好的数据包,且材料包为存储有多份材料的数据包,该多份材料为进行事件申报所需的材料数据。举例地,对于某地可行性报告申报,需对应提交5份材料,如材料D1申请函、材料D2报告正文、材料D3申请表、材料D4凭证、材料D5申报单位资质证书,则上述材料包可为包含该材料D1-D5所对应的5份材料的数据包。另外,上述材料包中的材料可为文档格式。然后对上述材料包进行拆分处理,得到对应的多份材料。其中,由于事件申报通常需要上传多份相关的电子材料,因而材料包中会包含有多份材料,可先通过使用预置解压工具对上述材料包进行解压处理,以实现将材料包中的各份材料拆分出来。另外,上述预置解压工具可采用现有任意的一种解压工具。
之后基于预设的特征提取器与预设的提取算法生成与各上述材料分别对应的关键词集合。其中,上述特征提取器具体可为MLP特征提取器,上述提取算法具体可为TextRank算法。TextRank算法是一种文本排序算法,由谷歌的网页重要性排序算法PageRank算法改进而来,它能够从一个给定的文本中提取出该文本的关键词、关键词组,并使用抽取式的自动文摘方法提取出该文本的关键句。后续从预设的指南标准数据库中获取与各上述材料分别对应的指定材料指南标准。其中,上述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据,上述指定材料指南标准的数据格式为向量格式。另外,上述指南标准数据库是基于预先输入的材料类别以及与各上述材料类别分别对应的材料指南标准之间的映射关系来进行对应数据存储的数据库。可先获取当前事件申报中所需上传材料的所有指定材料类别,在基于所有的指定材料类别从上述指南标准数据库中提取出与上述材料包中各材料分别对应的指定材料指南标准。在得到了上述关键词集合后,基于各上述关键词集合,分别计算各上述材料与目标材料指南标准之间的匹配度数值。其中,上述目标材料指南标准为所有上述指定材料指南标准中的任意一个。另外,可先基于与上述关键词集合相关的第一计算公式计算出各上述关键词集合与上述目标材料指南标准之间的相似度数值;再基于与上述相似度数值相关的第二计算公式分别计算各上述材料与上述目标材料指南标准之间的验证概率,并用作上述匹配度数值。
在得到了上述匹配度数值后,基于上述匹配度数值,从所有上述材料中确定出与上述目标材料指南标准对应的目标材料。其中,对于上述目标材料的确定方式不作具体限定。例如可先从所有匹配度数值中筛选出数值最大的指定匹配度数值,再从所有上述材料中筛选出与上述指定匹配度数值对应的第一指定材料并用作上述目标材料。或者,还可通过调用与上述匹配度数值对应的第三计算公式分别计算各上述材料与上述目标材料指南标准之间的差距量,再从所有差距量中筛选出数值最小的指定差距量,并从所有上述材料中筛选出与上述指定差距量对应的第二指定材料用作上述目标材料。最后获取与上述目标材料指南标准对应的目标材料类别,基于上述目标材料类别执行对于上述目标材料的上传处理。其中,通过将目标材料指南标准与材料包内的每一个材料进行匹配处理,即分别计算目标材料指南标准与每一个材料之间的匹配度数值,再将所有材料中匹配度数值最大的材料作为与目标材料指南标准相对应的目标材料。通过依次执行上述步骤可以实现材料包中每一个材料与对应的指定材料指南标准的一一匹配处理,进而再基于各指定材料指南标准所对应的材料类别,来得到材料包中每一个材料与每一个材料类别的匹配结果,使得后续根据该匹配结果完成对于材料包中每一个材料的准确上传处理。
本方案可应用于智慧城市中的智慧政务领域中,从而推动智慧城市的建设。不同于现有的人工根据每个材料类别对材料包内的多份材料进行一一对应上传的处理方法,本实施例通过将材料包内的每份材料分别与相关的指定材料指南标准进行匹配度计算,并根据得到的匹配度数值来进行每份材料与每份材料指南标准的一一匹配,进而可以根据得到的匹配关系以及材料指南标准与材料类别的对应关系来准确地确定出每份材料的所属材料类别,以使得后续能够基于得到的每份材料的所属材料类别来准确地完成对于每份材料的数据上传处理。相较于传统的人工逐份上传材料的方式,本实施例能够有效减少申报者的材料上传时间,减少申报者的工作量,提高了材料上传的处理效率且保证了材料上传的处理准确性。另外,由于材料上传的准确性得到了保证,从而可以有效减少审核人员对上传材料进行反复校验的工作,以及可有效规避申报者产生的上传错误事件以及审核人员产生的反复退件等问题。
进一步地,本申请一实施例中,上述步骤S3,包括:
S300:分别对各所述材料进行分词处理,得到与各所述材料分别对应的检索词特征向量集合;
S301:调用MLP特征提取器分别对各所述检索词特征向量集合进行特征提取处理,得到与各所述材料分别对应的语义特征向量集合;
S302:通过TextRank算法分别对各所述语义特征向量集合进行词语提取处理,得到与各所述材料分别对应的所述关键词集合。
如上述步骤S300至S302所述,上述基于预设的特征提取器与预设的提取算法生成与各上述材料分别对应的关键词集合的步骤,具体可包括:首先分别对各上述材料进行分词处理,得到与各上述材料分别对应的检索词特征向量集合。其中,可通过调用预置分词系统对材料中包含的所有句子进行分词处理,进而得到处理后的所有词语向量,即上述检索词特征向量集合。上述预置分词系统可以为ICTCLAS(Institute of ComputingTechnology,Chinese Lexical Analysis System,汉语词法分析系统)、jieba等分词系统。另外,在进行分词处理的过程中,还可以进一步剔除材料中的停用词,例如过滤掉数词、量词、副词、介词等无实际意义的词语。然后调用MLP特征提取器分别对各上述检索词特征向量集合进行特征提取处理,得到与各上述材料分别对应的语义特征向量集合。其中,上述特征提取器具体为MLP特征提取器,通过MLP特征提取器可以基于预设的标准要素,例如与目标指南标准对应的标准词来对上述检索词特征向量集合进行特征提取处理,以实现对检索词特征向量集合进行降维处理来得到对应的低维度的语义特征向量集合,例如将300维的检索词特征向量集合转化为128维的语义特征向量集合。最后通过TextRank算法分别对各上述语义特征向量集合进行词语提取处理,得到与各上述材料分别对应的上述关键词集合。其中,上述提取算法具体为TextRank算法。TextRank算法是一种文本排序算法,由谷歌的网页重要性排序算法PageRank算法改进而来,它能够从一个给定的文本中提取出该文本的关键词、关键词组,并使用抽取式的自动文摘方法提取出该文本的关键句。通过利用TextRank算法能够进一步对得到的各上述语义特征向量集合进行关键词提取处理,以得到月各上述材料分别对应的上述关键词集合,该关键词集合也可称为材料的内容识别要素。本实施例通过基于MLP特征提取器与TextRank算法来对接收到的材料数据进行处理,从而能够快速生成与各材料分别对应的关键词集合,有利于后续能够基于该关键词集合来快速方便地计算各上述材料与上述目标指南标准之间的匹配度数值,进而能够基于上述匹配度数值,从所有上述材料中确定出与上述目标指南标准对应的目标材料,以实现顺利地完成对于目标指南标准的材料匹配处理。
进一步地,本申请一实施例中,上述步骤S5,包括:
S500:基于各所述关键词集合,调用预设的第一计算公式计算各所述关键词集合与所述目标材料指南标准之间的相似度数值;
S501:分别获取各所述材料在经过所述特征提取处理后的损失值;
S502:基于所述损失值与所述相似度数值,调用预设的第二计算公式分别计算各所述材料与所述目标材料指南标准之间的验证概率;
S503:将所述验证概率作为所述匹配度数值。
如上述步骤S500至S503所述,上述基于各上述关键词集合,分别计算各上述材料与目标材料指南标准之间的匹配度数值的步骤,具体可包括:首先基于各上述关键词集合,调用预设的第一计算公式计算各上述关键词集合与上述目标材料指南标准之间的相似度数值。其中,可基于余弦定理来计算出相似度数值,上述第一计算公式具体可为:其中,S(Q,Z)为关键词集合与目标材料指南标准之间的相似度数值,Q为目标材料指南标准,Qi为目标材料指南标准中的第i个分向量,Z为任意一材料的关键词集合,Zi为关键词集合中的第i个分向量,n为分向量的数量。然后分别获取各上述材料在经过上述特征提取处理后的损失值。其中,在调用MLP特征提取器分别对各上述检索词特征向量集合进行特征提取处理后,得到的语义特征向量集合与之前的检索词特征向量集合相比会存在一定的信息损失,上述损失值即为与信息损失相关的数值。另外,对于上述损失值的获取方式可参照现有技术。之后基于上述损失值与上述相似度数值,调用预设的第二计算公式分别计算各上述材料与上述目标材料指南标准之间的验证概率。其中,上述第二计算公式具体可为:其中,P(Z|Q)为任意一材料与上述目标材料指南标准之间的验证概率,S(Q,Z)为任意一材料的关键词集合与目标材料指南标准之间的相似度数值,Υ为损失值,∑Z′∈zexp{Υ*S(Q,Z′)}为所有exp{Υ*S(Q,Z)}的和值。最后将上述验证概率作为上述匹配度数值。本实施例基于与各材料分别对应的关键词集合,调用预设的计算公式来计算出各上述材料与上述目标材料指南标准之间的验证概率,并将该验证概率作为上述匹配度数值,使得后续能够基于该匹配度数据,快速方便地从所有上述材料中确定出与上述目标材料指南标准对应的目标材料,以完成对于目标材料指南标准的材料匹配处理。
进一步地,本申请一实施例中,上述步骤S6,包括:
S600:获取与各所述材料分别对应的验证概率;
S601:从所有所述验证概率中筛选出数值最大的指定验证概率;
S602:从所有所述材料中筛选出与所述指定验证概率对应的第一指定材料;
S603:将所述第一指定材料作为所述目标材料。
如上述步骤S600至S603所述,上述基于上述匹配度数值,从所有上述材料中确定出与上述目标材料指南标准对应的目标材料的步骤,具体可包括:首先获取与各上述材料分别对应的验证概率。然后从所有上述验证概率中筛选出数值最大的指定验证概率。之后从所有上述材料中筛选出与上述指定验证概率对应的第一指定材料。最后将上述第一指定材料作为上述目标材料。举例地,假如材料包内包含有材料1、材料2、材料3这三份材料,与材料1对应的验证概率为P(Z1|Q),与材料2对应的验证概率为P(Z2|Q),与材料3对应的验证概率为P(Z3|Q),且P(Z1|Q)<P(Z2|Q)<P(Z3|Q),由于材料3对应的验证概率的数值在所有验证概率中是最大的,则可表示材料3与目标材料指南标准的匹配度更高,从而可将材料3作为与目标材料指南标准对应的目标材料。本实施例通过对所有上述验证概率进行大小比较并从所有上述验证概率中筛选出数值最大的指定验证概率,进而从所有上述材料中筛选出与上述指定验证概率对应的第一指定材料作为与目标材料指南标准对应的目标材料,有效的保证了对于目标材料指南标准的材料匹配处理的准确性。
进一步地,本申请一实施例中,上述步骤S6,包括:
S610:基于所述验证概率,调用预设的第三计算公式分别计算各所述材料与所述目标材料指南标准之间的差距量;
S611:从所有所述差距量中筛选出数值最小的指定差距量;
S612:从所有所述材料中筛选出与所述指定差距量对应的第二指定材料;
S613:将所述第二指定材料作为所述目标材料。
如上述步骤S610至S613所述,上述基于上述匹配度数值,从所有上述材料中确定出与上述目标材料指南标准对应的目标材料的步骤,具体可包括:首先基于上述验证概率,调用预设的第三计算公式分别计算各上述材料与上述目标材料指南标准之间的差距量。其中,上述第三计算公式为:L=-log∏(Q,Z)P(Z|Q),其中,L为任意一材料与上述目标材料指南标准之间的差距量,P(Z|Q)为任意一材料与上述目标材料指南标准之间的验证概率。另外,L还可称为Loss交叉熵,指代的是材料与目标材料指南标准之间的差距,Loss交叉熵的数值越小则其对应的材料与目标材料指南标准之间则越匹配。然后从所有上述差距量中筛选出数值最小的指定差距量。之后从所有上述材料中筛选出与上述指定差距量对应的第二指定材料。最后将上述第二指定材料作为上述目标材料。举例地,如果材料包内包含有材料1、材料2、材料3这三份材料,与材料1对应的差距量为L1,与材料2对应的验证概率为L2,与材料3对应的差距量为L3,且L3<L2<L1,由于L3的数值在所有的差距量中是最小的,则可表示材料3与目标材料指南标准的匹配度更高,从而可将材料3作为与目标材料指南标准对应的目标材料。本实施例通过基于上述验证概率,调用预设的第三计算公式计算各上述材料与上述编制标准之间的差距量,进而将数值最小的目标差距量对应的第二指定材料作为与目标材料指南标准对应的目标材料,有效的保证了对于目标材料指南标准的材料匹配处理的准确性。
进一步地,本申请一实施例中,上述步骤S4之前,包括:
S400:接收输入的材料类别以及与各所述材料类别分别对应的材料指南标准;
S401:为各所述材料类别与各所述材料指南标准建立一一对应的映射关系;
S402:创建预设的数据库;
S403:基于所述映射关系,将所述材料类别与所述材料指南标准对应存储于所述数据库内,得到所述指南标准数据库。
如上述步骤S400至S403所述,在执行上述从预设的指南标准数据库中获取与各上述材料分别对应的指定材料指南标准的步骤之前,还可包括对于上述指南标准数据库的生成过程。具体地,首先接收输入的材料类别以及与各上述材料类别分别对应的材料指南标准。其中,上述材料指南标准所包含的具体内容可根据实际使用需求进行设置,例如可包括对材料的提交材料格式、命名、文件标题主体结构、包含内容等进行标准化编制。选定可行性报告申报事项作为示例,某地可行性报告申报需提交材料包括:材料D1申请函、材料D2报告正文、材料D3申请表、材料D4凭证、材料D5申报单位资质证书。并同时对上述材料D1、D2、D3、D4、D5分别编制相应的材料指南标准。举例地,材料D2的材料指南标准对材料D2的提交材料格式、包含内容等进行了规范化的指南标准定义,可包括以下内容:1、标题h1为“项目名称+可行性研究报告”;2、内容h2项目概况包括“国家政策、会议纪要”;3、内容h3建设内容包括“建筑安装工程、单体工程、地下建筑工程、室外配套工程”。另外,上述材料指南标准的数据格式为向量格式。然后为各上述材料类别与各上述材料指南标准建立一一对应的映射关系。之后创建预设的数据库。最后基于上述映射关系,将上述材料类别与上述材料指南标准对应存储于上述数据库内,得到上述指南标准数据库。本实施例通过基于材料类别及对应的材料指南标准生成相应的指南标准数据库,有利于后续能够基于该指南标准数据库来快速便捷地提取出上述材料包中包含的每一份材料分别对应的指定材料指南标准,以便后续基于该指定材料指南标准来智能地从各材料中准确地查找出与目标材料指南标准对应的目标材料,从而完成对于目标材料指南标准的材料匹配处理。
进一步地,本申请一实施例中,上述步骤S7之后,包括:
S700:判断是否完成对于所有所述材料的上传处理;
S701:若是,生成材料上传完毕的提醒信息;
S702:获取与目标用户对应的用户终端信息;
S703:将所述提醒信息发送至与所述用户终端信息对应的用户终端。
如上述步骤S700至S703所述,在执行完上述获取与上述目标材料指南标准对应的目标材料类别,基于上述目标材料类别执行对于上述目标材料的上传处理的步骤之后,还可包括生成并发送材料上传完毕的提醒信息的过程。具体地,首先判断是否完成对于所有上述材料的上传处理。如果完成了对于所有上述材料的上传处理,生成材料上传完毕的提醒信息。然后获取与目标用户对应的用户终端信息。其中,上述目标用户可为需要对已上传材料进行准确性审核的材料审核员。另外,上述用户终端信息可指该用户终端对应的号码信息。最后将上述提醒信息发送至与上述用户终端信息对应的用户终端。其中,具体采用短信的形式将该提醒信息发送上述用户终端,由于终端一般都具有在屏幕上直接显示短信内容的功能,从而目标用户很大概率能够看到该提醒信息的内容,从而提高提醒目标用户的成功率。本实施例在判定完成了对于所有上述材料的上传处理后,会先生成材料上传完毕的提醒信息,并智能地将该提醒信息发送至与目标用户对应的用户终端,使得目标用户能够基于该提醒信息来及时知晓本次对于材料包的材料上传的实际上传情况,进而可以根据该提醒信息来合理安排后续的审核处理工作,提高了用户使用体验。
本申请实施例中的材料数据的处理方法还可以应用于区块链领域,如将上述目标材料等数据存储于区块链上。通过使用区块链来对上述目标材料进行存储和管理,能够有效地保证上述目标材料的安全性与不可篡改性。
上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
参照图2,本申请一实施例中还提供了一种材料数据的处理装置,包括:
第一获取模块1,用于获取输入的材料包;
第一处理模块2,对所述材料包进行拆分处理,得到对应的多份材料;
第一生成模块3,基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合;
第二获取模块4,从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准;其中,所述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据;
计算模块5,基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值;其中,所述目标材料指南标准为所有所述指定材料指南标准中的任意一个;
确定模块6,基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料;
第二处理模块7,获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理。
本实施例中,上述材料数据的处理装置中的第一获取模块1、第一处理模块2、第一生成模块3、第二获取模块4、计算模块5、确定模块6与第二处理模块7的功能和作用的实现过程具体详见上述材料数据的处理方法中对应步骤S1至S7的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第一生成模块3,包括:
第一处理单元,用于分别对各所述材料进行分词处理,得到与各所述材料分别对应的检索词特征向量集合;
第二处理单元,用于调用MLP特征提取器分别对各所述检索词特征向量集合进行特征提取处理,得到与各所述材料分别对应的语义特征向量集合;
第三处理单元,用于通过TextRank算法分别对各所述语义特征向量集合进行词语提取处理,得到与各所述材料分别对应的所述关键词集合。
本实施例中,上述材料数据的处理装置中的第一处理单元、第二处理单元与第三处理单元的功能和作用的实现过程具体详见上述材料数据的处理方法中对应步骤S300至S302的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述计算模块5,包括:
第一计算单元,用于基于各所述关键词集合,调用预设的第一计算公式计算各所述关键词集合与所述目标材料指南标准之间的相似度数值;
第一获取单元,用于分别获取各所述材料在经过所述特征提取处理后的损失值;
第二计算单元,用于基于所述损失值与所述相似度数值,调用预设的第二计算公式分别计算各所述材料与所述目标材料指南标准之间的验证概率;
第一确定单元,用于将所述验证概率作为所述匹配度数值。
本实施例中,上述材料数据的处理装置中的第一计算单元、第一获取单元、第二计算单元与第一确定单元的功能和作用的实现过程具体详见上述材料数据的处理方法中对应步骤S500至S503的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述确定模块6,包括:
第二获取单元,用于获取与各所述材料分别对应的验证概率;
第一筛选单元,用于从所有所述验证概率中筛选出数值最大的指定验证概率;
第二筛选单元,用于从所有所述材料中筛选出与所述指定验证概率对应的第一指定材料;
第二确定单元,用于将所述第一指定材料作为所述目标材料。
本实施例中,上述材料数据的处理装置中的第二获取单元、第一筛选单元、第二筛选单元与第二确定单元的功能和作用的实现过程具体详见上述材料数据的处理方法中对应步骤S600至S603的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述确定模块6,包括:
第三计算单元,用于基于所述验证概率,调用预设的第三计算公式分别计算各所述材料与所述目标材料指南标准之间的差距量;
第三筛选单元,用于从所有所述差距量中筛选出数值最小的指定差距量;
第四筛选单元,用于从所有所述材料中筛选出与所述指定差距量对应的第二指定材料;
第三确定单元,用于将所述第二指定材料作为所述目标材料。
本实施例中,上述材料数据的处理装置中的第三计算单元、第三筛选单元、第四筛选单元与第三确定单元的功能和作用的实现过程具体详见上述材料数据的处理方法中对应步骤S610至S613的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述材料数据的处理装置,包括:
接收模块,用于接收输入的材料类别以及与各所述材料类别分别对应的材料指南标准;
映射模块,用于为各所述材料类别与各所述材料指南标准建立一一对应的映射关系;
创建模块,用于创建预设的数据库;
存储模块,用于基于所述映射关系,将所述材料类别与所述材料指南标准对应存储于所述数据库内,得到所述指南标准数据库。
本实施例中,上述材料数据的处理装置中的接收模块、映射模块、创建模块与存储模块的功能和作用的实现过程具体详见上述材料数据的处理方法中对应步骤S400至S403的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述材料数据的处理装置,包括:
判断模块,用于判断是否完成对于所有所述材料的上传处理;
第二生成模块,用于若是,生成材料上传完毕的提醒信息;
第三获取模块,用于获取与目标用户对应的用户终端信息;
发送模块,用于将所述提醒信息发送至与所述用户终端信息对应的用户终端。
本实施例中,上述材料数据的处理装置中的判断模块、第二生成模块、第三获取模块与发送模块的功能和作用的实现过程具体详见上述材料数据的处理方法中对应步骤S700至S703的实现过程,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中,该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储材料包、关键词集合、指定材料指南标准、匹配度数值、目标材料以及目标材料类别。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备,用于将数字信号转换为光信号,使文字与图形在显示屏的屏幕上显示出来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置,用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种材料数据的处理方法。
上述处理器执行上述材料数据的处理方法的步骤:
获取输入的材料包;
对所述材料包进行拆分处理,得到对应的多份材料;
基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合;
从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准;其中,所述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据;
基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值;其中,所述目标材料指南标准为所有所述指定材料指南标准中的任意一个;
基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料;
获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的装置、计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种材料数据的处理方法,具体为:
获取输入的材料包;
对所述材料包进行拆分处理,得到对应的多份材料;
基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合;
从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准;其中,所述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据;
基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值;其中,所述目标材料指南标准为所有所述指定材料指南标准中的任意一个;
基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料;
获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理。
综上所述,本申请实施例中提供的材料数据的处理方法、装置、计算机设备和存储介质,不同于现有的人工根据每个材料类别对材料包内的多份材料进行一一对应上传的处理方法,本申请实施例通过将材料包内的每份材料分别与相关的指定材料指南标准进行匹配度计算,并根据得到的匹配度数值来进行每份材料与每份材料指南标准的一一匹配,进而可以根据得到的匹配关系以及材料指南标准与材料类别的对应关系来准确地确定出每份材料的所属材料类别,以使得后续能够基于得到的每份材料的所属材料类别来准确地完成对于每份材料的数据上传处理。相较于传统的人工逐份上传材料的方式,本申请实施例能够有效减少申报者的材料上传时间,减少申报者的工作量,提高了材料上传的处理效率且保证了材料上传的处理准确性。另外,由于材料上传的准确性得到了保证,从而可以有效减少审核人员对上传材料进行反复校验的工作,以及可有效规避申报者产生的上传错误事件以及审核人员产生的反复退件等问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种材料数据的处理方法,其特征在于,包括:
获取输入的材料包;
对所述材料包进行拆分处理,得到对应的多份材料;
基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合;
从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准;其中,所述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据;
基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值;其中,所述目标材料指南标准为所有所述指定材料指南标准中的任意一个;
基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料;
获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理。
2.根据权利要求1所述的材料数据的处理方法,其特征在于,所述基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合的步骤,包括:
分别对各所述材料进行分词处理,得到与各所述材料分别对应的检索词特征向量集合;
调用MLP特征提取器分别对各所述检索词特征向量集合进行特征提取处理,得到与各所述材料分别对应的语义特征向量集合;
通过TextRank算法分别对各所述语义特征向量集合进行词语提取处理,得到与各所述材料分别对应的所述关键词集合。
3.根据权利要求2所述的材料数据的处理方法,其特征在于,所述基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值的步骤,包括:
基于各所述关键词集合,调用预设的第一计算公式计算各所述关键词集合与所述目标材料指南标准之间的相似度数值;
分别获取各所述材料在经过所述特征提取处理后的损失值;
基于所述损失值与所述相似度数值,调用预设的第二计算公式分别计算各所述材料与所述目标材料指南标准之间的验证概率;
将所述验证概率作为所述匹配度数值。
4.根据权利要求3所述的材料数据的处理方法,其特征在于,所述基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料的步骤,包括:
获取与各所述材料分别对应的验证概率;
从所有所述验证概率中筛选出数值最大的指定验证概率;
从所有所述材料中筛选出与所述指定验证概率对应的第一指定材料;
将所述第一指定材料作为所述目标材料。
5.根据权利要求3所述的材料数据的处理方法,其特征在于,所述基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料的步骤,包括:
基于所述验证概率,调用预设的第三计算公式分别计算各所述材料与所述目标材料指南标准之间的差距量;
从所有所述差距量中筛选出数值最小的指定差距量;
从所有所述材料中筛选出与所述指定差距量对应的第二指定材料;
将所述第二指定材料作为所述目标材料。
6.根据权利要求1所述的材料数据的处理方法,其特征在于,所述从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准的步骤之前,包括:
接收输入的材料类别以及与各所述材料类别分别对应的材料指南标准;
为各所述材料类别与各所述材料指南标准建立一一对应的映射关系;
创建预设的数据库;
基于所述映射关系,将所述材料类别与所述材料指南标准对应存储于所述数据库内,得到所述指南标准数据库。
7.根据权利要求1所述的材料数据的处理方法,其特征在于,所述获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理的步骤之后,包括:
判断是否完成对于所有所述材料的上传处理;
若是,生成材料上传完毕的提醒信息;
获取与目标用户对应的用户终端信息;
将所述提醒信息发送至与所述用户终端信息对应的用户终端。
8.一种材料数据的处理装置,其特征在于,包括:
第一获取模块,用于获取输入的材料包;
第一处理模块,对所述材料包进行拆分处理,得到对应的多份材料;
第一生成模块,基于预设的特征提取器与预设的提取算法生成与各所述材料分别对应的关键词集合;
第二获取模块,从预设的指南标准数据库中获取与各所述材料分别对应的指定材料指南标准;其中,所述指定材料指南标准为根据材料的材料类型预先对材料的格式与材料的内容进行标准化定义的文本数据;
计算模块,基于各所述关键词集合,分别计算各所述材料与目标材料指南标准之间的匹配度数值;其中,所述目标材料指南标准为所有所述指定材料指南标准中的任意一个;
确定模块,基于所述匹配度数值,从所有所述材料中确定出与所述目标材料指南标准对应的目标材料;
第二处理模块,获取与所述目标材料指南标准对应的目标材料类别,基于所述目标材料类别执行对于所述目标材料的上传处理。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110390205.5A CN113051372B (zh) | 2021-04-12 | 2021-04-12 | 材料数据的处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110390205.5A CN113051372B (zh) | 2021-04-12 | 2021-04-12 | 材料数据的处理方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113051372A true CN113051372A (zh) | 2021-06-29 |
CN113051372B CN113051372B (zh) | 2024-05-07 |
Family
ID=76519115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110390205.5A Active CN113051372B (zh) | 2021-04-12 | 2021-04-12 | 材料数据的处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113051372B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360995A (zh) * | 2021-07-01 | 2021-09-07 | 苏州苏明装饰股份有限公司 | 一种基于bim模型的互换装修材料调用方法及系统 |
CN114691722A (zh) * | 2022-03-25 | 2022-07-01 | 济宁市质量技术监督信息所 | 一种包装检测标准的快速选定方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017202125A1 (zh) * | 2016-05-25 | 2017-11-30 | 华为技术有限公司 | 文本分类方法及装置 |
CN110795677A (zh) * | 2019-11-12 | 2020-02-14 | 成都知道创宇信息技术有限公司 | 一种cdn节点的分配方法及装置 |
WO2020082560A1 (zh) * | 2018-10-25 | 2020-04-30 | 平安科技(深圳)有限公司 | 文本关键词提取方法、装置、设备及计算机可读存储介质 |
CN111276156A (zh) * | 2020-01-20 | 2020-06-12 | 深圳市数字星河科技有限公司 | 一种实时语音流监控的方法 |
CN111444342A (zh) * | 2020-03-24 | 2020-07-24 | 湖南董因信息技术有限公司 | 一种基于多重弱监督集成的短文本分类方法 |
CN111859960A (zh) * | 2020-07-27 | 2020-10-30 | 中国平安人寿保险股份有限公司 | 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质 |
WO2020224097A1 (zh) * | 2019-05-06 | 2020-11-12 | 平安科技(深圳)有限公司 | 智能语义文档推荐方法、装置及计算机可读存储介质 |
CN112347310A (zh) * | 2020-11-05 | 2021-02-09 | 中国平安人寿保险股份有限公司 | 事件处理信息的查询方法、装置、计算机设备和存储介质 |
CN112434146A (zh) * | 2020-11-25 | 2021-03-02 | 平安普惠企业管理有限公司 | 基于关键词的问题排序方法、智能机器人以及计算机设备 |
CN112597158A (zh) * | 2020-12-17 | 2021-04-02 | 平安普惠企业管理有限公司 | 数据匹配方法、装置、计算机设备和存储介质 |
-
2021
- 2021-04-12 CN CN202110390205.5A patent/CN113051372B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017202125A1 (zh) * | 2016-05-25 | 2017-11-30 | 华为技术有限公司 | 文本分类方法及装置 |
WO2020082560A1 (zh) * | 2018-10-25 | 2020-04-30 | 平安科技(深圳)有限公司 | 文本关键词提取方法、装置、设备及计算机可读存储介质 |
WO2020224097A1 (zh) * | 2019-05-06 | 2020-11-12 | 平安科技(深圳)有限公司 | 智能语义文档推荐方法、装置及计算机可读存储介质 |
CN110795677A (zh) * | 2019-11-12 | 2020-02-14 | 成都知道创宇信息技术有限公司 | 一种cdn节点的分配方法及装置 |
CN111276156A (zh) * | 2020-01-20 | 2020-06-12 | 深圳市数字星河科技有限公司 | 一种实时语音流监控的方法 |
CN111444342A (zh) * | 2020-03-24 | 2020-07-24 | 湖南董因信息技术有限公司 | 一种基于多重弱监督集成的短文本分类方法 |
CN111859960A (zh) * | 2020-07-27 | 2020-10-30 | 中国平安人寿保险股份有限公司 | 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质 |
CN112347310A (zh) * | 2020-11-05 | 2021-02-09 | 中国平安人寿保险股份有限公司 | 事件处理信息的查询方法、装置、计算机设备和存储介质 |
CN112434146A (zh) * | 2020-11-25 | 2021-03-02 | 平安普惠企业管理有限公司 | 基于关键词的问题排序方法、智能机器人以及计算机设备 |
CN112597158A (zh) * | 2020-12-17 | 2021-04-02 | 平安普惠企业管理有限公司 | 数据匹配方法、装置、计算机设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
刘波;郭平;沈岳;丁德红;: "农业文本特征重组向量矩阵算法优化与仿真", 软件, no. 04 * |
刘端阳;王良芳;: "基于语义词典和词汇链的关键词提取算法", 浙江工业大学学报, no. 05 * |
金保华;林青;吴怀广;: "基于中文关键词提取的预案智能匹配方案", 郑州轻工业学院学报(自然科学版), no. 02 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360995A (zh) * | 2021-07-01 | 2021-09-07 | 苏州苏明装饰股份有限公司 | 一种基于bim模型的互换装修材料调用方法及系统 |
CN113360995B (zh) * | 2021-07-01 | 2022-02-15 | 苏州苏明装饰股份有限公司 | 一种基于bim模型的互换装修材料调用方法及系统 |
CN114691722A (zh) * | 2022-03-25 | 2022-07-01 | 济宁市质量技术监督信息所 | 一种包装检测标准的快速选定方法及系统 |
CN114691722B (zh) * | 2022-03-25 | 2024-05-03 | 济宁市质量技术监督信息所 | 一种包装检测标准的快速选定方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113051372B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112347310B (zh) | 事件处理信息的查询方法、装置、计算机设备和存储介质 | |
CN109189769A (zh) | 数据标准化处理方法、装置、计算机设备和存储介质 | |
CN111737963B (zh) | 基于配置文件的表单填写方法、装置和计算机设备 | |
CN112637282B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN112329865B (zh) | 基于自编码器的数据异常识别方法、装置和计算机设备 | |
CN113051372B (zh) | 材料数据的处理方法、装置、计算机设备和存储介质 | |
CN112597158A (zh) | 数据匹配方法、装置、计算机设备和存储介质 | |
CN112036147B (zh) | 将图片转换为网页的方法、装置、计算机设备和存储介质 | |
WO2022001517A1 (zh) | 基于谣言预测模型的信息发送方法、装置和计算机设备 | |
CN109447400A (zh) | 任务数据管理方法、装置、计算机设备和存储介质 | |
CN113742776A (zh) | 基于生物识别技术的数据校验方法、装置和计算机设备 | |
CN112163131A (zh) | 业务数据查询平台的配置方法、装置、计算机设备及介质 | |
CN111813946A (zh) | 医疗信息反馈方法、装置、设备及可读存储介质 | |
CN112836061A (zh) | 智能推荐的方法、装置以及计算机设备 | |
CN113190562A (zh) | 一种报表生成方法、装置及电子设备 | |
CN113177396B (zh) | 报表生成方法、装置、计算机设备和存储介质 | |
CN113435990B (zh) | 基于规则引擎的凭证生成方法、装置和计算机设备 | |
CN113656588A (zh) | 基于知识图谱的数据对码方法、装置、设备和存储介质 | |
CN113761375A (zh) | 基于神经网络的消息推荐方法、装置、设备及存储介质 | |
CN112650659B (zh) | 埋点设置方法、装置、计算机设备和存储介质 | |
CN113672654A (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
CN113918609A (zh) | 试卷创建方法、装置、计算机设备和存储介质 | |
CN112364136A (zh) | 关键词生成方法、装置、设备及存储介质 | |
CN113191146B (zh) | 诉求数据的分配方法、装置、计算机设备和存储介质 | |
CN113077185B (zh) | 工作量评估方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |