CN114580362B - 一种回标文件生成系统及其方法 - Google Patents

一种回标文件生成系统及其方法 Download PDF

Info

Publication number
CN114580362B
CN114580362B CN202210496259.4A CN202210496259A CN114580362B CN 114580362 B CN114580362 B CN 114580362B CN 202210496259 A CN202210496259 A CN 202210496259A CN 114580362 B CN114580362 B CN 114580362B
Authority
CN
China
Prior art keywords
bidding
bid
information
file
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210496259.4A
Other languages
English (en)
Other versions
CN114580362A (zh
Inventor
罗官
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Yema Technology Co ltd
Original Assignee
Sichuan Yema Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Yema Technology Co ltd filed Critical Sichuan Yema Technology Co ltd
Priority to CN202210496259.4A priority Critical patent/CN114580362B/zh
Publication of CN114580362A publication Critical patent/CN114580362A/zh
Application granted granted Critical
Publication of CN114580362B publication Critical patent/CN114580362B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于数据处理技术领域,公开了一种回标文件生成系统及其方法,系统一种回标文件生成系统,包括信息采集单元、标书分析单元以及回标生成单元。方法包括如下步骤:对招投标文件进行分析得到的历史的标书信息和历史的回标信息;基于神经网络建立标书分析模型和回标生成模型;获取当前的标书文件,使用标书分析模型对当前的标书文件进行分析,得到当前的标书信息;使用回标生成模型根据当前的标书信息和投标单位的投标信息生成初始的回标文件;对初始的回标文件进行压缩处理和格式转换,得到最终的回标文件。本发明解决了现有技术存在的制作回标文件工作量大、工作效率低以及回标文件过大导致出现错误的问题。

Description

一种回标文件生成系统及其方法
技术领域
本发明属于数据处理技术领域,具体涉及一种回标文件生成系统及其方法。
背景技术
标书是由发标单位编制或委托设计单位编制,向投标者提供对该工程的主要技术、质量、工期等要求的文件。标书是招标工作时采购当事人都要遵守的具有法律效应且可执行的投标行为标准文件。它的逻辑性要强,不能前后矛盾,模棱两可;用语要精炼、简短。标书也是投标商投标编制投标书的依据,投标商必须对标书的内容进行实质性的响应,否则被判定为无效标。标书同样也是评标最重要的依据。标书一般有至少一个正本,两个或多个副本。回标就是受邀投标单位接受到邀请投标,在规定时间内回复是否愿意投标,并做回标文件。
现有技术存在的问题:
回标文件的制作通常采用人工方式,这样的方式工作量大,工作效率低,尤其是在规定的回标时间很短的情况下,容易导致回标文件出现错误;在某些大型招标中,回标文件内容多,页数多,接入的报告、图片、文件过多,文件过大,导致回标文件无法打开,或回标文件打开响应速度慢,以及容易出现图片丢失现象,导致错过投标机会。
发明内容
为了解决现有技术存在的制作回标文件工作量大、工作效率低以及回标文件过大导致出现错误的问题,提出一种回标文件生成系统及其方法。
本发明所采用的技术方案为:
一种回标文件生成系统,包括信息采集单元、标书分析单元以及回标生成单元,所述的信息采集单元、标书分析单元以及回标生成单元依次连接,且信息采集单元连接有外部的招投标数据库;
信息采集单元用于采集历史的招投标文件,并对招投标文件进行分析,得到的历史的标书信息和回标信息;标书分析单元设置有根据历史的标书信息训练得到的标书分析模型,用于接收招标单位的标书文件并使用标书分析模型对标书文件进行分析得到当前的标书信息;回标生成单元设置有根据历史的回标信息训练得到的回标生成模型,用于根据当前的标书信息和投标信息使用回标生成模型生成回标文件;
基于递归神经网络根据历史的标书信息建立标书分析模型,所述的递归神经网络的公式为:
Figure GDA0003782447250000021
式中,xi(t)、xj(t)、xj(t-τij(t))均为递归神经网络的状态;f(*)为状态相关函数;aij、bij均为网络的权值;τij(t)为时变时滞;ui为外部输入;yi=f(xi(t))为递归神经网络的输出;i、j均为指示量;t为时刻自变量;
基于LSTM-FC神经网络根据历史的回标信息建立回标生成模型,LSTM-FC神经网络的公式为:
Figure GDA0003782447250000022
式中,ft为t时刻的遗忘门函数;
Figure GDA0003782447250000023
为t时刻的输入值;ut、ut-1为t、t-1时刻的输出值;σ为Sigmoid函数;it为t时刻的输入门函数;gt为t时刻的中间层函数;ot为t时刻的输出门函数;st、st-1分别为t、t-1时刻的神经元状态函数;bf、bi、bg、bo分别为遗忘门、输入门、中间层以及输出门的偏置值;Φ(*)为Tanh函数;Wfa、Wfh均为遗忘门函数的权重;Wia、Wih均为输入门函数的权重;Wga、Wgh均为中间层函数的权重;Woa、Woh均为输出门函数的权重。
进一步地,信息采集单元包括文件采集端口、格式转换模块、预处理模块、特征提取模块、文本识别模块、关键词提取模块以及存储模块,所述的文件采集端口、格式转换模块、预处理模块、特征提取模块、文本识别模块、关键词提取模块以及存储模块依次连接,且文件输入端口连接有外部的招投标数据库,所述的关键词提取模块与标书分析单元连接。
进一步地,标书分析单元包括标书输入端口、调用模块以及标书分析模块,所述的标书输入端口和调用模块均与标书分析模块依次连接,所述的调用模块与信息采集单元连接,所述的标书分析模块设置有标书分析模型,且标书分析模块与回标生成单元连接。
进一步地,回标生成单元包括投标信息输入端口、回标生成模块以及文件处理模块,所述的投标信息输入端口、回标生成模块以及文件处理模块依次连接,所述的回标生成模块与标书分析单元连接,且回标生成模块设置有回标生成模型。
一种回标文件生成方法,基于回标文件生成系统,包括如下步骤:
采集历史的招投标文件,并对招投标文件进行分析,得到的历史的标书信息和历史的回标信息;
基于神经网络根据历史的标书信息建立标书分析模型,并基于神经网络根据历史的回标信息建立回标生成模型;
获取当前的标书文件,使用标书分析模型对当前的标书文件进行分析,得到当前的标书信息;
使用回标生成模型根据当前的标书信息和投标单位的投标信息生成初始的回标文件;
对初始的回标文件进行压缩处理和格式转换,得到最终的回标文件。
进一步地,获取历史的招投标文件的招投标信息,提取招投标信息的关键词,根据关键词将招投标信息划分为历史的标书信息和历史的回标信息。
进一步地,使用TextRank算法提取招投标信息的关键词,包括如下步骤:
将招投标信息分割为若干完整的句子;
对每个句子进行分词和词性标注处理,过滤停用词并保留指定词性的单词,得到若干候选关键词;
根据若干候选关键词构建候选关键词图,并构建候选关键词之间的连接关系;
根据候选关键词之间的连接关系迭代传播建候选关键词图中各候选关键词的权重直至迭代结果收敛,对候选关键词的权重进行倒序排序,根据排序结果得到若干关键词;
TextRank算法的公式为:
Figure GDA0003782447250000041
式中,WS(Vi)、WS(Vj)分别为关键词节点Vi与Vj的得分函数;d为阻尼系数,取值范围为0-1;wji、wjk分别为关键词节点Vj到Vi与到Vk的权重;Out(Vi)为关键词节点Vi的指向节点集合;Vi、Vk、Vj均为关键词节点;i、j、k均为节点指示量。
进一步地,使用标书分析模型对当前的标书文件进行分析,包括如下步骤:
将当前的标书文件转化为统一的图片格式,得到标书图像;
对标书图像进行预处理,得到预处理后图像,并提取预处理后图像的特征数据;
对特征数据进行文本识别,得到当前的标书信息。
进一步地,基于递归神经网络使用联想记忆字符识别方法对标书文件的特征数据进行文本识别,包括如下步骤:
使用标书分析模型对当前的标书文件的特征数据进行一次识别,得到一次识别结果,并根据词典映射表将一次识别结果转化为一次向量数据;
将特征数据、一次识别结果以及一次向量数据输入标书分析模型进行二次识别,得到二次识别结果,并根据词典映射表将二次识别结果转化为二次向量数据;
将特征数据、二次识别结果以及二次向量数据输入标书分析模型进行三次识别,得到三次识别结果,并根据词典映射表将三次识别结果转化为三次向量数据;
将特征数据、n次识别结果以及n次向量数据输入标书分析模型进行n+1次识别,得到n+1次识别结果,并根据词典映射表将n+1次识别结果转化为n+1次向量数据,其中,n为递归次数指示量,且n为大于2的正整数,直至达到递归次数阈值n=N,将n+1次识别结果作为最终的识别结果,即当前的标书信息。
进一步地,使用回标生成模型生成初始的回标文件,包括如下步骤:
建立空白文件,并使用回标生成模型提取当前的标书信息中的投标项目和回标文件结构;
根据投标项目匹配投标单位的投标信息;
将对应的投标单位的投标信息按照回标文件结构写入空白文件,得到初始的回标文件。
本发明的有益效果为:
1)本发明提供的回标文件生成系统对当前的标书文件进行分析并生成对应的回标文件,避免了人工制作回标文件,减小了工作人员的工作量,提高了文件制作效率,大大缩短了文件制作周期,最后对回标文件进行压缩和格式转换,大大的压缩了文件的体积,同时将回标文件转换为方便阅读的格式,避免了图片、文字丢失的情况。
2)本发明提供的回标文件生成方法,通过采集历史的招投标文件基于神经网络训练标书分析模型和回标生成模型,标书分析模型对输入的标书文件进行自动分析,获取回标文件所需的投标项目和文件格式,回标生成模型根据投标项目和文件格式自动生成对应的回标文件,本方法基于神经网络和TextRank算法,提高了标书文件分析和回标文件生成的效率和准确度。
本发明的其他有益效果将在具体实施方式中进一步进行说明。
附图说明
图1是本发明中回标文件生成系统的结构框图。
图2是本发明中回标文件生成方法的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
如图1所示,本实施例提供一种回标文件生成系统,包括信息采集单元、标书分析单元以及回标生成单元,信息采集单元、标书分析单元以及回标生成单元依次连接,且信息采集单元连接有外部的招投标数据库;
信息采集单元用于采集历史的招投标文件,并对招投标文件进行分析,得到的历史的标书信息和回标信息;标书分析单元设置有根据历史的标书信息训练得到的标书分析模型,用于接收招标单位的标书文件并使用标书分析模型对标书文件进行分析得到当前的标书信息;回标生成单元设置有根据历史的回标信息训练得到的回标生成模型,用于根据当前的标书信息和投标信息使用回标生成模型生成回标文件;
基于递归神经网络根据历史的标书信息建立标书分析模型,所述的递归神经网络的公式为:
Figure GDA0003782447250000071
式中,xi(t)、xj(t)、xj(t-τij(t))均为递归神经网络的状态;f(*)为状态相关函数;aij、bij均为网络的权值;τij(t)为时变时滞;ui为外部输入;yi=f(xi(t))为递归神经网络的输出;i、j均为指示量;t为时刻自变量;
基于LSTM-FC神经网络根据历史的回标信息建立回标生成模型,LSTM-FC神经网络的公式为:
Figure GDA0003782447250000072
式中,ft为t时刻的遗忘门函数;
Figure GDA0003782447250000073
为t时刻的输入值;ut、ut-1为t、t-1时刻的输出值;σ为Sigmoid函数;it为t时刻的输入门函数;gt为t时刻的中间层函数;ot为t时刻的输出门函数;st、st-1分别为t、t-1时刻的神经元状态函数;bf、bi、bg、bo分别为遗忘门、输入门、中间层以及输出门的偏置值;Φ(*)为Tanh函数;Wfa、Wfh均为遗忘门函数的权重;Wia、Wih均为输入门函数的权重;Wga、Wgh均为中间层函数的权重;Woa、Woh均为输出门函数的权重。
作为优选,信息采集单元包括文件采集端口、格式转换模块、预处理模块、特征提取模块、文本识别模块、关键词提取模块以及存储模块,文件采集端口、格式转换模块、预处理模块、特征提取模块、文本识别模块、关键词提取模块以及存储模块依次连接,且文件输入端口连接有外部的招投标数据库,关键词提取模块与标书分析单元连接。
文件采集端口采集招投标数据库中历史的招投标文件,格式转换模块将招投标文件转化为统一的图片格式,预处理模块对招投标图像进行预处理,得到预处理后图像,特征提取模块提取预处理后图像的特征数据,文本识别模块对特征数据进行文本识别,得到招投标信息,关键词提取模块提取招投标信息的关键词,根据关键词将招投标信息划分为标书信息和回标信息,存储模块存储历史的标书信息和回标信息。
作为优选,标书分析单元包括标书输入端口、调用模块以及标书分析模块,标书输入端口和调用模块均与标书分析模块依次连接,调用模块与信息采集单元连接,标书分析模块设置有标书分析模型,且标书分析模块与回标生成单元连接。
标书输入端口接收当前的标书文件,调用模块调用信息采集单元的各模块和历史的标书信息进行训练,在标书分析模块建立标书分析模型,标书分析模块使用标书分析模型对当前的标书文件进行分析得到当前的标书信息。
作为优选,回标生成单元包括投标信息输入端口、回标生成模块以及文件处理模块,投标信息输入端口、回标生成模块以及文件处理模块依次连接,回标生成模块与标书分析单元连接,且回标生成模块设置有回标生成模型。
投标信息输入端口接收投标单位的投标信息,回标生成模块根据历史的回标信息进行训练,建立回标生成模型,回标模型根据当前的标书信息和投标单位的投标信息生成回标文件,文件处理模块对回标文件进行压缩处理和格式转换。
本发明提供的回标文件生成系统对当前的标书文件进行分析并生成对应的回标文件,避免了人工制作回标文件,减小了工作人员的工作量,提高了文件制作效率,大大缩短了文件制作周期,最后对回标文件进行压缩和格式转换,大大的压缩了文件的体积,同时将回标文件转换为方便阅读的格式,避免了图片、文字丢失的情况。
实施例2:
本实施例为基于实施例1的技术方案的改进,其与实施例1的区别在于:
一种回标文件生成方法,如图2所示,基于回标文件生成系统,包括如下步骤:
采集历史的招投标文件,并对招投标文件进行分析,得到的历史的标书信息和历史的回标信息;
基于神经网络根据历史的标书信息建立标书分析模型,并基于神经网络根据历史的回标信息建立回标生成模型;
获取当前的标书文件,使用标书分析模型对当前的标书文件进行分析,得到当前的标书信息;
使用回标生成模型根据当前的标书信息和投标单位的投标信息生成初始的回标文件;
并对初始的回标文件进行压缩处理和格式转换,得到最终的回标文件。
作为优选,获取历史的招投标文件的招投标信息,提取招投标信息的关键词,根据关键词将招投标信息划分为历史的标书信息和历史的回标信息。
作为优选,使用TextRank算法提取招投标信息的关键词,包括如下步骤:
将招投标信息分割为若干完整的句子;
对每个句子进行分词和词性标注处理,过滤停用词并保留指定词性的单词,得到若干候选关键词;
根据若干候选关键词构建候选关键词图,并构建候选关键词之间的连接关系;
根据候选关键词之间的连接关系迭代传播建候选关键词图中各候选关键词的权重直至迭代结果收敛,对候选关键词的权重进行倒序排序,根据排序结果得到若干关键词;
标书信息的关键词包括招标邀请函、投标人须知、招标项目的技术要求及附件、投标书格式、投标保证文件、合同条件、技术标准及规范、投标企业资格文件、合同格式,回标信息的关键词包括投标声明、投标报价表、技术偏离表、投标人简况及资格证明文件、投标技术文件以及业绩资料,根据上述关键词,将招投标信息分为标书信息和回标信息;
TextRank算法的公式为:
Figure GDA0003782447250000101
式中,WS(Vi)、WS(Vj)分别为关键词节点Vi与Vj的得分函数;d为阻尼系数,取值范围为0-1;wji、wjk分别为关键词节点Vj到Vi与到Vk的权重;Out(Vi)为关键词节点Vi的指向节点集合;Vi、Vk、Vj均为关键词节点;i、j、k均为节点指示量。
作为优选,使用标书分析模型对当前的标书文件进行分析,包括如下步骤:
将当前的标书文件转化为统一的图片格式,得到标书图像;
对标书图像进行预处理,得到预处理后图像,并提取预处理后图像的特征数据;
对特征数据进行文本识别,得到当前的标书信息。
作为优选,基于递归神经网络使用联想记忆字符识别方法对标书文件的特征数据进行文本识别,包括如下步骤:
使用标书分析模型对当前的标书文件的特征数据进行一次识别,得到一次识别结果,并根据词典映射表将一次识别结果转化为一次向量数据;
将特征数据、一次识别结果以及一次向量数据输入标书分析模型进行二次识别,得到二次识别结果,并根据词典映射表将二次识别结果转化为二次向量数据;
将特征数据、二次识别结果以及二次向量数据输入标书分析模型进行三次识别,得到三次识别结果,并根据词典映射表将三次识别结果转化为三次向量数据;
将特征数据、n次识别结果以及n次向量数据输入标书分析模型进行n+1次识别,得到n+1次识别结果,并根据词典映射表将n+1次识别结果转化为n+1次向量数据,其中,n为递归次数指示量,且n为大于2的正整数,直至达到递归次数阈值n=N,将n+1次识别结果作为最终的识别结果,即当前的标书信息。
作为优选,使用回标生成模型生成初始的回标文件,包括如下步骤:
建立空白文件,并使用回标生成模型提取当前的标书信息中的投标项目和回标文件结构;
根据投标项目匹配投标单位的投标信息;
将对应的投标单位的投标信息按照回标文件结构写入空白文件,得到初始的回标文件。
本发明提供的回标文件生成方法,通过采集历史的招投标文件基于神经网络训练标书分析模型和回标生成模型,标书分析模型对输入的标书文件进行自动分析,获取回标文件所需的投标项目和文件格式,回标生成模型根据投标项目和文件格式自动生成对应的回标文件,本方法基于神经网络和TextRank算法,提高了标书文件分析和回标文件生成的效率和准确度。
本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。

Claims (10)

1.一种回标文件生成系统,其特征在于:包括信息采集单元、标书分析单元以及回标生成单元,所述的信息采集单元、标书分析单元以及回标生成单元依次连接,且信息采集单元连接有外部的招投标数据库;
信息采集单元用于采集历史的招投标文件,并对招投标文件进行分析,得到的历史的标书信息和回标信息;标书分析单元设置有根据历史的标书信息训练得到的标书分析模型,用于接收招标单位的标书文件并使用标书分析模型对标书文件进行分析得到当前的标书信息;回标生成单元设置有根据历史的回标信息训练得到的回标生成模型,用于根据当前的标书信息和投标信息使用回标生成模型生成回标文件;
基于递归神经网络根据历史的标书信息建立标书分析模型,所述的递归神经网络的公式为:
Figure FDA0003782447240000011
式中,xi(t)、xj(t)、xj(t-τij(t))均为递归神经网络的状态;f(*)为状态相关函数;aij、bij均为网络的权值;τij(t)为时变时滞;ui为外部输入;yi=f(xi(t))为递归神经网络的输出;i、j均为指示量;t为时刻自变量;
基于LSTM-FC神经网络根据历史的回标信息建立回标生成模型,LSTM-FC神经网络的公式为:
Figure FDA0003782447240000012
式中,ft为t时刻的遗忘门函数;
Figure FDA0003782447240000013
为t时刻的输入值;ut、ut-1为t、t-1时刻的输出值;σ为Sigmoid函数;it为t时刻的输入门函数;gt为t时刻的中间层函数;ot为t时刻的输出门函数;st、st-1分别为t、t-1时刻的神经元状态函数;bf、bi、bg、bo分别为遗忘门、输入门、中间层以及输出门的偏置值;Φ(*)为Tanh函数;Wfa、Wfh均为遗忘门函数的权重;Wia、Wih均为输入门函数的权重;Wga、Wgh均为中间层函数的权重;Woa、Woh均为输出门函数的权重。
2.根据权利要求1所述的回标文件生成系统,其特征在于:所述的信息采集单元包括文件采集端口、格式转换模块、预处理模块、特征提取模块、文本识别模块、关键词提取模块以及存储模块,所述的文件采集端口、格式转换模块、预处理模块、特征提取模块、文本识别模块、关键词提取模块以及存储模块依次连接,且文件输入端口连接有外部的招投标数据库,所述的关键词提取模块与标书分析单元连接。
3.根据权利要求2所述的回标文件生成系统,其特征在于:所述的标书分析单元包括标书输入端口、调用模块以及标书分析模块,所述的标书输入端口和调用模块均与标书分析模块依次连接,所述的调用模块与信息采集单元连接,所述的标书分析模块设置有标书分析模型,且标书分析模块与回标生成单元连接。
4.根据权利要求3所述的回标文件生成系统,其特征在于:所述的回标生成单元包括投标信息输入端口、回标生成模块以及文件处理模块,所述的投标信息输入端口、回标生成模块以及文件处理模块依次连接,所述的回标生成模块与标书分析单元连接,且回标生成模块设置有回标生成模型。
5.一种回标文件生成方法,基于如权利要求4所述的回标文件生成系统,其特征在于:包括如下步骤:
采集历史的招投标文件,并对招投标文件进行分析,得到的历史的标书信息和历史的回标信息;
基于神经网络根据历史的标书信息建立标书分析模型,并基于神经网络根据历史的回标信息建立回标生成模型;
获取当前的标书文件,使用标书分析模型对当前的标书文件进行分析,得到当前的标书信息;
使用回标生成模型根据当前的标书信息和投标单位的投标信息生成初始的回标文件;
对初始的回标文件进行压缩处理和格式转换,得到最终的回标文件。
6.根据权利要求5所述的回标文件生成方法,其特征在于:获取历史的招投标文件的招投标信息,提取招投标信息的关键词,根据关键词将招投标信息划分为历史的标书信息和历史的回标信息。
7.根据权利要求6所述的回标文件生成方法,其特征在于:使用TextRank算法提取招投标信息的关键词,包括如下步骤:
将招投标信息分割为若干完整的句子;
对每个句子进行分词和词性标注处理,过滤停用词并保留指定词性的单词,得到若干候选关键词;
根据若干候选关键词构建候选关键词图,并构建候选关键词之间的连接关系;
根据候选关键词之间的连接关系迭代传播建候选关键词图中各候选关键词的权重直至迭代结果收敛,对候选关键词的权重进行倒序排序,根据排序结果得到若干关键词;
TextRank算法的公式为:
Figure FDA0003782447240000031
式中,WS(Vi)、WS(Vj)分别为关键词节点Vi与Vj的得分函数;d为阻尼系数,取值范围为0-1;wji、wjk分别为关键词节点Vj到Vi与到Vk的权重;Out(Vi)为关键词节点Vi的指向节点集合;Vi、Vk、Vj均为关键词节点;i、j、k均为节点指示量。
8.根据权利要求5所述的回标文件生成方法,其特征在于:使用标书分析模型对当前的标书文件进行分析,包括如下步骤:
将当前的标书文件转化为统一的图片格式,得到标书图像;
对标书图像进行预处理,得到预处理后图像,并提取预处理后图像的特征数据;
对特征数据进行文本识别,得到当前的标书信息。
9.根据权利要求8所述的回标文件生成方法,其特征在于:基于递归神经网络使用联想记忆字符识别方法对标书文件的特征数据进行文本识别,包括如下步骤:
使用标书分析模型对当前的标书文件的特征数据进行一次识别,得到一次识别结果,并根据词典映射表将一次识别结果转化为一次向量数据;
将特征数据、一次识别结果以及一次向量数据输入标书分析模型进行二次识别,得到二次识别结果,并根据词典映射表将二次识别结果转化为二次向量数据;
将特征数据、二次识别结果以及二次向量数据输入标书分析模型进行三次识别,得到三次识别结果,并根据词典映射表将三次识别结果转化为三次向量数据;
将特征数据、n次识别结果以及n次向量数据输入标书分析模型进行n+1次识别,得到n+1次识别结果,并根据词典映射表将n+1次识别结果转化为n+1次向量数据,其中,n为递归次数指示量,且n为大于2的正整数,直至达到递归次数阈值n=N,将n+1次识别结果作为最终的识别结果,即当前的标书信息。
10.根据权利要求5所述的回标文件生成方法,其特征在于:使用回标生成模型生成初始的回标文件,包括如下步骤:
建立空白文件,并使用回标生成模型提取当前的标书信息中的投标项目和回标文件结构;
根据投标项目匹配投标单位的投标信息;
将对应的投标单位的投标信息按照回标文件结构写入空白文件,得到初始的回标文件。
CN202210496259.4A 2022-05-09 2022-05-09 一种回标文件生成系统及其方法 Active CN114580362B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210496259.4A CN114580362B (zh) 2022-05-09 2022-05-09 一种回标文件生成系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210496259.4A CN114580362B (zh) 2022-05-09 2022-05-09 一种回标文件生成系统及其方法

Publications (2)

Publication Number Publication Date
CN114580362A CN114580362A (zh) 2022-06-03
CN114580362B true CN114580362B (zh) 2022-11-01

Family

ID=81769231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210496259.4A Active CN114580362B (zh) 2022-05-09 2022-05-09 一种回标文件生成系统及其方法

Country Status (1)

Country Link
CN (1) CN114580362B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115470340B (zh) * 2022-10-31 2023-01-13 深圳平安综合金融服务有限公司 基于产品底层知识的多需求融合标书筛选方法
CN117408651A (zh) * 2023-12-15 2024-01-16 辽宁省网联数字科技产业有限公司 基于人工智能的招标方案在线编制方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232177A (zh) * 2019-05-23 2019-09-13 广东鼎义互联科技股份有限公司 一种政务领域的标书生成系统及方法
CN111782772A (zh) * 2020-07-24 2020-10-16 平安银行股份有限公司 基于ocr技术的文本自动生成方法、装置、设备及介质
CN113312893A (zh) * 2021-06-17 2021-08-27 中冶地集团西北岩土工程有限公司 一种企业标书制作辅助方法、装置、设备及系统
CN113449504A (zh) * 2021-06-25 2021-09-28 郑州信源信息技术股份有限公司 一种标书智能评分方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10642846B2 (en) * 2017-10-13 2020-05-05 Microsoft Technology Licensing, Llc Using a generative adversarial network for query-keyword matching
CN108874771A (zh) * 2018-05-25 2018-11-23 福州大学 一种面向招标文本的信息抽取方法
US11361032B2 (en) * 2019-11-29 2022-06-14 Responsify Ltd. Computer driven question identification and understanding within a commercial tender document for automated bid processing for rapid bid submission and win rate enhancement
CN112328555B (zh) * 2020-11-25 2022-11-04 国家电网有限公司 一种招标文件的快速生成方法
CN112632228A (zh) * 2020-12-30 2021-04-09 深圳供电局有限公司 一种基于文本挖掘的辅助评标方法及系统
CN112651218A (zh) * 2020-12-31 2021-04-13 盘锦丙衡商务服务有限公司 一种标书自动生成方法、管理方法、介质以及计算机
CN113988020A (zh) * 2021-10-19 2022-01-28 苏州思萃融合基建技术研究所有限公司 工程技术标标书编制方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232177A (zh) * 2019-05-23 2019-09-13 广东鼎义互联科技股份有限公司 一种政务领域的标书生成系统及方法
CN111782772A (zh) * 2020-07-24 2020-10-16 平安银行股份有限公司 基于ocr技术的文本自动生成方法、装置、设备及介质
CN113312893A (zh) * 2021-06-17 2021-08-27 中冶地集团西北岩土工程有限公司 一种企业标书制作辅助方法、装置、设备及系统
CN113449504A (zh) * 2021-06-25 2021-09-28 郑州信源信息技术股份有限公司 一种标书智能评分方法及系统

Also Published As

Publication number Publication date
CN114580362A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN114580362B (zh) 一种回标文件生成系统及其方法
US20220147836A1 (en) Method and device for text-enhanced knowledge graph joint representation learning
CN111444700A (zh) 一种基于语义文档表达的文本相似度量方法
CN112989761B (zh) 文本分类方法及装置
Ling et al. Intelligent document processing based on RPA and machine learning
CN111597341B (zh) 一种文档级关系抽取方法、装置、设备及存储介质
CN112269868A (zh) 一种基于多任务联合训练的机器阅读理解模型的使用方法
CN111738169A (zh) 一种基于端对端网络模型的手写公式识别方法
CN110222192A (zh) 语料库建立方法及装置
CN116150335A (zh) 一种军事场景下文本语义检索方法
CN110457450A (zh) 基于神经网络模型的答案生成方法及相关设备
CN111160345A (zh) 一种企业合同智能生成系统及方法
CN114372475A (zh) 一种基于RoBERTa模型的网络舆情情感分析方法及系统
CN114706559A (zh) 一种基于需求识别的软件规模度量方法
CN109741824A (zh) 一种基于机器学习的医疗问诊方法
CN114048354B (zh) 基于多元表征和度量学习的试题检索方法、装置及介质
CN113076744A (zh) 一种基于卷积神经网络的文物知识关系抽取方法
CN113743079A (zh) 一种基于共现实体交互图的文本相似度计算方法及装置
CN112364160A (zh) 一种结合ALBERT和BiGRU的专利文本分类方法
CN115640401B (zh) 文本内容提取方法及装置
CN111651660A (zh) 一种跨媒体检索困难样本的方法
CN115984400A (zh) 基于手绘草图的图像自动生成方法及系统
CN115577080A (zh) 一种问题回复匹配方法、系统、服务器及存储介质
CN113869054A (zh) 一种基于深度学习的电力领域项目特征识别方法
CN114998960A (zh) 一种基于正负样本对比学习的表情识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant