CN117687972B - 一种基于区块链的招标文件生成方法 - Google Patents
一种基于区块链的招标文件生成方法 Download PDFInfo
- Publication number
- CN117687972B CN117687972B CN202311580972.8A CN202311580972A CN117687972B CN 117687972 B CN117687972 B CN 117687972B CN 202311580972 A CN202311580972 A CN 202311580972A CN 117687972 B CN117687972 B CN 117687972B
- Authority
- CN
- China
- Prior art keywords
- content
- processed
- bidding
- item
- bidding document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000035945 sensitivity Effects 0.000 claims abstract description 24
- 238000004806 packaging method and process Methods 0.000 claims abstract description 4
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于区块链的招标文件生成方法,属于文件处理技术领域,包括以下步骤:S1、根据若干个历史招标文件的存储信息确定内容敏感阈值;S2、获取空白招标文档模板以及待处理招标内容;S3、生成待处理文本内容和待处理图像内容;S4、生成标准文本内容和标准图像内容;S5、将标准文本内容和标准图像内容填入空白招标文档模板中,生成标准招标文档;S6、将标准招标文档和特征信息打包为文件交易区块,将文件交易区块加入区块链进行广播发布。本发明公开了一种基于区块链的招标文件生成方法,利用历史招标文件的敏感词汇以及内容确定一个可以帮助筛选不符合要求单词的内容敏感阈值。
Description
技术领域
本发明属于文件处理技术领域,具体涉及一种基于区块链的招标文件生成方法。
背景技术
区块链技术在近些年持续发展,其本质是一个共享的数据库,存储数据信息或交易记录,具有可追溯、不可篡改、公开透明等特点,因此可以用于保存招标文件。招标文件需要包括招标的项目的具体情况、要求以及中标后合同格式等等,并提供统一格式,以利于投标。并且招标文件的内容需要合法合规,然而现有招标文件生成方法多采用人工撰写及检查,容易出现纰漏。
发明内容
本发明为了解决以上问题,提出了一种基于区块链的招标文件生成方法。
本发明的技术方案是:一种基于区块链的招标文件生成方法包括以下步骤:
S1、获取若干个历史招标文件的存储信息,并根据若干个历史招标文件的存储信息确定内容敏感阈值;
S2、获取空白招标文档模板以及待处理招标内容;
S3、对待处理招标内容进行拆分,生成待处理文本内容和待处理图像内容;
S4、根据内容敏感阈值,对待处理文本内容进行预处理,生成标准文本内容;对待处理图像内容进行去噪处理,生成标准图像内容;
S5、将标准文本内容和标准图像内容填入空白招标文档模板中,生成标准招标文档;
S6、为标准招标文档生成特征信息,并将标准招标文档和特征信息打包为文件交易区块,将文件交易区块加入区块链进行广播发布。
进一步地,S1中,历史招标文件的存储信息包括项目名称、项目内容以及项目内容中已剔除的单词。
进一步地,S1包括以下子步骤:
S11、提取各个历史招标文件的项目内容中所有关键词,为各个历史招标文件生成项目关键词集合;
S12、根据各个历史招标文件的项目关键词集合以及项目名称,计算各个历史招标文件的项目内容匹配度,生成项目内容匹配度集合;
S13、根据项目内容匹配度集合以及各个历史招标文件的项目内容中已剔除的单词,计算内容敏感阈值。
上述进一步方案的有益效果是:在本发明中,根据历史招标文件的项目名称与项目关键词集合,确定可以表征项目名称与项目关键词集合关联度的参数,即项目内容匹配度,再将项目内容匹配度与生成历史招标文件过程中已删除的敏感词汇做运算,确定内容敏感阈值,其可以用于筛选敏感词汇,保证生成的招标文件的合规性。
进一步地,S12中,历史招标文件的项目内容匹配度p的计算公式为:;式中,m表示历史招标文件的项目关键词个数,n表示项目名称与项目关键词集合中相同单词的个数,ε表示极小值,M表示项目内容的单词个数,C表示常数。
进一步地,S13中,内容敏感阈值ω的计算公式为:;式中,pk表示第k个历史招标文件的项目内容匹配度,max(·)表示最大值运算,K表示历史招标文件的个数,Rk表示第k个历史招标文件的项目内容中已剔除的单词个数,Mk表示第k个历史招标文件的项目内容的单词个数,log(·)表示对数函数。
进一步地,S4包括以下子步骤:
S41、提取待处理文本内容中所有关键词,生成文本关键词集合;
S42、根据文本关键词集合以及所有历史招标文件的项目关键词集合,计算待处理文本内容的单词关键权重;
S43、根据待处理文本内容的单词关键权重,计算待处理文本内容中各个单词的敏感权重;
S44、将大于内容敏感阈值的敏感权重对应的单词删除,完成对待处理文本内容的预处理,生成标准文本内容;
S45、对待处理图像内容进行去噪处理,生成标准图像内容。
上述进一步方案的有益效果是:在本发明中,利用待处理文本内容的关键词来确定整个文本内容的单词关键权重,利用整个文本内容的单词关键权重来确定各个单词的敏感权重,再与之前确定的内容敏感阈值做大小比较,即可剔除敏感权重不正常的单词,保证标准文本内容中尽可能少的包含敏感词汇。
进一步地,S42中,待处理文本内容的单词关键权重σ的计算公式为:;式中,X表示文本关键词集合,Y表示所有历史招标文件的项目关键词集合,A表示待处理文本内容的单词个数,B表示文本关键词集合的关键词个数,fb表示待处理文本内容中第b个关键词的逆文档频率。
进一步地,S43中,待处理文本内容中第a个单词的敏感权重λa的计算公式为:;式中,Fa表示待处理文本内容中第a个单词的词频,A表示待处理文本内容的单词个数,σ表示待处理文本内容的单词关键权重。
进一步地,S6中,标准招标文档的特征信息包括标准招标文档的所有关键词以及各个关键词的词频。
本发明的有益效果是:本发明公开了一种基于区块链的招标文件生成方法,利用历史招标文件的敏感词汇以及内容确定一个可以帮助筛选不符合要求单词的内容敏感阈值,通过内容敏感阈值与待处理招标内容中各个单词的敏感权重之间进行大小比较并进行剔除处理,就可以生成符合要求的标准招标文档;另外,本发明还对招标文件的图片进行预处理,保证招标文件中图片的清晰度;经过上述过程生成的招标文件清楚明了地展示项目内容,符合规范。
附图说明
图1为基于区块链的招标文件生成方法的流程图。
实施方式
下面结合附图对本发明的实施例作进一步的说明。
如图1所示,本发明提供了一种基于区块链的招标文件生成方法,包括以下步骤:
S1、获取若干个历史招标文件的存储信息,并根据若干个历史招标文件的存储信息确定内容敏感阈值;
S2、获取空白招标文档模板以及待处理招标内容;
S3、对待处理招标内容进行拆分,生成待处理文本内容和待处理图像内容;
S4、根据内容敏感阈值,对待处理文本内容进行预处理,生成标准文本内容;对待处理图像内容进行去噪处理,生成标准图像内容;
S5、将标准文本内容和标准图像内容填入空白招标文档模板中,生成标准招标文档;
S6、为标准招标文档生成特征信息,并将标准招标文档和特征信息打包为文件交易区块,将文件交易区块加入区块链进行广播发布。
在本发明实施例中,S1中,历史招标文件的存储信息包括项目名称、项目内容以及项目内容中已剔除的单词。
历史招标文件为已制作完成且具有参考性的文件,其包含具体的招标项目名称、该项目对应的详细介绍(项目内容)和用于辅助说明的招标图片。其中,在生成历史招标文件的过程中,会删除不符合招标要求或敏感的词汇,即为“项目内容中已剔除的词汇”,比如“跑标”、“陪标”以及“阴阳合同”等词汇。
在本发明实施例中,S1包括以下子步骤:
S11、提取各个历史招标文件的项目内容中所有关键词,为各个历史招标文件生成项目关键词集合;
S12、根据各个历史招标文件的项目关键词集合以及项目名称,计算各个历史招标文件的项目内容匹配度,生成项目内容匹配度集合;
S13、根据项目内容匹配度集合以及各个历史招标文件的项目内容中已剔除的单词,计算内容敏感阈值。
在本发明中,根据历史招标文件的项目名称与项目关键词集合,确定可以表征项目名称与项目关键词集合关联度的参数,即项目内容匹配度,再将项目内容匹配度与生成历史招标文件过程中已删除的敏感词汇做运算,确定内容敏感阈值,其可以用于筛选敏感词汇,保证生成的招标文件的合规性。
在本发明实施例中,S12中,历史招标文件的项目内容匹配度p的计算公式为:;式中,m表示历史招标文件的项目关键词个数,n表示项目名称与项目关键词集合中相同单词的个数,ε表示极小值,M表示项目内容的单词个数,C表示常数。
在本发明实施例中,S13中,内容敏感阈值ω的计算公式为:;式中,pk表示第k个历史招标文件的项目内容匹配度,max(·)表示最大值运算,K表示历史招标文件的个数,Rk表示第k个历史招标文件的项目内容中已剔除的单词个数,Mk表示第k个历史招标文件的项目内容的单词个数,log(·)表示对数函数。
在本发明实施例中,S4包括以下子步骤:
S41、提取待处理文本内容中所有关键词,生成文本关键词集合;
S42、根据文本关键词集合以及所有历史招标文件的项目关键词集合,计算待处理文本内容的单词关键权重;
S43、根据待处理文本内容的单词关键权重,计算待处理文本内容中各个单词的敏感权重;
S44、将大于内容敏感阈值的敏感权重对应的单词删除,完成对待处理文本内容的预处理,生成标准文本内容;
S45、对待处理图像内容进行去噪处理,生成标准图像内容。
在本发明中,利用待处理文本内容的关键词来确定整个文本内容的单词关键权重,利用整个文本内容的单词关键权重来确定各个单词的敏感权重,再与之前确定的内容敏感阈值做大小比较,即可剔除敏感权重不正常的单词,保证标准文本内容中尽可能少的包含敏感词汇。
在本发明实施例中,S42中,待处理文本内容的单词关键权重σ的计算公式为:;式中,X表示文本关键词集合,Y表示所有历史招标文件的项目关键词集合,A表示待处理文本内容的单词个数,B表示文本关键词集合的关键词个数,fb表示待处理文本内容中第b个关键词的逆文档频率。
在本发明实施例中,S43中,待处理文本内容中第a个单词的敏感权重λa的计算公式为:;式中,Fa表示待处理文本内容中第a个单词的词频,A表示待处理文本内容的单词个数,σ表示待处理文本内容的单词关键权重。
在本发明实施例中,S6中,标准招标文档的特征信息包括标准招标文档的所有关键词以及各个关键词的词频。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (6)
1.一种基于区块链的招标文件生成方法,其特征在于,包括以下步骤:
S1、获取若干个历史招标文件的存储信息,并根据若干个历史招标文件的存储信息确定内容敏感阈值;
所述S1包括以下子步骤:
S11、提取各个历史招标文件的项目内容中所有关键词,为各个历史招标文件生成项目关键词集合;
S12、根据各个历史招标文件的项目关键词集合以及项目名称,计算各个历史招标文件的项目内容匹配度,生成项目内容匹配度集合;
S13、根据项目内容匹配度集合以及各个历史招标文件的项目内容中已剔除的单词,计算内容敏感阈值;
所述S12中,历史招标文件的项目内容匹配度p的计算公式为:;式中,m表示历史招标文件的项目关键词个数,n表示项目名称与项目关键词集合中相同单词的个数,ε表示极小值,M表示项目内容的单词个数,C表示常数;
所述S13中,内容敏感阈值ω的计算公式为:;式中,pk表示第k个历史招标文件的项目内容匹配度,max(·)表示最大值运算,K表示历史招标文件的个数,Rk表示第k个历史招标文件的项目内容中已剔除的单词个数,Mk表示第k个历史招标文件的项目内容的单词个数,log(·)表示对数函数;
S2、获取空白招标文档模板以及待处理招标内容;
S3、对待处理招标内容进行拆分,生成待处理文本内容和待处理图像内容;
S4、根据内容敏感阈值,对待处理文本内容进行预处理,生成标准文本内容;对待处理图像内容进行去噪处理,生成标准图像内容;
S41、提取待处理文本内容中所有关键词,生成文本关键词集合;
S42、根据文本关键词集合以及所有历史招标文件的项目关键词集合,计算待处理文本内容的单词关键权重;
S43、根据待处理文本内容的单词关键权重,计算待处理文本内容中各个单词的敏感权重;
S44、将大于内容敏感阈值的敏感权重对应的单词删除,完成对待处理文本内容的预处理,生成标准文本内容;
S5、将标准文本内容和标准图像内容填入空白招标文档模板中,生成标准招标文档;
S6、为标准招标文档生成特征信息,并将标准招标文档和特征信息打包为文件交易区块,将文件交易区块加入区块链进行广播发布。
2.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述S1中,历史招标文件的存储信息包括项目名称、项目内容以及项目内容中已剔除的单词。
3.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述S4还包括以下子步骤:
S45、对待处理图像内容进行去噪处理,生成标准图像内容。
4.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述S42中,待处理文本内容的单词关键权重σ的计算公式为:;式中,X表示文本关键词集合,Y表示所有历史招标文件的项目关键词集合,A表示待处理文本内容的单词个数,B表示文本关键词集合的关键词个数,fb表示待处理文本内容中第b个关键词的逆文档频率。
5.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述S43中,待处理文本内容中第a个单词的敏感权重λa的计算公式为:;式中,Fa表示待处理文本内容中第a个单词的词频,A表示待处理文本内容的单词个数,σ表示待处理文本内容的单词关键权重。
6.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述S6中,标准招标文档的特征信息包括标准招标文档的所有关键词以及各个关键词的词频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311580972.8A CN117687972B (zh) | 2023-11-24 | 2023-11-24 | 一种基于区块链的招标文件生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311580972.8A CN117687972B (zh) | 2023-11-24 | 2023-11-24 | 一种基于区块链的招标文件生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117687972A CN117687972A (zh) | 2024-03-12 |
CN117687972B true CN117687972B (zh) | 2024-06-18 |
Family
ID=90134296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311580972.8A Active CN117687972B (zh) | 2023-11-24 | 2023-11-24 | 一种基于区块链的招标文件生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117687972B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113919305A (zh) * | 2020-07-10 | 2022-01-11 | 腾讯科技(深圳)有限公司 | 一种文档生成方法、设备及计算机可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000079460A1 (en) * | 1999-06-23 | 2000-12-28 | Webango, Inc. | Method for buy-side bid management |
CN114547696A (zh) * | 2022-03-23 | 2022-05-27 | 平安证券股份有限公司 | 文件脱敏方法、装置、电子设备及存储介质 |
CN115577691A (zh) * | 2022-09-27 | 2023-01-06 | 海尔优家智能科技(北京)有限公司 | 标书生成方法、存储介质及电子装置 |
CN116825269A (zh) * | 2023-07-04 | 2023-09-29 | 康键信息技术(深圳)有限公司 | 体检报告的处理方法、装置、电子设备和可读存储介质 |
-
2023
- 2023-11-24 CN CN202311580972.8A patent/CN117687972B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113919305A (zh) * | 2020-07-10 | 2022-01-11 | 腾讯科技(深圳)有限公司 | 一种文档生成方法、设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
基于DELPHI语言的招标管理信息系统开发;刘昭斌, 王高山;德州学院学报;20010630(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117687972A (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11816121B2 (en) | System and method for matching of database records based on similarities to search queries | |
US10783367B2 (en) | System and method for data extraction and searching | |
US11816165B2 (en) | Identification of fields in documents with neural networks without templates | |
US7031969B2 (en) | System and method for identifying relationships between database records | |
CN111931774B (zh) | 药品数据的入库方法及系统 | |
WO2020234749A1 (en) | Representative document hierarchy generation | |
US20180181646A1 (en) | System and method for determining identity relationships among enterprise data entities | |
CN107229627B (zh) | 一种文本处理方法、装置及计算设备 | |
US9286526B1 (en) | Cohort-based learning from user edits | |
CN113095076A (zh) | 敏感词识别方法、装置、电子设备及存储介质 | |
CN112015721A (zh) | 一种基于大数据的电商平台存储数据库的优化方法 | |
US20220335073A1 (en) | Fuzzy searching using word shapes for big data applications | |
CN110287493B (zh) | 风险短语识别方法、装置、电子设备及存储介质 | |
US20230138491A1 (en) | Continuous learning for document processing and analysis | |
CN112464927A (zh) | 一种信息提取方法、装置及系统 | |
CN117687972B (zh) | 一种基于区块链的招标文件生成方法 | |
CN109344388B (zh) | 一种垃圾评论识别方法、装置及计算机可读存储介质 | |
CN116244421A (zh) | 项目名称匹配的方法、装置、设备及可读存储介质 | |
CN115688788A (zh) | 用于审计领域的命名实体识别模型的训练方法及相关设备 | |
CA3156204A1 (en) | Domain based text extraction | |
CN112559739A (zh) | 电力设备绝缘状态数据处理方法 | |
CN112328709B (zh) | 一种实体标注方法及装置、服务器、存储介质 | |
CN114969385B (zh) | 基于文档属性赋值实体权重的知识图谱优化方法及装置 | |
US20160110315A1 (en) | Methods and systems for digitizing a document | |
CN116681042B (zh) | 基于关键字提取的内容概要生成方法、系统及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |