CN117131197B - 一种招标书的需求类别处理方法、装置、设备及存储介质 - Google Patents
一种招标书的需求类别处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117131197B CN117131197B CN202311403479.9A CN202311403479A CN117131197B CN 117131197 B CN117131197 B CN 117131197B CN 202311403479 A CN202311403479 A CN 202311403479A CN 117131197 B CN117131197 B CN 117131197B
- Authority
- CN
- China
- Prior art keywords
- bid
- bidding
- text
- data
- requirement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012545 processing Methods 0.000 title claims description 28
- 230000004044 response Effects 0.000 claims abstract description 67
- 230000002776 aggregation Effects 0.000 claims abstract description 18
- 238000004220 aggregation Methods 0.000 claims abstract description 18
- 238000003672 processing method Methods 0.000 claims abstract description 11
- 238000010586 diagram Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 abstract description 18
- 238000012216 screening Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Mathematical Physics (AREA)
- Entrepreneurship & Innovation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种招标书的需求类别处理方法、装置、设备及存储介质。该方法包括:获取至少两个招投标数据分别对应的至少一个招投标文本组合,获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度,针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度,根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度,基于至少一个招标需求关联度,对各招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别。本发明实施例解决了文本相似度算法与招标需求文本匹配度不高的问题。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种招标书的需求类别处理方法、装置、设备及存储介质。
背景技术
由于招标书通常直接给出具体的招标需求文本,如“项目经理需要3年以上工作经验”,但不会写明招标需求文本所属的招标需求类别,如“项目人员要求”。
因此在招标书的文本处理任务中,通常会涉及到招标需求类别的解读步骤,该步骤主要通过对多个招标书中的招标需求文本进行聚类,从聚类结果的整体上分析多个招标书所涉及到的招标需求类别,以便为后续指定招标书的招标需求文本的提取、投标书的匹配、投标书的文本生成等场景应用提供数据支撑。
目前,上述招标需求文本的聚类操作依赖于文本相似度算法实现。但即便是在同一招标书中,针对同一招标需求类别,也经常会出现文本内容相差很大的两种招标需求文本,如同样针对“项目人员要求”,招标需求文本可能是“项目经理需要3年以上工作经验”,也可能是“工程师需要具备工程类证书”。因此高度依赖文本内容的文本相似度算法与招标需求文本的适配性并不高,从而使得对招标书的招标需求类别的解读准确度不高。
发明内容
本发明实施例提供了一种招标书的需求类别处理方法、装置、设备及存储介质,以解决文本相似度算法与目标招标文本匹配度不高的问题,提高目标招标文本的聚类效果,从而提高招标需求类别的解读准确度。
根据本发明一个实施例提供了一种招标书的需求类别处理方法,该方法包括:
获取至少两个招投标数据分别对应的至少一个招投标文本组合;其中,所述招投标数据中包含成对匹配的招标书和投标书,所述招投标文本组合中包含所述招标书中的招标文本和所述投标书中的投标文本;
获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度;
针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度;
根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度;
基于至少一个招标需求关联度,对各所述招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别。
根据本发明另一个实施例提供了一种招标书的需求类别处理装置,该装置包括:
招投标文本组合获取模块,用于获取至少两个招投标数据分别对应的至少一个招投标文本组合;其中,所述招投标数据中包含成对匹配的招标书和投标书,所述招投标文本组合中包含所述招标书中的招标文本和所述投标书中的投标文本;
响应匹配度获取模块,用于获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度;
投标文本相似度获取模块,用于针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度;
招标需求关联度确定模块,用于根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度;
招标需求类别确定模块,用于基于至少一个招标需求关联度,对各所述招投标文本组合中各招标文本进行聚类得到招标文本聚类集的招标需求类别。
根据本发明另一个实施例提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的招标书的需求类别处理方法。
根据本发明另一个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的招标书的需求类别处理方法。
本发明实施例的技术方案,通过获取至少两个招投标数据分别对应的至少一个招投标文本组合中的投标文本响应招标文本的响应匹配度,针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度,根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度,基于至少一个招标需求关联度,对各招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别,本发明实施例利用了招标文本与投标文本的文本结构关系以及投标文本与投标文本的文本内容关系,构建了招标文本与招标文本的文本关联关系,解决了文本相似度算法与招标需求文本匹配度不高的问题,提高了招标需求文本的聚类效果,从而提高了招标需求类别的解读准确度。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的一种招标书的需求类别处理方法的流程图;
图2为本发明一个实施例所提供的一种招投标关联图的示意图;
图3为本发明一个实施例所提供的一种招标需求关联度的示意图;
图4为本发明一个实施例所提供的另一种招标书的需求类别处理方法的流程图;
图5为本发明一个实施例所提供的一种招标书的需求类别处理装置的结构示意图;
图6为本发明一个实施例所提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“初始”、“目标”、“参考”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明一个实施例所提供的一种招标书的需求类别处理方法的流程图,本实施例可适用于对多个招标书共同所涉及到的招标需求类别进行解读处理的情况,该方法可以由招标书的需求类别处理装置来执行,该招标书的需求类别处理装置可以采用硬件和/或软件的形式实现,该招标书的需求类别处理装置可配置于终端设备中。如图1所示,该方法包括:
S110、获取至少两个招投标数据分别对应的至少一个招投标文本组合。
在本实施例中,招投标数据中包含成对匹配的招标书和投标书,招投标文本组合中包含招标书中的招标文本和投标书中的投标文本。
在一个可选实施例中,各招投标数据中的招标书属于同一招标书类别,或者,各招投标数据中的投标书属于同一投标书类别。示例性的,招标书类别/投标书类别包括但不限于建筑工程、采购、委托、信息系统、矿产资源开发等等,当然,建筑工程还可以进一步划分为建筑物、道路、桥梁、地铁等等。此处对招标书类别/投标书类别的划分维度和划分粒度均不作限定,具体可根据实际需求自定义设置。
这样设置好处在于,可以对某一招标书类别或某一投标书类别所涉及到的招标需求类别进行解读,从而可以提高解读到的招标需求类别的个性化需求定制水平。
在另一个可选实施例中,各招投标数据中的招标书属于不同招标书类别,或者,各招投标数据中的投标书属于不同投标书类别。这样设置的好处在于,可以提高解读到的招标需求类别的通用性水平,进而扩宽了后续的场景应用。
在本实施例中,招投标数据中的招标书中记录有与招标需求相关的文本内容,投标书中记录有响应招标书中各项招标需求的与投标资质相关的文本内容。当然,招标书中还可以记录有与招标相关的其他文本内容,投标书中还可以记录有投标相关的其他文本内容,此处对其他文本内容不作限定。
其中,具体的,招标文本用于表征与招标需求相关的文本内容,如“项目经理需要3年以上工作经验”,投标文本可用于表征基于最小章节维度的文本内容,如一级标题-二级标题-三级标题下的章节文本内容。示例性的,从第个招投标数据中的招标书/>中提取出的第/>个招标文本可表示为/>,从投标书/>中提取出的第/>个投标文本可表示为/>。
在一个可选实施例中,招标文本可以是人为从招标书中筛选得到的,投标文本可以是人为基于最小章节维度从投标书中拆分得到的。
在另一个可选实施例中,获取至少两个招投标数据分别对应的至少一个招投标文本组合,包括:针对每个招投标数据,基于预设关键词数据,从招投标数据中的招标书中获取至少一个招标文本;采用最小章节维度,对招投标数据中的投标书执行拆分操作得到至少一个投标文本;基于各招标文本和各投标文本,构建招投标数据对应的至少一个招投标文本组合。
其中,具体的,预设关键词数据中包含至少一个招标需求关键词。在一个可选实施例中,招标需求关键词可用于表征与招标书类别/投标书类别对应设置的与招标需求相关的关键词。示例性的,假设招标书类别/投标书类别为建筑物,则各招标需求关键词包括但不限于投标企业规模、交付时间期限、项目经理、施工地理位置等等,假设招标书类别/投标书类别为采购,则各招标需求关键词包括但不限于采购清单、资产配置、采购标准、验收标准等等。此处对不同招标书类别/投标书类别分别对应设置的招标需求关键词的具体设置标准不作限定,具体可根据实际需求自定义设置。
其中,具体的,各招投标文本组合表征招标书中的各招标文本和投标书中的各投标文本的所有组合形式。示例性的,假设第个招投标数据中的招标书/>中包含/>个招标文本,投标书/>中包含/>个投标文本,则第/>个招投标数据对应的招投标文本组合的数量为/>个。
S120、获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度。
在一个可选实施例中,响应匹配度可以是人工标注的。示例性的,如果招投标文本组合中投标文本应答了招投标文本组合中的招标文本,则将招投标文本组合中投标文本响应招标文本的响应匹配度设置为第一数值,如果招投标文本组合中投标文本没有应答招投标文本组合中的招标文本,则将招投标文本组合中投标文本响应招标文本的响应匹配度设置为第二数值。其中,第一数值大于第二数值。示例性的,第一数值可以为1,第二数值可以为0,此处对第一数值和第二数值的具体参数值不作限定,具体可根据实际需求自定义设置。
举例而言,假设招投标文本组合中的投标文本A包含“本公司拥有工作年限超过5年的项目经理4名”,如果招投标文本组合中的招标文本A为“项目经理需要3年以上工作经验”,则说明投标文本A应答了招标文本A,如果招投标文本组合中的招标文本A为“工程师需要具备工程类证书”,则说明投标文本A没有应答招标文本A。
在另一个可选实施例中,获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度,包括:针对每个招投标文本组合,将招投标文本组合中的投标文本和招标文本添加到匹配度提示模板中,得到匹配度提示语;将匹配度提示语输入到通用领域语言模型,以输出招投标文本组合中的投标文本响应招标文本的响应匹配度。
在本实施例中,匹配度提示模板包括匹配度提示字段、与投标文本对应的投标文本描述字段以及与招标文本对应的招标文本描述字段。具体的,匹配度提示字段用于描述通用领域语言模型需要执行的匹配度计算任务,投标文本描述字段用于对投标文本进行描述,招标文本描述字段用于对招标文本进行描述。
在本实施例中,通用领域语言模型表征具有庞大的参数规模和复杂程度的机器学习模型,或者表征具有数百万到数十亿参数的神经网络模型,通用领域语言模型需要大量的计算资源和存储空间,往往采用分布式计算和特殊的硬件技术。通用领域语言模型具备更强的泛化能力和表达能力。
举例而言,匹配度提示语可以为“已知招投标文本组合包括投标文本和招标文本,其中,投标文本为{本公司拥有工作年限超过5年的项目经理4名},招标文本为{项目经理需要3年以上工作经验},请计算招投标文本组合中的投标文本应答招标文本的响应匹配度”。此处仅对匹配度提示语进行示例性说明,并不对其进行限定。
这样设置的好处在于,可以提高招投标文本组合对应的响应匹配度的获取效率和精确度。
示例性的,招投标文本组合中的投标文本/>响应招标文本/>的响应匹配度可表示/>。
S130、针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度。
本实施例中构建了至少两个招投标数据对应的所有组合形式,假设招投标数据的数量为个,则任意两个招投标数据的组合形式的数量为/>个。
其中,具体的,任意两个招投标数据包括第一招投标数据和第二招投标数据,投标文本相似度用于表征第一招投标数据中第一投标书中的任意投标文本与第二招投标数据中第二投标书中的任意投标文本之间的文本相似度。示例性的,文本相似度算法包括但不限于欧式距离、余弦相似度、最小编辑距离、杰卡德相似度、词频-逆文件频率等。此处对采用的相似度算法不作限定,具体可根据实际需求自定义设置。
其中,示例性的,第一招投标数据中投标书中的/>个投标文本与第二招投标数据中投标书/>中的/>个投标文本分别对应的投标文本相似度构成的文本相似度数据/>可表示为:
其中,表示投标书/>中第/>个投标文本与投标书/>中第/>个投标文本对应的投标文本相似度。
由于在应答相似的招标需求时,不同投标书通常都是在相同的投标模板内容的基础上进行的个性化修正,使得不同投标书中的投标文本之间存在较高的文本相似度,因此传统的相似度算法与投标文本的匹配度较高,采用传统的相似度算法可计算得到较准确的投标文本相似度。
S140、根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度。
在一个可选实施例中,该方法还包括:根据至少两个招投标文本组合,构建招投标关联图。在本实施例中,招投标关联图属于二部图,招投标关联图中的节点代表招标文本和投标文本。
图2为本发明一个实施例所提供的一种招投标关联图的示意图,图2以第个招投标数据和第/>个招投标数据分别对应的各招投文本组合构成的招投标关联图为例。具体的,招投标关联图中第一虚线层中的各节点为第/>个招投标数据中招标书/>中的/>个招标文本,分别为/>、…、/>,第二虚线层中的各节点为第/>个招投标数据中投标书/>中的/>个投标文本,分别为/>、…、/>,第三虚线层中的各节点为第/>个招投标数据中投标书/>中的/>个投标文本,分别为、…、/>,第四虚线层中的各节点为第/>个招投标数据中招标书/>中的/>个招标文本,分别为/>、…、/>。
在上述实施例的基础上,根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度,包括:将响应匹配度作为招投标关联图中每个招投标数据中的招标文本和投标文本之间的边路径权重,将投标文本相似度作为任意两个招投标数据分别对应的投标文本之间的边路径权重;从两个招投标数据中的第一招标书中获取第一招标文本以及从两个招投标数据中的第二招标书中获取第二招标文本;从招投标关联图中查找与第一招标文本和第二招标文本对应的至少一条招标路径;基于各招标路径分别对应的三个边路径权重,确定第一招标文本和第二招标文本之间的招标需求关联度。
以图2为例,第一虚线层与第二虚线层之间的各边路径权重为招标书中的个招标文本与投标书/>中的/>个投标文本之间的响应匹配度,边路径权重的数量为/>个;第二虚线层与第三虚线层之间的各边路径权重为投标书/>中的/>个投标文本与投标书/>中的/>个投标文本之间的投标文本相似度,边路径权重的数量为个;第三虚线层与第四虚线层之间的各边路径权重为投标书/>中的/>个投标文本与招标书/>中的/>个招标文本之间的响应匹配度,边路径权重的数量为/>个。
图3为本发明一个实施例所提供的一种招标需求关联度的示意图,图3以第一招标文本为,第二招标文本为/>为例,招投标关联图中与第一招标文本/>和第二招标文本/>对应的招标路径的数量为/>个。
在一个可选实施例中,基于各招标路径分别对应的三个边路径权重,确定第一招标文本和第二招标文本之间的招标需求关联度,包括:针对每个招标路径,将招标路径中三个边路径权重的乘积作为招标路径对应的路径相似度;基于各路径相似度对应的统计值作为第一招标文本和第二招标文本对应的招标需求关联度。
其中,具体的,三个边路径权重包括第一虚线层与第二虚线层之间的边路径权重、第二虚线层与第三虚线层之间的边路径权重以及第三虚线层与第四虚线层之间的边路径权重。
其中,示例性的,统计值可以为最大值、最小值、中值或平均值,此处对统计值的选择不作限定,具体可根据实际需求自定义设置。
由于本发明实施例中同一投标文本可能同时应答多个招标文本,也就是说,同一投标文本与多个招标文本分别对应的响应匹配度均较高,因此即便响应匹配度是人为标注的,且标注结果中存在较小的标注错误率,也不会使得招标需求关联度出现较大误差,进一步保证了招标需求关联度的稳定性。
S150、基于至少一个招标需求关联度,对各招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别。
其中,示例性的,聚类算法包括但不限于K-均值聚类算法、均值漂移聚类算法、基于密度的聚类算法和凝聚层次聚类算法等,此处对采用的聚类算法不作限定,具体可根据实际需求自定义设置。
在一个可选实施例中,获取人为基于招标文本聚类集输入的招标需求类别。
在另一个可选实施例中,针对每个招标文本聚类集,对招标文本聚类集中至少一个招标文本执行分词操作,得到至少两个招标分词,将出现频次最高的招标分词作为招标文本聚类集的招标需求类别。
本实施例的技术方案,利用了招标文本与投标文本的文本结构关系以及投标文本与投标文本的文本内容关系,构建了招标文本与招标文本的文本关联关系,解决了文本相似度算法与招标需求文本匹配度不高的问题,提高了招标需求文本的聚类效果,从而提高了招标需求类别的解读准确度。
图4为本发明一个实施例所提供的另一种招标书的需求类别处理方法的流程图,本实施例对上述实施例中的招标书的需求类别处理方法进行进一步细化。如图4所示,该方法包括:
S210、获取至少两个招投标数据分别对应的至少一个招投标文本组合。
S220、获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度。
S230、针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度。
S240、根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度。
本实施例中的S210-S240与上述实施例中图1所示的S110-S140对应相同或类似,本实施例在此不再赘述。
S250、基于至少一个招标需求关联度,对各招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别。
在一个可选实施例中,基于至少一个招标需求关联度,对各招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别,包括:基于至少一个招标需求关联度,对各招投标数据中的各招标文本进行聚类得到招标文本聚类集;基于招标文本聚类集中至少一个招标文本分别对应的响应匹配度,从各投标书中获取与招标文本聚类集对应的至少一个投标标题框架;基于各投标标题框架,确定招标文本聚类集的招标需求类别。
其中,具体的,与招标文本对应的投标文本包括与招标文本所属的招标书成对匹配的投标书中的至少一个投标文本,与招标文本对应的响应匹配度为上述各投标文本分别响应该招标文本的响应匹配度。示例性的,招标文本聚类集包括招标文本,则与该招标文本对应的投标文本包括/>、…、/>,相应的,与该招标文本对应的响应匹配度包括/>,/>表示投标书/>对应的投标文本的总数量。
在一个可选实施例中,针对招标文本聚类集中的每个招标文本,将与招标文本对应的响应匹配度大于匹配度阈值的至少一个投标文本分别作为目标招标文本;针对每个目标招标文本,将目标招标文本所属的投标书中的与目标招标文本对应的标题框架作为与招标文本对应的投标标题框架。示例性的,匹配度阈值可以为0.5,此处对匹配度阈值不作限定,具体可根据实际需求自定义设置。
在另一个可选实施例中,针对招标文本聚类集中的每个招标文本,基于与招标文本对应的至少两个响应匹配度,对与招标文本对应的投标文本进行降序排序,将排名靠前的预设数量的投标文本分别作为目标招标文本;针对每个目标招标文本,将目标招标文本所属的投标书中的与目标招标文本对应的标题框架作为与招标文本对应的投标标题框架。示例性的,预设数量可以为10个或20个,此处对预设数量不作限定,具体可根据实际需求自定义设置。
其中,具体的,不同招标文本聚类集中的各招标文本不存在重叠的招标文本,不同招标文本聚类集分别对应的各投标标题框架之间可能存在重叠的投标标题框架。示例性的,假设投标文本A既应答招标书A中的招标文本A,又应答历史招标书A中的招标文本B,如果招标文本A和招标文本B属于不同的招标文本聚类集,则两个招标文本聚类集分别对应的各投标标题框架中均包含投标文本A对应的标题框架A。
在一个可选实施例中,基于各投标标题框架,确定招标文本聚类集的招标需求类别,包括:获取各投标标题框架中各投标标题分别对应的出现频次,将出现频次最高的投标标题作为招标文本聚类集的招标需求类别。
在另一个可选实施例中,基于各投标标题框架,确定招标文本聚类集的招标需求类别,包括:获取各投标标题框架中至少一个一级投标标题分别对应的出现频次,将出现频次最高的一级投标标题作为招标文本聚类集的招标需求类别。
S260、将招标文本聚类集中的各招标文本以及与招标文本聚类集的招标需求类别作为训练样本。
S270、基于训练样本,对初始需求类别识别模型进行训练得到训练完成的目标需求类别识别模型。
其中,具体的,将训练样本输入到未训练完成的初始需求类别识别模型中,得到输出的预测需求类别,基于预测需求类别和招标需求类别,确定损失函数,基于损失函数对初始需求类别识别模型的模型参数进行调整,直到损失函数收敛时,将初始需求类别识别模型作为训练完成的目标需求类别识别模型。
其中,示例性的,初始需求类别识别模型的模型架构包括但不限于卷积神经网络模型、循环神经网络模型、Transformer模型、递归神经网络模型、双向长短时记忆网络模型或BERT模型等,此处对初始需求类别识别模型的模型架构不作限定,具体可根据实际需求自定义选择。
其中,示例性的,损失函数的函数类型包括但不限于平方损失函数、对数损失函数、指数损失函数、均方误差损失函数、逻辑回归损失函数、Huber损失函数、交叉熵损失函数和Kullback-Leibler散度损失函数等等。此处对损失函数的函数类型不作限定,具体可根据实际需求自定义选择。
其中,具体的,可基于多个招标需求类别训练同一个目标需求类别识别模型,也可以基于多个招标需求类别分别训练一个目标需求类别识别模型。
在上述实施例的基础上,可选的,该方法还包括:将待测招标书中的至少一个待测招标文本分别输入训练完成的目标需求类别识别模型,以输出至少一个目标招标文本以及各目标招标文本分别对应的目标招标需求类别;基于各目标招标文本和各目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容;根据各目标投标文本内容,生成与待测招标书对应的目标投标书。
其中,示例性的,待测招标文本可以是采用句子维度拆分得到的招标文本,也可以是人为对待测招标书进行需求标注得到的,还可以是基于预设关键词数据从待测招标书中提取得到的。
其中,具体的,目标招标文本用于表征待测招标书中与招标需求相关的文本内容,目标招标需求类别为至少一个目标招标文本所属的招标需求类别。示例性的,当目标需求类别识别模型输出的预测招标需求类别不为空时,将预测招标需求类别作为目标招标需求类别,并将预测招标需求类别对应的待测招标文本作为目标招标文本。
其中,具体的,目标需求类别识别模型的作用是从多个待测招标文本中筛选出与招标需求相关的目标招标文本,并确定各目标招标文本分别对应的目标招标需求类别。
在一个可选实施例中,目标招标需求类别对应的参考投标标题框架可以是由S250中与目标招标需求类别对应的招标文本聚类集对应的各投标标题框架构成的。
在另一个可选实施例中,基于S250中与目标招标需求类别对应的招标文本聚类集对应的各投标标题框架,构建第一投标标题框架;针对每个标题级,获取各第一投标标题框架中与当前标题级对应的各第一投标标题分别对应的出现频次,并基于各出现频次,确定与当前标题级对应的至少一个参考投标标题;基于各标题级分别对应的参考投标标题,确定目标招标需求类别对应的参考投标标题框架。
其中,具体的,基于各出现频次,确定与当前标题级对应的至少一个参考投标标题,包括:基于各第一投标标题分别对应的出现频次,对各第一投标标题进行降序排序,将排名靠前的预设数量的第一投标标题作为当前标题级对应的参考投标标题。示例性的,预设数量可以为2个或3个,不同标题级分别对应的预设数量可以相同,也可以不同。如一级标题对应的预设数量为1个,二级标题对应的预设数量为2个,三级标题对应的预设数量为3个等等。
这样设置的好处在于,可以降低后续投标生成提示语中的参考投标标题框架的数据量,从而提高了通用领域语言模型的输出效率以及输出结果的准确度。
在本实施例中,投标生成提示语包括标题筛选提示语和文本生成提示语,目标投标文本内容包括与标题筛选提示语对应的目标投标标题框架和与文本生成提示语对应的目标投标章节内容。
其中,具体的,标题筛选提示语用于提示通用领域语言模型从各目标招标需求类别分别对应的参考投标标题框架中提取出与目标招标文本匹配的目标投标标题框架,文本生成提示语用于提示通用领域语言模型生成符合目标投标标题框架和目标招标文本的目标投标章节内容。
其中,具体的,基于各目标招标需求类别分别对应的参考投标标题框架,构建第二投标标题框架;针对每个目标招标文本,基于第二投标标题框架、目标招标文本和标题筛选提示模板,生成与目标招标文本对应的至少一个标题筛选提示语;获取通用领域语言模型基于输入的各标题筛选提示语输出的与目标招标文本对应的目标投标标题框架;将目标招标文本和目标投标标题框架分别添加到文本生成提示模板中的对应字段位置,得到文本生成提示语。
其中,具体的,第二投标标题框架为至少一个目标招标需求类别分别对应的参考投标标题框架拼接组合成的投标标题框架。
在一个可选实施例中,基于第二投标标题框架、目标招标文本和标题筛选提示模板,生成与目标招标文本对应的标题筛选提示语,包括:将第二投标标题框架和目标招标文本添加到标题筛选提示模板中,得到与目标招标文本对应的标题筛选提示语。
在本实施例中,标题筛选提示模板中包含标题筛选提示字段、与第二投标标题框架对应的第二标题描述字段以及与目标招标文本对应的招标文本描述字段。具体的,标题筛选提示字段用于描述通用领域语言模型需要执行的标题筛选任务以及筛选要求,第二标题描述字段用于对第二投标标题框架进行描述,招标文本描述字段用于对目标招标文本进行描述。
在另一个可选实施例中,基于第二投标标题框架、目标招标文本和标题筛选提示模板,生成与目标招标文本对应的标题筛选提示语,包括:将目标招标文本和第二投标标题框架中的至少一个第二一级标题添加到标题筛选提示模板中,得到第一标题筛选提示语;获取通用领域语言模型基于输入的第一标题筛选提示语从各第二一级标题中选择的目标一级标题,将目标招标文本和第二投标标题框架中与目标一级标题对应的至少一个第二二级标题添加到标题筛选提示模板中,得到第二标题筛选提示语。
在本实施例中,文本生成提示模板中包含文本生成提示字段、与目标招标文本对应的招标文本描述字段以及与目标投标标题框架对应的目标标题描述字段。具体的,文本生成提示字段用于描述通用领域语言模型需要执行的投标文本生成任务以及文本生成要求,目标标题描述字段用于对目标投标标题框架进行描述。
其中,具体的,针对目标招标文本,将与目标招标文本对应的至少一个标题筛选提示语输入通用领域语言模型,以输出目标招标文本对应的目标投标标题框架,将与目标招标文本对应的文本生成提示语输入通用领域语言模型,以输出目标招标文本对应的目标投标章节内容。
其中,具体的,基于各目标投标文本内容中的目标投标标题框架,对各目标投标标题框架下的目标投标章节内容进行拼接组合得到与目标招标书对应的目标投标书。
本实施例的技术方案,通过将招标文本聚类集中的各招标文本以及与招标文本聚类集的招标需求类别作为训练样本,基于训练样本,对初始需求类别识别模型进行训练得到训练完成的目标需求类别识别模型,解决了传统的需求类别识别模型的训练样本需要人工标注的问题,提高了招标需求类别的标注效率和标注准确度,从而提高了需求类别识别模型的训练效率和训练准确度。
本实施例进一步通过对将待测招标书中的至少一个待测招标文本分别输入训练完成的目标需求类别识别模型,以输出至少一个目标招标文本以及各目标招标文本分别对应的目标招标需求类别,基于各目标招标文本和各目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语,将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容,根据各目标投标文本内容,生成与待测招标书对应的目标投标书,解决了招标文本的提取问题,提高了招标文本的提取效率和准确度,进而提高了投标书的生成效率和文本质量。
需要说明的是,本发明的技术方案中,所涉及的招标书和投标书的收集、使用、保存、共享和转移等处理,均符合相关法律法规的规定,当适用时,对招标书和投标书中的保密文本内容进行了去标识化和/或匿名化和/或加密的技术处理。
以下是本发明实施例提供的招标书的需求类别处理装置的实施例,该装置与上述实施例的招标书的需求类别处理方法属于同一个发明构思,在招标书的需求类别处理装置的实施例中未详尽描述的细节内容,可以参考上述实施例中关于招标书的需求类别处理方法的内容。
图5为本发明一个实施例所提供的一种招标书的需求类别处理装置的结构示意图。如图5所示,该装置包括:招投标文本组合获取模块310、响应匹配度获取模块320、投标文本相似度获取模块330、招标需求关联度确定模块340和招标需求类别确定模块350。
其中,招投标文本组合获取模块310,用于获取至少两个招投标数据分别对应的至少一个招投标文本组合;其中,招投标数据中包含成对匹配的招标书和投标书,招投标文本组合中包含招标书中的招标文本和投标书中的投标文本;
响应匹配度获取模块320,用于获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度;
投标文本相似度获取模块330,用于针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度;
招标需求关联度确定模块340,用于根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度;
招标需求类别确定模块350,用于基于至少一个招标需求关联度,对各招投标文本组合中各招标文本进行聚类得到招标文本聚类集的招标需求类别。
本实施例的技术方案,利用了招标文本与投标文本的文本结构关系以及投标文本与投标文本的文本内容关系,构建了招标文本与招标文本的文本关联关系,解决了文本相似度算法与招标需求文本匹配度不高的问题,提高了招标需求文本的聚类效果,从而提高了招标需求类别的解读准确度。
在一个可选实施例中,该装置还包括:
目标需求类别识别模型训练模块,用于将招标文本聚类集中的各招标文本以及与招标文本聚类集的招标需求类别作为训练样本;
基于训练样本,对初始需求类别识别模型进行训练得到训练完成的目标需求类别识别模型。
在一个可选实施例中,该装置还包括:
目标投标书生成模块,用于将待测招标书中的至少一个待测招标文本分别输入训练完成的目标需求类别识别模型,以输出至少一个目标招标文本以及各目标招标文本分别对应的目标招标需求类别;
基于各目标招标文本和各目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;
将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容;
根据各目标投标文本内容,生成与待测招标书对应的目标投标书。
在一个可选实施例中,该装置还包括:
招投标关联图构建模块,用于根据至少两个招投标文本组合,构建招投标关联图;其中,招投标关联图中的节点代表招标文本和投标文本;
在一个可选实施例中,招标需求关联度确定模块340,包括:
边路径权重确定单元,用于将响应匹配度作为招投标关联图中每个招投标数据中的招标文本和投标文本之间的边路径权重,将投标文本相似度作为任意两个招投标数据分别对应的投标文本之间的边路径权重;
第二招标文本获取单元,用于从两个招投标数据中的第一招标书中获取第一招标文本以及从两个招投标数据中的第二招标书中获取第二招标文本;
招标路径查找单元,用于从招投标关联图中查找与第一招标文本和第二招标文本对应的至少一条招标路径;
招标需求关联度确定单元,用于基于各招标路径分别对应的三个边路径权重,确定第一招标文本和第二招标文本之间的招标需求关联度。
在一个可选实施例中,招标需求关联度确定单元,具体用于:
针对每个招标路径,将招标路径中三个边路径权重的乘积作为招标路径对应的路径相似度;
基于各路径相似度对应的统计值作为第一招标文本和第二招标文本对应的招标需求关联度。
在一个可选实施例中,招标需求类别确定模块350,具体用于:
基于至少一个招标需求关联度,对各招投标数据中的各招标文本进行聚类得到招标文本聚类集;
基于招标文本聚类集中至少一个招标文本分别对应的响应匹配度,从各投标书中获取与招标文本聚类集对应的至少一个投标标题框架;
基于各投标标题框架,确定招标文本聚类集的招标需求类别。
在一个可选实施例中,招投标文本组合获取模块310,具体用于:
针对每个招投标数据,基于预设关键词数据,从招投标数据中的招标书中获取至少一个招标文本;
采用最小章节维度,对招投标数据中的投标书执行拆分操作得到至少一个投标文本;
基于各招标文本和各投标文本,构建招投标数据对应的至少一个招投标文本组合。
在一个可选实施例中,响应匹配度获取模块320,具体用于:
针对每个招投标文本组合,将招投标文本组合中的投标文本和招标文本添加到匹配度提示模板中,得到匹配度提示语;
将匹配度提示语输入到通用领域语言模型,以输出招投标文本组合中的投标文本响应招标文本的响应匹配度;
其中,匹配度提示模板包括匹配度提示字段、与投标文本对应的投标文本描述字段以及与招标文本对应的招标文本描述字段。
本发明实施例所提供的招标书的需求类别处理装置可执行本发明任意实施例所提供的招标书的需求类别处理方法,具备执行方法相应的功能模块和有益效果。
图6为本发明一个实施例所提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器11执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如上述实施例提供的招标书的需求类别处理方法。
在一些实施例中,上述实施例提供的招标书的需求类别处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的招标书的需求类别处理方法中的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行招标书的需求类别处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的招标书的需求类别处理方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (9)
1.一种招标书的需求类别处理方法,其特征在于,包括:
获取至少两个招投标数据分别对应的至少一个招投标文本组合;其中,所述招投标数据中包含成对匹配的招标书和投标书,所述招投标文本组合中包含所述招标书中的招标文本和所述投标书中的投标文本;
根据至少两个招投标文本组合,构建招投标关联图;其中,所述招投标关联图中的节点代表招标文本和投标文本;
获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度;
针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度;
根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度;
基于至少一个招标需求关联度,对各所述招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别;
所述根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度,包括:
将所述响应匹配度作为所述招投标关联图中每个招投标数据中的招标文本和投标文本之间的边路径权重,将所述投标文本相似度作为任意两个招投标数据分别对应的投标文本之间的边路径权重;
从两个招投标数据中的第一招标书中获取第一招标文本以及从两个招投标数据中的第二招标书中获取第二招标文本;
从所述招投标关联图中查找与所述第一招标文本和所述第二招标文本对应的至少一条招标路径;
基于各所述招标路径分别对应的三个边路径权重,确定第一招标文本和第二招标文本之间的招标需求关联度;
所述基于各所述招标路径分别对应的三个边路径权重,确定第一招标文本和第二招标文本之间的招标需求关联度,包括:
针对每个招标路径,将所述招标路径中三个边路径权重的乘积作为所述招标路径对应的路径相似度;
将各所述路径相似度对应的统计值作为所述第一招标文本和第二招标文本对应的招标需求关联度。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述招标文本聚类集中的各招标文本以及与所述招标文本聚类集的招标需求类别作为训练样本;
基于所述训练样本,对初始需求类别识别模型进行训练得到训练完成的目标需求类别识别模型。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将待测招标书中的至少一个待测招标文本分别输入训练完成的目标需求类别识别模型,以输出至少一个目标招标文本以及各所述目标招标文本分别对应的目标招标需求类别;
基于各所述目标招标文本和各所述目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;
将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容;
根据各所述目标投标文本内容,生成与所述待测招标书对应的目标投标书。
4.根据权利要求1所述的方法,其特征在于,所述基于至少一个招标需求关联度,对各所述招投标数据中的各招标文本进行聚类得到招标文本聚类集的招标需求类别,包括:
基于至少一个招标需求关联度,对各所述招投标数据中的各招标文本进行聚类得到招标文本聚类集;
基于所述招标文本聚类集中至少一个招标文本分别对应的响应匹配度,从各所述投标书中获取与所述招标文本聚类集对应的至少一个投标标题框架;
基于各所述投标标题框架,确定所述招标文本聚类集的招标需求类别。
5.根据权利要求1所述的方法,其特征在于,所述获取至少两个招投标数据分别对应的至少一个招投标文本组合,包括:
针对每个招投标数据,基于预设关键词数据,从所述招投标数据中的招标书中获取至少一个招标文本;
采用最小章节维度,对所述招投标数据中的投标书执行拆分操作得到至少一个投标文本;
基于各所述招标文本和各所述投标文本,构建所述招投标数据对应的至少一个招投标文本组合。
6.根据权利要求1所述的方法,其特征在于,所述获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度,包括:
针对每个招投标文本组合,将所述招投标文本组合中的投标文本和招标文本添加到匹配度提示模板中,得到匹配度提示语;
将所述匹配度提示语输入到通用领域语言模型,以输出招投标文本组合中的投标文本响应招标文本的响应匹配度;
其中,所述匹配度提示模板包括匹配度提示字段、与所述投标文本对应的投标文本描述字段以及与所述招标文本对应的招标文本描述字段。
7.一种招标书的需求类别处理装置,其特征在于,包括:
招投标文本组合获取模块,用于获取至少两个招投标数据分别对应的至少一个招投标文本组合;其中,所述招投标数据中包含成对匹配的招标书和投标书,所述招投标文本组合中包含所述招标书中的招标文本和所述投标书中的投标文本;
招投标关联图构建模块,用于根据至少两个招投标文本组合,构建招投标关联图;其中,所述招投标关联图中的节点代表招标文本和投标文本;
响应匹配度获取模块,用于获取每个招投标文本组合中的投标文本响应招标文本的响应匹配度;
投标文本相似度获取模块,用于针对任意两个招投标数据,获取两个招投标数据分别对应的投标文本之间的投标文本相似度;
招标需求关联度确定模块,用于根据两个招投标数据分别对应的至少一个响应匹配度以及两个招投标数据对应的至少一个投标文本相似度,确定两个招投标数据分别对应的招标文本之间的招标需求关联度;
招标需求类别确定模块,用于基于至少一个招标需求关联度,对各所述招投标文本组合中各招标文本进行聚类得到招标文本聚类集的招标需求类别;
所述招标需求关联度确定模块,包括:
边路径权重确定单元,用于将所述响应匹配度作为所述招投标关联图中每个招投标数据中的招标文本和投标文本之间的边路径权重,将所述投标文本相似度作为任意两个招投标数据分别对应的投标文本之间的边路径权重;
第二招标文本获取单元,用于从两个招投标数据中的第一招标书中获取第一招标文本以及从两个招投标数据中的第二招标书中获取第二招标文本;
招标路径查找单元,用于从所述招投标关联图中查找与所述第一招标文本和所述第二招标文本对应的至少一条招标路径;
招标需求关联度确定单元,用于基于各所述招标路径分别对应的三个边路径权重,确定第一招标文本和第二招标文本之间的招标需求关联度;
所述招标需求关联度确定单元,具体用于:
针对每个招标路径,将所述招标路径中三个边路径权重的乘积作为所述招标路径对应的路径相似度;
将各所述路径相似度对应的统计值作为所述第一招标文本和第二招标文本对应的招标需求关联度。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的招标书的需求类别处理方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-6中任一项所述的招标书的需求类别处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311403479.9A CN117131197B (zh) | 2023-10-27 | 2023-10-27 | 一种招标书的需求类别处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311403479.9A CN117131197B (zh) | 2023-10-27 | 2023-10-27 | 一种招标书的需求类别处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117131197A CN117131197A (zh) | 2023-11-28 |
CN117131197B true CN117131197B (zh) | 2024-01-12 |
Family
ID=88853090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311403479.9A Active CN117131197B (zh) | 2023-10-27 | 2023-10-27 | 一种招标书的需求类别处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117131197B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2815441A1 (fr) * | 2000-10-16 | 2002-04-19 | Trade Match Com France | Procede de traitement d'un appel d'offres |
CN108985600A (zh) * | 2018-07-03 | 2018-12-11 | 龙马智芯(珠海横琴)科技有限公司 | 企业竞争力的分析方法、计算机可读存储介质及分析装置 |
CN110516037A (zh) * | 2019-07-29 | 2019-11-29 | 广东鼎义互联科技股份有限公司 | 一种政务领域的招标文件分析系统 |
WO2019245182A1 (ko) * | 2018-06-21 | 2019-12-26 | (주)엔터랩 | 조달입찰정보 매칭방법, 장치 및 프로그램 |
CN110969517A (zh) * | 2019-11-25 | 2020-04-07 | 佰聆数据股份有限公司 | 一种招投标生命周期关联方法、系统、存储介质及计算机设备 |
CN115099911A (zh) * | 2022-07-07 | 2022-09-23 | 缆宝(武汉)科技发展有限公司 | 一种适用于大宗商品的招投标方法及系统 |
CN115760258A (zh) * | 2022-11-04 | 2023-03-07 | 中铁一局集团建筑安装工程有限公司 | 投标文件智能生成方法、系统、计算机装置和存储介质 |
CN116757808A (zh) * | 2023-08-18 | 2023-09-15 | 江西省精彩纵横采购咨询有限公司 | 一种基于大数据的投标文件自动生成方法及系统 |
-
2023
- 2023-10-27 CN CN202311403479.9A patent/CN117131197B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2815441A1 (fr) * | 2000-10-16 | 2002-04-19 | Trade Match Com France | Procede de traitement d'un appel d'offres |
WO2019245182A1 (ko) * | 2018-06-21 | 2019-12-26 | (주)엔터랩 | 조달입찰정보 매칭방법, 장치 및 프로그램 |
CN108985600A (zh) * | 2018-07-03 | 2018-12-11 | 龙马智芯(珠海横琴)科技有限公司 | 企业竞争力的分析方法、计算机可读存储介质及分析装置 |
CN110516037A (zh) * | 2019-07-29 | 2019-11-29 | 广东鼎义互联科技股份有限公司 | 一种政务领域的招标文件分析系统 |
CN110969517A (zh) * | 2019-11-25 | 2020-04-07 | 佰聆数据股份有限公司 | 一种招投标生命周期关联方法、系统、存储介质及计算机设备 |
CN115099911A (zh) * | 2022-07-07 | 2022-09-23 | 缆宝(武汉)科技发展有限公司 | 一种适用于大宗商品的招投标方法及系统 |
CN115760258A (zh) * | 2022-11-04 | 2023-03-07 | 中铁一局集团建筑安装工程有限公司 | 投标文件智能生成方法、系统、计算机装置和存储介质 |
CN116757808A (zh) * | 2023-08-18 | 2023-09-15 | 江西省精彩纵横采购咨询有限公司 | 一种基于大数据的投标文件自动生成方法及系统 |
Non-Patent Citations (1)
Title |
---|
建设工程招投标腐败画像特征与监测预警研究;李玉;《硕士论文 工程科技辑》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117131197A (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106897428B (zh) | 文本分类特征提取方法、文本分类方法及装置 | |
CN107436875B (zh) | 文本分类方法及装置 | |
CN113360711B (zh) | 视频理解任务的模型训练和执行方法、装置、设备及介质 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN117150000B (zh) | 一种投标书的生成方法、装置、设备及存储介质 | |
CN115858764A (zh) | 一种文稿推荐方法、装置、设备及介质 | |
CN117971698A (zh) | 测试用例生成方法、装置、电子设备和存储介质 | |
CN117370520A (zh) | 分流的对话处理方法、装置、设备及介质 | |
US11074591B2 (en) | Recommendation system to support mapping between regulations and controls | |
CN116309002B (zh) | 图数据存储、访问、处理方法、训练方法、设备及介质 | |
CN117131197B (zh) | 一种招标书的需求类别处理方法、装置、设备及存储介质 | |
CN113612777B (zh) | 训练方法、流量分级方法、装置、电子设备以及存储介质 | |
CN112818221B (zh) | 实体的热度确定方法、装置、电子设备及存储介质 | |
CN114756753A (zh) | 一种产品推荐方法、装置、电子设备及存储介质 | |
CN114528378A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN112784600A (zh) | 信息排序方法、装置、电子设备和存储介质 | |
CN113360602B (zh) | 用于输出信息的方法、装置、设备以及存储介质 | |
CN114547417B (zh) | 一种媒体资源排序方法及电子设备 | |
CN115795023B (zh) | 文档推荐方法、装置、设备以及存储介质 | |
CN116644724B (zh) | 一种投标书生成方法、装置、设备及存储介质 | |
CN114547448B (zh) | 数据处理、模型训练方法、装置、设备、存储介质及程序 | |
CN116932913A (zh) | 一种信息推送方法、装置、设备及存储介质 | |
CN116756539A (zh) | 项目推荐方法、装置、计算机设备及存储介质 | |
CN118228713A (zh) | 一种需求文档生成方法、装置、电子设备及存储介质 | |
CN117668209A (zh) | 一种文档推荐方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |