CN117150000B - 一种投标书的生成方法、装置、设备及存储介质 - Google Patents

一种投标书的生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117150000B
CN117150000B CN202311403481.6A CN202311403481A CN117150000B CN 117150000 B CN117150000 B CN 117150000B CN 202311403481 A CN202311403481 A CN 202311403481A CN 117150000 B CN117150000 B CN 117150000B
Authority
CN
China
Prior art keywords
bid
bidding
title
demand
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311403481.6A
Other languages
English (en)
Other versions
CN117150000A (zh
Inventor
詹立雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202311403481.6A priority Critical patent/CN117150000B/zh
Publication of CN117150000A publication Critical patent/CN117150000A/zh
Application granted granted Critical
Publication of CN117150000B publication Critical patent/CN117150000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/08Auctions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种投标书的生成方法、装置、设备及存储介质。该方法包括:基于与目标招标书的招标书类别对应的历史招投标数据集,确定至少一个参考招标需求类别以及至少一个参考投标标题框架;基于目标招标书和各参考招标需求类别,生成至少一个需求筛选提示语,并获取通用领域语言模型基于输入的各需求筛选提示语输出的至少一个招标需求文本;基于各招标需求文本和各参考投标标题框架,生成至少一个投标生成提示语,并获取通用领域语言模型基于输入的各投标生成提示语输出的至少一个目标投标文本内容,基于各目标投标文本内容,生成与目标招标书对应的目标投标书。本发明实施例提高了投标书生成的可定制化水平。

Description

一种投标书的生成方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种投标书的生成方法、装置、设备及存储介质。
背景技术
投标书是指投标单位按照招标书的条件和要求,向招标单位提交的报价并填具标单的文书。传统的投标书生成方法是提前设定投标书模板,将从投标文件中提取出与招标需求相关的投标文本数据对应填充到投标书模板中得到投标书。但该方法受到投标书模板的限制,使得生成的投标书的文本结构单一,可定制化能力差。
随着通用领域语言模型的技术发展,自然语言的处理任务越来越多的开始使用通用领域语言模型实现。为了保证输出结果的精确度,通用领域语言模型对输入的任务提示语有较高的要求。
而投标书中需要包含符合指定招标书中招标需求的特定文本内容,因此投标书的生成在自然语言处理中属于受限文本生成任务。并且投标书的布局结构复杂,文本内容庞大,如何设置满足投标书生成需求的任务提示语是实现可定制化的招标书的技术关键。
发明内容
本发明实施例提供了一种投标书的生成方法、装置、设备及存储介质,以解决传统技术生成的投标书的文本质量差问题,提高投标书的可定制化水平,丰富投标书的文本结构和文本内容。
根据本发明一个实施例提供了一种投标书的生成方法,该方法包括:
获取与目标招标书的招标书类别对应的历史招投标数据集;其中,所述历史招投标数据集中包含至少两个招投标数据;
基于各所述招投标数据中成对匹配的历史招标书和历史投标书,确定至少一个参考招标需求类别以及各所述参考招标需求类别分别对应的参考投标标题框架;
基于所述目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语;
将至少一个需求筛选提示语输入通用领域语言模型,以输出至少一个目标招标需求类别以及各所述目标招标需求类别分别对应的至少一个招标需求文本;
基于各所述招标需求文本和各所述目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;
将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容,并基于各所述目标投标文本内容,生成与所述目标招标书对应的目标投标书。
根据本发明另一个实施例提供了一种投标书的生成装置,该装置包括:
历史招投标数据集获取模块,用于获取与目标招标书的招标书类别对应的历史招投标数据集;其中,所述历史招投标数据集中包含至少两个招投标数据;
参考投标标题框架确定模块,用于基于各所述招投标数据中成对匹配的历史招标书和历史投标书,确定至少一个参考招标需求类别以及各所述参考招标需求类别分别对应的参考投标标题框架;
需求筛选提示语生成模块,用于基于所述目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语;
需求筛选提示语输入模块,用于将至少一个需求筛选提示语输入通用领域语言模型,以输出与至少一个目标招标需求类别分别对应的至少一个招标需求文本;
投标生成提示语生成模块,用于基于各所述招标需求文本和各所述目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;
目标投标书生成模块,用于将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容,并基于各所述目标投标文本内容,生成与所述目标招标书对应的目标投标书。
根据本发明另一个实施例提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的投标书的生成方法。
根据本发明另一个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的投标书的生成方法。
本发明实施例的技术方案,通过基于与目标招标书的招标书类别对应的历史招投标数据集,确定至少一个参考招标需求类别以及各参考招投标需求类别分别对应的参考投标标题框架,从投标书的生成过程拆解出了基于参考招标需求类别生成的需求筛选提示语以及基于招标需求文本和参考投标标题框架生成的投标生成提示语,使得通用领域语言模型首先能够基于输入的需求筛选提示语从目标招标书中筛选出与至少一个目标招标需求类别分别对应的至少一个招标需求文本,其次能够基于输入的投标生成提示语输出至少一个目标投标文本内容,基于各目标投标文本内容,生成与目标招标书对应的目标投标书,本发明实施例中分层级构建的模型提示语降低了通用领域语言模型在投标书文本生成任务中的文本处理难度,实现了通用领域语言模型与投标书文本生成任务的适配性,从而解决了传统技术生成的投标书的文本质量差问题,提高了投标书的可定制化水平,丰富了投标书的文本结构和文本内容。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的一种投标书的生成方法的流程图;
图2为本发明一个实施例所提供的一种参考投标标题框架的示意图;
图3为本发明一个实施例所提供的一种需求筛选提示语的架构示意图;
图4为本发明一个实施例所提供的一种标题筛选提示语的架构示意图;
图5为本发明一个实施例所提供的一种文本生成提示语的架构示意图;
图6为本发明一个实施例所提供的另一种投标书的生成方法的流程图;
图7为本发明一个实施例所提供的一种投标书的生成装置的结构示意图;
图8为本发明一个实施例所提供的一种投标书的生成装置的具体实例的结构示意图;
图9为本发明一个实施例所提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“目标”、“参考”、“中间”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明一个实施例所提供的一种投标书的生成方法的流程图,本实施例可适用于为招标书生成定制化的投标书的情况,该方法可以由投标书的生成装置来执行,该投标书的生成装置可以采用硬件和/或软件的形式实现,该投标书的生成装置可配置于终端设备中。如图1所示,该方法包括:
S110、获取与目标招标书的招标书类别对应的历史招投标数据集。
其中,具体的,目标招标书用于表征待生成与之匹配的目标投标书的招标书,示例性的,招标书类别包括但不限于建筑工程招标、采购招标、委托招标、信息系统招标、矿产资源开发招标等等,当然,建筑工程招标还可以进一步划分为建筑物招标、道路招标、桥梁招标、地铁招标等等。此处对招标书类别的划分维度和划分粒度均不作限定,具体可根据实际需求自定义设置。
在本实施例中,历史招投标数据集中包含至少两个招投标数据。具体的,招投标数据中包含成对匹配的历史招标书和历史投标书,示例性的,历史招标书中记录有与招标需求相关的文本内容,历史投标书中记录有对成对匹配的历史招标书中的各项招标需求进行应答的与投标资质相关的文本内容。具体的,本实施例中的历史投标书可以是经过人工校对的投标书。
S120、基于各招投标数据中成对匹配的历史招标书和历史投标书,确定至少一个参考招标需求类别以及各参考招标需求类别分别对应的参考投标标题框架。
其中,具体的,参考招标需求类别用于表征各历史招标书中的招标需求文本所属的类别,招标需求文本用于表征历史招标书中与招标需求相关的文本内容。如招标需求文本可以为“项目经理要求3年以上工作经验”、“投标企业的人员规模在3000人以上”等等,其中,“项目经理要求3年以上工作经验”所属的参考招标需求类别可以是人员要求,“投标企业的人员规模在3000人以上”所属的参考招标需求类别可以是企业规模。
其中,具体的,参考投标标题框架用于表征至少一个标题级分别对应的至少一个参考投标标题。图2为本发明一个实施例所提供的一种参考投标标题框架的示意图,图2以参考招标需求类别为人员要求为例,其中,“一、人员要求”表示参考投标标题框架中的一级标题下的参考投标标题,“(一)项目经理要求”和“(二)工程师要求”表示参考投标标题框架中的二级标题下的两个参考投标标题,“1.工作年限”和“2.参与项目”表示参考投标标题框架中与“(一)项目经理要求”对应的三级标题下的两个参考投标标题,“1.工作经历”和“2.专业证书”表示参考投标标题框架中与“(二)工程师要求”对应的三级标题下的两个参考投标标题。
在一个可选实施例中,参考招标需求类别是人为基于各招投标数据中历史招标书中的招标需求文本标注得到的,参考投标标题框架是人为基于各参考招标需求类别以及各招投标数据中历史投标书中的历史投标标题框架梳理得到的。
S130、基于目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语。
其中,具体的,需求筛选提示语用于提示通用领域语言模型从目标招标书中提取符合参考招标需求类别的至少一个招标需求文本。
在一个可选实施例中,基于目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语,包括:将目标招标书和各参考招标需求类别添加到需求筛选提示模板中,得到需求筛选提示语。
在本实施例中,需求筛选提示模板中包含招标需求筛选提示字段、与各参考招标需求类别对应的招标需求类别描述字段以及与目标招标书对应的招标书描述字段。具体的,招标需求筛选提示字段用于描述通用领域语言模型需要执行的招标需求筛选任务以及筛选要求,招标需求类别描述字段用于对各参考招标需求类别进行描述,招标书描述字段用于对目标招标书进行描述。
在另一个可选实施例中,基于目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语,包括:采用最小章节维度,对目标招标书执行拆分操作得到至少两个目标招标文本内容;针对每个目标招标文本内容,将目标招标文本内容和至少一个参考招标需求类别分别添加到需求筛选提示模板中的对应字段位置,得到与目标招标文本内容对应的需求筛选提示语。
在本实施例中,需求筛选提示模板中包含招标需求筛选提示字段、与各参考招标需求类别对应的招标需求类别描述字段以及与目标招标文本内容对应的招标文本内容描述字段。具体的,招标文本内容描述字段用于对目标招标文本内容进行描述。
其中,目标招标文本内容中包含目标招标标题框架和目标招标标题框架下的目标招标章节内容,示例性的,目标招标标题框架包括“一级招标标题-二级招标标题-三级招标标题…”。相应的,需求筛选提示模板中的招标文本描述字段包含与目标招标标题框架对应的目标招标标题描述字段以及与目标招标章节内容对应的招标章节内容描述字段。
图3为本发明一个实施例所提供的一种需求筛选提示语的架构示意图。具体的,图3中的虚线上方内容表示需求筛选提示语,其中,“已知招标书的招标需求属于以下几个招标需求类别:1.{}2.{}3.{}4.{}”表示需求筛选提示模板中的招标需求类别描述字段,“以下招标标题框架为{}”表示需求筛选提示模板中的目标招标标题描述字段,“招标章节内容为{}”表示需求筛选提示模板中的招标章节内容描述字段,“中是否包含属于上述某一招标需求类别的招标需求文本?如果未在稳重明确提及的,则认为没有招标需求文本,请不要做任何的推断。具体对应哪些招标需求类别,请使用1,2,3序号区分,并给出原文内容”表示需求筛选提示模板中的招标需求筛选提示字段。上述需求筛选提示模板中“{}”中的字段内容为添加的字段内容,招标需求类别A-D表示各参考招标需求类别,“si”表示目标招标书中第i个目标招标文本内容中的目标招标章节内容,“si(title)”表示目标招标书中第i个目标招标文本内容中的目标招标标题框架。
由于目标招标书的文本内容布局结构复杂,文本内容庞大,将目标招标书作为一个整体添加到需求筛选提示模板中,会使得需求筛选提示语的提示字数过多。一方面可能会出现提示语字数超过通用领域语言模型限定的字数阈值的情况,通用领域语言模型的默认字数裁剪会影响到输出结果的完整性和准确度。另一方面会增加通用领域语言模型一次查询处理的数据量,降低通用领域语言模型的查询效率。
本实施例通过将目标招标书采用最小章节维度进行拆分,分批次生成需求筛选提示语,可以有效避免提示语字数超过字数阈值的情况,并且可以提高通用领域语言模型的查询效率,从而保证了通用领域语言模型输出结果的完整性和准确度。
S140、将至少一个需求筛选提示语输入通用领域语言模型,以输出至少一个目标招标需求类别以及各目标招标需求类别分别对应的至少一个招标需求文本。
在本实施例中,通用领域语言模型表征具有庞大的参数规模和复杂程度的机器学习模型,或者表征具有数百万到数十亿参数的神经网络模型,通用领域语言模型需要大量的计算资源和存储空间,往往采用分布式计算和特殊的硬件技术。通用领域语言模型具备更强的泛化能力和表达能力。
其中,具体的,目标招标需求类别用于表征与目标招标书中包含的招标需求文本匹配的参考招标需求类别。
图3中虚线下方内容表示通用领域语言模型基于需求筛选提示语的示意性输出结果,其中,“招标需求类别A”和“招标需求类别B”为通用领域语言模型从需求筛选提示语中的招标需求类别A-D中筛选出的两个目标招标需求类别,通用领域语言模型还输出了目标招标书中与“招标需求类别A”对应的2个招标需求文本,分别为“xxxxxA”和“yyyyyyA”,以及目标招标书中与“招标需求类别B”对应的2个招标需求文本,分别为“xxxxxB”和“yyyyyyB”。
S150、基于各招标需求文本和各目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语。
在本实施例中,投标生成提示语包括标题筛选提示语和文本生成提示语,目标投标文本内容包括与标题筛选提示语对应的目标投标标题框架和与文本生成提示语对应的目标投标章节内容。
其中,具体的,标题筛选提示语用于提示通用领域语言模型从各目标招标需求类别分别对应的参考投标标题框架中提取出与招标需求文本匹配的目标投标标题框架,文本生成提示语用于提示通用领域语言模型生成符合目标投标标题框架和招标需求文本的目标投标章节内容。
在一个可选实施例中,基于各招标需求文本和各目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语,包括:基于各目标招标需求类别分别对应的参考投标标题框架,构建中间投标标题框架;针对每个招标需求文本,基于中间投标标题框架、招标需求文本和标题筛选提示模板,生成与招标需求文本对应的至少一个标题筛选提示语;获取通用领域语言模型基于输入的各标题筛选提示语输出的与招标需求文本对应的目标投标标题框架;将招标需求文本和目标投标标题框架分别添加到文本生成提示模板中的对应字段位置,得到文本生成提示语。
其中,具体的,中间投标标题框架为至少一个目标招标需求类别分别对应的参考投标标题框架拼接组合成的标题框架。
在一个可选实施例中,基于中间投标标题框架、招标需求文本和标题筛选提示模板,生成与招标需求文本对应的标题筛选提示语,包括:将中间投标标题框架和招标需求文本添加到标题筛选提示模板中,得到与招标需求文本对应的标题筛选提示语。
在本实施例中,标题筛选提示模板中包含标题筛选提示字段、与中间投标标题框架对应的中间标题描述字段以及与招标需求文本对应的招标需求描述字段。具体的,标题筛选提示字段用于描述通用领域语言模型需要执行的标题筛选任务以及筛选要求,中间标题描述字段用于对中间投标标题框架进行描述,招标需求描述字段用于对招标需求文本进行描述。
在另一个可选实施例中,基于中间投标标题框架、招标需求文本和标题筛选提示模板,生成与招标需求文本对应的标题筛选提示语,包括:将招标需求文本和中间投标标题框架中的至少一个中间一级标题添加到标题筛选提示模板中,得到第一标题筛选提示语;获取通用领域语言模型基于输入的第一标题筛选提示语从各中间一级标题中选择的目标一级标题,将招标需求文本和中间投标标题框架中与目标一级标题对应的至少一个中间二级标题添加到标题筛选提示模板中,得到第二标题筛选提示语。
图4为本发明一个实施例所提供的一种标题筛选提示语的架构示意图,具体的,图4中的“已知招标需求文本为:{}”表示标题筛选提示模板中的招标需求描述字段,图4中的“已知以下可选标题:{}{}{}”表示标题筛选提示模板中的中间标题描述字段,图4中的“以上招标需求文本属于以上哪个标题”表示标题筛选提示模板中的标题筛选提示字段,上述标题筛选提示模板中“{}”中的字段内容为添加的字段内容,具体的,“项目经理要求3年以上工作经验”表示招标需求文本,“人员要求”、“企业规模”和“财务报表”表示中间投标标题框架中的3个中间一级标题。
举例而言,通用领域语言模型基于图4的标题筛选提示语输出的目标一级标题是“人员要求”,以图2为例,第二标题筛选提示语中的各中间二级标题包括“项目经理要求”和“工程师要求”,则通用领域语言模型基于上述第二标题筛选提示语输出的目标二级标题是“项目经理要求”,第三标题筛选提示语中的各中间三级标题包括“工作年限”和“参与项目”,则通用领域语言模型基于上述第三标题筛选提示语输出的目标三级标题是“工作年限”。因此,上述第一标题筛选提示语、第二标题筛选提示语和第三标题筛选提示语分别对应的目标一级标题、目标二级标题和目标三级标题构成的目标投标标题框架为人员要求-项目经理要求-工作年限。
设置分级构建标题筛选提示语的好处在于,可以提高通用领域语言模型输出的目标投标标题框架的准确度。
在本实施例中,文本生成提示模板中包含文本生成提示字段、与招标需求文本对应的招标需求描述字段以及与目标投标标题框架对应的目标投标标题描述字段。具体的,文本生成提示字段用于描述通用领域语言模型需要执行的投标文本生成任务以及文本生成要求,目标投标标题描述字段用于对目标投标标题框架进行描述。
图5为本发明一个实施例所提供的一种文本生成提示语的架构示意图,具体的,图5中的“请根据以下投标标题框架和招标需求文本,生成符合投标文本标准的应答文本。”表示文本生成提示模板中的文本生成提示字段,图5中的“投标标题框架:{}”表示文本生成提示模板中的目标投标标题描述字段,图5中的“招标需求文本:{}”表示文本生成提示模板中的招标需求描述字段,上述文本生成提示模板中“{}”中的字段内容为添加的字段内容,具体的,“人员要求-项目经理要求-工作年限”表示目标投标标题框架,“项目经理要求3年以上工作经验”表示招标需求文本。
S160、将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容,并基于各目标投标文本内容,生成与目标招标书对应的目标投标书。
其中,具体的,针对招标需求文本,将与招标需求文本对应的至少一个标题筛选提示语输入通用领域语言模型,以输出招标需求文本对应的目标投标标题框架,将与招标需求文本对应的文本生成提示语输入通用领域语言模型,以输出招标需求文本对应的目标投标章节内容。
其中,具体的,基于各目标投标文本内容中的目标投标标题框架,对各目标投标标题框架下的目标投标章节内容进行拼接组合得到与目标招标书对应的目标投标书。
本实施例的技术方案,通过基于与目标招标书的招标书类别对应的历史招投标数据集,确定至少一个参考招标需求类别以及各参考招投标需求类别分别对应的参考投标标题框架,从投标书的生成过程拆解出了基于参考招标需求类别生成的需求筛选提示语以及基于招标需求文本和参考投标标题框架生成的投标生成提示语,使得通用领域语言模型首先能够基于输入的需求筛选提示语从目标招标书中筛选出与至少一个目标招标需求类别分别对应的至少一个招标需求文本,其次能够基于输入的投标生成提示语输出至少一个目标投标文本内容,基于各目标投标文本内容,生成与目标招标书对应的目标投标书,本发明实施例中分层级构建的模型提示语降低了通用领域语言模型在投标书文本生成任务中的文本处理难度,实现了通用领域语言模型与投标书文本生成任务的适配性,从而解决了传统技术生成的投标书的文本质量差问题,提高了投标书的可定制化水平,丰富了投标书的文本结构和文本内容。
需要说明的是,本实施例仅对需求筛选提示模板、标题筛选提示模板和文本生成提示模板进行示例性说明,均不对其进行限定,提示模板的具体内容可根据实际需求自定义设置。
图6为本发明一个实施例所提供的另一种投标书的生成方法的流程图,本实施例对上述实施例中“基于各招投标数据中成对匹配的历史招标书和历史投标书,确定至少一个参考招标需求类别以及各参考招标需求类别分别对应的参考投标标题框架”进行进一步细化。如图6所示,该方法包括:
S210、获取与目标招标书的招标书类别对应的历史招投标数据集。
本实施例中的S210与上述实施例中图1所示的S110对应相同或类似,本实施例在此不再赘述。
S220、针对每个招投标数据,获取招投标数据中历史招标书中的至少一个历史需求文本和历史投标书中的至少一个历史投标标题框架,并获取各历史需求文本与各历史投标标题框架分别对应的响应匹配度。
在一个可选实施例中,历史需求文本可以是人为对历史招标书进行标注得到的,也可以是基于预设招标关键词从历史招标书中提取到的。其中,预设招标关键词可用于表征与招标书类别对应设置的与招标需求相关的招标关键词,历史需求文本用于表征历史招标书中与预设招标关键词匹配的文本内容。示例性的,假设招标书类别为建筑物招标,则各预设招标关键词包括但不限于投标企业规模、交付时间期限、项目经理、施工地理位置等等,假设招标书类别为采购招标,则各预设招标关键词包括但不限于采购清单、资产配置、采购标准、验收标准等等。此处对不同招标书类别分别对应设置的预设招标关键词的具体设置标准不作限定,具体可根据实际需求自定义设置。
在一个可选实施例中,响应匹配度可以是人工标注的。示例性的,如果历史投标标题框架A下的历史投标章节内容仅用于应答招标书中的历史需求文本A,则将历史投标标题框架A与历史需求文本A对应的响应匹配度设置为第一数值,历史投标标题框架A与历史需求文本B对应的响应匹配度设置为第二数值。其中,第一数值大于第二数值。示例性的,第一数值可以为1,第二数值可以为0,此处对第一数值和第二数值的具体参数值不作限定,具体可根据实际需求自定义设置。
举例而言,假设历史投标标题框架A下的历史投标章节内容包含“本公司拥有工作年限超过5年的项目经理4名”,如果历史需求文本A为“项目经理需要3年以上工作经验”,则说明该历史投标章节内容应答了历史需求文本A,如果历史需求文本B为“工程师需要具备工程类证书”,则说明该历史投标章节内容没有应答历史需求文本B。
在另一个可选实施例中,获取各历史需求文本与各历史投标标题框架分别对应的响应匹配度,包括:针对每组历史需求文本和历史投标标题框架,获取历史投标书中历史投标标题框架下的历史投标章节内容,并将历史需求文本和历史投标章节内容添加到匹配度提示模板中,得到匹配度提示语;将匹配度提示语输入到通用领域语言模型,以输出历史投标标题框架响应历史需求文本的响应匹配度。
在本实施例中,匹配度提示模板包括匹配度提示字段、与历史投标章节内容对应的投标内容描述字段以及与历史需求文本对应的招标内容描述字段。具体的,匹配度提示字段用于描述通用领域语言模型需要执行的匹配度计算任务,投标内容描述字段用于对历史投标章节内容进行描述,招标内容描述字段用于对历史需求文本进行描述。
这样设置的好处在于,可以提高历史需求文本与历史投标标题框架之间的响应匹配度的获取效率和精确度。
S230、针对任意两个招投标数据,获取两个招投标数据分别对应的至少一个历史需求文本之间的需求文本相似度。
本实施例中构建了历史招投标数据集中的至少两个招投标数据对应的所有组合形式,假设招投标数据的数量为M个,则任意两个招投标数据的组合形式的数量为M!个。
其中,具体的,需求文本相似度用于表征第一招投标数据中第一历史招标书中的任意历史需求文本与第二招投标数据中第二历史招标书中的任意历史需求文本之间的文本相似度。假设第一招投标数据中第一历史招标书中包含K个历史需求文本,第二招投标数据中第二历史招标书中包含R个历史需求文本,则获取到的两个招投标数据对应的需求文本相似度的数量为K×R个。
其中,示例性的,文本相似度算法包括但不限于欧式距离、余弦相似度、最小编辑距离、杰卡德相似度等。此处对采用的相似度算法不作限定,具体可根据实际需求自定义设置。
S240、基于至少一个响应匹配度和至少一个需求文本相似度,对历史招投标数据集对应的各历史投标标题框架进行分类得到至少一个投标标题集群。
在一个可选实施例中,基于至少一个响应匹配度和至少一个需求文本相似度,对历史招投标数据集对应的各历史投标标题框架进行分类得到至少一个投标标题集群,包括:基于至少一个需求文本相似度,对历史招投标数据集对应的各历史需求文本进行聚类得到至少一个需求类别集群;针对每个需求类别集群,基于需求类别集群中的各历史需求文本与至少一个历史投标标题框架分别对应的响应匹配度,对各历史投标标题框架进行筛选得到与需求类别集群对应的投标标题集群。
其中,示例性的,聚类算法包括但不限于K-均值聚类算法、均值漂移聚类算法、基于密度的聚类算法和凝聚层次聚类算法等,此处对采用的聚类算法不作限定,具体可根据实际需求自定义设置。
在一个可选实施例中,针对需求类别集群中的每个历史需求文本,将与历史需求文本对应的响应匹配度大于匹配度阈值的历史投标标题框架添加到与需求类别集群对应的投标标题集群中。示例性的,匹配度阈值可以为0.5,此处对匹配度阈值不作限定,具体可根据实际需求自定义设置。
在另一个可选实施例中,针对需求类别集群中的每个历史需求文本,基于与历史需求文本对应的至少两个历史投标标题框架分别对应的响应匹配度,对各历史投标标题框架进行降序排序,将排名靠前的预设数量的历史投标标题框架添加到与需求类别集群对应的投标标题集群中。示例性的,预设数量可以为10个或20个,此处对预设数量不作限定,具体可根据实际需求自定义设置。
其中,具体的,不同需求类别集群中的各历史需求文本不存在重叠的历史需求文本,不同投标标题集群中的各历史投标标题框架中可能存在重叠的历史投标标题框架。示例性的,假设历史投标标题框架A既与历史招标书A中的历史需求文本A匹配,又与历史招标书A中的历史需求文本B匹配,如果历史需求文本A和历史需求文本B属于不同的需求类别集群,则两个需求类别集群分别对应的投标标题集群中均包含历史投标标题框架A。
S250、基于各投标标题集群中的至少一个历史投标标题框架,确定各投标标题集群分别对应的参考招标需求类别和参考投标标题框架。
在一个可选实施例中,基于各投标标题集群中的至少一个历史投标标题框架,确定各投标标题集群分别对应的参考招标需求类别和参考投标标题框架,包括:针对每个标题级,获取投标标题集群中各历史投标标题框架中与当前标题级对应的各历史投标标题分别对应的出现频次,并基于各出现频次,确定与当前标题级对应的至少一个参考投标标题;基于各标题级分别对应的参考投标标题,确定投标标题集群对应的参考投标标题框架,并将参考投标标题框架中的一级标题作为投标标题集群对应的参考招标需求类别。
在另一个可选实施例中,基于各投标标题集群中的至少一个历史投标标题框架,确定各投标标题集群分别对应的参考招标需求类别和参考投标标题框架,包括:针对每个投标标题集群,获取投标标题集群中各历史投标标题框架中的各历史投标标题分别对应的出现频次,并将出现频次最高的历史投标标题作为投标标题集群对应的参考招标需求类别;针对每个标题级,获取投标标题集群中各历史投标标题框架中与当前标题级对应的各历史投标标题分别对应的出现频次,并基于各出现频次,确定与当前标题级对应的至少一个参考投标标题;基于各标题级分别对应的参考投标标题,确定投标标题集群对应的参考投标标题框架。
其中,具体的,针对每个标题级,基于各历史投标标题分别对应的出现频次,对各历史投标标题进行降序排序,将排名靠前的预设数量的历史投标标题作为当前标题级对应的参考投标标题。示例性的,预设数量可以为2个或3个,不同标题级分别对应的预设数量可以相同,也可以不同。如一级标题对应的预设数量为1个,二级标题对应的预设数量为2个,三级标题对应的预设数量为3个等等。
S260、基于目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语。
在一个可选实施例中,基于目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语,包括:采用最小章节维度,对目标招标书执行拆分操作得到至少两个目标招标文本内容;针对每个目标招标文本内容,将目标招标文本内容和至少一个参考招标需求类别分别添加到需求筛选提示模板中的对应字段位置,得到与目标招标文本内容对应的需求筛选提示语;其中,需求筛选提示模板中包含招标需求筛选提示字段、与各参考招标需求类别对应的招标需求类别描述字段以及与目标招标文本内容对应的招标文本内容描述字段。
在一个可选实施例中,采用最小章节维度,对目标招标书执行拆分操作得到至少两个目标招标文本内容,包括:采用最小章节维度,对目标招标书执行拆分操作得到至少两个参考招标文本内容;针对每个参考招标文本内容,在参考招标文本内容的内容字数大于预设字数阈值的情况下,采用句子维度,对参考招标文本内容执行拆分操作得到至少两个参考招标句子;获取任意两个相邻的参考招标句子分别对应的句子距离;基于各句子距离,对各参考招标句子执行聚类操作得到与参考招标文本内容对应的至少两个目标招标文本内容;其中,各目标招标文本内容的内容字数均小于或等于预设字数阈值。
其中,具体的,预设字数阈值与通用领域语言模型的处理能力相关,示例性的,预设字数阈值可以为1万字或2万字,此处对预设字数阈值不作限定。
在一个可选实施例中,获取任意两个相邻的参考招标句子分别对应的句子距离,包括:基于两个相邻的参考招标句子对应的文本相似度,确定两个相邻的参考招标句子的句子距离。其中,具体的,句子距离=1-文本相似度。
在另一个可选实施例中,获取任意两个相邻的参考招标句子分别对应的句子距离,包括:基于两个相邻的参考招标句子是否属于参考招标文本内容中的同一文本段落的判断结果,确定两个相邻的参考招标句子对应的段落距离;将两个相邻的参考招标句子对应的文本相似度作为两个相邻的参考招标句子对应的语义距离;将段落距离和语义距离之和作为两个相邻的参考招标句子对应的句子距离。
其中,具体的,如果两个相邻的参考招标句子属于参考招标文本内容中的同一文本段落,则将两个相邻的参考招标句子对应的段落距离设置为第三数值,如果两个相邻的参考招标句子不属于参考招标文本内容中的同一文本段落,则将两个相邻的参考招标句子对应的段落距离设置为第四数值。其中,第三数值大于第四数值。示例性的,第三数值可以为1,第四数值可以为0,此处对第三数值和第四数值的具体参数值不作限定,具体可根据实际需求自定义设置。
其中,具体的,语义距离=1-文本相似度。
在一个可选实施例中,目标招标文本内容采用的聚类算法为层次聚类算法。具体的,基于各句子距离,对任意两个相邻的参考招标句子分别构成的参考招标句子组合进行降序排序,并依次将得到的降序结果中的参考招标句子组合作为目标招标句子组合。如果已构建的至少一个当前招标文本内容中均不包含目标招标句子组合中两个相邻的参考招标句子,则基于目标招标句子组合构建新的当前招标文本内容,如果已构建的一个当前招标文本内容中包含目标招标句子组合中的一个参考招标句子,则将目标招标句子组合中的另一个参考招标句子添加到该当前招标文本内容中,已构建的两个当前招标文本内容中分别包含目标招标句子组合中的其中一个参考招标句子,如当前招标文本内容1中包含目标招标句子组合中的参考招标句子A,当前招标文本内容2中包含目标招标句子组合中的参考招标句子B,则将参考招标句子B添加到当前招标文本内容1中,或者,将参考招标句子A添加到当前招标文本内容2中。
在将参考招标句子添加到当前招标文本内容之前,该方法还包括:判断当前招标文本内容的当前字数与待添加的参考招标句子的待添加字数之和是否大于预设字数阈值,如果是,则将当前招标文本内容作为目标招标文本内容,如果否,则将参考招标句子添加到当前招标文本内容中。
这样设置的好处在于,在受到通用领域语言模型的字数限制的情况下,首先保证同一章节的段落内容划分在一起添加到需求筛选提示语中,其次保证同一段落中的句子内容划分在一起添加到需求筛选提示语中,最后保证意思相近的句子内容/段落内容划分在一起添加到需求筛选提示语中。从而提高了投标书的生成方法与通用领域语言模型之间的适配度,扩宽了投标书的生成方法的适用场景。
S270、将至少一个需求筛选提示语输入通用领域语言模型,以输出至少一个目标招标需求类别以及各目标招标需求类别分别对应的至少一个招标需求文本。
S280、基于各招标需求文本和各目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语。
S290、将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容,并基于各目标投标文本内容,生成与目标招标书对应的目标投标书。
本实施例中的S270-S290与上述图1中的S140-S160对应相同或类似,本实施例在此不再赘述。
本实施例的技术方案,通过针对每个招投标数据,获取招投标数据中历史招标书中的至少一个历史需求文本和历史投标书中的至少一个历史投标标题框架,并获取各历史需求文本与各历史投标标题框架分别对应的响应匹配度,针对任意两个招投标数据,获取两个招投标数据分别对应的至少一个历史需求文本之间的需求文本相似度,基于至少一个响应匹配度和至少一个需求文本相似度,对历史招投标数据集对应的各历史投标标题框架进行分类得到至少一个投标标题集群;基于各投标标题集群中的至少一个历史投标标题框架,确定各投标标题集群分别对应的参考招标需求类别和参考投标标题框架,解决了参考招标需求类别和参考投标标题框架人工标注成本高的问题,提高了参考招标需求类别和参考投标标题框架的获取效率和精确度,从而提高了后续招标需求文本的筛选效果以及定制化生成的投标书的文本质量。
需要说明的是,本发明的技术方案中,所涉及的招标书和投标书的收集、使用、保存、共享和转移等处理,均符合相关法律法规的规定,当适用时,对招标书和投标书中的保密文本内容进行了去标识化和/或匿名化和/或加密的技术处理。
以下是本发明实施例提供的投标书的生成装置的实施例,该装置与上述实施例的投标书的生成方法属于同一个发明构思,在投标书的生成装置的实施例中未详尽描述的细节内容,可以参考上述实施例中关于投标书的生成方法的内容。
图7为本发明一个实施例所提供的一种投标书的生成装置的结构示意图。如图7所示,该装置包括:历史招投标数据集获取模块310、参考投标标题框架确定模块320、需求筛选提示语生成模块330、需求筛选提示语输入模块340、投标生成提示语生成模块350和目标投标书生成模块360。
其中,历史招投标数据集获取模块310,用于获取与目标招标书的招标书类别对应的历史招投标数据集;其中,历史招投标数据集中包含至少两个招投标数据;
参考投标标题框架确定模块320,用于基于各招投标数据中成对匹配的历史招标书和历史投标书,确定至少一个参考招标需求类别以及各参考招标需求类别分别对应的参考投标标题框架;
需求筛选提示语生成模块330,用于基于目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语;
需求筛选提示语输入模块340,用于将至少一个需求筛选提示语输入通用领域语言模型,以输出与至少一个目标招标需求类别分别对应的至少一个招标需求文本;
投标生成提示语生成模块350,用于基于各招标需求文本和各目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;
目标投标书生成模块360,用于将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容,并基于各目标投标文本内容,生成与目标招标书对应的目标投标书。
本实施例的技术方案采用了分层级构建的模型提示语,降低了通用领域语言模型在投标书文本生成任务中的文本处理难度,实现了通用领域语言模型与投标书文本生成任务的适配性,从而解决了传统技术生成的投标书的文本质量差问题,提高了投标书的可定制化水平,丰富了投标书的文本结构和文本内容。
在一个可选实施例中,参考投标标题框架确定模块320,包括:
响应匹配度获取单元,用于针对每个招投标数据,获取招投标数据中历史招标书中的至少一个历史需求文本和历史投标书中的至少一个历史投标标题框架,并获取各历史需求文本与各历史投标标题框架分别对应的响应匹配度;
需求文本相似度确定单元,用于针对任意两个招投标数据,获取两个招投标数据分别对应的至少一个历史需求文本之间的需求文本相似度;
投标标题集群确定单元,用于基于至少一个响应匹配度和至少一个需求文本相似度,对历史招投标数据集对应的各历史投标标题框架进行分类得到至少一个投标标题集群;
参考投标标题框架确定单元,用于基于各投标标题集群中的至少一个历史投标标题框架,确定各投标标题集群分别对应的参考招标需求类别和参考投标标题框架。
在一个可选实施例中,投标标题集群确定单元,具体用于:
基于至少一个需求文本相似度,对历史招投标数据集对应的各历史需求文本进行聚类得到至少一个需求类别集群;
针对每个需求类别集群,基于需求类别集群中的各历史需求文本与至少一个历史投标标题框架分别对应的响应匹配度,对各历史投标标题框架进行筛选得到与需求类别集群对应的投标标题集群。
在一个可选实施例中,参考投标标题框架确定单元,具体用于:
针对每个投标标题集群,获取投标标题集群中各历史投标标题框架中的各历史投标标题分别对应的出现频次,并将出现频次最高的历史投标标题作为投标标题集群对应的参考招标需求类别;
针对每个标题级,获取投标标题集群中各历史投标标题框架中与当前标题级对应的各历史投标标题分别对应的出现频次,并基于各出现频次,确定与当前标题级对应的至少一个参考投标标题;
基于各标题级分别对应的参考投标标题,确定投标标题集群对应的参考投标标题框架。
在一个可选实施例中,需求筛选提示语生成模块330,包括:
目标招标文本内容确定单元,用于采用最小章节维度,对目标招标书执行拆分操作得到至少两个目标招标文本内容;
需求筛选提示语生成单元,用于针对每个目标招标文本内容,将目标招标文本内容和至少一个参考招标需求类别分别添加到需求筛选提示模板中的对应字段位置,得到与目标招标文本内容对应的需求筛选提示语;
其中,需求筛选提示模板中包含招标需求筛选提示字段、与各参考招标需求类别对应的招标需求类别描述字段以及与目标招标文本内容对应的招标文本内容描述字段。
在一个可选实施例中,目标招标文本内容确定单元,包括:
参考招标文本内容确定子单元,用于采用最小章节维度,对目标招标书执行拆分操作得到至少两个参考招标文本内容;
参考招标句子确定子单元,用于针对每个参考招标文本内容,在参考招标文本内容的内容字数大于预设字数阈值的情况下,采用句子维度,对参考招标文本内容执行拆分操作得到至少两个参考招标句子;
句子距离获取子单元,用于获取任意两个相邻的参考招标句子分别对应的句子距离;
目标招标文本内容确定子单元,用于基于各句子距离,对各参考招标句子执行聚类操作得到与参考招标文本内容对应的至少两个目标招标文本内容;其中,各目标招标文本内容的内容字数均小于或等于预设字数阈值。
在一个可选实施例中,句子距离获取子单元,具体用于:
基于两个相邻的参考招标句子是否属于参考招标文本内容中的同一文本段落的判断结果,确定两个相邻的参考招标句子对应的段落距离;
将两个相邻的参考招标句子对应的文本相似度作为两个相邻的参考招标句子对应的语义距离;
将段落距离和语义距离之和作为两个相邻的参考招标句子对应的句子距离。
在一个可选实施例中,投标生成提示语包括标题筛选提示语和文本生成提示语,目标投标文本内容包括与标题筛选提示语对应的目标投标标题框架和与文本生成提示语对应的目标投标章节内容;
相应的,投标生成提示语生成模块350,具体用于:
基于各目标招标需求类别分别对应的参考投标标题框架,构建中间投标标题框架;
针对每个招标需求文本,基于中间投标标题框架、招标需求文本和标题筛选提示模板,生成与招标需求文本对应的至少一个标题筛选提示语;
获取通用领域语言模型基于输入的各标题筛选提示语输出的与招标需求文本对应的目标投标标题框架;
将招标需求文本和目标投标标题框架分别添加到文本生成提示模板中的对应字段位置,得到文本生成提示语;
其中,标题筛选提示模板中包含标题筛选提示字段、与中间投标标题框架对应的中间标题描述字段以及与招标需求文本对应的招标需求描述字段;文本生成提示模板中包含文本生成提示字段、与招标需求文本对应的招标需求描述字段以及与目标投标标题框架对应的目标投标标题描述字段。
图8为本发明一个实施例所提供的一种投标书的生成装置的具体实例的结构示意图。具体的,投标书的生成装置包括知识库构建模块、需求分析模块、投标标题生成模块、投标章节生成模块和投标书生成模块。
具体的,投标书的生成装置的数据来源包括历史招投标数据集和目标招标书,其中,历史招投标数据集中包含n个招投标数据,招投标数据中投标书指向招标书的箭头表示投标书中的历史投标标题框架响应招标书中历史需求文本的响应匹配关系。
具体的,知识库构建模块,用于基于历史招投标数据集,构建了m个参考招标需求类别以及各参考招标需求类别分别对应的参考投标标题框架,具体的,图8中的“标题1…标题1.1…”表示与招标需求类别1对应的参考投标标题框架,“标题m…标题m.1…”表示与招标需求类别m对应的参考投标标题框架。
具体的,需求分析模块,用于采用通用领域语言模型,基于知识库构建模块中的m个参考招标需求类别,与目标招标书匹配了k个招标需求类别以及从目标招标书中提出了与k个招标需求类别分别对应的招标需求文本,图8中的需求文本1.1…需求文本1.N表示与招标需求类别1对应的N个招标需求文本,图8中的需求文本k.1…需求文本k.P表示与招标需求类别k对应的P个招标需求文本。
具体的,投标标题生成模块,用于采用通用领域语言模型,基于知识库构建模块得到的各参考投标标题框架以及需求分析模块得到的各招标需求文本,生成各招标需求文本分别对应的目标投标标题框架。投标章节生成模块,用于通用领域语言模型,基于投标标题生成模块得到的各招标需求文本分别对应的目标投标标题框架以及需求分析模块得到的各招标需求文本,生成各招标需求文本分别对应的目标章节文本内容。投标书生成模块,用于基于投标标题生成模块得到的各目标投标标题框架和投标章节生成模块得到的各目标章节文本内容,生成与目标招标书对应的目标投标书。
本发明实施例所提供的投标书的生成装置可执行本发明任意实施例所提供的投标书的生成方法,具备执行方法相应的功能模块和有益效果。
图9为本发明一个实施例所提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图9所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器11执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如上述实施例提供的投标书的生成方法。
在一些实施例中,上述实施例提供的投标书的生成方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的投标书的生成方法中的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行投标书的生成方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的投标书的生成方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种投标书的生成方法,其特征在于,包括:
获取与目标招标书的招标书类别对应的历史招投标数据集;其中,所述历史招投标数据集中包含至少两个招投标数据;
基于各所述招投标数据中成对匹配的历史招标书和历史投标书,确定至少一个参考招标需求类别以及各所述参考招标需求类别分别对应的参考投标标题框架;
基于所述目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语;
将至少一个需求筛选提示语输入通用领域语言模型,以输出至少一个目标招标需求类别以及各所述目标招标需求类别分别对应的至少一个招标需求文本;
基于各所述招标需求文本和各所述目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;
将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容,并基于各所述目标投标文本内容,生成与所述目标招标书对应的目标投标书;
其中,所述基于各所述招投标数据中成对匹配的历史招标书和历史投标书,确定至少一个参考招标需求类别以及各所述参考招标需求类别分别对应的参考投标标题框架,包括:
针对每个招投标数据,获取所述招投标数据中历史招标书中的至少一个历史需求文本和历史投标书中的至少一个历史投标标题框架,并获取各所述历史需求文本与各所述历史投标标题框架分别对应的响应匹配度;
针对任意两个招投标数据,获取两个招投标数据分别对应的至少一个历史需求文本之间的需求文本相似度;
基于至少一个响应匹配度和至少一个需求文本相似度,对所述历史招投标数据集对应的各历史投标标题框架进行分类得到至少一个投标标题集群;
基于各所述投标标题集群中的至少一个历史投标标题框架,确定各所述投标标题集群分别对应的参考招标需求类别和参考投标标题框架。
2.根据权利要求1所述的方法,其特征在于,所述基于至少一个响应匹配度和至少一个需求文本相似度,对所述历史招投标数据集对应的各历史投标标题框架进行分类得到至少一个投标标题集群,包括:
基于至少一个需求文本相似度,对所述历史招投标数据集对应的各历史需求文本进行聚类得到至少一个需求类别集群;
针对每个需求类别集群,基于所述需求类别集群中的各历史需求文本与至少一个历史投标标题框架分别对应的响应匹配度,对各所述历史投标标题框架进行筛选得到与所述需求类别集群对应的投标标题集群。
3.根据权利要求1所述的方法,其特征在于,所述基于各所述投标标题集群中的至少一个历史投标标题框架,确定各所述投标标题集群分别对应的参考招标需求类别和参考投标标题框架,包括:
针对每个投标标题集群,获取所述投标标题集群中各历史投标标题框架中的各历史投标标题分别对应的出现频次,并将出现频次最高的历史投标标题作为所述投标标题集群对应的参考招标需求类别;
针对每个标题级,获取所述投标标题集群中各历史投标标题框架中与当前标题级对应的各历史投标标题分别对应的出现频次,并基于各所述出现频次,确定与所述当前标题级对应的至少一个参考投标标题;
基于各所述标题级分别对应的参考投标标题,确定所述投标标题集群对应的参考投标标题框架。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标招标书和至少一个所述参考招标需求类别,生成至少一个需求筛选提示语,包括:
采用最小章节维度,对所述目标招标书执行拆分操作得到至少两个目标招标文本内容;
针对每个目标招标文本内容,将所述目标招标文本内容和至少一个参考招标需求类别分别添加到需求筛选提示模板中的对应字段位置,得到与所述目标招标文本内容对应的需求筛选提示语;
其中,所述需求筛选提示模板中包含招标需求筛选提示字段、与各所述参考招标需求类别对应的招标需求类别描述字段以及与所述目标招标文本内容对应的招标文本内容描述字段。
5.根据权利要求4所述的方法,其特征在于,所述采用最小章节维度,对所述目标招标书执行拆分操作得到至少两个目标招标文本内容,包括:
采用最小章节维度,对所述目标招标书执行拆分操作得到至少两个参考招标文本内容;
针对每个参考招标文本内容,在所述参考招标文本内容的内容字数大于预设字数阈值的情况下,采用句子维度,对所述参考招标文本内容执行拆分操作得到至少两个参考招标句子;
获取任意两个相邻的参考招标句子分别对应的句子距离;
基于各所述句子距离,对各所述参考招标句子执行聚类操作得到与所述参考招标文本内容对应的至少两个目标招标文本内容;其中,各所述目标招标文本内容的内容字数均小于或等于所述预设字数阈值。
6.根据权利要求5所述的方法,其特征在于,所述获取任意两个相邻的参考招标句子分别对应的句子距离,包括:
基于两个相邻的参考招标句子是否属于所述参考招标文本内容中的同一文本段落的判断结果,确定两个相邻的参考招标句子对应的段落距离;
将两个相邻的参考招标句子对应的文本相似度作为两个相邻的参考招标句子对应的语义距离;
将所述段落距离和所述语义距离之和作为两个相邻的参考招标句子对应的句子距离。
7.根据权利要求1所述的方法,其特征在于,所述投标生成提示语包括标题筛选提示语和文本生成提示语,所述目标投标文本内容包括与所述标题筛选提示语对应的目标投标标题框架和与所述文本生成提示语对应的目标投标章节内容;
相应的,所述基于各所述招标需求文本和各所述目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语,包括:
基于各所述目标招标需求类别分别对应的参考投标标题框架,构建中间投标标题框架;
针对每个招标需求文本,基于所述中间投标标题框架、所述招标需求文本和标题筛选提示模板,生成与所述招标需求文本对应的至少一个标题筛选提示语;
获取所述通用领域语言模型基于输入的各所述标题筛选提示语输出的与所述招标需求文本对应的目标投标标题框架;
将所述招标需求文本和所述目标投标标题框架分别添加到文本生成提示模板中的对应字段位置,得到文本生成提示语;
其中,所述标题筛选提示模板中包含标题筛选提示字段、与所述中间投标标题框架对应的中间标题描述字段以及与所述招标需求文本对应的招标需求描述字段;所述文本生成提示模板中包含文本生成提示字段、与所述招标需求文本对应的招标需求描述字段以及与所述目标投标标题框架对应的目标投标标题描述字段。
8.一种投标书的生成装置,其特征在于,包括:
历史招投标数据集获取模块,用于获取与目标招标书的招标书类别对应的历史招投标数据集;其中,所述历史招投标数据集中包含至少两个招投标数据;
参考投标标题框架确定模块,用于基于各所述招投标数据中成对匹配的历史招标书和历史投标书,确定至少一个参考招标需求类别以及各所述参考招标需求类别分别对应的参考投标标题框架;
需求筛选提示语生成模块,用于基于所述目标招标书和至少一个参考招标需求类别,生成至少一个需求筛选提示语;
需求筛选提示语输入模块,用于将至少一个需求筛选提示语输入通用领域语言模型,以输出与至少一个目标招标需求类别分别对应的至少一个招标需求文本;
投标生成提示语生成模块,用于基于各所述招标需求文本和各所述目标招标需求类别分别对应的参考投标标题框架,生成至少一个投标生成提示语;
目标投标书生成模块,用于将至少一个投标生成提示语输入通用领域语言模型,以输出至少一个目标投标文本内容,并基于各所述目标投标文本内容,生成与所述目标招标书对应的目标投标书;
其中,所述参考投标标题框架确定模块,包括:
响应匹配度获取单元,用于针对每个招投标数据,获取所述招投标数据中历史招标书中的至少一个历史需求文本和历史投标书中的至少一个历史投标标题框架,并获取各所述历史需求文本与各所述历史投标标题框架分别对应的响应匹配度;
需求文本相似度确定单元,用于针对任意两个招投标数据,获取两个招投标数据分别对应的至少一个历史需求文本之间的需求文本相似度;
投标标题集群确定单元,用于基于至少一个响应匹配度和至少一个需求文本相似度,对所述历史招投标数据集对应的各历史投标标题框架进行分类得到至少一个投标标题集群;
参考投标标题框架确定单元,用于基于各所述投标标题集群中的至少一个历史投标标题框架,确定各所述投标标题集群分别对应的参考招标需求类别和参考投标标题框架。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的投标书的生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的投标书的生成方法。
CN202311403481.6A 2023-10-27 2023-10-27 一种投标书的生成方法、装置、设备及存储介质 Active CN117150000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311403481.6A CN117150000B (zh) 2023-10-27 2023-10-27 一种投标书的生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311403481.6A CN117150000B (zh) 2023-10-27 2023-10-27 一种投标书的生成方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117150000A CN117150000A (zh) 2023-12-01
CN117150000B true CN117150000B (zh) 2024-02-02

Family

ID=88910381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311403481.6A Active CN117150000B (zh) 2023-10-27 2023-10-27 一种投标书的生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117150000B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117635283A (zh) * 2023-12-07 2024-03-01 北京鸿鹄元数科技有限公司 基于文本识别的投标方案制作检查和预评的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115099911A (zh) * 2022-07-07 2022-09-23 缆宝(武汉)科技发展有限公司 一种适用于大宗商品的招投标方法及系统
CN115577691A (zh) * 2022-09-27 2023-01-06 海尔优家智能科技(北京)有限公司 标书生成方法、存储介质及电子装置
CN115587578A (zh) * 2021-07-05 2023-01-10 珠海采筑电子商务有限公司 招标公告生成方法、装置、电子设备及存储介质
CN115760258A (zh) * 2022-11-04 2023-03-07 中铁一局集团建筑安装工程有限公司 投标文件智能生成方法、系统、计算机装置和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140006201A1 (en) * 2012-06-29 2014-01-02 Accion Group Inc. Method and apparatus for competitive solicitation and bidding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115587578A (zh) * 2021-07-05 2023-01-10 珠海采筑电子商务有限公司 招标公告生成方法、装置、电子设备及存储介质
CN115099911A (zh) * 2022-07-07 2022-09-23 缆宝(武汉)科技发展有限公司 一种适用于大宗商品的招投标方法及系统
CN115577691A (zh) * 2022-09-27 2023-01-06 海尔优家智能科技(北京)有限公司 标书生成方法、存储介质及电子装置
CN115760258A (zh) * 2022-11-04 2023-03-07 中铁一局集团建筑安装工程有限公司 投标文件智能生成方法、系统、计算机装置和存储介质

Also Published As

Publication number Publication date
CN117150000A (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN117150000B (zh) 一种投标书的生成方法、装置、设备及存储介质
CN114610845B (zh) 基于多系统的智能问答方法、装置和设备
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN113268560A (zh) 用于文本匹配的方法和装置
CN112686053A (zh) 一种数据增强方法、装置、计算机设备及存储介质
US20220198358A1 (en) Method for generating user interest profile, electronic device and storage medium
US20200374258A1 (en) Stepwise relationship cadence management
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
CN117370520A (zh) 分流的对话处理方法、装置、设备及介质
EP4116884A2 (en) Method and apparatus for training tag recommendation model, and method and apparatus for obtaining tag
CN113612777B (zh) 训练方法、流量分级方法、装置、电子设备以及存储介质
CN115238676A (zh) 招标需求热点识别方法、装置、存储介质及电子设备
CN117131197B (zh) 一种招标书的需求类别处理方法、装置、设备及存储介质
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN110879868A (zh) 顾问方案生成方法、装置、系统、电子设备及介质
CN113344405B (zh) 基于知识图谱生成信息的方法、装置、设备、介质和产品
CN116244740B (zh) 一种日志脱敏方法、装置、电子设备及存储介质
CN113971216B (zh) 数据处理方法、装置、电子设备和存储器
CN115688725A (zh) 报告框架模板的生成方法、装置、电子设备及介质
CN117453973A (zh) 信息推荐方法、装置、设备及介质
CN112288548A (zh) 目标对象的关键信息的提取方法、装置、介质及电子设备
CN117313670A (zh) 文案生成方法、装置、电子设备以及存储介质
CN114756753A (zh) 一种产品推荐方法、装置、电子设备及存储介质
CN113190779A (zh) 网页评估方法和装置
CN117807204A (zh) 工程机械故障问题的问答诊断方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant