CN112488593A - 一种用于招标的辅助评标系统及方法 - Google Patents
一种用于招标的辅助评标系统及方法 Download PDFInfo
- Publication number
- CN112488593A CN112488593A CN202011542596.XA CN202011542596A CN112488593A CN 112488593 A CN112488593 A CN 112488593A CN 202011542596 A CN202011542596 A CN 202011542596A CN 112488593 A CN112488593 A CN 112488593A
- Authority
- CN
- China
- Prior art keywords
- product
- information
- evaluation
- weight
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000004140 cleaning Methods 0.000 claims abstract description 28
- 238000000605 extraction Methods 0.000 claims abstract description 21
- 238000012986 modification Methods 0.000 claims description 9
- 230000004048 modification Effects 0.000 claims description 9
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 claims description 9
- 239000000284 extract Substances 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000006403 short-term memory Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/381—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using identifiers, e.g. barcodes, RFIDs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种用于招标的辅助评标系统及方法,包括,数据清洗模块,用以获取原始表述并对所述原始标书的内容按照预设清洗规则进行数据清理;归类模块,用以接收数据清洗后的标书并获取其中产品信息;根据预设划分规则将所述产品信息进行归类;提取信息模块,用以根据预设评估规则对所述位置参数和所述词性参数进行重要性评价,生成所述产品信息的权重结果;摘要模块,用以按权重比例对所述产品信息、所述位置参数及所述词性参数进行提取,生成所述产品信息的摘要;评标模块,用以将所述产品信息的摘要输出评标人员,获取评标人员输入的对应的评标结果。本发明对标书文件进行信息清洗、提取及评价,减少由人工操作的人力及财力成本。
Description
技术领域
本发明涉及评标系统技术领域,特别是涉及一种用于招标的辅助评标系统及方法。
背景技术
随着招标制度的成熟,企业在评审标书的过程中,对于海量的非结构化数据,若仅靠人工进行评审,其成效杯水车薪,而针对非结构化数据的评审已经成为评标工作的盲区,利用高科技手段与工具实现非结构化数据的分析与挖掘为评审标书提供数据支撑的需求已迫在眉睫。
现有的评标系统由于在特殊领域中的关键信息提取、判断技术尚未成熟,未能准确提取核心信息及进行优劣评价,需要评标人员人工进行关键信息的搜索和提取,因此,现有的评标系统还有待改进。
发明内容
本发明的目的在于,提出一种用于招标的辅助评标系统及方法,解决现有方法不能准确提取核心信息进行优劣评价,需要评标人员人工进行关键信息的搜索和提取的技术问题。
一方面,提供一种用于招标的辅助评标系统,包括:
数据清洗模块,用以获取原始标书,并识别所述原始标书内形容同一物体名称的不同词汇、数学符号及语句格式和介词,将所述同一物体名称的按照预设的词汇进行统一;并将所述数据符号按照预设的符号进行统一;以及将进行所述语句格式按照预设的格式进行统一,所述介词按照预设的介词进行统一;
归类模块,用以接收数据清洗后的标书并获取其中产品信息;根据预设划分规则将所述产品信息进行归类;其中,所述产品信息包括产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息;
提取信息模块,用以获取所述产品信息在标书中的位置参数和词性参数,将所述位置参数和所述词性参数转化成预先设定的格式进行输出;并根据预设评估规则对所述位置参数和所述词性参数进行重要性评价,生成所述产品信息的权重结果;
摘要模块,用以根据所有类型产品的产品信息的权重结果,获取某一类型产品的产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息,并将所述产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息按照权重比例进行组合,生成所述某一类型产品的产品信息的摘要;
评标模块,用以将所述产品信息的摘要输出评标人员,获取评标人员输入的与所述产品信息对应的评标结果。
优选地,还包括:领域词典库,用以为所述提取信息模块提供位置参数评估规则、词性参数评估规则,以及为所述数据清洗模块提供识别产品信息的关键词和统一规则;还用于,存储评标人员对所述产品信息、所述位置参数的权重及所述词性参数的权重的修改结果或更新结果。
优选地,所述归类模块识别所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息,分别根据预设的相似性判断规则对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息的相似性进行判断,生成相似性结果,并根据所述相似性规则分别对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息进行归类,将相似性大于预设阈值的内容划分为一类,生成归类结果;
根据所述归类结果对每一类中所述产品属性类别信息、所述产品属性值信息进行识别并将同属于一类的产品或属性值相同的产品进行关联,归为同一类型产品。
优选地,所述提取信息模块将属于同一类型产品的产品信息的位置参数和词性参数进行整合,生成所有类型产品的产品信息的位置参数和词性参数;
根据所述位置参数评估规则和词性参数评估规则分别评估某一类型产品的产品信息的位置参数权重结果和词性参数的权重结果,生成所有类型产品的产品信息的权重结果。
另一方面,还提供一种用于招标的辅助评标方法,依靠所述的于招标的辅助评标系统进行实现,包括以下步骤:
步骤S1,获取原始标书,并对所述原始标书的内容按照预设清洗规则进行数据清理;
步骤S2,接收数据清洗后的标书,获取其中产品信息;根据预设划分规则将所述产品信息进行归类;其中,所述产品信息包括产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息;
步骤S3,获取所述产品信息在标书中的位置参数和词性参数,将所述位置参数和所述词性参数转化成预先设定的格式进行输出;并根据预设评估规则对所述位置参数和所述词性参数进行重要性评价,生成所述产品信息的权重结果;
步骤S4,根据所述产品信息的权重结果按权重比例对所述产品信息、所述位置参数及所述词性参数进行提取,生成所述产品信息的摘要;并将所述产品信息的摘要输出评标人员,获取评标人员输入的与所述产品信息对应的评标结果。
优选地,所述步骤S1包括:识别所述原始标书内形容同一物体名称的不同词汇,并将所述同一物体名称的按照预设的词汇进行统一;
识别所述原始标书内的数学符号,并将所述数据符号按照预设的符号进行统一;
识别所述原始标书内的语句格式和介词,将进行所述语句格式按照预设的格式进行统一,并所述介词按照预设的介词进行统一。
优选地,所述步骤S2包括:识别所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息,分别根据预设的相似性判断规则对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息的相似性进行判断,生成相似性结果,并根据所述相似性规则分别对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息进行归类,将相似性大于预设阈值的内容划分为一类,生成归类结果;
根据所述归类结果对每一类中所述产品属性类别信息、所述产品属性值信息进行识别并将同属于一类的产品或属性值相同的产品进行关联,归为同一类型产品。
优选地,所述步骤S3包括:将属于同一类型产品的产品信息的位置参数和词性参数进行整合,生成所有类型产品的产品信息的位置参数和词性参数;
从领域词典库中获取位置参数评估规则和词性参数评估规则,根据所述位置参数评估规则和词性参数评估规则分别评估某一类型产品的产品信息的位置参数权重结果和词性参数的权重结果,生成所有类型产品的产品信息的权重结果。
优选地,所述步骤S3还包括:将所述产品信息、所述位置参数的权重及所述词性参数的权重输出给评标人员,获取评标人员对所述产品信息、所述位置参数的权重及所述词性参数的权重的修改结果或更新结果,将所述修改结果或更新结果存入领域词典库。
优选地,所述步骤S4包括:根据所有类型产品的产品信息的权重结果,获取某一类型产品的产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息,并将所述产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息按照权重比例进行组合,生成所述某一类型产品的产品信息的摘要。
综上,实施本发明的实施例,具有如下的有益效果:
本发明提供的用于招标的辅助评标系统及方法,在评标过程中对关键字词进行标记及评价,在线更新评标系统的关键字提取及其评价,不断提高评标系统关键信息提取效率。将非结构化的标书文件进行信息清洗、提取及评价,以帮助评标人员减少由人工操作产生的大量人力及财力成本。不断将评标系统提取的关键信息进行标记、评价,以不断改善本评标系统的信息提取及生成自动摘要的性能。根据预设的编写规则进行筛选、评价不仅仅适用于某一方面的标书处理,可对不同投标项目进行针对性的训练及提取,具有一定的泛用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例中一种用于招标的辅助评标的结构示意图。
图2为本发明实施例中一种用于招标的辅助评标方法的主流程示意图。
图3为本发明实施例中一种用于招标的辅助评标方法的逻辑示意图。
图4为本发明实施例中提取信息模块的架构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明提供的一种用于招标的辅助评标系统的一个实施例的示意图。在该实施例中,
数据清洗模块,用以获取原始标书,并识别所述原始标书内形容同一物体名称的不同词汇、数学符号及语句格式和介词,将所述同一物体名称的按照预设的词汇进行统一;并将所述数据符号按照预设的符号进行统一;以及将进行所述语句格式按照预设的格式进行统一,所述介词按照预设的介词进行统一;可以理解的是,为方便后续模块中文本处理并提高文本处理的精确度,需要完成数据清洗工作,数据清洗主要包含:同一物体的不同词汇名词统一化;数学符号(如乘号)的统一化;陈述句格式和介词使用的统一化等。数据清洗工作是非常消耗人力和时间的工作,是文本处理提高准确率的基石和根本.因此,需对所有对抽取知识有影响的词语进行一一清洗。
归类模块,用以接收数据清洗后的标书并获取其中产品信息;根据预设划分规则将所述产品信息进行归类;其中,所述产品信息包括产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息;具体实施例中,所述归类模块识别所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息,分别根据预设的相似性判断规则对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息的相似性进行判断,生成相似性结果,并根据所述相似性规则分别对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息进行归类,将相似性大于预设阈值的内容划分为一类,生成归类结果;根据所述归类结果对每一类中所述产品属性类别信息、所述产品属性值信息进行识别并将同属于一类的产品或属性值相同的产品进行关联,归为同一类型产品。可以理解的是,经过数据清洗后的标书文本,公司信息词汇、产品词汇、属性名和属性值的相对位置都已符合统一的格式。根据汉语句号及上下文相似度对病历文本进行粗粒度切割,划分出来的大文块具有统一的产品信息和相似内容,但含有多种属性名与具体的属性值所组建的“键-值”对,使用句法分析进行细粒度切割,各个小块分别叙述一种属性。
提取信息模块,用以获取所述产品信息在标书中的位置参数和词性参数,将所述位置参数和所述词性参数转化成预先设定的格式进行输出;并根据预设评估规则对所述位置参数和所述词性参数进行重要性评价,生成所述产品信息的权重结果;可以理解的是,借助领域词典库添加新词及权重,提高关键词提取的准确性,结合关键信息(产品信息)在标书文本中的具体位置和词性,标书文本分析系统可快速锁定标书文本中包含的信息,并经过既定格式进行整理和输出。然后,由评标人员进行查阅,对已提取的关键信息进行评价,输入到领域词典库中。
具体实施例中,所述提取信息模块将属于同一类型产品的产品信息的位置参数和词性参数进行整合,生成所有类型产品的产品信息的位置参数和词性参数;根据所述位置参数评估规则和词性参数评估规则分别评估某一类型产品的产品信息的位置参数权重结果和词性参数的权重结果,生成所有类型产品的产品信息的权重结果。
摘要模块,用以根据所有类型产品的产品信息的权重结果,获取某一类型产品的产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息,并将所述产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息按照权重比例进行组合,生成所述某一类型产品的产品信息的摘要;可以理解的是,根据所述产品信息的权重结果按权重比例对所述产品信息、所述位置参数及所述词性参数进行提取,生成所述产品信息的摘要。
具体实施例中,如图4所示,摘要模块主要包括编码器和解码器,其中,编码器从原始文本中提取信息的双向LSTM(Long Short-Term Memory,长短期记忆网络)层。双向LSTM(Long Short-Term Memory,长短期记忆网络)一次读取一个字,并根据当前字和之前读过的字更新其隐藏状态。解码器包括单向LSTM(Long Short-Term Memory,长短期记忆网络)层,一次生成一个字的摘要。它使用来自编码器的信息以及之前编写的信息来创建下一个字的概率分布。编码器和解码器是这里的构建块,在没有注意力机制的情况下,解码器的输入是编码器的最终隐藏状态,可以是256或512维矢量。通过注意力机制,解码器可以访问编码器中的中间隐藏状态,并使用所有这些信息来决定下一个字。
评标模块,用以将所述产品信息的摘要输出评标人员,获取评标人员输入的与所述产品信息对应的评标结果。
领域词典库,用以为所述提取信息模块提供位置参数评估规则、词性参数评估规则,以及为所述数据清洗模块提供识别产品信息的关键词和统一规则;还用于,存储评标人员对所述产品信息、所述位置参数的权重及所述词性参数的权重的修改结果或更新结果。可以理解的是,通过评标人员对关键字词的评价,对其词性进行重要性评分,以协助提取信息模块提取类似的信息,提高其提取准确度,并提供自动摘要模块中各个关键词的权重,使自动摘要模块的结果更接近人工评价方法。
如图2和图3所示,为本发明提供的一种用于招标的辅助评标方法的一个实施例的示意图。在该实施例中,所述方法依靠所述用于招标的辅助评标系统进行实现,包括以下步骤:
步骤S1,获取原始标书,并对所述原始标书的内容按照预设清洗规则进行数据清理;可以理解的是,为方便后续模块中文本处理并提高文本处理的精确度,需要完成数据清洗工作,数据清洗主要包含:同一物体的不同词汇名词统一化;数学符号(如乘号)的统一化;陈述句格式和介词使用的统一化等。数据清洗工作是非常消耗人力和时间的工作,是文本处理提高准确率的基石和根本.因此,需对所有对抽取知识有影响的词语进行一一清洗。
具体实施例中,识别所述原始标书内形容同一物体名称的不同词汇,并将所述同一物体名称的按照预设的词汇进行统一;
识别所述原始标书内的数学符号,并将所述数据符号按照预设的符号进行统一;
识别所述原始标书内的语句格式和介词,将进行所述语句格式按照预设的格式进行统一,并所述介词按照预设的介词进行统一。
步骤S2,接收数据清洗后的标书,获取其中产品信息;根据预设划分规则将所述产品信息进行归类;其中,所述产品信息包括产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息;可以理解的是,经过数据清洗后的标书文本,公司信息词汇、产品词汇、属性名和属性值的相对位置都已符合统一的格式。根据汉语句号及上下文相似度对病历文本进行粗粒度切割,划分出来的大文块具有统一的产品信息和相似内容,但含有多种属性名与具体的属性值所组建的“键-值”对,使用句法分析进行细粒度切割,各个小块分别叙述一种属性。
具体实施例中,识别所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息,分别根据预设的相似性判断规则对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息的相似性进行判断,生成相似性结果,并根据所述相似性规则分别对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息进行归类,将相似性大于预设阈值的内容划分为一类,生成归类结果;
根据所述归类结果对每一类中所述产品属性类别信息、所述产品属性值信息进行识别并将同属于一类的产品或属性值相同的产品进行关联,归为同一类型产品。
步骤S3,获取所述产品信息在标书中的位置参数和词性参数,将所述位置参数和所述词性参数转化成预先设定的格式进行输出;并根据预设评估规则对所述位置参数和所述词性参数进行重要性评价,生成所述产品信息的权重结果;可以理解的是,借助领域词典库添加新词及权重,提高关键词提取的准确性,结合关键信息(产品信息)在标书文本中的具体位置和词性,标书文本分析系统可快速锁定标书文本中包含的信息,并经过既定格式进行整理和输出。然后,由评标人员进行查阅,对已提取的关键信息进行评价,输入到领域词典库中。
具体实施例中,将属于同一类型产品的产品信息的位置参数和词性参数进行整合,生成所有类型产品的产品信息的位置参数和词性参数;
从领域词典库中获取位置参数评估规则和词性参数评估规则,根据所述位置参数评估规则和词性参数评估规则分别评估某一类型产品的产品信息的位置参数权重结果和词性参数的权重结果,生成所有类型产品的产品信息的权重结果。
具体地,将所述产品信息、所述位置参数的权重及所述词性参数的权重输出给评标人员,获取评标人员对所述产品信息、所述位置参数的权重及所述词性参数的权重的修改结果或更新结果,将所述修改结果或更新结果存入领域词典库。
步骤S4,根据所述产品信息的权重结果按权重比例对所述产品信息、所述位置参数及所述词性参数进行提取,生成所述产品信息的摘要;并将所述产品信息的摘要输出评标人员,获取评标人员输入的与所述产品信息对应的评标结果。
具体实施例中,根据所有类型产品的产品信息的权重结果,获取某一类型产品的产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息,并将所述产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息按照权重比例进行组合,生成所述某一类型产品的产品信息的摘要。
综上,实施本发明的实施例,具有如下的有益效果:
本发明提供的用于招标的辅助评标系统及方法,在评标过程中对关键字词进行标记及评价,在线更新评标系统的关键字提取及其评价,不断提高评标系统关键信息提取效率。将非结构化的标书文件进行信息清洗、提取及评价,以帮助评标人员减少由人工操作产生的大量人力及财力成本。不断将评标系统提取的关键信息进行标记、评价,以不断改善本评标系统的信息提取及生成自动摘要的性能。根据预设的编写规则进行筛选、评价不仅仅适用于某一方面的标书处理,可对不同投标项目进行针对性的训练及提取,具有一定的泛用性。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (10)
1.一种用于招标的辅助评标系统,其特征在于,包括:
数据清洗模块,用以获取原始标书,识别所述原始标书内描述同一物体的不同词汇、数学符号、语句格式和介词,并将描述同一物体的不同词汇、数学符号、语句格式和介词分别进行描述同一物体的不同词汇的统一、数学符号统一、语句格式统一和介词统一;
归类模块,用以接收数据清洗后的标书并获取其中产品信息;根据预设划分规则将所述产品信息进行归类;其中,所述产品信息包括产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息;
提取信息模块,用以获取所述产品信息在标书中的位置参数和词性参数,将所述位置参数和所述词性参数转化成预先设定的格式进行输出;并根据预设评估规则对所述位置参数和所述词性参数进行重要性评价,生成所述产品信息的权重结果;
摘要模块,用以根据所有类型产品的产品信息的权重结果,获取某一类型产品的产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息,并将所述产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息按照权重比例进行组合,生成所述某一类型产品的产品信息的摘要;
评标模块,用以将所述产品信息的摘要输出评标人员,获取评标人员输入的与所述产品信息对应的评标结果。
2.如权利要求1所述的系统,其特征在于,还包括:领域词典库,用以为所述提取信息模块提供位置参数评估规则、词性参数评估规则,以及为所述数据清洗模块提供识别产品信息的关键词和统一规则;还用于,存储评标人员对所述产品信息、所述位置参数的权重及所述词性参数的权重的修改结果或更新结果。
3.如权利要求2所述的系统,其特征在于,所述归类模块识别所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息,分别根据预设的相似性判断规则对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息的相似性进行判断,生成相似性结果,并根据所述相似性规则分别对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息进行归类,将相似性大于预设阈值的内容划分为一类,生成归类结果;
根据所述归类结果对每一类中所述产品属性类别信息、所述产品属性值信息进行识别并将同属于一类的产品或属性值相同的产品进行关联,归为同一类型产品。
4.如权利要求3所述的系统,其特征在于,所述提取信息模块将属于同一类型产品的产品信息的位置参数和词性参数进行整合,生成所有类型产品的产品信息的位置参数和词性参数;
根据所述位置参数评估规则和词性参数评估规则分别评估某一类型产品的产品信息的位置参数权重结果和词性参数的权重结果,生成所有类型产品的产品信息的权重结果。
5.一种用于招标的辅助评标方法,基于如权利要求1-4任一所述的系统进行实现,其特征在于,包括以下步骤:
步骤S1,获取原始标书,并对所述原始标书的内容按照预设清洗规则进行数据清理;
步骤S2,接收数据清洗后的标书,获取其中产品信息;根据预设划分规则将所述产品信息进行归类;其中,所述产品信息包括产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息;
步骤S3,获取所述产品信息在标书中的位置参数和词性参数,将所述位置参数和所述词性参数转化成预先设定的格式进行输出;并根据预设评估规则对所述位置参数和所述词性参数进行重要性评价,生成所述产品信息的权重结果;
步骤S4,根据所述产品信息的权重结果按权重比例对所述产品信息、所述位置参数及所述词性参数进行提取,生成所述产品信息的摘要;并将所述产品信息的摘要输出评标人员,获取评标人员输入的与所述产品信息对应的评标结果。
6.如权利要求5所述的方法,其特征在于,所述步骤S1包括:
识别所述原始标书内形容同一物体名称的不同词汇,并将所述同一物体名称的按照预设的词汇进行统一;
识别所述原始标书内的数学符号,并将所述数据符号按照预设的符号进行统一;
识别所述原始标书内的语句格式和介词,将进行所述语句格式按照预设的格式进行统一,并所述介词按照预设的介词进行统一。
7.如权利要求6所述的方法,其特征在于,所述步骤S2包括:
识别所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息,分别根据预设的相似性判断规则对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息的相似性进行判断,生成相似性结果,并根据所述相似性规则分别对所述产品名称、所述产品属性类别信息、所述产品属性值信息及所述产品所属公司信息进行归类,将相似性大于预设阈值的内容划分为一类,生成归类结果;
根据所述归类结果对每一类中所述产品属性类别信息、所述产品属性值信息进行识别并将同属于一类的产品或属性值相同的产品进行关联,归为同一类型产品。
8.如权利要求7所述的方法,其特征在于,所述步骤S3包括:
将属于同一类型产品的产品信息的位置参数和词性参数进行整合,生成所有类型产品的产品信息的位置参数和词性参数;
从领域词典库中获取位置参数评估规则和词性参数评估规则,根据所述位置参数评估规则和词性参数评估规则分别评估某一类型产品的产品信息的位置参数权重结果和词性参数的权重结果,生成所有类型产品的产品信息的权重结果。
9.如权利要求8所述的方法,其特征在于,所述步骤S3还包括:
将所述产品信息、所述位置参数的权重及所述词性参数的权重输出给评标人员,获取评标人员对所述产品信息、所述位置参数的权重及所述词性参数的权重的修改结果或更新结果,将所述修改结果或更新结果存入领域词典库。
10.如权利要求9所述的方法,其特征在于,所述步骤S4包括:
根据所有类型产品的产品信息的权重结果,获取某一类型产品的产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息,并将所述产品名称、产品属性类别信息、产品属性值信息及产品所属公司信息按照权重比例进行组合,生成所述某一类型产品的产品信息的摘要。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011542596.XA CN112488593B (zh) | 2020-12-24 | 2020-12-24 | 一种用于招标的辅助评标系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011542596.XA CN112488593B (zh) | 2020-12-24 | 2020-12-24 | 一种用于招标的辅助评标系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112488593A true CN112488593A (zh) | 2021-03-12 |
CN112488593B CN112488593B (zh) | 2023-10-20 |
Family
ID=74915405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011542596.XA Active CN112488593B (zh) | 2020-12-24 | 2020-12-24 | 一种用于招标的辅助评标系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112488593B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113836906A (zh) * | 2021-09-26 | 2021-12-24 | 中国联合网络通信集团有限公司 | 标书生成方法、装置及服务器 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615267A (zh) * | 2018-12-27 | 2019-04-12 | 平安科技(深圳)有限公司 | 招标评标方法及系统 |
CN110210952A (zh) * | 2019-06-13 | 2019-09-06 | 讯飞智元信息科技有限公司 | 一种评标方法及装置 |
CN110766278A (zh) * | 2019-09-20 | 2020-02-07 | 国家电网有限公司 | 一种自动化招标方法、装置及终端设备 |
-
2020
- 2020-12-24 CN CN202011542596.XA patent/CN112488593B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615267A (zh) * | 2018-12-27 | 2019-04-12 | 平安科技(深圳)有限公司 | 招标评标方法及系统 |
CN110210952A (zh) * | 2019-06-13 | 2019-09-06 | 讯飞智元信息科技有限公司 | 一种评标方法及装置 |
CN110766278A (zh) * | 2019-09-20 | 2020-02-07 | 国家电网有限公司 | 一种自动化招标方法、装置及终端设备 |
Non-Patent Citations (1)
Title |
---|
卢晶;江天博;陶涛;郭凯捷;胡远航;: "智能辅助评标工具应用设计", 项目管理技术, no. 04 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113836906A (zh) * | 2021-09-26 | 2021-12-24 | 中国联合网络通信集团有限公司 | 标书生成方法、装置及服务器 |
CN113836906B (zh) * | 2021-09-26 | 2023-06-06 | 中国联合网络通信集团有限公司 | 标书生成方法、装置及服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN112488593B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111723215B (zh) | 基于文本挖掘的生物技术信息知识图谱构建装置与方法 | |
AU2019263758B2 (en) | Systems and methods for generating a contextually and conversationally correct response to a query | |
CN106649260B (zh) | 基于评论文本挖掘的产品特征结构树构建方法 | |
CN109165294B (zh) | 一种基于贝叶斯分类的短文本分类方法 | |
CN110825877A (zh) | 一种基于文本聚类的语义相似度分析方法 | |
CN112183059B (zh) | 一种中文结构化事件抽取方法 | |
CN111967761A (zh) | 一种基于知识图谱的监控预警方法、装置及电子设备 | |
CN116628173B (zh) | 一种基于关键字提取的智能客服信息生成系统及生成方法 | |
CN110209818B (zh) | 一种面向语义敏感词句的分析方法 | |
CN111061882A (zh) | 一种知识图谱构建方法 | |
CN109446313B (zh) | 一种基于自然语言分析的排序系统及方法 | |
CN111897917B (zh) | 基于多模态自然语言特征的轨道交通行业术语提取方法 | |
CN111858842A (zh) | 一种基于lda主题模型的司法案例筛选方法 | |
CN112257442B (zh) | 一种基于扩充语料库神经网络的政策文件信息提取方法 | |
CN114266256A (zh) | 一种领域新词的提取方法及系统 | |
CN113159969A (zh) | 一种金融长文本复核系统 | |
CN114548072A (zh) | 用于合同类文件的自动内容解析与信息评测方法及系统 | |
CN114239579A (zh) | 基于正则表达式和crf模型的电力可研文档提取方法及装置 | |
CN112488593B (zh) | 一种用于招标的辅助评标系统及方法 | |
JP4005343B2 (ja) | 情報検索システム | |
CN116502637A (zh) | 一种结合上下文语义的文本关键词提取方法 | |
CN116383414A (zh) | 一种基于碳核查知识图谱的智能文件评审系统及方法 | |
CN110837735B (zh) | 一种数据智能分析识别方法及系统 | |
Sinha et al. | Break Down Resumes into Sections to Extract Data and Perform Text Analysis using Python | |
CN103119585B (zh) | 知识获取装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |