CN112668838A - 一种基于自然语言解析的评分标准词库建立方法及装置 - Google Patents
一种基于自然语言解析的评分标准词库建立方法及装置 Download PDFInfo
- Publication number
- CN112668838A CN112668838A CN202011453079.5A CN202011453079A CN112668838A CN 112668838 A CN112668838 A CN 112668838A CN 202011453079 A CN202011453079 A CN 202011453079A CN 112668838 A CN112668838 A CN 112668838A
- Authority
- CN
- China
- Prior art keywords
- scoring
- word
- database
- keywords
- establishing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及招标采购管理技术领域,提供一种基于自然语言解析的评分标准词库建立方法及装置,用于提高评标效率。本发明提供的基于自然语言解析的评分标准词库建立方法,包括:基于招标采购案例数据库及标的物的相关信息,建立评分知识库;通过对评分知识库进行逐条归纳整理,建立评分数据库;从所述评分数据库中提取评分关键词,基于提取的评分关键词建立评分标准词库。可以提取出大量的评分用关键词,降低专家的工作量,提高评标效率。
Description
技术领域
本发明涉及招标采购管理技术领域,具体涉及基于自然语言解析的评分标准词库建立方法。
背景技术
按照广电企【2019】8号文《关于印发公司深化招标管理改革任务分解表的通知》整体要求,通过利用供应商数据重构等技术实现客观分智能计算、投标文件自动定位、智能辅助验真,减轻专家评标时客观分评审工作量、减少专家机械工作内容、对投标文件所提供资料进行验真。
招标采购过程中,尤其是评标过程中,专家对标的物供应商进行评价,给出选择哪家供应商的建议,涉及到很多评价意见要进行填写。专家在评选大量标的物时,需要花费大量的时间和精力撰写评价意见。具有较多评价或评分常用词的词库可以有效减低专家的工作量,提高评标效率,但现在缺乏用于这种词库。
发明内容
本发明解决的技术问题为提高评标效率,提供基于自然语言解析的评分标准词库建立方法。
为了解决上述技术问题,本发明提供的技术方案为:
基于自然语言解析的评分标准词库建立方法,包括:
基于招标采购案例数据库及标的物的相关信息,建立评分知识库;
通过对评分知识库进行逐条归纳整理,建立评分数据库;
从所述评分数据库中提取评分关键词,基于提取的评分关键词建立评分标准词库。
从历史采购案例中提取关键词,建立标准词库。
可以提取出大量的评分用关键词,降低专家的工作量,提高评标效率。
优选地,所述标的物相关信息包括采购需求说明说明和供应商信息,所述基于招标采购案例数据库及标的物相关信息,建立评分知识库的方法包括:
根据标的物采购需求说明,依据标的物重要程度和供应商进行排序,确定供应商中标的关键原因;
所述评分知识库包括标的物相关信息、供应商中标关键原因,评分内容。
优选地,建立评分数据库包括:
将评分知识库逐条归纳整理,形成招标评价的案例,其中,单条案例u标识为:
u={i,p,f,r,c}
其中i为招标采购案例编号,p为标的物相关信息,f为采购频次,r为供应商中标关键原因,c为评分内容;
评分数据库为单条案例u形成的集合。
优选地,从所述评分数据库中提取评分关键词的方法包括:
从评分数据库依次提取单条案例中的供应商中标关键原因,,进而得到中标关键原因集合R,基于中标关键原因集合R得到评分关键词。
优选地,基于中标关键原因集合R得到评分关键词的方法包括:
对单条供应商中标关键原因进行分词,得到候选关键词集合,通过所述候选关键词集合构建候选关键此图,候选关键词词图中任意两个分词之间边的权重为wji,分词Vi的权重计算公式如下:
其中,d为阻尼系数,d∈(0,1),代表从词图某一特定词只想其他任意词的概率,Vi表示指向词Vi的词集合,o(Vj)表示词Vi指向的词集合;
根据权重计算公式对候选关键词词图进行循环迭代直至收敛,最终得到各节点的权重;
将各分词的权重按照降序进行排序,选取前面一定数量的词语作为评分关键词。根据候选关键词的权重进行排序,权重大的作为评分关键词。
优选地,将所述评分关键词、所述评分关键词的上下文输入神经网络模型,所述评分关键词的上下文即所在评分关键词的前一句和下一句文本,所述神经网络模型包括:
输入层,所述输入层包括关键词编译器和上下文编译器,所述关键词编译器将评分关键词转变为词向量,所述上下文编译器将所述评分关键词的上下文转变为上下文向量;
全连接层,所述全连接层将词向量和上下文向量拼接后的向量作为输入,以包括候选词库中各候选词与评分关键词之间的特征相思苦的相似度向量作为输出;
分类层,所述分类层以所述相似度向量为输入,所述分类层将所述相似度向量归一化,得到概率向量为输出。利用神经网络对评分关键词进行扩展,丰富词库内容。
优选地,所述神经网络模型的训练方法包括:
将部分评分关键词及其对应的上下文、人工挑选的与评分关键词对应的扩展词作为训练样本;
将训练样本输入神经网络模型,获取输出的预测概率向量,所述预测概率向量中包括部分人工挑选的与评分关键词对应的扩展词及与样本不相关的候选词;
根据所述预测概率向量和人工挑选的与评分关键词对应的扩展词,计算损失函数,以最小化损失函数为训练目标,更新神经网络的参数,至神经网络收敛,得到训练好的神经网络。
基于自然语言解析的评分标准词库建立装置,包括:
知识库建立模块,所述知识库建立模块基于招标采购案例数据库及标的物的相关信息,建立评分知识库;
数据库建立模块,所述数据库建立模块通过对评分知识库进行逐条归纳整理,建立评分数据库;
词库建立模块,所述词库建立模块从所述评分数据库中提取评分关键词,基于提取的评分关键词建立评分标准词库。
一种终端,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序以实现上述的方法。
一种存储介质,存储有计算机程序,所述计算机程序可被执行以实现上述的方法。
与现有技术相比,本发明具有的有益效果为:可以提取出大量的评分用关键词,降低专家的工作量,提高评标效率。
发明人在大量实验的基础上发现从招标采购案例数据库中采集的关键词存在数量过少,不能有效提高评标效率。为此,发明人采用了多种方式对关键词进行扩展,最终发现采用神经网络模型可以有效扩展关键词,从而提高评标效率。
附图说明
图1为基于自然语言解析的评分标准词库建立方法的示意图。
图2为基于自然语言解析的评分标准词库建立装置的示意图。
具体实施方式
以下实施例是对本发明的进一步说明,不是对本发明的限制。
基于自然语言解析的评分标准词库建立方法,在本申请的一些实施例中,包括:
基于招标采购案例数据库及标的物的相关信息,建立评分知识库;
S100.通过对评分知识库进行逐条归纳整理,建立评分数据库;
S200.从所述评分数据库中提取评分关键词,基于提取的评分关键词建立评分标准词库。
S300.从历史采购案例中提取关键词,建立标准词库。
可以提取出大量的评分用关键词,降低专家的工作量,提高评标效率。
在本申请的一些实施例中,所述标的物相关信息包括采购需求说明说明和供应商信息,所述基于招标采购案例数据库及标的物相关信息,建立评分知识库的方法包括:
根据标的物采购需求说明,依据标的物重要程度和供应商进行排序,确定供应商中标的关键原因;
所述评分知识库包括标的物相关信息、供应商中标关键原因,评分内容。
专家评标过程中,对供应商及其提供的标的物进行评价,从中的提取出的供应商关键原因可以为之后评标提供参考。
在本申请的一些实施例中,建立评分数据库包括:
将评分知识库逐条归纳整理,形成招标评价的案例,其中,单条案例u标识为:
u={i,p,f,r,c}
其中i为招标采购案例编号,p为标的物相关信息,f为采购频次,r为供应商中标关键原因,c为评分内容;
评分数据库为单条案例u形成的集合。
利用自然语言处理的方式对评分知识库进行整理,形成评分数据库。
在本申请的一些实施例中,从所述评分数据库中提取评分关键词的方法包括:
从评分数据库依次提取单条案例中的供应商中标关键原因,,进而得到中标关键原因集合R,基于中标关键原因集合R得到评分关键词。
在本申请的一些实施例中,基于中标关键原因集合R得到评分关键词的方法包括:
对单条供应商中标关键原因进行分词,得到候选关键词集合,通过所述候选关键词集合构建候选关键此图,候选关键词词图中任意两个分词之间边的权重为wji,分词Vi的权重计算公式如下:
其中,d为阻尼系数,d∈(0,1),代表从词图某一特定词只想其他任意词的概率,Vi表示指向词Vi的词集合,o(Vj)表示词Vi指向的词集合;
根据权重计算公式对候选关键词词图进行循环迭代直至收敛,最终得到各节点的权重;
将各分词的权重按照降序进行排序,选取前面一定数量的词语作为评分关键词。
根据候选关键词的权重进行排序,权重大的作为评分关键词。
在本申请的一些实施例中,将所述评分关键词、所述评分关键词的上下文输入神经网络模型,所述评分关键词的上下文即所在评分关键词的前一句和下一句文本,所述神经网络模型包括:
输入层,所述输入层包括关键词编译器和上下文编译器,所述关键词编译器将评分关键词转变为词向量,所述上下文编译器将所述评分关键词的上下文转变为上下文向量;
全连接层,所述全连接层将词向量和上下文向量拼接后的向量作为输入,以包括候选词库中各候选词与评分关键词之间的特征相思苦的相似度向量作为输出;
分类层,所述分类层以所述相似度向量为输入,所述分类层将所述相似度向量归一化,得到概率向量为输出。
利用神经网络对评分关键词进行扩展,丰富词库内容。候选词库也是常用的评分用词,从中筛选出有助于评分的更多关键词。
在本申请的一些实施例中,所述神经网络模型的训练方法包括:
将部分评分关键词及其对应的上下文、人工挑选的与评分关键词对应的扩展词作为训练样本;
将训练样本输入神经网络模型,获取输出的预测概率向量,所述预测概率向量中包括部分人工挑选的与评分关键词对应的扩展词及与样本不相关的候选词;
根据所述预测概率向量和人工挑选的与评分关键词对应的扩展词,计算损失函数,以最小化损失函数为训练目标,更新神经网络的参数,至神经网络收敛,得到训练好的神经网络。
基于自然语言解析的评分标准词库建立装置,在本申请的一些实施例中,包括:
知识库建立模块100,所述知识库建立模块100基于招标采购案例数据库及标的物的相关信息,建立评分知识库;
数据库建立模块200,所述数据库建立模块200通过对评分知识库进行逐条归纳整理,建立评分数据库;
词库建立模块300,所述词库建立模块300从所述评分数据库中提取评分关键词,基于提取的评分关键词建立评分标准词库。
在本申请的一些实施例中,所述知识库建立模块包括关键原因提取模块,所述标的物相关信息包括采购需求说明说明和供应商信息,所述基于招标采购案例数据库及标的物相关信息,所述建立评分知识库的方法包括:
所述关键原因提取模块根据标的物采购需求说明,依据标的物重要程度和供应商进行排序,确定供应商中标的关键原因;
所述评分知识库包括标的物相关信息、供应商中标关键原因,评分内容。
专家评标过程中,对供应商及其提供的标的物进行评价,从中的提取出的供应商关键原因可以为之后评标提供参考。
在本申请的一些实施例中,所述数据库建立模块建立评分数据库的方法包括:
将评分知识库逐条归纳整理,形成招标评价的案例,其中,单条案例u标识为:
u={i,p,f,r,c}
其中i为招标采购案例编号,p为标的物相关信息,f为采购频次,r为供应商中标关键原因,c为评分内容;
评分数据库为单条案例u形成的集合。
利用自然语言处理的方式对评分知识库进行整理,形成评分数据库。
在本申请的一些实施例中,还包括评分关键词提取模块,所述评分关键词提取模块从所述评分数据库中提取评分关键词的方法包括:
从评分数据库依次提取单条案例中的供应商中标关键原因,,进而得到中标关键原因集合R,基于中标关键原因集合R得到评分关键词。
在本申请的一些实施例中,所述评分关键词提取模块基于中标关键原因集合R得到评分关键词的方法包括:
对单条供应商中标关键原因进行分词,得到候选关键词集合,通过所述候选关键词集合构建候选关键此图,候选关键词词图中任意两个分词之间边的权重为wji,分词Vi的权重计算公式如下:
其中,d为阻尼系数,d∈(0,1),代表从词图某一特定词只想其他任意词的概率,Vi表示指向词Vi的词集合,o(Vj)表示词Vi指向的词集合;
根据权重计算公式对候选关键词词图进行循环迭代直至收敛,最终得到各节点的权重;
将各分词的权重按照降序进行排序,选取前面一定数量的词语作为评分关键词。
根据候选关键词的权重进行排序,权重大的作为评分关键词。
在本申请的一些实施例中,还包括扩增模块,所述扩展模块将所述评分关键词、所述评分关键词的上下文输入神经网络模型,所述评分关键词的上下文即所在评分关键词的前一句和下一句文本,所述神经网络模型包括:
输入层,所述输入层包括关键词编译器和上下文编译器,所述关键词编译器将评分关键词转变为词向量,所述上下文编译器将所述评分关键词的上下文转变为上下文向量;
全连接层,所述全连接层将词向量和上下文向量拼接后的向量作为输入,以包括候选词库中各候选词与评分关键词之间的特征相思苦的相似度向量作为输出;
分类层,所述分类层以所述相似度向量为输入,所述分类层将所述相似度向量归一化,得到概率向量为输出。
利用神经网络对评分关键词进行扩展,丰富词库内容。候选词库也是常用的评分用词,从中筛选出有助于评分的更多关键词。
在本申请的一些实施例中,还包括训练模块,所述训练模块训练所述神经网络模型的训练方法包括:
将部分评分关键词及其对应的上下文、人工挑选的与评分关键词对应的扩展词作为训练样本;
将训练样本输入神经网络模型,获取输出的预测概率向量,所述预测概率向量中包括部分人工挑选的与评分关键词对应的扩展词及与样本不相关的候选词;
根据所述预测概率向量和人工挑选的与评分关键词对应的扩展词,计算损失函数,以最小化损失函数为训练目标,更新神经网络的参数,至神经网络收敛,得到训练好的神经网络。
一种终端,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序以实现上述的方法。
一种存储介质,存储有计算机程序,所述计算机程序可被执行以实现上述的方法。
上列详细说明是针对本发明可行实施例的具体说明,以上实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本案的专利范围中。
Claims (10)
1.基于自然语言解析的评分标准词库建立方法,其特征在于,包括:
基于招标采购案例数据库及标的物的相关信息,建立评分知识库;
通过对评分知识库进行逐条归纳整理,建立评分数据库;
从所述评分数据库中提取评分关键词,基于提取的评分关键词建立评分标准词库。
2.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法,其特征在于,所述标的物相关信息包括采购需求说明说明和供应商信息,所述基于招标采购案例数据库及标的物相关信息,建立评分知识库的方法包括:
根据标的物采购需求说明,依据标的物重要程度和供应商进行排序,确定供应商中标的关键原因;
所述评分知识库包括标的物相关信息、供应商中标关键原因,评分内容。
3.根据权利要求2所述的基于自然语言解析的评分标准词库建立方法,其特征在于,建立评分数据库包括:
将评分知识库逐条归纳整理,形成招标评价的案例,其中,单条案例u标识为:
u={i,p,f,r,c}
其中i为招标采购案例编号,p为标的物相关信息,f为采购频次,r为供应商中标关键原因,c为评分内容;
评分数据库为单条案例u形成的集合。
4.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法,其特征在于,从所述评分数据库中提取评分关键词的方法包括:
从评分数据库依次提取单条案例中的供应商中标关键原因,,进而得到中标关键原因集合R,基于中标关键原因集合R得到评分关键词。
6.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法,其特征在于,将所述评分关键词、所述评分关键词的上下文输入神经网络模型,所述评分关键词的上下文即所在评分关键词的前一句和下一句文本,所述神经网络模型包括:
输入层,所述输入层包括关键词编译器和上下文编译器,所述关键词编译器将评分关键词转变为词向量,所述上下文编译器将所述评分关键词的上下文转变为上下文向量;
全连接层,所述全连接层将词向量和上下文向量拼接后的向量作为输入,以包括候选词库中各候选词与评分关键词之间的特征相思苦的相似度向量作为输出;
分类层,所述分类层以所述相似度向量为输入,所述分类层将所述相似度向量归一化,得到概率向量为输出。
7.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法,其特征在于,所述神经网络模型的训练方法包括:
将部分评分关键词及其对应的上下文、人工挑选的与评分关键词对应的扩展词作为训练样本;
将训练样本输入神经网络模型,获取输出的预测概率向量,所述预测概率向量中包括部分人工挑选的与评分关键词对应的扩展词及与样本不相关的候选词;
根据所述预测概率向量和人工挑选的与评分关键词对应的扩展词,计算损失函数,以最小化损失函数为训练目标,更新神经网络的参数,至神经网络收敛,得到训练好的神经网络。
8.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法装置,其特征在于,包括:
知识库建立模块,所述知识库建立模块基于招标采购案例数据库及标的物的相关信息,建立评分知识库;
数据库建立模块,所述数据库建立模块通过对评分知识库进行逐条归纳整理,建立评分数据库;
词库建立模块,所述词库建立模块从所述评分数据库中提取评分关键词,基于提取的评分关键词建立评分标准词库。
9.一种终端,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序以实现权利要求1~7任一项所述的方法。
10.一种存储介质,其特征在于,存储有计算机程序,所述计算机程序可被执行以实现权利要求1~7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011453079.5A CN112668838A (zh) | 2020-12-11 | 2020-12-11 | 一种基于自然语言解析的评分标准词库建立方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011453079.5A CN112668838A (zh) | 2020-12-11 | 2020-12-11 | 一种基于自然语言解析的评分标准词库建立方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112668838A true CN112668838A (zh) | 2021-04-16 |
Family
ID=75402482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011453079.5A Pending CN112668838A (zh) | 2020-12-11 | 2020-12-11 | 一种基于自然语言解析的评分标准词库建立方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112668838A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115270763A (zh) * | 2022-06-23 | 2022-11-01 | 广东国义信息科技有限公司 | 一种基于多数据库的风险控制方法 |
CN116501896A (zh) * | 2023-06-26 | 2023-07-28 | 中招联合信息股份有限公司 | 基于使用习惯分析文件关键字关联性的预测系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446885A (zh) * | 2018-01-31 | 2018-08-24 | 国网山东省电力公司经济技术研究院 | 一种评审意见自动归集方法 |
CN109902153A (zh) * | 2019-04-02 | 2019-06-18 | 杭州安脉盛智能技术有限公司 | 基于自然语言处理和案例推理的设备故障诊断方法及系统 |
-
2020
- 2020-12-11 CN CN202011453079.5A patent/CN112668838A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446885A (zh) * | 2018-01-31 | 2018-08-24 | 国网山东省电力公司经济技术研究院 | 一种评审意见自动归集方法 |
CN109902153A (zh) * | 2019-04-02 | 2019-06-18 | 杭州安脉盛智能技术有限公司 | 基于自然语言处理和案例推理的设备故障诊断方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115270763A (zh) * | 2022-06-23 | 2022-11-01 | 广东国义信息科技有限公司 | 一种基于多数据库的风险控制方法 |
CN115270763B (zh) * | 2022-06-23 | 2023-05-30 | 广东国义信息科技有限公司 | 一种基于多数据库的风险控制方法 |
CN116501896A (zh) * | 2023-06-26 | 2023-07-28 | 中招联合信息股份有限公司 | 基于使用习惯分析文件关键字关联性的预测系统 |
CN116501896B (zh) * | 2023-06-26 | 2023-09-19 | 中招联合信息股份有限公司 | 基于使用习惯分析文件关键字关联性的预测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Luan et al. | Scientific information extraction with semi-supervised neural tagging | |
CN112184525B (zh) | 通过自然语义分析实现智能匹配推荐的系统及方法 | |
CN112818093B (zh) | 基于语义匹配的证据文档检索方法、系统及存储介质 | |
WO2018153215A1 (zh) | 一种自动生成语义相近句子样本的方法 | |
CN106294639A (zh) | 基于语义的跨语言专利新创性预判分析方法 | |
CN112632228A (zh) | 一种基于文本挖掘的辅助评标方法及系统 | |
CN110083696B (zh) | 基于元结构技术的全局引文推荐方法、推荐系统 | |
CN111158641B (zh) | 基于语义分析和文本挖掘的事务类功能点自动识别方法 | |
CN115098690B (zh) | 一种基于聚类分析的多数据文档分类方法及系统 | |
CN111859961A (zh) | 一种基于改进TopicRank算法的文本关键词抽取方法 | |
CN112668838A (zh) | 一种基于自然语言解析的评分标准词库建立方法及装置 | |
CN112449700A (zh) | 语义模型实例化方法、系统和装置 | |
CN114818717A (zh) | 融合词汇和句法信息的中文命名实体识别方法及系统 | |
WO2021128529A1 (zh) | 一种技术趋势预测方法和系统 | |
CN111274494B (zh) | 结合深度学习和协同过滤技术的复合标签推荐方法 | |
CN115470354A (zh) | 基于多标签分类识别嵌套和重叠风险点的方法及系统 | |
CN110287493B (zh) | 风险短语识别方法、装置、电子设备及存储介质 | |
CN108491407B (zh) | 一种面向代码检索的查询扩展方法 | |
Revindasari et al. | Traceability between business process and software component using Probabilistic Latent Semantic Analysis | |
CN109189915B (zh) | 一种基于深度相关匹配模型的信息检索方法 | |
CN111563361A (zh) | 文本标签的提取方法及装置、存储介质 | |
CN114742062B (zh) | 文本关键词提取处理方法及系统 | |
Wongchaisuwat | Automatic keyword extraction using textrank | |
CN108733702B (zh) | 用户查询上下位关系提取的方法、装置、电子设备和介质 | |
CN114741512A (zh) | 一种文本自动分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210416 |