CN112434965A - 一种基于词频的专家标签产生方法、装置、终端 - Google Patents

一种基于词频的专家标签产生方法、装置、终端 Download PDF

Info

Publication number
CN112434965A
CN112434965A CN202011406854.1A CN202011406854A CN112434965A CN 112434965 A CN112434965 A CN 112434965A CN 202011406854 A CN202011406854 A CN 202011406854A CN 112434965 A CN112434965 A CN 112434965A
Authority
CN
China
Prior art keywords
label
data
historical evaluation
word frequency
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011406854.1A
Other languages
English (en)
Inventor
佟忠正
王喆
赵永发
林俊
王泽涌
洪雨天
黄杰韬
吴赟
臧笑宇
陈非
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Electric Power Information Technology Co Ltd
Original Assignee
Guangdong Electric Power Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Electric Power Information Technology Co Ltd filed Critical Guangdong Electric Power Information Technology Co Ltd
Priority to CN202011406854.1A priority Critical patent/CN112434965A/zh
Publication of CN112434965A publication Critical patent/CN112434965A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明涉及标签产生方法,具体公开了一种基于词频的专家标签产生方法、装置,所述的一种基于词频的专家标签产生方法,包括:获取评标专家的历史评价数据;建立历史评价数据库,将所述历史评价数据输入至历史评价数据库;预处理历史评价数据库中的数据,得到输入数据,将输入数据输入标签建立模型,所述标签建立模型为深度学习模型;所述标签建立模型输出标签数据,所述标签数据根据词频从高到底依次为第一标签、第二标签以及第三标签;将所述标签数据存储在标签数据库中。本发明具有能够更加全面以及准确地通过词频建立专家标签,从而能够对专家能力有一个更加准确地全面认知。

Description

一种基于词频的专家标签产生方法、装置、终端
技术领域
本发明涉及一种标签产生方法,具体涉及了一种基于词频的专家标签产生方法。
背景技术
按照广电企【2019】8号文《关于印发公司深化招标管理改革任务分解表的通知》整体要求,通过利用供应商数据重构等技术实现智能推荐、风险分析与智能预警,保证招标采购遴选供应商合规高效,防范采购过程中由于供应商自身风险导致履约、审计的风险。
招标过程中需要通过评标专家对标书进行评价,但是并不能通过标签很好地、更加准确地抽取相符合并且更加专业的评标专家,缺乏一种能够对评标专家建立更加准确的标签的计算机软件,导致不能抽取到更加契合对当次招投标的标书评价的评标专家对标书进行评价,在一定程度上会影响企业招投标的质量。
发明内容
针对现有技术存在不能对专家建立更加准确的标签从而导致不能对专家有一个更全面地认知,本发明的目的在于提供基于词频的专家标签产生方法,具有能够更加全面以及准确地通过词频建立专家标签,从而能够对专家能力有一个更加准确地全面认知。
为了解决上述技术问题,本发明提供的技术方案为:
一种基于词频的专家标签产生方法,包括:
获取评标专家的历史评价数据;
建立历史评价数据库,将所述历史评价数据输入至历史评价数据库;
预处理历史评价数据库中的数据,得到输入数据,将输入数据输入标签建立模型,所述标签建立模型为深度学习模型;
所述标签建立模型输出标签数据,所述标签数据根据词频从高到底依次为第一标签、第二标签以及第三标签;
将所述标签数据存储在标签数据库中。
能够更加准确地通过最高词频的标签对评标专家进行标签,从而能够对评标专家有一个更加全面的认知,能够在抽取对标书进行评价的评标专家时,对评标专家的认知更加全面,从而提高了招投标时对标书评分的质量。
优选地,所述历史评价数据的获取渠道来源于业务系统日常积累的日志记录系统。通过日常积累的日志记录,能够地对该评标专家进行更加准确的标签建立。
优选地,预处理历史评价数据库中的数据包括:
所述从历史评价数据中提取一部分历史评价数据组成训练集合;
将另一部分历史评价数据组成验证集合;
所述训练集合以及所述验证集合组成输入数据,所述输入数据输入至所述标签建立模型。通过历史评价数据的一部分作为训练集合,另一部分作为验证集合,能够更加贴切地对评标专家的历史评价数据做出更加准确的标签建立。
优选地,所述标签建立模型为卷积网络模型,所述卷积网络模型的训练方法为:
将所述训练集合输入卷积神经网络模型进行训练,得到初始标签建立模型;
将所述验证集合输入所述初始标签建立模型进行词频统计测试。
训练得到的卷积神经网络模型对评标专家所建立的标签准确率较高。
优选地,所述训练集合:所述验证集合=3~4:1。
优选地,所述卷积神经网络包括第一卷积神经网络和第二卷积神经网络;
将训练集合输入第一卷积神经网络进行训练,所述第一卷积神经网络包括依次相连的第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层和第二全连接层;
在训练好的第一卷积神经网络中添加第三全连接层和第四全连接层以生成第二卷积神经网络,其中所述第三全连接层与训练好的第一全连接层相同并与第二池化层连接,所述第四全连接层与训练好的第二全连接层相同并与第三全连接层连接;
根据训练集合,对第二卷积神经网络进行训练。
优选地,对第二卷积神经网络进行训练的方法包括:
将训练集合作为第二卷积网络中的第一卷积层的输入、所述标签数据作为第二卷积神经网络的输出,训练第二卷积神经网络。
一种基于词频的专家标签产生装置,包括:
信息获取模块,所述信息获取模块获取评标专家的历史评价数据;
数据库建立模块,所述数据库建立模块建立历史评价数据库,将所述历史评价数据输入至历史评价数据库;
预处理模块,所述预处理模块预处理历史评价数据库中的数据,得到输入数据,将输入数据输入标签建立模型,所述标签建立模型为深度学习模型;
数据输出模块,所述数据输出模块输出所述标签建立模型输出的标签数据,所述标签数据根据词频从高到底依次为第一标签、第二标签以及第三标签;
存储模块,所述存储模块将所述标签数据存储在标签数据库中。
一种终端,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以执行上述的方法。
一种存储介质,存储有可被执行的计算机程序,所述计算机程序被执行时实现上述的方法。
与现有技术相比,本发明具有的有益效果为:能够更加准确地通过最高词频的标签对评标专家进行标签,从而能够对评标专家有一个更加全面的认知,能够在抽取对标书进行评价的评标专家时,对评标专家的认知更加全面,从而提高了招投标时对标书评分的质量。
附图说明
图1是一种基于词频的专家标签产生方法的示意图。
图2为第一卷积神经网络的示意图。
图3为第二卷积神经网络的示意图。
具体实施方式
以下实施例是对本发明的进一步说明,不是对本发明的限制。
一种基于词频的专家标签产生方法,在本申请的一些实施例中,包括:
获取评标专家的历史评价数据;
建立历史评价数据库,将所述历史评价数据输入至历史评价数据库;
预处理历史评价数据库中的数据,得到输入数据,将输入数据输入标签建立模型,所述标签建立模型为深度学习模型;
所述标签建立模型输出标签数据,所述标签数据根据词频从高到底依次为第一标签、第二标签以及第三标签;
将所述标签数据存储在标签数据库中。
能够更加准确地通过最高词频的标签对评标专家进行标签,从而能够对评标专家有一个更加全面的认知,能够在抽取对标书进行评价的评标专家时,对评标专家的认知更加全面,从而提高了招投标时对标书评分的质量。
在本申请的一些实施例中,所述历史评价数据的获取渠道来源于业务系统日常积累的日志记录系统。通过日常积累的日志记录,能够地对该评标专家进行更加准确的标签建立。
在本申请的一些实施例中,预处理历史评价数据库中的数据包括:
所述从历史评价数据中提取一部分历史评价数据组成训练集合;
将另一部分历史评价数据组成验证集合;
所述训练集合以及所述验证集合组成输入数据,所述输入数据输入至所述标签建立模型。通过历史评价数据的一部分作为训练集合,另一部分作为验证集合,能够更加贴切地对评标专家的历史评价数据做出更加准确的标签建立。
在本申请的一些实施例中,所述标签建立模型为卷积网络模型,所述卷积网络模型的训练方法为:
将所述训练集合输入卷积神经网络模型进行训练,得到初始标签建立模型;
将所述验证集合输入所述初始标签建立模型进行词频统计测试。
训练得到的卷积神经网络模型对评标专家所建立的标签准确率较高。
在本申请的一些实施例中,所述训练集合:所述验证集合=3~4:1。
在本申请的一些实施例中,所述训练集合:所述验证集合=3:1。
在本申请的一些实施例中,所述卷积神经网络包括第一卷积神经网络和第二卷积神经网络;
将训练集合输入第一卷积神经网络进行训练,所述第一卷积神经网络包括依次相连的第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层和第二全连接层;
在训练好的第一卷积神经网络中添加第三全连接层和第四全连接层以生成第二卷积神经网络,其中所述第三全连接层与训练好的第一全连接层相同并与第二池化层连接,所述第四全连接层与训练好的第二全连接层相同并与第三全连接层连接;形成了分别以第二全连接层为输出的第一分支和以第四全连接层为输出的第二分支。
根据训练集合,对第二卷积神经网络进行训练。
在本申请的一些实施例中,对第二卷积神经网络进行训练的方法包括:
将训练集合作为第二卷积网络中的第一卷积层的输入、所述标签数据作为第二卷积神经网络的输出,训练第二卷积神经网络。
一种基于词频的专家标签产生装置,包括:
信息获取模块,所述信息获取模块获取评标专家的历史评价数据;
数据库建立模块,所述数据库建立模块建立历史评价数据库,将所述历史评价数据输入至历史评价数据库;
预处理模块,所述预处理模块预处理历史评价数据库中的数据,得到输入数据,将输入数据输入标签建立模型,所述标签建立模型为深度学习模型;
数据输出模块,所述数据输出模块输出所述标签建立模型输出的标签数据,所述标签数据根据词频从高到底依次为第一标签、第二标签以及第三标签;
存储模块,所述存储模块将所述标签数据存储在标签数据库中。
一种终端,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以执行上述的方法。
一种存储介质,存储有可被执行的计算机程序,所述计算机程序被执行时实现上述的方法。
上列详细说明是针对本发明可行实施例的具体说明,以上实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本案的专利范围中。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信号以及软件分发介质等。

Claims (10)

1.一种基于词频的专家标签产生方法,其特征在于,包括:
获取评标专家的历史评价数据;
建立历史评价数据库,将所述历史评价数据输入至历史评价数据库;
预处理历史评价数据库中的数据,得到输入数据,将输入数据输入标签建立模型,所述标签建立模型为深度学习模型;
所述标签建立模型输出标签数据,所述标签数据根据词频从高到底依次为第一标签、第二标签以及第三标签;
将所述标签数据存储在标签数据库中。
2.根据权利要求1所述的基于词频的专家标签产生方法,其特征在于:所述历史评价数据的获取渠道来源于业务系统日常积累的日志记录系统。
3.根据权利要求1所述的基于词频的专家标签产生方法,其特征在于:预处理历史评价数据库中的数据包括:
所述从历史评价数据中提取一部分历史评价数据组成训练集合;
将另一部分历史评价数据组成验证集合;
所述训练集合以及所述验证集合组成输入数据,所述输入数据输入至所述标签建立模型。
4.根据权利要求3所述的基于词频的专家标签产生方法,其特征在于:所述标签建立模型为卷积网络模型,所述卷积网络模型的训练方法为:
将所述训练集合输入卷积神经网络模型进行训练,得到初始标签建立模型;
将所述验证集合输入所述初始标签建立模型进行词频统计测试。
5.根据权利要求1所述的基于词频的专家标签产生方法,其特征在于:所述训练集合:所述验证集合=3~4:1。
6.根据权利要求4所述的基于词频的专家标签产生方法,其特征在于,所述卷积神经网络包括第一卷积神经网络和第二卷积神经网络;
将训练集合输入第一卷积神经网络进行训练,所述第一卷积神经网络包括依次相连的第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层和第二全连接层;
在训练好的第一卷积神经网络中添加第三全连接层和第四全连接层以生成第二卷积神经网络,其中所述第三全连接层与训练好的第一全连接层相同并与第二池化层连接,所述第四全连接层与训练好的第二全连接层相同并与第三全连接层连接;
根据训练集合,对第二卷积神经网络进行训练。
7.根据权利要求6所述的基于词频的专家标签产生方法,其特征在于,对第二卷积神经网络进行训练的方法包括:
将训练集合作为第二卷积网络中的第一卷积层的输入、所述标签数据作为第二卷积神经网络的输出,训练第二卷积神经网络。
8.一种基于词频的专家标签产生装置,其特征在于,包括:
信息获取模块,所述信息获取模块获取评标专家的历史评价数据;
数据库建立模块,所述数据库建立模块建立历史评价数据库,将所述历史评价数据输入至历史评价数据库;
预处理模块,所述预处理模块预处理历史评价数据库中的数据,得到输入数据,将输入数据输入标签建立模型,所述标签建立模型为深度学习模型;
数据输出模块,所述数据输出模块输出所述标签建立模型输出的标签数据,所述标签数据根据词频从高到底依次为第一标签、第二标签以及第三标签;
存储模块,所述存储模块将所述标签数据存储在标签数据库中。
9.一种终端,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以执行权利要求1~7任一项所述的方法。
10.一种存储介质,其特征在于,存储有可被执行的计算机程序,所述计算机程序被执行时实现权利要求1~7任一项所述的方法。
CN202011406854.1A 2020-12-04 2020-12-04 一种基于词频的专家标签产生方法、装置、终端 Pending CN112434965A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011406854.1A CN112434965A (zh) 2020-12-04 2020-12-04 一种基于词频的专家标签产生方法、装置、终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011406854.1A CN112434965A (zh) 2020-12-04 2020-12-04 一种基于词频的专家标签产生方法、装置、终端

Publications (1)

Publication Number Publication Date
CN112434965A true CN112434965A (zh) 2021-03-02

Family

ID=74691400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011406854.1A Pending CN112434965A (zh) 2020-12-04 2020-12-04 一种基于词频的专家标签产生方法、装置、终端

Country Status (1)

Country Link
CN (1) CN112434965A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295521A (zh) * 2016-07-29 2017-01-04 厦门美图之家科技有限公司 一种基于多输出卷积神经网络的性别识别方法、装置及计算设备
CN106776978A (zh) * 2016-12-06 2017-05-31 北京赛时科技有限公司 专家库建立办法和装置
CN110008342A (zh) * 2019-04-12 2019-07-12 智慧芽信息科技(苏州)有限公司 文献分类方法、装置、设备及存储介质
CN110276289A (zh) * 2019-06-17 2019-09-24 厦门美图之家科技有限公司 生成匹配模型的方法和人脸特征点追踪方法
CN110888857A (zh) * 2019-10-14 2020-03-17 平安科技(深圳)有限公司 基于神经网络的数据标签生成方法、装置、终端及介质
CN110909236A (zh) * 2019-10-24 2020-03-24 东莞成电智信信息科技有限公司 一种基于大数据的专家推荐方法
CN111581368A (zh) * 2019-02-19 2020-08-25 中国科学院信息工程研究所 一种基于卷积神经网络的面向智能专家推荐的用户画像方法
CN111598596A (zh) * 2019-02-21 2020-08-28 北京京东尚科信息技术有限公司 数据处理方法、装置、电子设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295521A (zh) * 2016-07-29 2017-01-04 厦门美图之家科技有限公司 一种基于多输出卷积神经网络的性别识别方法、装置及计算设备
CN106776978A (zh) * 2016-12-06 2017-05-31 北京赛时科技有限公司 专家库建立办法和装置
CN111581368A (zh) * 2019-02-19 2020-08-25 中国科学院信息工程研究所 一种基于卷积神经网络的面向智能专家推荐的用户画像方法
CN111598596A (zh) * 2019-02-21 2020-08-28 北京京东尚科信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN110008342A (zh) * 2019-04-12 2019-07-12 智慧芽信息科技(苏州)有限公司 文献分类方法、装置、设备及存储介质
WO2020207431A1 (zh) * 2019-04-12 2020-10-15 智慧芽信息科技(苏州)有限公司 文献分类方法、装置、设备及存储介质
CN110276289A (zh) * 2019-06-17 2019-09-24 厦门美图之家科技有限公司 生成匹配模型的方法和人脸特征点追踪方法
CN110888857A (zh) * 2019-10-14 2020-03-17 平安科技(深圳)有限公司 基于神经网络的数据标签生成方法、装置、终端及介质
CN110909236A (zh) * 2019-10-24 2020-03-24 东莞成电智信信息科技有限公司 一种基于大数据的专家推荐方法

Similar Documents

Publication Publication Date Title
CN112732897A (zh) 文档处理方法、装置、电子设备及存储介质
CN109410986B (zh) 一种情绪识别方法、装置及存储介质
CN112434884A (zh) 一种供应商分类画像的建立方法及装置
CN113705733A (zh) 医疗票据图像处理方法及装置、电子设备、存储介质
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN116881430B (zh) 一种产业链识别方法、装置、电子设备及可读存储介质
CN110246063A (zh) 一种指引案件审理的方法及装置
CN113298495A (zh) 简历筛选方法、简历筛选装置、终端设备及存储介质
CN112820404A (zh) 应用于大数据智慧医疗的信息处理方法及智慧医疗服务器
CN110400560B (zh) 数据处理方法及装置、存储介质、电子装置
CN111046632A (zh) 一种数据提取转换方法、系统、存储介质及电子设备
CN116628163A (zh) 客服服务处理方法、装置、设备及存储介质
CN112434965A (zh) 一种基于词频的专家标签产生方法、装置、终端
CN114490929A (zh) 一种招投标信息采集方法、装置、存储介质及终端设备
CN115964484A (zh) 基于多标签分类模型实现的法律多意图识别方法和装置
CN113903363B (zh) 基于人工智能的违规行为检测方法、装置、设备及介质
CN105654964A (zh) 录音音频设备源认定方法和装置
CN113282837B (zh) 事件分析方法、装置、计算机设备及存储介质
CN107729476A (zh) 一种机器数据在线处理方法及系统
CN113691382A (zh) 会议记录方法、装置、计算机设备及介质
CN109472457B (zh) 贷款申请在线面审方法及终端设备
CN113657773A (zh) 话术质检方法、装置、电子设备及存储介质
CN112463835A (zh) 一种使用关联关系分析的专家关系查找方法及装置
CN111783432A (zh) 信用证审单检查要点清单的生成方法及装置
CN116484836B (zh) 基于nlp模型的问卷生成系统、方法、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination