CN113191896A - 一种招标信息的推荐方法、装置及计算机设备 - Google Patents

一种招标信息的推荐方法、装置及计算机设备 Download PDF

Info

Publication number
CN113191896A
CN113191896A CN202110463389.3A CN202110463389A CN113191896A CN 113191896 A CN113191896 A CN 113191896A CN 202110463389 A CN202110463389 A CN 202110463389A CN 113191896 A CN113191896 A CN 113191896A
Authority
CN
China
Prior art keywords
bidding
user
information
preference
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110463389.3A
Other languages
English (en)
Inventor
王晓凡
李武钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China World Digital Technology Shenzhen Co ltd
Original Assignee
China World Digital Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China World Digital Technology Shenzhen Co ltd filed Critical China World Digital Technology Shenzhen Co ltd
Priority to CN202110463389.3A priority Critical patent/CN113191896A/zh
Publication of CN113191896A publication Critical patent/CN113191896A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Technology Law (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及机器学习技术,提出的招标信息的推荐方法、装置、计算机设备和存储介质,其中方法包括:获取指定用户的个人信息,从个人信息获取指定用户的个人特征;将个人特征输入到预设的分类模型中计算得到计算结果;依据计算结果得到指定用户对招标数据的偏好类型;依据指定用户的偏好类型从指定平台中获取对应的招标信息,记为推荐信息,指定平台存储有多种不同偏好类型的招标信息;将推荐信息推荐给指定用户,这样通过确定用户的个人的招标偏好,再获取与该招标偏好对应的招标信息来进行推荐,由于确定了用户的个人喜好,大大提高了用户对推荐内容的点击率,避免浪费推荐资源,达到了精准推荐,满足用户需求的目的。

Description

一种招标信息的推荐方法、装置及计算机设备
技术领域
本发明涉及到机器学习的技术领域,特别是涉及到一种招标信息的推荐方法、装置、计算机设备和存储介质。
背景技术
随着经济的发展,招标投标的交易方式越来越受到企业的青睐,市场上也开始涌现出不少招标平台,为各企业用户提供各种招标投标服务。目前在各种招标信息网站或者招标采购管理平台,在用户进入时一般都会推荐招标内容,但是通过给用户推荐基本都是热点招标内容,或者推荐最新的招标内容,这样无针对性的推荐,通常不是用户所需求的,不但用户体验差,而且平台的客户转化率也较低,浪费资源。
发明内容
本发明的主要目的为提供一种招标信息的推荐方法、装置、计算机设备和存储介质,旨在解决现有技术中平台推荐招标内容无针对性效果差的技术问题。
基于上述发明目的,本发明提出一种招标信息的推荐方法,包括:
获取指定用户的个人信息,从所述个人信息获取所述指定用户的个人特征;
将所述个人特征输入到预设的分类模型中进行计算,得到计算结果,所述分类模型为基于逻辑回归算法训练而得的神经网络模型;
依据所述计算结果得到所述指定用户对招标数据的偏好类型;
依据所述指定用户的偏好类型从指定平台中获取对应的招标信息,记为推荐信息,所述指定平台存储有多种不同偏好类型的招标信息;
将所述推荐信息推荐给所述指定用户。
进一步地,所述分类模型的训练步骤,包括:
获取样本集,所述样本集包括多个已经标注偏好标签的样本,每个所述样本为一组偏好标签与用户特征组合而成的训练数据;
将所述样本集输入预设的初始分类网络模型中进行计算,得到对应的特征向量,所述初始分类网络模型基于逻辑回归算法构建;
将所述特征向量通过预设的损失函数进行计算得到损失值,并通过网络反向传播计算梯度更新模型参数,直至模型收敛,得到所述分类模型。
进一步地,所述获取样本集的步骤,包括:
获取所述指定平台中所有用户的操作行为数据,所述操作行为数据包括操作次数以及每次操作出现的招标关键词;
依据所述操作行为数据计算出各所述招标关键词在所述用户操作行为中出现的频率,记为TF值;
依据所述操作行为数据计算各所述招标关键词的逆向文件频率,记为IDF值;
依据所述TF值与所述IDF值计算出每个所述用户对各所述招标关键词的偏好权重;
依据所述偏好权重确定每个所述用户偏好的招标关键词;
以所述用户偏好的招标关键词作为标签对所述用户的用户特征进行标注,得到所述样本。
进一步地,所述依据所述偏好权重确定每个所述用户偏好的招标关键词的步骤,包括:
将所述招标关键词按对应的所述偏好权重从大到小进行排序;
将排序第一的所述招标关键词作为所述用户偏好的招标关键词。
进一步地,所述获取平台中所有用户的操作行为数据的步骤之后,包括:
从所述操作行为数据中提取所述招标关键词信息,所述招标关键词信息包括招标关键词以及招标关键词出现的次数;
将各招标关键词进行相似度计算,得到相似度结果;
依据所述相似度结果对各所述招标关键词进行分类,得到多个所述偏好类型;
将每类所述招标关键词中出现次数最高的招标关键词作为所述偏好类型的名称。
本发明还提供一种招标信息的推荐装置,包括:
获取信息单元,用于获取指定用户的个人信息,从所述个人信息获取所述指定用户的个人特征;
计算类型单元,用于将所述个人特征输入到预设的分类模型中进行计算,得到计算结果,所述分类模型为基于逻辑回归算法训练而得的神经网络模型;
得到类型单元,用于依据所述计算结果得到所述指定用户对招标数据的偏好类型;
获取内容单元,用于依据所述指定用户的偏好类型从指定平台中获取对应的招标信息,记为推荐信息,所述指定平台存储有多种不同偏好类型的招标信息;
推荐信息单元,用于将所述推荐信息推荐给所述指定用户。
进一步地,还包括训练所述分类模型的训练单元,所述训练单元包括:
获取样本子单元,用于获取样本集,所述样本集包括多个已经标注偏好标签的样本,每个所述样本为一组偏好标签与用户特征组合而成的训练数据;
计算向量子单元,用于将所述样本集输入预设的初始分类网络模型中进行计算,得到对应的特征向量,所述初始分类网络模型基于逻辑回归算法构建;
得到模型子单元,用于将所述特征向量通过预设的损失函数进行计算得到损失值,并通过网络反向传播计算梯度更新模型参数,直至模型收敛,得到所述分类模型。
进一步地,所述获取样本子单元,包括:
获取数据模块,用于获取所述指定平台中所有用户的操作行为数据,所述操作行为数据包括操作次数以及每次操作出现的招标关键词;
第一计算模块,用于依据所述操作行为数据计算出各所述招标关键词在所述用户操作行为中出现的频率,记为TF值;
第二计算模块,用于依据所述操作行为数据计算各所述招标关键词的逆向文件频率,记为IDF值;
第三计算模块,用于依据所述TF值与所述IDF值计算出每个所述用户对各所述招标关键词的偏好权重;
确定关键模块,用于依据所述偏好权重确定每个所述用户偏好的招标关键词;
标注特征模块,用于以所述用户偏好的招标关键词作为标签对所述用户的用户特征进行标注,得到所述样本。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述招标信息的推荐方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述招标信息的推荐方法的步骤。
本发明的有益效果为:通过确定用户的个人的招标偏好,再获取与该招标偏好对应的招标信息来进行推荐,由于确定了用户的个人喜好,大大提高了用户对推荐内容的点击率,避免浪费推荐资源,达到了精准推荐,满足用户需求,提高用户体验的目的。
附图说明
图1为本发明一实施例中招标信息的推荐方法的步骤示意图;
图2为本发明一实施例中招标信息的推荐装置的结构示意框图;
图3是本申请的存储介质的一实施例的结构示意框图;
图4是本申请的计算机设备的一实施例的结构示意框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,本实施例中的招标信息的推荐方法,包括:
步骤S1:获取指定用户的个人信息,从所述个人信息获取所述指定用户的个人特征;
步骤S2:将所述个人特征输入到预设的分类模型中进行计算,得到计算结果,所述分类模型为基于逻辑回归算法训练而得的神经网络模型;
步骤S3:依据所述计算结果得到所述指定用户对招标数据的偏好类型;
步骤S4:依据所述指定用户的偏好类型从指定平台中获取对应的招标信息,记为推荐信息,所述平台包括有多种不同偏好类型的招标信息;
步骤S5:将所述推荐信息推荐给所述指定用户。
如上述步骤S1所述,上述个人信息为指定平台的用户的个人信息资料,例如姓名、工作、爱好等等,上述指定平台为预设的招标管理系统平台或者网站,例如招标信息网、招标采购平台等,用户可在该平台中进行操作,例如注册、搜索、评论、查看等等,当用户在平台注册时可存储对应的个人信息,故可需要时直接获取即可,然后从这些个人信息中提取出该用户的个人特征,该个人特征可以为多维特征,用于输入至模型中进行计算。
如上述步骤S2-S3所述,上述分类模型为基于逻辑回归算法训练而得的神经网络模型,用于计算用户对招标数据的偏好,具体而言,上述分类模型的训练方法包括:
步骤S01:获取样本集,所述样本集包括多个已经标注偏好标签的样本,每个所述样本为一组偏好标签与用户特征组合而成的训练数据;
步骤S02:将所述样本集输入预设的初始分类网络模型中进行计算,得到对应的特征向量,所述初始分类网络模型基于逻辑回归算法构建;
步骤S03:将所述特征向量通过预设的损失函数进行计算得到损失值,并通过网络反向传播计算梯度更新模型参数,直至模型收敛,得到所述分类模型。
本实施例中,上述样本集中包括多个样本,这些样本均为已经标注了偏好标签的样本,也即每个样本均为一组偏好标签x与用户特征y组合而成的训练数据,可表示为样本集D=(x1,y1),(x2,y2),…,(xi,yj),将样本集输入已经搭建好的初始分类网络模型进行计算得到特征向量,该初始分类网络模型基于逻辑回归算法构建,此处不再详细展开描述,然后特征向量通过预设的损失函数进行计算得到损失值,此处的损失函数可以为对数似然函数,并通过网络反向传播计算求梯度,更新模型参数,直至模型收敛,得到所述分类模型。
如上述步骤S4-S5所述,通过分类模型计算出指定用户的对招标数据的偏好类型后,根据该偏好类型从指定平台中获取对应的招标信息,为了便于描述,此处命为推荐信息,然后将该推荐信息推荐给指定用户,此处得招标信息可以包括与招标项目相关的信息,例如招标书、招标预告等。本实施例中,上述指定平台也即上述招标管理系统平台,该指定平台中存储有多种不同的偏好类型的招标信息,值得注意的是,在依据偏好类型获取招标信息之前,已将所有的招标信息按照各偏好类型分类,并分别存储,其中,偏好类型为基于用户对招标数据的不同偏好而进行分类的类型。
本发明提供的招标信息的推荐方法,通过确定用户的个人的招标偏好,再获取与该招标偏好对应的招标信息来进行推荐,由于确定了用户的个人喜好,大大提高了用户对推荐内容的点击率,避免浪费推荐资源,达到了精准推荐,满足用户需求,提高用户体验的目的。
在一个实施例中,上述步骤S01,包括:
步骤S011:获取所述指定平台中所有用户对招标数据的操作行为数据,所述操作行为数据包括操作次数以及每次操作出现的招标关键词;
步骤S012:依据所述操作行为数据计算出各所述招标关键词在所述用户操作行为中出现的频率,记为TF值;
步骤S013:依据所述操作行为数据计算各所述招标关键词的逆向文件频率,记为IDF值;
步骤S014:依据所述TF值与所述IDF值计算出每个所述用户对各所述招标关键词的偏好权重;
步骤S015:依据所述偏好权重确定每个所述用户偏好的招标关键词;
步骤S016:以所述用户偏好的招标关键词作为标签对所述用户的用户特征进行标注,得到所述样本。
本实施例中,获取上述指定平台中所有用户对招标数据的操作行为数据,此处的操作行为包括不限于点击、收藏、分享、评论等,上述操作行为数据至少包括操作次数以及每次操作出现的招标关键词,此处的操作次数为上述点击、收藏、分享、评论等操作行为的总次数,无需区分何种具体行为,上述招标关键词为每次操作所对应的招标数据中出现的关键词,例如招标数据中的省份、城市、类型、项目等等。然后依据操作行为数据计算出各招标关键词在各用户操作行为中出现的频率,具体而言,可通过下列公式计算得到该频率:
Figure BDA0003041225190000071
其中,ni,j表示第i个招标关键词在第j个用户操作行为中出现的次数,∑knk,j表示第j个用户操作行为的总次数,可将该频率记为TF(Term Frequency)值。
然后可依上述操作行为数据计算各招标关键词的逆向文件频率,记为IDF(Inverse Document Frequency)值,该逆向文件频率可以由所有用户的数量除以操作行为中出现有该招标关键词的用户的数量,将得到的商再取对数,具体的计算公式为:
Figure BDA0003041225190000072
其中,|K|表示所有用户的数量,|{j:ti∈kj}|表示操作行为中出现有招标关键词ti的用户的数量,且数量不为0,也即ni,j≠0。然后依据TF值与IDF值计算出每个用户对各招标关键词的偏好权重,具体可利用以下公式来进行计算:TF-IDF=TF*IDF,得到每个用户对各招标关键词的偏好权重后,可依据这些偏好权重得到用户最偏好的招标关键词,然后以该招标关键词左边标签对用户的用户特征进行标注,得到上述训练数据,此处的用户特征可为多维特征,可依据用户的个人信息提取。
具体地,上述步骤S015,包括:
步骤S0151:将所述招标关键词按对应的所述偏好权重从大到小进行排序;
步骤S0152:将排序第一的所述招标关键词作为所述用户偏好的招标关键词。
本实施例中,将每个用户对应多个招标关键词,每个招标关键词的偏好权重不一样,对应每个用户,可将对应的招标关键词按照偏好权重从大到小排序,排序越靠前其招标关键词的权重越大,越能说明该用户的偏好特点,故将排序第一的招标关键词作为上述用户偏好的招标关键词。
在一个实施例中,上述步骤S011之后,包括:
步骤S04:从所述操作行为数据中提取所述招标关键词信息,所述招标关键词信息包括多个招标关键词以及招标关键词出现的次数;
步骤S05:将各招标关键词进行相似度计算,得到相似度结果;
步骤S06:依据所述相似度结果对各所述招标关键词进行分类,得到多个所述偏好类型;
步骤S07:将每类所述招标关键词中出现次数最高的招标关键词作为所述偏好类型的名称。
本实施例中,可对招标关键词进行分类,以便和对应的招标信息关联,具体而言,首先从从上述操作行为数据中提取招标关键词信息,该信息包括多个招标关键词以及招标关键词出现的次数,例如当招标关键词为招标项目的类型,可以为工程、服务等类型的各种关键词,然后对各招标关键词进行相似度计算,得到相似度结果,具体可采用余弦相似度计算方法进行计算,得到对应的相似度值,将相似度值接近的招标关键词作为一类,例如相似度值大于80%的招标关键词均归为一个类别,得到多个类别,此处的类别也即上述偏好类型,每个偏好类型均可能包含多个不同的招标关键词,可从多个不同的招标关键词中选出一个作为代表,具体可依据出现次数最高的招标关键词作为该类偏好类型的名称,对应的,将招标信息按照相应的招标关键词进行归类,得到多个偏好类型的招标信息,当需要时直接依据偏好类型获取对应的招标信息即可。
参照图2,本实施例中提供一种招标信息的推荐装置,该装置对应上述招标信息的推荐方法,该装置包括:
获取信息单元1,用于获取指定用户的个人信息,从所述个人信息获取所述指定用户的个人特征;
计算类型单元2,用于将所述个人特征输入到预设的分类模型中进行计算,得到计算结果,所述分类模型为基于逻辑回归算法训练而得的神经网络模型;
得到类型单元3,用于依据所述计算结果得到所述指定用户对招标数据的偏好类型;
获取内容单元4,用于依据所述指定用户的偏好类型从指定平台中获取对应的招标信息,记为推荐信息,所述指定平台存储有多种不同偏好类型的招标信息;
推荐信息单元5,用于将所述推荐信息推荐给所述指定用户。
如上述获取信息单元1所述,上述个人信息为指定平台的用户的个人信息资料,例如姓名、工作、爱好等等,上述指定平台为预设的招标管理系统平台或者网站,例如招标信息网、招标采购平台等,用户可在该平台中进行操作,例如注册、搜索、评论、查看等等,当用户在平台注册时可存储对应的个人信息,故可需要时直接获取即可,然后从这些个人信息中提取出该用户的个人特征,该个人特征可以为多维特征,用于输入至模型中进行计算。
如上述计算类型单元2、得到类型单元3所述,上述分类模型为基于逻辑回归算法训练而得的神经网络模型,用于计算用户对招标数据的偏好,具体而言,还包括训练上述分类模型的训练单元,所述训练单元包括:
获取样本子单元,用于获取样本集,所述样本集包括多个已经标注偏好标签的样本,每个所述样本为一组偏好标签与用户特征组合而成的训练数据;
计算向量子单元,用于将所述样本集输入预设的初始分类网络模型中进行计算,得到对应的特征向量,所述初始分类网络模型基于逻辑回归算法构建;
得到模型子单元,用于将所述特征向量通过预设的损失函数进行计算得到损失值,并通过网络反向传播计算梯度更新模型参数,直至模型收敛,得到所述分类模型。
本实施例中,上述样本集中包括多个样本,这些样本均为已经标注了偏好标签的样本,也即每个样本均为一组偏好标签x与用户特征y组合而成的训练数据,可表示为样本集D=(x1,y1),(x2,y2),…,(xi,yj),将样本集输入已经搭建好的初始分类网络模型进行计算得到特征向量,该初始分类网络模型基于逻辑回归算法构建,此处不再详细展开描述,然后特征向量通过预设的损失函数进行计算得到损失值,此处的损失函数可以为对数似然函数,并通过网络反向传播计算求梯度,更新模型参数,直至模型收敛,得到所述分类模型。
如上述获取内容单元4、推荐信息单元5所述,通过分类模型计算出指定用户的对招标数据的偏好类型后,根据该偏好类型从指定平台中获取对应的招标信息,为了便于描述,此处命为推荐信息,然后将该推荐信息推荐给指定用户,此处得招标信息可以包括与招标项目相关的信息,例如招标书、招标预告等。本实施例中,上述指定平台也即上述招标管理系统平台,该指定平台中存储有多种不同的偏好类型的招标信息,值得注意的是,在依据偏好类型获取招标信息之前,已将所有的招标信息按照各偏好类型分类,并分别存储,其中,偏好类型为基于用户对招标数据的不同偏好而进行分类的类型。
本发明提供的招标信息的推荐方法,通过确定用户的个人的招标偏好,再获取与该招标偏好对应的招标信息来进行推荐,由于确定了用户的个人喜好,大大提高了用户对推荐内容的点击率,避免浪费推荐资源,达到了精准推荐,满足用户需求,提高用户体验的目的。
在一个实施例中,上述获取样本子单元,包括:
获取数据模块,用于获取所述指定平台中所有用户的操作行为数据,所述操作行为数据包括操作次数以及每次操作出现的招标关键词;
第一计算模块,用于依据所述操作行为数据计算出各所述招标关键词在所述用户操作行为中出现的频率,记为TF值;
第二计算模块,用于依据所述操作行为数据计算各所述招标关键词的逆向文件频率,记为IDF值;
第三计算模块,用于依据所述TF值与所述IDF值计算出每个所述用户对各所述招标关键词的偏好权重;
确定关键模块,用于依据所述偏好权重确定每个所述用户偏好的招标关键词;
标注特征模块,用于以所述用户偏好的招标关键词作为标签对所述用户的用户特征进行标注,得到所述样本。
本实施例中,获取上述指定平台中所有用户对招标数据的操作行为数据,此处的操作行为包括不限于点击、收藏、分享、评论等,上述操作行为数据至少包括操作次数以及每次操作出现的招标关键词,此处的操作次数为上述点击、收藏、分享、评论等操作行为的总次数,无需区分何种具体行为,上述招标关键词为每次操作所对应的招标数据中出现的关键词,例如招标数据中的省份、城市、类型、项目等等。然后依据操作行为数据计算出各招标关键词在各用户操作行为中出现的频率,具体而言,可通过下列公式计算得到该频率:
Figure BDA0003041225190000101
其中,ni,j表示第i个招标关键词在第j个用户操作行为中出现的次数,∑knk,j表示第j个用户操作行为的总次数,可将该频率记为TF(Term Frequency)值。
然后可依上述操作行为数据计算各招标关键词的逆向文件频率,记为IDF(Inverse Document Frequency)值,该逆向文件频率可以由所有用户的数量除以操作行为中出现有该招标关键词的用户的数量,将得到的商再取对数,具体的计算公式为:
Figure BDA0003041225190000102
其中,|K|表示所有用户的数量,|{j:ti∈kj}|表示操作行为中出现有招标关键词ti的用户的数量,且数量不为0,也即ni,j≠0。然后依据TF值与IDF值计算出每个用户对各招标关键词的偏好权重,具体可利用以下公式来进行计算:TF-IDF=TF*IDF,得到每个用户对各招标关键词的偏好权重后,可依据这些偏好权重得到用户最偏好的招标关键词,然后以该招标关键词左边标签对用户的用户特征进行标注,得到上述训练数据,此处的用户特征可为多维特征,可依据用户的个人信息提取。
具体地,上述确定关键模块,包括:
排序权重子模块,用于将所述招标关键词按对应的所述偏好权重从大到小进行排序;
确定关键子模块,用于将排序第一的所述招标关键词作为所述用户偏好的招标关键词。
本实施例中,将每个用户对应多个招标关键词,每个招标关键词的偏好权重不一样,对应每个用户,可将对应的招标关键词按照偏好权重从大到小排序,排序越靠前其招标关键词的权重越大,越能说明该用户的偏好特点,故将排序第一的招标关键词作为上述用户偏好的招标关键词。
在一个实施例中,上述装置,还包括:
提取信息单元,用于从所述操作行为数据中提取所述招标关键词信息,所述招标关键词信息包括多个招标关键词以及招标关键词出现的次数;
相似计算单元,用于将各招标关键词进行相似度计算,得到相似度结果;
分类结果单元,用于依据所述相似度结果对各所述招标关键词进行分类,得到多个所述偏好类型;
选出偏好单元,用于将每类所述招标关键词中出现次数最高的招标关键词作为所述偏好类型的名称。
本实施例中,可对招标关键词进行分类,以便和对应的招标信息关联,具体而言,首先从从上述操作行为数据中提取招标关键词信息,该信息包括多个招标关键词以及招标关键词出现的次数,例如当招标关键词为招标项目的类型,可以为工程、服务等类型的各种关键词,然后对各招标关键词进行相似度计算,得到相似度结果,具体可采用余弦相似度计算方法进行计算,得到对应的相似度值,将相似度值接近的招标关键词作为一类,例如相似度值大于80%的招标关键词均归为一个类别,得到多个类别,此处的类别也即上述偏好类型,每个偏好类型均可能包含多个不同的招标关键词,可从多个不同的招标关键词中选出一个作为代表,具体可依据出现次数最高的招标关键词作为该类偏好类型的名称,对应的,将招标信息按照相应的招标关键词进行归类,得到多个偏好类型的招标信息,当需要时直接依据偏好类型获取对应的招标信息即可。
参考图3,本申请还提供了一种计算机可读的存储介质10,存储介质10中存储有计算机程序20,当其在计算机上运行时,使得计算机执行以上实施例所描述的招标信息的推荐方法。
参考图4,本申请还提供了一种包含指令的计算机设备40,计算机设备包括存储器30和处理器50,存储器30存储有计算机程序20,处理器30执行计算机程序20时实现以上实施例所描述的招标信息的推荐方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种招标信息的推荐方法,其特征在于,包括:
获取指定用户的个人信息,从所述个人信息获取所述指定用户的个人特征;
将所述个人特征输入到预设的分类模型中进行计算,得到计算结果,所述分类模型为基于逻辑回归算法训练而得的神经网络模型;
依据所述计算结果得到所述指定用户对招标数据的偏好类型;
依据所述指定用户的偏好类型从指定平台中获取对应的招标信息,记为推荐信息,所述指定平台存储有多种不同偏好类型的招标信息;
将所述推荐信息推荐给所述指定用户。
2.根据权利要求1所述的招标信息的推荐方法,其特征在于,所述分类模型的训练步骤,包括:
获取样本集,所述样本集包括多个已经标注偏好标签的样本,每个所述样本为一组偏好标签与用户特征组合而成的训练数据;
将所述样本集输入预设的初始分类网络模型中进行计算,得到对应的特征向量,所述初始分类网络模型基于逻辑回归算法构建;
将所述特征向量通过预设的损失函数进行计算得到损失值,并通过网络反向传播计算梯度更新模型参数,直至模型收敛,得到所述分类模型。
3.根据权利要求2所述的招标信息的推荐方法,其特征在于,所述获取样本集的步骤,包括:
获取所述指定平台中所有用户的操作行为数据,所述操作行为数据包括操作次数以及每次操作出现的招标关键词;
依据所述操作行为数据计算出各所述招标关键词在所述用户操作行为中出现的频率,记为TF值;
依据所述操作行为数据计算各所述招标关键词的逆向文件频率,记为IDF值;
依据所述TF值与所述IDF值计算出每个所述用户对各所述招标关键词的偏好权重;
依据所述偏好权重确定每个所述用户偏好的招标关键词;
以所述用户偏好的招标关键词作为标签对所述用户的用户特征进行标注,得到所述样本。
4.根据权利要求3所述的招标信息的推荐方法,其特征在于,所述依据所述偏好权重确定每个所述用户偏好的招标关键词的步骤,包括:
将所述招标关键词按对应的所述偏好权重从大到小进行排序;
将排序第一的所述招标关键词作为所述用户偏好的招标关键词。
5.根据权利要求3所述的招标信息的推荐方法,其特征在于,所述获取平台中所有用户的操作行为数据的步骤之后,包括:
从所述操作行为数据中提取所述招标关键词信息,所述招标关键词信息包括招标关键词以及招标关键词出现的次数;
将各招标关键词进行相似度计算,得到相似度结果;
依据所述相似度结果对各所述招标关键词进行分类,得到多个所述偏好类型;
将每类所述招标关键词中出现次数最高的招标关键词作为所述偏好类型的名称。
6.一种招标信息的推荐装置,其特征在于,包括:
获取信息单元,用于获取指定用户的个人信息,从所述个人信息获取所述指定用户的个人特征;
计算类型单元,用于将所述个人特征输入到预设的分类模型中进行计算,得到计算结果,所述分类模型为基于逻辑回归算法训练而得的神经网络模型;
得到类型单元,用于依据所述计算结果得到所述指定用户对招标数据的偏好类型;
获取内容单元,用于依据所述指定用户的偏好类型从指定平台中获取对应的招标信息,记为推荐信息,所述指定平台存储有多种不同偏好类型的招标信息;
推荐信息单元,用于将所述推荐信息推荐给所述指定用户。
7.根据权利要求6所述的招标信息的推荐装置,其特征在于,还包括训练所述分类模型的训练单元,所述训练单元包括:
获取样本子单元,用于获取样本集,所述样本集包括多个已经标注偏好标签的样本,每个所述样本为一组偏好标签与用户特征组合而成的训练数据;
计算向量子单元,用于将所述样本集输入预设的初始分类网络模型中进行计算,得到对应的特征向量,所述初始分类网络模型基于逻辑回归算法构建;
得到模型子单元,用于将所述特征向量通过预设的损失函数进行计算得到损失值,并通过网络反向传播计算梯度更新模型参数,直至模型收敛,得到所述分类模型。
8.根据权利要求7所述的招标信息的推荐装置,其特征在于,所述获取样本子单元,包括:。
获取数据模块,用于获取所述指定平台中所有用户的操作行为数据,所述操作行为数据包括操作次数以及每次操作出现的招标关键词;
第一计算模块,用于依据所述操作行为数据计算出各所述招标关键词在所述用户操作行为中出现的频率,记为TF值;
第二计算模块,用于依据所述操作行为数据计算各所述招标关键词的逆向文件频率,记为IDF值;
第三计算模块,用于依据所述TF值与所述IDF值计算出每个所述用户对各所述招标关键词的偏好权重;
确定关键模块,用于依据所述偏好权重确定每个所述用户偏好的招标关键词;
标注特征模块,用于以所述用户偏好的招标关键词作为标签对所述用户的用户特征进行标注,得到所述样本。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的招标信息的推荐方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的招标信息的推荐方法的步骤。
CN202110463389.3A 2021-04-27 2021-04-27 一种招标信息的推荐方法、装置及计算机设备 Pending CN113191896A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110463389.3A CN113191896A (zh) 2021-04-27 2021-04-27 一种招标信息的推荐方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110463389.3A CN113191896A (zh) 2021-04-27 2021-04-27 一种招标信息的推荐方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN113191896A true CN113191896A (zh) 2021-07-30

Family

ID=76980230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110463389.3A Pending CN113191896A (zh) 2021-04-27 2021-04-27 一种招标信息的推荐方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN113191896A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113793199A (zh) * 2021-09-14 2021-12-14 北京捷风数据技术有限公司 一种招中标信息推荐方法、系统及存储介质
CN114707074A (zh) * 2022-06-06 2022-07-05 深圳尚米网络技术有限公司 一种内容推荐方法、设备和系统
CN114722301A (zh) * 2022-06-09 2022-07-08 江西省精彩纵横采购咨询有限公司 一种招投标信息推荐方法、装置、存储介质及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101026802A (zh) * 2007-03-16 2007-08-29 华为技术有限公司 一种信息推送方法与装置
CN105787066A (zh) * 2016-03-01 2016-07-20 成都汇资聚源科技有限公司 基于全量分析的数字内容分发系统
CN108733694A (zh) * 2017-04-18 2018-11-02 北京国双科技有限公司 检索推荐方法和装置
CN110148043A (zh) * 2019-03-01 2019-08-20 安徽省优质采科技发展有限责任公司 基于知识图谱的招标采购信息推荐系统及推荐方法
CN112200601A (zh) * 2020-09-11 2021-01-08 深圳市法本信息技术股份有限公司 物品推荐方法、装置及可读存储介质
CN112307351A (zh) * 2020-11-23 2021-02-02 中国科学院计算技术研究所 用户行为的模型训练、推荐方法、装置和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101026802A (zh) * 2007-03-16 2007-08-29 华为技术有限公司 一种信息推送方法与装置
CN105787066A (zh) * 2016-03-01 2016-07-20 成都汇资聚源科技有限公司 基于全量分析的数字内容分发系统
CN108733694A (zh) * 2017-04-18 2018-11-02 北京国双科技有限公司 检索推荐方法和装置
CN110148043A (zh) * 2019-03-01 2019-08-20 安徽省优质采科技发展有限责任公司 基于知识图谱的招标采购信息推荐系统及推荐方法
CN112200601A (zh) * 2020-09-11 2021-01-08 深圳市法本信息技术股份有限公司 物品推荐方法、装置及可读存储介质
CN112307351A (zh) * 2020-11-23 2021-02-02 中国科学院计算技术研究所 用户行为的模型训练、推荐方法、装置和设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113793199A (zh) * 2021-09-14 2021-12-14 北京捷风数据技术有限公司 一种招中标信息推荐方法、系统及存储介质
CN114707074A (zh) * 2022-06-06 2022-07-05 深圳尚米网络技术有限公司 一种内容推荐方法、设备和系统
CN114722301A (zh) * 2022-06-09 2022-07-08 江西省精彩纵横采购咨询有限公司 一种招投标信息推荐方法、装置、存储介质及设备
CN114722301B (zh) * 2022-06-09 2022-09-09 江西省精彩纵横采购咨询有限公司 一种招投标信息推荐方法、装置、存储介质及设备

Similar Documents

Publication Publication Date Title
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
US10728203B2 (en) Method and system for classifying a question
EP1992006B1 (en) Collaborative structured tagging for item encyclopedias
US10031975B2 (en) Presentation of search results based on the size of the content sources from which they are obtained
JP5358442B2 (ja) 共同タギング環境内での用語の収束化
CN113191896A (zh) 一种招标信息的推荐方法、装置及计算机设备
US20100174724A1 (en) Interest-group discovery system
CN112434151A (zh) 一种专利推荐方法、装置、计算机设备及存储介质
CN109165975B (zh) 标签推荐方法、装置、计算机设备及存储介质
US20130179449A1 (en) Detecting overlapping clusters
Singh et al. Event driven recommendation system for E-commerce using knowledge based collaborative filtering technique
CN114238573B (zh) 基于文本对抗样例的信息推送方法及装置
US20220358552A1 (en) Methods and systems for hair-service based digital image searching and ranking
CN113077317A (zh) 基于用户数据的物品推荐方法、装置、设备及存储介质
US9996529B2 (en) Method and system for generating dynamic themes for social data
Sisodia et al. Fast prediction of web user browsing behaviours using most interesting patterns
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN111275205A (zh) 虚拟样本的生成方法、终端设备及存储介质
CN109819002B (zh) 数据推送方法和装置、存储介质及电子装置
CN112907334A (zh) 一种对象推荐方法及装置
US20170098168A1 (en) Method and system for providing synthetic answers to a personal question
CN110427545B (zh) 一种信息推送方法及系统
Yu et al. A recommender system for ordering platform based on an improved collaborative filtering algorithm
CN111460300B (zh) 网络内容推送方法、装置及存储介质
CN109408713B (zh) 一种基于用户反馈信息的软件需求检索系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination