CN114266394A - 面向科技服务平台的企业画像与科技服务个性化需求预测方法 - Google Patents

面向科技服务平台的企业画像与科技服务个性化需求预测方法 Download PDF

Info

Publication number
CN114266394A
CN114266394A CN202111576376.3A CN202111576376A CN114266394A CN 114266394 A CN114266394 A CN 114266394A CN 202111576376 A CN202111576376 A CN 202111576376A CN 114266394 A CN114266394 A CN 114266394A
Authority
CN
China
Prior art keywords
enterprise
scientific
data
service
technological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111576376.3A
Other languages
English (en)
Inventor
华中生
俞鸿涛
鲍丽娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Zhejiang University ZJU
Original Assignee
Dalian University of Technology
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology, Zhejiang University ZJU filed Critical Dalian University of Technology
Priority to CN202111576376.3A priority Critical patent/CN114266394A/zh
Publication of CN114266394A publication Critical patent/CN114266394A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向科技服务平台的企业画像与科技服务个性化需求预测方法,包括:从平台数据库中采集企业属性数据、行为数据以及所选择科技服务类型数据,并将收集到数据按行业类型分类;利用数据挖掘方法从采集的数据提取企业标签,包括企业科技创新投入、科技创新产出、行为偏好与活跃度四种类型;企业画像为企业标签与企业属性数据组成的集合;选取企业数据数量最多的行业建立神经网络模型,将企业行为数据作为网络输入,科技服务类型数据作为网络输出训练神经网络,得到针对该行业的企业科技服务需求预测模型;通过迁移学习方法和其他行业的企业数据对所得预测模型参数进行调整更新,得到针对不同行业的企业科技服务需求预测模型。

Description

面向科技服务平台的企业画像与科技服务个性化需求预测 方法
技术领域
本发明涉及个性化需求预测技术领域,具体涉及一种面向科技服务平台的企业画像与科技服务个性化需求预测方法。
背景技术
科技服务平台是为企业提供科技服务的综合信息平台,承担着企业科技服务需求与供给匹配的纽带作用。近年来,随着科技企业对科技服务需求的快速提升,科技服务平台迎来了众多机遇和挑战。一方面,不同企业的规模、创新能力、行为偏好各不相同,科技服务需求呈个性化趋势发展;另一方面,现有科技服务平台大多采用被动式等待企业在站内寻找服务,缺乏主动推送科技服务的相关技术。
在此背景下,研究企业创新能力、行为偏好等特征画像,预测企业个性化科技服务需求,对科技服务平台提高科技服务需求与供给匹配精度,推动科技企业创新发展具有重要意义。
近年来,随着人工智能与机器学习技术的快速发展,研究者对基于机器学习技术的企业画像与个性化需求预测方法进行了深入的研究,提出了许多针对不同领域的画像模型和服务需求预测方法。
例如,田娟等(2018)提出了一种基于大数据平台的企业画像构建框架,分析了常用的企业画像生成模型及基于大数据的企业画像设计方法,总结了企业画像技术在企业营销、政府税收管理系统、股票证券交易系统及企业招聘系统等领域的应用;刘志中等(2015)提出了一种基于矩阵分析与深度学习的服务需求预测方法,该方法通过对用户历史使用数据进行矩阵分析得到用户特征矩阵与服务特征矩阵,将两种矩阵分别作为深度神经网络的输出与输入构建神经网络预测模型,实现用户服务需求预测,并在此基础上给出了主动服务及服务推荐策略。
尽管研究者提出了一些企业画像与服务需求预测方法,这些方法在企业科技服务领域尚未进行深入研究和应用。一方面,现有企业画像方法未考虑企业在创新能力、行为偏好、平台活跃度等方面的差异,无法对企业寻求科技服务过程中所表现出的特征进行准确描述;另一方面,现有服务需求预测方法的总体思路是通过大量用户历史数据构建和训练预测模型,但在企业科技服务背景下,不同行业的企业服务需求通常表现出很强的差异性,需要分别建立预测模型,一些行业通常存在企业数据难以获取、历史样本数量不足的情况,这对构建预测模型造成了很大困难。
因此当前方法在科技服务需求预测的实际应用中面临预测准确度偏低的问题。
发明内容
针对现有方法在本领域存在的不足,本发明提供了一种面向科技服务平台的企业画像与科技服务个性化需求预测方法。该方法通过数据挖掘方法提取企业在创新投入、创新产出、行为偏好与平台活跃度等方面的特征标签,以此为基础构建企业画像,并利用企业的历史行为数据与科技服务需求建立神经网络预测模型,结构迁移学习的方式克服不同企业的行业差异及历史样本不足的问题,实现企业科技服务准确预测。
一种面向科技服务平台的企业画像与科技服务个性化需求预测方法,包括步骤:
(1)从平台数据库中采集企业属性数据、行为数据以及所选择科技服务类型数据,并将收集到数据按行业类型分类;
(2)利用数据挖掘方法从采集的数据提取企业标签,包括企业科技创新投入、科技创新产出、行为偏好与活跃度四种类型;企业画像为企业标签与企业属性数据组成的集合;
(3)选取企业数据数量最多的行业建立神经网络模型,将企业行为数据作为网络输入,科技服务类型数据作为网络输出训练神经网络,得到针对该行业的企业科技服务需求预测模型;
(4)通过迁移学习方法和其他行业的企业数据对所得预测模型参数进行调整更新,得到针对不同行业的企业科技服务需求预测模型。
步骤(1)中:
企业属性数据指标包括企业名称、省份、行业、企业规模与信用;
行为数据包括企业科技创新投资、专利、论著与标准数量、平台广告偏好及平台内点击次数、访问、浏览次数;
科技服务类型包括行业认证、管理咨询、科技活动和知识产权代理。
步骤(2)中,所述标签指描述企业参与科技服务活动的特征标识,具体包括企业科技创新投入、科技创新产出、行为偏好与活跃度四种类型。其中:
企业科技创新投入、科技创新产出与活跃度标签分为高中低三档,分别由企业科技创新投资、知识产权数量及企业对平台访问浏览次数描述;
行为偏好标签代表企业对平台内不同类型科技服务广告的偏好程度,由企业对不同类型广告的点击次数描述。
步骤(2)中,所述数据挖掘方法为k-means聚类方法。
以企业科技创新投入为例。该方法提取标签的具体过程为:
(2-1)从企业科技创新投资数据中随机抽取三个样本,作为聚类中心点,记为C1、C2、C3
(2-2)计算剩余所有样本点到聚类中心C1、C2、C3的距离,根据距离大小将样本划分为三类,并计算每一类样本点均值,作为新的聚类中心;
(2-3)用新的聚类中心替代上一聚类中心,重复步骤(2-2),直至新聚类中心点位置变化小于事先设定点阈值;
(2-4)将样本划分的最终结果按聚类中心由高到低排列,分别对应高、中、低三种企业科技创新投入等级。
类似地,按照上述步骤,可根据企业知识产权数量与平台访问浏览次数数据得到企业科技创新产出与活跃度标签值。企业行为偏好标签由描述统计得到,即统计其对不同类型科技服务广告的点击次数,根据点击次数由高到低列出企业对不同服务类型的偏好。企业画像由企业属性数据与标签组成,即属性数据(企业名称、省份、行业与信用、企业规模和技术领域等)和标签(科技创新投入、科技创新产出、行为偏好与活跃度)组成的集合。
步骤(3)中,所述神经网络模型是一个前反馈神经网络,它由输入层、隐层与输出层三部分组成,神经网络将企业行为数据(科技创新投资、专利、论著与标准数量、平台广告偏好及访问次数等)作为输入,科技服务类型数据作为输出,具体计算过程为:
Figure BDA0003425248210000031
Figure BDA0003425248210000041
β3=φ(θ3β2)
其中,θ1、θ2和θ3分别代表网络输入层、隐层与输出层的参数,
Figure BDA0003425248210000042
和φ(·)代表非线性激活函数,其函数形式为
Figure BDA0003425248210000043
和φ(·)=1/(1-ex)。
步骤(4)中,迁移学习是一种机器学习方法,其目标是将某领域学习到的知识应用至相关但不同领域的问题中,以解决传统模型面对数据分布差异时存在的低准确率问题。在企业科技服务需求问题中,迁移学习方法首先将利用行业数据对神经网络模型进行预训练,然后利用训练后的神经网络和其他行业的数据进行需求预测并计算误差,最后根据预测误差与梯度下降算法训练后的模型参数进行调整,得到针对该行业的神经网络预测模型,具体计算过程为:
Figure BDA0003425248210000044
Figure BDA0003425248210000045
Figure BDA0003425248210000046
其中,α1、α2和α3分别代表网络参数θ1、θ2和θ3的更新结果,E代表神经网络对科技服务需求的预测误差,
Figure BDA0003425248210000047
代表误差E关于网络参数θ1、θ2和θ3的梯度,ρ代表梯度下降的更新速率。
本发明与现有技术相比,主要优点包括:
本发明通过数据挖掘方法提取企业在创新投入、创新产出、行为偏好与平台活跃度等方面的特征标签,以此为基础构建企业画像,并利用企业的历史行为数据与科技服务需求建立神经网络预测模型,结构迁移学习的方式克服不同企业的行业差异及历史样本不足的问题,实现企业科技服务准确预测。
附图说明
图1为本发明面向科技服务平台的企业画像与科技服务个性化需求预测方法流程图;
图2为企业科技服务画像结构图;
图3为实施例企业科技服务预测结果统计图;
图4为本发明提出方法与对比例传统神经网络方法预测结果对比图。
具体实施方式
下面结合附图及具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。
如图1所示,本发明提出的面向科技服务平台的企业画像与科技服务个性化需求预测方法的流程包括步骤:
S01,从平台数据库中采集企业属性数据、行为数据以及所选择科技服务类型数据,并将收集到数据按行业类型分类。
S02,利用数据挖掘方法从采集数据提取企业标签,包括企业科技创新投入、科技创新产出、行为偏好与活跃度四种类型。企业标签与属性数据组合形成企业画像。
S03,选取企业数据数量最多的行业建立神经网络模型,将企业行为数据作为网络输入,科技服务类型数据作为网络输出训练神经网络,得到针对该行业的企业科技服务需求预测模型。
S04,通过迁移学习方法和其他行业的企业数据对所得预测模型参数进行调整更新,得到针对不同行业的企业科技服务需求预测模型。
实施例
本实施例从国内科技服务平台收集了2236家企业的基本属性数据,并模拟生成了行为数据与科技服务类型数据。企业属性数据指标包括企业名称、省份、行业、企业规模与信用;行为数据包括企业科技创新投资、专利、论著与标准数量、平台广告偏好、以及平台内点击次数、访问、浏览次数,其中广告偏好包括技术交易、专利代理、软件检测、创业融资;企业科技服务包括行业认证、管理咨询、科技活动和知识产权服务四种类型。按照步骤S01,本实施按行业对所收集的企业数据与模拟数据进行了分类整理,企业行业与规模分布情况以及模拟数据描述统计结果如表1至表4所示。
表1企业规模与行业分布数据
微型企业 小型企业 中型企业 大型企业
高技术服务 8 34 22 1
现代农业 12 52 11 3
制造业 9 88 51 11
电子信息 218 997 430 53
生物与新医药 32 101 89 14
表2企业科技创新投资、知识产权数量与平台访问浏览次数描述统计结果
科技创新投投资(万元) 知识产权数量 平台访问流量次数
平均值 60.32 10.00 149.00
方差 19.93 2.98 31.07
表3企业科技服务广告偏好统计结果
广告类型 技术交易 专利代理 软件检测 创业融资
企业数量 558 552 549 577
表4企业选择科技服务类型统计结果
科技服务类型 行业认证 管理咨询 科技活动 知识产权代理
企业数量 5 1510 309 404
然后,按照步骤S02,本实施例利用k-means聚类方法从上述企业数据中提取企业标签,具体包括企业科技创新投入、科技创新产出、行为偏好与活跃度四种类型。企业科技创新投入、科技创新产出与活跃度标签分为高中低三档,分别由企业科技创新投资、知识产权数量及企业对平台访问浏览次数描述;行为偏好标签代表企业对平台内不同类型科技服务广告的偏好程度,由企业对不同类型广告的点击次数描述。企业画像由企业属性数据与标签组成,即属性数据(企业名称、省份、行业与信用、企业规模和技术领域)和标签(科技创新投入、科技创新产出、行为偏好与活跃度)组成的集合。企业科技服务画像如图2所示。
最后,按照步骤S03、步骤S04,本实施例利用电子信息行业的企业科技服务数据搭建神经网络模型并对神经网络进行训练,同时利用迁移学习方法将训练结果分别应用至其他四个行业的企业科技服务预测当中。为检测本发明提出方法的可靠性,实施例将每个行业的企业数据分别两个部分,其中百分之八十的数据用于训练神经网络和迁移学习,剩余百分之二十数据用于测试神经网络预测企业科技服务需求结果的准确性,相应的统计结果如图3所示。
对比例
为说明本发明提出方法在企业科技服务需求预测方面的优势,对比例采用前反馈神经网络模型和传统批量学习方法搭建企业科技服务需求模型,并使用与实施例相同的企业数据与模型的预测结果进行验证。验证过程中,百分之八十的数据用于训练神经网络,百分之二十的数据用于测试神经网络预测结果的准确度。前反馈神经网络与本发明提出方法预测准确度的对比结果如图4所示。
从图4中可以看出,本发明提出方法的正确率为96.65%,错误率为3.35%,明显优于传统神经网络方法的正确率92.85%和错误率7.15%。本发明提出方法考虑了部分行业中企业数据数量不足对模型预测的问题,采用迁移学习等前沿技术对传统模型进行优化调整,从而能够获得更高的预测精度。
此外应理解,在阅读了本发明的上述描述内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (8)

1.一种面向科技服务平台的企业画像与科技服务个性化需求预测方法,其特征在于,包括步骤:
(1)从平台数据库中采集企业属性数据、行为数据以及所选择科技服务类型数据,并将收集到数据按行业类型分类;
(2)利用数据挖掘方法从采集的数据提取企业标签,包括企业科技创新投入、科技创新产出、行为偏好与活跃度四种类型;企业画像为企业标签与企业属性数据组成的集合;
(3)选取企业数据数量最多的行业建立神经网络模型,将企业行为数据作为网络输入,科技服务类型数据作为网络输出训练神经网络,得到针对该行业的企业科技服务需求预测模型;
(4)通过迁移学习方法和其他行业的企业数据对所得预测模型参数进行调整更新,得到针对不同行业的企业科技服务需求预测模型。
2.根据权利要求1所述的面向科技服务平台的企业画像与科技服务个性化需求预测方法,其特征在于,步骤(1)中,企业属性数据指标包括企业名称、省份、行业、企业规模与信用。
3.根据权利要求1所述的面向科技服务平台的企业画像与科技服务个性化需求预测方法,其特征在于,步骤(1)中,行为数据包括企业科技创新投资、专利、论著与标准数量、平台广告偏好及平台内点击次数、访问、浏览次数。
4.根据权利要求1所述的面向科技服务平台的企业画像与科技服务个性化需求预测方法,其特征在于,步骤(1)中,科技服务类型包括行业认证、管理咨询、科技活动和知识产权代理。
5.根据权利要求1所述的面向科技服务平台的企业画像与科技服务个性化需求预测方法,其特征在于,步骤(2)中:
企业科技创新投入、科技创新产出与活跃度标签分为高中低三档,分别由企业科技创新投资、知识产权数量及企业对平台访问浏览次数描述;
行为偏好标签代表企业对平台内不同类型科技服务广告的偏好程度,由企业对不同类型广告的点击次数描述。
6.根据权利要求1所述的面向科技服务平台的企业画像与科技服务个性化需求预测方法,其特征在于,步骤(2)中,所述数据挖掘方法为k-means聚类方法。
7.根据权利要求1所述的面向科技服务平台的企业画像与科技服务个性化需求预测方法,其特征在于,步骤(3)中,所述神经网络模型是一个前反馈神经网络,它由输入层、隐层与输出层三部分组成,具体计算过程为:
Figure FDA0003425248200000021
Figure FDA0003425248200000022
β3=φ(θ3β2)
其中,θ1、θ2和θ3分别代表网络输入层、隐层与输出层的参数,
Figure FDA0003425248200000023
和φ(·)代表非线性激活函数,其函数形式为
Figure FDA0003425248200000024
和φ(·)=1/(1-ex)。
8.根据权利要求1所述的面向科技服务平台的企业画像与科技服务个性化需求预测方法,其特征在于,步骤(4)中,迁移学习方法首先将利用行业数据对神经网络模型进行预训练,然后利用训练后的神经网络和其他行业的数据进行需求预测并计算误差,最后根据预测误差与梯度下降算法训练后的模型参数进行调整,得到针对该行业的神经网络预测模型,具体计算过程为:
Figure FDA0003425248200000025
Figure FDA0003425248200000026
Figure FDA0003425248200000027
其中,α1、α2和α3分别代表网络参数θ1、θ2和θ3的更新结果,E代表神经网络对科技服务需求的预测误差,
Figure FDA0003425248200000028
代表误差E关于网络参数θ1、θ2和θ3的梯度,ρ代表梯度下降的更新速率。
CN202111576376.3A 2021-12-22 2021-12-22 面向科技服务平台的企业画像与科技服务个性化需求预测方法 Pending CN114266394A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111576376.3A CN114266394A (zh) 2021-12-22 2021-12-22 面向科技服务平台的企业画像与科技服务个性化需求预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111576376.3A CN114266394A (zh) 2021-12-22 2021-12-22 面向科技服务平台的企业画像与科技服务个性化需求预测方法

Publications (1)

Publication Number Publication Date
CN114266394A true CN114266394A (zh) 2022-04-01

Family

ID=80828545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111576376.3A Pending CN114266394A (zh) 2021-12-22 2021-12-22 面向科技服务平台的企业画像与科技服务个性化需求预测方法

Country Status (1)

Country Link
CN (1) CN114266394A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117372206A (zh) * 2023-12-08 2024-01-09 烟台云朵软件有限公司 一种元宇宙统一服务集成方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376766A (zh) * 2018-09-18 2019-02-22 平安科技(深圳)有限公司 一种画像预测分类方法、装置及设备
CN113157752A (zh) * 2021-03-12 2021-07-23 北京航空航天大学 一种基于用户画像和情境的科技资源推荐方法及系统
CN113743081A (zh) * 2021-09-03 2021-12-03 西安邮电大学 技术服务信息的推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376766A (zh) * 2018-09-18 2019-02-22 平安科技(深圳)有限公司 一种画像预测分类方法、装置及设备
CN113157752A (zh) * 2021-03-12 2021-07-23 北京航空航天大学 一种基于用户画像和情境的科技资源推荐方法及系统
CN113743081A (zh) * 2021-09-03 2021-12-03 西安邮电大学 技术服务信息的推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李小妞等: "面向科技服务平台个性化服务的企业科技画像构建研究", 《河南科技》, 31 August 2021 (2021-08-31), pages 135 - 140 *
由育阳: "《机器学习智能诊断理论与应用:睡眠障碍诊断》", 30 September 2020, 北京理工大学出版社, pages: 138 - 139 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117372206A (zh) * 2023-12-08 2024-01-09 烟台云朵软件有限公司 一种元宇宙统一服务集成方法与系统

Similar Documents

Publication Publication Date Title
Hafezi et al. A time-use activity-pattern recognition model for activity-based travel demand modeling
Skinner Choosing college in the 2000s: An updated analysis using the conditional logistic choice model
Dowling Measuring corporate images: A review of alternative approaches
CN112561598B (zh) 基于客户画像的客户流失预测及挽回方法和系统
CN107633035B (zh) 一种基于K-Means&LightGBM模型的共享交通服务reorder预估方法
CN117540935B (zh) 一种基于区块链技术的dao运营管理方法
CN113689234B (zh) 一种基于深度学习的平台相关的广告点击率预测方法
CN114048436A (zh) 一种预测企业财务数据模型构建方法及构建装置
CN110310012A (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN116883157A (zh) 一种基于度量学习的小样本信用评估方法及系统
CN117436679A (zh) 一种元宇宙资源匹配方法及其系统
CN108647714A (zh) 负面标签权重的获取方法、终端设备及介质
Sun et al. Using improved RFM model to classify consumer in big data environment
CN113705679B (zh) 一种基于超图神经网络的学生成绩预测方法
CN114266394A (zh) 面向科技服务平台的企业画像与科技服务个性化需求预测方法
CN114584601A (zh) 用户流失识别及干预方法、系统、终端及介质
CN117874594A (zh) 一种银行客户分类方法、系统以及电子设备
CN114004513A (zh) 一种需求预测方法、系统及存储介质
CN117495482A (zh) 一种基于用户画像的二手手机销售推荐方法及系统
CN116127189A (zh) 用户运营方法、装置、设备以及计算机存储介质
CN108764518A (zh) 一种基于物联网大数据的交通资源动态优化方法
Mousavian Anaraki et al. Providing a hybrid clustering method as an auxiliary system in automatic labeling to divide employee into different levels of productivity and their retention
CN111581382B (zh) 问答社区中的热门问题的预测方法及系统
CN114549035A (zh) 一种基于电信大数据的理财用户精准获客标签构建方法
CN108764537B (zh) 一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination