CN116089595A - 基于科技成果的数据处理推送方法、装置及介质 - Google Patents

基于科技成果的数据处理推送方法、装置及介质 Download PDF

Info

Publication number
CN116089595A
CN116089595A CN202211674831.8A CN202211674831A CN116089595A CN 116089595 A CN116089595 A CN 116089595A CN 202211674831 A CN202211674831 A CN 202211674831A CN 116089595 A CN116089595 A CN 116089595A
Authority
CN
China
Prior art keywords
information
technological
scientific
achievement
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211674831.8A
Other languages
English (en)
Inventor
蒋琰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202211674831.8A priority Critical patent/CN116089595A/zh
Publication of CN116089595A publication Critical patent/CN116089595A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例涉及成果转换技术领域,公开了一种基于科技成果的数据处理推送方法,包括:获取待评估的科技成果信息,并对所述科技成果信息进行数据处理以确定与科技成果相关的成果特征数据;根据构建完成的领域分类模型对所述成果特征数据进行分类以得到相应的领域分类结果,并将所述领域分类结果与成果特征数据进行关联以得到科技匹配信息;获取预先存储的企业信息和科技园区信息;将所述科技匹配信息与企业信息和科技园区信息进行关联匹配以得到信息推荐列表。本发明实施例中的基于科技成果的数据处理推送方法通过领域分类模型来对科技成果信息进行领域分类,并获取与其领域相关的园区或者企业信息,并完成信息推送。

Description

基于科技成果的数据处理推送方法、装置及介质
技术领域
本发明涉及成果转化技术领域,具体涉及一种基于科技成果的数据处理推送方法、装置及介质。
背景技术
目前,高校研究所与市场之间的沟通还存在一些代沟,高校研究所能够不断的产出各种新奇的想法;但是很多并没有应用到市场端,因为其并没有较好的渠道来获取与其设计关联的企业信息。虽然现有有一些科技成果交流会,但是划分并不够具体,这也就增加了企业与成果持有者之间的沟通壁垒。因此,设计一种能够提高科技成果转换的信息推送方案成为本领域技术人员亟待解决的技术问题。
发明内容
针对所述缺陷,本发明实施例公开了一种基于科技成果的数据处理推送方法,其能够基于文本来对企业以及科技成果持有方进行精准的信息匹配,提高两者之间的沟通效率,进而提升科技成果转化的成功率。
本发明实施例第一方面公开了基于科技成果的数据处理推送方法,包括:
获取待评估的科技成果信息,并对所述科技成果信息进行数据处理以确定与科技成果相关的成果特征数据;
根据构建完成的领域分类模型对所述成果特征数据进行分类以得到相应的领域分类结果,并将所述领域分类结果与成果特征数据进行关联以得到科技匹配信息;
获取预先存储的企业信息和科技园区信息,所述科技园区信息包括园区企业、园区类型、园区位置和与园区关联的领域信息;
将所述科技匹配信息与企业信息和科技园区信息进行关联匹配以得到信息推荐列表,并根据所述信息推荐列表将所述科技成果信息推送至相应的企业或者园区。
作为一种可选的实施方式,在本发明实施例第一方面中,所述领域分类模型通过如下步骤构建完成:
接收历史科技信息,并对所述历史科技信息进行预处理操作以得到历史科技文本;
将所述历史科技文本转换为科技文本向量;
采用神经网络模型来对所述科技文本向量进行特征选择以得到第一科技特征;
基于所述第一科技特征采用随机梯度下降算法对训练所述神经网络模型,直至得到第二科技特征;
根据分类器对所述第二科技特征进行领域分类以确定文本分类结果,并完成领域分类模型的构建。
作为一种可选的实施方式,在本发明实施例第一方面中,所述神经网络模型为BP神经网络模型。
作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述历史科技信息进行预处理操作,包括:
对所述历史科技信息与预先构建的词库中的词条根据预先设定的策略进行匹配以得到所述历史科技信息中的词语;
根据预先构建完成的停用词表和所述历史科技信息中的词语进行匹配,若匹配成功,则删除该词语;
计算得到的词语之间的关联强度,利用TextRank算法迭代算出词语的重要度得分,且每个词语采用数值向量形式来表示;
计算所述历史科技信息中两个词语之间的欧氏距离,当两者的欧氏距离小于预设数值时,则选择两者之一。
作为一种可选的实施方式,在本发明实施例第一方面中,所述企业信息包括与相应企业关联的文本信息,所述文本信息包括媒体报道信息、论文信息和专利文献信息;
在所述获取待评估的科技成果信息之后,还包括:
计算所述科技成果信息中每个词语的词频,以词语和词频作为项和支持度,用FP-Tree方法挖掘出与该科技成果信息相关度最高的前五项文本信息;
根据所述前五项文本信息确定与该文本信息对应的企业信息;并获取与该企业关联的全部的文本内容信息,且所述文本内容信息与企业具有一一对应的关系;
对相应的文本内容信息进行词语提取以得到该企业的知识词库;并扫描优化企业词库中的词表,用TF词频代替FP-tree算法中的支持度构建FP树以挖掘出具有实施领域的技术特征集合;
基于所述技术特征集合确定与科技成果信息相关的企业信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述数据处理推送方法,还包括:
获取电子商务网站上与科技成果相关的产品销售信息;
获取与产品销售信息关联的商家信息;
根据所述产品销售信息确定该相关产品的总营收;
将所述产品销售信息、商家信息和总营收与科技成果信息进行关联并推送至相应的企业或者园区。
作为一种可选的实施方式,在本发明实施例第一方面中,所述数据处理推送方法,还包括:
将与科技成果关联的企业信息或者园区信息推送至相应的用户。
本发明实施例第二方面公开一种基于科技成果的数据处理推送方法,包括:
第一获取模块:用于获取待评估的科技成果信息,并对所述科技成果信息进行数据处理以确定与科技成果相关的成果特征数据;
领域分类模块:用于根据构建完成的领域分类模型对所述成果特征数据进行分类以得到相应的领域分类结果,并将所述领域分类结果与成果特征数据进行关联以得到科技匹配信息;
第二获取模块:用于获取预先存储的企业信息和科技园区信息,所述科技园区信息包括园区企业、园区类型、园区位置和与园区关联的领域信息;
数据匹配模块:用于将所述科技匹配信息与企业信息和科技园区信息进行关联匹配以得到信息推荐列表,并根据所述信息推荐列表将所述科技成果信息推送至相应的企业或者园区。
本发明实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本发明实施例第一方面公开的基于科技成果的数据处理推送方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的基于科技成果的数据处理推送方法。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中的基于科技成果的数据处理推送方法通过领域分类模型来对科技成果信息进行领域分类,并获取与其领域相关的园区或者企业信息,并完成最终的信息推送;通过上述方式提高两者之间的沟通效率,并且基于文本分析能够进行更加准确的领域分类。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的基于科技成果的数据处理推送方法的流程示意图;
图2是本发明实施例提供的一种基于科技成果的数据处理推送装置的结构示意图;
图3是本发明实施例提供的一种电子设备的结构示意图;
图4是本发明实施例公开的科技成果转化运营数据信息展示方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
高校研究所能够不断的产出各种新奇的想法;但是很多并没有应用到市场端,因为其并没有较好的渠道来获取与其设计关联的企业信息。虽然现有有一些科技成果交流会,但是划分并不够具体,这也就增加了企业与成果持有者之间的沟通壁垒。基于此,本发明实施例公开了基于科技成果的数据处理推送方法、装置、电子设备及存储介质,其通过领域分类模型来对科技成果信息进行领域分类,并获取与其领域相关的园区或者企业信息,并完成最终的信息推送;通过上述方式提高两者之间的沟通效率,并且基于文本分析能够进行更加准确的领域分类。
实施例一
请参阅图1,图1是本发明实施例公开的基于科技成果的数据处理推送方法的流程示意图。其中,本发明实施例所描述的方法的执行主体为由软件或/和硬件组成的执行主体,该执行主体可以通过有线或/和无线方式接收相关信息,并可以发送一定的指令。当然,其还可以具有一定的处理功能和存储功能。该执行主体可以控制多个设备,例如远程的物理服务器或云服务器以及相关软件,也可以是对某处安置的设备进行相关操作的本地主机或服务器以及相关软件等。在一些场景中,还可以控制多个存储设备,存储设备可以与设备放置于同一地方或不同地方。如图1所示,该基于科技成果的数据处理推送方法包括以下步骤:
S101:获取待评估的科技成果信息,并对所述科技成果信息进行数据处理以确定与科技成果相关的成果特征数据;
本步骤主要是获取待评估的科技成果信息,这里的科技成果信息可以是论文或者专利或者是其他的文字性介绍;在本发明实施例中主要是采用客观文字来进行评析,这样能够获取到更加精准的领域分类。由于文本特征具有丰富的内容与含义,当获取到文本特征的时候,其甚至能够得到匹配得到相似领域的情况;这也就是大大增加了该科技成果转化的可能性。
这里的待评估的科技成果也可以采用模板的形式来进行获取,这样在进行信息填报的时候,可以按照适用范围、应用行业、成果内容简介、前期应用示范、获得研发资助情况、转化应用前景、成果持有单位来进行内容填写;
S102:根据构建完成的领域分类模型对所述成果特征数据进行分类以得到相应的领域分类结果,并将所述领域分类结果与成果特征数据进行关联以得到科技匹配信息;
在本步骤主要是对领域进行分类,这里的领域分类模型主要是通过对不同领域的信息抽取来进行综合判断的。这里提及的领域包括有新一代信息技术领域、能源技术领域、现代农业技术领域、高端装备与先进制造技术、城镇化技术领域、海洋技术领域、资源节约与生态修复技术、人口健康技术领域、新材料技术领域、高新技术服务业技术领域等;
具体的,所述领域分类模型通过如下步骤构建完成:
S1021:接收历史科技信息,并对所述历史科技信息进行预处理操作以得到历史科技文本;
S1022:将所述历史科技文本转换为科技文本向量;
S1023:采用神经网络模型来对所述科技文本向量进行特征选择以得到第一科技特征;
S1024:基于所述第一科技特征采用随机梯度下降算法对训练所述神经网络模型,直至得到第二科技特征;
S1025:根据分类器对所述第二科技特征进行领域分类以确定文本分类结果,并完成领域分类模型的构建。
进行批量训练数据处理的时候,主要有以下三种形式:批量梯度下降法BGD(BatchGradient Descent):针对的是整个数据集,通过对所有的样本的计算来求解梯度的方向;其能够实现全局最优解;易于并行实现;小批量梯度下降法MBGD(mini-batch GradientDescent)把数据分为若干个批,按批来更新参数,这样,一个批中的一组数据共同决定了本次梯度的方向,下降起来就不容易跑偏,减少了随机性;还有就是随机梯度下降算法,其对每个数据都计算算一下损失函数,然后求梯度更新参数。其具有计算速度快的优点,随机梯度下降算法每次从训练集中随机选择一个样本来进行学习,批量梯度下降算法每次都会使用全部训练样本,因此这些计算是冗余的,因为每次都使用完全相同的样本集。而随机梯度下降算法每次只随机选择一个样本来更新模型参数,因此每次的学习是非常快速的,并且可以进行在线更新。其针对于文字训练来说是更加优选的选择。
通过上述步骤来实现领域分类模型的构建,这里的在进行实施的时候,不单单是通过一个科技特征词来进行领域分类的,而是需要组合多种不同的信息来进行分类。比如针对于人口健康技术领域,其可以通过“九价疫苗”、“角膜、透镜、等离子膜化”等来进行综合判定,因为有些名词在不同领域是共通的;如果从单个词语来进行判断,并不能够定位更加精准的领域,这样在进行信息对接的时候,也会使得其并不能够对接到更加精准的企业或者园区;也就从一定程度上降低了转化效率。
更为优选的,所述对所述历史科技信息进行预处理操作,包括:
对所述历史科技信息与预先构建的词库中的词条根据预先设定的策略进行匹配以得到所述历史科技信息中的词语;
根据预先构建完成的停用词表和所述历史科技信息中的词语进行匹配,若匹配成功,则删除该词语;
计算得到的词语之间的关联强度,利用TextRank算法迭代算出词语的重要度得分,且每个词语采用数值向量形式来表示;
计算所述历史科技信息中两个词语之间的欧氏距离,当两者的欧氏距离小于预设数值时,则选择两者之一。
通过上述文本识别的方式来对历史信息进行抽取,这样能够得到更多的文字拆分,进而获取到更多更综合的信息。
在本发明实施例中其可以通过Word2Vec语言模型来获取词向量。该语言模型,就是通过前个字预测下一个字的概率,其实就是增加多种分类器,整体的过程为输入onehot,然后连接一个全连接层,然后再连接若干个层,最后接一个softmax分类器,就可以得到相应的语言模型,然后将大批量文本输入训练,最后得到第一个全连接层的参数,就是字、词向量表。具体的,历史科技信息就是sentences:其是要分析的语料,可以是一个列表,或者从文件中遍历读出。
具体的,word2vec的训练如下:
#设置词语向量维度
num_featrues=300
min_word_count=1
#设置并行化训练使用CPU计算核心数量
num_workers=4
#设置词语上下文窗口大小
context=5
#开始训练
model=word2vec.Word2Vec(sentence_word_list,workers=num_workers,size=num_featrues,min_count=min_word_count,window=context)
model.init_sims(replace=True)
”'
#如果有需要的话,可以输入一个路径,保存训练好的模型
model.save("w2vModel1")
print(model)
#加载模型
model=word2vec.Word2Vec..load("w2vModel1")
”'。
上述为具体历史文本信息的处理操作,上述处理操作也可以用于对待评估的科技成果进行处理。具体的,基于TextRank的迭代出最重要的词语:关键词抽取的任务就是从一段给定的文本中自动抽取出若干有意义的词语或词组。TextRank算法是利用局部词汇之间关系(共现窗口)对后续关键词进行排序,直接从文本本身抽取。其主要步骤如下:
把给定的文本T按照完整句子进行分割,即T=[S1,S2,…,Sm];对于每个句子Si∈T,进行分词和词性标注处理,并过滤掉停用词,只保留指定词性的单词,如名词、动词、形容词,即Si=[ti,1,ti,2,…,ti,n],其中ti,j∈Sj是保留后的候选关键词;构建候选关键词图G=(V,E),其中V为节点集,由(2)生成的候选关键词组成,然后采用共现关系(co-occurrence)构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K的窗口中共现,K表示窗口大小,即最多共现K个单词。根据上面公式,迭代传播各节点的权重,直至收敛。对节点权重进行倒序排序,从而得到最重要的T个单词,作为候选关键词。得到最重要的T个单词,在原始文本中进行标记,若形成相邻词组,则组合成多词关键词。例如,文本中有句子“Matlab code for plotting ambiguity function”,如果“Matlab”和“code”均属于候选关键词,则组合成“Matlab code”加入关键词序列。
S103:获取预先存储的企业信息和科技园区信息,所述科技园区信息包括园区企业、园区类型、园区位置和与园区关联的领域信息;
这里需要预先获取到各个企业的信息以及科技园区的信息,这里需要获取到多种类型的信息,比如该企业涉及到的领域和产品等,这里可以通过爬取公开的信息来进行多种内容信息的获取,进而扩大自身的企业数据库信息。在本发明实施例中还通过对科技园区的信息进行获取来获取到相应的园区信息,由于园区内集聚有更多类型的企业,并且还有更加专业化的园区,比如信息技术产业园区,其区内都是一些信息技术产业相关的企业,这样在进行技术推广或者成果转化的时候,可以将该成果扩散到更全面的范围,也大大提高了成果转化成功的可能性。
在本发明实施例中更为优选的可以获取到企业或者园区的位置信息,通过位置信息来匹配成果持有者和企业之间的距离,如果筛选到的企业或者园区数量众多的时候,可以通过距离来提高一种筛选维度,当企业与成果持有者均在同一个城市甚至于是在同一个行政区的时候,则可以增加两者之间沟通交流的频次,也就使得在成果转化过程中可以有持续不断的交流。
S104:将所述科技匹配信息与企业信息和科技园区信息进行关联匹配以得到信息推荐列表,并根据所述信息推荐列表将所述科技成果信息推送至相应的企业或者园区。
通过步骤S101到S103则可以确定两者之间的关键词信息,通过上述关键词来进行领域匹配或者信息匹配。在本发明实施例中通过设置领域匹配的方式,其能够实现更加精准的信息匹配。当获取到相应的信息列表之后,则可以根据信息列表来进行成果推送;这样就能够使得大大提高两者之间的交流。
更为优选的,所述神经网络模型为BP神经网络模型。
更为优选的,所述企业信息包括与相应企业关联的文本信息,所述文本信息包括媒体报道信息、论文信息和专利文献信息;
在所述获取待评估的科技成果信息之后,还包括:
S1011:计算所述科技成果信息中每个词语的词频,以词语和词频作为项和支持度,用FP-Tree方法挖掘出与该科技成果信息相关度最高的前五项文本信息;
S1012:根据所述前五项文本信息确定与该文本信息对应的企业信息;并获取与该企业关联的全部的文本内容信息,且所述文本内容信息与企业具有一一对应的关系;
S1013:对相应的文本内容信息进行词语提取以得到该企业的知识词库;并扫描优化企业词库中的词表,用TF词频代替FP-tree算法中的支持度构建FP树以挖掘出具有实施领域的技术特征集合;
S1014:基于所述技术特征集合确定与科技成果信息相关的企业信息。
在本发明实施中对企业或者园区领域进行综合确定的时候,还可以通过相应企业的专利或者轮来进行综合确定,因为专利一般都是与其产品较为关联的技术内容,这样能够定位到更加精准的应用领域;这样在进行后续的成果匹配的时候能够获取到的更加全面的内容。
在本发明实施例中,还可以追踪与企业相关的媒体报道,这样的报道就可能展现了对应企业的研发方向或者市场方向,根据上述方向匹配更加优选的科技成果,则能够实现好的信息对接。
在上述信息对接的时候,还可以对企业产值信息以及园区产值信息进行获取,只有在了解到对应的产值以及产值变化的话,则可能分析出其对于技术的需求度;当某个企业产值在一段时间内稍显下滑的时候,则可以确定其需要新的技术来刺激产品;也就是其对于新技术更加的渴望,故而可以将其重要度提升。
更为优选的,所述数据处理推送方法,还包括:
获取电子商务网站上与科技成果相关的产品销售信息;
获取与产品销售信息关联的商家信息;
根据所述产品销售信息确定该相关产品的总营收;
将所述产品销售信息、商家信息和总营收与科技成果信息进行关联并推送至相应的企业或者园区。
更为优选的,所述数据处理推送方法,还包括:
将与科技成果关联的企业信息或者园区信息推送至相应的用户。
通过上述步骤来获取对应企业实际产品的销售情况,通过上述销售情况,则能够获取到对应的产品的营收,这样也就能够给出一个科技成果对应的预期价值;并且将收集到的信息可以推送至科技成果持有者处,这样使得科技成果持有者能够获取到更多的信息,并且增加其主动性,只有在信息提供充分的情况下,对于成果持有者也具有较好的优势,能够让其成果得到合理的市场认可,进而刺激其做出更好的成果。
本发明实施例中的基于科技成果的数据处理推送方法通过领域分类模型来对科技成果信息进行领域分类,并获取与其领域相关的园区或者企业信息,并完成最终的信息推送;通过上述方式提高两者之间的沟通效率,并且基于文本分析能够进行更加准确的领域分类。
实施例二
如图4所示,该基于科技成果转化运营数据信息展示方法包括以下步骤:
S201:获取与科技成果转化相关的转化主体以及与各个转化主体关联的位置信息,所述转化主体包括成果持有方和成果实施方;
在本步骤主要是为了获取到基础的转化主体信息,这里的转化主体为成果持有方,也就是研发方,其主要为高校、研究所或者是各个企业内部的研究部门;而成果实施方一般都是相对应的企业;在这里主要是可以确定各个转化主体的位置信息,并与后续基于位置信息来进行综合展示。
S202:获取科技成果转化的时间点信息以及与相应科技成果转换关联的产值变化信息;
在科技成果转化运营过程中,时间点以及产值变化均具有较大的意义;通过成果实施的时间点来确定实施前后的产值变化信息;比如在甲学校在2020年1月将其研发的新的生物制剂配方转让给乙企业;乙企业在接受该配方前,相关生物制剂的年销售额为1千万,而在受让该成果之后,每年的产值增加到了2千万,这说明该成果给乙企业带来了一倍的收益;并对该收益进行信息记录。通过该收益数字作为属性值来对地图显示进行颜色调整,使得用户能够直观的看到对应的收益变化以及收益分布情况。
在进行具体实施的时候,还有可能存在下述情况,也就是该科技成果受让方并不是一家企业,而是多家企业;通过对多家企业接受该成果前后进行详细的数据比对,来判断那一家的企业收益更好,并且还可以结合区域进行位置分析以确定其收益是由于地理位置原因,还是企业自身的原因,提供更多维度的数据分析。
更为优选的,在所述获取与科技成果转化相关的转化主体以及与各个转化主体关联的位置信息之前,包括:
接收用户点选的领域类型信息;
所述获取与科技成果转化相关的转化主体以及与各个转化主体关联的位置信息,包括:
S2021:获取与成果持有方关联的第一用户集合;
S2022:获取与成果实施方关联的第二用户集合;从所述第一用户集合和第二用户集合中筛选出与所述领域类型信息相匹配的目标用户;
S2023:根据所述目标用户确定相应的位置信息,
S2024:为所述位置信息配置多个位置属性,并将所述位置属性与相应的目标用户进行数据关联,所述位置属性包括区县信息、地级市信息、省级信息和经济圈信息。
由于在实际实施过程中,不同领域有不同的需求,在这里提供了基于领域选择的方式,因为做生物科学方面的研究,对于做互联网大数据方面的转化数据并不感兴趣,因为两者领域不同,则没有相应的参考价值。因此通过上述领域来进行更加细粒度的数据区分,甚至在进行数据研究的时候,根据选择区域力度的大小也会影响用户的判断;故而在进行实施的时候,基于各级位置属性来为其配置相应的差异,特别是经济圈的设置使得其更具实际的意义,本发明事实来中可以采用现有的经济圈划分方式,比如长三江区域、珠三角区域、京津冀区域等等;还可以基于科技转化的活跃度来进行聚类分析以确定在那些区域可以形成经济圈。
S203:根据所述位置信息确定转化主体在电子地图上所处的地理区域,并对相应科技成果的转化方向进行标注操作;
除了表明转化主体的位置,还可以对转化的方向进行标注,这样使得用户更加方便直观看到哪里是成果持有方,哪里是成果输出方;方便双方进行信息接洽。
S204:响应用于用户点选的展示类型,根据所述展示类型在电子地图中展示成果持有方和成果实施方的位置分布以及成果流向;其中,根据与所述展示类型相对应的地图渲染数据渲染所述电子地图。
更为优选的,所述根据所述展示类型在电子地图中展示成果持有方和成果实施方的位置分布以及成果流向,包括:
S2041:对电子地图进行网格化划分,并对划分后的各个网格所代表的区域的属性值进行初始化操作;
S2042:根据所述位置信息以及产值变化信息对相应网格的属性值进行更新操作;
S2043:按照预设的绘制策略对不同属性值的网格赋予不同的色彩;
S2044:对每个网格所代表的区域中的信息结合区域本身的属性进行分析以确定当前的成果转化状态。
通过网格划分的方式,并基于网格来进行属性值配置的方式,使得整体的渲染方式更加的方便快捷;其主要设置好基础的数值区间即可完成相应区域色彩渲染。
更为优选的,所述信息展示方法还包括:
S205:采集预设时间内选定区域的成果转化数据,对成果转化数据进行预处理以生成时序转化数据;
S206:将所述时序转化数据输入至转化预测模型进行预测下一个时序段的成果转化数据,其中,所述转化预测模型通过如下步骤构建完成:
S2061:基于支持向量机进行转化预测模型的构建,并将历史转化数据输入至转化预测模型中进行训练;
S2062:计算转化预测模型的平均百分误差,根据平均百分误差获取转化预测模型的精度数据;
S2063:获取精度数据对应的模型参数,根据贝叶斯算法对预测精度对应的模型参数进行优化,根据优化后的模型参数对转化预测模型进行调整以生成转化预测模型。
在本发明实施例中通过获取历史的转化数据来对未来相应区域可能发生的转化的可能性来进行数据预测;甚至于是对于企业接受度来进行数据分析,比如可以分析出该区域内能够接受该成果转化方案的企业的数量以及对应的企业名单。其可以基于历史信息以获取成果输出点的转移规律以及成果接收点的转移规律。
更为优选的,所述信息展示方法还包括:
对选定区域内的成果实施方的生产产值进行数据分析以得到其生产力数值;
对选定区域内的成果持有方的成果输出信息进行数据分析以得到其科技研发能力值;
根据生产力数值和科技研发能力值对区域的属性进行更新操作。
在进行具体实施时,上述方案应用到价值评估中;通过对区域经济水平的分析以确定在不同区域应用的经济价值,甚至于通过分析运输链、产业链来结合成果转化的内容来分析出能够取得更大经济效益的受让方。
更为优选的,所述信息展示方法,还包括:
当检测到转化主体的位置进行变更时,则依据变更前后的位置信息来对相应区域进行属性值更新。
在实际实施过程中,如果某家企业发生位置变更,那么后续当进行成果承接的时候,其是以新的地址来进行成果转化的接受。故而需要基于新的位置来进行属性更新。
更为优选的,所述展示类型为历史转化数据展示和下一阶段的转化数据展示。
在进行具体实施时,还可以通过不断获取成果转化交流会的信息来进行数据更新;在成果转化交流会上获取成果转化交流会产生的初步意向内容,并定位成果转化交流会的地点信息,基于所述地点信息来确定相应的本次交流会的应用领域范围,比如其为农业技术领域、互联网技术领域等。
在进行具体分析的时候,农业方面的成果转化与地区具有更大的差异化;基于农业方面的成果,其还可以对各个区域的地形特征、土壤特征、雨量特征、光照信息、肥料信息来进行综合的数据监测以及实施可能性的匹配。
本发明实施例中的科技成果转化运营数据信息展示方法通过对转化主体的位置以及实施前后的产值变化与地图进行结合使得用户能够科技转化的情况有更直观的认识,并且基于预先构建的转化预测模型对时序化的运营数据进行分析以确定后续的成果输出点以及成果实施地,进而提供更多维度的数据给用户进行参考。
实施例三
请参阅图2,图2是本发明实施例公开的基于科技成果的数据处理推送装置的结构示意图。如图2所示,该基于科技成果的数据处理推送装置可以包括:
第一获取模块21:用于获取待评估的科技成果信息,并对所述科技成果信息进行数据处理以确定与科技成果相关的成果特征数据;
领域分类模块22:用于根据构建完成的领域分类模型对所述成果特征数据进行分类以得到相应的领域分类结果,并将所述领域分类结果与成果特征数据进行关联以得到科技匹配信息;
第二获取模块23:用于获取预先存储的企业信息和科技园区信息,所述科技园区信息包括园区企业、园区类型、园区位置和与园区关联的领域信息;
数据匹配模块24:用于将所述科技匹配信息与企业信息和科技园区信息进行关联匹配以得到信息推荐列表,并根据所述信息推荐列表将所述科技成果信息推送至相应的企业或者园区。
本发明实施例中的基于科技成果的数据处理推送方法通过领域分类模型来对科技成果信息进行领域分类,并获取与其领域相关的园区或者企业信息,并完成最终的信息推送;通过上述方式提高两者之间的沟通效率,并且基于文本分析能够进行更加准确的领域分类。
实施例四
请参阅图3,图3是本发明实施例公开的一种电子设备的结构示意图。电子设备可以是计算机以及服务器等,当然,在一定情况下,还可以是手机、平板电脑以及监控终端等智能设备,以及具有处理功能的图像采集装置。如图..所示,该电子设备可以包括:
存储有可执行程序代码的存储器510;
与存储器510耦合的处理器520;
其中,处理器520调用存储器510中存储的可执行程序代码,执行实施例一中的基于科技成果的数据处理推送方法中的部分或全部步骤。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行实施例一中的基于科技成果的数据处理推送方法中的部分或全部步骤。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于科技成果的数据处理推送方法中的部分或全部步骤。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于科技成果的数据处理推送方法中的部分或全部步骤。
在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。
在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的基于科技成果的数据处理推送方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于科技成果的数据处理推送方法,其特征在于,包括:
获取待评估的科技成果信息,并对所述科技成果信息进行数据处理以确定与科技成果相关的成果特征数据;
根据构建完成的领域分类模型对所述成果特征数据进行分类以得到相应的领域分类结果,并将所述领域分类结果与成果特征数据进行关联以得到科技匹配信息;
获取预先存储的企业信息和科技园区信息,所述科技园区信息包括园区企业、园区类型、园区位置和与园区关联的领域信息;
将所述科技匹配信息与企业信息和科技园区信息进行关联匹配以得到信息推荐列表,并根据所述信息推荐列表将所述科技成果信息推送至相应的企业或者园区。
2.如权利要求1所述的基于科技成果的数据处理推送方法,其特征在于,所述领域分类模型通过如下步骤构建完成:
接收历史科技信息,并对所述历史科技信息进行预处理操作以得到历史科技文本;
将所述历史科技文本转换为科技文本向量;
采用神经网络模型来对所述科技文本向量进行特征选择以得到第一科技特征;
基于所述第一科技特征采用随机梯度下降算法对训练所述神经网络模型,直至得到第二科技特征;
根据分类器对所述第二科技特征进行领域分类以确定文本分类结果,并完成领域分类模型的构建。
3.如权利要求1所述的基于科技成果的数据处理推送方法,其特征在于,所述神经网络模型为BP神经网络模型。
4.如权利要求1所述的基于科技成果的数据处理推送方法,其特征在于,所述对所述历史科技信息进行预处理操作,包括:
对所述历史科技信息与预先构建的词库中的词条根据预先设定的策略进行匹配以得到所述历史科技信息中的词语;
根据预先构建完成的停用词表和所述历史科技信息中的词语进行匹配,若匹配成功,则删除该词语;
计算得到的词语之间的关联强度,利用TextRank算法迭代算出词语的重要度得分,且每个词语采用数值向量形式来表示;
计算所述历史科技信息中两个词语之间的欧氏距离,当两者的欧氏距离小于预设数值时,则选择两者之一。
5.如权利要求1所述的基于科技成果的数据处理推送方法,其特征在于,所述企业信息包括与相应企业关联的文本信息,所述文本信息包括媒体报道信息、论文信息和专利文献信息;
在所述获取待评估的科技成果信息之后,还包括:
计算所述科技成果信息中每个词语的词频,以词语和词频作为项和支持度,用FP-Tree方法挖掘出与该科技成果信息相关度最高的前五项文本信息;
根据所述前五项文本信息确定与该文本信息对应的企业信息;并获取与该企业关联的全部的文本内容信息,且所述文本内容信息与企业具有一一对应的关系;
对相应的文本内容信息进行词语提取以得到该企业的知识词库;并扫描优化企业词库中的词表,用TF词频代替FP-tree算法中的支持度构建FP树以挖掘出具有实施领域的技术特征集合;
基于所述技术特征集合确定与科技成果信息相关的企业信息。
6.如权利要求1所述的基于科技成果的数据处理推送方法,其特征在于,所述数据处理推送方法,还包括:
获取电子商务网站上与科技成果相关的产品销售信息;
获取与产品销售信息关联的商家信息;
根据所述产品销售信息确定该相关产品的总营收;
将所述产品销售信息、商家信息和总营收与科技成果信息进行关联并推送至相应的企业或者园区。
7.如权利要求1所述的基于科技成果的数据处理推送方法,其特征在于,所述数据处理推送方法,还包括:
将与科技成果关联的企业信息或者园区信息推送至相应的用户。
8.一种基于科技成果的数据处理推送方法,其特征在于,包括:
第一获取模块:用于获取待评估的科技成果信息,并对所述科技成果信息进行数据处理以确定与科技成果相关的成果特征数据;
领域分类模块:用于根据构建完成的领域分类模型对所述成果特征数据进行分类以得到相应的领域分类结果,并将所述领域分类结果与成果特征数据进行关联以得到科技匹配信息;
第二获取模块:用于获取预先存储的企业信息和科技园区信息,所述科技园区信息包括园区企业、园区类型、园区位置和与园区关联的领域信息;
数据匹配模块:用于将所述科技匹配信息与企业信息和科技园区信息进行关联匹配以得到信息推荐列表,并根据所述信息推荐列表将所述科技成果信息推送至相应的企业或者园区。
9.一种电子设备,其特征在于,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1至7任一项所述的基于科技成果的数据处理推送方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1至7任一项所述的基于科技成果的数据处理推送方法。
CN202211674831.8A 2022-12-26 2022-12-26 基于科技成果的数据处理推送方法、装置及介质 Pending CN116089595A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211674831.8A CN116089595A (zh) 2022-12-26 2022-12-26 基于科技成果的数据处理推送方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211674831.8A CN116089595A (zh) 2022-12-26 2022-12-26 基于科技成果的数据处理推送方法、装置及介质

Publications (1)

Publication Number Publication Date
CN116089595A true CN116089595A (zh) 2023-05-09

Family

ID=86201784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211674831.8A Pending CN116089595A (zh) 2022-12-26 2022-12-26 基于科技成果的数据处理推送方法、装置及介质

Country Status (1)

Country Link
CN (1) CN116089595A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117670488A (zh) * 2024-01-31 2024-03-08 山东立信华创大数据科技有限公司 一种基于大数据的科技成果分析预测系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117670488A (zh) * 2024-01-31 2024-03-08 山东立信华创大数据科技有限公司 一种基于大数据的科技成果分析预测系统
CN117670488B (zh) * 2024-01-31 2024-04-16 山东立信华创大数据科技有限公司 一种基于大数据的科技成果分析预测系统

Similar Documents

Publication Publication Date Title
CN110889556B (zh) 一种企业经营风险特征数据信息提取方法和提取系统
CN111737495B (zh) 基于领域自分类的中高端人才智能推荐系统及其方法
WO2020249125A1 (zh) 用于自动训练机器学习模型的方法和系统
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN104111973B (zh) 一种学者重名的消歧方法及其系统
CN110990590A (zh) 一种基于强化学习和迁移学习的动态金融知识图谱构建方法
CN109345302A (zh) 机器学习模型训练方法、装置、存储介质和计算机设备
CN108132961B (zh) 一种基于引用预测的参考文献推荐方法
US11373424B1 (en) Document analysis architecture
CN113139141B (zh) 用户标签扩展标注方法、装置、设备及存储介质
CN104298778A (zh) 一种基于关联规则树的轧钢产品质量的预测方法及系统
US11620453B2 (en) System and method for artificial intelligence driven document analysis, including searching, indexing, comparing or associating datasets based on learned representations
CN114647741A (zh) 工艺自动决策和推理方法、装置、计算机设备及存储介质
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN110781297B (zh) 基于层次判别树的多标签科研论文的分类方法
CN116089595A (zh) 基于科技成果的数据处理推送方法、装置及介质
Han et al. DeepRouting: A deep neural network approach for ticket routing in expert network
Vilaysouk et al. Semisupervised machine learning classification framework for material intensity parameters of residential buildings
CN116401338A (zh) 一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法
CN110705889A (zh) 一种企业筛选方法、装置、设备及存储介质
Poornima et al. Prediction of water consumption using machine learning algorithm
CN115660695A (zh) 客服人员标签画像构建方法、装置、电子设备及存储介质
CN116108227A (zh) 科技成果转化运营数据信息展示方法及装置
Shaji et al. Weather Prediction Using Machine Learning Algorithms
TWI419071B (zh) Active knowledge management system, method and computer program product for problem solving

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication