CN111177512A - 一种基于大数据的科技成果缺失处理方法及装置 - Google Patents

一种基于大数据的科技成果缺失处理方法及装置 Download PDF

Info

Publication number
CN111177512A
CN111177512A CN201911350931.3A CN201911350931A CN111177512A CN 111177512 A CN111177512 A CN 111177512A CN 201911350931 A CN201911350931 A CN 201911350931A CN 111177512 A CN111177512 A CN 111177512A
Authority
CN
China
Prior art keywords
information data
scientific
data
technological
technological achievement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911350931.3A
Other languages
English (en)
Inventor
马银波
邹腊年
郭玲琼
徐飞飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaoxing Shangyu District Institute Of Technology
Original Assignee
Shaoxing Shangyu District Institute Of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaoxing Shangyu District Institute Of Technology filed Critical Shaoxing Shangyu District Institute Of Technology
Priority to CN201911350931.3A priority Critical patent/CN111177512A/zh
Publication of CN111177512A publication Critical patent/CN111177512A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Abstract

本发明提出了一种基于大数据的科技成果缺失处理方法及装置。包括:获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据;根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据;建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。本发明通过对科技成果的各项数据信息进行检测,检测出不完整的科技成果信息,然后通过贝叶斯算法对不完整的科技成果信息,通过这样的方式,能够提高科技成果筛选的准确性,保证科技成果的完整性,减少资源的浪费。

Description

一种基于大数据的科技成果缺失处理方法及装置
技术领域
本发明涉及科技成果筛选技术领域,尤其涉及一种基于大数据的科技成果缺失处理方法及装置。
背景技术
现有系统在收集到很多科技成果之后,会对科技成果进行筛选,筛选的目的是为了提高之前收集存储的科技成果的可用性,更利用后期对科技成果进行分析,科技成果筛选包括科技成果抽取、科技成果清理以及科技成果载入三个部分。
科技成果清理是科技成果筛选过程中非常重要的一部分,科技成果清洗包含缺失科技成果处理、重复科技成果处理、异常科技成果处理以及不一致科技成果整理四部分,其中缺失科技成果处理是比较常见的情况,但是现有的缺失科技成果处理方法都是将缺失的科技成果直接删除或者通过人工补全缺失的科技成果,这样不仅会耗费大量人力资源,而且对于科技成果的准确性没有保障,所以,亟需一种缺失科技成果处理方法,能够自动处理缺失的科技成果,提高科技成果筛选的准确性,减少资源的浪费。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于大数据的科技成果缺失处理方法及装置,旨在解决现有技术无法自动处理缺失的科技成果,提高科技成果筛选的准确性,减少资源的浪费的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于大数据的科技成果缺失处理方法,所述基于大数据的科技成果缺失处理方法包括以下步骤:
S1,获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据;
S2,根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据;
S3,建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。
在以上技术方案的基础上,优选的,步骤S1中,获取科技成果各项信息数据,还包括以下步骤,所述科技成果各项信息数据包括:名称信息、作者信息、时间信息以及内容信息。
在以上技术方案的基础上,优选的,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据,还包括以下步骤,设定数据完整性格式,根据数据完整性格式对各项信息数据的完整性进行检测,当检测到信息数据不完整时,将该信息数据作为待补全信息数据;当检测到信息数据完整时,将该信息数据作为完整信息数据。
在以上技术方案的基础上,优选的,步骤S2中,根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据,还包括以下步骤,根据完整信息数据获取科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据,根据数据完整性格式对样本信息数据的完整性进行检测,当检测到样本信息数据为完整数据时,保留样本信息数据;当检测到样本信息数据不为完整数据时,重新获取科技成果。
在以上技术方案的基础上,优选的,步骤S3中,建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全,还包括以下步骤,建立贝叶斯算法,设定匹配度阈值,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,将计算结果与匹配度阈值进行比较,当计算结果大于匹配度阈值时,根据计算结果对应的样本信息数据对科技成果信息数据进行补全;当计算结果小于匹配度阈值时,重新选择样本信息数据进行计算。
在以上技术方案的基础上,优选的,所述贝叶斯算法为:
Figure BDA0002334649970000031
其中,P(yj|x)代表后验概率,P(x|yj)代表似然函数,P(yj)代表先验概率,x代表样本信息数据,yj代表待补全信息数据,j代表待补全信息数据的索引下标,n代表待补全信息数据的数量。
在以上技术方案的基础上,优选的,当计算结果大于匹配度阈值时,根据计算结果对应的样本信息数据对科技成果信息数据进行补全之后,还包括以下步骤,根据数据完整性格式对补全后的科技成果各项信息数据进行检测,当检测到补全后的科技成果各项信息数据完整时,存储该补全后的科技成果;当检测到补全后的科技成果各项信息数据不完整时,获取不完整的信息数据进行补全。
更进一步优选的,所述基于大数据的科技成果缺失处理装置包括:
获取模块,用于获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据;
提取模块,用于根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据;
科技成果补全模块,用于建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。
第二方面,所述基于大数据的科技成果缺失处理方法还包括一种设备,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于大数据的科技成果缺失处理方法程序,所述基于大数据的科技成果缺失处理方法程序配置为实现如上文所述的基于大数据的科技成果缺失处理方法的步骤。
第三方面,所述基于大数据的科技成果缺失处理方法还包括一种介质,所述介质为计算机介质,所述计算机介质上存储有基于大数据的科技成果缺失处理方法程序,所述基于大数据的科技成果缺失处理方法程序被处理器执行时实现如上文所述的基于大数据的科技成果缺失处理方法的步骤。
本发明的一种基于大数据的科技成果缺失处理方法相对于现有技术具有以下有益效果:
(1)通过对科技成果的各项信息数据进行检测,能够提前确定需要进行补全的科技成果,然后对科技成果进行多次检测,能够有效在科技成果清理这一步来提高科技成果的完整性,保证科技成果筛选能够完整进行,提高科技成果筛选的准确性;
(2)通过建立贝叶斯算法,能够精确计算出样本信息数据以及待补全信息数据之间的匹配度,根据匹配度能够精确找到与待补全信息数据形同的信息数据来进行补全,提高了科技成果筛选的准确性,同时也保证了科技成果的完整性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例方案涉及的硬件运行环境的设备的结构示意图;
图2为本发明基于大数据的科技成果缺失处理方法第一实施例的流程示意图;
图3为本发明基于大数据的科技成果缺失处理方法第一实施例的功能模块示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,该设备可以包括:处理器1001,例如中央处理器(Central ProcessingUnit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对设备的限定,在实际应用中设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于大数据的科技成果缺失处理方法程序。
在图1所示的设备中,网络接口1004主要用于建立设备与存储基于大数据的科技成果缺失处理方法系统中所需的所有数据的服务器的通信连接;用户接口1003主要用于与用户进行数据交互;本发明基于大数据的科技成果缺失处理方法设备中的处理器1001、存储器1005可以设置在基于大数据的科技成果缺失处理方法设备中,所述基于大数据的科技成果缺失处理方法设备通过处理器1001调用存储器1005中存储的基于大数据的科技成果缺失处理方法程序,并执行本发明实施提供的基于大数据的科技成果缺失处理方法。
结合图2,图2为本发明基于大数据的科技成果缺失处理方法第一实施例的流程示意图。
本实施例中,所述基于大数据的科技成果缺失处理方法包括以下步骤:
S10:获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据。
应当理解的是,系统获取的科技成果各项信息数据包括:名称信息、作者信息、时间信息以及内容信息,获取这些信息有助于系统能加快速找到存在缺失的科技成果对应的科技成果,提高科技成果信息数据补全的速度。
应当理解的是,系统会设定完整的数据格式,用于检测科技成果各项信息数据的完整性,凡是科技成果的各项信息数据出现如下情况:信息缺少以及信息模糊,都会被定义为不完整的科技成果信息数据,所以,系统会根据这个设定好的完整的数据格式对每个科技成果进行筛选,选出完整信息数据以及不完整的信息数据,将不完整的信息数据作为待补全信息数据。
S20:根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据。
应当理解的是,系统在分出完整信息数据以及待补全信息数据之后,会根据完整信息数据从网络爬取对应的科技成果作为样本科技成果,如果完整信息数据越多,获取的对应的科技成果也就越准确,如果完整信息比较少,则爬取到对应的科技成果也就越多,准确性就越低。
应当理解的是,系统在爬取到对应的样本科技成果之后,还是会根据完整的数据格式对样本科技成果各项样本信息数据进行检测,这一步的目的是为了防止获取的样本科技成果也存在信息缺失的情况,无法补全待补全科技成果信息数据。
S30:建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。
应当理解的是,系统会建立贝叶斯算法,然后设定匹配度阈值,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,将计算结果与匹配度阈值进行比较,当计算结果大于匹配度阈值时,根据计算结果对应的样本信息数据对科技成果信息数据进行补全;当计算结果小于匹配度阈值时,重新选择样本信息数据进行计算。
应当理解的是,所述贝叶斯算法为:
Figure BDA0002334649970000071
其中,P(yj|x)代表后验概率,即条件x下yj发生的概率,也是样本信息数据以及待补全信息数据的匹配度,P(x|yj)代表似然函数,即条件yj下x发生的概率,P(yj)代表先验概率,即yj发生的概率,x代表样本信息数据,yj代表待补全信息数据,j代表待补全信息数据的索引下标,n代表待补全信息数据的数量。
应当理解的是,在系统将待补全数据补全之后,系统还会对这个科技成果进行再一次的检测,以确保这个科技成果的各项信息数据都完整了,如果检测结果是这个科技成果的各项信息数据都完整了,那么系统会将这个科技成果保留起来,用于接下来的科技成果筛选;如果检测结果是这个科技成果的各项信息数据还存在有缺失的信息数据,系统则会重新对这个科技成果缺失的信息数据进行补全。通过这种方式,在进行数据筛选,对缺失的科技成果进行补全,能够提高最后科技成果筛选的准确度,避免后续科技筛选的资源消耗,提高筛选效率。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例通过获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据;根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据;建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。本发明通过对科技成果的各项数据信息进行检测,检测出不完整的科技成果信息,然后通过贝叶斯算法对不完整的科技成果信息,通过这样的方式,能够提高科技成果筛选的准确性,保证科技成果的完整性,减少资源的浪费。
此外,本发明实施例还提出一种基于大数据的科技成果缺失处理装置。如图3所示,该基于大数据的科技成果缺失处理装置包括:获取模块10、提取模块20、科技成果补全模块30。
获取模块10,用于获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据;
提取模块20,用于根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据;
科技成果补全模块30,用于建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于大数据的科技成果缺失处理方法,此处不再赘述。
此外,本发明实施例还提出一种介质,所述介质为计算机介质,所述计算机介质上存储有基于大数据的科技成果缺失处理方法程序,所述基于大数据的科技成果缺失处理方法程序被处理器执行时实现如下操作:
S1,获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据;
S2,根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据;
S3,建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。
进一步地,所述基于大数据的科技成果缺失处理方法程序被处理器执行时还实现如下操作:
所述科技成果各项信息数据包括:名称信息、作者信息、时间信息以及内容信息。
进一步地,所述基于大数据的科技成果缺失处理方法程序被处理器执行时还实现如下操作:
设定数据完整性格式,根据数据完整性格式对各项信息数据的完整性进行检测,当检测到信息数据不完整时,将该信息数据作为待补全信息数据;当检测到信息数据完整时,将该信息数据作为完整信息数据。
进一步地,所述基于大数据的科技成果缺失处理方法程序被处理器执行时还实现如下操作:
根据完整信息数据获取科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据,根据数据完整性格式对样本信息数据的完整性进行检测,当检测到样本信息数据为完整数据时,保留样本信息数据;当检测到样本信息数据不为完整数据时,重新获取科技成果。
进一步地,所述基于大数据的科技成果缺失处理方法程序被处理器执行时还实现如下操作:
建立贝叶斯算法,设定匹配度阈值,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,将计算结果与匹配度阈值进行比较,当计算结果大于匹配度阈值时,根据计算结果对应的样本信息数据对科技成果信息数据进行补全;当计算结果小于匹配度阈值时,重新选择样本信息数据进行计算。
进一步地,所述基于大数据的科技成果缺失处理方法程序被处理器执行时还实现如下操作:
所述贝叶斯算法为:
Figure BDA0002334649970000091
其中,P(yj|x)代表后验概率,P(x|yj)代表似然函数,P(yj)代表先验概率,x代表样本信息数据,yj代表待补全信息数据,j代表待补全信息数据的索引下标,n代表待补全信息数据的数量。
进一步地,所述基于大数据的科技成果缺失处理方法程序被处理器执行时还实现如下操作:
根据数据完整性格式对补全后的科技成果各项信息数据进行检测,当检测到补全后的科技成果各项信息数据完整时,存储该补全后的科技成果;当检测到补全后的科技成果各项信息数据不完整时,获取不完整的信息数据进行补全。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于大数据的科技成果缺失处理方法,其特征在于:包括以下步骤;
S1,获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据;
S2,根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据;
S3,建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。
2.如权利要求1所述的基于大数据的科技成果缺失处理方法,其特征在于:步骤S1中,获取科技成果各项信息数据,还包括以下步骤,所述科技成果各项信息数据包括:名称信息、作者信息、时间信息以及内容信息。
3.如权利要求2所述的基于大数据的科技成果缺失处理方法,其特征在于:对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据,还包括以下步骤,设定数据完整性格式,根据数据完整性格式对各项信息数据的完整性进行检测,当检测到信息数据不完整时,将该信息数据作为待补全信息数据;当检测到信息数据完整时,将该信息数据作为完整信息数据。
4.如权利要求3所述的基于大数据的科技成果缺失处理方法,其特征在于:步骤S2中,根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据,还包括以下步骤,根据完整信息数据获取科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据,根据数据完整性格式对样本信息数据的完整性进行检测,当检测到样本信息数据为完整数据时,保留样本信息数据;当检测到样本信息数据不为完整数据时,重新获取科技成果。
5.如权利要求4所述的基于大数据的科技成果缺失处理方法,其特征在于:步骤S3中,建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全,还包括以下步骤,建立贝叶斯算法,设定匹配度阈值,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,将计算结果与匹配度阈值进行比较,当计算结果大于匹配度阈值时,根据计算结果对应的样本信息数据对科技成果信息数据进行补全;当计算结果小于匹配度阈值时,重新选择样本信息数据进行计算。
6.如权利要求5所述的基于大数据的科技成果缺失处理方法,其特征在于:还包括以下步骤,所述贝叶斯算法为:
Figure FDA0002334649960000021
其中,P(yj|x)代表后验概率,P(x|yj)代表似然函数,P(yj)代表先验概率,x代表样本信息数据,yj代表待补全信息数据,j代表待补全信息数据的索引下标,n代表待补全信息数据的数量。
7.如权利要求5所述的基于大数据的科技成果缺失处理方法,其特征在于:当计算结果大于匹配度阈值时,根据计算结果对应的样本信息数据对科技成果信息数据进行补全之后,还包括以下步骤,根据数据完整性格式对补全后的科技成果各项信息数据进行检测,当检测到补全后的科技成果各项信息数据完整时,存储该补全后的科技成果;当检测到补全后的科技成果各项信息数据不完整时,获取不完整的信息数据进行补全。
8.一种基于大数据的科技成果缺失处理装置,其特征在于,所述基于大数据的科技成果缺失处理装置包括:
获取模块,用于获取科技成果各项信息数据,对各项信息数据进行检测,根据检测结果将科技成果各项信息数据分为完整信息数据以及待补全信息数据;
提取模块,用于根据完整信息数据获取相关的样本科技成果,根据待补全信息数据从样本科技成果中提取对应的样本信息数据;
科技成果补全模块,用于建立贝叶斯算法,根据贝叶斯算法对样本信息数据以及待补全信息数据进行计算,根据计算结果对待补全科技成果信息数据进行补全。
9.一种设备,其特征在于,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于大数据的科技成果缺失处理方法程序,所述基于大数据的科技成果缺失处理方法程序配置为实现如权利要求1至7任一项所述的基于大数据的科技成果缺失处理方法的步骤。
10.一种介质,其特征在于,所述介质为计算机介质,所述计算机介质上存储有基于大数据的科技成果缺失处理方法程序,所述基于大数据的科技成果缺失处理方法程序被处理器执行时实现如权利要求1至7任一项所述的基于大数据的科技成果缺失处理方法的步骤。
CN201911350931.3A 2019-12-24 2019-12-24 一种基于大数据的科技成果缺失处理方法及装置 Pending CN111177512A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911350931.3A CN111177512A (zh) 2019-12-24 2019-12-24 一种基于大数据的科技成果缺失处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911350931.3A CN111177512A (zh) 2019-12-24 2019-12-24 一种基于大数据的科技成果缺失处理方法及装置

Publications (1)

Publication Number Publication Date
CN111177512A true CN111177512A (zh) 2020-05-19

Family

ID=70658168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911350931.3A Pending CN111177512A (zh) 2019-12-24 2019-12-24 一种基于大数据的科技成果缺失处理方法及装置

Country Status (1)

Country Link
CN (1) CN111177512A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120016875A1 (en) * 2010-07-16 2012-01-19 International Business Machines Corporation Personalized data search utilizing social activities
US20130036082A1 (en) * 2011-08-05 2013-02-07 International Business Machines Corporation Multiple imputation of missing data in multi-dimensional retail sales data sets via tensor factorization
CN104392400A (zh) * 2014-12-10 2015-03-04 国家电网公司 一种电力营销缺失数据补全方法
CN106708929A (zh) * 2016-11-18 2017-05-24 广州视源电子科技股份有限公司 视频节目的搜索方法和装置
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN110570229A (zh) * 2019-07-30 2019-12-13 平安科技(深圳)有限公司 用户信息处理方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120016875A1 (en) * 2010-07-16 2012-01-19 International Business Machines Corporation Personalized data search utilizing social activities
US20130036082A1 (en) * 2011-08-05 2013-02-07 International Business Machines Corporation Multiple imputation of missing data in multi-dimensional retail sales data sets via tensor factorization
CN104392400A (zh) * 2014-12-10 2015-03-04 国家电网公司 一种电力营销缺失数据补全方法
CN106708929A (zh) * 2016-11-18 2017-05-24 广州视源电子科技股份有限公司 视频节目的搜索方法和装置
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN110570229A (zh) * 2019-07-30 2019-12-13 平安科技(深圳)有限公司 用户信息处理方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张晓飞;余建桥;: "基于用户兴趣模型构建与个性化搜索算法研究" *

Similar Documents

Publication Publication Date Title
CN110472082B (zh) 数据处理方法、装置、存储介质及电子设备
US9176043B2 (en) Cell image analysis apparatus, cell image analysis method, and program
CN111598827A (zh) 外观瑕疵检测方法、电子装置及存储介质
CN111291572A (zh) 一种文字排版方法、装置及计算机可读存储介质
CN110807548A (zh) 基于风电竞价用户的数据采集方法、装置、设备及介质
CN111400448A (zh) 对象的关联关系分析方法及装置
EP3564833B1 (en) Method and device for identifying main picture in web page
CN111177512A (zh) 一种基于大数据的科技成果缺失处理方法及装置
CN114155547B (zh) 一种图表识别方法、装置、设备及存储介质
CN114785616A (zh) 数据风险检测方法、装置、计算机设备及存储介质
CN114201999A (zh) 异常账号的识别方法、系统、计算设备及存储介质
CN115665286B (zh) 接口聚类方法、装置、计算机设备及存储介质
CN109241428B (zh) 用户性别的确定方法、装置、服务器及存储介质
CN112560992B (zh) 优化图片分类模型的方法、装置、电子设备及存储介质
CN110717503A (zh) 一种分类方法、装置、电子设备及计算机存储介质
CN114860847B (zh) 应用于大数据平台的数据链路处理方法、系统及介质
CN110781973B (zh) 物品识别模型训练方法、物品识别方法、装置及电子设备
CN109344132B (zh) 用户信息的合并方法、计算机可读存储介质及终端设备
CN107451180B (zh) 识别站点同源关系的方法、装置、设备和计算机存储介质
CN114679558A (zh) 基于应用操作的防欺诈处理方法、装置、电子设备及介质
CN116935365A (zh) 一种基因芯片的识别方法、装置、设备及存储介质
CN113867785A (zh) 一种数据筛选方法及相关装置
CN113672444A (zh) 一种芯片检测数据采集方法
CN116664427A (zh) 一种图像处理方法、装置、设备及存储介质
CN101329730B (zh) 符号影像辨识方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination