CN111177372A - 一种科技成果的分类方法、装置、设备及介质 - Google Patents
一种科技成果的分类方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111177372A CN111177372A CN201911241011.8A CN201911241011A CN111177372A CN 111177372 A CN111177372 A CN 111177372A CN 201911241011 A CN201911241011 A CN 201911241011A CN 111177372 A CN111177372 A CN 111177372A
- Authority
- CN
- China
- Prior art keywords
- scientific
- information
- classification
- similarity
- technological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种科技成果的分类方法、装置、设备及介质。包括:获取科技成果信息以及客户信息;根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,根据比较结果对待计算信息对应的科技成果信息进行分类。本发明通过客户信息先对科技成果进行初步分类,然后通过词频算法计算出关键词作为最终类别,最后进行分类,节省运算资源,提高了分类效率以及分类准确性。
Description
技术领域
本发明涉及科技成果分类技术领域,尤其涉及一种科技成果的分类方法、装置、设备及介质。
背景技术
国家实施创新驱动发展战略,科技成果是衡量企业和科研院所创新能力的重要标准之一,但是目前突出存在着企业技术吸纳能力较低、产业技术创新基础薄弱,而来自高校、科研院所的大量科研成果往往无法转化、不能与产业发展的实际需求充分对接等问题,在技术转移对接时出现了科研人员的“技术”并不等于就是企业需要的“成果”、企业没将科研院所当作自己的研发中心、技术转移对接程度不高,高校、科研院所的科技成果无法迅速转化,企业的技术需求无法满足等情况,这种情况带来了重复科研现象,造成了严重的资源浪费。
因为不同的客户对于科技成果的要求也可能不同,要实现科技成果的精准推送就需要能够准确对科技成果进行识别和分类,但是现有的分类方法大都比较复杂,在提高分类精度的同时,要占用系统大量资源以及时间;而简单的分类方法,又无法提高精度,所以,亟需一种分类规则来提高分类精度的同时,降低分类的时间。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种科技成果的分类方法、装置、设备及介质,旨在解决现有技术无法在提科技成果分类精度的同时,降低分类时间的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种科技成果的分类方法,所述科技成果的分类方法包括以下步骤:
S1,获取科技成果信息以及客户信息;
S2,根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;
S3,建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。
在以上技术方案的基础上,优选的,步骤S1,获取科技成果信息,还包括以下步骤,所述科技成果信息包括:科技成果的类型以及科技成果的文本内容,所述科技成果的类型包括:专利、论文、期刊以及实物,客户信息包括:客户历史浏览文本内容信息以及历史浏览文本类型信息,所述文本类型信息包括:专利、论文、期刊以及实物。
在以上技术方案的基础上,优选的,步骤S2中,根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词,还包括以下步骤,根据客户历史浏览文本类型信息建立不同分类类别,根据科技成果的类型将各科技成果存入不同类别中,将各类别中的科技成果作为待计算信息,建立词频算法,通过该词频算法对客户历史浏览文本内容信息中的词语进行计算,根据计算结果确定分类关键词,并根据词频算法计算待计算信息的关键词。
在以上技术方案的基础上,优选的,建立词频算法,通过该词频算法对客户历史浏览文本内容信息中的词语进行计算,根据计算结果确定分类关键词,还包括以下步骤,将各词语的词频两两进行比较,筛选出词频最大的词语,将该词语作为分类关键词。
在以上技术方案的基础上,优选的,还包括以下步骤,所述词频算法为:
其中,W代表词频,m代表当前文本的总词语数量,a代表当前文本中出现该词语的次数,l代表文本总数,b代表出现该词语的文本数。
在以上技术方案的基础上,优选的,步骤S3中,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类,还包括以下步骤,当相似度大于相似度阈值时,根据该相似度对应的关键词建立对应类别,将该相似度对应的科技成果信息存入该类别中;当相似度小于相似度阈值时,选择新的相似度进行比较。
在以上技术方案的基础上,优选的,还包括以下步骤,所述语义相似度算法为:
其中,S(x1,x2)代表相似度,x1代表待计算信息的关键词,x2代表分类关键词,W1代表待计算信息的关键词的词频,W2代表分类关键词的词频,n代表待计算信息的关键词的数量,k代表当前待计算信息的关键词的索引下标。
更进一步优选的,所述科技成果的分类方法装置包括:
获取模块,用于获取科技成果信息以及客户信息;
分类规则建立模块,用于根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;
分类模块,用于建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。
第二方面,所述科技成果的分类方法还包括一种设备,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的科技成果的分类方法程序,所述科技成果的分类方法程序配置为实现如上文所述的科技成果的分类方法的步骤。
第三方面,所述科技成果的分类方法还包括一种介质,所述介质为计算机介质,所述计算机介质上存储有科技成果的分类方法程序,所述科技成果的分类方法程序被处理器执行时实现如上文所述的科技成果的分类方法的步骤。
本发明的一种科技成果的分类方法相对于现有技术具有以下有益效果:
(1)通过客户信息建立初步分类类别,根据该初步分类类别对科技成果进行初步分类,后续对一个类别的科技成果进行计算,避免了后续需要计算的数据过多,资源占用大,分类速度慢的情况;
(2)通过语义相似度算法对科技成果的关键词以及客户信息的关键词进行计算,根据客户信息的关键词确定分类的类别,利用语义相似度算法提高对科技成果分类的精确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例方案涉及的硬件运行环境的设备的结构示意图;
图2为本发明科技成果的分类方法第一实施例的流程示意图;
图3为本发明科技成果的分类方法第一实施例的功能模块示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,该设备可以包括:处理器1001,例如中央处理器(CentralProcessingUnit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对设备的限定,在实际应用中设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及科技成果的分类方法程序。
在图1所示的设备中,网络接口1004主要用于建立设备与存储科技成果的分类方法系统中所需的所有数据的服务器的通信连接;用户接口1003主要用于与用户进行数据交互;本发明科技成果的分类方法设备中的处理器1001、存储器1005可以设置在科技成果的分类方法设备中,所述科技成果的分类方法设备通过处理器1001调用存储器1005中存储的科技成果的分类方法程序,并执行本发明实施提供的科技成果的分类方法。
结合图2,图2为本发明科技成果的分类方法第一实施例的流程示意图。
本实施例中,所述科技成果的分类方法包括以下步骤:
S10:获取科技成果信息以及客户信息。
应当理解的是,所述科技成果信息包括:科技成果的类型以及科技成果的文本内容,所述科技成果的类型包括:专利、论文、期刊以及实物,客户信息包括:客户历史浏览文本内容信息以及历史浏览文本类型信息,所述文本类型信息包括:专利、论文、期刊以及实物。科技成果可以从论文发表网站、知识产权局官网等网站中获取,然后将重复的文章删除。
应当理解的是,因为客户的不同,所以对于科技成果的侧重点也可能不同,比如科研院的客户,可能侧重于专利、论文以及期刊,企业的客户可能侧重于专利、期刊以及实物。而且客户是与该科技成果平台建立合作关系的客户,系统会根据客户信息来不断更新分类的组别,当有新的科技成果需要分类时,系统会直接调用整理后的历史客户信息对这个新的科技成果进行分类。
S20:根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词。
应当理解的是,根据客户历史浏览文本类型信息建立不同分类类别,这些类别如:专利、论文、期刊以及实物,这是一个初步的分类,目的在于减少后期系统的计算量,然后根据科技成果的类型将各科技成果存入对应的类别中。
应当理解的是,系统会建立词频算法,词频算法是计算词频的算法,词频是一种用于情报检索与文本挖掘的常用加权技术,用以评估一个词对于一个文件或者一个语料库中的一个领域文件集的重复程度。
应当理解的是,通过词频算法,对客户历史浏览文本内容信息中的词语进行计算,可以确定出客户浏览文本的关键词,一篇文本信息中至少存在一个关键词,根据词频算法可以确定出多个关键词,在将重复的关键词删除之后,剩余的关键词即可作为分类的类别对科技成果进行分类。一个科技成果可能对应多个关键词,即多个类别中都可能出现这个科技成果。
应当理解的是,利用词频算法,还需要对专利、论文、期刊以及实物这4个类别中的科技成果进行计算,通过计算得到这些类别中科技成果的关键词,然后通过语义相似度算法来将这些关键词存入不同的类别中,完成最终的分类。
应当理解的是,所述词频算法为:
其中,W代表词频,m代表当前文本的总词语数量,a代表当前文本中出现该词语的次数,l代表文本总数,b代表出现该词语的文本数。
S30:建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。
应当理解的是,系统会设定相似度阈值,然后将相似度与相似度阈值进行比较,当相似度大于相似度阈值时,根据该相似度对应的关键词建立对应类别,将该相似度对应的科技成果信息存入该类别中;当相似度小于相似度阈值时,选择新的相似度进行比较。
应当理解的是,所述语义相似度算法为:
其中,S(x1,x2)代表相似度,x1代表待计算信息的关键词,x2代表分类关键词,W1代表待计算信息的关键词的词频,W2代表分类关键词的词频,n代表待计算信息的关键词的数量,k代表当前待计算信息的关键词的索引下标。
例如:对于一个计算机软件领域的科技成果,这个科技成果是一篇关于云计算的论文,系统在搜索到这个科技成果之后,会先将这个科技成果放入论文类别,然后通过词频计算这个论文的关键词,通过词频计算后,这篇论文的关键词是“计算机”,“软件”,“云计算”以及“大数据”,然后系统会通过语义相似度算法计算这篇论文各关键词与系统相应关键词类别的相似度,如果相似度大于相似度阈值,则将这篇论文存入对应的关键词类别;如果相似度小相似度阈值,则重新选择其他关键词的相似度进行比较。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例通过获取科技成果信息以及客户信息;根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。本实施例通过客户信息先对科技成果进行初步分类,然后通过词频算法计算出关键词作为最终类别,最后进行分类,节省运算资源,提高了分类效率以及分类准确性。
此外,本发明实施例还提出一种科技成果的分类方法装置。如图3所示,该科技成果的分类方法装置包括:获取模块10、分类规则建立模块20、分类模块30。
获取模块10,用于获取科技成果信息以及客户信息;
分类规则建立模块20,用于根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;
分类模块30,用于建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的科技成果的分类方法,此处不再赘述。
此外,本发明实施例还提出一种介质,所述介质为计算机介质,所述计算机介质上存储有科技成果的分类方法程序,所述科技成果的分类方法程序被处理器执行时实现如下操作:
S1,获取科技成果信息以及客户信息;
S2,根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;
S3,建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。
进一步地,所述科技成果的分类方法程序被处理器执行时还实现如下操作:
所述科技成果信息包括:科技成果的类型以及科技成果的文本内容,所述科技成果的类型包括:专利、论文、期刊以及实物,客户信息包括:客户历史浏览文本内容信息以及历史浏览文本类型信息,所述文本类型信息包括:专利、论文、期刊以及实物。
进一步地,所述科技成果的分类方法程序被处理器执行时还实现如下操作:
根据客户历史浏览文本类型信息建立不同分类类别,根据科技成果的类型将各科技成果存入不同类别中,将各类别中的科技成果作为待计算信息,建立词频算法,通过该词频算法对客户历史浏览文本内容信息中的词语进行计算,根据计算结果确定分类关键词,并根据词频算法计算待计算信息的关键词。
进一步地,所述科技成果的分类方法程序被处理器执行时还实现如下操作:
将各词语的词频两两进行比较,筛选出词频最大的词语,将该词语作为分类关键词。
进一步地,所述科技成果的分类方法程序被处理器执行时还实现如下操作:
所述词频算法为:
其中,W代表词频,m代表当前文本的总词语数量,a代表当前文本中出现该词语的次数,l代表文本总数,b代表出现该词语的文本数。
进一步地,所述科技成果的分类方法程序被处理器执行时还实现如下操作:
当相似度大于相似度阈值时,根据该相似度对应的关键词建立对应类别,将该相似度对应的科技成果信息存入该类别中;当相似度小于相似度阈值时,选择新的相似度进行比较。
进一步地,所述科技成果的分类方法程序被处理器执行时还实现如下操作:
所述语义相似度算法为:
其中,S(x1,x2)代表相似度,x1代表待计算信息的关键词,x2代表分类关键词,W1代表待计算信息的关键词的词频,W2代表分类关键词的词频,n代表待计算信息的关键词的数量,k代表当前待计算信息的关键词的索引下标。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种科技成果的分类方法,其特征在于:包括以下步骤;
S1,获取科技成果信息以及客户信息;
S2,根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;
S3,建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。
2.如权利要求1所述的科技成果的分类方法,其特征在于:步骤S1,获取科技成果信息,还包括以下步骤,所述科技成果信息包括:科技成果的类型以及科技成果的文本内容,所述科技成果的类型包括:专利、论文、期刊以及实物,客户信息包括:客户历史浏览文本内容信息以及历史浏览文本类型信息,所述文本类型信息包括:专利、论文、期刊以及实物。
3.如权利要求2所述的科技成果的分类方法,其特征在于:步骤S2中,根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词,还包括以下步骤,根据客户历史浏览文本类型信息建立不同分类类别,根据科技成果的类型将各科技成果存入不同类别中,将各类别中的科技成果作为待计算信息,建立词频算法,通过该词频算法对客户历史浏览文本内容信息中的词语进行计算,根据计算结果确定分类关键词,并根据词频算法计算待计算信息的关键词。
4.如权利要求3所述的科技成果的分类方法,其特征在于:建立词频算法,通过该词频算法对客户历史浏览文本内容信息中的词语进行计算,根据计算结果确定分类关键词,还包括以下步骤,将各词语的词频两两进行比较,筛选出词频最大的词语,将该词语作为分类关键词。
6.如权利要求4所述的科技成果的分类方法,其特征在于:步骤S3中,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类,还包括以下步骤,当相似度大于相似度阈值时,根据该相似度对应的关键词建立对应类别,将该相似度对应的科技成果信息存入该类别中;当相似度小于相似度阈值时,选择新的相似度进行比较。
8.一种科技成果的分类方法装置,其特征在于,所述科技成果的分类方法装置包括:
获取模块,用于获取科技成果信息以及客户信息;
分类规则建立模块,用于根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;
分类模块,用于建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。
9.一种设备,其特征在于,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的科技成果的分类方法程序,所述科技成果的分类方法程序配置为实现如权利要求1至7任一项所述的科技成果的分类方法的步骤。
10.一种介质,其特征在于,所述介质为计算机介质,所述计算机介质上存储有科技成果的分类方法程序,所述科技成果的分类方法程序被处理器执行时实现如权利要求1至7任一项所述的科技成果的分类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911241011.8A CN111177372A (zh) | 2019-12-06 | 2019-12-06 | 一种科技成果的分类方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911241011.8A CN111177372A (zh) | 2019-12-06 | 2019-12-06 | 一种科技成果的分类方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111177372A true CN111177372A (zh) | 2020-05-19 |
Family
ID=70655427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911241011.8A Pending CN111177372A (zh) | 2019-12-06 | 2019-12-06 | 一种科技成果的分类方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111177372A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307206A (zh) * | 2020-10-29 | 2021-02-02 | 青岛檬豆网络科技有限公司 | 一种关于新技术的领域分类方法 |
CN113610405A (zh) * | 2021-08-11 | 2021-11-05 | 国网河北省电力有限公司邢台市环城供电分公司 | 一种基于供电营销大数据建立供电服务风险预警系统和方法 |
CN114564444A (zh) * | 2022-02-24 | 2022-05-31 | 朗森特科技有限公司 | 一种利用二进制提取、识别、归类文件的系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2013156493A (ru) * | 2013-12-19 | 2015-06-27 | ООО "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи не зависящей от языка семантической структуры |
CN106815297A (zh) * | 2016-12-09 | 2017-06-09 | 宁波大学 | 一种学术资源推荐服务系统与方法 |
CN107357933A (zh) * | 2017-08-04 | 2017-11-17 | 刘应波 | 一种用于多源异构科技信息资源的标签描述方法和装置 |
CN109033212A (zh) * | 2018-07-01 | 2018-12-18 | 东莞市华睿电子科技有限公司 | 一种基于相似度匹配的文本分类方法 |
CN109543945A (zh) * | 2018-10-18 | 2019-03-29 | 平安科技(深圳)有限公司 | 企业创新评估方法及终端设备 |
-
2019
- 2019-12-06 CN CN201911241011.8A patent/CN111177372A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2013156493A (ru) * | 2013-12-19 | 2015-06-27 | ООО "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи не зависящей от языка семантической структуры |
CN106815297A (zh) * | 2016-12-09 | 2017-06-09 | 宁波大学 | 一种学术资源推荐服务系统与方法 |
CN107357933A (zh) * | 2017-08-04 | 2017-11-17 | 刘应波 | 一种用于多源异构科技信息资源的标签描述方法和装置 |
CN109033212A (zh) * | 2018-07-01 | 2018-12-18 | 东莞市华睿电子科技有限公司 | 一种基于相似度匹配的文本分类方法 |
CN109543945A (zh) * | 2018-10-18 | 2019-03-29 | 平安科技(深圳)有限公司 | 企业创新评估方法及终端设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307206A (zh) * | 2020-10-29 | 2021-02-02 | 青岛檬豆网络科技有限公司 | 一种关于新技术的领域分类方法 |
CN113610405A (zh) * | 2021-08-11 | 2021-11-05 | 国网河北省电力有限公司邢台市环城供电分公司 | 一种基于供电营销大数据建立供电服务风险预警系统和方法 |
CN114564444A (zh) * | 2022-02-24 | 2022-05-31 | 朗森特科技有限公司 | 一种利用二进制提取、识别、归类文件的系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11556572B2 (en) | Systems and methods for coverage analysis of textual queries | |
CN106844407B (zh) | 基于数据集相关性的标签网络产生方法和系统 | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
CN104077407B (zh) | 一种智能数据搜索系统及方法 | |
CN111177372A (zh) | 一种科技成果的分类方法、装置、设备及介质 | |
KR101505546B1 (ko) | 텍스트 마이닝을 이용한 키워드 도출 방법 | |
US11977567B2 (en) | Method of retrieving query, electronic device and medium | |
CN107885717B (zh) | 一种关键词提取方法及装置 | |
CN113836131A (zh) | 一种大数据清洗方法、装置、计算机设备及存储介质 | |
CN112328805A (zh) | 基于nlp的漏洞描述信息与数据库表的实体映射方法 | |
CN111400448A (zh) | 对象的关联关系分析方法及装置 | |
CN112506864B (zh) | 文件检索的方法、装置、电子设备及可读存储介质 | |
CN112148841B (zh) | 一种对象分类以及分类模型构建方法和装置 | |
CN111737607B (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN110852078A (zh) | 生成标题的方法和装置 | |
CN112926297B (zh) | 处理信息的方法、装置、设备和存储介质 | |
CN109918661A (zh) | 同义词获取方法及装置 | |
CN112528644B (zh) | 实体挂载的方法、装置、设备以及存储介质 | |
CN114528378A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN114445179A (zh) | 业务推荐方法、装置、电子设备和计算机可读介质 | |
CN112380342A (zh) | 一种电力文档主题提取方法及设备 | |
CN113656393B (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
CN110851560A (zh) | 信息检索方法、装置及设备 | |
CN112784007B (zh) | 文本匹配方法及装置、存储介质和计算机设备 | |
CN113177116B (zh) | 信息展示方法及装置、电子设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |