CN113360776A - 基于跨表数据挖掘的科技资源推荐方法 - Google Patents

基于跨表数据挖掘的科技资源推荐方法 Download PDF

Info

Publication number
CN113360776A
CN113360776A CN202110814971.XA CN202110814971A CN113360776A CN 113360776 A CN113360776 A CN 113360776A CN 202110814971 A CN202110814971 A CN 202110814971A CN 113360776 A CN113360776 A CN 113360776A
Authority
CN
China
Prior art keywords
document
data
vocabulary
topic
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110814971.XA
Other languages
English (en)
Other versions
CN113360776B (zh
Inventor
肖国强
唐小琴
王晓蒙
吴松
程天宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University
Original Assignee
Southwest University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University filed Critical Southwest University
Priority to CN202110814971.XA priority Critical patent/CN113360776B/zh
Publication of CN113360776A publication Critical patent/CN113360776A/zh
Application granted granted Critical
Publication of CN113360776B publication Critical patent/CN113360776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于跨表数据挖掘的科技资源推荐方法,该方法通过前期数据语义分析,挖掘跨表数据或多对象属性之间的相关性,确定用于NLP主题模型的输入数据字段,在一定程度上优化了多对象之间的数据交流模式;通过采用的神经网络主题模型结构简洁,且无需先验假设,通过训练可获得质量更高的主题表示;通对多对象推荐结果根据推荐指数和对象种类,进行不同大小和颜色的图模型展示及可视化,可实现推荐结果的直观、有效、合理显示,提升用户体验。

Description

基于跨表数据挖掘的科技资源推荐方法
技术领域
本发明涉及一种基于跨表数据挖掘的科技资源推荐方法。
背景技术
科技资源在国民经济发展中愈发重要,在科技活动中的共享和利用程度也得到相关部门和企业的高度重视,资源的多维大数据特征得以突显。
科技资源具有领域性强、数据分散、地域性强的特点,当前的通用性推荐算法(如用户行为分析、协同过滤技术等)在实际的资源共享平台中的应用效果不佳,资源推荐准确率偏低。隐语义分析技术是一种基于机器学习的一系列方法,具有比较好的理论基础,目前部分算法在推荐系统中已经得到应用和肯定。但是,目前的推荐方法均不能进行跨表数据挖掘,从而实现基于多维度数据向企业准确推荐科技资源。
发明内容
本发明的目的是提供一种基于跨表数据挖掘的科技资源推荐方法,能够为企业自动推荐科技资源。
为解决上述技术问题,本发明提供一种基于跨表数据挖掘的科技资源推荐方法,包括步骤:
S1:构建包括企业、人才、项目、平台和仪器设备属性数据的对象表,选取与对象表中各对象属性相关性最高的关联对象作为跨表数据交流的信息通道;
S2:从所述对象表中提取与关联对象的属性数据对应的属性数据,并根据提取出的属性数构建NLP主题模型形成文档数据;
S3:对所述文档数据进行分词处理,然后将分词后的文档数据输入创建好的神经网络主题模型NTM进行训练,求得文档-主题分布θ和主题-词汇分布
Figure BDA0003169698400000021
及对应的权重矩阵Wθ
Figure BDA0003169698400000022
并生成隐含层对应每个主题下的词汇集及其出现概率;
S4:通过训练好的主题-词汇分布
Figure BDA0003169698400000023
求出与用户搜索的关键词匹配度最高的主题t*;再根据要求返回的对象,计算主题t*对应词汇集
Figure BDA0003169698400000028
出现在每个对象文档数据d的概率
Figure BDA0003169698400000029
然后对计算结果进行从大到小排序后将对应的对象ID作为推荐系数返回给企业用户。
进一步地,所述步骤S2具体包括:提取企业-业务范围数据、项目-名称数据、人才-熟悉学科数据、仪器设备-主要功能数据和平台-研究方向数据输入NLP主题模型形成文档数据;其中,每个记录或样本对应的数据定义为一个文档d={d1,d2,...dN},N表示文档总数。
进一步地,所述步骤S3具体包括:
S31:对文档d进行n-gram分词得到词汇g,构建神经网络主题模型NTM,并将每个文档d及其n-gram词汇g作为神经网络主题模型NTM的输入层;
S32:添加n-gram词向量层,定义词向量维度为300,将每个词汇g转换成数字向量le(g)进行表示;
S33:创建文档-主题分布θ和主题-词汇分布
Figure BDA00031696984000000210
的两个隐含层ld(d)和lt(g),主题数量为K;其中,ld(d)=softmax(Wθ(d)),
Figure BDA0003169698400000024
其中权重矩阵Wθ表示N个文档向量在K个主题上的分布,即Wθ∈RN×K,Wθ(d)为文档d的权重矩阵;
Figure BDA0003169698400000025
表示主题-词汇层K个主题与词向量层300维词向量之间的权重矩阵,故
Figure BDA0003169698400000026
因文档主题个数为K,则ld和lt均是一个K维向量;模型输出为文档d关于词汇g的分布概率
Figure BDA0003169698400000027
S34:将步骤S31中每个样本数据(d,g),和通过统计标注获得的每个词汇g在文档d中出现的概率p(g|d)分别作为神经网络主题模型NTM的输入和输出进行训练,获得文档-主题分布θ和主题-词汇分布
Figure BDA0003169698400000031
以及对应的权重矩阵Wθ
Figure BDA0003169698400000032
进一步地,所述步骤S31中,文档集d采用unigram和bigrams模型生成词汇集g={g1,g2,...gV},V表示文档的词汇数量。
进一步地,该方法还包括:
S5:采用图结构对步骤S4得到的推荐结果进行可视化。
进一步地,所述步骤S5具体包括:
S51:依据步骤3的推荐指数
Figure BDA0003169698400000033
对图节点的大小进行定义,使推荐指数高的对象在图空间的节点面积最大,且距离图空间中该公司节点最近。
进一步地,所述步骤S5还包括:
S52:采用不同的颜色对不同对象进行区分和可视化。
本发明的有益效果为:通过前期数据语义分析,挖掘跨表数据或多对象属性之间的相关性,确定用于NLP主题模型的输入数据字段,在一定程度上优化了多对象之间的数据交流模式;在采用多对象联合推荐技术推荐适合企业发展的科技项目,并为该项目准确推荐多种合适的科技资源如人才、仪器设备等。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为基于跨表数据挖掘的科技资源推荐方法实施方案;
图2为面向企业的科技资源数据表达与挖掘方法示意图;
图3为神经网络主题模型构建方法。
具体实施方式
如图1所示的基于跨表数据挖掘的科技资源推荐方法,该方法包括步骤:
S1:构建包括企业、人才、项目、平台和仪器设备属性数据的对象表,选取与对象表中各对象属性相关性最高的关联对象作为跨表数据交流的信息通道;
S2:从所述对象表中提取与关联对象的属性数据对应的属性数据,并根据提取出的属性数构建NLP主题模型形成文档数据;
S3:对所述文档数据进行分词处理,然后将分词后的文档数据输入创建好的神经网络主题模型NTM进行训练,求得文档-主题分布θ和主题-词汇分布
Figure BDA0003169698400000041
及对应的权重矩阵Wθ
Figure BDA0003169698400000042
并生成隐含层对应每个主题下的词汇集及其出现概率;
S4:通过训练好的主题-词汇分布
Figure BDA0003169698400000043
求出与用户搜索的关键词匹配度最高的主题t*;再根据要求返回的对象,计算主题t*对应词汇集
Figure BDA0003169698400000044
出现在每个对象文档数据d的概率
Figure BDA0003169698400000045
然后对计算结果进行从大到小排序后将对应的对象ID作为推荐系数返回给企业用户。
本发明通过前期数据语义分析,挖掘跨表数据或多对象属性之间的相关性,确定用于NLP主题模型的输入数据字段,在一定程度上优化了多对象之间的数据交流模式;在采用多对象联合推荐技术推荐适合企业发展的科技项目,并为该项目准确推荐多种合适的科技资源如人才、仪器设备等。
根据本申请的一个实施例,所述步骤S2具体包括:提取企业-业务范围数据、项目-名称数据、人才-熟悉学科数据、仪器设备-主要功能数据和平台-研究方向数据输入NLP主题模型形成文档数据;其中,每个记录或样本对应的数据定义为一个文档d={d1,d2,...dN},N表示文档总数。跨表数据包含企业、项目、人才、平台和仪器设备5种对象及其属性数据,通常这些属性对于不同的需求,其重要性和价值有所不同,附图2展示了各对象的部分属性。针对科技资源推荐应用场景,各资源数据的相关性主要体现在专业方向和实用价值方面,故定义一个用于关联多种数据对象的语义概念“研究方向”。随后,从每个数据对象表中选择与该语义概念最匹配的属性作为跨表数据交流的信息通道,并将该表中该属性对应的数据用于构建NLP主题模型。拟选择的对象属性包括:企业-“业务范围”、项目-“名称”、人才-“熟悉学科”、仪器设备-“主要功能”和平台-“研究方向”。
根据本申请的一个实施例,所述步骤S3具体包括:
S31:对文档集d进行n-gram分词得到词汇g,并将每个文档d及其n-gram词汇g作为神经网络主题模型NTM的输入层;
S32:添加n-gram词向量层,定义词向量维度为300,将每个词汇g转换成数字向量le(g)进行表示;通过实现文本数据的量化表示,提高文本数据的可运算性和可操作性。
S33:创建文档-主题分布θ和主题-词汇分布
Figure BDA0003169698400000057
的两个隐含层ld(d)和lt(g),主题数量为K;不同于传统概率主题模型,NTM无需指定先验分布,而是分别采用神经网络常用的softmax和sigmoid函数从权重矩阵中生隐含层ld和lt,即:ld(d)=softmax(Wθ(d)),
Figure BDA0003169698400000051
其中权重矩阵Wθ表示N个文档向量在K个主题上的分布,即Wθ∈RN×K,Wθ(d)为文档d的权重矩阵。
Figure BDA0003169698400000052
表示主题-词汇层K个主题与词向量层300维词向量之间的权重矩阵,故
Figure BDA0003169698400000053
因文档主题个数为K,则ld和lt均是一个K维向量。模型输出为文档d关于词汇g的分布概率
Figure BDA0003169698400000056
S34:将步骤S31中每个样本数据(d,g),和通过统计标注获得的每个词汇g在文档d中出现的概率p(g|d)分别作为神经网络主题模型NTM的输入和输出进行训练,获得文档-主题分布θ和主题-词汇分布
Figure BDA0003169698400000054
以及对应的权重矩阵Wθ
Figure BDA0003169698400000055
通过训练隐含层的主题模型,生成同一主题下语义信息相似的词汇gt,且这些词汇隶属于该主题的概率
Figure BDA0003169698400000061
最大,如人才对象表中的以下词汇隶属于同一主题:{模式,识别,图像,处理,人工,智能,系统,计算机,机器,学习,深度}。
根据本申请的一个实施例,所述步骤S31中,文档集d采用unigram和bigrams模型生成词汇集g={g1,g2,...gV},V表示文档的词汇数量。
根据本申请的一个实施例,该方法还包括:
S5:采用图结构对步骤S4得到的推荐结果进行可视化。
根据本申请的一个实施例,所述步骤S5具体包括:
S51:依据步骤3的推荐指数
Figure BDA0003169698400000062
对图节点的大小进行定义,使推荐指数高的对象在图空间的节点面积最大,且距离图空间中该公司节点最近。
根据本申请的一个实施例,所述步骤S5还包括:
S52:采用不同的颜色对不同对象进行区分和可视化。
本申请通过根据推荐指数和对象种类,进行不同大小和颜色的图模型展示及可视化,可实现推荐结果的直观、有效、合理显示,提升用户体验。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (7)

1.一种基于跨表数据挖掘的科技资源推荐方法,其特征在于,包括步骤:
S1:构建包括企业、人才、项目、平台和仪器设备属性数据的对象表,选取与对象表中各对象属性相关性最高的关联对象作为跨表数据交流的信息通道;
S2:从所述对象表中提取与关联对象的属性数据对应的属性数据,并根据提取出的属性数构建NLP主题模型形成文档数据;
S3:对所述文档数据进行分词处理,然后将分词后的文档数据输入创建好的神经网络主题模型NTM进行训练,求得文档-主题分布θ和主题-词汇分布
Figure FDA0003169698390000011
及对应的权重矩阵Wθ
Figure FDA0003169698390000012
并生成隐含层对应每个主题下的词汇集及其出现概率;
S4:通过训练好的主题-词汇分布
Figure FDA0003169698390000013
求出与用户搜索的关键词匹配度最高的主题t*;再根据要求返回的对象,计算主题t*对应词汇集
Figure FDA0003169698390000014
出现在每个对象文档数据d的概率
Figure FDA0003169698390000015
然后对计算结果进行从大到小排序后将对应的对象ID作为推荐系数返回给企业用户。
2.根据权利要求1所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S2具体包括:提取企业-业务范围数据、项目-名称数据、人才-熟悉学科数据、仪器设备-主要功能数据和平台-研究方向数据输入NLP主题模型形成文档数据;其中,每个记录或样本对应的数据定义为一个文档d={d1,d2,...dN},N表示文档总数。
3.根据权利要求1所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S3具体包括:
S31:对文档d进行n-gram分词得到词汇g,构建神经网络主题模型NTM,并将每个文档d及其n-gram词汇g作为神经网络主题模型NTM的输入层;
S32:添加n-gram词向量层,定义词向量维度为300,将每个词汇g转换成数字向量le(g)进行表示;
S33:创建文档-主题分布θ和主题-词汇分布
Figure FDA0003169698390000028
的两个隐含层ld(d)和lt(g),主题数量为K;其中,
Figure FDA0003169698390000021
其中权重矩阵Wθ表示N个文档向量在K个主题上的分布,即Wθ∈RN×K,Wθ(d)为文档d的权重矩阵;
Figure FDA0003169698390000022
表示主题-词汇层K个主题与词向量层300维词向量之间的权重矩阵,故
Figure FDA0003169698390000023
因文档主题个数为K,则ld和lt均是一个K维向量;模型输出为文档d关于词汇g的分布概率
Figure FDA0003169698390000024
S34:将步骤S31中每个样本数据(d,g),和通过统计标注获得的每个词汇g在文档d中出现的概率p(g|d)分别作为神经网络主题模型NTM的输入和输出进行训练,获得文档-主题分布θ和主题-词汇分布
Figure FDA0003169698390000025
以及对应的权重矩阵Wθ
Figure FDA0003169698390000026
4.根据权利要求3所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S31中,文档集d采用unigram和bigrams模型生成词汇集g={g1,g2,...gV},V表示文档的词汇数量。
5.根据权利要求1所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,该方法还包括:
S5:采用图结构对步骤S4得到的推荐结果进行可视化。
6.根据权利要求5所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S5具体包括:
S51:依据步骤3的推荐指数
Figure FDA0003169698390000027
对图节点的大小进行定义,使推荐指数高的对象在图空间的节点面积最大,且距离图空间中该公司节点最近。
7.根据权利要求6所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S5还包括:
S52:采用不同的颜色对不同对象进行区分和可视化。
CN202110814971.XA 2021-07-19 2021-07-19 基于跨表数据挖掘的科技资源推荐方法 Active CN113360776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110814971.XA CN113360776B (zh) 2021-07-19 2021-07-19 基于跨表数据挖掘的科技资源推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110814971.XA CN113360776B (zh) 2021-07-19 2021-07-19 基于跨表数据挖掘的科技资源推荐方法

Publications (2)

Publication Number Publication Date
CN113360776A true CN113360776A (zh) 2021-09-07
CN113360776B CN113360776B (zh) 2023-07-21

Family

ID=77539876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110814971.XA Active CN113360776B (zh) 2021-07-19 2021-07-19 基于跨表数据挖掘的科技资源推荐方法

Country Status (1)

Country Link
CN (1) CN113360776B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440329A (zh) * 2013-09-04 2013-12-11 北京邮电大学 权威作者和高质量论文推荐系统和推荐方法
US20140172627A1 (en) * 2009-04-20 2014-06-19 4-Tell, Inc Next Generation Improvements in Recommendation Systems
WO2015027425A1 (zh) * 2013-08-29 2015-03-05 华为技术有限公司 存储数据的方法和装置
CN105512323A (zh) * 2015-12-21 2016-04-20 广东省科技基础条件平台中心 一种基于领域特征和隐语义分析的科技资源推荐方法
CN106815297A (zh) * 2016-12-09 2017-06-09 宁波大学 一种学术资源推荐服务系统与方法
CN106951494A (zh) * 2017-03-14 2017-07-14 腾讯科技(深圳)有限公司 一种信息推荐方法及装置
CN108170752A (zh) * 2017-12-21 2018-06-15 山东合天智汇信息技术有限公司 基于模板的元数据管理方法和系统
CN109272286A (zh) * 2018-08-30 2019-01-25 中国传媒大学 一种面向SaaS多租户以剧本为核心的云端影视项目管理方法与系统
CN110991190A (zh) * 2019-11-29 2020-04-10 华中科技大学 文档主题增强的自注意力网络、文本情绪预测系统和方法
CN111222847A (zh) * 2019-12-29 2020-06-02 东南大学 基于深度学习与非监督聚类的开源社区开发者推荐方法
CN111339240A (zh) * 2020-02-10 2020-06-26 北京达佳互联信息技术有限公司 对象的推荐方法、装置、计算设备和存储介质
CN111737482A (zh) * 2020-04-17 2020-10-02 郑敏杰 一种适用于数据挖掘的全景可视化图谱生成方法及装置
CN111897999A (zh) * 2020-07-27 2020-11-06 九江学院 一种用于视频推荐且基于lda的深度学习模型构建方法
CN111931043A (zh) * 2020-07-23 2020-11-13 重庆邮电大学 一种科技资源的推荐方法及系统
CN112184334A (zh) * 2020-10-27 2021-01-05 北京嘀嘀无限科技发展有限公司 用于确定问题用户的方法、装置、设备和介质
CN112749341A (zh) * 2021-01-22 2021-05-04 南京莱斯网信技术研究院有限公司 重点舆情推荐方法、可读存储介质及数据处理装置
CA3063243A1 (en) * 2019-11-13 2021-05-13 Beijing Digital Union Web Science And Technology Company Limited An application preference text classification method based on textrank

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140172627A1 (en) * 2009-04-20 2014-06-19 4-Tell, Inc Next Generation Improvements in Recommendation Systems
WO2015027425A1 (zh) * 2013-08-29 2015-03-05 华为技术有限公司 存储数据的方法和装置
CN103440329A (zh) * 2013-09-04 2013-12-11 北京邮电大学 权威作者和高质量论文推荐系统和推荐方法
CN105512323A (zh) * 2015-12-21 2016-04-20 广东省科技基础条件平台中心 一种基于领域特征和隐语义分析的科技资源推荐方法
CN106815297A (zh) * 2016-12-09 2017-06-09 宁波大学 一种学术资源推荐服务系统与方法
CN106951494A (zh) * 2017-03-14 2017-07-14 腾讯科技(深圳)有限公司 一种信息推荐方法及装置
CN108170752A (zh) * 2017-12-21 2018-06-15 山东合天智汇信息技术有限公司 基于模板的元数据管理方法和系统
CN109272286A (zh) * 2018-08-30 2019-01-25 中国传媒大学 一种面向SaaS多租户以剧本为核心的云端影视项目管理方法与系统
CA3063243A1 (en) * 2019-11-13 2021-05-13 Beijing Digital Union Web Science And Technology Company Limited An application preference text classification method based on textrank
CN110991190A (zh) * 2019-11-29 2020-04-10 华中科技大学 文档主题增强的自注意力网络、文本情绪预测系统和方法
CN111222847A (zh) * 2019-12-29 2020-06-02 东南大学 基于深度学习与非监督聚类的开源社区开发者推荐方法
CN111339240A (zh) * 2020-02-10 2020-06-26 北京达佳互联信息技术有限公司 对象的推荐方法、装置、计算设备和存储介质
CN111737482A (zh) * 2020-04-17 2020-10-02 郑敏杰 一种适用于数据挖掘的全景可视化图谱生成方法及装置
CN111931043A (zh) * 2020-07-23 2020-11-13 重庆邮电大学 一种科技资源的推荐方法及系统
CN111897999A (zh) * 2020-07-27 2020-11-06 九江学院 一种用于视频推荐且基于lda的深度学习模型构建方法
CN112184334A (zh) * 2020-10-27 2021-01-05 北京嘀嘀无限科技发展有限公司 用于确定问题用户的方法、装置、设备和介质
CN112749341A (zh) * 2021-01-22 2021-05-04 南京莱斯网信技术研究院有限公司 重点舆情推荐方法、可读存储介质及数据处理装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FABIANO BELÉM 等: "Associative tag recommendation exploiting multiple textual features", 《RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL》 *
FABIANO BELÉM 等: "Associative tag recommendation exploiting multiple textual features", 《RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL》, 24 July 2011 (2011-07-24), pages 1033 - 1042, XP058499390, DOI: 10.1145/2009916.2010053 *
宋佳 等: "科技资源元数据的关联与推荐方法", 《中国科技资源导刊》 *
宋佳 等: "科技资源元数据的关联与推荐方法", 《中国科技资源导刊》, vol. 49, no. 05, 28 September 2017 (2017-09-28), pages 37 - 44 *

Also Published As

Publication number Publication date
CN113360776B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
CN109284357B (zh) 人机对话方法、装置、电子设备及计算机可读介质
Park et al. ConceptVector: Text visual analytics via interactive lexicon building using word embedding
CN107180045B (zh) 一种互联网文本蕴含地理实体关系的抽取方法
CN109271537B (zh) 一种基于蒸馏学习的文本到图像生成方法和系统
CN109299865B (zh) 基于语义分析的心理测评系统及方法、信息数据处理终端
CN112966091B (zh) 一种融合实体信息与热度的知识图谱推荐系统
US20170262783A1 (en) Team Formation
CN106940726B (zh) 一种基于知识网络的创意自动生成方法与终端
CN113627797B (zh) 入职员工画像生成方法、装置、计算机设备及存储介质
CN112307164A (zh) 信息推荐方法、装置、计算机设备和存储介质
CN113886604A (zh) 一种职位知识图谱生成方法和系统
CN113535949B (zh) 基于图片和句子的多模态联合事件检测方法
CN115062135B (zh) 一种专利筛选方法与电子设备
CN112231554A (zh) 一种搜索推荐词生成方法、装置、存储介质和计算机设备
JP4967133B2 (ja) 情報取得装置、そのプログラム及び方法
CN117076636A (zh) 一种智能客服的信息查询方法、系统和设备
CN114491034A (zh) 一种文本分类方法及智能设备
CN118035405A (zh) 一种基于大模型的知识库问答构建方法及装置
Ronghui et al. Application of Improved Convolutional Neural Network in Text Classification.
CN110633363A (zh) 一种基于nlp和模糊多准则决策的文本实体推荐方法
CN109918661A (zh) 同义词获取方法及装置
CN115982322A (zh) 一种水利行业设计领域知识图谱的检索方法及检索系统
CN113360776B (zh) 基于跨表数据挖掘的科技资源推荐方法
Xu et al. Prioritizing Customer Requirements for Science and Technology Service Platform Based on Improved TF-IDF and Sentiment Analysis
CN116415047B (zh) 一种基于国家形象资源推荐的资源筛选方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant