CN113360776B - 基于跨表数据挖掘的科技资源推荐方法 - Google Patents

基于跨表数据挖掘的科技资源推荐方法 Download PDF

Info

Publication number
CN113360776B
CN113360776B CN202110814971.XA CN202110814971A CN113360776B CN 113360776 B CN113360776 B CN 113360776B CN 202110814971 A CN202110814971 A CN 202110814971A CN 113360776 B CN113360776 B CN 113360776B
Authority
CN
China
Prior art keywords
data
document
topic
vocabulary
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110814971.XA
Other languages
English (en)
Other versions
CN113360776A (zh
Inventor
肖国强
唐小琴
王晓蒙
吴松
程天宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University
Original Assignee
Southwest University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University filed Critical Southwest University
Priority to CN202110814971.XA priority Critical patent/CN113360776B/zh
Publication of CN113360776A publication Critical patent/CN113360776A/zh
Application granted granted Critical
Publication of CN113360776B publication Critical patent/CN113360776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Abstract

本发明公开了一种基于跨表数据挖掘的科技资源推荐方法,该方法通过前期数据语义分析,挖掘跨表数据或多对象属性之间的相关性,确定用于NLP主题模型的输入数据字段,在一定程度上优化了多对象之间的数据交流模式;通过采用的神经网络主题模型结构简洁,且无需先验假设,通过训练可获得质量更高的主题表示;通对多对象推荐结果根据推荐指数和对象种类,进行不同大小和颜色的图模型展示及可视化,可实现推荐结果的直观、有效、合理显示,提升用户体验。

Description

基于跨表数据挖掘的科技资源推荐方法
技术领域
本发明涉及一种基于跨表数据挖掘的科技资源推荐方法。
背景技术
科技资源在国民经济发展中愈发重要,在科技活动中的共享和利用程度也得到相关部门和企业的高度重视,资源的多维大数据特征得以突显。
科技资源具有领域性强、数据分散、地域性强的特点,当前的通用性推荐算法(如用户行为分析、协同过滤技术等)在实际的资源共享平台中的应用效果不佳,资源推荐准确率偏低。隐语义分析技术是一种基于机器学习的一系列方法,具有比较好的理论基础,目前部分算法在推荐系统中已经得到应用和肯定。但是,目前的推荐方法均不能进行跨表数据挖掘,从而实现基于多维度数据向企业准确推荐科技资源。
发明内容
本发明的目的是提供一种基于跨表数据挖掘的科技资源推荐方法,能够为企业自动推荐科技资源。
为解决上述技术问题,本发明提供一种基于跨表数据挖掘的科技资源推荐方法,包括步骤:
S1:构建包括企业、人才、项目、平台和仪器设备属性数据的对象表,选取与对象表中各对象属性相关性最高的关联对象作为跨表数据交流的信息通道;
S2:从所述对象表中提取与关联对象的属性数据对应的属性数据,并根据提取出的属性数据构建NLP主题模型形成文档数据;
S3:对所述文档数据进行分词处理,然后将分词后的文档数据输入创建好的神经网络主题模型NTM进行训练,求得文档-主题分布θ和主题-词汇分布φ及对应的权重矩阵Wθ和Wφ,并生成隐含层对应每个主题下的词汇集及其出现概率;
S4:通过训练好的主题-词汇分布求出与用户搜索的关键词匹配度最高的主题t*;再根据要求返回的对象,计算主题t*对应词汇集/>出现在每个对象文档数据d的概率然后对计算结果进行从大到小排序后将对应的对象ID作为推荐系数返回给企业用户。
进一步地,所述步骤S2具体包括:提取企业-业务范围数据、项目-名称数据、人才-熟悉学科数据、仪器设备-主要功能数据和平台-研究方向数据输入NLP主题模型形成文档数据;其中,每个记录或样本对应的数据定义为一个文档数据d={d1,d2,...dN},N表示文档总数。
进一步地,所述步骤S3具体包括:
S31:对文档集d进行n-gram分词得到词汇集g,构建神经网络主题模型NTM,并将每个文档集d及其n-gram词汇集g作为神经网络主题模型NTM的输入层;
S32:添加n-gram词向量层,定义词向量维度为300,将每个词汇集g转换成数字向量le(g)进行表示;
S33:创建文档-主题分布θ和主题-词汇分布的两个隐含层ld(d)和lt(g),主题数量为K;其中,ld(d)=softmax(Wθ(d)),lt(g)=sigmoid(le(g)×Wφ),其中权重矩阵Wθ表示N个文档向量在K个主题上的分布,即Wθ∈RN×K,Wθ(d)为文档集d的权重矩阵;Wφ表示主题-词汇层K个主题与词向量层300维词向量之间的权重矩阵,故Wφ∈R300×K。因文档主题个数为K,则ld和lt均是一个K维向量;模型输出为文档集d关于词汇集g的分布概率
S34:将步骤S31中每个样本数据(d,g),和通过统计标注获得的每个词汇集g在文档集d中出现的概率p(g|d)分别作为神经网络主题模型NTM的输入和输出进行训练,获得文档-主题分布θ和主题-词汇分布φ,以及对应的权重矩阵Wθ和Wφ
进一步地,所述步骤S31中,文档集d采用unigram和bigrams模型生成词汇集g={g1,g2,...gV},V表示文档的词汇数量。
进一步地,该方法还包括:
S5:采用图结构对步骤S4得到的推荐结果进行可视化。
进一步地,所述步骤S5具体包括:
S51:依据步骤S3的推荐指数对图节点的大小进行定义,使推荐指数高的对象在图空间的节点面积最大,且距离图空间中该图节点最近。
进一步地,所述步骤S5还包括:
S52:采用不同的颜色对不同对象进行区分和可视化。
本发明的有益效果为:通过前期数据语义分析,挖掘跨表数据或多对象属性之间的相关性,确定用于NLP主题模型的输入数据字段,在一定程度上优化了多对象之间的数据交流模式;在采用多对象联合推荐技术推荐适合企业发展的科技项目,并为该项目准确推荐多种合适的科技资源如人才、仪器设备等。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为基于跨表数据挖掘的科技资源推荐方法实施方案;
图2为面向企业的科技资源数据表达与挖掘方法示意图;
图3为神经网络主题模型构建方法。
具体实施方式
如图1所示的基于跨表数据挖掘的科技资源推荐方法,该方法包括步骤:
S1:构建包括企业、人才、项目、平台和仪器设备属性数据的对象表,选取与对象表中各对象属性相关性最高的关联对象作为跨表数据交流的信息通道;
S2:从所述对象表中提取与关联对象的属性数据对应的属性数据,并根据提取出的属性数据构建NLP主题模型形成文档数据;
S3:对所述文档数据进行分词处理,然后将分词后的文档数据输入创建好的神经网络主题模型NTM进行训练,求得文档-主题分布θ和主题-词汇分布φ及对应的权重矩阵Wθ和Wφ,并生成隐含层对应每个主题下的词汇集及其出现概率;
S4:通过训练好的主题-词汇分布求出与用户搜索的关键词匹配度最高的主题t*;再根据要求返回的对象,计算主题t*对应词汇集/>出现在每个对象文档数据d的概率然后对计算结果进行从大到小排序后将对应的对象ID作为推荐系数返回给企业用户。
本发明通过前期数据语义分析,挖掘跨表数据或多对象属性之间的相关性,确定用于NLP主题模型的输入数据字段,在一定程度上优化了多对象之间的数据交流模式;在采用多对象联合推荐技术推荐适合企业发展的科技项目,并为该项目准确推荐多种合适的科技资源如人才、仪器设备等。
根据本申请的一个实施例,所述步骤S2具体包括:提取企业-业务范围数据、项目-名称数据、人才-熟悉学科数据、仪器设备-主要功能数据和平台-研究方向数据输入NLP主题模型形成文档数据;其中,每个记录或样本对应的数据定义为一个文档数据d={d1,d2,...dN},N表示文档总数。跨表数据包含企业、项目、人才、平台和仪器设备5种对象及其属性数据,通常这些属性对于不同的需求,其重要性和价值有所不同,附图2展示了各对象的部分属性。针对科技资源推荐应用场景,各资源数据的相关性主要体现在专业方向和实用价值方面,故定义一个用于关联多种数据对象的语义概念“研究方向”。随后,从每个数据对象表中选择与该语义概念最匹配的属性作为跨表数据交流的信息通道,并将该表中该属性对应的数据用于构建NLP主题模型。拟选择的对象属性包括:企业-“业务范围”、项目-“名称”、人才-“熟悉学科”、仪器设备-“主要功能”和平台-“研究方向”。
根据本申请的一个实施例,所述步骤S3具体包括:
S31:对文档集d进行n-gram分词得到词汇集g,并将每个文档集d及其n-gram词汇集g作为神经网络主题模型NTM的输入层;
S32:添加n-gram词向量层,定义词向量维度为300,将每个词汇集g转换成数字向量le(g)进行表示;通过实现文本数据的量化表示,提高文本数据的可运算性和可操作性。
S33:创建文档-主题分布θ和主题-词汇分布的两个隐含层ld(d)和lt(g),主题数量为K;不同于传统概率主题模型,NTM无需指定先验分布,而是分别采用神经网络常用的softmax和sigmoid函数从权重矩阵中生隐含层ld和lt,即:ld(d)=softmax(Wθ(d)),lt(g)=sigmoid(le(g)×Wφ),其中权重矩阵Wθ表示N个文档向量在K个主题上的分布,即Wθ∈RN ×K,Wθ(d)为文档集d的权重矩阵。Wφ表示主题-词汇层K个主题与词向量层300维词向量之间的权重矩阵,故Wφ∈R300×K。因文档主题个数为K,则ld和lt均是一个K维向量。模型输出为文档集d关于词汇集g的分布概率/>
S34:将步骤S31中每个样本数据(d,g),和通过统计标注获得的每个词汇集g在文档集d中出现的概率p(g|d)分别作为神经网络主题模型NTM的输入和输出进行训练,获得文档-主题分布θ和主题-词汇分布φ,以及对应的权重矩阵Wθ和Wφ。通过训练隐含层的主题模型,生成同一主题下语义信息相似的词汇gt,且这些词汇隶属于该主题的概率最大,如人才对象表中的以下词汇隶属于同一主题:{模式,识别,图像,处理,人工,智能,系统,计算机,机器,学习,深度}。
根据本申请的一个实施例,所述步骤S31中,文档集d采用unigram和bigrams模型生成词汇集g={g1,g2,...gV},V表示文档的词汇数量。
根据本申请的一个实施例,该方法还包括:
S5:采用图结构对步骤S4得到的推荐结果进行可视化。
根据本申请的一个实施例,所述步骤S5具体包括:
S51:依据步骤S3的推荐指数对图节点的大小进行定义,使推荐指数高的对象在图空间的节点面积最大,且距离图空间中该图节点最近。
根据本申请的一个实施例,所述步骤S5还包括:
S52:采用不同的颜色对不同对象进行区分和可视化。
本申请通过根据推荐指数和对象种类,进行不同大小和颜色的图模型展示及可视化,可实现推荐结果的直观、有效、合理显示,提升用户体验。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种基于跨表数据挖掘的科技资源推荐方法,其特征在于,包括步骤:
S1:构建包括企业、人才、项目、平台和仪器设备属性数据的对象表,选取与对象表中各对象属性相关性最高的关联对象作为跨表数据交流的信息通道;
S2:从所述对象表中提取与关联对象的属性数据对应的属性数据,并根据提取出的属性数据构建NLP主题模型形成文档数据;步骤S2具体包括:提取企业-业务范围数据、项目-名称数据、人才-熟悉学科数据、仪器设备-主要功能数据和平台-研究方向数据输入NLP主题模型形成文档数据;其中,每个记录或样本对应的数据定义为一个文档数据d={d1,d2,...,dN},N表示文档总数;
S3:对所述文档数据进行分词处理,然后将分词后的文档数据输入创建好的神经网络主题模型NTM进行训练,求得文档-主题分布θ和主题-词汇分布φ及对应的权重矩阵Wθ和Wφ,并生成隐含层对应每个主题下的词汇集及其出现概率;
S4:通过训练好的主题-词汇分布求出与用户搜索的关键词匹配度最高的主题t*;再根据要求返回的对象,计算主题t*对应词汇集/>出现在每个对象文档数据d的概率然后对计算结果进行从大到小排序后将对应的对象ID作为推荐系数返回给企业用户。
2.根据权利要求1所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S3具体包括:
S31:对文档集d进行n-gram分词得到词汇集g,构建神经网络主题模型NTM,并将每个文档集d及其n-gram词汇集g作为神经网络主题模型NTM的输入层;
S32:添加n-gram词向量层,定义词向量维度为300,将每个词汇集g转换成数字向量le(g)进行表示;
S33:创建文档-主题分布θ和主题-词汇分布的两个隐含层ld(d)和lt(g),主题数量为K;其中,ld(d)=softmax(Wθ(d)),lt(g)=sigmoid(le(g)×Wφ),其中权重矩阵Wθ表示N个文档向量在K个主题上的分布,即Wθ∈RN×K,Wθ(d)为文档集d的权重矩阵;Wφ表示主题-词汇层K个主题与词向量层300维词向量之间的权重矩阵,故Wφ∈R300×K。因文档主题个数为K,则ld和lt均是一个K维向量;模型输出为文档集d关于词汇集g的分布概率/>
S34:将步骤S31中每个样本数据(d,g),和通过统计标注获得的每个词汇集g在文档集d中出现的概率p(g|d)分别作为神经网络主题模型NTM的输入和输出进行训练,获得文档-主题分布θ和主题-词汇分布φ,以及对应的权重矩阵Wθ和Wφ
3.根据权利要求2所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S31中,文档集d采用unigram和bigrams模型生成词汇集g={g1,g2,...,gV},V表示文档的词汇数量。
4.根据权利要求1所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,该方法还包括:
S5:采用图结构对步骤S4得到的推荐结果进行可视化。
5.根据权利要求4所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S5具体包括:
S51:依据步骤S3的推荐指数对图节点的大小进行定义,使推荐指数高的对象在图空间的节点面积最大,且距离图空间中该图节点最近。
6.根据权利要求5所述的基于跨表数据挖掘的科技资源推荐方法,其特征在于,所述步骤S5还包括:
S52:采用不同的颜色对不同对象进行区分和可视化。
CN202110814971.XA 2021-07-19 2021-07-19 基于跨表数据挖掘的科技资源推荐方法 Active CN113360776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110814971.XA CN113360776B (zh) 2021-07-19 2021-07-19 基于跨表数据挖掘的科技资源推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110814971.XA CN113360776B (zh) 2021-07-19 2021-07-19 基于跨表数据挖掘的科技资源推荐方法

Publications (2)

Publication Number Publication Date
CN113360776A CN113360776A (zh) 2021-09-07
CN113360776B true CN113360776B (zh) 2023-07-21

Family

ID=77539876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110814971.XA Active CN113360776B (zh) 2021-07-19 2021-07-19 基于跨表数据挖掘的科技资源推荐方法

Country Status (1)

Country Link
CN (1) CN113360776B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512323A (zh) * 2015-12-21 2016-04-20 广东省科技基础条件平台中心 一种基于领域特征和隐语义分析的科技资源推荐方法
CN106815297A (zh) * 2016-12-09 2017-06-09 宁波大学 一种学术资源推荐服务系统与方法
CN111897999A (zh) * 2020-07-27 2020-11-06 九江学院 一种用于视频推荐且基于lda的深度学习模型构建方法
CN111931043A (zh) * 2020-07-23 2020-11-13 重庆邮电大学 一种科技资源的推荐方法及系统
CN112184334A (zh) * 2020-10-27 2021-01-05 北京嘀嘀无限科技发展有限公司 用于确定问题用户的方法、装置、设备和介质
CA3063243A1 (en) * 2019-11-13 2021-05-13 Beijing Digital Union Web Science And Technology Company Limited An application preference text classification method based on textrank

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10275818B2 (en) * 2009-04-20 2019-04-30 4-Tell, Inc. Next generation improvements in recommendation systems
WO2015027425A1 (zh) * 2013-08-29 2015-03-05 华为技术有限公司 存储数据的方法和装置
CN103440329B (zh) * 2013-09-04 2016-05-18 北京邮电大学 权威作者和高质量论文推荐系统和推荐方法
CN106951494B (zh) * 2017-03-14 2022-01-04 腾讯科技(深圳)有限公司 一种信息推荐方法及装置
CN108170752B (zh) * 2017-12-21 2020-10-16 山东合天智汇信息技术有限公司 基于模板的元数据管理方法和系统
CN109272286B (zh) * 2018-08-30 2022-11-15 中国传媒大学 一种面向SaaS多租户以剧本为核心的云端影视项目管理方法与系统
CN110991190B (zh) * 2019-11-29 2021-06-29 华中科技大学 一种文档主题增强系统、文本情绪预测系统和方法
CN111222847B (zh) * 2019-12-29 2023-11-24 东南大学 基于深度学习与非监督聚类的开源社区开发者推荐方法
CN111737482B (zh) * 2020-04-17 2021-02-19 郑敏杰 一种适用于数据挖掘的全景可视化图谱生成方法及装置
CN112749341B (zh) * 2021-01-22 2024-03-29 南京莱斯网信技术研究院有限公司 重点舆情推荐方法、可读存储介质及数据处理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512323A (zh) * 2015-12-21 2016-04-20 广东省科技基础条件平台中心 一种基于领域特征和隐语义分析的科技资源推荐方法
CN106815297A (zh) * 2016-12-09 2017-06-09 宁波大学 一种学术资源推荐服务系统与方法
CA3063243A1 (en) * 2019-11-13 2021-05-13 Beijing Digital Union Web Science And Technology Company Limited An application preference text classification method based on textrank
CN111931043A (zh) * 2020-07-23 2020-11-13 重庆邮电大学 一种科技资源的推荐方法及系统
CN111897999A (zh) * 2020-07-27 2020-11-06 九江学院 一种用于视频推荐且基于lda的深度学习模型构建方法
CN112184334A (zh) * 2020-10-27 2021-01-05 北京嘀嘀无限科技发展有限公司 用于确定问题用户的方法、装置、设备和介质

Also Published As

Publication number Publication date
CN113360776A (zh) 2021-09-07

Similar Documents

Publication Publication Date Title
Yang et al. Image-text multimodal emotion classification via multi-view attentional network
CN110750959B (zh) 文本信息处理的方法、模型训练的方法以及相关装置
CN111753060B (zh) 信息检索方法、装置、设备及计算机可读存储介质
US10831796B2 (en) Tone optimization for digital content
US10831762B2 (en) Extracting and denoising concept mentions using distributed representations of concepts
TW202009749A (zh) 人機對話方法、裝置、電子設備及電腦可讀媒體
CN109271537B (zh) 一种基于蒸馏学习的文本到图像生成方法和系统
EP3933657A1 (en) Conference minutes generation method and apparatus, electronic device, and computer-readable storage medium
CN110162771B (zh) 事件触发词的识别方法、装置、电子设备
Novak et al. HistoGraph--A visualization tool for collaborative analysis of networks from historical social multimedia collections
CN112966091B (zh) 一种融合实体信息与热度的知识图谱推荐系统
Chen et al. Research on personalized recommendation hybrid algorithm for interactive experience equipment
US11429792B2 (en) Creating and interacting with data records having semantic vectors and natural language expressions produced by a machine-trained model
CN111538830B (zh) 法条检索方法、装置、计算机设备及存储介质
CN113392179A (zh) 文本标注方法及装置、电子设备、存储介质
CN110888970B (zh) 文本生成方法、装置、终端和存储介质
CN113535949B (zh) 基于图片和句子的多模态联合事件检测方法
Xia et al. A cross-modal multimedia retrieval method using depth correlation mining in big data environment
CN113360776B (zh) 基于跨表数据挖掘的科技资源推荐方法
CN111985520A (zh) 一种基于图卷积神经网络的多模态分类方法
CN110633363B (zh) 一种基于nlp和模糊多准则决策的文本实体推荐方法
CN113297485A (zh) 一种生成跨模态的表示向量的方法以及跨模态推荐方法
CN112269877A (zh) 数据标注方法及装置
Nguyen et al. Keyword visual representation for image retrieval and image annotation
Kumar et al. Scene Graph Generation Using Depth, Spatial, and Visual Cues in 2D Images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant