CN106095966B - 一种用户可扩展的标签标注方法及系统 - Google Patents
一种用户可扩展的标签标注方法及系统 Download PDFInfo
- Publication number
- CN106095966B CN106095966B CN201610435965.2A CN201610435965A CN106095966B CN 106095966 B CN106095966 B CN 106095966B CN 201610435965 A CN201610435965 A CN 201610435965A CN 106095966 B CN106095966 B CN 106095966B
- Authority
- CN
- China
- Prior art keywords
- user
- label
- sample
- data
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种用户可扩展的标签标注方法及系统,包括步骤步骤S1:对用户采样获取用户样本数据并标记用户的样本图片,生成样本用户标签标注矩阵;步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;步骤S3:利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;步骤S4:通过用户标签关联知识数据,计算生成用户新标签标注数据。本发明解决在对用户进行图像数据标签化处理过程中,如何合理地、低成本地完成对用户进行新的标签标注的问题,本发明有效地提升了在对用户进行新的标签化的过程中的计算效率和数据利用效率。
Description
技术领域
本发明属于图像处理技术领域,特别是涉及一种用户可扩展的标签标注方法及系统。
背景技术
目前大数据技术和商业智能技术正在飞速发展,互联网用户每天正在飞速地产生大量数据,这些数据中包含了结构化数据和非结构化数据,其中图片数据就是非结构化数据中占比极大的一块。基于用户的图像数据,挖掘用户的潜在兴趣点,在商业智能领域的需求已经非常巨大,伴随而生的深度学习、神经网络等技术也正日趋成熟商用。但这些技术的应用往往需要大量的GPU高昂硬件设备成本的付出,在对这些图片数据进一步进行处理的时候,会对同一张图片进行重复的GPU计算处理,消耗了大量不必要的计算资源,从而产生了极大的资源浪费。
发明内容
为了解决上述问题,本发明提出了一种用户可扩展的标签标注方法及系统,解决在对用户进行图像数据标签化处理过程中,如何合理地、低成本地完成对用户进行新的标签标注的问题,本发明有效地提升了在对用户进行新的标签化的过程中的计算效率和数据利用效率。
为达到上述目的,本发明采用的技术方案是:一种用户可扩展的标签标注方法,步骤包括:
步骤S1:对用户采样获取用户样本数据,并标记用户的样本图片,生成样本用户标签标注矩阵;
步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;
步骤S3:利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;
步骤S4:通过用户标签关联知识数据,计算生成用户新标签标注数据。
进一步的是,所述步骤S1包括步骤:
对用户进行随机采样作为用户样本数据,标记用户收藏的图片作为样本图片;
对样本图片进行标签标记,其中每张图片有多个标签标记或只有一个标签标记;
利用用户样本数据和样本图片的标签标记生成样本用户的标签标注矩阵,其中第j个用户的标签特征向量由标记的图片标签归一化分布产生。
进一步的是,所述步骤S2包括步骤:
将每个用户样本数据作为卷积神经网络的输入数据,获取分类特征层的数值输出特征,每张图片输出一个固定维度的特征;将带有标签标注的样本图片依据用户进行归类,作为训练数据输入;综合归一化每个用户样本的特征维度,根据训练数据生成用户兴趣特征矩阵;
将样本图片依据标签进行归类,作为训练数据输入;将生成的图片特征作为矩阵的横向量,构建图像特征矩阵;综合归一化每个标签样本的特征维度,生成标签兴趣特征矩阵。
进一步的是,步骤S3中计算用户标签关联知识数据的计算公式为U·A·TT≈Ut,通过梯度下降方法求解矩阵A;其中,Ut为样本用户标签标注矩阵,U为用户兴趣特征矩阵,T为标签兴趣特征矩阵,A为用户标签关联知识数据。
进一步的是,所述步骤S4包括步骤:
构建需要标注的用户的兴趣特征矩阵为U′,计算U′·A·TT,记结果为Ut′=[u1,u2,u3...ui]T,其中行向量ui为第i个用户对应的标签标注权重;逐行抽取用户的新标签关联权重,并筛选适用于用户的新标签,输出用户的标签标注数据。
进一步的是,对ui进行降序排序,通过设定阈值s对排序后的数据进行权重截断,获取新标签对用户i的权重标记,完成对用户的新标签标注。
进一步的是,对权重向量进行降序排列,并截取其中前k位的标签,作为该用户的标注标签,输出用户的标签标注作为新标签。
另一方面,本发明还提供了一种用于用户可扩展的标签标注方法的系统,包括
数据获取模块:采样用户的样本用户数据并标记用户的样本图片,生成样本用户标签标注矩阵;
预处理模块:连接数据获取模块,对用户样本图片数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;
计算模块:连接预处理模块,利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;
标签生成模块:连接计算模块,通过用户标签关联知识数据,计算生成用户新标签标注数据。
进一步的是,向预处理模块输入对用户数据,并计算返回特征,合并为统一的向量数据,标准化用户的图片特征,该特征矩阵为用户的兴趣特征描述矩阵,包含全部样本用户数据;
向图片预处理模块输入样本图片中各个标签的通用特征权重,该模块对特征数据其进行分维度取期望值;
向预处理模块对需要进行新标签标注的用户进行样本图片的特征处理;将处理好的用户图片数据输入标签标注计算模块,进行矩阵运算,计算用户标签关联知识数据;逐行抽取用户的新标签关联权重,并对其进行降序排列,通过阈值来筛选适用于用户的新标签,输出用户的标签标注。
进一步的是,向知识矩阵计算模块输入每个用户新标签的个数,该模块对用户的新标签权重进行标准化处理,生成样本用户标签数据;向知识矩阵计算模块输入预处理后的数据,对处理后的样本数据,该模块通过梯度下降方法对知识矩阵进行数值计算,并输出用户标签关联知识数据。
采用本技术方案的有益效果:
有效地提升了在对用户进行新的标签化的过程中的计算效率和数据利用效率;
有效地利用了图片的卷积神经网络输出特征,减少了处理图片过程中卷积计算的频次,降低了在用户标签标记过程中的图像处理所需的硬件成本;易于扩展新的用户的标签数据,不需要多次对神经网络进行样本的模型训练。
附图说明
图1为本发明的一种用户可扩展的标签标注方法流程示意图;
图2为本发明的实施例中步骤S1的流程示意图;
图3为本发明的实施例中步骤S2中获取用户兴趣特征矩阵的流程示意图;
图4为本发明的实施例中步骤S2中获取标签兴趣特征矩阵的流程示意图;
图5为本发明的实施例中步骤S3的流程示意图;
图6为本发明的实施例中步骤S4的流程示意图;
图7为本发明实施例中一种用于用户可扩展的标签标注方法的系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步阐述。
在实施例中,参见图1所示,本发明提出了一种用户可扩展的标签标注方法,包括步骤
步骤S1:对用户采样获取用户样本数据并标记用户的样本图片,生成样本用户标签标注矩阵,如图2所示;
具体为:对用户进行随机采样作为用户样本数据,标记用户收藏的图片作为样本图片;对样本图片进行标签标记,其中每张图片有多个标签标记或只有一个标签标记;利用用户样本数据和样本图片的标签标记生成样本用户的标签标注矩阵,其中第j个用户的标签特征向量由标记的图片标签归一化分布产生。
优选实施例,如图2所示:
步骤S1-1,采样用户,获取用户的图片数据。
该步骤包含,通过随机采样的形式获取数据库中的用户数据,若用户的图片数量大于阈值,则采样该用户。
步骤S1-2,将所有采样的用户标识ID生成列表文件;抽取用户的图片数据。
步骤S1-3,抽取用户i的图片集合,对其进行新标签标注数据的统计,获取用户的标注特征μi t,对其进行L2的标准化处理,得到Ut为样本用户标签标注矩阵。
在该实施例中,读取采样用户标识列表文件,获取用户的图片数据,存放文件夹,并以用户的ID作为文件夹命名。
步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;
提取图片特征数据,构建用户兴趣特征矩阵数据;通过对采样用户图片进行卷积神经网络分类特征的提取,该步骤中涉及到卷积神经网络的构建,不在该发明的涉及范围为现有技术。
具体为,将每个用户的样本图片数据作为卷积神经网络的输入数据,获取分类特征层的数值输出特征,每张图片输出一个固定维度的特征;将带有标签标注的样本图片依据用户进行归类,作为训练数据输入;综合归一化每个用户样本的特征维度,根据训练数据生成用户兴趣特征矩阵。
优选实施例,如图3和图4所示:
步骤S2-1-1,对采样用户的每一张图片获取其分类特征记为Pi m,其中m为用户标识,i为图片标识;
对其进行L2标准化处理即:
其中xi∈Pi m。
生成采用用户的兴趣特征矩阵记为将此特征矩阵存储为文件,文件名称以用户ID命名。
步骤S2-1-2,生成用户兴趣特征矩阵。
读取采样用户的兴趣特征数据,分别对其进行各个特征维度的归一化处理,生成用户兴趣特征矩阵记为U。
记μi为用户i的兴趣特征向量,U=[μ1,μ2,μ3...μn]T,其中μi的计算公式如下:
其中α∈Um,Um∈Rn×k。
具体为,将样本图片依据标签进行归类,作为训练数据输入;将生成的图片特征作为矩阵的横向量,构建图像特征矩阵;综合归一化每个标签样本的特征维度,生成标签兴趣特征矩阵。
对采样用户的图片进行新标签的标注,生成新标签的特征矩阵。该步骤包含,对采样用户图片进行基于新标签标注的归类。
步骤S2-2-1,对用户图片数据新标签标注,被标注的图片可以包含有1个或者1个以上的标签属性。
步骤S2-2-2,生成新标签的特征矩阵。
将包含有同样标签的图片进行归类,并抽取其特征Pi t,其中t为标签标识,i为图片标识。
对Pi t进行L2标准化处理,生成新标签的特征矩阵记为
将新标签的特征矩阵存储为文件,并以标签ID进行命名。
读取标签特征数据,分别对其进行各个特征维度的归一化处理,生成标签兴趣特征矩阵为T。
记τi为标签i的特征向量,T=[τ1,τ2,τ3...τn]T,其中τi的计算公式如下:
其中β∈Tt,Tt∈Rn×k。
步骤S3:利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据。
具体为,计算用户标签关联知识数据的计算公式为U·A·TT≈Ut,通过梯度下降方法求解矩阵A;其中,Ut为样本用户标签标注矩阵,U为用户兴趣特征矩阵,T为标签兴趣特征矩阵,A为用户标签关联知识数据。
优选实施例,如图5所示:
构建学习模型,求解相应的关联矩阵,生成知识模块。该步骤包含,构建关联模型,对关联矩阵进行基于统计的求解,并输出最终的模型知识矩阵,用于对新用户的标签标注。
步骤S3-1,构建用户标签关联知识数据模型,本发明通过对图片特征进行基于用户的建模来实现对新用户的标签标注的效果,其主要问题是找到标签的特征与用户兴趣特征之间的数据关联,构建U·A·TT≈Ut关系式,得到用户标签关联知识数据A。
步骤S3-2,通过梯度下降方法来对矩阵A进行求解。
优化目标函数如下:
其中,r∈Ut,A∈Rk×k;
其中,μi,τi分别为用户i的特征向量和标签j的特征向量,其计算方法请参见步骤S2-1-2和步骤S2-2-3。
计算所得的关联因子矩阵,写入文本或者内存或者cache模块,作为关联用户标签关联知识数据模块。
步骤S4:通过用户标签关联知识数据,计算生成用户新标签标注数据。
具体的为,包括步骤:构建需要标注的用户的兴趣特征矩阵为U′,计算U′·A·TT,记结果为Ut′=[u1,u2,u3...ui]T,其中行向量ui为第i个用户对应的标签标注权重;逐行抽取用户的新标签关联权重,并筛选适用于用户的新标签,输出用户的标签标注数据。
优选方法一:对ui进行降序排序,通过设定阈值s对排序后的数据进行权重截断,获取新标签对用户i的权重标记,完成对用户的新标签标注。
优选方法二,对权重向量进行降序排列,并截取其中前k位的标签,作为该用户的标注标签,输出用户的标签标注作为新标签。
优选实施例,如图6所示:
步骤S4-1,计算待标注用户的标签特征,通过知识模块对新用户进行标签标注。该步骤包含,计算待标注用户的兴趣特征矩阵,其计算方法请参见步骤S2-1-2,用户的兴趣特征矩阵为U′。
最终新用户的标签标注权重矩阵为:Ut=U′·A·TT其中
步骤S4-2,计算新用户的标签评分权重。
方法一:为用户的新标签权重评分,对其依据权重大小进行降序排序,设置阈值s,获取权重大于s的标签。
方法二:对权重向量进行降序排列,并截取其中前k位的标签,作为该用户的标注标签。
为配合本发明方法的实现,基于相同的发明构思,如图7所示,本发明还提供了一种用于用户可扩展的标签标注方法的系统,包括:
数据获取模块:采样用户的样本用户数据并标记用户的样本图片,生成样本用户标签标注矩阵;
预处理模块:连接数据获取模块,对用户样本图片数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵;
计算模块:连接预处理模块,利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据;
标签生成模块:连接计算模块,通过用户标签关联知识数据,计算生成用户新标签标注数据。
其中,向预处理模块输入对用户数据,并计算返回特征,合并为统一的向量数据,标准化用户的图片特征,该特征矩阵为用户的兴趣特征描述矩阵,包含全部样本用户数据;
向图片预处理模块输入样本图片中各个标签的通用特征权重,该模块对特征数据其进行分维度取期望值;
向预处理模块对需要进行新标签标注的用户进行样板图片的特征处理;将处理好的用户图片数据输入标签标注计算模块,进行矩阵运算,计算用户标签关联知识数据;逐行抽取用户的新标签关联权重,并对其进行降序排列,通过阈值来筛选适用于用户的新标签,输出用户的标签标注。
其中,向知识矩阵计算模块输入每个用户新标签的个数,该模块对用户的新标签权重进行标准化处理,生成样本用户标签数据;向知识矩阵计算模块输入预处理后的数据,对处理后的样本数据,该模块通过梯度下降方法对知识矩阵进行数值计算,并输出用户标签关联知识数据。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本实发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (4)
1.一种用户可扩展的标签标注方法,其特征在于,步骤包括;
步骤S1:对用户采样获取用户样本数据,并标记用户的样本图片,生成样本用户标签标注矩阵,具体步骤为:对用户进行随机采样作为用户样本数据,标记用户收藏的图片作为样本图片,对样本图片进行标签标记,其中每张图片有多个标签标记或只有一个标签标记,利用用户样本数据和样本图片的标签标记生成样本用户的标签标注矩阵,其中第j个用户的标签特征向量由标记的图片标签归一化分布产生;
步骤S2:通过卷积神经网络对用户样本数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵,具体步骤为:将每个用户样本数据作为卷积神经网络的输入数据,获取分类特征层的数值输出特征,每张图片输出一个固定维度的特征,将带有标签标注的样本图片依据用户进行归类,作为训练数据输入,综合归一化每个用户样本的特征维度,根据训练数据生成用户兴趣特征矩阵,将样本图片依据标签进行归类,作为训练数据输入,将生成的图片特征作为矩阵的横向量,构建图像特征矩阵,综合归一化每个标签样本的特征维度,生成标签兴趣特征矩阵;
步骤S3:利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据,其中,计算用户标签关联知识数据的计算公式为U·A·TT≈Ut,通过梯度下降方法求解矩阵A;其中,Ut为样本用户标签标注矩阵,U为用户兴趣特征矩阵,T为标签兴趣特征矩阵,A为用户标签关联知识数据;
步骤S4:通过用户标签关联知识数据,计算生成用户新标签标注数据,其中,构建需要标注的用户的兴趣特征矩阵为U′,计算U′·A·TT,记结果为Ut′=[u1,u2,u3…ui]T,其中行向量ui为第i个用户对应的标签标注权重;逐行抽取用户的新标签关联权重,并筛选适用于用户的新标签,输出用户的标签标注数据。
2.根据权利要求1所述的一种用户可扩展的标签标注方法,其特征在于,对ui进行降序排序,通过设定阈值s对排序后的数据进行权重截断,获取新标签对用户i的权重标记,完成对用户的新标签标注。
3.根据权利要求1所述的一种用户可扩展的标签标注方法,其特征在于,对权重向量进行降序排列,并截取其中前k位的标签作为该用户的标注标签,输出用户的标签标注作为新标签。
4.一种用于用户可扩展的标签标注方法的系统,其特征在于,包括:
数据获取模块:采样用户的样本用户数据,并标记用户的样本图片,生成样本用户标签标注矩阵,具体为对用户进行随机采样作为用户样本数据,标记用户收藏的图片作为样本图片,对样本图片进行标签标记,其中每张图片有多个标签标记或只有一个标签标记,利用用户样本数据和样本图片的标签标记生成样本用户的标签标注矩阵,其中第j个用户的标签特征向量由标记的图片标签归一化分布产生;
预处理模块:连接数据获取模块,对用户样本图片数据预处理,生成用户兴趣特征矩阵和标签兴趣特征矩阵,具体为:将每个用户样本数据作为卷积神经网络的输入数据,获取分类特征层的数值输出特征,每张图片输出一个固定维度的特征,将带有标签标注的样本图片依据用户进行归类,作为训练数据输入,综合归一化每个用户样本的特征维度,根据训练数据生成用户兴趣特征矩阵,将样本图片依据标签进行归类,作为训练数据输入,将生成的图片特征作为矩阵的横向量,构建图像特征矩阵,综合归一化每个标签样本的特征维度,生成标签兴趣特征矩阵;
计算模块:连接预处理模块,利用样本用户标签标注矩阵、用户兴趣特征矩阵和标签兴趣特征矩阵计算并生成用户标签关联知识数据,其中,计算用户标签关联知识数据的计算公式为U·A·TT≈Ut,通过梯度下降方法求解矩阵A;其中,Ut为样本用户标签标注矩阵,U为用户兴趣特征矩阵,T为标签兴趣特征矩阵,A为用户标签关联知识数据;
标签生成模块:连接计算模块,通过用户标签关联知识数据,计算生成用户新标签标注数据,其中,构建需要标注的用户的兴趣特征矩阵为U′,计算U′·A·TT,记结果为Ut′=[u1,u2,u3…ui]T,其中行向量ui为第i个用户对应的标签标注权重;逐行抽取用户的新标签关联权重,并筛选适用于用户的新标签,输出用户的标签标注数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610435965.2A CN106095966B (zh) | 2016-06-15 | 2016-06-15 | 一种用户可扩展的标签标注方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610435965.2A CN106095966B (zh) | 2016-06-15 | 2016-06-15 | 一种用户可扩展的标签标注方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106095966A CN106095966A (zh) | 2016-11-09 |
CN106095966B true CN106095966B (zh) | 2019-12-27 |
Family
ID=57235954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610435965.2A Active CN106095966B (zh) | 2016-06-15 | 2016-06-15 | 一种用户可扩展的标签标注方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106095966B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108076036A (zh) * | 2017-01-06 | 2018-05-25 | 哈尔滨安天科技股份有限公司 | 一种威胁向量提取与标签标注的系统及方法 |
CN107330001A (zh) * | 2017-06-09 | 2017-11-07 | 国政通科技股份有限公司 | 一种多元化标签的创建方法及系统 |
CN109189880A (zh) * | 2017-12-26 | 2019-01-11 | 爱品克科技(武汉)股份有限公司 | 一种基于短文本的用户兴趣分类方法 |
CN109492695B (zh) * | 2018-11-08 | 2021-07-23 | 北京字节跳动网络技术有限公司 | 数据建模的样本处理方法、装置、电子设备及可读介质 |
CN109682676A (zh) * | 2018-12-29 | 2019-04-26 | 上海工程技术大学 | 一种纤维拉伸断裂的声发射信号的特征提取方法 |
CN112000819B (zh) * | 2019-05-27 | 2023-07-11 | 北京达佳互联信息技术有限公司 | 多媒体资源推荐方法、装置、电子设备及存储介质 |
CN111522889B (zh) * | 2020-04-24 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 用户兴趣标签扩展方法、装置、电子设备及存储介质 |
CN112035750B (zh) * | 2020-09-17 | 2024-06-18 | 上海二三四五网络科技有限公司 | 一种用户标签扩展的控制方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999615A (zh) * | 2012-11-29 | 2013-03-27 | 合肥工业大学 | 基于径向基函数神经网络的多样化图像标注和检索方法 |
CN104615767A (zh) * | 2015-02-15 | 2015-05-13 | 百度在线网络技术(北京)有限公司 | 搜索排序模型的训练方法、搜索处理方法及装置 |
CN104899298A (zh) * | 2015-06-09 | 2015-09-09 | 华东师范大学 | 一种基于大规模语料特征学习的微博情感分析方法 |
CN105404632A (zh) * | 2014-09-15 | 2016-03-16 | 深港产学研基地 | 基于深度神经网络对生物医学文本序列化标注的系统和方法 |
CN105512209A (zh) * | 2015-11-28 | 2016-04-20 | 大连理工大学 | 一种基于特征自动学习的生物医学事件触发词识别方法 |
-
2016
- 2016-06-15 CN CN201610435965.2A patent/CN106095966B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999615A (zh) * | 2012-11-29 | 2013-03-27 | 合肥工业大学 | 基于径向基函数神经网络的多样化图像标注和检索方法 |
CN105404632A (zh) * | 2014-09-15 | 2016-03-16 | 深港产学研基地 | 基于深度神经网络对生物医学文本序列化标注的系统和方法 |
CN104615767A (zh) * | 2015-02-15 | 2015-05-13 | 百度在线网络技术(北京)有限公司 | 搜索排序模型的训练方法、搜索处理方法及装置 |
CN104899298A (zh) * | 2015-06-09 | 2015-09-09 | 华东师范大学 | 一种基于大规模语料特征学习的微博情感分析方法 |
CN105512209A (zh) * | 2015-11-28 | 2016-04-20 | 大连理工大学 | 一种基于特征自动学习的生物医学事件触发词识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106095966A (zh) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106095966B (zh) | 一种用户可扩展的标签标注方法及系统 | |
CN107229708B (zh) | 一种个性化出行服务大数据应用系统及方法 | |
Papadopoulos et al. | Cluster-based landmark and event detection for tagged photo collections | |
CN104112026B (zh) | 一种短信文本分类方法及系统 | |
CN105868773A (zh) | 一种基于层次随机森林的多标签分类方法 | |
CN105138977A (zh) | 一种大数据环境下的人脸识别方法 | |
CN110263021B (zh) | 一种基于个性化标签体系的主题库生成方法 | |
CN114138784B (zh) | 基于存储库的信息溯源方法、装置、电子设备及介质 | |
CN113886708A (zh) | 基于用户信息的产品推荐方法、装置、设备及存储介质 | |
Bai et al. | News classifications with labeled LDA | |
CN110309355A (zh) | 内容标签的生成方法、装置、设备及存储介质 | |
Cao et al. | Mixed weighted KNN for imbalanced datasets | |
CN107368610A (zh) | 基于全文的大文本 crf 和规则分类方法和系统 | |
US20170337484A1 (en) | Scalable web data extraction | |
CN110083654A (zh) | 一种面向国防科技领域的多源数据融合方法及系统 | |
CN109871414A (zh) | 基于上下文向量图核的生物医学实体关系分类方法 | |
CN111859135B (zh) | 适应于新学术平台的匿名用户行为挖掘与资源推荐方法 | |
Abdallah et al. | Multilevel deep learning-based processing for lifelog image retrieval enhancement | |
Pan et al. | MRNet: a keypoint guided multi-scale reasoning network for vehicle re-identification | |
Wen et al. | Research on hybrid recommendation model based on PersonRank algorithm and TensorFlow platform | |
Vollset et al. | Making use of external company data to improve the classification of bank transactions | |
Abdulrazzaq et al. | X-Ray medical image classification based on multi classifiers | |
Xu et al. | Study of network public opinion classification method based on naive Bayesian algorithm in Hadoop environment | |
KR20200140543A (ko) | 빅데이터 분석에 의한 개인 맞춤형 한국어 학습 콘텐츠를 제공하는 콘텐츠 큐레이션 시스템 | |
CN105808723B (zh) | 基于图片语义和视觉散列的图片检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |