CN116304719A - 一种判断异常分类标签的处理系统 - Google Patents

一种判断异常分类标签的处理系统 Download PDF

Info

Publication number
CN116304719A
CN116304719A CN202310541928.XA CN202310541928A CN116304719A CN 116304719 A CN116304719 A CN 116304719A CN 202310541928 A CN202310541928 A CN 202310541928A CN 116304719 A CN116304719 A CN 116304719A
Authority
CN
China
Prior art keywords
tag
label
node
classification
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310541928.XA
Other languages
English (en)
Other versions
CN116304719B (zh
Inventor
靳雯
石江枫
赵洲洋
于伟
王全修
张宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rizhao Ruian Information Technology Co ltd
Beijing Rich Information Technology Co ltd
Original Assignee
Rizhao Ruian Information Technology Co ltd
Beijing Rich Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rizhao Ruian Information Technology Co ltd, Beijing Rich Information Technology Co ltd filed Critical Rizhao Ruian Information Technology Co ltd
Priority to CN202310541928.XA priority Critical patent/CN116304719B/zh
Publication of CN116304719A publication Critical patent/CN116304719A/zh
Application granted granted Critical
Publication of CN116304719B publication Critical patent/CN116304719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及电数字数据处理技术领域,特别是涉及一种判断异常分类标签的处理系统。所述系统包括存储器、处理器和存储有计算机程序的存储介质,当所述计算机程序被所述处理器执行时,实现以下步骤:S100,获取目标用户对目标文本标注的分类标签A;S200,将A在所述标签树中进行匹配,获取匹配的标签节点PA;S300,获取分类模型对目标文本标注的分类标签B;S400,将B在所述标签树中进行匹配,获取匹配的标签节点PB;S500,遍历PB,获取pB,m与PA在所述标签树中的第一偏差度Vm;S600,获取A对应的目标偏差度V’;S700,如果V’大于偏差度阈值r0,则判定A异常。本发明提高了标签异常判断的效率。

Description

一种判断异常分类标签的处理系统
技术领域
本发明涉及电数字数据处理技术领域,特别是涉及一种判断异常分类标签的处理系统。
背景技术
在第一用户对目标文本标注分类标签之后,现有技术中一般由第二用户对第一用户标注的分类标签是否异常进行判断;当第一用户的数量较大时,上述判断第一用户标注的分类标签是否异常的工作量较大,占用了较多的人力资源,且基于人工的判断方法的效率较低。如何减少标签异常判断过程对人力资源的占用和提高判断的效率,是亟待解决的问题。
发明内容
本发明目的在于,提供一种判断异常分类标签的处理系统,减少了标签异常判断过程对人力资源的占用和提高了判断的效率。
根据本发明,提供了一种判断异常分类标签的处理系统,包括存储器,所述存储器存储有标签树,所述标签树包括Q个标签节点的信息(X1,X2,…,Xq,…,XQ),Xq为第q个标签节点的信息,q的取值范围为1到Q;Xq=(Eq,Fq),Eq为第q个标签节点,Fq为第q个标签节点的父标签节点。
所述处理系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被所述处理器执行时,实现以下步骤:
S100,获取目标用户对目标文本标注的分类标签A。
S200,将A在所述标签树中进行匹配,获取匹配的标签节点PA
S300,获取分类模型对目标文本标注的分类标签B,B=(b1,b2,…,bm,…bM),bm为分类模型对目标文本标注的第m个分类标签,m的取值范围为1到M,M为分类模型对目标文本标注的分类标签的数量。
S400,将B在所述标签树中进行匹配,获取匹配的标签节点PB;PB=(pB,1,pB,2,…,pB,m,…,pB,M),PB,m为bm在所述标签树中匹配的标签节点。
S500,遍历PB,获取pB,m与PA在所述标签树中的第一偏差度Vm,Vm=zm×(Dm,1+Dm,2),zm为bm对应的置信度,Dm,1为pB,m与PA在所述标签树中的纵向偏差度;Dm,2为pB,m与PA在所述标签树中的横向偏差度。
S600,获取A对应的目标偏差度V’=∑M m=1(wm×Vm),wm为Vm对应的权重,0≤wm≤1,∑M m=1wm=1。
S700,如果V’大于偏差度阈值r0,则判定A异常,r0>0。
本发明与现有技术相比至少具有以下有益效果:
本发明的判断异常分类标签的处理系统包括存储器,存储器中存储有标签树,目标用户对目标文本标注的分类标签A和分类模型对目标文本标注的分类标签B均可以在所述标签树中匹配到对应的标签节点;基于目标用户对应的匹配的标签节点PA和分类模型对应的匹配的标签节点PB在所述标签树中的目标偏差度,通过将目标偏差度与预设的偏差度阈值进行比较,本发明实现了对分类标签A是否存在异常的自动化判断,减少了标签异常判断过程对人力资源的占用和提高了判断的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的判断异常分类标签的处理方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明,提供了一种判断异常分类标签的处理系统,包括存储器,所述存储器存储有标签树,所述标签树包括Q个标签节点的信息(X1,X2,…,Xq,…,XQ),Xq为第q个标签节点的信息,q的取值范围为1到Q;Xq=(Eq,Fq),Eq为第q个标签节点,Fq为第q个标签节点的父标签节点。
根据本发明,每个标签节点对应一个标签,不同标签节点对应的标签不同,一个父标签节点包括一个以上的子标签节点,一个标签节点包括一个以上的父标签节点。应当理解的是,一个父标签节点是其对应的子标签节点的概括表述,一个子标签节点是其对应的父标签节点的具体表述。
本发明的处理系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被所述处理器执行时,实现判断异常分类标签的处理方法。如图1所示,判断异常分类标签的处理方法包括以下步骤:
S100,获取目标用户对目标文本标注的分类标签A。
S200,将A在所述标签树中进行匹配,获取匹配的标签节点PA
可选的,遍历所述标签树中的每个标签节点,如果所述标签树中的某个标签节点对应的标签为A,那么判定该标签节点与A匹配,判定该标签节点为匹配的标签节点PA
S300,获取分类模型对目标文本标注的分类标签B,B=(b1,b2,…,bm,…bM),bm为分类模型对目标文本标注的第m个分类标签,m的取值范围为1到M,M为分类模型对目标文本标注的分类标签的数量。
根据本发明,当M=1时,即分类标签B包括1个分类标签;当M≥2时,即分类标签B包括多个分类标签时,可选的,这M个分类标签由同一分类模型标注,或者由M个不同的分类模型标注,每个分类模型对应一个分类标签。
根据本发明,所述分类模型为经训练的神经网络模型。本领域技术人员知悉,现有技术中任何的可用于对文本进行分类的神经网络模型均落入本发明的保护范围。
可选的,对神经网络模型进行训练的过程包括:
S310,获取文本训练样本TP=(TP1,TP2,…,TPg,…,TPG),TPg为第g个文本训练样本,g的取值范围为1到G,G为文本训练样本的数量。
S320,遍历TP,对TP的分类标签进行标注,得到文本训练样本标注BP=(BP1,BP2,…,BPg,…,BPG),BPg为TPg对应的分类标签。
根据本发明,不同文本对应的分类标签可能相同或不同,可选的,对TP的分类标签进行标注时只标注一个分类标签,或者对TP的分类标签进行标注时可以标注两个以上的分类标签。
S330,利用TP和BP对神经网络模型进行训练。
应当理解的是,经训练的神经网络模型即具备对文本进行分类标签标注的功能。本发明对神经网络进行训练的过程属于有监督的训练过程,本领域技术人员知悉,现有技术中任何的有监督训练的方法均落入本发明的保护范围。
S400,将B在所述标签树中进行匹配,获取匹配的标签节点PB;PB=(pB,1,pB,2,…,pB,m,…,pB,M),PB,m为bm在所述标签树中匹配的标签节点。
可选的,对于B中的每一分类标签bm,遍历所述标签树中的每个标签节点,如果所述标签树中的某个标签节点对应的标签为bm,那么判定该标签节点与bm匹配,判定该标签节点为匹配的标签节点pB,m
S500,遍历PB,获取pB,m与PA在所述标签树中的第一偏差度Vm,Vm=zm×(Dm,1+Dm,2),zm为bm对应的置信度,Dm,1为pB,m与PA在所述标签树中的纵向偏差度;Dm,2为pB,m与PA在所述标签树中的横向偏差度。
根据本发明,分类模型对目标文本进行分类标签标注的任务本质是一个分类的任务,分类模型输出其对分类标签的标注结果时,一般还输出有对应分类标签的概率,当M≥2且这M个分类标签由同一分类模型标注时,可将该同一分类模型输出的对应的概率作为对应分类标签的置信度;当M≥2且这M个分类标签由M个不同的分类模型标注时,可将每一分类模型输出的分类标签对应的概率作为对应分类标签的置信度;当M=1时,将进行标注的分类模型输出的分类标签对应的概率作为置信度。
可选的,所述存储器还存储有标签关联表,所述标签关联表包括N条记录(l 1,l 2,…,l n,…,l N),l n为第n条记录,n的取值范围为1到N;l n=(e1 n,e2 n,fn),e1 nl n包括的第一标签节点,e2 nl n包括的第二标签节点,fn为e1 n与e2 n的相似度,0≤fn≤1;Dm,2的获取方法包括:
S510,获取pB,m与PA在所述标签树中的最近公共祖先。
本领域技术人员知悉,现有技术中任何的获取最近公共祖先的方法均落入本发明的保护范围。
S520,如果pB,m与PA在所述标签树中的最近公共祖先为pB,m或PA,则获取Dm,2为0;否则,进入S530。
S530,将pB,m与PA在所述标签关联表中进行匹配,得到匹配的记录;所述匹配的记录为对应的第一标签节点为pB,m且第二标签节点为PA的记录或者对应的第一标签节点为PA且第二标签节点为pB,m的记录。
S540,获取Dm,2=1-f’,f’为所述匹配的记录中的相似度。
可选的,本发明中标签关联表中的相似度是用户根据经验设置的,两标签节点的相似度越大,说明两标签节点对应的标签越相近,差异越小。根据本发明,f’越大,Dm,2越小,说明pB,m与PA在所述标签树中的横向偏差度越小,即横向差异越小;f’越小,Dm,2越大,说明pB,m与PA在所述标签树中的横向偏差度越大,即横向差异越大。
可选的,Dm,1的获取方法包括:
S501,获取pB,m与PA在所述标签树中的最近公共祖先。
S502,获取所述标签树中pB,m到所述最近公共祖先的第一累加权重Hm,Hm=∑R1 i= 1 l 1,il 1,i为pB,m到所述最近公共祖先的路径中第i条边对应的权重,i的取值范围为1到R1,R1为pB,m到所述最近公共祖先的路径中边的数量。
应当理解的是,标签树中除包括标签节点之外,还包括用于连接两标签节点的边。对于任一条边而言,其对应两个标签节点,其中一个标签节点为上层节点,另一个标签节点为下层节点,所述上层节点为所述下层节点的父节点,所述下层节点为所述上层节点的子节点。
本发明中l 1,il 1,i对应的上层节点包括的子节点的数量S相关,可选的,l 1,i的获取方法包括:
S5021,如果l 1,i对应的下层节点为叶子节点,则l 1,i=1。
S5022,如果l 1,i对应的下层节点为非叶子节点,则l 1,i=-∑S d=1(pd×logpd),pdl 1,i对应的上层节点包括的第d个子节点对应的概率,pd=1/S,d的取值范围为1到S,S为l 1,i对应的上层节点包括的子节点的数量。
S503,获取所述标签树中PA到所述最近公共祖先的第二累加权重H’;H’=∑R2 j= 1 l 2,jl 2,j为PA到所述最近公共祖先的路径中第j条边对应的权重,j的取值范围为1到R2,R2为PA到所述最近公共祖先的路径中边的数量。
本发明中l 2,jl 2,j对应的上层节点包括的子节点的数量C相关,可选的,l 2,j的获取方法包括:
S5021,如果l 2,j对应的下层节点为叶子节点,则l 2,j=1。
S5022,如果l 2,j对应的下层节点为非叶子节点,则l 2,j=-∑C a=1(pa×logpa),pal 2,j对应的上层节点包括的第a个子节点对应的概率,pa=1/C,a的取值范围为1到C,C为l 2,j对应的上层节点包括的子节点的数量。
S504,获取Dm,1=Hm-H’。
根据本发明,Dm,1用于表示pB,m与PA在所述标签树中的纵向差异的大小,Dm,1越小,说明pB,m与PA在所述标签树中的纵向偏差度越小,即纵向差异越小;Dm,1越大,说明pB,m与PA在所述标签树中的纵向偏差度越大,即纵向差异越大。需要说明的是,Hm<H’时,Dm,1<0,本发明中Dm,1<0表征pB,m与PA在所述标签树中的纵向偏差度较小。
S600,获取A对应的目标偏差度V’=∑M m=1(wm×Vm),wm为Vm对应的权重,0≤wm≤1,∑M m=1wm=1。
作为第一实施例,将各pB,m对应的第一偏差度的均值作为目标偏差度wm,wm=1/M。
作为第二实施例,将各pB,m对应的第一偏差度中最大的第一偏差度作为目标偏差度,wm的获取方法包括:
S601,获取max(V1,V2,…,Vm,…,VM),max( )为求最大值。
S602,如果Vm=max(V1,V2,…,Vm,…,VM),则获取wm=1;否则,获取wm=0。
作为第三实施例,将各pB,m对应的第一偏差度中最小的第一偏差度作为目标偏差度,wm的获取方法包括:
S611,获取min(V1,V2,…,Vm,…,VM),min( )为求最小值。
S612,如果Vm=min(V1,V2,…,Vm,…,VM),则获取wm=1;否则,获取wm=0。
S700,如果V’大于偏差度阈值r0,则判定A异常,r0>0。
根据本发明,如果V’小于等于偏差度阈值r0,则判定A不存在异常。
可选的,偏差度阈值r0为用户的经验值,或者通过以下方法获取r0
S710,获取样本用户对样本文本标注的分类标签T={t1,t2,…,ty,…,tY},ty为第y个样本用户对样本文本标注的分类标签,y的取值范围为1到Y,Y为样本用户的数量。
S720,遍历T,将ty对应的目标偏差度追加到预设目标偏差度集合J,J的初始化为Null。
本发明采用与获取A对应的目标偏差度相同的方法获取ty对应的目标偏差度,此处不再赘述。应当理解的是,遍历T后得到的J包括各ty对应的目标偏差度。
S730,获取r0=k×mean(J),mean( )为求平均值,k为预设比例。
本发明中k由用户提前设置,应当理解的是,r0越大,判断异常的条件越宽松;r0越小,判断异常的条件越严苛。
本发明的判断异常分类标签的处理系统包括存储器,存储器中存储有标签树,目标用户对目标文本标注的分类标签A和分类模型对目标文本标注的分类标签B均可以在所述标签树中匹配到对应的标签节点;基于目标用户对应的匹配的标签节点PA和分类模型对应的匹配的标签节点PB在所述标签树中的目标偏差度,通过将目标偏差度与预设的偏差度阈值进行比较,本发明实现了对分类标签A是否存在异常的自动化判断,减少了标签异常判断过程对人力资源的占用和提高了判断的效率。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明的范围由所附权利要求来限定。

Claims (9)

1.一种判断异常分类标签的处理系统,其特征在于,包括存储器,所述存储器存储有标签树,所述标签树包括Q个标签节点的信息(X1,X2,…,Xq,…,XQ),Xq为第q个标签节点的信息,q的取值范围为1到Q;Xq=(Eq,Fq),Eq为第q个标签节点,Fq为第q个标签节点的父标签节点;
所述处理系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被所述处理器执行时,实现以下步骤:
S100,获取目标用户对目标文本标注的分类标签A;
S200,将A在所述标签树中进行匹配,获取匹配的标签节点PA
S300,获取分类模型对目标文本标注的分类标签B,B=(b1,b2,…,bm,…bM),bm为分类模型对目标文本标注的第m个分类标签,m的取值范围为1到M,M为分类模型对目标文本标注的分类标签的数量;
S400,将B在所述标签树中进行匹配,获取匹配的标签节点PB;PB=(pB,1,pB,2,…,pB,m,…,pB,M),PB,m为bm在所述标签树中匹配的标签节点;
S500,遍历PB,获取pB,m与PA在所述标签树中的第一偏差度Vm,Vm=zm×(Dm,1+Dm,2),zm为bm对应的置信度,Dm,1为pB,m与PA在所述标签树中的纵向偏差度;Dm,2为pB,m与PA在所述标签树中的横向偏差度;
S600,获取A对应的目标偏差度V’=∑M m=1(wm×Vm),wm为Vm对应的权重,0≤wm≤1,∑M m=1wm=1;
S700,如果V’大于偏差度阈值r0,则判定A异常,r0>0。
2.根据权利要求1所述的判断异常分类标签的处理系统,其特征在于,所述存储器还存储有标签关联表,所述标签关联表包括N条记录(l 1,l 2,…,l n,…, l N),l n为第n条记录,n的取值范围为1到N;l n=(e1 n,e2 n,fn),e1 nl n包括的第一标签节点,e2 nl n包括的第二标签节点,fn为e1 n与e2 n的相似度,0≤fn≤1;Dm,2的获取方法包括:
S510,获取pB,m与PA在所述标签树中的最近公共祖先;
S520,如果pB,m与PA在所述标签树中的最近公共祖先为pB,m或PA,则获取Dm,2为0;否则,进入S530;
S530,将pB,m与PA在所述标签关联表中进行匹配,得到匹配的记录;所述匹配的记录为对应的第一标签节点为pB,m且第二标签节点为PA的记录或者对应的第一标签节点为PA且第二标签节点为pB,m的记录;
S540,获取Dm,2=1-f’,f’为所述匹配的记录中的相似度。
3.根据权利要求1所述的判断异常分类标签的处理系统,其特征在于,Dm,1的获取方法包括:
S501,获取pB,m与PA在所述标签树中的最近公共祖先;
S502,获取所述标签树中pB,m到所述最近公共祖先的第一累加权重Hm,Hm=∑R1 i=1 l 1,il 1,i为pB,m到所述最近公共祖先的路径中第i条边对应的权重,i的取值范围为1到R1,R1为pB,m到所述最近公共祖先的路径中边的数量;
S503,获取所述标签树中PA到所述最近公共祖先的第二累加权重H’;H’=∑R2 j=1 l 2,jl 2,j为PA到所述最近公共祖先的路径中第j条边对应的权重,j的取值范围为1到R2,R2为PA到所述最近公共祖先的路径中边的数量;
S504,获取Dm,1=Hm-H’。
4.根据权利要求3所述的判断异常分类标签的处理系统,其特征在于,l 1,i的获取方法包括:
S5021,如果l 1,i对应的下层节点为叶子节点,则l 1,i=1;
S5022,如果l 1,i对应的下层节点为非叶子节点,则l 1,i=-∑S d=1(pd×logpd),pdl 1,i对应的上层节点包括的第d个子节点对应的概率,pd=1/S,d的取值范围为1到S,S为l 1,i对应的上层节点包括的子节点的数量。
5.根据权利要求1所述的判断异常分类标签的处理系统,其特征在于,wm=1/M。
6.根据权利要求1所述的判断异常分类标签的处理系统,其特征在于,wm的获取方法包括:
S601,获取max(V1,V2,…,Vm,…,VM),max( )为求最大值;
S602,如果Vm=max(V1,V2,…,Vm,…,VM),则获取wm=1;否则,获取wm=0。
7.根据权利要求1所述的判断异常分类标签的处理系统,其特征在于,wm的获取方法包括:
S611,获取min(V1,V2,…,Vm,…,VM),min( )为求最小值;
S612,如果Vm=min(V1,V2,…,Vm,…,VM),则获取wm=1;否则,获取wm=0。
8.根据权利要求1所述的判断异常分类标签的处理系统,其特征在于,r0的获取方法包括:
S710,获取样本用户对样本文本标注的分类标签T={t1,t2,…,ty,…,tY},ty为第y个样本用户对样本文本标注的分类标签,y的取值范围为1到Y,Y为样本用户的数量;
S720,遍历T,将ty对应的目标偏差度追加到预设目标偏差度集合J,J的初始化为Null;
S730,获取r0=k×mean(J),mean( )为求平均值,k为预设比例。
9.根据权利要求1所述的判断异常分类标签的处理系统,其特征在于,所述分类模型为经训练的神经网络模型。
CN202310541928.XA 2023-05-15 2023-05-15 一种判断异常分类标签的处理系统 Active CN116304719B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310541928.XA CN116304719B (zh) 2023-05-15 2023-05-15 一种判断异常分类标签的处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310541928.XA CN116304719B (zh) 2023-05-15 2023-05-15 一种判断异常分类标签的处理系统

Publications (2)

Publication Number Publication Date
CN116304719A true CN116304719A (zh) 2023-06-23
CN116304719B CN116304719B (zh) 2023-08-04

Family

ID=86789031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310541928.XA Active CN116304719B (zh) 2023-05-15 2023-05-15 一种判断异常分类标签的处理系统

Country Status (1)

Country Link
CN (1) CN116304719B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5067166A (en) * 1989-03-24 1991-11-19 International Business Machines Corporation Method and apparatus for dp matching using multiple templates
US20080114573A1 (en) * 2006-11-10 2008-05-15 Institute For Information Industry Tag organization methods and systems
CN109543756A (zh) * 2018-11-26 2019-03-29 重庆邮电大学 一种基于主动学习的标签查询与更改方法
CN109887497A (zh) * 2019-04-12 2019-06-14 北京百度网讯科技有限公司 语音识别的建模方法、装置及设备
CN111626362A (zh) * 2020-05-28 2020-09-04 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和存储介质
CN112015898A (zh) * 2020-08-28 2020-12-01 支付宝(杭州)信息技术有限公司 基于标签树的模型训练、文本标签确定方法及装置
CN113407719A (zh) * 2021-06-10 2021-09-17 平安科技(深圳)有限公司 文本数据的检测方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5067166A (en) * 1989-03-24 1991-11-19 International Business Machines Corporation Method and apparatus for dp matching using multiple templates
US20080114573A1 (en) * 2006-11-10 2008-05-15 Institute For Information Industry Tag organization methods and systems
CN109543756A (zh) * 2018-11-26 2019-03-29 重庆邮电大学 一种基于主动学习的标签查询与更改方法
CN109887497A (zh) * 2019-04-12 2019-06-14 北京百度网讯科技有限公司 语音识别的建模方法、装置及设备
CN111626362A (zh) * 2020-05-28 2020-09-04 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和存储介质
CN112015898A (zh) * 2020-08-28 2020-12-01 支付宝(杭州)信息技术有限公司 基于标签树的模型训练、文本标签确定方法及装置
CN113407719A (zh) * 2021-06-10 2021-09-17 平安科技(深圳)有限公司 文本数据的检测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN116304719B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN110309331B (zh) 一种基于自监督的跨模态深度哈希检索方法
US20220101059A1 (en) Learning system, learning device, learning method, learning program, teacher data creation device, teacher data creation method, teacher data creation program, terminal device, and threshold value changing device
US20210382937A1 (en) Image processing method and apparatus, and storage medium
US7783581B2 (en) Data learning system for identifying, learning apparatus, identifying apparatus and learning method
US8463051B2 (en) Modeling images as mixtures of image models
CN109189767B (zh) 数据处理方法、装置、电子设备及存储介质
WO2019158015A1 (zh) 样本获取方法、目标检测模型生成方法、目标检测方法
CN109829478B (zh) 一种基于变分自编码器的问题分类方法和装置
US10163020B2 (en) Systems and methods for identifying objects in media contents
CN113434684B (zh) 自监督学习的谣言检测方法、系统、设备及存储介质
CN116701303A (zh) 基于深度学习的电子文件分类方法、系统及可读存储介质
WO2022156822A1 (zh) 一种分类模型训练方法及系统
Alalyan et al. Model-based hierarchical clustering for categorical data
WO2020114109A1 (zh) 嵌入结果的解释方法和装置
US20100169292A1 (en) Slideshow video file detection
CN116304719B (zh) 一种判断异常分类标签的处理系统
TW201243627A (en) Multi-label text categorization based on fuzzy similarity and k nearest neighbors
CN115019305B (zh) 一种根尖细胞的识别方法、装置、设备及可读存储介质
Yakhnenko et al. Multi-modal hierarchical Dirichlet process model for predicting image annotation and image-object label correspondence
CN114120048B (zh) 图像处理方法、电子设备及计算存储介质
CN111767402B (zh) 一种基于对抗学习的限定域事件检测方法
US20170293863A1 (en) Data analysis system, and control method, program, and recording medium therefor
CN112883191B (zh) 一种农业实体自动识别的分类方法及装置
EP2172874B1 (en) Modeling images as mixtures of image models
JP2012174083A (ja) プログラム及び情報処理システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant