CN114722825A - 标签生成方法、装置、存储介质及计算机设备 - Google Patents
标签生成方法、装置、存储介质及计算机设备 Download PDFInfo
- Publication number
- CN114722825A CN114722825A CN202210354702.4A CN202210354702A CN114722825A CN 114722825 A CN114722825 A CN 114722825A CN 202210354702 A CN202210354702 A CN 202210354702A CN 114722825 A CN114722825 A CN 114722825A
- Authority
- CN
- China
- Prior art keywords
- label
- text
- generated
- tag
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Abstract
本发明公开了一种标签生成方法、装置、存储介质及计算机设备,涉及信息技术领域,主要在于能够提高标签生成的精度。其中方法包括:获取待生成标签文本;将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;基于所述各个标签,确定所述待生成标签文本中的目标标签。本发明适用于对标签进行生成。
Description
技术领域
本发明涉及信息技术领域,尤其是涉及一种标签生成方法、装置、存储介质及计算机设备。
背景技术
文本中的标签是根据语言描述抽象出的关键词,能够概括出文本的主要信息,通过在文本中生成标签能够为后续自然语言处理提供基础,因此,高效准确地在文本中生成标签对自然语言处理有着重要的意义。
目前,通常仅采用神经网络模型来识别文本中的词语,并将所述词语确定所述文本中的标签。然而,这种方式仅能识别文本中单一类别的词语作为标签,无法抽取出多类别组合的词作为文本中的标签,例如,只能抽取出“疫苗”标签,而不能抽取出“儿童疫苗”标签,因此,导致文本中标签生成的精度较低。
发明内容
本发明提供了一种标签生成方法、装置、存储介质及计算机设备,主要在于能够提高标签生成的精度。
根据本发明的第一个方面,提供一种标签生成方法,包括:
获取待生成标签文本;
将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;
将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;
基于所述各个标签,确定所述待生成标签文本中的目标标签。
根据本发明的第二个方面,提供一种标签生成装置,包括:
获取单元,用于获取待生成标签文本;
实体识别单元,用于将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;
标签识别单元,用于将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;
确定单元,用于基于所述各个标签,确定所述待生成标签文本中的目标标签。
根据本发明的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取待生成标签文本;
将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;
将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;
基于所述各个标签,确定所述待生成标签文本中的目标标签。
根据本发明的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
获取待生成标签文本;
将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;
将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;
基于所述各个标签,确定所述待生成标签文本中的目标标签。
根据本发明提供的一种标签生成方法、装置、存储介质及计算机设备,与目前仅采用神经网络模型来识别文本中的实体,并将所述实体确定所述文本中的标签的方式相比,本发明通过获取待生成标签文本;并将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;与此同时,将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;最终基于所述各个标签,确定所述待生成标签文本中的目标标签,由此通过首先获取待生成标签文本中的实体,并将所述待生成标签文本和所述实体再共同输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中的各个标签,最终在所述各个标签中确定所述待生成标签文本中的目标标签,避免仅通过词语识别来确定文本中部分标签的情况,从而提高了标签生成的精度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明实施例提供的一种标签生成方法流程图;
图2示出了本发明实施例提供的另一种标签生成方法流程图;
图3示出了本发明实施例提供的一种标签生成装置的结构示意图;
图4示出了本发明实施例提供的另一种标签生成装置的结构示意图;
图5示出了本发明实施例提供的一种计算机设备的实体结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
目前,仅采用神经网络模型来识别文本中的实体,并将所述实体确定所述文本中的标签的方式,仅能识别出文本中的部分标签,而不能够识别出文本中的组合实体对应的标签,降低了文本中标签生成的精度。
为了解决上述问题,本发明实施例提供了一种标签生成方法,如图1所示,所述方法包括:
101、获取待生成标签文本。
其中,待生成标签文本可以是一个或多个文本,也可以是一段或多段语句,本发明实施例不做具体限定。
对于本发明实施例,为了解决现有技术中标签生成精度低的问题,本发明能够通过首先获取待生成标签文本中的实体,并将所述待生成标签文本和所述实体再共同输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中的各个标签,最终在所述各个标签中确定所述待生成标签文本中的目标标签,避免仅通过实体识别来确定文本中部分标签的情况,从而提高了标签生成的精度。本发明实施例主要应用于对文本中的标签进行生成的场景,本发明实施例的执行主体为能够对文本中的标签进行生成的装置或者设备,具体可以设置在客户端或者服务器一侧。
具体地,所述待生成标签文本可以存储至文本数据库中,若需要在所述待生成标签文本中生成标签,需要在所述文本数据库中获取所述待生成标签文本,用户可以将获取到的待生成标签文本上传至装置侧,并在所述装置测完成文本中标签的生成。
102、将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体。
其中,待生成标签文本中可以包括一个或者多个实体,所述实体如:儿童、疫苗、疾病等,所述实体还包括儿童对应的人群,疫苗对应的药物等。
对于本发明实施例,在文本数据库中获取所述待生成标签文本后,为了在所述待生成标签文本中生成标签,首先需要获取所述待生成标签文本中的各个实体,具体可以将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中的各个实体,例如,将所述医疗文本输入至预设实体识别模型中进行实体识别,得到所述语料文本中的各个实体为儿童、疫苗、感冒、疾病等实体,之后将待生成标签文本中的各个实体和待生成标签文本再共同输入至预设标签生成模型中进行标签识别,最终确定诉所述待生成标签文本中包含的标签,由此能够避免仅通过词语识别来确定文本中部分标签的情况,从而提高了标签生成的精度。
103、将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签。
对于本发明实施例,因为识别出的实体仅包含单个词语,例如,识别出的实体包括儿童、发烧、疫苗,而儿童实体和疫苗实体的组合“儿童疫苗”也属于标签,所以为了将所述待生成标签文本中的各个标签都识别出来,在确定所述待生成标签文本中的各个实体后,还需要确定所述实体对应的向量,同时确定所述待生成标签文本对应的向量,之后将两个向量进行组合,得到组合后的向量,最终基于组合后的向量,确定所述待生成标签文本中包含的各个标签,由此能够提高标签生成的精度,例如,通过实体识别模型识别出医疗文本中的各个实体为胸痛、咳嗽、气喘、四肢、无力、变异性、哮喘,之后将上述各个实体和医疗文本共同输入至预设标签生成模型中进行标签识别,得到所述医疗文本中包含的各个标签为“胸痛、咳嗽、气喘、四肢、无力、四肢无力、变异性、哮喘、变异性哮喘”,由此可知,最终得到的文本中的标签大于识别出的实体,进而提高了文本中标签生成的精度。
104、基于所述各个标签,确定所述待生成标签文本中的目标标签。
对于本发明实施例,将所述各个实体和所述待生成标签文本输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中的各个标签后,为了提高所述标签生成的准确性,需要对各个标签进行检测,将错误的标签剔除,保留正确的标签,最终将所述正确的标签确定为所述待生成标签文本中的目标标签,例如,所述各个实体和所述待生成标签文本输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中的各个标签为肺炎、高血压、冠心病、胸闷气短、感觉,对上述标签进行检查,发现“感觉”不属于标签,将感觉在上述实体中去除,得到所述待生成标签文本中包含的目标实体,由此通过首先获取待生成标签文本中的实体,并将所述待生成标签文本和所述实体再共同输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中的各个标签,最终在所述各个标签中确定所述待生成标签文本中的目标标签,避免仅通过词语识别来确定文本中部分标签的情况,从而提高了标签生成的精度。
根据本发明提供的一种标签生成方法,与目前仅采用神经网络模型来识别文本中的实体,并将所述实体确定所述文本中的标签的方式相比,本发明通过获取待生成标签文本;并将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;与此同时,将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;最终基于所述各个标签,确定所述待生成标签文本中的目标标签,由此通过首先获取待生成标签文本中的实体,并将所述待生成标签文本和所述实体再共同输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中的各个标签,最终在所述各个标签中确定所述待生成标签文本中的目标标签,避免仅通过词语识别来确定文本中部分标签的情况,从而提高了标签生成的精度。
进一步的,为了更好的说明上述标签生成的过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种标签生成方法,如图2所示,所述方法包括:
201、获取待生成标签文本。
具体地,在文本数据库中可以获取待生成标签文本,也可以在网络上下载所述待生成标签文本,所述待生成标签文本可以是医疗方面的文本,也可以是其他方面的文本,与此同时,所述文本可以是一篇文章,也可以是一段话,本发明不做具体限定,获取到所述待生成标签文本后,获取所述待生成标签文本中包含的各个实体,之后将所述实体和所述待生成标签文本输入至预设标签生成模型中进行标签识别,得到各个标签,最终在所述各个标签中确定所述待生成标签文本中的目标标签。
202、对所述待生成标签文本中的文本语句进行分词处理,得到所述文本语句对应的各个分词。
具体地,获取到所述待生成标签文本后,为了确定所述待生成标签文本中的标签,若所述待生成标签文本为一篇文章,首先需要确定所述待生成标签文本中包含的文本语句,并对所述文本语句进行分词处理,得到所述文本语句对应的各个分词,例如,所述文本语句为“5岁以上的儿童可以接种流感疫苗”,对所述文本语句进行分词处理,得到所述文本语句对应的各个分词为“5岁/以上/的/儿童/可以/接种/流感/疫苗/”,又如所述文本语句为“儿童需要打的疫苗”,对所述文本语句进行分词处理,得到所述文本语句对应的各个分词为“儿童/需要/打/的/疫苗”。
203、将所述各个分词输入至所述预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体。
对于本发明实施例,在获取所述文本语句对应的各个分词后,需要基于所述各个分词,确定所述待生成标签文本中包含的各个实体,基于此,步骤203具体包括:将所述各个分词按照其在所述待生成标签文本中的顺序输入至第一递归神经网络中进行特征提取,得到所述各个分词共同对应的第一特征向量;将所述各个分词按照其在所述待生成标签文本中的顺序逆序输入至第二递归神经网络中进行特征提取,得到所述各个分词共同对应的第二特征向量;将所述第一特征向量和所述第二特征向量进行合并,得到合并后的特征向量,并根据所述合并后的特征向量,确定所述各个分词对应的实体类别;基于所述实体类别,确定所述待生成标签文本中包含的实体。
具体地,该预设实体识别模型包括第一递归神经网络和第二递归神经网络,通过第一递归神经网络和第二递归神经网络组成一个双向LSTM网络,在利用预设实体识别模型进行实体识别时,将各个分词对应的词向量按照各个分词在待生成标签文本中的顺序输入至第一递归神经网络进行特征提取,得到各个分词共同对应的第一特征向量,再将各个分词对应的词向量按照各个分词在待生成标签文本中的顺序逆序输入至第二递归神经网络进行特征提取,得到各个分词共同对应的第二特征向量,接着将第一特征向量和第二特征向量进行合并,得到合并后的特征向量,例如,将两个32维的特征向量拼接成64维的特征向量,之后将合并后的特征向量输入softmax网络,得到各个分词属于不同实体类别的概率值,最终在所述概率值中确定最大概率值,并将所述最大概率值对应的实体类别确定为所述分词对应的实体类别。
对于本发明实施例,为了提高实体识别的准确率,利用条件随机网络CRF对softmax网络的输出结果进行约束,CRF网络能够对各个分词属于不同实体类别的概率值进行修正,并基于修正后的各个分词属于不同实体类别的概率值,确定各个分词对应的实体类别,最终基于所述各个分词对应的实体类别,确定所述待生成标签文本中包含的各个实体,例如,文本语句对应的各个分词为“高血压/和/糖尿病/患者/不能/接种/新冠/疫苗/,/若/要/接种/,/需要/进行/全面/体检/”,并将所述各个分词输入至预设实体识别模型中进行实体识别,得到待生成标签文本中包含的各个实体为“高血压”、“糖尿病”、“疫苗”、等。
204、将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签。
对于本发明实施例,在获取所述待生成标签文本中包含的各个实体后,需要将所述待生成标签文本与所述各个实体相结合来确定所述待生成标签文本中包含的各个标签,基于此,步骤204具体包括:确定所述待生成标签文本中各个第一字符对应的第一嵌入向量,以及所述实体中各个第二字符对应的第二嵌入向量;将所述第一嵌入向量与所述第二嵌入向量进行横向拼接,得到各个字符对应的拼接后的向量,其中,所述各个字符包括各个第一字符和各个第二字符;将所述拼接后的向量输入至预设自然语言模型中进行语义信息提取,得到所述待生成标签文本对应的语义信息向量;将所述语义信息向量输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签。
其中,预设自然语言模型具体可以为预设自然语言BERT模型,预设自然语言BERT模型中包括多个编码器,每个编码器首尾相连,上一个编码器的输出会作为下一个编码器的输入,该编码器具体包括注意力层和前馈神经网络层。
具体地,首先确定待生成标签文本中包含的各个第一字符,例如待生成标签文本为“先天性心脏病”,则待生成标签文本对应的各个第一字符为“先/天/性/心/脏/病/”,之后利用bert模型中的词嵌入方法将待生成标签文本中的各个第一字符转化为第一嵌入向量,与此同时,确定所述各个实体中包含的各个第二字符,例如各个实体为“儿童、疫苗、感冒”,上述各个实体对应的各个第二字符为“儿/童//疫/苗//感/冒”,之后利用bert模型中的词嵌入方法将各个实体中的各个第二字符转化为第二嵌入向量,并将所述第一嵌入向量和所述第二嵌入向量进行横向拼接,得到拼接后的向量,例如,第一嵌入向量为[1,2,4],第二嵌入向量为[3,4,5],则将第一嵌入向量和所述第二嵌入向量进行横向拼接,得到拼接后的向量为[1,2,4,3,4,5],之后将所述拼接后的向量输入至预设自然语言模型中进行语义信息提取,得到所述待生成标签文本对应的语义信息向量,具体获取所述语义信息向量的方法包括:将所述拼接后的向量输入至所述注意力层进行特征提取,得到所述各个字符对应的第三特征向量;将所述第三特征向量和所述拼接后的向量相加,得到所述各个字符对应的第四特征向量;将所述第四特征向量输入至所述前馈神经网络层进行特征提取,得到所述待生成标签文本对应的语义信息向量。
其中,第三特征向量为注意力层的输出向量,待生成标签文本对应的语义信息向量为最后一个编码器的前馈神经网络层的输出向量。
具体地,在利用预设自然语言BERT模型提取待生成标签文本对应的语义信息向量的过程中,首先将拼接后的嵌入向量输入至预设自然语言BERT模型中第一个编码器的注意力层进行特征提取,得到该注意力层的输出向量,即各个字符对应的第三特征向量,其中,在注意力层进行特征提取的具体过程为:根据所述拼接后的嵌入向量,确定所述各个字符对应的查询向量、键向量和值向量;将所述各个字符中的目标字符对应的查询向量与所述各个字符对应的键向量相乘,得到所述各个字符针对所述目标字符的注意力分值;将所述各个字符对应的所述注意力分值和所述值向量相乘并求和,得到所述目标字符对应的第一特征向量。
对于本发明实施例,在获取各个字符对应的第三特征向量的过程中,可以将各个字符对应的拼接后的向量与预设BERT模型中注意力层对应的权重矩阵相乘,得到各个字符对应的查询向量、键向量和值向量,进一地,需要计算各个字符对应的注意力分值,在计算各个字符中任意一个字符(目标字符)对应的注意力分值时,需要利用各个字符对目标字符进行打分,具体地,将目标字符对应的查询向量与各个字符对应的键向量相乘,得到各个字符对目标字符的打分值,即注意力分值,之后将各个字符对应的注意力分值和值向量相乘求和,最终得到目标字符对应的注意力层输出向量,即目标字符对应的第三特征向量,由此按照上述方式能够确定各个字符对应的第三特征向量,以便利用各个字符对应的第三特征向量获取待生成标签文本对应的语义信息向量。
进一步地,为了获取待生成标签文本对应的语义信息向量,在将各个字符对应的拼接后的向量输入至第一个编码器的注意力层,提取到各个字符对应的第三特征向量之后,需要将第三特征向量与各个字符对应的拼接后的向量相加,得到各个字符对应的第四特征向量,并将第四特征向量输入至第一个编码器的前馈神经网络层中进行特征提取,得到第一个编码器的输出向量,因为本发明实施例中的预设自然语言BERT模型包含多个编码器,且多个编码器之间采用首尾串联的方式,因此将第一个编码器的输出向量输入至第二个编码器中进行特征提取,得到第二个编码器的输出向量,以此将前一个编码器的输出向量作为下一个编码器的输入向量,最终将最后一个编码器的输出向量确定为待生成标签文本对应的语义信息向量,之后将所述语义信息向量输入至预设标签生成模型中进行标签识别,所述预设标签生成模型可以为预设分类器,具体地,在确定待生成标签文本对应的语义信息向量之后,将该语义信息向量输入至预设分类器中进行分类,该语义信息向量在预设分类器中经过最后一个全连接层输出后,再输入预设分类器的softmax层,得到所述待生成标签文本中包含的各个标签。
205、基于所述各个标签,确定所述待生成标签文本中的目标标签。
对于本发明实施例,在获取所述待生成标签文本中的各个标签后,为了提高所述文本标签生成的精度,需要在所述各个标签中确定所述待生成标签文本对应的目标标签,基于此,步骤205具体包括:在预设字符字典中查询所述各个标签对应的标签注释;基于所述各个标签及其对应的标签注释,确定所述待生成标签文本中的目标标签。
具体地,为了提高所述待生成标签文本中标签生成的精度,在确定所述待生成标签文本中的各个标签,即候选标签集后,还需要借助外部知识库,所述外部知识库可以为预设字符字典,也可以为知识图谱,本发明不做具体限定,基于所述外部知识库查询所述候选标签集中的各个标签对应的标签解释,之后基于所述标签及其对应的标签解释,确定所述待生成标签文本对应的目标标签,具体确定所述待生成标签文本中目标标签的方法为:将所述各个标签及其对应的标签注释输入至预设分类模型中进行分类,得到所述各个标签对应的概率值;在所述概率值中确定大于预设阈值的目标概率值,并将所述目标概率值对应的标签确定为所述待生成标签文本中的目标标签。
具体地,预设分类模型具体可以为多层感知器模型,多层感知器是一种神经网络模型,它包括输入层、隐藏层和输出层。
对于本发明实施例,为了得到待生成标签文本中的目标标签,所述方法包括:将所述各个标签及其对应的标签注释输入至所述多层感知器,提取所述多层感知器中最后一个全连接层输出的特征,并将所述最后一个全连接层输出的特征输入至所述多层感知器中的softmax层,得到所述待生成标签文本对应的目标标签。
具体地,确定所述各个标签及其标签注释对应的各个字符,并将所述各个字符对应的嵌入向量通过多层感知器模型的输入层输入至隐藏层,通过该隐藏层输出的结果为:
f(W1x+b1)
其中,该输出结果即为各个字符对应的嵌入向量经过预设分类模型的全连接输出的结果,x为各个字符对应的嵌入向量,w1为隐藏层的权重,也是多层感知器的连接系数,b1为隐藏层的偏置系数,f函数通常可以采用sigmoid函数或者tanh函数,如下所示:
sigmoid(x)=1/(1+e-x)
tanh(x)=(ex-e-x)/(e1+e-x)
进一步地,在将各个标签及其标签注释中各个字符对应的嵌入向量通过多层感知器模型的输入层输入至隐藏层,得到该隐藏层输出的结果之后,再将该结果输入至输出层,即所述多层感知器的softmax层,通过该输出层进行标签推荐,得到的推荐结果为:
softmax(W2f(W1x+b1)+b2)
其中,W2为输出层的权重系数,b2为输出层的偏置系数,通过该多层感知器模型的输出层能够输出待生成标签文本中的目标标签,该目标标签对应着概率值,在所述概率值中确定大于预设阈值的目标概率值,并将所述目标概率值对应的标签确定为待生成标签文本中的目标标签,例如,若预设阈值为0.80,输出的各个标签及其对应的概率值为:儿童-0.85、疫苗-0.91、儿童疫苗-0.93、感觉-0.45,则确定儿童、疫苗、儿童疫苗对应的概率值大于预设阈值,则将儿童、疫苗、儿童疫苗确定为所述待生成标签文本对应的目标标签。
根据本发明提供另的一种标签生成方法,与目前仅采用神经网络模型来识别文本中的实体,并将所述实体确定所述文本中的标签的方式相比,本发明通过获取待生成标签文本;并将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;与此同时,将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;最终基于所述各个标签,确定所述待生成标签文本中的目标标签,由此通过首先获取待生成标签文本中的实体,并将所述待生成标签文本和所述实体再共同输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中的各个标签,最终在所述各个标签中确定所述待生成标签文本中的目标标签,避免仅通过词语识别来确定文本中部分标签的情况,从而提高了标签生成的精度。
进一步地,作为图1的具体实现,本发明实施例提供了一种标签生成装置,如图3所示,所述装置包括:获取单元31、实体识别单元32、标签识别单元33和确定单元34。
所述获取单元31,可以用于获取待生成标签文本。
所述实体识别单元32,可以用于将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体。
所述标签识别单元33,可以用于将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签。
所述确定单元34,可以用于基于所述各个标签,确定所述待生成标签文本中的目标标签。
在具体应用场景中,为了得到所述待生成标签文本中包含的实体,如图4所示,所述实体识别单元32,包括分词模块321、实体识别模块322。
所述分词模块321,可以用于对所述待生成标签文本中的文本语句进行分词处理,得到所述文本语句对应的各个分词。
所述实体识别模块322,可以用于将所述各个分词输入至所述预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体。
在具体应用场景中,为了基于所述各个分词,确定所述待生成标签文本中包含的实体,所述实体识别模块322,包括第一特征提取子模块、合并子模块和第一确定子模块。
所述第一特征提取子模块,可以用于将所述各个分词按照其在所述待生成标签文本中的顺序输入至第一递归神经网络中进行特征提取,得到所述各个分词共同对应的第一特征向量。
所述第一特征提取子模块,还可以用于将所述各个分词按照其在所述待生成标签文本中的顺序逆序输入至第二递归神经网络中进行特征提取,得到所述各个分词共同对应的第二特征向量。
所述合并子模块,可以用于将所述第一特征向量和所述第二特征向量进行合并,得到合并后的特征向量,并根据所述合并后的特征向量,确定所述各个分词对应的实体类别。
所述第一确定子模块,可以用于基于所述实体类别,确定所述待生成标签文本中包含的实体。
在具体应用场景中,为了获取所述待生成标签文本中包含的各个标签,所述标签识别单元33,包括第一确定模块331、拼接模块332、信息提取模块333和标签识别模块334。
所述第一确定模块331,可以用于确定所述待生成标签文本中各个第一字符对应的第一嵌入向量,以及所述实体中各个第二字符对应的第二嵌入向量。
所述拼接模块332,可以用于将所述第一嵌入向量与所述第二嵌入向量进行横向拼接,得到各个字符对应的拼接后的向量,其中,所述各个字符包括各个第一字符和各个第二字符。
所述信息提取模块333,可以用于将所述拼接后的向量输入至预设自然语言模型中进行语义信息提取,得到所述待生成标签文本对应的语义信息向量。
所述标签识别模块334,可以用于将所述语义信息向量输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签。
在具体应用场景中,为了基于所述拼接后的向量,确定所述待生成标签文本对应的语义信息向量,所述信息提取模块333,包括第二特征提取子模块和相加子模块。
所述第二特征提取子模块,可以用于将所述拼接后的向量输入至所述注意力层进行特征提取,得到所述各个字符对应的第三特征向量。
所述相加子模块,可以用于将所述第三特征向量和所述拼接后的向量相加,得到所述各个字符对应的第四特征向量。
所述第二特征提取子模块,具体可以用于将所述第四特征向量输入至所述前馈神经网络层进行特征提取,得到所述待生成标签文本对应的语义信息向量。
在具体应用场景中,为了确定所述待生成标签文本中的目标标签,所述确定单元34,包括查询模块341和第二确定模块342。
所述查询模块341,可以用于在预设字符字典中查询所述各个标签对应的标签注释。
所述第二确定模块342,可以用于基于所述各个标签及其对应的标签注释,确定所述待生成标签文本中的目标标签。
在具体应用场景中,为了在所述各个标签中确定所述待生成标签文本对应的目标标签,所述第二确定模块342,包括分类子模块和第二确定子模块。
所述分类子模块,可以用于将所述各个标签及其对应的标签注释输入至预设分类模型中进行分类,得到所述各个标签对应的概率值。
所述第二确定子模块,可以用于在所述概率值中确定大于预设阈值的目标概率值,并将所述目标概率值对应的标签确定为所述待生成标签文本中的目标标签。
需要说明的是,本发明实施例提供的一种标签生成装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。
基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取待生成标签文本;将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;基于所述各个标签,确定所述待生成标签文本中的目标标签。
基于上述如图1所示方法和如图3所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图5所示,该计算机设备包括:处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序,其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤:获取待生成标签文本;将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;基于所述各个标签,确定所述待生成标签文本中的目标标签。
通过本发明的技术方案,本发明通过获取待生成标签文本;并将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;与此同时,将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;最终基于所述各个标签,确定所述待生成标签文本中的目标标签,由此通过首先获取待生成标签文本中的实体,并将所述待生成标签文本和所述实体再共同输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中的各个标签,最终在所述各个标签中确定所述待生成标签文本中的目标标签,避免仅通过词语识别来确定文本中部分标签的情况,从而提高了标签生成的精度。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (10)
1.一种标签生成方法,其特征在于,包括:
获取待生成标签文本;
将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;
将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;
基于所述各个标签,确定所述待生成标签文本中的目标标签。
2.根据权利要求1所述的方法,其特征在于,所述将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体,包括:
对所述待生成标签文本中的文本语句进行分词处理,得到所述文本语句对应的各个分词;
将所述各个分词输入至所述预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体。
3.根据权利要求2所述的方法,其特征在于,所述预设实体识别模型包括第一递归神经网络和第二递归神经网络,所述将所述各个分词输入至所述预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体,包括:
将所述各个分词按照其在所述待生成标签文本中的顺序输入至第一递归神经网络中进行特征提取,得到所述各个分词共同对应的第一特征向量;
将所述各个分词按照其在所述待生成标签文本中的顺序逆序输入至第二递归神经网络中进行特征提取,得到所述各个分词共同对应的第二特征向量;
将所述第一特征向量和所述第二特征向量进行合并,得到合并后的特征向量,并根据所述合并后的特征向量,确定所述各个分词对应的实体类别;
基于所述实体类别,确定所述待生成标签文本中包含的实体。
4.根据权利要求1所述的方法,其特征在于,所述将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签,包括:
确定所述待生成标签文本中各个第一字符对应的第一嵌入向量,以及所述实体中各个第二字符对应的第二嵌入向量;
将所述第一嵌入向量与所述第二嵌入向量进行横向拼接,得到各个字符对应的拼接后的向量,其中,所述各个字符包括所述各个第一字符和所述各个第二字符;
将所述拼接后的向量输入至预设自然语言模型中进行语义信息提取,得到所述待生成标签文本对应的语义信息向量;
将所述语义信息向量输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签。
5.根据权利要求4所述的方法,其特征在于,所述预设自然语言模型为预设编码器,所述预设编码器包括注意力层和前馈神经网络层,所述将所述拼接后的向量输入至预设自然语言模型中进行语义信息提取,得到所述待生成标签文本对应的语义信息向量,包括:
将所述拼接后的向量输入至所述注意力层进行特征提取,得到所述各个字符对应的第三特征向量;
将所述第三特征向量和所述拼接后的向量相加,得到所述各个字符对应的第四特征向量;
将所述第四特征向量输入至所述前馈神经网络层进行特征提取,得到所述待生成标签文本对应的语义信息向量。
6.根据权利要求1所述的方法,其特征在于,所述基于所述各个标签,确定所述待生成标签文本中的目标标签,包括:
在预设字符字典中查询所述各个标签对应的标签注释;
基于所述各个标签及其对应的标签注释,确定所述待生成标签文本中的目标标签。
7.根据权利要求6所述的方法,其特征在于,所述基于所述各个标签及其对应的标签注释,确定所述待生成标签文本中的目标标签,包括:
将所述各个标签及其对应的标签注释输入至预设分类模型中进行分类,得到所述各个标签对应的概率值;
在所述概率值中确定大于预设阈值的目标概率值,并将所述目标概率值对应的标签确定为所述待生成标签文本中的目标标签。
8.一种标签生成装置,其特征在于,包括:
获取单元,用于获取待生成标签文本;
实体识别单元,用于将所述待生成标签文本输入至预设实体识别模型中进行实体识别,得到所述待生成标签文本中包含的实体;
标签识别单元,用于将所述待生成标签文本和所述实体输入至预设标签生成模型中进行标签识别,得到所述待生成标签文本中包含的各个标签;
确定单元,用于基于所述各个标签,确定所述待生成标签文本中的目标标签。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210354702.4A CN114722825A (zh) | 2022-04-06 | 2022-04-06 | 标签生成方法、装置、存储介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210354702.4A CN114722825A (zh) | 2022-04-06 | 2022-04-06 | 标签生成方法、装置、存储介质及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114722825A true CN114722825A (zh) | 2022-07-08 |
Family
ID=82242351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210354702.4A Withdrawn CN114722825A (zh) | 2022-04-06 | 2022-04-06 | 标签生成方法、装置、存储介质及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114722825A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115294964A (zh) * | 2022-09-26 | 2022-11-04 | 广州小鹏汽车科技有限公司 | 语音识别方法、服务器、语音识别系统和可读存储介质 |
-
2022
- 2022-04-06 CN CN202210354702.4A patent/CN114722825A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115294964A (zh) * | 2022-09-26 | 2022-11-04 | 广州小鹏汽车科技有限公司 | 语音识别方法、服务器、语音识别系统和可读存储介质 |
CN115294964B (zh) * | 2022-09-26 | 2023-02-10 | 广州小鹏汽车科技有限公司 | 语音识别方法、服务器、语音识别系统和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107526799B (zh) | 一种基于深度学习的知识图谱构建方法 | |
CN107341264B (zh) | 一种支持自定义实体的电子病历检索系统及方法 | |
CN111079377B (zh) | 一种面向中文医疗文本命名实体识别的方法 | |
US10146859B2 (en) | System and method for entity recognition and linking | |
CN112001177A (zh) | 融合深度学习与规则的电子病历命名实体识别方法及系统 | |
Hetzner | A simple method for citation metadata extraction using hidden markov models | |
Korpusik et al. | Spoken language understanding for a nutrition dialogue system | |
CN111611775B (zh) | 一种实体识别模型生成方法、实体识别方法及装置、设备 | |
KR101897060B1 (ko) | 개체명 인식 모델 생성 장치 및 방법 | |
CN111046660B (zh) | 一种识别文本专业术语的方法及装置 | |
CN111353306A (zh) | 基于实体关系和依存Tree-LSTM的联合事件抽取的方法 | |
CN111460175A (zh) | 一种基于snomed-ct的医学名词词典构造与拓展方法 | |
CN116628186B (zh) | 文本摘要生成方法及系统 | |
CN113657105A (zh) | 基于词汇增强的医学实体抽取方法、装置、设备及介质 | |
CN114970530A (zh) | 针对基于机器学习命名实体识别的弱监督训练的基于图的标记规则扩充 | |
CN114676233A (zh) | 基于骨骼肌知识图谱的医疗自动问答方法 | |
CN115019906A (zh) | 多任务序列标注的药物实体和相互作用联合抽取方法 | |
CN114239612A (zh) | 一种多模态神经机器翻译方法、计算机设备及存储介质 | |
KR101072460B1 (ko) | 한국어 형태소 분석 방법 | |
CN114722825A (zh) | 标签生成方法、装置、存储介质及计算机设备 | |
CN111597789A (zh) | 一种电子病历文本的评估方法及设备 | |
CN111191446B (zh) | 交互信息处理方法、装置、计算机设备和存储介质 | |
CN116502642A (zh) | 一种基于视觉-语言结合的命名实体识别方法及装置 | |
CN116756316A (zh) | 医疗文本的信息识别方法、装置、介质及设备 | |
M’rabet et al. | TextFlow: a text similarity measure based on continuous sequences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220708 |
|
WW01 | Invention patent application withdrawn after publication |