CN114330252A - 一种文本打标签方法、装置及相关设备 - Google Patents

一种文本打标签方法、装置及相关设备 Download PDF

Info

Publication number
CN114330252A
CN114330252A CN202111660438.9A CN202111660438A CN114330252A CN 114330252 A CN114330252 A CN 114330252A CN 202111660438 A CN202111660438 A CN 202111660438A CN 114330252 A CN114330252 A CN 114330252A
Authority
CN
China
Prior art keywords
text
label
target
preset
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111660438.9A
Other languages
English (en)
Inventor
于彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN202111660438.9A priority Critical patent/CN114330252A/zh
Publication of CN114330252A publication Critical patent/CN114330252A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种文本打标签方法,包括根据打标签指令确定目标文本;遍历预设标签库,将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率;将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签。应用本申请所提供的技术方案,可以实现快速高效的文本打标签。本申请还公开了一种文本打标签装置、文本打标签设备及计算机可读存储介质,均具有上述有益效果。

Description

一种文本打标签方法、装置及相关设备
技术领域
本申请涉及自然语言处理技术领域,特别涉及一种文本打标签方法,还涉及一种文本打标签装置、文本打标签设备及计算机可读存储介质。
背景技术
文字是最基本的传播媒介手段,可实现海量数据收集,但是,由于数据量巨大,用户往往不能全部都阅读,因此,需要对文本进行打标签分类,以便用户关注自己感兴趣或需要的内容。目前常用的方式是手动打标签,即用户基于实际需要对文本标签编辑,但是,该种实现方式效率极其低下,面对海量数据时,该问题尤为明显。
因此,如何实现快速高效的文本打标签是本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种文本打标签方法,该文本打标签方法可以实现快速高效的文本打标签;本申请的另一目的是提供一种文本打标签装置、文本打标签设备及计算机可读存储介质,均具有上述有益效果。
第一方面,本申请提供了一种文本打标签方法,包括:
根据打标签指令确定目标文本;
遍历预设标签库,将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率;
将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签。
优选的,所述将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签之前,还包括:
判断所述取值最大的发生概率是否超出预设阈值;
若是,则执行所述将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签的步骤;
若否,则输出文本未知提示。
优选的,所述输出文本未知提示之后,还包括:
接收用户端基于所述文本未知提示输入的人工识别标签;
将所述人工识别标签作为所述目标文本的标签。
优选的,所述文本打标签方法还包括:
判断所述人工识别标签是否命中所述预设标签库;
若否,则将所述人工识别标签作为所述已知标签添加至所述预设标签库。
优选的,所述将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率,包括:
结合小样本学习技术,将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率。
优选的,所述文本打标签方法还包括:
将所述目标文本和所述目标标签存储至预设文本表格;其中,在所述预设文本表格中,所述目标文本和所述目标标签对应存储。
优选的,所述文本打标签方法还包括:
当接收到查询指令时,根据所述查询指令确定待查询标签;
在所述预设文本表格中查询获得所述待查询标签对应的文本。
第二方面,本申请还公开了一种文本打标签装置,包括:
目标文本确定模块,用于根据打标签指令确定目标文本;
发生概率计算模块,用于遍历预设标签库,将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率;
文本打标签模块,用于将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签。
第三方面,本申请还公开了一种文本打标签设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的任一种文本打标签方法的步骤。
第四方面,本申请还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的任一种文本打标签方法的步骤。
本申请所提供的一种文本打标签方法,包括根据打标签指令确定目标文本;遍历预设标签库,将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率;将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签。
应用本申请所提供的技术方案,预先建立标签库,用于实现已知标签存储,对于目标文本而言,则可以基于预设标签库中的已知标签对其进行概率计算,并将取值最大的该概率对应的已知标签作为目标文本的标签,从而实现对目标文本打标签,显然,该种实现方式无需人工操作即可实现文本打标签,极大地提升了文本打标签效率。
本申请所提供的一种文本打标签装置、文本打标签设备及计算机可读存储介质,均具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明现有技术和本申请实施例中的技术方案,下面将对现有技术和本申请实施例描述中需要使用的附图作简要的介绍。当然,下面有关本申请实施例的附图描述的仅仅是本申请中的一部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图,所获得的其他附图也属于本申请的保护范围。
图1为本申请所提供的一种文本打标签方法的流程示意图;
图2为本申请所提供的一种文本打标签装置的结构示意图;
图3为本申请所提供的一种文本打标签设备的结构示意图。
具体实施方式
本申请的核心是提供一种文本打标签方法,该文本打标签方法可以实现快速高效的文本打标签;本申请的另一核心是提供一种文本打标签装置、文本打标签设备及计算机可读存储介质,也具有上述有益效果。
为了对本申请实施例中的技术方案进行更加清楚、完整地描述,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行介绍。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
文字是最基本的传播媒介手段,可实现海量数据收集,但是,由于数据量巨大,用户往往不能全部都阅读,因此,需要对文本进行打标签分类,以便用户关注自己感兴趣或需要的内容。目前常用的方式是手动打标签,即用户基于实际需要对文本标签编辑,但是,该种实现方式效率极其低下,面对海量数据时,该问题尤为明显。
因此,为解决上述技术问题,本申请提供了一种文本打标签方法,该文本打标签方法预先建立标签库,用于实现已知标签存储,对于目标文本而言,则可以基于预设标签库中的已知标签对其进行概率计算,并将取值最大的该概率对应的已知标签作为目标文本的标签,从而实现对目标文本打标签,显然,该种实现方式无需人工操作即可实现文本打标签,极大地提升了文本打标签效率。
本申请实施例提供了一种文本打标签方法。
请参考图1,图1为本申请所提供的一种文本打标签方法的流程示意图,该文本打标签方法可包括:
S101:根据打标签指令确定目标文本;
本步骤旨在实现目标文本的确定,该目标文本即为用户需要打标签的文本,可以根据打标签指令确定。具体而言,当用户需要对某一文本进行打标签时,可以通过用户端发起打标签指令,由此,处理器即可通过指令解析确定目标文本。
其中,打标签指令中可以直接携带由目标文本,处理器可直接通过指令解析获得该目标文本;打标签指令中也可以携带有目标文本的标识信息,处理器则可以通过指令解析获得目标文本的标识信息,并基于该标识信息从文本库中调取获得目标文本,可见,目标文本的获取方式并不唯一,可以由技术人员根据实际情况进行设定,例如,当目标文本的数量较少时,则可以采用前一种实现方式,当目标文本的数量较多时,则可以采用后一种实现方式。其中,标识信息的具体类型并不影响本技术方案的实施,例如,可以为预先设定的ID号或在文本库中存储的序列号等,本申请对此不做限定。
S102:遍历预设标签库,将预设标签库中的各已知标签作为概率条件,并计算目标文本在各概率条件下的发生概率;
本步骤旨在实现概率计算,该概率即为目标文本的发生概率,当然,该发生概率是基于预设标签库中的各已知标签计算得到的,也就是说,是在已知标签条件下进行概率计算,以有效保证打标签结果的准确性。
具体而言,可以预先创建标签库,用于实现各类已知标签的存储,由此,在获得目标文本后,即可对预设标签库进行遍历,将预设标签库中的每一个已知标签作为概率条件,然后计算目标文本在每一个概率条件下发生的概率,即上述发生概率。
可以理解的是,预设标签库中已知标签的数量即为目标文本发生概率的数量,其中,已知标签可以由用户根据实际需求进行设定或采集,例如,当目标文本为文章时,预设标签库中的已知标签可以包括小说类、科研类、童话类等;当目标文本为新闻时,预设标签库中的已知标签可以包括娱乐类、房地产类、教育类等。
S103:将取值最大的发生概率对应的已知标签作为目标标签,并将目标标签作为目标文本的标签。
本步骤旨在实现目标文本打标签。具体而言,在完成发生概率计算之后,也即获得所有已知标签对应的目标文本发生概率之后,即可从所有的发生概率中挑选取值最大的发生概率,发生概率取值最大,目标文本的类型为该最大发生概率对应的已知标签指示的类型的可能性最大,因此,可以将最大发生概率对应的已知标签作为目标标签,也即目标文本的标签,由此,实现对目标文本打标签。
可见,本申请所提供的文本打标签方法,预先建立标签库,用于实现已知标签存储,对于目标文本而言,则可以基于预设标签库中的已知标签对其进行概率计算,并将取值最大的该概率对应的已知标签作为目标文本的标签,从而实现对目标文本打标签,显然,该种实现方式无需人工操作即可实现文本打标签,极大地提升了文本打标签效率。
在本申请的一个实施例中,上述将取值最大的发生概率对应的已知标签作为目标标签,并将目标标签作为目标文本的标签之前,还可以包括:判断取值最大的发生概率是否超出预设阈值;若是,则执行将取值最大的发生概率对应的已知标签作为目标标签,并将目标标签作为目标文本的标签的步骤;若否,则输出文本未知提示。
为进一步保证文本打标签结果的准确性,还可以对最大发生概率进行阈值比较。具体而言,可以根据实际需求预设设定最大阈值,即上述预设阈值,如60%,由此,在从所有的目标文本发生概率确定最大发生概率之后,可进一步判断该最大发生概率是否超出预设阈值,若是,则可以执行S103打标签的步骤,否则,说明该最大发生概率对应的已知标签对于目标文本的准确性较低,此时,则可以输出文本未知提示,用以提醒技术人员该目标文本打标签失败。基于该种实现方式,可以有效保证文本打标签结果的准确性。
在本申请的一个实施例中,上述输出文本未知提示之后,还可以包括:接收用户端基于文本未知提示输入的人工识别标签;将人工识别标签作为目标文本的标签。
本申请实施例所提供的文本打标签方法还可进一步实现人工识别,保证所有的目标文本均可以被打标签。具体而言,当最大发生概率低于预设阈值,输出文本未知提示之后,用户可以根据文本未知提示确定当前目标文本打标签失败,并根据自身经验对该目标文本进行人工识别,获得识别结果。进一步,用户还可以通过用户端将识别结果作为人工识别标签进行输入,由此,处理器即可直接将该人工识别标签作为目标文本的目标标签,从而实现目标文本的人工识别。
在本申请的一个实施例中,该文本打标签方法还可以包括:判断人工识别标签是否命中预设标签库;若否,则将人工识别标签作为已知标签添加至预设标签库。
本申请实施例所提供的文本打标签方法还可进一步实现预设标签库的更新功能。具体而言,在获得人工识别标签之后,可进一步判断该人工识别标签是否命中预设标签库,如若命中预设标签库,则说明预设标签库中存在已知标签与该人工识别标签相同,此时,忽略该人工识别标签即可;如若未命中预设标签库,说明预设标签库中不存在已知标签与该人工识别标签相同,此时,将该人工识别标签添加至预设标签库即可,由此,实现预设标签库的更新。基于该种实现方式,以此类推,可以使得预设标签库中的已知标签的种类更为丰富,更加有助于实现自动化文本打标签。
在本申请的一个实施例中,上述将预设标签库中的各已知标签作为概率条件,并计算目标文本在各概率条件下的发生概率,可以包括:结合小样本学习技术,将预设标签库中的各已知标签作为概率条件,并计算目标文本在各概率条件下的发生概率。
本申请实施例提供了一种计算目标文本发生概率的实现方式,概率实现方式结合小样本学习技术实现了目标文本发生概率计算,具体可参照如下举例:
假设有一条新闻类目标文本:在天津买房,首付只能付大概40万,在哪个区域买比较合适?对该新闻类目标文本进行打标签仅为判断该新闻类目标文本属于哪一类新闻。那么,在对该新闻类目标文本进行发生概率计算时,则有:P(在天津买房……这条新闻属于|候选label),其中,候选label即为预设标签库中的已知标签,在此基础上,结合小样本学习技术,即在任务描述时加上一个输出的例子,比如:以下是一条教育新闻:教育是社会所需,也是百姓所求,由此,对上述新闻类目标文本进行发生概率计算则转变为:
P(在天津买房,首付只能付大概40万,在哪个区域买比较合适?|以下是一条教育新闻:教育是社会所需,也是百姓所求,以下是一条候选label新闻:)。
可见,通过结合小样本学习技术实现目标文本发生概率的计算,可以进一步提升目标文本打标签结果的准确性。
在本申请的一个实施例中,该文本打标签方法还可以包括:将目标文本和目标标签存储至预设文本表格;其中,在预设文本表格中,目标文本和目标标签对应存储。
本申请实施例所提供的文本打标签方法还可进一步实现目标文本的分类存储功能。具体而言,可以预先创建文本表格,用于实现目标文本与目标标签的存储,由此,在完成目标文本打标签之后,可以将目标文本与目标标签相对应,并存储至预设文本表格,也就是说,在预设文本表格中,目标文本与目标标签一一对应存储,以便于后续进行文本查询。当然,以预设文本表格实现目标文本与目标标签的存储仅为本申请实施例所提供的一种实现方式,并不唯一,也可以创建新的文本库,如关系型数据库实现目标文本与目标标签的对应存储。
在本申请的一个实施例中,该文本打标签方法还可以包括:当接收到查询指令时,根据查询指令确定待查询标签;在预设文本表格中查询获得待查询标签对应的文本。
本申请实施例所提供的文本打标签方法还可进一步实现文本查询功能,在基于预设文本表格实现目标文本与目标标签的对应存储时,用户则可基于该预设文本表格实现文本查询。具体而言,用户可以将文本标签作为待查询标签添加至查询指令中,并向处理器发起查询指令,由此,处理器则可以通过指令解析获得其中的待查询标签,然后从预设文本表格中查询获得该待查询标签对应的文本,即为用户所需要查询的文本。最后,将查询到的文本输出至前端界面进行展示即可。
本申请还提供了一种文本打标签装置,请参考图2,图2为本申请所提供的一种文本打标签装置的结构示意图,该文本打标签装置可包括:
目标文本确定模块1,用于根据打标签指令确定目标文本;
发生概率计算模块2,用于遍历预设标签库,将预设标签库中的各已知标签作为概率条件,并计算目标文本在各概率条件下的发生概率;
文本打标签模块3,用于将取值最大的发生概率对应的已知标签作为目标标签,并将目标标签作为目标文本的标签。
可见,本申请实施例所提供的文本打标签装置,预先建立标签库,用于实现已知标签存储,对于目标文本而言,则可以基于预设标签库中的已知标签对其进行概率计算,并将取值最大的该概率对应的已知标签作为目标文本的标签,从而实现对目标文本打标签,显然,该种实现方式无需人工操作即可实现文本打标签,极大地提升了文本打标签效率。
在本申请的一个实施例中,该文本打标签装置还可以包括阈值判断模块,用于在上述将取值最大的发生概率对应的已知标签作为目标标签,并将目标标签作为目标文本的标签之前,判断取值最大的发生概率是否超出预设阈值;若是,则执行将取值最大的发生概率对应的已知标签作为目标标签,并将目标标签作为目标文本的标签的步骤;若否,则输出文本未知提示。
在本申请的一个实施例中,该文本打标签装置还可以包括人工识别模块,用于在上述输出文本未知提示之后,接收用户端基于文本未知提示输入的人工识别标签;将人工识别标签作为目标文本的标签。
在本申请的一个实施例中,该文本打标签装置还可以包括数据库更新模块,用于判断人工识别标签是否命中预设标签库;若否,则将人工识别标签作为已知标签添加至预设标签库。
在本申请的一个实施例中,上述发生概率计算模块2可具体用于结合小样本学习技术,将预设标签库中的各已知标签作为概率条件,并计算目标文本在各概率条件下的发生概率。
在本申请的一个实施例中,该文本打标签装置还可以包括文本存储模块,用于将目标文本和目标标签存储至预设文本表格;其中,在预设文本表格中,目标文本和目标标签对应存储。
在本申请的一个实施例中,该文本打标签装置还可以包括文本查询模块,用于当接收到查询指令时,根据查询指令确定待查询标签;在预设文本表格中查询获得待查询标签对应的文本。
对于本申请提供的装置的介绍请参照上述方法实施例,本申请在此不做赘述。
本申请还提供了一种文本打标签设备,请参考图3,图3为本申请所提供的一种文本打标签设备的结构示意图,该文本打标签设备可包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时可实现如上述任意一种文本打标签方法的步骤。
如图3所示,为文本打标签设备的组成结构示意图,文本打标签设备可以包括:处理器10、存储器11、通信接口12和通信总线13。处理器10、存储器11、通信接口12均通过通信总线13完成相互间的通信。
在本申请实施例中,处理器10可以为中央处理器(Central Processing Unit,CPU)、特定应用集成电路、数字信号处理器、现场可编程门阵列或者其他可编程逻辑器件等。
处理器10可以调用存储器11中存储的程序,具体的,处理器10可以执行文本打标签方法的实施例中的操作。
存储器11中用于存放一个或者一个以上程序,程序可以包括程序代码,程序代码包括计算机操作指令,在本申请实施例中,存储器11中至少存储有用于实现以下功能的程序:
根据打标签指令确定目标文本;
遍历预设标签库,将预设标签库中的各已知标签作为概率条件,并计算目标文本在各概率条件下的发生概率;
将取值最大的发生概率对应的已知标签作为目标标签,并将目标标签作为目标文本的标签。
在一种可能的实现方式中,存储器11可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及至少一个功能所需的应用程序等;存储数据区可存储使用过程中所创建的数据。
此外,存储器11可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件。
通信接口12可以为通信模块的接口,用于与其他设备或者系统连接。
当然,需要说明的是,图3所示的结构并不构成对本申请实施例中文本打标签设备的限定,在实际应用中文本打标签设备可以包括比图3所示的更多或更少的部件,或者组合某些部件。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如上述任意一种文本打标签方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本申请提供的计算机可读存储介质的介绍请参照上述方法实施例,本申请在此不做赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的技术方案进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请的保护范围内。

Claims (10)

1.一种文本打标签方法,其特征在于,包括:
根据打标签指令确定目标文本;
遍历预设标签库,将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率;
将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签。
2.根据权利要求1所述的文本打标签方法,其特征在于,所述将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签之前,还包括:
判断所述取值最大的发生概率是否超出预设阈值;
若是,则执行所述将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签的步骤;
若否,则输出文本未知提示。
3.根据权利要求2所述的文本打标签方法,其特征在于,所述输出文本未知提示之后,还包括:
接收用户端基于所述文本未知提示输入的人工识别标签;
将所述人工识别标签作为所述目标文本的标签。
4.根据权利要求3所述的文本打标签方法,其特征在于,还包括:
判断所述人工识别标签是否命中所述预设标签库;
若否,则将所述人工识别标签作为所述已知标签添加至所述预设标签库。
5.根据权利要求1所述的文本打标签方法,其特征在于,所述将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率,包括:
结合小样本学习技术,将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率。
6.根据权利要求1所述的文本打标签方法,其特征在于,还包括:
将所述目标文本和所述目标标签存储至预设文本表格;其中,在所述预设文本表格中,所述目标文本和所述目标标签对应存储。
7.根据权利要求6所述的文本打标签方法,其特征在于,还包括:
当接收到查询指令时,根据所述查询指令确定待查询标签;
在所述预设文本表格中查询获得所述待查询标签对应的文本。
8.一种文本打标签装置,其特征在于,包括:
目标文本确定模块,用于根据打标签指令确定目标文本;
发生概率计算模块,用于遍历预设标签库,将所述预设标签库中的各已知标签作为概率条件,并计算所述目标文本在各所述概率条件下的发生概率;
文本打标签模块,用于将取值最大的发生概率对应的已知标签作为目标标签,并将所述目标标签作为所述目标文本的标签。
9.一种文本打标签设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的文本打标签方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的文本打标签方法的步骤。
CN202111660438.9A 2021-12-30 2021-12-30 一种文本打标签方法、装置及相关设备 Pending CN114330252A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111660438.9A CN114330252A (zh) 2021-12-30 2021-12-30 一种文本打标签方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111660438.9A CN114330252A (zh) 2021-12-30 2021-12-30 一种文本打标签方法、装置及相关设备

Publications (1)

Publication Number Publication Date
CN114330252A true CN114330252A (zh) 2022-04-12

Family

ID=81018386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111660438.9A Pending CN114330252A (zh) 2021-12-30 2021-12-30 一种文本打标签方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN114330252A (zh)

Similar Documents

Publication Publication Date Title
CN107798123B (zh) 知识库及其建立、修改、智能问答方法、装置及设备
CN109271509B (zh) 直播间话题的生成方法、装置、计算机设备和存储介质
CN108932218B (zh) 一种实例扩展方法、装置、设备和介质
CN110275965A (zh) 假新闻检测方法、电子装置及计算机可读存储介质
CN109933217B (zh) 用于推送语句的方法和装置
US20190147104A1 (en) Method and apparatus for constructing artificial intelligence application
CN111143556B (zh) 软件功能点自动计数方法、装置、介质及电子设备
CN105302906A (zh) 信息标注方法及装置
CN111930792A (zh) 数据资源的标注方法、装置、存储介质及电子设备
CN111553556A (zh) 业务数据分析方法、装置、计算机设备及存储介质
CN114090671A (zh) 数据导入方法、装置、电子设备及存储介质
CN115392235A (zh) 字符匹配方法、装置、电子设备及可读存储介质
CN109033082B (zh) 语义模型的学习训练方法、装置及计算机可读存储介质
CN111354354B (zh) 一种基于语义识别的训练方法、训练装置及终端设备
CN111935552A (zh) 信息标注方法、装置、设备及介质
CN111949793A (zh) 用户意图识别方法、装置及终端设备
CN107908724B (zh) 一种数据模型匹配方法、装置、设备及存储介质
CN110147358B (zh) 自动问答知识库的建设方法及建设系统
CN114330252A (zh) 一种文本打标签方法、装置及相关设备
CN114265777A (zh) 应用程序的测试方法、装置、电子设备及存储介质
CN113535916A (zh) 一种基于表格的问答方法、装置及计算机设备
CN114141236A (zh) 语言模型更新方法、装置、电子设备及存储介质
CN111985235B (zh) 文本处理方法、装置、计算机可读存储介质和电子设备
CN109388404B (zh) 一种路径解码方法、装置、计算机设备及存储介质
CN113326461A (zh) 跨平台内容分发方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination