CN110347786A - 一种语义模型的调优方法及系统 - Google Patents
一种语义模型的调优方法及系统 Download PDFInfo
- Publication number
- CN110347786A CN110347786A CN201910503677.XA CN201910503677A CN110347786A CN 110347786 A CN110347786 A CN 110347786A CN 201910503677 A CN201910503677 A CN 201910503677A CN 110347786 A CN110347786 A CN 110347786A
- Authority
- CN
- China
- Prior art keywords
- target
- labeled data
- text information
- semantic
- semantic label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种语义模型的调优方法及系统,该方法包括:获取用户输入的文本信息;将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;根据所述目标语义标签及所述影响系数对所述语义模型进行调优。本发明实施例能够在待识别文本信息与语义识别结果出现匹配误差时,快速了解到是哪些数据导致了该匹配误差,从而对语义模型进行针对性的调优。
Description
技术领域
本发明涉及语义识别技术领域,尤其涉及一种语义模型的调优方法及系统。
背景技术
如今,随着信息技术的深入发展,文本数据呈爆炸式增长态势,为了对这些文本数据进行充分的利用,许多场景都会应用到语义识别或语义匹配技术,例如:即时信息、微信公众号、机器人客服等等。现有的语义识别通常依赖于语义模型实现,该语义模型通过采用深度学习技术对用于训练的文本数据进行深度学习训练得到。在服务器获取到待识别文本信息时,将待识别文本信息输入到该语义模型中,最终输出与该待识别文本信息匹配度最高的语义识别结果。然而,由于深度学习技术复杂度较高,存在感知上的黑盒效应,即使主观上知道待识别文本信息与语义识别结果出现了明显的匹配误差,也无法快速了解到是哪些数据导致了该匹配误差,从而无法对语义模型进行针对性的调优。
发明内容
本发明提供了一种语义模型的调优方法及系统,以解决待识别文本信息与语义识别结果出现匹配误差时,无法快速了解到是哪些数据导致了该匹配误差,从而无法对语义模型进行针对性的调优的问题。
为实现上述目的,本发明实施例第一方面提供了一种语义模型的调优方法,该方法包括:
获取用户输入的文本信息;
将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;
获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;
根据所述目标语义标签及所述影响系数对所述语义模型进行调优。
在一种可能的实施例中,在所述将所述文本信息输入到预先训练好的语义模型中进行识别之前,所述方法还包括:
获取标注数据集;
将所述标注数据集中的标注数据标注到多个预设语义标签中;其中,多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据;
针对所述多个预设语义标签中的每个预设语义标签,对该每个预设语义标签中的多个标注数据进行深度学习训练,以得到所述语义模型。
在一种可能的实施例中,所述将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,包括:
获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值;
将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配,以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据;
将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。
在一种可能的实施例中,所述获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,包括:
计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度;
将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。
在一种可能的实施例中,根据所述影响系数的大小,对多个所述目标标注数据进行排序,并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据;
在所述目标语义标签与所述文本信息语义不相匹配的情况下,将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除,以对所述语义模型的训练数据进行调优。
本发明实施例第二方面提供了一种语义模型的调优系统,该系统包括客户端及服务端,所述客户端和所述服务端通信连接;
所述服务端包括第一获取模块、语义识别模块、第二获取模块及模型调优模块;
所述客户端,用于接收用户输入的文本信息,并将所述文本信息发送至所述服务端;以及接收所述服务端返回的所述文本信息对应的目标语义标签;
所述第一获取模块,用于接收所述文本信息;
所述语义识别模块,用于将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;
所述第二获取模块,用于获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;
所述模型调优模块,用于根据所述目标语义标签及所述影响系数对所述语义模型进行调优。
本发明实施例第三方面提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语义模型的调优方法中的步骤。
本发明实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述语义模型的调优方法中的步骤。
本发明的上述方案至少包括以下有益效果:
本发明实施例通过获取用户输入的文本信息,然后将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,之后获取多个目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,最后根据所述影响系数的大小对目标语义标签下的多个所述目标标注数据进行排序并和目标语义标签一起输出,从而能够在语义识别结果与待识别文本信息不相匹配的情况下,快速了解到是哪些数据导致了匹配误差,进而对语义模型进行针对性的调优。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种网络架构的示意图;
图2为本发明实施例提供的一种语义模型的调优方法的流程示意图;
图3为本发明实施例提供的一种语义模型的结构示意图;
图4为本发明实施例提供的另一种语义模型的调优方法的流程示意图;
图5为本发明实施提供的一种语义模型的调优系统的结构意图;
图6为本发明实施提供的另一种语义模型的调优系统的结构意图;
图7为本发明实施提供的另一种语义模型的调优系统的结构意图;
图8为本发明实施提供的另一种语义模型的调优系统的结构意图;
图9为本发明实施提供的另一种语义模型的调优系统的结构意图;
图10为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。
首先结合相关附图来举例介绍下本申请实施例的方案可能的网络架构,请参见图1,图1为本发明实施例提供的一种网络架构的示意图,如图1所示,具体涉及到用户终端及服务器,二者通过网络通信连接,实现交互。用户终端用于接收用户通过输入界面输入的文本信息,例如:我不记得密码了怎么办?用户终端将用户输入的文本信息发送至服务器,服务器对文本信息进行一系列处理,从数据库中得到该文本信息对应的一个或多个候选匹配结果,例如:忘记密码怎么办,或者如何修改密码,再或者如何找回我的密码,之后将这些候选匹配结果返回至用户终端。可以理解的,用户终端可以是手机、平板电脑、计算机、可穿戴设备、个人数字助理(Personal Digital Assistant,PDA)等智能设备,服务器可以是单个服务器,也可以是服务器集群,上述的网络架构可以应用于任何人机交互的场景中,例如,电商购物、在线教育、智能家居、网上银行等等。
请参见图2,图2为本发明实施例提供的一种语义模型的调优方法的流程示意图,如图2所示,包括步骤:
S21,获取用户输入的文本信息。
其中,在本发明具体实施例中,上述获取用户输入的文本信息,主要是获取用户终端发送的文本信息,上述文本信息可以是用户直接输入的文本信息,也可以是用户输入的语音信息通过转译得到的文本信息。
S22,将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据。
其中,在本发明具体实施例中,语义模型由预设的语义标签及标注在预设的语义标签下的标注数据经过深度学习算法训练得到,具有根据用户输入的文本信息得到该文本信息对应的目标语义标签的能力。目标语义标签是预设的语义标签中的一个或多个,是对应各种业务的一些标准回答,例如:“查询商品退款的方式”、“如何进行退款”等就可以是退款业务中预设的语义标签,标注数据指用户日常生活中的一些与业务相的常用语,例如:“我购买商品怎么进行退款呀”、“商品退款的方法是什么”、“商品想退款该如何操作”等等,每个预设的语义标签下标注有大量的标注数据,例如:将“我购买商品怎么进行退款呀”、“商品退款的方法是什么”、“商品想退款该如何操作”标注在预设的语义标签“查询商品退款的方式”下。如图3所示,图3为本发明实施例提供的一种语义模型的结构示意图,例如用户输入的文本信息为“这件商品该如何退款”,将“这件商品该如何退款”输入至语义模型,语义模型经过各层的处理,最后得到候选匹配结果,即目标语义标签“查询商品退款的方式”。
S23,获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数。
之所以会得到上述的目标语义标签,是因为此目标语义标签下标注了与用户输入的文本信息相似的目标标注数据,这些目标标注数据对得到目标语义标签有着匹配逻辑上的影响。这些目标标注数据与用户输入的文本信息可能仅仅是文本相似,而语义并不相似,那么,得出的目标语义标签与用户输入的文本信息就并不匹配,或者说存在匹配误差,例如:用户输入的文本信息为“这件商品该如何退款”,实际上应该匹配出“商品退款的方式”这类语义标签,但有可能错误匹配到“这件商品该如何付款”这类语义标签。另外,这些目标标注数据与用户输入的文本信息在文本相似的同时,语义也可能是相似的,那么,得出的目标语义标签与用户输入的文本信息之间的匹配结果就是理想的,该目标语义标签就是与用户想要了解的内容。
其中,在本发明具体实施例中,不管目标语义标签与用户输入的文本信息是否匹配,都将获取该目标语义标签下的目标标注数据对得到该目标语义标签的影响系数,例如:可以计算该目标语义标签下的目标标注数据与用户输入的文本信息之间的相似度,根据该影响系数可以直观地了解到哪些目标标注数据对得到该目标语义标签的影响较大,并将影响较大的目标标注数据返回给用户终端。
S24,根据所述目标语义标签及所述影响系数对所述语义模型进行调优。
其中,在本发明具体实施例中,若得到的目标语义标签与用户输入的文本信息不相匹配,例如:预设时间内用户并没有对返回的目标语义标签进行点击操作,则需要对语义模型再次训练的数据进行调优,例如:上述影响系数较大的目标标注数据不再作为语义模型的训练数据,以达到对语义模型进行优化的目的。
本发明实施例中,通过获取用户输入的文本信息,然后将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,之后获取多个目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,最后根据所述影响系数的大小对目标语义标签下的多个所述目标标注数据进行排序并和目标语义标签一起输出,从而能够在语义识别结果与待识别文本信息不相匹配的情况下,快速了解到是哪些数据导致了匹配误差,进而对语义模型进行针对性的调优。
请参见图4,图4为本发明实施例提供的另一种语义模型的调优方法的流程示意图,如图4所示,包括步骤:
S31,获取标注数据集。
其中,在本发明具体实施例中,标注数据集是大量标注数据的集合,其中的标注数据是用户在各类业务上的日常用语,例如:对应购买业务的标注数据“这件商品能用优惠券吗”、“购买这件商品分期付款怎么操作”、“这件商品什么时候有价格优惠”,对应退款业务的标注数据“我购买商品怎么进行退款呀”、“商品想退款该如何操作”,对应修改密码业务的标注数据“我不记得密码了咋办”、“我想修改密码”。
S32,将所述标注数据集中的标注数据标注到多个预设语义标签中;其中,多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据。
其中,在本发明具体实施例中,对应所涉及的业务层面,会预设多个语义标签,然后将标注数据集中的标注数据正确合规地标注到对应的预设语义标签中,例如:在修改密码业务上预设的语义标签为“查询修改密码的方式”,则将上述的标注数据“我不记得密码了咋办”、“我想修改密码”标注到“查询修改密码的方式”这一预设的语义标签中。
S33,针对所述多个预设语义标签中的每个预设语义标签,对该每个预设语义标签中的多个标注数据进行深度学习训练,以得到语义模型。
其中,在本发明的具体实施例中,待将标注数据集中的标注数据标注到对应的预设的语义标签后,采用深度学习算法对多个预设语义标签及多个预设语义标签中的每个预设语义标下的标注数据进行深度学习训练,使得到的语义模型具有识别用户输入的文本信息的能力。此处的训练可以是将所有预设语义标签及所有预设语义标签中的标注数据一起进行训练,也可以是分别针对每个预设语义标签及每个预设语义标签中的标注数据做单独训练。
S34,获取用户输入的文本信息。
S35,将所述文本信息输入到所述语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;
S36,获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;
S37,根据所述目标语义标签及所述影响系数对所述语义模型进行调优。
其中,上述步骤S34-S37在上一实施例中已有相关描述,且能达到相同或相似的有益效果,为避免重复,此处不再赘述。
在一种可能的实施例中,所述将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,包括:
获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值;
其中,在本发明具体实施例中,可以采用文本特征值提取算法获取文本信息的特征值和每个预设语义标签中的多个标注数据的特征值,常见的例如:词频-逆向文件频率算法、Countvectorizer算法、Word to Vector算法等。为了提高匹配速度,可以事先对每个预设语义标签中的多个标注数据进行特征值提取,然后将提取出来的特征值进行存储。
将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配,以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据;
将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。
其中,在本发明具体实施例中,第一预设阈值可根据实际情况设定,例如:95%、98%等,与所述文本信息的特征值的匹配度大于第一预设阈值的目标标注数据可以是来自于同一预设语义标签中的标注数据,也可以是来自不同预设语义标签中的标注数据。得到与所述文本信息的特征值的匹配度大于第一预设阈值的目标标注数据后,将该目标标注数据所属的预设语义标签作为目标语义标签进行输出。
在一种可能的实施例中,所述获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,包括:
计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度;
将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。
其中,在本发明具体实施例中,可以采用余弦相似度来计算每个目标标注数据与用户输入的文本信息之间的相似度,通过获取每个目标标注数据的向量表达和用户输入的文本信息的向量表达,然后计算向量之间的夹角余弦值得到每个目标标注数据与用户输入的文本信息之间的相似度,将该相似度作为每个目标标注数据对得到目标语义标签的影响系数。余弦相似度越接近于1,说明该目标标注数据与用户输入的文本信息之间的相似度越大,也就说明该目标标注数据对得到目标语义标签的影响程度越大。当然,还可以采用简单共有词方法来计算每个目标标注数据与用户输入的文本信息之间的相似度,例如:某个目标标注数据是“商品想退款该如何操作”,用户输入的文本信息是“这件商品该如何退款”,首先查找两个文本共同都有的词的字数为7,字数最长的一句话的字数为10,那么二者的相似度就是7/10=0.7,也就说明“商品想退款该如何操作”这一目标标注数据对得到目标语义标签的影响系数是0.7。或者还可以采用编辑距离的方法来计算每个目标标注数据与用户输入的文本信息之间的相似度,具体采用哪种方法计算每个目标标注数据与用户输入的文本信息之间的相似度,本申请实施例不做任何限定。
在一种可能的实施例中,所述根据所述目标语义标签及所述影响系数对所述语义模型进行调优,包括:
根据所述影响系数的大小,对多个所述目标标注数据进行排序,并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据;
在所述目标语义标签与所述文本信息语义不相匹配的情况下,将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除,以对所述语义模型的训练数据进行调优。
其中,在本发明具体实施例中,在获取到每个目标标注数据对得到目标语义标签的影响系数后,按照影响系数的大小对每个目标标注数据进行排序,然后选取影响系数最大的目标标注数据或者影响系数大于第二预设阈值的目标标注数据或者经过排序后的前N个目标标注数据与目标语义标签一起返回至用户终端。例如表1所示,目标语义标签为“查询商品退款的方式”,其中影响系数大于第二预设阈值的目标标注数据仅仅为“商品退款的方法是什么”,其影响系数为0.6,当然,展示的方式不局限于表1所示,还可以对话的形式展示,还可不展示影响系数。
查询商品退款的方式 |
:商品退款的方法是什么—0.6 |
表1
若用户确定接收到的目标语义标签不是自己想要获取的语义标签,或者说该目标语义标签与用户表达的语义相关性并不大,则将选取并返回至用户终端的目标标注数据从目标语义标签中删除,以优化语义模型的训练数据,避免该类目标标注数据扰乱匹配逻辑。
请参见图5,图5为本发明实施例提供的一种语义模型的调优系统的结构示意图,如图5所示,该系统包括客户端100及服务端200,所述客户端100和所述服务端200通信连接;所述服务端200包括第一获取模块210、语义识别模块220、第二获取模块230及模型调优模块240;
所述客户端100,用于接收用户输入的文本信息,并将所述文本信息发送至所述服务端200;以及接收所述服务端200返回的所述文本信息对应的目标语义标签;
所述第一获取模块210,用于接收所述文本信息;
所述语义识别模块220,用于将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;
所述第二获取模块230,用于获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;
所述模型调优模块240,用于根据所述目标语义标签及所述影响系数对所述语义模型进行调优。
可选的,如图6所示,所述服务端200,还包括:
第三获取模块250,用于获取标注数据集;
数据标注模块260,用于将所述标注数据集中的标注数据标注到多个预设语义标签中;其中,多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据;
模型训练模块270,用于针对所述多个预设语义标签中的每个预设语义标签,对该每个预设语义标签中的多个标注数据进行深度学习训练,以得到所述语义模型。
可选的,如图7所示,所述语义识别模块220,包括:
特征获取单元2201,用于获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值;
特征匹配单元2202,用于将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配,以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据;
语义确定单元2203,用于将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。
可选的,如图8所示,所述第二获取模块230,包括:
相似度计算单元2301,用于计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度;
系数确定单元2302,用于将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。
可选的,如图9所示,所述模型调优模块240,包括:
排序输出单元2401,用于根据所述影响系数的大小,对多个所述目标标注数据进行排序,并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据;
模型调优单元2402,用于在所述目标语义标签与所述文本信息语义不相匹配的情况下,将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除,以对所述语义模型的训练数据进行调优。
本发明实施例提供的语义模型的调优系统,能够实现图2和图4的方法实施例中的各个实施方式,以及相应有益效果,为避免重复,这里不再赘述。
请参见图10,图10为本发明实施例提供的一种电子设备的结构示意图,如图10所示,包括:存储器1001、处理器1002及存储在所述存储器1001上并可在所述处理器1002上运行的计算机程序,所述处理器1002用于调用存储器1001中存储的计算机程序执行如下步骤:
获取用户输入的文本信息;
将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;
获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;
根据所述目标语义标签及所述影响系数对所述语义模型进行调优。
可选的,所述处理器1002还用于:
获取标注数据集;
将所述标注数据集中的标注数据标注到多个预设语义标签中;其中,多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据;
针对所述多个预设语义标签中的每个预设语义标签,对该每个预设语义标签中的多个标注数据进行深度学习训练,以得到所述语义模型。
可选的,所述处理器1002执行所述将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,包括:
获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值;
将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配,以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据;
将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。
可选的,所述处理器1002执行所述获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,包括:
计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度;
将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。
可选的,所述处理器1002执行所述根据所述目标语义标签及所述影响系数对所述语义模型进行调优,包括:
根据所述影响系数的大小,对多个所述目标标注数据进行排序,并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据;
在所述目标语义标签与所述文本信息语义不相匹配的情况下,将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除,以对所述语义模型的训练数据进行调优。
示例性的,上述电子设备可以是手机、计算机、笔记本电脑、平板电脑、掌上电脑及可穿戴设备等。电子设备可包括但不仅限于处理器1002、存储器1001。本领域技术人员可以理解,所述示意图仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
需要说明的是,由于电子设备的处理器1002执行计算机程序时实现上述的语义模型的调优方法中的步骤,因此上述语义模型的调优方法的实施方式均适用于该电子设备,且均能达到相同或相似的有益效果。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述的语义模型的调优方法中的步骤。
示例性的,计算机可读存储介质的计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,由于计算机可读存储介质的计算机程序被处理器执行时实现上述的语义模型的调优方法中的步骤,因此上述语义模型的调优方法的所有实施方式均适用于该计算机可读存储介质,且均能达到相同或相似的有益效果。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种语义模型的调优方法,其特征在于,所述方法包括:
获取用户输入的文本信息;
将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;
获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;
根据所述目标语义标签及所述影响系数对所述语义模型进行调优。
2.根据权利要求1所述的方法,其特征在于,在所述将所述文本信息输入到预先训练好的语义模型中进行识别之前,所述方法还包括:
获取标注数据集;
将所述标注数据集中的标注数据标注到多个预设语义标签中;其中,多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据;
针对所述多个预设语义标签中的每个预设语义标签,对该每个预设语义标签中的多个标注数据进行深度学习训练,以得到所述语义模型。
3.根据权利要求2所述的方法,其特征在于,所述将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签,包括:
获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值;
将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配,以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据;
将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。
4.根据权利要求1所述的方法,其特征在于,所述获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数,包括:
计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度;
将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。
5.根据权利要求1或4所述的方法,其特征在于,所述根据所述目标语义标签及所述影响系数对所述语义模型进行调优,包括:
根据所述影响系数的大小,对多个所述目标标注数据进行排序,并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据;
在所述目标语义标签与所述文本信息语义不相匹配的情况下,将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除,以对所述语义模型的训练数据进行调优。
6.一种语义模型的调优系统,其特征在于,所述系统包括客户端及服务端,所述客户端和所述服务端通信连接;
所述服务端包括第一获取模块、语义识别模块、第二获取模块及模型调优模块;
所述客户端,用于接收用户输入的文本信息,并将所述文本信息发送至所述服务端;以及接收所述服务端返回的所述文本信息对应的目标语义标签;
所述第一获取模块,用于接收所述文本信息;
所述语义识别模块,用于将所述文本信息输入到预先训练好的语义模型中进行识别,以得到所述文本信息对应的目标语义标签;其中,所述目标语义标签中包括多个目标标注数据;
所述第二获取模块,用于获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数;
所述模型调优模块,用于根据所述目标语义标签及所述影响系数对所述语义模型进行调优。
7.根据权利要求6所述的系统,其特征在于,所述服务端,还包括:
第三获取模块,用于获取标注数据集;
数据标注模块,用于将所述标注数据集中的标注数据标注到多个预设语义标签中;其中,多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据;
模型训练模块,用于针对所述多个预设语义标签中的每个预设语义标签,对该每个预设语义标签中的多个标注数据进行深度学习训练,以得到所述语义模型。
8.根据权利要求7所述的系统,其特征在于,所述语义识别模块,包括:
特征获取单元,用于获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值;
特征匹配单元,用于将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配,以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据;
语义确定单元,用于将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。
9.根据权利要求6所述的系统,其特征在于,所述第二获取模块,包括:
相似度计算单元,用于计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度;
系数确定单元,用于将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。
10.根据权利要求6或9所述的系统,其特征在于,所述模型调优模块,包括:
排序输出单元,用于根据所述影响系数的大小,对多个所述目标标注数据进行排序,并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据;
模型调优单元,用于在所述目标语义标签与所述文本信息语义不相匹配的情况下,将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除,以对所述语义模型的训练数据进行调优。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910503677.XA CN110347786B (zh) | 2019-06-11 | 2019-06-11 | 一种语义模型的调优方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910503677.XA CN110347786B (zh) | 2019-06-11 | 2019-06-11 | 一种语义模型的调优方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110347786A true CN110347786A (zh) | 2019-10-18 |
CN110347786B CN110347786B (zh) | 2021-01-05 |
Family
ID=68181892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910503677.XA Active CN110347786B (zh) | 2019-06-11 | 2019-06-11 | 一种语义模型的调优方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110347786B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126054A (zh) * | 2019-12-03 | 2020-05-08 | 东软集团股份有限公司 | 确定相似文本的方法、装置、存储介质及电子设备 |
CN111144132A (zh) * | 2019-12-31 | 2020-05-12 | 北京声智科技有限公司 | 一种语义识别方法及装置 |
CN114025216A (zh) * | 2020-04-30 | 2022-02-08 | 网易(杭州)网络有限公司 | 媒体素材处理方法、装置、服务器及存储介质 |
CN114519895A (zh) * | 2022-02-21 | 2022-05-20 | 上海元梦智能科技有限公司 | 虚拟人动作配置方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909656A (zh) * | 2017-02-27 | 2017-06-30 | 腾讯科技(深圳)有限公司 | 获取文本提取模型的方法及装置 |
US20180013662A1 (en) * | 2016-07-05 | 2018-01-11 | Cisco Technology, Inc. | Method and apparatus for mapping network data models |
CN109446302A (zh) * | 2018-09-25 | 2019-03-08 | 中国平安人寿保险股份有限公司 | 基于机器学习的问答数据处理方法、装置和计算机设备 |
CN109522406A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 文本语义匹配方法、装置、计算机设备和存储介质 |
CN109582773A (zh) * | 2018-11-29 | 2019-04-05 | 深圳爱问科技股份有限公司 | 智能问答匹配方法及装置 |
-
2019
- 2019-06-11 CN CN201910503677.XA patent/CN110347786B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180013662A1 (en) * | 2016-07-05 | 2018-01-11 | Cisco Technology, Inc. | Method and apparatus for mapping network data models |
CN106909656A (zh) * | 2017-02-27 | 2017-06-30 | 腾讯科技(深圳)有限公司 | 获取文本提取模型的方法及装置 |
CN109446302A (zh) * | 2018-09-25 | 2019-03-08 | 中国平安人寿保险股份有限公司 | 基于机器学习的问答数据处理方法、装置和计算机设备 |
CN109522406A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 文本语义匹配方法、装置、计算机设备和存储介质 |
CN109582773A (zh) * | 2018-11-29 | 2019-04-05 | 深圳爱问科技股份有限公司 | 智能问答匹配方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126054A (zh) * | 2019-12-03 | 2020-05-08 | 东软集团股份有限公司 | 确定相似文本的方法、装置、存储介质及电子设备 |
CN111126054B (zh) * | 2019-12-03 | 2024-03-05 | 东软集团股份有限公司 | 确定相似文本的方法、装置、存储介质及电子设备 |
CN111144132A (zh) * | 2019-12-31 | 2020-05-12 | 北京声智科技有限公司 | 一种语义识别方法及装置 |
CN111144132B (zh) * | 2019-12-31 | 2023-10-10 | 北京声智科技有限公司 | 一种语义识别方法及装置 |
CN114025216A (zh) * | 2020-04-30 | 2022-02-08 | 网易(杭州)网络有限公司 | 媒体素材处理方法、装置、服务器及存储介质 |
CN114025216B (zh) * | 2020-04-30 | 2023-11-17 | 网易(杭州)网络有限公司 | 媒体素材处理方法、装置、服务器及存储介质 |
CN114519895A (zh) * | 2022-02-21 | 2022-05-20 | 上海元梦智能科技有限公司 | 虚拟人动作配置方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110347786B (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110347786A (zh) | 一种语义模型的调优方法及系统 | |
CN102236663B (zh) | 一种基于垂直搜索的查询方法、系统和装置 | |
US7689527B2 (en) | Attribute extraction using limited training data | |
US11741094B2 (en) | Method and system for identifying core product terms | |
CN104951468A (zh) | 数据搜索处理方法和系统 | |
CN107862005A (zh) | 用户意图识别方法及装置 | |
CN110362665B (zh) | 一种基于语义相似度的问答系统及方法 | |
CN103514181A (zh) | 一种搜索方法和装置 | |
CN110084658A (zh) | 物品匹配的方法和装置 | |
CN104866985A (zh) | 快递单号识别方法、装置及系统 | |
CN113379449B (zh) | 多媒体资源召回方法、装置、电子设备以及存储介质 | |
CN107578659A (zh) | 电子题目的生成方法、生成装置及终端 | |
CN110516033A (zh) | 一种计算用户偏好的方法和装置 | |
CN109447273A (zh) | 模型训练方法、广告推荐方法、相关装置、设备及介质 | |
CN109726295A (zh) | 品牌知识图谱显示方法、装置、图服务器及存储介质 | |
CN115545832A (zh) | 商品搜索推荐方法及其装置、设备、介质 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN113792134A (zh) | 一种基于数字孪生技术的用户服务方法及系统 | |
CN114943590A (zh) | 基于双塔模型的对象推荐方法及装置 | |
Vishwanath et al. | Deep reader: Information extraction from document images via relation extraction and natural language | |
CN107967641A (zh) | 商品推荐方法、装置及计算机可读存储介质 | |
CN113325959A (zh) | 一种输入语料的推荐方法和装置 | |
CN108334522A (zh) | 确定海关编码的方法,以及确定类型信息的方法和系统 | |
CN112860860A (zh) | 一种答复问题的方法和装置 | |
CN114579870B (zh) | 基于关键字的金融主播推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |