CN114969326A - 分类模型训练、语义分类方法、装置、设备和介质 - Google Patents

分类模型训练、语义分类方法、装置、设备和介质 Download PDF

Info

Publication number
CN114969326A
CN114969326A CN202210439044.9A CN202210439044A CN114969326A CN 114969326 A CN114969326 A CN 114969326A CN 202210439044 A CN202210439044 A CN 202210439044A CN 114969326 A CN114969326 A CN 114969326A
Authority
CN
China
Prior art keywords
category
semantic
sample
predicted
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210439044.9A
Other languages
English (en)
Inventor
林泽南
秦华鹏
赵岷
张国鑫
吕雅娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210439044.9A priority Critical patent/CN114969326A/zh
Publication of CN114969326A publication Critical patent/CN114969326A/zh
Priority to US18/179,266 priority patent/US20230342667A1/en
Priority to JP2023050552A priority patent/JP2023160746A/ja
Priority to KR1020230039739A priority patent/KR20230150723A/ko
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Abstract

本公开提供了一种分类模型训练、语义分类方法、装置、设备和介质,涉及人工智能领域,尤其涉及知识图谱、深度学习和自然语义处理等技术。具体实现方案为:获取样本问询模板和样本问询模板中待预测类别的标签类别;其中,样本问询模板基于样本问询语句和待预测类别的数量构建;将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的样本语义类别;根据样本语义类别和待预测类别的标签类别,训练语义分类模型。根据本公开的技术,提高了模型的通用性,能够应对样本不均衡问题。

Description

分类模型训练、语义分类方法、装置、设备和介质
技术领域
本公开涉及人工智能技术领域,尤其涉及知识图谱、深度学习和自然语义处理等技术。
背景技术
文本分类又称自动文本分类,是指计算机将载有信息的文本映射到预先给定的某一类别或某几类别主题的过程,可用于情感分析、话题标记、新闻分类、问答系统、自然语言推理、对话行为分类、关系分类和事件预测等诸多场景。
发明内容
本公开提供了一种分类模型训练、语义分类方法、装置、设备和介质。
根据本公开的一方面,提供了一种分类模型训练方法,包括:
获取样本问询模板和样本问询模板中待预测类别的标签类别;其中,样本问询模板基于样本问询语句和待预测类别的数量构建;
将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的样本语义类别;
根据样本语义类别和待预测类别的标签类别,训练语义分类模型。
根据本公开的另一方面,还提供了一种语义分类方法,包括:
获取预测问询模板;其中,预测问询模板基于预测问询语句和待预测类别的数量构建;
根据预测问询模板,得到待预测类别的预测语义类别。
根据本公开的另一方面,还提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开实施例所提供的任意一种分类模型训练方法,和/或语义分类方法。
根据本公开的另一方面,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开实施例所提供的任意一种分类模型训练方法,和/或语义分类方法。
根据本公开的技术,提高了模型的通用性,能够应对样本不均衡问题。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1A是本公开实施例提供的一种分类模型训练方法的流程图;
图1B是本公开实施例提供的一种语义分类模型的结构图;
图2是本公开实施例提供的另一种分类模型训练方法的流程图;
图3是本公开实施例提供的另一种分类模型训练方法的流程图;
图4A是本公开实施例提供的一种语义分类方法的流程图;
图4B是本公开实施例提供的一种语义分类模型的结构图;
图5是本公开实施例提供的另一种语义分类方法的流程图;
图6是本公开实施例提供的一种分类模型训练装置的结构图;
图7是本公开实施例提供的一种语义分类装置的结构图;
图8是用来实现本公开实施例的分类模型训练方法和/或语义分类方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开实施例提供的各分类模型训练方法,可以适用于进行语义分类模型训练的场景,该方法可以由分类模型训练装置执行,该装置可以采用软件和/或硬件实现,并具体配置于电子设备中。
参见图1A所示的一种分类模型训练方法,包括:
S101、获取样本问询模板和样本问询模板中待预测类别的标签类别;其中,样本问询模板基于样本问询语句和待预测类别的数量构建。
其中,问询语句可以理解为由至少一个语义字符构建得到的语句,样本问询语句即为在模型训练过程中作为训练样本的问询语句。其中,待预测类别可以理解为样本问询语句最多可预测的类别。待预测类别的数量可以由技术人员根据需要或经验值进行设定,或通过大量试验确定。其中,待预测类别的数量可以为至少一个。为了避免后续训练得到的语义分类模型出现语义类别预测遗漏的情况,通常会将待预测类别的数量设置为至少两个,例如5个。
需要说明的是,待预测类别为可预测类别中的至少一种,通常待预测类别的数量会显著小于可预测类别的数量。
其中,样本问询模板为基于样本问询语句和待预测类别的数量构建的具备统一格式要求的语句。其中,待预测类别的标签类别可以理解为预先设定的样本问询语句对应的标准语义类别。其中,本公开对标签类别的具体设定方式不作任何限定,例如可以采用人工标注的方式加以实现。
需要说明的是,样本问询模板和/或相应的标签类别可以存储在执行分类模型训练的计算设备本地、或者与该计算设备相关联的其他存储设备或云端中,并在需要时进行相应数据的获取。本公开对上述各数据的获取方式不作任何限定。
可选的,还可以在进行分类模型训练之前,获取样本问询语句,并根据样本问询语句和待预测类别的数量,实时构建样本问询模板,以供后续分类模型训练使用。
值得注意的是,执行样本问询模板和相应标签类别获取的计算设备与进行样本问询模板构建的计算设备,两者可以相同或不同,本公开对此不作任何限定。
S102、将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的样本语义类别。
将样本问询模板作为训练样本输入至预先构建的语义分类模型中,得到样本问询模板中至少一个待预测类别的样本语义类别。需要说明的是,所预测的样本语义类别的数量,仅需不大于待预测类别的数量即可,本公开对样本语义类别的具体数量不作任何限定。
其中,语义分类模型可以基于现有的机器学习模型或深度学习模型实现,本公开对该语义分类模型的具体网络结构不作任何限定。示例性的,语义分类模型可以采用PLM(Pre-trained Language Model,与训练语言模型)加以实现。例如,语义分类模型可以是BERT(Bidirectional Encoder Representation from Transformers,深度双向语言表征抽取模型)或ERNIE(Enhanced Representation through Knowledge Integration,知识表征增强融合)模型等。
在一个可选实施例中,可以直接将样本问询模板作为训练样本输入至预先构建的语义分类模型中,将语义分类模型的输出直接作为待预测类别的样本语义类别。
在另一可选实施例中,可以将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的至少一个样本语义字符;将各样本语义字符按照预测顺序组合,得到待预测类别的样本语义类别。
其中,待预测类别的样本语义字符,可以理解为在待预测类别维度下,所提取的样本问询模板的语义特征对应的字符信息。示例性的,针对任一待预测类别维度,可能得到的样本语义字符的数量为至少一个,因此可以根据样本语义字符的预测顺序,将各样本语义字符顺序组合,得到待预测类别的样本语义类别。
可以理解的是,通过首先预测样本语义字符,再按照预测顺序组合各样本语义字符,得到待预测类别的样本语义类别的方式,进行样本语义类别的确定,完善了样本语义类别的确定机制。同时,鉴于样本语义字符粒度较小,能够通过字符粒度进行语义特征的提取,提高了所预测的样本语义字符的准确性。
示例性的,将样本问询模板输入至预先构建的语义分类模型,以提取样本问询模板中的样本语义特征,并对样本语义特征进行特征变换,得到待预测类别的至少一个样本语义字符。其中,各待预测类别的样本语义字符的数量可以相同或不同,本公开仅对不同待预测类别的样本语义字符的最大数量加以约束即可。
具体的,结合图1B所示的语义分类模型结构图,该语义分类模型可以包括特征提取网络和特征变换网络。针对任一待预测类别,可以通过特征提取网络在该待预测类别维度对样本问询模板进行特征提取,得到该待预测类别维度下的样本语义特征;通过特征变换网络对样本语义特征进行特征变换,从而将样本语义特征从语义特征空间映射至语义字符空间,并将语义字符空间下的映射结果与标准语义字符库进行匹配,得到样本语义字符。相应的,将各样本语义字符按照预测顺序组合,得到待预测类别的样本语义类别。
其中,特征变换可以采用线性特征变换或非线性特征变换的方式,本公开对此不作任何限定。其中,标准语义字符库可以由技术人员根据需要或经验值进行设定或调整,或通过大量试验加以设置。
可以理解的是,上述技术方案仅通过特征变换的方式进行样本语义字符的确定,无需进行复杂的数据处理,简化了样本语义字符确定过程的数据运算量,从而有助于提高模型训练效率。
S103、根据样本语义类别和待预测类别的标签类别,训练语义分类模型。
根据样本语义类别和待预测标签的标签类别之间的差异情况,确定损失函数,并基于损失函数调整语义分类模型的模型参数,以趋缩小样本语义标签与标签类别之间的差异,提高语义分类模型的分类能力,直至所训练的语义分类模型满足训练终止条件。
其中,训练终止条件可以是训练语义分类模型的样本问询模板的数量满足预设数量阈值、损失函数的函数值趋于平稳、模型评价指标满足预设评价指标阈值等中的至少一种。其中,预设数量阈值和预设评价指标阈值的具体数值可以由技术人员根据需要或经验值进行设置,或通过大量试验加以确定。其中,模型评价指标可以包括准确度、灵敏度和特异性等中的至少一种。
本公开实施例通过获取基于样本问询模板和待预测类别的数量构建的样本问询模板,并根据样本问询模板和待预测类别的标签类别,对预先构建的语义分类模型进行训练。由于本公开基于统一的样本问询模板进行语义分类模型的训练,从语义维度而非类别间差异维度进行样本分类,使得所训练的语义分类模型能够适配多样化的分类场景,且无需针对不同分类场景进行不同分类模型的训练,提高了所训练的语义分类模型的通用性。同时,采用模板的形式进行多样化的样本问询语句的统一整合,能够有效应对多样化类别预测场景下样本不均衡的问题,从而有助于提高所训练的语义分类模型的小样本分类能力。
在上述各技术方案的基础上,本公开还提供了一个可选实施例。在该可选实施例中,对S101中所使用的样本问询模板的构建机制进行了细化。需要说明的是,在本公开实施例未详述部分,可参见其他实施例的相关表述。
参见图2所示的一种分类模型训练方法,包括:
S201、构建包括样本语义类别填充域的样本类别填充语句;其中,样本语义类别填充域的数量与待预测类别的数量相等;样本语义类别填充域用于填充相应待预测类别的样本语义类别。
其中,样本语义类别填充域可以是预先设置的空白区域或添加有预设标识的区域,其中,预设标识可以由技术人员根据需要或经验值进行设置或调整,例如可以是空值或“MASK”标记等。
可以理解的是,为了便于对样本类别填充语句中不同样本语义类别加以区分,可以在不同样本语义类别填充域之间添加域分隔符。其中,域分隔符可以采用预设字符加以实现,本公开对预设字符的具体表现形式不作任何限定。例如,预设字符可以是逗号、顿号、空格或其他符号等。
需要说明的是,本公开中所涉及的待预测类别可以为相同体系下的类别或不同体系下的类别。其中,不同待预测类别所属体系可以由技术人员根据需要或经验值进行设置或调整,本公开对体系的种类也不作任何限制。
举例说明,可以划分主题和意图两种体系。其中,将具备物种归属属性的类别划分为主题体系,例如人物、娱乐人物等均属于主题体系;将具备数据获取意图的类别划分为意图体系,例如身高、体重等均属于意图体系。
当待预测类别数量为至少一个,且不同待预测类别所属体系不同,也即各待预测类别所属体系的数量为至少一个的情况下,可以针对任一体系,构建包括样本语义类别填充域的样本体系填充子句;其中,样本语义类别填充域的数量与该体系下待预测类别的数量相等;根据不同样本体系填充子句,确定样本类别填充语句。
具体的,针对任一体系,根据该体系下待预测类别的数量,设置等量的样本语义类别填充域,并构建包括所设置样本语义类别填充域的样本体系填充子句。当待预测类别数量对应体系的数量为至少两个时,根据不同体系对应的各样本体系填充子句,确定样本类别填充语句。
示例性的,可以将不同体系对应的样本体系填充子句组合,得到样本类别填充语句。进一步的,为了便于进行不同体系下的待预测类别的划分,可以在生成样本类别填充语句时,将不同样本体系填充子句之间设置子句分隔符。其中,子句分隔符可以采用预设字符加以实现,本公开对预设字符的具体表现形式不作任何限定。例如,预设字符可以是逗号、顿号、空格或其他符号等。需要说明的是,子句分隔符与前述域分隔符可以相同或不同,仅需保证能够将不同样本体系填充子句加以区分即可。
可以理解的是,通过引入待预测类别所属体系,针对各体系进行样本体系填充子句的构建,进而根据样本体系填充子句进行样本类别填充语句的确定使得所生成的样本类别填充语句中,能够对待预测类别进行体系划分。同时,由于样本类别填充语句作为样本问询模板的生成基础,便于进行体系的新增或调整,从而无需针对不同体系分别进行后续语义分类模型的训练,能够适配多样化的样本问询语句,有助于提高模型通用性。并且,在多体系多类别的语义分类模型训练过程中,能够实现不同样本问询语句所训练的网络参数的复用,实现有助于提升训练效率。
进一步的,当引入多体系多类别的样本问询模板时,在进行模型训练过程中,模型内部通常会进行不同维度下的语义特征的交叉增强,从而助于提高所训练模型的语义特征提取能力,进而有助于提高所训练模型的准确度。
需要说明的是,为了便于进行不同体系下的待预测类别的划分,可以在相同体系的样本体系填充子句中,设置相同的域分隔符,在不同样本体系填充子句中,设置不同的域分隔符。
S202、根据样本问询语句和样本类别填充语句,构建样本问询模板。
生成包括样本问询语句和样本类别填充语句的样本问询模板。
示例性的,将样本问询语句和样本类别填充语句组合,得到样本问询模板。进一步的,为了保证后续在预测样本语义类别时,将样本语义类别填充至样本问询模板的样本语义类别填充域后,所得样本问询模板的可读性,还可以在构建样本问询模板时,在样本问询语句与样本类别填充语句之间,添加连接语句。其中,连接语句可以人为设置,例如连接语句可以为连词。当然,为了增强样本语义类别填充域经样本语义类别填充后的样本问询模板的可读性,在不同样本体系填充子句之间,还可以添加连接语句。本公开对样本问询模板中不同位置的连接语句的数量和内容不做任何限定。
举例说明,若样本问询语句为“张三身高和体重”,且待预测类别所属体系包括主题体系和意图体系,各体系对应待预测类别的数量为三个,则可构建以下模板“张三身高和体重是[MASK],[MASK],[MASK];[MASK]、[MASK]、[MASK]”。其中,“[MASK]”为样本语义类别填充域;“[MASK],[MASK],[MASK];[MASK]、[MASK]、[MASK]”为样本类别填充语句;“是”为连词;“[MASK],[MASK],[MASK]”为主题体系对应的样本体系填充子句,其中“,”为主题体系对应的域分隔符;“[MASK]、[MASK]、[MASK]”为意图体系对应的样本体系填充子句,其中“、”为意图体系对应的域分隔符;“;”为样本体系填充子句之间的域分隔符。当然,上述仅对所构建样本问询模板进行示例性说明,不应理解为对样本问询模板的构建方式的限定。
S203、获取样本问询模板和样本问询模板中待预测类别的标签类别。
S204、将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的样本语义类别。
延续前例,若样本问询模板为“张三身高和体重是[MASK],[MASK],[MASK];[MASK]、[MASK]、[MASK]”,确定的主题体系下的待预测类别包括“人物”和“娱乐人物”,确定的意图体系下的待预测类别包括“身高”和“体重”,则样本问询模板中的样本语义类别填充域被填充后得到“张三身高和体重是人物,娱乐人物,[MASK];身高、体重、[MASK]”。为了保证填充后的样本问询模板的简洁度,可以不显示未填充的样本语义类别以及相邻的域分隔符。也即,填充后的样本问询模板可以是“张三身高和体重是人物,娱乐人物;身高、体重”。
S205、根据样本语义类别和待预测类别的标签类别,训练语义分类模型。
本公开实施例通过引入样本语义类别填充域构建样本类别填充语句,并根据样本问询语句和样本类别填充语句,构建样本问询模板,从而完善了样本问询模板的构建机制,为语义分类模型的训练提供了数据支撑。同时,通过上述统一的方式针对不同样本问询语句进行样本问询模板的生成,使得网络结构无需特别复杂的语义分类模型也能训练出较好的分类能力,简化了模型复杂度,有助于提升了训练效率。
需要说明的是,在进行语义分类模型训练过程中,该语义分类模型逐渐具备了基于样本问询模板中的语义特征,进行语义类别划分的能力。由于样本问询模板中待预测类别的标签类别在标注过程中可能存在标注不合理的情况,因此,可以引入标签类别纠错机制,将标注不合理的标签类别进行校正,避免由于标签类别标注错误,影响语义分类模型的分类能力。
有鉴于此,本公开还提供了一个可选实施例,在该可选实施例中,对S103中对语义分类模型的训练过程中,引入标签类别纠错机制,以提升语义分类模型的分类能力。需要说明的是,在本公开实施例中未详述部分,可参见其他实施例的相关表述。
进一步参见图3所示的一种分类模型训练方法,包括:
S301、获取样本问询模板和样本问询模板中待预测类别的标签类别;其中,样本问询模板基于样本问询语句和待预测类别的数量构建。
S302、将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的样本语义类别。
S303、根据样本语义类别和标签类别,确定标签异常类型。
其中,标签异常类型用于从类型维度表征样本语义类别与标签类别不同时的差异情况。
示例性的,可以根据样本语义类别和标签类别之间的差异情况,确定标签异常类型。
在一个可选实施例中,若样本语义类别为标签类别的下位类别,则确定标签异常类型为上位预测下位类型。
具体的,若标签类别和样本语义类别具备上下位所属关系,且标签类别为样本语义类别的上位类别,样本语义类别为标签类别的下位类别,则确定标签异常类型为上位预测下位类型。例如,标签类别为“游戏”;样本语义类别为“象棋游戏”;“象棋游戏”为“游戏”的下位类别,此时,对应标签异常类型即为“上位预测下位类型”。
在另一可选实施例中,若样本语义类别为标签类别的同源变形类别,则确定标签异常类型为噪音类型。
其中,标签类别的同源变形类别,可以理解为对标签类别直接增加或删减字符所得到的类别。示例性的,可以通过确定标签类别与样本语义类别的相同字符占比或相似度,来识别样本语义类别是否为标签类别的同源变形类别。若是,则确定标签异常类型为噪音类型。例如,样本问询语句为“久病成良医下一句”,该样本问询语句的意图体系下的待预测类别对应标签类别为“其他”,而语义分类模型输出的样本语义类别为“其他句”,由于“其他句”为“其他”的同源变形类别,因此,将标签异常类型设置为噪音类型。
在又一可选实施例中,若样本语义类别为标签类别的可拆分类别的组合类别,则确定标签异常类型为混淆类型。
其中,标签类别的可拆分类别可以理解为复合语义的标签类别的单语义拆分结果。其中,复合语义中可以包括至少两层单语义。例如,“票房榜”是“票房”和“排行榜”的复合语义,则标签类别“票房榜”对应的可拆分类别包括“票房”和“排行榜”。若样本语义类别为“票房排行榜”,则标签异常类型设置为混淆类型。
可以理解的是,上述通过将标签异常类型细化为包括上位预测下位类型、噪音类型和混淆类型中的至少一种,提高了标签异常类型的丰富性和多样性,并对不同类型的标签异常类型加以限定,完善了不同标签异常类型的确定机制,为不同标签异常类型下对标签类别的校正奠定了基础。
S304、根据标签异常类型对应的标签校正方式,调整标签类别。
示例性的,可以预先为不同标签异常类型设置不同的标签校正方式,相应的,采用标签异常类型相对应的标签校正方式,对异常标签类别加以修正。
在一个可选实施例中,若标签异常类型为上位预测下位类型,则可以直接将标签类别替换为样本语义类别。
延续前例,若标签类别为“游戏”,样本语义类别为“象棋游戏”,则直接将标签类别由“游戏”变更为“象棋游戏”。
在另一可选实施例中,若标签异常类型为噪音类型,则可以根据标签类别的同源变形类别的可替代标签,调整标签类别。
示例性的,可以从标签类别的同源变形类别的可替代标签中,选取其中一个可替代标签作为标签类别。可选的,可以采用确定样本问询语句与可替代标签的相似度的方式,或者采用人工的方式,进行可替代类别的选取,本公开对可替代标签的选取方式不作任何限定。
延续前例,若样本问询语句为“久病成良医下一句”,该样本问询语句的意图体系下的待预测类别对应标签类别为“其他”,而语义分类模型输出的样本语义类别为“其他句”,则可以从“其他句”的可替代标签“上一句”和“下一句”中,选取“下一句”作为新的标签类别。
在又一可选实施例中,若标签异常类型为混淆类型,则将标签类别替换为样本语义或标签类别的可拆分类别。
延续前例,若标签类别为“票房榜”,样本语义类别为“票房排行榜”,则可以在单一意图预测场景下,将单一意图预测转变为单一意图体系下多类别预测,从而将标签类别校正为包括“票房”和“排行榜”。或者,在双意图体系单类别预测场景下,在已有的第一意图体系下的“票房”和第二意图体系下的“排行榜”后,增加新的意图体系“票房排行榜”的标签类别。
可以理解的是,上述通过将不同标签异常类型下对标签类别的校正过程进行细化,提高了标签类别校正过程的多样性和丰富性,能够有效应对不同的标签异常情况,从而为语义分类模型的准确度的进一步提高奠定基础。
S305、根据样本语义类别和调整后的标签类别,训练语义分类模型。
根据调整后的标签类别而非异常标注的标签类别,对语义分类模型进行训练,避免了采用异常标注的标签类别对语义分类模型的网络参数,导致语义分类模型性能较差、准确度较低的情况发生,从而有助于提高语义分类模型的准确度和鲁棒性。
以上对分类模型的训练过程进行了详细说明,以下将对语义分类过程进行详述。
本公开实施例所提供的各语义分类方法,可适用于进行语义分类,特别是基于前述分类模型训练方法所得到的语义分类模型,进行语义分类的场景。该方法可以由语义分类装置执行,该装置可以采用软件和/或硬件实现,并具体配置于电子设备中。该电子设备与执行前述分类模型训练方法的计算设备可以是相同或不同的电子设备,本公开对此不作任何限定。
参见图4A所示的一种语义分类方法,包括:
S401、获取预测问询模板;其中,预测问询模板基于预测问询语句和待预测类别的数量构建。
其中,问询语句可以理解为由至少一个语义字符构建得到的语句,预测问询语句即为在语义分类过程中,待进行语义类别预测的问询语句。其中,待预测类别可以理解为预测问询语句可预测的类别,其中,待预测类别的数量可以由技术人员根据需要或经验值进行设定,或通过大量试验确定。其中,待预测类别的数量可以为至少一个。为了避免对不同预测问询语句进行待预测类别确定时,出现类别预测遗漏的情况发生,通常会将待预测类别的数量设置为至少两个,例如5个。
需要说明的是,待预测类别为可预测类别中的至少一种,通常待预测类别的数量会显著小于可预测类别的数量。
其中,预测问询模板为基于预测问询语句和待预测类别的数量构建的具备统一格式要求的语句。需要说明的是,预测问询模板可以预先存储在执行语义分类方法的计算设备本地、或者与该计算设备关联的其他存储设备或云端中,并在需要进行语义分类时,进行响应数据的获取。本公开对预测问询模板的获取方式不作任何限定。
可选的,还可以在执行语义分类之前,获取预测问询语句,并根据预测问询语句和待预测类别的数量,实时构建预测问询模板。
值得注意的是,执行预测问询模板获取的计算设备与进行预测问询模板构建的计算设备,两者可以相同或不同,本公开对此不作任何限定。
S402、根据预测问询模板,得到待预测类别的预测语义类别。
示例性的,可以将预测问询模板作为训练好的语义分类模型的输入数据,根据模型输出结果,确定待预测类别的预测语义类别。需要说明的是,所得到的预测语义类别的数量不大于待预测类别的数量即可,本公开对预测语义类别的具体数量不作任何限定。其中,语义分类模型可以采用前述至少一种分类模型训练方法训练得到。
在一个可选实施例中,可以直接将预测问询模板输入至训练好的语义分类模型中,将语义分类模型的输出作为待预测类别的预测语义类别。
在另一可选实施例中,可以根据预测问询模板,确定待预测类别的至少一个预测语义字符;将各预测语义字符按照预测顺序组合,得到待预测类别的预测语义类别。
其中,待预测类别的预测语义字符,可以理解为在待预测类别维度下,所提取的预测问询模板的语义特征对应的字符信息。其中,各待预测类别的预测语义字符的数量可以相同或不同,本公开仅对不同待预测类别的预测语义字符的最大数量加以约束即可。
示例性的,可以将预测问询模板输入至训练好的语义分类模型中,得到待预测类别的至少一个预测语义字符。相应的,针对任一待预测类别维度,可能得到的预测语义字符的数量为至少一个,因此可以根据预测语义字符的预测顺序,将各预测语义字符顺序组合,得到待预测类别的预测语义类别。
可以理解的是,通过预先确定预测语义字符,再按照预测顺序组合各预测语义字符,得到待预测类别的预测语义类别的方式,进行预测语义类别的确定,完善了预测语义类别的确定机制。同时,鉴于预测语义字符粒度较小,能够通过字符粒度进行语义特征的提取,提高了所确定的预测语义字符的准确度。同时,由于不同预测语义字符的较多,通过对不同顺序下的预测语义字符进行组合,提高了所确定的预测语义类别的丰富性和多样性。
示例性的,根据预测问询模板,确定待预测类别的至少一个预测语义字符,可以是:提取预测问询模板中的预测语义特征;对预测语义特征进行特征变换,得到待预测类别的至少一个预测语义字符。
具体的,结合图4B所示的语义分类模型结构图,该语义分类模块可以包括特征提取网络和特征变换网络。可以针对任一待预测类别,可以通过特征提取网络在该待预测类别维度对预测问询模板进行特征提取,得到该待预测类别维度下的预测语义特征;通过特征变换网络对预测语义特征进行特征变换,从而将预测语义特征从语义特征空间映射至语义字符空间,并将语义字符空间下的映射结果与标准语义字符库进行匹配,得到预测语义字符。相应的,将各预测语义字符按照预测顺序组合,得到待预测类别的预测语义类别。
其中,特征变换可以采用线性特征变换或非线性变换的方式,本公开对此不作任何限定。其中,标准语义字符库可以由技术人员根据需要或经验值进行设定或调整,或通过大量试验加以设置。
需要说明的是,为了保证语义分类结果的准确度,在基于语义分类模型进行预测语义字符确定时,预测问询模板中待预测类别的预测语义字符的最大数量,应当与样本问询模板中待预测类别的样本语义字符的最大数量相一致;特征变换所采用的特征变换方式也应当一致;在语义分类过程中所采用的标准语义字符库,与分类模型训练过程中所采用的标准语义字符库也应当保持一致。
可以理解的是,上述技术方案仅通过特征变换的方式进行预测语义字符的确定,无需进行复杂的数据处理,简化了预测语义字符确定过程的数据运算量,从而有助于语义分类效率。
由于预测语义类别可以由至少一个字符预测位的预测语义字符顺序组合得到。鉴于预测语义字符的多样性,通过顺序组合的方式所得的预测语义类别可能并不存在实际语义,影响预测语义类别确定结果的准确度。例如,不同字符预测位的预测语义字符分别为“娱”、“快”、“人”和“物”,组合得到的预测语义类别为“娱快人物”,而“娱快人物”并无实际语义。
可选的,可通过预测语义类别在标准语义类别库的存在性加以衡量;若存在,则表明存在实际的语义信息;否则,不存在实际的语义信息。其中,标准语义类别库中存储有可以作为可预测类别的标准语义类别,各标准语义类别均具备实际语义含义。需要说明的是,标准语义类别库可以由技术人员根据需要或经验值进行设置或调整,本公开对此不作任何限定。
为了提高预测语义类别的准确度,在进行预测语义字符确定时,至少一个预测语义字符中相同预测顺序的预测语义字符为至少两个,也即,在同一字符预测位,进行至少两个预测语义字符的确定,并通过引入预测语义字符的概率,对不同预测语义字符设置于相应字符预测位的可能性加以区分。
相应的,将各预测语义字符按照预测顺序组合,得到待预测类别的预测语义类别,可以是:将不同预测顺序的各预测语义字符,按照预测顺序组合,得到至少一个候选语义类别;根据候选语义类别中不同预测语义字符的字符预测概率,确定候选语义类别的类别预测概率;根据类别预测概率,以及候选语义类别与标准语义类别库中各标准语义类别的匹配结果,从各候选语义类别中选取预测语义类别。
示例性的,针对任一待预测类别,确定该待预测类别下各字符预测位中的字符预测概率;根据预测顺序,将不同字符预测位的预测语义字符组合,得到候选语义类别;基于预设概率确定函数,根据候选语义类别中不同预测语义字符的字符预测概率,确定候选语义类别的类别预测概率;其中,预设概率确定函数为字符预测概率的增函数;从候选语义类别中选取类别预测概率较高(例如最高),且与标准语义类别库中各标准语义类别相匹配的候选语义类别,作为预测语义类别。
具体的,可以基于Beam search(集束搜索)或Bk-tree(Burkhard Keller Tree,凯勒布尔哈德树)的方式,确定类别预测概率较大的至少一个候选语义类别,并从中选取类别预测概率较高,且能够在标准语义类别库中匹配到标准语义类别的候选语义类别,作为预测语义类别。
延续前例,若候选语义类别中包括“娱快人物”、“娱乐人物”、“娱快人员”和“娱乐人员”,且类别预测概率依次降低,仅有“娱乐人物”为标准语义类别库中的标准语义类别,因此,选取“娱乐人物”作为最终的预测语义类别。
需要说明的是,当存在多体系多类别预测时,可以分类针对不同体系设置标准语义类别库,从而提高各体系下预测语义类别确定结果准确度的同时,能够避免不同体系下标准语义类别库的混合使用,导致计算量的增加。
上述技术方案通过在相同预测顺序中进行至少两个预测语义字符的确定,并引入预测语义字符的字符预测概率,进行类别预测概率的确定,从而基于类别预测概率和标准语义类别库中的标准语义类别,进行预测语义类别的确定,避免了在语义分类过程中分类结果不准确的情况发生,有助于提高分类预测结果的准确度和合理性。
本公开实施例通过获取基于预测问询语句和待预测类别的数量构建的预测问询模板,并根据预测问询模板,得到待预测类别的预测语义类别。由于本公开基于统一的预测问询模板进行类别预测,从语义维度而非类别间差异维度进行分类,使得分类方式能够适配多样化的分类场景,提高了语义分类的通用性。
进一步的,基于前述训练好的语义分类模型,确定预测问询模板中各待预测类别的预测语义类别,由于模型能够应对多样化类别预测场景下样本不均衡的问题,从而有助于提高所训练的语义分类模型的小样本分类能力,从而提高了小样本情况下语义分类结果的准确度。
在上述各技术方案的基础上,本公开还提供了一可选实施例,在该可选实施例中,对S401中使用的预测问询模板的构建机制进行了优化。需要说明的是,在本公开实施例中未详述部分,可参见其他实施例的相关表述。
进一步参见图5所示的一种语义分类方法,包括:
S501、构建包括预测语义类别填充域的预测类别填充语句;其中,预测语义类别填充域的数量与待预测类别的数量相等;预测语义类别填充域用于填充相应待预测类别的预测语义类别。
其中,预测语义类别填充域可以是预先设置的空白区域或添加有预设标识的区域,其中,预设标识可以由技术人员根据需要或经验值进行设置或调整,例如可以是空值或“MASK”标记等。需要说明的是,此处的预设标识与分类模型训练过程中的预设标识可以相同或不同。优选的,两者采用的预设标识相同。
可以理解的是,为了便于对预测类别填充语句中不同预测语义类别加以区分,可以在不同预测语义类别填充域之间添加域分隔符。其中,域分隔符可以采用预设字符加以实现,本公开对预设字符的具体表现形式不作任何限定。例如,预设字符可以是逗号、顿号、空格或其他符号等。
需要说明的是,本公开中所涉及的待预测类别可以为相同体系下的类别或不同体系下的类别。其中,不同待预测类别所属体系可以由技术人员根据需要或经验值进行设置或调整,本公开对体系的种类也不作任何限制。
举例说明,可以划分主题和意图两种体系。其中,将具备物种归属属性的类别划分为主题体系,例如人物、娱乐人物等均属于主题体系;将具备数据获取意图的类别划分为意图体系,例如身高、体重等均属于意图体系。
当待预测类别数量为至少一个,且不同待预测类别所属体系不同,也即各待预测类别所属体系的数量为至少一个的情况下,可以针对任一体系,构建包括预测语义类别填充域的预测体系填充子句;其中,预测语义类别填充域的数量与该体系下待预测类别的数量相等;根据不同预测体系填充子句,确定预测类别填充语句。
具体的,针对任一体系,根据该体系下待预测类别的数量,设置等量的预测语义类别填充域,并构建包括所设置预测语义类别填充域的预测体系填充子句。当待预测类别数量对应体系的数量为至少两个时,根据不同体系对应的各预测体系填充子句,确定预测类别填充语句。
示例性的,可以将不同体系对应的预测体系填充子句组合,得到预测类别填充语句。进一步的,为了便于进行不同体系下的待预测类别的划分,可以在生成预测类别填充语句时,将不同预测体系填充子句之间设置子句分隔符。其中,子句分隔符可以采用预设字符加以实现,本公开对预设字符的具体表现形式不作任何限定。例如,预设字符可以是逗号、顿号、空格或其他符号等。需要说明的是,子句分隔符与前述域分隔符可以相同或不同,仅需保证能够将不同预测体系填充子句加以区分即可。
可以理解的是,通过引入待预测类别所属体系,针对各体系进行预测体系填充子句的构建,进而根据预测体系填充子句进行预测类别填充语句的确定使得所生成的预测类别填充语句中,能够对待预测类别进行体系划分。同时,由于预测类别填充语句作为预测问询模板的生成基础,便于进行体系的新增或调整,能够适配多体系下的分类场景,提高了语义分类的通用性。
进一步的,当引入多体系多类别的预测问询模板时,若基于前述训练好的语义分类模型进行预测问询模板的处理,模型内部通常会进行不同维度下的语义特征的交叉增强,从而提高了语义分类模型所提取语义特征的丰富性和准确性,进而有助于提高多体系多分类下的语义分类准确度。
需要说明的是,为了便于进行不同体系下的待预测类别的划分,可以在相同体系的预测体系填充子句中,设置相同的域分隔符,在不同预测体系填充子句中,设置不同的域分隔符。
值得注意的是,本公开实施例中的域分隔符可以与分类模型训练过程中所使用的域分隔符相同或不同;本公开实施例中的子句分隔符可以与分类模型训练过程中所使用的子句分隔符相同或不同。优选的,本公开实施例中的域分隔符与分类模型训练过程中所使用的域分隔符相同;本公开实施例中的子句分隔符与分类模型训练过程中所使用的子句分隔符也相同。
S502、根据预测问询语句和预测类别填充语句,构建预测问询模板。
生成包括预测问询语句和预测类别填充语句的预测问询模板。
示例性的,将预测问询语句和预测类别填充语句组合,得到预测问询模板。进一步的,为了保证后续在确定预测语义类别时,将预测语义类别填充至预测问询模板的预测语义类别填充域后,所得预测问询模板的可读性,还可以在构建预测问询模板时,在预测问询语句与预测类别填充语句之间,添加连接语句。其中,连接语句可以人为设置,例如连接语句可以为连词。当然,为了增强预测语义类别填充域经预测语义类别填充后的预测问询模板的可读性,在不同预测体系填充子句之间,还可以添加连接语句。本公开对预测问询模板中不同位置的连接语句的数量和内容不做任何限定。
需要说明的是,此处所采用的连接语句与分类模型训练过程中所使用的连接语句可以相同或不同。优选的,两者采用连接语句对应相同。
举例说明,若预测问询语句为“张三身高和体重”,且待预测类别所属体系包括主题体系和意图体系,各体系对应待预测类别的数量为三个,则可构建以下模板“张三身高和体重是[MASK],[MASK],[MASK];[MASK]、[MASK]、[MASK]”。其中,“[MASK]”为预测语义类别填充域;“[MASK],[MASK],[MASK];[MASK]、[MASK]、[MASK]”为预测类别填充语句;“是”为连词;“[MASK],[MASK],[MASK]”为主题体系对应的预测体系填充子句,其中“,”为主题体系对应的域分隔符;“[MASK]、[MASK]、[MASK]”为意图体系对应的预测体系填充子句,其中“、”为意图体系对应的域分隔符;“;”为预测体系填充子句之间的域分隔符。当然,上述仅对所构建预测问询模板进行示例性说明,不应理解为对预测问询模板的构建方式的限定。
S503、根据预测问询模板,得到待预测类别的预测语义类别。
本公开实施例通过引入预测语义类别填充域构建样本类别填充语句,并根据预测问询语句和预测类别填充语句,构建预测问询模板,从而完善了预测问询模板的构建机制,后续进行预测语义类别的确定提供了数据支撑。同时,通过上述统一的方式针对不同预测问询语句进行预测问询模板的生成,便于进行预测问询语句的批量处理,有助于提高语义分类效率。
作为上述各分类模型训练方法的实现,本公开还提供了一种实施上述各分类模型训练方法的执行装置的可选实施例。该装置适用于进行语义分类模型训练的场景,可以采用软件和/或硬件实现,并具体配置于电子设备中。
进一步参见图6所示的分类模型训练装置600,包括:样本问询模板获取模块601、样本语义类别确定模块602和语义分类模型训练模块603。其中,
样本问询模板获取模块601,用于获取样本问询模板和样本问询模板中待预测类别的标签类别;其中,样本问询模板基于样本问询语句和待预测类别的数量构建;
样本语义类别确定模块602,用于将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的样本语义类别;
语义分类模型训练模块603,用于根据样本语义类别和待预测类别的标签类别,训练语义分类模型。
本公开基于统一的样本问询模板进行语义分类模型的训练,从语义维度而非类别间差异维度进行样本分类,使得所训练的语义分类模型能够适配多样化的分类场景,且无需针对不同分类场景进行不同分类模型的训练,提高了所训练的语义分类模型的通用性。同时,采用模板的形式进行多样化的样本问询语句的统一整合,能够有效应对多样化类别预测场景下样本不均衡的问题,从而有助于提高所训练的语义分类模型的小样本分类能力。
在一个可选实施例中,该装置600还包括样本问询模板构建模块,具体包括:
样本类别填充语句构建单元,用于构建包括样本语义类别填充域的样本类别填充语句;其中,样本语义类别填充域的数量与待预测类别的数量相等;样本语义类别填充域用于填充相应待预测类别的样本语义类别;
样本问询模板构建单元,用于根据样本问询语句和样本类别填充语句,构建样本问询模板。
在一个可选实施例中,待预测类别所属体系的数量为至少一个;
样本类别填充语句构建单元,包括:
样本体系填充子句构建子单元,用于针对任一体系,构建包括样本语义类别填充域的样本体系填充子句;其中,样本语义类别填充域的数量与该体系下待预测类别的数量相等;
样本类别填充语句确定子单元,用于根据不同样本体系填充子句,确定样本类别填充语句。
在一个可选实施例中,样本类别填充语句中不同样本体系填充子句之间设置有子句分隔符;和/或,样本体系填充子句中不同样本语义类别填充域之间设置有域分隔符。
在一个可选实施例中,若样本体系填充子句中设置有域分隔符,则相同样本体系填充子句中的域分隔符相同,且不同样本体系填充子句中的域分隔符不同。
在一个可选实施例中,语义分类模型训练模块603,包括:
标签异常类别确定单元,用于根据样本语义类别和标签类别,确定标签异常类型;
标签类别调整单元,用于根据标签异常类型对应的标签校正方式,调整标签类别;
语义分类模型训练单元,用于根据样本语义类别和调整后的标签类别,训练语义分类模型。
在一个可选实施例中,标签异常类型确定单元,包括:
上下位类型确定子单元,用于若样本语义类别为标签类别的下位类别,则确定标签异常类型为上位预测下位类型;
噪音类型确定子单元,用于若样本语义类别为标签类别的同源变形类别,则确定标签异常类型为噪音类型;
混淆类型确定子单元,用于若样本语义类别为标签类别的可拆分类别的组合类别,则确定标签异常类型为混淆类型。
在一个可选实施例中,标签类别调整单元,包括:
上下位类型调整子单元,用于若标签异常类型为上位预测下位类型,则将标签类别替换为样本语义类别;
噪音类型调整子单元,用于若标签异常类型为噪音类型,则根据标签类别的同源变形类别的可替代标签,调整标签类别;
混淆类型确定子单元,用于若标签异常类型为混淆类型,则将标签类别替换为样本语义类别或标签类别的可拆分类别。
在一个可选实施例中,样本语义类别确定模块602,包括:
样本语义字符确定单元,用于将样本问询模板输入至预先构建的语义分类模型,得到待预测类别的至少一个样本语义字符;
样本语义类别确定单元,用于将各样本语义字符按照预测顺序组合,得到待预测类别的样本语义类别。
在一个可选实施例中,样本语义字符确定单元,具体用于:
将样本问询模板输入至预先构建的语义分类模型,以提取样本问询模板中的样本语义特征,并对样本语义特征进行特征变换,得到待预测类别的至少一个样本语义字符。
上述分类模型训练装置可执行本公开任意实施例所提供的分类模型训练方法,具备执行各分类模型训练方法相应的功能模块和有益效果。
作为上述各语义分类方法的实现,本公开还提供了一种实施上述各语义分类方法的执行装置的可选实施例。该装置适用于进行语义分类,特别是基于前述分类模型训练方法所得到的语义分类模型进行语义分类的场景。该装置可以采用软件和/或硬件实现,并具体配置于电子设备中。
进一步参见图7所示的语义分类装置700,包括:预测问询模块获取模块701和预测语义类别确定模块702。其中,
预测问询模块获取模块701,用于获取预测问询模板;其中,预测问询模板基于预测问询语句和待预测类别的数量构建;
预测语义类别确定模块702,用于根据预测问询模板,得到待预测类别的预测语义类别。
本公开实施例通过获取基于预测问询语句和待预测类别的数量构建的预测问询模板,并根据预测问询模板,得到待预测类别的预测语义类别。由于本公开基于统一的预测问询模板进行类别预测,从语义维度而非类别间差异维度进行分类,使得分类方式能够适配多样化的分类场景,提高了语义分类的通用性。
在一个可选实施例中,该装置700,还包括预测问询模板构建模块,具体包括:
预测类别填充语句构建单元,用于构建包括预测语义类别填充域的预测类别填充语句;其中,预测语义类别填充域的数量与待预测类别的数量相等;预测语义类别填充域用于填充相应待预测类别的预测语义类别;
预测问询模块构建单元,用于根据预测问询语句和预测类别填充语句,构建预测问询模板。
在一个可选实施例中,待预测类别所属体系的数量为至少一个;
预测类别填充语句构建单元,包括:
预测体系填充子句构建子单元,用于针对任一体系,构建包括预测语义类别填充域的预测体系填充子句;其中,预测语义类别填充域的数量与该体系下待预测类别的数量相等;
预测类别填充语句构建子单元,用于根据不同预测体系填充子句,确定预测类别填充语句。
在一个可选实施例中,预测类别填充语句中不同预测体系填充子句之间设置有子句分隔符;和/或,预测体系填充子句中不同预测语义类别填充域之间设置有域分隔符。
在一个可选实施例中,若预测体系填充子句中设置有域分隔符,则相同预测体系填充子句中的域分隔符相同,且不同预测体系填充子句中的域分隔符不同。
在一个可选实施例中,预测语义类别确定模块702,包括:
预测语义字符确定单元,用于根据预测问询模板,确定待预测类别的至少一个预测语义字符;
预测语义类别确定单元,用于将各预测语义字符按照预测顺序组合,得到待预测类别的预测语义类别。
在一个可选实施例中,至少一个预测语义字符中相同预测顺序的预测语义字符为至少两个;
预测语义类别确定单元,包括:
候选语义类别确定子单元,用于将不同预测顺序的各预测语义字符,按照预测顺序组合,得到至少一个候选语义类别;
类别预测概率确定子单元,用于根据候选语义类别中不同预测语义字符的字符预测概率,确定候选语义类别的类别预测概率;
预测语义类别选取子单元,用于根据类别预测概率,以及候选语义类别与标准语义类别库中各标准语义类别的匹配结果,从各候选语义类别中选取预测语义类别。
在一个可选实施例中,预测语义字符确定单元,包括:
预测语义特征提取子单元,用于提取预测问询模板中的预测语义特征;
预测语义字符确定子单元,用于对预测语义特征进行特征变换,得到待预测类别的至少一个预测语义字符。
上述语义分类装置可执行本公开任意实施例所提供的语义分类方法,具备执行各语义分类方法相应的功能模块和有益效果。
本公开的技术方案中,所涉及的样本问询模板、标签类别、预测问询模板的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如分类模型训练方法和/或语义分类方法。例如,在一些实施例中,分类模型训练方法和/或语义分类方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的分类模型训练方法和/或语义分类方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行分类模型训练方法和/或语义分类方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (39)

1.一种分类模型训练方法,包括:
获取样本问询模板和所述样本问询模板中待预测类别的标签类别;其中,所述样本问询模板基于样本问询语句和所述待预测类别的数量构建;
将所述样本问询模板输入至预先构建的语义分类模型,得到所述待预测类别的样本语义类别;
根据所述样本语义类别和所述待预测类别的标签类别,训练所述语义分类模型。
2.根据权利要求1所述的方法,其中,所述样本问询模板采用以下方式构建得到:
构建包括样本语义类别填充域的样本类别填充语句;其中,所述样本语义类别填充域的数量与所述待预测类别的数量相等;所述样本语义类别填充域用于填充相应待预测类别的样本语义类别;
根据所述样本问询语句和所述样本类别填充语句,构建所述样本问询模板。
3.根据权利要求2所述的方法,其中,所述待预测类别所属体系的数量为至少一个;
所述构建包括样本语义类别填充域的样本类别填充语句,包括:
针对任一体系,构建包括样本语义类别填充域的样本体系填充子句;其中,所述样本语义类别填充域的数量与该体系下待预测类别的数量相等;
根据不同样本体系填充子句,确定所述样本类别填充语句。
4.根据权利要求3所述的方法,其中,所述样本类别填充语句中不同样本体系填充子句之间设置有子句分隔符;和/或,所述样本体系填充子句中不同样本语义类别填充域之间设置有域分隔符。
5.根据权利要求4所述的方法,其中,若所述样本体系填充子句中设置有域分隔符,则相同样本体系填充子句中的域分隔符相同,且不同样本体系填充子句中的域分隔符不同。
6.根据权利要求1-5任一项所述的方法,其中,所述根据所述样本语义类别和所述待预测类别的标签类别,训练所述语义分类模型,包括:
根据所述样本语义类别和所述标签类别,确定标签异常类型;
根据所述标签异常类型对应的标签校正方式,调整所述标签类别;
根据所述样本语义类别和调整后的标签类别,训练所述语义分类模型。
7.根据权利要求6所述的方法,其中,所述根据所述样本语义类别和所述标签类别,确定标签异常类型,包括:
若所述样本语义类别为所述标签类别的下位类别,则确定所述标签异常类型为上位预测下位类型;
若所述样本语义类别为所述标签类别的同源变形类别,则确定所述标签异常类型为噪音类型;
若所述样本语义类别为所述标签类别的可拆分类别的组合类别,则确定所述标签异常类型为混淆类型。
8.根据权利要求7所述的方法,其中,所述根据所述标签异常类型对应的标签校正方式,调整所述标签类别,包括:
若所述标签异常类型为上位预测下位类型,则将所述标签类别替换为所述样本语义类别;
若所述标签异常类型为噪音类型,则根据所述标签类别的同源变形类别的可替代标签,调整所述标签类别;
若所述标签异常类型为混淆类型,则将所述标签类别替换为所述样本语义类别或所述标签类别的可拆分类别。
9.根据权利要求1-8任一项所述的方法,其中,所述将所述样本问询模板输入至预先构建的语义分类模型,得到所述待预测类别的样本语义类别,包括:
将所述样本问询模板输入至预先构建的语义分类模型,得到所述待预测类别的至少一个样本语义字符;
将各所述样本语义字符按照预测顺序组合,得到所述待预测类别的样本语义类别。
10.根据权利要求9所述的方法,其中,所述将所述样本问询模板输入至预先构建的语义分类模型,得到所述待预测类别的至少一个样本语义字符,包括:
将所述样本问询模板输入至预先构建的语义分类模型,以提取所述样本问询模板中的样本语义特征,并对所述样本语义特征进行特征变换,得到所述待预测类别的至少一个样本语义字符。
11.一种语义分类方法,包括:
获取预测问询模板;其中,所述预测问询模板基于预测问询语句和待预测类别的数量构建;
根据所述预测问询模板,得到所述待预测类别的预测语义类别。
12.根据权利要求11所述的方法,其中,所述预测问询模板采用以下方式构建得到:
构建包括预测语义类别填充域的预测类别填充语句;其中,所述预测语义类别填充域的数量与所述待预测类别的数量相等;所述预测语义类别填充域用于填充相应待预测类别的预测语义类别;
根据所述预测问询语句和所述预测类别填充语句,构建所述预测问询模板。
13.根据权利要求12所述的方法,其中,所述待预测类别所属体系的数量为至少一个;
所述构建包括预测语义类别填充域的预测类别填充语句,包括:
针对任一体系,构建包括预测语义类别填充域的预测体系填充子句;其中,所述预测语义类别填充域的数量与该体系下待预测类别的数量相等;
根据不同预测体系填充子句,确定所述预测类别填充语句。
14.根据权利要求13所述的方法,其中,所述预测类别填充语句中不同预测体系填充子句之间设置有子句分隔符;和/或,所述预测体系填充子句中不同预测语义类别填充域之间设置有域分隔符。
15.根据权利要求14所述的方法,其中,若所述预测体系填充子句中设置有域分隔符,则相同预测体系填充子句中的域分隔符相同,且不同预测体系填充子句中的域分隔符不同。
16.根据权利要求11-15任一项所述的方法,其中,所述根据所述预测问询模板,得到所述待预测类别的预测语义类别,包括:
根据所述预测问询模板,确定所述待预测类别的至少一个预测语义字符;
将各所述预测语义字符按照预测顺序组合,得到所述待预测类别的预测语义类别。
17.根据权利要求16所述的方法,其中,所述至少一个预测语义字符中相同预测顺序的预测语义字符为至少两个;
所述将各所述预测语义字符按照预测顺序组合,得到所述待预测类别的预测语义类别,包括:
将不同预测顺序的各所述预测语义字符,按照预测顺序组合,得到至少一个候选语义类别;
根据所述候选语义类别中不同预测语义字符的字符预测概率,确定所述候选语义类别的类别预测概率;
根据所述类别预测概率,以及所述候选语义类别与标准语义类别库中各标准语义类别的匹配结果,从各候选语义类别中选取所述预测语义类别。
18.根据权利要求16所述的方法,其中,所述根据所述预测问询模板,确定所述待预测类别的至少一个预测语义字符,包括:
提取所述预测问询模板中的预测语义特征;
对所述预测语义特征进行特征变换,得到所述待预测类别的至少一个预测语义字符。
19.一种分类模型训练装置,包括:
样本问询模板获取模块,用于获取样本问询模板和所述样本问询模板中待预测类别的标签类别;其中,所述样本问询模板基于样本问询语句和所述待预测类别的数量构建;
样本语义类别确定模块,用于将所述样本问询模板输入至预先构建的语义分类模型,得到所述待预测类别的样本语义类别;
语义分类模型训练模块,用于根据所述样本语义类别和所述待预测类别的标签类别,训练所述语义分类模型。
20.根据权利要求19所述的装置,其中,所述装置还包括样本问询模板构建模块,具体包括:
样本类别填充语句构建单元,用于构建包括样本语义类别填充域的样本类别填充语句;其中,所述样本语义类别填充域的数量与所述待预测类别的数量相等;所述样本语义类别填充域用于填充相应待预测类别的样本语义类别;
样本问询模板构建单元,用于根据所述样本问询语句和所述样本类别填充语句,构建所述样本问询模板。
21.根据权利要求20所述的装置,其中,所述待预测类别所属体系的数量为至少一个;
所述样本类别填充语句构建单元,包括:
样本体系填充子句构建子单元,用于针对任一体系,构建包括样本语义类别填充域的样本体系填充子句;其中,所述样本语义类别填充域的数量与该体系下待预测类别的数量相等;
样本类别填充语句确定子单元,用于根据不同样本体系填充子句,确定所述样本类别填充语句。
22.根据权利要求21所述的装置,其中,所述样本类别填充语句中不同样本体系填充子句之间设置有子句分隔符;和/或,所述样本体系填充子句中不同样本语义类别填充域之间设置有域分隔符。
23.根据权利要求22所述的装置,其中,若所述样本体系填充子句中设置有域分隔符,则相同样本体系填充子句中的域分隔符相同,且不同样本体系填充子句中的域分隔符不同。
24.根据权利要求19-23任一项所述的装置,其中,所述语义分类模型训练模块,包括:
标签异常类别确定单元,用于根据所述样本语义类别和所述标签类别,确定标签异常类型;
标签类别调整单元,用于根据所述标签异常类型对应的标签校正方式,调整所述标签类别;
语义分类模型训练单元,用于根据所述样本语义类别和调整后的标签类别,训练所述语义分类模型。
25.根据权利要求24所述的装置,其中,所述标签异常类型确定单元,包括:
上下位类型确定子单元,用于若所述样本语义类别为所述标签类别的下位类别,则确定所述标签异常类型为上位预测下位类型;
噪音类型确定子单元,用于若所述样本语义类别为所述标签类别的同源变形类别,则确定所述标签异常类型为噪音类型;
混淆类型确定子单元,用于若所述样本语义类别为所述标签类别的可拆分类别的组合类别,则确定所述标签异常类型为混淆类型。
26.根据权利要求25所述的装置,其中,所述标签类别调整单元,包括:
上下位类型调整子单元,用于若所述标签异常类型为上位预测下位类型,则将所述标签类别替换为所述样本语义类别;
噪音类型调整子单元,用于若所述标签异常类型为噪音类型,则根据所述标签类别的同源变形类别的可替代标签,调整所述标签类别;
混淆类型确定子单元,用于若所述标签异常类型为混淆类型,则将所述标签类别替换为所述样本语义类别或所述标签类别的可拆分类别。
27.根据权利要求19-26任一项所述的装置,其中,所述样本语义类别确定模块,包括:
样本语义字符确定单元,用于将所述样本问询模板输入至预先构建的语义分类模型,得到所述待预测类别的至少一个样本语义字符;
样本语义类别确定单元,用于将各所述样本语义字符按照预测顺序组合,得到所述待预测类别的样本语义类别。
28.根据权利要求27所述的装置,其中,所述样本语义字符确定单元,具体用于:
将所述样本问询模板输入至预先构建的语义分类模型,以提取所述样本问询模板中的样本语义特征,并对所述样本语义特征进行特征变换,得到所述待预测类别的至少一个样本语义字符。
29.一种语义分类装置,包括:
预测问询模块获取模块,用于获取预测问询模板;其中,所述预测问询模板基于预测问询语句和待预测类别的数量构建;
预测语义类别确定模块,用于根据所述预测问询模板,得到所述待预测类别的预测语义类别。
30.根据权利要求29所述的装置,其中,所述装置还包括预测问询模板构建模块,具体包括:
预测类别填充语句构建单元,用于构建包括预测语义类别填充域的预测类别填充语句;其中,所述预测语义类别填充域的数量与所述待预测类别的数量相等;所述预测语义类别填充域用于填充相应待预测类别的预测语义类别;
预测问询模块构建单元,用于根据所述预测问询语句和所述预测类别填充语句,构建所述预测问询模板。
31.根据权利要求30所述的装置,其中,所述待预测类别所属体系的数量为至少一个;
所述预测类别填充语句构建单元,包括:
预测体系填充子句构建子单元,用于针对任一体系,构建包括预测语义类别填充域的预测体系填充子句;其中,所述预测语义类别填充域的数量与该体系下待预测类别的数量相等;
预测类别填充语句构建子单元,用于根据不同预测体系填充子句,确定所述预测类别填充语句。
32.根据权利要求31所述的装置,其中,所述预测类别填充语句中不同预测体系填充子句之间设置有子句分隔符;和/或,所述预测体系填充子句中不同预测语义类别填充域之间设置有域分隔符。
33.根据权利要求32所述的装置,其中,若所述预测体系填充子句中设置有域分隔符,则相同预测体系填充子句中的域分隔符相同,且不同预测体系填充子句中的域分隔符不同。
34.根据权利要求29-33任一项所述的装置,其中,所述预测语义类别确定模块,包括:
预测语义字符确定单元,用于根据所述预测问询模板,确定所述待预测类别的至少一个预测语义字符;
预测语义类别确定单元,用于将各所述预测语义字符按照预测顺序组合,得到所述待预测类别的预测语义类别。
35.根据权利要求34所述的装置,其中,所述至少一个预测语义字符中相同预测顺序的预测语义字符为至少两个;
所述预测语义类别确定单元,包括:
候选语义类别确定子单元,用于将不同预测顺序的各所述预测语义字符,按照预测顺序组合,得到至少一个候选语义类别;
类别预测概率确定子单元,用于根据所述候选语义类别中不同预测语义字符的字符预测概率,确定所述候选语义类别的类别预测概率;
预测语义类别选取子单元,用于根据所述类别预测概率,以及所述候选语义类别与标准语义类别库中各标准语义类别的匹配结果,从各候选语义类别中选取所述预测语义类别。
36.根据权利要求34所述的装置,其中,所述预测语义字符确定单元,包括:
预测语义特征提取子单元,用于提取所述预测问询模板中的预测语义特征;
预测语义字符确定子单元,用于对所述预测语义特征进行特征变换,得到所述待预测类别的至少一个预测语义字符。
37.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10任一项所述的分类模型训练方法,和/或,权利要求11-18任一项所述的语义分类方法。
38.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-10任一项所述的分类模型训练方法,和/或,权利要求11-18任一项所述的语义分类方法。
39.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现权利要求1-10任一项所述的分类模型训练方法的步骤,和/或,权利要求11-18任一项所述的语义分类方法的步骤。
CN202210439044.9A 2022-04-22 2022-04-22 分类模型训练、语义分类方法、装置、设备和介质 Pending CN114969326A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202210439044.9A CN114969326A (zh) 2022-04-22 2022-04-22 分类模型训练、语义分类方法、装置、设备和介质
US18/179,266 US20230342667A1 (en) 2022-04-22 2023-03-06 Classification model training method, semantic classification method, device and medium
JP2023050552A JP2023160746A (ja) 2022-04-22 2023-03-27 分類モデルトレーニング、語義分類方法、装置、機器及び媒体
KR1020230039739A KR20230150723A (ko) 2022-04-22 2023-03-27 분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210439044.9A CN114969326A (zh) 2022-04-22 2022-04-22 分类模型训练、语义分类方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN114969326A true CN114969326A (zh) 2022-08-30

Family

ID=82979675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210439044.9A Pending CN114969326A (zh) 2022-04-22 2022-04-22 分类模型训练、语义分类方法、装置、设备和介质

Country Status (4)

Country Link
US (1) US20230342667A1 (zh)
JP (1) JP2023160746A (zh)
KR (1) KR20230150723A (zh)
CN (1) CN114969326A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599891A (zh) * 2022-11-29 2023-01-13 支付宝(杭州)信息技术有限公司(Cn) 一种确定异常对话数据方法、装置、设备及可读存储介质
CN116051558A (zh) * 2023-03-31 2023-05-02 菲特(天津)检测技术有限公司 一种缺陷图像标注方法、装置、设备及介质
CN116821307A (zh) * 2023-08-21 2023-09-29 腾讯科技(深圳)有限公司 内容交互方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170249297A1 (en) * 2016-02-29 2017-08-31 Rovi Guides, Inc. Systems and methods for training a model to determine whether a query with multiple segments comprises multiple distinct commands or a combined command
US10970493B1 (en) * 2019-10-18 2021-04-06 Clinc, Inc. Systems and methods for slot relation extraction for machine learning task-oriented dialogue systems
CN112966076A (zh) * 2021-02-25 2021-06-15 中国平安人寿保险股份有限公司 智能问答问题的生成方法、装置、计算机设备及存储介质
CN113010678A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 分类模型的训练方法、文本分类方法及装置
CN113239705A (zh) * 2021-07-12 2021-08-10 北京百度网讯科技有限公司 语义表示模型的预训练方法、装置、电子设备和存储介质
US20210326747A1 (en) * 2020-04-20 2021-10-21 Microsoft Technology Licensing, Llc. Machine learned model framework for screening question generation
CN113688245A (zh) * 2021-08-31 2021-11-23 中国平安人寿保险股份有限公司 基于人工智能的预训练语言模型的处理方法、装置及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170249297A1 (en) * 2016-02-29 2017-08-31 Rovi Guides, Inc. Systems and methods for training a model to determine whether a query with multiple segments comprises multiple distinct commands or a combined command
US10970493B1 (en) * 2019-10-18 2021-04-06 Clinc, Inc. Systems and methods for slot relation extraction for machine learning task-oriented dialogue systems
US20210326747A1 (en) * 2020-04-20 2021-10-21 Microsoft Technology Licensing, Llc. Machine learned model framework for screening question generation
CN112966076A (zh) * 2021-02-25 2021-06-15 中国平安人寿保险股份有限公司 智能问答问题的生成方法、装置、计算机设备及存储介质
CN113010678A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 分类模型的训练方法、文本分类方法及装置
CN113239705A (zh) * 2021-07-12 2021-08-10 北京百度网讯科技有限公司 语义表示模型的预训练方法、装置、电子设备和存储介质
CN113688245A (zh) * 2021-08-31 2021-11-23 中国平安人寿保险股份有限公司 基于人工智能的预训练语言模型的处理方法、装置及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王红斌;李金绘;沈强;线岩团;毛存礼;: "基于最大熵的泰语句子级实体从属关系抽取", 南京大学学报(自然科学), no. 04, 30 July 2017 (2017-07-30) *
黄东晋;梁景坤;李娜;丁友东;: "基于Bi-LSTM的动画电影智能问答系统", 现代电影技术, no. 05, 11 May 2020 (2020-05-11) *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599891A (zh) * 2022-11-29 2023-01-13 支付宝(杭州)信息技术有限公司(Cn) 一种确定异常对话数据方法、装置、设备及可读存储介质
CN115599891B (zh) * 2022-11-29 2023-03-21 支付宝(杭州)信息技术有限公司 一种确定异常对话数据方法、装置、设备及可读存储介质
CN116051558A (zh) * 2023-03-31 2023-05-02 菲特(天津)检测技术有限公司 一种缺陷图像标注方法、装置、设备及介质
CN116821307A (zh) * 2023-08-21 2023-09-29 腾讯科技(深圳)有限公司 内容交互方法、装置、电子设备和存储介质
CN116821307B (zh) * 2023-08-21 2023-11-28 腾讯科技(深圳)有限公司 内容交互方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
JP2023160746A (ja) 2023-11-02
KR20230150723A (ko) 2023-10-31
US20230342667A1 (en) 2023-10-26

Similar Documents

Publication Publication Date Title
CN114969326A (zh) 分类模型训练、语义分类方法、装置、设备和介质
CN110717327A (zh) 标题生成方法、装置、电子设备和存储介质
EP4113357A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
CN109359290A (zh) 试题文本的知识点确定方法、电子设备及存储介质
CN116737908A (zh) 知识问答方法、装置、设备和存储介质
CN113053388B (zh) 语音交互方法、装置、设备和存储介质
CN115099239B (zh) 一种资源识别方法、装置、设备以及存储介质
CN111858905A (zh) 模型训练方法、信息识别方法、装置、电子设备及存储介质
CN115168562A (zh) 一种智能问答系统的构建方法、装置、设备及介质
CN115062718A (zh) 语言模型训练方法、装置、电子设备及存储介质
CN114399772A (zh) 样本生成、模型训练和轨迹识别方法、装置、设备和介质
CN112466277B (zh) 韵律模型训练方法、装置、电子设备及存储介质
EP3846075A1 (en) Contextualized character recognition system
CN112541070A (zh) 槽位更新语料的挖掘方法、装置、电子设备和存储介质
CN113360617B (zh) 异常识别方法、装置、设备和存储介质
CN113204616B (zh) 文本抽取模型的训练与文本抽取的方法、装置
CN113051396B (zh) 文档的分类识别方法、装置和电子设备
CN114996494A (zh) 图像处理方法、装置、电子设备及存储介质
CN113051926A (zh) 文本抽取方法、设备和存储介质
CN112487817A (zh) 命名实体识别模型训练方法、样本标注方法、装置及设备
CN113591464B (zh) 变体文本检测方法、模型训练方法、装置及电子设备
CN114417871B (zh) 模型训练及命名实体识别方法、装置、电子设备及介质
CN114461771A (zh) 问答方法、装置、电子设备和可读存储介质
CN115982366A (zh) 一种日志分类方法、装置、电子设备及存储介质
CN115906873A (zh) 对话处理方法及装置、训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination