CN116758907B - 一种小样本语义理解训练方法及系统 - Google Patents

一种小样本语义理解训练方法及系统 Download PDF

Info

Publication number
CN116758907B
CN116758907B CN202311035254.2A CN202311035254A CN116758907B CN 116758907 B CN116758907 B CN 116758907B CN 202311035254 A CN202311035254 A CN 202311035254A CN 116758907 B CN116758907 B CN 116758907B
Authority
CN
China
Prior art keywords
sample
signal
samples
noise ratio
batch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311035254.2A
Other languages
English (en)
Other versions
CN116758907A (zh
Inventor
李强
赵峰
庄莉
苏江文
王秋琳
张晓东
吴佩颖
王燕蓉
丘志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Information and Telecommunication Co Ltd
Fujian Yirong Information Technology Co Ltd
Original Assignee
State Grid Information and Telecommunication Co Ltd
Fujian Yirong Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Information and Telecommunication Co Ltd, Fujian Yirong Information Technology Co Ltd filed Critical State Grid Information and Telecommunication Co Ltd
Priority to CN202311035254.2A priority Critical patent/CN116758907B/zh
Publication of CN116758907A publication Critical patent/CN116758907A/zh
Application granted granted Critical
Publication of CN116758907B publication Critical patent/CN116758907B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种小样本语义理解训练方法及系统,具体涉及样本训练技术领域,包括数据处理模块以及与数据处理模块通讯连接的信息采集模块、信噪比较模块、样本标记模块以及效果判断模块;将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数并通过样本有效性评估系数和有效性评估阈值的比较来判断样本的有效性,避免无效样本对训练效果的不利影响,提高语义理解训练的效率和准确性;根据生成的第一训练效果不佳信号、训练效果正常信号以及第二训练效果不佳信号,可以对同一批次的训练效果的有效性进行评估,以确定该批次的样本差异程度是否符合要求,从而为语义理解的样本训练的效率和实用性提供帮助。

Description

一种小样本语义理解训练方法及系统
技术领域
本发明涉及样本训练技术领域,更具体地说,本发明涉及一种小样本语义理解训练方法及系统。
背景技术
语音助手的语义理解训练是指通过机器学习和自然语言处理技术,训练模型以理解用户语音输入中的意图和含义。这是语音助手在实现人机交互中至关重要的一环,它使得语音助手能够正确地解析用户的指令、问题或需求,并提供相应的回应和服务;小样本(Small Sample)通常指的是数据集中包含的样本数量较少的情况。
语义理解的样本训练中,现有的对样本是否为无效样本的判断不够准确,小样本由于样本数量较少,每个样本对模型影响都较大;即使少量无效样本存在,也可能会对语义理解训练模型产生较大的干扰,降低语义理解训练的效果,从而造成语音助手的语义理解的准确性较低,不能很好的满足用户的需求。
为了解决上述问题,现提供一种技术方案。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种小样本语义理解训练方法及系统以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种小样本语义理解训练方法,包括如下步骤:
步骤S1:采集语音偏差信息,根据样本对应的语音的偏差情况和单个样本的字之间的时间间隔情况计算得到样本偏离评估值;
步骤S2:采集样本质量信息,计算样本信噪比,当样本信噪比小于样本信噪比阈值,将该样本标记为无效样本;当样本信噪比大于等于样本信噪比阈值,计算信噪偏移指数;
步骤S3:当样本信噪比大于等于样本信噪比阈值,将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数;通过样本有效性评估系数和有效性评估阈值的比较,对样本进行标记;
步骤S4:对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度。
在一个优选的实施方式中,在步骤S1中,样本偏离评估值的获取逻辑为:
获取样本对应的语音的偏差情况:计算每个样本对应的语音的语速;计算同一批次的语义训练的所有样本对应的语音的语速的平均值,计算样本对应的语音的语速与同一批次的语义训练的所有样本对应的语音的语速的平均值的偏差值;
获取单个样本的字之间的时间间隔情况:获取相邻的字之间的时间间隔,设定有个字,单个样本拥有/>个相邻的字之间的时间间隔;
设定时间间隔范围,获取相邻的字之间的时间间隔不在时间间隔范围的数量,将相邻的字之间的时间间隔不在时间间隔范围的数量标记为
计算样本偏离评估值,其表达式为:;其中,分别为样本偏离评估值、样本对应的语音的语速以及同一批次的语义训练的所有样本对应的语音的语速的平均值。
在一个优选的实施方式中,在步骤S2中,计算样本信噪比,其表达式为:,其中,/>分别为样本信噪比、语音信号的功率以及噪声信号的功率;
设定样本信噪比阈值,当样本信噪比小于样本信噪比阈值,将该样本标记为无效样本;
当样本信噪比大于等于样本信噪比阈值,计算信噪偏移指数,其表达式为:;其中,/>分别为信噪偏移指数和样本信噪比阈值。
在一个优选的实施方式中,在步骤S3中,当样本信噪比大于等于样本信噪比阈值,将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数;
设定有效性评估阈值;通过样本有效性评估系数和有效性评估阈值的比较,对样本进行标记:
当样本有效性评估系数大于有效性评估阈值,将该样本标记为无效样本;当样本有效性评估系数小于等于有效性评估阈值,将该样本标记为有效样本;
筛除标记为无效样本的样本,将标记为有效样本的样本进入语义理解的样本训练中。
在一个优选的实施方式中,在步骤S4中,采集同一批次的每个有效样本对应的样本有效性评估系数,对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度,得到差异程度大、差异程度小或差异程度正常三种情况。
在一个优选的实施方式中,判断该批次的样本的差异程度,得到差异程度大、差异程度小或差异程度正常三种情况的具体步骤为:对样本对应的样本有效性评估系数进行编号;计算批次样本差异系数,其表达式为:,其中,分别为批次样本差异系数、第/>个样本有效性评估系数、在同一批次内的被标记为有效样本的样本对应的样本有效性评估系数的平均值以及有效性评估阈值,/>为同一批次的被标记为有效样本的样本的数量,/>为样本对应的样本有效性评估系数的编号,/>,/>为大于1的正整数;
设定批次样本差异第一阈值和批次样本差异第二阈值,批次样本差异第一阈值小于批次样本差异第二阈值;
当批次样本差异系数大于批次样本差异第二阈值,该批次的样本的差异程度大,生成第一训练效果不佳信号;当批次样本差异系数大于等于批次样本差异第一阈值,且批次样本差异系数小于等于批次样本差异第二阈值,该批次的样本的差异程度正常,生成训练效果正常信号;当批次样本差异系数小于批次样本差异第一阈值,该批次的样本的差异程度过小,生成第二训练效果不佳信号。
在一个优选的实施方式中,一种小样本语义理解训练系统,包括数据处理模块以及与数据处理模块通讯连接的信息采集模块、信噪比较模块、样本标记模块以及效果判断模块;
信息采集模块采集语音偏差信息,将语音偏差信息发送至数据处理模块,计算得到样本偏离评估值;
信息采集模块采集样本质量信息,将样本质量信息发送至数据处理模块,计算得到样本信噪比;
信噪比较模块对样本信噪比和样本信噪比阈值进行比较,当样本信噪比小于样本信噪比阈值,将该样本标记为无效样本;当样本信噪比大于等于样本信噪比阈值,通过数据处理模块计算信噪偏移指数;
当样本信噪比大于等于样本信噪比阈值,数据处理模块将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数;样本标记模块通过样本有效性评估系数和有效性评估阈值的比较,对样本进行标记;
效果判断模块对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度。
本发明一种小样本语义理解训练方法及系统的技术效果和优点:
1、将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数并通过样本有效性评估系数和有效性评估阈值的比较来判断样本的有效性,并将有效样本用于语义理解的样本训练,可以有效避免过拟合问题,从而避免无效样本对训练效果的不利影响,优化样本选择过程,提高语义理解训练的效率和准确性。
2、根据生成的第一训练效果不佳信号、训练效果正常信号以及第二训练效果不佳信号,可以对同一批次的训练效果的有效性进行评估,以确定该批次的样本差异程度是否符合要求,从而为语义理解的样本训练的效率和实用性提供帮助;提升语音助手的语义理解能力。
附图说明
图1为本发明一种小样本语义理解训练方法示意图;
图2为本发明一种小样本语义理解训练系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
图1给出了本发明一种小样本语义理解训练方法,其包括如下步骤:
步骤S1:采集语音偏差信息,根据样本对应的语音的偏差情况和单个样本的字之间的时间间隔情况计算得到样本偏离评估值。
步骤S2:采集样本质量信息,计算样本信噪比,当样本信噪比小于样本信噪比阈值,将该样本标记为无效样本;当样本信噪比大于等于样本信噪比阈值,计算信噪偏移指数。
步骤S3:当样本信噪比大于等于样本信噪比阈值,将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数;通过样本有效性评估系数和有效性评估阈值的比较,对样本进行标记。
步骤S4:对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度。
在步骤S1中,采集语音偏差信息,语音偏差信息通过样本偏离评估值体现。
语义理解训练是通过机器学习和自然语言处理技术,以大量的样本数据为基础,训练模型来理解用户语音输入的意图和含义,在语义理解训练过程中,通常是以批量的方式处理样本。
样本偏离评估值的获取逻辑为:
获取同一批次的语义训练的样本,同一批次的语义训练的样本数量在数量上为小样本。
获取样本对应的语音的偏差情况:获取每个样本对应的语音的时间,获取每个样本对应的语音的字的数量。计算每个样本对应的语音的语速,样本对应的语音的语速为样本对应的语音的字的数量与样本对应的语音的时间的比值。计算同一批次的语义训练的所有样本对应的语音的语速的平均值,计算样本对应的语音的语速与同一批次的语义训练的所有样本对应的语音的语速的平均值的偏差值。样本对应的语音的语速与同一批次的语义训练的所有样本对应的语音的语速的平均值的偏差值越大,训练语义理解模型过度依赖这些异常样本,可能导致训练语义理解模型的泛化能力下降,引起训练过程的不稳定性,导致训练语义理解模型对于一些类别的样本学习不充分,而过度关注其他类别的样本,从而影响模型的泛化能力。
获取单个样本的字之间的时间间隔情况:获取单个样本对应的字的时间点,获取相邻的字之间的时间间隔,设定有个字,那么单个样本拥有/>个相邻的字之间的时间间隔。
在实际的样本获取中,由于用户的实际情况,例如在不同环境不同状态时,说话的准确性和流畅性等都会受到影响,并不是用户大多数情况下的语音的状态,会导致相邻的字之间的时间间隔过大和过小,在一定程度上对语义理解训练产生不利影响,当相邻的字之间的时间间隔较大,可能会带来较长的停顿,这可能导致训练数据中的样本分布不均衡;如果大部分样本都是时间间隔较大的样本,那么训练语义理解模型可能会更倾向于处理这种样本,导致对于较快语速的样本处理效果不佳,当相邻的字之间的时间间隔较小,可能会导致在处理较快语速的样本时出现困难,短时间间隔的样本可能包含较多的信息,需要更快速的响应和处理能力,而如果训练语义理解模型没有充分训练这类样本,可能会导致理解的不准确。
设定时间间隔范围,获取相邻的字之间的时间间隔不在时间间隔范围的数量,将相邻的字之间的时间间隔不在时间间隔范围的数量标记为,/>越大,对语义理解训练产生的不利影响越大。
根据样本对应的语音的语速与同一批次的语义训练的所有样本对应的语音的语速的平均值的偏差值以及相邻的字之间的时间间隔不在时间间隔范围的数量的占比情况,计算样本偏离评估值,其表达式为:;其中,/>分别为样本偏离评估值、样本对应的语音的语速以及同一批次的语义训练的所有样本对应的语音的语速的平均值。样本偏离评估值反映了单个样本的语速情况偏离理想样本的程度,样本偏离评估值越大,单个样本的语速情况偏离理想样本的程度越大,则对语义理解训练产生的不利影响越大。
其中,时间间隔范围是依据实际中对相邻的字之间的时间间隔的要求标准等其他实际情况进行设定,例如在相邻的字之间的时间间隔小于或大于某个时间间隔时,对语音的准确性不利影响较大,此处不再赘述。
值得注意的是,同一批次的语义训练的样本是单个用户的。语音助手可以通过用户使用手机、智能音箱等设备时收集用户语音输入数据。用户在实际使用中的语音指令、问题或需求会被记录下来,并用于训练语义理解模型。
在步骤S2中,采集样本质量信息,样本质量信息反映了样本的质量情况,样本较差的语音质量会对后期语义理解的样本训练造成不利影响。
计算样本信噪比,其表达式为:,其中,分别为样本信噪比、语音信号的功率以及噪声信号的功率;样本信噪比越大,说明有用信号相对较强,而噪声较小,这通常意味着样本的语音质量较好,语音信号清晰;而样本信噪比越小,说明有用信号相对较弱,而噪声较大,这通常意味着样本的语音质量较差,语音信号不清晰,该样本对语义理解的样本训练造成的不利影响越大。
设定样本信噪比阈值,当样本信噪比小于样本信噪比阈值,此时,该样本的样本信噪比较低,对语义理解的样本训练造成的不利影响较大,并将该样本标记为无效样本。
当样本信噪比大于等于样本信噪比阈值,此时量化分析在样本信噪比大于等于样本信噪比阈值情况下的样本信噪比的好坏程度。
当样本信噪比大于等于样本信噪比阈值,计算信噪偏移指数,其表达式为:;其中,/>分别为信噪偏移指数和样本信噪比阈值。信噪偏移指数越小,样本信噪比偏离样本信噪比阈值越小,样本的语音质量越差,语音信号越不清晰,该样本对语义理解的样本训练造成的不利影响越大。
样本信噪比阈值是本领域专业技术人员根据样本的实际情况对应的对信噪比的要求等其他实际情况进行设定,此处不再赘述。
在步骤S3中,在样本信噪比大于等于样本信噪比阈值时,对语音偏差信息和样本质量信息进行综合分析,从而对样本进行标记。
当样本信噪比大于等于样本信噪比阈值,将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数。例如,本发明可采用如下公式进行样本有效性评估系数的计算,其表达式为:;其中,/>为样本有效性评估系数;/>分别为样本偏离评估值和信噪偏移指数的预设比例系数,/>大于0,/>小于0;即样本有效性评估系数越大,样本的有效性越差,对语义理解训练产生的不利影响越大。
设定有效性评估阈值,有效性评估阈值是根据样本有效性评估系数的大小,以及依据本领域专业技术人员对样本所对应的语音的实际要求标准等其他实际情况进行设定,此处不再赘述。
通过样本有效性评估系数和有效性评估阈值的比较,判断样本的有效性,并对样本进行标记:
当样本有效性评估系数大于有效性评估阈值,此时,样本的有效性较差,将该样本标记为无效样本。
当样本有效性评估系数小于等于有效性评估阈值,此时,样本的有效性正常,将该样本标记为有效样本。
筛除标记为无效样本的样本,将标记为有效样本的样本进入语义理解的样本训练中,从而避免小样本的场景下,标记为无效样本的样本对语义理解的样本训练的不利影响。
将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数并通过样本有效性评估系数和有效性评估阈值的比较来判断样本的有效性,并将有效样本用于语义理解的样本训练,可以有效避免过拟合问题,从而避免无效样本对训练效果的不利影响,优化样本选择过程,提高语义理解训练的效率和准确性,从而使得语音助手的语义理解能力更加强大和可靠。
在步骤S4中,采集同一批次的每个有效样本对应的样本有效性评估系数,虽然被标记为有效样本,但所对应的样本有效性评估系数的大小也会反映对语义理解的样本训练的影响程度的不同。
对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度,得到差异程度大、差异程度小或差异程度正常三种情况。
差异程度的大小会对语义理解的样本训练产生不同的影响,包括过大和过小两种情况:
差异程度大:如果同一批次的有效样本之间的差异程度大,意味着这批样本之间具有较大的多样性,涉及不同的说话人、语音特点、环境噪声等因素,过大的差异程度可能导致以下影响:
数据不均衡:过大的差异程度可能导致不同类别的样本数量不均衡,使得某些类别的样本在训练过程中占据较大的比例,从而影响模型的泛化能力。
训练样本的可靠性:过大的差异程度可能会导致一些样本的质量较差,包含较多的噪声或不准确信息,影响语义理解的样本的训练效果。
差异程度小:如果同一批次的有效样本之间的差异程度小,意味着这批样本之间相似度较高,具有较强的一致性。过小的差异程度可能导致以下影响:
数据单一性:过小的差异程度可能使得训练数据相对单一,缺乏多样性,导致模型对于其他不同样式的语音输入泛化能力较差。
过拟合:过小的差异程度可能会造成语义理解的样本训练在训练集上表现很好,但在测试集或真实应用中的泛化能力较差,出现过拟合现象。
其中,判断该批次的样本的差异程度,得到差异程度大、差异程度小或差异程度正常三种情况的具体步骤为:
获取同一批次的被标记为有效样本的样本对应的样本有效性评估系数,对样本对应的样本有效性评估系数进行编号;计算批次样本差异系数,其表达式为:,其中,/>分别为批次样本差异系数、第/>个样本有效性评估系数、在同一批次内的被标记为有效样本的样本对应的样本有效性评估系数的平均值以及有效性评估阈值,/>为同一批次的被标记为有效样本的样本的数量,/>为样本对应的样本有效性评估系数的编号,,/>为大于1的正整数。
设定批次样本差异第一阈值和批次样本差异第二阈值,批次样本差异第一阈值小于批次样本差异第二阈值;批次样本差异第一阈值和批次样本差异第二阈值是根据批次样本差异系数的大小以及实际中对样本的差异程度的要求标准等实际情况进行设定,此处不再赘述。
当批次样本差异系数大于批次样本差异第二阈值,此时,该批次的样本的差异程度大;生成第一训练效果不佳信号。
当批次样本差异系数大于等于批次样本差异第一阈值,且批次样本差异系数小于等于批次样本差异第二阈值,此时,该批次的样本的差异程度正常;生成训练效果正常信号。
当批次样本差异系数小于批次样本差异第一阈值,此时,该批次的样本的差异程度过小;生成第二训练效果不佳信号。
根据生成的第一训练效果不佳信号、训练效果正常信号以及第二训练效果不佳信号,可以对同一批次的训练效果的有效性进行评估,以确定该批次的样本差异程度是否符合要求,从而为语义理解的样本训练的效率和实用性提供帮助;提升语音助手的语义理解能力,更好地满足用户需求。
实施例
本发明实施例2与实施例1的区别在于,本实施例是对一种小样本语义理解训练系统进行介绍。
图2给出了本发明一种小样本语义理解训练系统的结构示意图,一种小样本语义理解训练系统,包括数据处理模块以及与数据处理模块通讯连接的信息采集模块、信噪比较模块、样本标记模块以及效果判断模块。
信息采集模块采集语音偏差信息,将语音偏差信息发送至数据处理模块,计算得到样本偏离评估值。
信息采集模块采集样本质量信息,将样本质量信息发送至数据处理模块,计算得到样本信噪比。
信噪比较模块对样本信噪比和样本信噪比阈值进行比较,当样本信噪比小于样本信噪比阈值,将该样本标记为无效样本;当样本信噪比大于等于样本信噪比阈值,通过数据处理模块计算信噪偏移指数。
当样本信噪比大于等于样本信噪比阈值,数据处理模块将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数;样本标记模块通过样本有效性评估系数和有效性评估阈值的比较,对样本进行标记。
效果判断模块对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度。
上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数以及阈值选取由本领域的技术人员根据实际情况进行设置。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络,或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD),或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件,或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其他的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,既可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种小样本语义理解训练方法,其特征在于,包括如下步骤:
步骤S1:采集语音偏差信息,根据样本对应的语音的偏差情况和单个样本的字之间的时间间隔情况计算得到样本偏离评估值;
步骤S2:采集样本质量信息,计算样本信噪比,当样本信噪比小于样本信噪比阈值,将该样本标记为无效样本;当样本信噪比大于等于样本信噪比阈值,计算信噪偏移指数;
步骤S3:当样本信噪比大于等于样本信噪比阈值,将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数;通过样本有效性评估系数和有效性评估阈值的比较,对样本进行标记;
步骤S4:对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度;
样本偏离评估值的获取逻辑为:
获取样本对应的语音的偏差情况:计算每个样本对应的语音的语速;计算同一批次的语义训练的所有样本对应的语音的语速的平均值,计算样本对应的语音的语速与同一批次的语义训练的所有样本对应的语音的语速的平均值的偏差值;
获取单个样本的字之间的时间间隔情况:获取相邻的字之间的时间间隔,设定有个字,单个样本拥有/>个相邻的字之间的时间间隔;
设定时间间隔范围,获取相邻的字之间的时间间隔不在时间间隔范围的数量,将相邻的字之间的时间间隔不在时间间隔范围的数量标记为
计算样本偏离评估值,其表达式为:;其中,/>分别为样本偏离评估值、样本对应的语音的语速以及同一批次的语义训练的所有样本对应的语音的语速的平均值。
2.根据权利要求1所述的一种小样本语义理解训练方法,其特征在于:在步骤S2中,计算样本信噪比,其表达式为:,其中,/>分别为样本信噪比、语音信号的功率以及噪声信号的功率;
设定样本信噪比阈值,当样本信噪比小于样本信噪比阈值,将该样本标记为无效样本;
当样本信噪比大于等于样本信噪比阈值,计算信噪偏移指数,其表达式为:;其中,/>分别为信噪偏移指数和样本信噪比阈值。
3.根据权利要求2所述的一种小样本语义理解训练方法,其特征在于:在步骤S3中,当样本信噪比大于等于样本信噪比阈值,将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数;
设定有效性评估阈值;通过样本有效性评估系数和有效性评估阈值的比较,对样本进行标记:
当样本有效性评估系数大于有效性评估阈值,将该样本标记为无效样本;当样本有效性评估系数小于等于有效性评估阈值,将该样本标记为有效样本;
筛除标记为无效样本的样本,将标记为有效样本的样本进入语义理解的样本训练中。
4.根据权利要求3所述的一种小样本语义理解训练方法,其特征在于:在步骤S4中,采集同一批次的每个有效样本对应的样本有效性评估系数,对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度,得到差异程度大、差异程度小或差异程度正常三种情况。
5.根据权利要求4所述的一种小样本语义理解训练方法,其特征在于:判断该批次的样本的差异程度,得到差异程度大、差异程度小或差异程度正常三种情况的具体步骤为:对样本对应的样本有效性评估系数进行编号;计算批次样本差异系数,其表达式为:,其中,/>分别为批次样本差异系数、第/>个样本有效性评估系数、在同一批次内的被标记为有效样本的样本对应的样本有效性评估系数的平均值以及有效性评估阈值,/>为同一批次的被标记为有效样本的样本的数量,/>为样本对应的样本有效性评估系数的编号,,/>为大于1的正整数;
设定批次样本差异第一阈值和批次样本差异第二阈值,批次样本差异第一阈值小于批次样本差异第二阈值;
当批次样本差异系数大于批次样本差异第二阈值,该批次的样本的差异程度大,生成第一训练效果不佳信号;当批次样本差异系数大于等于批次样本差异第一阈值,且批次样本差异系数小于等于批次样本差异第二阈值,该批次的样本的差异程度正常,生成训练效果正常信号;当批次样本差异系数小于批次样本差异第一阈值,该批次的样本的差异程度过小,生成第二训练效果不佳信号。
6.一种小样本语义理解训练系统,用于实现权利要求1-5任一项所述的一种小样本语义理解训练方法,其特征在于:包括数据处理模块以及与数据处理模块通讯连接的信息采集模块、信噪比较模块、样本标记模块以及效果判断模块;
信息采集模块采集语音偏差信息,将语音偏差信息发送至数据处理模块,计算得到样本偏离评估值;
信息采集模块采集样本质量信息,将样本质量信息发送至数据处理模块,计算得到样本信噪比;
信噪比较模块对样本信噪比和样本信噪比阈值进行比较,当样本信噪比小于样本信噪比阈值,将该样本标记为无效样本;当样本信噪比大于等于样本信噪比阈值,通过数据处理模块计算信噪偏移指数;
当样本信噪比大于等于样本信噪比阈值,数据处理模块将样本偏离评估值和信噪偏移指数通过归一化处理计算得到样本有效性评估系数;样本标记模块通过样本有效性评估系数和有效性评估阈值的比较,对样本进行标记;
效果判断模块对同一批次的被标记为有效样本的样本对应的样本有效性评估系数进行离散分析,判断该批次的样本的差异程度。
CN202311035254.2A 2023-08-17 2023-08-17 一种小样本语义理解训练方法及系统 Active CN116758907B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311035254.2A CN116758907B (zh) 2023-08-17 2023-08-17 一种小样本语义理解训练方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311035254.2A CN116758907B (zh) 2023-08-17 2023-08-17 一种小样本语义理解训练方法及系统

Publications (2)

Publication Number Publication Date
CN116758907A CN116758907A (zh) 2023-09-15
CN116758907B true CN116758907B (zh) 2024-01-02

Family

ID=87957468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311035254.2A Active CN116758907B (zh) 2023-08-17 2023-08-17 一种小样本语义理解训练方法及系统

Country Status (1)

Country Link
CN (1) CN116758907B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934485A (ja) * 1995-07-18 1997-02-07 Matsushita Electric Ind Co Ltd 自己学習話者適応音声認識方法
CN109994116A (zh) * 2019-03-11 2019-07-09 南京邮电大学 一种基于会议场景小样本条件下的声纹准确识别方法
CN114980122A (zh) * 2022-05-05 2022-08-30 南京航空航天大学 一种小样本射频指纹智能识别系统与方法
CN115131558A (zh) * 2022-06-10 2022-09-30 华南理工大学 一种少样本环境下的语义分割方法
CN116092512A (zh) * 2022-12-30 2023-05-09 重庆邮电大学 一种基于数据生成的小样本语音分离方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210004700A1 (en) * 2019-07-02 2021-01-07 Insurance Services Office, Inc. Machine Learning Systems and Methods for Evaluating Sampling Bias in Deep Active Classification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934485A (ja) * 1995-07-18 1997-02-07 Matsushita Electric Ind Co Ltd 自己学習話者適応音声認識方法
CN109994116A (zh) * 2019-03-11 2019-07-09 南京邮电大学 一种基于会议场景小样本条件下的声纹准确识别方法
CN114980122A (zh) * 2022-05-05 2022-08-30 南京航空航天大学 一种小样本射频指纹智能识别系统与方法
CN115131558A (zh) * 2022-06-10 2022-09-30 华南理工大学 一种少样本环境下的语义分割方法
CN116092512A (zh) * 2022-12-30 2023-05-09 重庆邮电大学 一种基于数据生成的小样本语音分离方法

Also Published As

Publication number Publication date
CN116758907A (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
US10984818B2 (en) Devices and methods for evaluating speech quality
CN109584884B (zh) 一种语音身份特征提取器、分类器训练方法及相关设备
CN107919137A (zh) 远程审批方法、装置、设备及可读存储介质
CN113223536B (zh) 声纹识别方法、装置及终端设备
CN108766464B (zh) 基于电网频率波动超矢量的数字音频篡改自动检测方法
CN108831506A (zh) 基于gmm-bic的数字音频篡改点检测方法及系统
CN111326169A (zh) 一种语音质量的评价方法及装置
CN113823293A (zh) 一种基于语音增强的说话人识别方法及系统
CN112329052A (zh) 一种模型隐私保护方法及装置
CN115394318A (zh) 一种音频检测方法和装置
CN116758907B (zh) 一种小样本语义理解训练方法及系统
CN111554325B (zh) 一种嗓音识别方法及系统
WO2021217979A1 (zh) 声纹识别方法、装置、设备及存储介质
CN110660411B (zh) 基于语音识别的健身安全提示方法、装置、设备及介质
CN116821304A (zh) 基于大数据的供电所知识智能问答系统
CN114050941A (zh) 一种基于核密度估计的失陷账号检测方法及系统
CN112233693B (zh) 一种音质评估方法、装置和设备
CN114694680A (zh) 话务员的服务评估方法、装置、存储介质及电子设备
CN111477248B (zh) 一种音频噪声检测方法及装置
CN110675878A (zh) 一种车商识别的方法、装置、存储介质及电子设备
CN111951786A (zh) 声音识别模型的训练方法、装置、终端设备及介质
CN117475360B (zh) 基于改进型mlstm-fcn的音视频特点的生物特征提取与分析方法
CN115329968B (zh) 确定量子机器学习算法公平性的方法、系统和电子设备
CN117612566B (zh) 音频质量评估方法及相关产品
CN113742216B (zh) 一种检测机器学习引擎的效率的方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant