CN113221533B - 一种针对体验声音的标签提取方法、装置以及设备 - Google Patents
一种针对体验声音的标签提取方法、装置以及设备 Download PDFInfo
- Publication number
- CN113221533B CN113221533B CN202110475145.7A CN202110475145A CN113221533B CN 113221533 B CN113221533 B CN 113221533B CN 202110475145 A CN202110475145 A CN 202110475145A CN 113221533 B CN113221533 B CN 113221533B
- Authority
- CN
- China
- Prior art keywords
- training
- text
- sentences
- key
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 171
- 238000000034 method Methods 0.000 claims abstract description 69
- 230000008569 process Effects 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims description 20
- 239000000284 extract Substances 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000005520 cutting process Methods 0.000 claims description 3
- 230000000873 masking effect Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 238000003860 storage Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Abstract
本说明书实施例公开了一种针对体验声音的标签提取方法、装置以及设备。方案包括:获取体验声音对应的待处理文本;获取根据训练语句及其重点内容标注训练过的识别模型,其中,识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;将待处理文本切分字符并对应地输入识别模型,以识别得到待处理文本中的重点语句;根据重点语句,提取标签。
Description
技术领域
本说明书涉及机器学习技术领域,尤其涉及一种针对体验声音的标签提取方法、装置以及设备。
背景技术
随着计算机和互联网技术的发展,很多业务都可以在线上进行,为了更好地服务于用户,服务方需要更多地聆听用户的体验声音,这里的体验声音包括但不限于文字、语音等形式。
为了对体验声音有较深入的理解,需要给体验声音打上各种标签,以便做体验声音分析和消费。目前的一些方案从体验声音对应的文本中直接提取标签,但是,当遇到长文本时,处理一般较差,不仅提取出来的标签质量较差,而且耗时较高。
基于此,针对长文本需要更准确高效的标签提取方案。
发明内容
本说明书一个或多个实施例提供一种针对体验声音的标签提取方法、装置、设备以及存储介质,用以解决如下技术问题:针对长文本需要更准确高效的标签提取方案。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
本说明书一个或多个实施例提供的一种针对体验声音的标签提取方法,包括:
获取体验声音对应的待处理文本;
获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
根据所述重点语句,提取标签。
本说明书一个或多个实施例提供的一种针对体验声音的标签提取装置,包括:
文本获取模块,获取体验声音对应的待处理文本;
模型获取模块,获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
重点识别模块,将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
标签提取模块,根据所述重点语句,提取标签。
本说明书一个或多个实施例提供的一种针对体验声音的标签提取设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取体验声音对应的待处理文本;
获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
根据所述重点语句,提取标签。
本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
获取体验声音对应的待处理文本;
获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
根据所述重点语句,提取标签。
本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:通过两阶段提取标签的方式,先提取重点内容,排除了相对不重要的内容带来的干扰和处理负担,再从重点内容中提取更细粒度的标签,有助于提高准确性和效率,对于长文本的处理有较大优势;不仅如此,在训练过程中通过根据训练语句动态地屏蔽部分输出节点,能够有效地减少正常训练任务,保留一些有代表性的训练语句中位置对应的训练任务,兼顾了效率和对文本语义的完整性理解,从而有助于进一步地提高准确性和效率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的一种针对体验声音的标签提取方法的流程示意图;
图2为本说明书一个或多个实施例提供的一种应用场景下,带有重点内容标注的训练文本示意图;
图3为本说明书一个或多个实施例提供的一种应用场景下,图1中方法的实施方案示意图;
图4为本说明书一个或多个实施例提供的一种针对体验声音的标签提取装置的结构示意图;
图5为本说明书一个或多个实施例提供的一种针对体验声音的标签提取设备的结构示意图。
具体实施方式
本说明书实施例提供一种针对体验声音的标签提取方法、装置、设备以及存储介质。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
在本说明书一个或多个实施例中,采用端到端的模型,向模型中输入一段文本,通过分类或者序列标注的方式,提取标签,但是,这类模型对长文本的处理一般较差,当遇到较长文本时,提取出来的标签质量较差,且耗时较高。基于此,进一步提供了两阶段提取标签的方案,并且化简了训练任务,有助于提高针对长文本提取标签的准确性和效率。
下面基于这样的思路进行说明。
图1为本说明书一个或多个实施例提供的一种针对体验声音的标签提取方法的流程示意图。该方法可以应用于不同的业务领域,比如,互联网金融业务领域、电商业务领域、即时通讯业务领域、游戏业务领域、公务业务领域等。该流程可以由相应领域的计算设备(比如,支付业务对应的智能客服服务器或者智能移动终端等)执行,流程中的某些输入参数或者中间结果允许人工干预调节,以帮助提高准确性。
图1中的流程可以包括以下步骤:
S102:获取体验声音对应的待处理文本。
可以通过多种渠道获取体验声音,比如,截屏反馈、在线服务、热线服务、舆情、投诉、调研等。若体验声音本身不是文本形式,比如是语音,则转换为文本,为了便于后续使用,相比于原体验声音,对应的文本可以是经过预处理的,比如,错字纠正、自动翻译等。
S104:获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽。
在本说明书一个或多个实施例中,利用体验声音对应的训练文本预先训练识别模型,训练文本中有多个训练语句。在一个训练文本中,有多处被标注为重点内容,即使是一个短的语句,也可以只将该语句中的一部分内容标注为重点内容,而未必要将整个语句标注为重点内容,如此更突出重点。
按照指定的标点符号切分训练文本,得到训练语句以便训练。一般地,至少一个完整的句子作为一个训练语句。为了提高准确性,还可以按照完整句子中诸如分号、逗号等标签且分为更短的语句,比如,采用正则表达式“,|\.|;|\?|!|-|=|\_|\+|,|。|、|;|?|!|\n”对训练文本进行切分处理。
在本说明书一个或多个实施例中,训练语句中还可以包含训练文本以外的一些附加信息,比如,分割符或者顺序标号等,这些附加信息有助于后续学习这多个训练语句之间的关系。
在本说明书一个或多个实施例中,在单个训练语句中确定多个字符位置,并在这多个字符位置中确定第一位置,针对剩下的第二位置进行训练目标屏蔽处理。具体地,可以动态地将当前训练语句中第二位置对应的输出节点进行屏蔽,只需考虑第一位置对应的输出节点的输出结果与正确结果之间的损失,并根据损失调整识别模型的参数,从而减少了训练任务,提高了训练效率,而且虽然减少了训练任务,但是由于保留了第一位置,因此对于每个训练语句也都训练到了,兼顾了训练充分性和效率。
在本说明书一个或多个实施例中,考虑语句中的所有位置,在这种情况下,比如,将语句按照字符连续划分,将划分出的每个字符分别作为一个字符位置,若有附加信息,可以将附加信息也作为字符位置。
在本说明书一个或多个实施例中,对于单个语句,第一位置的数量小于甚至远小于第二位置的数量(比如,单个语句中只有一个第一位置,其余全是第二位置),从而有效地减少训练任务。
通过训练目标屏蔽处理,使得在后续训练中,对第二位置不再有直接的训练目标,而对第一位置则是有直接的训练目标,从而简化了整体的训练任务。进一步地,虽然进行了训练目标屏蔽,但是并非是简单地抛弃第二位置,而是使第二位置仍然参与训练(第二位置对应的文本内容仍然会输入识别模型),以帮助学习语句乃至整个训练文本更完整的语义,这种方案有助于兼顾效率和准确性。
在本说明书一个或多个实施例中,以第一位置代表其所在的语句,根据重点内容标注可知,哪些语句包含有重点内容,哪些语句不包含重点内容,根据这样的区别对第一位置设置直接的训练目标(该训练目标也可以视为是第一位置所属的整个语句的训练目标),在训练时除了输入第一位置的内容以外,还会输入第一位置以外的至少部分内容。
S106:将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句。
训练过的识别模型具有识别重要内容的能力,重点语句为通过识别认为其中包含重点内容的语句。
在本说明书一个或多个实施例中,通过屏蔽了第二位置对应的输出节点的所述模型,确定第一位置对应的输出节点的输出结果,根据该输出结果,确定第一位置所在的语句是否为重点语句,其中,第一位置所在的语句也包含有第二位置。在识别过程中,第二位置对应的输出节点可以是处于屏蔽状态的,以第一位置的情况代表其所在的整个语句的情况即可,如此,效率较高而且有助于减少计算资源。
S108:根据所述重点语句,提取标签。
在本说明书一个或多个实施例中,将待处理文本中重点语句以外的内容筛除,从而减少了文本量,根据剩余的内容提取标签,所提取出的标签更容易反映出重点内容,从而更准确地表现相应用户的真实意图。
相比于待处理文本本身,标签是结构化的信息。以服务对话数据为例,标签可以是用户反馈的问题类型(比如,支付失败、隐私侵犯、越权操作等)、用户的诉求类型(比如,退出服务、退款、更换服务等)、用户环境(比如,是否是移动端、是否在境外等)等。根据标签,能够对情况相似的用户进行归类,统一分析处理他们的当前问题或者潜在需求,从而提高服务效率和质量,还有助于促进用户消费。
在本说明书一个或多个实施例中,将从待处理文本中识别得到多个重点语句合并,得到重点文本,根据重点文本提取标签。可以将重点文本再次利用识别模型进行识别,如此迭代进行,尝试继续提炼重点内容。在重点文本中,保留各重点语句在文本待处理文本中的原有顺序,从而有助于保证上下文逻辑的正确性。
通过图1的方法,通过两阶段提取标签的方式,先提取重点内容,排除了相对不重要的内容带来的干扰和处理负担,再从重点内容中提取更细粒度的标签,有助于提高准确性和效率,对于长文本的处理有较大优势;不仅如此,在训练过程中通过根据训练语句动态地屏蔽部分输出节点,能够有效地减少大部分的正常训练任务,保留一些有代表性的训练语句中位置对应的训练任务,兼顾了效率和对文本语义的完整性理解,从而有助于进一步地提高准确性和效率。
基于图1的方法,本说明书还提供了该方法的一些具体实施方案和扩展方案,下面继续进行说明。
在本说明书一个或多个实施例中,在多个字符位置中选择相对更有代表性和便利性的位置作为第一位置。
前面已经提到,虽然进行了训练目标屏蔽,但是会使第二位置仍然参与训练。比如,可以训练时可以输入完整的训练文本,而不是只输入第一位置的内容,从而第二位置的内容也会影响到训练结果。在这类情况下,本方案针对包含重点内容的语句,根据重点内容的位置确定第一位置,尽量将第一位置设置在重点内容所在位置以外的位置,甚至是设置在尽量远离重点内容所在位置的位置。
这样的处理思路看似反常,实际上是考虑增加对语句中的关注点,想尽量将重点内容所在语句作为一个整体,学习更完整的语义,而不是将关注点都集中在重点内容上。比如,假定重点内容处于其所在语句的后半段,则可以将第一位置确定为该语句中最靠前的一个位置,在这种情况下,训练过程中对于该语句有两个明确的关注点(通过训练目标关注第一位置,通过针对重点内容的训练标签关注重点内容),从语句结构来说,这两个关注点恰好一前一后将整个语句的范围进行了限位,这两个关注点对训练过程也产生限制,由于整个语句的内容往往是有语义上下文关联的,基于这种限制,有助于将整个语句的语义更完整地学习,防止脱离这种上下文关联而陷入局部最优解。
按照这样的思路,若语句中包含所标注的重点内容,则可以根据该语句中多个字符位置与该重点内容之间的距离,在这多个字符位置中确定第一位置,比如将距离该重点内容最远的位置确定为第一位置。在实际应用中,无论重点内容位于语句中的何处,距离重点内容最远的位置不是在语句中最靠前的位置,就是在语句中最靠后的位置(这里假定单个语句中只有一处重点内容,而若有多处则不一定),基于此,可以将多个位置中最靠前或者最靠后的一个位置确定为第一位置。而对于不包含重点内容的语句,可以省事地迁就于包含重点内容的语句,也将多个位置中最靠前或者最靠后的一个位置确定为第一位置,便于统一处理。
对于上一段中的方案,仍需要分析重点内容的具体所在位置,以此确定距离,如此也会带来明显额外计算开销。为了避免该开销,对于全部的语句,也可以并不具体确定距离,而是统一地均将语句中多个字符位置中最靠前的一个位置确定为第一位置,或者统一地均将语句中多个字符位置中最靠后的一个位置确定为第一位置,如此,简化了方案,一定程度上兼顾了语义完整性和效率。
在本说明书一个或多个实施例中,基于类似的思路,也可以在单个语句中确定多个不同的第一位置。比如,将语句中多个位置中最靠前的一个位置和最靠后的一个位置分别确定为一个第一位置。对于包含重点内容,尽量将重点内容以外的位置确定为第一位置,以便更多地考虑重点内容的上下文,而不是埋头于重点内容而轻视这些上下文。
根据前面的说明,本说明书一个或多个实施例还提供了一种应用场景下,带有重点内容标注的训练文本示意图以及图1中方法的实施方案示意图,分别如图2、图3所示。
在该应用场景下,某用户向某平台发起了投诉,图2中示出了为用户的投诉描述的部分文本(部分内容省略未示出),将投诉描述的文本作为训练文本。从文本内容可以看出,该用户被诱导购买了保险,而且通过免密支付的方式在未经用户同意的情况下就扣钱完成了支付。通过人工手段在该训练文本中标注了多处重点内容,比如,“我要退保”(说明了用户的直接诉求),“能不能解释你们给我4月份λ、的那份健康无忧险是、先让我支付然给花吸20.8元”(说明了基本过程)、“未经过我同意又免密从我银行卡里把我的钱刷走”(说明了强烈的质疑和不满之处)。
在图3的方案中,先对训练文本按照上面列举的正则表达式进行切分。基于transformers,训练一个识别重点内容的模型作为上述的识别模型,该模型中包含BERT结构和softmax层,BERT结构用于映射输出相应的向量表达,softmax层用于对BERT结构输出的向量进行概率化分类,比如具体实现二分类,将从softmax层输出的概率称为分数。
向BERT结构输入切分过的整个训练文本内容,在原文本内容中添加了多个分隔符表示从何处切分开的。图中示例性地示出了输入的其中三个语句,S1:“S你好,”、Sn:“S我要退保!”、SN:“S谢谢了!”,每个字符分别作为一个位置,本方案将每个语句的最靠前的一个位置作为上述的第一位置,其余位置作为第二位置。可以看到,某些包含重点内容的语句中,重点内容处于第二位置,而不处于第一位置。
正常说来,BERT结构会通过映射输出文本每个位置的向量。但是,本方案把每个语句中除了第一位置以外的位置都屏蔽掉,只看第一位置的得分,也即,上述的针对剩下的第二位置进行训练目标屏蔽处理。
具体地,在训练过程中,将训练文本输入待训练模型(即尚未训练完成的识别模型),并根据语句中是否包含所标注的重点内容,为语句中的第一位置设置对应的训练标签(假定若包含则设置为“1”,若不包含则设置为“0”),且不为语句中的第二位置设置训练标签。
训练完成后,即可利用识别模型识别出待处理文本中的重点语句,再合并各重点语句用于提取标签。该应用场景是用户投诉的场景,只包含的用户的发言,若服务方(比如,客服人员)也进行了发言,则上述的体验声音包括服务对话数据,对话的轮数一般较多内容较长,为了提高处理效率,可以筛除服务对话数据中的服务方发言,得到剩下的用户方发言,作为对应的训练文本。
在本说明书一个或多个实施例中,采用F1值度量本方案的效果作为参考。在一份测试数据集上,与直接从原文本中提取标签的方案相比,本方案基于重点语句提取标签,最终F1值提升了13%。
基于同样的思路,本说明书一个或多个实施例还提供了上述方法对应的装置和设备,如图4、图5所示。
图4为本说明书一个或多个实施例提供的一种针对体验声音的标签提取装置的结构示意图,所述装置包括:
文本获取模块402,获取体验声音对应的待处理文本;
模型获取模块404,获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
重点识别模块406,将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
标签提取模块408,根据所述重点语句,提取标签。
可选地,所述装置还包括模型训练模块410;
所述模型训练模块410按照如下方式训练所述识别模型:
获取体验声音对应的训练文本,以及获取对所述训练文本中的重点内容标注;
将所述训练文本进行切分处理,得到多个训练语句;
根据所述多个单字符输入节点,在所述训练语句中确定多个字符位置,并在所述多个字符位置中确定第一位置,将剩下的第二位置在所述识别模型中对应的输出节点进行屏蔽;
根据所述第一位置和所述重点内容标注,对所述识别模型进行训练;
可选地,所述模型训练模块410,根据所述训练语句中是否包含所标注的重点内容,为所述训练语句中的所述第一位置设置对应的训练标签,且不为所述训练语句中的所述第二位置设置训练标签;
根据所述设置的训练标签,训练所述识别模型。
可选地,所述重点识别模块406,通过屏蔽了所述第二位置对应的输出节点的所述识别模型,确定所述第一位置对应的输出节点的输出结果;
根据所述输出结果,确定所述第一位置所在的语句是否为重点语句,其中,所述第一位置所在的语句也包含有所述第二位置。
可选地,所述模型训练模块410,将所述多个字符位置中最靠前的一个位置确定为第一位置。
可选地,所述模型训练模块410,若所述训练语句中包含所标注的重点内容,则根据所述多个字符位置与所述重点内容之间的距离,在所述多个字符位置中确定第一位置。
可选地,在包含所述重点内容的至少一个所述语句中,所述重点内容处于所述第二位置,而不处于所述第一位置。
可选地,所述体验声音包括服务对话数据;
所述模型训练模块410,筛除所述服务对话数据中的服务方发言,得到剩下的用户方发言,作为对应的训练文本;
所述模型训练模块410,将所述训练文本中用户方每轮发言分别切分出来作为一个语句。
可选地,所述标签提取模块408,将从待处理文本中识别得到多个所述重点语句合并,得到重点文本;
根据所述重点文本提取标签。
图5为本说明书一个或多个实施例提供的一种针对体验声音的标签提取设备的结构示意图,所述设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取体验声音对应的待处理文本;
获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
根据所述重点语句,提取标签。
处理器与存储器之间可以通过总线通信,设备还可以包括与其他设备通信的输入/输出接口。
基于同样的思路,本说明书一个或多个实施例还提供了对应于上述方法的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
获取体验声音对应的待处理文本;
获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
根据所述重点语句,提取标签。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (15)
1.一种针对体验声音的标签提取方法,包括:
获取体验声音对应的待处理文本;
获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
根据所述重点语句,提取标签;
所述识别模型是按照如下方式训练的:
获取体验声音对应的训练文本,以及获取对所述训练文本中的重点内容标注;将所述训练文本进行切分处理,得到多个训练语句;根据所述多个单字符输入节点,在所述训练语句中确定多个字符位置,并在所述多个字符位置中确定第一位置,将剩下的第二位置在所述识别模型中对应的输出节点进行屏蔽;根据所述训练语句中是否包含所标注的重点内容,为所述训练语句中的所述第一位置设置对应的训练标签,且不为所述训练语句中的所述第二位置设置训练标签;根据所述设置的训练标签,训练所述识别模型。
2.如权利要求1所述的方法,所述识别得到所述待处理文本中的重点语句,具体包括:
通过屏蔽了所述第二位置对应的输出节点的所述识别模型,确定所述第一位置对应的输出节点的输出结果;
根据所述输出结果,确定所述第一位置所在的语句是否为重点语句,其中,所述第一位置所在的语句也包含有所述第二位置。
3.如权利要求1所述的方法,所述在所述多个字符位置中确定第一位置,具体包括:
将所述多个字符位置中最靠前的一个位置确定为第一位置。
4.如权利要求1所述的方法,所述在所述多个字符位置中确定第一位置,具体包括:
若所述训练语句中包含所标注的重点内容,则根据所述多个字符位置与所述重点内容之间的距离,在所述多个字符位置中确定第一位置。
5.如权利要求1所述的方法,在包含所述重点内容的至少一个所述语句中,所述重点内容处于所述第二位置,而不处于所述第一位置。
6.如权利要求1所述的方法,所述体验声音包括服务对话数据;
所述获取体验声音对应的训练文本,具体包括:
筛除所述服务对话数据中的服务方发言,得到剩下的用户方发言,作为对应的训练文本;
所述将所述训练文本进行切分处理,得到多个语句,具体包括:
将所述训练文本中用户方每轮发言分别切分出来作为一个语句。
7.如权利要求1所述的方法,所述根据所述重点语句,提取标签,具体包括:
将从待处理文本中识别得到多个所述重点语句合并,得到重点文本;
根据所述重点文本提取标签。
8.一种针对体验声音的标签提取装置,包括:
文本获取模块,获取体验声音对应的待处理文本;
模型获取模块,获取根据训练语句及其重点内容标注训练过的识别模型,其中,所述识别模型包含用于将训练语句切分字符后并行输入的多个单字符输入节点,以及对应的多个输出节点,在所述训练的过程中,输入同一训练语句的多个单字符输入节点对应的一部分输出节点被屏蔽;
重点识别模块,将所述待处理文本切分字符并对应地输入所述识别模型,以识别得到所述待处理文本中的重点语句;
标签提取模块,根据所述重点语句,提取标签;
所述装置还包括模型训练模块;
所述模型训练模块按照如下方式训练所述识别模型:
获取体验声音对应的训练文本,以及获取对所述训练文本中的重点内容标注;将所述训练文本进行切分处理,得到多个训练语句;根据所述多个单字符输入节点,在所述训练语句中确定多个字符位置,并在所述多个字符位置中确定第一位置,将剩下的第二位置在所述识别模型中对应的输出节点进行屏蔽;根据所述训练语句中是否包含所标注的重点内容,为所述训练语句中的所述第一位置设置对应的训练标签,且不为所述训练语句中的所述第二位置设置训练标签;根据所述设置的训练标签,训练所述识别模型。
9.如权利要求8所述的装置,所述重点识别模块,通过屏蔽了所述第二位置对应的输出节点的所述识别模型,确定所述第一位置对应的输出节点的输出结果;
根据所述输出结果,确定所述第一位置所在的语句是否为重点语句,其中,所述第一位置所在的语句也包含有所述第二位置。
10.如权利要求8所述的装置,所述模型训练模块,将所述多个字符位置中最靠前的一个位置确定为第一位置。
11.如权利要求8所述的装置,所述模型训练模块,若所述训练语句中包含所标注的重点内容,则根据所述多个字符位置与所述重点内容之间的距离,在所述多个字符位置中确定第一位置。
12.如权利要求8所述的装置,在包含所述重点内容的至少一个所述语句中,所述重点内容处于所述第二位置,而不处于所述第一位置。
13.如权利要求8所述的装置,所述体验声音包括服务对话数据;
所述模型训练模块,筛除所述服务对话数据中的服务方发言,得到剩下的用户方发言,作为对应的训练文本;
所述模型训练模块,将所述训练文本中用户方每轮发言分别切分出来作为一个语句。
14.如权利要求8所述的装置,所述标签提取模块,将从待处理文本中识别得到多个所述重点语句合并,得到重点文本;
根据所述重点文本提取标签。
15.一种针对体验声音的标签提取设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1~7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110475145.7A CN113221533B (zh) | 2021-04-29 | 一种针对体验声音的标签提取方法、装置以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110475145.7A CN113221533B (zh) | 2021-04-29 | 一种针对体验声音的标签提取方法、装置以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113221533A CN113221533A (zh) | 2021-08-06 |
CN113221533B true CN113221533B (zh) | 2024-07-05 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009228A (zh) * | 2017-11-27 | 2018-05-08 | 咪咕互动娱乐有限公司 | 一种内容标签的设置方法、装置及存储介质 |
CN111259660A (zh) * | 2020-01-15 | 2020-06-09 | 中国平安人寿保险股份有限公司 | 基于文本对的关键词抽取方法、装置、设备及存储介质 |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009228A (zh) * | 2017-11-27 | 2018-05-08 | 咪咕互动娱乐有限公司 | 一种内容标签的设置方法、装置及存储介质 |
CN111259660A (zh) * | 2020-01-15 | 2020-06-09 | 中国平安人寿保险股份有限公司 | 基于文本对的关键词抽取方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | Sentiment adaptive end-to-end dialog systems | |
US11106983B2 (en) | Intelligent interaction method and intelligent interaction system | |
CN106649825B (zh) | 语音交互系统及其创建方法和装置 | |
CN111984779B (zh) | 一种对话文本分析方法、装置、设备和可读介质 | |
CN112735374B (zh) | 一种自动语音交互的方法及装置 | |
CN115952272B (zh) | 一种生成对话信息的方法、装置、设备及可读存储介质 | |
CN111144126A (zh) | 一种语义分析模型的训练方法、语义分析方法及装置 | |
CN112860871B (zh) | 自然语言理解模型训练方法、自然语言理解方法及装置 | |
CN112597301A (zh) | 一种语音意图识别方法及装置 | |
CN114596845A (zh) | 语音识别模型的训练方法、语音识别方法及装置 | |
CN112735407A (zh) | 一种对话处理方法及装置 | |
CN115545002A (zh) | 一种模型训练和业务处理的方法、装置、存储介质及设备 | |
CN115759122A (zh) | 一种意图识别方法、装置、设备及可读存储介质 | |
CN113626608B (zh) | 增强语义的关系抽取方法、装置、计算机设备及存储介质 | |
CN113887206B (zh) | 一种模型训练及关键词提取方法及装置 | |
CN117216271A (zh) | 一种文章文本处理方法、装置以及设备 | |
CN113221533B (zh) | 一种针对体验声音的标签提取方法、装置以及设备 | |
Eshghi et al. | Interactional dynamics and the emergence of language games | |
CN116757208A (zh) | 数据处理方法、装置及设备 | |
CN115620726A (zh) | 语音文本生成方法、语音文本生成模型的训练方法、装置 | |
CN111488737B (zh) | 文本识别方法、装置及设备 | |
CN114239602A (zh) | 会话方法、装置和计算机程序产品 | |
CN115310441A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN113221533A (zh) | 一种针对体验声音的标签提取方法、装置以及设备 | |
CN115599891B (zh) | 一种确定异常对话数据方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |