CN111414732A - 文本风格转换方法、装置、电子设备及存储介质 - Google Patents
文本风格转换方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111414732A CN111414732A CN201910014667.XA CN201910014667A CN111414732A CN 111414732 A CN111414732 A CN 111414732A CN 201910014667 A CN201910014667 A CN 201910014667A CN 111414732 A CN111414732 A CN 111414732A
- Authority
- CN
- China
- Prior art keywords
- text
- style
- information
- training
- text information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 73
- 230000008569 process Effects 0.000 claims abstract description 37
- 230000002452 interceptive effect Effects 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims description 123
- 238000013256 Gubra-Amylin NASH model Methods 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000009471 action Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本申请实施例提供一种文本风格转换方法、装置、电子设备及存储介质,该方法中,根据类型转换标签将服务提供方在提供服务过程中与服务请求方之间的交互信息转换为第二文本风格的文本信息,即将第一文本风格的文本信息转换为第二文本风格的文本信息,相比于现有技术中通过人工编写规则进行词语替换导致耗时较长且准确率低的问题,本方案中可以自动学习第一文本风格的文本信息转换为第二文本风格的文本信息的转换规则,从而可以有效提高数据转换的效率和准确性。
Description
技术领域
本申请涉及数据处理领域,具体而言,涉及一种文本风格转换方法、装置、电子设备及存储介质。
背景技术
以网约车场景为例,为了进一步保证乘客的乘车安全,一般可以获取乘客在乘车过程中与司机之间的对话来判断司机和乘客之间是否产生矛盾,所以,有效识别司机和乘客之间的对话数据尤其重要。由于,司机和乘客之间的对话数据可能比较口语化,或者由于地域差异,其对话还可能为方言,所以,为了后续对司机和乘客之间的对话数据进行有效识别,在对司机和乘客之间的对话进行语义理解或者用于训练语言模型之前,还需对这些对话数据进行转换,转换为比较标准书面语,从而便于后续进行语义理解或者便于训练语言模型。
现有技术中进行转换的方式是通过人工编写规则进行转换,例如,将对话数据中的某些词替换为比较标准的书面语,如“要去->导航去”,但是若对话数据量大的情况下,则需预先人工编写大量的转换规则,耗时较长导致效率太低,且若编写的转换规则数量不足,可能无法对有的数据进行正确转换,准确率不高。
发明内容
有鉴于此,本申请实施例的目的在于提供一种文本风格转换方法、装置、电子设备及存储介质,以提高数据转换的效率和准确性。
第一方面,本申请实施例提供了一种文本风格转换方法,所述方法包括:获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
在上述实现过程中,可以根据类型转换标签将服务提供方在提供服务过程中与服务请求方之间的交互信息转换为第二文本风格的文本信息,即将第一文本风格的文本信息转换为第二文本风格的文本信息,相比于现有技术中通过人工编写规则进行词语替换导致耗时较长且准确率低的问题,本方案中可以自动学习第一文本风格的文本信息转换为第二文本风格的文本信息的转换规则,从而可以有效提高数据转换的效率和准确性。
可选地,根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息,包括:采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
在上述实现过程中,由于GAN模型可以比其他模型产生更好的样本,即其可以生成任意想生成的数据,如第二文本风格的文本信息,所以,通过GAN模型可以将第一文本风格的文本信息更加便捷地转换为第二文本风格的文本信息。
可选地,获取待转换的第一文本风格的文本信息之前,还包括:获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息;将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签;将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。
在上述实现过程中,预先对GAN模型进行训练,使得GAN模型在实际使用过程中可以更加准确地将第一文本风格的文本信息转换为第二文本风格的文本信息。
可选地,将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型,包括:采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;若所述判别式模型无法判断,则表明完成所述GAN模型的训练。
在上述实现过程中,GAN模型中的生成式模型可以基于类型转换标签将第一文本风格的文本信息转换为第二文本风格的文本信息,判别式模型可以判断第二文本风格的文本信息是否为类型转换标签中的需转换的文本风格对应的文本信息,若所述判别式模型无法判断,则表明完成GAN模型的训练,所以,通过训练阶段可以使得该GAN模型可以自动学习文本风格转换的规则,无需在学习过程中进行推断,从而可以提高数据转换的效率和准确性。
可选地,获取待转换的第一文本风格的文本信息,包括:获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息;对所述交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。
在上述实现过程中,将服务提供方与服务请求方之间的交互语音信息进行语音识别,转换为第一文本风格的文本信息,从而可利于后续进行文本风格的转换。
第二方面,本申请实施例提供了一种文本风格转换装置,所述装置包括:
信息获取模块,用于获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;
标签获取模块,用于获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;
信息转换模块,用于根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
可选地,所述信息转换模块,具体用于采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
可选地,所述装置还包括:
模型训练模块,用于获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息;将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签;将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。
可选地,所述模型训练模块,还用于采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;若所述判别式模型无法判断,则表明完成所述GAN模型的训练。
可选地,所述信息获取模块,用于获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息;对所述交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。
第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出根据本申请的一些实施例的可以实现本申请思想的电子设备的示例性硬件和软件组件的示意图;
图2为本申请实施例提供的一种文本风格转换方法的流程图;
图3为本申请实施例提供的一种文本风格转换装置的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了使得本领域技术人员能够理解本申请内容,结合特定应用场景“网约车”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕网约车进行描述,但是应该理解,这仅是一个示例性实施例。本申请可以应用于任何其他交通运输类型。例如,本申请可以应用于不同的运输系统环境,包括陆地,海洋,或航空等,或其任意组合。运输系统的交通工具可以包括出租车、私家车、顺风车、公共汽车、或无人驾驶车辆等,或其任意组合。本申请还可以包括用于提供服务的任何服务系统,例如,用于发送和/或接收快递的系统、用于买卖双方交易的服务系统。本申请的系统或方法的应用可以包括网页、浏览器的插件、客户端终端、定制系统、内部分析系统、或人工智能机器人等,或其任意组合。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“司机”、“提供方”、“服务提供方”和“服务提供者”可互换使用,以指代可以提供服务的个人、实体或工具。本申请中的术语“乘客”、“请求方”、“服务人员”、“服务请求方”和“客户”可互换使用,以指代可以请求或订购服务的个人、实体或工具。
请参照图1,图1示出根据本申请的一些实施例的可以实现本申请思想的电子设备100的示例性硬件和软件组件的示意图。例如,处理器可以用于电子设备100上,并且用于执行本申请中的功能。
电子设备100可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的数据处理方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。
例如,电子设备100可以包括连接到网络的网络端口110、用于执行程序指令的一个或多个处理器120、通信总线130、和不同形式的存储介质140,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备100还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output,I/O)接口150。
为了便于说明,在电子设备100中仅描述了一个处理器。然而,应当注意,本申请中的电子设备100还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备100的处理器执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B。
请参照图2,图2为本申请实施例提供的一种文本风格转换方法的流程图,所述方法包括如下步骤:
步骤S110:获取待转换的第一文本风格的文本信息。
为了便于对本申请实施例的理解,本申请实施例以网约车场景为例进行说明。在网约车场景中,为了判断司机是否会对乘客造成危险,以保证乘客的安全,可以获取司机与乘客之间的对话数据,以分析该对话数据,以此来判断司机和乘客之间是否产生矛盾等情况,进而可判断司机的危险程度。
由于司机和乘客之间的对话数据一般比较口语化,所以,为了后续对其进行语义理解,需将司机与乘客之间的对话数据转换为比较标准的书面语。可以理解地,第一文本风格的文本信息可以是指司机和乘客之间的对话数据直接通过语音识别转换获得的,即第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息,而司机和乘客之间的对话数据一般是语音信息,其可以通过如下方式获取:司机在服务开始时,安装在司机终端上的网约车平台可自动控制启动司机终端的录音设备,录音设备可录取在行车过程中司机和乘客之间的所有语音信息,在服务结束后,网约车平台自动控制关闭录音设备,并将获取的语音信息发送至服务器进行后续的处理。
服务器可以对上述的语音信息进行语音识别,即将语音信息转换为文本信息,即获得第一文本风格的文本信息,也就是,服务器可以获得服务提供方在提供服务过程中与服务请求方之间的交互语音信息,然后对该交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。其语音识别的方式可以有:采用声学模型、发音词典或语言模型对待识别语音信息进行识别等等。
需要说明的是,上述第一文本风格的文本信息中,除了包括在服务过程中,通过录音设备获取的司机与乘客之间的语音信息转换为的文本信息外,还包括乘客与司机之间进行文本交流的信息,如通过短信或微信等交流的文本信息。
步骤S120:获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签。
其中,第二文本风格是指比较标准的书面语,如第一文本风格是比较口语化的语句,如“你是干嘛的”,第二文本风格的文本信息可以是比较标准的书面语,如“你是做什么工作的”。
类型转换标签可以用于标识需转换的文本风格,如将第一文本风格的文本信息转换为第二文本风格的文本信息,也就是标识两个文本风格之间的转换标签。
步骤S130:根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
根据类型转换标签中标识的转换类型,将第一文本风格的文本信息转换为第二文本风格的文本信息,其中,第二文本风格可以是与第一文本风格不同的任一文本风格,如第一文本风格的文本信息是比较口语化的文本信息,则第二风格的文本信息可以是比较标准化的书面语、或者是幽默风格的文本信息等。
所以,本实施例中,可以根据类型转换标签将服务提供方在提供服务过程中与服务请求方之间的交互信息转换为第二文本风格的文本信息,即将第一文本风格的文本信息转换为第二文本风格的文本信息,相比于现有技术中通过人工编写规则进行词语替换导致耗时较长且准确率低的问题,本方案中可以自动学习第一文本风格的文本信息转换为第二文本风格的文本信息的转换规则,从而有效提高数据转换的效率和准确性,从而有利于后续对服务提供方在提供服务过程中与服务请求方之间的交互信息进行准确地语义理解。
需要说明的是,第一文本风格与第二文本风格并不止上述列举的两种文本风格,如相反地,在某些应用场景时,第一文本风格可以为标准的书面语,第二文本风格可以为口语化的文本信息,如司机和乘客同通过选择网约车平台设置的一些文本信息进行交流,如在乘客知晓司机接单后,可通过网约车平台选择文本信息“请问您还有多久到达?”,该文本信息即是预先存储在网约车平台中的,乘客可选择该文本信息发送至司机的司机终端,司机在收到该文本信息后,也可选择对应的回复文本信息,如“我大约还有xx分钟到达,请您耐心等待”,这些文本信息可作为第一文本风格的文本信息,即比较标准的书面语,后续将其转换为比较口语化的第二文本风格的文本信息,可以便于后续用于训练语言模型。
当然,若第一文本风格的文本信息为比较标准的书面语,第二文本风格的文本信息可以为幽默风格的文本信息,即将比较标准的书面语转换为比较幽默的语句,其也可以用于训练语言模型,所以,第二文本风格的文本信息可以是与第一文本风格不同的文本信息。基于实际需求,可获得不同的第二文本风格的文本信息,然后可将不同的第二文本风格的文本信息分别输入语言模型进行训练,可以获得不同的语言模型,该语言模型可用于语音识别等。
在上述实施例的基础上,还可以采用训练好的生成式对抗网络模型(Generativeadversarial network,GAN)根据所述类型转换标签将第一文本风格的文本信息转换为第二文本风格的文本信息。
由于GAN模型可以比其他模型产生更好的样本,即其可以生成任意想生成的数据(如第二文本风格的文本信息),所以,通过GAN模型可以将第一文本风格的文本信息更加便捷地转换为第二文本风格的文本信息。
其中,GAN模型是基于深度学习的一种强大的生成模型,其将生成问题视作判别器(即判别式模型)和生成器(即生成式模型)这两个网络模型的对抗和博弈,生成器从给定噪声中产生合成数据,判别器分辨生成器的输出和真实数据。生成器试图产生更接近真实的数据,相应地,后者试图更完美地分辨真实数据和生成数据。由此,两个网络在对抗中进步,在进步后继续对抗,由生成器得到的数据也越来越完美,逼近真实数据,从而可以生成想要得到的数据。
下面对GAN模型的原理进行介绍。设z为随机噪声,x为真实数据,生成式模型和判别式模型可以分别用G和D表示,其中D可以看作一个二分类器,其中,定义了噪声Pz(x)作为先验,用于学习生成式模型G在训练数据x上的概率分布Pg,G(z)表示将输入的噪声z映射成数据,D(x)代表x来自于真实数据分布pdata而不是Pg。因此,优化的目标函数定义如下minmax的形式:
其中,在参数的更新过程中,是对D更新k次后,才对G更新1次,上式中的minmax可理解为当更新D时,需要最大化上式,而当更新G时,需要最小化上式,详细解释如下:
在对判别式模型D的参数进行更新时:对于来自真实分布Pdata的样本x而言,希望D(x)的输出越接近于1越好,即logD(x)越大越好,对于通过噪声z生成的数据G(z)而言,希望D(G(z))尽量接近于0(即D能够区分出真假数据),因此log(1-D(G(z)))也是越大越好,所以需要maxD。
在对生成式模型G的参数进行更新时:希望G(z)尽可能和真实数据一样,即Pg=Pdata,所以希望D(G(z))尽量接近于1,即log(1-D(G(z)))越小越好,所以,需要minG。需要说明的是,logD(x)是与G(z)无关的项,在求导时直接为0。
当固定G更新D时,最优解为而在更新G时,目标函数取到最小值当且仅当Pg=Pdata,最后两个模型博弈的结果是G可以生成以假乱真的数据G(z),而D难以判断G生成的数据是否真实,即D(G(z))=0.5。
而在GAN模型的训练过程分为两个阶段,第一阶段只有判别式模型D参与,将训练集中的样本x作为D的输入,输出0-1之间的某个值,数值越大意味着样本x为真实数据的可能性越大。在这个过程中,希望D尽可能使输出的值逼近1。第二阶段中,判别式模型D和生成式模型G都参与,首先将噪声z输入G,G从真实数据集里学习概率分布并产生假的样本,然后将假的样本输入判别式模型D,这一次D将尽可能输出数值0。所以在这个过程中,判别式模型D相当于一个监督情况下的二分类器,数据要么归1,要么归0。
所以,第一项logD(x)表示判别器模型对真实数据的判断,第二项log(1-D(G(z)))表示对数据的合成与判断,通过这样一个极大极小(max-min)博弈,循环交替地分别优化G和D来训练所需要的生成式模型和判别式模型,直到到达Nash均衡点。
在上述介绍了GAN模型的原理后,可以理解地,在本实施例中,对GAN模型进行训练的过程是:获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息,将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签,将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。
可以理解地,采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;若所述判别式模型无法判断,则表明完成所述GAN模型的训练。
也就是说,在训练阶段,生成式模型尽可能生成第二文本风格的训练文本信息,然后输入至判别式模型,判别式模型判断该第二文本风格的训练文本信息是否是第一文本风格的训练文本信息还是真实的第二文本风格的训练文本信息,直到判别式模型无法判断输入的样本信息是第一文本风格的训练文本信息还是第二文本风格的训练文本信息,此时,表明GAN模型训练完成。
其中,在训练前,将每个第一文本风格的训练文本信息转换为第二文本风格的训练文本信息的方式可以是:可以通过人工方式将每个第一文本风格的训练文本信息转换为第二文本风格的训练文本信息,或者若第二文本风格的训练文本信息为标准书面语,在网约车场景中,可直接通过网约车平台获取第二文本风格的训练文本信息,即司机和乘客同通过选择网约车平台设置的一些文本信息进行交流,如在乘客知晓司机接单后,可通过网约车平台选择文本信息“请问您还有多久到达?”,该文本信息即是预先存储在网约车平台中的,乘客可选择该文本信息发送至司机的司机终端,司机在收到该文本信息后,也可选择对应的回复文本信息,如“我大约还有xx分钟到达,请您耐心等待”,这些交互信息可作为第二风格的训练文本信息。
在训练过程中,第二文本风格的文本信息可以作为上述的G(z),第一文本风格的文本信息作为上述的z,该训练过程可以参考上述描述的GAN模型中的训练阶段,在此不做过多赘述。
在上述实现过程中,GAN模型中的生成式模型可以基于类型转换标签将第一文本风格的文本信息转换为第二文本风格的文本信息,判别式模型可以判断第二文本风格的文本信息是否为类型转换标签中的需转换的文本风格对应的文本信息,若所述判别式模型无法判断,则表明完成GAN模型的训练,所以,通过训练阶段可以使得该GAN模型可以自动学习文本风格转换的规则,无需在学习过程中进行推断,从而可以提高数据转换的效率和准确性。
所以,通过训练好的GAN模型可以直接将第一文本风格的文本信息转换为第二文本风格的文本信息,即GAN模型中生成式模型可以完成第一文本风格的文本信息与第二文本风格的文本信息之间的转换,即生成式模型直接将第一文本风格的文本信息转换为第二文本风格的文本信息。
请参照图3,图3为本申请实施例提供的一种文本风格转换装置200的结构示意图,所述装置包括:
信息获取模块210,用于获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;
标签获取模块220,用于获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;
信息转换模块230,用于根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
可选地,所述信息转换模块230,具体用于采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
可选地,所述装置还包括:
模型训练模块,用于获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息;将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签;将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。
可选地,所述模型训练模块,还用于采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;若所述判别式模型无法判断,则表明完成所述GAN模型的训练。
可选地,所述信息获取模块210,用于获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息;对所述交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。
本申请实施例提供一种可读存储介质,所述计算机程序被处理器执行时,执行如图2所示方法实施例中电子设备所执行的方法过程。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上所述,本申请实施例提供一种文本风格转换方法、装置、电子设备及存储介质,该方法中,根据类型转换标签将服务提供方在提供服务过程中与服务请求方之间的交互信息转换为第二文本风格的文本信息,即将第一文本风格的文本信息转换为第二文本风格的文本信息,相比于现有技术中通过人工编写规则进行词语替换导致耗时较长且准确率低的问题,本方案中可以自动学习第一文本风格的文本信息转换为第二文本风格的文本信息的转换规则,从而可以有效提高数据转换的效率和准确性。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (12)
1.一种文本风格转换方法,其特征在于,所述方法包括:
获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;
获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;
根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
2.根据权利要求1所述的方法,其特征在于,根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息,包括:
采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
3.根据权利要求1所述的方法,其特征在于,获取待转换的第一文本风格的文本信息之前,还包括:
获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息;
将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签;
将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。
4.根据权利要求3所述的方法,其特征在于,将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型,包括:
采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;
通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;
若所述判别式模型无法判断,则表明完成所述GAN模型的训练。
5.根据权利要求1-4任一所述的方法,其特征在于,获取待转换的第一文本风格的文本信息,包括:
获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息;
对所述交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。
6.一种文本风格转换装置,其特征在于,所述装置包括:
信息获取模块,用于获取待转换的第一文本风格的文本信息,所述第一文本风格的文本信息为服务提供方在提供服务过程中与服务请求方之间的交互信息;
标签获取模块,用于获取用于表征将所述第一文本风格的文本信息转换为与所述第一文本风格不同的第二文本风格的文本信息的类型转换标签;
信息转换模块,用于根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
7.根据权利要求6所述的装置,其特征在于,所述信息转换模块,具体用于采用训练好的生成式对抗网络模型GAN根据所述类型转换标签将所述第一文本风格的文本信息转换为所述第二文本风格的文本信息。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
模型训练模块,用于获取多个第一文本风格的训练文本信息以及每个第一文本风格的训练文本信息转换的第二文本风格的训练文本信息;将每个第一文本风格的训练文本信息添加用于表征将所述第一文本风格的训练文本信息转换为所述第二文本风格的训练文本信息的类型转换标签;将所述多个第一文本风格的训练文本信息、多个所述第二文本风格的训练文本信息以及所述每个第一文本风格的训练文本信息对应的类型转换标签输入至所述GAN模型中进行训练,获得训练后的GAN模型。
9.根据权利要求8所述的装置,其特征在于,所述模型训练模块,还用于采用所述GAN模型中的生成式模型根据所述类型转换标签将所述第一文本风格的训练文本信息转换为第二文本风格的训练文本信息;通过所述GAN模型中的判别式模型判断所述第二文本风格的文本信息是否为所述类型转换标签中的需转换的文本风格对应的文本信息;若所述判别式模型无法判断,则表明完成所述GAN模型的训练。
10.根据权利要求6-9任一所述的装置,其特征在于,所述信息获取模块,用于获取服务提供方在提供服务过程中与服务请求方之间的交互语音信息;对所述交互语音信息进行语音识别,获得待转换的第一文本风格的文本信息。
11.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-5任一所述方法中的步骤。
12.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-5任一所述方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910014667.XA CN111414732A (zh) | 2019-01-07 | 2019-01-07 | 文本风格转换方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910014667.XA CN111414732A (zh) | 2019-01-07 | 2019-01-07 | 文本风格转换方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111414732A true CN111414732A (zh) | 2020-07-14 |
Family
ID=71492919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910014667.XA Pending CN111414732A (zh) | 2019-01-07 | 2019-01-07 | 文本风格转换方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111414732A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112084841A (zh) * | 2020-07-27 | 2020-12-15 | 齐鲁工业大学 | 跨模态的图像多风格字幕生成方法及系统 |
CN115879469A (zh) * | 2022-12-30 | 2023-03-31 | 北京百度网讯科技有限公司 | 文本数据处理方法、模型训练方法、装置及介质 |
CN117272941A (zh) * | 2023-09-21 | 2023-12-22 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备、计算机可读存储介质及产品 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844480A (zh) * | 2017-10-21 | 2018-03-27 | 科大讯飞股份有限公司 | 将书面文本转换为口语文本的方法及系统 |
US20180367484A1 (en) * | 2017-06-15 | 2018-12-20 | Google Inc. | Suggested items for use with embedded applications in chat conversations |
CN109147760A (zh) * | 2017-06-28 | 2019-01-04 | 阿里巴巴集团控股有限公司 | 合成语音的方法、装置、系统及设备 |
-
2019
- 2019-01-07 CN CN201910014667.XA patent/CN111414732A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180367484A1 (en) * | 2017-06-15 | 2018-12-20 | Google Inc. | Suggested items for use with embedded applications in chat conversations |
CN109147760A (zh) * | 2017-06-28 | 2019-01-04 | 阿里巴巴集团控股有限公司 | 合成语音的方法、装置、系统及设备 |
CN107844480A (zh) * | 2017-10-21 | 2018-03-27 | 科大讯飞股份有限公司 | 将书面文本转换为口语文本的方法及系统 |
Non-Patent Citations (1)
Title |
---|
ZHITING HU 等: "Toward Controlled Generation of Text", 《HTTPS://ARXIV.ORG/ABS/1703.00955》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112084841A (zh) * | 2020-07-27 | 2020-12-15 | 齐鲁工业大学 | 跨模态的图像多风格字幕生成方法及系统 |
CN112084841B (zh) * | 2020-07-27 | 2023-08-04 | 齐鲁工业大学 | 跨模态的图像多风格字幕生成方法及系统 |
CN115879469A (zh) * | 2022-12-30 | 2023-03-31 | 北京百度网讯科技有限公司 | 文本数据处理方法、模型训练方法、装置及介质 |
CN115879469B (zh) * | 2022-12-30 | 2023-10-03 | 北京百度网讯科技有限公司 | 文本数据处理方法、模型训练方法、装置及介质 |
CN117272941A (zh) * | 2023-09-21 | 2023-12-22 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备、计算机可读存储介质及产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110890088B (zh) | 语音信息反馈方法、装置、计算机设备和存储介质 | |
US20220358292A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN111414732A (zh) | 文本风格转换方法、装置、电子设备及存储介质 | |
CN110223134B (zh) | 基于语音识别的产品推荐方法及相关设备 | |
CN111522916A (zh) | 一种语音服务质量检测方法、模型训练方法及装置 | |
CN111259124A (zh) | 对话管理方法、装置、系统及存储介质 | |
CN112199486A (zh) | 一种办公场景的任务型多轮对话方法及系统 | |
CN111368066B (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
CN109408175B (zh) | 通用高性能深度学习计算引擎中的实时交互方法及系统 | |
US11132999B2 (en) | Information processing device, information processing method, and non-transitory computer readable storage medium | |
CN113806501B (zh) | 意图识别模型的训练方法、意图识别方法和设备 | |
CN105869631B (zh) | 语音预测的方法和装置 | |
US11449726B1 (en) | Tailored artificial intelligence | |
CN111324712A (zh) | 对话回复方法及服务端 | |
CN115689603A (zh) | 用户反馈信息收集方法、装置及用户反馈系统 | |
CN111681670B (zh) | 信息识别方法、装置、电子设备及存储介质 | |
CN111310847B (zh) | 训练要素分类模型的方法和装置 | |
CN113468306A (zh) | 语音对话方法、装置、电子设备及存储介质 | |
CN115408500A (zh) | 问答一致性的评估方法、装置、电子设备及介质 | |
CN114676705A (zh) | 一种对话关系处理方法、计算机及可读存储介质 | |
CN111309990A (zh) | 一种语句应答方法及装置 | |
CN113889149B (zh) | 语音情感识别方法及装置 | |
CN112714220B (zh) | 业务处理方法、装置、计算设备及计算机可读存储介质 | |
CN117271778B (zh) | 基于生成式大模型的保险外呼会话信息输出方法及装置 | |
JP6704976B2 (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200714 |