CN110866377A - 文本内容的转换方法及装置 - Google Patents

文本内容的转换方法及装置 Download PDF

Info

Publication number
CN110866377A
CN110866377A CN201810898863.3A CN201810898863A CN110866377A CN 110866377 A CN110866377 A CN 110866377A CN 201810898863 A CN201810898863 A CN 201810898863A CN 110866377 A CN110866377 A CN 110866377A
Authority
CN
China
Prior art keywords
text information
style
scene
text
display scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810898863.3A
Other languages
English (en)
Inventor
杨忠伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Beijing Youku Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youku Technology Co Ltd filed Critical Beijing Youku Technology Co Ltd
Priority to CN201810898863.3A priority Critical patent/CN110866377A/zh
Publication of CN110866377A publication Critical patent/CN110866377A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本公开涉及文本内容的转换方法及装置。所述方法包括:采用分类器识别第一文本信息的风格;确定所述第一文本信息的展示场景;在所述第一文本信息的风格与展示场景不匹配时,基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息。根据本公开的文本内容的转换方法及装置,可以自动大批量的实现文本内容的转换,相比于人工改写,大幅提高了转换效率,并且降低改写的出错率、统一风格。

Description

文本内容的转换方法及装置
技术领域
本公开涉及多媒体技术领域,尤其涉及一种文本内容的转换方法及装置。
背景技术
视频标题是视频数据的重要组成部分,好的视频标题可以大大提升视频分发的效率,提高视频的点击量和流量。在不同的场景和频道,需要不同风格的标题。现在都是采用人工进行改写,效率非常低下,并且容易出错。
发明内容
有鉴于此,本公开提出了一种文本内容的转换方法及装置,可以自动大批量的实现文本内容的转换,相比于人工改写,大幅提高了转换效率,并且降低改写的出错率、统一风格。
根据本公开的一方面,提供了一种文本内容的转换方法,包括:
采用分类器识别第一文本信息的风格;
确定所述第一文本信息的展示场景;
在所述第一文本信息的风格与展示场景不匹配时,基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息。
根据本公开的另一方面,提供了一种文本内容的转换装置,包括:
分类模块,用于采用分类器识别第一文本信息的风格;
展示场景确定模块,用于确定所述第一文本信息的展示场景;
转换模块,用于在所述第一文本信息的风格与展示场景不匹配时,基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息。
根据本公开的另一方面,提供了一种文本内容的转换装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
通过识别第一文本信息的风格及展示场景,在第一文本信息的风格和展示场景不匹配时,采用与展示场景对应的机器翻译模型自动对第一文本信息的风格进行转换,转换成风格与展示场景匹配的第二文本信息。根据本公开的文本内容的转换方法及装置,可以自动大批量的实现文本内容的转换,相比于人工改写,大幅提高了转换效率,并且降低改写的出错率、统一风格。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出根据本公开一实施例的文本内容的转换方法的流程图。
图2示出了根据本公开一实施例的分类器的生成及分类的示意图。
图3示出根据本公开一实施例的步骤S11的方法的流程图。
图4示出根据本公开一实施例的步骤S13的方法的流程图。
图5示出根据本公开一实施例的机器翻译模型进行文本内容转换的示意图。
图6示出根据本公开一实施例的文本内容的转换装置的框图。
图7示出根据本公开一实施例的文本内容的转换装置的框图。
图8示出根据本公开一实施例的文本内容的转换装置的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开一实施例的文本内容的转换方法的流程图。所述方法可以应用于服务器,或者服务器集群中,例如,可以应用于多媒体资源(例如,视频、音乐、微博等)投放服务器,或者也可以是专门用于文本内容转换的服务器。
举例来说,在应用于专门用于文本内容转换的服务器时,视频投放服务器可以与文本内容转换的服务器进行通信,实现视频标题的转换。
如图1所示,该方法可以包括:
步骤S11,采用分类器识别第一文本信息的风格;
步骤S12,确定所述第一文本信息的展示场景;
步骤S13,在所述第一文本信息的风格与展示场景不匹配时,基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息。
通过识别第一文本信息的风格及展示场景,在第一文本信息的风格和展示场景不匹配时,采用与展示场景对应的机器翻译模型自动对第一文本信息的风格进行转换,转换成风格与展示场景匹配的第二文本信息。根据本公开的文本内容的转换方法,可以自动大批量的实现文本内容的转换,相比于人工改写,大幅提高了转换效率,并且降低改写的出错率、统一风格。
其中的第一文本信息、第二文本信息可以为多媒体资源的标题,例如,视频的标题、文章的标题,等等。第一文本信息还可以为其他内容,例如,用户在微博上发的文字内容,朋友圈发的文字内容,文章中的一段文字内容等,本公开对第一文本信息的具体内容不作限定。
下文中主要以多媒体资源的标题(例如,视频的标题)为例进行说明。在一种可能的实现方式中,对于应用于视频投放服务器的情形中,本公开可以通过识别多媒体资源中的字段以识别标题部分,从而获取到第一文本信息,然后采用分类器识别第一文本信息的风格。对于应用于专门用于文本内容转换的服务器的情形中,多媒体资源投放服务器可以将多媒体资源的标题发送给门用于文本内容转换的服务器。
按照不同的分类标准可以将文本信息分为不同的风格,例如,按照文本内容的长短可以分为长文本、短文本,比如说,微博、微信朋友圈等平台用户发表的内容基本上都在140字以内,可以分类为短文本,博客、公众号等用户发表的内容较长,可以分类为长文本,以标题为例,可以分为长标题、短标题,短标题通常在15字内,长标题通常在15到30字;按照文本内容的语言风格可以分为讽刺风格、非讽刺风格、幽默风格、非幽默风格等。以标题为例,按照标题的撰写形式可以分为头条体风格、咆哮风格等。需要说明的是,以上不同风格的举例仅仅是本公开的一些示例,不以任何方式限制本公开。
步骤S11中的分类器可以为基于文本样本对卷积神经网络CNN模型进行训练生成的。其中,文本样本可以是预先收集的不同风格的文本信息。
图2示出了根据本公开一实施例的分类器的生成及分类的示意图。以文本样本为标题为例进行说明,可以先收集不同风格的标题,如图2所示的样本标题1、样本标题2、样本标题3……样本标题N。样本标题的数量、种类越多,训练出来的分类器越智能,识别越准确。将样本标题输入到卷积神经网络模型,对卷积神经网络模型进行训练,即可以生成标题风格分类器。在向分类器输入一个标题(第一文本信息示例)后,分类器可以输出标题所属的风格。
步骤S12中的展示场景可以是指终端上对第一文本信息进行展示的场景,例如,首页场景或者feed流场景等。其中,首页场景可以是指网页或者应用程序的第一页。feed流场景可以是指根据用户的订阅向用户持续更新内容的场景。以上两种场景仅仅是展示场景的示例,本公开不限于此。
确定第一文本信息的展示场景的具体方式可以为:根据接收到的终端发送的请求确定展示场景,其中,所述请求表示所述终端获取携带有所述第一文本信息的数据的请求,所述请求携带有场景标识。
以视频应用程序为例,用户在终端上打开视频应用程序,视频应用程序在检测到用户打开的指令后,通常向用户展示的是首页,这种展示场景就属于首页场景。视频应用程序可以向服务器发出请求,以请求在首页展示的视频内容。视频应用程序向服务器发出的请求中携带有场景标识,场景标识可以是能够表示场景唯一性的信息,例如场景ID等。服务器在接收到上述请求后,可以确定要展示的内容(视频),以及这些内容将要展示的展示场景(首页场景)。通过以上过程可以确定第一文本信息将要展示的展示场景。
需要说明的是,以上确定第一文本信息的展示场景的过程仅仅是本公开的一个示例,本公开不限于此,例如,在服务器主动向终端推送内容的场景下,也可以预先确定推送的展示场景。
步骤S13中,第一文本信息的风格与展示场景不匹配可以是指,分类器识别的第一文本信息的风格与展示场景对应的风格不一致。服务器上的文本内容转换系统中可以存储有展示场景与风格之间的对应关系,比如展示场景-风格对照表,在确定展示场景后,可以确定与展示场景对应的风格。
需要说明的是,一个风格可能对应多种展示场景,例如,对于首页场景和feed流场景都可以与头条体风格相对应,或者都可以与短标题对应,一个展示场景也可能对应多种风格,本公开对此不作限定。一个展示场景也可能对应多种风格的情况下,第一文本信息的风格与展示场景对应的任意一种风格都不一致,则可以确定不匹配。
以标题为例,分类器识别的视频的标题的风格为长标题,视频将要展示的展示场景为首页场景,首页上展示的视频信息,因为受到屏幕限制,对标题有字数要求,字数要求不能超过10个字,那么首页场景对应的标题风格为短标题,这种情况下,第一文本信息的风格与展示场景不匹配。
机器翻译模型可以是指能够进行文本内容转换的模型,可以是基于文本样本预先对深入人工神经网络模型训练生成的模型。例如,可以是seq2seq模型、纯attention模型等。
在一种可能的实现方式中,针对不同的展示场景可以分别进行训练以生成与展示场景对应的机器翻译模型,与展示场景对应的机器翻译模型专门用于将输入的第一文本信息转换成风格与该展示场景匹配的第二文本信息。
根据本公开的文本内容的转换方法,可以自动大批量的实现文本内容的转换,相比于人工改写,大幅提高了转换效率,并且降低改写的出错率、统一风格。
通过预先对风格的识别,对于没有必要进行转换的内容可以不进行转换,可以进一步提高转换的效率。
人工改写文字内容,例如标题,会因为疲劳、不仔细等因素,造成错别字等错误。机器自动改写,避免了错别字等错误。
人工改写文字内容,例如标题,会因为每个人的主观认识不同,改写出来的风格也迥异。机器自动改写出来的风格可以保持一致。
图3示出根据本公开一实施例的步骤S11的方法的流程图,如图3所示,步骤S11可以包括:
步骤S111,获取所述第一文本信息的词向量集合作为所述分类器的输入;
步骤S112,基于所述分类器根据所述词向量集合生成的独热码,确定所述第一文本信息的风格。
其中,所述第一文本信息的词向量集合可以是通过Word2vec模型生成的。例如,服务器可以将第一文本信息输入到Word2vec模型中,Word2vec模型可以将第一文本信息中的每个词映射到一个向量,从而输出第一文本信息的词向量集合。服务器将Word2vec模型输出的第一文本信息的词向量集合作为分类器的输入。
独热码(one-hot code)是一种表示不同状态的编码,直观来说就是有多少个状态就有多少比特,而且只有一个比特为1,其他全为0的一种码制。
分类器可以根据词向量集合生成与词向量集合对应的独热码,根据独热码中状态为1的比特位确定独热码对应的风格,即为第一文本信息的风格。
需要说明的是,上述训练生成分类器的过程中,输入的也可以是文本样本的词向量集合,通过不断的学习,分类器可以确定不同的词向量集合与风格之间的对应关系。在训练好分类器后,使用分类器对第一文本信息进行分类的过程中,分类器可以根据输入的词向量集合进行卷积运算得到词向量集合对应的独热码,从而根据独热码中状态为1的比特位确定第一文本信息的风格。
通过以上过程,可自动实现第一文本信息的风格的识别,为后期的转换过程提供依据,提高转换的效率。在第一文本信息的风格与展示场景不匹配时,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息;在第一文本信息的风格与展示场景匹配时,可以不对第一文本信息进行转换。
图4示出根据本公开一实施例的步骤S13的方法的流程图。在一种可能的实现方式中,所述与展示场景对应的机器翻译模型可以包括与展示场景对应的编码器和解码器。
在本实施例中,如图4所示,步骤S13中的“基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息”,可以包括:
步骤S131,采用与展示场景对应的编码器将所述第一文本信息编码成多维向量。
与展示场景对应的编码器将第一文本信息编码后可以生成一个或多个多维向量,一个多维向量可以与第一文本信息中的一个或多个词关联、并且可以表示词之间的关联关系。
编码器生成多维向量后,可以输出到与展示场景对应的解码器。
步骤S132,采用与展示场景对应的解码器将所述多维向量解码成第二文本信息。
与展示场景对应的解码器可以根据预先训练的解码算法,将多维向量解码生成风格与展示场景对应的第二文本信息。
与不同的展示场景对应的编码器具体的编码方式可以不同,编码的方式可以通过对文本样本的训练得到优化。与不同的展示场景对应的解码器具体的解码方式也可以不同,解码的方式同样可以通过文本样本的训练得到优化。本公开对编码和解码的方式不作具体限定。
图5示出根据本公开一实施例的机器翻译模型进行文本内容转换的示意图。以标题转换为例,如图5所示,输入原始标题(即第一文本信息)为“俩女孩演练的防狼术”,将要展示的展示场景为feed流场景,feed流场景通常都会采用头条体风格的三段式标题,输入原始标题为普通场景下的标题,与feed流场景不匹配。因此,feed流场景对应的编码器将“俩女孩演练的防狼术”编码生成多个多维向量,并输出到解码器中;解码器对多个多维向量进行解码生成了输出目标标题(第二文本信息)“俩女孩练防狼术,这防狼术太可怕了!”。以上过程就完成了标题的自动改写,相比于人工改写,大幅提高了转换效率,并且不容易出错。
应用场景示例
以普通标题转换成头条体风格的标题为例:
1、训练语料准备:首先准备一批普通标题和头条体风格的标题的平行语料;准备一批包含不同风格标题的分类语料。
2、模型训练:分为分类器训练和机器翻译模型训练。
基于分类语料,对卷积神经网络模型进行训练得到分类器。
基于平行语料,训练一套seq2seq的深度人工神经网络模型得到机器翻译模型。
3、利用训练好的分类器和seq2seq模型,可以批量的对输入原始标题进行风格识别和转换,把普通的标题,转换成头条体风格的标题。
具体地,获取多媒体资源的原始标题(普通标题),并确定多媒体资源将要投放的展示场景。可以将原始标题先通过Word2vec模型生成词向量集合,词向量集合作为分类器的输入,采用分类器根据此向量集合识别输入原始标题的风格为普通标题,判断普通标题与展示场景是否匹配,如果不匹配,基于与展示场景对应的机器翻译模型,将原始标题转换成风格与所述展示场景匹配的标题。具体转换的过程为,通过编码器将原始标题编码成多维向量,然后再通过解码器将多维向量解码成相应的文本,即可得到风格与所述展示场景匹配的标题。
业务场景中,根据场景自动转换的例子:
示例1、将视频投放在首页场景的例子。首页上展示的视频信息,因为受到屏幕限制,对标题有字数要求,字数要求不能超过10个字。此时,投放系统把(展示场景的)场景标识回传给标题风格转换系统(文本内容转换系统、专门用于文本内容转换的服务器的示例),标题风格转换系统根据场景标识选择对应的机器翻译模型,把将要投放的视频的标题自动转换成适用于首页场景的短标题,并发送给投放系统。
示例2、将视频投放在feed流场景的例子。Feed流场景下希望能抓人眼球,通常都会采用头条体风格的三段式标题。此时,投放系统可以把(展示场景的)场景标识回传给标题风格转换系统,标题风格转换系统根据场景标识选择对应的机器翻译模型,把将要投放的视频的标题自动转换成头条体风格的标题,并发送给投放系统。
图6示出根据本公开一实施例的文本内容的转换装置的框图。所述装置可以应用于服务器,或者服务器集群中,例如,可以应用于视频投放服务器,或者也可以是专门用于文本内容转换的服务器。
如图6所示,该文本内容的转换装置可以包括:
分类模块61,用于采用分类器识别第一文本信息的风格;
展示场景确定模块62,用于确定所述第一文本信息的展示场景;
转换模块63,用于在所述第一文本信息的风格与展示场景不匹配时,基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息。
通过识别第一文本信息的风格及展示场景,在第一文本信息的风格和展示场景不匹配时,采用与展示场景对应的机器翻译模型自动对第一文本信息的风格进行转换,转换成风格与展示场景匹配的第二文本信息。根据本公开的文本内容的转换装置,可以自动大批量的实现文本内容的转换,相比于人工改写,大幅提高了转换效率,并且降低改写的出错率、统一风格。
图7示出根据本公开一实施例的文本内容的转换装置的框图。如图7所示,在一种可能的实现方式中,所述分类模块61可以包括:
获取单元611,用于获取所述第一文本信息的词向量集合作为所述分类器的输入;
分类单元612,用于基于所述分类器根据所述词向量集合生成的独热码,确定所述第一文本信息的风格。
在一种可能的实现方式中,所述展示场景确定模块62可以包括:
确定单元621,用于根据接收到的终端发送的请求确定展示场景,
其中,所述请求表示所述终端获取携带有所述第一文本信息的数据的请求,所述请求携带有场景标识。
在一种可能的实现方式中,所述与展示场景对应的机器翻译模型包括与展示场景对应的编码器和解码器,
所述转换模块63可以包括:
编码单元631,用于采用与展示场景对应的编码器将所述第一文本信息编码成高多维向量;
解码单元632,用于采用与展示场景对应的解码器将所述多维向量解码成第二文本信息。
在一种可能的实现方式中,所述分类器为基于文本样本对卷积神经网络模型进行训练生成的。
在一种可能的实现方式中,所述第一文本信息为多媒体资源的标题。
在一种可能的实现方式中,所述第一文本信息为视频的标题。
在一种可能的实现方式中,所述展示场景为首页场景或者feed流场景。
在一种可能的实现方式中,在所述第一文本信息为标题时,所述风格包括:长标题、短标题和头条体风格。
图8是根据一示例性实施例示出的一种用于文本内容的转换的装置1900的框图。例如,装置1900可以被提供为一服务器。参照图8,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由装置1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (20)

1.一种文本内容的转换方法,其特征在于,包括:
采用分类器识别第一文本信息的风格;
确定所述第一文本信息的展示场景;
在所述第一文本信息的风格与展示场景不匹配时,基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息。
2.根据权利要求1所述的方法,其特征在于,所述分类器为基于文本样本对卷积神经网络模型进行训练生成的。
3.根据权利要求1或2所述的方法,其特征在于,采用分类器识别第一文本信息的风格,包括:
获取所述第一文本信息的词向量集合作为所述分类器的输入;
基于所述分类器根据所述词向量集合生成的独热码,确定所述第一文本信息的风格。
4.根据权利要求1所述的方法,其特征在于,确定所述第一文本信息的展示场景,包括:
根据接收到的终端发送的请求确定展示场景,
其中,所述请求表示所述终端获取携带有所述第一文本信息的数据的请求,所述请求携带有场景标识。
5.根据权利要求1所述的方法,其特征在于,所述与展示场景对应的机器翻译模型包括与展示场景对应的编码器和解码器,
基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息,包括:
采用与展示场景对应的编码器将所述第一文本信息编码成高多维向量;
采用与展示场景对应的解码器将所述多维向量解码成第二文本信息。
6.根据权利要求1-5任意一项所述的方法,其特征在于,所述第一文本信息为多媒体资源的标题。
7.根据权利要求1-5任意一项所述的方法,其特征在于,所述第一文本信息为视频的标题。
8.根据权利要求1-5任意一项所述的方法,其特征在于,所述展示场景为首页场景或者feed流场景。
9.根据权利要求1-5任意一项所述的方法,其特征在于,
在所述第一文本信息为标题时,所述风格包括:长标题、短标题和头条体风格。
10.一种文本内容的转换装置,其特征在于,包括:
分类模块,用于采用分类器识别第一文本信息的风格;
展示场景确定模块,用于确定所述第一文本信息的展示场景;
转换模块,用于在所述第一文本信息的风格与展示场景不匹配时,基于与展示场景对应的机器翻译模型,将所述第一文本信息转换成风格与所述展示场景匹配的第二文本信息。
11.根据权利要求10所述的装置,其特征在于,所述分类器为基于文本样本对卷积神经网络模型进行训练生成的。
12.根据权利要求10或11所述的装置,其特征在于,所述分类模块包括:
获取单元,用于获取所述第一文本信息的词向量集合作为所述分类器的输入;
分类单元,用于基于所述分类器根据所述词向量集合生成的独热码,确定所述第一文本信息的风格。
13.根据权利要求10所述的装置,其特征在于,所述展示场景确定模块包括:
确定单元,用于根据接收到的终端发送的请求确定展示场景,
其中,所述请求表示所述终端获取携带有所述第一文本信息的数据的请求,所述请求携带有场景标识。
14.根据权利要求10所述的装置,其特征在于,所述与展示场景对应的机器翻译模型包括与展示场景对应的编码器和解码器,
所述转换模块包括:
编码单元,用于采用与展示场景对应的编码器将所述第一文本信息编码成高多维向量;
解码单元,用于采用与展示场景对应的解码器将所述多维向量解码成第二文本信息。
15.根据权利要求10-14任意一项所述的装置,其特征在于,所述第一文本信息为多媒体资源的标题。
16.根据权利要求10-14任意一项所述的装置,其特征在于,所述第一文本信息为视频的标题。
17.根据权利要求10-14任意一项所述的装置,其特征在于,所述展示场景为首页场景或者feed流场景。
18.根据权利要求10-14任意一项所述的装置,其特征在于,
在所述第一文本信息为标题时,所述风格包括:长标题、短标题和头条体风格。
19.一种文本内容的转换装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行可执行指令时实现权利要求1至9中任意一项所述的方法。
20.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至9中任意一项所述的方法。
CN201810898863.3A 2018-08-08 2018-08-08 文本内容的转换方法及装置 Pending CN110866377A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810898863.3A CN110866377A (zh) 2018-08-08 2018-08-08 文本内容的转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810898863.3A CN110866377A (zh) 2018-08-08 2018-08-08 文本内容的转换方法及装置

Publications (1)

Publication Number Publication Date
CN110866377A true CN110866377A (zh) 2020-03-06

Family

ID=69650780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810898863.3A Pending CN110866377A (zh) 2018-08-08 2018-08-08 文本内容的转换方法及装置

Country Status (1)

Country Link
CN (1) CN110866377A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112911373A (zh) * 2021-01-31 2021-06-04 云知声智能科技股份有限公司 视频字幕的生成方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003022266A (ja) * 2001-07-06 2003-01-24 Communication Research Laboratory 文章語文体変換システムおよび文章語文体変換処理プログラム
CN102651035A (zh) * 2012-04-12 2012-08-29 北京百纳威尔科技有限公司 文本生成方法及装置、移动终端
CN105955715A (zh) * 2016-04-15 2016-09-21 广州阿里巴巴文学信息技术有限公司 一种信息处理方法、装置和智能终端
CN106708813A (zh) * 2015-07-14 2017-05-24 阿里巴巴集团控股有限公司 一种标题处理方法及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003022266A (ja) * 2001-07-06 2003-01-24 Communication Research Laboratory 文章語文体変換システムおよび文章語文体変換処理プログラム
CN102651035A (zh) * 2012-04-12 2012-08-29 北京百纳威尔科技有限公司 文本生成方法及装置、移动终端
CN106708813A (zh) * 2015-07-14 2017-05-24 阿里巴巴集团控股有限公司 一种标题处理方法及设备
CN105955715A (zh) * 2016-04-15 2016-09-21 广州阿里巴巴文学信息技术有限公司 一种信息处理方法、装置和智能终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHENXIN FU等: "Style Transfer in Text:Exploration and Evaluation", 《ARXIV:1711.06861V2[CS.CL]》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112911373A (zh) * 2021-01-31 2021-06-04 云知声智能科技股份有限公司 视频字幕的生成方法、装置、设备和存储介质
CN112911373B (zh) * 2021-01-31 2023-05-26 云知声智能科技股份有限公司 视频字幕的生成方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN108345692B (zh) 一种自动问答方法和系统
US10824874B2 (en) Method and apparatus for processing video
US11758088B2 (en) Method and apparatus for aligning paragraph and video
KR101929220B1 (ko) 얼굴인식 정보 제공 방법, 이를 이용하는 얼굴인식 서버 및 얼굴인식 시스템
US20150120755A1 (en) Decoders for predicting author age, gender, location from short texts
CN113469298B (zh) 模型训练方法及资源推荐方法
CN109582825B (zh) 用于生成信息的方法和装置
CN110929505B (zh) 房源标题的生成方法和装置、存储介质、电子设备
CN107862058B (zh) 用于生成信息的方法和装置
WO2020103674A1 (zh) 自然语言描述信息的生成方法及装置
US20240078385A1 (en) Method and apparatus for generating text
CN114419527B (zh) 一种数据处理方法、设备以及计算机可读存储介质
CN110858914A (zh) 视频素材推荐方法及装置
CN110866377A (zh) 文本内容的转换方法及装置
CN117474748A (zh) 一种图像生成方法、装置、电子设备及存储介质
CN110413770B (zh) 将群消息归类到群话题的方法及装置
CN113761174A (zh) 一种文本生成方法和装置
CN116168108A (zh) 文本生成图像的方法及装置、存储介质及电子设备
CN115774762A (zh) 即时通讯信息处理方法、装置、设备及存储介质
US11238236B2 (en) Summarization of group chat threads
CN114363664A (zh) 生成视频合集标题的方法及装置
CN115967833A (zh) 视频生成方法、装置、设备计存储介质
CN115687701A (zh) 文本处理方法
KR20220079029A (ko) 문서 기반 멀티 미디어 콘텐츠 자동 제작 서비스 제공 방법
CN113821677A (zh) 一种生成封面图像的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200423

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 100000 room 26, 9 Building 9, Wangjing east garden four, Chaoyang District, Beijing.

Applicant before: BEIJING YOUKU TECHNOLOGY Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200306