CN111327960A - 文章处理方法、装置、电子设备及计算机存储介质 - Google Patents

文章处理方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN111327960A
CN111327960A CN202010148113.1A CN202010148113A CN111327960A CN 111327960 A CN111327960 A CN 111327960A CN 202010148113 A CN202010148113 A CN 202010148113A CN 111327960 A CN111327960 A CN 111327960A
Authority
CN
China
Prior art keywords
article
comment
picture
content
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010148113.1A
Other languages
English (en)
Other versions
CN111327960B (zh
Inventor
户其修
张超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Douyin Vision Beijing Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010148113.1A priority Critical patent/CN111327960B/zh
Publication of CN111327960A publication Critical patent/CN111327960A/zh
Application granted granted Critical
Publication of CN111327960B publication Critical patent/CN111327960B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4756End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for rating content, e.g. scoring a recommended movie
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开实施例涉及信息处理技术领域,公开了一种文章处理方法、装置、电子设备及计算机可读存储介质,其中,文章处理方法包括:检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论;接着,确定文章内容与各条评论间的第一对应关系;接着,基于第一对应关系,根据文章内容和各条评论,生成文章的视频。本公开实施例的方法,不仅可以以更加丰富、明确的方式将文章的内容呈现给用户,而且确保了视频中文章内容与各条评论的同步性与一致性,从而丰富了文章内容的展现方式与呈现形式,使得用户不仅可以方便快捷地获取文章内容,而且可以获得其他人对文章内容的看法、评论等。

Description

文章处理方法、装置、电子设备及计算机存储介质
技术领域
本公开实施例涉及信息处理技术领域,具体而言,本公开涉及一种文章处理方法、装置、电子设备及计算机可读存储介质。
背景技术
随着自媒体的发展与互联网的普及,越来越多各种类型的文章出现在不同的文章发布平台或网络上,如电影评论文章或时事点评文章等,既有原创的文章,也有转载或二次编辑的文章。同时,为了满足人们的互动需求,文章发布平台或网站会允许网友对文章添加评论,如针对某篇文章上传自己的观点等。
通常,人们在查看到比较好或比较有价值的文章时,会对文章进行分享,然而,本公开的发明人在具体实施过程中发现:目前市面上的文章分享处理,基本上都是将待分享的文章原封不动地分享出去,导致文章内容的呈现形式比较单一,无法提供更加直观、生动的文章内容展示形式,造成较差的用户体验。
发明内容
本公开实施例的目的旨在至少能解决上述的技术缺陷之一,特提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
一方面,提供了一种文章处理方法,包括:
检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论;
确定文章内容与各条评论间的第一对应关系;
基于第一对应关系,根据文章内容和各条评论,生成文章的视频。
一方面,提供了一种文章处理装置,包括:
第一处理模块,用于检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论;
确定模块,用于确定文章内容与各条评论间的第一对应关系;
第二处理模块,用于基于第一对应关系,根据文章内容和各条评论,生成文章的视频。
一方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现上述的文章处理方法。
一方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的文章处理方法。
本公开实施例提供的文章处理方法,检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论,确定文章内容与各条评论间的第一对应关系,从而对文章内容与各条评论进行上下文关联,为后续生成文章的视频提供前提保障;基于第一对应关系根据文章内容和各条评论,生成文章的视频,不仅可以以更加丰富、明确的方式将文章的内容呈现给用户,而且确保了视频中文章内容与各条评论的同步性与一致性,从而丰富了文章内容的展现方式与呈现形式,使得用户不仅可以方便快捷地获取文章内容,而且可以获得其他人对文章内容的看法、评论等,提升用户对文章内容的观看体验。
本公开实施例附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例的文章处理方法的流程示意图;
图2为本公开实施例的文章处理装置的基本结构示意图;
图3为本公开实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对装置、模块或单元进行区分,并非用于限定这些装置、模块或单元一定为不同的装置、模块或单元,也并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
本公开实施例提供的文章处理方法、装置、电子设备及计算机可读存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本公开实施例的技术方案以及本公开实施例的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
本公开一个实施例提供了一种文章处理方法,该方法由计算机设备执行,该计算机设备可以是终端或者服务器。终端可以是台式设备或者移动终端。服务器可以是独立的物理服务器、物理服务器集群或者虚拟服务器。如图1所示,该方法包括:
步骤S110,检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论。
具体地,用户在查看发布在文章发布平台或网络上的文章时,可以根据需要对文章进行一些预设操作,比如分享、复制链接、收藏、转载等操作。相对应地,计算机设备可以检测到用户针对文章的预设操作,其中,计算机设备在检测到针对文章的预设操作时,可以获取文章的文章内容和针对文章的至少一条评论。
步骤S120,确定文章内容与各条评论间的第一对应关系。
具体地,在获取到文章的文章内容和针对文章的至少一条评论后,可以确定文章内容与各条评论间的对应关系(即第一对应关系)。在一种可能的实现方式中,假如针对文章内容的各条评论分别为评论A、评论B、评论C及评论D,则可以确定文章内容与各条评论间的对应关系,可以是如下所示的情况:评论A是针对文章的第一段文章内容的(即第一段文章内容对应于评论A)、评论B是针对文章的第二段文章内容的(即第二段文章内容对应于评论B)、评论C是针对文章的第三段文章内容与第四段文章内容的(即第三段文章内容与第四段文章内容对应于评论C)以及评论D是针对文章的第五段文章内容的(即第五段文章内容对应于评论D);当然也可以其他情况下的对应关系或其它形式的对应关系,在此不再一一赘述。
步骤S130,基于第一对应关系,根据文章内容和各条评论,生成文章的视频。
具体地,在获取到文章内容后,可以根据文章内容生成文章的视频,其中,在生成文章的视频时,不仅需要考虑文章内容本身,还可以综合考虑各条评论,即结合文章内容和各条评论生成文章的视频。在结合文章内容和各条评论生成文章的视频时,可以基于确定出的文章内容与各条评论间的第一对应关系,来根据文章内容和各条评论,生成文章的视频,以使得生成的视频可以将当前显示的文章内容(例如第一段文章内容)与该当前显示的文章内容对应的评论同步显示,提升用户的观看体验。
本公开实施例提供的文章处理方法,检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论,确定文章内容与各条评论间的第一对应关系,从而对文章内容与各条评论进行上下文关联,为后续生成文章的视频提供前提保障;基于第一对应关系根据文章内容和各条评论,生成文章的视频,不仅可以以更加丰富、明确的方式将文章的内容呈现给用户,而且确保了视频中文章内容与各条评论的同步性与一致性,从而丰富了文章内容的展现方式与呈现形式,使得用户不仅可以方便快捷地获取文章内容,而且可以获得其他人对文章内容的看法、评论等,提升用户对文章内容的观看体验。
下面对本公开实施例的方法进行具体介绍:
在一种可能的实现方式中,上述的预设操作可以是分享操作,当预设操作为分享操作时,在生成文章的视频之后,可以向目标对象分享该生成的视频。
其中,该目标对象可以是某个人的即时通信联系方式(例如微信号、QQ号等),也可以是某个社交媒体平台(例如微博、朋友圈、QQ空间及论坛等)。当然,上述的预设操作可以是转载操作,当预设操作为转载操作时,在生成文章的视频之后,可以向目标对象转载该生成的视频。
在一种可能的实现方式中,文章内容包括文字内容和/或至少一张图片;确定文章内容与各条评论间的第一对应关系,包括:确定文字内容对应的各条评论,得到文字内容与各条评论之间的第一对应关系;和/或,确定各张图片分别对应的各条评论,得到各张图片与各条评论之间的第一对应关系。
具体地,文章可能是单纯包括文字内容的纯文本文章,也可能是单纯包括至少一张图片(比如1张、3张、8张等)的图片文章,还可能是既包括文字内容又包括至少一张图片的文章,即文章内容包括文字内容和/或至少一张图片。
具体地,用户针对文章的文章内容给出的评论或观点可能是文字评论,也可能是语音评论,还可能是文字评论与语音评论的组合,当然还可以是其它形式,本申请实施例不对其作限制。其中,文字评论不仅可以是各种文字,也可以各种附加信息,还可以是文字与附加信息的组合。其中,附件信息包括但不限于各种图片、表情符号、搞笑动态图片、音符符号、天气符号、文化符号、手符号等等。上述的文字评论可以是针对文章的所有文字评论,也可以是针对文章的各条文字评论中的热门文字评论(即热度比较高的文字评论)。
具体地,在确定文章内容与各条评论间的第一对应关系的过程中,当文章内容为单纯的文字内容时,可以通过确定文字内容与各条评论间的第一对应关系,来得到文章内容与各条评论间的第一对应关系;当文章内容为单纯的各张图片时,可以通过确定各张图片与各条评论间的第一对应关系,来得到文章内容与各条评论间的第一对应关系;当文章内容既包括文字内容又包括各张图片时,可以通过确定文字内容与各条评论间的第一对应关系、各张图片与各条评论间的第一对应关系,来得到文章内容与各条评论间的第一对应关系。
具体地,当评论内容包括文字评论和/或语音评论时,上述确定文字内容与各条评论间的第一对应关系具体可以为:确定文字内容与各条文字评论和/或各条语音评论的第一对应关系,相当于通过确定文字内容对应的各条文字评论和/或各条语音评论,来得到文字内容与各条评论之间的第一对应关系。上述确定各张图片与各条评论间的第一对应关系具体可以为:确定各张图片与各条文字评论和/或各条语音评论的第一对应关系,相当于通过确定各张图片分别对应的各条文字评论和/或各条语音评论,来得到各张图片与各条评论之间的第一对应关系。
在一种实现方式中,在确定文字内容对应的各条评论时,可以采用如下处理过程:
对文字内容进行分词处理,得到各第一词组,并对各条评论分别进行分词处理得到各第二词组;
确定各第一词组与各第二词组之间的第一关联度;
根据第一关联度确定文字内容对应的各条评论。
具体地,在对文字内容进行分词处理的过程中,可以通过自然语言处理技术,对文字内容进行理解、拆分及分词等的分词处理,得到经由自然语言处理后的各个不同词组(即第一词组)。为便于描述,可以将各第一词组分别记作A1、A2、A3、…、AN,需要说明的是,后续提到A1、A2、A3、…、AN时均指此处的第一词组。其中,自然语音处理技术是研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法,通过自然语言处理技术中的分词、语义理解等技术,可以获得某段文字中的核心要素及其含义。
具体地,在对各条评论进行分词处理的过程中,可以通过自然语言处理技术,对各条评论进行理解、拆分及分词等的分词处理,得到经由自然语言处理后的各个不同词组(即第二词组)。由于评论内容可以包括文字评论和/或语音评论,因此,对各条评论进行分词处理的过程,具体可以分为如下两种情况:
情况一,当评论包括文字评论时,在确定文字内容对应的各条文字评论时,也需要对各条文字评论分别进行分词处理得到相应的各个词组(即第二词组)。同样地,在对各条文字评论分别进行分词处理的过程中,也可以通过自然语言处理技术,对各条文字评论分别进行理解、拆分及分词等的分词处理,得到经由自然语言处理后的各个不同词组(即第二词组)。为便于描述,可以将各第二词组分别记作B1、B2、B3、…、BM,需要说明的是,后续提到B1、B2、B3、…、BM时均指此处的第二词组。
在一种场景下,在确定出各个第一词组与各个第二词组后,可以通过计算各个第一词组分别与各个第二词组之间的关联度(即第一关联度),来确定文字内容对应的各条文字评论。
在一个示例中,假如文字内容包括两段文字内容,且第一段文字内容的各个第一词组为A1和A2、第二段文字内容的各个第一词组为A3和A4,评论包括3条文字评论,且第一条文字评论的各个第二词组为B1、第二条文字评论的各个第二词组为B2与B3、第三条文字评论的各个第二词组为B4与B5,则可以依次计算A1与B1、B2、B3、B4及B5之间的第一关联度、A2与B1、B2、B3、B4及B5之间的第一关联度、A3与B1、B2、B3、B4及B5之间的第一关联度、以及A4与B1、B2、B3、B4及B5之间的第一关联度;在确定出各个第一关联度后,可以根据各个第一关联度的大小,确定文字内容对应的各条文字评论,比如A1与B1的第一关联度的数值很大、且A2与B1的第一关联度的数值也很大,则可以确定B1对应的文字评论(即第一条文字评论)对应于第一段文字内容,又比如A2与B2的第一关联度的数值很大、且A3与B3的第一关联度的数值也很大,则可以确定B2与B3对应的文字评论(即第二条文字评论)对应于第一段文字内容。
情况二,当评论包括语音评论时,在确定文字内容对应的各条语音评论时,可以先对各条语音评论分别进行语音识别,得到各条语音评论分别对应的文字,即将各条语音评论的语音流转换为相应的文字;接着,对各条语音评论分别对应的文字进行分词处理,得到相应的各个词组(即第二词组)。其中,在对各条语音评论分别对应的文字进行分词处理的过程中,也可以通过自然语言处理技术,对各条文字评论分别进行理解、拆分及分词等的分词处理,得到经由自然语言处理后的各个不同词组(即第二词组)。为便于描述,可以将各第二词组分别记作C1、C2、C3、…、CL,需要说明的是,后续提到C1、C2、C3、…、CL均指此处的第二词组。
在实际应用中,可以通过训练后的神经网络,将各条语音评论的语音流转换为相应的文字,即将各条语音评论分别输入到训练后的神经网络中,得到各条语音评论分别对应的文字。
在一个示例中,训练后的神经网络可以自动识别各条语音评论的语言(比如方言、普通话)、语种(比如汉语、英语、日语等)等,即训练后的神经网络是通过各种语言、语种的训练语料训练得到的综合性的神经网络。在另一个示例中,可以针对每种语言或语种单独训练一个神经网络,比如语种1对应于神经网络1、语种2对应于神经网络2、方言1对应于神经网络5等,在此种情况下,需要先确定某条语音评论的语言或语种,然后再将该某条语音评论输入到相应的神经网络中,得到该某条语音评论的各个第二词组。
在一种场景下,在确定出各个第一词组与各个第二词组后,可以通过计算各个第一词组分别与各个第二词组之间的关联度(即第一关联度),来确定文字内容对应的各条文字评论。
在一个示例中,假如文字内容包括两段文字内容,且第一段文字内容的各个第一词组为A1和A2、第二段文字内容的各个第一词组为A3和A4,评论包括2条语音评论,且第一条语音评论的各个第二词组为C1与C2、第二条语音评论的各个第二词组为C3、C4与C5,则可以依次计算A1与C1、C2、C3、C4及C5之间的第一关联度、A2与C1、C2、C3、C4及C5之间的第一关联度、A3与C1、C2、C3、C4及C5之间的第一关联度、以及A4与C1、C2、C3、C4及C5之间的第一关联度;在确定出各个第一关联度后,可以根据各个第一关联度的大小,确定文字内容对应的各条文字评论,比如A1与C1的第一关联度的数值很大、A2与C1的第一关联度的数值很大、且A2与C2的第一关联度的数值也很大,则可以确定C1与C2对应的语音评论(即第一条语音评论)对应于第一段文字内容,又比如A3与C3的第一关联度的数值很大、A4与C4的第一关联度的数值很大、且A3与C5的第一关联度的数值也很大,则可以确定C3、C4与C5对应的语音评论(即第二条语音评论)对应于第二段文字内容。
情况三,当评论包括文字评论与语音评论时,可以综合考虑上述情况一与情况二,来确定文字内容对应的各条评论。假如将对各条文字评论分别进行分词处理得到的各个词组记作第二词组,将对各条语音评论分别进行分词处理得到的词组记作第三词组,且将各第一词组与各第二词组之间的关联度记作第一关联度,将各第一词组与各第三词组之间的关联度确定为第三关联度,则:确定文字内容对应的各条文字评论和各条语音评论的过程,可以描述为:
对文字内容进行分词处理,得到各第一词组;
对各条文字评论分别进行分词处理得到各第二词组,对各条语音评论分别进行语音识别,得到各条语音评论分别对应的文字,并对各条语音评论分别对应的文字进行分词处理,得到各第三词组;
确定各第一词组与各第二词组之间的第一关联度,并确定各第一词组与各第三词组之间的第二关联度;
根据第一关联度确定文字内容对应的各条文字评论,并根据第二关联度确定文字内容对应的各条语音评论。
在一种实现方式中,在确定各张图片分别对应的各条评论时,可以采用如下处理过程:
对各张图片分别进行图像识别处理,得到各张图片分别对应的第一图片关键词;
确定各第一图片关键词与各第二词组之间的第二关联度;
根据第二关联度确定各张图片分别对应的各条评论。
具体地,由于评论内容可以包括文字评论和/或语音评论,因此,对各条评论进行分词处理的过程,请参考上述情况一、情况二及情况三,在此不再赘述。
具体地,当评论包括文字评论时,若已经通过上述情况一的实现方式中的分词处理操作,对各条文字评论分别进行分词处理,则此处不需要再重复对各条文字评论进行分词处理,直接使用各条文字评论分别对应的各个分词(即B1、B2、B3、…、BM等)即可;若尚未对各条文字评论分别进行分词处理,则需要根据上述情况一描述的对各条文字评论分别进行分词处理的处理方式,对各条文字评论分别进行分词处理,得到各条文字评论分别对应的各个分词,即B1、B2、B3、…、BM等。
具体地,当评论包括语音评论时,若已经通过上述情况二的实现方式中的分词处理操作,对各条语音评论分别进行分词处理,则此处不需要再重复对各条语音评论进行分词处理,直接使用各条语音评论分别对应的各个分词(即C1、C2、C3、C4及C5等)即可;若尚未对各条语音评论分别进行分词处理,则需要根据上述情况二描述的对各条语音评论分别进行分词处理的处理方式,对各条语音评论分别进行分词处理,得到各条语音评论分别对应的各个分词,即C1、C2、C3、C4及C5等。
具体地,当评论包括文字评论与语音评论时,若已经通过上述情况一与情况二的实现方式中的分词处理操作,对各条文字评论和各条语音评论分别进行分词处理,则此处不需要再重复对各条文字评论和各条语音评论进行分词处理,直接使用各条文字评论分别对应的各个分词(即B1、B2、B3、…、BM等)和各条语音评论分别对应的各个分词(即C1、C2、C3、C4及C5等)即可;若尚未对各条文字评论和各条语音评论分别进行分词处理,则需要根据上述情况一描述的对各条文字评论分别进行分词处理的处理方式,对各条文字评论分别进行分词处理,以及根据上述情况二描述的对各条语音评论分别进行分词处理的处理方式,对各条语音评论分别进行分词处理,来得到各条文字评论分别对应的各个分词(即B1、B2、B3、…、BM等)与各条语音评论分别对应的各个分词(即C1、C2、C3、C4及C5等)。
具体地,在对各张图片分别进行图像识别处理的过程中,可以利用深度学习技术,对各张图片分别进行图像识别处理,得到各张图片分别对应的图片关键词(即第一图片关键词)。为便于描述,可以将各第一图片关键词分别记作P1、P2、P3、…、PT,需要说明的是,后续提到P1、P2、P3、…、PT时均指第一图片关键词。
场景一,当评论包括文字评论时,在确定各张图片分别对应的各条文字评论时,可以通过计算各个第一图片关键词分别与各个第二词组之间的关联度(即本实现方式中的第二关联度),来确定各张图片分别对应的各条文字评论。
在一个示例中,假如文章包括2张图片,且第一张图片的各个第一图片关键词为P1、第二张图片的各个第一图片关键词为P2和P3,评论包括3条文字评论,且第一条文字评论的各个第二词组为B1、第二条文字评论的各个第二词组为B2与B3、第三条文字评论的各个第二词组为B4与B5,则可以依次计算P1与B1、B2、B3、B4及B5之间的关联度(即本实现方式中的第二关联度)、P2与B1、B2、B3、B4及B5之间的关联度(即本实现方式中的第二关联度)、P3与B1、B2、B3、B4及B5之间的关联度(即本实现方式中的第二关联度);在确定出各个关联度后,可以根据各个关联度的大小,确定各张图片分别对应的各条文字评论,比如P1与B1的关联度的数值最大,则可以确定B1对应的文字评论(即第一条文字评论)对应于第一张图片,又比如P2与B2的关联度的数值很大、且P3与B3的关联度的数值也很大,则可以确定B2与B3对应的文字评论(即第二条文字评论)对应于第二张图片。
场景二,当评论包括语音评论时,在确定各张图片分别对应的各条语音评论时,可以通过计算各个第一图片关键词分别与各个第二词组之间的关联度(即本实现方式中的第二关联度),来确定各张图片分别对应的各条语音评论。其中,各个第二词组是通过对各条语音评论分别对应的文字进行分词处理得到的。
在一个示例中,假如文章包括两张图片,且第一张图片的各个第一图片关键词为P1、第二张图片的各个第一图片关键词为P2和P3,评论包括2条语音评论,且第一条语音评论的各个第二词组为C1与C2、第二条语音评论的各个第二词组为C3、C4与C5,则可以依次计算P1与C1、C2、C3、C4及C5之间的关联度(即本实现方式中的第二关联度)、P2与C1、C2、C3、C4及C5之间的关联度(即本实现方式中的第二关联度)、P3与C1、C2、C3、C4及C5之间的关联度(即本实现方式中的第二关联度);在确定出各个关联度后,可以根据各个关联度的大小,确定各张图片分别对应的各条语音评论,比如P1与C1的关联度的数值很大、且P1与C2的关联度的数值也很大,则可以确定C1与C2对应的语音评论(即第一条语音评论)对应于第一张图片,又比如P2与C3的关联度的数值很大、P3与C4的关联度的数值也很大、且P3与C5的关联度的数值也很大,则可以确定C3、C4与C5对应的语音评论(即第二条语音评论)对应于第二张图片。
场景三,当评论包括文字评论与语音评论时,可以综合考虑上述场景一与场景二,来确定各张图片分别对应的各条评论。假如将对各条文字评论分别进行分词处理得到的各个词组记作第二词组,将对各条语音评论分别进行分词处理得到的词组记作第三词组,且将各第一图片关键词与各第二词组之间的关联度记作第三关联度,将各第一图片关键词与各第三词组之间的关联度确定为第四点关联度,则:确定各张图片分别对应的各条评论的过程,可以描述为:
对各张图片分别进行图像识别处理,得到各张图片分别对应的第一图片关键词;
确定各第一图片关键词与各第二词组之间的第三关联度,并确定各第一图片关键词与各第三词组之间的第四关联度;
根据第三关联度确定各张图片分别对应的各条文字评论,并根据第四关联度确定各张图片分别对应的各条语音评论。
在一种实现方式中,当文章内容包括文字内容和至少一张图片时,在基于第一对应关系,根据文章内容和各条评论,生成针对文章的视频的过程中,可以执行如下处理:
确定各张图片分别对应的文字内容,得到各张图片与文字内容之间的第二对应关系;
基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频。
具体地,当文章内容包括文字内容和至少一张图片时,在基于第一对应关系,根据文章内容和各条评论,生成文章的视频的过程中,为便于将文字内容和各张图片准确对应,确保视频中文字内容与各张图片的同步性与一致性,需要确定各张图片分别对应的文字内容(即确定各张图片与文字内容之间的第二对应关系),从而基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成针对文章的视频信息。
具体地,在确定各张图片分别对应的文字内容的过程中,可以执行如下处理:对文字内容进行分词处理,得到各第三词组;对各张图片分别进行图像识别处理,得到各张图片分别对应的第二图片关键词;确定各第二图片关键词与各第三词组之间的第三关联度;根据第三关联度确定各张图片分别对应的文字内容。
具体地,在对文字内容进行分词处理,得到各第三词组之前,可以先确定之前是否已经对文字内容进行分词处理,如果之前已经对文字内容进行分词处理,得到文字内容的各个词组(即第一词组)A1、A2、A3、…及AN,则此时不需要再次对文字内容进行分词处理,直接将之前得到的针对文字内容的各个词组(即第一词组)A1、A2、A3、…及AN作为此处的第三词组即可,即第三词组即为上述的第一词组;如果之前尚未对文字内容进行分词处理,则此时可以通过自然语言处理技术,对文字内容进行理解、拆分及分词等的分词处理,得到经由自然语言处理后的各个不同词组(即第三词组)。为便于描述,可以将各第三词组分别记作A1、A2、A3、…、AN
同样地,在对各张图片分别进行图像识别处理,得到各张图片分别对应的第二图片关键词之前,可以先确定之前是否已经对各张图片进行图像识别处理,如果之前已经对各张图片进行图像识别处理,得到各张图片的各个图片关键词(即第一图片关键词)P1、P2、P3、…、PT,则此时不需要再次对文字内容进行分词处理,直接将之前得到的针对文字内容的各个词组(即第一图片关键词)P1、P2、P3、…、PT作为此处的第二图片关键词即可,即第二图片关键词即为上述的第一图片关键词;如果之前尚未对各张图片进行图像识别处理,则此时可以通过深度学习技术,对各张图片分别进行图像识别处理,得到相应的图片关键词(即第二图片关键词)。为便于描述,可以将各第二图片关键词分别记作P1、P2、P3、…、PT
具体地,在确定出文字内容的各个第三词组与各张图片分别对应的各第二图片关键词后,可以通过计算各个第三词组分别与各个第二图片关键词之间的关联度(即本实现方式中的第三关联度),来确定各张图片分别对应的文字内容。
在一个示例中,假如文字内容包括两段文字内容,且第一段文字内容的各个词组为A1和A2、第二段文字内容的各个词组为A3和A4,文章包括2张图片,且第一张图片的各个图片关键词为P1、第二张图片的各个图片关键词为P2和P3,则:可以依次计算A1与P1、P2及P3之间的关联度(即本实现方式中的第三关联度)、A2与P1、P2及P3之间的关联度、A3与P1、P2及P3之间的关联度以及A4与P1、P2及P3之间的关联度;在确定出各个关联度后,可以根据各个关联度的大小,确定各张图片分别对应的文字内容,比如P1与A1的关联度很大且P1与A2的关联度也很大,则可以确定P1对应的第一张图片对应于第一段文字内容,又比如P2与A3的关联度的数值很大、且P3与A4的第一关联度的数值也很大,则可以确定P2与P3对应的第二张图片对应于第二段文字内容。
在一个具体示例中,文章的文章内容为“2004年12月26日海啸席卷马尔代夫的马累。震中位于印尼苏门答腊岛西160千米。这次的印度洋大地震是继1960年智利大地震后的又一次强震。”,且文章包括的图片为一张印度洋的海洋图、一张马尔代夫海景图以及一张介绍本次震中信息的地震解析图。通过上述技术方案处理后,可以将图片和文字内容一一对应起来,比如,马尔代夫海景图对应于第一句“2004年12月26日海啸席卷马尔代夫的马累”,地震解析图对应于第二句“震中位于印尼苏门答腊岛西160千米”,印度洋的海洋图对应于第三句“这次的印度洋大地震是继1960年智利大地震后的又一次强震”。
在一种可能的实现方式中,在基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频的过程中,可以执行如下处理:
步骤1:按照文章中各部分文字内容的先后位置顺序,依次针对各部分文字内容,将与该部分文字内容具有第二对应关系的图片作为视频帧的图像,将该部分文字内容作为该视频帧的字幕,并将与该部分文字内容具有第一对应关系的评论作为该视频帧的附加信息;其中,附加信息包括弹幕和/或背景音;
步骤2:按照文章中各部分文字内容的先后位置顺序,将各部分文字内容对应的视频帧合并生成所述文章的视频。
通常,一篇文章会包括几部分的文字内容,且各部分文字内容之间具有一定的先后位置顺序,比如一篇文章Text1包括3段文字内容(即3部分文字内容),分别为Text1_1、Text1_2及Text1_3,且该3段文字内容之间具有一定的先后位置顺序,比如Text1_1位于Text1_2之前,Text1_2位于Text1_3之前;又比如一篇文章Text2包括10段文字内容(即10部分文字内容),分别为Text2_1、Text2_2、…、Text2_10,且该10段文字内容之间具有一定的先后位置顺序,比如Text2_1位于Text2_2之前,Text2_2位于Text2_3之前,依此类推,Text1_9位于Text1_10之前。
具体地,由于各部分文字内容之间具有一定的先后位置顺序,因此,在基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频的过程中,需要充分考虑各部分文字内容之间的先后位置顺序,比如根据文章中各部分文字内容的先后位置顺序,先对位于靠前位置的某部分文字内容进行视频帧的生成,再对位于靠后位置的某部分文字内容进行视频帧的生成,最后再根据各部分文字内容的先后位置顺序,对各部分文字内容分别对应的视频帧进行合并,来生成文章的视频。
具体地,对于文章中的每一部分文字内容,其生成视频帧的方式都是相同的,下面以文章Text1中的第一段文字内容Text1_1为例,对生成视频帧的过程进行具体介绍:
首先,根据各张图片与文字内容之间的第二对应关系,确定Text1_1所对应的图片(一张或多张),比如图片Pc1与图片Pc2,并将该与Text1_1具有第二对应关系的图片Pc1与图片Pc2分别作为视频帧(记作Video_1)的图像,同时将该Text1_1作为该视频帧Video_1的字幕。接着,根据文字内容与各条评论间的第一对应关系,确定Text1_1所对应的评论(一条或多条),比如评论com_1与评论com_2,并将该与Text1_1具有第一对应关系的评论com_1与评论com_2分别作为视频帧Video_1的弹幕和/或背景音。
具体地,评论可以是文字评论,也可以是语音评论,假如评论com_1是文字评论,评论com_2为语音评论,则可以将评论com_1作为视频帧Video_1的弹幕,将评论com_2作为视频帧Video_1的背景音;又假如评论com_1与评论com_2均为文字评论,则可以将评论com_1与评论com_2均作为视频帧Video_1的弹幕,此时可以选择预定音乐作为视频帧Video_1的背景音,也可以不选择任何音乐作为视频帧Video_1的背景音(即视频帧Video_1无背景音);又假如评论com_1与评论com_2均为语音评论,则可以将评论com_1与评论com_2均作为视频帧Video_1的背景音,此时视频帧Video_1无弹幕或者选择一些预定弹幕作为视频帧Video_1的弹幕。
具体地,在基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频的过程中,在针对文章中的某部分文字内容(例如Text1_1)生成视频帧时,可以将该某部分文字内容记作当前显示的目标文字内容,将与该部分文字内容具有第二对应关系的图片(例如图片Pc1与图片Pc2)记作目标文字内容对应的目标显示图片,于是,针对Text1_1的视频帧生成过程,可以为:
确定当前显示的目标文字内容,并基于第二对应关系确定目标文字内容对应的目标显示图片,以及基于第一对应关系,确定目标文字内容与目标显示图片分别对应的各条评论;
通过将目标显示图片作为视频的视频帧、将目标文字内容作为视频的字幕、将目标文字内容与目标显示图片分别对应的各条评论作为视频的附加信息,来生成文章的视频;附加信息包括弹幕和/或背景音。
具体地,可以根据文字内容、各张图片、各条评论等素材,生成文章的视频。其中,在生成文章的视频的过程中,可以将文字内容作为视频的字幕、将文章中的各张图片作为视频的视频帧,将各条评论作为视频的弹幕和/或背景音,来生成最终的视频。
在一种情况下,当评论包括文字评论和语音评论时,可以根据文字内容、各张图片、各条文字评论和各条语音评论等素材,生成文章的视频。其中,在生成文章的视频的过程中,可以将文字内容作为视频的字幕、将文章中的各张图片作为视频的视频帧,将各条文字评论作为视频的弹幕以及将语音评论作为视频的背景音,来生成最终的视频。
具体地,在根据文字内容、各张图片、各条文字评论和各条语音评论等素材,生成文章的视频时,可以根据上述的第一对应关系,确定各张图片分别对应的文字内容,以便在显示某张图片时(即将某张图片作为某些视频帧时),能够将根据第二对应关系确定出的该张图片对应的文字内容,作为该视频中该些视频帧的字幕,从而实现视频帧与字幕的同步显示。
具体地,在视频中显示某张图片(即视频帧)时,可以将根据第一对应关系确定出的该张图片对应的各条文字评论,作为该视频中该些视频帧的弹幕,其中,当该张图片对应的文字内容也存在相对应的各条文字评论时,也将该文字内容对应的各条文字评论,作为该视频中该些视频帧的弹幕。
具体地,在显示某张图片时,可以将根据第一对应关系确定出的该张图片对应的各条语音评论,作为该视频中该些视频帧的背景音,其中,当该张图片对应的文字内容也存在相对应的各条语音评论时,也将该文字内容对应的各条语音评论,作为该视频中该些视频帧的背景音。
在一个示例中,假定文章包括两段文字内容和两张图片,两段文字内容分别为第一段文字内容与第二段文字内容,两张图片分别为图片1与图片2,并且针对文章的评论包括7条文字评论(分别为文评1、文评2、…、文评7)和2条语音评论(分别为语评1与语评2),则:如果根据文章内容与各条评论间的第一对应关系,确定第一段文字内容对应文评1与文评2、第二段文字内容对应文评3与文评4、图片1对应文评5、图片2对应文评6与文评7、图片1对应语评1以及图片2对应语评2,并且根据各张图片与文章内容之间的第二对应关系,此时,在生成文章的视频时,若当前显示的是图片1(即将图片1作为某些视频帧),则将第一段文字内容作为图片1的字幕,将文评1、文评2及文评5作为图片1的弹幕,将语评1作为图片1的背景音;若当前显示的是图片2(即将图片2作为某些视频帧),则将第二段文字内容作为图片2的字幕,将文评3、文评4、文评6与文评7作为图片2的弹幕,将语评2作为图片2的背景音。
在实际应用中,可以通过FFmpeg,来根据文字内容、各张图片、各条文字评论和各条语音评论等素材,生成文章的视频。其中,FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序,FFmpeg提供了良好的接口,使得可以方便的实现如何将某些特定内容显示在特定视频帧范围内,最终得到想要的视频。
在一种可能的实现方式中,当文章内容包括文字内容、评论包括文字评论时,在基于第一对应关系,根据文章内容和各条评论,生成针对文章的视频时,可以执行如下处理:确定当前待显示文字内容,并基于第一对应关系,确定当前待显示文字内容对应的各条文字评论;接着,通过将预定图片作为视频的视频帧、将当前待显示文字内容作为视频的字幕、将与当前待显示文字内容对应的各条文字评论作为视频的弹幕以及将预定音乐作为视频的背景音,生成文章的视频。其中,生成文章的视频的方式与上述示例中的描述类似,在此不再赘述。
在一种可能的实现方式中,当文章内容包括文字内容、评论包括语音评论时,在基于第一对应关系,根据文章内容和各条评论,生成针对文章的视频时,可以执行如下处理:确定当前待显示文字内容,并基于第一对应关系,确定当前待显示文字内容对应的各条语音评论;接着,通过将预定图片作为视频的视频帧、将当前待显示文字内容作为视频的字幕以及将与当前待显示文字内容对应的各条语音评论作为视频的背景音,生成文章的视频。其中,生成文章的视频的方式与上述示例中的描述类似,在此不再赘述。
在一种可能的实现方式中,当文章内容包括文字内容、评论包括文字评论和语音评论时,在基于第一对应关系,根据文章内容和各条评论,生成针对文章的视频时,可以执行如下处理:基于第一对应关系,确定当前待显示文字内容对应的各条文字评论和各条语音评论;接着,通过将预定图片作为视频的视频帧、将当前待显示文字内容作为视频的字幕、将与当前待显示文字内容对应的各条文字评论作为视频的弹幕以及将当前待显示文字内容对应的各条语音评论作为视频的背景音,生成文章的视频。其中,生成文章的视频的方式与上述示例中的描述类似,在此不再赘述。
在一种可能的实现方式中,当文章内容包括至少一张图片、评论包括文字评论时,在基于第一对应关系,根据文章内容和各条评论,生成针对文章的视频时,可以执行如下处理:确定当前待显示图片,并基于第一对应关系,确定当前待显示图片对应的各条文字评论;接着,通过将当前待显示图片作为视频的视频帧、将与当前待显示图片对应的各条文字评论作为视频的弹幕以及将预定音乐作为视频的背景音,生成文章的视频。其中,生成文章的视频的方式与上述示例中的描述类似,在此不再赘述。
在一种可能的实现方式中,当文章内容包括至少一张图片、评论包括语音评论时,在基于第一对应关系,根据文章内容和各条评论,生成针对文章的视频时,可以执行如下处理:确定当前待显示图片,并基于第一对应关系,确定当前待显示图片对应的各条语音评论;接着,通过将当前待显示图片作为视频的视频帧、将与当前待显示图片对应的各条语音评论作为视频的背景音,生成文章的视频。其中,生成文章的视频的方式与上述示例中的描述类似,在此不再赘述。
在一种可能的实现方式中,当文章内容包括至少一张图片、评论包括文字评论和语音评论时,在基于第一对应关系,根据文章内容和各条评论,生成针对文章的视频时,可以执行如下处理:确定当前待显示图片,并基于第一对应关系,确定当前待显示图片对应的各条文字评论和各条语音评论;接着,通过将当前待显示图片作为视频的视频帧、将与当前待显示图片对应的各条文字评论作为视频的弹幕以及将与当前待显示图片对应的各条语音评论作为视频的背景音,生成文章的视频。其中,生成文章的视频的方式与上述示例中的描述类似,在此不再赘述。
图2为本公开又一实施例提供的一种文章处理装置的结构示意图,如图2所示,该装置200可以包括第一处理模块201、确定模块202及第二处理模块203,其中:
第一处理模块201,用于检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论;
确定模块202,用于确定文章内容与各条评论间的第一对应关系;
第二处理模块203,用于基于第一对应关系,根据文章内容和各条评论,生成文章的视频。
具体地,文章内容包括文字内容和/或至少一张图片;确定模块用于:
确定文字内容对应的各条评论,得到文字内容与各条评论之间的第一对应关系;和/或,
确定各张图片分别对应的各条评论,得到各张图片与各条评论之间的第一对应关系。
具体地,确定模块在确定文字内容对应的各条评论时,用于:
对文字内容进行分词处理,得到各第一词组,并对各条评论分别进行分词处理得到各第二词组;
确定各第一词组与各第二词组之间的第一关联度;
根据第一关联度确定文字内容对应的各条评论;
确定模块在确定各张图片分别对应的各条评论时,用于:
对各张图片分别进行图像识别处理,得到各张图片分别对应的第一图片关键词;
确定各第一图片关键词与各第二词组之间的第二关联度;
根据第二关联度确定各张图片分别对应的各条评论。
具体地,当文章内容包括文字内容和至少一张图片时,第二处理模块用于:
确定各张图片分别对应的文字内容,得到各张图片与文字内容之间的第二对应关系;
基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频信息。
具体地,第二处理模块在确定各张图片分别对应的文字内容时,用于:
对文字内容进行分词处理,得到各第三词组;
对各张图片分别进行图像识别处理,得到各张图片分别对应的第二图片关键词;
确定各第二图片关键词与各第三词组之间的第三关联度;
根据第三关联度确定各张图片分别对应的文字内容。
具体地,第二处理模块在基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频时,用于:
按照文章中各部分文字内容的先后位置顺序,依次针对各部分文字内容,将与该部分文字内容具有第二对应关系的图片作为视频帧的图像,将该部分文字内容作为该视频帧的字幕,并将与该部分文字内容具有第一对应关系的评论作为该视频帧的附加信息;其中,附加信息包括弹幕和/或背景音;
按照文章中各部分文字内容的先后位置顺序,将各部分文字内容对应的视频帧合并生成文章的视频。
具体地,预设操作包括分享操作;
当预设操作为分享操作时,该装置还包括分享模块;
分享模块用于向目标对象分享视频。
本公开实施例提供的装置,检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论,确定文章内容与各条评论间的第一对应关系,从而对文章内容与各条评论进行上下文关联,为后续生成文章的视频提供前提保障;基于第一对应关系根据文章内容和各条评论,生成文章的视频,不仅可以以更加丰富、明确的方式将文章的内容呈现给用户,而且确保了视频中文章内容与各条评论的同步性与一致性,从而丰富了文章内容的展现方式与呈现形式,使得用户不仅可以方便快捷地获取文章内容,而且可以获得其他人对文章内容的看法、评论等,提升用户对文章内容的观看体验。
需要说明的是,本实施例为与上述的方法项实施例相对应的装置项实施例,本实施例可与上述方法项实施例互相配合实施。上述方法项实施例中提到的相关技术细节在本实施例中依然有效,为了减少重复,这里不再赘述。相应地,本实施例中提到的相关技术细节也可应用在上述方法项实施例中。
下面参考图3,其示出了适于用来实现本公开实施例的电子设备300的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
电子设备包括存储器以及处理器,其中,这里的处理器可以称为下方所述的处理装置301,存储器包括下文中的只读存储器(ROM)302、随机访问存储器(RAM)303以及存储装置308中的至少一项,具体如下所示:
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论;接着,确定文章内容与各条评论间的第一对应关系;接着,基于第一对应关系,根据文章内容和各条评论,生成文章的视频。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块或单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取模块还可以被描述为“检测到发生预定直播事件时,获取预定直播事件对应的至少一种事件处理方式的模块”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,提供了一种文章处理方法,包括:检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论;
确定文章内容与各条评论间的第一对应关系;
基于第一对应关系,根据文章内容和各条评论,生成文章的视频。
在一种可能的实现方式中,文章内容包括文字内容和/或至少一张图片;
确定文章内容与各条评论间的第一对应关系,包括:
确定文字内容对应的各条评论,得到文字内容与各条评论之间的第一对应关系;和/或,
确定各张图片分别对应的各条评论,得到各张图片与各条评论之间的第一对应关系。
在一种可能的实现方式中,确定文字内容对应的各条评论,包括:
对文字内容进行分词处理,得到各第一词组,并对各条评论分别进行分词处理得到各第二词组;
确定各第一词组与各第二词组之间的第一关联度;
根据第一关联度确定文字内容对应的各条评论;
确定各张图片分别对应的各条评论,包括:
对各张图片分别进行图像识别处理,得到各张图片分别对应的第一图片关键词;
确定各第一图片关键词与各第二词组之间的第二关联度;
根据第二关联度确定各张图片分别对应的各条评论。
在一种可能的实现方式中,当文章内容包括文字内容和至少一张图片时,基于第一对应关系,根据文章内容和各条评论,生成针对文章的视频,包括:
确定各张图片分别对应的文字内容,得到各张图片与文字内容之间的第二对应关系;
基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频信息。
在一种可能的实现方式中,确定各张图片分别对应的文字内容,包括:
对文字内容进行分词处理,得到各第三词组;
对各张图片分别进行图像识别处理,得到各张图片分别对应的第二图片关键词;
确定各第二图片关键词与各第三词组之间的第三关联度;
根据第三关联度确定各张图片分别对应的文字内容。
在一种可能的实现方式中,基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频,包括:
按照文章中各部分文字内容的先后位置顺序,依次针对各部分文字内容,将与该部分文字内容具有第二对应关系的图片作为视频帧的图像,将该部分文字内容作为该视频帧的字幕,并将与该部分文字内容具有第一对应关系的评论作为该视频帧的附加信息;其中,附加信息包括弹幕和/或背景音;
按照文章中各部分文字内容的先后位置顺序,将各部分文字内容对应的视频帧合并生成所述文章的视频。
在一种可能的实现方式中,预设操作包括分享操作;
当预设操作为分享操作时,在生成文章的视频之后,还包括:
向目标对象分享视频。
根据本公开的一个或多个实施例,提供了一种文章处理装置,包括:
第一处理模块,用于检测到针对文章的预设操作时,获取文章的文章内容和针对文章的至少一条评论;
确定模块,用于确定文章内容与各条评论间的第一对应关系;
第二处理模块,用于基于第一对应关系,根据文章内容和各条评论,生成文章的视频。
在一种可能的实现方式中,文章内容包括文字内容和/或至少一张图片;确定模块用于:
确定文字内容对应的各条评论,得到文字内容与各条评论之间的第一对应关系;和/或,
确定各张图片分别对应的各条评论,得到各张图片与各条评论之间的第一对应关系。
在一种可能的实现方式中,确定模块在确定文字内容对应的各条评论时,用于:
对文字内容进行分词处理,得到各第一词组,并对各条评论分别进行分词处理得到各第二词组;
确定各第一词组与各第二词组之间的第一关联度;
根据第一关联度确定文字内容对应的各条评论;
确定模块在确定各张图片分别对应的各条评论时,用于:
对各张图片分别进行图像识别处理,得到各张图片分别对应的第一图片关键词;
确定各第一图片关键词与各第二词组之间的第二关联度;
根据第二关联度确定各张图片分别对应的各条评论。
在一种可能的实现方式中,当文章内容包括文字内容和至少一张图片时,第二处理模块用于:
确定各张图片分别对应的文字内容,得到各张图片与文字内容之间的第二对应关系;
基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频信息。
在一种可能的实现方式中,第二处理模块在确定各张图片分别对应的文字内容时,用于:
对文字内容进行分词处理,得到各第三词组;
对各张图片分别进行图像识别处理,得到各张图片分别对应的第二图片关键词;
确定各第二图片关键词与各第三词组之间的第三关联度;
根据第三关联度确定各张图片分别对应的文字内容。
在一种可能的实现方式中,第二处理模块在基于第一对应关系与第二对应关系,根据文字内容、各张图片、各条评论,生成文章的视频时,用于:
按照文章中各部分文字内容的先后位置顺序,依次针对各部分文字内容,将与该部分文字内容具有第二对应关系的图片作为视频帧的图像,将该部分文字内容作为该视频帧的字幕,并将与该部分文字内容具有第一对应关系的评论作为该视频帧的附加信息;其中,附加信息包括弹幕和/或背景音;
按照文章中各部分文字内容的先后位置顺序,将各部分文字内容对应的视频帧合并生成所述文章的视频。
在一种可能的实现方式中,预设操作包括分享操作;
当预设操作为分享操作时,该装置还包括分享模块;
分享模块用于向目标对象分享视频。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (10)

1.一种文章处理方法,其特征在于,包括:
检测到针对文章的预设操作时,获取所述文章的文章内容和针对所述文章的至少一条评论;
确定所述文章内容与各条评论间的第一对应关系;
基于所述第一对应关系,根据所述文章内容和所述各条评论,生成所述文章的视频。
2.根据权利要求1所述的方法,其特征在于,所述文章内容包括文字内容和/或至少一张图片;
所述确定所述文章内容与所述各条评论间的第一对应关系,包括:
确定所述文字内容对应的各条评论,得到所述文字内容与所述各条评论之间的第一对应关系;和/或,
确定各张图片分别对应的各条评论,得到所述各张图片与所述各条评论之间的第一对应关系。
3.根据权利要求2所述的方法,其特征在于,所述确定所述文字内容对应的各条评论,包括:
对所述文字内容进行分词处理,得到各第一词组,并对所述各条评论分别进行分词处理得到各第二词组;
确定所述各第一词组与所述各第二词组之间的第一关联度;
根据所述第一关联度确定所述文字内容对应的各条评论;
所述确定各张图片分别对应的各条评论,包括:
对所述各张图片分别进行图像识别处理,得到各张图片分别对应的第一图片关键词;
确定所述各第一图片关键词与所述各第二词组之间的第二关联度;
根据所述第二关联度确定所述各张图片分别对应的各条评论。
4.根据权利要求2所述的方法,其特征在于,当所述文章内容包括文字内容和至少一张图片时,所述基于所述第一对应关系,根据所述文章内容和各条所述评论,生成针对所述文章的视频,包括:
确定各张图片分别对应的文字内容,得到各张图片与文字内容之间的第二对应关系;
基于所述第一对应关系与所述第二对应关系,根据所述文字内容、所述各张图片、所述各条评论,生成所述文章的视频。
5.根据权利要求4所述的方法,其特征在于,确定各张图片分别对应的文字内容,包括:
对所述文字内容进行分词处理,得到各第三词组;
对所述各张图片分别进行图像识别处理,得到各张图片分别对应的第二图片关键词;
确定所述各第二图片关键词与所述各第三词组之间的第三关联度;
根据所述第三关联度确定所述各张图片分别对应的文字内容。
6.根据权利要求4或5所述的方法,其特征在于,基于所述第一对应关系与所述第二对应关系,根据所述文字内容、所述各张图片、所述各条评论,生成所述文章的视频,包括:
按照文章中各部分文字内容的先后位置顺序,依次针对各部分文字内容,将与该部分文字内容具有第二对应关系的图片作为视频帧的图像,将该部分文字内容作为该视频帧的字幕,并将与该部分文字内容具有第一对应关系的评论作为该视频帧的附加信息;其中,所述附加信息包括弹幕和/或背景音;
按照文章中各部分文字内容的先后位置顺序,将各部分文字内容对应的视频帧合并生成所述文章的视频。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述预设操作包括分享操作;
当所述预设操作为所述分享操作时,在生成所述文章的视频之后,还包括:
向目标对象分享所述视频。
8.一种文章处理装置,其特征在于,包括:
第一处理模块,用于检测到针对文章的预设操作时,获取所述文章的文章内容和针对所述文章的至少一条评论;
确定模块,用于确定所述文章内容与各条评论间的第一对应关系;
第二处理模块,用于基于所述第一对应关系,根据所述文章内容和所述各条评论,生成所述文章的视频。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现权利要求1-7任一项所述的方法。
CN202010148113.1A 2020-03-05 2020-03-05 文章处理方法、装置、电子设备及计算机存储介质 Active CN111327960B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010148113.1A CN111327960B (zh) 2020-03-05 2020-03-05 文章处理方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010148113.1A CN111327960B (zh) 2020-03-05 2020-03-05 文章处理方法、装置、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN111327960A true CN111327960A (zh) 2020-06-23
CN111327960B CN111327960B (zh) 2022-07-29

Family

ID=71169317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010148113.1A Active CN111327960B (zh) 2020-03-05 2020-03-05 文章处理方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111327960B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113301389A (zh) * 2021-05-19 2021-08-24 北京沃东天骏信息技术有限公司 一种用于生成视频的评论处理方法和装置
JP2022075668A (ja) * 2021-02-23 2022-05-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ビデオ処理方法、装置、デバイスおよび記憶媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731959A (zh) * 2015-04-03 2015-06-24 北京威扬科技有限公司 基于文本的网页内容生成视频摘要的方法、装置及系统
CN107832382A (zh) * 2017-10-30 2018-03-23 百度在线网络技术(北京)有限公司 基于文字生成视频的方法、装置、设备及存储介质
CN107943839A (zh) * 2017-10-30 2018-04-20 百度在线网络技术(北京)有限公司 基于图片和文字生成视频的方法、装置、设备及存储介质
CN109582945A (zh) * 2018-12-17 2019-04-05 北京百度网讯科技有限公司 文章生成方法、装置及存储介质
CN110807126A (zh) * 2018-08-01 2020-02-18 腾讯科技(深圳)有限公司 文章转换成视频的方法、装置、存储介质及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731959A (zh) * 2015-04-03 2015-06-24 北京威扬科技有限公司 基于文本的网页内容生成视频摘要的方法、装置及系统
CN107832382A (zh) * 2017-10-30 2018-03-23 百度在线网络技术(北京)有限公司 基于文字生成视频的方法、装置、设备及存储介质
CN107943839A (zh) * 2017-10-30 2018-04-20 百度在线网络技术(北京)有限公司 基于图片和文字生成视频的方法、装置、设备及存储介质
CN110807126A (zh) * 2018-08-01 2020-02-18 腾讯科技(深圳)有限公司 文章转换成视频的方法、装置、存储介质及设备
CN109582945A (zh) * 2018-12-17 2019-04-05 北京百度网讯科技有限公司 文章生成方法、装置及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022075668A (ja) * 2021-02-23 2022-05-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ビデオ処理方法、装置、デバイスおよび記憶媒体
JP7355865B2 (ja) 2021-02-23 2023-10-03 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ビデオ処理方法、装置、デバイスおよび記憶媒体
CN113301389A (zh) * 2021-05-19 2021-08-24 北京沃东天骏信息技术有限公司 一种用于生成视频的评论处理方法和装置
CN113301389B (zh) * 2021-05-19 2023-04-07 北京沃东天骏信息技术有限公司 一种用于生成视频的评论处理方法和装置

Also Published As

Publication number Publication date
CN111327960B (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN110969012B (zh) 文本纠错方法、装置、存储介质及电子设备
CN111970577A (zh) 字幕编辑方法、装置和电子设备
CN111178056A (zh) 基于深度学习的文案生成方法、装置及电子设备
CN111897976A (zh) 一种虚拟形象合成方法、装置、电子设备及存储介质
CN111327960B (zh) 文章处理方法、装置、电子设备及计算机存储介质
CN111897950A (zh) 用于生成信息的方法和装置
CN112069360A (zh) 音乐海报生成方法、装置、电子设备及介质
CN112291614A (zh) 一种视频生成方法及装置
CN115908640A (zh) 生成图像的方法、装置、可读介质及电子设备
CN115640815A (zh) 翻译方法、装置、可读介质及电子设备
CN114445754A (zh) 视频处理方法、装置、可读介质及电子设备
CN112785669B (zh) 一种虚拟形象合成方法、装置、设备及存储介质
CN111815274A (zh) 信息处理方法、装置和电子设备
CN113886612A (zh) 一种多媒体浏览方法、装置、设备及介质
CN111767259A (zh) 内容分享的方法、装置、可读介质和电子设备
CN111555960A (zh) 信息生成的方法
CN115547330A (zh) 基于语音交互的信息展示方法、装置和电子设备
CN111859970B (zh) 用于处理信息的方法、装置、设备和介质
CN114398135A (zh) 交互方法、装置、电子设备、存储介质和程序产品
CN112699687A (zh) 内容编目方法、装置和电子设备
CN113420723A (zh) 获取视频热点的方法、装置、可读介质和电子设备
CN111898595A (zh) 一种信息展示方法、装置、电子设备和存储介质
CN115967833A (zh) 视频生成方法、装置、设备计存储介质
CN112905838A (zh) 信息检索方法和装置、存储介质和电子设备
CN113486212A (zh) 搜索推荐信息的生成和展示方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Tiktok vision (Beijing) Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.