CN112752165B - 字幕处理方法、装置、服务器及计算机可读存储介质 - Google Patents

字幕处理方法、装置、服务器及计算机可读存储介质 Download PDF

Info

Publication number
CN112752165B
CN112752165B CN202010503884.8A CN202010503884A CN112752165B CN 112752165 B CN112752165 B CN 112752165B CN 202010503884 A CN202010503884 A CN 202010503884A CN 112752165 B CN112752165 B CN 112752165B
Authority
CN
China
Prior art keywords
subtitle
array
caption
file
fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010503884.8A
Other languages
English (en)
Other versions
CN112752165A (zh
Inventor
叶学超
王维富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010503884.8A priority Critical patent/CN112752165B/zh
Publication of CN112752165A publication Critical patent/CN112752165A/zh
Application granted granted Critical
Publication of CN112752165B publication Critical patent/CN112752165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请提供了一种字幕处理方法、装置、服务器及计算机可读存储介质,属于多媒体技术领域。该方法包括:分别获取第一字幕数组和第二字幕数组,确定二者之间的最长公共子序列,基于最长公共子序列中字幕片段在第二字幕数组中的存储位置,确定目标索引数组,基于第二字幕数组和目标索引数组,确定包括差异字幕片段的目标字幕数组。本申请通过对比第一字幕数组的多个第一字幕片段和第二字幕数组的多个第二字幕片段,来自动确定出数组之间的公共子序列,而由于公共子序列能够用于表示数组之间哪些字幕片段相同,因此可以基于公共子序列和第二字幕文件自动确定出变更的字幕片段,无需对变更的字幕进行人工标注,提高了字幕处理的效率。

Description

字幕处理方法、装置、服务器及计算机可读存储介质
技术领域
本申请涉及多媒体技术领域,特别涉及一种字幕处理方法、装置、服务器及计算机可读存储介质。
背景技术
字幕一般是由字幕制作人员通过人工编辑得到的,字幕内容可能涉及脏话、宗教、色情等令用户反感的内容,所以字幕在上线到视频网站之前,需要经过安全审核,以保证字幕内容的健康性和合法性。然而,对于同一个视频的字幕,字幕制作人员可能会进行多次修改,使得字幕发生变更,每次变更后,都需要审核人员重新对字幕文本中的内容进行审核。
目前,字幕制作人员在第一次提交字幕时,需要将完整的字幕提交到安全审核平台进行审核。而在后续修改部分字幕内容时,字幕制作人员需要在完整的字幕中对变更的字幕进行人工标注,再根据标注确定出变更的字幕,仅把变更的字幕提交到安全审核平台,以便安全审核人员仅对变更的字幕进行审核。
在上述实现过程中,由于字幕在进行提交时,除了要提交字幕内容外,还要提交字幕内容对应的时间标签和序号,以便审核人员来对字幕内容进行定位,而且对字幕的变更可能涉及增加字幕内容、删除字幕内容、修改时间标签、修改字幕内容等多种操作,使得人工标注的效率很低,导致字幕处理效率较低。
发明内容
本申请实施例提供了一种字幕处理方法、装置、服务器及计算机可读存储介质,可以提高字幕处理效率。该技术方案如下:
一方面,提供了一种字幕处理方法,该方法包括:
分别获取第一字幕数组和第二字幕数组,该第一字幕数组包括按照字幕时间标签所指示的时间顺序排列的第一字幕文件的多个第一字幕片段,该第二字幕数组包括按照字幕时间标签所指示的时间顺序排列的第二字幕文件的多个第二字幕片段;
确定该第一字幕数组和该第二字幕数组之间的最长公共子序列;
基于该最长公共子序列中字幕片段在该第二字幕数组中的存储位置,确定目标索引数组,该目标索引数组包括该最长公共子序列中多个字幕片段在该第二字幕数组中的存储位置;
基于该第二字幕数组和该目标索引数组,确定目标字幕数组,该目标字幕数组包括第一字幕数组和第二字幕数组之间的差异字幕片段。
在一种可能的实现方式中,该基于该第二字幕数组和该目标索引数组,确定目标字幕数组之后,该方法还包括:
将该目标字幕数组推送至安全审核平台,通过该安全审核平台对该目标字幕数组进行审核。
一方面,提供了一种字幕处理装置,该装置包括:
字幕数组获取模块,用于分别获取第一字幕数组和第二字幕数组,该第一字幕数组包括按照字幕时间标签所指示的时间顺序排列的第一字幕文件的多个第一字幕片段,该第二字幕数组包括按照字幕时间标签所指示的时间顺序排列的第二字幕文件的多个第二字幕片段;
序列确定模块,用于确定该第一字幕数组和该第二字幕数组之间的最长公共子序列;
索引数组确定模块,用于基于该最长公共子序列中字幕片段在该第二字幕数组中的存储位置,确定目标索引数组,该目标索引数组包括该最长公共子序列中多个字幕片段在该第二字幕数组中的存储位置;
字幕数组确定模块,用于基于该第二字幕数组和该目标索引数组,确定目标字幕数组,该目标字幕数组包括第一字幕数组和第二字幕数组之间的差异字幕片段。
在一种可能的实现方式中,该序列确定模块,用于将该第二字幕数组中的任一个第二字幕片段,与该第一字幕数组中的各个第一字幕片段进行比较,若该第一字幕数组中存在与该任一个第二字幕片段对应的字幕内容相同的第一字幕片段,则将该任一个第二字幕片段确定为该最长公共子序列包含的字幕片段,直至该第二字幕数组中的各个第二字幕片段均比较完成,得到该最长公共子序列。
在一种可能的实现方式中,该字幕数组确定模块,用于根据该目标索引数组中的存储位置所指示的多个字幕片段在该第二字幕数组中的存储位置,获取目标字幕片段在该第二字幕数组中的存储位置,该目标字幕片段为该第二字幕数组中除该目标索引数组中的存储位置所指示的多个字幕片段外的字幕片段,根据该目标字幕片段在该第二字幕数组中的存储位置,从该第二字幕数组中获取该目标字幕片段,将该目标字幕片段存储至该目标字幕数组。
在一种可能的实现方式中,该字幕数组获取模块,用于分别获取该第一字幕文件和该第二字幕文件,分别对该第一字幕文件和该第二字幕文件进行解析,得到该第一字幕文件的多个第一字幕片段和该第二字幕文件的多个第二字幕片段,分别将该多个第一字幕片段和该多个第二字幕片段按照各个字幕片段的字幕时间标签所指示的时间顺序,存储至该第一字幕数组和该第二字幕数组。
在一种可能的实现方式中,该字幕数组获取模块,用于分别获取该第一字幕文件和该第二字幕文件,获取存储该第一字幕文件的多个第一字幕片段的该第一字幕数组,对该第二字幕文件进行解析,得到该第二字幕文件的多个第二字幕片段,将该多个第二字幕片段按照各个第二字幕片段的字幕时间标签所指示的时间顺序,存储至该第二字幕数组。
在一种可能的实现方式中,该字幕数组获取模块,用于接收重新上传的该第二字幕文件,基于该第二字幕文件对应的多媒体标识,下载与该多媒体标识对应的该第一字幕文件。
在一种可能的实现方式中,该装置还包括:
排序模块,用于根据该第二字幕文件中各个第二字幕片段的字幕时间标签所指示的时间顺序,对该第二字幕数组中的各个第二字幕片段进行排序。
在一种可能的实现方式中,该装置还包括:
推送模块,用于将该目标字幕数组推送至安全审核平台,通过该安全审核平台对该目标字幕数组进行审核。
一方面,提供了一种服务器,该服务器包括一个或多个处理器和一个或多个存储器,该一个或多个存储器中存储有至少一条程序代码,该程序代码由该一个或多个处理器加载并执行以实现该字幕处理方法所执行的操作。
一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条程序代码,该程序代码由处理器加载并执行以实现该字幕处理方法所执行的操作。
一方面,提供了一种应用程序产品,该应用程序产品存储有至少一条程序代码,该至少一条程序代码由电子设备的处理器加载并执行,以实现上述数据处理方法。
本申请提供的方案,通过分别获取包括第一字幕文件的多个第一字幕片段的第一字幕数组和包括第二字幕文件的多个第二字幕片段的第二字幕数组,确定第一字幕数组和第二字幕数组之间的最长公共子序列,基于最长公共子序列中字幕片段在第二字幕数组中的存储位置,确定目标索引数组,基于第二字幕数组和目标索引数组,确定包括第一字幕数组和第二字幕数组之间的差异字幕片段的目标字幕数组。本申请通过对比第一字幕数组的多个第一字幕片段和第二字幕数组的多个第二字幕片段,来自动确定出数组之间的公共子序列,而由于公共子序列能够用于表示数组之间哪些字幕片段相同,因此可以基于公共子序列和第二字幕文件自动确定出变更的字幕片段,无需字幕制作人员对变更的字幕进行人工标注,提高了字幕处理的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种字幕处理方法的实施环境示意图;
图2是本申请实施例提供的一种字幕处理方法的流程图;
图3是本申请实施例提供的一种字幕处理方法的流程图;
图4是本申请实施例提供的一种字幕处理方法的处理流程示意图;
图5是本申请实施例提供的一种字幕数组的结构示意图;
图6是本申请实施例提供的一种确定最长公共子序列的方法示意图;
图7是本申请实施例提供的一种字幕处理装置的结构示意图;
图8是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本申请实施例提供的一种字幕处理方法的实施环境示意图,参见图1,该实施环境包括:终端101和服务器102。
终端101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端101以及服务器102可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。终端101可以响应于用户触发的播放指令,向服务器102发送获取请求,用于获取用户要观看的视频文件和对应的字幕文件,接收服务器102发送的视频文件及对应的字幕文件,并根据视频文件中各个视频帧的时间戳以及字幕文件中字幕内容对应的字幕时间标签,对视频进行播放。
终端101可以泛指多个终端中的一个,本实施例仅以终端101来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端可以仅为一个,或者上述终端为几十个或几百个,或者更多数量,本申请实施例对终端的数量和设备类型不加以限定。
服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器102以及终端101可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。服务器102可以维护有一个文件数据库,用于存储各个视频文件及对应的第一字幕文件,以便服务器102从中获取第一字幕文件,服务器102还可以接收运营方的终端上传的第二字幕文件,该第一字幕文件可以为运营方的终端上传的、已经经过安全审核平台审核的字幕文件,而该第二字幕文件可以为在第一字幕文件上修改得到的、尚未经过安全审核平台审核的字幕文件,进而可以根据第一字幕文件和第二字幕文件,确定二者之间的差异字幕片段,以便将差异字幕片段推送至安全审核平台,安全审核人员可以通过该安全审核平台来对该差异字幕片段进行审核。在接收到安全审核平台反馈的审核通过信息后,服务器102还可以根据接收到的第二字幕文件,对字幕文件数据库的第一字幕文件进行更新,以接收到的第二字幕文件替换对应的第一字幕文件,作为视频文件对应的第一字幕文件。服务器102还可以接收终端101发送的获取请求,并根据获取请求中携带的信息,从文件数据库中获取需要的视频文件及对应的第一字幕文件发送给终端101。可选地,上述服务器的数量可以更多或更少,本申请实施例对此不加以限定。当然,服务器102还可以包括其他功能服务器,以便提供更全面且多样化的服务。
图2是本申请实施例提供的一种字幕处理方法的流程图,参见图2,应用于服务器,该方法包括:
201、分别获取第一字幕数组和第二字幕数组,该第一字幕数组包括按照字幕时间标签所指示的时间顺序排列的第一字幕文件的多个第一字幕片段,该第二字幕数组包括按照字幕时间标签所指示的时间顺序排列的第二字幕文件的多个第二字幕片段。
202、确定该第一字幕数组和该第二字幕数组之间的最长公共子序列。
203、基于该最长公共子序列中字幕片段在该第二字幕数组中的存储位置,确定目标索引数组,该目标索引数组包括该最长公共子序列中多个字幕片段在该第二字幕数组中的存储位置。
204、基于该第二字幕数组和该目标索引数组,确定目标字幕数组,该目标字幕数组包括第一字幕数组和第二字幕数组之间的差异字幕片段。
本申请实施例提供的方案,通过分别获取包括第一字幕文件的多个第一字幕片段的第一字幕数组和包括第二字幕文件的多个第二字幕片段的第二字幕数组,确定第一字幕数组和第二字幕数组之间的最长公共子序列,基于最长公共子序列中字幕片段在第二字幕数组中的存储位置,确定目标索引数组,基于第二字幕数组和目标索引数组,确定包括第一字幕数组和第二字幕数组之间的差异字幕片段的目标字幕数组。本申请通过对比第一字幕数组的多个第一字幕片段和第二字幕数组的多个第二字幕片段,来自动确定出数组之间的公共子序列,而由于公共子序列能够用于表示数组之间哪些字幕片段相同,因此可以基于公共子序列和第二字幕文件自动确定出变更的字幕片段,无需字幕制作人员对变更的字幕进行人工标注,提高了字幕处理的效率。
在一种可能的实现方式中,该确定该第一字幕数组和该第二字幕数组之间的最长公共子序列包括:
将该第二字幕数组中的任一个第二字幕片段,与该第一字幕数组中的各个第一字幕片段进行比较;
若该第一字幕数组中存在与该任一个第二字幕片段对应的字幕内容相同的第一字幕片段,则将该任一个第二字幕片段确定为该最长公共子序列包含的字幕片段,直至该第二字幕数组中的各个第二字幕片段均比较完成,得到该最长公共子序列。
在一种可能的实现方式中,该基于该第二字幕数组和该目标索引数组,确定目标字幕数组包括:
根据该目标索引数组中的存储位置所指示的多个字幕片段在该第二字幕数组中的存储位置,获取目标字幕片段在该第二字幕数组中的存储位置,该目标字幕片段为该第二字幕数组中除该目标索引数组中的存储位置所指示的多个字幕片段外的字幕片段;
根据该目标字幕片段在该第二字幕数组中的存储位置,从该第二字幕数组中获取该目标字幕片段;
将该目标字幕片段存储至该目标字幕数组。
在一种可能的实现方式中,该分别获取第一字幕数组和第二字幕数组包括:
分别获取该第一字幕文件和该第二字幕文件;
分别对该第一字幕文件和该第二字幕文件进行解析,得到该第一字幕文件的多个第一字幕片段和该第二字幕文件的多个第二字幕片段;
分别将该多个第一字幕片段和该多个第二字幕片段按照各个字幕片段的字幕时间标签所指示的时间顺序,存储至该第一字幕数组和该第二字幕数组。
在一种可能的实现方式中,该分别获取第一数组和第二数组包括:
分别获取该第一字幕文件和该第二字幕文件;
获取存储该第一字幕文件的多个第一字幕片段的该第一字幕数组,对该第二字幕文件进行解析,得到该第二字幕文件的多个第二字幕片段,将该多个第二字幕片段按照各个第二字幕片段的字幕时间标签所指示的时间顺序,存储至该第二字幕数组。
在一种可能的实现方式中,该分别获取该第一字幕文件和该第二字幕文件包括:
接收重新上传的该第二字幕文件;
基于该第二字幕文件对应的多媒体标识,下载与该多媒体标识对应的该第一字幕文件。
在一种可能的实现方式中,该分别获取第一字幕数组和第二字幕数组之后,该方法还包括:
根据该第二字幕文件中各个第二字幕片段的字幕时间标签所指示的时间顺序,对该第二字幕数组中的各个第二字幕片段进行排序。
在一种可能的实现方式中,该基于该第二字幕数组和该目标索引数组,确定目标字幕数组之后,该方法还包括:
将该目标字幕数组推送至安全审核平台,通过该安全审核平台对该目标字幕数组进行审核。
图3是本申请实施例提供的一种字幕处理方法的流程图,参见图3,该方法包括:
301、服务器分别获取该第一字幕文件和该第二字幕文件。
需要说明的是,该第一字幕文件与第二字幕文件对应同一个视频文件,该第一字幕文件可以为已经过安全审核平台审核的字幕文件,该第二字幕文件可以为在第一字幕文件的基础上变更得到的、未经过安全审核平台审核的字幕文件。该第一字幕文件与第二字幕文件均可以为文本文件,可选地,该第一字幕文件和第二字幕文件还可以为其他类型的文件,本申请实施例对此不加以限定。
在一种可能的实现方式中,服务器可以接收运营方重新上传的该第二字幕文件,并基于该第二字幕文件对应的多媒体标识,在文件数据库中进行查询,从文件数据库中下载与该多媒体标识对应的该第一字幕文件。参见图4,图4是本申请实施例提供的一种字幕处理方法的处理流程示意图,上述过程可以参见该图中的步骤401至步骤403。可选地,服务器还可以采用其他方式进行第一字幕文件和第二字幕文件的获取,本申请实施例对此不加以限定。
其中,该第一字幕文件与第二字幕文件中包含的组成部分是相同的,均包含序号、字幕开始时间、字幕结束时间和字幕内容四个部分,但各个组成部分中的具体内容不同。字幕开始时间和字幕结束时间即可以作为字幕时间标签,用于标识对应的文本内容在终端,也即是视频播放器展示的时机。该第一字幕文件与第二字幕文件的格式也是相同的,一对字幕开始时间和字幕结束时间对应一段字幕内容,一段字幕的序号、字幕开始时间和字幕结束时间以及对应的字幕内容完结后,有一个空行,接着是下一段字幕的序号、字幕开始时间和字幕结束时间以及对应的字幕内容,各段字幕内容组合成为这个视频完整的字幕。例如,该字幕文件的格式可以如下所示:
1
00:01:36,760-->00:01:41,560
好久不见
2
00:01:44,230-->00:01:46,230
最近过得怎么样
3
00:01:47,230-->00:01:48,230
挺好的
4
00:01:59,990-->00:02:00,620
你呢
其中,以第一段字幕为例,第一段字幕中,1即为字幕的序号,00:01:36,760即为字幕开始时间,00:01:41,560即为字幕结束时间,字幕开始时间和字幕结束时间统称为字幕时间标签,“好久不见”即为对应的字幕内容,其他几段字幕中各个组成部分的确定方法与之同理,此处不再赘述。
需要说明的是,字幕制作人员可以根据实际情况,在第一字幕文件的基础上进行修改,得到变更后的第二字幕文件。对字幕文件的修改,可以包括字幕内容的增加、字幕内容的删除、字幕内容的修改、字幕时间标签的修改等等。例如,上述字幕文件变更前后的对比可以参见表1:
表1
上述表1展示了3种较为常见的字幕变更,分别为:
(1)在1分41秒560毫秒后面增加了一个字幕片段,序号为5。
(2)在序号3对应的字幕片段中,对字幕时间标签,也即是,字幕开始时间和字幕结束时间进行了修改,原来的字幕开始时间和字幕结束时间分别为00:01:47,230和00:01:48,230,修改后的字幕开始时间和字幕结束时间分别为00:01:48,230和00:01:49,230。
(3)对序号4的对应的字幕片段中的字幕内容进行了修改,将字幕内容从“你呢”修改成了“你最近怎么样”。
需要说明的是,安全审核人员通过安全审核平台对字幕进行审核时,仅需针对字幕内容进行审核,因此,在后续过程中,仅需关注对字幕内容的变更,而可以忽略对字幕时间标签及字幕序号的变更,可以减少服务器的处理压力,从而可以提高字幕处理速度。
302、服务器分别对该第一字幕文件和该第二字幕文件进行解析,得到该第一字幕文件的多个第一字幕片段和该第二字幕文件的多个第二字幕片段。
在一种可能的实现方式中,对于第一字幕文件和第二字幕文件中任一个字幕文件,以第一字幕文件为例,服务器可以根据第一字幕文件的格式,将第一字幕文件中一段字幕的字幕开始时间和字幕结束时间以及对应的字幕内容确定为一个字幕片段,进而将第一字幕文件的全文解析成一段段的字幕片段,得到第一字幕文件的多个第一字幕片段,对第二字幕文件的处理方式与之同理,此处不再赘述,进而可以得到第二字幕文件的多个第二字幕片段。参见图4,上述过程可以参见该图中的步骤404和步骤405。
其中,以步骤301中的字幕为例,将字幕开始时间为00:01:36,760,字幕结束时间为00:01:41,560,字幕内容为“好久不见”的一段字幕确定为一个字幕片段,将字幕开始时间为00:01:44,230,字幕结束时间为00:01:46,230,字幕内容为“最近过得怎么样”的一段字幕确定为一个字幕片段,以此类推,将步骤301中的字幕解析为四个字幕片段。
303、服务器分别将该多个第一字幕片段和该多个第二字幕片段按照各个字幕片段的字幕标签所指示的时间顺序,存储至第一字幕数组和第二字幕数组。
需要说明的是,该第一字幕数组包括按照字幕时间标签所指示的时间顺序排列的第一字幕文件的多个第一字幕片段,该第二字幕数组包括按照字幕时间标签所指示的时间顺序排列的第二字幕文件的多个第二字幕片段。
在一种可能的实现方式中,服务器将解析得到的多个字幕片段按照字幕时间标签所指示的时间顺序存储至字幕数组后,服务器可以根据已存储的多个字幕片段字幕时间标签所指示的时间顺序,对第二字幕数组中各个第二字幕片段的序号与对应的字幕时间标签进行检测,当检测到各个第二字幕片段的字幕时间标签所指示的顺序与序号不对应时,服务器可以根据该第二字幕文件中各个第二字幕片段的字幕时间标签所指示的时间顺序,重新对该第二字幕文件中的各个第二字幕片段进行排序。例如,服务器可以第二字幕数组中各个第二字幕片段与对应的字幕时间标签中的字幕开始时间进行检测,当检测到各个第二字幕片段的字幕开始时间所指示的顺序与序号不对应时,服务器可以根据该第二字幕文件中各个第二字幕片段的字幕开始时间所指示的时间顺序,对该第二字幕文件中的各个第二字幕片段进行排序。
由于运营方在上传第二字幕文件时,各段字幕的序号可能是混乱无序的,通过对第二字幕数组中各个第二字幕片段与对应的字幕时间标签进行检测,可以及时发现各段字幕的序号混乱无序的情况,进而可以按照各个第二字幕片段字幕时间标签所指示的顺序,对第二字幕文件中的各个第二字幕片段进行排序,可以保证第二字幕数组中存储的各个第二字幕片段均是按照字幕时间标签所指示的时间顺序来进行存储的,方便后续进行比较时,可以按照各个字幕片段的字幕时间标签所指示的时间顺序,来依次进行比较。
其中,存储多个字幕片段的字幕数组的结构可以参见图5,图5是本申请实施例提供的一种字幕数组的结构示意图,对于步骤301中作为例子的字幕文件,其分段得到的多个字幕片段存储至数组后如图中的501至504所示。
需要说明的是,上述步骤302至步骤303可以称作对字幕文件进行预处理的过程,通过对字幕文件进行预处理,可以将一个字幕序号以及对应的字幕开始时间、字幕结束时间和字幕内容组成一个字幕片段,存储到一个结构体中,进而将各个字幕片段按照字幕序号的顺序存储到一个数组中,得到存储字幕文件的各个字幕片段的数组,方便后续对各个字幕片段进行比较,以便确定变更的字幕,提高字幕处理效率。
304、服务器将该第二字幕数组中的任一个第二字幕片段,与该第一字幕数组中的各个第一字幕片段进行比较。
需要说明的是,在将第二字幕数组中的任一个第二字幕片段,与第一字幕数组中的各个第一字幕片段进行比较时,可以仅对各个字幕片段中的字幕内容进行比较,而无需对字幕片段的序号、字幕开始时间和字幕结束时间进行比较。通过仅对每个字幕片段中的字幕内容进行比较,可以减少服务器的处理压力,提高字幕处理速度。
在一种可能的实现方式中,对于第二字幕数组中的任一个第二字幕片段,服务器可以将该第二字幕片段的字幕内容,与第一字幕数组中序号为1的第一字幕片段的字幕内容进行比较,若该第二字幕片段的字幕内容与序号为1的第一字幕片段的字幕内容相同,则执行步骤305,若该第二字幕片段的字幕内容与序号为1的第一字幕片段的字幕内容不相同,则将该第二字幕片段的字幕内容,与第一字幕数组中序号为2的第一字幕片段的字幕内容进行比较,以此类推,直到确定出该第二字幕片段的字幕内容相同的第一字幕片段,或将该第二字幕片段的字幕内容与第一字幕数组中的各个第一字幕片段均比较完成。
其中,字幕序号可以称为subtitle_idx,字幕时间标签,也即是,字幕开始时间和字幕结束时间可以分别称为subtitle_start和subtitle_end,字幕内容可以称为subtitle_text,在进行比较时,可以仅针对subtitle_text进行比较。
305、若该第一字幕数组中存在与该任一个第二字幕片段对应的字幕内容相同的第一字幕片段,则服务器将该任一个第二字幕片段确定为该最长公共子序列包含的字幕片段,直至该第二字幕数组中的各个第二字幕片段均比较完成,得到该最长公共子序列。
需要说明的是,对两个字幕片段的字幕内容进行比较时,若N[i].subtitle_text==O[j].subtitle_text,则服务器可以确定该第一字幕数组中存在与该任一个第二字幕片段对应的字幕内容相同的第一字幕片段时,进而服务器可以将该任一个第二字幕片段确定为该最长公共子序列包含的字幕片段,当该第一字幕数组中不存在与该任一个第二字幕片段对应的字幕内容相同的第一字幕片段时,该任一个第二字幕片段就不属于该最长公共子序列包含的字幕片段。其中,N[i].subtitle_text可以代表任一个第一字幕片段的字幕内容,i可以代表该任一个第一字幕片段的序号,O[j].subtitle_text可以代表任一个第二字幕片段的字幕内容,j可以代表该任一个第二字幕片段的序号,i和j均可以为大于0的任意整数,本申请实施例对i和j的取值不加以限定。
其中,最长公共子序列(Longest Common S equence,LCS)就是求出两个序列中含有相同元素最长的子序列。在本申请实施例中,通过对两个字幕片段的字幕内容进行比较确定出的最长公共子序列,可以为第一字幕数组与第二字幕数组中字幕内容相同的字幕片段。
需要说明的是,图6是本申请实施例提供的一种确定最长公共子序列的方法示意图,参见图6,该图中标识有序列1和序列2两个序列,序列1中包含A元素601、C元素602、D元素603、E元素604这四个元素,序列2中包含A元素605、B元素606、C元素607、D元素608、E1元素609这五个元素,则序列1和序列2的最长公共子序列为ACD。如果把序列1作为变更前的序列,序列2作为变更后的序列,则序列2变更的元素有B和E1,其中B是新增加的元素,E1是基于E修改后的得到的元素。对于字幕数组来说,若序列1为第一字幕数组,序列2为第二字幕数组,则序列1中的四个元素可以代表第一字幕数组中的四个第一字幕片段,序列2中的五个元素可以代表第二字幕数组中的五个第二字幕片段,第一字幕数组与第二字幕数组之间字幕内容相同的字幕片段,也即是,最长公共子序列中的字幕片段分别为A、C、D,此外,B是第二字幕数组相对于第一字幕数组新增加的字幕片段,E1是基于第一字幕数组的字幕片段E修改后的得到的第二字幕数组中的字幕片段。
306、服务器基于该最长公共子序列中字幕片段的在该第二字幕数组中的存储位置,确定目标索引数组,该目标索引数组包括该最长公共子序列中多个字幕片段在该第二字幕数组中的存储位置。
在一种可能的实现方式中,服务器可以将确定出的最长公共子序列中字幕片段在第二字幕数组中的存储位置,作为索引,存储至目标索引数组中,进而得到包括该最长公共子序列中多个字幕片段在第二字幕数组中的存储位置的目标索引数组。上述步骤305至步骤306对应的过程可以参见图4中的步骤406至步骤408。
307、服务器根据该目标索引数组中的存储位置所指示的多个字幕片段在该第二字幕数组中的存储位置,获取目标字幕片段在该第二字幕数组中的存储位置,该目标字幕片段为该第二字幕数组中除该目标索引数组中的存储位置所指示的多个字幕片段外的字幕片段。
在一种可能的实现方式中,服务器可以基于目标索引数组中的存储位置所指示的多个字幕片段在第二字幕数组中的存储位置,以及第二字幕数组中的所有存储位置,将第二字幕数组中除目标索引数组包括的存储位置之外的存储位置存储的第二字幕片段,确定为目标字幕片段,进而可以获取目标字幕片段在第二字幕数组的存储位置。
308、服务器根据该目标字幕片段在该第二字幕数组中的存储位置,从该第二字幕数组中获取该目标字幕片段。
在一种可能的实现方式中,服务器可以根据目标字幕片段在第二字幕数组的存储位置,从目标字幕数组中获取该目标字幕片段的字幕内容。
需要说明的是,上述过程仅获取目标字幕片段的字幕内容,从而可以使通过下述步骤309确定出的目标字幕数组中仅包括各个目标字幕片段的字幕内容,而不包括字幕序号及字幕时间标签这些无需审核的内容,可以有效减少服务器与安全审核平台之间所传输的文本数据量,提高传输速度,进而可以提高字幕处理速度。
309、服务器将该目标字幕片段存储至该目标字幕数组,该目标字幕数组包括第一字幕数组和第二字幕数组之间的差异字幕片段。
需要说明的是,服务器在确定出该目标字幕数组后,可以基于第二字幕数组与第一字幕数组中各个字幕片段的字幕内容,自行检测出各个差异字幕片段中修改的内容,并在目标字幕数组中对修改的内容自动进行标注,以便后续安全审核人员直接根据标注进行审核,未标注的部分即可不用进行审核,减少字幕审核人员的工作量,提高字幕审核的速度。
其中,该步骤对应的过程可以参见图4中的步骤409。此外,对于上述步骤304至步骤307,服务器还可以通过哈希表,将各个第一字幕片段和各个第二字幕片段的字幕时间标签和字幕内容记录到哈希表中,进而通过查找任一个字幕片段是否在哈希表中已存在,来确定该任一个字幕片段是否为差异字幕片段,进而确定目标字幕,也即是第一字幕文件和第二字幕文件之间更改的字幕,本申请实施例对具体采用哪种方式来确定第一字幕文件和第二字幕文件之间更改的字幕不加以限定。
需要说明的是,服务器在基于该第二字幕数组和该目标索引数组,确定目标字幕数组之后,可以将该目标字幕数组推送至安全审核平台,通过该安全审核平台对该目标字幕数组进行审核。在其他可能的实现方式中,若该目标字幕片段仅有一个,则服务器可以直接将该目标字幕片段以文件的形式推送至安全审核平台,通过该安全审核平台对该目标字幕数片段进行审核,而无需将该目标字幕片段存储至目标字幕数组再进行推送。通过直接将该目标字幕片段以文件的形式推送至安全审核平台,服务器无需再将该目标字幕片段存储至目标字幕数组,减少了不必要的操作,可以提高字幕处理的速度。
其中,安全审核平台在接收到该目标字幕数组后,可以对该目标字幕数组中的内容进行展示,方便安全审核人员来对目标字幕数组进行审核。由于目标字幕数组中仅包括第一字幕文件和第二字幕文件中字幕内容不同的各个字幕片段的字幕内容,因而安全审核人员仅需通过安全审核平台来对这些字幕内容进行审核,无需审核其他内容,极大地减少了字幕审核人员的工作量,提高了字幕审核的速度。
需要说明的是,在其他可能的实现方式中,运营方的终端也可以根据运营人员上传到其中的第二字幕文件,以及基于该第二字幕文件对应的多媒体标识获取到第一字幕文件,来进行差异字幕片段的确定,具体过程与上述步骤301至步骤309同理,此处不再赘述。
本申请实施例提供的方案,通过对比第一字幕数组的多个第一字幕片段和第二字幕数组的多个第二字幕片段,来自动确定出数组之间的公共子序列,而由于公共子序列能够用于表示数组之间哪些字幕片段相同,因此可以基于公共子序列和第二字幕文件自动确定出变更的字幕片段,使得第n次(n>1)提交字幕的时候,无需把字幕全文推送到安全审核平台进行审核,也无需字幕制作人员对变更的字幕进行人工标注,即可以保证安全审核人员无需对重复的内容进行重复审核,提高了字幕处理的效率。此外,本申请实施例提供的方案,能过滤字幕时间标签和序号的变更,只识别出字幕内容的变更,进而可以更精准地将更改的字幕内容推送至安全审核平台,极大减少了服务器与安全审核平台之间所传输的文本数据量,而且,服务器与安全审核平台之间在进行字幕文件的传输时,可能会经过其他终端或服务器的转发,其他终端或服务器也可以对转发的字幕文件进行存储,由于本申请实施例中仅需对包含差异字幕片段的目标字幕数组进行传输,该目标字幕数组的数据量较小,因而在涉及到其他终端或服务器进行转发的情况下,存储该目标字幕数组不会过度占用其他终端或服务器的存储资源,可以避免传输过程中多地存储导致的容量浪费。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
图7是本申请实施例提供的一种字幕处理装置的结构示意图,参见图7,该装置包括:
字幕数组获取模块701,用于分别获取第一字幕数组和第二字幕数组,该第一字幕数组包括按照字幕时间标签所指示的时间顺序排列的第一字幕文件的多个第一字幕片段,该第二字幕数组包括按照字幕时间标签所指示的时间顺序排列的第二字幕文件的多个第二字幕片段;
序列确定模块702,用于确定该第一字幕数组和该第二字幕数组之间的最长公共子序列;
索引数组确定模块703,用于基于该最长公共子序列中字幕片段在该第二字幕数组中的存储位置,确定目标索引数组,该目标索引数组包括该最长公共子序列中多个字幕片段在该第二字幕数组中的存储位置;
字幕数组确定模块704,用于基于该第二字幕数组和该目标索引数组,确定目标字幕数组,该目标字幕数组包括第一字幕数组和第二字幕数组之间的差异字幕片段。
本申请实施例提供的装置,通过分别获取包括第一字幕文件的多个第一字幕片段的第一字幕数组和包括第二字幕文件的多个第二字幕片段的第二字幕数组,确定第一字幕数组和第二字幕数组之间的最长公共子序列,基于最长公共子序列中字幕片段在第二字幕数组中的存储位置,确定目标索引数组,基于第二字幕数组和目标索引数组,确定包括第一字幕数组和第二字幕数组之间的差异字幕片段的目标字幕数组。本申请通过对比第一字幕数组的多个第一字幕片段和第二字幕数组的多个第二字幕片段,来自动确定出数组之间的公共子序列,而由于公共子序列能够用于表示数组之间哪些字幕片段相同,因此可以基于公共子序列和第二字幕文件自动确定出变更的字幕片段,无需字幕制作人员对变更的字幕进行人工标注,提高了字幕处理的效率。
在一种可能的实现方式中,该序列确定模块702,用于将该第二字幕数组中的任一个第二字幕片段,与该第一字幕数组中的各个第一字幕片段进行比较,若该第一字幕数组中存在与该任一个第二字幕片段对应的字幕内容相同的第一字幕片段,则将该任一个第二字幕片段确定为该最长公共子序列包含的字幕片段,直至该第二字幕数组中的各个第二字幕片段均比较完成,得到该最长公共子序列。
在一种可能的实现方式中,该字幕数组确定模块704,用于根据该目标索引数组中的存储位置所指示的多个字幕片段在该第二字幕数组中的存储位置,获取目标字幕片段在该第二字幕数组中的存储位置,该目标字幕片段为该第二字幕数组中除该目标索引数组中的存储位置所指示的多个字幕片段外的字幕片段,根据该目标字幕片段在该第二字幕数组中的存储位置,从该第二字幕数组中获取该目标字幕片段,将该目标字幕片段存储至该目标字幕数组。
在一种可能的实现方式中,该字幕数组获取模块701,用于分别获取该第一字幕文件和该第二字幕文件,分别对该第一字幕文件和该第二字幕文件进行解析,得到该第一字幕文件的多个第一字幕片段和该第二字幕文件的多个第二字幕片段,分别将该多个第一字幕片段和该多个第二字幕片段按照各个字幕片段的字幕时间标签所指示的时间顺序,存储至该第一字幕数组和该第二字幕数组。
在一种可能的实现方式中,该字幕数组获取模块701,用于分别获取该第一字幕文件和该第二字幕文件,获取存储该第一字幕文件的多个第一字幕片段的该第一字幕数组,对该第二字幕文件进行解析,得到该第二字幕文件的多个第二字幕片段,将该多个第二字幕片段按照各个第二字幕片段的字幕时间标签所指示的时间顺序,存储至该第二字幕数组。
在一种可能的实现方式中,该字幕数组获取模块701,用于接收重新上传的该第二字幕文件,基于该第二字幕文件对应的多媒体标识,下载与该多媒体标识对应的该第一字幕文件。
在一种可能的实现方式中,该装置还包括:
排序模块,用于根据该第二字幕文件中各个第二字幕片段的字幕时间标签所指示的时间顺序,对该第二字幕数组中的各个第二字幕片段进行排序。
在一种可能的实现方式中,该装置还包括:
推送模块,用于将该目标字幕数组推送至安全审核平台,通过该安全审核平台对该目标字幕数组进行审核。
需要说明的是:上述实施例提供的字幕处理装置在对字幕进行处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的字幕处理装置与字幕处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图8是本申请实施例提供的一种服务器的结构示意图,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)801和一个或多个的存储器802,其中,该一个或多个存储器802中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器801加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器800还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器800还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括程序代码的存储器,上述程序代码可由处理器执行以完成上述实施例中的字幕处理方法。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,包括一条或多条程序代码,该一条或多条程序代码可以由服务器的处理器执行,以完成上述实施例中提供的数据处理方法的方法步骤。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来程序代码相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种字幕处理方法,其特征在于,所述方法包括:
分别获取第一字幕数组和第二字幕数组,所述第一字幕数组包括按照字幕时间标签所指示的时间顺序排列的第一字幕文件的多个第一字幕片段,所述第二字幕数组包括按照字幕时间标签所指示的时间顺序排列的第二字幕文件的多个第二字幕片段,所述第二字幕文件是在所述第一字幕文件的基础上变更得到的字幕文件;
确定所述第一字幕数组和所述第二字幕数组之间的最长公共子序列,所述最长公共子序列是指所述第一字幕数组和所述第二字幕数组中字幕内容相同的字幕片段;
基于所述最长公共子序列中字幕片段在所述第二字幕数组中的存储位置,确定目标索引数组,所述目标索引数组包括所述最长公共子序列中多个字幕片段在所述第二字幕数组中的存储位置;
基于所述第二字幕数组和所述目标索引数组,确定目标字幕数组,所述目标字幕数组包括第一字幕数组和第二字幕数组之间的差异字幕片段;
基于所述差异字幕片段的字幕内容,在所述目标字幕数组中对所述差异字幕片段的修改字幕内容进行标注。
2.根据权利要求1所述的方法,其特征在于,所述确定所述第一字幕数组和所述第二字幕数组之间的最长公共子序列包括:
将所述第二字幕数组中的任一个第二字幕片段,与所述第一字幕数组中的各个第一字幕片段进行比较;
若所述第一字幕数组中存在与所述任一个第二字幕片段对应的字幕内容相同的第一字幕片段,则将所述任一个第二字幕片段确定为所述最长公共子序列包含的字幕片段,直至所述第二字幕数组中的各个第二字幕片段均比较完成,得到所述最长公共子序列。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第二字幕数组和所述目标索引数组,确定目标字幕数组包括:
根据所述目标索引数组中的存储位置所指示的多个字幕片段在所述第二字幕数组中的存储位置,获取目标字幕片段在所述第二字幕数组中的存储位置,所述目标字幕片段为所述第二字幕数组中除所述目标索引数组中的存储位置所指示的多个字幕片段外的字幕片段;
根据所述目标字幕片段在所述第二字幕数组中的存储位置,从所述第二字幕数组中获取所述目标字幕片段;
将所述目标字幕片段存储至所述目标字幕数组。
4.根据权利要求1所述的方法,其特征在于,所述分别获取第一字幕数组和第二字幕数组包括:
分别获取所述第一字幕文件和所述第二字幕文件;
分别对所述第一字幕文件和所述第二字幕文件进行解析,得到所述第一字幕文件的多个第一字幕片段和所述第二字幕文件的多个第二字幕片段;
分别将所述多个第一字幕片段和所述多个第二字幕片段按照各个字幕片段的字幕时间标签所指示的时间顺序,存储至所述第一字幕数组和所述第二字幕数组。
5.根据权利要求1所述的方法,其特征在于,所述分别获取第一字幕数组和第二字幕数组包括:
分别获取所述第一字幕文件和所述第二字幕文件;
获取存储所述第一字幕文件的多个第一字幕片段的所述第一字幕数组;
对所述第二字幕文件进行解析,得到所述第二字幕文件的多个第二字幕片段;
将所述多个第二字幕片段按照各个第二字幕片段的字幕时间标签所指示的时间顺序,存储至所述第二字幕数组。
6.根据权利要求4或5所述的方法,其特征在于,所述分别获取所述第一字幕文件和所述第二字幕文件包括:
接收重新上传的所述第二字幕文件;
基于所述第二字幕文件对应的多媒体标识,下载与所述多媒体标识对应的所述第一字幕文件。
7.根据权利要求1所述的方法,其特征在于,所述分别获取第一字幕数组和第二字幕数组之后,所述方法还包括:
根据所述第二字幕文件中各个第二字幕片段的字幕时间标签所指示的时间顺序,对所述第二字幕数组中的各个第二字幕片段进行排序。
8.一种字幕处理装置,其特征在于,所述装置包括:
字幕数组获取模块,用于分别获取第一字幕数组和第二字幕数组,所述第一字幕数组包括按照字幕时间标签所指示的时间顺序排列的第一字幕文件的多个第一字幕片段,所述第二字幕数组包括按照字幕时间标签所指示的时间顺序排列的第二字幕文件的多个第二字幕片段,所述第二字幕文件是在所述第一字幕文件的基础上变更得到的字幕文件;
序列确定模块,用于确定所述第一字幕数组和所述第二字幕数组之间的最长公共子序列,所述最长公共子序列是指所述第一字幕数组和所述第二字幕数组中字幕内容相同的字幕片段;
索引数组确定模块,用于基于所述最长公共子序列中字幕片段在所述第二字幕数组中的存储位置,确定目标索引数组,所述目标索引数组包括所述最长公共子序列中多个字幕片段在所述第二字幕数组中的存储位置;
字幕数组确定模块,用于基于所述第二字幕数组和所述目标索引数组,确定目标字幕数组,所述目标字幕数组包括第一字幕数组和第二字幕数组之间的差异字幕片段;基于所述差异字幕片段的字幕内容,在所述目标字幕数组中对所述差异字幕片段的修改字幕内容进行标注。
9.一种服务器,其特征在于,所述服务器包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求7任一项所述的字幕处理方法所执行的操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述程序代码由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的字幕处理方法所执行的操作。
CN202010503884.8A 2020-06-05 2020-06-05 字幕处理方法、装置、服务器及计算机可读存储介质 Active CN112752165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010503884.8A CN112752165B (zh) 2020-06-05 2020-06-05 字幕处理方法、装置、服务器及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010503884.8A CN112752165B (zh) 2020-06-05 2020-06-05 字幕处理方法、装置、服务器及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112752165A CN112752165A (zh) 2021-05-04
CN112752165B true CN112752165B (zh) 2023-09-01

Family

ID=75645230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010503884.8A Active CN112752165B (zh) 2020-06-05 2020-06-05 字幕处理方法、装置、服务器及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112752165B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115442656B (zh) * 2021-06-04 2023-08-15 中国移动通信集团浙江有限公司 视频片头片尾自动检测方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102065237A (zh) * 2009-11-13 2011-05-18 新奥特(北京)视频技术有限公司 一种方便处理字幕文件的字幕机
CN106375684A (zh) * 2016-10-10 2017-02-01 北京译言协力传媒科技有限公司 字幕协同编辑设备、字幕协同编辑系统和方法
CN206136100U (zh) * 2016-10-10 2017-04-26 北京译言协力传媒科技有限公司 字幕协同编辑设备和字幕协同编辑系统
CN106973333A (zh) * 2017-03-27 2017-07-21 山东浪潮商用系统有限公司 基于比较的视频字幕错别字词纠错的方法及装置
CN109413475A (zh) * 2017-05-09 2019-03-01 北京嘀嘀无限科技发展有限公司 一种视频中字幕的调整方法、装置和服务器
CN109862422A (zh) * 2019-02-28 2019-06-07 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机可读存储介质和计算机设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101155524B1 (ko) * 2007-03-07 2012-06-19 삼성전자주식회사 텍스트 기반 자막 변경 방법 및 장치
US8707381B2 (en) * 2009-09-22 2014-04-22 Caption Colorado L.L.C. Caption and/or metadata synchronization for replay of previously or simultaneously recorded live programs
TWI543612B (zh) * 2014-09-18 2016-07-21 晨星半導體股份有限公司 影片字幕處理裝置與方法,以及解析影片字幕之方法
US10419828B2 (en) * 2018-01-08 2019-09-17 Netflix, Inc. Modifying subtitles to reflect changes to audiovisual programs

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102065237A (zh) * 2009-11-13 2011-05-18 新奥特(北京)视频技术有限公司 一种方便处理字幕文件的字幕机
CN106375684A (zh) * 2016-10-10 2017-02-01 北京译言协力传媒科技有限公司 字幕协同编辑设备、字幕协同编辑系统和方法
CN206136100U (zh) * 2016-10-10 2017-04-26 北京译言协力传媒科技有限公司 字幕协同编辑设备和字幕协同编辑系统
CN106973333A (zh) * 2017-03-27 2017-07-21 山东浪潮商用系统有限公司 基于比较的视频字幕错别字词纠错的方法及装置
CN109413475A (zh) * 2017-05-09 2019-03-01 北京嘀嘀无限科技发展有限公司 一种视频中字幕的调整方法、装置和服务器
CN109862422A (zh) * 2019-02-28 2019-06-07 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机可读存储介质和计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
支持多种文字的视频字幕叠加工具设计;王亚;褚晶辉;刘子玉;吕卫;;信息技术(09);全文 *

Also Published As

Publication number Publication date
CN112752165A (zh) 2021-05-04

Similar Documents

Publication Publication Date Title
US10643610B2 (en) Voice interaction based method and apparatus for generating multimedia playlist
CN103390258B (zh) 基于信息码的实验室物品信息管理系统
US11070851B2 (en) System and method for providing image-based video service
CN109756760B (zh) 视频标签的生成方法、装置及服务器
US20150341771A1 (en) Hotspot aggregation method and device
WO2021237467A1 (zh) 文件上传方法、文件下载方法和文件管理装置
US20160306811A1 (en) Method and system for creating inverted index file of video resource
US11392606B2 (en) System and method for converting user data from disparate sources to bitmap data
CN101158981A (zh) 一种对下载资源进行分类的方法、系统和装置
CN112685433A (zh) 元数据更新方法、装置、电子设备及计算机可读存储介质
CN111368141A (zh) 视频标签的扩展方法、装置、计算机设备和存储介质
CN112445997A (zh) 一种提取cms多版本识别特征规则的方法及装置
US9870422B2 (en) Natural language search
CN109271545A (zh) 一种特征检索方法及装置、存储介质和计算机设备
CN112752165B (zh) 字幕处理方法、装置、服务器及计算机可读存储介质
CN109299352B (zh) 搜索引擎中网站数据的更新方法、装置和搜索引擎
CN109116718B (zh) 设置闹钟的方法及设备
CN112307318A (zh) 一种内容发布方法、系统及装置
CN114066533A (zh) 产品推荐方法、装置、电子设备及存储介质
CN114003629A (zh) 一种高效预编译型缓存数据管理方法、装置、设备和介质
CN111782798A (zh) 摘要生成方法、装置和设备以及项目管理方法
CN107729486B (zh) 一种视频搜索方法及装置
CN111737443A (zh) 答案文本的处理方法和装置、关键文本的确定方法
CN108268545B (zh) 一种分级的用户标签库的创建的方法和装置
CN112734502A (zh) 一种多媒体信息定向投放的测试方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant