CN113886612A - 一种多媒体浏览方法、装置、设备及介质 - Google Patents

一种多媒体浏览方法、装置、设备及介质 Download PDF

Info

Publication number
CN113886612A
CN113886612A CN202011296617.4A CN202011296617A CN113886612A CN 113886612 A CN113886612 A CN 113886612A CN 202011296617 A CN202011296617 A CN 202011296617A CN 113886612 A CN113886612 A CN 113886612A
Authority
CN
China
Prior art keywords
multimedia
target
segment
subtitle
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011296617.4A
Other languages
English (en)
Inventor
盛碧星
李璋毅
张升辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202011296617.4A priority Critical patent/CN113886612A/zh
Priority to PCT/CN2021/130998 priority patent/WO2022105760A1/zh
Priority to US18/037,288 priority patent/US20240007718A1/en
Publication of CN113886612A publication Critical patent/CN113886612A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开实施例涉及一种多媒体浏览方法、装置、设备及介质,其中该方法包括:接收目标多媒体的字幕浏览请求;获取目标多媒体的至少两个多媒体片段以及多媒体片段对应的字幕片段,其中,多媒体片段对应至少一个字幕片段;在内容展示界面中的第一展示区域展示多媒体片段,在第二展示区域展示多媒体片段对应的字幕片段。采用上述技术方案,可以实现多媒体的多个多媒体片段和对应的多个字幕片段在不同的展示区域分别进行完整展示,使得用户在不方便进行多媒体播放的场景下,可以快速浏览多媒体的字幕内容,满足了用户在特殊场景下对多媒体内容的阅读需求,提高了用户对多媒体的内容浏览体验效果。

Description

一种多媒体浏览方法、装置、设备及介质
技术领域
本公开涉及多媒体技术领域,尤其涉及一种多媒体浏览方法、装置、设备及介质。
背景技术
随着智能设备和多媒体技术的不断发展,在智能设备中浏览多媒体越来越成为人们生活中不可或缺的一部分。
多媒体的播放通常受场景的局限。例如,在会议中或者在工作中,往往不适于播放多媒体。然而,在上述场景下,往往同时需要了解多媒体的内容。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种多媒体浏览方法、装置、设备及介质。
本公开实施例提供了一种多媒体浏览方法,所述方法包括:
接收目标多媒体的字幕浏览请求;
获取所述目标多媒体的至少两个多媒体片段以及所述多媒体片段对应的字幕片段,其中,所述多媒体片段对应至少一个所述字幕片段;
在内容展示界面中的第一展示区域展示所述多媒体片段,在第二展示区域展示所述多媒体片段对应的字幕片段。
本公开实施例还提供了一种多媒体浏览装置,所述装置包括:
浏览请求接收模块,用于接收目标多媒体的字幕浏览请求;
内容获取模块,用于获取所述目标多媒体的至少两个多媒体片段以及所述多媒体片段对应的字幕片段,其中,所述多媒体片段对应至少一个所述字幕片段;
内容展示模块,用于在内容展示界面中的第一展示区域展示所述多媒体片段,在第二展示区域展示所述多媒体片段对应的字幕片段。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的多媒体浏览方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的多媒体浏览方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:本公开实施例提供的多媒体浏览方案,接收目标多媒体的字幕浏览请求;获取目标多媒体的至少两个多媒体片段以及多媒体片段对应的字幕片段,其中,多媒体片段对应至少一个字幕片段;在内容展示界面中的第一展示区域展示多媒体片段,在第二展示区域展示多媒体片段对应的字幕片段。采用上述技术方案,可以实现多媒体的多个多媒体片段和对应的多个字幕片段在不同的展示区域分别进行完整展示,使得用户在不方便进行多媒体播放的场景下,可以快速浏览多媒体的字幕内容,满足了用户在特殊场景下对多媒体内容的阅读需求,提高了用户对多媒体的内容浏览体验效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种多媒体浏览方法的流程示意图;
图2为本公开实施例提供的一种内容展示界面的示意图;
图3为本公开实施例提供的另一种内容展示界面的示意图;
图4为本公开实施例提供的再一种内容展示界面的示意图;
图5为本公开实施例提供的一种多媒体浏览装置的结构示意图;
图6为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1为本公开实施例提供的一种多媒体浏览方法的流程示意图,该方法可以由多媒体浏览装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法包括:
步骤101、接收目标多媒体的字幕浏览请求。
其中,目标多媒体可以为用户当前具有浏览需求的一个多媒体,本公开实施例对目标多媒体的类型、来源和格式等不作限定,目标多媒体可以包括音频和/或视频。字幕浏览请求可以理解为一种用户在特定场景下不方便进行多媒体播放时,需要在多媒体的基础上浏览该多媒体的整体字幕的请求,例如在会议场景下,需要浏览一个多媒体的字幕,以了解该多媒体的整体内容。
本公开实施例中,客户端可以在目标多媒体的多媒体展示页面,接收目标多媒体的字幕浏览请求,具体接收的方式不作限定,例如若检测到用户对多媒体展示页面上设定按钮的触发,可以接收到目标多媒体的字幕浏览请求,设定按钮的在多媒体展示页面上的具体位置不作限定。
步骤102、获取目标多媒体的至少两个多媒体片段以及多媒体片段对应的字幕片段,其中,多媒体片段对应至少一个字幕片段。
其中,多媒体片段是指对目标多媒体进行拆分得到的片段,字幕片段是指对目标多媒体识别得到的字幕内容拆分得到的片段,多媒体片段对应至少一个字幕片段,也即一个多媒体片段可以与一个字幕片段相对应,也可以与多个字幕片段相对应。
本公开实施例中,在执行步骤102之前,多媒体浏览方法还可以包括:对目标多媒体进行语音识别获取字幕内容;对字幕内容进行语义拆分,确定至少两个字幕片段。可选的,多媒体浏览方法还包括:根据字幕片段对应的时间戳对目标多媒体进行拆分,确定至少两个多媒体片段。
对目标多媒体采用语音识别(Automatic Speech Recognition,ASR)技术,可以识别目标多媒体中的语音,并将语音转换为字幕内容,本公开实施例中对具体的语音识别技术不作限定,例如可以采用随机模型法或人工神经网络的方法等。之后可以对字幕内容进行语义拆分,将字幕内容拆分为至少两个字幕片段,每个字幕片段中可以包括一部分字幕内容,字幕片段的数量也不限。确定字幕片段之后,由于每个字幕片段均对应一个目标多媒体的时间戳,基于每个字幕片段对应的时间戳可以对目标多媒体进行拆分,确定相对应的至少两个多媒体片段。
可选的,多媒体浏览方法还包括:按照设定规则对目标多媒体进行拆分,确定至少两个多媒体片段;根据多媒体片段确定对应的至少两个字幕片段。其中,设定规则可以根据实际情况进行设定,具体不限,例如设定规则可以包括按照时间或按照多媒体中的场景。对目标多媒体还可以按照设定规则进行拆分,将目标多媒体拆分为至少两个多媒体片段,之后基于每个多媒体片段的时间戳可以对目标多媒体语音识别的字幕内容进行拆分,或者,对每个多媒体片段进行语音识别,可以得到对应的字幕片段。
本公开实施例中,获取到目标多媒体的字幕浏览请求之后,可以获取预先处理得到的目标多媒体的多个多媒体片段以及对应的多个字幕片段,也可以实时对目标多媒体进行处理,得到多个多媒体片段以及对应的多个字幕片段。可选的,上述字幕片段和多媒体片段的确定也可以由服务端预先处理,客户端接收到字幕浏览请求并反馈给服务端时,服务端将字幕片段和多媒体片段返回给客户端,具体不限。
步骤103、在内容展示界面中的第一展示区域展示多媒体片段,在第二展示区域展示多媒体片段对应的字幕片段。
其中,内容展示界面是指对目标多媒体的多媒体片段以及字幕片段进行展示的一个界面,第一展示区域为内容展示界面中设置的用于展示多媒体片段的区域,第二展示区域为内容展示界面中设置的用于展示字幕片段的区域,第一展示区域和第二展示区域的具体位置不作限定,例如第一展示区域和第二展示区域可以水平对齐或竖直对齐等。
获取到目标多媒体的至少两个多媒体片段以及对应的至少两个字幕片段之后,可以在内容展示界面中的第一展示区域将各多媒体片段进行展示,并在第二展示区域将各字幕片段进行展示。
可选的,第一展示区域中可以设置多个多媒体展示框,每个多媒体展示框用于展示一个多媒体片段,第二展示区域中可以设置多个字幕展示框,每个字幕展示框用于展示一个字幕片段,一个多媒体展示框的中心可以与一个字幕展示框的中心对齐。
示例性的,图2为本公开实施例提供的一种内容展示界面的示意图,如图2所示,示例性的展示了一个内容展示界面10,该内容展示界面10中设置有第一展示区域11和第二展示区域12,第一展示区域11中包括多个多媒体展示框,用于展示多个多媒体片段,图中以视频片段为例,图中示出了两个多媒体展示框,分别展示了时间范围在“00:00-00:11”以及“00:12-00:23”两个视频片段,第二展示区域12中包括多个字幕展示框,用于展示多个字幕片段,图中示出了两个字幕展示框。图2中一个多媒体片段的多媒体展示框以及该多媒体片段的字幕展示框中心对齐展示,有利于用户对照浏览。图中内容展示界面10中还可以展示多媒体标题“2020年9月A公司新闻发布会”。
本公开实施例提供的多媒体浏览方案,接收目标多媒体的字幕浏览请求;获取目标多媒体的至少两个多媒体片段以及多媒体片段对应的字幕片段,其中,多媒体片段对应至少一个字幕片段;在内容展示界面中的第一展示区域展示多媒体片段,在第二展示区域展示多媒体片段对应的字幕片段。采用上述技术方案,可以实现多媒体的多个多媒体片段和对应的多个字幕片段在不同的展示区域分别进行完整展示,使得用户在不方便进行多媒体播放的场景下,可以快速浏览多媒体的字幕内容,满足了用户在特殊场景下对多媒体内容的阅读需求,提高了用户对多媒体的内容浏览体验效果。
在一些实施例中,多媒体浏览方法还可以包括:确定字幕片段中包括的各字幕语句的时间戳,其中,字幕语句中包括至少一个字或词。字幕内容属于结构化文本,包括段、句和词三层结构,字幕语句是字幕内容中的句,一个字幕语句可以包括至少一个字或词。由于字幕片段是通过对目标多媒体进行语音识别得到的,字幕片段中每个字幕语句均具有对应的语音语句,每个语音语句均对应于目标多媒体中的一个时间戳,基于字幕语句、语音语句和目标多媒体的播放时间之间的对应关系,可以确定字幕片段中包括的每个字幕语句的时间戳。这样设置的好处在于,通过确定字幕片段中每个字幕语句的时间戳,可以为后续字幕与多媒体之间的联动交互做好准备,有利于快速实现联动交互。
在一些实施例中,多媒体浏览方法还可以包括:接收用户的播放触发操作,播放目标多媒体中播放触发操作对应的第一多媒体片段。可选的,当目标多媒体为目标视频时,播放为采用静音方式播放。可选的,多媒体浏览方法还可以包括:在第一多媒体片段播放过程中,基于与第一多媒体片段对应的字幕片段中的各字幕语句的时间戳,依次对与第一多媒体片段的播放进度对应的字幕语句进行突出展示。
其中,播放触发操作是指用于播放多媒体的触发操作,本播放触发操作的具体形式可以为多种,具体不限。第一多媒体片段是指与播放触发操作相对应的多媒体片段。接收到用户的播放触发操作之后,当目标多媒体为目标视频时,可以静音方式播放目标多媒体中的第一多媒体片段;当目标多媒体为目标音频时,可以直接播放第一多媒体片段。然后,基于上述预先确定的字幕片段中各字幕语句的时间戳,可以确定与第一多媒体片段对应的字幕片段,并在第一多媒体片段播放过程中,基于第一多媒体片段对应的字幕片段中的各字幕语句的时间戳,依次对第一多媒体片段的播放进度对应的字幕语句进行突出展示,也即随着第一多媒体片段的播放,字幕片段中的字幕语句随着播放的进行,依次进行突出展示。可选的,突出展示的方式不作限定,例如可以高亮展示。
可选的,接收用户的播放触发操作,可以包括:接收用户对第一多媒体片段的第一触发操作,其中,第一触发操作为针对第一多媒体片段的操作。可选的,接收用户的播放触发操作,包括:接收用户对第一字幕语句的第二触发操作,其中,第一字幕语句为第一多媒体片段对应的字幕片段中的一个字幕语句。可选的,第二触发操作为针对第一字幕语句的操作。
播放触发操作可以为多种操作,本公开实施例中以播放触发操作为上述第一触发操作或第二触发操作为例进行说明,第一触发操作可以为对第一多媒体片段的点击操作或悬停操作,第二触发操作可以为对第一字幕语句的点击操作或悬停操作,上述点击操作或悬停操作仅为示例。接收用户对第一多媒体片段的第一触发操作时,接收到用户的播放触发操作,从头播放目标多媒体中播放触发操作对应的第一多媒体片段,在第一多媒体片段播放过程中,基于与第一多媒体片段对应的字幕片段中的各字幕语句的时间戳,依次对与第一多媒体片段的播放进度对应的字幕语句进行突出展示。
或者,接收到用户对第一字幕语句的第二触发操作时,也可以接收到用户的播放触发操作,与上述不同的是,基于第一字幕语句的时间戳播放第一多媒体片段,也即第一多媒体片段不是从头播放第一多媒体片段,而是从第一字幕语句的时间戳开始播放,该第一字幕语句进行突出展示,随着第一多媒体片段的播放,第一字幕语句之后的字幕语句也可以依次突出展示。
示例性的,图3为本公开实施例提供的另一种内容展示界面的示意图,参见图3,图中第一展示区域11中的箭头可以表示播放触发操作,在第一多媒体片段中的箭头可以表示第一触发操作,在第二展示区域12的第一字幕片段中的箭头可以表示第二触发操作,当接收到上述第一触发操作或第二触发操作时,第一多媒体片段可以静音播放,如图中第一多媒体片段播放过程中隐藏对应的时间范围“00:00-00:11”,对应的字幕语句随着播放进度依次突出展示,图中突出展示可以添加背景色。
上述通过对一个多媒体片段或一个字幕语句的触发均可以实现对目标多媒体的播放触发,播放该多媒体片段,并在播放过程中对应的字幕也可以关联突出展示,可以实现多媒体和字幕之间的关联互动,使用户更好地了解多媒体的内容,提高了用户的浏览体验。
在一些实施例中,多媒体浏览方法还可以包括:接收用户在第一展示区域中对第二多媒体片段的非播放触发操作;将非播放触发操作所在时间戳对应的第二字幕语句进行突出展示。可选的,非播放触发操作包括在第二多媒体片段的播放时间轴上的操作。可选的,当第二多媒体片段为视频片段,还可以包括:在第二多媒体片段的播放时间轴上展示非播放触发操作所在时间戳对应的视频画面帧。可选的,突出展示为采用高亮、加粗和添加下划线中的至少一种方式进行展示。
其中,非播放触发操作是与播放触发操作不同的操作,非播放触发操作可以理解为不能触发多媒体播放的操作,也即该操作不会改变多媒体当前的播放状态,非播放触发操作的具体形式也可以为多种,例如非播放触发操作可以为在第二多媒体片段的播放时间轴上的悬停操作。第二多媒体片段是目标多媒体包括的任意一个多媒体片段。接收用户对第二多媒体片段的非播放触发操作之后,可以确定非播放触发操作对应的第二字幕语句,将该第二字幕语句进行突出展示。并且,当第二多媒体片段为视频片段,接收到非播放触发操作之后,可以确定非播放触发操作对应的时间戳,并在第二多媒体片段的播放时间轴上展示上述时间戳对应的视频画面帧,以使用户可以对当前非播放触发操作所在时间点对应的字幕语句和视频画面帧进行相对应的浏览。本公开实施例中对突出展示的具体方式不作限定,例如突出展示可以为采用高亮、加粗和添加下划线等方式进行展示。
上述通过在多媒体片段的播放时间轴上某个时刻的触发,该时刻对应的字幕会突出展示,并且当第二多媒体片段为视频片段,该时刻的视频画面帧也可以展示,使得用户可以根据实际需求有针对性地了解一个时刻的多媒体画面和对应的字幕语句,更加符合实际场景需求,提高了用户体验效果。
在一些实施例中,多媒体浏览方法还可以包括:接收用户在第二展示区域中对目标字幕语句的选择操作,展示可操作按钮;接收用户对可操作按钮的触发操作之后,对目标字幕语句执行可操作按钮对应的目标操作。可选的,可操作按钮可以包括复制按钮、评论按钮、编辑按钮和表情按钮中的至少一个,可操作按钮对应的目标操作包括复制操作、评论操作、编辑操作和发表情操作中的至少一个。
其中,选择操作是指在字幕内容中进行的点击和拖动组合成的选中操作,通过对光标位置的检测可以确定选择操作对应的文本,目标字幕语句即为上述文本。可操作按钮是指预先设置的用于对字幕实现具体的操作的按钮,可操作按钮可以包括多种,具体不限,本公开实施例中的可操作按钮可以包括复制按钮、评论按钮、编辑按钮和表情按钮等中的至少一个,每个可操作按钮对应的操作不同。接收用户在第二展示区域中对目标字幕语句的选择操作之后,可以展示至少一个可操作按钮给用户,用户对可操作按钮触发之后,可以接收到该触发操作,对上述选择操作对应的目标字幕语句执行对应的目标操作,例如当接收到用户对评论按钮的触发,可以对目标字幕语句进行评论;又如,接收到用户对表情按钮的触发,可以对目标字幕语句发布表情。可以理解的是,对于编辑按钮,仅为制作用户具有权限触发进行编辑,其他用户不能进行编辑。
示例性的,参见图3,图3中第二展示区域12中展示了包括四个可操作按钮的展示框13,展示框13中从左到右分别展示了复制按钮、评论按钮、编辑按钮和表情按钮,选择操作对应的目标字幕语句为展示框13下方添加背景色的语句,用户可以对任意一个可操作按钮进行触发,以实现对目标字幕语句对应的操作。可以理解的是,图3中展示的可操作按钮仅为示例,点击展示框13最右侧的更多按钮(三个点)可以展示更多的可操作按钮。
上述通过可操作按钮可以支持用户对字幕内容的多种操作,例如评论、编辑、发表情和复制等,提供了更多交互的可能,用户可以根据实际需求进行交互,进一步提高了用户的交互体验效果。
可选的,当可操作按钮为编辑按钮,目标操作为编辑操作,多媒体浏览方法还可以包括:基于编辑操作之后的目标字幕语句调整目标字幕语句的时间戳在多媒体片段中的嵌入字幕。其中,嵌入字幕是指多媒体片段中通过编码等方式结合的字幕,该嵌入字幕可以在多媒体片段播放时同步显示在多媒体片段中。本公开实施例中由于用户可以对字幕内容中的目标字幕语句进行编辑,也即进行修改和添加等操作,编辑之后针对多媒体片段中该目标字幕语句的时间戳对应的嵌入字幕,也可以修改为编辑之后的目标字幕语句,以保持字幕内容在不同的位置展示时是相同的,避免了用户在不同位置因字幕不同造成的体验效果差,提高了字幕展示的准确性。
在一些实施例中,多媒体浏览方法还可以包括:展示至少一个关键字,其中,关键字通过对各字幕片段进行关键字提取得到:接收用户对至少一个关键字中的目标关键字的触发操作,将各字幕片段中的目标关键字突出展示,其中,目标关键字的数量为至少一个。
其中,关键字可以为对字幕内容中的各字幕片段进行关键字提取得到,具体提取规则不作限定,例如提取规则可以基于数量进行提取。本公开实施例中,在内容展示界面中还可以展示关键字,关键字的数量不作限定,并在接收到用户对目标关键字的触发操作之后,将各字幕片段中包括的目标关键字均突出展示。突出展出的方式也不作限定。
示例性的,图4为本公开实施例提供的再一种内容展示界面的示意图,参见图4,图中内容展示界面10中可以包括关键字展示区域14,该关键字展示区域中示例性的展示有5个关键字,分别为“创新”、“尺寸”、“框架”、“部件”和“重命名”,当用户对其中一个关键字进行触发时,例如对“创新”进行触发时,第二展示区域12中的各字幕片段中的“创新”均突出展示。
可选的,多媒体浏览方法还可以包括:基于各目标关键字的时间戳,播放各目标关键字所在字幕片段对应的多媒体片段。可选的,多媒体浏览方法还可以包括:接收用户对至少一个目标关键字触发操作;基于所触发的目标关键字的时间戳,播放设定关键字所在字幕片段对应的多媒体片段。
接收到用户对目标关键字的触发操作之后,由于目标关键字在各字幕片段中的时间戳不同,基于每个目标关键字的时间戳,可以同时播放每个目标关键字所在字幕片段对应的多媒体片段。或者,接收到用户对目标关键字的触发操作之后,如果再次接收到用户对至少一个目标关键字的触发操作,则可以仅基于设定关键字的时间戳放设定关键字所在字幕片段对应的多媒体片段。也即,当用户对目标关键字触发之后,如果用户没有进行再次触发,则可以播放每个目标关键字对应的多媒体片段;如果用户再次触发至少两个目标关键字中的一个关键字,则仅播放用户再次触发的关键字对应的多媒体片段。
上述对字幕内容进行关键字提取、展示和触发之后,字幕和多媒体中均可以关联互动,以使用户直观地浏览到关键字所在字幕位置和多媒体位置,更有利于满足用户的个性化需求。
在一些实施例中,多媒体浏览方法还可以包括:对目标多媒体进行语音识别,确定至少两个多媒体人物;按照多媒体人物对各多媒体片段和各字幕片段进行划分;基于各多媒体人物对划分后的各多媒体片段和各字幕片段进行互动触发。可选的,多媒体浏览方法还可以包括:展示各多媒体人物的人物信息;接收用户对目标多媒体人物的人物信息的触发操作;将与目标多媒体人物关联的字幕子片段进行突出展示。
其中,多媒体人物是指目标多媒体中包括的说话者,通过对目标多媒体进行语音识别,例如音色识别,即可确定包括的说话者。本公开实施例中,通过对目标多媒体进行语音识别,可以确定其中包括的至少两个多媒体人物,之后通过语义分析可以对各多媒体片段和各字幕片段基于多媒体人物进行划分,将各多媒体片段划分为不同多媒体人物对应的多媒体子片段,将各字幕片段划分为不同多媒体人物对应的字幕子片段,之后可以基于各多媒体人物对划分后的各多媒体片段和各字幕片段进行互动触发。将各多媒体人物的人物信息展示在内容展示界面中,人物信息用于表征多媒体人物,不同多媒体人物的人物信息不同,人物信息可以包括人物名称等信息,具体不限。接收到用户对至少两个多媒体人物中的目标多媒体人物的人物信息的触发操作之后,可以将目标多媒体人物在各字幕片段中划分的字幕子片段进行突出展示,突出展示的方式不作限定。
示例性的,参见图4,图中内容展示界面10可以包括人物信息展示区域15,人物信息展示区域15中示例性的展示了两个多媒体人物的人物名称,分别为“人物A”和“人物B”,当用户对其中一个人物名称触发时,例如用户对“人物A”触发时,第二展示区域12中的各字幕片段中“人物A”的字幕子片段均突出展示。
可选的,多媒体浏览方法还可以包括:播放目标多媒体人物在各多媒体片段划分的多媒体子片段。可选的,多媒体浏览方法还可以包括:接收用户对目标字幕子片段的触发操作;基于目标字幕子片段的时间戳播放目标字幕子片段对应的多媒体子片段。
接收到用户对至少两个多媒体人物中的目标多媒体人物的人物信息的触发操作之后,由于目标多媒体人物在各多媒体片段中均具有对应的多媒体子片段,可以同时播放目标多媒体人物在各多媒体片段中划分的多媒体子片段,一个多媒体片段中目标多媒体人物的多媒体子片段为多个时,可以间隔播放。或者,接收到用户对至少两个多媒体人物中的目标多媒体人物的人物信息的触发操作之后,如果再次接收到用户对目标多媒体人物的至少两个字幕子片段中目标字幕子片段的触发操作,可以基于目标字幕子片段的时间戳仅播放该目标字幕子片段对应的多媒体子片段。也即,当用户对目标多媒体人物的人物信息触发之后,如果用户没有进行再次触发,则可以播放每个多媒体片段中的目标多媒体人物的多媒体子片段;如果用户再次触发至少两个字幕子片段中目标字幕子片段,则仅播放用户再次触发的至少两个字幕子片段中目标字幕子片段对应的多媒体子片段。
上述对多媒体中包括的人物信息的确定、展示和触发之后,该人物信息对应的字幕和多媒体均可以关联互动,以使用户直观地浏览到该人物所在字幕位置和多媒体位置,更有利于满足用户的个性化需求,进一步提高了交互体验。
在一些实施例中,多媒体浏览方法还可以包括:在内容展示界面展示目标多媒体的交互内容,交互内容包括评论和/或表情。其中,交互内容可以包括用户针对目标多媒体的交互内容和/或用户针对目标多媒体的字幕内容的交互内容。本公开实施例中,在内容展示界面中还可以展示针对目标多媒体的交互内容和/或针对目标多媒体的字幕内容的交互内容,具体的展示位置不作限定,例如可以在内容展示界面的右侧设置交互内容展示区域,用于展示交互内容。可选的,交互内容的展示还可以划分不同的多媒体片段和对应的字幕片段进行展示,并且交互内容中针对目标多媒体的交互内容和针对目标多媒体的字幕内容的交互内容可以采用不同的方式进行展示,例如可以采用不同颜色进行展示。
上述通过在内容展示界面中展示目标多媒体存在的交互内容,可以使用户直观地浏览到多媒体的历史交互信息,从交互角度了解多媒体片段的侧重点,更有利于用户对多媒体以及对应的字幕的整体了解,进一步提高了用户的浏览体验效果。
此外,参见图4,内容展示界面10中还可以设置搜索按钮16、翻译按钮17和分享按钮18等等功能按钮,用户触发其中一个按钮时,可以执行对应的操作。当用户触发搜索按钮16并输入搜索词时可以执行对该搜索词的搜索;当用户触发翻译按钮17时,可以执行对整个内容展示界面10中所有文本的翻译,具体可以从初始语音翻译为目标语言,具体的翻译语言可以根据实际情况进行设定;当用户触发分享按钮18时,可以将内容展示界面10整体分享给其他用户。图4中的内容展示界面10仅为示例,内容展示界面10可以根据实际情况和用户需求进行设置。
本公开实施例提供的多媒体浏览方法,可以满足用户在多种特定场景下不方便进行多媒体播放时,快速浏览多媒体以及字幕内容的需求,将多媒体内容拆分得到的至少两个多媒体片段和多媒体片段对应的字幕片段进行展示,使用户直观地浏览到多媒体片段对应的字幕片段,提高了用户了解多媒体完整内容的效率;并且,字幕片段和多媒体片段在用户触发时,可以实现多种方式的关联互动,使用户从多种角度以及多种粒度均可以直观地确定到字幕和多媒体之间的对应关系,更有利于满足用户的个性化需求,进一步提高了交互体验;字幕内容可以支持用户进行编辑、评论和复制等操作,交互功能更加多样;通过对字幕内容的关键字提取以及对多媒体的语音识别,可以确定关键字和多个多媒体人物,进而通过触发关键字或多媒体人物,从关键字或多媒体人物的角度对多媒体和字幕进行筛选浏览,使用户更有针对性地浏览到相关内容,更有利于满足用户的个性化需求。
图5为本公开实施例提供的一种多媒体浏览装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图5所示,该装置包括:
浏览请求接收模块301,用于接收目标多媒体的字幕浏览请求;
内容获取模块302,用于获取所述目标多媒体的至少两个多媒体片段以及所述多媒体片段对应的字幕片段,其中,所述多媒体片段对应至少一个所述字幕片段;
内容展示模块303,用于在内容展示界面中的第一展示区域展示所述多媒体片段,在第二展示区域展示所述多媒体片段对应的字幕片段。
可选的,所述装置还包括字幕片段模块,用于:
对所述目标多媒体进行语音识别获取字幕内容;
对所述字幕内容进行语义拆分,确定至少两个字幕片段。
可选的,所述装置还包括多媒体片段模块,用于:
根据所述字幕片段对应的时间戳对所述目标多媒体进行拆分,确定至少两个多媒体片段。
可选的,所述装置还包括片段模块,用于:
按照设定规则对所述目标多媒体进行拆分,确定至少两个多媒体片段;
根据所述多媒体片段确定对应的至少两个字幕片段。
可选的,所述装置还包括时间戳模块,用于:
确定所述字幕片段中包括的各字幕语句的时间戳,其中,所述字幕语句中包括至少一个字或词。
可选的,所述装置还包括播放模块,用于:
接收用户的播放触发操作,播放所述目标多媒体中所述播放触发操作对应的第一多媒体片段。
可选的,当所述目标多媒体为目标视频时,所述播放为采用静音方式播放
可选的,所述装置还包括字幕突出展示模块,用于:
在所述第一多媒体片段播放过程中,基于与所述第一多媒体片段对应的字幕片段中的各字幕语句的时间戳,依次对与所述第一多媒体片段的播放进度对应的字幕语句进行突出展示。
可选的,所述播放模块具体用于:
接收用户对所述第一多媒体片段的第一触发操作,其中,所述第一触发操作为针对所述第一多媒体片段的操作。
可选的,所述播放模块具体用于:
接收用户对第一字幕语句的第二触发操作,其中,所述第一字幕语句为所述第一多媒体片段对应的字幕片段中的一个字幕语句。
可选的,所述第二触发操作为针对所述第一字幕语句的操作。
可选的,所述装置还包括非播放模块,用于:
接收用户在所述第一展示区域中对第二多媒体片段的非播放触发操作;
将所述非播放触发操作所在时间戳对应的第二字幕语句进行突出展示。
可选的,所述非播放触发操作包括在所述第二多媒体片段的播放时间轴上的操作。
可选的,当所述第二多媒体片段为视频片段,所述装置还包括画面帧模块,用于:
在所述第二多媒体片段的播放时间轴上展示所述非播放触发操作所在时间戳对应的视频画面帧。
可选的,所述突出展示为采用高亮、加粗和添加下划线中的至少一种方式进行展示。
可选的,所述装置还包括字幕交互模块,用于:
接收用户在第二展示区域中对目标字幕语句的选择操作,展示可操作按钮;
接收用户对所述可操作按钮的触发操作之后,对所述目标字幕语句执行所述可操作按钮对应的目标操作。
可选的,所述可操作按钮包括复制按钮、评论按钮、编辑按钮和表情按钮中的至少一个,所述可操作按钮对应的目标操作包括复制操作、评论操作、编辑操作和发表情操作中的至少一个。
可选的,当所述可操作按钮为所述编辑按钮,所述目标操作为编辑操作,所述装置还包括字幕调整模块,用于:
基于所述编辑操作之后的目标字幕语句调整所述目标字幕语句的时间戳在多媒体片段中的嵌入字幕。
可选的,所述装置还包括关键字模块,用于:
展示至少一个关键字,其中,所述关键字通过对各所述字幕片段进行关键字提取得到:
接收用户对所述至少一个关键字中的目标关键字的触发操作,将各所述字幕片段中的所述目标关键字突出展示,其中,所述目标关键字的数量为至少一个。
可选的,所述装置还包括关键字多媒体模块,用于:
基于各所述目标关键字的时间戳,播放各所述目标关键字所在字幕片段对应的多媒体片段。
可选的,所述装置还包括设定关键字模块,用于:
接收用户对至少一个目标关键字触发操作;
基于所触发的目标关键字的时间戳,播放所述设定关键字所在字幕片段对应的多媒体片段。
可选的,所述装置还包括人物模块,用于:
对所述目标多媒体进行语音识别,确定至少两个多媒体人物;
按照所述多媒体人物对各所述多媒体片段和各所述字幕片段进行划分;
基于各所述多媒体人物对划分后的各所述多媒体片段和各所述字幕片段进行互动触发。
可选的,所述装置还包括人物触发模块,用于:
展示各所述多媒体人物的人物信息;
接收用户对所述目标多媒体人物的人物信息的触发操作;
将与所述目标多媒体人物关联的字幕子片段进行突出展示。
可选的,所述装置还包括第一播放模块,用于:
播放所述目标多媒体人物在各所述多媒体片段划分的多媒体子片段。
可选的,所述装置还包括第二播放模块,用于:
接收用户对目标字幕子片段的触发操作;
基于所述目标字幕子片段的时间戳播放所述目标字幕子片段对应的多媒体子片段。
可选的,所述装置还包括交互展示模块,用于:
在所述内容展示界面展示所述目标多媒体的交互内容,所述交互内容包括评论和/或表情。
本公开实施例所提供的多媒体浏览装置可执行本公开任意实施例所提供的多媒体浏览方法,具备执行方法相应的功能模块和有益效果。
图6为本公开实施例提供的一种电子设备的结构示意图。下面具体参考图6,其示出了适于用来实现本公开实施例中的电子设备400的结构示意图。本公开实施例中的电子设备400可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的多媒体浏览方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收目标多媒体的字幕浏览请求;获取所述目标多媒体的至少两个多媒体片段以及所述多媒体片段对应的字幕片段,其中,所述多媒体片段对应至少一个所述字幕片段;在内容展示界面中的第一展示区域展示所述多媒体片段,在第二展示区域展示所述多媒体片段对应的字幕片段。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,本公开提供了一种多媒体浏览方法,包括:
接收目标多媒体的字幕浏览请求;
获取所述目标多媒体的至少两个多媒体片段以及所述多媒体片段对应的字幕片段,其中,所述多媒体片段对应至少一个所述字幕片段;
在内容展示界面中的第一展示区域展示所述多媒体片段,在第二展示区域展示所述多媒体片段对应的字幕片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
对所述目标多媒体进行语音识别获取字幕内容;
对所述字幕内容进行语义拆分,确定至少两个字幕片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
根据所述字幕片段对应的时间戳对所述目标多媒体进行拆分,确定至少两个多媒体片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
按照设定规则对所述目标多媒体进行拆分,确定至少两个多媒体片段;
根据所述多媒体片段确定对应的至少两个字幕片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
确定所述字幕片段中包括的各字幕语句的时间戳,其中,所述字幕语句中包括至少一个字或词。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
接收用户的播放触发操作,播放所述目标多媒体中所述播放触发操作对应的第一多媒体片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,当所述目标多媒体为目标视频时,所述播放为采用静音方式播放。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
在所述第一多媒体片段播放过程中,基于与所述第一多媒体片段对应的字幕片段中的各字幕语句的时间戳,依次对与所述第一多媒体片段的播放进度对应的字幕语句进行突出展示。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,所述接收用户的播放触发操作,包括:
接收用户对所述第一多媒体片段的第一触发操作,其中,所述第一触发操作为针对所述第一多媒体片段的操作。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,所述接收用户的播放触发操作,包括:
接收用户对第一字幕语句的第二触发操作,其中,所述第一字幕语句为所述第一多媒体片段对应的字幕片段中的一个字幕语句。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,所述第二触发操作为针对所述第一字幕语句的操作。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
接收用户在所述第一展示区域中对第二多媒体片段的非播放触发操作;
将所述非播放触发操作所在时间戳对应的第二字幕语句进行突出展示。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,所述非播放触发操作包括在所述第二多媒体片段的播放时间轴上的操作。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,当所述第二多媒体片段为视频片段,还包括:
在所述第二多媒体片段的播放时间轴上展示所述非播放触发操作所在时间戳对应的视频画面帧。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,所述突出展示为采用高亮、加粗和添加下划线中的至少一种方式进行展示。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
接收用户在第二展示区域中对目标字幕语句的选择操作,展示可操作按钮;
接收用户对所述可操作按钮的触发操作之后,对所述目标字幕语句执行所述可操作按钮对应的目标操作。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,所述可操作按钮包括复制按钮、评论按钮、编辑按钮和表情按钮中的至少一个,所述可操作按钮对应的目标操作包括复制操作、评论操作、编辑操作和发表情操作中的至少一个。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,当所述可操作按钮为所述编辑按钮,所述目标操作为编辑操作,还包括:
基于所述编辑操作之后的目标字幕语句调整所述目标字幕语句的时间戳在多媒体片段中的嵌入字幕。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
展示至少一个关键字,其中,所述关键字通过对各所述字幕片段进行关键字提取得到:
接收用户对所述至少一个关键字中的目标关键字的触发操作,将各所述字幕片段中的所述目标关键字突出展示,其中,所述目标关键字的数量为至少一个。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
基于各所述目标关键字的时间戳,播放各所述目标关键字所在字幕片段对应的多媒体片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
接收用户对至少一个目标关键字触发操作;
基于所触发的目标关键字的时间戳,播放所述设定关键字所在字幕片段对应的多媒体片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
对所述目标多媒体进行语音识别,确定至少两个多媒体人物;
按照所述多媒体人物对各所述多媒体片段和各所述字幕片段进行划分;
基于各所述多媒体人物对划分后的各所述多媒体片段和各所述字幕片段进行互动触发。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
展示各所述多媒体人物的人物信息;
接收用户对所述目标多媒体人物的人物信息的触发操作;
将与所述目标多媒体人物关联的字幕子片段进行突出展示。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
播放所述目标多媒体人物在各所述多媒体片段划分的多媒体子片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
接收用户对目标字幕子片段的触发操作;
基于所述目标字幕子片段的时间戳播放所述目标字幕子片段对应的多媒体子片段。
根据本公开的一个或多个实施例,本公开提供多媒体浏览方法中,还包括:
在所述内容展示界面展示所述目标多媒体的交互内容,所述交互内容包括评论和/或表情。
根据本公开的一个或多个实施例,本公开提供了一种多媒体浏览装置,包括:
浏览请求接收模块,用于接收目标多媒体的字幕浏览请求;
内容获取模块,用于获取所述目标多媒体的至少两个多媒体片段以及所述多媒体片段对应的字幕片段,其中,所述多媒体片段对应至少一个所述字幕片段;
内容展示模块,用于在内容展示界面中的第一展示区域展示所述多媒体片段,在第二展示区域展示所述多媒体片段对应的字幕片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括字幕片段模块,用于:
对所述目标多媒体进行语音识别获取字幕内容;
对所述字幕内容进行语义拆分,确定至少两个字幕片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括多媒体片段模块,用于:
根据所述字幕片段对应的时间戳对所述目标多媒体进行拆分,确定至少两个多媒体片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括片段模块,用于:
按照设定规则对所述目标多媒体进行拆分,确定至少两个多媒体片段;
根据所述多媒体片段确定对应的至少两个字幕片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括时间戳模块,用于:
确定所述字幕片段中包括的各字幕语句的时间戳,其中,所述字幕语句中包括至少一个字或词。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括播放模块,用于:
接收用户的播放触发操作,播放所述目标多媒体中所述播放触发操作对应的第一多媒体片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,当所述目标多媒体为目标视频时,所述播放为采用静音方式播放
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括字幕突出展示模块,用于:
在所述第一多媒体片段播放过程中,基于与所述第一多媒体片段对应的字幕片段中的各字幕语句的时间戳,依次对与所述第一多媒体片段的播放进度对应的字幕语句进行突出展示。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述播放模块具体用于:
接收用户对所述第一多媒体片段的第一触发操作,其中,所述第一触发操作为针对所述第一多媒体片段的操作。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述播放模块具体用于:
接收用户对第一字幕语句的第二触发操作,其中,所述第一字幕语句为所述第一多媒体片段对应的字幕片段中的一个字幕语句。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述第二触发操作为针对所述第一字幕语句的操作。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括非播放模块,用于:
接收用户在所述第一展示区域中对第二多媒体片段的非播放触发操作;
将所述非播放触发操作所在时间戳对应的第二字幕语句进行突出展示。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述非播放触发操作包括在所述第二多媒体片段的播放时间轴上的操作。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,当所述第二多媒体片段为视频片段,所述装置还包括画面帧模块,用于:
在所述第二多媒体片段的播放时间轴上展示所述非播放触发操作所在时间戳对应的视频画面帧。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述突出展示为采用高亮、加粗和添加下划线中的至少一种方式进行展示。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括字幕交互模块,用于:
接收用户在第二展示区域中对目标字幕语句的选择操作,展示可操作按钮;
接收用户对所述可操作按钮的触发操作之后,对所述目标字幕语句执行所述可操作按钮对应的目标操作。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述可操作按钮包括复制按钮、评论按钮、编辑按钮和表情按钮中的至少一个,所述可操作按钮对应的目标操作包括复制操作、评论操作、编辑操作和发表情操作中的至少一个。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,当所述可操作按钮为所述编辑按钮,所述目标操作为编辑操作,所述装置还包括字幕调整模块,用于:
基于所述编辑操作之后的目标字幕语句调整所述目标字幕语句的时间戳在多媒体片段中的嵌入字幕。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括关键字模块,用于:
展示至少一个关键字,其中,所述关键字通过对各所述字幕片段进行关键字提取得到:
接收用户对所述至少一个关键字中的目标关键字的触发操作,将各所述字幕片段中的所述目标关键字突出展示,其中,所述目标关键字的数量为至少一个。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括关键字多媒体模块,用于:
基于各所述目标关键字的时间戳,播放各所述目标关键字所在字幕片段对应的多媒体片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括设定关键字模块,用于:
接收用户对至少一个目标关键字触发操作;
基于所触发的目标关键字的时间戳,播放所述设定关键字所在字幕片段对应的多媒体片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括人物模块,用于:
对所述目标多媒体进行语音识别,确定至少两个多媒体人物;
按照所述多媒体人物对各所述多媒体片段和各所述字幕片段进行划分;
基于各所述多媒体人物对划分后的各所述多媒体片段和各所述字幕片段进行互动触发。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括人物触发模块,用于:
展示各所述多媒体人物的人物信息;
接收用户对所述目标多媒体人物的人物信息的触发操作;
将与所述目标多媒体人物关联的字幕子片段进行突出展示。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括第一播放模块,用于:
播放所述目标多媒体人物在各所述多媒体片段划分的多媒体子片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括第二播放模块,用于:
接收用户对目标字幕子片段的触发操作;
基于所述目标字幕子片段的时间戳播放所述目标字幕子片段对应的多媒体子片段。
根据本公开的一个或多个实施例,本公开提供的多媒体浏览装置中,所述装置还包括交互展示模块,用于:
在所述内容展示界面展示所述目标多媒体的交互内容,所述交互内容包括评论和/或表情。
根据本公开的一个或多个实施例,本公开提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开提供的任一所述的多媒体浏览方法。
根据本公开的一个或多个实施例,本公开提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开提供的任一所述的多媒体浏览方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (29)

1.一种多媒体浏览方法,其特征在于,包括:
接收目标多媒体的字幕浏览请求;
获取所述目标多媒体的至少两个多媒体片段以及所述多媒体片段对应的字幕片段,其中,所述多媒体片段对应至少一个所述字幕片段;
在内容展示界面中的第一展示区域展示所述多媒体片段,在第二展示区域展示所述多媒体片段对应的字幕片段。
2.根据权利要求1所述的方法,其特征在于,还包括:
对所述目标多媒体进行语音识别获取字幕内容;
对所述字幕内容进行语义拆分,确定至少两个字幕片段。
3.根据权利要求2所述的方法,其特征在于,还包括:
根据所述字幕片段对应的时间戳对所述目标多媒体进行拆分,确定至少两个多媒体片段。
4.根据权利要求1所述的方法,其特征在于,还包括:
按照设定规则对所述目标多媒体进行拆分,确定至少两个多媒体片段;
根据所述多媒体片段确定对应的至少两个字幕片段。
5.根据权利要求1所述的方法,其特征在于,还包括:
确定所述字幕片段中包括的各字幕语句的时间戳,其中,所述字幕语句中包括至少一个字或词。
6.根据权利要求1所述的方法,其特征在于,还包括:
接收用户的播放触发操作,播放所述目标多媒体中所述播放触发操作对应的第一多媒体片段。
7.根据权利要求6所述的方法,其特征在于,当所述目标多媒体为目标视频时,所述播放为采用静音方式播放。
8.根据权利要求6所述的方法,其特征在于,还包括:
在所述第一多媒体片段播放过程中,基于与所述第一多媒体片段对应的字幕片段中的各字幕语句的时间戳,依次对与所述第一多媒体片段的播放进度对应的字幕语句进行突出展示。
9.根据权利要求6所述的方法,其特征在于,所述接收用户的播放触发操作,包括:
接收用户对所述第一多媒体片段的第一触发操作,其中,所述第一触发操作为针对所述第一多媒体片段的操作。
10.根据权利要求6所述的方法,其特征在于,所述接收用户的播放触发操作,包括:
接收用户对第一字幕语句的第二触发操作,其中,所述第一字幕语句为所述第一多媒体片段对应的字幕片段中的一个字幕语句。
11.根据权利要求10所述的方法,其特征在于,所述第二触发操作为针对所述第一字幕语句的操作。
12.根据权利要求1所述的方法,其特征在于,还包括:
接收用户在所述第一展示区域中对第二多媒体片段的非播放触发操作;
将所述非播放触发操作所在时间戳对应的第二字幕语句进行突出展示。
13.根据权利要求12所述的方法,其特征在于,所述非播放触发操作包括在所述第二多媒体片段的播放时间轴上的操作。
14.根据权利要求12所述的方法,其特征在于,当所述第二多媒体片段为视频片段,还包括:
在所述第二多媒体片段的播放时间轴上展示所述非播放触发操作所在时间戳对应的视频画面帧。
15.根据权利要求8或12所述的方法,其特征在于,所述突出展示为采用高亮、加粗和添加下划线中的至少一种方式进行展示。
16.根据权利要求1所述的方法,其特征在于,还包括:
接收用户在第二展示区域中对目标字幕语句的选择操作,展示可操作按钮;
接收用户对所述可操作按钮的触发操作之后,对所述目标字幕语句执行所述可操作按钮对应的目标操作。
17.根据权利要求16所述的方法,其特征在于,所述可操作按钮包括复制按钮、评论按钮、编辑按钮和表情按钮中的至少一个,所述可操作按钮对应的目标操作包括复制操作、评论操作、编辑操作和发表情操作中的至少一个。
18.根据权利要求17所述的方法,其特征在于,当所述可操作按钮为所述编辑按钮,所述目标操作为编辑操作,还包括:
基于所述编辑操作之后的目标字幕语句调整所述目标字幕语句的时间戳在多媒体片段中的嵌入字幕。
19.根据权利要求1所述的方法,其特征在于,还包括:
展示至少一个关键字,其中,所述关键字通过对各所述字幕片段进行关键字提取得到:
接收用户对所述至少一个关键字中的目标关键字的触发操作,将各所述字幕片段中的所述目标关键字突出展示,其中,所述目标关键字的数量为至少一个。
20.根据权利要求19所述的方法,其特征在于,还包括:
基于各所述目标关键字的时间戳,播放各所述目标关键字所在字幕片段对应的多媒体片段。
21.根据权利要求19所述的方法,其特征在于,还包括:
接收用户对至少一个目标关键字触发操作;
基于所触发的目标关键字的时间戳,播放所述设定关键字所在字幕片段对应的多媒体片段。
22.根据权利要求1所述的方法,其特征在于,还包括:
对所述目标多媒体进行语音识别,确定至少两个多媒体人物;
按照所述多媒体人物对各所述多媒体片段和各所述字幕片段进行划分;
基于各所述多媒体人物对划分后的各所述多媒体片段和各所述字幕片段进行互动触发。
23.根据权利要求22所述的方法,其特征在于,还包括:
展示各所述多媒体人物的人物信息;
接收用户对所述目标多媒体人物的人物信息的触发操作;
将与所述目标多媒体人物关联的字幕子片段进行突出展示。
24.根据权利要求23所述的方法,其特征在于,还包括:
播放所述目标多媒体人物在各所述多媒体片段划分的多媒体子片段。
25.根据权利要求23所述的方法,其特征在于,还包括:
接收用户对目标字幕子片段的触发操作;
基于所述目标字幕子片段的时间戳播放所述目标字幕子片段对应的多媒体子片段。
26.根据权利要求1所述的方法,其特征在于,还包括:
在所述内容展示界面展示所述目标多媒体的交互内容,所述交互内容包括评论和/或表情。
27.一种多媒体浏览装置,其特征在于,包括:
浏览请求接收模块,用于接收目标多媒体的字幕浏览请求;
内容获取模块,用于获取所述目标多媒体的至少两个多媒体片段以及所述多媒体片段对应的字幕片段,其中,所述多媒体片段对应至少一个所述字幕片段;
内容展示模块,用于在内容展示界面中的第一展示区域展示所述多媒体片段,在第二展示区域展示所述多媒体片段对应的字幕片段。
28.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-26中任一所述的多媒体浏览方法。
29.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-26中任一所述的多媒体浏览方法。
CN202011296617.4A 2020-11-18 2020-11-18 一种多媒体浏览方法、装置、设备及介质 Pending CN113886612A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011296617.4A CN113886612A (zh) 2020-11-18 2020-11-18 一种多媒体浏览方法、装置、设备及介质
PCT/CN2021/130998 WO2022105760A1 (zh) 2020-11-18 2021-11-16 一种多媒体浏览方法、装置、设备及介质
US18/037,288 US20240007718A1 (en) 2020-11-18 2021-11-16 Multimedia browsing method and apparatus, device and mediuim

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011296617.4A CN113886612A (zh) 2020-11-18 2020-11-18 一种多媒体浏览方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113886612A true CN113886612A (zh) 2022-01-04

Family

ID=79012985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011296617.4A Pending CN113886612A (zh) 2020-11-18 2020-11-18 一种多媒体浏览方法、装置、设备及介质

Country Status (3)

Country Link
US (1) US20240007718A1 (zh)
CN (1) CN113886612A (zh)
WO (1) WO2022105760A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114827745A (zh) * 2022-04-08 2022-07-29 海信集团控股股份有限公司 视频字幕的生成方法及电子设备
CN115047999A (zh) * 2022-07-27 2022-09-13 北京字跳网络技术有限公司 界面切换方法、装置、电子设备、存储介质及程序产品
CN115830489A (zh) * 2022-11-03 2023-03-21 南京小网科技有限责任公司 一种基于ai识别的智能动态分析系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101816174A (zh) * 2007-10-05 2010-08-25 夏普株式会社 内容显示控制装置、内容显示控制方法、程序以及记录介质
EP2953133A1 (en) * 2014-06-06 2015-12-09 Xiaomi Inc. Method and device of playing multimedia
CN107767871A (zh) * 2017-10-12 2018-03-06 安徽听见科技有限公司 文本显示方法、终端及服务器
CN110121093A (zh) * 2018-02-06 2019-08-13 优酷网络技术(北京)有限公司 视频中目标对象的搜索方法及装置
CN110719518A (zh) * 2018-07-12 2020-01-21 阿里巴巴集团控股有限公司 多媒体数据处理方法、装置和设备

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061056A (en) * 1996-03-04 2000-05-09 Telexis Corporation Television monitoring system with automatic selection of program material of interest and subsequent display under user control
CA2386303C (en) * 2001-05-14 2005-07-05 At&T Corp. Method for content-based non-linear control of multimedia playback
US7519274B2 (en) * 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
US7382933B2 (en) * 2005-08-24 2008-06-03 International Business Machines Corporation System and method for semantic video segmentation based on joint audiovisual and text analysis
TW200813760A (en) * 2006-06-20 2008-03-16 There Yugo Inc Multimedia system and method relating thereto
US8079054B1 (en) * 2008-04-14 2011-12-13 Adobe Systems Incorporated Location for secondary content based on data differential
US20110164175A1 (en) * 2010-01-05 2011-07-07 Rovi Technologies Corporation Systems and methods for providing subtitles on a wireless communications device
US9009760B2 (en) * 2011-06-30 2015-04-14 Verizon Patent And Licensing Inc. Provisioning interactive video content from a video on-demand (VOD) server
WO2014186346A1 (en) * 2013-05-13 2014-11-20 Mango Languages Method and system for motion picture assisted foreign language learning
US9852773B1 (en) * 2014-06-24 2017-12-26 Amazon Technologies, Inc. Systems and methods for activating subtitles
CN104967910B (zh) * 2014-10-29 2018-11-23 广州酷狗计算机科技有限公司 多媒体播放进度控制方法及装置
WO2016204481A1 (ko) * 2015-06-16 2016-12-22 엘지전자 주식회사 미디어 데이터 전송 장치, 미디어 데이터 수신 장치, 미디어 데이터 전송 방법, 및 미디어 데이터 수신 방법
WO2017051808A1 (ja) * 2015-09-25 2017-03-30 日立マクセル株式会社 放送受信装置
CN113660521A (zh) * 2015-09-25 2021-11-16 麦克赛尔株式会社 接收装置
CA3038797A1 (en) * 2016-09-30 2018-04-05 Rovi Guides, Inc. Systems and methods for correcting errors in caption text
US20180160069A1 (en) * 2016-12-01 2018-06-07 Arris Enterprises Llc Method and system to temporarily display closed caption text for recently spoken dialogue
CN106792071A (zh) * 2016-12-19 2017-05-31 北京小米移动软件有限公司 字幕处理方法及装置
CN108322800A (zh) * 2017-01-18 2018-07-24 阿里巴巴集团控股有限公司 字幕信息处理方法及装置
CN107027060A (zh) * 2017-04-18 2017-08-08 腾讯科技(深圳)有限公司 视频片段的确定方法和装置
WO2019125704A1 (en) * 2017-12-20 2019-06-27 Flickray, Inc. Event-driven streaming media interactivity
US11252477B2 (en) * 2017-12-20 2022-02-15 Videokawa, Inc. Event-driven streaming media interactivity
CN110620946B (zh) * 2018-06-20 2022-03-18 阿里巴巴(中国)有限公司 字幕显示方法及装置
CN108924626B (zh) * 2018-08-17 2021-02-23 腾讯科技(深圳)有限公司 图片生成方法、装置、设备及存储介质
US10489496B1 (en) * 2018-09-04 2019-11-26 Rovi Guides, Inc. Systems and methods for advertising within a subtitle of a media asset
US10638201B2 (en) * 2018-09-26 2020-04-28 Rovi Guides, Inc. Systems and methods for automatically determining language settings for a media asset
CN109379641B (zh) * 2018-11-14 2022-06-03 腾讯科技(深圳)有限公司 一种字幕生成方法和装置
CN111314775B (zh) * 2018-12-12 2021-09-07 华为终端有限公司 一种视频拆分方法及电子设备
CN111356025A (zh) * 2018-12-24 2020-06-30 深圳Tcl新技术有限公司 一种多字幕显示方法、智能终端及存储介质
CN110035313A (zh) * 2019-02-28 2019-07-19 阿里巴巴集团控股有限公司 视频播放控制方法、视频播放控制装置、终端设备和电子设备
KR20200121603A (ko) * 2019-04-16 2020-10-26 삼성전자주식회사 텍스트를 제공하는 전자 장치 및 그 제어 방법.
US10965888B1 (en) * 2019-07-08 2021-03-30 Snap Inc. Subtitle presentation based on volume control
US11043244B1 (en) * 2019-07-29 2021-06-22 Snap Inc. Tap to advance by subtitles
CN112752047A (zh) * 2019-10-30 2021-05-04 北京小米移动软件有限公司 视频录制方法、装置、设备及可读存储介质
US11295497B2 (en) * 2019-11-25 2022-04-05 International Business Machines Corporation Dynamic subtitle enhancement
WO2022006044A1 (en) * 2020-06-30 2022-01-06 Arris Enterprises Llc Method and system for precise presentation of audiovisual content with temporary closed captions
US11646030B2 (en) * 2020-07-07 2023-05-09 International Business Machines Corporation Subtitle generation using background information
CN111970577B (zh) * 2020-08-25 2023-07-25 北京字节跳动网络技术有限公司 字幕编辑方法、装置和电子设备
CN111988663B (zh) * 2020-08-28 2022-09-06 北京百度网讯科技有限公司 视频播放节点的定位方法、装置、设备以及存储介质
US11212587B1 (en) * 2020-11-05 2021-12-28 Red Hat, Inc. Subtitle-based rewind for video display

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101816174A (zh) * 2007-10-05 2010-08-25 夏普株式会社 内容显示控制装置、内容显示控制方法、程序以及记录介质
EP2953133A1 (en) * 2014-06-06 2015-12-09 Xiaomi Inc. Method and device of playing multimedia
CN107767871A (zh) * 2017-10-12 2018-03-06 安徽听见科技有限公司 文本显示方法、终端及服务器
CN110121093A (zh) * 2018-02-06 2019-08-13 优酷网络技术(北京)有限公司 视频中目标对象的搜索方法及装置
CN110719518A (zh) * 2018-07-12 2020-01-21 阿里巴巴集团控股有限公司 多媒体数据处理方法、装置和设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114827745A (zh) * 2022-04-08 2022-07-29 海信集团控股股份有限公司 视频字幕的生成方法及电子设备
CN114827745B (zh) * 2022-04-08 2023-11-14 海信集团控股股份有限公司 视频字幕的生成方法及电子设备
CN115047999A (zh) * 2022-07-27 2022-09-13 北京字跳网络技术有限公司 界面切换方法、装置、电子设备、存储介质及程序产品
CN115830489A (zh) * 2022-11-03 2023-03-21 南京小网科技有限责任公司 一种基于ai识别的智能动态分析系统
CN115830489B (zh) * 2022-11-03 2023-10-20 南京小网科技有限责任公司 一种基于ai识别的智能动态分析系统

Also Published As

Publication number Publication date
US20240007718A1 (en) 2024-01-04
WO2022105760A1 (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
US11917344B2 (en) Interactive information processing method, device and medium
CN111970577B (zh) 字幕编辑方法、装置和电子设备
CN108847214B (zh) 语音处理方法、客户端、装置、终端、服务器和存储介质
CN113259740A (zh) 一种多媒体处理方法、装置、设备及介质
CN113010704B (zh) 一种会议纪要的交互方法、装置、设备及介质
US20240007718A1 (en) Multimedia browsing method and apparatus, device and mediuim
CN111753558B (zh) 视频翻译方法和装置、存储介质和电子设备
CN112380365A (zh) 一种多媒体的字幕交互方法、装置、设备及介质
CN113010698A (zh) 多媒体的交互方法、信息交互方法、装置、设备及介质
CN112163102B (zh) 搜索内容匹配方法、装置、电子设备及存储介质
US20220391058A1 (en) Interaction information processing method and apparatus, electronic device and storage medium
CN112291614A (zh) 一种视频生成方法及装置
CN111367447A (zh) 信息显示方法、装置、电子设备及计算机可读存储介质
CN113778419A (zh) 多媒体数据的生成方法、装置、可读介质及电子设备
CN113011169B (zh) 一种会议纪要的处理方法、装置、设备及介质
CN113552984A (zh) 文本提取方法、装置、设备及介质
CN112954453A (zh) 视频配音方法和装置、存储介质和电子设备
CN115379136A (zh) 特效道具处理方法、装置、电子设备及存储介质
CN115269920A (zh) 交互方法、装置、电子设备和存储介质
CN113891108A (zh) 字幕优化方法、装置、电子设备和存储介质
CN112163103A (zh) 搜索目标内容的方法、装置、电子设备及存储介质
CN112905838A (zh) 信息检索方法和装置、存储介质和电子设备
CN113132789B (zh) 一种多媒体的交互方法、装置、设备及介质
US11792494B1 (en) Processing method and apparatus, electronic device and medium
EP4339804A1 (en) Template recommendation method and apparatus, device, and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220104

RJ01 Rejection of invention patent application after publication