CN112580302B - 一种字幕校正方法及显示设备 - Google Patents

一种字幕校正方法及显示设备 Download PDF

Info

Publication number
CN112580302B
CN112580302B CN202011441956.7A CN202011441956A CN112580302B CN 112580302 B CN112580302 B CN 112580302B CN 202011441956 A CN202011441956 A CN 202011441956A CN 112580302 B CN112580302 B CN 112580302B
Authority
CN
China
Prior art keywords
subtitle
target
language
data
caption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011441956.7A
Other languages
English (en)
Other versions
CN112580302A (zh
Inventor
高雯雯
刘畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Visual Technology Co Ltd
Original Assignee
Hisense Visual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Visual Technology Co Ltd filed Critical Hisense Visual Technology Co Ltd
Priority to CN202011441956.7A priority Critical patent/CN112580302B/zh
Publication of CN112580302A publication Critical patent/CN112580302A/zh
Priority to PCT/CN2021/119628 priority patent/WO2022121436A1/zh
Application granted granted Critical
Publication of CN112580302B publication Critical patent/CN112580302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明公开一种字幕校正方法及显示设备,当字幕开关开启时,响应于用户输入片源字幕的目标语言,根据片源每条字幕数据的语言识别状态,以及当前编码格式下字幕信息的显示状态,确定与所述目标语言匹配的目标字幕数据和目标编码格式;其中每条字幕数据对应一种语言;利用所述目标编码格式对目标字幕数据进行编码,得到校正后的字幕信息,控制片源播放界面的指定位置处显示所述校正后的字幕信息。本申请中由于将目标编码格式、目标字幕数据和目标语言三者都调整为一致匹配,因此编码后得到的校正字幕更精准,克服了乱码、字幕与图像不匹配等字幕异常显示的问题,从而提升片源字幕的显示效果,提升用户观看体验。

Description

一种字幕校正方法及显示设备
技术领域
本发明涉及显示设备领域,尤其涉及一种字幕校正方法及显示设备。
背景技术
显示设备在播放片源时,如果用户打开字幕开关,就可以在片源画面中的指定位置(比如底部)显示字幕信息,字幕信息一般与片源的音频内容同步。不同国家和地区使用的字幕编码格式存在差异,当解析片源字幕时,如果无法更新正确的编码格式,会使得字幕信息与编码格式不匹配,尤其是对于阿拉伯语、希伯来语等语系,进而导致字幕显示异常,比如字幕出现乱码,影响用户观看片源的体验。
发明内容
本发明提供一种字幕校正方法及显示设备,以解决由于字幕信息与编码格式不匹配导致的字幕显示异常的问题。
第一方面提供的显示设备,包括:
显示器,用于在播放片源时显示字幕信息;
控制器,被配置为执行:
当字幕开关开启时,响应于用户输入片源字幕的目标语言,根据片源每条字幕数据的语言识别状态,以及当前编码格式下字幕信息的显示状态,确定与所述目标语言匹配的目标字幕数据和目标编码格式;其中每条字幕数据对应一种语言;
利用所述目标编码格式对目标字幕数据进行编码,得到校正后的字幕信息,控制显示器在片源播放界面的指定位置处显示所述校正后的字幕信息。
在一些实施例中,所述控制器被配置为按照如下方式确定目标字幕数据和目标编码格式:
对片源的每条字幕数据进行解析,遍历各条字幕数据的语言标识,查找与目标语言匹配的语言标识对应的目标字幕数据;
如果能查找到与目标语言匹配的语言标识,则从语言-编码列表中获取所述目标语言对应的目标编码格式;其中,所述语言-编码列表中记录有语言与编码格式之间的对应关系。
在一些实施例中,所述控制器被配置为按照如下方式确定目标字幕数据和目标编码格式:
对片源的每条字幕数据进行解析,遍历各条字幕数据的语言标识,查找与目标语言匹配的语言标识;
如果未能查找到与目标语言匹配的语言标识,则将包含预设标识的字幕数据作为目标字幕数据,利用当前编码格式对所述目标字幕数据进行编码,得到第一字幕信息;
确定所述第一字幕信息中是否显示有异常字符;
如果所述第一字幕信息中未显示有异常字符,则利用语言字母集合对所述第一字幕信息进行字符串匹配;
如果所述第一字幕信息中的字符串都能在语言字母集合中匹配到,则确定当前编码格式为所述目标编码格式。
在一些实施例中,所述控制器被配置为按照如下方式确定目标编码格式:
如果所述第一字幕信息中至少存在一个字符串未能在语言字母集合中匹配到,则将当前编码格式切换为编码列表中的下一个编码格式,直至在编码列表中定位到所述目标编码格式;其中,所述编码列表中记录有显示设备支持的全部编码格式。
在一些实施例中,所述控制器被配置为按照如下方式确定目标编码格式:
如果所述第一字幕信息中显示有异常字符,则将当前编码格式切换为编码列表中的下一个编码格式,直至所述第一字幕信息中不再显示异常字符,执行第一字幕信息的字符串匹配流程。
在一些实施例中,所述控制器还被配置为执行:
对片源的每条字幕数据进行解析,如果识别到所述字幕数据的类型属于本文型字幕,则启动执行确定目标编码格式的流程。
第二方面提供的字幕校正方法,包括:
当字幕开关开启时,响应于用户输入片源字幕的目标语言,根据片源每条字幕数据的语言识别状态,以及当前编码格式下字幕信息的显示状态,确定与所述目标语言匹配的目标字幕数据和目标编码格式;其中每条字幕数据对应一种语言;
利用所述目标编码格式对目标字幕数据进行编码,得到校正后的字幕信息,控制片源播放界面的指定位置处显示所述校正后的字幕信息。
本申请提供的技术方案中,当用户点击观看某个片源时,屏幕显示片源播放界面,用户开启该界面中的字幕开关时,就需要显示字幕信息,用户会选择或随时切换希望观看的字幕的目标语言,对该片源进行解析,获取片源中包括的多条字幕数据,每条字幕数据对应于一种语言,并对多条字幕数据进行逐条解析,可以获取到每条字幕数据的语言识别状态,比如识别到目标语言或者未识别出目标语言,以及当前编码格式下字幕信息的显示状态,比如字幕显示正常或存在乱码等异常,通过字幕数据的语言识别状态结合字幕显示状态,从多条字幕数据中查找与目标语言匹配的目标字幕数据,以及匹配校正字幕时使用的目标编码格式,并在片源播放界面的指定位置处(比如底部)来显示校正后的字幕信息。由于将目标编码格式、目标字幕数据和目标语言三者都调整为一致匹配,因此编码后得到的校正字幕更精准,克服了乱码、字幕与图像不匹配等字幕异常显示的问题,从而提升片源字幕的显示效果,提升用户观看体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要访问的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据一些实施例的显示设备的使用场景;
图2示出了根据一些实施例的控制装置100的硬件配置框图;
图3示出了根据一些实施例的显示设备200的硬件配置框图;
图4示出了根据一些实施例的显示设备200中软件配置图;
图5(a)示例性示出了片源播放界面未开启字幕开关时的示意图;
图5(b)示例性示出了片源播放界面开启字幕开关时的示意图;
图6中示例性示出了字幕选项的界面示意图;
图7中示例性示出了字幕语言选择界面的示意图;
图8中示例性示出了编码列表的界面示意图;
图9(a)中示例性示出了片源播放界面中字幕全部乱码的示意图;
图9(b)中示例性示出了对图9(a)中的字幕进行校正后的示意图;
图10(a)中示例性示出了片源播放界面中字幕局部乱码的示意图;
图10(b)中示例性示出了对图10(a)中的字幕进行校正后的示意图;
图11中示例性示出了字幕校正方法的流程图。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
图1为根据实施例中显示设备的使用场景的示意图。如图1所示,显示设备200还与服务器400进行数据通信,用户可通过智能设备300或控制装置100操作显示设备200。
在一些实施例中,控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信,及其他短距离通信方式中的至少一种,通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等至少一种输入用户指令,来控制显示设备200。
在一些实施例中,智能设备300可以包括移动终端、平板电脑、计算机、笔记本电脑,AR/VR设备等中的任意一种。
在一些实施例中,也可以使用智能设备300以控制显示设备200。例如,使用在智能设备上运行的应用程序控制显示设备200。
在一些实施例中,也可以使用智能设备300和显示设备进行数据的通信。
在一些实施例中,显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制,例如,可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制,也可以通过显示设备200设备外部设置的语音控制装置来接收用户的语音指令控制。
在一些实施例中,显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。
在一些实施例中,一个步骤执行主体执行的软件步骤可以随需求迁移到与之进行数据通信的另一步骤执行主体上进行执行。示例性的,服务器执行的软件步骤可以随需求迁移到与之数据通信的显示设备上执行,反之亦然。
图2示例性示出了根据示例性实施例中控制装置100的配置框图。如图2所示,控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令,且将操作指令转换为显示设备200可识别和响应的指令,起用用户与显示设备200之间交互中介作用。
在一些实施例中,通信接口130用于和外部通信,包含WIFI芯片,蓝牙模块,NFC或可替代模块中的至少一种。
在一些实施例中,用户输入/输出接口140包含麦克风,触摸板,传感器,按键或可替代模块中的至少一种。
图3示出了根据示例性实施例中显示设备200的硬件配置框图。
在一些实施例中,显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。
在一些实施例中控制器包括中央处理器,视频处理器,音频处理器,图形处理器,RAM,ROM,用于输入/输出的第一接口至第n接口。
在一些实施例中,显示器260包括用于呈现画面的显示屏组件,以及驱动图像显示的驱动组件,用于接收源自控制器输出的图像信号,进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控UI界面等。
在一些实施例中,显示器260可为液晶显示器、OLED显示器、以及投影显示器中的至少一种,还可以为一种投影装置和投影屏幕。
在一些实施例中,调谐解调器210通过有线或无线接收方式接收广播电视信号,以及从多个无线或有线广播电视信号中解调出音视频信号,如以及EPG数据信号。
在一些实施例中,通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如:通信器可以包括Wifi模块,蓝牙模块,有线以太网模块等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。显示设备200可以通过通信器220与控制装置100或服务器400建立控制信号和数据信号的发送和接收。
在一些实施例中,检测器230用于采集外部环境或与外部交互的信号。例如,检测器230包括光接收器,用于采集环境光线强度的传感器;或者,检测器230包括图像采集器,如摄像头,可以用于采集外部环境场景、用户的属性或用户交互手势,再或者,检测器230包括声音采集器,如麦克风等,用于接收外部声音。
在一些实施例中,外部装置接口240可以包括但不限于如下:高清多媒体接口接口(HDMI)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(CVBS)、USB输入接口(USB)、RGB端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。
在一些实施例中,控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。
在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如:响应于接收到用于选择在显示器260上显示UI对象的用户命令,控制器250便可以执行与由用户命令选择的对象有关的操作。
在一些实施例中,所述对象可以是可选对象中的任何一个,例如超链接、图标或其他可操作的控件。与所选择的对象有关操作有:显示连接到超链接页面、文档、图像等操作,或者执行与所述图标相对应程序的操作。
在一些实施例中控制器包括中央处理器(Central Processing Unit,CPU),视频处理器,音频处理器,图形处理器(Graphics Processing Unit,GPU),RAM Random AccessMemory,RAM),ROM(Read-Only Memory,ROM),用于输入/输出的第一接口至第n接口,通信总线(Bus)等中的至少一种。
CPU处理器。用于执行存储在存储器中操作系统和应用程序指令,以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。CPU处理器,可以包括多个处理器。如,包括一个主处理器以及一个或多个子处理器。
在一些实施例中,图形处理器,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等中的至少一种。图形处理器包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象;还包括渲染器,对基于运算器得到的各种对象,进行渲染,上述渲染后的对象用于显示在显示器上。
在一些实施例中,视频处理器,用于将接收外部视频信号,根据输入信号的标准编解码协议,进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频处理中的至少一种,可得到直接可显示设备200上显示或播放的信号。
在一些实施例中,视频处理器,包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等中的至少一种。其中,解复用模块,用于对输入音视频数据流进行解复用处理。视频解码模块,用于对解复用后的视频信号进行处理,包括解码和缩放处理等。图像合成模块,如图像合成器,其用于将图形生成器根据用户输入或自身生成的GUI信号,与缩放处理后视频图像进行叠加混合处理,以生成可供显示的图像信号。帧率转换模块,用于对转换输入视频帧率。显示格式化模块,用于将接收帧率转换后视频输出信号,改变信号以符合显示格式的信号,如输出RGB数据信号。
在一些实施例中,音频处理器,用于接收外部的音频信号,根据输入信号的标准编解码协议,进行解压缩和解码,以及降噪、数模转换、和放大处理等处理中的至少一种,得到可以在扬声器中播放的声音信号。
在一些实施例中,用户可在显示器260上显示的图形用户界面(GUI)输入用户命令,则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。
在一些实施例中,“用户界面”,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素中的至少一种。
在一些实施例中,用户接口280,为可用于接收控制输入的接口(如:显示设备本体上的实体按键,或其他等)。
在一些实施例中,显示设备的系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构,它们让用户可以管理文件、运行程序并使用系统。上电后,内核启动,激活内核空间,抽象硬件、初始化硬件参数等,运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后,再加载Shell和用户应用程序。应用程序在启动后被编译成机器码,形成一个进程。
参见图4,在一些实施例中,将系统分为四层,从上至下分别为应用程序(Applications)层(简称“应用层”),应用程序框架(Application Framework)层(简称“框架层”),安卓运行时(Android runtime)和系统库层(简称“系统运行库层”),以及内核层。
在一些实施例中,应用程序层中运行有至少一个应用程序,这些应用程序可以是操作系统自带的窗口(Window)程序、系统设置程序或时钟程序等;也可以是第三方开发者所开发的应用程序。在具体实施时,应用程序层中的应用程序包不限于以上举例。
框架层为应用程序层的应用程序提供应用编程接口(application programminginterface,API)和编程框架。应用程序框架层包括一些预先定义的函数。应用程序框架层相当于一个处理中心,这个中心决定让应用层中的应用程序做出动作。应用程序通过API接口,可在执行中访问系统中的资源和取得系统的服务。
如图4所示,本申请实施例中应用程序框架层包括管理器(Managers),内容提供者(Content Provider)等,其中管理器包括以下模块中的至少一个:活动管理器(ActivityManager)用与和系统中正在运行的所有活动进行交互;位置管理器(Location Manager)用于给系统服务或应用提供了系统位置服务的访问;文件包管理器(Package Manager)用于检索当前安装在设备上的应用程序包相关的各种信息;通知管理器(NotificationManager)用于控制通知消息的显示和清除;窗口管理器(Window Manager)用于管理用户界面上的括图标、窗口、工具栏、壁纸和桌面部件。
在一些实施例中,活动管理器用于管理各个应用程序的生命周期以及通常的导航回退功能,比如控制应用程序的退出、打开、后退等。窗口管理器用于管理所有的窗口程序,比如获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕,控制显示窗口变化(例如将显示窗口缩小显示、抖动显示、扭曲变形显示等)等。
在一些实施例中,系统运行库层为上层即框架层提供支撑,当框架层被使用时,安卓操作系统会运行系统运行库层中包含的C/C++库以实现框架层要实现的功能。
在一些实施例中,内核层是硬件和软件之间的层。如图4所示,内核层至少包含以下驱动中的至少一种:音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB驱动、HDMI驱动、传感器驱动(如指纹传感器,温度传感器,压力传感器等)、以及电源驱动等。
以上实施例介绍了显示设备的硬件/软件架构以及功能实现等内容。显示设备中一般设置有主页,主页中可显示有各种类型的推荐媒资,比如教育、影视、少儿等类型,用户可以直接在主页中选择推送的媒资作为片源,也可启动显示设备中安装的应用,比如腾讯视频、YouTube等,并观看应用中的片源。
用户在观看片源时,往往有同步观看字幕的习惯,比如片源播放时采用非母语的语种,用户就可观看翻译后的字幕来获知与画面对应的音频信息;又比如对于具有听力障碍的用户,可以通过字幕来获知无法听取的音频信息,因此每个片源基本都具有字幕属性,即片源除音视频数据外,一般还配置对应的字幕数据,通过解析字幕数据以及进行字幕编码,即可将字幕数据转换为用户能阅读感知的字幕信息,字幕信息显示需要与音频播放保持同步,从而保证字幕信息与片源画面的一致性,避免出现字幕与图像不匹配的问题。
在一些实施例中,各用户对字幕的需求不同,比如有听力和语言障碍的用户更依赖于观看字幕,而某些用户更注重画面观感,不喜欢字幕展示,因此可以在片源播放界面中的指定位置,比如界面右上角设置字幕开关控件,用户通过触发字幕开关控件,即可选择是否显示字幕信息。如图5(a)所示,当字幕开关未开启时,界面仅播放片源的视频画面;若用户想要观看字幕,则点击字幕开关控件,使之处于开启状态,则如图5(b)所示,界面中不仅显示片源的视频画面,还会在界面的指定位置,比如视频画面的底部,同步显示编码后的字幕信息,用户可一边观看视频画面,一边参照字幕信息来观赏片源。其中,字幕信息比如可采用浮层展示效果,确保字幕信息不会覆盖和遮挡视频画面,提升用户体验。
在一些实施例中,显示设备可以设置相应的字幕选项,便于用户预设和更新字幕的展示效果。比如用户可以通过“设置”(Settings)菜单或者片源播放界面上设置的控件进入字幕选项,如图6所示,字幕选项的界面包括“字幕语言”、“字幕位置”、“字幕大小”、“字幕字体”、“字幕颜色”、“背景颜色”和“编码格式”等选项。用户可以通过“字幕语言”选项来设定字幕所使用的目标语言,当用户点击“字幕语言”后,界面跳转到如图7所示的字幕语言选择界面,该界面中展示有当前片源能支持的全部字幕语言的标识,以供用户从中选择,这里所述的标识可以是语言的简称、全称或预设名称等形式,比如日语的标识为jpn、Japanese或subtitle track 5,subtitle track 5仅为日语的一种示意性的预设名称,预设名称的命名不作限定。图7中在各项语言标识的最下方还可设置有off选项,该示例中如果用户选择某个目标语言,则默认自动开启了字幕开关,如果用户选项off,则为关闭字幕开关,片源播放界面中不会显示任何一种语言的字幕信息。此外,字幕选项的界面还支持用户自定义字幕信息的展示位置、字体、字幕大小、字体颜色、字幕背景颜色和编码格式等内容,从而使字幕效果满足用户所需。
在一些实施例中,当用户在字幕选项中点击“编码格式”时,界面跳转到编码列表,编码列表中显示有本机支持全部编码格式,如图8所示,编码列表比如可逐行展示每种编码格式,编码格式包括但不限于Auto、ASCI、BIG5(中文繁体)、GB18030(中文简体)、ISO8859-2(东欧)、ISO8859-5(西里尔/Cyrillic)、ISO8859-7(希腊)、ISO8859-9(土耳其)等,字幕编码格式与语言类型有关。用户可以在编码列表中,参照每种编码格式及其对应标注的语言,选择其中一种作为本机默认的字幕编码格式。
在实际应用中,由于不同片源的字幕属性不同,本机的当前编码格式可能与待解析的字幕数据不匹配,导致利用当前编码格式对字幕数据进行编码后,字幕信息显示异常,如图9(a)所示,字幕信息全部出现乱码,比如字幕呈现一长串的
Figure BDA0002830492950000071
的异常字符,这类字符不是任何语言中的字母元素,用户无法识别,因此用户根本无法获知有效的字幕信息;如图10(a)所示,示出了字幕出现局部乱码的情况,用户可以看到一部分有效字幕,但字幕信息中仍夹杂有无法识别的异常字符,导致用户无法获知清楚完整的字幕信息,而一旦某些关键信息显示异常,仍会导致用户无法理解字幕信息的含义或者出现理解偏差,从而导致字幕与图像不符,降低用户对片源的观赏体验,因此在显示片源字幕时,有必要对编码格式进行校正和更新,以确保编码格式与字幕数据匹配,克服字幕显示异常的缺陷。
对此在一些实施例中,在开启字幕开关时,用户输入目标语言后,可根据每条字幕数据的语言识别状态,以及当前编码格式下字幕信息的显示状态,确定与目标语言匹配的目标字幕数据和目标编码格式;利用目标编码格式对目标字幕数据进行编码,得到校正后的字幕信息,在片源播放界面的指定位置处显示所述校正后的字幕信息。当用户点击观看某个片源时,对该片源进行解析,获取片源中包括的多条字幕数据,每条字幕数据对应一种语言,并对多条字幕数据进行逐条解析,可以获取到字幕数据的语言识别状态,比如识别到该字幕数据中包含有目标语言的标识或者未识别出目标语言的标识,以及当前编码格式下字幕信息的显示状态,比如字幕显示正常或存在乱码等异常,通过字幕数据的语言识别状态结合字幕显示状态,从多条字幕数据中查找与目标语言匹配的目标字幕数据,以及匹配校正字幕时使用的目标编码格式,并在片源播放界面的指定位置处(比如底部)来显示校正后的字幕信息。
在一些实施例中,假设片源为demo.mp4,片源按照语言划分,一般可包括多条字幕数据,即每条字幕数据对应一种语言,首先对片源进行解析,获取到片源的多条字幕数据,之后对每条字幕数据继续解析,比如解析后的字幕格式如下所示:
Figure BDA0002830492950000082
其中,subtitle track index表示字幕数据的编号;language表示字幕数据对应的语言,比如eng为国际英语,fre为法语,ita为意大利语,jpn为日语等;其中und为无法识别出具体语言时备注的标识,即本申请中命名的预设标识,预设标识不作具体限定;trackType:3表明数据类型为字幕;create subtitle代表字幕类型,比如text/srt表示文本型字幕,text/vobsub表示图片型字幕。图片型字幕属于非文本型字幕,无需进行编码,也就不涉及编码格式的校正问题,因此本申请提供的字幕校正方案适用于文本型字幕。以上对字幕数据解析后得到的字幕格式仅仅是示例性的,其字符标识的设定以及格式等内容可以根据实际情况进行配置,具体以实际应用为准。片源的多条字幕数据中,可能无带有预设标识的字幕数据,或者包括一个或多个带有预设标识的字幕数据。
在一些实施例中,通过解析后的字幕数据中的language,即可获取每条字幕数据的语言识别状态,当language为可识别的语言类型(比如上述字幕格式示例中的非und)时,即可判断language对应的语言标识是否指示为目标语言,如果是,即查找到了与目标语言匹配的目标字幕数据,后续需要利用匹配到的目标编码格式对该目标字幕数据进行编码。
在查找到与目标语言匹配的目标字幕数据之后,可以利用语言-编码列表来确定与目标语言相匹配的目标编码格式。由于每种语言都有各自对应的编码格式,因此显示设备端可以维护一个语言-编码列表,该列表中记录有每种语言与其编码格式之间的对应关系,只有将字幕语言设置为对应的编码格式,才能使字幕正常显示,语言-编码列表的示例如下表1所示:
表1
Figure BDA0002830492950000081
Figure BDA0002830492950000091
比如,用户在片源demo.mp4的“字幕语言”中选择目标语言为英文,则可以遍历前述编号1~6的各条字幕数据,能在前述编号为1的字幕数据language中识别到英文标识eng,编号为1的字幕数据则为片源demo.mp4的英文字幕数据,即查找到了目标字幕数据,然后在语言-编码列表中即可查找到eng对应的编码格式为ASCI,从而确定目标语言对应的目标编码格式为ASCI,则利用ASCI对编号1的字幕数据进行编码,得到字幕信息,并按照图6中用户对字幕显示位置、大小和颜色等格式的设置去展示字幕信息。
如果遍历各条字幕数据后,未能查找到与目标语言匹配的语言标识,比如用户选择的目标语言为中文简体,中文简体的标识是chs,而片源demo.mp4的各条字幕数据中,能识别的语言标识都不是chs,其中编号为5的字幕数据中language为und,它实际对应的语言很可能是中文简体,但由于无法准确识别具体语言,也就不适用语言-编码列表去确定目标编码格式。
对此在一些实施例中,可以将包含预设标识的字幕数据作为目标字幕数据,利用当前编码格式对所述目标字幕数据进行编码,得到第一字幕信息,然后采用基于字符串匹配的方式,确定第一字幕信息是否显示有异常字符,例如正常的字幕信息应显示为“Teachthis is a serious problem for me!Oh,right!Right!Out,out!”,而异常的字幕信息则可能显示如
Figure BDA0002830492950000092
或者
Figure BDA0002830492950000093
等形式,即字幕信息中的字符串出现乱码,显示有一些异常字符,显示设备端可以存储有异常字符集合,该集合中记录有字幕异常时经常显示的乱码字样,将编码后的字幕信息中的字符串与异常字符集合进行比对,即可确定字幕信息中是否存在异常字符。
如果当前编码格式所编码的第一字幕信息中存在异常字符,即说明当前编码格式一定与目标字幕数据不匹配,满足字幕校正的条件,则将当前编码格式切换为编码列表中的下一个编码格式,比如当前编码格式为Auto,但Auto匹配失败,则参照图8中的编码列表,将当前编码格式由Auto切换为ASCI,然后利用ASCI再次编码当前的目标字幕数据,并重复前述利用异常字符集合进行字串符匹配的流程,以此类推,遍历编码列表,直至第一字幕信息中无显示异常字符为止。
在一些实施例中,若当前编码格式所编码的第一字幕信息中未识别到异常字符,仍不能直接确定字幕的准确性,这是由于字幕信息中可能会出现未录入在异常字符集合中的新字符,为避免新异常字符的漏识别,在前述初步校正的基础上,还需要对字幕信息做进一步精校正,具体可利用语言字母集合对所述第一字幕信息进行字符串匹配。
在一些实施例中,显示设备中可以维护一个语言字母集合,其包括多种语言中涉及的基本字母,比如英文中包括26个字母[ABCDEFGHIJKLMN…],希伯来语中包括
Figure BDA0002830492950000094
Figure BDA0002830492950000095
当前编码格式对目标字幕数据编码后,得到第一字幕信息,将第一字幕信息中各字符串的字母依次与语言字母集合进行比对,如果字符串中的字母都能在语言字母集合中找到,则该字符串匹配成功,如果第一字幕信息中所有的字符串都匹配成功,即认为当前编码格式与字幕数据匹配,当前编码格式即为目标编码格式。比如,第一字幕信息为“I am fine”,该字幕信息没有识别出异常字符,其被空格字符分割开三个字符串,其中I、am和fine中的每个字母都包含于26个英文字母集合中,因此该第一字幕信息是正常字幕,当前编码格式是匹配的目标编码格式。
在一些实施例中,如果第一字幕信息至少有一个字符串未能在语言字幕集合中匹配成功,则说明第一字幕信息中包含不是语言字母并且系统无法识别的新异常字符,则说明当前编码格式不匹配,则需要将当前编码格式切换为编码列表中的下一个编码格式,以此类推,遍历编码列表,直至第一字幕信息中的全部字符串都能通过语言字母集合匹配成功为止。通过这种循环定位目标编码格式的方案,即可在编码列表中准确筛选出匹配的编码格式,然后利用更新后的目标编码格式校正字幕,即可排除字幕异常,保证字幕显示的准确性和匹配性。如图9(b)所示,通过本方案可以将全部乱码的字幕信息校正准确;如图10(b)所示,可以将局部乱码一并校正,为用户提供清楚、完整的字幕信息,提升片源和字幕的观看体验。
在一些实施例中,当未能查找到与目标语言匹配的语言标识时,如果包括多个带有预设标识的字幕数据,则最终校正显示的字幕数据只能是其中之一,因此可以将多个目标字幕数据匹配编码格式后的字幕信息的语言与用户设定的目标语言进行比较,筛选出与目标语言相同的字幕信息进行显示,从而完成字幕信息的校正。
在一些实施例中,控制器可以通过调用播放器固有接口来设置和切换编码格式。
在一些实施例中,如图11所示,提供一种字幕校正方法,所述方法是由控制器250配置执行,即控制器250为本方法的执行主体,所述方法包括如下程序步骤:
步骤S10,对片源进行解析,获取片源包括的多条字幕数据。
步骤S20,对获取的多条字幕数据进行逐条解析。
步骤S30,识别字幕数据是否为文本型字幕。如果是文本型字幕,则继续执行步骤S40,反之则说明当前此条字幕数据为图片型字幕等非文本型,不适用于本申请提供的字幕校正流程,则执行步骤S120。
步骤S40,判断是否查找到与目标语言匹配的语言标识。如果能查找到与目标语言匹配的语言标识,则执行步骤S50,反之则执行步骤S60。
步骤S50,从语言-编码列表中获取目标语言对应的目标编码格式,利用目标编码格式对目标字幕数据进行编码,得到校正后的字幕信息,并在片源播放界面的指定位置处显示校正后的字幕信息。其中,目标字幕数据是与目标语言匹配的语言标识所对应的字幕数据。
步骤S60,将包含预设标识的字幕数据作为目标字幕数据,利用当前编码格式对所述目标字幕数据进行编码,得到第一字幕信息。
步骤S70,确定第一字幕信息中是否显示有异常字符。如果未显示有异常字符,则执行步骤S80,反之则执行步骤S110。
步骤S80,利用语言字母集合对第一字幕信息进行字符串匹配。
步骤S90,判断第一字幕信息中的字符串是否都能在语言字母集合中匹配到。如果字符串匹配成功,则执行步骤S100,反之则执行步骤S110。
步骤S100,确定当前编码格式为目标编码格式,利用目标编码格式对目标字幕数据进行编码,得到校正后的字幕信息,并在片源播放界面的指定位置处显示校正后的字幕信息。
步骤S110,将当前编码格式切换为编码列表中的下一个编码格式,实现编码列表中编码格式的循环定位和匹配。
步骤S120,确认校正方案不适用于当前的字幕数据,则不对当前的字幕数据进行校正处理。
由以上技术方案可知,首先根据每条字幕数据中的语言识别状态,当识别到目标语言的标识时,即查找到目标字幕数据,并利用语言-编码列表来匹配目标语言对应的目标编码格式,匹配效率高且准确;当未识别到目标语言的标识时,利用字幕信息的显示状态,进行异常字符识别,进一步结合语言字幕集合进行字符串匹配,进行初步校正和进一步精校正,使得字幕数据、语言和编码格式都调整为一致匹配,因此编码后得到的校正字幕更精准,克服了乱码、字幕与图像不匹配等字幕异常显示的问题,从而提升片源字幕的显示效果,提升用户观看体验。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。具体实现中,本发明还提供一种计算机存储介质,该计算机存储介质可存储有程序。当计算机存储介质位于显示设备200中时,该程序执行时可包括前述控制器250被配置执行的字幕校正方法涉及的程序步骤。其中,计算机存储介质可为磁碟、光盘、只读存储记忆体(英文:Read-Only Memory,简称ROM)或随机存储记忆体(英文:Random Access Memory,简称RAM)等。
本说明书中显示设备实施例和方法实施例之间相同相似的部分互相参照即可,相关内容不再赘述。本申请中示出的UI界面图仅仅是示例性的,具体以实际应用的界面设计为准。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims (6)

1.一种显示设备,其特征在于,包括:
显示器,用于在播放片源时显示字幕信息;
控制器,被配置为执行:
响应于起播片源操作,控制显示器显示片源播放界面;
根据用户设置的编码格式和目标语言,在所述片源播放界面上显示字幕信息;
在检测到所述字幕信息显示异常时,获取所述字幕信息映射的多个字幕数据,所述字幕数据中包含语言类型;
根据所述目标语言,从多个字幕数据中确定目标字幕数据,如果从多个字幕数据中未查找到所述目标字幕数据,则将包含预设标识的字幕数据作为所述目标字幕数据;其中,所述预设标识为未识别到字幕数据的语言类型时设置的标识;利用当前编码格式对所述目标字幕数据进行编码,得到第一字幕信息;确定所述第一字幕信息中是否显示有异常字符;如果所述第一字幕信息中未显示有异常字符,则利用语言字母集合对所述第一字幕信息进行字符串匹配;如果所述第一字幕信息中的字符串都能在所述语言字母集合中匹配到,则确定当前编码格式为所述目标编码格式;如果所述第一字幕信息中至少存在一个字符串未能在所述语言字母集合中匹配到,则切换到编码列表中当前编码格式的下一个编码格式,并重新生成所述第一字幕信息,直至在所述编码列表中定位到所述目标编码格式;其中,所述编码列表中记录有显示设备支持的字幕的编码格式;
利用所述目标编码格式对所述目标字幕数据进行编码,得到校正后的字幕信息;
控制显示器在所述片源播放界面上显示所述校正后的字幕信息。
2.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为按照如下方式确定所述目标字幕数据和所述目标编码格式:
从多条字幕数据中查找与所述目标语言一致的所述目标字幕数据;
如果从多个字幕数据中查找到所述目标字幕数据,则从语言-编码列表中获取所述目标语言对应的所述目标编码格式;其中,所述语言-编码列表中记录有语言与编码格式之间的对应关系。
3.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为按照如下方式确定所述目标编码格式:
如果所述第一字幕信息中显示有异常字符,则切换到所述编码列表中当前编码格式的下一个编码格式,并重新生成所述第一字幕信息,直至在所述编码列表中定位到所述目标编码格式。
4.根据权利要求1所述的显示设备,其特征在于,所述字幕数据中还包含字幕类型,所述控制器还被配置为执行:
在检测到所述字幕信息显示异常时,查询当前被编码的字幕数据的字幕类型;
如果当前被编码的字幕数据为文本型字幕,则对所述字幕信息进行校正。
5.一种字幕校正方法,其特征在于,包括:
响应于起播片源操作,显示片源播放界面;
根据用户设置的编码格式和目标语言,在所述片源播放界面上显示字幕信息;
在检测到所述字幕信息显示异常时,获取所述字幕信息映射的多个字幕数据,所述字幕数据中包含语言类型;
根据所述目标语言,从多个字幕数据中确定目标字幕数据,如果从多个字幕数据中未查找到所述目标字幕数据,则将包含预设标识的字幕数据作为所述目标字幕数据;其中,所述预设标识为未识别到字幕数据的语言类型时设置的标识;利用当前编码格式对所述目标字幕数据进行编码,得到第一字幕信息;确定所述第一字幕信息中是否显示有异常字符;如果所述第一字幕信息中未显示有异常字符,则利用语言字母集合对所述第一字幕信息进行字符串匹配;如果所述第一字幕信息中的字符串都能在所述语言字母集合中匹配到,则确定当前编码格式为所述目标编码格式;如果所述第一字幕信息中至少存在一个字符串未能在所述语言字母集合中匹配到,则切换到编码列表中当前编码格式的下一个编码格式,并重新生成所述第一字幕信息,直至在所述编码列表中定位到所述目标编码格式;其中,所述编码列表中记录有显示设备支持的字幕的编码格式;
利用所述目标编码格式对所述目标字幕数据进行编码,得到校正后的字幕信息;
在所述片源播放界面上显示所述校正后的字幕信息。
6.根据权利要求5所述的方法,其特征在于,按照如下方式确定所述目标字幕数据和所述目标编码格式:
从多条字幕数据中查找与所述目标语言一致的所述目标字幕数据;
如果从多个字幕数据中查找到所述目标字幕数据,则从语言-编码列表中获取所述目标语言对应的所述目标编码格式;其中,所述语言-编码列表中记录有语言与编码格式之间的对应关系。
CN202011441956.7A 2020-12-11 2020-12-11 一种字幕校正方法及显示设备 Active CN112580302B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011441956.7A CN112580302B (zh) 2020-12-11 2020-12-11 一种字幕校正方法及显示设备
PCT/CN2021/119628 WO2022121436A1 (zh) 2020-12-11 2021-09-22 一种字幕调整方法及显示设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011441956.7A CN112580302B (zh) 2020-12-11 2020-12-11 一种字幕校正方法及显示设备

Publications (2)

Publication Number Publication Date
CN112580302A CN112580302A (zh) 2021-03-30
CN112580302B true CN112580302B (zh) 2023-07-14

Family

ID=75130744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011441956.7A Active CN112580302B (zh) 2020-12-11 2020-12-11 一种字幕校正方法及显示设备

Country Status (1)

Country Link
CN (1) CN112580302B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113271503A (zh) * 2021-05-21 2021-08-17 青岛海信传媒网络技术有限公司 字幕信息的显示方法及显示设备
CN113873221B (zh) * 2021-08-27 2023-07-18 深圳市九洲电器有限公司 字幕失真性检测方法、多媒体终端、服务器以及存储介质
WO2023071349A1 (zh) * 2021-10-27 2023-05-04 海信视像科技股份有限公司 显示设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100939860B1 (ko) * 2004-06-18 2010-01-29 파나소닉 주식회사 재생장치, 재생방법
JP2008078998A (ja) * 2006-09-21 2008-04-03 Orion Denki Kk コンテンツ再生装置及びテキスト言語判別プログラム
CN101771846B (zh) * 2009-01-04 2012-02-29 联想(北京)有限公司 一种字幕校准的方法和电子设备
CN102194503B (zh) * 2010-03-12 2014-08-27 腾讯科技(深圳)有限公司 一种播放器及字幕文件的字符编码检测方法和装置
CN102595082A (zh) * 2012-01-30 2012-07-18 深圳创维-Rgb电子有限公司 电视机自动显示多格式隐藏字幕方法和系统
CN104516862B (zh) * 2013-09-29 2018-05-01 北大方正集团有限公司 一种选择读取目标文档的编码格式的方法及其系统
US9456170B1 (en) * 2013-10-08 2016-09-27 3Play Media, Inc. Automated caption positioning systems and methods
CN105898517A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 字幕显示控制方法及装置
CN108600856A (zh) * 2018-03-20 2018-09-28 青岛海信电器股份有限公司 视频文件中外挂字幕语言的识别方法及装置
CN111131871B (zh) * 2019-12-03 2021-03-19 海信视像科技股份有限公司 一种播放节目时显示epg用户界面的方法及显示设备

Also Published As

Publication number Publication date
CN112580302A (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
CN112580302B (zh) 一种字幕校正方法及显示设备
CN111447498A (zh) 显示设备的唤醒方法及显示设备
CN111432256A (zh) 显示设备和电子节目指南的呈现方法
CN111836115B (zh) 一种屏保展示方法、屏保跳转方法及显示设备
CN112506400A (zh) 一种页面信息语音播报方法及显示设备
WO2021109489A1 (zh) 显示设备和电子节目指南的呈现方法
CN112752156A (zh) 字幕调整方法及显示设备
CN112087671A (zh) 一种输入法控件的操控提示信息的显示方法及显示设备
CN112584229B (zh) 一种显示设备切换频道的方法及显示设备
CN112055245B (zh) 一种彩色字幕实现方法及显示设备
CN113992960A (zh) 显示设备上字幕预览方法及显示设备
CN113453069B (zh) 一种显示设备及缩略图生成方法
CN113703705A (zh) 显示设备及列表更新方法
CN112668546A (zh) 视频缩略图显示方法及显示设备
CN113490030A (zh) 一种显示设备及频道信息展示方法
CN112817679A (zh) 一种显示设备和界面显示方法
CN112911381A (zh) 一种显示设备、模式调整方法、设备及介质
CN112261463A (zh) 显示设备及节目推荐方法
CN115150667B (zh) 显示设备及广告播放方法
WO2022121436A1 (zh) 一种字幕调整方法及显示设备
CN113766164B (zh) 显示设备及信号源界面显示方法
CN113596563B (zh) 一种背景色展示方法以及显示设备
CN113076042B (zh) 一种本地媒体资源的访问方法及显示设备
CN115396717B (zh) 显示设备及显示画质调节方法
WO2022174751A1 (zh) 一种显示方法和显示设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant