CN101771846B - 一种字幕校准的方法和电子设备 - Google Patents
一种字幕校准的方法和电子设备 Download PDFInfo
- Publication number
- CN101771846B CN101771846B CN200910076471XA CN200910076471A CN101771846B CN 101771846 B CN101771846 B CN 101771846B CN 200910076471X A CN200910076471X A CN 200910076471XA CN 200910076471 A CN200910076471 A CN 200910076471A CN 101771846 B CN101771846 B CN 101771846B
- Authority
- CN
- China
- Prior art keywords
- character
- repertoire
- captions
- comparing result
- electronic equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明提供一种字幕校准的方法和电子设备,其中方法应用于一电子设备,电子设备包括一个显示屏,显示屏上显示有一字幕,字幕由至少一个字符组成,电子设备的字符库中包括第一字符库、参考字符编码库和字幕默认输出编码库,方法包括:从字幕中,获取一字符;将字符与第一字符库进行对比,得到第一对比结果;当第一对比结果表明字符属于第一字符库,根据参考字符编码库对字符进行解码,当字符属于参考字符编码库的文字时,得到一参考字符;将参考字符根据字幕默认输出编码库解码,得到一字幕默认的字符并显示。本发明实施例在对视频文件中的字幕进行解码的过程中,通过实现参考字符与默认字符之间的转换过程,剔除了那些被解码为乱码的字符的编码。
Description
技术领域
本发明涉及视频技术,特别是指一种字幕校准的方法和电子设备。
背景技术
电子文件,特别是内嵌字幕的视频文件,例如MKV(一种视频编码规范)等,由于种种原因常常会出现错乱的字符,这些错乱的字符通常不符合电子设备的字符库所采用的编码规范;特别是在播放字幕的过程中,由于最后一个字符的后面缺少正确的结尾标志符,在解码时无法判断字幕的终止位置,使得解码后输出了乱码。
发明人在实现本发明的过程中,发现现有技术中至少存在如下问题:由于电子文件中的字幕不符合编码格式或者结尾处缺少正确的结束标志符,在显示的过程中出现乱码,给用户带来极大不便。
发明内容
本发明的目的是提供一种字幕校准的方法和电子设备,解决电子文件中的字幕不符合编码格式,在显示的过程中经常出现乱码的缺陷。
一种字幕校准的方法,应用于一电子设备,所述电子设备包括一个显示屏,所述显示屏上显示有一字幕,所述字幕由至少一个字符组成,所述电子设备支持一字符库;所述字符库中至少包括有第一字符库、参考字符编码库和字幕默认输出编码库,所述方法包括:从所述字幕中,获取一字符;将所述字符与所述第一字符库进行对比,得到第一对比结果;当所述第一对比结果表明所述字符属于所述第一字符库时,对所述字符进行解码;根据所述参考字符编码库对所述字符进行解码,当所述字符属于所述参考字符编码库的文字时,得到一参考字符;将所述参考字符根据所述字幕默认输出编码库进行解码转换,得到一字幕默认的字符并显示。
一种字幕校准的电子设备,包括一显示单元,包括:字符获取单元,用于在一字幕中,获取一字符;第一编码单元,用于将所述字符与所述第一字符库进行对比,得到第一对比结果;当所述第一对比结果表明所述字符属于所述第一字符库时,通知一参考字符解码单元;参考字符解码单元,用于根据一参考字符编码库对所述字符进行解码,生成一参考字符;默认字符解码单元,用于根据一字幕默认输出编码库对所述参考字符进行解码,生成一默认字符,通知所述显示单元进行显示。
本发明的实施例具有以下有益效果,在对视频文件中的字幕进行解码的过程中,通过实现参考字符与默认字符之间的转换过程,剔除了那些被解码为乱码的字符,给用户带来舒适的视觉感受。
附图说明
图1为本发明实施例一种字幕校准的方法流程示意图一;
图2为本发明实施例一种字幕校准的方法流程示意图二;
图3为本发明实施例在计算机实现字幕校准的方法流程示意图;
图4为本发明实施例实现字幕校准的电子设备结构图一;
图5为本发明实施例实现字幕校准的电子设备结构图二。
具体实施方式
为使本发明的目的、技术特征和实施效果更加清楚,下面将结合附图及具体实施例对本发明的技术方案进行详细描述。本发明提供的实施例中,在不必对解码器解码字幕部分进行优化的前提下,对解码出的字幕进行修复,去除乱码。
本发明实施例中,如图1所示,提供一种字幕校准的方法,应用于一电子设备,所述电子设备包括一个显示屏,所述显示屏上显示有一字幕,所述字幕由至少一个字符组成,所述电子设备支持一字符库;所述字符库中至少包括有第一字符库、参考字符编码库和字幕默认输出编码库;所述方法包括:
步骤101.从所述字幕中,获取一字符;
步骤102.将所述字符与所述第一字符库进行对比,得到第一对比结果;
步骤103.当所述第一对比结果表明所述字符属于所述第一字符库时,对所述字符进行解码;
步骤104.根据一参考字符编码库对所述字符进行解码,生成一参考字符;
根据一字幕默认输出编码库对所述参考字符进行解码,生成一所述默认字符并显示。
其中,步骤102中,判断字符是否在电子设备所支持的第一字符库的范围内;由于所给出的第一对比结果不是十分准确的,因此即使第一对比结果表示该字符在第一字符库的范围内也不能说明该字符可以正确显示,还需要进一步通过步骤104中的解码操作来进一步确定,此时不在参考字符编码库和字幕默认输出编码库的范围内则一定无法正常显示。
应用本实施例提供的技术,在参考字符与默认字符之间的转换过程中,剔除了那些被解码为乱码的字符,避免了在显示的过程中出现乱码。
以计算机或者移动终端为例,其字符库不仅支持第一字符库,而且支持第二字符库,如图2所示,包括:
步骤201.从所述字幕中,获取一字符。
步骤202.将所述字符与所述第一字符库进行对比,得到第一对比结果;之后还包括:
步骤203.当所述第一对比结果表明所述字符不属于所述第一字符库时,将所述字符与所述第二字符库进行对比,得到第二对比结果。
步骤204.当所述第二对比结果表明所述字符属于所述第二字符库时,对所述字符进行解码。
需要说明的是,由于各种类型语言或者特殊符号的字符库有很多,例如同一个计算机中支持法文、俄文、日文,以及特殊或复杂的数学符号、物理符号等;因此实际上在所述第一字符库之外,可以不仅仅只有一个所述第二字符库,即,可以有更多的字符库:第三字符库、第四字符库......。
步骤205.根据一参考字符编码库对所述字符进行解码,生成一参考字符;
根据一字幕默认输出编码库对所述参考字符进行解码,生成一所述默认字符并显示。
由于计算机大多均支持美国标准信息交换码(ASCII,American StandardCode for Information Interchange)码或者Unicode码,因此以ASCII作为第一字符库,以统一码(Unicode)作为第二字符库,以UTF-8(UNICODE的一种变长字符)编码规范作为所述字幕默认输出编码库,以GB2312编码规范作为所述参考字符编码库。如图3所示,应用于视频解码过程,包括:
步骤301.获取字幕中的一个字符。
如果出于优化的考虑,仅对一段字幕中的最后一个字符进行验证,则需要:根据该字幕的初始位置和偏移量,计算所述字幕中最后一个字符的位置,在该位置处截取该字符。
步骤302.判断是否为ASCII码或者标点符号,如果是,转步骤304;否则转步骤303。
需要说明的是,此处也可以进行等同替换,例如首先判断是否为Unicode码,如果是,转步骤304;否则转步骤303。
所述第一字符库包含的编码规则是所述第二字符库包含的编码规则的真子集;或者,所述第一字符库包含的编码规则与所述第二字符库包含的编码规则之间具有交集。
需要说明的是,在本申请中,例如以ASCII为第一字符库,以Unicode为第二字符库,由于Unicode是最近若干年发展起来的一种统一的编码规范,因此可以认为ASCII是Unicode的真子集;而UTF-8是在Unicode的基础上发展起来,并加入了一些新的规则,因此可以认为UTF-8与Unicode之间具有交集。
步骤303.判断是否为一Unicode支持的中文字符,如果是,转步骤304,否则丢弃该字符,并转步骤301。
即,所述以所述第一字符库验证不支持对所述字符解码之后,还包括:以所述第二字符库验证所述字符不通过,则丢弃该字符,并在所述字幕中,获取下一个字符。
步骤304.转换为一GB2312编码规范所支持的对应字符,该对应字符为参考字符。
步骤305.将所述参考字符转换为一UTF-8编码规范所包含的字符,称为默认字符。
步骤306.显示输出默认字符。
其中,上述实施例中,所述字幕默认输出编码库支持所述第一字符库;和/或,所述字幕默认输出编码库支持所述第二字符库。
所述第一字符库包含的字符是所述第二字符库包含的字符的真子集;或者,所述第一字符库包含的字符与所述第二字符库包含的字符之间具有交集。
所述字符库中仅包括一所述第一字符库;将所述字符与所述第一字符库进行对比,得到第一对比结果,之后还包括:当所述第一对比结果表明所述字符不属于所述第一字符库时,丢弃该所述字符,并在所述字幕中,获取下一个字符。
由于通常是在一字幕的结尾处,即,最后一个字符的后面缺少结束标志,在解码时无法判断字幕的终止位置,使得解码后输出了乱码,因此,本实施例中,根据该字幕的初始位置和偏移量,计算所述字幕中最后一个字符的位置,在该位置处获取该字符。
应用本实施例提供的技术,在对视频文件中的字幕进行解码的过程中,通过实现参考字符与默认字符之间的转换过程,剔除了那些被解码为乱码的字符,即,将不符合该两种编码规范的字符滤除,剩下的就是完全符合的字符。根据日常经验以及测算,通过以上步骤可以滤除原始字幕中90%以上的非法字符和乱码,剩下的10%大部分为英文字母和标点符号;而如果是在中文字幕的情况下,根据统计可滤除95%以上的中文字幕结尾处的乱码。
与以上提供的方法对应,本发明实施例还提供了一种字幕校准的电子设备,如图4所示,包括:
字符获取单元401,用于在一字幕中,获取一字符;
第一编码单元402,用于将所述字符与所述第一字符库进行对比,得到第一对比结果;当所述第一对比结果表明所述字符属于所述第一字符库时,通知一参考字符解码单元403;
参考字符解码单元403,用于根据一参考字符编码库对所述字符进行解码,生成一参考字符;
默认字符解码单元404,用于根据一字幕默认输出编码库对所述参考字符进行解码,生成一默认字符,通知所述显示单元405进行显示。
显示单元405,用于显示字幕中的字符。
应用本实施例提供的技术,在参考字符与默认字符之间的转换过程中,剔除了那些被解码为乱码的字符的编码,避免了在显示的过程中出现乱码。
为完善电子设备的功能,如图5所示,还可以包括:
第二编码单元407,用于当所述第一对比结果表明所述字符不属于所述第一字符库时,将所述字符与一第二字符库进行对比,得到第二对比结果。
由于通常是在一字幕的结尾处,即,最后一个字符的后面缺少正确的结束标志符,在解码时无法判断字幕的终止位置,使得解码后输出了乱码,因此,本实施例中,字符获取单元401还可以具体是一字幕尾码获取单元406,为字符获取单元401的具体实现形式之一,用于在一字幕中,根据该字幕的初始位置和偏移量,计算所述字幕中最后一个字符的位置,在该位置处截取该字符。
本发明的实施例具有以下有益效果,在对视频文件中的字幕进行解码的过程中,通过实现参考字符与默认字符之间的转换过程,剔除了那些被解码为乱码的字符,给用户带来舒适的视觉感受。
应当说明的是,以上实施例仅用以说明本发明的技术方案而非限制,所有的参数取值可以根据实际情况调整,且在该权利保护范围内。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种字幕校准的方法,应用于一电子设备,所述电子设备包括一个显示屏,所述显示屏上显示有一字幕,所述字幕由至少一个字符组成,所述电子设备支持一字符库;所述字符库中至少包括有第一字符库、参考字符编码库和字幕默认输出编码库,其特征在于,所述方法包括:
从所述字幕中,获取一字符;
将所述字符与所述第一字符库进行对比,得到第一对比结果;
当所述第一对比结果表明所述字符属于所述第一字符库时,对所述字符进行解码;
根据所述参考字符编码库对所述字符进行解码,当所述字符属于所述参考字符编码库的文字时,得到一参考字符;
将所述参考字符根据所述字幕默认输出编码库进行解码转换,得到一字幕默认的字符并显示。
2.根据权利要求1所述的方法,其特征在于,所述字符库中还至少包括一第二字符库;
将所述字符与所述第一字符库进行对比,得到第一对比结果,之后还包括:
当所述第一对比结果表明所述字符不属于所述第一字符库时,将所述字符与所述第二字符库进行对比,得到第二对比结果;
当所述第二对比结果表明所述字符属于所述第二字符库时,对所述字符进行解码。
3.根据权利要求2所述的方法,其特征在于,
所述字幕默认输出编码库支持所述第一字符库;
和/或,
所述字幕默认输出编码库支持所述第二字符库。
4.根据权利要求2所述的方法,其特征在于,所述第一字符库包含的编码规则是所述第二字符库包含的编码规则的真子集;
或者,
所述第一字符库包含的编码规则与所述第二字符库包含的编码规则之间具有交集。
5.根据权利要求2所述的方法,其特征在于,所述字符库中仅包括一所述第一字符库;
将所述字符与所述第一字符库进行对比,得到第一对比结果,之后还包括:
当所述第一对比结果表明所述字符不属于所述第一字符库时,丢弃该所述字符,并在所述字幕中,获取下一个字符。
6.根据权利要求1所述的方法,其特征在于,从所述字幕中,获取一字符,进一步包括:
根据该字幕的初始位置和偏移量,计算所述字幕中最后一个字符的位置,在该位置处获取该字符。
7.一种字幕校准的电子设备,包括一显示单元,其特征在于,包括:
字符获取单元,用于在一字幕中,获取一字符;
第一编码单元,用于将所述字符与所述第一字符库进行对比,得到第一对比结果;当所述第一对比结果表明所述字符属于所述第一字符库时,通知一参考字符解码单元;
参考字符解码单元,用于根据一参考字符编码库对所述字符进行解码,生成一参考字符;
默认字符解码单元,用于根据一字幕默认输出编码库对所述参考字符进行解码,生成一默认字符,通知所述显示单元进行显示。
8.根据权利要求7所述的电子设备,其特征在于,还包括:
第二编码单元,用于当所述第一对比结果表明所述字符不属于所述第一字符库时,将所述字符与一第二字符库进行对比,得到第二对比结果。
9.根据权利要求7所述的电子设备,其特征在于,所述字符获取单元具体为:
字幕尾码获取单元,用于根据该字幕的初始位置和偏移量,计算所述字幕中最后一个字符的位置,在该位置处截取该字符。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910076471XA CN101771846B (zh) | 2009-01-04 | 2009-01-04 | 一种字幕校准的方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910076471XA CN101771846B (zh) | 2009-01-04 | 2009-01-04 | 一种字幕校准的方法和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101771846A CN101771846A (zh) | 2010-07-07 |
CN101771846B true CN101771846B (zh) | 2012-02-29 |
Family
ID=42504399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910076471XA Active CN101771846B (zh) | 2009-01-04 | 2009-01-04 | 一种字幕校准的方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101771846B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105430481B (zh) * | 2015-11-13 | 2019-03-12 | 深圳Tcl数字技术有限公司 | 码流字幕的自动测试方法及装置 |
CN107302722B (zh) * | 2017-05-12 | 2020-08-14 | 广州视源电子科技股份有限公司 | Dtv码流解码方法及装置 |
CN112580302B (zh) * | 2020-12-11 | 2023-07-14 | 海信视像科技股份有限公司 | 一种字幕校正方法及显示设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1484173A (zh) * | 2003-08-10 | 2004-03-24 | 卢小林 | 基于汉字形状的中文单词拼写错误校正方法 |
CN1499865A (zh) * | 2002-10-31 | 2004-05-26 | �ձ�������ʽ���� | 具有字符识别功能的便携式蜂窝电话、方法及程序 |
CN1717013A (zh) * | 2004-06-29 | 2006-01-04 | 乐金电子(沈阳)有限公司 | 电视机的字幕错误修正装置及其方法 |
-
2009
- 2009-01-04 CN CN200910076471XA patent/CN101771846B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1499865A (zh) * | 2002-10-31 | 2004-05-26 | �ձ�������ʽ���� | 具有字符识别功能的便携式蜂窝电话、方法及程序 |
CN1484173A (zh) * | 2003-08-10 | 2004-03-24 | 卢小林 | 基于汉字形状的中文单词拼写错误校正方法 |
CN1717013A (zh) * | 2004-06-29 | 2006-01-04 | 乐金电子(沈阳)有限公司 | 电视机的字幕错误修正装置及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101771846A (zh) | 2010-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101526963A (zh) | 网页编码识别方法、装置和终端设备 | |
US9158742B2 (en) | Automatically detecting layout of bidirectional (BIDI) text | |
CN102662926B (zh) | 字库的存储与访问方法 | |
CN104424165A (zh) | 一种文本文档乱码检测方法及系统 | |
WO2016124070A1 (zh) | 一种数据处理的方法和设备 | |
CN101771846B (zh) | 一种字幕校准的方法和电子设备 | |
CN104391993A (zh) | 一种识别网页编码方法及系统 | |
US8473280B2 (en) | System and methods for cost-effective bilingual texting | |
US20150070361A1 (en) | Character conversion system and a character conversion method | |
CN104424010B (zh) | 一种文本文档乱码检测及修复方法和系统 | |
EP2482231B1 (en) | Method for encoding and decoding data on a matrix code symbol | |
CN101013420A (zh) | 一种识别中文文本编码形式的方法 | |
US20140049554A1 (en) | Method of manipulating character string in embeded system | |
CN104077593A (zh) | 图像处理方法和装置 | |
CN103136453A (zh) | 文档操作题的自动组卷方法和自动阅卷方法 | |
CN101345952B (zh) | 客户身份识别卡的数据存储、读取方法、装置及系统 | |
CN101599264B (zh) | 移动终端上显示字符的方法及相关装置 | |
CN106777061B (zh) | 基于网页文本和图像的信息隐藏系统、方法及提取方法 | |
CN101621771B (zh) | 短信编码处理方法、装置及系统 | |
CN103489268B (zh) | 一种用于pos平台的阿拉伯语显示方法 | |
CN105148519A (zh) | 一种游戏程序中的文字渲染方法及系统 | |
CN102799572B (zh) | 一种文本编码方式和文本编码装置 | |
CN108108267B (zh) | 数据的恢复方法和装置 | |
KR101450435B1 (ko) | 폰트 파일 수정 변환 방법, 그 시스템, 및 컴퓨터로 읽을 수 있는 기록매체 | |
CN103092922A (zh) | 一种针对含特殊字符的url编码后的自动解码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |