CN113569534A - 一种检测文档中乱码的方法及装置 - Google Patents

一种检测文档中乱码的方法及装置 Download PDF

Info

Publication number
CN113569534A
CN113569534A CN202010355019.3A CN202010355019A CN113569534A CN 113569534 A CN113569534 A CN 113569534A CN 202010355019 A CN202010355019 A CN 202010355019A CN 113569534 A CN113569534 A CN 113569534A
Authority
CN
China
Prior art keywords
document
codes
character
character code
messy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010355019.3A
Other languages
English (en)
Inventor
孙自刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN202010355019.3A priority Critical patent/CN113569534A/zh
Publication of CN113569534A publication Critical patent/CN113569534A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Abstract

本发明公开了一种检测文档中乱码的方法及装置,本发明实施例获取嵌入式设备当前支持语言的字库并加载后,依次读取文档的字符编码集合中的每个字符编码,针对每个字符编码,判断是否在嵌入式设备当前加载的语言数据库中存在,如果否,得到所述字符编码为乱码的检测信息,如果是,检测下一个字符编码,直到文档的字符编码集合中的所有字符编码被判断完;汇总文档中的所有字符编码为乱码的检测信息,输出。这样,本发明实施例实现了对文档的字符编码集合中的每个字符编码的乱码检测,且将得到的最终检测信息输出给用户查看,增加了用户体验度。

Description

一种检测文档中乱码的方法及装置
技术领域
本发明涉及嵌入式设备处理文档的技术,特别涉及一种检测文档中乱码的方法及装置。
背景技术
嵌入式设备是以应用为中心,以计算机技术为基础设置的设备,应用系统适用于对功能、可靠性、成本、体积、功耗等方面有特殊要求的专用计算机系统。在嵌入式设备应用中,文档都是以字符编码集合的形式存储在嵌入式设备中,或在嵌入式设备之间传输。当在某一嵌入式设备显示某一文档时,首先,在该嵌入式设备中加载所支持语言的字库,在该字库中存储有字符编码与该语言文本之间的映射关系;然后,该嵌入式设备读取存储的文档或接收到远程嵌入式设备传输的文档,该文档以字符编码集合的形式存在,根据该字中的映射关系,将该字符编码集合中的各个字符编码转换为该语言文本,显示。但是,在文档的字符编码集合中的各个字符编码转换为该语言文本时,一个或多个字符编码有可能转换错误,在显示的该语言文本中出现乱码,影响浏览该语言文本的用户体验度。
为了避免文档在显示时出现乱码,需要对文档进行检测。目前,对文档进行检测通常采用文档整体检测方式,比如在文档打开之前校验文档的字符编码集合是否被损坏,或者校验读取到的文档字符编码集合是否完整等等,以此确认整体文档在显示时是否会出现乱码。但是,这种文档整体检测方式无法有针对性对文档的字符编码集合中的每一个字符编码进行乱码检测,导致即使通过了文档整体检测的文档在显示时,仍然有乱码存在的问题。
发明内容
有鉴于此,本发明实施例提供一种检测文档中乱码的方法,该方法能够对文档的字符编码集合中的每个字符编码的转换进行乱码检测。
本发明实施例还提供一种检测文档中乱码的装置,该装置能够对文档的字符编码集合中的每个字符编码的转换进行乱码检测。
本发明实施例是这样实现的:
一种检测文档中乱码的方法,所述方法包括:
获取嵌入式设备当前支持语言的字库并加载;
依次读取文档的字符编码集合中的每个字符编码;
针对每个字符编码,判断是否在所述加载的字库中存在,如果否,得到所述字符编码为乱码的检测信息;
汇总文档中的所有字符编码为乱码的检测信息,输出。
优选地,所述判断是否在所述加载的字库中存在,还包括:
a、判断在所述加载的字库中存在;
b、判断所述字符编码集合中的下一个字符编码是否在所述加载的字库中存在,如果否,执行步骤c;如果是,执行步骤d;
c、得到所述字符编码为乱码的检测信息;
d、返回步骤b继续执行,直到所述文档的字符编码集合中的所有字符编码被判断完。
优选地,所述判断是否在所述加载的字库中存在包括:
所述加载的字库中记录有字符编码与当前语言文本之间的映射关系;
判断所述加载的字库中是否有与所述读取的字符编码相同的字符编码。
优选地,所述获取嵌入式设备当前支持语言的字库并加载还包括:
嵌入式设备支持语言有多个;
依次将所述嵌入式设备支持语言中的一个作为嵌入式设备当前支持语言;
获取嵌入式设备当前支持语言的字库并加载。
优选地,所述方法还包括:
将文档的字符编码集合转换为嵌入式设备当前支持语言的语言文本;
根据所述汇总文档中的所有字符编码为乱码的检测信息,在所述语言文本中标记出乱码。
一种检测文档中乱码的装置,包括:加载单元、读取单元、检测单元及输出单元,其中,
加载单元,用于获取嵌入式设备当前支持语言的字库并加载;
读取单元,用于依次读取文档的字符编码集合中的每个字符编码;
检测单元,用于针对每个字符编码,判断是否在所述加载的字库中存在,如果否,得到所述字符编码为乱码的检测信息;
输出单元,用于汇总文档中的所有字符编码为乱码的检测信息,输出。
优选地,所述检测单元,还用于:
a、判断在所述加载的字库中存在;
b、判断所述字符编码集合中的下一个字符编码是否在所述加载的字库中存在,如果否,执行步骤c;如果是,执行步骤d;
c、得到所述字符编码为乱码的检测信息;
d、返回步骤b继续执行,直到所述文档的字符编码集合中的所有字符编码被判断完。
优选地,所述检测单元,还用于:
所述加载的字库中记录有字符编码与当前语言文本之间的映射关系;
判断所述加载的字库中是否有与所述读取的字符编码相同的字符编码。
优选地,所述加载单元,还用于:
嵌入式设备支持语言有多个;依次将所述嵌入式设备支持语言中的一个作为嵌入式设备当前支持语言;获取嵌入式设备当前支持语言的字库并加载。
还包括转换单元,用于将文档的字符编码集合转换为嵌入式设备当前支持语言的语言文本;
所述输出单元,还用于根据所述汇总文档中的所有字符编码为乱码的检测信息,在所述语言文本中标记出乱码。
如上所见,本发明实施例获取嵌入式设备当前支持语言的字库并加载后,依次读取文档的字符编码集合中的每个字符编码,针对每个字符编码,判断是否在嵌入式设备当前加载的语言数据库中存在,如果否,得到所述字符编码为乱码的检测信息,如果是,检测下一个字符编码,直到文档的字符编码集合中的所有字符编码被判断完;汇总文档中的所有字符编码为乱码的检测信息,输出。这样,本发明实施例实现了对文档的字符编码集合中的每个字符编码的乱码检测,且将得到的最终检测信息输出给用户查看,增加了用户体验度。
附图说明
图1为本发明实施例提供的检测文档中乱码的方法流程图;
图2为本发明实施例判断字符编码是否在所述加载的字库中存在的方法流程图;
图3为本发明实施例提供的获取嵌入式设备当前支持语言的字库并加载的方法流程图;
图4为本发明实施例提供的检测文档中乱码的装置结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
从背景技术可以看出,目前针对文档的乱码检测方式采用的是文档整体检测方式,无法针对文档的字符编码集合中的每个字符编码进行乱码检测,这样得到的检测结果不准确,无法反应文档中乱码的真实情况。为了克服这个问题,本发明实施例获取嵌入式设备当前支持语言的字库并加载后,依次读取文档的字符编码集合中的每个字符编码,针对每个字符编码,判断是否在嵌入式设备当前加载的语言数据库中存在,如果否,得到所述字符编码为乱码的检测信息,如果是,检测下一个字符编码,直到文档的字符编码集合中的所有字符编码被判断完;汇总文档中的所有字符编码为乱码的检测信息,输出。
这样,本发明实施例实现了对文档的字符编码集合中的每个字符编码的乱码检测,且将得到的最终检测信息输出给用户查看,增加了用户体验度。
图1为本发明实施例提供的检测文档中乱码的方法流程图,其具体步骤为:
步骤101、获取嵌入式设备当前支持语言的字库并加载;
步骤102、依次读取文档的字符编码集合中的每个字符编码;
步骤103、针对每个字符编码,判断是否在所述加载的字库中存在,如果否,得到所述字符编码为乱码的检测信息;
步骤104、汇总文档中的所有字符编码为乱码的检测信息,输出。
在该方法的步骤103中的判断是否在所述加载的字库中存在的方法流程图如图2所示,其具体步骤为:
步骤201、按照顺序读取文档的字符编码集合中的一个字符编码,判断是否在所述加载的字库中存在,如果否,执行步骤202;如果是,执行步骤203;
步骤202、得到所述字符编码为乱码的检测信息,继续执行步骤203;
步骤203、判断所述字符编码集合中的下一个字符编码是否在所述加载的字库中存在,如果否,执行步骤204;如果是,执行步骤205;
步骤204、得到所述字符编码为乱码的检测信息,转入步骤205;
步骤205、确定所述文档的字符编码集合中的所有字符编码是否被判断完,如果是,执行步骤206;如果否,返回步骤203继续执行;
步骤206、汇总文档中的所有字符编码为乱码的检测信息。
这样,经过了图2的检测过程,就针对文档中的每个字符编码进行了乱码检测,整个过程循环执行,直到文档中的最后一个字符编码被乱码检测完,使得文档的乱码检测准确率增高。
在图2所述的过程中,对所述字符编码集合中的每个字符编码进行判断的顺序是依据其在文档中顺序出现的顺序确定的,这样,文档出现的最后一个字符编码也被最后检测完,在汇总后并在文档标记时也可以按照该顺序进行标记显示,不会标记错误,使得文档的乱码检测率增高,且易于实现。当然,对所述字符编码集合中的每个字符编码进行判断的顺序也可以不依据其在文档中顺序出现的顺序确定,而是随机的或者是依据设定的判断顺序规则进行判断的,根据需要进行设定,只要保证所述字符编码集合中的所有字符编码都被检测过,采用这种方式判断更加灵活,增强用户体验度。
在图1的方法中,具体判断文档的每个字符编码是否在所述加载的字库中存在包括:所述加载的字库中记录有字符编码与当前语言文本之间的映射关系;判断所述加载的字库中是否有与所述读取的字符编码相同的字符编码。这样,本发明实施例预先设置了字符编码与当前语言文本之间的对应关系,在判断过程中就直接利用了已有的字库中的映射关系,简单地对文档中的每个字符编码进行了乱码检测,易于实施。
在本发明实施例中,嵌入式设备机不仅仅可以支持一种语言,还可以支持多种语言,对于每种语言,其都有对应的字库存在,在要显示文档时,都在嵌入式设备支持的某一种语言环境下显示对应的语言文本。当对文档进行乱码检测时,就需要确定该文档的语言环境,这是因为,在某一种语言环境下文档存在乱码,在另一种语言环境下则文档可能不存在乱码。
当嵌入式设备支持的语言有多个时,如何具体在每一种语言环境下实现文档中的字符编码的检测过程如图3所示,图3为本发明实施例提供的获取嵌入式设备当前支持语言的字库并加载的方法流程图,其具体步骤为:
步骤301、嵌入式设备支持多种语言;
步骤302、依次将所述嵌入式设备支持语言中的一个作为嵌入式设备当前支持语言;
步骤303、获取嵌入式设备当前支持语言的字库并加载,进行文档的乱码检测过程;
步骤304、判断文档的乱码检测过程是否完成,如果是,执行步骤305;如果否,执行步骤306;
步骤305、返回步骤302继续执行,直到嵌入式设备所支持的语言都被选择完;
步骤306、继续进行文档的乱码检测,返回步骤304执行。
从图3可以看出,本发明实施例在对文档中的乱码进行检测时,可以在不同的语言环境中进行,只要在判断前切换所支持的语言环境,从而可以在多语言环境下进行文档的乱码检测,使得乱码检测的应用范围广。
当然,由于用户已知需要采用何种语言显示文档,所以在图3所述的基础上,也可以由用户主动选择一种语言,作为嵌入式设备当前支持的语言并加载对应的字库后,执行文档的乱码检测过程,这样就不需要在多种语言环境下依次进行文档的乱码检测了,更加简单及快速。
在图1所述的步骤104中,有多种输出汇总文档中的所有字符编码为乱码的检测信息方式,比如,直接将检测信息进行显示给用户,也可以在显示的文档中采用标亮或不同颜色的方式显示等,从而使得用户更加容易获知文档中的乱码。可以根据用户需要,采用其中的一种输出乱码的检测信息方式,使得用户能够更快速且准确地获知文档中检测得到的乱码,提高用户体验度。
具体地说,输出文档中的乱码方式可以包括:
将文档的字符编码集合转换为嵌入式设备当前支持语言的语言文本;
根据所述汇总文档中的所有字符编码为乱码的检测信息,在所述语言文本中标记出乱码。
举一个具体例子对本发明实施例进行说明。
假设嵌入式设备支持的语言为泰语,加载的是泰语的字库,读取了文档的字符编码集合进行转换后显示对应的泰语文本,比如期望显示的泰语文本为:
Figure BDA0002473159040000061
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
但是因为某些因素导致该文档的字符编码集合进行转换后显示对应的泰语文本为:
Figure BDA0002473159040000062
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
也就是中间有个字符变成了问号“?”,出现了乱码。这对于用户来说不太容易识别出。
采用本发明实施例提供的方法对上述文档进行测试后,就可以得到该字符编码的乱码的检测信息,并提供给用户,使得用户很容易获知该文档中出现乱码的位置及乱码具体是什么,提高乱码识别的准确度,提高用户体验。
图4为本发明实施例提供的检测文档中乱码的装置结构示意图,包括:加载单元、读取单元、检测单元及输出单元,其中,
加载单元,用于获取嵌入式设备当前支持语言的字库并加载;
读取单元,用于依次读取文档的字符编码集合中的每个字符编码;
检测单元,用于针对每个字符编码,判断是否在所述加载的字库中存在,如果否,得到所述字符编码为乱码的检测信息;
输出单元,用于汇总文档中的所有字符编码为乱码的检测信息,输出。
该装置实现了对文档的字符编码集合中的每个字符编码的乱码检测,且将得到的最终检测信息输出给用户查看,增加了用户体验度。
在该装置中,所述检测单元,还用于:
a、判断在所述加载的字库中存在;
b、判断所述字符编码集合中的下一个字符编码是否在所述加载的字库中存在,如果否,执行步骤c;如果是,执行步骤d;
c、得到所述字符编码为乱码的检测信息;
d、返回步骤b继续执行,直到所述文档的字符编码集合中的所有字符编码被判断完。
这样,该检测单元就针对文档中的每个字符编码进行了乱码检测,整个过程循环执行,直到文档中的最后一个字符编码被乱码检测完,使得文档的乱码检测准确率增高。
进一步,在该装置中,所述检测单元,还用于:所述加载的字库中记录有字符编码与当前语言文本之间的映射关系;判断所述加载的字库中是否有与所述读取的字符编码相同的字符编码。明确了检测单元对文档中的每个字符编码的具体检测方式。在这种情况下,该装置预先设置了字符编码与当前语言文本之间的对应关系,在判断过程中就直接利用了已有的字库中的映射关系,简单地对文档中的每个字符编码进行了乱码检测,易于实施。
进一步,在该装置中,所述加载单元,还用于:嵌入式设备支持语言有多个;依次将所述嵌入式设备支持语言中的一个作为嵌入式设备当前支持语言;获取嵌入式设备当前支持语言的字库并加载。在嵌入式设备支持的不同语言环境下分别进行文档中的字符编码的乱码检测,而不仅仅在一种语言环境下进行文档中的字符编码的乱码检测,增大了文档的乱码检测范围。在这种情况下,该装置在对文档中的乱码进行检测时,可以在不同的语言环境中进行,只要在判断前切换所支持的语言环境,从而可以在多语言环境下进行文档的乱码检测,使得乱码检测的应用范围广。
进一步,在该装置中,有多种输出汇总文档中的所有字符编码为乱码的检测信息方式,可以根据用户需要,采用其中的一种输出乱码的检测信息方式,使得用户能够更快速且准确地获知文档中检测得到的乱码,提高用户体验度。具体地,其中一种为:还包括转换单元,用于将文档的字符编码集合转换为嵌入式设备当前支持语言的语言文本;所述输出单元,还用于根据所述汇总文档中的所有字符编码为乱码的检测信息,在所述语言文本中标记出乱码。
本发明实施例可以针对文档的字符编码集合中的每个字符编码进行乱码检测,并将检测结果提供给用户,以使用户及时获知,提高了用户体验度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种检测文档中乱码的方法,其特征在于,所述方法包括:
获取嵌入式设备当前支持语言的字库并加载;
依次读取文档的字符编码集合中的每个字符编码;
针对每个字符编码,判断是否在所述加载的字库中存在,如果否,得到所述字符编码为乱码的检测信息;
汇总文档中的所有字符编码为乱码的检测信息,输出。
2.如权利要求1所述的方法,其特征在于,所述判断是否在所述加载的字库中存在,还包括:
a、判断在所述加载的字库中存在;
b、判断所述字符编码集合中的下一个字符编码是否在所述加载的字库中存在,如果否,执行步骤c;如果是,执行步骤d;
c、得到所述字符编码为乱码的检测信息;
d、返回步骤b继续执行,直到所述文档的字符编码集合中的所有字符编码被判断完。
3.如权利要求1或2所述的方法,其特征在于,所述判断是否在所述加载的字库中存在包括:
所述加载的字库中记录有字符编码与当前语言文本之间的映射关系;
判断所述加载的字库中是否有与所述读取的字符编码相同的字符编码。
4.如权利要求1或2所述的方法,其特征在于,所述获取嵌入式设备当前支持语言的字库并加载还包括:
嵌入式设备支持语言有多个;
依次将所述嵌入式设备支持语言中的一个作为嵌入式设备当前支持语言;
获取嵌入式设备当前支持语言的字库并加载。
5.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
将文档的字符编码集合转换为嵌入式设备当前支持语言的语言文本;
根据所述汇总文档中的所有字符编码为乱码的检测信息,在所述语言文本中标记出乱码。
6.一种检测文档中乱码的装置,其特征在于,包括:加载单元、读取单元、检测单元及输出单元,其中,
加载单元,用于获取嵌入式设备当前支持语言的字库并加载;
读取单元,用于依次读取文档的字符编码集合中的每个字符编码;
检测单元,用于针对每个字符编码,判断是否在所述加载的字库中存在,如果否,得到所述字符编码为乱码的检测信息;
输出单元,用于汇总文档中的所有字符编码为乱码的检测信息,输出。
7.如权利要求6所述的装置,其特征在于,所述检测单元,还用于:
a、判断在所述加载的字库中存在;
b、判断所述字符编码集合中的下一个字符编码是否在所述加载的字库中存在,如果否,执行步骤c;如果是,执行步骤d;
c、得到所述字符编码为乱码的检测信息;
d、返回步骤b继续执行,直到所述文档的字符编码集合中的所有字符编码被判断完。
8.如权利要求6或7所述的装置,其特征在于,所述检测单元,还用于:
所述加载的字库中记录有字符编码与当前语言文本之间的映射关系;
判断所述加载的字库中是否有与所述读取的字符编码相同的字符编码。
9.如权利要求6或7所述的装置,其特征在于,所述加载单元,还用于:
嵌入式设备支持语言有多个;依次将所述嵌入式设备支持语言中的一个作为嵌入式设备当前支持语言;获取嵌入式设备当前支持语言的字库并加载。
10.如权利要求6或7所述的装置,其特征在于,还包括转换单元,用于将文档的字符编码集合转换为嵌入式设备当前支持语言的语言文本;
所述输出单元,还用于根据所述汇总文档中的所有字符编码为乱码的检测信息,在所述语言文本中标记出乱码。
CN202010355019.3A 2020-04-29 2020-04-29 一种检测文档中乱码的方法及装置 Pending CN113569534A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010355019.3A CN113569534A (zh) 2020-04-29 2020-04-29 一种检测文档中乱码的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010355019.3A CN113569534A (zh) 2020-04-29 2020-04-29 一种检测文档中乱码的方法及装置

Publications (1)

Publication Number Publication Date
CN113569534A true CN113569534A (zh) 2021-10-29

Family

ID=78158429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010355019.3A Pending CN113569534A (zh) 2020-04-29 2020-04-29 一种检测文档中乱码的方法及装置

Country Status (1)

Country Link
CN (1) CN113569534A (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7148824B1 (en) * 2005-08-05 2006-12-12 Xerox Corporation Automatic detection of character encoding format using statistical analysis of the text strings
CN101419589A (zh) * 2008-12-08 2009-04-29 北大方正集团有限公司 一种计算机文档内容保护的方法和系统
CN101599264A (zh) * 2009-07-15 2009-12-09 青岛海信移动通信技术股份有限公司 移动终端上显示字符的方法及相关装置
CN102479075A (zh) * 2010-11-23 2012-05-30 中兴通讯股份有限公司 嵌入式设备中多语言显示方法及装置
CN102750337A (zh) * 2012-06-01 2012-10-24 中国科学院声学研究所 字库的制作方法和装置
CN103049095A (zh) * 2012-12-06 2013-04-17 郑州威科姆科技股份有限公司 一种嵌入式设备藏文语言输入方法
CN104424165A (zh) * 2013-09-06 2015-03-18 北大方正集团有限公司 一种文本文档乱码检测方法及系统
CN104503954A (zh) * 2014-12-11 2015-04-08 康佳集团股份有限公司 一种文字组合显示方法及显示系统
CN105099652A (zh) * 2014-05-04 2015-11-25 博雅网络游戏开发(深圳)有限公司 数据加密、解密方法和装置
WO2016023471A1 (zh) * 2014-08-11 2016-02-18 张锐 手写输入字符的处理、数据拆分和合并及编解码处理方法
KR101693627B1 (ko) * 2015-10-08 2017-01-17 숭실대학교산학협력단 문자 인코딩 변환 장치 및 방법
CN106547728A (zh) * 2016-11-26 2017-03-29 朱信 多重复字字库兼容通用字库
CN110222617A (zh) * 2019-05-29 2019-09-10 四川译讯信息科技有限公司 一种pdf文件修复方法和系统
CN110795258A (zh) * 2018-07-17 2020-02-14 珠海金山办公软件有限公司 字体库匹配方法、装置及设备

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7148824B1 (en) * 2005-08-05 2006-12-12 Xerox Corporation Automatic detection of character encoding format using statistical analysis of the text strings
CN101419589A (zh) * 2008-12-08 2009-04-29 北大方正集团有限公司 一种计算机文档内容保护的方法和系统
CN101599264A (zh) * 2009-07-15 2009-12-09 青岛海信移动通信技术股份有限公司 移动终端上显示字符的方法及相关装置
CN102479075A (zh) * 2010-11-23 2012-05-30 中兴通讯股份有限公司 嵌入式设备中多语言显示方法及装置
CN102750337A (zh) * 2012-06-01 2012-10-24 中国科学院声学研究所 字库的制作方法和装置
CN103049095A (zh) * 2012-12-06 2013-04-17 郑州威科姆科技股份有限公司 一种嵌入式设备藏文语言输入方法
CN104424165A (zh) * 2013-09-06 2015-03-18 北大方正集团有限公司 一种文本文档乱码检测方法及系统
CN105099652A (zh) * 2014-05-04 2015-11-25 博雅网络游戏开发(深圳)有限公司 数据加密、解密方法和装置
WO2016023471A1 (zh) * 2014-08-11 2016-02-18 张锐 手写输入字符的处理、数据拆分和合并及编解码处理方法
CN104503954A (zh) * 2014-12-11 2015-04-08 康佳集团股份有限公司 一种文字组合显示方法及显示系统
KR101693627B1 (ko) * 2015-10-08 2017-01-17 숭실대학교산학협력단 문자 인코딩 변환 장치 및 방법
CN106547728A (zh) * 2016-11-26 2017-03-29 朱信 多重复字字库兼容通用字库
CN110795258A (zh) * 2018-07-17 2020-02-14 珠海金山办公软件有限公司 字体库匹配方法、装置及设备
CN110222617A (zh) * 2019-05-29 2019-09-10 四川译讯信息科技有限公司 一种pdf文件修复方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡崧: "《超梦幻劲爆网页DREAMXEAVER CS5/FLASH CS5/PHOTOSHOP CS5完美结合》", vol. 978, 31 October 2010, 中国青年出版社, pages: 378 *

Similar Documents

Publication Publication Date Title
US9158742B2 (en) Automatically detecting layout of bidirectional (BIDI) text
CN111814822B (zh) 一种敏感图片检测方法、装置及电子设备
KR20080100179A (ko) 벡터 그래픽 문서 내 리스트 인식 방법, 벡터 그래픽 문서해석 방법 및 컴퓨터 판독가능 매체
US20190340114A1 (en) Method and apparatus for automatic testing of web pages
CN108664471B (zh) 文字识别纠错方法、装置、设备及计算机可读存储介质
US8908972B2 (en) Electronic device capable of recovering garbled characters and method for recovering garbled characters
CN104008123B (zh) 用于中文姓名匹配的方法和系统
CN108132915A (zh) 指令转换方法与系统
KR101143650B1 (ko) 분석용 디스플레이 문서 준비 장치
JPH096922A (ja) 手書き文字認識装置
CN111368506A (zh) 文本处理方法及装置
CN107239209B (zh) 一种拍照搜索方法、装置、终端及存储介质
CN113569534A (zh) 一种检测文档中乱码的方法及装置
CN112541373A (zh) 司法文本识别方法、文本识别模型获得方法及相关设备
CN107957883B (zh) 数据处理方法、51单片机、设备及可读存储介质
CN113435217B (zh) 语言测试处理方法、装置及电子设备
CN110010131B (zh) 一种语音信息处理的方法和装置
CN114065762A (zh) 一种文本信息的处理方法、装置、介质及设备
CN111339776B (zh) 简历解析方法、装置、电子设备和计算机可读存储介质
JP2010211256A (ja) 正式名称判定システム及び正式名称判定プログラム
CN111177228A (zh) 基于学科评估的数据处理方法、系统、装置及电子设备
CN106155893B (zh) 判断应用程序测试覆盖范围的方法及程序测试设备
CN104978273B (zh) 菜单名称的自动检测方法及自动检测单元
CN111813664B (zh) 一种崩溃信息收集方法、装置、介质和设备
CN112035373B (zh) 基本测试脚本的测试方法、装置、服务器及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination