CN117077624A - 一种字库在线处理方法、设备和介质 - Google Patents

一种字库在线处理方法、设备和介质 Download PDF

Info

Publication number
CN117077624A
CN117077624A CN202311320344.6A CN202311320344A CN117077624A CN 117077624 A CN117077624 A CN 117077624A CN 202311320344 A CN202311320344 A CN 202311320344A CN 117077624 A CN117077624 A CN 117077624A
Authority
CN
China
Prior art keywords
target
character
information
word stock
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311320344.6A
Other languages
English (en)
Other versions
CN117077624B (zh
Inventor
罗辉
马志宇
韦刚
李云军
伍炬彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yunxigu Technology Co ltd
Original Assignee
Shenzhen Yunxigu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yunxigu Technology Co ltd filed Critical Shenzhen Yunxigu Technology Co ltd
Priority to CN202311320344.6A priority Critical patent/CN117077624B/zh
Publication of CN117077624A publication Critical patent/CN117077624A/zh
Application granted granted Critical
Publication of CN117077624B publication Critical patent/CN117077624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开了一种字库在线处理方案。本方案通过扫描终端将扫描信息发送至云端服务器,云端服务器根据扫描信息进行识别、翻译得到目标字符串,并结合扫描终端存有的第一字库文件,生成对应的仅与所述目标字符串关联的字库文件及对应的读取编码返回给终端,大大减少了传输到扫描终端的字库文件大小,并且扫描终端也无需将各字库存储于所述扫描终端,仅需存储包含少量常用的字符的字库文件,因此所述扫描终端无需设置较大的内存空间,也无需使用额外的或者复杂的处理芯片和电路,使得仅包含小内存的扫描设备也能实现复杂文本识别并进行多语言翻译,大大降低了成本,而且也方便拓展、更新、维护。

Description

一种字库在线处理方法、设备和介质
技术领域
本申请涉及数据信息处理技术领域,特别是涉及一种字库在线处理方法、设备和介质。
背景技术
嵌入式设备在屏幕显示绘制文本时需要字库的支持,字库中一般包含文字的字型等信息,需要支持的语言种类越来越多,需要占用较大的内存空间,嵌入式设备的存储能力小、处理能力弱,全量字库在各类资源都很受限的嵌入式设备中使用时会花费很大的成本;而且在需要显示用户自定义的图标或者外国语言时不方便拓展。现有的技术解决的方法常有三种:
第一种方法为在嵌入式设备上使用字库芯片,用以储存需要的字库,设备在需要绘制文本时读取字库芯片中的信息,然后绘制到屏幕上。这种方法虽然可以实现显示文字,但是需要大容量的内存(如几百MB甚至GB级别的内存)、且需要额外的芯片和电路,会增加硬件成本,而且只能显示字库芯片中包含的文字,不方便拓展。当字库芯片上储存的字库的量很大时,也会造成加载速度缓慢等问题。
第二种方法为在嵌入式设备上使用外部flash,用以储存需要的字库。这种方法与第一种方法类似,增加额外的flash芯片,在芯片中存储需要的字库。这种方法同样需要增加额外的硬件成本,而且只能显示flash芯片中包含的文字,不方便拓展。
第三种方法为减少嵌入式设备支持的语言数量,以缩小字库占用的存储空间大小。这样带来的问题是,嵌入式设备在遇到不支持的语言时内容无法显示或显示异常,且嵌入式设备需要根据实际情况预置不同的字库,增加了生产和维护成本。
因此,如何使嵌入式设备能够在多国语言支持时,又能避免占用嵌入式设备较大的内存空间而增加硬件成本,是急需解决的问题。
发明内容
基于此,有必要针对上述技术问题,本申请提供一种能够在较小存储介质的嵌入式设备中字库在线处理方法、设备和介质。
本申请第一方面提供一种字库在线处理方法,所述方法应用于服务端,其特征在于,所述方法包括:
接收扫描终端发送的扫描信息和标识信息;
根据所述标识信息,确定所述扫描终端的第一字库信息;
根据所述扫描信息及第一字库信息,识别要显示的目标字符串;
根据所述第一字库信息及所述目标字符串,生成所述目标字符串的目标字库文件及对应的读取编码文件,其中,所述目标字库文件仅与所述目标字符串相关;
将所述第一字符串的读取编码文件及目标字库文件发送至所述扫描终端。
进一步地,上述方法中,所述标识信息包括目标语言种类信息;所述根据所述扫描信息及第一字库信息,识别要显示的目标字符串包括:
根据所述扫描信息,识别得到所述扫描信息对应的第一字符串;对所述第一字符串进行翻译成目标语言,得到对应第二字符串;将所述第一字符串和所述第二字符串按照显示顺序及显示位置进行融合,得到所述目标字符串。
进一步地,所述根据所述第一字库信息及所述目标字符串,生成所述目标字符串的目标字库文件及对应的预设读取编码文件,包括:
按顺序提取所述目标字符串中未包含在所述第一字库中的字符,得到第一字符集;
判断所述第一字符集中字符数量在所述目标字符串字符数量的占比是否超过预设阈值;若不超过,对所述第一字符集的字符进行去重处理,得到第一目标字符集;
根据所述第一目标字符集生成第一目标字库文件,其中,所述第一目标字库文件包括所述第一目标字符集的各显示字符及对应的字符编码;
按顺序生成所述目标字符串所有字符的字符编码,并将按顺序生成的字符编码作为对应的读取编码文件。
进一步地,若所述占比超过预设阈值,直接将所述第一字符集作为目标字库文件;
根据所述目标字符串和所述第一字库,生产所述目标字符串的读取编码文件。
进一步地,所述根据所述目标字符串和所述第一字库,生产所述目标字符串的读取编码文件包括:
S1001:将所述目标字符的首字符作为当前字符;
S1002:判断当前字符是否包含在所述第一字库中,若是,执行S1003,否则执行S1004;
S1003:获取当前字符的字符编码,并将当前字符编码添加写入到编码文件中,判断当前字符是否为最后一个字符,若是,执行S1005,否则将下一字符作为当前字符,执行S1002;
S1004:获取当前字符开始连续不包含在所述第一字库中字符串长度,将所述长度信息添加写入到编码文件中,判断当前字符后是否还包含在所述第一字库中的字符,若是则将下一个包含在第一字库中的字符作为当前字符,执行S1002,否则执行S1005;
S1005:生产所述目标字符串对应的读取编码文件。
本申请第二方面提供一种实现在线字库的方法,所述方法应用于扫描终端,其特征在于,所述方法包括:
启用所述扫描终端扫描图像,获得扫描信息;
向服务端发送扫描信息和标识信息,其中,所述标识信息至少包括用于标识所述扫描终端包含第一字库的信息;
接收服务端发送的目标字库文件及对应的读取编码文件,其中,所述目标字库文件仅与待显示的目标字符串信息相关;
按照预设格式解析目标所述目标字库文件并保存至内存空间;
根据所述读取编码文件及解析后的目标字库文件,得到待显示的目标信息;
根据所述待显示的目标信息在显示单元进行绘制和/或刷新显示。
进一步地,所述方法还包括:接收用户的选择操作,根据用户的选择确定目标语言种类信息;
获取所述扫描终端的第一标识信息;将所述第一标识信息及所述目标语言种类信息,生成所述标识信息。
进一步地,所述方法还包括:解析所述读取编码文件,判断所述读取编码文件是否包含长度信息;
若否,则按顺序依次将所述读取编码文件各字符编码匹配所述第一字库及所述目标字库文件中的字符,得到各待显示的字符,将所有的待显示字符作为待显示目标信息;
若是,依次判断各读取编码文件的当前解析信息类型,若为字符编码信息,则根据字符编码匹配所述第一字库的字符,得到待显示的字符,若为长度信息,则直接按顺序读取所述目标字库文件中的与该长度对应的字符,解析下一读取编码文件的信息,直到得到所有待显示字符,将所有的待显示字符作为待显示目标信息;
将所述待显示的目标信息在显示单元的对应位置进行绘制和/或刷新显示。
本申请第三方面提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现上述任一项所述的方法步骤。
本申请第四方面提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以实现上述任一项所述的方法步骤。
本申请的上述技术方案,扫描终端将扫描信息发送至服务端服务,服务端服务器根据扫描信息进行识别、翻译得到目标字符串,并结合扫描终端存有的第一字库文件,生成对应的仅与所述目标字符串关联的字库文件及对应的读取编码返回给终端,大大减少了传输到扫描终端的字库文件大小,并且扫描终端也无需将各字库存储于所述扫描终端,仅需存储包含少量常用的字符的字库文件,因此所述扫描终端无需设置较大的内存空间,也无需使用额外的或者复杂的处理芯片和电路,使得仅包含小内存的扫描设备也能实现复杂文本识别并进行多语言翻译,大大降低了成本,而且也方便拓展、更新、维护。
进一步地,本申请通过提取所述目标字符串中未包含在所述第一字库中的字符,得到第一字符集,并第一字符集字符数量若所述占比超过预设阈值,直接将所述第一字符集作为目标字库文件,并生成由字符编码和目标字库读取长度交替组成的读取编码文件,也即该目标字库文件只包含字符信息,不包含字符编码,大大减少了目标字库文件大小,避免造成网络流量开销增大,进一步减轻了扫描终端的内存开销和数据处理,这样也可以节省所述扫描终端解析字库的时间。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为本申请中的实现在线字库处理的一种实施方法的流程示意图;
图2为本申请中的实现在线字库处理的另一种实施方法的流程示意图;
图3为本申请中电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
现有技术通常是一次性的在扫描终端上预置好所有支持的语言相关的字库,在能够支持多种语言数量的扫描终端,所需要的字库过大,因此大大增加了硬件成本。为解决这个问题,本申请实施例提供了一种字库在线处理的方法,所述方法可以应用在扫描终端或服务端服务器中,所述扫描终端和服务端服务器可以是无线连接,无线连接是指可以通过wifi、蓝牙等无线连接方式进行相互连接,所述扫描终端、服务端服务器也可以通过某种有线通信方式连接;所述服务端服务器可以为云端服务器。
如图1所示,图1为本申请提供的其中一种实施方式中,实现在线字库处理的方法的步骤流程图,所述方法应用于服务端,具体包括以下步骤:
S10:接收扫描终端发送的扫描信息和标识信息。
具体地,扫描信息为扫描终端扫描发送的文本图像集,由于扫描终端配置较弱,及其设置的内存较小,其处理能力相对较弱,因此,需要将扫描的文本图像集传输到服务端服务器进行识别、翻译处理。
需要说明的是,标识信息包括扫描设备的设备信息和需要翻译成目标语言种类的标识信息。
S11:根据所述标识信息,确定所述扫描终端的第一字库信息。
具体地,可以提取标识信息中的设备信息,根据设备信息确定扫描终端预先存有的第一字库信息。可以理解的是,服务端服务预先存储了不同扫描终端种类所包含的第一字库信息,该第一字库为仅包含该扫描设备常用的少量字符的字库文件,不同类型的扫描终端根据其硬件配置不同,其所包含的第一字库信息可以不同。
S12:根据所述扫描信息及第一字库信息,识别要显示的目标字符串。
具体包括:S121、服务端服务器根据所述扫描信息,识别得到所述扫描信息对应的第一字符串。服务端服务器采用OCR等识别技术对接收的扫描图像信息进行识别,得到字符类型的目标字符串,例如,针对接收的扫描图像信息“我是学生,我爱学习”,识别成需要显示的中文目标字符串为“我是学生,我爱学习”。
S122、对所述第一字符串进行翻译成目标语言,得到对应第二字符串;将所述第一字符串和所述第二字符串按照显示顺序及显示位置进行融合,得到所述目标字符串。
例如,若解析标识信息中目标语言类型标识为英文,则翻译得到的第二字符串为英文字符串“I am a student,I love studying”,则将第一字符串和第二字符串进行融合结果为:“我是学生,我爱学习I am a student,I love studying”,其中,“/>”为换行符,用于指示换行,当扫描终端解析到换行符时,扫描终端会自动换另一行来显示后面的内容。
S13、根据所述第一字库信息及所述目标字符串,生成所述目标字符串的目标字库文件及对应的读取编码文件,其中,所述目标字库文件仅与所述目标字符串相关。
需要说明的是,由于扫描设备内存容量较小,其预存的第一字库中只包含了少量常用的字符及其字符编码信息,经识别和翻译的目标字符串,并不能直接由扫描终端解析并显示。因此,为了使扫描终端既能完整地解析出目标字符串,又不过多地增加所述扫描终端的数据处理开销及内存占用,以让扫描终端能让扫描终端能快速、准确地匹配、解析出所有的字符,并在显示单元上进行展示,本申请服务端服务器专门根据所述第一字库信息及所述目标字符串,生成所述目标字符串的目标字库文件及对应的读取编码文件,其中,所述生成的目标字库文件仅与所述目标字符串相关,且该目标字库文件作为辅助字库。具体包括如下步骤:
S131、按顺序提取所述目标字符串中未包含在所述第一字库中的字符,得到第一字符集。
具体地,目标字符串的顺序依次查询各个字符能在所述第一字库中匹配查询到,得到目标字符串中所有未能在第一字库中匹配的字符,作为第一字符集。例如,针对目标字符串“我是学生,我爱学习I am a student,I love studying”,而某扫描终端第一字库中包含有“我、是、生”这几个中文字符及26个英文字母,则根据本申请的方案,匹配得到的第一字符集为“学,爱学习/>”。
S132、判断所述第一字符集中字符数量在所述目标字符串字符数量的占比是否超过预设阈值;若不超过,执行步骤A1-A3,以得到目标字库文件和读取编码文件,否则,执行步骤B1-B2,以得到目标字库文件和读取编码文件。
A1、对所述第一字符集的字符进行去重处理,得到第一目标字符集。
例如,上述第一字符集字符数量为41,而第一字符集字符数量为6,假设设定的阈值为80%,则6/41<80%,因此,根据本申请的方案,对所述第一字符集的字符进行去重处理,得到第一目标字符集为“学,爱习”。
A2、根据所述第一目标字符集生成第一目标字库文件,其中,所述第一目标字库文件包括所述第一目标字符集的各显示字符及对应的字符编码。
具体地,得到第一目标字符集后,可以直接根据目标字符集的字符信息,生成扫描终端能解析的目标字库文件,即上述实施例中生成仅包含“学,爱习”字符信息的目标字库文件,该字库文件跟常规字库文件规则一样,同时包含字符及其对应的字符编码等信息,以方便后续扫描终端根据字符编码信息匹配查询对应的字符进行显示。
A3、按顺序生成所述目标字符串所有字符的字符编码,并将按顺序生成的字符编码作为对应的读取编码文件。
具体地,为了便于所述扫描终端能正确地解析出目标字符串进行显示,本申请方案通过按顺序生成所述目标字符串所有字符的字符编码,并将按顺序生成的各字符编码组合得到目标字符串对应的读取编码文件,通过该读取编码文件,扫描终端便能按顺序去字库中解析匹配对应的字符进行显示,所述读取编码文件只包含目标字符串的字符编码,因此该文件相对字库文件来说小很多。
通过本申请的上述方案,读取编码文件包含了与目标字符串一一对应的字符编码,而目标字库文件作为扫描终端针对该目标字符串的补充第二字库文件,结合第一字库文件,根据该读取编码可以直接匹配查询得到待显示的信息。使得内存较小的扫描终端也能完成扫描信息的识别、翻译和显示。
在另一实施例中,若所述占比超过预设阈值,则执行B1-B2:
B1:直接将所述第一字符集作为目标字库文件。
需要说明的是,当所述第一字符集中字符数量在所述目标字符串字符数量的占比超过预设阈值,例如,需要将扫描信息“我是学生,我爱学习”翻译成韩语,则目标字符串为
,而扫描终端第一字库中包含有“我、是、生”这几个中文字符及26个英文字母,则根据本申请的方案,匹配得到的第一字符集为
此时,目标字符串字符数为33,第一字符集字符数为29,此时29/33>80%。
此时,继续按之前的规则生成目标字库文件,则该目标字库文件大小可能还是会相对较大,并且扫描终端大部分得依赖该目标字库文件进行解析和匹配得到待显示的字符。因此,可能导致扫描终端的内存不足,出现死机卡顿现象。
本申请方案为此直接将所述第一字符集作为目标字库文件,也即该目标字库文件只包含含有顺序的字符信息,并未包含有对应字符的字符编码,大大减少了发送给扫描终端的目标字库文件,且扫描终端可以根据该目标字库文件对应的读取编码,直接按顺序读取出目标字库文件的字符进行显示,大大减少了匹配查询目标字库文件的次数及内存占用。
B2:根据所述目标字符串和所述第一字库,生产所述目标字符串的读取编码文件。
具体地,所述根据所述目标字符串和所述第一字库,生产所述目标字符串的读取编码文件包括:
S1001:将所述目标字符的首字符作为当前字符;
S1002:判断当前字符是否包含在所述第一字库中,若是,执行S1003,否则执行S1004;
S1003:获取当前字符的字符编码,并将当前字符编码添加写入到编码文件中,判断当前字符是否为最后一个字符,若是,执行S1005,否则将下一字符作为当前字符,执行S1002;
S1004:获取当前字符开始连续不包含在所述第一字库中字符串长度,将所述长度信息添加写入到编码文件中,判断当前字符后是否还包含在所述第一字库中的字符,若是则将下一个包含在第一字库中的字符作为当前字符,执行S1002,否则执行S1005;
S1005:生产所述目标字符串对应的读取编码文件。
也即通过本申请的上述方案,所得到的读取编码文件为包含能通过第一字库文件匹配得到字符的字符编码及直接从目标字库文件读取相应长度信息的组合/交替编码文件,而不是所有目标字符串的字符编码的文件,也大大减少了读取编码文件的大小,进一步减少了扫描终端的处理负担,也进一步提升了扫描终端的读取和显示效率。
扫描终端接解析得到上述读取编码文件时,依次判断各读取编码文件的当前解析信息类型,若为字符编码信息,则根据字符编码匹配所述第一字库的字符,得到待显示的字符,若为长度信息,则直接按顺序读取所述目标字库文件中的与该长度对应的字符,解析下一读取编码文件的信息,直到得到所有待显示字符,将所有的待显示字符作为待显示目标信息。
S14、将所述第一字符串的读取编码文件及目标字库文件发送至所述扫描终端。
本申请的上述技术方案,扫描终端将扫描信息发送至服务端服务,服务端服务器根据扫描信息进行识别、翻译得到目标字符串,并结合扫描终端存有的第一字库文件,生成对应的仅与所述目标字符串关联的字库文件及对应的读取编码返回给终端,大大减少了传输到扫描终端的字库文件大小,并且扫描终端也无需将各字库存储于所述扫描终端,仅需存储包含少量常用的字符的字库文件,因此所述扫描终端无需设置较大的内存空间,也无需使用额外的或者复杂的处理芯片和电路,使得仅包含小内存的扫描设备也能实现复杂文本识别并进行多语言翻译,大大降低了成本,而且也方便拓展、更新、维护。
进一步地,本申请通过提取所述目标字符串中未包含在所述第一字库中的字符,得到第一字符集,并第一字符集字符数量若所述占比超过预设阈值,直接将所述第一字符集作为目标字库文件,并生成由字符编码和目标字库读取长度交替组成的读取编码文件,也即该目标字库文件只包含字符信息,不包含字符编码,大大减少了目标字库文件大小,避免造成网络流量开销增大,进一步减轻了扫描终端的内存开销和数据处理,这样也可以节省所述扫描终端解析字库的时间。
如图2所示,为本申请提供的另一种实施方式中,实现在线字库处理的方法的步骤流程图,所述方法应用于扫描终端,其特征在于,所述方法包括:
S21、启用所述扫描终端扫描图像,获得扫描信息;
S22、向服务端发送扫描信息和标识信息,其中,所述标识信息至少包括用于标识所述扫描终端包含第一字库的信息;
S23、接收服务端发送的目标字库文件及对应的读取编码文件,其中,所述目标字库文件仅与待显示的目标字符串信息相关;
S24、按照预设格式解析目标所述目标字库文件并保存至内存空间;
S25、根据所述读取编码文件及解析后的目标字库文件,得到待显示的目标信息;
S26、根据所述待显示的目标信息在显示单元进行绘制和/或刷新显示;
S27、删除所述目标字库文件及所述读取编码文件。
进一步地,所述方法还包括:接收用户的选择操作,根据用户的选择确定目标语言种类信息;
获取所述扫描终端的第一标识信息;将所述第一标识信息及所述目标语言种类信息,生成所述标识信息。
进一步地,所述S25、根据所述读取编码文件及解析后的目标字库文件,得到待显示的目标信息,还包括:
S251解析所述读取编码文件,判断所述读取编码文件是否包含长度信息;
S252、若否,则按顺序依次将所述读取编码文件各字符编码匹配所述第一字库及所述目标字库文件中的字符,得到各待显示的字符,将所有的待显示字符作为待显示目标信息;
S253若是,依次判断各读取编码文件的当前解析信息类型,若为字符编码信息,则根据字符编码匹配所述第一字库的字符,得到待显示的字符,若为长度信息,则直接按顺序读取所述目标字库文件中的与该长度对应的字符,解析下一读取编码文件的信息,直到得到所有待显示字符,将所有的待显示字符作为待显示目标信息。
在本申请的实现在线字库处理的方案中,通过服务端生成相应的较小而又与待显示的目标字符相匹配的读取编码文件和字库文件,无需占用所述扫描终端较大的内存空间,扫描终端也无需使用额外的字库芯片,降低了硬件成本,也方便字库进行拓展,也防止造成网络流量开销增大,页面加载速度缓慢等问题,还可以节省所述扫描终端解析字库及信息处理的时间。同时所述扫描终端每间隔一预设时间段就会将服务端发送的读取文件和仅包含要显示的字符的字库文件进行定期删除,防止占用本地的内存空间。
此外,本申请的方案不仅能够实现在较小存储介质的硬件系统中能够实现在线不同复杂信息的扫描和识别,所占用的存储空间可低至1~4M,极大减少了相关的硬件成本,而且所述扫描终端还可以根据用户需要翻译需求得到各种不同语言的翻译结果进行显示,及可提供多种语言支持。
图3示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图3所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现基于小程序的登录方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行实现在线字库的方法。本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现上述所述方法步骤。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以实现上述所述方法步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种字库在线处理方法,所述方法应用于服务端,其特征在于,所述方法包括:
接收扫描终端发送的扫描信息和标识信息;
根据所述标识信息,确定所述扫描终端的第一字库信息;
根据所述扫描信息及第一字库信息,识别要显示的目标字符串;
根据所述第一字库信息及所述目标字符串,生成所述目标字符串的目标字库文件及对应的读取编码文件,其中,所述目标字库文件仅与所述目标字符串相关;
将第一字符串的读取编码文件及目标字库文件发送至所述扫描终端。
2.根据权利要求1所述的方法,其特征在于,所述标识信息包括目标语言种类信息;所述根据所述扫描信息及第一字库信息,识别要显示的目标字符串包括:
根据所述扫描信息,识别得到所述扫描信息对应的第一字符串;
对所述第一字符串进行翻译成目标语言,得到对应第二字符串;
将所述第一字符串和所述第二字符串按照显示顺序及显示位置进行融合,得到所述目标字符串。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一字库信息及所述目标字符串,生成所述目标字符串的目标字库文件及对应的预设读取编码文件,包括:
按顺序提取所述目标字符串中未包含在所述第一字库中的字符,得到第一字符集;
判断所述第一字符集中字符数量在所述目标字符串字符数量的占比是否超过预设阈值;
若不超过,对所述第一字符集的字符进行去重处理,得到第一目标字符集;
根据所述第一目标字符集生成第一目标字库文件,其中,所述第一目标字库文件包括所述第一目标字符集的各显示字符及对应的字符编码;
按顺序生成所述目标字符串所有字符的字符编码,并将按顺序生成的字符编码作为对应的读取编码文件。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若所述占比超过预设阈值,直接将所述第一字符集作为目标字库文件;
根据所述目标字符串和所述第一字库,生产所述目标字符串的读取编码文件。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标字符串和所述第一字库,生产所述目标字符串的读取编码文件包括:
S1001:将所述目标字符的首字符作为当前字符;
S1002:判断当前字符是否包含在所述第一字库中,若是,执行S1003,否则执行S1004;
S1003:获取当前字符的字符编码,并将当前字符编码添加写入到编码文件中,判断当前字符是否为最后一个字符,若是,执行S1005,否则将下一字符作为当前字符,执行S1002;
S1004:获取当前字符开始连续不包含在所述第一字库中字符串长度,将所述长度信息添加写入到编码文件中,判断当前字符后是否还包含在所述第一字库中的字符,若是则将下一个包含在第一字库中的字符作为当前字符,执行S1002,否则执行S1005;
S1005:生产所述目标字符串对应的读取编码文件。
6.一种实现在线字库的方法,所述方法应用于扫描终端,其特征在于,所述方法包括:
启用所述扫描终端扫描图像,获得扫描信息;
向服务端发送扫描信息和标识信息,其中,所述标识信息至少包括用于标识所述扫描终端包含第一字库的信息;
接收服务端发送的目标字库文件及对应的读取编码文件,其中,所述目标字库文件仅与待显示的目标字符串信息相关;
按照预设格式解析目标所述目标字库文件并保存至内存空间;
根据所述读取编码文件及解析后的目标字库文件,得到待显示的目标信息;
根据所述待显示的目标信息在显示单元进行绘制和/或刷新显示。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
接收用户的选择操作,根据用户的选择确定目标语言种类信息;
获取所述扫描终端的第一标识信息;
将所述第一标识信息及所述目标语言种类信息,生成所述标识信息。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
解析所述读取编码文件,判断所述读取编码文件是否包含长度信息;
若否,则按顺序依次将所述读取编码文件各字符编码匹配所述第一字库及所述目标字库文件中的字符,得到各待显示的字符,将所有的待显示字符作为待显示目标信息;
若是,依次判断各读取编码文件的当前解析信息类型,若为字符编码信息,则根据字符编码匹配所述第一字库的字符,得到待显示的字符,若为长度信息,则直接按顺序读取所述目标字库文件中的与该长度对应的字符,解析下一读取编码文件的信息,直到得到所有待显示字符,将所有的待显示字符作为待显示目标信息;
将所述待显示的目标信息在显示单元的对应位置进行绘制和/或刷新显示。
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法步骤。
10.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以实现如权利要求1至8中任一项所述方法步骤。
CN202311320344.6A 2023-10-12 2023-10-12 一种字库在线处理方法、设备和介质 Active CN117077624B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311320344.6A CN117077624B (zh) 2023-10-12 2023-10-12 一种字库在线处理方法、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311320344.6A CN117077624B (zh) 2023-10-12 2023-10-12 一种字库在线处理方法、设备和介质

Publications (2)

Publication Number Publication Date
CN117077624A true CN117077624A (zh) 2023-11-17
CN117077624B CN117077624B (zh) 2024-01-26

Family

ID=88702759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311320344.6A Active CN117077624B (zh) 2023-10-12 2023-10-12 一种字库在线处理方法、设备和介质

Country Status (1)

Country Link
CN (1) CN117077624B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117975485A (zh) * 2024-03-28 2024-05-03 中国电子信息产业集团有限公司第六研究所 一种字符串的扫描方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006018700A (ja) * 2004-07-05 2006-01-19 Sharp Corp 多言語対応携帯通信端末
CN102279841A (zh) * 2011-08-31 2011-12-14 深圳市茁壮网络股份有限公司 一种实现多字体显示的方法、用户端及服务器
CN102572080A (zh) * 2010-12-30 2012-07-11 上海亿人通信终端有限公司 在终端显示复杂字符的方法
CN105528345A (zh) * 2014-09-28 2016-04-27 北大方正集团有限公司 终端、服务器和补字方法
WO2018164322A1 (ko) * 2017-03-06 2018-09-13 코아글림 주식회사 다국어 지원 스마트 디지털 사이니지 시스템 및 운용방법
CN109032616A (zh) * 2018-06-08 2018-12-18 重庆洋逸乐科技有限公司 一种字库烧写方法、电子设备和存储介质
CN110597591A (zh) * 2019-09-17 2019-12-20 深圳融昕医疗科技有限公司 嵌入式设备的界面多语言实现方法、装置及存储介质
CN112651212A (zh) * 2020-08-16 2021-04-13 深圳信可通讯技术有限公司 一种远程获取字库的方法及终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006018700A (ja) * 2004-07-05 2006-01-19 Sharp Corp 多言語対応携帯通信端末
CN102572080A (zh) * 2010-12-30 2012-07-11 上海亿人通信终端有限公司 在终端显示复杂字符的方法
CN102279841A (zh) * 2011-08-31 2011-12-14 深圳市茁壮网络股份有限公司 一种实现多字体显示的方法、用户端及服务器
CN105528345A (zh) * 2014-09-28 2016-04-27 北大方正集团有限公司 终端、服务器和补字方法
WO2018164322A1 (ko) * 2017-03-06 2018-09-13 코아글림 주식회사 다국어 지원 스마트 디지털 사이니지 시스템 및 운용방법
CN109032616A (zh) * 2018-06-08 2018-12-18 重庆洋逸乐科技有限公司 一种字库烧写方法、电子设备和存储介质
CN110597591A (zh) * 2019-09-17 2019-12-20 深圳融昕医疗科技有限公司 嵌入式设备的界面多语言实现方法、装置及存储介质
CN112651212A (zh) * 2020-08-16 2021-04-13 深圳信可通讯技术有限公司 一种远程获取字库的方法及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王健飞 等: "一种嵌入式系统汉语与维吾尔语双语显示的方法", 网络新媒体技术, vol. 2, no. 02, pages 48 - 52 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117975485A (zh) * 2024-03-28 2024-05-03 中国电子信息产业集团有限公司第六研究所 一种字符串的扫描方法、装置、电子设备及存储介质
CN117975485B (zh) * 2024-03-28 2024-06-07 中国电子信息产业集团有限公司第六研究所 一种字符串的扫描方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN117077624B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN117077624B (zh) 一种字库在线处理方法、设备和介质
CN105677764A (zh) 信息提取方法和装置
CN111176996A (zh) 测试用例生成方法、装置、计算机设备及存储介质
CN103455475B (zh) 排版方法、设备及系统
JP4502615B2 (ja) 類似文検索装置、類似文検索方法、およびプログラム
CN111324716A (zh) 指标数据获取方法、装置、计算机设备和存储介质
CN111831920A (zh) 用户需求分析方法、装置、计算机设备及存储介质
US20150205765A1 (en) Font process method and font process system
CN113033165A (zh) 电子表格文件解析方法、装置和计算机可读存储介质
CN112528832A (zh) 对pdf格式的继电保护定值单进行处理的方法和系统
CN111382570A (zh) 文本实体识别方法、装置、计算机设备及存储介质
WO2021047327A1 (zh) 目标概念图谱的构建方法、装置、计算机设备和存储介质
CN109712613B (zh) 语义分析库更新方法、装置及电子设备
CN111552527A (zh) 用户界面内文字翻译方法、装置、系统及存储介质
CN116861881A (zh) 数据处理方法、装置、设备及介质
CN111324344A (zh) 代码语句的生成方法、装置、设备及可读存储介质
US10942934B2 (en) Non-transitory computer-readable recording medium, encoded data searching method, and encoded data searching apparatus
CN112016297B (zh) 意图识别模型测试方法、装置、计算机设备和存储介质
CN114492303A (zh) 电子书的排版处理方法、电子设备及存储介质
CN114169331A (zh) 地址解析方法、装置、计算机设备和存储介质
CN104182396A (zh) 终端、版式文档内容描述优化装置和方法
CN112528599A (zh) 基于xml的多页文档处理方法、装置、计算机设备及介质
CN110674093A (zh) 文件数据处理方法、装置、计算机设备和存储介质
CN115099212B (zh) 基于模板设计的归类方法、装置、介质及计算机设备
CN114817685B (zh) 一种快速锁定目标信息的方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant