CN104516899A - 字库更新方法和装置 - Google Patents

字库更新方法和装置 Download PDF

Info

Publication number
CN104516899A
CN104516899A CN201310455168.7A CN201310455168A CN104516899A CN 104516899 A CN104516899 A CN 104516899A CN 201310455168 A CN201310455168 A CN 201310455168A CN 104516899 A CN104516899 A CN 104516899A
Authority
CN
China
Prior art keywords
word
supplement
character
character library
bit pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310455168.7A
Other languages
English (en)
Other versions
CN104516899B (zh
Inventor
王玉欣
栾瑛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201310455168.7A priority Critical patent/CN104516899B/zh
Publication of CN104516899A publication Critical patent/CN104516899A/zh
Application granted granted Critical
Publication of CN104516899B publication Critical patent/CN104516899B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明提供一种字库更新方法和装置,其中方法包括:获取待添加到字库中的增补字的位图信息;获取字库中各字符的位图信息;根据增补字的位图信息与字库中各字符的位图信息,判断字库是否包括增补字;若字库不包括增补字,则确定增补字为有效增补字;将有效增补字添加到字库中,用于解决现有技术中根据增补字的字符结构信息人工在标准中进行查找,效率差,准确度低的问题。

Description

字库更新方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种字库更新方法和装置。
背景技术
现有技术中,为了完善我国正在建设的人口基础信息库、法人单位基础信息库、自然资源和地理空间基础信息库、宏观经济数据库等数据库的字库,需要获取全国人名、地名等中的增补字,判断增补字是否有效,若增补字为有效的增补字,则将增补字添加到原有字库中。
现有技术中,判断增补字是否有效的方法为:根据增补字的字符结构信息人工在Unicode5.0等标准中进行查找,若在标准中查找到该增补字,则该增补字为无效的增补字,若在标准中未查找到该增补字,则该增补字为有效的增补字。
然而现有技术中,由于标准收录的字符很多,例如最新Unicode标准已收纳汉字八万多字,根据增补字的字符结构信息人工在标准中进行查找,效率差,准确度低。
发明内容
本发明提供一种字库更新方法和装置,用于解决现有技术中根据增补字的字符结构信息人工在标准中进行查找,效率差,准确度低的问题。
本发明的第一个方面是提供一种字库更新方法,包括:
获取待添加到字库中的增补字的位图信息;
获取所述字库中各字符的位图信息;
根据所述增补字的位图信息与所述字库中各字符的位图信息,判断所述字库是否包括所述增补字;
若所述字库不包括所述增补字,则确定所述增补字为有效增补字;
将所述有效增补字添加到所述字库中。
本发明的另一个方面提供一种字库更新装置,包括:
获取模块,用于获取待添加到字库中的增补字的位图信息;
所述获取模块,还用于获取所述字库中各字符的位图信息;
判断模块,用于根据所述增补字的位图信息与所述字库中各字符的位图信息,判断所述字库是否包括所述增补字;
确定模块,用于在所述字库不包括所述增补字时,确定所述增补字为有效增补字;
添加模块,用于将所述有效增补字添加到所述字库中。
本发明中,通过根据增补字的位图信息与字库中各字符的位图信息,判断字库是否包括增补字,根据判断结果确定增补字是否为有效增补字,将有效增补字添加到字库中,减少了现有技术中根据增补字的字符结构信息人工在标准中进行查找的时间,提高了判断增补字是否有效的效率和准确度,减少了在字库中增加重复字符出现的可能性。
附图说明
图1为本发明提供的字库更新方法一个实施例的流程图;
图2为增补字与字库中的某个字符相同的情形;
图3为增补字与字库中的某个字符相似的情形;
图4为本发明提供的字库更新方法又一个实施例的流程图;
图5为增补字中两个字符差一个笔划的情形;
图6为增补字中两个字符相似的情形;
图7为本发明提供的字库更新装置一个实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明提供的字库更新方法一个实施例的流程图,如图1所示,包括:
101、获取待添加到字库中的增补字的位图信息。
其中,本发明提供的字库更新方法可以由字库更新装置执行,字库具体可以为人口基础信息库、法人单位基础信息库、自然资源和地理空间基础信息库、宏观经济数据库等的字库。增补字具体可以指人名、地名中的未包括在字库中的生僻字。增补字的位图信息指的是增补字的点阵图像信息或绘制图像信息,是由称作像素的多个点组成的。这些点可以进行不同的排列和染色以构成图像。
具体地,字库更新装置可以先获取待添加到字库中的增补字的字符结构信息,对增补字的字符结构信息进行转换,得到待添加到字库中的增补字的位图信息。
可选的,字库更新装置可以在待添加到字库中的增补字的数量满足预设的数量阈值时,获取待添加到字库中的增补字的位图信息;或者,字库更新装置也可以获取一段时间内的待添加到字库中的增补字,在时间段的长度满足预设的时间阈值时,获取待添加到字库中的增补字的位图信息。
102、获取字库中各字符的位图信息。
其中,字库中的字符具体指的是人口基础信息库、法人单位基础信息库、自然资源和地理空间基础信息库、宏观经济数据库等字库中的字。字库中的字符具体是以矢量方式进行保存的。字符的矢量方式指的是,将每个字符的笔画分解成数学模型中定义好的各种直线和曲线,然后记下这些直线和曲线的参数。字符的位图信息的定义与增补字的位图信息的定义类似。
103、根据增补字的位图信息与字库中各字符的位图信息,判断字库是否包括增补字。
具体地,字库更新装置将字库中的字符转成位单色位图,获取到字库中各字符的位图信息后,字库更新装置分别将增补字的位图信息与字库中各字符的位图信息进行比较;
若字库中不存在位图信息与增补字的位图信息的匹配度都满足预设的阈值的字符,则确定字库不包括增补字;
若字库中存在位图信息与增补字的位图信息的匹配度满足预设的阈值的至少一个字符,则确定字库中存在增补字的相似字符或相同字符;
若字库中存在增补字的相同字符,则确定字库包括增补字。
其中,匹配度具体指的是两个字符的位图信息之间的相似度,例如字库中某个字符的位图信息与增补字的位图信息的匹配度指的是字库中该字符的位图信息与增补字的位图信息之间的相似度,相似度具体可以用百分比来表示。预设的阈值具体指的也是百分比。字库中存在位图信息与增补字的位图信息的匹配度满足预设的阈值的至少一个字符,具体指的是,字库中存在位图信息与增补字的位图信息的相似度满足预设的百分比的至少一个字符。
在字库中存在位图信息与增补字的位图信息的匹配度满足预设的阈值的至少一个字符的情况下,需进行人工筛查,判断增补字与字库中的所述至少一个字符是相似字符还是相同字符,若增补字与字库中的所述至少一个字符是相同字符,则确定字库包括所述增补字。例如,在字库中存在位图信息与增补字的位图信息的匹配度满足预设的阈值的至少一个字符的情况下,如图2所示,为增补字与字库中的某个字符相同的情形,如图3所示,为增补字与字库中的某个字符相似的情形。
其中,预设的阈值可以由字库更新装置在对增补字的位图信息与字库中各字符的位图信息进行比较之前进行设置。
另外,由于增补字的位图信息与增补字的类型有一定的关系,即与增补字的字面大小和字体风格有一定的关系,字面大小指的是在字号相同的情况下字符的显示大小,当字符的字号相同且显示大小相同时,字面大小相同;字体风格指的是增补字的字体以及增补字是否加粗、是否倾斜等特征。也就是说,针对同一个增补字,不同字体风格的增补字或不同字面大小的增补字对应的位图信息是不同的。因此,若待添加到字库中的增补字与字库中各字符的类型相同,则可以进一步提高增补字的位图信息与字库中各字符的位图信息的匹配度,提高判断增补字是否有效的准确度。
104、若字库不包括增补字,则确定增补字为有效增补字。
105、将有效增补字添加到字库中。
其中,字库更新装置可以按照字库的编码规则对有效增补字进行编码,将有效增补字及对应的编码添加到字库中,将有效增补字及对应的编码添加到字库中后,字库更新装置还可以对字库进行测试,若测试通过,可以将字库作为产品进行发布。
另外,本发明提供的字库更新装置中确定增补字是否有效的方法也可以用于检查某字库是否有重复字符,例如检查中华大字库的成果字库、中华经典古籍库、商周铜器铭文知识库等数字库是否有重复字符。
本实施例中,通过根据增补字的位图信息与字库中各字符的位图信息,判断字库是否包括增补字,根据判断结果确定增补字是否为有效增补字,将有效增补字添加到字库中,减少了现有技术中根据增补字的字符结构信息人工在标准中进行查找的时间,提高了判断增补字是否有效的效率和准确度,减少了在字库中增加重复字符出现的可能性。
图4为本发明提供的字库更新方法又一个实施例的流程图,如图4所示,为了进一步提高判断增补字是否有效的效率,在图1所示实施例的基础上,步骤103之前,还可以包括:
106、根据增补字的位图信息,判断待添加到字库中的增补字中是否存在匹配度满足预设的阈值的至少两个增补字。
具体地,字库分析装置可以根据每个增补字的字符结构信息等信息,给每个增补字编制一个临时码位,将这些增补字做成一个小字库,这些增补字的类型可以与字库中各字符的类型一致,然后依次获取小字库中的每个增补字,并分别将每个增补字的位图信息与小字库中的其他增补字的位图信息进行匹配;若某个增补字的位图信息与小字库中的其他增补字的位图信息的匹配度满足预设的阈值,则小字库中存在相似字符或者相同字符,在小字库中存在相似字符的情况下,如图5所示,为增补字中两个字符差一个笔划的情形;若每个增补字的位图信息与小字库中的其他增补字的位图信息的匹配度不满足预设的阈值,则小字库中不存在相同字符或相似字符。
在某个增补字的位图信息与小字库中的其他增补字的位图信息的匹配度满足预设的阈值时,例如在第一增补字的位图信息与第二增补字的位图信息的匹配度满足预设的阈值的情况下,需进行人工筛查,判断第一增补字与第二增补字是相似字符还是相同字符,若第一增补字与第二增补字为相同字符,则确定第一增补字与第二增补字是重复字符,若第一增补字与第二增补字为相似字符,则确定第一增补字与第二增补字不是重复字符。例如,如图6所示,为增补字中两个字符相似的情形。
107、若待添加到字库中的增补字中存在匹配度满足预设的阈值的至少两个增补字,则待添加到字库中的增补字中存在至少两个相同增补字或至少两个相似增补字。
108、若待添加到字库中的增补字中存在至少两个相同增补字,则删除至少两个相同增补字中的重复增补字。
具体地,若小字库中存在匹配度满足预设的阈值的增补字,则说明小字库中存在相似字符或相同字符,若为相同字符,则删除重复字符。
本实施例中,通过根据增补字的位图信息与字库中各字符的位图信息,先根据增补字的位图信息判断增补字之间是否存在重复字符,若存在重复字符,删除重复字符,然后再判断字库是否包括增补字,根据判断结果确定增补字是否为有效增补字,将有效增补字添加到字库中,减少了现有技术中根据增补字的字符结构信息人工在标准中进行查找的时间,提高了判断增补字是否有效的效率和准确度,减少了在字库中增加重复字符出现的可能性。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图7为本发明提供的字库更新装置一个实施例的结构示意图,如图7所示,包括:
获取模块71,用于获取待添加到字库中的增补字的位图信息;
获取模块71,还用于获取字库中各字符的位图信息;
判断模块72,用于根据增补字的位图信息与字库中各字符的位图信息,判断字库是否包括增补字;
确定模块73,用于在字库不包括增补字时,确定增补字为有效增补字;
添加模块74,用于将有效增补字添加到字库中。
进一步地,判断模块72根据增补字的位图信息与字库中各字符的位图信息,判断字库是否包括增补字中,判断模块72具体用于,
分别将增补字的位图信息与字库中各字符的位图信息进行比较;
若字库中不存在位图信息与增补字的位图信息的匹配度满足预设的阈值的字符,则确定字库不包括增补字;
若字库中存在位图信息与增补字的位图信息的匹配度满足预设的阈值的至少一个字符,则确定字库中存在增补字的相似字符或相同字符;
若字库中存在增补字的相同字符,则确定字库包括增补字。
更进一步地,为了进一步提高判断增补字是否有效的效率,所述字库更新装置还可以包括:删除模块;
判断模块72还用于,在判断模块72根据增补字的位图信息与字库中各字符的位图信息,判断字库是否包括增补字之前,根据增补字的位图信息,判断待添加到字库中的增补字中是否存在匹配度满足预设的阈值的至少两个增补字;
若待添加到字库中的增补字中存在匹配度满足预设的阈值的至少两个增补字,则待添加到字库中的增补字中存在至少两个相同增补字或至少两个相似增补字;
删除模块,用于在待添加到字库中的增补字中存在至少两个相同增补字时,删除所述至少两个相同增补字中的重复增补字中。
再进一步地,为了进一步提高增补字的位图信息与字库中各字符的位图信息的匹配度,提高判断增补字是否有效的准确度,增补字的类型与字库中各字符的类型保持一致,类型包括字面大小和字体风格。
本实施例中,通过根据增补字的位图信息与字库中各字符的位图信息,判断字库是否包括增补字,根据判断结果确定增补字是否为有效增补字,将有效增补字添加到字库中,减少了现有技术中根据增补字的字符结构信息人工在标准中进行查找的时间,提高了判断增补字是否有效的效率和准确度,减少了在字库中增加重复字符出现的可能性。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种字库更新方法,其特征在于,包括:
获取待添加到字库中的增补字的位图信息;
获取所述字库中各字符的位图信息;
根据所述增补字的位图信息与所述字库中各字符的位图信息,判断所述字库是否包括所述增补字;
若所述字库不包括所述增补字,则确定所述增补字为有效增补字;
将所述有效增补字添加到所述字库中。
2.根据权利要求1所述的方法,其特征在于,所述根据所述增补字的位图信息与所述字库中各字符的位图信息,判断所述字库是否包括所述增补字,包括:
分别将所述增补字的位图信息与所述字库中各字符的位图信息进行比较;
若所述字库中不存在位图信息与所述增补字的位图信息的匹配度满足预设的阈值的所述字符,则确定所述字库不包括所述增补字;
若所述字库中存在位图信息与所述增补字的位图信息的匹配度满足预设的阈值的至少一个所述字符,则确定所述字库中存在所述增补字的相似字符或相同字符;
若所述字库中存在所述增补字的相同字符,则确定所述字库包括所述增补字。
3.根据权利要求2所述的方法,其特征在于,所述根据所述增补字的位图信息与所述字库中各字符的位图信息,判断所述字库是否包括所述增补字之前,还包括:
根据所述增补字的位图信息,判断所述待添加到字库中的增补字中是否存在匹配度满足预设的阈值的至少两个增补字;
若所述待添加到字库中的增补字中存在匹配度满足预设的阈值的至少两个增补字,则所述待添加到字库中的增补字中存在至少两个相同增补字或至少两个相似增补字;
若所述待添加到字库中的增补字中存在至少两个相同增补字,则删除所述至少两个相同增补字中的重复增补字。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述增补字的类型与所述字库中各字符的类型相同,所述类型包括字面大小和字体风格。
5.一种字库更新装置,其特征在于,包括:
获取模块,用于获取待添加到字库中的增补字的位图信息;
所述获取模块,还用于获取所述字库中各字符的位图信息;
判断模块,用于根据所述增补字的位图信息与所述字库中各字符的位图信息,判断所述字库是否包括所述增补字;
确定模块,用于在所述字库不包括所述增补字时,确定所述增补字为有效增补字;
添加模块,用于将所述有效增补字添加到所述字库中。
6.根据权利要求5所述的装置,其特征在于,所述判断模块根据所述增补字的位图信息与所述字库中各字符的位图信息,判断所述字库是否包括所述增补字中,所述判断模块具体用于,
分别将所述增补字的位图信息与所述字库中各字符的位图信息进行比较;
若所述字库中不存在位图信息与所述增补字的位图信息的匹配度满足预设的阈值的所述字符,则确定所述字库不包括所述增补字;
若所述字库中存在位图信息与所述增补字的位图信息的匹配度满足预设的阈值的至少一个所述字符,则确定所述字库中存在所述增补字的相似字符或相同字符;
若所述字库中存在所述增补字的相同字符,则确定所述字库包括所述增补字。
7.根据权利要求6所述的装置,其特征在于,还包括:删除模块;
所述判断模块还用于,在所述判断模块根据所述增补字的位图信息与所述字库中各字符的位图信息,判断所述字库是否包括所述增补字之前,根据所述增补字的位图信息,判断所述待添加到字库中的增补字中是否存在匹配度满足预设的阈值的至少两个增补字;
若所述待添加到字库中的增补字中存在匹配度满足预设的阈值的至少两个增补字,则所述待添加到字库中的增补字中存在至少两个相同增补字或至少两个相似增补字;
所述删除模块,用于在所述待添加到字库中的增补字中存在至少两个相同增补字时,删除所述至少两个相同增补字中的重复增补字。
8.根据权利要求5-7任一项所述的装置,其特征在于,所述增补字的类型与所述字库中各字符的类型相同,所述类型包括字面大小和字体风格。
CN201310455168.7A 2013-09-29 2013-09-29 字库更新方法和装置 Expired - Fee Related CN104516899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310455168.7A CN104516899B (zh) 2013-09-29 2013-09-29 字库更新方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310455168.7A CN104516899B (zh) 2013-09-29 2013-09-29 字库更新方法和装置

Publications (2)

Publication Number Publication Date
CN104516899A true CN104516899A (zh) 2015-04-15
CN104516899B CN104516899B (zh) 2017-10-13

Family

ID=52792213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310455168.7A Expired - Fee Related CN104516899B (zh) 2013-09-29 2013-09-29 字库更新方法和装置

Country Status (1)

Country Link
CN (1) CN104516899B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326195A (zh) * 2015-06-17 2017-01-11 北大方正集团有限公司 字符处理方法和处理系统
CN107909097A (zh) * 2017-11-08 2018-04-13 阿里巴巴集团控股有限公司 样本库中样本的更新方法及装置
CN111144066A (zh) * 2019-12-27 2020-05-12 北大方正集团有限公司 字库字面的调整方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1673999A (zh) * 2004-03-24 2005-09-28 无敌科技股份有限公司 电子辞典的数据库更新维护系统及其方法
CN1983239A (zh) * 2006-04-06 2007-06-20 华为技术有限公司 一种字符输入显示方法及系统
US20090299974A1 (en) * 2008-05-29 2009-12-03 Fujitsu Limited Character sequence map generating apparatus, information searching apparatus, character sequence map generating method, information searching method, and computer product
CN102479228A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 在线词典更新资料的推送系统及其方法
CN102750337A (zh) * 2012-06-01 2012-10-24 中国科学院声学研究所 字库的制作方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1673999A (zh) * 2004-03-24 2005-09-28 无敌科技股份有限公司 电子辞典的数据库更新维护系统及其方法
CN1983239A (zh) * 2006-04-06 2007-06-20 华为技术有限公司 一种字符输入显示方法及系统
US20090299974A1 (en) * 2008-05-29 2009-12-03 Fujitsu Limited Character sequence map generating apparatus, information searching apparatus, character sequence map generating method, information searching method, and computer product
CN102479228A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 在线词典更新资料的推送系统及其方法
CN102750337A (zh) * 2012-06-01 2012-10-24 中国科学院声学研究所 字库的制作方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326195A (zh) * 2015-06-17 2017-01-11 北大方正集团有限公司 字符处理方法和处理系统
CN106326195B (zh) * 2015-06-17 2019-06-11 北大方正集团有限公司 字符处理方法和处理系统
CN107909097A (zh) * 2017-11-08 2018-04-13 阿里巴巴集团控股有限公司 样本库中样本的更新方法及装置
CN107909097B (zh) * 2017-11-08 2021-07-30 创新先进技术有限公司 样本库中样本的更新方法及装置
CN111144066A (zh) * 2019-12-27 2020-05-12 北大方正集团有限公司 字库字面的调整方法、装置、设备和存储介质
CN111144066B (zh) * 2019-12-27 2022-02-18 北大方正集团有限公司 字库字面的调整方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN104516899B (zh) 2017-10-13

Similar Documents

Publication Publication Date Title
CN108090400B (zh) 一种图像文本识别的方法和装置
US11216658B2 (en) Utilizing glyph-based machine learning models to generate matching fonts
CN113011420A (zh) 字符识别方法、模型训练方法、相关装置及电子设备
CN111143551A (zh) 文本预处理方法、分类方法、装置及设备
CN113158987B (zh) 表格处理方法、装置、设备及计算机可读存储介质
CN111899191B (zh) 一种文本图像修复方法、装置及存储介质
CN111666442A (zh) 一种图像检索方法、装置及计算机设备
CN104516899A (zh) 字库更新方法和装置
CN107203764A (zh) 长微博图片识别方法和装置
CN113780297B (zh) 图像处理方法、装置、设备以及存储介质
CN116306498B (zh) 文字渲染方法及装置
CN103136166B (zh) 字体确定方法和设备
CN107943760B (zh) Pdf文档编辑的字体优化方法、装置、终端设备和存储介质
CN114579796B (zh) 机器阅读理解方法及装置
KR101772831B1 (ko) 중간 문자 라이브러리의 형성 방법 및 장치
CN113554549B (zh) 文本图像的生成方法、装置、计算机设备和存储介质
CN113095058B (zh) 一种流式文档翻页处理方法、装置、电子设备及存储介质
CN113468906B (zh) 图形码提取模型构建方法、识别方法、装置、设备和介质
CN106569986A (zh) 字符串替换方法和装置
CN115457581A (zh) 表格提取方法、装置及计算机设备
CN114818627A (zh) 一种表格信息抽取方法、装置、设备及介质
CN110276051B (zh) 拆分字体部件的方法及装置
CN110263303B (zh) 文本修改历史的追溯方法及装置
CN111027325A (zh) 一种模型生成方法、实体识别方法、装置及电子设备
CN114140688B (zh) 基于透射扫描图像的叶脉表型提取方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220620

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171013