CN113326674B - 一种用于社会信用代码核查的字码抽取系统与方法 - Google Patents

一种用于社会信用代码核查的字码抽取系统与方法 Download PDF

Info

Publication number
CN113326674B
CN113326674B CN202110888928.8A CN202110888928A CN113326674B CN 113326674 B CN113326674 B CN 113326674B CN 202110888928 A CN202110888928 A CN 202110888928A CN 113326674 B CN113326674 B CN 113326674B
Authority
CN
China
Prior art keywords
font
code
area
character
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110888928.8A
Other languages
English (en)
Other versions
CN113326674A (zh
Inventor
朱峰
章学周
吕浩
沈健威
吴杰
李玥
黄洁
赵文清
王理
徐雪岚
倪文红
孙芳
杨璐瑶
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Institute Of Quality And Standardization
Original Assignee
Jiangsu Institute Of Quality And Standardization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Institute Of Quality And Standardization filed Critical Jiangsu Institute Of Quality And Standardization
Priority to CN202110888928.8A priority Critical patent/CN113326674B/zh
Publication of CN113326674A publication Critical patent/CN113326674A/zh
Application granted granted Critical
Publication of CN113326674B publication Critical patent/CN113326674B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

一种用于社会信用代码核查的字码抽取系统与方法,包括:外部系统和与外部系统通信连接的主控终端;数据解码模块运行在主控终端上;所述外部系统用于传递OFD文档至所述主控终端;所述数据解码模块用于从所述OFD文档中获得包含统一社会信用代码数据的信息;所述数据解码模块包括OFD文档解码单元、确认单元与操控单元;OFD文档解码单元,用于获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;有效避免了现有技术中数据解码模块从OFD文档中获得包含统一社会信用代码数据的信息中抓取文字耗时长、常发生导入出错、辨识率不佳的缺陷。

Description

一种用于社会信用代码核查的字码抽取系统与方法
技术领域
本发明涉及字码抽取技术领域,具体涉及一种用于社会信用代码核查的字码抽取系统与方法。
背景技术
法人和其他组织统一社会信用代码制度,相当于让法人和其他组织拥有了一个全国统一的“身份证号”,标准规定统一社会信用代码用18位阿拉伯数字或大写英字码母表示,分别是1位登记管理部门代码、1位机构类别代码、6位登记管理机关行政区划码、9位主体标识码、1位校验码。由登记管理部门代码、机构类别代码、登记管理机关行政区划码、主体标识码(组织机构代码)和校验码五个部分组成,且对涉及到的组织机构、法人、其他组织、组织机构代码、统一社会信用代码等相应概念作出了规定。
在现有的社会信用代码数据核查模式中,普遍需要经由数据解码模块获得包含统一社会信用代码数据的信息,随后将包含统一社会信用代码数据的信息传递至核对数据库内,构造核对数据请求表;以此来进一步执行社会信用代码数据核查。包含统一社会信用代码数据的信息除了统一社会信用代码数据外,还包括法人或其他组织的名称、法人或其他组织的地址、法人或其他组织负责人的姓名这样的信息。
而数据解码模块获得包含统一社会信用代码数据的信息,往往是获得外部系统传送来的文档后,在传送来的文档中获得包含统一社会信用代码数据的信息。
另一方面,伴随着OFD版式文档的广泛运用,外部系统传来的文档也越来越多的是这样的OFD版式文档,OFD版式文档也就是OFD文档,OFD文档,就是版式文件的一种,它最大的特点在于,这是我国自主研发、自主制定的版式文档形式标准,其具有:
OFD文档内部运用可扩展标记语言XML来描述数据和结构,体积精简,安全开放,易于扩展;OFD支持国产加密算法,具有全面的安全保障体系,可防止信息被窃取,并且和数字签名技术结合,可防篡改抵赖,更加安全;永久可读可用,可对文件长久保存,且能够精准呈现,文件的版式内容在不一样场景、设备下都能保持一致性;OFD版式文档的标准,是由工业和信息化部软件司牵头中国电子技术标准化研究院成立的版式编写组制定的国家标准。
这样,数据解码模块从OFD文档中获得包含统一社会信用代码数据的信息,该获得为抽取出OFD文档内具有的字码数据,且经由规范的信息处置,把所述字码数据转变成宜于修改的文档形式,就像.wps这样的文档形式;现在,对OFD文档的字码抽取有二类模式,一类为运用抓取文字方式来把OFD文档转化为图片,需要说明的是就是运用抓取文字CaptureText软件来经由页面剖析、字段分割与字码辨识来把确认值导出,该模式的全部OFD文档的字码数据均要执行抓取文字CaptureText软件辨识,不光耗时长,也会发生导入出错,具有辨识率不佳的缺陷;另一类模式为运用OFD文档执行解码,抽取字码的调制码,然而在OFD文档内,具有字码的调制码与导出的字码不相符的现象发生,使得该模式抽取的字码不正确;就如,OFD文档形式规范说明了一些字型的调制码到单一码的关联,然而依然有一些OFD文档字型不能达成经字型的调制码到单一码的关联,因此字码的调制码与导出的字码不相符,辨识率不佳。
发明内容
为解决所述问题,本发明提供了一种用于社会信用代码核查的字码抽取系统和方法,有效避免了现有技术中数据解码模块从OFD文档中获得包含统一社会信用代码数据的信息中抓取文字耗时长、常发生导入出错、辨识率不佳的缺陷。
要克服现有技术中的不足,本发明提供了一种用于社会信用代码核查的字码抽取系统和方法的解决方案,具体如下:
一种用于社会信用代码核查的字码抽取系统,包括:
外部系统和与外部系统通信连接的主控终端;
数据解码模块运行在主控终端上;
所述外部系统用于传递OFD文档至所述主控终端;
所述数据解码模块用于从所述OFD文档中获得包含统一社会信用代码数据的信息;
所述数据解码模块包括OFD文档解码单元、确认单元与操控单元;
OFD文档解码单元,用于获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;
确认单元,用于依据所述字码区的字型数据确认所述字码区的字型种类而获得确认值一,依据所述字码区的内在数据确认所述字码区是非嵌进于所述OFD文档页面内而获得确认值二;
所述确认单元包括:确认单元一;
确认单元一,用于依据获得的所述字型数据确认所述字码区的字型种类归于字型种类一或字型种类二;
操控单元,用于对归于所述字型种类二且是嵌进于所述OFD文档页面中的所述字码区执行抓取文字CaptureText软件辨识且获得确认值三。
优选地,确认单元还包括:确认单元二;
确认单元二,用于依据获得的所述内在数据确认所述字码区是不是嵌进于所述OFD文档页面中。
优选地,所述数据解码模块还包括:调节单元;
调节单元,用于获得所述字码区的所述确认值一、所述确认值二与所述确认值三,依据字码区库的各字码区的所述内在数据、所述字型数据与字码大小数据,对所述字码区的所述确认值一、所述确认值二与所述确认值三执行按序排布以及分类,对所述OFD文档页面的再构造。
另外,所述OFD文档页面包括一个以上的所述字码区。
一种用于社会信用代码核查的字码抽取系统的方法,包括:
步骤1,所述外部系统传递OFD文档至所述主控终端;
步骤2,所述数据解码模块从所述OFD文档中获得包含统一社会信用代码数据的信息;
所述步骤2具体包括:
步骤2-1:获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;
优选地,所述字码区的字码的栅格图色彩的调制方式能够用RGB的照度对所述字码区的字码的栅格图加色而获得调制码一;所述字码区的字码的栅格图色彩的调制方式亦能够经由着色的方式对所述字码区的字码的栅格图加色而获得调制码一。
步骤2-2:依据所述字码区的字型数据确认所述字码区的字型种类而获得确认值一,依据所述字码区的内在数据确认所述字码区是非嵌进于所述OFD文档页面内而获得确认值二;
所述字码区的字型数据是字型种类,所述字型种类包含字型种类一与字型种类二;所述确认值一能够包含字码区的字型种类是字型种类一与字码区的字型种类是字型种类二,也就是所述OFD文档页面中的各字码区顺序依据所述字码区的字型数据确认所述字码区的字型种类是字型种类一或字型种类二。
所述字码区的内在数据是所述字码区是非嵌进于所述OFD文档页面,所述字码区是非嵌进于所述OFD文档页面就是所述字码区中的字型是不是已载入所述主控终端内,如果已载入所述主控终端内,就表示所述字码区是嵌进于所述OFD文档页面的,如果未载入所述主控终端内,就表示所述字码区是非嵌进于所述OFD文档页面的。
步骤2-3:依据所述确认值一与所述确认值二对所述字码区执行抽取;
所述步骤2-3内的所述依据所述确认值一和所述确认值二对所述字码区执行抽取的达成方法,包括:
步骤2-3-1:如果所述确认值一内所述字码区的字型种类是字型种类一,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值一;
优选地,如果所述确认值一内所述字码区的字型种类是普通字型种类一,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图运用照度辨识的方式把所述字码区的字码的栅格图转化为字码区的单一码,且获得调制码二;
所述字码区的字码的栅格图执行抓取文字CaptureText软件辨识获得的所述字码区的抽取值一还包含辨识确信值一;所述辨识确信值一是所述字码区的调制码二是不是为所述字码区的实际字码的确信值。
步骤2-3-2:如果所述确认值一内所述字码区的字型种类是字型种类二,且所述确认值二内所述字码区非嵌进于所述OFD文档页面中,那么所述字码区的调制码一是所述字码区的抽取值二;
所述字型种类二包含普通字型种类二与特殊字型种类;
所述特殊字型种类为OFD文档支持的除去普通字型种类一与普通字型种类二字型种类之外的另外的字型种类。
优选地,如果所述确认值一内所述字码区的字型种类为普通字型种类二或特殊字型种类,且所述确认值二内所述字码区非嵌进于所述OFD文档页面中,那么所述字码区的调制码一就成为所述字码区的实际字码。
步骤2-3-3:如果所述确认值一内所述字码区的字型种类是字型种类二,且所述确认值二中所述字码区是嵌进于所述OFD文档页面内,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值三。
优选地,所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识还包含辨识确信值二;所述辨识确信值二为所述字码区的调制码三是不是为所述字码区的实际字码的确信值。
优选地,所述步骤2-3-1内的运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值一的方法,包括:
步骤2-3-1-1:所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识来获得所述字码区的调制码二与辨识确信值一;
步骤2-3-1-2:如果所述字码区的辨识确信值一高过事先设定的辨识确信值的临界数,那么所述字码区的调制码二就是所述字码区的抽取值一;
步骤2-3-1-3:若所述字码区的辨识确信值一低于所述事先设定的辨识确信值的临界数,那么所述字码区的字码的栅格图是所述字码区的抽取值一。
优选地,所述步骤2-3-3内的运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值三的方法,包括:
步骤2-3-3-1:所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识获得所述字码区的调制码三与辨识确信值二;
所述抽取值三包含所述调制码三与所述辨识确信值二;所述辨识确信值二是运行抓取文字CaptureText软件对所述字码区执行辨识后的单一码是不是为所述字码区的实际字码的确信值,也就是所述字码区的调制码三是不是为所述字码区的实际字码的确信值;
如果所述确认值一内所述字码区的字型种类是普通字型种类二或特殊字型种类,且所述确认值二内所述字码区是嵌进于所述OFD文档页面内,所述运行抓取文字CaptureText软件对所述字码区执行辨识,运用照度辨识将把述字码区的字码的栅格图转化为字码区的单一码且获得辨识确信值二,所述字码区的单一码就成为所述字码区的调制码三。
步骤2-3-3-2:如果所述字码区的辨识确信值二高过所述事先设定的辨识确信值的临界数,那么所述字码区的调制码三是所述字码区的抽取值三;
步骤2-3-3-3:如果所述字码区的辨识确信值二低于所述事先设定的辨识确信值的临界数,那么所述字码区的字码的栅格图是所述字码区的抽取值三。
优选地,所述字码区还包括:字码大小数据;所述OFD文档页面包括一个以上的所述字码区,所述OFD文档页面的一个以上的字码区包括内在数据、字型数据和字码大小数据构成字码区库。
优选地,所述OFD文档字码抽取方法还包括:
依据字码区库的各字码区的所述内在数据、所述字型数据与所述字码大小数据导出相应于字码区的抽取值一、抽取值二与抽取值三;依据字码区库的各字码区的所述内在数据、所述字型数据与所述字码大小数据,对所述相应于字码区的抽取值一、抽取值二与抽取值三执行按序排布与分类,执行所述OFD文档页面的再构造。
对所述若干相应于字码区的抽取值一、抽取值二和抽取值三执行按序排布和分类,执行所述OFD文档页面的再构造的方法,包括:
依据所述若干相应于字码区的内在数据、字型数据与字码大小数据对若干所述相应于字码区的抽取值一、抽取值二与抽取值三执行按序排布与分类,且把若干所述相应于字码区的抽取值一、抽取值二与抽取值三按照所述若干相应于字码区在OFD文档页面上的位置执行页面再构造,所述再构造的页面是能修改的页面。
优选地,所述步骤二还可以具体包括:
步骤2-4:对OFD文档页面执行解码获得成份库,抽取成份库内全部字码区的调制码一、字码的栅格图、内在数据、字型数据与字码大小数据;
步骤2-5:依据字码区的字型数据把所述成份库内全部字码划成字型种类一字码区与字型种类二字码区,运行抓取文字CaptureText软件对所述字码区执行辨识且获得抽取值一;
步骤2-6:依据所述字型种类二字码区的内在数据确认所述字型种类二字码区是不是嵌进于所述OFD文档页面内,把非嵌进于所述OFD文档页面内的字码区的调制码一当做抽取值二,把嵌进于所述OFD文档页面内的字码区运用抓取文字CaptureText软件辨识且获得抽取值三。
本发明的有益效果为:
本发明经经由获得OFD文档页面中的各字码区的调制码一、字码的栅格图、内在数据与字型数据;依据所述字码区的所述字型数据确认所述字码区的字型种类获得确认值一,依据所述字码区的所述内在数据确认所述字码区是非嵌进于所述OFD文档页面中获得确认值二;依据所述确认值一与所述确认值二对所述字码区执行抽取,改善了OFD文档字码抽取的正确性,达成了无须把全部OFD文档字码运用抓取文字CaptureText软件来辨识,降低了OFD文档的字码抽取的耗时。
有效避免了现有技术中数据解码模块从OFD文档中获得包含统一社会信用代码数据的信息中抓取文字耗时长、常发生导入出错、辨识率不佳的缺陷。
附图说明
图1是本发明的一种用于社会信用代码核查的字码抽取系统的方法的部分流程图。
图2是本发明的用于社会信用代码核查的字码抽取系统的运行在所述前端上的单元的部分结构图。
具体实施方式
下面将结合附图和实施例对本发明做优选地说明。
如图1-图2所示,用于社会信用代码核查的字码抽取系统,包括:
外部系统和与外部系统通信连接的主控终端;所述主控终端能够是计算机;
数据解码模块运行在主控终端上;
所述外部系统用于传递OFD文档至所述主控终端;
所述数据解码模块用于从所述OFD文档中获得包含统一社会信用代码数据的信息;
所述数据解码模块包括OFD文档解码单元、确认单元与操控单元;
OFD文档解码单元,用于获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;
确认单元,用于依据所述字码区的字型数据确认所述字码区的字型种类而获得确认值一,依据所述字码区的内在数据确认所述字码区是非嵌进于所述OFD文档页面内而获得确认值二;
所述确认单元包括:确认单元一;
确认单元一,用于依据获得的所述字型数据确认所述字码区的字型种类归于字型种类一或字型种类二;
操控单元,用于对归于所述字型种类二且是嵌进于所述OFD文档页面中的所述字码区执行抓取文字CaptureText软件辨识且获得确认值三。
优选地,确认单元还包括:确认单元二;
确认单元二,用于依据获得的所述内在数据确认所述字码区是不是嵌进于所述OFD文档页面中。
优选地,所述数据解码模块还包括:调节单元;
调节单元,用于获得所述字码区的所述确认值一、所述确认值二与所述确认值三,依据字码区库的各字码区的所述内在数据、所述字型数据与所述字码大小数据,对所述字码区的所述确认值一、所述确认值二与所述确认值三执行按序排布以及分类,对所述OFD文档页面的再构造。
另外,所述OFD文档页面包括一个以上的所述字码区。
所述数据解码模块,经由OFD文档解码单元获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;确认单元依据获得的所述字型数据确认所述字码区的字型种类归于字型种类一或字型种类二,还依据获得的所述内在数据确认所述字码区是不是嵌进于所述OFD文档页面内;操控单元,用于对所述字型种类二且是嵌进于所述OFD文档页面中的所述字码区执行抓取文字CaptureText软件辨识且获得确认值三,改善了OFD文档字码抽取的正确性,达成了无须把全部OFD文档字码执行抓取文字CaptureText软件辨识,降低了OFD文档字码抽取的耗时。
所述外部系统为并联审批平台、民政业务系统或质监业务系统。包含统一社会信用代码数据的信息除了统一社会信用代码数据外,还包括法人或其他组织的名称、法人或其他组织的地址、法人或其他组织负责人的姓名这样的信息。所述OFD文档中具有包含统一社会信用代码数据的信息的字码。
一种用于社会信用代码核查的字码抽取系统的方法,包括:
步骤1,所述外部系统传递OFD文档至所述主控终端;
步骤2,所述数据解码模块从所述OFD文档中获得包含统一社会信用代码数据的信息;
所述步骤2具体包括:
步骤2-1:获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;
需要说明的是,对OFD文档页面执行解码获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据。优选地,OFD文档页面解码的方式能够把OFD文档页面执行分割而获得各字码区的调制码一、内在数据与字型数据,亦能够对OFD文档页面执行统一的抽取字码区信息,获得各字码区的的调制码一、内在数据与字型数据,且对各字码区执行着色,获得各字码区的所述字码的栅格图。本申请对OFD文档页面解码的方式不限制。
另外,所述字码区的字码的栅格图亦就是光栅图,为经所述字码区的一个个画素构成,这样的画素能够执行不一样的排布与着色来构成图案。优选地,所述字码区的字码的栅格图色彩的调制方式能够用RGB的照度对所述字码区的字码的栅格图加色而获得调制码一,此为最普遍的栅格图色彩调制方式;优选地,所述字码区的字码的栅格图色彩的调制方式亦能够经由着色的方式对所述字码区的字码的栅格图加色而获得调制码一,本申请对所述字码区的字码的栅格图色彩的调制方法不做限制。
步骤2-2:依据所述字码区的字型数据确认所述字码区的字型种类而获得确认值一,依据所述字码区的内在数据确认所述字码区是非嵌进于所述OFD文档页面内而获得确认值二;
需要说明的是,所述OFD文档页面内的各字码区顺序执行所述依据所述字码区的字型数据确认所述字码区的字型种类获得确认值一,接着顺序依据所述字码区的内在数据确认所述字码区是非嵌进于所述OFD文档页面中获得确认值二的步骤,所述OFD文档页面中包含一个以上的字码区。
另外,所述字码区的字型数据是字型种类,所述字型种类包含字型种类一与字型种类二;需要说明的是,所述确认值一能够包含字码区的字型种类是字型种类一与字码区的字型种类是字型种类二,也就是所述OFD文档页面中的各字码区顺序依据所述字码区的字型数据确认所述字码区的字型种类是字型种类一或字型种类二。
所述字码区的内在数据是所述字码区是非嵌进于所述OFD文档页面,所述字码区是非嵌进于所述OFD文档页面就是所述字码区中的字型是不是已载入所述主控终端内,如果已载入所述主控终端内,就表示所述字码区是嵌进于所述OFD文档页面的,如果未载入所述主控终端内,就表示所述字码区是非嵌进于所述OFD文档页面的;需要说明的是,所述字码区嵌进于OFD文档页面内是要避免由于在没载入相应字型的主控终端中展示OFD文档之际发生字码不正确的状况;所述确认值二能够包含字码区是嵌进于所述OFD文档页面中与字码区非嵌进于所述OFD文档页面内。
步骤2-3:依据所述确认值一与所述确认值二对所述字码区执行抽取;
需要说明的是,依据字码区的字型种类为字型种类一或字码区的字型种类是字型种类二对所述字码区执行抽取,依据字码区为嵌进于所述OFD文档页面内或字码区非嵌进于所述OFD文档页面内对所述字码区执行抽取。
优选地,所述步骤2-3内的所述依据所述确认值一和所述确认值二对所述字码区执行抽取的达成方法,能够包括:
步骤2-3-1:如果所述确认值一内所述字码区的字型种类是字型种类一,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值一;
需要说明的是,所述字型种类一是普通字型种类一,正如OpenType字型种类;如果所述确认值一内所述字码区的字型种类是普通字型种类一,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值一;
另外,运行抓取文字CaptureText软件为查看页面上的字码,用字码辨识方法把外形转化为单一码;正如,面对页面上的字码,运用照度的方式把页面上的字码转化为去色后的光栅图,且经由辨识模块把光栅图内的字码转化为单一码,供字码处理程序继续修改的方案。
优选地,如果所述确认值一内所述字码区的字型种类是普通字型种类一,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图运用照度辨识的方式把所述字码区的字码的栅格图转化为字码区的单一码,且获得调制码二;
需要说明的是,所述字码区的字码的栅格图执行抓取文字CaptureText软件辨识获得的所述字码区的抽取值一还包含辨识确信值一;所述辨识确信值一是所述字码区的调制码二是不是为所述字码区的实际字码的确信值。
步骤2-3-2:如果所述确认值一内所述字码区的字型种类是字型种类二,且所述确认值二内所述字码区非嵌进于所述OFD文档页面中,那么所述字码区的调制码一是所述字码区的抽取值二;
需要说明的是,所述字型种类二包含普通字型种类二与特殊字型种类,正如symbol与big5是普通字型种类二;
所述特殊字型种类为OFD文档支持的除去普通字型种类一与普通字型种类二字型种类之外的另外的字型种类,正如prc字型种类、wansung字型种类与johab字型种类。所述特殊字型种类能够支持16bits以上的字码集,拓展性更强。
优选地,如果所述确认值一内所述字码区的字型种类为普通字型种类二或特殊字型种类,且所述确认值二内所述字码区非嵌进于所述OFD文档页面中,那么所述字码区的调制码一就成为所述字码区的实际字码。
步骤2-3-3:如果所述确认值一内所述字码区的字型种类是字型种类二,且所述确认值二中所述字码区是嵌进于所述OFD文档页面内,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值三。
需要说是,如果所述确认值一内所述字码区的字型种类是普通字型种类二或特殊字型种类,且所述确认值二中所述字码区是嵌进于所述OFD文档页面内,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识,运用照度辨识把所述字码区的字码的栅格图转化为字码区的单一码,且获得所述字码区的调制码三。
优选地,所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识还包含辨识确信值二;所述辨识确信值二为所述字码区的调制码三是不是为所述字码区的实际字码的确信值。
优选地,所述步骤2-3-1内的运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值一的方法,能够包括:
步骤2-3-1-1:所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识来获得所述字码区的调制码二与辨识确信值一;
需要说明的是,如果所述确认值一内所述字码区的字型种类为普通字型种类一,运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识,运用照度辨识把所述字码区的字码的栅格图转化为字码区的单一码获得所述调制码二与所述辨识确信值一;所述字码区的单一码就成为所述字码区的调制码二。
步骤2-3-1-2:如果所述字码区的辨识确信值一高过事先设定的辨识确信值的临界数,那么所述字码区的调制码二就是所述字码区的抽取值一;
需要说明的是,所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识而获得所述调制码二和所述辨识确信值一,设定所述字码区的实际字码的确信值的临界数,也就是事先设定的辨识确信值的临界数,如果所述字码区的辨识确信值一高过事先设定的辨识确信值的临界数,那么所述字码区的调制码二是所述字码区的抽取值一。正如,所述辨识确信值的临界数是0.9,在所述字码区的辨识确信值一高过0.9之际,所述调制码二是所述字码区的实际字码。
步骤2-3-1-3:若所述字码区的辨识确信值一低于所述事先设定的辨识确信值的临界数,那么所述字码区的字码的栅格图是所述字码区的抽取值一。
需要说明的是,如果所述字码区的辨识确信值一低于所述事先设定的辨识确信值的临界数,那么所述字码区的字码的栅格图为所述字码区的抽取值一;正如,所述辨识确信值的临界数是0.9,在所述字码区的辨识确信值一低于0.9之际,所述字码区的字码的栅格图是所述字码区的实际字码。
优选地,所述步骤2-3-3内的运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值三的方法,包括:
步骤2-3-3-1:所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识获得所述字码区的调制码三与辨识确信值二;
另外,所述抽取值三包含所述调制码三与所述辨识确信值二;所述辨识确信值二是运行抓取文字CaptureText软件对所述字码区执行辨识后的单一码是不是为所述字码区的实际字码的确信值,也就是所述字码区的调制码三是不是为所述字码区的实际字码的确信值;
需要说明的是,如果所述确认值一内所述字码区的字型种类是普通字型种类二或特殊字型种类,且所述确认值二内所述字码区是嵌进于所述OFD文档页面内,所述运行抓取文字CaptureText软件对所述字码区执行辨识,运用照度辨识将把述字码区的字码的栅格图转化为字码区的单一码且获得辨识确信值二,所述字码区的单一码就成为所述字码区的调制码三。
步骤2-3-3-2:如果所述字码区的辨识确信值二高过所述事先设定的辨识确信值的临界数,那么所述字码区的调制码三是所述字码区的抽取值三;
需要说明的是,所述运行抓取文字CaptureText软件对所述字码区执行辨识就把所述字码区的字码的栅格图转化为字码区的单一码,设定事先设定的辨识确信值的临界数,如果所述字码区的辨识确信值二高过所述事先设定的辨识确信值的临界数,那么所述字码区的调制码三是所述字码区的抽取值三。正如,所述辨识确信值的临界数是0/9,在所述字码区的辨识确信值二高过0.9之际,所述调制码三是所述字码区的实际字码。
步骤2-3-3-3:如果所述字码区的辨识确信值二低于所述事先设定的辨识确信值的临界数,那么所述字码区的字码的栅格图是所述字码区的抽取值三。
需要说明的是,如果所述字码区的辨识确信值二低于所述事先设定的辨识确信值的临界数,那么所述字码区的字码的栅格图是所述字码区的抽取值三;正如,所述辨识确信值的临界数是0.9,在所述字码区的辨识确信值二低于0.9之际,所述字码区的字码的栅格图是所述字码区的实际字码。
优选地,所述字码区还包括:字码大小数据;所述OFD文档页面包括一个以上的所述字码区,所述OFD文档页面的一个以上的字码区包括内在数据、字型数据和字码大小数据构成字码区库。
优选地,所述OFD文档字码抽取方法还包括:
依据字码区库的各字码区的所述内在数据、所述字型数据与所述字码大小数据导出相应于字码区的抽取值一、抽取值二与抽取值三;依据字码区库的各字码区的所述内在数据、所述字型数据与所述字码大小数据,对所述相应于字码区的抽取值一、抽取值二与抽取值三执行按序排布与分类,执行所述OFD文档页面的再构造。
需要说明的是,所述各字码区的所述内在数据、所述字型数据与所述字码大小数据构成相应于字码区的位置,也就是所述OFD文档页面的一个以上的字码区的位置构成字码区库;在软件导出所述字码区库中一个字码区的抽取值一、抽取值二与抽取值三之际,那么软件能够直接运用相应于字码区的位置获得相应于字码区的抽取值一、抽取值二与抽取值三;如果软件导出所述字码区库内若干字码区的抽取值一、抽取值二与抽取值三之际,那么软件能够调用若干相应于字码区的位置获得若干相应于字码区的抽取值一、抽取值二与抽取值三,对若干所述相应于字码区的抽取值一、抽取值二与抽取值三执行按序排布与分类,执行所述OFD文档页面的再构造。
对所述若干相应于字码区的抽取值一、抽取值二和抽取值三执行按序排布和分类,执行所述OFD文档页面的再构造的方法,包括:
依据所述若干相应于字码区的内在数据、字型数据与字码大小数据对若干所述相应于字码区的抽取值一、抽取值二与抽取值三执行按序排布与分类,且把若干所述相应于字码区的抽取值一、抽取值二与抽取值三按照所述若干相应于字码区在OFD文档页面上的位置执行页面再构造,所述再构造的页面是能修改的页面。所述按序排布与分类能够按照具体情况而定,在本申请中不做限制。
所述OFD文档的字码抽取方法内,经由获得OFD文档页面中的各字码区的调制码一、字码的栅格图、内在数据与字型数据;依据所述字码区的所述字型数据确认所述字码区的字型种类获得确认值一,依据所述字码区的所述内在数据确认所述字码区是非嵌进于所述OFD文档页面中获得确认值二;依据所述确认值一与所述确认值二对所述字码区执行抽取,改善了OFD文档字码抽取的正确性,达成了无须把全部OFD文档字码运用抓取文字CaptureText软件来辨识,降低了OFD文档的字码抽取的耗时。
优选地,所述步骤2还可以具体包括:
步骤2-4:对OFD文档页面执行解码获得成份库,抽取成份库内全部字码区的调制码一、字码的栅格图、内在数据、字型数据与字码大小数据;
另外,所述成份库内包含一个以上的字码区,抽取成份库内一个以上的字码区的调制码一、字码的栅格图、内在数据、字型数据与字码大小数据。
步骤2-5:依据字码区的字型数据把所述成份库内全部字码划成字型种类一字码区与字型种类二字码区,运行抓取文字CaptureText软件对所述字码区执行辨识且获得抽取值一;
另外,所述字型种类一字码区包含一个以上的字码区,所述字型种类二字码区包含一个以上的字码区;
需要说明的是,运行抓取文字CaptureText软件对所述字型种类一字码区的字码的栅格图执行辨识获得所述字型种类一字码区的调制码二与辨识确信值一;
如果所述字型种类一字码区的辨识确信值一高过事先设定的辨识确信值的临界数,那么所述字型种类一字码区的调制码二是所述字型种类一字码区的抽取值一;
如果所述字型种类一字码区的辨识确信值一低于所述事先设定的辨识确信值的临界数,那么所述字型种类一字码区的字码的栅格图是所述字型种类一字码区的抽取值一。
步骤2-6:依据所述字型种类二字码区的内在数据确认所述字型种类二字码区是不是嵌进于所述OFD文档页面内,把非嵌进于所述OFD文档页面内的字码区的调制码一当做抽取值二,把嵌进于所述OFD文档页面内的字码区运用抓取文字CaptureText软件辨识且获得抽取值三。
另外,所述嵌进于所述OFD文档页面中的字码区包含一个以上的字码区,所述非嵌进于所述OFD文档页面中的字码区包含一个以上的字码区。
需要说明的是,所述嵌进于所述OFD文档页面内的所述字码区的字码的栅格图运行抓取文字CaptureText软件执行辨识,获得所述嵌进于所述OFD文档页面中的字码区的调制码三与辨识确信值二。
如果所述嵌进于所述OFD文档页面中的字码区的辨识确信值二高过所述事先设定的辨识确信值的临界数,那么所述嵌进于所述OFD文档页面中的字码区的调制码三为所述嵌进于所述OFD文档页面中的字码区的抽取值三。
如果所述嵌进于所述OFD文档页面中的字码区的辨识确信值二低于所述事先设定的辨识确信值的临界数,那么所述嵌进于所述OFD文档页面中的字码区的字码的栅格图是所述嵌进于所述OFD文档页面中的字码区的抽取值三。
所述步骤2中的数据解码模块从所述OFD文档中获得包含统一社会信用代码数据的信息的方法,还包括:
依据所述成份库的各字码区的内在数据、字型数据与字码大小数据导出相应于字码区的抽取值一、抽取值二与抽取值三;依据所述成份库的各字码区的内在数据、字型数据和字码大小数据对所述相应于字码区的抽取值一、抽取值二和抽取值三执行按序排布以及分类,执行所述OFD文档页面的再构造。
所述OFD文档字码的抽取方法,经由对OFD文档页面执行解码获得成份库,抽取成份库中全部字码区的调制码一、字码的栅格图、内在数据、字型数据与字码大小数据;依据字码区的字型数据把所述成份库内全部字码划成字型种类一字码区和字型种类二字码区,对所述字型种类一字码区执行抓取文字CaptureText软件辨识且获得抽取值一;依据所述字型种类二字码区的内在数据确认所述字型种类二字码区是不是嵌进于所述OFD文档页面中,把非嵌进于所述OFD文档页面内的字码区的调制码一当做抽取值二,把嵌进于所述OFD文档页面内中的字码区执行抓取文字CaptureText软件来辨识且获得抽取值三,改善了OFD文档字码抽取的正确性,达成了无须把全部OFD文档字码执行抓取文字CaptureText软件辨识,降低了OFD文档字码抽取的耗时。
以上以用实施例说明的方式对本发明作了描述,本领域的技术人员显而易见的是,本公开不限于以上描述的实施例,在不偏离本发明的范围的状态下,能够做出各种变动、改变和替换。

Claims (9)

1.一种用于社会信用代码核查的字码抽取系统,其特征在于,包括:
外部系统和与外部系统通信连接的主控终端;
数据解码模块运行在主控终端上;
所述外部系统用于传递OFD文档至所述主控终端;
所述数据解码模块用于从所述OFD文档中获得包含统一社会信用代码数据的信息;
所述数据解码模块包括OFD文档解码单元、确认单元与操控单元;
OFD文档解码单元,用于获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;
确认单元,用于依据所述字码区的字型数据确认所述字码区的字型种类而获得确认值一,依据所述字码区的内在数据确认所述字码区是非嵌进于所述OFD文档页面内而获得确认值二;
所述确认单元包括:确认单元一;
确认单元一,用于依据获得的所述字型数据确认所述字码区的字型种类归于字型种类一或字型种类二;
操控单元,用于对归于所述字型种类二且是嵌进于所述OFD文档页面中的所述字码区执行抓取文字CaptureText软件辨识且获得确认值三;
所述数据解码模块还包括:调节单元;
调节单元,用于获得所述字码区的所述确认值一、所述确认值二与所述确认值三,依据字码区库的各字码区的所述内在数据、所述字型数据与字码大小数据,对所述字码区的所述确认值一、所述确认值二与所述确认值三执行按序排布以及分类,对所述OFD文档页面的再构造。
2.根据权利要求1所述的用于社会信用代码核查的字码抽取系统,其特征在于,所述确认单元还包括:确认单元二;
确认单元二,用于依据获得的所述内在数据确认所述字码区是不是嵌进于所述OFD文档页面中。
3.根据权利要求1所述的用于社会信用代码核查的字码抽取系统,其特征在于,所述数据解码模块还包括:调节单元;
调节单元,用于获得所述字码区的所述确认值一、所述确认值二与所述确认值三,依据字码区库的各字码区的所述内在数据、所述字型数据与字码大小数据,对所述字码区的所述确认值一、所述确认值二与所述确认值三执行按序排布以及分类,对所述OFD文档页面的再构造;
所述OFD文档页面包括一个以上的所述字码区。
4.一种用于社会信用代码核查的字码抽取系统的方法,其特征在于,包括:
步骤1,外部系统传递OFD文档至主控终端;
步骤2,数据解码模块从OFD文档中获得包含统一社会信用代码数据的信息;
步骤2具体包括:
步骤2-1:获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;
步骤2-2:依据字码区的字型数据确认字码区的字型种类而获得确认值一,依据字码区的内在数据确认字码区是非嵌进于OFD文档页面内而获得确认值二;
步骤2-3:依据确认值一与确认值二对字码区执行抽取;
步骤2还可以具体包括:
步骤2-4:对OFD文档页面执行解码获得成份库,抽取成份库内全部字码区的调制码一、字码的栅格图、内在数据、字型数据与字码大小数据;
步骤2-5:依据字码区的字型数据把成份库内全部字码划成字型种类一字码区与字型种类二字码区,运行抓取文字CaptureText软件对字码区执行辨识且获得抽取值一;
步骤2-6:依据字型种类二字码区的内在数据确认字型种类二字码区是不是嵌进于OFD文档页面内,把非嵌进于OFD文档页面内的字码区的调制码一当做抽取值二,把嵌进于OFD文档页面内的字码区运用抓取文字CaptureText软件辨识且获得抽取值三。
5.根据权利要求4所述的用于社会信用代码核查的字码抽取系统的方法,其特征在于,所述字码区的字码的栅格图色彩的调制方式能够用RGB的照度对所述字码区的字码的栅格图加色而获得调制码一;所述字码区的字码的栅格图色彩的调制方式亦能够经由着色的方式对所述字码区的字码的栅格图加色而获得调制码一;
所述字码区的字型数据是字型种类,所述字型种类包含字型种类一与字型种类二;所述确认值一能够包含字码区的字型种类是字型种类一与字码区的字型种类是字型种类二,也就是所述OFD文档页面中的各字码区顺序依据所述字码区的字型数据确认所述字码区的字型种类是字型种类一或字型种类二;
所述字码区的内在数据是所述字码区是非嵌进于所述OFD文档页面,所述字码区是非嵌进于所述OFD文档页面就是所述字码区中的字型是不是已载入所述主控终端内,如果已载入所述主控终端内,就表示所述字码区是嵌进于所述OFD文档页面的,如果未载入所述主控终端内,就表示所述字码区是非嵌进于所述OFD文档页面的。
6.根据权利要求4所述的用于社会信用代码核查的字码抽取系统的方法,其特征在于,所述步骤2-3内的所述依据所述确认值一和所述确认值二对所述字码区执行抽取的达成方法,包括:
步骤2-3-1:如果所述确认值一内所述字码区的字型种类是字型种类一,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值一;
步骤2-3-2:如果所述确认值一内所述字码区的字型种类是字型种类二,且所述确认值二内所述字码区非嵌进于所述OFD文档页面中,那么所述字码区的调制码一是所述字码区的抽取值二;
步骤2-3-3:如果所述确认值一内所述字码区的字型种类是字型种类二,且所述确认值二中所述字码区是嵌进于所述OFD文档页面内,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值三。
7.根据权利要求6所述的用于社会信用代码核查的字码抽取系统的方法,其特征在于,如果所述确认值一内所述字码区的字型种类是普通字型种类一,就运行抓取文字CaptureText软件对所述字码区的字码的栅格图运用照度辨识的方式把所述字码区的字码的栅格图转化为字码区的单一码,且获得调制码二;
所述字码区的字码的栅格图执行抓取文字CaptureText软件辨识获得的所述字码区的抽取值一还包含辨识确信值一;所述辨识确信值一是所述字码区的调制码二是不是为所述字码区的实际字码的确信值;
所述字型种类二包含普通字型种类二与特殊字型种类;
所述特殊字型种类为OFD文档支持的除去普通字型种类一与普通字型种类二字型种类之外的另外的字型种类;
如果所述确认值一内所述字码区的字型种类为普通字型种类二或特殊字型种类,且所述确认值二内所述字码区非嵌进于所述OFD文档页面中,那么所述字码区的调制码一就成为所述字码区的实际字码;
所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识还包含辨识确信值二;所述辨识确信值二为所述字码区的调制码三是不是为所述字码区的实际字码的确信值。
8.根据权利要求6所述的用于社会信用代码核查的字码抽取系统的方法,其特征在于,所述步骤2-3-1内的运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值一的方法,包括:
步骤2-3-1-1:所述运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识来获得所述字码区的调制码二与辨识确信值一;
步骤2-3-1-2:如果所述字码区的辨识确信值一高过事先设定的辨识确信值的临界数,那么所述字码区的调制码二就是所述字码区的抽取值一;
步骤2-3-1-3:若所述字码区的辨识确信值一低于所述事先设定的辨识确信值的临界数,那么所述字码区的字码的栅格图是所述字码区的抽取值一;
所述步骤2-3-3内的运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识且获得所述字码区的抽取值三的方法,包括:
步骤2-3-3-1运行抓取文字CaptureText软件对所述字码区的字码的栅格图执行辨识获得所述字码区的调制码三与辨识确信值二;
步骤2-3-3-2:如果所述字码区的辨识确信值二高过所述事先设定的辨识确信值的临界数,那么所述字码区的调制码三是所述字码区的抽取值三;
步骤2-3-3-3:如果所述字码区的辨识确信值二低于所述事先设定的辨识确信值的临界数,那么所述字码区的字码的栅格图是所述字码区的抽取值三。
9.根据权利要求8所述的用于社会信用代码核查的字码抽取系统的方法,其特征在于,所述抽取值三包含所述调制码三与所述辨识确信值二;所述辨识确信值二是运行抓取文字CaptureText软件对所述字码区执行辨识后的单一码是不是为所述字码区的实际字码的确信值,也就是所述字码区的调制码三是不是为所述字码区的实际字码的确信值;
如果所述确认值一内所述字码区的字型种类是普通字型种类二或特殊字型种类,且所述确认值二内所述字码区是嵌进于所述OFD文档页面内,所述运行抓取文字CaptureText软件对所述字码区执行辨识,运用照度辨识将把述字码区的字码的栅格图转化为字码区的单一码且获得辨识确信值二,所述字码区的单一码就成为所述字码区的调制码三;
所述字码区还包括:字码大小数据;所述OFD文档页面包括一个以上的所述字码区,所述OFD文档页面的一个以上的字码区包括内在数据、字型数据和字码大小数据构成字码区库;
所述OFD文档字码抽取方法还包括:
依据字码区库的各字码区的所述内在数据、所述字型数据与所述字码大小数据导出相应于字码区的抽取值一、抽取值二与抽取值三;依据字码区库的各字码区的所述内在数据、所述字型数据与所述字码大小数据,对所述相应于字码区的抽取值一、抽取值二与抽取值三执行按序排布与分类,执行所述OFD文档页面的再构造;
对若干所述相应于字码区的抽取值一、抽取值二和抽取值三执行按序排布和分类,执行所述OFD文档页面的再构造的方法,包括:
依据若干相应于字码区的内在数据、字型数据与字码大小数据对若干所述相应于字码区的抽取值一、抽取值二与抽取值三执行按序排布与分类,且把若干所述相应于字码区的抽取值一、抽取值二与抽取值三按照若干相应于字码区在OFD文档页面上的位置执行页面再构造,再构造的页面是能修改的页面。
CN202110888928.8A 2021-08-04 2021-08-04 一种用于社会信用代码核查的字码抽取系统与方法 Active CN113326674B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110888928.8A CN113326674B (zh) 2021-08-04 2021-08-04 一种用于社会信用代码核查的字码抽取系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110888928.8A CN113326674B (zh) 2021-08-04 2021-08-04 一种用于社会信用代码核查的字码抽取系统与方法

Publications (2)

Publication Number Publication Date
CN113326674A CN113326674A (zh) 2021-08-31
CN113326674B true CN113326674B (zh) 2021-11-09

Family

ID=77426984

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110888928.8A Active CN113326674B (zh) 2021-08-04 2021-08-04 一种用于社会信用代码核查的字码抽取系统与方法

Country Status (1)

Country Link
CN (1) CN113326674B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881651A (zh) * 2020-08-06 2020-11-03 泰山信息科技有限公司 一种uot流式文档转换成ofd版式文档的方法
CN112100267A (zh) * 2020-11-17 2020-12-18 江苏省质量和标准化研究院 一种统一社会信用代码数据的核查方法
CN112989437A (zh) * 2021-04-23 2021-06-18 杭州天谷信息科技有限公司 Ofd文档处理方法、传输方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881651A (zh) * 2020-08-06 2020-11-03 泰山信息科技有限公司 一种uot流式文档转换成ofd版式文档的方法
CN112100267A (zh) * 2020-11-17 2020-12-18 江苏省质量和标准化研究院 一种统一社会信用代码数据的核查方法
CN112989437A (zh) * 2021-04-23 2021-06-18 杭州天谷信息科技有限公司 Ofd文档处理方法、传输方法及系统

Also Published As

Publication number Publication date
CN113326674A (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
CN105930159B (zh) 一种基于图像的界面代码生成的方法及系统
CN101996160B (zh) 一种字体数据的处理方法及系统
CN109492199B (zh) 一种基于ocr预判断的pdf文件转换方法
CN112257613B (zh) 体检报告信息结构化提取方法、装置及计算机设备
CN108038093B (zh) Pdf文字提取方法和装置
CN109976840B (zh) 一种基于前后台分离平台下实现多语言自动适配的方法及系统
WO2019041527A1 (zh) 文档图表抽取方法、电子设备及计算机可读存储介质
CN112825561A (zh) 字幕显示方法、系统、计算机设备及可读存储介质
CN106227808B (zh) 一种去除邮件干扰信息的方法以及垃圾邮件判定方法
CN110288310A (zh) 工作签报管理方法、设备、存储介质及装置
CN103295047A (zh) 一种可获取隐藏信息的图像标识及其制作与识读方法
JP2014197844A (ja) テキストをマトリクスコードシンボルに符号化するためのエンコーダ、およびマトリクスコードシンボルを復号化するためのデコーダ
CN113326674B (zh) 一种用于社会信用代码核查的字码抽取系统与方法
CN113220568A (zh) Usim卡文件系统的测试方法、装置及介质
CN106021197B (zh) Dwg格式文件的翻译系统及翻译方法
US20180067916A1 (en) Analysis apparatus, analysis method, and recording medium
CN103440231A (zh) 用于比较文本的设备和方法
CN108572948B (zh) 门牌信息的处理方法及装置
CN114781008B (zh) 面向物联网终端固件安全检测的数据识别方法及装置
CN110414497A (zh) 对象电子化的方法、装置、服务器及存储介质
CN115712601A (zh) 一种基于springbatch批量读取定长文件的方法
CN106055529B (zh) Dwg格式文件中待翻译文本数据的解析系统及其解析方法
CN113127863B (zh) 恶意代码的检测方法、装置、计算机设备和存储介质
CN109684417B (zh) 数据展示方法及装置、存储介质和处理器
CN113743072B (zh) 家谱登记表的信息抽取方法及其装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant