CN112287937A - 一种光学字符识别方法和装置 - Google Patents

一种光学字符识别方法和装置 Download PDF

Info

Publication number
CN112287937A
CN112287937A CN202011038663.4A CN202011038663A CN112287937A CN 112287937 A CN112287937 A CN 112287937A CN 202011038663 A CN202011038663 A CN 202011038663A CN 112287937 A CN112287937 A CN 112287937A
Authority
CN
China
Prior art keywords
optical character
character recognition
identification
data
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011038663.4A
Other languages
English (en)
Inventor
邓练兵
方家钦
卢振兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Dahengqin Technology Development Co Ltd
Original Assignee
Zhuhai Dahengqin Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Dahengqin Technology Development Co Ltd filed Critical Zhuhai Dahengqin Technology Development Co Ltd
Priority to CN202011038663.4A priority Critical patent/CN112287937A/zh
Publication of CN112287937A publication Critical patent/CN112287937A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明实施例提供了一种光学字符识别方法和装置,应用于光学字符识别平台,光学字符识别平台部署于开发者门户系统,开发者门户系统集成于城市门户系统,所述方法包括:接收多个业务平台的用户提出的光学字符识别服务请求;获取用户指定的待识别数据;响应光学字符识别服务请求,调用光学字符识别服务接口对待识别数据进行光学字符识别处理,得到识别结果;向用户发送识别结果。在城市门户系统中,通过部署于开发者门户系统的光学字符识别平台接收其他业务平台发送的光学字符识别服务请求,并调用光学字符识别接口进行处理,便于城市门户系统的其他业务平台的用户得到进行光学字符识别处理后的识别结果。

Description

一种光学字符识别方法和装置
技术领域
本发明涉及网络技术领域,特别是涉及一种光学字符识别方法和一种光学字符识别装置。
背景技术
随着计算机、网络和通信等技术的发展,以人工智能深度应用为途径,建设符合跨域多维理念的城市建设,推进技术融合、业务融合、数据融合、应用融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务,与各行业、企业、团队合作,加速城市建设工作,是智慧城市的发展方向。
目前,多数的城市发展都没有多维度融合的规划方案,各行业、企业、团队的信息平台之间在功能上不关联互助、信息不共享互换以及信息与业务流程和应用相互脱节的问题,导致信息平台中的信息无法得到充分利用。
实现针对城市进行多维度融合的城市门户系统,以及如何使城市门户系统更利于用户使用是目前急需解决的方案。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种光学字符识别方法和相应的一种光学字符识别装置。
为了解决上述问题,本发明实施例公开了一种光学字符识别方法,应用于光学字符识别平台,所述光学字符识别平台部署于开发者门户系统,所述开发者门户系统集成于城市门户系统,所述光学字符识别平台提供的光学字符识别服务接口预先注册到所述城市门户系统的统一服务网关并发布,所述城市门户系统还包括多个业务平台,所述方法包括:
接收所述多个业务平台的用户提出的光学字符识别服务请求;
获取所述用户指定的待识别数据;
响应所述光学字符识别服务请求,调用光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果;
向所述用户发送所述识别结果。
可选地,所述获取所述用户指定的待识别数据,包括:
获取所述用户上传的待识别数据;
或,从所述用户所属的业务平台获取所述用户指定的待识别数据;
或,从所述用户提供的URL地址获取待识别数据。
可选地,所述光学字符识别服务请求包括待识别数据的识别类型;所述响应所述光学字符识别服务请求,调用光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果,包括:
响应所述光学字符识别服务请求,调用与所述识别类型匹配的光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果。
可选地,所述光学字符识别服务接口包括结构化识别服务接口,和/或全文识别服务接口;
所述响应所述光学字符识别服务请求,调用与所述识别类型匹配的光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果,包括:
当所述识别类型为预设第一识别类型时,响应所述光学字符识别服务请求,调用所述结构化识别服务接口对所述待识别数据进行光学字符识别处理,得到结构化识别结果;
和/或,当所述识别类型为预设第二识别类型时,响应所述光学字符识别服务请求,调用所述全文识别服务接口对所述待识别数据进行光学字符识别处理,得到全文识别结果。
可选地,所述第一识别类型至少包括身份证、银行卡、发票、驾驶证、行驶证、房产证、营业执照、车牌和车辆识别号码。
可选地,所述向所述用户发送所述识别结果,包括:
若所述识别结果为识别成功,则向所述用户发送识别得到的结构化信息。
可选地,还包括:
若所述识别结果为识别失败,则生成并向所述用户发送提示信息,以提示所述用户重新提交待识别数据。
本发明实施例还公开了一种光学字符识别装置,应用于光学字符识别平台,所述光学字符识别平台部署于开发者门户系统,所述开发者门户系统集成于城市门户系统,所述光学字符识别平台提供的光学字符识别服务接口预先注册到所述城市门户系统的统一服务网关并发布,所述城市门户系统还包括多个业务平台,所述装置包括:
服务请求接收模块,用于接收所述多个业务平台的用户提出的光学字符识别服务请求;
待识别数据获取模块,用于获取所述用户指定的待识别数据;
识别处理模块,用于响应所述光学字符识别服务请求,调用光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果;
识别结果发送模块,用于向所述用户发送所述识别结果。
可选地,所述待识别数据获取模块包括:
待识别数据获取子模块,用于获取所述用户上传的待识别数据,或从所述用户所属的业务平台获取所述用户指定的待识别数据,或从所述用户提供的URL地址获取待识别数据。
可选地,所述光学字符识别服务请求包括待识别数据的识别类型;所述识别处理模块包括:
识别服务接口调用子模块,用于响应所述光学字符识别服务请求,调用与所述识别类型匹配的光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果。
可选地,所述光学字符识别服务接口包括结构化识别服务接口,和/或全文识别服务接口;所述识别服务接口调用子模块包括:
第一识别处理单元,用于当所述识别类型为预设第一识别类型时,响应所述光学字符识别服务请求,调用所述结构化识别服务接口对所述待识别数据进行光学字符识别处理,得到结构化识别结果;
第二识别处理单元,用于当所述识别类型为预设第二识别类型时,响应所述光学字符识别服务请求,调用所述全文识别服务接口对所述待识别数据进行光学字符识别处理,得到全文识别结果。
可选地,所述第一识别类型至少包括身份证、银行卡、发票、驾驶证、行驶证、房产证、营业执照、车牌和车辆识别号码。
可选地,所述识别结果发送模块包括:
识别结果发送子模块,用于若所述识别结果为识别成功,则向所述用户发送识别得到的结构化信息。
可选地,所述识别结果发送模块还包括:
提示信息发送子模块,用于若所述识别结果为识别失败,则生成并向所述用户发送提示信息,以提示所述用户重新提交待识别数据。
本发明实施例还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现任一项所述的光学字符识别方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现任一项所述的光学字符识别方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,部署于开发者门户系统的光学字符识别平台可以接收在城市门户系统中多个业务平台的用户提出的光学字符识别服务请求,并获取提出请求的用户所指定的待识别数据,通过调用光学字符识别服务接口对所获取的待识别数据进行光学字符识别处理,并将处理得到的识别结果返回至提出请求的用户。在城市门户系统中,通过部署于开发者门户系统的光学字符识别平台接收其他业务平台发送的光学字符识别服务请求,并调用光学字符识别接口进行处理,便于城市门户系统的其他业务平台的用户得到进行光学字符识别处理后的识别结果。
附图说明
图1是本发明实施例的一种城市门户系统的框图;
图2是本发明的一种光学字符识别方法实施例一的步骤流程图;
图3是本发明的一种光学字符识别方法实施例二的步骤流程图;
图4是本发明的一种光学字符识别装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
城市门户系统是指集合了针对城市规划的综合性互联网信息,提供综合性应用服务的公共平台门户。城市门户系统的服务对象包括:政府、个人、企业、开发者,可以提供政务服务、个人服务、企业服务等多种综合性服务。
参照图1,示出了本发明实施例的一种城市门户系统的框图,具体可以包括:前端系统10、后端系统11、API开放平台12、开发者门户系统13、运营中心14等多个平台。
前端系统10,实现多个功能并提供多个页面;所述多个页面包括与所述多个功能对应的多个UI元素;所述多个功能包括由后端系统提供服务支持的功能。
前端系统是面向用户的客户端,作为用户使用城市门户系统中各种内容的工具,用户可以通过前端系统使用城市门户系统中的资讯、应用、API服务以及系统功能等。前端系统展现以Vue,React等通用前端开发框架实现多业务系统单页面统一呈现。
前端系统支持多维用户使用,包括游客、自然人、企业法人、企业员工、政府人员。前端系统支持多维业态城市服务,包括政务服务、公共服务、特色服务等。用户可以通过前端系统使用多种城市服务。
前端系统可以包括APP客户端、Web客户端和Web管理端,Web客户端面向游客、自然人、企业和政府用户,用于城市门户系统官网、API开放平台、开发者门户。APP客户端面向游客、自然人、企业和政府用户,用于移动APP;Web管理端面向运营人员和系统管理员,用于运营中心和其它后端管理系统。
后端系统11,用于为所述前端系统提供业务支持,响应所述前端系统的业务请求,执行相应业务操作。
后端系统以通用化业务组件或技术业务为桥梁,打通底层数据。前端系统与后端系统解耦,后端系统为前端系统提供业务支撑。前端系统与后端系统分离部署,后端系统服务动态扩容,实现系统最大性能。
API开放平台12,用于提供针对API的管理服务,包括API发布服务、购买服务、使用服务。
API开放平台提供统一标准的数据与系统开发环境,可应用于各行业、系统内,是具有统一解决能力服务且开放的综合服务平台,旨在实现包括服务能力接入、开放管理、能力申请、能力应用等在内的统一能力开放的全流程生命周期管理管控。开发者通过将API服务发布到API开放平台,其它人员可以在平台上申请或购买使用。
开发者门户系统13,用于提供API、应用、数据开发和部署的环境,以及通用的程序构件。
开发者门户系统可以为开发者提供应用、算法和数据开发和部署的环境,以及通用的AI构件、技术构件和业务构件。包含应用开发、算法开发、应用发布和服务发布等功能。开发者可以基于开发者门户系统提供的环境、组件、模板等快速开发和发布应用及API。开发者门户系统可以包括算法开发平台、应用开发平台和数据开发平台三个平台。
运营中心14,用于对所述城市门户系统的内容、用户、应用、API进行管理。
运营中心是为管理人员和运营人员对城市门户系统提供统一日常运营管理的业务中台。管理人员可以通过运营中心对城市门户系统的内容、用户、应用、API等进行统一管理。
在本发明实施例提供了一种城市门户系统,可以集成前端系统、后端系统、API开放平台、开发者门户系统、运营中心等多个平台。前端系统作为客户端面向各种用户,用户可以通过在前端系统执行操作,从而获得集成于城市门户系统中的各个平台提供的内容。后端系统为前端系统提供业务支持,响应所述前端系统的业务请求,执行相应业务操作。API开放平台提供针对API的管理服务,包括API发布服务、购买服务、使用服务;可以供开发者统一调用API,建立规范统一的信息化平台。开发者门户系统可以提供API、应用、数据开发和部署的环境,以及通用的程序构件;可以供开发者实现各种业务发开。运营中心可以对城市门户系统的内容、用户、应用、API进行管理。本发明实施例提供了针对城市的综合性的城市门户系统,面向城市中的各种用户,用户可以通过城市门户系统快捷、便利的实现各种数字化服务;通过城市门户系统实现规范化的业务开发。
参照图2,示出了本发明的一种光学字符识别方法实施例一的步骤流程图,应用于光学字符识别平台,所述光学字符识别平台部署于开发者门户系统,所述开发者门户系统集成于城市门户系统,所述光学字符识别平台提供的光学字符识别服务接口预先注册到所述城市门户系统的统一服务网关并发布,所述城市门户系统还包括多个业务平台,具体可以包括如下步骤:
步骤201,接收所述多个业务平台的用户提出的光学字符识别服务请求;
在本发明的一种实施例中,城市门户系统可以包括开发者门户系统以及其他业务平台,开发者门户系统与其他业务平台之间相互通信,部署于开发者门户系统的光学字符识别平台可以接收其他多个业务平台的用户所提出的光学字符识别服务请求,以便响应用户所提出的服务请求并进行相应处理。
其中,当其他多个业务平台的用户向部署于开发者门户系统的光学字符平台提出光学字符识别服务请求时,主要表现为城市门户系统中的多个业务平台与开发者门户系统之间的服务通信请求,城市门户系统在检测到多个业务平台的用户提出的服务通信请求时,可以对提出服务请求的用户进行身份认证,即在通过身份认证平台判断具有与该用户对应的session(时域)会话以及与该用户对应的session会话有效的情况下,向部署于开发者门户系统的光学字符平台发送多个业务平台的用户所提出的服务请求。
步骤202,获取所述用户指定的待识别数据;
在实际应用中,在接收到其他多个平台的用户提出的光学字符识别服务请求之后,还需要对用户所要进行光学字符识别的待识别数据进行获取,待识别数据可以是用户指定的待识别数据,用户指定的待识别数据可以是所接收的光学字符识别请求中携带的数据,也可以是其他来源的数据,对此,本发明实施例不加以限制。
步骤203,响应所述光学字符识别服务请求,调用光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果;
步骤204,向所述用户发送所述识别结果。
在本发明的一种实施例中,光学字符识别平台在接收到其他业务平台的用户提出的光学字符识别服务请求以及获取用户指定的待识别数据之后,可以为用户提供相应的光学字符识别服务,具体的,可以响应用户提出的光学字符识别服务请求,并调用与提供光学字符识别服务对应的光学字符识别服务接口对待识别数据进行光学字符识别处理,得到处理之后的识别结果,并向提出该服务请求的用户发送识别结果。
在本发明实施例中,部署于开发者门户系统的光学字符识别平台可以接收在城市门户系统中多个业务平台的用户提出的光学字符识别服务请求,并获取提出请求的用户所指定的待识别数据,通过调用光学字符识别服务接口对所获取的待识别数据进行光学字符识别处理,并将处理得到的识别结果返回至提出请求的用户。在城市门户系统中,通过部署于开发者门户系统的光学字符识别平台接收其他业务平台发送的光学字符识别服务请求,并调用光学字符识别接口进行处理,便于城市门户系统的其他业务平台的用户得到进行光学字符识别处理后的识别结果。
参照图3,示出了本发明的一种光学字符识别方法实施例二的步骤流程图,应用于光学字符识别平台,具体可以包括如下步骤:
步骤301,接收用户提出的光学字符识别服务请求,并获取用户指定的待识别数据;
在本发明的一种实施例中,部署于开发者门户系统的光学字符识别平台可以接收用户所提出的光学字符识别服务请求,以及获取用户所指定的待识别数据,以便响应用户所提出的服务请求并对所获取的待识别数据进行相应处理。
其中,提出光学字符识别服务请求的用户可以是集成于城市门户系统的开发者门户系统的登陆用户,还可以是城市门户系统中除了开发者门户系统以外的其他业务平台的用户;对于提出光学字符识别服务请求的提出方式,用户在登陆开发者门户系统或其他业务平台后,可以在出现系统的主页面或平台的主页面,该主页面可以包括针对光学字符识别服务请求的操作栏,或针对光学字符识别服务请求的链接入口,此时可以通过登陆用户的作用于上述操作栏或链接入口的触控操作,实现对光学字符识别服务请求的提出。
在实际应用中,对用户指定的待识别数据进行获取,待识别数据的来源可以包括接收的光学字符识别请求中携带的数据,或者用户上传的数据,或者从用户提出光学字符识别请求所属的业务平台的数据,或者从用户提供的URL地址所包含的数据。
步骤302,调用光学字符识别服务接口对待识别数据进行光学字符识别处理;
在具体实现中,对所接收的光学字符识别服务接口进行响应,可以通过网关调用光学字符识别服务接口,对待识别数据进行光学字符识别处理,其中,光学字符识别服务接口是预先注册到城市门户系统的统一服务网关并发布,以及用于提供光学字符识别服务的服务接口。
在本发明的一种实施例中,所述光学字符识别服务请求包括待识别数据的识别类型;步骤302可以包括如下子步骤:
子步骤S11,响应所述光学字符识别服务请求,调用与所述识别类型匹配的光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果。
其中,所接收的光学字符识别服务请求可以包括用户所指定的待识别数据的识别类型,不同识别类型的待识别数据对应不同的光学字符识别服务接口,此时可以调用与识别类型匹配的光学字符识别服务接口对待识别数据进行处理。
在本发明的一种实施例中,子步骤S11可以包括如下子步骤:
子步骤S111,当所述识别类型为预设第一识别类型时,响应所述光学字符识别服务请求,调用所述结构化识别服务接口对所述待识别数据进行光学字符识别处理,得到结构化识别结果。
具体的,光学字符识别服务接口可以包括结构化识别服务接口,结构化识别服务接口所提供的服务可以是针对光学字符的结构化识别服务,此时可以采用结构化识别服务对识别类型为预设第一识别类型的待识别数据进行光学识别,以得到针对待识别数据的结构化识别结果。
其中,预设第一识别类型至少可以包括身份证、银行卡、发票(可以包括增值税发票以及机动车发票)、驾驶证、行驶证(包括副页)、房产证、营业执照、车牌、车辆识别号码、毕业证书、护照、车票(包括机动车车票以及火车票)、不动产证、食品经营许可证和银行开户许可证等,进行光学识别的待识别数据可以是与光学字符识别平台对应的服务器所接收的本地图片,也可以是网络图片或者URL。
在一种优选的实施例中,结构化识别服务接口所提供的结构化识别服务可以通过识别模型实现,识别模型可以将图片中所有文字都识别出来,并以半结构化的文字行信息形式生成结构化识别结果,半结构化文字的行信息可以包括单行文字的位置信息,单字的位置信息以及行的置信度信息。
针对光学字符的结构化识别服务指的是基于全文有效地识别关键信息元素。
其中,针对卡证票据类的结构化识别结果可以支持按照卡证的信息结构化返回值的形式,例如姓名是什么、地址是什么等;针对身份证的的关键信息元素可以是身份证中的姓名、身份证号码、性别、出生日期、民族、地址等字段,其结构化识别结果除了支持识别身份证正反面所有字段之外,还提供针对身份证的五分类功能(普通身份证、临时身份证、复印件、翻拍、PS)以及前端质量控制(扫描的形式提取身份证图片以及信息),还有image_statue字段可以辅助返回身份证是否传反、是否有模糊、反光、是否其他证照类型等参考信息;针对营业执照的结构化识别结果可以包括企业名称,法人等信息;针对银行卡的关键信息元素可以是银行卡卡号,且其结构化识别可以支持横卡、竖卡及银行卡任意角度偏斜情况的识别与提取;针对增值税发票的关键信息元素可以是发票代码、发票号码、开票日期、受票方、销售方等所有字段;针对驾驶证的关键信息元素可以是姓名、证号、性别、国籍、发证单位、初次领证日期、有效期起止日期等11个有效字段;针对行驶证的关键信息元素可以是号牌号码、车辆类型、所有人、住址、使用性质、发动机号码、车辆识别代号、注册日期等10个有效字段;针对房产证的关键信息元素可以是户主信息、房屋地址、面积大小、土地权利类型等,该结构化识别可以适用于全国各地的不同房产证识别;针对机动车发票的关键信息元素可以是购买方名称及身份证、销售单位名称、销售金额、车辆类型等27个字段,该结构化识别可以应用于财务报销、资产归档等场景;针对营业执照的关键信息元素可以是企业名称、执照类型、法定代表人、注册资本、成立日期、营业期限、经营范围等多种营业执照的有效字段;针对车辆识别号码的关键信息元素可以是车辆的车票和识别码信息。
子步骤S112,当所述识别类型为预设第二识别类型时,响应所述光学字符识别服务请求,调用所述全文识别服务接口对所述待识别数据进行光学字符识别处理,得到全文识别结果。
在另一种情况下,光学字符识别服务接口可以包括全文识别服务接口,全文识别服务接口所提供的服务可以是针对光学字符的全文识别服务,此时可以采用全文识别服务对识别类型为预设第二识别类型的待识别数据进行光学识别,以得到针对待识别数据的全文识别结果。
其中,预设第二识别类型至少可以包括文档识别、纯英文识别、电商图片识别等,进行光学识别的待识别数据可以是与光学字符识别平台对应的服务器所接收的本地图片,也可以是网络图片或者URL;针对光学字符的全文识别服务指的是准确、快速并全面地提取所有文字。
在本发明实施例中,待识别数据的识别类型还可以包括混帖图片类型或PDF文件类型,混帖图片类型的待识别数据可以包括混贴发票、混贴行驶证、混贴身份证等。
需要说明的是,上述所调用的光学字符识别服务接口可以是符合RESTful规范的API访问接口,及对应的Java、PHP、Python、C#、C++、Node.js、iOS和Android的SDK。对此,本发明实施例不加以限制。
步骤303,向用户发送通过光学字符识别处理后的识别结果。
在本发明的一种实施例中,光学字符识别平台在接收到其他业务平台的用户提出的光学字符识别服务请求以及获取用户指定的待识别数据,并调用与提供光学字符识别服务对应的光学字符识别服务接口对待识别数据进行光学字符识别处理之后,可以将处理之后的识别结果发送给用户,实现在城市门户系统中,通过部署于开发者门户系统的光学字符识别平台为其他业务平台的用户所提供的光学字符识别服务。
其中,若识别结果为识别成功,则可以向用户发送经过识别处理得到的结构化信息;若识别结果为识别失败,则可以生成提示消息并向用户发送提示消息,以提示用户重新提交待识别数据,以便重新调用与提供光学字符识别服务对应的光学字符识别服务接口对待识别数据进行光学字符识别处理。
在一种优选的实施例中,光学字符识别平台所调用的结构化识别服务接口以及全文识别服务接口具有轻量接入和高灵活度的特征,且服务接口所提供的结构化识别服务以及全文识别服务,可以应用于高可扩展性的场景,具有较大的覆盖范围以及较强的覆盖能力,无论是在自动化办公场景(例如实现人工审核、录入、信息比对等)、还是信息监管(例如鉴黄鉴暴、恶意广告的语言甄别等)以及行业数字化转型上,均可以通过采用结构化识别服务以及全文识别服务实现,以提高效率。
需要说明的是,光学字符识别平台可以通过强大的算法能力(例如针对文档类的排版分析以及针对表单类的KV键值结构化)和系统化的工程设计(包括算法应用层、AI安全以及GPU服务器),不断优化其系统的性能,并可以通过自然语言处理和计算机识别相关算法(例如图形提取、表格提取、文字识别以及文字定位)提升光学字符识别功能的准确率以及易用性;其中,光学字符识别平台所具有的光学字符识别服务还可以通过光学字符识别小程序实现,对此,本发明实施例不加以限制。
在本发明实施例中,部署于开发者门户系统的光学字符识别平台可以接收在城市门户系统中多个业务平台的用户提出的光学字符识别服务请求,并获取提出请求的用户所指定的待识别数据,通过调用光学字符识别服务接口对所获取的待识别数据进行光学字符识别处理,并将处理得到的识别结果返回至提出请求的用户。在城市门户系统中,通过部署于开发者门户系统的光学字符识别平台接收其他业务平台发送的光学字符识别服务请求,并调用光学字符识别接口进行处理,便于城市门户系统的其他业务平台的用户得到进行光学字符识别处理后的识别结果。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明的一种光学字符识别装置实施例的结构框图,应用于光学字符识别平台,所述光学字符识别平台部署于开发者门户系统,所述开发者门户系统集成于城市门户系统,所述光学字符识别平台提供的光学字符识别服务接口预先注册到所述城市门户系统的统一服务网关并发布,所述城市门户系统还包括多个业务平台,具体可以包括如下模块:
服务请求接收模块401,用于接收所述多个业务平台的用户提出的光学字符识别服务请求;
待识别数据获取模块402,用于获取所述用户指定的待识别数据;
识别处理模块403,用于响应所述光学字符识别服务请求,调用光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果;
识别结果发送模块404,用于向所述用户发送所述识别结果。
在本发明的一种实施例中,待识别数据获取模块302可以包括如下子模块:
待识别数据获取子模块,用于获取所述用户上传的待识别数据,或从所述用户所属的业务平台获取所述用户指定的待识别数据,或从所述用户提供的URL地址获取待识别数据。
在本发明的一种实施例中,所述光学字符识别服务请求包括待识别数据的识别类型;识别处理模块403可以包括如下子模块:
识别服务接口调用子模块,用于响应所述光学字符识别服务请求,调用与所述识别类型匹配的光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果。
在本发明的一种实施例中,所述光学字符识别服务接口包括结构化识别服务接口,和/或全文识别服务接口;识别服务接口调用子模块可以包括如下单元:
第一识别处理单元,用于当所述识别类型为预设第一识别类型时,响应所述光学字符识别服务请求,调用所述结构化识别服务接口对所述待识别数据进行光学字符识别处理,得到结构化识别结果;
第二识别处理单元,用于当所述识别类型为预设第二识别类型时,响应所述光学字符识别服务请求,调用所述全文识别服务接口对所述待识别数据进行光学字符识别处理,得到全文识别结果。
在本发明的一种实施例中,所述第一识别类型至少包括身份证、银行卡、发票、驾驶证、行驶证、房产证、营业执照、车牌和车辆识别号码。
在本发明的一种实施例中,识别结果发送模块404可以包括如下子模块:
识别结果发送子模块,用于若所述识别结果为识别成功,则向所述用户发送识别得到的结构化信息。
在本发明的一种实施例中,识别结果发送模块404还可以包括如下子模块:
提示信息发送子模块,用于若所述识别结果为识别失败,则生成并向所述用户发送提示信息,以提示所述用户重新提交待识别数据。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述光学字符识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现上述光学字符识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种光学字符识别方法和一种光学字符识别装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种光学字符识别方法,其特征在于,应用于光学字符识别平台,所述光学字符识别平台部署于开发者门户系统,所述开发者门户系统集成于城市门户系统,所述光学字符识别平台提供的光学字符识别服务接口预先注册到所述城市门户系统的统一服务网关并发布,所述城市门户系统还包括多个业务平台,所述方法包括:
接收所述多个业务平台的用户提出的光学字符识别服务请求;
获取所述用户指定的待识别数据;
响应所述光学字符识别服务请求,调用光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果;
向所述用户发送所述识别结果。
2.根据权利要求1所述的方法,其特征在于,所述获取所述用户指定的待识别数据,包括:
获取所述用户上传的待识别数据;
或,从所述用户所属的业务平台获取所述用户指定的待识别数据;
或,从所述用户提供的URL地址获取待识别数据。
3.根据权利要求1所述的方法,其特征在于,所述光学字符识别服务请求包括待识别数据的识别类型;所述响应所述光学字符识别服务请求,调用光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果,包括:
响应所述光学字符识别服务请求,调用与所述识别类型匹配的光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果。
4.根据权利要求3所述的方法,其特征在于,所述光学字符识别服务接口包括结构化识别服务接口,和/或,全文识别服务接口;
所述响应所述光学字符识别服务请求,调用与所述识别类型匹配的光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果,包括:
当所述识别类型为预设第一识别类型时,响应所述光学字符识别服务请求,调用所述结构化识别服务接口对所述待识别数据进行光学字符识别处理,得到结构化识别结果;
和/或,当所述识别类型为预设第二识别类型时,响应所述光学字符识别服务请求,调用所述全文识别服务接口对所述待识别数据进行光学字符识别处理,得到全文识别结果。
5.根据权利要求4所述的方法,其特征在于,所述第一识别类型至少包括身份证、银行卡、发票、驾驶证、行驶证、房产证、营业执照、车牌和车辆识别号码。
6.根据权利要求1所述的方法,其特征在于,所述向所述用户发送所述识别结果,包括:
若所述识别结果为识别成功,则向所述用户发送识别得到的结构化信息。
7.根据权利要求6所述的方法,其特征在于,还包括:
若所述识别结果为识别失败,则生成并向所述用户发送提示信息,以提示所述用户重新提交待识别数据。
8.一种光学字符识别装置,其特征在于,应用于光学字符识别平台,所述光学字符识别平台部署于开发者门户系统,所述开发者门户系统集成于城市门户系统,所述光学字符识别平台提供的光学字符识别服务接口预先注册到所述城市门户系统的统一服务网关并发布,所述城市门户系统还包括多个业务平台,所述装置包括:
服务请求接收模块,用于接收所述多个业务平台的用户提出的光学字符识别服务请求;
待识别数据获取模块,用于获取所述用户指定的待识别数据;
识别处理模块,用于响应所述光学字符识别服务请求,调用光学字符识别服务接口对所述待识别数据进行光学字符识别处理,得到识别结果;
识别结果发送模块,用于向所述用户发送所述识别结果。
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的光学字符识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的光学字符识别方法的步骤。
CN202011038663.4A 2020-09-28 2020-09-28 一种光学字符识别方法和装置 Pending CN112287937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011038663.4A CN112287937A (zh) 2020-09-28 2020-09-28 一种光学字符识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011038663.4A CN112287937A (zh) 2020-09-28 2020-09-28 一种光学字符识别方法和装置

Publications (1)

Publication Number Publication Date
CN112287937A true CN112287937A (zh) 2021-01-29

Family

ID=74422644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011038663.4A Pending CN112287937A (zh) 2020-09-28 2020-09-28 一种光学字符识别方法和装置

Country Status (1)

Country Link
CN (1) CN112287937A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100062785A (ko) * 2008-12-01 2010-06-10 한국전자통신연구원 오픈 api 기반 웹포털 서비스 제공 방법 및 시스템
CN102904909A (zh) * 2011-07-25 2013-01-30 上海博路信息技术有限公司 一种云模式的ocr文字识别方法
CN107295077A (zh) * 2017-06-16 2017-10-24 深圳易嘉恩科技有限公司 基于微服务架构的分布式云平台系统
CN108023948A (zh) * 2017-12-04 2018-05-11 山东浪潮通软信息科技有限公司 一种处理第三方系统信息的系统及方法
CN108183939A (zh) * 2017-12-20 2018-06-19 汉王科技股份有限公司 云识别服务系统、方法、设备及云服务器
CN111240861A (zh) * 2020-01-08 2020-06-05 陕西省大数据集团有限公司 服务提供方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100062785A (ko) * 2008-12-01 2010-06-10 한국전자통신연구원 오픈 api 기반 웹포털 서비스 제공 방법 및 시스템
CN102904909A (zh) * 2011-07-25 2013-01-30 上海博路信息技术有限公司 一种云模式的ocr文字识别方法
CN107295077A (zh) * 2017-06-16 2017-10-24 深圳易嘉恩科技有限公司 基于微服务架构的分布式云平台系统
CN108023948A (zh) * 2017-12-04 2018-05-11 山东浪潮通软信息科技有限公司 一种处理第三方系统信息的系统及方法
CN108183939A (zh) * 2017-12-20 2018-06-19 汉王科技股份有限公司 云识别服务系统、方法、设备及云服务器
CN111240861A (zh) * 2020-01-08 2020-06-05 陕西省大数据集团有限公司 服务提供方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US7953753B2 (en) Newsmaker verification and commenting method and system
US10740285B2 (en) Electronic file format modification and optimization
Weber The digital future–A challenge for privacy?
US20080091846A1 (en) Creation and transaction processes of intelligent documents
CA3062580A1 (en) An enterprise group establishing method and computer device in an instant messaging system
US20130145419A1 (en) Systems and Methods for Generating Trust Federation Data from BPMN Choreography
KR102243218B1 (ko) 모바일 기반 전자명함 생성, 관리 및 교환 서비스 제공 시스템
CN110622184B (zh) 合规性文档的创建、修改和供应
CN112287270A (zh) 一种内容审核方法和装置
CN103329098A (zh) 文档工作流程架构
US10462257B2 (en) Method and apparatus for obtaining user account
US20160261609A1 (en) System and a method for intelligent verification management
CN112350991A (zh) 一种前端系统的登录方法和装置
US9697350B1 (en) Electronic signing of content
CN109255967B (zh) 用于发布信息的方法和装置
CN104052605A (zh) 用于跨越不同第三方平台的实体认证的单系统
CN112287937A (zh) 一种光学字符识别方法和装置
CN116523515A (zh) 基于区块链去中心化互联网的用户请求处理方法及装置
Rakhmawati et al. Indonesia’s Public Application Programming Interface (API)
CN112288385A (zh) 一种电子证件处理方法和装置
CN112287104A (zh) 一种自然语言处理方法和装置
KR20200082186A (ko) 법률 문서 자동 작성 방법 및 시스템
Theocharis et al. Semantic Knowledge Modelling Via Open Linked Ontologies: Ontologies in E-Governance
JP7496584B1 (ja) プログラム、コンピュータおよび情報処理方法
CN109086618B (zh) 一种身份证照片的加密、验证方法、相关装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination