CN117669529A - 数据处理方法、装置、设备以及介质 - Google Patents
数据处理方法、装置、设备以及介质 Download PDFInfo
- Publication number
- CN117669529A CN117669529A CN202410141216.3A CN202410141216A CN117669529A CN 117669529 A CN117669529 A CN 117669529A CN 202410141216 A CN202410141216 A CN 202410141216A CN 117669529 A CN117669529 A CN 117669529A
- Authority
- CN
- China
- Prior art keywords
- template
- text recognition
- configuration
- field
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000012986 modification Methods 0.000 claims description 59
- 230000004048 modification Effects 0.000 claims description 58
- 230000004044 response Effects 0.000 claims description 56
- 230000004913 activation Effects 0.000 claims description 41
- 238000011161 development Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 17
- 238000012790 confirmation Methods 0.000 claims description 8
- 230000001960 triggered effect Effects 0.000 claims description 5
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 15
- 238000010586 diagram Methods 0.000 description 36
- 238000007792 addition Methods 0.000 description 9
- 230000009286 beneficial effect Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000013507 mapping Methods 0.000 description 9
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000012384 transportation and delivery Methods 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 238000012550 audit Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种数据处理方法、装置、设备以及介质,该方法包括:响应针对模板配置入口的触发操作,显示模板配置页面;响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;文本识别模板包含编辑操作所指示的配置字段名;为文本识别模板生成模板标识;模板标识用于调用业务服务对象对应的文本识别模板,以为业务服务对象提供结构化识别服务。实施本申请实施例,可以提升文本识别效果。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据处理方法、装置、设备以及介质。
背景技术
文本识别技术是指利用计算机对图像中的文字进行识别,并输出识别文本的过程。文本识别技术可以应用在多个领域,例如,信件和快递包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总等领域。用户通过文本识别技术可以快速录入图像中的文本信息,提高工作效率。
目前的文本识别场景中,通常利用光学字符识别(Optical CharacterRecognition,OCR)识别出含有文本信息的图像中的每一个字段,再由用户从文本识别结果中筛选出实际需要的文本内容,以便进行信息录入。可见,这种文本识别方式得到的文本识别结果可能与实际期望的文本内容并不匹配,影响了文本识别效果。
发明内容
本申请实施例提供一种数据处理方法、装置、设备以及介质,可以提升文本识别效果。
本申请实施例一方面提供了一种数据处理方法,包括:
响应针对模板配置入口的触发操作,显示模板配置页面;
响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;文本识别模板包含编辑操作所指示的配置字段名;
为文本识别模板生成模板标识;模板标识用于调用业务服务对象对应的文本识别模板,以为业务服务对象提供结构化识别服务。
本申请实施例一方面提供了一种数据处理装置,包括:
配置页面显示模块,用于响应针对模板配置入口的触发操作,显示模板配置页面;
识别模板创建模块,用于响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;文本识别模板用于为业务服务对象提供结构化识别服务,不同的文本识别模板用于服务不同的业务服务对象;
模板标识生成模块,用于为文本识别模板生成模板标识,将模板标识发送给业务服务对象;模板标识用于调用业务服务对象对应的文本识别模板。
其中,数据处理装置还包括创建权限申请模块,创建权限申请模块用于:
接收业务服务对象对应的权限申请请求,获取权限申请请求携带的对象凭证;
若对象凭证指示业务服务对象满足权限激活条件,则确定业务服务对象具备模板创建权限,为业务服务对象显示模板配置入口。
其中,配置页面显示模块具体用于:
响应针对模板配置入口的触发操作,显示模板编辑页面;
响应模板编辑页面中的类型输入区域的编辑操作,根据类型输入区域中的编辑内容确定模板类型;
响应针对模板类型的确认操作,显示模板配置页面,在模板配置页面中显示与模板类型相匹配的初始识别模板。
其中,配置页面显示模块具体用于:
响应针对模板配置入口的触发操作,显示一个或者多个初始识别模板;
显示模板配置页面,在模板配置页面中显示,针对一个或者多个初始识别模板的模板选择操作所触发的初始识别模板。
其中,配置页面显示模块具体用于:
响应针对模板配置入口的触发操作,显示模板编辑页面;
响应模板编辑页面中的样图输入区域的样图添加操作,将样图输入区域中的输入图像确定为样本配置图像;
显示模板配置页面,在模板配置页面中显示与初始识别模板相匹配的样本配置图像的字段识别结果。
其中,字段识别结果包括第一识别结果和第二识别结果,配置页面显示模块具体用于:
根据初始识别模板,对样本配置图像进行文本识别,得到样本配置图像对应的字段名列表和字段值列表;
为字段名列表中所包含的字段名匹配第一配置字段名,为字段值列表中所包含的字段值匹配第二配置字段名;
将字段名列表和第一配置字段名确定为样本配置图像对应的第一识别结果,将字段值列表和第二配置字段名确定为样本配置图像对应的第二识别结果。
其中,模板配置页面包括第一输入区域和第二输入区域,第一输入区域包括第一识别结果,第二输入区域包括第二识别结果;字段输入区域为第一输入区域和第二输入区域中的任意一个。
其中,编辑操作包括子区域添加操作和文本输入操作;识别模板创建模块具体用于:
响应针对模板配置页面中的字段输入区域的子区域添加操作,在字段输入区域中添加字段子区域;
响应针对字段子区域的文本输入操作,将字段子区域中的输入文本确定为扩充字段名;
将包含扩充字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。
其中,模板配置页面中的字段输入区域包括多个字段子区域,每一个字段子区域中包含配置字段名,编辑操作包括子区域删除操作;识别模板创建模块具体用于:
响应针对模板配置页面中的字段输入区域的子区域删除操作,在模板配置页面所显示的初始识别模板中,清除子区域删除操作对应的字段子区域中的配置字段名,得到业务服务对象对应的文本识别模板。
其中,编辑操作包括字段名修改操作,初始识别模板中的字段输入区域包括多个字段子区域,每一个字段子区域中包含配置字段名,一个字段子区域对应一个激活控件,激活控件对应的激活状态包括开启状态和关闭状态;识别模板创建模块具体用于:
响应针对模板配置页面中的字段输入区域的字段名修改操作,根据字段名修改操作所确定的文本内容,更新字段名修改操作所确定的字段子区域中的配置字段名;
将处于开启状态的激活控件对应的字段子区域确定为候选子区域,将包含候选子区域中的配置字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。
其中,数据处理装置还包括模板标识发送模块,模板标识发送模块用于:
响应针对文本识别模板的确认操作,为文本识别模板生成模板标识,将文本识别模板添加至模板创建记录列表,在模板创建记录列表中为文本识别模板添加发布控件;
响应针对文本识别模板对应的发布控件的触发操作,将文本识别模板对应的发布状态从待发布状态切换显示为已发布状态;
将处于已发布状态的文本识别模板对应的模板标识,发送给业务服务对象。
其中,模板标识发送模块还用于:
获取文本识别模板对应的最大历史使用时间戳,根据最大历史使用时间戳确定文本识别模板对应的使用间隔时长;
若使用间隔时长大于间隔时长阈值,则在模板创建记录列表中删除文本识别模板。
其中,数据处理装置还包括结构化文本识别模块,结构化文本识别模块用于:
响应针对文本识别控件的触发操作,显示文本识别页面;文本识别页面包括图像区域和标识区域;
响应针对图像区域的图像添加操作,将图像添加操作所指示的图像确定为待识别图像;
响应针对标识区域的标识输入操作,在标识区域中显示模板标识;
响应针对待识别图像的文本识别操作,将模板标识传入文本识别接口,通过文本识别接口调用模板标识对应的文本识别模板;
根据文本识别模板对待识别图像进行文本识别,得到与文本识别模板中的配置字段名相匹配的结构化文本。
其中,结构化文本识别模块还用于:
响应针对文本识别页面中的模板修改控件的触发操作,显示文本识别模板对应的模板修改页面;
响应模板修改页面中的模板修改操作,将模板修改操作所确定的文本识别模板确定为文本更新模板,将业务服务对象对应的文本识别模板替换为文本更新模板。
其中,结构化文本识别模块还用于:
响应针对文本识别接口的代码导出操作,将文本识别接口关联的代码文件封装为文本识别开发包;
将文本识别开发包发送给业务服务对象对应的终端设备,以使终端设备根据文本识别开发包搭建业务服务对象对应的文本识别应用。
本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,存储器与处理器相连,存储器用于存储计算机程序,处理器用于调用计算机程序,以使得该计算机设备执行本申请实施例中上述一方面提供的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序适于由处理器加载并执行,以使得具有处理器的计算机设备执行本申请实施例中上述一方面提供的方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述一方面提供的方法。
本申请实施例中,通过响应针对模板配置入口的触发操作,可以显示模板配置页面;通过响应针对模板配置页面中的字段输入区域的编辑操作,可以创建业务服务对象对应的文本识别模板,为文本识别模板生成模板标识,该模板标识可以用于调用业务服务对象对应的文本识别模板,为业务服务对象提供结构化识别服务。其中,文本识别模板可以包含模板配置页面中的字段输入区域的编辑操作所指示的配置字段名,也就是说,在本申请实施例中业务服务对象可以创建自己专属的文本识别模板,通过自己创建的文本识别模板,可以使得提取得到的结构化文本符合实际业务需求,进而有助于提升文本识别效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构的结构示意图;
图2a是本申请实施例提供的一种数据处理场景示意图一;
图2b是本申请实施例提供的一种数据处理场景示意图二;
图3是本申请实施例提供的一种数据处理方法的流程示意图一;
图4是本申请实施例提供的一种创建文本识别模板的界面示意图一;
图5是本申请实施例提供的一种数据处理方法的流程示意图二;
图6是本申请实施例提供的一种申请模板创建权限的界面示意图;
图7a是本申请实施例提供的一种模板配置页面的界面示意图一;
图7b是本申请实施例提供的一种模板配置页面的界面示意图二;
图7c是本申请实施例提供的一种模板配置页面的界面示意图三;
图8a是本申请实施例提供的一种创建文本识别模板的界面示意图二;
图8b是本申请实施例提供的一种创建文本识别模板的界面示意图三;
图8c是本申请实施例提供的一种创建文本识别模板的界面示意图四;
图9a是本申请实施例提供的一种发布文本识别模板的界面示意图;
图9b是本申请实施例提供的一种文本识别模板的发布状态的示意图;
图10是本申请实施例提供的一种文本识别的界面示意图;
图11是本申请实施例提供的一种下载文本识别开发包的界面示意图;
图12是本申请实施例提供的一种数据处理方法的流程示意图三;
图13是本申请实施例提供的一种模板数据存储的示意图;
图14是本申请实施例提供的一种数据处理装置的结构示意图;
图15是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参见图1,图1是本申请实施例提供的一种网络架构的结构示意图。如图1所示,该网络架构可以包括服务器10d和终端设备集群,终端设备集群可以包括一个或者多个终端设备,这里将不对终端设备的数量进行限制。如图1所示,多个终端设备具体可以包括终端设备10a、终端设备10b以及终端设备10c等;如图1所示,终端设备10a、终端设备10b以及终端设备10c可以分别与服务器10d进行网络连接,以便于每个终端设备可以通过该网络连接与服务器10d之间进行数据交互。
其中,图1所示的服务器10d可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,本申请实施例对服务器的类型不做限定。
图1所示的终端集群中的终端设备可以包括但不限于:智能手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备(例如智能手表、智能手环等)、智能语音交互设备、智能家电(例如智能电视等)、车载设备、飞行器等电子设备,本申请实施例对终端设备的类型不做限定。
如图1所示的终端集群中的任意一个终端设备均可以安装智能结构化平台,服务器10d可以是指智能结构化平台对应的后台服务器。该智能结构化平台可以是指能够对图像中的文字进行识别,并输出识别文本结果的文本识别工具,智能结构化平台的运行载体可以是客户端、网页或者小程序等。可以理解的是,本申请实施例提供的智能结构化平台,不仅可以适用于通用文本识别场景,还可以适用于结构化数据识别场景。结构化数据是指具有固定格式和规则的数据,例如,键值对(key-value)数据等;通用文本识别场景是指将图像中的文本转换为可编辑的文本格式的文本识别技术;结构化数据识别场景是指将图像中的文本转换为结构化数据格式的文本识别技术,可以适用于各类证件、运单、票据、表单、合同等结构化场景的结构化文本识别。
在结构化数据识别场景中,待识别图像可能是证件、运单、票据、表单、合同等不同类型的图像,业务服务对象(智能结构化平台提供文本识别服务的目标对象)可以通过智能结构化平台中提供的通用结构化识别模板,例如,身份证识别模板、银行卡识别模板、票据识别模板等,提取出待识别图像中的结构化数据。然而,通用结构化识别模板中的配置字段往往是一些常用的基础字段,很难完全涵盖业务服务对象期望的字段;当待识别图像中的结构化文本过于复杂时,使用通用结构化识别模板,难以提取出期望的结构化文本,进而影响文本识别效果。
举例而言,待识别图像是采购报销单对应的图像,该待识别图像中包含键值对1和键值对2的结构化文本,其中,键值对1对应的键(key)为“报销人”,键值对1对应的值(value)为“小A”;键值对2对应的键为“采购部门审核”,键值对2对应的值为“小B”。业务服务对象希望识别得到包含键值对1和键值对2的结构化文本,假设通用结构化识别模板中的票据识别模板的包含“报销人”的配置字段,而缺乏“采购部门审核”的配置字段,那么采用票据识别模板对该待识别图像进行文本识别时,只能识别得到包含键值对1的结构化文本,而不能识别得到包含键值对2的结构化文本。因此,采用智能结构化平台默认提供的通用结构化识别模板,文本识别效果差,难以满足业务需求。
为提升结构化文本的识别效果,本申请实施例提供的智能结构化平台不仅可以提供通用文本识别模板,还可以支持业务服务对象自定义设置文本识别模板,以满足业务服务对象多样化的业务需求。也就是说,假设业务服务对象希望识别得到包含键值对1和键值对2的结构化文本,那么可以在智能结构化平台中创建包括“报销人”的配置字段名和“采购部门审核”的配置字段名的文本识别模板,通过该文本识别模板对待识别图像进行文本识别,可以识别得到同时包含键值对1和键值对2的结构化文本,使得提取得到的结构化文本更符合业务需求,进而可以提升文本识别效果。通过向业务服务对象开放模板创建服务,可以降低文本识别成本,提高文本识别准确率,进而提升文本识别效果。
请参见图2a,图2a是本申请实施例提供的一种数据处理场景示意图一。如图2a所示,智能结构化平台可以提供模板配置页面,业务服务对象可以在模板配置页面向智能结构化平台发起模板创建请求,智能结构化平台接收到该模板创建请求之后,可以通过超文本传输协议(HTTP)调用云服务接口(云API),将该模板创建请求转发至智能结构化平台中的结构化控制台,以便业务服务对象根据自身的业务需求,在结构化控制台执行模板创建、模板编辑、模板发布等操作,以完成自定义的文本识别模板的创建,具体的模板创建过程将在下文进行详细描述,在此不再赘述。
业务服务对象在结构化控制台完成模板创建之后,可以将待识别图像对应的图像链接(Uniform Resource Locator,URL)和文本识别模板对应的模板标识作为文本识别接口(可以是指上述提及的云服务接口)对应的传入参数,进而将该传入参数赋值给文本识别接口,以便通过该文本识别接口调用该模板标识对应的文本识别模板,进而根据该文本识别模板对该待识别图像进行文本识别,得到文本识别结果。其中,该文本识别结果可以包括业务服务对象创建的文本识别模板匹配的结构化文本。
在本申请实施例中,智能结构化平台可以提供包含文本识别模板的样例识别服务,以供业务服务对象体验智能结构化平台提供的结构化文本识别功能,以及预览结构化文本识别结果。如图2a所示,业务服务对象可以通过智能结构化平台的模板配置页面发起结构化识别服务调用请求,具体地,可以通过模板配置页面中的样例(demo)识别服务,将该结构化识别服务调用请求转发至云服务接口,通过云服务接口提供的结构化识别服务中内置的文本识别算法提取待识别图像中的结构化文本,得到文本识别结果。其中,该文本识别结果可以包括样例识别服务中的文本识别模板匹配的结构化文本。
在本申请实施例中,还可以将上述文本识别接口关联的代码文件封装为文本识别开发包,该文本识别开发包是指智能结构化平台对应的软件开发包(SoftwareDevelopment Kit,SDK)。业务服务对象可以在智能结构化平台中下载该文本识别开发包,并根据该文本识别开发包在本地搭建业务服务对象对应的文本识别应用,以便业务服务对象通过该文本识别应用在本地调用文本识别接口进行文本识别。可选地,为提高数据安全,业务服务对象还可以在结构化平台设置预签名链接(URL),以便提供该文本识别开发包的验证机制。也就是说,在通过该文本识别开发包在本地搭建文本识别平台时,可以根据预签名URL验证该文本识别开发包的安全性,若此时输入的验证签名URL和预签名URL一致,则表明该文本识别开发包是安全可信任的,可以通过该文本识别开发包在本地搭建文本识别平台。
在业务服务对象对应的文本识别应用搭建完成之后,业务服务对象通过该文本识别应用发起模板详情获取请求、文本识别请求等。例如,业务服务对象可以通过HTTP协议调用云服务接口,云服务接口可以提供结构化识别服务,进而通过结构化识别服务获取文本识别模板对应的模板配置信息。其中,结构化识别服务与智能结构化平台中的结构化控制台之间可以通过远程过程调用协议(Remote Procedure Call,RPC)进行通信。又例如,业务服务对象可以通过HTTP协议调用云服务接口,云服务接口可以调用文本识别接口提供的结构化识别服务,进而通过结构化识别服务中的文本识别算法提取待识别图像中的结构化文本,得到文本识别结果。
在本申请实施例中,业务服务对象可以是个人或者团体,当业务服务对象代指团体时,业务服务对象可以包括第一操作对象和第二操作对象,第一操作对象可以是指业务服务对象中的管理对象,第二操作对象可以是指业务服务对象中的普通对象。也就是说,智能结构化平台为第一操作对象提供的业务使用权限高于第二操作对象提供的业务使用权限。更具体地,智能结构化平台可以为第一操作对象提供模板创建服务和文本识别服务,智能结构化平台可以为第二操作对象提供文本识别服务,但不向第二操作对象开放模板创建权限。
请参见图2b,图2b是本申请实施例提供的一种数据处理场景示意图二。智能结构化平台可以包括前端和服务端,前端可以是指智能结构化平台中与操作对象进行交互的平台,例如,智能结构化平台界面(tea-ocr-app)、样例识别服务界面(tea-app-demo-invoice)等;服务端(包括smartform_forward_server服务端和smartform_access_server服务端)可以是指智能结构化平台中为前端提供数据传输的平台。在本申请实施例中,服务端具体可以包含结构化控制台服务、样例识别服务、结构化识别服务、算法引擎服务中的一种或者多种服务;服务端可以采用微服务的架构方式,以保证各个服务之间具有良好的解耦性和扩展性。
如图2b所示,第一操作对象可以通过HTTP协议在tea-ocr-app前端提供的结构化控制台中输入文本识别模板对应的模板配置信息(模板名称、配置字段等信息),tea-ocr-app前端将该模板配置信息发送给smartform_forward_server服务端,smartform_forward_server服务端接入云服务接口网关,通过云服务接口将该模板配置信息转发给smartform_access_server服务端,从而完成文本识别模板的创建。
在文本识别模板创建完成之后,第一操作对象和第二操作对象均可以通过云服务接口调用文本识别模板,进而根据该文本识别模板完成结构化文本识别。当智能结构化平台提供有样例识别服务时,第一操作对象和第二操作对象还可以从tea-app-demo-invoice前端输入待识别图像,进而tea-app-demo-invoice前端将待识别图像传输至smartform_forward_server服务端,smartform_forward_server服务端可以通过HTTP协议与smartform_access_server服务端进行交互,以便调用通过云服务接口调用文本识别模板,进而根据该文本识别模板对待识别图像进行文本识别,得到该待识别图像对应的结构化文本。
在本申请实施例中,在通过tea-app-demo-invoice前端进行文本识别时,第一操作对象和第二操作对象可以在智能结构化平台中实现无登录态完成文本识别。也就是说,通过tea-app-demo-invoice前端进行文本识别时,第一操作对象和第二操作对象可以是以游客身份完成文本识别操作,从而可以减少操作流程,提高文本识别效率。
下面对本申请实施例所涉及的文本识别模板创建过程进行详细描述。具体地,请参见图3,图3是本申请实施例提供的一种数据处理方法的流程示意图。可以理解地,该数据处理方法由计算机设备执行,该计算机设备可以是终端设备(例如,图1所对应实施例的终端设备10a),或者可以是服务器(例如,图1所示的服务器10d),该数据处理方法可以包括以下步骤S101至步骤S103:
步骤S101:响应针对模板配置入口的触发操作,显示模板配置页面。
步骤S102:响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板。
计算机设备可以安装有智能结构化平台,该智能结构化平台支持业务服务对象自定义设置文本识别模板,以满足业务服务对象多样化的业务需求。也就是说,业务服务对象可以根据自身的业务需求,在智能结构化平台中设置专属的文本识别模板,进而通过该文本识别模板进行结构化文本识别。该业务服务对象可以是指个人或者团体组织中的一个或者多个成员。
其中,文本识别模板可以用于为业务服务对象提供结构化识别服务,不同的文本识别模板之间可以通过模板标识区分,一个文本识别模板对应一个唯一的模板标识,模板标识可以是数字、字母、符号等一种或者多种形式的组合。不同的文本识别模板可以用于服务不同的业务服务对象,例如,在智能结构化平台中,模板标识为“12345”对应的文本识别模板可以用于服务业务服务对象a,模板标识为“12346”对应的文本识别模板可以用于服务业务服务对象b。
不同的业务服务对象可以根据自身的业务需求,在智能结构化平台中创建自己专属的文本识别模板。例如,业务服务对象a可以是从事快递业务的对象,可以在智能结构化平台创建运单相关的文本识别模板(例如,模板标识为“12345”),进而通过运模板标识为“12345”的文本识别模板快速识别得到运单中的结构化文本;业务服务对象b可以是从事报销业务的对象,可以在智能结构化平台创建报销单相关的文本识别模板(模板标识为“12346”),进而通过模板标识为“12346”的文本识别模板快速识别得到报销单中的结构化文本。又例如,业务服务对象a和业务服务对象b均为从事快递业务的对象,但是业务服务对象a主营国内快递业务,业务服务对象b主营国外快递业务,业务服务对象a可以在智能结构化平台创建国内运单相关的文本识别模板,类似地,业务服务对象b可以在智能结构化平台创建国外运单相关的文本识别模板,进而根据各自专属的文本识别模板快速识别得到各自期望的结构化文本。
本申请实施例对业务服务对象创建的模板数量不做限制,一个业务服务对象可以在智能结构化平台中创建一个或者多个文本识别模板。例如,业务服务对象a可以在智能结构化平台中创建模板标识为“12345”对应的文本识别模板,进而通过模板标识为“12345”对应的文本识别模板进行结构化文本识别。又例如,业务服务对象a可以在智能结构化平台中创建模板标识为“12345”对应的文本识别模板和模板标识为“12346”对应的文本识别模板,进而通过模板标识为“12345”对应的文本识别模板和模板标识为“12346”对应的文本识别模板进行结构化文本识别。
请参见图4,图4是本申请实施例提供的一种创建文本识别模板的界面示意图一。如图4所示,智能结构化平台可以为业务服务对象提供模板配置入口20a,业务服务对象可以对模板配置入口20a执行触发操作,进而可以响应针对模板配置入口20a的触发操作,显示模板配置页面20b。本申请实施例所提及的触发操作可以包括但不限于:点击触发操作、语音触发操作、悬停触发操作等触发操作中的一种或者多种。
模板配置页面20b可以包括基础信息输入区域20d和字段输入区域20e,此时,字段输入区域20e中的配置字段名为空,也就是说,此时的初始识别模板20c中的配置字段名为空。其中,基础信息输入区域20d用于输入模板基础信息,例如,模板名称、模板分组、模板备注等信息;字段输入区域20e用于输入配置字段名,该配置字段名可以用于作为业务服务对象对应的文本筛选条件,也就是说,该配置字段名与业务服务对象最终期望得到的结构化文本相匹配。业务服务对象可以对模板配置页面20b中的基础信息输入区域20d和字段输入区域20e执行编辑操作,智能结构化平台响应针对基础信息输入区域20d和字段输入区域20e的编辑操作,将基础信息输入区域20d中的编辑内容确定为模板基础信息,将字段输入区域20e中的编辑内容确定为配置字段名,进而将包含模板基础信息和配置字段名的初始识别模板20c,确定为业务服务对象对应的文本识别模板20i。
模板配置页面20b中的编辑操作可以是文本输入操作。如图4所示,业务服务对象可以在基础信息输入区域20d中执行文本输入操作,例如,智能结构化平台响应基础信息输入区域20d中的文本输入操作,将基础信息输入区域20d中的输入文本“国内运单1”确定为模板名称,将输入文本“运单模板”确定为模板分组,将输入文本“国内运单”确定为模板备注。字段输入区域20e可以包括多个字段子区域,例如,字段子区域20f、字段子区域20g和字段子区域20h等。业务服务对象可以在字段子区域20f执行文本输入操作,智能结构化平台响应针对字段子区域20f中的文本输入操作,将字段子区域20f中的输入文本“运单号”确定为字段子区域20f中的配置字段名。类似地,将字段子区域20g中的输入文本“寄件方联系方式”确定为字段子区域20g中的配置字段名,将字段子区域20h中的输入文本“收件方联系方式”确定为字段子区域20h中的配置字段名。也就是说,最终生成的文本识别模板20i可以包括字段输入区域20e的编辑操作指示的“运单号”、“寄件方联系方式”和“收件方联系方式”等配置字段名。
可选地,业务服务对象还可以根据业务需求,在字段输入区域20e中执行字段名添加操作和字段名删除操作。例如,字段输入区域20e还可以包括“新增字段名”控件和“删除”控件,业务服务对象可以对“新增字段名”控件执行触发操作,以便进行字段名添加操作,业务服务对象可以对“删除”控件执行触发操作,以便进行字段名删除操作。进而将包含模板基础信息和配置字段名的初始识别模板20c,确定为业务服务对象对应的文本识别模板20i。
步骤S103:为文本识别模板生成模板标识。
如图4所示,业务服务对象可以对模板配置页面20b中的“创建”控件20j执行触发操作,以确认创建文本识别模板20i,智能结构化平台响应针对文本识别模板的确认操作,可以为文本识别模板20i生成模板标识(例如,模板标识“123456”)。进一步地,可以将模板标识“123456”显示在智能结构化平台中,或者也可以将模板标识“123456”发送给业务服务对象对应的终端设备,以便业务服务对象根据模板标识“123456”调用文本识别模板20i进行结构化文本识别。具体的结构化文本识别过程将在下文进行详细描述,在此不再进行赘述。
本申请实施例中,通过响应针对模板配置入口的触发操作,可以显示模板配置页面;通过响应针对模板配置页面中的字段输入区域的编辑操作,可以创建业务服务对象对应的文本识别模板,为文本识别模板生成模板标识,该模板标识可以用于调用业务服务对象对应的文本识别模板,为业务服务对象提供结构化识别服务。其中,文本识别模板可以包含模板配置页面中的字段输入区域的编辑操作所指示的配置字段名,也就是说,在本申请实施例中业务服务对象可以创建自己专属的文本识别模板,通过自己创建的文本识别模板,可以使得提取得到的结构化文本符合实际业务需求,进而有助于提升文本识别效果。
请参见图5,图5是本申请实施例提供的一种数据处理方法的流程示意图二。可以理解地,该数据处理方法由计算机设备执行,该计算机设备可以是终端设备(例如,图1所对应实施例的终端设备10a),或者可以是服务器(例如,图1所示的服务器10d),计算机设备安装有智能结构化平台。该数据处理方法可以包括以下步骤S201至步骤S210:
步骤S201:接收业务服务对象对应的权限申请请求,获取权限申请请求携带的对象凭证。
步骤S202:若对象凭证指示业务服务对象满足权限激活条件,则确定业务服务对象具备模板创建权限,为业务服务对象显示模板配置入口。
在本申请实施例中,模板配置入口可以是预先集成在智能结构化平台的框架中的,当业务服务对象具备模板创建权限时,会激活该模板配置入口,并在智能结构化平台中为该业务服务对象显示模板配置入口;当业务服务对象未具备模板创建权限时,此时的模板配置入口处于未激活状态,无法在智能结构化平台中为该业务服务对象显示该模板配置入口。换言之,当业务服务对象具备模板创建权限时,无需更新该智能结构化平台,且可以直接在当前的智能结构化平台中显示模板配置入口,可以减少操作流程,节省时间。
业务服务对象在智能结构化平台中创建文本识别模板之前,可以先向智能结构化平台申请开放模板创建权限。具体地,业务服务对象可以通过计算机设备向智能结构化平台发送权限申请请求,相应地,智能结构化平台接收业务服务对象对应的权限申请请求,获取权限申请请求携带的对象凭证;若对象凭证指示业务服务对象满足权限激活条件,则确定业务服务对象具备模板创建权限,在智能结构化平台中为业务服务对象显示模板配置入口。对象凭证可以是指业务服务对象对应的模板创建服务使用凭证(例如,费用支付凭证、信用凭证、身份凭证等),具体用于验证业务服务对象是否满足权限激活条件的凭据。
请参见图6,图6是本申请实施例提供的一种申请模板创建权限的界面示意图。如图6所示,当业务服务对象不具备模板创建权限时,可以在智能结构化平台中显示模板创建申请页面30a,以便业务服务对象在模板创建申请页面30a中申请模板创建权限。具体地,业务服务对象可以对模板创建申请页面30a中的“立即开通”控件30b执行触发操作,智能结构化平台响应针对该“立即开通”控件30b的触发操作,显示服务开通页面30h。服务开通页面30h可以包含服务套餐选取区域30c,服务套餐选取区域30c可以包括多个模板创建服务套餐,业务服务对象可以根据业务需求对服务套餐选取区域30c中的任意一个模板创建服务套餐执行选择操作,例如,业务服务对象可以对模板创建服务套餐30i执行选取操作,申请开通1年的模板创建服务。
进一步地,业务服务对象可以对“确认开通”控件30d执行触发操作,向智能结构化平台支付相应的服务费用。支付完成之后,可以向智能结构化平台发送权限申请请求,以向智能结构化平台申请开通1年的模板创建服务。相应地,智能结构化平台接收业务服务对象对应的权限申请请求,获取权限申请请求携带的对象凭证,该对象凭证可以是模板创建服务对应的费用支付凭证。进而可以将该对象凭证与权限激活条件进行比对,确定是否满足权限激活条件。例如,当对象凭证指示业务服务对象的模板创建服务对应的支付状态处于支付成功状态时,确定业务服务对象满足权限激活条件;当对象凭证指示业务服务对象的模板创建服务对应的支付状态处于支付失败状态时,确定业务服务对象不满足权限激活条件。
当对象凭证指示业务服务对象满足权限激活条件时,确定业务服务对象具备模板创建权限,可以在智能结构化平台中显示权限激活提示页面30e。权限激活提示页面30e可以包括“返回创建模板”控件30f,业务服务对象可以对“返回创建模板”30f执行触发操作,智能结构化平台响应针对“返回创建模板”控件30f的触发操作,为业务服务对象显示模板配置入口30g,进而通过模板配置入口30g创建文本识别模板。
步骤S203:响应针对模板配置入口的触发操作,显示模板配置页面。
在一种可能的实施方式中,业务服务对象可以对模板配置入口执行触发操作,智能结构化平台可以响应业务服务对象针对模板配置入口的触发操作,显示模板编辑页面;模板编辑页面可以包括类型输入区域,业务服务对象可以在类型输入区域执行编辑操作,智能结构化平台可以响应类型输入区域的编辑操作,根据类型输入区域中的编辑内容确定模板类型;业务服务对象可以对该模板类型执行确认操作,智能结构化平台可以响应针对该模板类型的确认操作,显示模板配置页面,在模板配置页面中显示与该模板类型相匹配的初始识别模板。
具体地,请参见图7a,图7a是本申请实施例提供的一种模板配置页面的界面示意图一。如图7a所示,智能结构化平台可以包括模板配置入口40a,业务服务对象可以对模板配置入口40a执行触发操作,智能结构化平台可以响应针对模板配置入口40a的触发操作,显示模板编辑页面40b。模板编辑页面40b可以包括类型输入区域40c,业务服务对象可以在类型输入区域40c中执行编辑操作,例如,业务服务对象在输入区域40c中输入“运单”作为模板编辑页面40b对应的编辑内容;智能结构化平台可以响应类型输入区域40c的编辑操作,将类型输入区域40c中的编辑内容确定为模板类型,例如,可以将编辑内容“运单”确定为模板类型。可选地,模板编辑页面40b还可以包括热门类型选取区域40d,热门类型选取区域40d可以包括智能结构化平台中使用频次高的一些模板类型,例如,“证件”类型、“发票”类型、“运单”类型、“合同”类型和“收据”类型等等。业务服务对象可以在热门模板选取区域40d中选取一个或者多个热门模板类型,智能结构化平台可以响应业务服务对象针对热门模板选取区域40d中的热门模板选择操作,将模板选择操作所触发的一个或者多个热门模板类型(例如,“运单”类型)可视化地显示在类型输入区域40c中,并将其确定为模板类型。
进一步地,业务服务对象可以对该模板类型执行确认操作,智能结构化平台可以响应针对该模板类型的确认操作,显示模板配置页面40k。如图7a所示,模板编辑页面40b可以包括“确认”控件40e,业务服务对象可以对“确认”控件40e执行触发操作,以实现对“运单”模板类型执行确认操作,智能结构化平台可以响应针对“运单”模板类型的确认操作,显示模板配置页面40k。其中,模板配置页面40k中可以显示有初始识别模板40g,初始识别模板40g是与“运单”模板类型相匹配的模板类型。初始识别模板40g可以包括基础信息输入区域40i所指示的模板基础信息和字段输入区域40j所指示的配置字段名,例如,“运单号”、“寄件方联系方式”和“收件方联系方式”等配置字段名。
业务服务对象可以在初始识别模板40g的基础上,在基础信息输入区域40i中修改或者输入模板基础信息,在字段输入区域40j中新增或者删除配置字段名,得到文本识别模板;或者也可以将初始识别模板40g确定为业务服务对象对应的文本识别模板,通过初始识别模板40g创建文本识别模板,有助于提高文本识别模板的创建效率。有助于提高文本识别模板的创建效率。
在一种可能的实施方式中,业务服务对象可以对模板配置入口执行触发操作,智能结构化平台可以响应业务服务对象针对模板配置入口的触发操作,显示一个或者多个初始识别模板;智能结构化平台可以显示模板配置页面,在模板配置页面中显示,针对一个或者多个初始识别模板的模板选择操作所触发的初始识别模板。
具体地,请参见图7b,图7b是本申请实施例提供的一种模板配置页面的界面示意图二。如图7b所示,智能结构化平台可以包括模板配置入口50a,业务服务对象可以对模板配置入口50a执行触发操作,智能结构化平台可以响应针对模板配置入口50a的触发操作,显示模板编辑页面50b。模板编辑页面50b可以包括一个或者多个初始识别模板,例如,初始识别模板50c、初始识别模板50d和初始识别模板50e等。业务服务对象可以对模板编辑页面50b中的初始识别模板(例如,初始识别模板50e)执行模板选择操作,智能结构化平台可以响应初始识别模板50e的模板选择操作,显示模板配置页面50f。模板配置页面50f中可以显示有初始识别模板50e,初始识别模板50e可以包括基础信息输入区域50i所指示的模板基础信息和字段输入区域50j所指示的配置字段名,例如,“运单号”、“寄件方联系方式”和“收件方联系方式”等配置字段名。
业务服务对象可以在初始识别模板50e的基础上,在基础信息输入区域50i中修改或者输入模板基础信息,在字段输入区域50j中新增或者删除配置字段名,得到文本识别模板;或者也可以将初始识别模板50e确定为业务服务对象对应的文本识别模板,通过初始识别模板50e创建文本识别模板,有助于提高文本识别模板的创建效率。
在一种可能的实施方式中,模板编辑页面还可以包括样图输入区域,在得到初始识别模板之后,业务服务对象还可以在样图输入区域中添加样本配置图像,例如,可以在样图输入区域中输入样本配置图像对应的统一资源定位系统(uniform resource locator,URL),通过输入样本配置图像对应的URL添加样本配置图像;或者也可以在样图输入区域中上传本地图像,将上传的本地图像确定为样本配置图像。进而通过初始识别模板对样本配置图像进行文本识别,得到样本配置图像对应的字段识别结果,并显示模板配置页面,该模板配置页面包括该字段识别结果。字段识别结果具体的获取过程可以参考下文的描述,在此不再赘述。
在一种可能的实施方式中,业务服务对象可以对模板配置入口执行触发操作,智能结构化平台可以响应业务服务对象针对模板配置入口的触发操作,显示模板编辑页面;业务服务对象可以在模板编辑页面中的样图输入区域中执行样图添加操作,智能结构化平台可以响应样图输入区域的样图添加操作,将样图输入区域中的输入图像确定为样本配置图像;进一步地,智能结构化平台可以显示模板配置页面,并在模板配置页面中显示与初始识别模板相匹配的样本配置图像的字段识别结果。其中,初始识别模板可以用于对样本配置图像进行文本识别,得到字段识别结果,该初始识别模板可以是智能结构化平台预先存储的识别模板。
具体地,请参见图7c,图7c是本申请实施例提供的一种模板配置页面的界面示意图三。如图7c所示,智能结构化平台可以包括模板配置入口60a,业务服务对象可以对模板配置入口60a执行触发操作,智能结构化平台可以响应针对模板配置入口60a的触发操作,显示模板编辑页面60b。模板编辑页面60b可以包括基础信息输入区域60c和样图输入区域60d,业务服务对象可以在基础信息输入区域60c中输入模板基础信息,在样图输入区域60d添加样本配置图像。
如图7c所示,业务服务对象可以对样图输入区域60d中的“选择图片”控件60e执行触发操作,智能结构化平台可以响应针对“选择图片”控件60e的触发操作,显示样图选择页面;样图选择页面可以包括一张或者多张图像(例如,图像60g)。业务服务对象可以对图像60g(模板类型为“报销单”类型)执行样图添加操作,智能结构化平台可以响应针对图像60g的样图添加操作,将图像60g确定为样本配置图像。智能结构化平台可以通过识别图像60g对应的标题“采购报销单”,确定图像60g对应的模板类型为“报销单”类型;或者样图输入区域60d中还可以包括类型子区域,智能结构化平台可以响应类型子区域中的类型输入操作,将类型子区域中的输入文本(例如,“报销单”)确定为图像60g对应的模板类型,获取“报销单”类型的初始识别模板60m。该初始识别模板60m的模板类型与图像60g对应的模板类型相匹配,此时,初始识别模板60m可以包括“报销部门”、“报销日期”等配置字段名,可以使用初始识别模板60m对图像60g进行文本识别,得到图像60g对应的字段识别结果。
进一步地,业务服务对象可以对模板编辑页面60b中的“确定”控件60f执行触发操作,表明对图像60g执行确认操作,智能结构化平台可以响应针对图像60g的确认操作,根据初始识别模板60m对图像60g的进行文本识别,得到图像60g的样图识别结果,并显示模板配置页面60h。该样图识别结果可以包括字段名列表60j和字段值列表60u,字段名列表60j中包含图像60g中的字段名,例如,“部门”、“报销人”等字段名;字段值列表60u中包含图像60g中的字段值,例如,“销售部”、“小A”等字段值。进而可以为字段名列表60j中所包含的字段名匹配第一配置字段名60k;第一配置字段名60k包含字段名列表60j中的各个字段名对应的配置字段名,例如,字段名列表60j中的“部门”字段名对应的配置字段名可以是“报销部门”。类似地,可以为字段值列表60u中所包含的字段值匹配第二配置字段名60v;第二配置字段名60v包含字段值列表60u中的各个字段值对应的配置字段名,例如,字段值列表60u中的“销售部”字段值对应的配置字段名可以是“报销部门”。可以将字段名列表60j和第一配置字段名确定为图像60g对应的第一识别结果,将字段值列表60u和第二配置字段名60v确定为图像60g对应的第二识别结果。进而可以将第一识别结果和第二识别结果中的任意一种确定为字段识别结果,或者可以将第一识别结果和第二识别结果确定为字段识别结果。在得到字段识别结果之后,可以将字段识别结果中的配置字段名进行修改,得到文本识别模板,或者也可以将初始识别模板60m确定为业务服务对象对应的文本识别模板。
如图7c所示,模板配置页面60h可以包括第一输入区域60i和第二输入区域60n,第一输入区域60i可以包括第一识别结果,第二输入区域60n可以包括第二识别结果。在一种可能的实施方式中,业务服务对象可以同时将第一输入区域60i和第二输入区域60n确定为字段输入区域。在这种情况下,业务服务对象可以同时在第一输入区域60i和第二输入区域60n中执行编辑操作,创建文本识别模板。在一种可能的实施方式中,业务服务对象可以在第一输入区域60i和第二输入区域60n中任意选择一个区域作为字段输入区域,例如,业务服务对象可以针对第一输入区域60i执行区域选取操作,智能结构化平台响应针对第一输入区域60i的区域选取操作,将第一输入区域60i确定为字段输入区域。在这种情况下,第一输入区域60i对应的编辑状态可以切换显示为可编辑状态,第二输入区域60n对应的编辑状态可以切换显示为不可编辑状态,业务服务对象可以在第一输入区域60i执行编辑操作,创建文本识别模板。
步骤S204:响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板。
其中,编辑操作可以包括但不限于:文本输入操作、子区域添加操作、子区域删除操作、字段名修改操作等操作中的一种或者多种。例如,编辑操作可以包含子区域添加操作和文本输入操作;又例如,编辑操作可以包含子区域删除操作;再例如,编辑操作可以包括子区域添加操作、子区域删除操作和字段名修改操作等。本申请实施例对编辑操作的具体实现方式不做限定,可以根据实际需求执行具体的编辑操作。文本识别模板可以包含编辑操作所指示的配置字段名,该配置字段名可以用于作为业务服务对象对应的文本筛选条件,也就是说,该配置字段名与业务服务对象最终期望得到的结构化文本相匹配。
在一种可能的实施方式中,编辑操作可以包括子区域添加操作和文本输入操作,文本识别模板的创建方式可以包括:响应针对模板配置页面中的字段输入区域的子区域添加操作,在字段输入区域中添加字段子区域;响应针对字段子区域的文本输入操作,将字段子区域中的输入文本确定为扩充字段名;将包含扩充字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。
具体地,请参见图8a,图8a是本申请实施例提供的一种创建文本识别模板的界面示意图二。如图8a所示,模板配置页面70a可以显示有初始识别模板70b,初始识别模板70b可以包括字段输入区域70d所指示的配置字段名,例如,“运单号”、“寄件方联系方式”、“收件方联系方式”等配置字段名。当业务服务对象发现初始识别模板70b中缺少必要的配置字段名时,可以对“新增字段名”控件70e执行触发操作,进而对字段输入区域70d执行子区域添加操作;智能结构化平台可以响应针对字段输入区域70d的子区域添加操作,在字段输入区域70d中添加字段子区域70f。
如图8a所示,业务服务对象可以在字段子区域70f中输入期望的配置字段名,智能结构化平台可以响应针对字段子区域70f的文本输入操作,将字段子区域70f中的输入文本(例如“付款方式”)确定为扩充字段名,进而将包含扩充字段名的初始识别模板70b,确定为业务服务对象对应的文本识别模板70g。可选地,在创建文本识别模板70g之前,业务服务对象可以对“预览”控件执行触发操作,以便预览文本识别模板70g。业务服务对象可以对模板配置页面70b中的“创建”控件70c执行触发操作,智能结构化平台响应针对“创建”控件70c的触发操作,为业务服务对象创建文本识别模板70g。如图8a所示,文本识别模板70g中的配置字段名可以包括:“运单号”、“寄件方联系方式”、“收件方联系方式”和“付款方式”。
在一种可能的实施方式中,模板配置页面中的字段输入区域可以包括多个字段子区域,每一个字段子区域中可以包含配置字段名,编辑操作可以包括子区域删除操作,文本识别模板的创建方式可以包括:响应针对模板配置页面中的字段输入区域的子区域删除操作,在模板配置页面所显示的初始识别模板中,清除子区域删除操作对应的字段子区域中的配置字段名,得到业务服务对象对应的文本识别模板。
其中,该子区域删除操作可以是对字段子区域对应的“删除”控件执行触发操作;或者也可以是选中待删除的字段子区域,进而对选中的字段子区域进行删除操作;或者也可以是选中字段子区域中包含的配置字段名进行删除,以对字段子区域中的配置字段名进行删除,这种删除方式,只删除字段子区域中的配置字段名,而不删除字段子区域。可以理解的是,本申请实施例对子区域删除操作的具体实现方式不做限定。
具体地,请参见图8b,图8b是本申请实施例提供的一种创建文本识别模板的界面示意图三。如图8b所示,模板配置页面80a可以显示有初始识别模板80b,初始识别模板80b可以包括字段输入区域80d所指示的配置字段名,例如,“运单号”、“寄件方联系方式”、“收件方联系方式”等配置字段名。其中,字段输入区域80d可以包括多个字段子区域,例如,字段子区域80e、字段子区域80f和字段子区域80g,字段子区域80e包含的配置字段名为“运单号”,字段子区域80f包含的配置字段名为“寄件方联系方式”,字段子区域80g包含的配置字段名为“收件方联系方式”。每一个字段子区域可以对应一个“删除”控件,例如,字段子区域80e对应“删除”控件80h,字段子区域80f对应“删除”控件80i,字段子区域80g对应“删除”控件80j。
当业务服务对象发现初始识别模板80b中具有多余的配置字段名(例如“收件方联系方式”)时,可以对“删除”控件80j执行触发操作,智能结构化平台响应针对“删除”控件80j的触发操作,删除字段子区域80g,进而在初始识别模板80b中删除字段子区域80g中的配置字段名“收件方联系方式”,得到业务服务对象对应的文本识别模板80k。业务服务对象可以对模板配置页面80b中的“创建”控件80c执行触发操作,智能结构化平台响应针对“创建”控件80c的触发操作,为业务服务对象创建文本识别模板80k。如图8b所示,文本识别模板80k中的配置字段名可以包括:“运单号”和“寄件方联系方式”。
在一种可能的实施方式中,初始识别模板中的字段输入区域可以包括一个或者多个字段子区域,字段子区域中可以包含配置字段名,编辑操作可以包括子字段名修改操作,文本识别模板的创建方式可以包括:响应针对模板配置页面中的字段输入区域的字段名修改操作,根据字段名修改操作所确定的文本内容,更新字段名修改操作所确定的字段子区域中的配置字段名,将包含更新后的配置字段名的初始文本识别模板,确定为业务服务对象对应的文本识别模板。
在一种可能的实施方式中,模板配置页面中的字段输入区域可以包括多个字段子区域,每一个字段子区域中包含配置字段名,一个字段子区域可以对应一个激活控件,激活控件对应的激活状态包括开启状态和关闭状态,文本识别模板的创建方式可以包括:将处于开启状态的激活控件对应的字段子区域确定为候选子区域,将包含候选子区域中的配置字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。
在一种可能的实施方式中,模板配置页面中的字段输入区域可以包括多个字段子区域,每一个字段子区域中包含配置字段名,一个字段子区域可以对应一个激活控件,激活控件对应的激活状态包括开启状态和关闭状态,文本识别模板的创建方式可以包括:响应针对模板配置页面中的字段输入区域的字段名修改操作,根据字段名修改操作所确定的文本内容,更新字段名修改操作所确定的字段子区域中的配置字段名;将处于开启状态的激活控件对应的字段子区域确定为候选子区域,将包含候选子区域中的配置字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。
具体地,请参见图8c,图8c是本申请实施例提供的一种创建文本识别模板的界面示意图四。如图8c所示,模板配置页面90a可以显示有初始识别模板90b,初始识别模板90b可以包括字段输入区域90d所指示的配置字段名,例如,“运单号”、“寄件方联系方式”、“收件方联系方式”等配置字段名。其中,字段输入区域90d可以包括多个字段子区域,例如,字段子区域90e、字段子区域90f和字段子区域90g,字段子区域90e包含的配置字段名为“运单号”,字段子区域90f包含的配置字段名为“寄件方联系方式”,字段子区域90g包含的配置字段名为“收件方联系方式”。每一个字段子区域可以对应一个“激活”控件,例如,字段子区域90e对应“激活”控件90h,字段子区域90f对应“激活”控件90i,字段子区域90g对应“激活”控件90j。
当业务服务对象发现初始识别模板90b中的配置字段名(例如,“收件方联系方式”)需要进行修改时,可以对字段子区域90g执行字段名修改操作;智能结构化文本可以响应字段子区域90g的字段名修改操作,根据字段名修改操作所确定的文本内容(例如,“付款方式”)更新字段子区域90g中的配置字段名,例如,可以将字段子区域90g中的配置字段名“收件方联系方式”更新为配置字段名“付款方式”。
可以理解的是,“激活”控件对应的激活状态包括开启状态和关闭状态,模板配置页面90a中可以显示有每一个“激活”控件对应的激活状态。一般而言,“激活”控件对应的激活状态默认设置为开启状态,例如,在初始识别模板90b中,“激活”控件90h、“激活”控件90i和“激活”控件90j对应的激活状态均为开启状态。
当业务服务对象不希望某一个或者多个字段子区域(例如,字段子区域90f)中的配置字段名生效时,可以对“激活”控件90i执行触发操作,智能结构化平台可以响应针对“激活”控件90i对应的触发操作,将“激活”控件90i对应的激活状态从开启状态切换显示为关闭状态。
进一步地,智能结构化平台可以将处于开启状态的激活控件对应的字段子区域(例如,字段子区域90e和字段子区域90g)确定为候选子区域,进而将将包含候选子区域中的配置字段名的初始识别模板90b,确定为业务服务对象对应的文本识别模板90k。如图8c所示,文本识别模板90k中的配置字段名可以包括:“运单号”和“付款方式”,此时配置字段名“寄件方联系方式”为未生效状态。
步骤S205:为文本识别模板生成模板标识。
在本申请实施例中,文本识别模板对应的发布状态可以包括待发布状态和已发布状态,当文本识别模板对应的发布状态处于待发布状态时,表明该文本识别模板为草稿模板,还不能通过该文本识别模板进行文本识别;当文本识别模板对应的发布状态处于已发布状态时,表明该文本识别模板为线上模板,可以通过该文本识别模板进行文本识别。
具体地,智能结构化平台可以响应针对文本识别模板的确认操作,为文本识别模板生成模板标识,将文本识别模板添加至模板创建记录列表,在模板创建记录列表中为文本识别模板添加发布控件;响应针对文本识别模板对应的发布控件的触发操作,将文本识别模板对应的发布状态从待发布状态切换显示为已发布状态;将处于已发布状态的文本识别模板对应的模板标识,发送给业务服务对象,例如,将处于已发布状态的文本识别模板对应的模板标识显示在智能结构化平台,或者将处于已发布状态的文本识别模板对应的模板标识发送给业务对象对应的终端设备。
请参见图9a,图9a是本申请实施例提供的一种发布文本识别模板的界面示意图。如图9a所示,业务服务对象可以对模板配置页面11a中的“创建”控件11c执行触发操作,确认为业务服务对象创建文本识别模板11b;智能结构化平台可以响应针对文本识别模板11b的确认操作,为文本识别模板11b生成模板标识“0012345”,将文本识别模板11b添加至模板创建记录列表11d,并在模板创建记录列表11d中为文本识别模板11b添加发布控件11e。
模板创建记录列表11d中可以显示有文本识别模板11b对应的发布状态,如图9a所示,文本识别模板11b当前的发布状态为待发布状态。业务服务对象可以对发布控件11e执行触发操作,智能结构化平台可以响应针对发布控件11e的触发操作,将文本识别模板11b对应的发布状态从待发布状态切换显示为已发布状态,进而将处于已发布状态的文本识别模板11b对应的模板标识“0012345”,发送给业务服务对象,以便业务服务对象根据模板标识“0012345”调用文本识别模板11b进行结构化文本识别。
可选地,业务服务对象可以对文本识别模板11b进行模板修改操作,例如,业务服务对象可以对文本识别模板11b对应的“编辑”控件执行触发操作,智能结构化平台可以响应针对该“编辑”控件的触发操作,显示文本识别模板11b对应的模板修改页面,此时,文本识别模板11b对应的发布状态可以从已发布状态切换显示为待发布状态。业务服务对象可以在文本识别模板11b对应的模板修改页面对文本识别模板11b执行模板修改操作,例如,可以在模板修改页面对文本识别模板11b中的配置字段名执行修改、删除或者添加,或者对字段子区域对应的“激活”控件对应的激活状态进行切换等操作;智能结构化平台可以响应文本识别模板11b的模板修改操作,更新文本识别模板11b。
请一并参见图9b,图9b是本申请实施例提供的一种文本识别模板的发布状态的示意图。如图9b所示,可以通过文本识别模板对应的发布状态区分线上模板(处于已发布状态的文本识别模板)和草稿模板(处于已发布状态的文本识别模板),从而将线上模板和草稿模板进行隔离,保证二者不会互相影响。
在一种可能的实施方式中,可以移除模板创建记录列表中的使用间隔时长大于间隔时间阈值的文本识别模板,以提高文本识别模板的管理效率。其中,间隔时间阈值是预先设置的参数,例如,间隔时间阈值可以是一个月、三个月等,具体的取值就可以根据实际情况确定。例如,可以获取文本识别模板对应的最大历史使用时间戳,根据最大历史使用时间戳确定文本识别模板对应的使用间隔时长;若使用间隔时长大于间隔时长阈值,则在模板创建记录列表中删除文本识别模板。该最大历史使用时间戳可以是指文本识别模板最近一次使用的时间戳。
具体地,可以获取文本识别模板对应的历史使用时间戳集合,从历史使用时间戳集合获取最大历史使用时间戳,以及与最大历史使用时间戳相邻的时间戳(记为相邻历史使用时间戳);进而获取最大历史使用时间戳与相邻历史使用时间戳之间的差值时间间隔,将该差值时间间隔确定文本识别模板对应的使用间隔时长。若使用间隔时长大于间隔时长阈值,则在模板创建记录列表中删除文本识别模板,以提高模板管理效率。可选地,智能结构化平台可以在模板创建记录列表中自动清除该文本识别模板;或者智能结构化平台也可以向业务服务对象发送模板清除消息,以便业务服务对象根据该模板清除消息,在模板创建记录列表中删除该文本识别模板。此时,业务服务对象可以在模板创建记录列表中,对该文本识别模板对应的“模板删除”控件执行触发操作,智能结构化平台可以响应针对“模板删除”控件的触发操作,在模板创建记录列表中删除该文本识别模板。
步骤S206:响应针对文本识别控件的触发操作,显示文本识别页面。
当业务服务对象接收到模板标识时,可以在智能结构化平台中调用该模板标识对应的文本识别模板进行结构化文本识别。具体地,请参见图10,图10是本申请实施例提供的一种文本识别的界面示意图。如图10所示,智能结构化平台可以显示有文本识别控件12a,业务服务对象可以对文本识别控件12a执行触发操作,智能结构化平台响应针对文本识别控件12a的触发操作,显示文本识别页面12b。文本识别页面12b可以包括标识区域12c和图像区域12d,标识区域12c用于输入模板标识,图像区域12d用于输入待识别图像。
步骤S207:响应针对图像区域的图像添加操作,将图像添加操作所指示的图像确定为待识别图像。
如图10所示,业务服务对象可以对图像区域12d执行图像添加操作,例如,业务服务对象可以在图像区域12d中上传待识别图像进行图像添加操作,或者在图像区域12d中输入URL进行图像添加操作。智能结构化平台可以响应针对图像区域12d的图像添加操作,将图像添加操作所指示的图像12d确定为待识别图像。
步骤S208:响应针对标识区域的标识输入操作,在标识区域中显示模板标识。
如图10所示,业务服务对象可以对标识区域12c执行标识输入操作,智能结构化平台可以响应针对标识输入操作的标识输入操作,在标识区域12c中显示模板标识(例如,“12345”)。可选地,智能结构化平台还可以在文本识别页面12b中显示模板选择区域,该模板选择区域可以包括业务服务对象在智能结构化平台创建的一个或者多个文本识别模板。业务服务对象可以对模板选择区域执行模板选择操作,智能结构化平台可以响应该模板选择操作,获取该模板选择操作对应的文本识别模板的模板标识,在标识区域12c中显示该模板标识。
步骤S209:响应针对待识别图像的文本识别操作,将模板标识传入文本识别接口,通过文本识别接口调用模板标识对应的文本识别模板。
步骤S210:根据文本识别模板对待识别图像进行文本识别,得到与文本识别模板中的配置字段名相匹配的结构化文本。
如图10所示,业务服务对象可以对“开始识别”控件12e执行触发操作,智能结构化平台可以响应针对“开始识别”控件12e的触发操作,进而响应针对图像12g的文本识别操作,将模板标识“12345”作为参数传入文本识别接口,通过文本识别接口调用模板标识“12345”对应的文本识别模板,进而根据文本识别模板对图像12g进行文本识别,得到与文本识别模板中的配置字段名相匹配的结构化文本12f,并在智能结构化平台中显示结构化文本12f。
可以理解的是,智能结构化平台集成有文本识别模型(Document LanguageModel,DocLM),该文本识别模型是经过大量的样本结构化数据进行训练后得到的模型,该样本结构化数据可以包括样本识别模板,以及样本图像,该样本图像包括与该样本识别模板中的样本字段名相匹配的样本文本。因此,通过该文本识别模型调用业务服务对象创建的文本识别模板进行文本识别,可以使得识别得到的结构化文本满足业务服务对象的业务需求,进而可以提升文本识别效果。
可选地,当业务服务对象发现通过文本识别模板识别得到的结构化文本不符合预期时,可以对文本识别模板进行模板修改,得到文本更新模板,进而通过该文本更新模板对待识别图像进行文本识别。
在本申请实施例中,文本识别页面可以包括模板修改控件,业务服务对象可以对该模板修改控制执行触发操作,智能结构化平台可以响应针对该模板修改控件的触发操作,显示文本识别模板对应的模板修改页面。业务服务对象可以在模板修改页面中执行模板修改操作模板,例如,可以在模板修改页面对文本识别模板中的配置字段名执行修改、删除或者添加等操作,或者对字段子区域对应的“激活”控件对应的激活状态进行切换等操作;智能结构化平台可以响应模板修改页面中的模板修改操作,将模板修改操作所确定的文本识别模板确定为文本更新模板,将业务服务对象对应的文本识别模板替换为文本更新模板,进而通过该文本更新模板对待识别图像进行文本识别。可以理解的是,在模板修改过程中,模板标识不进行变更,修改前和修改后的文本识别模板具有相同的模板标识。
可选地,业务服务对象还可以在本地搭建自己的文本识别应用,通过该文本识别应用进行文本识别。具体地,智能结构化平台可以响应针对文本识别接口的代码导出操作,将文本识别接口关联的代码文件封装为文本识别开发包;进而将文本识别开发包发送给业务服务对象对应的终端设备,以使终端设备根据文本识别开发包搭建业务服务对象对应的文本识别应用,此时,业务服务对象可以通过该文本识别应用进行文本识别,而无需在智能结构化平台中进行文本识别,有助于提高文本识别效率。
请参见图11,图11是本申请实施例提供的一种下载文本识别开发包的界面示意图。智能结构化平台可以提供文本识别开发包的下载服务。如图11所示,智能结构化平台可以显示代码区域13c,代码区域13c显示文本识别接口的关联的代码文件,该代码文件可以是搭建文本识别应用所需的代码文件或工具。可选地,业务服务对象可以根据实际需求在代码区域13c中传入或者修改代码文件中的参数,包括但不限于:传入业务服务对象在智能结构化平台的账号标识和账号密码;或者传入业务服务对象在智能结构化平台创建的文本识别模板对应的模板标识等等。
传参或者修改参数完成之后,业务服务对象可以对“调试代码”控件13a执行触发操作,智能结构化平台可以响应针对“调试代码”控件13a的触发操作,对代码区域13c中的文本识别接口关联的代码文件进行调试,并显示代码调式结果。当代码调式结果指示调试通过时,业务服务对象可以对“下载开发包”控件13b执行触发操作,智能结构化平台响应针对“下载开发包”控件13b的触发操作,进而响应针对文本识别接口执行代码导出操作,将文本识别接口关联的代码文件封装为文本识别开发包;进而将文本识别开发包发送给业务服务对象对应的终端设备。如图11所示,当文本识别开发包下载完成时,表明文本识别开发包发送成功时,可以在智能结构化平台显示发送成功提示消息13f,以提示业务服务对象可以搭建文本识别应用。成功提示消息13f可以包括“查看文本识别开发包”控件13d和“开发帮助”控件13e,“查看文本识别开发包”控件13d用于查看文本识别开发包在业务服务对象对应的终端设备的存储位置,“开发帮助”控件13e用于为业务服务对象提供文本识别应用的开发帮助,进而提高文本识别应用的开发效率。
本申请实施例中,通过响应针对模板配置入口的触发操作,可以显示模板配置页面;通过响应针对模板配置页面中的字段输入区域的编辑操作,可以创建业务服务对象对应的文本识别模板,为文本识别模板生成模板标识,将模板标识发送给业务服务对象,该模板标识可以用于调用业务服务对象对应的文本识别模板,为业务服务对象提供结构化识别服务。其中,文本识别模板可以包含模板配置页面中的字段输入区域的编辑操作所指示的配置字段名,也就是说,在本申请实施例中业务服务对象可以创建自己专属的文本识别模板,通过自己创建的文本识别模板,可以使得提取得到的结构化文本符合实际业务需求,进而有助于提升文本识别效果。
请参见图12,图12是本申请实施例提供的一种数据处理方法的流程示意图三。可以理解地,该数据处理方法由业务服务对象和智能结构化平台交互执行,智能结构化平台可以包括结构化控制台、模板配置页面、云服务接口、数据库、文本识别服务和算法引擎等。该数据处理方法可以包括以下步骤S301至步骤S315:
步骤S301:创建文本识别模板。
业务服务对象可以在智能结构化平台中的结构化控制台中创建文本识别模板,具体的创建方式可以参考上文的描述,在此不再进行赘述。
步骤S302:请求云服务。
结构化控制台请求智能结构化平台对应的云服务的响应,以便完成文本识别模板的创建。
步骤S303:生成模板标识。
文本识别模板创建完成之后,为该文本识别模板生成模板标识,并在智能结构化平台中的模板配置页面显示该模板标识。
步骤S304:存储文本识别模板。
在智能结构化平台中的数据库中存储该文本识别模板,以实现模板数据的持久化管理。
请参见图13,图13是本申请实施例提供的一种模板数据存储的示意图。如图13所示,数据库中存储有文本识别模板对应的配置主表、字段名映射表、字段值映射表、用量表和用量详情表等二维表。其中,配置主表用于存储文本识别模板的基本信息,包括模板标识(f_config_id)、业务服务对象信息(对象主账号和对象子账号)、模板备注、发布状态、图像链接(文本识别模板对应的样本配置图像的URL)等信息。
字段名映射表用于存储文本识别模板对应的第一识别结果,第一识别结果可以包括样本配置图像对应的字段名列表和与字段名列表相匹配的第一配置字段名;字段值映射表用于存储文本识别模板对应的第二识别结果,第二识别结果可以包括样本配置图像对应的字段值列表和与字段值列表相匹配的第二配置字段名。配置主表和字段名映射表之间是一对多的关系,二者通过模板标识(f_config_id)建立关联关系;类似地,配置主表和字段值映射表之间也是一对多的关系,二者通过模板标识(f_config_id)建立关联关系。用量表存储业务服务对象对文本识别模板的使用情况,用于后期统计;用量详情表用于存储文本识别模板的使用详情信息。配置主表和用量表之间通过配置主表标识建立关联关系;用量表和用量详情表之间通过配置主表标识建立关联关系。
在本申请实施例中,业务服务对象在模板配置页面的操作,包括模板创建操作、模板修改操作、模板发布操作等操作,可以存储在配置主表中。业务服务对象在模板配置页面中针对字段输入区域的操作,包括配置字段名保存操作、配置字段名添加操作、配置字段名删除操作等,可以存储在字段名映射表或字段值映射表中。
文本识别模板对应的配置版本可以包括两个配置版本,分别是草稿配置版本(发布状态处于待发布状态)和已发布配置版本(发布状态处于已发布状态),二者相互隔离,通过数据库中的草稿字段(f_is_draf)t区分。当文本识别模板对应的发布状态处于已发布状态时,可以用f_is_draft=草稿的模板数据,替换f_is_draft=已发布的模板数据,更新文本识别模板对应的模板数据。可以理解的是,本申请实施例涉及的数据库存储结构,可以实现模板数据的持久化管理,为高效实现模板数据的查询和存储提供了有力支持。
步骤S305:返回模板创建成功消息。
步骤S306:返回模板创建成功消息。
当文本识别模板创建成功时,模板配置页面可以向结构化控制台返回模板创建成功消息,该模板创建成功消息可以包括文本识别模板对应的模板标识;结构化控制台在接收到模板创建成功消息之后,可以向业务服务对象返回模板创建成功消息。
步骤S307:调用文本识别接口。
业务服务对象在接收到模板创建成功消息之后,可以向智能结构化平台中的云服务接口请求调用文本识别接口进行文本识别。此时,可以将模板标识和接口参数等信息传入云服务接口,以便云服务接口请求调用模板标识对应的文本识别接口。
步骤S308:调用云服务。
云服务接口请求调用智能结构化平台对应的云服务,以便云服务提供文本识别服务。
步骤S309:通过模板标识查询文本识别模板。
文本识别服务向数据库请求查询模板标识对应的文本识别模板。
步骤S310:调用文本识别模板。
步骤S311:识别图片中的结构化文本。
步骤S312:结合文本识别模板识别图片中的结构化文本。
通过文本识别接口调用模板标识对应的文本识别模板,智能结构化平台中的算法引擎可以结合文本识别模板对图片进行文本识别,得到与文本识别模板中的配置字段名相匹配的结构化文本。
步骤S313:返回文本识别结果。
步骤S314:文本识别服务响应。
步骤S315:云服务响应。
算法引擎在完成文本识别之后,可以将识别得到的结构化文本返回给文本识别服务;文本识别服务响应之后,进行云服务的响应,向业务服务对象返回结构化文本。
可以理解的是,在本申请的具体实施方式中,可能涉及到用户的相关信息(例如,用户的账号信息、用户的密码信息等),当本申请以上实施例运用到具体产品或技术中时,需要获得用户的许可或同意,且相关数据的收集、使用和处理需要遵守相关地区的相关法律法规和标准。
请参见图14,图14是本申请实施例提供的一种数据处理装置的结构示意图。可以理解地,上述数据处理装置可以是应用于图1所示的终端设备(例如,终端设备10a)或者服务器(例如,服务器10d),该数据处理装置可以用于执行本申请实施例提供的方法中的相应步骤。如图14所示,该数据处理装置1可以包括:配置页面显示模块11、识别模板创建模块12和模板标识生成模块13,其中:
配置页面显示模块11,用于响应针对模板配置入口的触发操作,显示模板配置页面;
识别模板创建模块12,用于响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;文本识别模板包含编辑操作所指示的配置字段名;
模板标识生成模块13,用于为文本识别模板生成模板标识;模板标识用于调用业务服务对象对应的文本识别模板,以为业务服务对象提供结构化识别服务。
在一种可能的实施方式中,数据处理装置1还包括创建权限申请模块14,创建权限申请模块14用于:
接收业务服务对象对应的权限申请请求,获取权限申请请求携带的对象凭证;
若对象凭证指示业务服务对象满足权限激活条件,则确定业务服务对象具备模板创建权限,为业务服务对象显示模板配置入口。
在一种可能的实施方式中,配置页面显示模块11具体用于:
响应针对模板配置入口的触发操作,显示模板编辑页面;
响应模板编辑页面中的类型输入区域的编辑操作,根据类型输入区域中的编辑内容确定模板类型;
显示模板配置页面,在模板配置页面中显示与模板类型相匹配的初始识别模板。
在一种可能的实施方式中,配置页面显示模块11具体用于:
响应针对模板配置入口的触发操作,显示一个或者多个初始识别模板;
显示模板配置页面,在模板配置页面中显示,针对一个或者多个初始识别模板的模板选择操作所触发的初始识别模板。
在一种可能的实施方式中,配置页面显示模块11具体用于:
响应针对模板配置入口的触发操作,显示模板编辑页面;
响应模板编辑页面中的样图输入区域的样图添加操作,将样图输入区域中的输入图像确定为样本配置图像;
显示模板配置页面,在模板配置页面中显示与初始识别模板相匹配的样本配置图像的字段识别结果。
在一种可能的实施方式中,字段识别结果包括第一识别结果和第二识别结果,配置页面显示模块11具体用于:
根据初始识别模板,对样本配置图像进行文本识别,得到样本配置图像对应的字段名列表和字段值列表;
为字段名列表中所包含的字段名匹配第一配置字段名,为字段值列表中所包含的字段值匹配第二配置字段名;
将字段名列表和第一配置字段名确定为样本配置图像对应的第一识别结果,将字段值列表和第二配置字段名确定为样本配置图像对应的第二识别结果。
在一种可能的实施方式中,模板配置页面包括第一输入区域和第二输入区域,第一输入区域包括第一识别结果,第二输入区域包括第二识别结果;字段输入区域为第一输入区域和第二输入区域中的任意一个。
在一种可能的实施方式中,编辑操作包括子区域添加操作和文本输入操作;识别模板创建模块12具体用于:
响应针对模板配置页面中的字段输入区域的子区域添加操作,在字段输入区域中添加字段子区域;
响应针对字段子区域的文本输入操作,将字段子区域中的输入文本确定为扩充字段名;
将包含扩充字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。
在一种可能的实施方式中,模板配置页面中的字段输入区域包括多个字段子区域,每一个字段子区域中包含配置字段名,编辑操作包括子区域删除操作;识别模板创建模块12具体用于:
响应针对模板配置页面中的字段输入区域的子区域删除操作,在模板配置页面所显示的初始识别模板中,清除子区域删除操作对应的字段子区域中的配置字段名,得到业务服务对象对应的文本识别模板。
在一种可能的实施方式中,编辑操作包括字段名修改操作,初始识别模板中的字段输入区域包括多个字段子区域,每一个字段子区域中包含配置字段名,一个字段子区域对应一个激活控件,激活控件对应的激活状态包括开启状态和关闭状态;识别模板创建模块12具体用于:
响应针对模板配置页面中的字段输入区域的字段名修改操作,根据字段名修改操作所确定的文本内容,更新字段名修改操作所确定的字段子区域中的配置字段名;
将处于开启状态的激活控件对应的字段子区域确定为候选子区域,将包含候选子区域中的配置字段名的初始识别模板,确定为业务服务对象对应的文本识别模板。
在一种可能的实施方式中,数据处理装置1还包括模板标识发送模块15,模板标识发送模块15用于:
响应针对文本识别模板的确认操作,为文本识别模板生成模板标识,将文本识别模板添加至模板创建记录列表,在模板创建记录列表中为文本识别模板添加发布控件;
响应针对文本识别模板对应的发布控件的触发操作,将文本识别模板对应的发布状态从待发布状态切换显示为已发布状态;
将处于已发布状态的文本识别模板对应的模板标识,发送给业务服务对象。
在一种可能的实施方式中,模板标识发送模块15还用于:
获取文本识别模板对应的最大历史使用时间戳,根据最大历史使用时间戳确定文本识别模板对应的使用间隔时长;
若使用间隔时长大于间隔时长阈值,则在模板创建记录列表中删除文本识别模板。
在一种可能的实施方式中,数据处理装置1还包括结构化文本识别模块16,结构化文本识别模块16用于:
响应针对文本识别控件的触发操作,显示文本识别页面;文本识别页面包括图像区域和标识区域;
响应针对图像区域的图像添加操作,将图像添加操作所指示的图像确定为待识别图像;
响应针对标识区域的标识输入操作,在标识区域中显示模板标识;
响应针对待识别图像的文本识别操作,将模板标识传入文本识别接口,通过文本识别接口调用模板标识对应的文本识别模板;
根据文本识别模板对待识别图像进行文本识别,得到与文本识别模板中的配置字段名相匹配的结构化文本。
在一种可能的实施方式中,结构化文本识别模块16还用于:
响应针对文本识别页面中的模板修改控件的触发操作,显示文本识别模板对应的模板修改页面;
响应模板修改页面中的模板修改操作,将模板修改操作所确定的文本识别模板确定为文本更新模板,将业务服务对象对应的文本识别模板替换为文本更新模板。
在一种可能的实施方式中,结构化文本识别模块16还用于:
响应针对文本识别接口的代码导出操作,将文本识别接口关联的代码文件封装为文本识别开发包;
将文本识别开发包发送给业务服务对象对应的终端设备,以使终端设备根据文本识别开发包搭建业务服务对象对应的文本识别应用。
本申请实施例中,术语“模块”或“单元”是指有预定功能的计算机程序或计算机程序的一部分,并与其他相关部分一起工作以实现预定目标,并且可以通过使用软件、硬件(如处理电路或存储器)或其组合来全部或部分实现。同样的,一个处理器(或多个处理器或存储器)可以用来实现一个或多个模块或单元。此外,每个模块或单元都可以是包含该模块或单元功能的整体模块或单元的一部分。
根据本申请的一种实施例,前文图3、图5和图12所示数据处理方法所涉及的步骤可以由图14所示的数据处理装置1中的各个模块来执行。例如,图3所示的步骤S101可由图14所示的配置页面显示模块11来执行,图3所示的步骤S102可由图14所示的识别模板创建模块12来执行,图3所示的步骤S103可由图14所示的模板标识生成模块13来执行等。
根据本申请的一个实施例,图14所示的数据处理装置1中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的至少两个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由至少两个单元来实现,或者至少两个模块的功能由一个单元实现。在本申请的其它实施例中,数据处理装置1也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由至少两个单元协作实现。
本申请实施例中,通过响应针对模板配置入口的触发操作,可以显示模板配置页面;通过响应针对模板配置页面中的字段输入区域的编辑操作,可以创建业务服务对象对应的文本识别模板,为文本识别模板生成模板标识,将模板标识发送给业务服务对象,该模板标识可以用于调用业务服务对象对应的文本识别模板,为业务服务对象提供结构化识别服务。其中,文本识别模板可以包含模板配置页面中的字段输入区域的编辑操作所指示的配置字段名,也就是说,在本申请实施例中业务服务对象可以创建自己专属的文本识别模板,通过自己创建的文本识别模板,可以使得提取得到的结构化文本符合实际业务需求,进而有助于提升文本识别效果。
请参见图15,图15是本申请实施例提供的一种计算机设备的结构示意图。如图15所示,该计算机设备1000可以为终端设备,例如,上述图1所对应实施例中的终端设备10a,还可以为服务器,例如,上述图1所对应实施例中的服务器10d,这里将不对其进行限制。为便于理解,本申请以计算机设备为用户终端为例,该计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。可选的,网络接口1004可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器1005还可以是至少一个位于远离前述处理器1001的存储装置。如图15所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备管理应用程序。
在如图15所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
响应针对模板配置入口的触发操作,显示模板配置页面;
响应针对模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;文本识别模板包含编辑操作所指示的配置字段名;
为文本识别模板生成模板标识;模板标识用于调用业务服务对象对应的文本识别模板,以为业务服务对象提供结构化识别服务。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3、图5和图12任一个所对应实施例中对数据处理方法的描述,也可执行前文图14所对应实施例中对数据处理装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图3、图5和图12任一个所对应实施例中对数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行,分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链系统。
此外,需要说明的是:本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或者计算机程序可以包括计算机指令,该计算机指令可以存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器可以执行该计算机指令,使得该计算机设备执行前文图3、图5和图12任一个所对应实施例中对数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品或者计算机程序实施例中未披露的技术细节,请参照本申请方法实施例的描述。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(Random Access Memory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (19)
1.一种数据处理方法,其特征在于,包括:
响应针对模板配置入口的触发操作,显示模板配置页面;
响应针对所述模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;所述文本识别模板包含所述编辑操作所指示的配置字段名;
为所述文本识别模板生成模板标识;所述模板标识用于调用所述业务服务对象对应的文本识别模板,以为所述业务服务对象提供结构化识别服务。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述业务服务对象对应的权限申请请求,获取所述权限申请请求携带的对象凭证;
若所述对象凭证指示所述业务服务对象满足权限激活条件,则确定所述业务服务对象具备模板创建权限,为所述业务服务对象显示所述模板配置入口。
3.根据权利要求1所述的方法,其特征在于,所述响应针对模板配置入口的触发操作,显示模板配置页面,包括:
响应针对模板配置入口的触发操作,显示模板编辑页面;
响应所述模板编辑页面中的类型输入区域的编辑操作,根据所述类型输入区域中的编辑内容确定模板类型;
显示所述模板配置页面,在所述模板配置页面中显示与所述模板类型相匹配的初始识别模板。
4.根据权利要求1所述的方法,其特征在于,所述响应针对模板配置入口的触发操作,显示模板配置页面,包括:
响应针对模板配置入口的触发操作,显示一个或者多个初始识别模板;
显示所述模板配置页面,在所述模板配置页面中显示,针对所述一个或者多个初始识别模板的模板选择操作所触发的初始识别模板。
5.根据权利要求1所述的方法,其特征在于,所述响应针对模板配置入口的触发操作,显示模板配置页面,包括:
响应针对模板配置入口的触发操作,显示模板编辑页面;
响应所述模板编辑页面中的样图输入区域的样图添加操作,将所述样图输入区域中的输入图像确定为样本配置图像;
显示所述模板配置页面,在所述模板配置页面中显示与初始识别模板相匹配的所述样本配置图像的字段识别结果。
6.根据权利要求5所述的方法,其特征在于,所述字段识别结果包括第一识别结果和第二识别结果;
所述显示所述模板配置页面,在所述模板配置页面中显示初始识别模板相匹配的所述样本配置图像的字段识别结果,包括:
根据初始识别模板,对所述样本配置图像进行文本识别,得到所述样本配置图像对应的字段名列表和字段值列表;
为所述字段名列表中所包含的字段名匹配第一配置字段名,为所述字段值列表中所包含的字段值匹配第二配置字段名;
将所述字段名列表和所述第一配置字段名确定为所述样本配置图像对应的第一识别结果,将所述字段值列表和所述第二配置字段名确定为所述样本配置图像对应的第二识别结果。
7.根据权利要求6所述的方法,其特征在于,所述模板配置页面包括第一输入区域和第二输入区域,所述第一输入区域包括所述第一识别结果,所述第二输入区域包括所述第二识别结果;所述字段输入区域为所述第一输入区域和所述第二输入区域中的任意一个。
8.根据权利要求3至7任一项所述的方法,其特征在于,所述编辑操作包括子区域添加操作和文本输入操作;
所述响应针对所述模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板,包括:
响应针对所述模板配置页面中的字段输入区域的子区域添加操作,在所述字段输入区域中添加字段子区域;
响应针对所述字段子区域的文本输入操作,将所述字段子区域中的输入文本确定为扩充字段名;
将包含所述扩充字段名的初始识别模板,确定为所述业务服务对象对应的文本识别模板。
9.根据权利要求3至7任一项所述的方法,其特征在于,所述模板配置页面中的字段输入区域包括多个字段子区域,每一个字段子区域中包含配置字段名,所述编辑操作包括子区域删除操作;
所述响应针对所述模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板,包括:
响应针对所述模板配置页面中的字段输入区域的子区域删除操作,在所述模板配置页面所显示的初始识别模板中,清除所述子区域删除操作对应的字段子区域中的配置字段名,得到所述业务服务对象对应的文本识别模板。
10.根据权利要求3至7任一项所述的方法,其特征在于,所述编辑操作包括字段名修改操作,所述字段输入区域包括多个字段子区域,每一个字段子区域中包含配置字段名,一个字段子区域对应一个激活控件,激活控件对应的激活状态包括开启状态和关闭状态;
所述响应针对所述模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板,包括:
响应针对所述模板配置页面中的字段输入区域的字段名修改操作,根据所述字段名修改操作所确定的文本内容,更新所述字段名修改操作所确定的字段子区域中的配置字段名;
将处于开启状态的激活控件对应的字段子区域确定为候选子区域,将包含所述候选子区域中的配置字段名的初始识别模板,确定为所述业务服务对象对应的文本识别模板。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应针对所述文本识别模板的确认操作,为所述文本识别模板生成模板标识,将所述文本识别模板添加至模板创建记录列表,在所述模板创建记录列表中为所述文本识别模板添加发布控件;
响应针对所述文本识别模板对应的发布控件的触发操作,将所述文本识别模板对应的发布状态从待发布状态切换显示为已发布状态;
将处于已发布状态的文本识别模板对应的模板标识,发送给所述业务服务对象。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
获取所述文本识别模板对应的最大历史使用时间戳,根据所述最大历史使用时间戳确定所述文本识别模板对应的使用间隔时长;
若所述使用间隔时长大于间隔时长阈值,则在所述模板创建记录列表中删除所述文本识别模板。
13.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应针对文本识别控件的触发操作,显示文本识别页面;所述文本识别页面包括图像区域和标识区域;
响应针对所述图像区域的图像添加操作,将所述图像添加操作所指示的图像确定为待识别图像;
响应针对所述标识区域的标识输入操作,在所述标识区域中显示所述模板标识;
响应针对所述待识别图像的文本识别操作,将所述模板标识传入文本识别接口,通过所述文本识别接口调用所述模板标识对应的文本识别模板;
根据所述文本识别模板对所述待识别图像进行文本识别,得到与所述文本识别模板中的配置字段名相匹配的结构化文本。
14.根据权利要求13所述的方法,其特征在于,所述方法还包括:
响应针对所述文本识别页面中的模板修改控件的触发操作,显示所述文本识别模板对应的模板修改页面;
响应所述模板修改页面中的模板修改操作,将所述模板修改操作所确定的文本识别模板确定为文本更新模板,将所述业务服务对象对应的文本识别模板替换为所述文本更新模板。
15.根据权利要求13所述的方法,其特征在于,所述方法还包括:
响应针对文本识别接口的代码导出操作,将所述文本识别接口关联的代码文件封装为文本识别开发包;
将所述文本识别开发包发送给所述业务服务对象对应的终端设备,以使所述终端设备根据所述文本识别开发包搭建所述业务服务对象对应的文本识别应用。
16.一种数据处理装置,其特征在于,包括:
配置页面显示模块,用于响应针对模板配置入口的触发操作,显示模板配置页面;
识别模板创建模块,用于响应针对所述模板配置页面中的字段输入区域的编辑操作,创建业务服务对象对应的文本识别模板;所述文本识别模板包含所述编辑操作所指示的配置字段名;
模板标识生成模块,用于为所述文本识别模板生成模板标识;所述模板标识用于调用所述业务服务对象对应的文本识别模板,以为所述业务服务对象提供结构化识别服务。
17.一种计算机设备,其特征在于,包括存储器和处理器;
所述存储器与所述处理器相连,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行权利要求1至15任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1至15任一项所述的方法。
19.一种计算程序产品,其特征在于,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现权利要求1至15任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410141216.3A CN117669529B (zh) | 2024-02-01 | 2024-02-01 | 数据处理方法、装置、设备以及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410141216.3A CN117669529B (zh) | 2024-02-01 | 2024-02-01 | 数据处理方法、装置、设备以及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117669529A true CN117669529A (zh) | 2024-03-08 |
CN117669529B CN117669529B (zh) | 2024-04-30 |
Family
ID=90086657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410141216.3A Active CN117669529B (zh) | 2024-02-01 | 2024-02-01 | 数据处理方法、装置、设备以及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117669529B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080148153A1 (en) * | 2006-12-18 | 2008-06-19 | Samsung Electronics Co., Ltd. | System, method and medium organizing templates for generating moving images |
US20200104354A1 (en) * | 2018-10-01 | 2020-04-02 | Abbyy Production Llc | System and method of automatic template generation |
CN113485618A (zh) * | 2021-07-05 | 2021-10-08 | 上海商汤临港智能科技有限公司 | 自定义识别模板的生成方法、证件的识别方法以及装置 |
CN113487702A (zh) * | 2021-07-05 | 2021-10-08 | 上海商汤临港智能科技有限公司 | 一种模板生成、图片识别方法及装置 |
CN113723158A (zh) * | 2020-12-18 | 2021-11-30 | 北京沃东天骏信息技术有限公司 | 文本结构化识别方法、装置、电子设备和计算机可读介质 |
WO2022111591A1 (zh) * | 2020-11-26 | 2022-06-02 | 北京有竹居网络技术有限公司 | 页面生成方法和装置、存储介质和电子设备 |
CN114611481A (zh) * | 2022-03-18 | 2022-06-10 | 中国建设银行股份有限公司 | 模板的配置方法、装置、计算机设备、存储介质 |
US11481823B1 (en) * | 2021-10-27 | 2022-10-25 | Zaru, Inc. | Collaborative text detection and text recognition |
CN115588206A (zh) * | 2022-09-29 | 2023-01-10 | 浪潮软件股份有限公司 | 一种基于数据管理的自动模板文字识别实现系统及方法 |
CN115630636A (zh) * | 2022-10-25 | 2023-01-20 | 北京万合之众科技有限公司 | 文本识别方法及装置 |
US20230048495A1 (en) * | 2021-10-27 | 2023-02-16 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and platform of generating document, electronic device and storage medium |
CN116756711A (zh) * | 2022-03-04 | 2023-09-15 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备以及介质 |
CN116776302A (zh) * | 2022-03-07 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 业务模版编辑权限的配置方法和装置、存储介质及电子设备 |
CN117315705A (zh) * | 2023-10-10 | 2023-12-29 | 河北神玥软件科技股份有限公司 | 通用的卡证识别方法、装置、系统、电子设备及存储介质 |
-
2024
- 2024-02-01 CN CN202410141216.3A patent/CN117669529B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080148153A1 (en) * | 2006-12-18 | 2008-06-19 | Samsung Electronics Co., Ltd. | System, method and medium organizing templates for generating moving images |
US20200104354A1 (en) * | 2018-10-01 | 2020-04-02 | Abbyy Production Llc | System and method of automatic template generation |
WO2022111591A1 (zh) * | 2020-11-26 | 2022-06-02 | 北京有竹居网络技术有限公司 | 页面生成方法和装置、存储介质和电子设备 |
CN113723158A (zh) * | 2020-12-18 | 2021-11-30 | 北京沃东天骏信息技术有限公司 | 文本结构化识别方法、装置、电子设备和计算机可读介质 |
CN113485618A (zh) * | 2021-07-05 | 2021-10-08 | 上海商汤临港智能科技有限公司 | 自定义识别模板的生成方法、证件的识别方法以及装置 |
CN113487702A (zh) * | 2021-07-05 | 2021-10-08 | 上海商汤临港智能科技有限公司 | 一种模板生成、图片识别方法及装置 |
US20230048495A1 (en) * | 2021-10-27 | 2023-02-16 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and platform of generating document, electronic device and storage medium |
US11481823B1 (en) * | 2021-10-27 | 2022-10-25 | Zaru, Inc. | Collaborative text detection and text recognition |
CN116756711A (zh) * | 2022-03-04 | 2023-09-15 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备以及介质 |
CN116776302A (zh) * | 2022-03-07 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 业务模版编辑权限的配置方法和装置、存储介质及电子设备 |
CN114611481A (zh) * | 2022-03-18 | 2022-06-10 | 中国建设银行股份有限公司 | 模板的配置方法、装置、计算机设备、存储介质 |
CN115588206A (zh) * | 2022-09-29 | 2023-01-10 | 浪潮软件股份有限公司 | 一种基于数据管理的自动模板文字识别实现系统及方法 |
CN115630636A (zh) * | 2022-10-25 | 2023-01-20 | 北京万合之众科技有限公司 | 文本识别方法及装置 |
CN117315705A (zh) * | 2023-10-10 | 2023-12-29 | 河北神玥软件科技股份有限公司 | 通用的卡证识别方法、装置、系统、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
王琰洁 等: "基于页面模型的引擎式快速页面构造服务", 计算机系统应用, vol. 25, no. 10, 15 October 2016 (2016-10-15), pages 86 - 90 * |
Also Published As
Publication number | Publication date |
---|---|
CN117669529B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109684054B (zh) | 信息处理方法及装置、电子设备及存储器 | |
CN107450869B (zh) | 一种pdf电子发票版式文件的在线打印系统及方法 | |
EP1170673A1 (en) | Portal application | |
US20020174186A1 (en) | Electronic mail typestyle processing device | |
US6920410B2 (en) | Systems and methods for testing a network service | |
CN108132926A (zh) | 合同生成装置及系统 | |
CN104541262A (zh) | 用于富因特网应用的透明网络内适配的系统和方法 | |
US20080208964A1 (en) | Client-Server Information System and Method for Providing Graphical User Interface | |
WO2003094474A1 (en) | A communication system, mobile device therefor and methods of storing pages on a mobile device | |
JP5705804B2 (ja) | 移動端末でファイルを操作するための方法、システム、コンピュータプログラム、及びコンピュータ読取り可能な記憶媒体 | |
CN113064562A (zh) | 基于区块链的人机交互打印方法及打印系统 | |
JPH10124030A (ja) | ネットワーク環境におけるフォント処理装置および方法 | |
CN117669529B (zh) | 数据处理方法、装置、设备以及介质 | |
CN109669785A (zh) | 终端应用的页面分享方法、装置、服务器及存储介质 | |
CN111801696A (zh) | 支付页面管理方法、设备、支付系统以及存储介质 | |
CN112818270A (zh) | 数据跨域传递方法、装置及计算机设备 | |
CN114253441B (zh) | 目标功能的启用方法及装置、存储介质、电子装置 | |
JP4129466B2 (ja) | 定型文書提供システム及びサーバ | |
CN115776548A (zh) | 双录系统 | |
CN114489603A (zh) | 代码生成方法、装置、电子设备、介质和产品 | |
CN113934557A (zh) | 小程序与网页通信的方法、相关设备及系统 | |
CN112613932A (zh) | 开票方法、装置、存储介质及电子设备 | |
CN111833033B (zh) | 一种数字产品虚拟交易方法及系统 | |
KR102425978B1 (ko) | 클라우드 서비스 플랫폼에서 Composite 웹 UI 제공시스템 | |
WO2024066749A1 (zh) | 区块链的交易执行方法、装置、程序产品、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |