CN113449829A - 基于光学字符识别技术的数据传输方法及相关装置 - Google Patents

基于光学字符识别技术的数据传输方法及相关装置 Download PDF

Info

Publication number
CN113449829A
CN113449829A CN202110716023.2A CN202110716023A CN113449829A CN 113449829 A CN113449829 A CN 113449829A CN 202110716023 A CN202110716023 A CN 202110716023A CN 113449829 A CN113449829 A CN 113449829A
Authority
CN
China
Prior art keywords
data
target
information
target user
optical character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110716023.2A
Other languages
English (en)
Inventor
李希加
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weikun Shanghai Technology Service Co Ltd
Original Assignee
Weikun Shanghai Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weikun Shanghai Technology Service Co Ltd filed Critical Weikun Shanghai Technology Service Co Ltd
Priority to CN202110716023.2A priority Critical patent/CN113449829A/zh
Publication of CN113449829A publication Critical patent/CN113449829A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0022Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisious for transferring data to distant stations, e.g. from a sensing device

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及一种基于光学字符识别技术的数据传输方法及相关装置,其中方法包括:从目标用户的本地服务器接收第一数据的获取请求,所述获取请求用于指示将所述第一数据传输给所述本地服务器;获取所述目标用户的身份信息;基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限;若确定所述目标用户具有所述第一数据的处理权限,则基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据;将所述第二数据发送给所述本地服务器。采用本申请,可提高数据传输的安全性和便利性。

Description

基于光学字符识别技术的数据传输方法及相关装置
技术领域
本申请涉及数据处理技术领域,主要涉及了一种基于光学字符识别技术的数据传输方法及相关装置。
背景技术
在公司运营过程中,通常存在多个网络环境,且数据无法直接互通。如果需要从一个网络环境中获取数据,并导入到另一个网络环境中,通常有以下两种方式。第一种是开墙实现系统之间的互联互通,易造成信息泄露,数据的安全性低。第二种是采用手工方式,即人工在两个网络环境之间做数据传递的工作,操作的便利性不足。
发明内容
本申请实施例提供了一种基于光学字符识别技术的数据传输方法及相关装置,可提高数据传输的安全性和便利性。
第一方面,本申请实施例提供一种基于光学字符识别技术的数据传输方法,其中:
从目标用户的本地服务器接收第一数据的获取请求,其中,所述获取请求用于指示将所述第一数据传输给所述本地服务器;
获取所述目标用户的身份信息;
基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限;
若确定所述目标用户具有所述第一数据的处理权限,则基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据;
将所述第二数据发送给所述本地服务器。
第二方面,本申请实施例提供一种基于光学字符识别技术的数据传输装置,其中:
通信单元,用于从目标用户的本地服务器接收第一数据的获取请求,其中,所述获取请求用于指示将所述第一数据传输给所述本地服务器;
处理单元,用于获取所述目标用户的身份信息;基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限;若确定所述目标用户具有所述第一数据的处理权限,则基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据;
所述通信单元,还用于将所述第二数据发送给所述本地服务器。
第三方面,本申请实施例提供一种计算机设备,包括处理器、存储器、通信接口以及一个或至少一个程序,其中,上述一个或至少一个程序被存储在上述存储器中,并且被配置由上述处理器执行,所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行以实现如第一方面中所描述的部分或全部步骤。
实施本申请实施例,将具有如下有益效果:
采用了上述的基于光学字符识别技术的数据传输方法及相关装置之后,若从目标用户的本地服务器接收到第一数据的获取请求,则先获取目标用户的身份信息。再基于目标用户的身份信息确定目标用户是否具有第一数据的处理权限。若是,则基于预设OCR模型和目标标签对第一数据对应的目标图像进行识别,得到包括第一数据和目标标签的第二数据。然后将第二数据发送给本地服务器,以实现数据传输。如此,提高了数据传输的安全性和便利性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为应用于本申请实施例提供的一种基于光学字符识别技术的数据传输方法的系统构架图;
图2为本申请实施例提供的一种基于光学字符识别技术的数据传输方法的流程示意图;
图3为本申请实施例提供的一种基于光学字符识别技术的数据传输装置的结构示意图;
图4为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
请参照图1,图1为应用于本申请实施例提供的一种数据传输方法的系统构架图。如图1所示,该系统可包括电子设备101、与电子设备101连接的本地服务器111、以及与电子设备101和本地服务器111连接的目标服务器112。
在本申请实施例中,电子设备101可以是个人计算机(personal computer,PC)、笔记本电脑、手机、一体机、掌上电脑、平板电脑(pad)、智能电视播放终端、车载终端或便捷式设备等。在图1中,电子设备101以手机进行描述。
本申请实施例对于本地服务器111和目标服务器112的数量不做限定。本地服务器111可为一个或多个电子设备101提供服务。目标服务器112可为一个或多个电子设备101,或者可以为一个或多个本地服务器111提供服务。本地服务器111和目标服务器112均可以用独立的服务器或者多个服务器组成的服务器集群来实现。目标服务器112可以是任一与本地服务器111所处的网络不同的服务器。在图1中,目标服务器112以云服务器进行描述。
本地服务器111和目标服务器112均用于为电子设备101提供服务。本地服务器111和目标服务器112为电子设备101提供的服务可包括即时聊天业务、转账业务、审批业务、打卡业务、客服业务等各项功能或应用对应的服务,在此不做限定。
需要说明的是,本地服务器111提供的服务包括电子设备101中可直接使用的数据服务。也就是说,该服务所涉及的数据可直接用于电子设备101的其他应用中。而目标服务器112为电子设备101提供的服务,仅在该目标服务器112的网络中才能进行使用。也就是说,其他的网络,例如,本地服务器111对应的网络中无法使用该服务对应的数据。且目标服务器112不支持硬盘、U盘等外接的存储设备连接,或者支持外接的存储设备连接,但该存储设备只允许数据接收,而不允许数据发送。可以理解为用户在登录目标服务器112时,用户所使用的电子设备101连接的外部的存储设备,不能转存该电子设备101中的数据,或者说不能转存该电子设备101处于目标服务器112提供的网络中的数据。
本申请实施例提出的一种基于光学字符识别技术的数据传输方法,该方法可以由基于光学字符识别技术的数据传输装置或计算机设备执行。该装置或设备可由软件和/或硬件实现,一般可集成在目标服务器中,可提高数据传输的安全性和便利性。
请参照图2,图2是本申请提供的一种基于光学字符识别技术的数据传输方法的流程示意图。以该方法应用在目标服务器为例进行举例说明,包括如下步骤S201~S205,其中:
S201:目标服务器从目标用户的本地服务器接收第一数据的获取请求。
在本申请实施例中,第一数据可以是数字、文字、链接、图像等。本申请对于第一数据的数据类型和数量不做限定。获取请求用于指示将目标服务器中的第一数据传输给目标用户的本地服务器。获取请求可包含目标用户的标识信息和第一数据在目标服务器中的位置信息等,在此不做限定。
其中,目标用户可以为接收第一数据的用户。该目标用户可以是发送获取请求的用户,还可以是与目标服务器不同的另一网络对应的服务器中需要处理第一数据的用户。目标用户的标识信息可以为目标用户的电话号码、电子邮箱、应用账号、工号等中的一项或多项组成的字符串,在此不做限定。位置信息可以为第一数据对应的网络地址,还可以为第一数据对应的网页中相对位置等,在此不做限定。
获取请求可以由目标用户通过本地服务器设置的配置信息得到。该配置信息可以包括第一数据的名称和位置信息,以及目标用户的身份信息。该获取请求还可以根据目标报告的上报请求而触发的。第一数据可以为目标报告中呈现的数据,还可以为呈现数据所需要的上游数据,即生成目标报告中的数据所需要的数据。该上报请求可以是预设的指定时间(例如,每天下班的时刻、每个月的最后一天、每个季度的最后一天等)到达时触发执行的,还可以是目标用户(例如,目标报告对应内容的管理者等)发送的,在此不做限定。
本申请实施例对于目标报告不做限定,可以是任一形式的报告。例如,数据表格、折线图、柱状图等。目标报告可广泛应用于各种应用场景,例如,金融场景、互联网场景、物流场景等。比如,金融场景下的支付业务、退款业务、转账业务等,通过目标报告可对业务数据进行分析。
在一种可能的示例中,在步骤S201之前,还包括:本地服务器接收到目标报告的上报请求;本地服务器基于上报请求确定目标报告对应的第一数据;若第一数据存储于目标服务器的网络中,则本地服务器生成第一数据的获取请求。
可以理解,目标服务器的网络中的数据不能直接传输给本地服务器。因此,在确定生成目标报告的第一数据存储于目标服务器的网络中之后,生成第一数据的获取请求,以将目标服务器将第一数据发送给本地服务器。
需要说明的是,在一种可能的示例中,在步骤S205之后,还包括:本地服务器基于第二数据和从其他服务器获取的第三数据生成目标报告。
在本申请实施例中,第二数据为目标服务器传输给本地服务器的数据。第二数据可包括第一数据和目标标签,可以理解为处理得到的第一数据。第三数据为其他服务器传输的数据。可以理解,在本地服务器获取包含第一数据的第二数据之后,可基于第二数据和从其他服务器获取的第三数据生成目标报告。
S202:目标服务器获取目标用户的身份信息。
S203:目标服务器基于身份信息确定目标用户是否具有第一数据的处理权限。
在本申请实施例中,目标用户的身份信息可以包括目标用户的姓名、年龄、性别、身份证号码、工号等标识信息。还可包括目标用户的其他信息,例如,学历、工作经历、健康情况等信息。
目标用户的身份信息可以通过图像拾取器获取。也就是说,先获取目标用户的采集图像(可以为人脸图像、指纹图像等)。再从预先存储的图像库中查找与采集图像匹配的参考图像,将预先存储的参考图像的身份信息作为目标用户的身份信息。目标用户的身份信息或者可以通过声音拾取器获取。也就是说,先获取目标用户的采集声音,再确定采集声音的声音特征。再从预先存储的声音特征库中查找与声音特征匹配的参考声音特征,将预先存储的参考声音特征的身份信息作为目标用户的身份信息。目标用户的身份信息或者可以通过目标用户在本地服务器中的登录信息进行获取。也就是说,根据目标用户的登录信息中的身份相关的信息,例如,电话号码、账号等,获取目标用户的身份信息。
当目标用户具有第一数据的处理权限时,表示允许将第一数据发送给目标用户的本地服务器。本申请对于确定目标用户是否具有第一数据的处理权限的方法不做限定,可以由目标服务器预先存储各个用户的处理权限,从而基于目标用户的处理权限是否包含第一数据的处理权限。若包含,则确定目标用户具有第一数据的处理权限。
在一种可能的示例中,步骤S203包括以下步骤A1和步骤A2,其中:
A1:基于身份信息获取目标用户的职位信息和\或工作信息。
在本申请实施例中,职位信息包括目标用户的职级、部门、小组等内容。工作信息包括目标用户负责的案件、项目、工作计划等内容。若身份信息包含目标用户的职位信息和工作信息,则可直接获取该职位信息和/或工作信息。否则,基于身份信息去查找目标用户的信息,例如,工作日志、移动轨迹等。如此,基于以上查找到的目标用户的信息去推断目标用户的职位信息和/或工作信息。此外,还可结合身份信息中的年龄、学历、工作经历去确定目标用户的职位信息和/或工作信息。
A2:基于职位信息和\或工作信息确定目标用户是否具有第一数据的处理权限。
可以理解,基于目标用户的职位信息和\或工作信息可以确定目标用户在工作中可能涉及的数据是否包含第一数据,从而确定目标用户是否具有第一数据的处理权限,可提高确定目标用户是否具体第一数据的处理权限的准确率。
在一种可能的示例中,步骤A2包括以下步骤A21~A24,其中:
A21:基于职位信息获取目标用户处理第一数据的概率。
在本申请实施例中,概率用于描述目标用户处理(例如,查看、编辑等)的可能性。该概率可以通过职位信息的职位等级和第一数据的处理等级之间的匹配值进行确定。可以理解,职位等级越低,处理的数据越琐碎,数据的处理等级越低,且无法处理等级高的数据。因此,基于职位信息的职位等级和第一数据的处理等级之间的匹配值获取目标用户处理第一数据的概率,可提高获取概率的准确率。
A22:获取工作信息和第一数据之间的关联值。
在本申请实施例中,关联值用于描述目标用户的工作中涉及的数据与第一数据之间的关联性。可通过工作信息确定目标用户处理第一数据或与第一数据同一个数据类型的数据的比例,再基于该比例获取工作信息和第一数据之间的关联值。可以理解,若比例较大,则表示目标用户处理第一数据或与第一数据同一个数据类型的数据是大概率发生的事件,目标用户的工作信息与第一数据具有强关联性。因此,基于上述的比例获取工作信息和第一数据之间的关联值,可提高获取关联值的准确率。
该关联性还可通过工作信息和与目标服务器之间的数据交互频率进行获取。可以理解,若数据交互频率越大,则表示目标用户处理的数据大多来自目标服务器,目标用户的工作信息与第一数据具有强关联性。因此,基于工作信息和与目标服务器之间的数据交互频率获取工作信息和第一数据之间的关联值,可提高获取关联值的准确率。
需要说明的是,本申请对于步骤A21和步骤A22的执行顺序不做限定,可以先执行步骤A21,再执行步骤A22。或者可以先执行步骤A22,再执行步骤A21。或者可以同时执行步骤A21和步骤A22.
A23:基于概率和关联值确定目标用户的用户评价值。
本申请对于用户评价值的确定方法不做限定,可以获取概率和关联值之间的乘积,或者概率和关联值之间的加权平均值等。其中,概率和关联值分别对应的预设权值,可以为指定数值,例如,0.5和0.5等。该预设权值还可根据电子设备或目标服务器进行计算得到等,在此不做限定。
A24:若用户评价值大于预设阈值,则确定目标用户具有第一数据的处理权限。
本申请对于预设阈值不做限定,可以基于第一数据是否为隐私数据或目标服务器的安全等级进行确定等。其中,隐私数据可以为用户的隐私数据,或者可以为目标服务器的隐私数据。隐私数据可以理解为不适合传输给其他用户或其他服务器的数据。可以理解,隐私数据对于安全性的要求高。基于第一数据是否为隐私数据确定预设阈值,可提高确定目标用户是否具有第一数据的处理权限的准确率。
目标服务器的安全等级可以通过目标服务器当前的网络状态,和/或第一数据对应的应用是否有安全需求进行确定。可以理解,网络状态差,网络安全难以保证。若第一数据对应的应用有安全需求,则表示需要该应用进行安全保护。如此,基于目标服务器当前的网络状态,和/或第一数据对应的应用是否有安全需求确定目标服务器的安全等级,再基于该安全等级确定预设阈值,可提高确定目标用户是否具有第一数据的处理权限的准确率。
可以理解,在步骤A21~A24中,基于职位信息获取的目标用户处理第一数据的概率,以及工作信息和第一数据之间的关联值,确定目标用户的用户评价值。再基于用户评价值和预设阈值之间的大小关系确定目标用户是否具有第一数据的处理权限,可提高确定目标用户是否具体第一数据的处理权限的准确率。
若确定目标用户具有第一数据的处理权限,则执行步骤S204:目标服务器基于预设光学字符识别模型对第一数据对应的目标图像进行识别,得到第二数据。
在本申请实施例中,预设光学字符识别(Optical Character Recognition,OCR)模型是基于OCR技术的模型。OCR技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状。然后用字符识别方法将形状翻译成计算机文字的过程。即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。可以理解,两个不能直接数据互通的网络中,从而基于OCR技术对应的预设光学字符识别模型可以将第一数据对应的目标图像进行文字转换,得到第一数据,提高了数据传输的便利性。
本申请对于预设OCR模型不做限定,在一种可能的示例中,在步骤S204之前,还包括以下步骤B1~B3,其中:
B1:确定第一数据的目标数据类型和目标服务器的网络配置信息。
在本申请实施例中,第一数据的目标数据类型可以为第一数据的数据名称,还可以是数字、文字、链接、图像等。或者可以进一步细分,例如,数字可能包括金额、年龄、统计值等。或者可以是第一数据对应的领域或功能,例如,金融、互联网、物流等。或者可以包括英文、中文、特殊字符等文字类型,在此不做限定。可以理解,基于第一数据的目标数据类型确定参考OCR模型的模型评价值,可以提高选取预设OCR模型的准确率,便于提高获取第一数据的准确率和效率。
B2:基于目标数据类型和网络配置信息确定参考OCR模型的模型评价值。
在本申请实施例中,目标服务器的网络配置信息可以理解为目标服务器的网络对于OCR技术的限制条件或支持范围。可以理解,基于目标服务器的网络配置信息确定参考OCR模型的评价值,可以提高选取预设OCR模型的准确率,便于提高获取第一数据的准确率和效率。
本申请对于模型评价值的确定方法不做限定,在一种可能的示例中,步骤B2可包括以下步骤B21~B24,其中:
B21:确定参考OCR模型的处理数据类型。
在本申请实施例中,处理数据类型是指参考OCR模型能进行处理或擅长处理的数据类型。可以基于参考OCR模型的标签信息进行确定,或者可以基于参考OCR模型的组成信息进行确定等,在此不做限定。
B22:获取目标数据类型和处理数据类型之间的第一匹配值。
在本申请实施例中,第一匹配值用于描述第一数据的数据类型和参考OCR模型的处理数据类型之间的相似程度。可以理解,第一匹配值越大,采用参考OCR模型获取数据的成功率越大。
B23:获取网络配置信息和本地服务器的网络信息之间的第二匹配值。
在本申请实施例中,第二匹配值用于描述目标服务器的网络和本地服务器的网络进行数据传输的成功率。可以理解,第二匹配值越大,采用参考OCR模型获取数据的成功率越大。
B24:基于第一匹配值和第二匹配值获取参考OCR模型的模型评价值。
在本申请实施例中,模型评价值可以为第一匹配值和第二匹配值之间的最小值、最大值、平均值或加权平均值等,在此不做限定。第一匹配值和第二匹配值分别对应的预设权值,可以为指定数值,例如,0.5和0.5等。该预设权值还可根据电子设备或目标服务器进行计算得到等,在此不做限定。
可以理解,在步骤B21~B24中,基于目标数据类型和参考OCR模型的处理数据类型之间的第一匹配值,以及网络配置信息和本地服务器的网络信息之间的第二匹配值,获取参考OCR模型的模型评价值,可提高选取的预设OCR模型获取数据的成功率。
B3:基于模型评价值从参考OCR模型中选取预设OCR模型。
本申请对于模型评价值选取预设OCR模型的方法不做限定,可以选取最大的模型评价值对应的参考OCR模型,还可以选取大于阈值A的模型评价值对应的参考OCR模型作为预设OCR模型等。其中,阈值A可以为任一指定数值,或者可以为模型评价值的平均值,或者根据参考OCR模型的数量进行确定的数量等,在此不做限定。
若选取的参考OCR模型的数量大于或等于2个,则预设OCR模型可以为参考OCR模型组成的OCR模型。还可以先确定参考OCR模型的优先级,基于优先级和目标标签对第一数据对应的目标图像进行处理。若处理成功,则结束优先级在后的参考OCR模型的识别步骤。若处理失败或处理不完全,则由优先级在后的参考OCR模型执行识别步骤。
在本申请实施例中,第二数据包括第一数据和目标标签。目标标签可以包括目标服务器的标识,例如,名称、网络地址等。如此,第二数据携带了目标服务器的信息,以避免其他服务器直接使用第一数据。目标标签还可以包括获取请求的信息或者目标用户的信息,从而保证该第二数据是本次使用的数据,可避免下次被其他服务器使用。
本申请对于目标标签不做限定,在一种可能的示例中,在步骤S204之前,还包括以下步骤:获取目标服务器的基本信息;基于基本信息和身份信息生成目标标签。
其中,目标服务器的基本信息可以包括目标服务器的网络配置信息、服务器名称、服务器版本等信息。
可以理解,基于目标服务器的基本信息和目标用户的身份信息生成目标标签,以使目标标签中携带目标服务器和目标用户的信息。如此,在基于目标标签和预设OCR模型获取第一数据对应的第二数据之后,可避免被其他服务器使用,提高了第二数据的安全性。
本申请对于获取第二数据的方法不做限定,在一种可能的示例中,基于预设光学字符识别模型对第一数据对应的目标图像进行识别,得到第二数据包括以下步骤C1~C3,其中:
C1:确定第一数据对应的目标图像的目标位置。
在本申请实施例,目标图像的目标位置可以是第一数据所在目标服务器中的相对位置,或者可以是绝对位置。
C2:基于预设OCR模型和目标位置对目标图像进行识别,得到目标图像对应的第一数据。
在本申请实施例,预设OCR模型可用于将图像进行文字转换。可以理解,在基于预设OCR模型将目标位置的目标图像进行识别之后,可获取目标图像对应的第一数据。
C3:基于第一数据和目标标签获取第二数据。
在本申请实施例,第二数据可以为图像,图像中的第一数据可编辑,图像中可携带目标标签的水印。第二数据可以为文字,例如,第二数据为第一数据中夹杂着目标标签的数据。第二数据还可以为需验证的文件,例如,在点击第二数据时,需输入验证信息(例如,目标标签)。若验证成功,则显示第一数据。
在一种可能的示例中,步骤C3包括以下步骤C31~C33,其中:
C31:对第一数据和目标标签进行二进制转换,得到第一信息。
在本申请实施例中,二进制转换可基于美国信息交换标准代码(AmericanStandard Code for Information Interchange,ASCII)技术。ASCII是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。ASCII总共有128个,用一个字节的低7位表示,其中,0~31是控制字符如换行回车删除等,32~126是打印字符。
在进行二进制转换之前,可以将第一数据和目标标签进行组合。第一数据可以位于目标标签的前面,也可以位于目标标签的后面,在此不做限定。
C32:对第一信息进行加密处理,得到第二信息。
本申请对于加密处理的方法不做限定,可以采用加密(Encrypt)算法或哈希(Hash)算法。其中,哈希算法是将目标文本转换成具有相同长度的、不可逆的杂凑字符串(或叫做消息摘要)。而加密算法是将目标文本转换成具有不同长度的、可逆的密文。
C33:对第二信息进行字符转换,得到第二数据。
在本申请实施例中,字符转换可基于base64技术。base64是网络上最常见的用于传输8Bit字节码的编码方式之一,可用于在HTTP环境下传递较长的标识信息。具体可根据一系列以编号排定的文件(Request For Comments,RFC)中多用途的网际邮件扩充协议(Multipurpose Internet Mail Extensions,MIME)的详细规范进行转换以得到字符串。
可以理解,在步骤C31~C33中,对第一数据和目标标签对应的二进制信息进行加密处理。再将加密处理得到的信息进行字符转换,得到第二数据。也就是说,对第一数据和目标标签对应的数据进行加密,可进一步提高传输数据的安全性。
在步骤C1~C3中,基于预设OCR模型和第一数据对应的目标图像的目标位置对目标图像进行识别,可提高获取数据的准确率。再基于目标标签和第一数据获取第二数据,以使本地服务器存储的第二数据包括第一数据和目标标签,可提高第一数据传输的安全性。
S205:目标服务器将第二数据发送给本地服务器。
在图2所示的方法中,若从目标用户的本地服务器接收到第一数据的获取请求,则先获取目标用户的身份信息。再基于目标用户的身份信息确定目标用户是否具有第一数据的处理权限。若是,则基于预设OCR模型和目标标签对第一数据对应的目标图像进行识别,得到包括第一数据和目标标签的第二数据。然后将第二数据发送给本地服务器,以实现数据传输。如此,提高了数据传输的安全性和便利性。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
与图2所示的实施例一致,请参照图3,图3是本申请提出的一种基于光学字符识别技术的数据传输装置的结构示意图,如图3所示,上述装置300包括:
通信单元302用于从目标用户的本地服务器接收第一数据的获取请求,其中,所述获取请求用于指示将所述第一数据传输给所述本地服务器;
处理单元301用于获取所述目标用户的身份信息;基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限;若确定所述目标用户具有所述第一数据的处理权限,则基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据;
所述通信单元302还用于将所述第二数据发送给所述本地服务器。
在一个可能的示例中,所述处理单元301具体用于基于所述身份信息获取所述目标用户的职位信息和\或工作信息;基于所述职位信息和\或所述工作信息确定所述目标用户是否具有所述第一数据的处理权限。
在一个可能的示例中,所述处理单元301具体用于基于所述职位信息获取所述目标用户处理所述第一数据的概率;获取所述工作信息和所述第一数据之间的关联值;基于所述概率和所述关联值确定所述目标用户的用户评价值;若所述用户评价值大于预设阈值,则确定所述目标用户具有所述第一数据的处理权限。
在一个可能的示例中,所述处理单元301具体用于确定所述第一数据对应的目标图像的目标位置;基于所述预设光学字符识别模型和所述目标位置对所述目标图像进行识别,得到所述目标图像对应的第一数据;基于所述第一数据和目标标签获取第二数据。
在一个可能的示例中,所述处理单元301具体用于对所述第一数据和所述目标标签进行二进制转换,得到第一信息;对所述第一信息进行加密处理,得到第二信息;对所述第二信息进行字符转换,得到第二数据。
在一个可能的示例中,所述处理单元301还用于确定所述第一数据的目标数据类型和所述目标服务器的网络配置信息;基于所述目标数据类型和所述网络配置信息确定参考光学字符识别模型的模型评价值;基于所述模型评价值从所述参考光学字符识别模型中选取所述预设光学字符识别模型。
在一个可能的示例中,所述处理单元301具体用于确定参考光学字符识别模型的处理数据类型;获取所述目标数据类型和所述处理数据类型之间的第一匹配值;获取所述网络配置信息和所述本地服务器的网络信息之间的第二匹配值;基于所述第一匹配值和所述第二匹配值获取所述参考光学字符识别模型的模型评价值。
基于光学字符识别技术的数据传输装置300中各个单元执行详细过程可以参见前述方法实施例中的执行步骤,此处不在赘述。
与图2所示的实施例一致,请参照图4,图4是本申请实施例提供的一种计算机设备的结构示意图。如图4所示,该计算机设备400包括处理器410、存储器420、通信接口430以及一个或多个程序440。处理器410、存储器420和通信接口430之间通过总线450互相连接。图3所示的通信单元302所实现的相关功能可通过通信接口430来实现,图3所示的处理单元301所实现的相关功能可通过处理器410来实现。
上述一个或多个程序440被存储在上述存储器420中,并且被配置由上述处理器410执行,上述程序440包括用于执行以下步骤的指令:
从目标用户的本地服务器接收第一数据的获取请求,其中,所述获取请求用于指示将所述第一数据传输给所述本地服务器;
获取所述目标用户的身份信息;
基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限;
若确定所述目标用户具有所述第一数据的处理权限,则基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据;
将所述第二数据发送给所述本地服务器。
在一个可能的示例中,在所述基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限方面,所述程序440具体用于执行以下步骤的指令:
基于所述身份信息获取所述目标用户的职位信息和\或工作信息;
基于所述职位信息和\或所述工作信息确定所述目标用户是否具有所述第一数据的处理权限。
在一个可能的示例中,在所述基于所述职位信息和\或所述工作信息确定所述目标用户是否具有所述第一数据的处理权限方面,所述程序440具体用于执行以下步骤的指令:
基于所述职位信息获取所述目标用户处理所述第一数据的概率;
获取所述工作信息和所述第一数据之间的关联值;
基于所述概率和所述关联值确定所述目标用户的用户评价值;
若所述用户评价值大于预设阈值,则确定所述目标用户具有所述第一数据的处理权限。
在一个可能的示例中,在所述基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据方面,所述程序440具体用于执行以下步骤的指令:
确定所述第一数据对应的目标图像的目标位置;
基于所述预设光学字符识别模型和所述目标位置对所述目标图像进行识别,得到所述目标图像对应的第一数据;
基于所述第一数据和目标标签获取第二数据。
在一个可能的示例中,在所述基于所述第一数据和目标标签获取第二数据方面,所述程序440具体用于执行以下步骤的指令:
对所述第一数据和所述目标标签进行二进制转换,得到第一信息;
对所述第一信息进行加密处理,得到第二信息;
对所述第二信息进行字符转换,得到第二数据。
在一个可能的示例中,在所述基于预设光学字符识别模型对所述第一数据对应的目标图像进行识别之前,所述程序440还用于执行以下步骤的指令:
确定所述第一数据的目标数据类型和所述目标服务器的网络配置信息;
基于所述目标数据类型和所述网络配置信息确定参考光学字符识别模型的模型评价值;
基于所述模型评价值从所述参考光学字符识别模型中选取所述预设光学字符识别模型。
在一个可能的示例中,在所述基于所述目标数据类型和所述网络配置信息确定参考光学字符识别模型的模型评价值方面,所述程序440具体用于执行以下步骤的指令:
确定参考光学字符识别模型的处理数据类型;
获取所述目标数据类型和所述处理数据类型之间的第一匹配值;
获取所述网络配置信息和所述本地服务器的网络信息之间的第二匹配值;
基于所述第一匹配值和所述第二匹配值获取所述参考光学字符识别模型的模型评价值。
本申请实施例还提供一种计算机存储介质,其中,计算机存储介质存储用于存储计算机程序。计算机程序使得计算机执行以实现方法实施例中记载的任一方法的部分或全部步骤。计算机包括电子设备、本地服务器和目标服务器。
本申请实施例还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质。计算机程序可操作来使计算机执行以实现方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,计算机包括电子设备、本地服务器和目标服务器。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模式并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如至少一个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到至少一个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模式的形式实现。
集成的单元如果以软件程序模式的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。根据这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random accessmemory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种基于光学字符识别技术的数据传输方法,其特征在于,所述方法适用于目标服务器,所述方法包括:
从目标用户的本地服务器接收第一数据的获取请求,其中,所述获取请求用于指示将所述第一数据传输给所述本地服务器;
获取所述目标用户的身份信息;
基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限;
若确定所述目标用户具有所述第一数据的处理权限,则基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据;
将所述第二数据发送给所述本地服务器。
2.根据权利要求1所述的方法,其特征在于,所述基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限,包括:
基于所述身份信息获取所述目标用户的职位信息和\或工作信息;
基于所述职位信息和\或所述工作信息确定所述目标用户是否具有所述第一数据的处理权限。
3.根据权利要求2所述的方法,其特征在于,所述基于所述职位信息和\或所述工作信息确定所述目标用户是否具有所述第一数据的处理权限,包括:
基于所述职位信息获取所述目标用户处理所述第一数据的概率;
获取所述工作信息和所述第一数据之间的关联值;
基于所述概率和所述关联值确定所述目标用户的用户评价值;
若所述用户评价值大于预设阈值,则确定所述目标用户具有所述第一数据的处理权限。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据,包括:
确定所述第一数据对应的目标图像的目标位置;
基于所述预设光学字符识别模型和所述目标位置对所述目标图像进行识别,得到所述目标图像对应的第一数据;
基于所述第一数据和目标标签获取第二数据。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一数据和目标标签获取第二数据,包括:
对所述第一数据和所述目标标签进行二进制转换,得到第一信息;
对所述第一信息进行加密处理,得到第二信息;
对所述第二信息进行字符转换,得到第二数据。
6.根据权利要求1-3中任一项所述的方法,其特征在于,在所述基于预设光学字符识别模型对所述第一数据对应的目标图像进行识别之前,所述方法还包括:
确定所述第一数据的目标数据类型和所述目标服务器的网络配置信息;
基于所述目标数据类型和所述网络配置信息确定参考光学字符识别模型的模型评价值;
基于所述模型评价值从所述参考光学字符识别模型中选取所述预设光学字符识别模型。
7.根据权利要求6所述的方法,其特征在于,所述基于所述目标数据类型和所述网络配置信息确定参考光学字符识别模型的模型评价值,包括:
确定参考光学字符识别模型的处理数据类型;
获取所述目标数据类型和所述处理数据类型之间的第一匹配值;
获取所述网络配置信息和所述本地服务器的网络信息之间的第二匹配值;
基于所述第一匹配值和所述第二匹配值获取所述参考光学字符识别模型的模型评价值。
8.一种基于光学字符识别技术的数据传输装置,其特征在于,包括:
通信单元,用于从目标用户的本地服务器接收第一数据的获取请求,其中,所述获取请求用于指示将所述第一数据传输给所述目标用户的本地服务器;
处理单元,用于获取所述目标用户的身份信息;基于所述身份信息确定所述目标用户是否具有所述第一数据的处理权限;若确定所述目标用户具有所述第一数据的处理权限,则基于预设光学字符识别模型和目标标签对所述第一数据对应的目标图像进行处理,得到第二数据;
所述通信单元,还用于将所述第二数据发送给所述本地服务器。
9.一种计算机设备,其特征在于,包括处理器、存储器、通信接口以及一个或至少一个程序,其中,所述一个或至少一个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行权利要求1-7任一项方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序使得计算机执行以实现权利要求1-7任一项所述的方法。
CN202110716023.2A 2021-06-25 2021-06-25 基于光学字符识别技术的数据传输方法及相关装置 Pending CN113449829A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110716023.2A CN113449829A (zh) 2021-06-25 2021-06-25 基于光学字符识别技术的数据传输方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110716023.2A CN113449829A (zh) 2021-06-25 2021-06-25 基于光学字符识别技术的数据传输方法及相关装置

Publications (1)

Publication Number Publication Date
CN113449829A true CN113449829A (zh) 2021-09-28

Family

ID=77813041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110716023.2A Pending CN113449829A (zh) 2021-06-25 2021-06-25 基于光学字符识别技术的数据传输方法及相关装置

Country Status (1)

Country Link
CN (1) CN113449829A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115019291A (zh) * 2021-11-22 2022-09-06 荣耀终端有限公司 图像的文字识别方法、电子设备及存储介质
CN115131806A (zh) * 2022-06-07 2022-09-30 福建极推科技有限公司 一种基于深度学习的各类证件ocr图像信息识别方法、系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115019291A (zh) * 2021-11-22 2022-09-06 荣耀终端有限公司 图像的文字识别方法、电子设备及存储介质
CN115131806A (zh) * 2022-06-07 2022-09-30 福建极推科技有限公司 一种基于深度学习的各类证件ocr图像信息识别方法、系统
CN115131806B (zh) * 2022-06-07 2023-10-31 福建极推科技有限公司 一种基于深度学习的各类证件ocr图像信息识别方法、系统

Similar Documents

Publication Publication Date Title
CN107784051B (zh) 在线客服应答系统及方法
US8073263B2 (en) Multi-classifier selection and monitoring for MMR-based image recognition
CN105474253A (zh) 利用印刷品提供内容传输服务的方法
CN104468531A (zh) 敏感数据的授权方法、装置和系统
US10992646B2 (en) Data transmission method and data transmission apparatus
CN108777655B (zh) 一种即时通讯方法及其装置、设备、存储介质
US10461934B2 (en) Authentication-based message display method and communication terminal thereof
CN113449829A (zh) 基于光学字符识别技术的数据传输方法及相关装置
US8370437B2 (en) Method and apparatus to associate a modifiable CRM related token to an email
WO2020233047A1 (zh) 页面测试的方法及装置
CN104010068A (zh) 移动终端的短消息处理方法和装置
CN110738323A (zh) 基于数据共享建立机器学习模型的方法和装置
CN109766315B (zh) 文件展示方法及终端、计算机存储介质、计算机设备
WO2018133715A1 (zh) 一种用户信息的获取方法及相关装置
US9544252B2 (en) Compressing and decompressing electronic messages in message threads
CN114257443B (zh) 一种法院专用跨内网签名系统、方法及设备
CN108600255B (zh) Mock服务管理方法、装置、计算机设备以及存储介质
CN111177536A (zh) 基于设备指纹对未登录用户传送定制信息的方法、装置及电子设备
WO2016188079A1 (zh) 终端设备的数据存储方法及终端设备
CN115774762A (zh) 即时通讯信息处理方法、装置、设备及存储介质
KR102390000B1 (ko) 문서 이미지 내 텍스트 추출 서비스 시스템 및 방법
CN114048490A (zh) 一种信息处理方法及其装置、设备、存储介质
CN113904865A (zh) 一种基于非对称算法的日志传输方法及装置
CN103312592A (zh) 一种在网页上批量向即时通信客户端发送信息的方法
CN112307527A (zh) 一种传输数据的方法及结构

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination