CN112381702B - 一种图像隐私处理方法、计算设备及存储介质 - Google Patents

一种图像隐私处理方法、计算设备及存储介质 Download PDF

Info

Publication number
CN112381702B
CN112381702B CN202011403954.9A CN202011403954A CN112381702B CN 112381702 B CN112381702 B CN 112381702B CN 202011403954 A CN202011403954 A CN 202011403954A CN 112381702 B CN112381702 B CN 112381702B
Authority
CN
China
Prior art keywords
invoice
item
filled
image
filling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011403954.9A
Other languages
English (en)
Other versions
CN112381702A (zh
Inventor
张海宾
叶明登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Pierbulaini Software Co ltd
Original Assignee
Beijing Pierbulaini Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Pierbulaini Software Co ltd filed Critical Beijing Pierbulaini Software Co ltd
Priority to CN202011403954.9A priority Critical patent/CN112381702B/zh
Publication of CN112381702A publication Critical patent/CN112381702A/zh
Application granted granted Critical
Publication of CN112381702B publication Critical patent/CN112381702B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0053Embedding of the watermark in the coding stream, possibly without decoding; Embedding of the watermark in the compressed domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种图像隐私处理方法,该方法在存储有待填充发票模板的计算设备中执行,待填充发票模板包括多个模糊处理的第一信息项目和多个擦除的第二信息项目,第二信息项目关联有待填充位置和填充格式,该方法包括步骤:对目标发票图像进行识别,得到目标发票对应的多个项目内容;根据多个项目内容获取所述目标发票图像对应的待填充发票模板;在待填充发票模板中第二信息项目关联的待填充位置根据填充格式填充项目内容;对于已被填充的项目内容,根据项目内容计算模糊图像的大小和填充位置,在得到的模糊图像填充位置填充模糊图像,以得到隐私处理后的发票图像。本发明还公开了相应的计算设备和存储介质。

Description

一种图像隐私处理方法、计算设备及存储介质
技术领域
本发明涉及信息处理技术领域,特别涉及一种图像隐私处理方法、计算设备及存储介质。
背景技术
在网购平台以及相关论坛中,会在网页中展示商品的相关内容,随着商品的价格越来越透明,为了让即将购买商品的用户看到价格更真实,在购买商品的用户会上传自己购买商品的发票的同时,平台会展示已经购买商品的发票信息,为了保护用户的隐私,购物发票上有些信息需要遮挡后才能展示。人工对网页中每个商品对应的发票进行遮挡,很容易出现发票信息处理的准确程度不够理想,导致人工效率低、劳动成本高昂。
发明内容
为此,本发明提供了一种图像隐私处理方法、计算设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种图像隐私处理方法,该方法在计算设备中执行,述计算设备与数据存储装置连接,数据存储装置中存储有多个待填充发票模板,待填充发票模板包括多个模糊处理的第一信息项目和多个擦除的第二信息项目,第二信息项目关联有待填充位置和填充格式,该方法包括步骤:对目标发票图像进行识别,得到目标发票对应的多个项目内容;根据多个项目内容获取目标发票图像对应的待填充发票模板;在待填充发票模板中第二信息项目关联的待填充位置根据填充格式填充项目内容;对于已被填充的项目内容,根据项目内容计算模糊图像的大小和填充位置,在得到的模糊图像填充位置填充模糊图像,以得到隐私处理后的发票图像。
可选地,在根据本发明的图像隐私处理方法中,根据多个项目内容获取目标发票对象对应的待填充发票模板,包括步骤:遍历多个待填充发票模板,若多个项目内容对应的项目包含于待填充发票模板的第一信息项目和第二信息项目,则将该待填充发票模板作为目标发票图像对应的待填充发票模板。
可选地,在根据本发明的图像隐私处理方法中,在待填充发票模板中第二信息项目关联的待填充位置根据填充格式填充项目内容,包括步骤:根据待填充发票模板中第二信息项目获取对应的项目内容,在关联的待填充位置根据填充格式填充对应的项目内容。
可选地,在根据本发明的图像隐私处理方法中,第二信息项目包括第一类型和第二类型两种类型,对于已被填充的项目内容,根据项目内容计算模糊图像的大小和填充位置之前,包括步骤:获取已被填充的项目内容对应的第二信息项目属于的类型;若属于第一类型,则无需对该项目内容进行模糊图像填充;若属于第二类型,则对该项目内容进行模糊图像填充。
可选地,在根据本发明的图像隐私处理方法中,根据项目内容计算模糊图像的大小和填充位置,包括步骤:根据项目内容对应的第二信息项目预设截取方式部分截取项目内容;根据项目内容对应的第二信息项目关联的填充格式计算完整项目内容的宽度,以及所部分截取的项目内容的宽度,以获取模糊图像的宽度信息;根据填充格式计算完整项目内容的高度,以获取模糊图像的高度信息;根据项目内容的填充位置和所部分截取的项目内容的宽度获取模糊图像的填充位置。
可选地,在根据本发明的图像隐私处理方法中,项目内容包括多个连续的字符,所述填充格式包括字体和字号,所述预设截取方式为从前往后截取项目内容中预设数目个连续字符。
可选地,在根据本发明的图像隐私处理方法中,对目标发票图像进行识别,得到目标发票对应的多个项目内容,包括步骤:提取所述目标发票图像中各个字符的所在位置;根据各个字符的所在位置,将相邻字符进行合并作为一个对象;获取每个对象的所在位置,以将包含多个连续的字符的对象识别为目标发票图像中的项目内容。
可选地,在根据本发明的图像隐私处理方法中,目标发票图像为购车发票图像,第二信息项目包括开票日期、厂牌型号、价税合计大写、价税合计小写、地址,第一信息项目包括购车发票上除第二信息项目以外的其他项目。
可选地,在根据本发明的图像隐私处理方法中,第二信息项目中的开票日期、价税合计大写、价税合计小写属于第一类型,第二信息项目中的厂牌型号、地址属于第二类型。
可选地,在根据本发明的图像隐私处理方法中,得到隐私处理后的发票图像之前,还包括步骤:计算待填充发票的大小,根据待填充发票的大小对预设印章图片进行缩放,根据随机选取算法选取印章图片填充位置,以填充印章图片。
可选地,在根据本发明的图像隐私处理方法中,填充印章图片之前,还包括步骤:在预设角度范围内选取一个随机角度,将印章图片按随机角度进行旋转。
根据本发明的又一个方面,提供了一种计算设备,包括至少一个处理器;以及存储器,存储有程序指令,其中程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行根据本发明的图像隐私处理方法的指令。
根据本发明的又一个方面,提供了一种存储有程序指令的可读存储介质,当该程序指令被计算设备读取并执行时,使得计算设备执行本发明的图像隐私处理方法。
根据本发明的技术方案,待填充发票模板包括多个模糊处理的第一信息项目和多个擦除的第二信息项目,对平台上购买商品的用户上传购物发票图像进行识别得到项目内容,利用项目内容和待填充模板的对应关系,使用处理过的模板来代替用户上传的发票,保证发票图像的敏感信息被完全遮挡,在待填充发票模板中第二信息项目关联的待填充位置根据填充格式填充项目内容,在处理后的发票模板上写入展示发票所需要的信息保证了发票可展示信息的真实性。对于已被填充的项目内容,根据项目内容计算模糊图像的大小和填充位置,在得到的模糊图像填充位置填充模糊图像,对部分项目可以进行不完整展示,进一步平衡了用户隐私保护的安全性和处理后发票的真实性。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明的一个实施例的计算设备100的示意图;
图2示出了根据本发明的一个实施例的图像隐私处理方法200的流程图;
图3示出了根据本发明的一个实施例地图像隐私处理后的发票图像300。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。在一些实施例中,计算设备100被配置为执行图像隐私处理方法,程序数据124中就包含了用于执行所述方法的指令。
在网购平台以及相关论坛中,会在网页中展示商品的相关内容,随着商品的价格越来越透明,为了让即将购买商品的用户看到价格更真实,在购买商品的用户会上传自己购买商品的发票的同时,平台会展示已经购买商品的发票信息,为了保护用户的隐私,购物发票上有些信息需要遮挡后才能展示。人工对网页中每个商品对应的发票进行遮挡,很容易出现发票信息处理的准确程度不够理想,导致人工效率低、劳动成本高昂。根据本发明的一个实施例,执行图像隐私处理方法时,计算设备100还与数据存储装置(图中未示出)连接,数据存储装置中存储有多个待填充发票模板,待填充发票模板包括多个模糊处理的第一信息项目和多个擦除的第二信息项目,第二信息项目关联有待填充位置和填充格式。例如,待填充发票模板为对购车发票进行进一步处理得到的模板,第二信息项目包括开票日期、厂牌型号、价税合计大写、价税合计小写、地址,第一信息项目包括购车发票上除第二信息项目以外的其他项目。根据应用场景的需要,还可以对第一信息项目和第二信息项目进行调整。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、图像输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。根据本发明的一个实施例,在执行图像隐私处理方法前,数据输入设备用于获取目标发票图像,计算设备对目标发票图像进行识别,以得到目标发票图像对应的多个项目内容。目标发票即平台上购买商品的用户会上传的自己购买商品的发票图像,对该发票图像进行图像隐私处理可以在保护用户隐私的同时,提高商品的可信度。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。在一些实施例中,计算机可读介质中存储一个或多个程序,这一个或多个程序中包括执行某些方法的指令,如根据本发明的实施例,计算设备100通过所述指令来执行基于本发明的图像隐私处理方法200。
计算设备100上安装有支持网络文件传输和存储的移动APP或者客户端应用,包括原生应用或者诸如包括IE、Chrome和Firefox等浏览器,或者微信、QQ等通讯软件,并且本地存储有各种文件,如照片、音频、视频、文档(如Word、PDF等格式的文档)。应用客户端可以运行在诸如Windows、MacOS、安卓等操作系统上。计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、数码照相机、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。
图2示出了根据本发明的一个实施例的图像隐私处理方法200的流程图。方法200适于在计算设备(例如前述计算设备100中)执行,计算设备与数据存储装置连接,数据存储装置中存储有多个待填充发票模板,待填充发票模板包括多个模糊处理的第一信息项目和多个擦除的第二信息项目,第二信息项目关联有待填充位置和填充格式。
发票上的信息项目一般包括:发票号码、编码信息、发票抬头、发票代码、开票日期、购买方、密码、购买货物详情、购买货物合计、价税合计大写、价税合计小写、销售方、收款人、复核人和开票人。不同的发票所包含的项目根据发票种类和具体的商品都有所不同。第一信息项目和第二信息项目构成发票上所有信息项目,其具体分配根据发票的种类和不同应用场景下隐私处理的设定有所不同,对第一信息项目进行模糊处理以直接进行遮挡,对第二信息项目进行擦除以填充真实发票信息,在保留发票真实性的同时提高了隐私保护的安全性。根据本发明的一个实施例,目标发票图像为购车发票图像,第二信息项目包括开票日期、厂牌型号、价税合计大写、价税合计小写、地址,第一信息项目包括购车发票上除第二信息项目以外的其他项目。
如图2所示,图像隐私处理方法200始于步骤S210。在步骤S210中,对目标发票图像进行识别,得到目标发票对应的多个项目内容。目标发票即平台上购买商品的用户会上传的自己购买商品的发票图像,对该发票图像进行图像隐私处理可以在保护用户隐私的同时,提高商品的可信度。
根据本发明的一个实施例,对目标发票图像进行识别,得到目标发票对应的多个项目内容,包括步骤:提取目标发票图像中各个字符的所在位置;根据各个字符的所在位置,将相邻字符进行合并作为一个对象;获取每个对象的所在位置,以将包含多个连续的字符的对象识别为目标发票图像中的项目内容。
本实施例可利用文本检测算法,对文本信息进行检测。例如,通过文本检测网络模型,提取出目标发票图像中每个字符的位置,然后将检测到的相邻字符进行合并作为一个对象,以及根据合并后的对象在发票上的位置对文本信息对应的项目进行识别。进而,本实施例利用文本识别算法,获取每个对象的所在位置,根据对象所在位置对该区域的文本信息进行识别。例如,通过文本识别网络模型,对提取到的包含多个连续字符的对象进行识别,利用文本的前后联系,提高识别的准确率最终准确地识别出项目内容包含的多个连续的字符。项目内容即为目标发票上对应项目名称空白处人为手写或打印填充的内容,最后将识别得到的项目名称以及项目内容转换为结构化数据存储到数据库中,例如{key:价税合计大写,value:贰拾陆万肆仟圆整},其中,key为项目名称,value为项目内容。
随后,在步骤S220中,根据多个项目内容获取目标发票图像对应的待填充发票模板,以确定目标发票和待填充发票模板处理前原始的发票种类一致,待填充发票模板中的第二信息项目能被有效项目内容填充。
根据本发明的一个实施例,根据项目内容获取目标发票对象对应的待填充发票模板,包括步骤:遍历多个待填充发票模板,若多个项目内容对应的项目包含于待填充发票模板的第一信息项目和第二信息项目,则将该待填充发票模板作为目标发票图像对应的待填充发票模板。例如所获取的项目内容为购车发票上所包含的内容,则待填充发票模板也为对购车发票进行处理得到,以确定目标发票和待填充发票模板处理前原始的发票种类一致。若同时有多个模板的项目包含项目内容,随机选取一个模板进行填充,以提高隐私处理后的发票图像的丰富性。另外,在步骤S210中可以指定识别只对应某个发票模板上的第二信息项目的项目内容,以节省识别所花费的时间,提高图像处理的效率。
接着,在步骤S230中,在待填充发票模板中第二信息项目关联的待填充位置根据填充格式填充项目内容。具体来说,根据多个项目内容中的每个项目内容对应的第二信息项目获取每个项目内容的待填充位置,根据填充格式对每个项目内容进行填充。
例如对于第二信息项目“价税合计大写”,根据结构化存储的目标发票信息中找到key为“价税合计大写”,取出value即对应的项目内容“贰拾陆万肆仟圆整”,根据填充格式在关联的待填充位置进行填充,其中,填充格式例如字体和字号,待填充位置例如发票模板上的首字开始填充坐标。
根据本发明的一个实施例,待填充发票模板的生成过程如下:采集发票图像,提取发票图像的位置信息,以获取发票图像的整体定位结果;基于整体定位结果,对发票图像进行区域划分,以获取发票图像的分区结果;基于分区结果,对发票图像进行信息去除以及模糊处理;记录被去除信息的分区位置作为待填充位置,记录被去除信息的字体和字号作为填充格式,以得到待填充发票模板。在所需发票模板种类和数量较多时,对发票的整体定位和区域划分可以采用神经网络来完成,在所需发票模板种类和数量都较小时,可以人工进行第二信息项目关联的待填充位置和填充格式的选取。若步骤S220中不存在包含项目内容对应项目的发票模板,则提醒业务人员根据上述方式增加新的模板。
若是对购车发票进行处理,第二信息项目的选取如前所述的情况,则人工得到待填充发票模板的过程如下:选取一张拍摄清晰的发票,擦除开票日期、厂牌型号、价税合计大写、价税合计小写、地址等项目名称后的信息,购车发票其它信息模糊处理。系统自动校验发票是否倾斜,如倾斜则自动摆正,自动摆正可采用OpenCV图像摆正技术。业务人员通过鼠标在摆正后的发票上选择每个项目的填充位置,填充位置可以是填充开始的坐标。然后通过系统界面选择填充格式即发票模板相符合的字体和字号大小,每选择一种字体和字号后上传发票界面的内置文本都会随之变动,以方便业务人员找到和发票模板相匹配的填充格式。
最后,在步骤S240中,对于已被填充的项目内容,根据项目内容计算模糊图像的大小和填充位置,在得到的模糊图像填充位置填充模糊图像,以得到隐私处理后的发票图像。
具体地,根据项目内容计算模糊图像的大小和填充位置,包括步骤:根据项目内容对应的第二信息项目预设截取方式部分截取项目内容;根据项目内容对应的第二信息项目关联的填充格式计算完整项目内容的宽度,以及所部分截取的项目内容的宽度,以获取模糊图像的宽度信息;根据填充格式计算完整项目内容的高度,以获取模糊图像的高度信息;根据项目内容的填充位置和所部分截取的项目内容的宽度获取模糊图像的填充位置。
例如,项目内容包括多个连续的字符,填充格式包括字体和字号,截取方式为截取固定字之前的内容,例如,在厂牌型号项目中,截取厂牌型号项目内容中的“xx牌”,在地址项目中,截取地址项目内容中的“xx市”。预设截取方式不限于以上方式,还可以为从前往后截取项目内容中预设数目个连续字符。
以下为根据项目内容计算模糊图像的大小和填充位置的一个具体实施过程:根据项目内容对应的第二信息项目关联的填充格式计算完整项目内容的宽度k1,截取厂牌型号中所部分截取的项目内容“xx牌”字符串并计算其宽度k2,k1-k2+3个像素即为模糊图像的宽度。根据填充格式计算完整项目内容的高度g1,g1+2个像素即为模糊图像的高度。项目内容的填充位置为x1,则x1+k2为模糊图像的填充位置
为了平衡用户隐私保护和处理后发票真实性,部分项目可以进行不完整展示,根据本发明的一个实施例,第二信息项目包括第一类型和第二类型两种类型,根据所述项目内容计算模糊图像的大小和填充位置之前,包括步骤:获取多个项目内容中的每个项目内容对应的第二信息项目属于的类型;若属于第一类型,则无需对该项目内容进行模糊图像填充;若属于第二类型,则对该项目内容进行模糊图像填充。
图3示出了根据本发明的一个实施例地图像隐私处理后的发票图像300。为了提高隐私处理后发票图像的真实性,得到隐私处理后的发票图像之前,还包括步骤:计算待填充发票的大小,根据待填充发票的大小对预设印章图片进行缩放,根据随机选取算法选取印章图片填充位置,以填充所述印章图片。填充印章图片之前,还包括步骤:在预设角度范围内选取一个随机角度,将印章图片按随机角度进行旋转。进一步地,预设角度为0-30度。
根据本发明的技术方案,待填充发票模板包括多个模糊处理的第一信息项目和多个擦除的第二信息项目,对平台上购买商品的用户上传购物发票图像进行识别得到项目内容,利用项目内容和待填充模板的对应关系,使用处理过的模板来代替用户上传的发票,保证发票图像的敏感信息被完全遮挡,在待填充发票模板中第二信息项目关联的待填充位置根据填充格式填充项目内容,在处理后的发票模板上写入展示发票所需要的信息保证了发票可展示信息的真实性。对于已被填充的项目内容,根据项目内容计算模糊图像的大小和填充位置,在得到的模糊图像填充位置填充模糊图像,对部分项目可以进行不完整展示,进一步平衡了用户隐私保护地安全性和处理后发票的真实性。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
B9、如B7所述的方法,所述第二信息项目中的开票日期、价税合计大写、价税合计小写属于第一类型,所述第二信息项目中的厂牌型号、地址属于第二类型。
B10、如B1-B6中任一项所述的方法,所述得到隐私处理后的发票图像之前,还包括步骤:
计算所述待填充发票的大小,根据待填充发票的大小对预设印章图片进行缩放,根据随机选取算法选取印章图片填充位置,以填充所述印章图片。
B11、如B10所述的方法,所述填充所述印章图片之前,还包括步骤:
在预设角度范围内选取一个随机角度,将印章图片按随机角度进行旋转。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (13)

1.一种图像隐私处理方法,所述方法在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有多个待填充发票模板,所述待填充发票模板包括多个模糊处理的第一信息项目和多个擦除的第二信息项目,所述第二信息项目关联有待填充位置和填充格式,所述方法包括步骤:
对目标发票图像进行识别,得到所述目标发票图像对应的多个项目内容;
根据所述多个项目内容获取所述目标发票图像对应的待填充发票模板;
在所述待填充发票模板中第二信息项目关联的待填充位置根据填充格式填充项目内容;
对于已被填充的项目内容,根据所述项目内容计算模糊图像的大小和填充位置,在得到的模糊图像填充位置填充模糊图像,以得到隐私处理后的发票图像。
2.如权利要求1所述的方法,所述根据所述多个项目内容获取所述目标发票图像对应的待填充发票模板,包括步骤:
遍历所述多个待填充发票模板,若所述多个项目内容对应的项目包含于待填充发票模板的第一信息项目和第二信息项目,则将该待填充发票模板作为所述目标发票图像对应的待填充发票模板。
3.如权利要求2所述的方法,所述在所述待填充发票模板中第二信息项目关联的待填充位置根据填充格式填充项目内容,包括步骤:
根据所述待填充发票模板中第二信息项目获取对应的项目内容,在关联的待填充位置根据填充格式填充所述对应的项目内容。
4.如权利要求2所述的方法,所述第二信息项目包括第一类型和第二类型两种类型,所述对于已被填充的项目内容,根据所述项目内容计算模糊图像的大小和填充位置之前,包括步骤:
获取已被填充的项目内容对应的第二信息项目属于的类型;
若属于第一类型,则无需对该项目内容进行模糊图像填充;
若属于第二类型,则对该项目内容进行模糊图像填充。
5.如权利要求1-4中任一项所述的方法,所述根据所述项目内容计算模糊图像的大小和填充位置,包括步骤:
根据所述项目内容对应的第二信息项目预设截取方式部分截取项目内容;
根据所述项目内容对应的第二信息项目关联的填充格式计算完整项目内容的宽度,以及所部分截取的项目内容的宽度,以获取模糊图像的宽度信息;
根据填充格式计算完整项目内容的高度,以获取模糊图像的高度信息;
根据所述项目内容的填充位置和所部分截取的项目内容的宽度获取模糊图像的填充位置。
6.如权利要求5所述的方法,所述项目内容包括多个连续的字符,所述填充格式包括字体和字号,所述预设截取方式为从前往后截取项目内容中预设数目个连续字符。
7.如权利要求1-4中任一项所述的方法,所述对目标发票图像进行识别,得到所述目标发票图像对应的多个项目内容,包括步骤:
提取所述目标发票图像中各个字符的所在位置;
根据所述各个字符的所在位置,将相邻字符进行合并作为一个对象;
获取每个对象的所在位置,以将包含多个连续的字符的对象识别为所述目标发票图像中的项目内容。
8.如权利要求1-4中任一项所述的方法,所述目标发票图像为购车发票图像,所述第二信息项目包括开票日期、厂牌型号、价税合计大写、价税合计小写、地址,所述第一信息项目包括购车发票上除第二信息项目以外的其他项目。
9.如权利要求7所述的方法,所述第二信息项目中的开票日期、价税合计大写、价税合计小写属于第一类型,所述第二信息项目中的厂牌型号、地址属于第二类型。
10.如权利要求1-4中任一项所述的方法,所述得到隐私处理后的发票图像之前,还包括步骤:
计算所述待填充发票的大小,根据待填充发票的大小对预设印章图片进行缩放,根据随机选取算法选取印章图片填充位置,以填充所述印章图片。
11.如权利要求10所述的方法,所述填充所述印章图片之前,还包括步骤:
在预设角度范围内选取一个随机角度,将印章图片按随机角度进行旋转。
12.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-11中任一项所述方法的指令。
13.一种存储有程序指令的可读存储介质,当所述程序指令被客户端读取并执行时,使得所述客户端执行如权利要求1-11中任一项所述方法。
CN202011403954.9A 2020-12-02 2020-12-02 一种图像隐私处理方法、计算设备及存储介质 Active CN112381702B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011403954.9A CN112381702B (zh) 2020-12-02 2020-12-02 一种图像隐私处理方法、计算设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011403954.9A CN112381702B (zh) 2020-12-02 2020-12-02 一种图像隐私处理方法、计算设备及存储介质

Publications (2)

Publication Number Publication Date
CN112381702A CN112381702A (zh) 2021-02-19
CN112381702B true CN112381702B (zh) 2024-03-15

Family

ID=74589386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011403954.9A Active CN112381702B (zh) 2020-12-02 2020-12-02 一种图像隐私处理方法、计算设备及存储介质

Country Status (1)

Country Link
CN (1) CN112381702B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115600249A (zh) * 2022-11-28 2023-01-13 北京师范大学(Cn) 基于区块链的元宇宙电商购物大数据安全保护方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779890A (zh) * 2016-12-08 2017-05-31 用友网络科技股份有限公司 电子发票的生成方法及系统
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种发票中关键信息的识别方法及计算设备
CN109858275A (zh) * 2018-12-20 2019-06-07 航天信息股份有限公司 基于神经网络的发票公示方法和系统
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN110661866A (zh) * 2019-09-24 2020-01-07 腾讯科技(深圳)有限公司 一种票据处理方法及设备
CN111325092A (zh) * 2019-12-26 2020-06-23 湖南星汉数智科技有限公司 一种动车票识别方法、装置、计算机装置及计算机可读存储介质
CN111654700A (zh) * 2020-06-19 2020-09-11 杭州海康威视数字技术股份有限公司 一种隐私遮蔽处理方法、装置、电子设备及监控系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010134653A (ja) * 2008-12-03 2010-06-17 Ricoh Co Ltd 配布物印刷方法、配布物印刷装置及び配布物印刷プログラム
US10242118B2 (en) * 2010-06-21 2019-03-26 International Business Machines Corporation Multi-source electronic forms with concealed fields
US9875369B2 (en) * 2013-01-23 2018-01-23 Evernote Corporation Automatic protection of partial document content

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779890A (zh) * 2016-12-08 2017-05-31 用友网络科技股份有限公司 电子发票的生成方法及系统
CN107977665A (zh) * 2017-12-15 2018-05-01 北京科摩仕捷科技有限公司 一种发票中关键信息的识别方法及计算设备
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN109858275A (zh) * 2018-12-20 2019-06-07 航天信息股份有限公司 基于神经网络的发票公示方法和系统
CN110661866A (zh) * 2019-09-24 2020-01-07 腾讯科技(深圳)有限公司 一种票据处理方法及设备
CN111325092A (zh) * 2019-12-26 2020-06-23 湖南星汉数智科技有限公司 一种动车票识别方法、装置、计算机装置及计算机可读存储介质
CN111654700A (zh) * 2020-06-19 2020-09-11 杭州海康威视数字技术股份有限公司 一种隐私遮蔽处理方法、装置、电子设备及监控系统

Also Published As

Publication number Publication date
CN112381702A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
US9002066B2 (en) Methods, systems and processor-readable media for designing a license plate overlay decal having infrared annotation marks
US12008828B2 (en) Receipt identification method, apparatus, electronic device and computer-readable storage medium
EP3734510A1 (en) Composite code pattern, generating device, reading device, method, and program
US8818107B2 (en) Identification generation and authentication process application
US7840092B2 (en) Medium processing method, copying apparatus, and data filing apparatus
US10929597B2 (en) Techniques and systems for storing and protecting signatures and images in electronic documents
US20200050856A1 (en) Systems and methods for depicting vehicle information in augmented reality
US9824270B1 (en) Self-learning receipt optical character recognition engine
US10339373B1 (en) Optical character recognition utilizing hashed templates
US10621676B2 (en) System and methods for extracting document images from images featuring multiple documents
CN112183296B (zh) 模拟票据图像生成、票据图像识别方法和装置
CN112580640A (zh) 一种结合rpa和ai的发票信息的处理方法与装置
US20220092878A1 (en) Method and apparatus for document management
CN111931771A (zh) 票据内容识别方法、装置、介质及电子设备
CN112381702B (zh) 一种图像隐私处理方法、计算设备及存储介质
US11966890B2 (en) Bill identification method, device, electronic device and computer-readable storage medium
CN211375614U (zh) 影像整合打印系统及装置
CN117315705B (zh) 通用的卡证识别方法、装置、系统、电子设备及存储介质
CN117541180A (zh) 一种发票处理方法、装置及介质
CN111353111B (zh) 一种图像显示方法、计算设备及可读存储介质
TW201939430A (zh) 退稅平台、退稅系統及其退稅方法
CN114780095B (zh) 离屏渲染方法、装置、打印方法、计算设备和存储介质
CN118072321A (zh) 发票信息识别方法、装置、设备及存储介质
CN116681047A (zh) 函件处理方法、装置、存储介质及计算机设备
CN117151804A (zh) 一种发票入池方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant