CN105447392A - 用于保护特定信息的方法和系统 - Google Patents

用于保护特定信息的方法和系统 Download PDF

Info

Publication number
CN105447392A
CN105447392A CN201410418383.4A CN201410418383A CN105447392A CN 105447392 A CN105447392 A CN 105447392A CN 201410418383 A CN201410418383 A CN 201410418383A CN 105447392 A CN105447392 A CN 105447392A
Authority
CN
China
Prior art keywords
image
information zone
zone specific
template
border
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410418383.4A
Other languages
English (en)
Inventor
孙盛艳
王军
冯浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN201410418383.4A priority Critical patent/CN105447392A/zh
Priority to US14/832,140 priority patent/US9760797B2/en
Publication of CN105447392A publication Critical patent/CN105447392A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/759Region-based matching

Abstract

本发明公开了一种用于保护特定信息的方法,该方法包括:接收包含特定信息的图像;识别该图像的边界;基于所述边界,将该图像与预定的图像模板进行匹配,以确定该图像的特定信息区域;以及响应于确定了该图像的特定信息区域,对要呈现的该图像的所述特定信息区域进行预定处理,以保护所述特定信息。本发明用于保护特定信息的方法可以不用识别图像中具体的语义内容而能够对相关特定信息进行有效保护。

Description

用于保护特定信息的方法和系统
技术领域
本发明涉及一种计算机信息处理方法,更具体地,涉及一种用于保护特定信息的方法和系统。
背景技术
在当前数据库系统或其他大数据系统中除了常见的数字、文本格式的敏感数据外,越来越多情况以图片等对象形式存储用户敏感图像信息,其中尤其是身份证、银行卡、病历档案等的复印件、扫描件等图像中存在着极其敏感的个人信息。此类信息在银行、医疗等行业数据检索系统中展示时,一方面需要借助图像所携带的内容对于该图像的所有者身份、权限加以审核以用于相关业务,例如通过查看身份证用户照片及核对身份证出生年月日来判断柜台用户身份真伪,但另一方面敏感信息也有极大可能被不恰当被使用。
因此需要一种方法,在前端系统通过应用程序及Http传输、读取、展示时,对最有价值且敏感的信息,如的身份证号码、银行卡号码等ID类信息进行自动覆盖。在通过FTP或其他文件管理系统或在互联网传输过程中,也存在类似情况,敏感、个性化、私人内容在传输、存储、展示时有被攻击滥用的风险存在。当前的解决方法都是知道要保护的敏感信息的内容模式,对图片内容进行分析,找出与设定好的需要保护的内容模式相匹配的内容,再对其进行覆盖。在图片中搜索精确匹配的内容是非常困难的,尤其对于身份证号、信用卡号等这种内容不固定的图像内容,而在图像本身存在一定瑕疵时,识别图像中的具体语义内容变得更加困难。
发明内容
本发明提供了一种用于保护特定信息的方法和系统。
根据本发明的一个方面,提供了一种用于保护特定信息的方法,包括:接收包含特定信息的图像;识别该图像的边界;基于所述边界,将该图像与预定的图像模板进行匹配,以确定该图像的特定信息区域;以及响应于确定了该图像的特定信息区域,对该图像的所述特定信息区域进行预定处理,以保护所述特定信息。
根据本发明的另一个方面,提供了一种用于保护特定信息的系统,包括:接收装置,被配置用于接收包含特定信息的图像;识别装置,被配置用于识别该图像的边界;特定信息区域确定装置,被配置用于基于所述边界,将该图像与预定的图像模板进行匹配,以确定该图像的特定信息区域;以及特定信息保护装置,被配置用于响应于确定了该图像的特定信息区域,对该图像的所述特定信息区域进行预定处理,以保护所述特定信息。
本发明不需要分析图像具体语义内容,而是根据敏感数据所在的区域以及区域特征区域和边界的距离来进行定位和对敏感数据进行保护。而且因其并不直接判断内容,而是通过获取区域特征区域位置及相对距离来定位,在发现匹配上提高了性能。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。
图2示出用于本发明的信用卡示例。
图3示出了本发明用于保护特定信息的方法的第一具体实施方式。
图4示出了用于生成预定的图像模板的第一具体实施方式。
图5示出了用于生成预定的图像模板的第二具体实施方式。
图6示出了根据图2的信用卡学习出来的信用卡图像模型。
图7示出了用于生成预定的图像模板的第二具体实施方式。
图8示出了本发明用于具体匹配图像与图像模板的第一具体实施方式。
图9示出了本发明用于匹配图像与图像模板的第二具体实施方式。
图10示出了本发明一种用于保护特定信息的系统框架图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
考虑到现有技术都需要识别图像中的具体信息内容来决定对何种信息进行保护,从而导致语义识别困难的技术缺陷,申请人经过长期的研究和实践,发现,现有处理的图像都有一定的规则性,如图2所示的信用卡,其中用户提交该信用卡的复印件或者扫描件时,银行会要求信用卡的复印件或者扫描件等中的四条边界中的至少三条边界是清晰的。因此申请人另辟蹊径地提出了通过基于图像边界来识别图像中的特征区域和特定信息区域的方法,而避免了现有技术中需要进行语义识别的技术缺陷,取得了出乎本领域技术人员意料之外的技术效果。
现在参看图3,图3示出了本发明用于保护特定信息的方法的第一具体实施方式。在步骤301中,接收包含特定信息的图像。其中所述特定信息可以是用户或者按照用户与企业协议规定等要求保护的各种信息,比如个人姓名、个人身份证号、个人住址、疾病状况等等。图像形式可以包括但不限于由复印件、传真件、扫描件等形成的电子图像。图像优选用灰度表示,而对于接收的彩色图像,优选地可以将其转换为灰度表示的图像。在步骤303中,识别该图像的边界。正如上面所指出的,适用于本具体实施例的图像是具有明确的边界的。则可以基于接收的图像,识别其边界。本领域技术人员了解,可以采用现有的或者将来的各种图像边界识别方法,比如本领域技术人员所熟知的马尔可夫随机场模型、模拟退火算法、MAP准则等进行边界检测,从而得到各条边界的基于像素点的坐标值表示,比如图2中,边a就可以表示为((0,0),(80,0))、边b可以表示为((0,0),(0,50)),以此类推可以表示出边c((0,50),(80,50)),d((80,50),(80,0)),……。优选地,对于常用的规则图像(比如银行卡、身份证等),可以仅仅识别和记录三条边界,比如边a、b、c,之所以考虑用三条边,主要是由于考虑到在实际中,扫描图样的角部可能不完整(不封闭),则以某一虚拟原点为(0,0)(比如边a、b的延长线交点),并记录三条边界。
在步骤305中,基于所述边界,将该图像与预定的图像模板进行匹配,以确定该图像的特定信息区域。在本发明中,将会预先存有与该图像属于同类的图像模板,比如输入的新的信用卡图像,则对应预先存有信用卡的图像模板。在该图像模板中,会记录有图像的特征区域以及特定信息区域。其中所述特征区域是用于识别该图像是否与图像模板属于同一类图像,特定信息区域则是该类图像用于记载需要保护的特定信息的区域。对于如何生成预定的图像模板,以及具体如何进行匹配,将在下文的多个优选具体实施方式中进行详细描述。在步骤307中,响应于确定了该图像的特定信息区域,对该图像的所述特定信息区域进行预定处理,以保护所述特定信息。其中,所述预定处理包括但不限于以下方法任意一种或者多种:
(1)如已知敏感区域为身份证、银行卡ID等,对该区域进行伪数字/字母处理:比如11010519660101123x->12312312341212abcd;
(2)将图象灰度变化剧烈的位置、分布勾画出来,做模糊处理,对噪音多的位置作锐化,增宽边缘区域,增大亮暗对比,反转后二次切分边缘区域并增大对比等;
通过上述处理后,希望得到保护的特定信息就得到了妥善的保护,而其它信息则可以得到充分应用。
图4示出了用于生成预定的图像模板的第一具体实施方式。在步骤401中,接收多个图像。这些图像是作为训练图像模板的样例。在步骤403中,对所述多个图像进行聚类。所述对所述多个图像进行聚类包括对所述多个图像进行图像机器学习,并根据所述多个图像的相互匹配程度,对所述多个图像进行分类,其中本领域技术人员了解,可以采用现有或者将来的各种机器学习算法用于上述步骤,比如本领域技术人员所熟知的反向传播(backpropagation)神经网络,集成学习(ensemblelearning)各种支持向量机(supportvectorMachines)算法以及更泛化的最大化间隔方法,也包括以贝叶斯决策理论为基础的各种概率方法如条件随机场及其变形等。
在步骤405中,对属于同一类的图像进行分析,将该同一类的图像中完全相同的区域确定为该同一类的图像的特征区域,将该同一类的图像中不同的区域确定为可选特定信息区域。先把历史学习图片灰度化,灰度化后的图片再锐化,比如对图像的像素点从某一灰度值R向黑白(#000000,#ffffff)两端调整锐化,当大于灰度值R的调整为黑,小于的调整为白。然后把所有黑白图片迭代比较,所以是一个像素一个像素的比较。例如:第一个图片和第二个图片进行比较,图片共有1万个像素点,对黑色区域进行比较,当该区域相同位置像素的相同度达到90%以上我们认为是特征区域(当然,90%在此仅仅是作为示例,本领域技术人员完全可以根据实际需要对该数值进行调整,比如85%或者95%等等)。其他的黑色区域为可选待定信息区域。
其中,优选地,如图5示出的用于生成预定的图像模板的第二具体实施方式所示,在步骤501中,识别该同一类图像的边界,在步骤503中,分别确定和记录该特征区域和该可选特定信息区域相对于该边界的相对位置,从而生成所述预定的图像模板。以识别出的边界为基准,计算出特征区域与边界之间的基于像素的距离,并确定特征区域的基于像素的区域大小。就可以标记特征区域的位置和大小。比如,图6是根据图2的信用卡学习出来的信用卡图像模型,其中特征区域3的相对于边界的位置坐标就可以表示为((5,20),(5,30),(30,30),(30,20))。由于可选特定信息区域是表示同一类的图像中不同的区域,由于这些区域是不同的,比如人的姓名,有两个字的,也有三个字的,通过机器学习是无法总结出来的,这时可以将该同一类图像在该区域中最大的作为模板的可选特定信息区域,比如通过机器学习,发现其实四个字的名字是最大的区域,则将最大的区域作为模板的可选特定信息区域之一,从而可以达到最大的保护程度。由于有时作为采样的图像相对于其背景图像会存在倾斜、颠倒等缺陷(比如一般向银行提交身份证复印件时,大家都是将身份证复印在A4纸上,这时身份证往往相对于背景图像A4纸会存在倾斜、颠倒等缺陷),则优选地,可以在进行机器学习时,对图像进行旋转的预处理,由于具体如何判断图像是否倾斜、颠倒以及进行图像旋转对本领域技术人员而言属于常用技术,在此不再赘述。也可以考虑记录待选特定信息区域相对于特征区域的位置,来作为待选特定信息区域的相对位置,则如果找到对应的特征区域的位置,就可以确定待选特定信息区域的位置,当然位置信息也包含有区域的大小数据。而要最终确定图像模板的特定信息区域,则可以采用下述方式之一:接收用户对特定信息区域的指定,而从该可选特定信息区域中确定该预定的图像模板的特定信息区域;或者将所述可选特定信息区域确定为所述预定的图像模板的特定信息区域。
图7示出了用于生成预定的图像模板的第二具体实施方式。在步骤701中,接收图像。该图像将作为图像模板的基础。在步骤703中,识别该图像的边界。在步骤705中,接收用户对该图像的特征区域和特定信息区域的指定。优选地,该具体实施方式可以将该图像呈现给用户,用户通过所见即所得的方式,通过如键盘、鼠标、触摸屏等输入方式,来标记其指定的该图像的特征区域和特定信息区域。用户的指定可以如图6所示。在步骤707中,确定和记录该特征区域和该可选特定信息区域相对于所述边界的相对位置,从而形成所述预定的图像模板。其中基于识别出来的边界,确定和记录该特征区域和该可选特定信息区域相对于所述边界的相对位置。由于基于本申请,根据用户的输入设备来确定选定区域的坐标以及相对于边界的相对像素位置对本领域技术人员而言属于常用技术,在此不再做进一步地赘述。优选地,考虑到特定信息区域的不确定性,可以基于用户的指定,在与其它特征区域和特定信息区域不存在区域冲突的情况下,可以适度扩大特定信息区域范围,这样就可以避免因为用户基于的采样图像的特定信息区域较小,而遇到较大特定信息区域时而遗漏部分特定信息未被保护的情况。
图8示出了本发明用于具体匹配图像与图像模板的第一具体实施方式。在步骤801中,基于所述边界,根据预定的图像模板的特征区域匹配该图像的特征区域。优选地,考虑到待匹配的图像虽然有清晰边界,但是具体图像内容可能存在颜色过浅、少量缺失等问题,则对图像进行锐化的预处理,然后,根据预定的图像模板中记录的特征区域的位置和区域大小,基于图像的边界,在图像上确定对应的区域,为与图像模板中的特征区域相对应,可以称之为图像的热度区(特征区域),每个热度区为一组矢量数据,包含了像素相对于边界的位置坐标值与灰度值,坐标值表示可以参考特征区域3的表示方式。然后从图像上按照热度区位置与图像模板中的对应特征区域进行逐一像素比较,如果相同率小于90%(当然,90%在此仅仅是作为示例,本领域技术人员完全可以根据实际需要对该数值进行调整,比如85%或者95%等等),则认为不符合该图像模板,相反,就可以认为该图像模板与该图像是相匹配的。在步骤803中,基于相匹配的图像模板来确定该图像的所述特定信息区域。当最终确定了与该图像相匹配的图像模板,也就是说该图像与图像模板属于同一类型的图像,如果图像模板记录的是特定信息区域相对于特征区域的相对位置信息,就可以基于该图像模板中记录的特征区域位置,来确定该图像的所述特定信息区域;如果图像模板记录的是特定信息区域相对于图像边界的位置,则可以直接由图像模板记录的是特定信息区域位置来确定该图像的特定信息区域位置。
图9示出了本发明用于匹配图像与图像模板的第二具体实施方式。优选地,一个企业,比如一家银行,往往会发行多种银行(信用)卡产品,则意味着其会建立多个图像模板,因此需要确定该图像究竟与哪一个图像模板属于同一类。在步骤901中,将该图像与预定的多个图像模板分别进行匹配。匹配的方法可以如上文所介绍的匹配方式进行,确定出该图像与各个图像模板中能够匹配上的特征区域。在步骤903中,将与该图像具有最多的匹配的特征区域的图像模板,确定为与该图像相匹配的图像模板。
图10示出了本发明一种用于保护特定信息的系统1000,其包括:接收装置1001,被配置用于接收包含特定信息的图像;识别装置1003,被配置用于识别该图像的边界;特定信息区域确定装置1005,被配置用于基于所述边界,将该图像与预定的图像模板进行匹配,以确定该图像的特定信息区域;以及特定信息保护装置1007,被配置用于响应于确定了该图像的特定信息区域,对要呈现的该图像的所述特定信息区域进行预定处理,以保护所述特定信息。
优选地,其中所述特定信息区域确定装置包括:匹配装置,被配置用于基于所述边界,根据预定的图像模板的特征区域匹配该图像的特征区域;确定装置,被配置用于基于相匹配的图像模板来确定该图像的所述特定信息区域。
优选地,其中所述匹配装置包括:分别匹配装置,被配置用于将该图像与预定的多个图像模板分别进行匹配;以及匹配图像模板确定装置,被配置用于将与该图像具有最多的匹配的特征区域的图像模板,确定为与该图像相匹配的图像模板。
优选地,所述系统还包括:图像接收装置,被配置用于接收多个图像;聚类装置,被配置用于对所述多个图像进行聚类;以及分析装置,被配置用于对属于同一类的图像进行分析,将该同一类的图像中相同的区域确定为该同一类的图像的特征区域,将该同一类的图像中不同的区域确定为可选特定信息区域。
优选地,其中所述分析装置还包括:边界识别装置,被配置用于识别该同一类图像的边界;以及图像模板生成装置,被配置用于分别确定和记录该特征区域和该可选特定信息区域相对于该边界的相对位置,从而生成所述预定的图像模板。
优选地,所述系统还包括以下之一:接收用户对特定信息区域的指定,而从该可选特定信息区域中确定该预定的图像模板的特定信息区域;或者将所述可选特定信息区域确定为所述预定的图像模板的特定信息区域。
优选地,所述系统还包括:第二图像接收装置,被配置用于接收图像;第二边界识别装置,被配置用于识别该图像的边界;第二接收装置,被配置用于接收用户对该图像的特征区域和特定信息区域的指定;以及第二图像模板生成装置,被配置用于确定和记录该特征区域和该特定信息区域相对于所述边界的相对位置,从而生成所述预定的图像模板。
优选地,其中所述识别该图像的边界包括:第三边界识别装置,被配置用于识别该图像的三条边界。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (16)

1.一种用于保护特定信息的方法,包括:
接收包含特定信息的图像;
识别该图像的边界;
基于所述边界,将该图像与预定的图像模板进行匹配,以确定该图像的特定信息区域;以及
响应于确定了该图像的特定信息区域,对该图像的所述特定信息区域进行预定处理,以保护所述特定信息。
2.根据权利要求1所述的方法,其中所述将该图像与预定的图像模板进行匹配,以确定该图像的特定信息区域包括:
基于所述边界,根据预定的图像模板的特征区域匹配该图像的特征区域;
基于相匹配的图像模板来确定该图像的所述特定信息区域。
3.根据权利要求2所述的方法,其中所述根据预定的图像模板的特征区域匹配该图像的特征区域包括:
将该图像与预定的多个图像模板分别进行匹配;以及
将与该图像具有最多的匹配的特征区域的图像模板,确定为与该图像相匹配的图像模板。
4.根据权利要求1所述的方法,所述方法还包括:
接收多个图像;
对所述多个图像进行聚类;以及
对属于同一类的图像进行分析,将该同一类的图像中相同的区域确定为该同一类的图像的特征区域,将该同一类的图像中不同的区域确定为可选特定信息区域。
5.根据权利要求4所述的方法,其中所述对属于同一类的图像进行分析,将该同一类的图像中相同的区域确定为该同一类的图像的特征区域,将该同一类的图像中不同的区域确定为可选特定信息区域还包括:
识别该同一类图像的边界;以及
分别确定和记录该特征区域和该可选特定信息区域相对于该边界的相对位置,从而生成所述预定的图像模板。
6.根据权利要求5所述的方法,所述方法还包括以下之一:
接收用户对特定信息区域的指定,而从该可选特定信息区域中确定该预定的图像模板的特定信息区域;或者
将所述可选特定信息区域确定为所述预定的图像模板的特定信息区域。
7.根据权利要求1所述的方法,所述方法还包括:
接收图像;
识别该图像的边界;
接收用户对该图像的特征区域和特定信息区域的指定;以及
确定和记录该特征区域和该特定信息区域相对于所述边界的相对位置,从而生成所述预定的图像模板。
8.根据权利要求1所述的方法,其中所述识别该图像的边界包括:
识别该图像的三条边界。
9.一种用于保护特定信息的系统,包括:
接收装置,被配置用于接收包含特定信息的图像;
识别装置,被配置用于识别该图像的边界;
特定信息区域确定装置,被配置用于基于所述边界,将该图像与预定的图像模板进行匹配,以确定该图像的特定信息区域;以及
特定信息保护装置,被配置用于响应于确定了该图像的特定信息区域,对该图像的所述特定信息区域进行预定处理,以保护所述特定信息。
10.根据权利要求9所述的系统,其中所述特定信息区域确定装置包括:
匹配装置,被配置用于基于所述边界,根据预定的图像模板的特征区域匹配该图像的特征区域;
确定装置,被配置用于基于相匹配的图像模板来确定该图像的所述特定信息区域。
11.根据权利要求10所述的系统,其中所述匹配装置包括:
分别匹配装置,被配置用于将该图像与预定的多个图像模板分别进行匹配;以及
匹配图像模板确定装置,被配置用于将与该图像具有最多的匹配的特征区域的图像模板,确定为与该图像相匹配的图像模板。
12.根据权利要求9所述的系统,所述系统还包括:
图像接收装置,被配置用于接收多个图像;
聚类装置,被配置用于对所述多个图像进行聚类;以及
分析装置,被配置用于对属于同一类的图像进行分析,将该同一类的图像中相同的区域确定为该同一类的图像的特征区域,将该同一类的图像中不同的区域确定为可选特定信息区域。
13.根据权利要求12所述的系统,其中所述分析装置还包括:
边界识别装置,被配置用于识别该同一类图像的边界;以及
图像模板生成装置,被配置用于分别确定和记录该特征区域和该可选特定信息区域相对于该边界的相对位置,从而生成所述预定的图像模板。
14.根据权利要求13所述的系统,所述系统还包括以下之一:
接收用户对特定信息区域的指定,而从该可选特定信息区域中确定该预定的图像模板的特定信息区域;或者
将所述可选特定信息区域确定为所述预定的图像模板的特定信息区域。
15.根据权利要求9所述的系统,所述系统还包括:
第二图像接收装置,被配置用于接收图像;
第二边界识别装置,被配置用于识别该图像的边界;
第二接收装置,被配置用于接收用户对该图像的特征区域和特定信息区域的指定;以及
第二图像模板生成装置,被配置用于确定和记录该特征区域和该特定信息区域相对于所述边界的相对位置,从而生成所述预定的图像模板。
16.根据权利要求9所述的系统,其中所述识别该图像的边界包括:
第三边界识别装置,被配置用于识别该图像的三条边界。
CN201410418383.4A 2014-08-22 2014-08-22 用于保护特定信息的方法和系统 Pending CN105447392A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410418383.4A CN105447392A (zh) 2014-08-22 2014-08-22 用于保护特定信息的方法和系统
US14/832,140 US9760797B2 (en) 2014-08-22 2015-08-21 Protecting specific information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410418383.4A CN105447392A (zh) 2014-08-22 2014-08-22 用于保护特定信息的方法和系统

Publications (1)

Publication Number Publication Date
CN105447392A true CN105447392A (zh) 2016-03-30

Family

ID=55348573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410418383.4A Pending CN105447392A (zh) 2014-08-22 2014-08-22 用于保护特定信息的方法和系统

Country Status (2)

Country Link
US (1) US9760797B2 (zh)
CN (1) CN105447392A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284684A (zh) * 2018-08-21 2019-01-29 Oppo广东移动通信有限公司 一种信息处理方法、装置以及计算机存储介质
CN109684853A (zh) * 2017-10-16 2019-04-26 诺基亚技术有限公司 用于确定和提供图像内的匿名内容的装置和方法
CN111209924A (zh) * 2018-11-19 2020-05-29 零氪科技(北京)有限公司 一种用于对医嘱进行自动提取的系统及应用

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105491443A (zh) * 2014-09-19 2016-04-13 中兴通讯股份有限公司 图像处理、访问方法及装置
CN105760766B (zh) * 2016-02-17 2018-10-23 青岛海信移动通信技术股份有限公司 一种基于人脸识别的图像保护方法及装置
US10819699B2 (en) * 2017-03-30 2020-10-27 Optim Corporation System, method, and program for remotely supporting work
CN109902684B (zh) * 2019-03-07 2022-03-18 苏州达家迎信息技术有限公司 信息获取方法及装置、设备及存储介质
CN109886964A (zh) * 2019-03-29 2019-06-14 北京百度网讯科技有限公司 电路板缺陷检测方法、装置及设备
US10984279B2 (en) * 2019-06-13 2021-04-20 Wipro Limited System and method for machine translation of text
US11790110B2 (en) * 2021-02-09 2023-10-17 Nice Ltd. System and method for preventing sensitive information from being recorded

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090100527A1 (en) * 2007-10-10 2009-04-16 Adrian Michael Booth Real-time enterprise data masking
CN100483442C (zh) * 2001-02-06 2009-04-29 国际商业机器公司 带变体的多重表格的识别、分离和压缩
CN103544475A (zh) * 2013-09-23 2014-01-29 方正国际软件有限公司 一种版面类型的识别方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69435214D1 (de) * 1993-12-10 2009-08-06 Ricoh Kk Verfahren zur Bilderkennung und zum Herausziehen und Erkennen eines spezifizierten Bildes aus einem Bildeingabesignal
US6823203B2 (en) 2001-06-07 2004-11-23 Koninklijke Philips Electronics N.V. System and method for removing sensitive data from diagnostic images
EP3567840B1 (en) 2005-12-16 2024-04-10 The 41st Parameter, Inc. Methods and apparatus for securely displaying digital images
US8014604B2 (en) * 2008-04-16 2011-09-06 International Business Machines Corporation OCR of books by word recognition
US8345101B2 (en) * 2008-10-31 2013-01-01 International Business Machines Corporation Automatically calibrating regions of interest for video surveillance
US20120033892A1 (en) 2010-08-04 2012-02-09 Coreguard Systems and Methods for Identifying Matching Images of Digital Documents
US9201575B2 (en) 2012-01-10 2015-12-01 General Motors Llc Method and system for database browsing
WO2013136324A1 (en) 2012-02-21 2013-09-19 Green Sql Ltd. Dynamic data masking system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100483442C (zh) * 2001-02-06 2009-04-29 国际商业机器公司 带变体的多重表格的识别、分离和压缩
US20090100527A1 (en) * 2007-10-10 2009-04-16 Adrian Michael Booth Real-time enterprise data masking
CN103544475A (zh) * 2013-09-23 2014-01-29 方正国际软件有限公司 一种版面类型的识别方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684853A (zh) * 2017-10-16 2019-04-26 诺基亚技术有限公司 用于确定和提供图像内的匿名内容的装置和方法
CN109684853B (zh) * 2017-10-16 2023-12-29 诺基亚技术有限公司 用于确定和提供图像内的匿名内容的装置和方法
CN109284684A (zh) * 2018-08-21 2019-01-29 Oppo广东移动通信有限公司 一种信息处理方法、装置以及计算机存储介质
CN109284684B (zh) * 2018-08-21 2021-06-01 Oppo广东移动通信有限公司 一种信息处理方法、装置以及计算机存储介质
CN111209924A (zh) * 2018-11-19 2020-05-29 零氪科技(北京)有限公司 一种用于对医嘱进行自动提取的系统及应用
CN111209924B (zh) * 2018-11-19 2023-04-18 零氪科技(北京)有限公司 一种用于对医嘱进行自动提取的系统及应用

Also Published As

Publication number Publication date
US20160055393A1 (en) 2016-02-25
US9760797B2 (en) 2017-09-12

Similar Documents

Publication Publication Date Title
CN105447392A (zh) 用于保护特定信息的方法和系统
US20180114332A1 (en) Edge-based adaptive machine learning for object recognition
US20200090321A1 (en) System and method for facilitating efficient damage assessments
US11080839B2 (en) System and method for training a damage identification model
CN110942074B (zh) 字符切分识别方法、装置、电子设备、存储介质
JP6244892B2 (ja) 文書内の文字の局所的な拡大縮小、回転および表示位置に対して不変である光学的文字認識のためのワード検出
CN107085585A (zh) 用于图像搜索的准确的标签相关性预测
US10726300B2 (en) System and method for generating and processing training data
CN107077570A (zh) 用于检测通过数据分发通道发送敏感信息的尝试的系统和方法
EP3853761A1 (en) Converting an image into a structured table
KR102537114B1 (ko) 인공 신경망의 추론 데이터에 대한 신뢰도를 판단하는 방법
CN114330588A (zh) 一种图片分类方法、图片分类模型训练方法及相关装置
KR102206604B1 (ko) 글자 인식 장치 및 이에 의한 글자 인식 방법
US20210319264A1 (en) Resolving training dataset category ambiguity
KR102282025B1 (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
KR20210010602A (ko) 글자 인식 장치 및 이에 의한 글자 인식 방법
CN112070093A (zh) 生成图像分类模型的方法、图像分类方法、装置和设备
CN117115823A (zh) 一种篡改识别方法、装置、计算机设备和存储介质
JP7007551B2 (ja) 画像類否判断プログラム、画像類否判断装置および画像類否判断方法
CN110688995A (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
CN116246161A (zh) 领域知识引导下的遥感图像目标精细类型识别方法及装置
US20230062313A1 (en) Generating 2d mapping using 3d data
US20230186668A1 (en) Polar relative distance transformer
US11615618B2 (en) Automatic image annotations
US11354793B2 (en) Object detection with missing annotations in visual inspection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160330

WD01 Invention patent application deemed withdrawn after publication