CN103235946A - 人工识别名片信息的防泄密处理方法 - Google Patents
人工识别名片信息的防泄密处理方法 Download PDFInfo
- Publication number
- CN103235946A CN103235946A CN2013101200439A CN201310120043A CN103235946A CN 103235946 A CN103235946 A CN 103235946A CN 2013101200439 A CN2013101200439 A CN 2013101200439A CN 201310120043 A CN201310120043 A CN 201310120043A CN 103235946 A CN103235946 A CN 103235946A
- Authority
- CN
- China
- Prior art keywords
- submodule
- subclauses
- clauses
- artificial cognition
- business card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明提供一种人工识别名片信息的防泄密处理方法,该方法包括:获取用户的名片图像;将名片图像切割成不同类别的条目子模块,并记录条目子模块与名片图像的对应所属关系;将不同类别的条目子模块分发给操作人员进行人工识别;根据对应所属关系,对经人工识别后的不同类别的条目子模块的信息进行重组,获得名片图像的完整信息。本发明针对复杂的用机器识别算法难于识别或者要求极高识别率的名片图像,采用了一种人工识别的机制,通过将名片图像切割成条目子模块分发给操作人员识别,并在人工识别名片图像前,将涉及用户信息的条目子模块中的字块进行加密,既可以比机器更精确地识别名片,同时又能像机器识别名片一样,有效地保护用户的信息隐私。
Description
技术领域
本发明属于图像处理技术领域,涉及一种名片识别方法,特别是涉及一种人工识别名片信息的防泄密处理方法。
背景技术
当前已经有很多利用机器进行名片识别的软件,整个识别过程完全不需要人工参与,且能达到非常高的识别率,如名片全能王可以达到99%的识别率,能满足商务市场的需求。但是,在一些场合,现有的机器算法仍然无法满足需求,比如:1)识别阿拉伯语、希伯来语等语言的名片;2)要求100%准确识别名片。通过人眼的识别,可以解决这个问题,但是,建立人工识别的运维中心,会有泄漏用户信息的风险。由于名片识别不仅仅需要识别各个条目的信息,还需要识别条目的类别,一般情况下必须将整张名片的图像呈现给工人进行人眼识别,这就有可能因为工人的接触将用户的信息泄漏出去。
一般的名片由如下字段组成:姓名,公司,职位,电话号码,电子邮件,地址,网页等等。工人获得名片图像后,需要判断出各个部分的文字图像对应的类型和内容,并将其类型和对应的内容输入到系统的数据库,再通过系统返回给用户。即用户的名片图像信息变成文字信息的过程中,操作员可以接触到整张名片信息,这就存在泄漏的风险。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种人工识别名片信息的防泄密处理方法,用于解决现有技术中因人工接触用户名片信息导致的信息泄露的问题。
为实现上述目的及其他相关目的,本发明提供一种人工识别名片信息的防泄密处理方法。
一种人工识别名片信息的防泄密处理方法,所述人工识别名片信息的防泄密处理方法包括:
获取用户的名片图像;
将所述名片图像切割成不同类别的条目子模块,并记录所述条目子模块与所述名片图像的对应所属关系;
将所述不同类别的条目子模块分发给操作人员进行人工识别;
根据所述对应所属关系,对经人工识别后的不同类别的条目子模块的信息进行重组,获得所述名片图像的完整信息。
优选地,所述不同类别的条目子模块包括姓名条目子模块、公司条目子模块、职位条目子模块、电话号码条目子模块、电子邮件条目子模块、或/和网页条目子模块。
优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:将所述条目子模块继续切分成以单个数字、单个字符、或/和单个字母为单位的字块图像;对每个字块图像进行识别,判断其为数字、字符还是字母。
优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:判断所述条目子模块中是否含有数字,若有则对所述数字进行A加密,记录第A加密规则,将A加密后的条目子模块供人工识别。
优选地,所述A加密规则包括:对数字的位置进行随机调换;或插入无效数字混淆原有数字表示的含义。
优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤还包括:根据所述A加密规则,对人工识别后的包含数字的条目子模块的信息进行解密还原,获得所述条目子模块表示的真实信息。
优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:判断所述条目子模块中是否含有英文字母和符号,若有则对所述英文字母和符号进行B加密,记录B加密规则,将B加密后的条目子模块供人工识别。
优选地,所述B加密规则包括:对英文字母的位置进行随机调换;或插入无效英文字母或重复相邻英文字母混淆原有英文字母表示的含义。
优选地,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤还包括:根据所述B加密规则,对人工识别后的包含英文字母和符号的条目子模块的信息进行解密还原,获得所述条目子模块表示的真实信息。
如上所述,本发明所述的人工识别名片信息的防泄密处理方法,具有以下有益效果:
本发明针对复杂的用机器识别算法难于识别或者要求极高识别率的名片图像,采用了一种人工识别的机制,通过将名片图像切割成条目子模块分发给操作人员识别,并在人工识别名片图像前,将涉及用户信息的条目子模块中的字块进行加密,既可以比机器更精确地识别名片,同时又能像机器识别名片一样,有效地保护用户的信息隐私。
附图说明
图1为本发明所述的人工识别名片信息的防泄密处理方法的流程示意图。
图2为本发明所述的将不同类别的条目子模块分发给操作人员进行人工识别的流程示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
请参阅附图。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
下面结合实施例和附图对本发明进行详细说明。
实施例
本实施例提供一种人工识别名片信息的防泄密处理方法,如图1所示,所述人工识别名片信息的防泄密处理方法包括:
获取用户的名片图像;
将所述名片图像切割成不同类别的条目子模块,并记录所述条目子模块与所述名片图像的对应所属关系;进一步,所述不同类别的条目子模块包括姓名条目子模块、公司条目子模块、职位条目子模块、电话号码条目子模块、电子邮件条目子模块、或/和网页条目子模块。
将所述不同类别的条目子模块分发给操作人员进行人工识别,参见图2,具体步骤包括:
首先,将所述条目子模块继续切分成以单个数字、单个字符、或/和单个字母为单位的字块图像;对每个字块图像进行识别,判断其为数字、字符还是字母。
其次,判断所述条目子模块中的字块图像是否含有数字,若有则对所述数字进行A加密,记录第A加密规则,将A加密后的条目子模块供人工识别;根据所述A加密规则,对包含数字的条目子模块的人工识别信息进行解密还原,获得所述条目子模块表示的真实信息。其中,所述A加密规则包括:对数字的位置进行随机调换;或插入无效数字混淆原有数字表示的含义。
判断所述条目子模块中的字块图像是否含有英文字母和符号,若有则对所述英文字母和符号进行B加密,记录B加密规则,将B加密后的条目子模块供人工识别;根据所述B加密规则,对包含英文字母和符号的条目子模块的人工识别信息进行解密还原,获得所述条目子模块表示的真实信息。其中,所述B加密规则包括:对英文字母的位置进行随机调换;或插入无效英文字母或重复相邻英文字母混淆原有英文字母表示的含义。
根据所述对应所属关系,对经人工识别后的不同类别的条目子模块的信息进行重组,获得所述名片图像的完整信息。
假设有一张张三的名片图像,采用本发明所述的人工识别名片信息的防泄密处理方法可以使一个操作人员只获得张三的电话号码图像区域(即电话号码条目子模块),该操作人员可以识别出该条目子模块的类型是电话号码和该电话号码的内容,但他并不知道这个电话号码是谁的,从而达到了保护用户信息的目的。
对于某些孤立的名片区域条目图像信息,比如公司,职位,姓名,网页,并不会涉及到隐私;但是对于电话号码,完整的地址信息,电子邮件等条目,即使是孤立的条目子模块,也可以被利用来发送垃圾或者广告信息,对这部分区域的信息可以通过本发明所述的加密后在进行人工识别的方法来处理以达到保护用户信息的目的。
例如:电话号码是由数字组成的,如果条目中含有数字,再判断数字个数是否大于5,若是则可基本断定该条目子模块为电话号码,此时将数字的相对位置进行随机的调整,并记录下对应的调整关系,比如电话号码为18701750441,调整后变成10157044078,工人识别后,再通过所述对应的调整关系恢复条目信息。这样,操作人员将无法接触到准确的电话号码。
地址信息也会包含较少的数字,如果条目中含有数字,则可以通过插入数字或重复相邻数字的方式进行加密,并记录下密钥,比如地址中的“国定路3号”,则可以通过插入数字或重复相邻数字的方式将该地址加密变成“国定路333号”或者“国定路3333号”,并记录下有效数字的位置(即密钥),工人识别后,只需提取对应有效数字位置处的信息即可。这样,操作人员将无法接触到准确的地址信息。
电子邮箱基本都由英文字母和符号组成,如果条目中含有英文字母和符号,则对所述英文字母和符号进行加密,并记录下密钥,比如电子邮箱“abcdhotmail.com”,则可通过将英文字母的顺序打乱或者重复相邻的英文字母的方式将该电子邮箱加密为“ababccddhotmail.com”,其中重复相邻的英文字母的方式有多种,比如随机选取部分连续的英文字母加放在邮箱的头部或尾部;在工人对“ababccddhotmail.com”进行识别后,只需提取对应有效位置处的信息即可。这样,操作人员将无法接触到准确的电子邮箱地址。
本发明针对复杂的用机器识别算法难于识别或者要求极高识别率的名片图像,采用了一种人工识别的机制,通过将名片图像切割成条目子模块分发给操作人员识别,并在人工识别名片图像前,将涉及用户信息的条目子模块中的字块进行加密(如调换顺序或者增加冗余字块)的方法,既可以比机器更精确地识别名片,同时又能像机器识别名片一样,有效地保护用户的信息隐私。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (9)
1.一种人工识别名片信息的防泄密处理方法,其特征在于,所述人工识别名片信息的防泄密处理方法包括:
获取用户的名片图像;
将所述名片图像切割成不同类别的条目子模块,并记录所述条目子模块与所述名片图像的对应所属关系;
将所述不同类别的条目子模块分发给操作人员进行人工识别;
根据所述对应所属关系,对经人工识别后的不同类别的条目子模块的信息进行重组,获得所述名片图像的完整信息。
2.根据权利要求1所述的人工识别名片信息的防泄密处理方法,其特征在于:所述不同类别的条目子模块包括姓名条目子模块、公司条目子模块、职位条目子模块、电话号码条目子模块、电子邮件条目子模块、或/和网页条目子模块。
3.根据权利要求1所述的人工识别名片信息的防泄密处理方法,其特征在于,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:
将所述条目子模块继续切分成以单个数字、单个字符、或/和单个字母为单位的字块图像;
对每个字块图像进行识别,判断其为数字、字符还是字母。
4.根据权利要求3所述的人工识别名片信息的防泄密处理方法,其特征在于,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:
判断所述条目子模块中的字块图像是否含有数字,若有则对所述数字进行A加密,记录第A加密规则,将A加密后的条目子模块供人工识别。
5.根据权利要求4所述的人工识别名片信息的防泄密处理方法,其特征在于,所述A加密规则包括:
对数字的位置进行随机调换;或
插入无效数字混淆原有数字表示的含义。
6.根据权利要求4所述的人工识别名片信息的防泄密处理方法,其特征在于,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤还包括:
根据所述A加密规则,对人工识别后的包含数字的条目子模块的信息进行解密还原,获得所述条目子模块表示的真实信息。
7.根据权利要求3所述的人工识别名片信息的防泄密处理方法,其特征在于,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤包括:
判断所述条目子模块中的字块图像是否含有英文字母和符号,若有则对所述英文字母和符号进行B加密,记录B加密规则,将B加密后的条目子模块供人工识别。
8.根据权利要求7所述的人工识别名片信息的防泄密处理方法,其特征在于,所述B加密规则包括:
对英文字母的位置进行随机调换;或
插入无效英文字母或重复相邻英文字母混淆原有英文字母表示的含义。
9.根据权利要求7所述的人工识别名片信息的防泄密处理方法,其特征在于,将所述不同类别的条目子模块分发给操作人员进行人工识别的具体步骤还包括:
根据所述B加密规则,对人工识别后的包含英文字母和符号的条目子模块的信息进行解密还原,获得所述条目子模块表示的真实信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013101200439A CN103235946A (zh) | 2013-04-08 | 2013-04-08 | 人工识别名片信息的防泄密处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013101200439A CN103235946A (zh) | 2013-04-08 | 2013-04-08 | 人工识别名片信息的防泄密处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103235946A true CN103235946A (zh) | 2013-08-07 |
Family
ID=48883985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013101200439A Pending CN103235946A (zh) | 2013-04-08 | 2013-04-08 | 人工识别名片信息的防泄密处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103235946A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106330976A (zh) * | 2016-11-03 | 2017-01-11 | 武汉斗鱼网络科技有限公司 | 一种信息加、解密的方法及装置 |
CN113556330A (zh) * | 2021-07-06 | 2021-10-26 | 上海传英信息技术有限公司 | 名片信息管理方法、移动终端及存储介质 |
CN113688658A (zh) * | 2020-05-18 | 2021-11-23 | 华为技术有限公司 | 一种对象识别方法、装置、设备及介质 |
CN114640855A (zh) * | 2019-04-09 | 2022-06-17 | 西安万像电子科技有限公司 | 数据处理方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1877598A (zh) * | 2005-06-06 | 2006-12-13 | 英华达(上海)电子有限公司 | 手机中使用图像识别进行名片信息的采集与录入的方法 |
JP2008234291A (ja) * | 2007-03-20 | 2008-10-02 | Toshiba Corp | 文字認識装置及び文字認識方法 |
CN102622592A (zh) * | 2012-01-19 | 2012-08-01 | 北京友录在线科技发展有限公司 | 一种基于云技术的名片识别方法 |
-
2013
- 2013-04-08 CN CN2013101200439A patent/CN103235946A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1877598A (zh) * | 2005-06-06 | 2006-12-13 | 英华达(上海)电子有限公司 | 手机中使用图像识别进行名片信息的采集与录入的方法 |
JP2008234291A (ja) * | 2007-03-20 | 2008-10-02 | Toshiba Corp | 文字認識装置及び文字認識方法 |
CN102622592A (zh) * | 2012-01-19 | 2012-08-01 | 北京友录在线科技发展有限公司 | 一种基于云技术的名片识别方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106330976A (zh) * | 2016-11-03 | 2017-01-11 | 武汉斗鱼网络科技有限公司 | 一种信息加、解密的方法及装置 |
CN114640855A (zh) * | 2019-04-09 | 2022-06-17 | 西安万像电子科技有限公司 | 数据处理方法及系统 |
CN113688658A (zh) * | 2020-05-18 | 2021-11-23 | 华为技术有限公司 | 一种对象识别方法、装置、设备及介质 |
CN113556330A (zh) * | 2021-07-06 | 2021-10-26 | 上海传英信息技术有限公司 | 名片信息管理方法、移动终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1319331C (zh) | 一种检测鉴别假冒网页的方法及系统 | |
CN111539009B (zh) | 保护隐私数据的有监督特征分箱方法及装置 | |
CN110866281A (zh) | 一种用于敏感数据的安全合规处理系统及方法 | |
CN108304725A (zh) | 一种对政务数据资源脱敏的方法及系统 | |
CN105005884A (zh) | 快件签收方法、系统、服务器及手持终端 | |
CN103235946A (zh) | 人工识别名片信息的防泄密处理方法 | |
CN104361293B (zh) | 一种纸质防伪文件生成和辨别的方法及装置 | |
CN103532960B (zh) | 解密装置 | |
CN102930194A (zh) | 一种基于权限管控的数据安全操作系统及方法 | |
CN111402120A (zh) | 一种标注图像处理方法及装置 | |
CN106357608B (zh) | 一种面向个人医疗健康数据的隐私数据加密及解密方法 | |
CN103095737A (zh) | 一种网络浏览信息的处理方法和装置 | |
CN106934299A (zh) | 一种数据库加密系统和方法 | |
CN105898054A (zh) | 一种基于验证的消息显示方法及通信终端 | |
Liu et al. | A Large-Scale Study of Web Password Habits of Chinese Network Users. | |
CN103310019B (zh) | 面向检测机构标准信息与知识服务系统及方法 | |
CN110855611A (zh) | 一种数据外发方法、装置以及相关设备 | |
CN103559251B (zh) | 基于信息隐藏的数据安全保护方法 | |
CN110213202A (zh) | 标识加密匹配方法和装置、标识处理方法和装置 | |
CN107665314A (zh) | 在电子文档上签名的可信处理方法及装置 | |
CN107451036A (zh) | 输入提示方法、装置和设备 | |
Magno et al. | Stereotypes in search engine results: understanding the role of local and global factors | |
CN108415971A (zh) | 采用知识图谱推荐供求信息的方法和装置 | |
CN115471860B (zh) | 一种快递实名查验方法、系统及计算机可读存储介质 | |
CN113468546A (zh) | 一种图像处理方法及智能设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130807 |
|
RJ01 | Rejection of invention patent application after publication |