CN113177233A - 一种敏感数据识别方法及装置 - Google Patents

一种敏感数据识别方法及装置 Download PDF

Info

Publication number
CN113177233A
CN113177233A CN202110597331.8A CN202110597331A CN113177233A CN 113177233 A CN113177233 A CN 113177233A CN 202110597331 A CN202110597331 A CN 202110597331A CN 113177233 A CN113177233 A CN 113177233A
Authority
CN
China
Prior art keywords
data
sensitive
sensitive type
type model
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110597331.8A
Other languages
English (en)
Inventor
杜晋瑞
陈勇铨
周华
江俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yingfang Software Co ltd
Original Assignee
Shanghai Yingfang Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yingfang Software Co ltd filed Critical Shanghai Yingfang Software Co ltd
Priority to CN202110597331.8A priority Critical patent/CN113177233A/zh
Publication of CN113177233A publication Critical patent/CN113177233A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种敏感数据识别方法及装置,所述方法包括如下步骤:步骤S1,建立敏感类型模型,并确定敏感数据匹配比率;步骤S2,扫描欲进行敏感数据识别的数据库,根据数据库的多个维度信息确定相应的敏感类型模型;步骤S3,随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。

Description

一种敏感数据识别方法及装置
技术领域
本发明涉及计算机信息安全技术领域,特别是涉及一种对数据库系统中含有的敏感数据识别的敏感数据识别方法及装置。
背景技术
敏感数据又称隐私数据,常见的有姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等。目前,银行、保险、证券等金融机构保存的数据含有大量个人隐私的数据,这些与个人生活、工作密切相关的信息受到不同行业和政府数据隐私法规的管制。如果负责存储和发布这些信息的企业或政府无法保证数据隐私,他们就会面临严重的财务、法律或问责风险,同时在用户信任方面蒙受巨大损失。因此,有效可靠的敏感数据检测技术,相当重要。
在现有技术中,一般都是指定数据库对应的表名列名来确定是否进行脱敏,然而,这样的方式需要大量人工去完成,并有遗漏敏感数据的可能性,费事费力且效率低下。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种敏感数据识别方法及装置,以解决现有技术人工识别工作量大且可能遗漏敏感数据的问题,自动识别数据库是否含有敏感数据,并输出含有敏感数据的列及其类型。
为达上述目的,本发明提出一种敏感数据识别方法,包括如下步骤:
步骤S1,建立敏感类型模型,并确定敏感数据匹配比率;
步骤S2,扫描欲进行敏感数据识别的数据库,根据其中各表的各维度信息确定相应的敏感类型模型;
步骤S3,随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。
优选地,步骤S1进一步包括:
步骤S100,根据通用的敏感数据定义,建立通用的敏感类型模型;
步骤S101,自定义敏感类型,根据自定义的敏感类型建立自定义的敏感数据模型;
步骤S102,定义并预设敏感数据匹配比率。
优选地,于步骤S2中,扫描欲进行敏感数据识别的数据库,提取所述数据库的库名、表名、表注释,针对各个表获取列名及列注释并进行判断,从而确定相应的敏感类型模模型。
优选地,步骤S3进一步包括:
步骤S300,对所述数据库的每张表每列数据随机抽取预设数量数据;
步骤S301,根据步骤S2确定的敏感类型模型对抽取的当前列数据一一进行匹配,确定其是否与步骤S2中确定的敏感类型模型匹配;
步骤S302,根据步骤S301的匹配结果与步骤S1定义的敏感数据匹配比率,确定当前列数据是否属于敏感类型。
优选地,于步骤S300中,若当前表当前列的数据量大于预设阈值时,则抽取预设阈值量的数据;若当前表当前列的数据量小于或等于预设阈值时,则将当前表当前列的数据全部抽取。
优选地,于步骤S302中,当根据步骤S301的匹配结果,与步骤S2中确定的敏感类型模型匹配的数据量与抽取总量的比值大于步骤S1定义的敏感数据匹配比率,则确定当前列数据属于敏感类型。
为达到上述目的,本发明还提供一种敏感数据识别装置,包括如下步骤:
敏感类型模型构建单元,用于建立敏感类型模型,并确定敏感数据匹配比率;
敏感类型模型确定单元,用于扫描欲进行敏感数据识别的数据库,根据其中各表的各维度信息确定相应的敏感类型模型;
敏感数据识别单元,用于随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。
优选地,所述敏感类型模型构建单元进一步包括:
通用敏感类型模型构建模块,用于根据通用的敏感数据定义,建立通用的敏感类型模型;
自定义敏感类型构建模块,用于自定义敏感类型,根据自定义的敏感类型建立自定义的敏感数据模型;
敏感数据匹配比率定义模块,用于定义并预设敏感数据匹配比率。
优选地,所述敏感类型模型确定单元扫描欲进行敏感数据识别的数据库,提取所述数据库的库名、表名、表注释,针对各个表获取列名及列注释并进行判断,从而确定相应的敏感类型模模型。
优选地,所述敏感数据识别单元进一步包括:
抽取模块,用于对所述数据库的每张表每列数据随机抽取预设数量数据;
数据匹配模块,根据所述敏感类型模型确定单元确定的敏感类型模型对抽取的当前列数据一一进行匹配,确定是否与所述敏感类型模型确定单元中确定的敏感类型模型匹配;
敏感类型确定模块,用于根据所述数据匹配模块的匹配结果与敏感类型模型构建单元定义的敏感数据匹配比率,确定当前列数据是否属于敏感类型。
与现有技术相比,本发明一种敏感数据识别方法及装置通过建立敏感类型模型,确定敏感数据匹配比率,然后扫描欲进行敏感数据识别的数据库,根据数据库的多个维度信息确定相应的敏感类型模型,随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型,以自动识别数据库是否含有敏感数据,并输出含有敏感数据的列及其类型的目的,从而解决现有技术人工识别工作量大且可能遗漏敏感数据的问题,
附图说明
图1为本发明一种敏感数据识别方法的步骤流程图;
图2为本发明一种敏感数据识别装置的系统架构图;
图3为本发明实施例中敏感数据识别方法的流程图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种敏感数据识别方法的步骤流程图。如图1所示,本发明一种敏感数据识别方法,包括如下步骤:
步骤S1,建立敏感类型模型,并确定敏感数据匹配比率。
具体地,步骤S1进一步包括:
步骤S100,根据通用的敏感数据定义,建立通用的敏感类型模型。
于步骤S100中,可以根据现行通用的敏感数据定义建立通用的敏感类型模型。例如,现行通用的敏感类型有银行卡号、居民身份证号,电话号码等,而对于每种敏感类型,对应不同的格式特征,例如居民身份证号,其格式为18位全数字或17位数字加末尾一个字母等。
步骤S101,根据自定义的敏感数据,建立自定义的敏感数据模型。
也就是说,在本发明中,用户还可以对敏感数据进行自定义,例如用户可以自定义如金融行业、基金代码等非常见的敏感数据类型,并根据其对应的特征,构建自定义敏感数据模型。
步骤S102,确定敏感数据匹配比率。
在本发明中,预先确定并设置敏感数据匹配比率,本发明确定敏感数据匹配比率的目的是当数据库中某列的数据匹配对应的敏感类型模型超过该敏感数据匹配比率时,才将该列数据识别为敏感数据。例如当确定敏感数据匹配比率为50%时,只有当某列数据的匹配数据量超过检测总量的50%,认为该列数据为敏感数据。
步骤S2,扫描要进行敏感数据识别的数据库,根据数据库中各表的维度信息确定相应的敏感类型模型。
在本发明具体实施例中,扫描要进行敏感数据识别的数据库,提取数据库的库名、表名、表注释,并针对各个表的若干维度信息确定相应的敏感类型模型。具体地,首先获取表的列名、列注释,同时进行判断,并记录当前匹配的敏感类型,然后进入步骤S3对该列数据取值,判断,记录匹配的敏感类型和概率,最终确定是哪种敏感类型。
步骤S3,随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。
具体地,步骤S3进一步包括:
步骤S300,对所述数据库的每张表每列数据随机抽取一定量数据。
在本发明具体实施例中,若当前表的数据大于2000条,则随机抽取其中的2000条,若当前表的数据小于等于2000条,则全部抽取。
步骤S301,根据步骤S2确定的敏感类型模型对抽取的当前列数据一一进行匹配,确定是否与步骤S2中构建的敏感类型模型匹配。
例如,假设步骤S2确定当前列是通用的敏感类型模型,例如某一列名或列注释为居民身份证号码,确定该列为通用的敏感类型模型,则对该列提取的每个数据,一一判断其是否为18位以及判断其是否符合身份证规则,若符合,则表示匹配,否则,则表示不匹配。
步骤S302,根据步骤S301的匹配结果与步骤S1定义的敏感数据匹配比率,确定当前列数据是否属于敏感类型。
具体地说,当根据步骤S301的匹配结果,与步骤S2中构建的敏感类型模型匹配的数据量与抽取总量的比值大于步骤S1定义的敏感数据匹配比率,则确定当前列数据属于敏感类型,则需要进行脱敏,并输出含有敏感数据的列及其类型,例如,输出列名ID,抽样数据130203200301012730,类型中国居民身份证号等。
图2为本发明一种敏感数据识别装置的系统架构图。如图2所示,本发明一种敏感数据识别装置,包括如下步骤:
敏感类型模型构建单元20,用于建立敏感类型模型,并确定敏感数据匹配比率。
具体地,敏感类型模型构建单元20进一步包括:
通用敏感类型模型构建模块201,用于根据通用的敏感数据定义,建立通用的敏感类型模型。
通用敏感类型模型构建模块201可以根据现行通用的敏感数据定义建立通用的敏感类型模型。例如,现行通用的敏感类型有银行卡号、居民身份证号,电话号码等,而对于每种敏感类型,对应不同的格式特征,例如居民身份证号,其格式为18位全数字或17位数字加末尾一个字母,等。
自定义敏感类型构建模块202,用于自定义敏感数据,根据自定义的敏感数据建立自定义的敏感数据模型。
也就是说,在本发明中,用户还可以对敏感数据进行自定义,例如用户可以自定义如金融行业、基金代码等非常见的敏感数据类型,并根据其对应的特征,构建自定义敏感数据模型。
敏感数据匹配比率定义模块203,用于确定敏感数据匹配比率。
在本发明中,预先确定并设置敏感数据匹配比率,本发明确定敏感数据匹配比率的目的是当数据库中某列的数据匹配对应的敏感类型模型超过该敏感数据匹配比率时,才将该列数据识别为敏感数据。例如当确定敏感数据匹配比率为50%时,只有某列数据的匹配数据量为检测总量的50%,才认为该列数据为敏感数据。
敏感类型模型确定单元21,用于扫描要进行敏感数据识别的数据库,根据其中各表的多个维度信息确定相应的敏感类型模型。
在本发明具体实施例中,敏感类型模型确定单元21扫描要进行敏感数据识别的数据库,提取数据库的库名、表名、表注释,并针对各个表的若干维度信息确定相应的敏感类型模型。具体地,首先获取表的列名、列注释,同时进行判断,并记录当前匹配的敏感类型,然后进入敏感数据识别单元22对该列数据取值,判断,记录匹配的敏感类型和概率,最终确定是哪种敏感类型。
敏感数据识别单元22,用于随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。
具体地,敏感数据识别单元22进一步包括:
抽取模块221,用于对所述数据库的每张表每列数据随机抽取一定量数据。
在本发明具体实施例中,若当前表的数据大于2000条,则随机抽取其中的2000条,若当前表的数据小于等于2000条,则全部抽取。
数据匹配模块222,根据敏感类型模型确定单元21确定的敏感类型模型对抽取的当前列数据一一进行匹配,确定是否与敏感类型模型确定单元21中确定的敏感类型模型匹配。
例如,假设敏感类型模型确定单元21确定当前列是通用的敏感类型模型,例如某一列名或列注释为居民身份证号码,确定该列为通用的敏感类型模型,则对该列提取的每个数据,一一判断其是否为18位以及判断其是否符合身份证规则,若符合,则表示匹配,否则,则表示不匹配。
敏感类型确定模块223,用于根据数据匹配模块222的匹配结果与敏感类型模型构建单元20定义的敏感数据匹配比率,确定当前列数据是否属于敏感类型。
具体地说,当根据数据匹配模块222的匹配结果,与敏感类型模型确定单元21中构建的敏感类型模型匹配的数据量与抽取总量的比值大于敏感类型模型构建单元20定义的敏感数据匹配比率,则确定当前列数据属于敏感类型,则需要进行脱敏,并输出含有敏感数据的列及其类型,例如,输出列名ID,抽样数据130203200301012730,类型中国居民身份证号等。
实施例
如图3所示,在本实施例中,一种敏感数据识别方法的步骤如下:
步骤1,敏感类型建模,并定义敏感数据匹配比率。
具体地,根据用户现有的敏感数据定义,建立敏感类型模型,并根据现行通用的敏感数据定义,进行相应的敏感类型建模。
定义敏感数据匹配比率,当数据匹配敏感类型超过一定比率,该数据识别为敏感数据,例如当匹配数据量为检测总量的50%,认为该列数据为敏感数据。
步骤2,扫描数据库,通过数据库的库名,表名,表注释,列名,列注释几个维度,确定相应的敏感类型模型。
步骤3,对每张表每列数据随机抽取一定量数据。
具体地,若当前表的数据大于2000条,则随机抽取2000条;若当前表的数据小于等于2000条,则全部抽取。
步骤4,根据相应的敏感类型模型对列名,列注释进行匹配,确定该列是否为步骤1中构建的敏感类型,若是,则写入结果集。
步骤5,对抽取的数据进行匹配,确定是否为步骤1中构建的敏感类型,若是,则将匹配结果写入结果集。
步骤6,根据步骤5的匹配结果计算匹配的比率,根据匹配的比率与定义的敏感数据匹配比率判断该列数据是否为敏感数据,并将结果写入结果集。
步骤7,综合步骤4,5,6中的结果确定当前列数据是否为敏感类型。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。

Claims (10)

1.一种敏感数据识别方法,包括如下步骤:
步骤S1,建立敏感类型模型,并确定敏感数据匹配比率;
步骤S2,扫描欲进行敏感数据识别的数据库,根据其中各表的各维度信息确定相应的敏感类型模型;
步骤S3,随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。
2.如权利要求1所述的一种敏感数据识别方法,其特征在于,步骤S1进一步包括:
步骤S100,根据通用的敏感数据定义,建立通用的敏感类型模型;
步骤S101,自定义敏感类型,根据自定义的敏感类型建立自定义的敏感数据模型;
步骤S102,定义并预设敏感数据匹配比率。
3.如权利要求2所述的一种敏感数据识别方法,其特征在于:于步骤S2中,扫描欲进行敏感数据识别的数据库,提取所述数据库的库名、表名、表注释,针对各个表获取列名及列注释并进行判断,从而确定相应的敏感类型模模型。
4.如权利要求3所述的一种敏感数据识别方法,其特征在于,步骤S3进一步包括:
步骤S300,对所述数据库的每张表每列数据随机抽取预设数量数据;
步骤S301,根据步骤S2确定的敏感类型模型对抽取的当前列数据一一进行匹配,确定其是否与步骤S2中确定的敏感类型模型匹配;
步骤S302,根据步骤S301的匹配结果与步骤S1定义的敏感数据匹配比率,确定当前列数据是否属于敏感类型。
5.如权利要求4所述的一种敏感数据识别方法,其特征在于,于步骤S300中,若当前表当前列的数据量大于预设阈值时,则抽取预设阈值量的数据;若当前表当前列的数据量小于或等于预设阈值时,则将当前表当前列的数据全部抽取。
6.如权利要求5所述的一种敏感数据识别方法,其特征在于:于步骤S302中,当根据步骤S301的匹配结果,与步骤S2中确定的敏感类型模型匹配的数据量与抽取总量的比值大于步骤S1定义的敏感数据匹配比率,则确定当前列数据属于敏感类型。
7.一种敏感数据识别装置,包括如下步骤:
敏感类型模型构建单元,用于建立敏感类型模型,并确定敏感数据匹配比率;
敏感类型模型确定单元,用于扫描欲进行敏感数据识别的数据库,根据其中各表的各维度信息确定相应的敏感类型模型;
敏感数据识别单元,用于随机抽取所述数据库中每个表每列的若干数据,将其与确定的敏感类型模型匹配,根据匹配结果判断每列数据是否属于敏感类型。
8.如权利要求7所述的一种敏感数据识别装置,其特征在于,所述敏感类型模型构建单元进一步包括:
通用敏感类型模型构建模块,用于根据通用的敏感数据定义,建立通用的敏感类型模型;
自定义敏感类型构建模块,用于自定义敏感类型,根据自定义的敏感类型建立自定义的敏感数据模型;
敏感数据匹配比率定义模块,用于定义并预设敏感数据匹配比率。
9.如权利要求8所述的一种敏感数据识别装置,其特征在于:所述敏感类型模型确定单元扫描欲进行敏感数据识别的数据库,提取所述数据库的库名、表名、表注释,针对各个表获取列名及列注释并进行判断,从而确定相应的敏感类型模模型。
10.如权利要求9所述的一种敏感数据识别装置,其特征在于:所述敏感数据识别单元进一步包括:
抽取模块,用于对所述数据库的每张表每列数据随机抽取预设数量数据;
数据匹配模块,根据所述敏感类型模型确定单元确定的敏感类型模型对抽取的当前列数据一一进行匹配,确定是否与所述敏感类型模型确定单元中确定的敏感类型模型匹配;
敏感类型确定模块,用于根据所述数据匹配模块的匹配结果与敏感类型模型构建单元定义的敏感数据匹配比率,确定当前列数据是否属于敏感类型。
CN202110597331.8A 2021-05-31 2021-05-31 一种敏感数据识别方法及装置 Pending CN113177233A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110597331.8A CN113177233A (zh) 2021-05-31 2021-05-31 一种敏感数据识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110597331.8A CN113177233A (zh) 2021-05-31 2021-05-31 一种敏感数据识别方法及装置

Publications (1)

Publication Number Publication Date
CN113177233A true CN113177233A (zh) 2021-07-27

Family

ID=76927249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110597331.8A Pending CN113177233A (zh) 2021-05-31 2021-05-31 一种敏感数据识别方法及装置

Country Status (1)

Country Link
CN (1) CN113177233A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642030A (zh) * 2021-10-14 2021-11-12 广东鸿数科技有限公司 敏感数据多层识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123370A (zh) * 2014-07-24 2014-10-29 杭州安恒信息技术有限公司 数据库敏感信息探测方法及系统
CN104794204A (zh) * 2015-04-23 2015-07-22 上海新炬网络信息技术有限公司 一种数据库敏感数据自动识别方法
CN107291737A (zh) * 2016-04-01 2017-10-24 腾讯科技(深圳)有限公司 敏感图像识别方法及装置
CN111191275A (zh) * 2019-11-28 2020-05-22 深圳云安宝科技有限公司 敏感数据识别方法、系统及其装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123370A (zh) * 2014-07-24 2014-10-29 杭州安恒信息技术有限公司 数据库敏感信息探测方法及系统
CN104794204A (zh) * 2015-04-23 2015-07-22 上海新炬网络信息技术有限公司 一种数据库敏感数据自动识别方法
CN107291737A (zh) * 2016-04-01 2017-10-24 腾讯科技(深圳)有限公司 敏感图像识别方法及装置
CN111191275A (zh) * 2019-11-28 2020-05-22 深圳云安宝科技有限公司 敏感数据识别方法、系统及其装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642030A (zh) * 2021-10-14 2021-11-12 广东鸿数科技有限公司 敏感数据多层识别方法

Similar Documents

Publication Publication Date Title
CN111861731A (zh) 基于ocr的贷后检查系统及方法
CN110413569A (zh) 纸质档案电子化归档方法、装置及终端设备
CN104750791A (zh) 一种图像检索方法及装置
CN116089620A (zh) 一种电子档案数据管理方法和系统
CN113177233A (zh) 一种敏感数据识别方法及装置
CN111259207A (zh) 短信的识别方法、装置及设备
CN111861733B (zh) 基于地址模糊匹配的欺诈防控系统及方法
CN110955796B (zh) 一种基于笔录信息的案件特征信息提取方法及装置
CN115688107B (zh) 一种涉诈app检测系统和方法
EP3662393A1 (en) Automated reporting system
CN115482075A (zh) 财务数据的异常分析方法、装置、电子设备及存储介质
CN114817518A (zh) 基于大数据档案识别的证照办理方法、系统及介质
CN115017256A (zh) 电力数据处理方法、装置、电子设备及存储介质
RU2739342C1 (ru) Способ и система интеллектуальной обработки документа
CN111859896B (zh) 配方文档检测方法、装置、计算机可读介质及电子设备
CN113688240A (zh) 威胁要素提取方法、装置、设备及存储介质
CN112417007A (zh) 一种数据分析方法、装置、电子设备及存储介质
JPH11219394A (ja) 財務諸表自動入力装置
CN111428497A (zh) 一种自动抽取出资信息的方法、装置及设备
WO2021054850A1 (ru) Способ и система интеллектуальной обработки документа
CN116841424B (zh) 一种屏幕截图监控方法及系统
CN114462405A (zh) 文本类别的识别方法和装置、存储介质及电子装置
CN115033633B (zh) 一种信创环境下的远程运维服务实现方法及系统
EP4006768A1 (en) Method and system for text cleaning
CN114724150A (zh) 业务信息智能检测方法、装置、计算机设备、介质和产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210727