CN117275007A - 账户信息识别分类器生成方法、装置及资源卡片识别方法 - Google Patents

账户信息识别分类器生成方法、装置及资源卡片识别方法 Download PDF

Info

Publication number
CN117275007A
CN117275007A CN202311057889.2A CN202311057889A CN117275007A CN 117275007 A CN117275007 A CN 117275007A CN 202311057889 A CN202311057889 A CN 202311057889A CN 117275007 A CN117275007 A CN 117275007A
Authority
CN
China
Prior art keywords
account information
sample
resource
card
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311057889.2A
Other languages
English (en)
Inventor
郭健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202311057889.2A priority Critical patent/CN117275007A/zh
Publication of CN117275007A publication Critical patent/CN117275007A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种账户信息识别分类器生成方法、装置及资源卡片识别方法。方法包括:获取携带有样本资源账户的样本账户信息的样本卡面图像;将样本卡面图像输入待训练的多个子账户信息识别分类器,通过各子账户信息识别分类器,得到各子账户信息识别分类器分别对应的预测账户信息;多个账户信息识别分类器分别对应于不同的账户信息识别模式;获取各预测账户信息与样本账户信息之间的差异,根据差异对各子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器;获取各子账户信息识别分类器对应的权重,按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。采用本方法能够提高账户信息进行识别的准确性。

Description

账户信息识别分类器生成方法、装置及资源卡片识别方法
技术领域
本申请涉及人工智能技术领域,特别是涉及一种账户信息识别分类器生成方法、装置及资源卡片识别方法。
背景技术
在日常资源交互场景中,通常需要对绑定有资源账户的资源卡片的账户信息识别。通过对资源卡片的卡面图像进行账户信息识别,以获取记录在资源卡片上所绑定的账户信息。
目前对于资源卡片的账户信息进行识别,过于复杂,没有统一的、系统化的方法,进行不同的资源卡片的账户信息识别需要手动编写程序来处理特征;如果程序编写出错导致计算错误从而使得结果出现错误,而开发人员较难发现计算错误。
现有对于资源卡片的账户信息的识别方法存在准确性低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高针对资源卡片上的账户信息的识别准确性的账户信息识别分类器生成方法、装置及资源卡片识别方法。
第一方面,本申请提供了一种账户信息识别分类器生成方法,该方法包括:
获取携带有样本资源账户的样本账户信息的样本卡面图像;样本卡面图像为与样本资源账户绑定的资源卡片的卡面图像;
将样本卡面图像输入待训练的多个子账户信息识别分类器,通过各子账户信息识别分类器,得到各子账户信息识别分类器分别对应的预测账户信息;多个账户信息识别分类器分别对应于不同的账户信息识别模式;
获取各预测账户信息与样本账户信息之间的差异,根据差异对各子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器;
获取各子账户信息识别分类器对应的权重,按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。
在其中一个实施例中,获取各子账户信息识别分类器对应的权重,包括:
获取各子账户信息识别分类器的预测账户信息和样本账户信息之间的差异程度;
根据各子账户信息识别分类器对应的差异程度,确定各子账户信息识别分类器对应的权重。
在其中一个实施例中,获取携带有样本资源账户的样本账户信息的样本卡面图像,包括:
获取携带有样本资源账户的样本账户信息的初始卡片图像;
对初始资源卡片图像进行离群点检测处理,得到检测处理后的资源卡片图像;
对检测处理后的资源卡片图像进行去重处理,得到去重处理后的资源卡片图像;
将去重处理后的资源卡片图像进行去噪处理,得到样本卡面图像。
在其中一个实施例中,将去重处理后的资源卡片图像进行去噪处理,得到样本卡面图像,包括:
对去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像;
对去噪处理后的资源卡片图像进行重采样,得到样本卡面图像。
在其中一个实施例中,将去重处理后的资源卡片图像进行去噪处理,得到样本卡面图像,包括:
对去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像;
将去噪处理后的资源卡片图像进行归一化处理,得到样本卡面图像。
在其中一个实施例中,将样本卡面图像输入待训练的多个子账户信息识别分类器之前,包括:
根据预先设定的资源卡片图像筛选条件,从样本卡面图像中,筛选出目标样本卡面图像;
将样本卡面图像输入待训练的多个子账户信息识别分类器,包括:
将目标样本卡面图像输入多个不同的资源卡片识别分类器。
第二方面,本申请提供了一种资源卡片识别方法,该方法包括:
获取携带有资源账户的账户信息的待识别资源卡片图像;待识别卡面图像为与资源账户绑定的待识别资源卡片的卡面图像;
将待识别资源卡片图像输入至预先训练的账户信息识别分类器,通过账户信息识别分类器,获取待识别资源卡片图像的账户信息;账户信息识别分类器通过上述的账户信息识别分类器生成方法得到。
第三方面,本申请还提供了一种账户信息识别分类器生成装置,该装置包括:
样本图像获取模块,用于获取携带有样本资源账户的样本账户信息的样本卡面图像;样本卡面图像为与样本资源账户绑定的资源卡片的卡面图像;
预测信息获取模块,用于将样本卡面图像输入待训练的多个子账户信息识别分类器,通过各子账户信息识别分类器,得到各子账户信息识别分类器分别对应的预测账户信息;多个账户信息识别分类器分别对应于不同的账户信息识别模式;
子分类器训练模块,用于获取各预测账户信息与样本账户信息之间的差异,根据差异对各子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器;
分类器集成模块,用于获取各子账户信息识别分类器对应的权重,按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。
第四方面,本申请还提供了一种计算机设备。该计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的方法的步骤。
第五方面,本申请还提供了一种计算机可读存储介质。该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法的步骤。
上述账户信息识别分类器生成方法、装置及资源卡片识别方法,获取携带有样本资源账户的样本账户信息的样本卡面图像;样本卡面图像为与样本资源账户绑定的资源卡片的卡面图像;将样本卡面图像输入待训练的多个子账户信息识别分类器,通过各子账户信息识别分类器,得到各子账户信息识别分类器分别对应的预测账户信息;多个账户信息识别分类器分别对应于不同的账户信息识别模式;获取各预测账户信息与样本账户信息之间的差异,根据差异对各子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器;获取各子账户信息识别分类器对应的权重,按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。与传统技术相比,本申请通过训练得到多个子账户信息识别分类器,并且按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。如此,通过多个子账户信息识别分类器集成得到账户信息识别分类器,能够提高账户信息识别分类器对于资源卡片上的账户信息进行识别的准确性。同时,将本申请提供的账户信息识别分类器应用于资源卡片的账户信息识别,能够提高账户信息识别的准确性。
附图说明
图1为一个实施例中账户信息识别分类器生成方法的流程示意图;
图2为一个实施例中获取各子账户信息识别分类器对应的权重步骤的流程示意图;
图3为一个实施例中获取携带有样本资源账户的样本账户信息的样本卡面图像步骤的流程示意图;
图4为一个实施例中一种资源卡片识别方法的流程示意图;
图5为一个实施例中账户信息识别分类器生成装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种账户信息识别分类器生成方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
S102,获取携带有样本资源账户的样本账户信息的样本卡面图像;样本卡面图像为与样本资源账户绑定的资源卡片的卡面图像。
其中,样本资源账户可以是金融资源账户,金融资源账户可以用于对金融资源进行管理存储。样本账户信息可以是用于表征样本资源账户的信息。资源卡片可以是金融资源卡片,金融资源卡片可以用于进行资源交换,金融资源卡片可以绑定有资源账户。样本卡面图像指的是资源卡片的卡面图像。
示例性地,可以获取样本卡面图像,该样本卡面图像上携带有样本资源账户的样本账户信息。样本账户信息表征样本资源账户的信息。进一步,可以通过对样本卡面图像进行信息识别,得到样本账户信息。
S104,将样本卡面图像输入待训练的多个子账户信息识别分类器,通过各子账户信息识别分类器,得到各子账户信息识别分类器分别对应的预测账户信息;多个账户信息识别分类器分别对应于不同的账户信息识别模式。
其中,多个子账户信息识别分类器可以是具有不同账户信息识别模式的子账户信息识别分类器。预测账户信息指的是子账户信息识别分类器对样本卡面图像进行信息识别处理后得到的预测结果信息。
示例性地,将样本卡面图像分别输入待训练的多个子账户信息识别分类器,通过各子账户信息识别分类器具有的不同账户信息识别模式,对样本卡面图像进行账户信息识别,得到各子账户信息识别分类器分别对应的预测账户信息。
S106,获取各预测账户信息与样本账户信息之间的差异,根据差异对各子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器。
示例性地,可以根据各子账户信息识别分类器对应的损失函数、各预测账户信息以及样本账户信息,获取各子账户信息识别分类器对应的损失值,利用各子账户信息识别分类器对应的损失值,对各子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器。
S108,获取各子账户信息识别分类器对应的权重,按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。
示例性地,可以按照权重将训练完成的各子账户信息识别分类器进行加权处理,将加权后的各子账户信息识别分类器进行集成学习,得到账户信息识别分类器。将多个机器学习算法采用集成学习方法来进行融合,生成一个强的账户信息识别分类器。
本实施例中,获取携带有样本资源账户的样本账户信息的样本卡面图像;样本卡面图像为与样本资源账户绑定的资源卡片的卡面图像;将样本卡面图像输入待训练的多个子账户信息识别分类器,通过各子账户信息识别分类器,得到各子账户信息识别分类器分别对应的预测账户信息;多个账户信息识别分类器分别对应于不同的账户信息识别模式;获取各预测账户信息与样本账户信息之间的差异,根据差异对各子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器;获取各子账户信息识别分类器对应的权重,按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。与传统技术相比,本申请通过训练得到多个子账户信息识别分类器,并且按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。如此,通过多个子账户信息识别分类器集成得到账户信息识别分类器,能够提高账户信息识别分类器对于资源卡片上的账户信息进行识别的准确性。
在一个实施例中,如图2所示,获取各子账户信息识别分类器对应的权重,包括:
S202,获取各子账户信息识别分类器的预测账户信息和样本账户信息之间的差异程度;
S204,根据各子账户信息识别分类器对应的差异程度,确定各子账户信息识别分类器对应的权重。
其中,差异程度指的是预测账户信息和样本账户信息之间的差异程度,例如,可以是预测账户信息和样本账户信息之间的误差。
示例性地,对于每一个子账户信息识别分类器,计算预测账户信息和样本账户信息之间的误差。根据误差,确定该子账户信息识别分类器的权重。
例如,可以是误差小的子账户信息识别分类器的权重大。
本实施例中,通过根据各子账户信息识别分类器对应的差异程度,确定各子账户信息识别分类器对应的权重,如此,能够在集成学习过程中,使得差异程度小的子账户信息识别分类器占比更大,从而能够提高账户信息识别分类器对于资源卡片上的账户信息进行识别的准确性。
在一个实施例中,如图3所示,获取携带有样本资源账户的样本账户信息的样本卡面图像,包括:
S302,获取携带有样本资源账户的样本账户信息的初始卡片图像;
S304,对初始资源卡片图像进行离群点检测处理,得到检测处理后的资源卡片图像;
S306,对检测处理后的资源卡片图像进行去重处理,得到去重处理后的资源卡片图像;
S308,将去重处理后的资源卡片图像进行去噪处理,得到样本卡面图像。
其中,初始卡片图像可以是未经过图像处理的卡片图像。
示例性地,可以对初始卡片图像进行预处理得到样本卡面图像。例如,利用隔离森林离群点检测方法,将初始资源卡片图像进行离群点检测处理,得到检测处理后的资源卡片图像,将检测处理后的资源卡片图像进行去重处理,得到去重处理后的资源卡片图像;将去重处理后的资源卡片图像进行去噪处理,得到样本卡面图像。如此,能够样本卡面图像的准确性,从而能够提高账户信息识别分类器对于资源卡片上的账户信息进行识别的准确性。
本实施例中,通过对初始卡片图像进行预处理得到样本卡面图像,提高了对多个子账户信息识别分类器训练的准确性,进而提高了资源卡片上的账户信息进行识别的准确性。
在一个实施例中,将去重处理后的资源卡片图像进行去噪处理,得到样本卡面图像,包括:
对去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像;
对去噪处理后的资源卡片图像进行重采样,得到样本卡面图像。
示例性地,可以利用SMOTE(Synthetic Minority Oversampling)算法,对去噪处理后的资源卡片图像进行重采样,得到样本卡面图像。
本实施例中,通过对资源卡片图像进行重采样,得到样本卡面图像,从而能够提高对多个子账户信息识别分类器训练的准确性,进一步能够提高账户信息识别分类器的准确性。
在一个实施例中,将去重处理后的资源卡片图像进行去噪处理,得到样本卡面图像,包括:
对去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像;
将去噪处理后的资源卡片图像进行归一化处理,得到样本卡面图像。
示例性地,可以将去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像。通过归一化或者标准化处理,可以将不同维度的资源卡片图像放在一起进行比较。如此,提高账户信息识别分类器的准确性
本实施例中,通过将去噪处理后的资源卡片图像进行归一化处理,得到样本卡面图像,从而能够提高子账户信息识别分类器训练的准确性,能够提高对集学习得到的账户信息识别分类器的准确性。
在一个实施例中,将样本卡面图像输入待训练的多个子账户信息识别分类器之前,包括:
根据预先设定的资源卡片图像筛选条件,从样本卡面图像中,筛选出目标样本卡面图像;
将样本卡面图像输入待训练的多个子账户信息识别分类器,包括:
将目标样本卡面图像输入多个不同的资源卡片识别分类器。
示例性地,可以预先设定的资源卡片图像筛选条件,从样本卡面图像中,筛选出目标样本卡面图像。利用可以是样本卡面图像的特征子集选择(Feature Subset Selection,FSS),或是样本卡面图像的属性选择(Attribute Selection),从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。
本实施例中,通过对资源卡片图像进行筛选,能够提高账户信息识别分类器的性能,从而能提高账户信息识别分类器的准确性。
在一个实施例中,如图4所示,提供了一种资源卡片识别方法,该方法包括:
S402,获取携带有资源账户的账户信息的待识别资源卡片图像;待识别卡面图像为与资源账户绑定的待识别资源卡片的卡面图像;
S404,将待识别资源卡片图像输入至预先训练的账户信息识别分类器,通过账户信息识别分类器,获取待识别资源卡片图像的账户信息;账户信息识别分类器通过上述的账户信息识别分类器生成方法得到。
其中,资源账户可以是金融资源账户,金融资源账户可以用于对金融资源进行管理存储。账户信息可以是用于表征资源账户的信息。待识别资源卡片指的是待进行资源账户信息识别的金融资源卡片。待识别资源卡片图像指的是待进行资源账户信息识别的资源卡片的图像。账户信息识别分类器可以通过上述的账户信息识别分类器生成方法得到。
示例性地,可以获取待识别资源卡片图像,该待识别资源卡片图像上携带有资源账户的账户信息。将待识别资源卡片图像输入至预先训练的账户信息识别分类器,通过账户信息识别分类器,获取待识别资源卡片图像的账户信息;账户信息识别分类器通过上述的账户信息识别分类器生成方法得到。
本实施例中,通过将本申请提供的账户信息识别分类器应用于资源卡片的账户信息识别,能够提高对资源卡片上的账户信息识别的准确性。
在一个实施例中,提供了一种基于集成学习的资源卡片账户信息识别模分类器的生成方法,包括:
主要分为三个部分,第一部分为特征工程部分,主要有缺失值处理、数据清洗、数据重采样、特征缩放和特征选择,缺失值处理的三种方法:直接使用含有缺失值的特征;删除含有缺失值的特征(该方法在包含缺失值的属性含有大量缺失值而仅仅包含极少量有效值时是有效的);缺失值补全。数据清洗主要对三类异常数据进行处理;分别是异常值(离群点)、去重处理(Duplicate Data)以及噪音数据的处理。数据重采样可以使用一些策略该减轻数据的不平衡程度,数据重采样主要分为欠采样(under-sampling)和过采样(over-sampling)。特征缩放通过归一化/标准化数据可以使不同维度的特征放在一起进行比较,可以大大提高模型的准确性。特征子集选择(Feature Subset Selection,FSS),或是样本卡面图像的属性选择(Attribute Selection),从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。第二部分为图像分类,主要通过机器学习算法来将图像根据某种规则划分为不同类别。第三部分为集成学习部分,主要是将多个机器学习算法采用集成学习方法来进行融合,从而生成一个强分类器。
基于集成学习的资源卡片账户信息识别模分类器的生成模块,包括:
数据输入模块:将特征数据作为已有数据输入系统。
特征处理模块:对输入的数据集进行特征处理,将数据处理成可用样本集。
特征选择模块:根据处理之后的特征数据筛选出最具有整体表征性的数据。
图像分类模块:根据处理后的特征数据进行图像分类。
算法融合模块:利用不同算法对训练集进行分类,根据结果计算各个算法的权重,从而进行算法融合。
各个模块的处理步骤包括:
数据输入模块得到预先准备好的数据集。
启动特征处理模块,将数据集进行清洗和重采样等步骤。
启动特征选择模块,基于处理好的数据集计算出具有表征性的特征。
启动图像分类模块:基于处理好的特征数据进行图像分类。
启动算法融合模块:基于不同的机器学习算法得到的结果生成强学习器,从而进行最终分类。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的账户信息识别分类器生成方法的账户信息识别分类器生成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个账户信息识别分类器生成装置实施例中的具体限定可以参见上文中对于账户信息识别分类器生成方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种账户信息识别分类器生成装置,包括:样本图像获取模块510、预测信息获取模块520、子分类器训练模块530和分类器集成模块540,其中:
样本图像获取模块510,用于获取携带有样本资源账户的样本账户信息的样本卡面图像;样本卡面图像为与样本资源账户绑定的资源卡片的卡面图像。
预测信息获取模块520,用于将样本卡面图像输入待训练的多个子账户信息识别分类器,通过各子账户信息识别分类器,得到各子账户信息识别分类器分别对应的预测账户信息;多个账户信息识别分类器分别对应于不同的账户信息识别模式。
子分类器训练模块530,用于获取各预测账户信息与样本账户信息之间的差异,根据差异对各子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器。
分类器集成模块540,用于获取各子账户信息识别分类器对应的权重,按照权重将训练完成的各子账户信息识别分类器进行集成,得到账户信息识别分类器。
在一个实施例中,分类器集成模块包括差异程度获取单元和权重确定单元。
差异程度获取单元用于获取各子账户信息识别分类器的预测账户信息和样本账户信息之间的差异程度。权重确定单元用于根据各子账户信息识别分类器对应的差异程度,确定各子账户信息识别分类器对应的权重。
在一个实施例中,样本图像获取模块包括初始图像获取单元、检测处理单元、去重处理单元和去噪处理单元。
初始图像获取单元用于获取携带有样本资源账户的样本账户信息的初始卡片图像。检测处理单元用于对初始资源卡片图像进行离群点检测处理,得到检测处理后的资源卡片图像。用于对检测处理后的资源卡片图像进行去重处理,得到去重处理后的资源卡片图像。去噪处理单元用于将去重处理后的资源卡片图像进行去噪处理,得到样本卡面图像。
在一个实施例中,去噪处理单元包括去噪图像单元和重采样单元。
去噪图像单元用于对去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像。重采样单元用于对去噪处理后的资源卡片图像进行重采样,得到样本卡面图像。
在一个实施例中,去噪处理单元包括去噪图像单元和归一化单元。
去噪图像单元用于对去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像。归一化单元用于将去噪处理后的资源卡片图像进行归一化处理,得到样本卡面图像。
在一个实施例中,该装置还包括筛选模块。筛选模块用于根据预先设定的资源卡片图像筛选条件,从样本卡面图像中,筛选出目标样本卡面图像。预测信息获取模块用于将目标样本卡面图像输入多个不同的资源卡片识别分类器。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的资源卡片识别方法的资源卡片识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个资源卡片识别装置实施例中的具体限定可以参见上文中对于资源卡片识别方法的限定,在此不再赘述。
在一个实施例中,提供了一种资源卡片识别装置,该装置包括:待识别图像获取模块和账户信息识别模块。
待识别图像获取模块,用于获取携带有资源账户的账户信息的待识别资源卡片图像;待识别卡面图像为与资源账户绑定的待识别资源卡片的卡面图像。
账户信息识别模块,用于将待识别资源卡片图像输入至预先训练的账户信息识别分类器,通过账户信息识别分类器,获取待识别资源卡片图像的账户信息;账户信息识别分类器通过上述的账户信息识别分类器生成方法得到。
上述账户信息识别分类器生成装置、资源卡片识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本卡面图像数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种账户信息识别分类器生成方法、一种资源卡片识别方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种账户信息识别分类器生成方法,其特征在于,所述方法包括:
获取携带有样本资源账户的样本账户信息的样本卡面图像;所述样本卡面图像为与所述样本资源账户绑定的资源卡片的卡面图像;
将所述样本卡面图像输入待训练的多个子账户信息识别分类器,通过各所述子账户信息识别分类器,得到各所述子账户信息识别分类器分别对应的预测账户信息;所述多个账户信息识别分类器分别对应于不同的账户信息识别模式;
获取各所述预测账户信息与所述样本账户信息之间的差异,根据所述差异对各所述子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器;
获取各所述子账户信息识别分类器对应的权重,按照所述权重将训练完成的各所述子账户信息识别分类器进行集成,得到账户信息识别分类器。
2.根据权利要求1所述的方法,其特征在于,所述获取各所述子账户信息识别分类器对应的权重,包括:
获取各所述子账户信息识别分类器的预测账户信息和样本账户信息之间的差异程度;
根据各所述子账户信息识别分类器对应的差异程度,确定各所述子账户信息识别分类器对应的权重。
3.根据权利要求1所述的方法,其特征在于,所述获取携带有样本资源账户的样本账户信息的样本卡面图像,包括:
获取携带有样本资源账户的样本账户信息的初始卡片图像;
对所述初始资源卡片图像进行离群点检测处理,得到检测处理后的资源卡片图像;
对所述检测处理后的资源卡片图像进行去重处理,得到去重处理后的资源卡片图像;
将所述去重处理后的资源卡片图像进行去噪处理,得到所述样本卡面图像。
4.根据权利要求3所述的方法,其特征在于,所述将所述去重处理后的资源卡片图像进行去噪处理,得到所述样本卡面图像,包括:
对所述去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像;
对所述去噪处理后的资源卡片图像进行重采样,得到所述样本卡面图像。
5.根据权利要求3所述的方法,其特征在于,所述将所述去重处理后的资源卡片图像进行去噪处理,得到所述样本卡面图像,包括:
对所述去重处理后的资源卡片图像进行去噪处理,得到去噪处理后的资源卡片图像;
将所述去噪处理后的资源卡片图像进行归一化处理,得到所述样本卡面图像。
6.根据权利要求1所述的方法,其特征在于,所述将所述样本卡面图像输入待训练的多个子账户信息识别分类器之前,包括:
根据预先设定的资源卡片图像筛选条件,从所述样本卡面图像中,筛选出目标样本卡面图像;
所述将所述样本卡面图像输入待训练的多个子账户信息识别分类器,包括:
将所述目标样本卡面图像输入多个不同的资源卡片识别分类器。
7.一种资源卡片识别方法,其特征在于,所述方法包括:
获取携带有资源账户的账户信息的待识别资源卡片图像;所述待识别卡面图像为与所述资源账户绑定的待识别资源卡片的卡面图像;
将所述待识别资源卡片图像输入至预先训练的账户信息识别分类器,通过所述账户信息识别分类器,获取所述待识别资源卡片图像的账户信息;所述账户信息识别分类器通过权利要求1至6任一项所述的账户信息识别分类器生成方法得到。
8.一种账户信息识别分类器生成装置,其特征在于,所述装置包括:
样本图像获取模块,用于获取携带有样本资源账户的样本账户信息的样本卡面图像;所述样本卡面图像为与所述样本资源账户绑定的资源卡片的卡面图像;
预测信息获取模块,用于将所述样本卡面图像输入待训练的多个子账户信息识别分类器,通过各所述子账户信息识别分类器,得到各所述子账户信息识别分类器分别对应的预测账户信息;所述多个账户信息识别分类器分别对应于不同的账户信息识别模式;
子分类器训练模块,用于获取各所述预测账户信息与所述样本账户信息之间的差异,根据所述差异对各所述子账户信息识别分类器进行训练,得到训练完成的多个子账户信息识别分类器;
分类器集成模块,用于获取各所述子账户信息识别分类器对应的权重,按照所述权重将训练完成的各所述子账户信息识别分类器进行集成,得到账户信息识别分类器。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202311057889.2A 2023-08-21 2023-08-21 账户信息识别分类器生成方法、装置及资源卡片识别方法 Pending CN117275007A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311057889.2A CN117275007A (zh) 2023-08-21 2023-08-21 账户信息识别分类器生成方法、装置及资源卡片识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311057889.2A CN117275007A (zh) 2023-08-21 2023-08-21 账户信息识别分类器生成方法、装置及资源卡片识别方法

Publications (1)

Publication Number Publication Date
CN117275007A true CN117275007A (zh) 2023-12-22

Family

ID=89208632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311057889.2A Pending CN117275007A (zh) 2023-08-21 2023-08-21 账户信息识别分类器生成方法、装置及资源卡片识别方法

Country Status (1)

Country Link
CN (1) CN117275007A (zh)

Similar Documents

Publication Publication Date Title
Samek et al. Evaluating the visualization of what a deep neural network has learned
WO2017143914A1 (zh) 一种利用训练数据训练模型的方法和训练系统
CN111461225B (zh) 客户聚类系统及其方法
CN111882426A (zh) 业务风险分类器训练方法、装置、设备及存储介质
CN117033039A (zh) 故障检测方法、装置、计算机设备和存储介质
US20240126730A1 (en) Schema Validation with Data Synthesis
US11593622B1 (en) Artificial intelligence system employing graph convolutional networks for analyzing multi-entity-type multi-relational data
CN117009873A (zh) 支付风险识别模型的生成方法、支付风险识别方法及装置
US20200013201A1 (en) Method and system for solving inverse problems in image processing using deep dictionary learning (ddl)
CN114782960B (zh) 模型训练方法、装置、计算机设备及计算机可读存储介质
CN117275007A (zh) 账户信息识别分类器生成方法、装置及资源卡片识别方法
CN111291838B (zh) 实体对象分类结果的解释方法和装置
CN114611592A (zh) 一种半监督特征选择方法、系统、介质、设备及终端
CN114170000A (zh) 信用卡用户风险类别识别方法、装置、计算机设备和介质
Mohan et al. Graph signal recovery using restricted Boltzmann machines
CN117710100B (zh) 基于区块链的数据分析方法及计算服务器
CN113239878B (zh) 图像分类方法、装置、设备及介质
CN116016142B (zh) 传感网络故障识别方法、装置、计算机设备和存储介质
US10719490B1 (en) Forensic analysis using synthetic datasets
CN117436882A (zh) 异常交易识别方法、装置、计算机设备和存储介质
CN117041015A (zh) 网络故障检测方法、装置、计算机设备和存储介质
CN116631420A (zh) 音频修复方法、装置、计算机设备和存储介质
CN117077813A (zh) 一种机器学习模型的训练方法及训练系统
CN117808605A (zh) 保险欺诈判断方法、模型训练方法、装置和计算机设备
CN116664295A (zh) 交易数据的处理方法、装置、设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination