CN113362151A - 金融业务的数据处理方法、装置、电子设备及存储介质 - Google Patents

金融业务的数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113362151A
CN113362151A CN202110740238.8A CN202110740238A CN113362151A CN 113362151 A CN113362151 A CN 113362151A CN 202110740238 A CN202110740238 A CN 202110740238A CN 113362151 A CN113362151 A CN 113362151A
Authority
CN
China
Prior art keywords
account
target
type
name
account name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110740238.8A
Other languages
English (en)
Other versions
CN113362151B (zh
Inventor
邹志明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202110740238.8A priority Critical patent/CN113362151B/zh
Publication of CN113362151A publication Critical patent/CN113362151A/zh
Application granted granted Critical
Publication of CN113362151B publication Critical patent/CN113362151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请适用于数据分析、技术领域,提供一种金融业务的数据处理方法、装置、电子设备及存储介质。其方法包括:获取待处理金融业务对应的账户信息,所述账户信息中包含有目标账户的账户名称;对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型;根据所述属性类型确定所述待处理金融业务的风控规则,并按照确定的所述风控规则执行对所述待处理金融业务的数据处理操作。该方法实现了根据不同的账户属性类型针对性地配置金融业务的风控规则,从而在对金融业务进行数据处理时可以采用针对性的风控规则来对金融业务进行风险把控,提高了风险识别的准确率,风险把控的效果更好。

Description

金融业务的数据处理方法、装置、电子设备及存储介质
技术领域
本申请涉及数据分析、智能推荐技术领域,尤其涉及一种金融业务的数据处理方法、装置、电子设备及存储介质。
背景技术
风险是金融机构业务固有特性,与金融机构相伴而生。金融机构是指生产金融产品、提供金融服务、帮助客户承担风险同时能够有效管理自身风险的机构。金融机构盈利的来源是承担风险的风险溢价,而决定金融机构是否盈利的关键就在于是否能够准确有效地对其提供的金融业务进行风险监控。然而,目前在金融交易场景中,通常需要通过人工审查金融业务交易数据的方式来进行风险监控,过程繁琐,效率低下且容易出错,难以满足现今对金融业务的风控需求。
发明内容
有鉴于此,本申请实施例提供了一种金融业务的数据处理方法、装置、电子设备及存储介质,可以在对金融业务进行数据处理时提高风险识别的准确率,使得风险把控的效果更好。
本申请实施例的第一方面提供了一种金融业务的数据处理方法,包括:
获取待处理金融业务对应的账户信息,所述账户信息中包含有目标账户的账户名称;
对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型;
根据所述属性类型确定所述待处理金融业务的风控规则,并按照确定的所述风控规则执行对所述待处理金融业务的数据处理操作。
结合第一方面,在第一方面的第一种可能实现方式中,所述对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型的步骤之前,还包括:
预配置账户的属性类型,其中,所述属性类型包括个人账户类型、企业账户类型、政府单位账户类型、专项资金科目账户类型和银行账户类型。
结合第一方面,在第一方面的第二种可能实现方式中,所述对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型的步骤,包括:
将所述账户名称转化为字符串数组;
按照预设的字符类型识别规则比对所述字符串数组,确定所述账户名称的字符类型;
根据所述账户名称的字符类型,获取与所述账户名称的字符类型相匹配的目标分类识别模型;
将所述账户名称输入至所述目标分类识别模型中进行分类识别处理,获得账户所对应的属性类型。
结合第一方面的第二种可能实现方式,在第一方面的第三种可能实现方式中,所述根据所述账户名称的字符类型,获取与所述账户名称的字符类型相匹配的目标分类识别模型的步骤之前,还包括:
构建账户名称样本;
将所述构建的账户名称样本输入至预设的卷积神经网络模型进行模型训练,以获得分类识别模型,所述分类识别模型被训练用于根据对账户名称进行分类识别。
结合第一方面的第二种可能实现方式,在第一方面的第四种可能实现方式中,所述将所述账户名称输入至所述目标分类识别模型中进行分类识别处理,获得账户所对应的属性类型的步骤,还包括:
基于所述目标分类识别模型,计算所述账户名称的字符串长度,根据所述字符串长度确定所述目标账户是否为个人账户类型。
结合第一方面的第四种可能实现方式,在第一方面的第五种可能实现方式中,所述基于所述目标分类识别模型,通过计算所述账户名称的字符串长度,根据所述字符串长度确定所述目标账户是否为个人账户类型的步骤之后,若未确定所述目标账户为个人账户类型,还包括:
基于所述目标分类识别模型,提取所述账户名称中的特征词信息,判断所述特征词信息中是否含有表征人名的特征词;
若所述特征词信息中含有表征人名的特征词,则根据所述目标分类识别模型中基于属性类型预先构建的关键库,判断所述特征词信息中是否含有与所述关键词库中存储的关键词对应匹配的特征词;
若所述特征词信息中未含有与所述关键词库中存储的关键词对应匹配的特征词,则确定所述目标账户为个人账户类型,否则,根据所述关键特征词在所述关键词库中的分类确定所述目标账户的属性类型。
结合第一方面或第一方面的第一种可能实现方式,在第一方面的第六种可能实现方式中,所述对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型的步骤,包括:
对所述目标账户的账户名称进行字节统计,获得所述账户名称的字符串长度;
将所述字符串长度与预设的字符串长度阈值进行比较,确定所述目标账户是否为个人账户类型;
若未确定出所述目标账户为个人账户类型,则识别所述账户名称中是否含有人名;
若所述账户名称中含有人名,则引入基于属性类型预先构建的关键词库对所述账户名称进行关键词识别,判断所述账户名称中是否含有与所述关键词库中存储的表征属性类型的关键词相匹配的词语;
若所述所述账户名称中未含有与所述关键词库中存储的关键词对应的关键词,则判断所述目标账户为个人账户类型,否则,通过对所述账户名称中含有的关键词进行归类识别,以确定所述目标账户的属性类型。
本申请实施例的第二方面提供了一种金融业务的数据处理装置,所述金融业务的数据处理装置包括:
账户信息获取模块,用于获取待处理金融业务对应的账户信息,所述账户信息中包含有目标账户的账户名称;
属性分类模块,用于对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型;
数据处理模块,用于根据所述属性类型确定所述待处理金融业务的风控规则,并按照确定的所述风控规则执行对所述待处理金融业务的数据处理操作。
本申请实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在电子设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面提供的金融业务的数据处理方法。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面提供的金融业务的数据处理方法。
本申请实施例提供的一种金融业务的数据处理方法、装置、电子设备及存储介质,具有以下有益效果:
本申请所述方法通过获取待处理金融业务对应的账户信息,所述账户信息中包含有目标账户的账户名称;对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型;根据所述属性类型确定所述待处理金融业务的风控规则,并按照确定的所述风控规则执行对所述待处理金融业务的数据处理操作。该方法实现了根据不同的账户属性类型针对性地配置金融业务的风控规则,从而在对金融业务进行数据处理时可以采用针对性的风控规则来对金融业务进行风险把控,提高了风险识别的准确率,风险把控的效果更好。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种金融业务的数据处理方法的基本方法流程图;
图2为本申请实施例提供的金融业务的数据处理方法中确定账户属性类型的第一种方法流程示意图;
图3为本申请实施例提供的金融业务的数据处理方法中构建分类识别模型的一种方法流程示意图;
图4为本申请实施例提供的金融业务的数据处理方法中确定账户属性类型的第二种方法流程示意图;
图5为本申请实施例提供金融业务的数据处理方法中确定账户属性类型的第三种方法流程示意图;
图6为本申请实施例提供的一种金融业务的数据处理装置的基本结构框图;
图7为本申请实施例提供的一种电子设备的基本结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
请参阅图1,图1为本申请实施例提供的一种金融业务的数据处理方法的基本方法流程图。详细如下:
步骤S11:获取待处理金融业务对应的账户信息,所述账户信息中包含有目标账户的账户名称。
本实施例中,所谓金融交易是指涉及机构单位金融资产所有权变化的所有交易,而交易账户则是指登记结算登记机构为投资人开立的、记录其持有的、机构管理人所管理的资金份额余额及其变动情况的账户。在金融交易场景中,每一份金融业务都有其所对应的交易账户,金融机构在处理一份金融业务时,可以在该分金融业务中读取获得该份金融业务所对应的交易账户的账户信息。其中,账户信息中包含有目标账户的账户名称。本实施例中,具体可以通过文本分析获得信息提取的方式获得该目标账户的账户名称。
步骤S12:对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型。
本实施例中,将金融交易场景中用于执行金融交易的账户进行属性类型分类得到多种属性类型。可以理解的是,在本实施例中,每一种属性类型可以对应代表着不同的交易风险性。示例性的,基于金融交易场景,预配置账户的属性类型,其中,属性类型可以包括但不限于个人账户类型、企业账户类型、政府单位账户类型、专项资金科目账户类型、银行账户类型等。在本实施例中,可以通过预先设置每一种属性类型各自对应的分类识别规则,以根据该分类识别规则来确定目标账户的属性类型。示例性的,该分类识别规则为账户名称的特征比对。针对每一种属性类型,采用大量属于该属性类型的账户名称样本进行特征分析,得到表征该属性类型的账户名称特征。基于账户名称特征预先设置各属性类型的分类识别规则。在对目标账户进行属性类型识别时,采用预先设置的各属性类型的分类识别规则来对目标账户的账户名称进行分类识别处理,通过分析该目标账户的账户名称特征与哪个属性类型的分类识别规则匹配,由此即可确定该目标账户的属性类型。
步骤S13:根据所述属性类型确定所述待处理金融业务的风控规则,并按照确定的所述风控规则执行对所述待处理金融业务的数据处理操作。
本实施例中,风控规则包括但不限于转账渠道选择、收费分类、风险预警等。在本实施例中,由于不同的属性类型可以代表着不同的交易风险性,预先针对不同的属性类型制定出不同的风控规则,构建获得各属性类型与其对应的风控规则之间的对应关系。由此,可以通过确定账户所对应的属性类型,即可根据属性类型确定待处理金融业务的风控规则,并按照该确定的风控规则执行对所述待处理金融业务的数据处理操作。
以上可以看出,本实施例提供的金融业务的数据处理方法过获取待处理金融业务对应的账户信息,基于账户信息中包含的目标账户的账户名称来确定目标账户的属性类型,实现了根据不同的账户属性类型针对性地配置金融业务的风控规则,从而在对金融业务进行数据处理时可以采用针对性的风控规则来对金融业务进行风险把控,提高了风险识别的准确率,风险把控的效果更好。
本申请的一些实施例中,请参阅图2,图2为本申请实施例提供的金融业务的数据处理方法中确定账户属性类型的第一种方法流程示意图。详细如下:
步骤S21:将所述账户名称转化为字符串数组。
本实施例中,在unicode编码表中,用于表示汉字的字符编码,其编码范围为[0x4e00,0x9fa5]或十进制[19968,40869];用于表示数字的字符编码,其编码范围为[0x30,0x39]或十进制[48,57];用于表示小写字母的字符编码,其编码范围为[0x61,0x7a]或十进制[97,122],用于表示大写字母的字符编码,其编码范围为[0x41,0x5a]或十进制[65,90]。由此,可以按照上述unicode编码表将账户名称转化为采用字符编码表示的字符串数组。
步骤S22:按照预设的字符类型识别规则比对所述字符串数组,确定所述账户名称的字符类型。
本实施例中,账户名称的字符类型可以划分为包括但不限于中文字符类型、英文字符类型和数字字符类型等。在本实施例中,基于不同的字符类型对应不同的unicode编码,预先配置字符类型识别规则。例如正则表达式识别规则,可以采用unicode编码的正则表达式来确定账户名称的字符类型。其中,中文字符类型的正则表达式为对应汉字的unicode编码[0x4e00,0x9fa5]或十进制[19968,40869],英文字符类型的正则表达式为对应小写字母的unicode编码[0x61,0x7a]或十进制[97,122]以及大写字母的unicode编码[0x41,0x5a]或十进制[65,90],数字字符类型的正则表达式为对应数字的unicode编码[0x30,0x39]或十进制[48,57]。
步骤S23:根据所述账户名称的字符类型,获取与所述账户名称的字符类型相匹配的目标分类识别模型。
本实施例中,假设账户名称的字符类型划分为中文字符类型、英文字符类型和数字字符类型。在本实施例中,为每种字符类型配置各自对应的分类识别模型,该分类识别模型可以通过神经网络训练获得。获得每种字符类型各自对应的分类识别模型后,通过将每种字符类型分别与其对应配置的分类识别模型进行映射关联,构建得到字符类型与分类识别模型之间的关联关系。根据账户名称的字符类型遍历字符类型与分类识别模型之间的关联关系,即可确定与该账户名称的字符类型对应匹配的目标分类识别模型,由此获取与所述账户名称的字符类型相匹配的目标分类识别模型。
步骤S24:将所述账户名称输入至所述目标分类识别模型中进行分类识别处理,获得账户所对应的属性类型。
本实施例中,将账户名称输入至目标分类识别模型后,由该目标分类模型对该账户名称进行特征提取处理,获得用于表征账户属性类型的特征,并且将该获得的特征与目标分类识别模型中配置的各属性类型的预设特征进行比对,判断该获得特征与各属性类型的预设特征之间的相似程度,从而根据该获得特征与各属性类型的预设特征之间的相似程度确定该账户所对应的属性类型。
本申请的一些实施例中,请参阅图3,图3为本申请实施例提供的金融业务的数据处理方法中构建分类识别模型的一种方法流程示意图。详细如下:
步骤S31:构建账户名称样本。
本实施例中,可以通过收集账户名称,对这些收集到的账户名称进行人工标注,使得各收集到的账户名称都具有对应的属性类型,这些标注有属性类型的账户名称即为构建获得的账户名称样本。
步骤S32:将所述构建的账户名称样本输入至预设的卷积神经网络模型进行模型训练,以获得分类识别模型,所述分类识别模型被训练用于根据对账户名称进行分类识别。
本实施例中,通过将标注有属性类型的账户名称输入至一个预设的卷积神经网络模型中进行模型训练,以使预设的卷积神经网络模型中配置的各属性类型训练获得对应的用于进行分类识别的预设特征信息,当该预设的卷积神经网络模型训练至收敛状态时,该训练至收敛状态的卷积神经网络模型即为被训练用于根据对账户名称进行分类识别的分类识别模型。在本实施例中,分类识别模型通过将输入的账户名称的特征与所述分类识别模型中表征属性类型的预设特征之间的相似度进行评价。进一步地,还可以通过加重可区分各属性类型的特征在卷积层中的权重,以使在进行卷积提取时,提取的聚类中心点集中在可区分各属性类型的特征所在的地方,在提高了的辨识度的同时,提高了分类识别的准确性。需要说明的是,本实施例提供的预设的卷积神经网络模型可以是CNN卷积神经网络模型或者VGG卷积神经网络模型,该卷积神经网络模型具体通过大量的样本数据(例如不同属性类型的账户名称)将分类识别模型训练至收敛状态,以使得所述分类识别模型具有可以判断出账户所对应的属性类型的能力。
本申请的一些实施例中,可以基于上述训练获得的目标分类识别模型,通过计算账户名称的字符串长度,根据该字符串长度来确定目标账户是否为个人账户类型。在本实施例中,目标分类识别模型为通过神经网络模型训练获得。训练该目标分类识别模型时,可以通过将标注有字符串长度信息和属性类型信息的账户名称样本数据输入至神经网络模型中进行训练,获得一个用于判断账户是否为个人账户类型的字符串长度阈值。以该字符串长度阈值为目标分类识别模型用于判断账户是否为个人账户类型的判断依据。由此,基于目标分类识别模型,计算出目标账户的账户名称的字符串长度后,由该目标分类识别模型根据计算得到的字符串长度与其作为判断依据的字符串长度阈值进行比较,即可确定确定目标账户是否为个人账户类型。
本申请的一些实施例中,请参阅图4,图4为本申请实施例提供的金融业务的数据处理方法中确定账户属性类型的第二种方法流程示意图。详细如下:
步骤S41:基于所述目标分类识别模型,提取所述账户名称中的特征词信息,判断所述特征词信息中是否含有表征人名的特征词;
步骤S42:若所述特征词信息中含有表征人名的特征词,则根据所述目标分类识别模型中基于属性类型预先构建的关键库,判断所述特征词信息中是否含有与所述关键词库中存储的关键词对应匹配的特征词;
步骤S43:若所述特征词信息中未含有与所述关键词库中存储的关键词对应匹配的特征词,则确定所述目标账户为个人账户类型,否则,根据所述关键特征词在所述关键词库中的分类确定所述目标账户的属性类型。
本实施例中,目标分类识别模型为通过神经网络模型训练获得。训练该目标分类识别模型时,可以通过将标注的人名样本数据输入至神经网络模型中进行训练,以获得表征人名的特征信息,以该特征信息作为判断输入的账户名称中是否含有人名的依据,以使目标分类识别模型具备可以判断账户名称中是否含有人名的能力。由此在本实施例中,将账户名称输入至目标分类识别模型后,通过由该目标分类识别模型基于训练至收敛状态的神经网络提取获得账户名称中的特征词信息,通过将该获得特征词信息中的特征词逐一与作为判断依据的特征信息进行比对,比对该特征词与作为判断依据的特征信息两者之间的相似度,如果特征词信息中含有与作为判断依据的特征信息相似度匹配的特征词,则该特征词即为表征人名的特征词,由此判断特征词信息中是否含有表征人名的特征词。本实施例中,基于目标分类识别模型,引入有基于属性类型预先构建的关键词库,该预先构建的关键词库是目标分类识别模型用于判断目标账户是否为其他几种预配置的属性类型的依据。其中。该其他几种预配置的属性类型可以包括企业账户类型、政府单位账户类型、专项资金科目账户类型和银行账户类型。在本实施例中,该目标分类识别模型引入的关键词库也可以通过训练目标分类识别模型获得。例如,通过收集大量各预配置的属性类型的账户名称样本,将这些账户名称样本按照属性类型分别输入至该目标分类识别模型中进行关键词提取训练,构建生成关键词库。该关键词库中包含有各预配置的属性类型各自对应的关键特征词集合。若特征词信息中含有表征人名的特征词,则根据该目标分类识别模型中基于属性类型预先构建的关键词库,通过根据特征词信息中的特征词遍历该关键词库,从而判断出特征词信息中是否含有与该关键词库中存储的关键特征词对应匹配的特征词。如若该特征词信息中未含有与该关键词库中存储的关键特征词对应匹配的特征词,则可以确定该目标账户为个人账户类型,否则,根据该关键特征词,确定该关键特征词在关键词库中的分类,从而基于分类确定该目标账户的属性类型。
本申请的一些实施例中,请参阅图5,图5为本申请实施例提供金融业务的数据处理方法中确定账户属性类型的第三种方法流程示意图。详细如下:
步骤S51:对所述目标账户的账户名称进行字节统计,获得所述账户名称的字符串长度。
本实施例中,由于一个汉字的占两个字节的字符串长度,一个字母或一个数字占一个字节的字符串长度。若账户名称为中文,则通过统计出账户名称中所含的汉字的数量,按一个汉字对应占用两个字节长度计算,即可计算出账户名称的字符串长度;若账户名称为英文或数字时同理,则通过统计出账户名称中所含的英文字母或数字的数量,按一个英文字母或数字对应占用一个字节长度计算,即可计算出账户名称的字符串长度。
步骤S52:将所述字符串长度与预设的字符串长度阈值进行比较,确定所述目标账户是否为个人账户类型。
本实施例中,通过将该计算得到的字符串长度与预先设置的字符串长度阈值进行比较,以此确定目标账户是否为个人账户类型。在本实施例中,可以基于专家经验或模型训练设置用于根据字符串长度判断账户是否为个人账户类型的字符串长度阈值,若计算得到的字符串长度满足预先设置的字符串长度阈值要求,即确定该目标账户为个人账户类型。示例性的,对于中文的账户名称而言,目标账户的账户名称一般为人名,而中文的人名一般在五个汉字以下,由此可以设置中文预设的字符串长度阈值为10个字节,通过比较,如果计算得到的字符串长度小于等于10个字节,则确定该目标账户属于个人账户类型,否则,未能确定该目标账户是个人账户类型,需要进行下一步的识别和判断。可以理解的是,针对比如中文字符类型、英文字符类型、数字字符类型等不同的字符类型,分别设置各自对应的字符串长度阈值,即不同的字符类型,对应设置的字符串长度阈值不同,由此对不同字符类型的账户名称,采用不同的字符串长度阈值进行比较。
步骤S53:若未确定出所述目标账户为个人账户类型,则识别所述账户名称中是否含有人名。
本实施例中,如若根据账户名称计算得到的字符串长度不满足预设的字符串长度阈值要求,则无法判断该目标账户是否为个人账户类型,即未确定出该目标账户为个人账户类型。此时,本实施例会进一步识别该账户名称中是否存在人名。示例性的,可以预先构建一个基于LAC算法的词法分析模型,该词法分析模型被训练用于可以整体性地完成分词、词性标注、专名识别等任务。由此,本实施例通过该词法分析模型来识别账户名称中是否存在人名。
步骤S54:若所述账户名称中含有人名,则引入基于属性类型预先构建的关键词库对所述账户名称进行关键词识别,判断所述账户名称中是否含有与所述关键词库中存储的表征属性类型的关键词相匹配的词语。
本实施例中,当识别出账户名称中含有人名时,则说明该目标账户有可能是个人账户类型,此时,本实施例可以进一步引入基于属性类型预先构建的关键词库,用于对账户名称进行关键词识别,判断该账户名称中是否含有与该关键词库中预先存储的表征属性类型的关键词相匹配的词语。示例性的,该预先构建的关键词库按预配置的属性类型设置存储分类,其中一种属性类型对应一个存储分类,每一个存储分类中存储有用于判断是否为该属性类型的关键词,比如政府单位账户类型,政府机构名称中一般会出现哪些关键词,通过收集这些词语存储于该政府单位账户类型对应的存储分类中。通过对账户名称进行词语提取,根据提取到的词语遍历预先构建的关键词库,可以实现对账户名称进行关键词识别。通过遍历预先构建的关键词库中的所有存储分类,以将从账户名称中提取到的词语与关键词库中存储的关键词一一进行遍历筛查,从而判断出该账户名称中是否含有与该关键词库中预先存储的表征属性类型的关键词相匹配的词语。
步骤S55:若所述所述账户名称中未含有与所述关键词库中存储的关键词对应的关键词,则判断所述目标账户为个人账户类型,否则,通过对所述账户名称中含有的关键词进行归类识别,以确定所述目标账户的属性类型。
本实施例中,如果账户名称中并未含有与关键词库任意存储分类中表征属性类型的关键词相匹配的词语,则判断该目标账户为个人账户。若果账户名称中含有与关键词库任意存储分类中表征属性类型的关键词相匹配的词语,则通过根据该关键词归属的存储分类,由此根据存储分类来确定出该目标账户是哪种属性类型。
可以理解的是,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本申请的一些实施例中,请参阅图6,图6为本申请实施例提供的一种金融业务的数据处理装置的基本结构框图。本实施例中该装置包括的各单元用于执行上述方法实施例中的各步骤。具体请参阅上述方法实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。如图6所示,金融业务的数据处理装置包括:账户信息获取模块61、属性分类模块62以及数据处理模块63。其中:所述账户信息获取模块61用于获取待处理金融业务对应的账户信息,所述账户信息中包含有目标账户的账户名称。所述属性分类模块62用于对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型。所述数据处理模块63用于根据所述属性类型确定所述待处理金融业务的风控规则,并按照确定的所述风控规则执行对所述待处理金融业务的数据处理操作。
应当理解的是,上述金融业务的数据处理装置,与上述的金融业务的数据处理方法一一对应,此处不再赘述。
本申请的一些实施例中,请参阅图7,图7为本申请实施例提供的一种电子设备的基本结构框图。如图7所示,该实施例的电子设备7包括:处理器71、存储器72以及存储在所述存储器72中并可在所述处理器71上运行的计算机程序73,例如金融业务的数据处理方法的程序。处理器71执行所述计算机程序73时实现上述各个金融业务的数据处理方法各实施例中的步骤。或者,所述处理器71执行所述计算机程序73时实现上述金融业务的数据处理装置对应的实施例中各模块的功能。具体请参阅实施例中的相关描述,此处不赘述。
示例性的,所述计算机程序73可以被分割成一个或多个模块(单元),所述一个或者多个模块被存储在所述存储器72中,并由所述处理器71执行,以完成本申请。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序73在所述电子设备7中的执行过程。例如,所述计算机程序73可以被分割成账户信息获取模块、属性分类模块以及数据处理模块,各模块具体功能如上所述。
所述转台设备可包括,但不仅限于,处理器71、存储器72。本领域技术人员可以理解,图7仅仅是电子设备7的示例,并不构成对电子设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述转台设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器71可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器72可以是所述电子设备7的内部存储单元,例如电子设备7的硬盘或内存。所述存储器72也可以是所述电子设备7的外部存储设备,例如所述电子设备7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器72还可以既包括所述电子设备7的内部存储单元也包括外部存储设备。所述存储器72用于存储所述计算机程序以及所述转台设备所需的其他程序和数据。所述存储器72还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。在本实施例中,所述计算机可读存储介质可以是非易失性,也可以是易失性。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种金融业务的数据处理方法,其特征在于,包括:
获取待处理金融业务对应的账户信息,所述账户信息中包含有目标账户的账户名称;
对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型;
根据所述属性类型确定所述待处理金融业务的风控规则,并按照确定的所述风控规则执行对所述待处理金融业务的数据处理操作。
2.根据权利要求1所述的金融业务的数据处理方法,其特征在于,所述对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型的步骤之前,还包括:
预配置账户的属性类型,其中,所述属性类型包括个人账户类型、企业账户类型、政府单位账户类型、专项资金科目账户类型和银行账户类型。
3.根据权利要求1或2所述的金融业务的数据处理方法,其特征在于,所述对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型的步骤,包括:
将所述目标账户的账户名称转化为字符串数组;
按照预设的字符类型识别规则比对所述字符串数组,确定所述账户名称的字符类型;
根据所述账户名称的字符类型,获取与所述账户名称的字符类型相匹配的目标分类识别模型;
将所述账户名称输入至所述目标分类识别模型中进行分类识别处理,获得账户所对应的属性类型。
4.根据权利要求3所述的金融业务的数据处理方法,其特征在于,所述根据所述账户名称的字符类型,获取与所述账户名称的字符类型相匹配的目标分类识别模型的步骤之前,还包括:
构建账户名称样本;
将所述构建的账户名称样本输入至预设的卷积神经网络模型进行模型训练,以获得分类识别模型,所述分类识别模型被训练用于根据对账户名称进行分类识别。
5.根据权利要求3所述的金融业务的数据处理方法,其特征在于,所述将所述账户名称输入至所述目标分类识别模型中进行分类识别处理,获得账户所对应的属性类型的步骤,还包括:
基于所述目标分类识别模型,计算所述账户名称的字符串长度,根据所述字符串长度确定所述目标账户是否为个人账户类型。
6.根据权利要求5所述的金融业务的数据处理方法,其特征在于,所述基于所述目标分类识别模型,通过计算所述账户名称的字符串长度,根据所述字符串长度确定所述目标账户是否为个人账户类型的步骤之后,若未确定所述目标账户为个人账户类型,还包括:
基于所述目标分类识别模型,提取所述账户名称中的特征词信息,判断所述特征词信息中是否含有表征人名的特征词;
若所述特征词信息中含有表征人名的特征词,则根据所述目标分类识别模型中基于属性类型预先构建的关键库,判断所述特征词信息中是否含有与所述关键词库中存储的关键词对应匹配的特征词;
若所述特征词信息中未含有与所述关键词库中存储的关键词对应匹配的特征词,则确定所述目标账户为个人账户类型,否则,根据所述关键特征词在所述关键词库中的分类确定所述目标账户的属性类型。
7.根据权利要求1或2所述的金融业务的数据处理方法,其特征在于,所述对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型的步骤,包括:
对所述目标账户的账户名称进行字节统计,获得所述账户名称的字符串长度;
将所述字符串长度与预设的字符串长度阈值进行比较,确定所述目标账户是否为个人账户类型;
若未确定出所述目标账户为个人账户类型,则识别所述账户名称中是否含有人名;
若所述账户名称中含有人名,则引入基于属性类型预先构建的关键词库对所述账户名称进行关键词识别,判断所述账户名称中是否含有与所述关键词库中存储的表征属性类型的关键词相匹配的词语;
若所述所述账户名称中未含有与所述关键词库中存储的关键词对应的关键词,则判断所述目标账户为个人账户类型,否则,通过对所述账户名称中含有的关键词进行归类识别,以确定所述目标账户的属性类型。
8.一种金融业务的数据处理装置,其特征在于,包括:
账户信息获取模块,用于获取待处理金融业务对应的账户信息,所述账户信息中包含有目标账户的账户名称;
属性分类模块,用于对所述目标账户的账户名称进行分类识别处理,以确定所述目标账户的属性类型;
数据处理模块,用于根据所述属性类型确定所述待处理金融业务的风控规则,并按照确定的所述风控规则执行对所述待处理金融业务的数据处理操作。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法。
CN202110740238.8A 2021-06-30 2021-06-30 金融业务的数据处理方法、装置、电子设备及存储介质 Active CN113362151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110740238.8A CN113362151B (zh) 2021-06-30 2021-06-30 金融业务的数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110740238.8A CN113362151B (zh) 2021-06-30 2021-06-30 金融业务的数据处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113362151A true CN113362151A (zh) 2021-09-07
CN113362151B CN113362151B (zh) 2023-07-11

Family

ID=77537643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110740238.8A Active CN113362151B (zh) 2021-06-30 2021-06-30 金融业务的数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113362151B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8341081B1 (en) * 2011-07-27 2012-12-25 Intuit Inc. Intelligent identification of on-line bank accounts utilized for business purposes
CN110110577A (zh) * 2019-01-22 2019-08-09 口碑(上海)信息技术有限公司 识别菜名的方法及装置、存储介质、电子装置
CN111681097A (zh) * 2020-05-27 2020-09-18 北京三快在线科技有限公司 账户类型的识别方法、服务器、电子设备及系统
CN111814779A (zh) * 2020-07-08 2020-10-23 重庆农村商业银行股份有限公司 一种票据文本识别方法、装置、设备及存储介质
CN112085019A (zh) * 2020-08-31 2020-12-15 深圳思谋信息科技有限公司 字符识别模型生成系统、方法、装置和计算机设备
CN112150162A (zh) * 2020-11-24 2020-12-29 深圳华锐金融技术股份有限公司 交易账户的监管方法、装置、计算机设备和存储介质
CN112257449A (zh) * 2020-11-13 2021-01-22 腾讯科技(深圳)有限公司 命名实体识别方法、装置、计算机设备和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8341081B1 (en) * 2011-07-27 2012-12-25 Intuit Inc. Intelligent identification of on-line bank accounts utilized for business purposes
CN110110577A (zh) * 2019-01-22 2019-08-09 口碑(上海)信息技术有限公司 识别菜名的方法及装置、存储介质、电子装置
CN111681097A (zh) * 2020-05-27 2020-09-18 北京三快在线科技有限公司 账户类型的识别方法、服务器、电子设备及系统
CN111814779A (zh) * 2020-07-08 2020-10-23 重庆农村商业银行股份有限公司 一种票据文本识别方法、装置、设备及存储介质
CN112085019A (zh) * 2020-08-31 2020-12-15 深圳思谋信息科技有限公司 字符识别模型生成系统、方法、装置和计算机设备
CN112257449A (zh) * 2020-11-13 2021-01-22 腾讯科技(深圳)有限公司 命名实体识别方法、装置、计算机设备和存储介质
CN112150162A (zh) * 2020-11-24 2020-12-29 深圳华锐金融技术股份有限公司 交易账户的监管方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN113362151B (zh) 2023-07-11

Similar Documents

Publication Publication Date Title
CN107818344B (zh) 用户行为进行分类和预测的方法和系统
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN110580308B (zh) 信息审核方法及装置、电子设备、存储介质
CN110929525B (zh) 一种网贷风险行为分析检测方法、装置、设备和存储介质
CN111985937A (zh) 交易商价值信息评估方法、系统、存储介质、计算机设备
CN112668323B (zh) 基于自然语言处理的文本要素提取方法及其文本审查系统
CN112016313A (zh) 口语化要素识别方法及装置、警情分析系统
CN114298845A (zh) 一种理赔票据处理方法和装置
CN113850077A (zh) 基于人工智能的话题识别方法、装置、服务器及介质
CN113362151B (zh) 金融业务的数据处理方法、装置、电子设备及存储介质
CN109993381B (zh) 基于知识图谱的需求管理应用方法、装置、设备及介质
CN116071150A (zh) 数据处理方法、银行产品推广、风控系统、服务器及介质
CN115171136A (zh) 银行业务材料内容分类识别方法、设备及存储介质
CN115391541A (zh) 智能合约代码自动审查方法、存储介质和电子设备
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
CN114154829A (zh) 企业的产业链节点确定方法、装置、终端及存储介质
CN108711073B (zh) 用户分析方法、装置及终端
CN114495138A (zh) 一种智能文档识别与特征提取方法、装置平台和存储介质
CN115203382A (zh) 业务问题场景识别方法、装置、电子设备及存储介质
CN110895564A (zh) 一种潜在客户数据处理方法和装置
CN111143533A (zh) 一种基于用户行为数据的客服方法及系统
CN113837183B (zh) 基于实时挖掘的多阶段凭证智能生成方法、系统及介质
CN116204567B (zh) 用户挖掘及模型的训练方法、装置、电子设备和存储介质
CN115269939B (zh) 正则表达式生成方法、装置、智能终端及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant