CN115034787A - 基于行为反馈数据的对象状态识别方法、装置及设备 - Google Patents

基于行为反馈数据的对象状态识别方法、装置及设备 Download PDF

Info

Publication number
CN115034787A
CN115034787A CN202110240273.3A CN202110240273A CN115034787A CN 115034787 A CN115034787 A CN 115034787A CN 202110240273 A CN202110240273 A CN 202110240273A CN 115034787 A CN115034787 A CN 115034787A
Authority
CN
China
Prior art keywords
behavior
feedback data
target
information
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110240273.3A
Other languages
English (en)
Inventor
陈萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110240273.3A priority Critical patent/CN115034787A/zh
Publication of CN115034787A publication Critical patent/CN115034787A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Computer Security & Cryptography (AREA)
  • Finance (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种基于行为反馈数据的对象状态识别方法、装置及设备,涉及人工智能技术领域,尤其涉及对象在移动支付中的状态识别,以提升对对象状态进行识别的准确度。该方法包括:获取待识别对象在目标业务中的各个行为反馈数据,分别对各个行为反馈数据是否包含目标信息进行识别,并确定各个行为反馈数据各自对应的识别结果,基于各个行为反馈数据各自对应的识别结果,确定待识别对象在目标业务中的对象状态是否异常,其中,行为反馈数据是使用目标业务的账户针对待识别对象在目标业务中执行的业务行为触发的,目标信息表征业务行为不满足目标业务关联的行为约定信息。该方法能够提升对对象在目标业务中的对象状态是否异常进行识别的准确度。

Description

基于行为反馈数据的对象状态识别方法、装置及设备
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于行为反馈数据的对象状态识别方法、装置及设备。
背景技术
随着互联网技术的发展,移动支付已经成为人们生活中的一部分,目前在对移动支付中异常状态的对象进行识别的过程中,常根据用户针对上述对象在目标业务中的投诉内容,直接针对上述对象在上述目标业务中的对象状态是否异常进行评判,但用户的投诉内容具有很强的主观性,其投诉内容中的信息的真实程度不可靠,直接根据用户的投诉数据,识别对象的对象状态是否异常的准确度低,因此,如何提升对对象的对象状态进行识别的准确度是值得考虑的问题。
发明内容
本申请实施例提一种基于行为反馈数据的对象状态识别方法、装置及设备,用于提升对对象的对象状态是否异常的准确度。
本申请第一方面,提供一种基于行为反馈数据的对象状态识别方法,包括:
获取待识别对象在目标业务中的各个行为反馈数据;其中,所述行为反馈数据是使用所述目标业务的账户,针对所述待识别对象在所述目标业务中执行的业务行为触发的;
分别对所述各个行为反馈数据是否包含目标信息进行识别,并确定所述各个行为反馈数据各自对应的识别结果,所述目标信息表征所述业务行为不满足所述目标业务关联的行为约定信息;
基于所述各个行为反馈数据各自对应的识别结果,确定所述待识别对象在所述目标业务中的对象状态是否异常。
在一种可能的实现方式中,所述对象属性信息包括如下至少一种信息:
待识别对象的电子资源的转移信息;
待识别对象对应的欺诈风险信息,所述欺诈风险信息表征所述待识别对象存在网络欺诈行为的可疑程度;
异常业务行为关联的行为信息,所述异常业务行为包括包含所述目标信息的行为反馈数据关联的业务行为。
在一种可能的实现方式中,所述对象属性信息包括所述异常业务行为关联的行为信息,所述行为信息包括如下至少一种信息:
所述异常业务行为关联的电子资源值;
所述异常业务行为关联的账户;
所述异常业务行为关联的业务对象;
所述异常业务行为的触发时间信息。
本申请第二方面,提供一种基于行为反馈数据的对象状态识别装置,包括:
数据获取单元,用于获取待识别对象在目标业务中的各个行为反馈数据;其中,所述行为反馈数据是使用所述目标业务的账户,针对所述待识别对象在所述目标业务中执行的业务行为触发的;
第一识别单元,用于分别对所述各个行为反馈数据是否包含目标信息进行识别,并确定所述各个行为反馈数据各自对应的识别结果,所述目标信息表征所述业务行为不满足所述目标业务关联的行为约定信息;
第二识别单元,用于基于所述各个行为反馈数据各自对应的识别结果,确定所述待识别对象在所述目标业务中的对象状态是否异常。
在一种可能的实现方式中,所述第一识别单元具体用于:针对所述各个行为反馈数据,分别执行如下操作:
根据所述各个行为反馈数据中一个行为反馈数据包含的各个词语的上下文信息,提取所述一个行为反馈数据对应的待处理文本特征;基于所述待处理文本特征,对所述一个行为反馈数据是否包含所述目标信息进行识别,确定所述一个行为反馈数据对应的识别结果。
在一种可能的实现方式中,所述第一识别单元具体用于:
将所述一个行为反馈数据输入已训练的数据分类模型;
基于所述数据分类模型中的语言学习子模型,对所述一个行为反馈数据包含的各个词语的上下文信息进行特征提取,获得所述一个行为反馈数据对应的待处理文本特征;其中,所述语言学习子模型是将所述目标业务中的历史行为反馈数据作为训练样本,基于所述训练样本包含的各个词语的上下文信息进行训练得到的;
所述第二识别单元具体用于:基于所述数据分类模型中的数据预测子模型已学习的第一关联度,预测所述待处理文本特征和第一识别信息之间的第二关联度,基于所述第二关联度确定所述一个行为反馈数据对应的识别结果,所述第一识别信息表征行为反馈数据包含所述目标信息,所述第一关联度是基于历史行为反馈数据对应的历史文本特征和所述第一识别信息之间的关联程度确定的。
在一种可能的实现方式中,所述第一识别单元具体用于:若所述第二关联度大于第一设定阈值,则确定所述一个行为反馈数据对应的识别结果为所述一个行为反馈数据中包含所述目标信息;若所述第二关联度不大于第一设定阈值,则确定所述一个行为反馈数据对应的识别结果为所述一个行为反馈数据中不包含所述目标信息。
在一种可能的实现方式中,所述第二识别单元具体用于:
基于所述各个行为反馈数据各自对应的识别结果中的第一识别信息,确定所述待识别对象对应的反馈有效信息,所述第一识别信息用于表征行为反馈数据中包含所述目标信息;
获取所述待识别对象关联的对象属性信息;
基于所述反馈有效信息和所述对象属性信息,确定所述待识别对象在所述目标业务中的对象状态是否异常。
在一种可能的实现方式中,所述反馈有效信息包括如下一种或任意组合:所述各个行为反馈数据各自对应的识别结果中的第一识别信息的数量;所述各个行为反馈数据各自对应的识别结果中,所述第一识别信息的数量与所述各个行为反馈数据的总数量的比值。
在一种可能的实现方式中,所述第二识别单元具体用于:基于所述目标评分卡模型,对所述反馈有效信息和所述对象属性信息进行处理,得到所述待识别对象针对所述目标业务的目标行为评估值;基于所述目标行为评估值,确定所述待识别对象在所述目标业务中的对象状态是否异常。
在一种可能的实现方式中,所述第二识别单元还用于:基于所述目标评分卡模型,对所述反馈有效信息和所述对象属性信息进行处理,得到所述待识别对象针对所述目标业务的目标行为评估值之前,确定所述待识别对象的对象类型;从所述目标业务关联的目标评分卡模型集合中,获取与所述对象类型对应的目标评分卡模型。
在一种可能的实现方式中,所述第二识别单元具体用于:
若确定所述目标行为评估值低于评估值阈值,则确定所述待识别对象是异常对象;其中,所述异常对象包括在所述目标业务中的对象状态是异常状态的对象,行为评估值与对象在所述目标业务中的对象状态是异常状态的可疑程度呈负相关;或
根据至少一个对象异常等级映射的行为评估值范围,确定所述目标行为评估值归属的行为评估值范围,并将确定的行为评估值范围映射的对象异常等级,确定为所述待识别对象对应的对象异常等级;其中,所述对象异常等级是根据对象在所述目标业务中的对象状态是异常状态的可疑程度确定的。
在一种可能的实现方式中,所述第二识别单元具体用于:将所述反馈有效信息和所述对象属性信息,输入已训练的状态识别模型,并通过所述状态识别模型进行如下处理:
将所述反馈有效信息和所述对象属性信息,确定为所述待识别对象对应的待处理对象特征;
基于所述状态识别模型已学习的第三关联度,预测所述待处理对象特征和目标对象识别结果之间的第四关联度,若所述第四关联度大于第二设定阈值,则确定所述待识别对象是异常对象,其中,所述第三关联度是基于历史对象对应的历史对象特征和所述目标识别结果之间的关联程度确定的,所述异常对象包括在所述目标业务中的对象状态是异常状态的对象,所述目标对象识别结果用于表征对象在所述目标业务中的对象状态是异常状态。
在一种可能的实现方式中,所述第二识别单元还用于:
确定所述待识别对象是异常对象之后,取消所述待识别对象的第一权限和第二权限中的至少一个;所述第一权限包括进行电子资源转移操作的权限,第二权限包括针对目标电子资源值的电子资源转移操作,所述目标电子资源值基于所述行为反馈数据确定。
在一种可能的实现方式中,所述对象属性信息包括如下至少一种信息:
待识别对象的电子资源的转移信息;
待识别对象对应的欺诈风险信息,所述欺诈风险信息表征所述待识别对象存在网络欺诈行为的可疑程度;
异常业务行为关联的行为信息,所述异常业务行为包括包含所述目标信息的行为反馈数据关联的业务行为。
在一种可能的实现方式中,所述对象属性信息包括所述异常业务行为关联的行为信息,所述行为信息包括如下至少一种信息:所述异常业务行为关联的电子资源值;所述异常业务行为关联的账户;所述异常业务行为关联的业务对象;所述异常业务行为的触发时间信息。
本申请第三方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
本申请第四方面,提供一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面中所述的方法。
本申请第五方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如第一方面所述的方法。
由于本申请实施例采用上述技术方案,至少具有如下技术效果:
本申请实施例中,首先针对对象在目标业务中的各个行为反馈数据进行识别,确定各个行为反馈数据对应的业务行为是否满足目标业务关联的行为约定信息,进而基于各个行为反馈数据各自对应的识别结果,确定待识别对象在目标业务中的对象状态是否异常,而不仅仅基于用户的投诉内容识别对象在目标业务中的对象状态是否异常,提升了对对象在目标业务中的对象状态是否异常进行识别的准确度。
附图说明
图1为本申请实施例提供的一种基于行为反馈数据的对象状态识别的应用场景的示意图;
图2为本申请实施例提供的一种获取行为反馈数据的过程示意图;
图3为本申请实施例提供的一种基于行为反馈数据的对象状态识别方法的流程图;
图4为本申请实施例提供的一种数据分类模型的结构示意图;
图5为本申请实施例提供的一种语言学习子模型的训练过程的示意图;
图6为本申请实施例提供的一种数据分类模型的训练过程的流程示意图;
图7为本申请实施例提供的一种创建目标评分卡模型的流程图;
图8为本申请实施例提供的一种识别在返利业务中对象状态为异常状态的商户的流程图;
图9为本申请实施例提供的一种数据分类模型的训练的流程图;
图10为本申请实施例提供的一种基于行为反馈数据的对象状态识别的系统流程图;
图11为本申请实施例提供的一种基于行为反馈数据的对象状态识别装置的结构示意图;
图12为本申请实施例提供的一种计算机设备的结构图。
具体实施方式
为了使本申请的目的、技术方案及有益效果更加清楚明白,以下将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于本领域技术人员更好地理解本申请的技术方案,下面对本申请涉及的部分概念进行说明。
1)对象
本申请实施例中对象可以但不局限于是能进行移动支付的目标,对象可以是用户在互联网中的身份标识,如本申请实施例中对象可以是互联网中的商户或者个人的账户等。
2)目标业务、业务行为、行为反馈数据
业务一般指各行业中需要处理的事务,本申请实施例中的目标业务可以但不局限于包括移动支付中需要处理的事务,如目标业务可以但不局限于交易业务、交友业务、工作信息相关的业务、返利业务(即返还利益相关的业务)、仿冒商品相关的业务、盗取账户相关的业务、商品折扣相关的业务、金融信用相关的业务等,其中,返还利益相关的业务可以但不局限于包括:金融返利类(如可以但不局限于包括返利红包雨、文字游戏、社会活动返利、公益捐款、真假收款码等)、购物返利类(如可以但不局限于包括猜拳赢奖品、100%中奖、慈善购物、回馈粉丝福利等)。
业务行为:对象在目标业务中执行的操作,如可以但不局限于包括电子资源转移操作(如可以但不局限于包括接收电子资源的操作或转移电子资源的操作等)、针对商品的发货操作等,本领域的技术人员可根据实际需求设置。
行为反馈数据可以是使用目标业务的账户,针对上述待识别对象在上述目标业务中执行的业务行为触发的数据,如行为反馈数据可以但不局限于包括账户的投诉内容、赞许内容等。
本申请实施例中的电子资源转移操作可以包括转移电子资源的操作,电子资源操作又可以称为移动支付,移动支付表征账户通过移动网络进行支付操作的行为;其中,本申请实施例中涉及的电子资源可以资金和信息资源的至少一种;上述资金可至少包括法币、电子货币等;所谓法币是指一种以法律形式赋予其强制流通使用的货币,如人民币、美元等;所谓电子货币是指以电子形式存储在账户所持有的电子钱包(如可以但不局限于支持移动支付的应用程序中的钱包等)中的货币,电子货币可以但不局限于包括电子票据、数字货币(一种不受管制的、数字化的货币、游戏币等);上述信息资源可以但不局限于游戏资源(如游戏装备等)、多媒体资源(如视频、音频等)、电子券(如可以但不局限于包括电子团购券、电子折扣券等)。
3)行为约定信息和目标信息
本申请实施例中的行为约定信息可以但不局限于是用来约束目标业务中的业务行为的信息,如行为约定信息可以但不局限于是针对目标业务中的业务行为的协议等,本申请实施例中对上述行为约定信息的具体内容不做限定,本领域的技术人员可根据实际需求设置上述行为约定信息;此处以商户为对象,返利业务为目标业务进行示例性说明,返利业务关联的行为约定信息中可以但不局限于包括:在商户和目标用户(即使用返利业务的账户)约定的返利期限内向用户发送电子资源值、向上述目标用户发送约定的电子资源值、按照约定的电子资源的转移方式向上述目标用户发送电子资源等。
本申请实施例中的目标信息是表征对象在目标业务中的业务行为不满足目标业务关联的行为约定信息的信息,即可以将目标信息理解为针对目标业务中的业务行为的投诉信息,如若目标业务为返利业务时,目标信息可以但不局限于是“X对象未返还约定的利益”、“X对象返还的电子资源值小于约定”等,本领域的技术人员可根据实际需求设置。
4)对象状态
本申请实施例中的对象状态指代对象在目标业务中的状态,可以但不局限于包括正常状态或异常状态,其中,正常状态可以但不局限于理解为对象在目标业务中的业务行为满足目标业务关联的行为约定信息,异常状态可以但不局限于理解为对象在目标业务中的业务行为不满足目标业务关联的行为约定信息;例如若一个对象在目标业务中存在欺诈行为,则可以认为该对象在目标业务中的业务行为不满足目标业务关联的行为约定信息,即可以认为该对象在该目标业务中的对象状态是异常状态;若目标业务是与电子资源转移相关的操作时,若一个对象当前被禁止了进行电子资源转移的权限,则可以但不局限于认为该对象在该目标业务中的对象状态是异常状态;其中,本领域的技术人员可根据实际需求设置对象在不同目标业务中的异常状态。
5)欺诈行为
本申请实施例中涉及的欺诈行为主要包括网络诈骗的行为,即欺诈账户(又可以称为欺诈者)通过社交网络、信息交流平台,使用虚假信息(如可以但不局限于虚假的商品信息、工作信息等),让受害账户(又可以称为受害者)自愿执行电子资源转移操作的行为;如受害者在接收到欺诈者发送的虚假信息时会信以为真,可能会自愿将自己的电子资源转移给欺诈者;目前欺诈者可能在交易业务、交友业务、工作信息相关的业务、返利业务、仿冒商品相关的业务、盗取账户相关的业务、商品折扣相关的业务、金融信用相关的业务等,其中,返还利益相关的业务等中进行欺诈行为;因而,本申请实施例中的欺诈行为可以但不局限于包括交易业务中的交易行为、交友业务中的交友行为、工作信息相关的业务的兼职诈骗、返利业务中的返利诈骗、仿冒商品、盗取账户、商品折扣诈骗等。
本申请实施例涉及人工智能(ArtificialIntelligence,AI)和机器学习技术,基于人工智能中的计算机视觉技术和机器学习(MachineLearning,ML)而设计;人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术主要包括计算机视觉技术、自然语言处理技术、以及机器学习或深度学习等几大方向。随着人工智能技术研究和进步,人工智能在多个领域展开研究和应用,例如常见的智能家居、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、机器人、智能医疗等,相信随着技术的发展,人工智能将在更多的领域得到应用,并发挥越来越重要的价值。
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
下面对本申请的设计思想进行说明。
随着互联网技术的发展,移动支付已经成为人们生活中的一部分,极大地改善了用户的消费行为和支付方式,目前在对移动支付中状态异常的对象进行识别的过程中,通常是基于用户针对上述对象的业务行为进行投诉时,用户选定上述业务行为关联的目标业务以及用户针对上述对象进行投诉时的投诉内容,直接针对上述对象在上述目标业务中的对象状态是否异常进行评判,但用户可能并不能准确地选定上述业务行为关联的目标业务,且用户的投诉内容具有很强的主观性,其投诉内容中的信息的真实程度不可靠,直接根据用户的投诉数据和选定的目标业务,识别对象在目标业务中的对象状态是否异常的准确度低。
鉴于此,本申请实施例设计了一种基于行为反馈数据的对象状态识别方法,用于提升对对象的对象状态是否异常进行识别的准确度;本申请实施例中首先获取待识别对象在目标业务中的各个行为反馈数据,并对触发各个行为反馈数据的业务行为是否满足目标业务关联的行为约定信息进行识别,进而基于各个行为反馈数据各自对应的识别结果,确定待识别对象在目标业务中的对象状态是否异常。
进一步地,为了提升对待识别对象在目标业务中的对象状态是否异常进行识别的准确度,本申请实施例中还可以将各个行为反馈数据各自对应的识别结果结合待识别对象关联的对象属性特征,确定待识别对象在目标业务中的对象状态是否异常。
更进一步地,为了提升确定待识别对象在目标业务中的对象状态是否异常的效率,本申请实施例中还可以基于目标评分卡模型或已训练的状态识别模型,确定待识别对象在目标业务中的对象状态是否异常;对上述状态识别模型不做过多限定,本领域的技术人员可根据实际需求设置,如基于神经网络模型创建上述状态识别模型,上述神经网络模型可以但不局限于包括卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)等。
为了更清楚地理解本申请的设计思路,以下对本申请实施例中的应用场景进行示例介绍。
请参见图1,提供一种基于行为反馈数据的对象状态识别的应用场景,该应用场景中可以包括终端设备110和服务器120;终端设备110和服务器120之间可以通过网络进行通信,其中:
终端设备110上可以安装有目标应用程序,该目标应用程序支持移动支付的功能,该目标应用程序可以但不局限于包括支付类应用程序、社交类应用程序、多媒体类应用程序、协助工具类应用程序中的至少一种,本申请实施例中对此不加以限定;本申请实施例中待识别对象和使用目标业务的账户可以登入上述目标应用程序,执行相应的行为或操作;如待识别对象登入目标应用程序后,可以执行电子资源转移操作或其它的业务行为,待识别对象在登入目标应用程序之后,还可以向其他对象或账户发送消息,或接收其他对象或账户发送的消息,其他对象为上述待识别对象之外的对象;使用目标业务的账户登入上述目标应用程序后,可以执行电子资源转移操作或其它操作,上述账户也可以针对待识别对象在目标业务中执行的业务行为,触发行为反馈数据。
作为一种实施例,请参见图2中的(a),待识别对象在目标业务中执行业务行为后,使用目标业务的账户可以针对该业务行为触发行为反馈操作,进而终端设备110采集上述行为反馈操作指示的行为反馈数据,并将采集的行为反馈数据发送给服务器120,进而服务器120可以接收行为反馈数据,并将记录接收的行为反馈数据;
作为一种实施例,请参见图2中的(b),使用目标业务的账户针对该业务行为触发业务行为反馈操作后,终端设备110也可以向服务器120发送数据采集指令,进而服务器120响应上述数据采集指令,获取业务行为反馈操作指示的行为反馈数据并记录。
服务器120获取待识别对象在目标业务中的各个行为反馈数据,分别对上述各个行为反馈数据是否包含目标信息进行识别,并确定上述各个行为反馈数据各自对应的识别结果,基于上述各个行为反馈数据各自对应的识别结果,确定上述待识别对象在上述目标业务中的对象状态是否异常;其中,上述目标信息用于表征上述业务行为不满足上述目标业务关联的行为约定信息。
本申请实施例中的终端设备110可以是移动终端、固定终端或便携式终端,例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机或摄像机、车载设备、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。
本申请实施例中的服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是云服务技术中提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的多个云服务器(如可以但不局限于包括图中示意出的服务器120-1、服务器120-2或服务器120-3);上述服务器120的功能可以由一个或多个云服务器实现,还可以由一个或多个云服务器集群实现等。
下面主对本申请实施例提供的基于行为反馈数据的对象状态识别方法进行详细介绍。需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。
基于图1的应用场景,下面对本申请实施例中涉及的一种基于行为反馈数据的对象状态识别方法进行示例说明,请参照图3,表示本申请实施例设计的一种基于行为反馈数据的对象状态识别方法的流程示意图,具体包括如下步骤:
步骤S301,获取待识别对象在目标业务中的各个行为反馈数据;其中,上述行为反馈数据是使用上述目标业务的账户,针对上述待识别对象在上述目标业务中执行的业务行为触发的。
作为一种实施例,步骤S301中,还可以获取待识别对象在预设时间段内在目标业务中的行为反馈数据,进而以便基于预设时间段内的各个行为反馈数据,确定待识别对象在预设时间段内在目标业务中的对象状态是否异常,以提升确定待识别对象的对象状态是否异常的灵活度;其中,对上述预设时间段不做限定,本领域的技术人员可根据实际需求设置,如可以但不局限于将上述预设时间段设置为当前时刻之前的一段时间,如可以将预设时间段设置为当前时刻之前的1天、3天、5天、7天或一个月等;也可以将预设时间段设置为从当前时刻之前的第二时间起至当前时刻之前的第二时间的时间段,如当前时刻为2021年2月1日,则可以但不局限于将2020年12月1日(即上述第一时间)至2020年1月1日(即上述第二时间)设置之间的时间段设置为上述预设时间段等。
步骤S302,分别对上述各个行为反馈数据是否包含目标信息进行识别,并确定上述各个行为反馈数据各自对应的识别结果,上述目标信息表征上述业务行为不满足上述目标业务关联的行为约定信息。
作为一种实施例,上述识别结果可以但不局限于是行为反馈数据中包含上述目标信息,上述识别结果也可以是行为反馈数据中不包含上述目标信息,为了便于描述,本申请实施例的以下内容中,将行为反馈数据中包含上述目标信息的识别结果描述为第一识别信息,将行为反馈数据中不包含上述目标信息的识别结果描述为第二识别信息,例如以商户A为待识别对象,以返利业务为目标业务,目标信息为业务行为不满足返利业务关联的行为约定信息为例进行说明,若商户A在返利业务中的行为反馈数据1为“商户A没有进行返利相关的操作”,商户A在返利业务中的行为反馈数据2为“商户A没有针对X商品进行发货操作”,商户A在返利业务中的行为反馈数据3为“商户A返利的金额远小于约定的金额”,则基于上述返利业务关联的行为约定信息,则可以确定出行为反馈数据1和3的识别结果是第一识别信息,行为反馈数据2的识别结果是第二识别信息;本申请实施例中对上述第一识别信息和第二识别信息的具体形式不做限定,本领域的技术人员可根据实际需求设置,如可以用第一标签表示上述第一识别信息,用第二标签表示上述第二识别信息,上述第一标签可以但不局限于为“1”,上述第二标签可以但不局限于为“0”。
作为一种实施例,为提升对各个行为反馈数据是否包含目标信息进行识别的准确度,本申请实施例中可以基于各个行为反馈数据中包含的各个词语的上下文信息,对各个行为反馈数据进行识别;具体地,可以针对上述各个行为反馈数据,分别执行如下操作:根据上述各个行为反馈数据中一个行为反馈数据包含的各个词语的上下文信息,提取上述一个行为反馈数据对应的待处理文本特征;基于上述待处理文本特征,对上述一个行为反馈数据是否包含上述目标信息进行识别,确定上述一个行为反馈数据对应的识别结果;其中,本申请实施例中一个词语的上下文信息可以但不局限于包括该词语在行为反馈数据中的位置信息、该词语的语义特征等信息。
作为一种实施例,为了提升处理的效率和对各个行为反馈数据进行特征提取的准确度,在上述步骤S302中,可以通过已训练的数据分类模型,提取各个行为反馈数据各自对应的待处理文本特征,并基于各个行为反馈数据各自对应的待处理文本特征,确定各个行为反馈数据各自对应的识别结果,上述数据分类模型中可以包括语言学习子模型和数据预测子模型;其中,语言学习子模型可以用于对各个行为反馈数据进行特征提取,对上述语言学习子模型不做过多限定,本申请实施例中的语言学习子模型可以但不局限于包括预训练模型,如可以但不局限于包括Bert模型、Fast-Bert模型、Tiny-Bert模型或Word2vec模型等;上述数据预测子模型可以用于确定各个行为反馈数据各自对应的识别结果,本申请实施例中的数据预测子模型可以但不局限于包括用于做二分类的网络等;有关上述数据分类模型的详细内容将在下文中做进一步说明;
其中,上述Word2vec模型是用一个一层的神经网络(即CBOW网络)把one-hot形式的稀疏词向量映射称为一个n维(n可以但不局限于为几百)的稠密向量的过程;为了加快模型训练速度,本申请实施例中模型中的tricks可以但不局限于包括Hierarchicalsoftmax、negative sampling或Huffman Tree等;上述Bert(Bidirectional EncoderRepresentations from Transformer)模型为双向Transformer的编码网络(Encoder);Bert模型的目标是利用大规模无标注语料训练、获得文本的包含丰富语义信息的语义表示(Representation),然后将文本的语义表示在特定自然语言处理(Natural LanguageProcessing,NLP)任务中进行微调,最终应用于该特定NLP任务;其中,上述数据分类模型更详细的内容将在下文中做进一步说明。
步骤S303,基于上述各个行为反馈数据各自对应的识别结果,确定上述待识别对象在上述目标业务中的对象状态是否异常。
作为一种实施例,为了提升确定待识别对象在上述目标业务中的对象状态是否异常的准确度,本申请实施例中可以基于上述各个行为反馈数据各自对应的识别结果以及待识别对象的对象属性信息,确定上述待识别对象在上述目标业务中的对象状态是否异常;具体地,可以但不局限于基于上述各个行为反馈数据各自对应的识别结果中的第一识别信息,确定上述待识别对象对应的反馈有效信息,上述第一识别信息用于表征行为反馈数据中包含上述目标信息;获取上述待识别对象关联的对象属性信息;基于上述反馈有效信息和上述对象属性信息,确定上述待识别对象在上述目标业务中的对象状态是否异常。
作为一种实施例,上述反馈有效信息包括如下第一种反馈有效信息和第二种反馈有效信息中的一种或任意组合:其中,第一种反馈有效信息可以是上述各个行为反馈数据各自对应的识别结果中的第一识别信息的数量;第二种反馈有效信息可以是上述各个行为反馈数据各自对应的识别结果中,上述第一识别信息的数量与上述各个行为反馈数据的总数量的比值。
为便于理解,此处给出上述两种反馈有效信息的一个示例,如若获取的待识别对象在目标业务中的各个行为反馈数据的数量为N1,上述N1个行为反馈数据中有N2(N2小于或等于N1)个行为反馈数据中包含目标信息,则N1个行为反馈数据对应的识别结果中的第一识别信息的数量为N2,即此情况下可以但不局限于将N2确定为上述第一种反馈有效信息,将(N2/N1)确定为上述第二种反馈有效信息。
作为一种实施例,为了提升确定待识别对象在目标业务中的对象状态是否异常的效率,本申请实施例中还可以基于目标评分卡模型或已训练的状态识别模型,基于上述反馈有效信息和上述对象属性信息,确定上述待识别对象在上述目标业务中的对象状态是否异常,其详细内容将在下文中做进一步说明。
作为一种实施例,本申请实施例中的对象属性信息可以但不局限于指将待识别对象的相关信息进行标签化后的数据;对象属性信息中可以但不局限于包括如下至少一种信息:待识别对象的电子资源的转移信息、待识别对象对应的欺诈风险信息(上述欺诈风险信息表征上述待识别对象存在网络欺诈行为的可疑程度)、异常业务行为关联的行为信息(上述异常业务行为包括包含上述目标信息的行为反馈数据关联的业务行为)、待识别对象的创建时长、待识别对象的资产情况、待识别对象的信誉等级以及从待识别对象的历史行为反馈数据中挖掘出的信息等;其中,待识别对象为商户时,上述对象属性信息还可以包括该商户的收益情况、该商户的信誉等级、该商户的工商注册信息等。
进一步地,若上述对象属性信息包括上述异常业务行为关联的行为信息,上述行为信息包括如下至少一种信息:上述异常业务行为关联的电子资源值、上述异常业务行为关联的账户、上述异常业务行为关联的业务对象、上述异常业务行为的触发时间信息等。
作为一种实施例,以下内容对步骤S302中涉及的数据分类模型做进一步介绍,请参见图4,本申请实施例提供一种数据分类模型的结构示意图,该数据分类模型至少可以包括语言学习子模型401和数据预测子模型402,其中:
上述语言学习子模型401可以基于各个行为反馈数据包含的各个词语的上下文信息进行特征提取,获得各个行为反馈数据各自对应的待处理文本特征;具体地,针对各个行为反馈数据中的一个行为反馈数据,可以将上述一个行为反馈数据输入已训练的数据分类模型,基于上述数据分类模型中的语言学习子模型401,对上述一个行为反馈数据包含的各个词语的上下文信息进行特征提取,获得上述一个行为反馈数据对应的待处理文本特征;其中,上述语言学习子模型是将上述目标业务中的历史行为反馈数据作为训练样本,基于上述训练样本包含的各个词语的上下文信息进行训练得到,上述语言学习子模型401的具体内容将在下文中做进一步说明。
作为一种实施例,在基于语言学习子模型401获取上述一个行为反馈数据对应的待处理文本特征的过程中,可以首先对上述一个行为反馈数据进行分词处理,获得上述一个行为反馈数据包含的各个词语,进而通过编码(Embedding)等处理方式,对各个词语在上述一个行为反馈数据中的上下文信息进行处理,得到上述一个行为反馈数据包含的各个词语的词语表示(如可以但不局限于包括图中示意出的词语表示E1、词语表示E2和词语表示EN,N为正整数),上述词语表示中可以包括词语在行为反馈数据中的位置信息、词语的语义信息等;进而可以但不局限于用于通过多层的单元Trm的处理后,针对每个词语表示,分别提取出一个词语特征(如图所示,可以针对词语表示E1至EN,分别提取出词语特征T1至TN),进而可以对上述各个词语的词语特征进行处理,得到上述一个行为反馈数据对应的待处理文本特征,如可以但不局限于将上述各个词语的词语特征进行拼接,将拼接的结果确定为上述一个行为反馈数据对应的待处理文本特征等。
上述数据预测子模型402可以基于各个行为反馈数据各自对应的待处理文本特征,分别对上述各个行为反馈数据是否包含目标信息进行识别,并确定上述各个行为反馈数据各自对应的识别结果;具体地,在基于上述语言学习子模型获得上述一个行为反馈数据对应的待处理文本特征后,可以基于数据预测子模型402已学习的第一关联度,预测上述待处理文本特征和第一识别信息之间的第二关联度,并基于上述第二关联度确定上述一个行为反馈数据对应的识别结果;其中,上述第一识别信息表征行为反馈数据包含上述目标信息,上述第一关联度是基于历史行为反馈数据对应的历史文本特征和上述第一识别信息之间的关联程度确定的。
作为一种实施例,为了提升对各个行为反馈数据进行识别的准确度,本申请实施例中在基于上述第二关联度确定上述一个行为反馈数据对应的识别结果时,若上述第二关联度大于第一设定阈值,则确定上述一个行为反馈数据对应的识别结果为上述一个行为反馈数据中包含上述目标信息;若上述第二关联度不大于第一设定阈值,则确定上述一个行为反馈数据对应的识别结果为上述一个行为反馈数据中不包含上述目标信息;对上述第一设定阈值不做限定,本领域的技术人员可根据实际需求设置。
作为一种实施例,为了提升数据分类模型的准确度,以及提高数据分类模型的训练效率,本申请实施例中可以首先对语言学习子模型401进行训练,得到已训练的语言学习子模型401,进而在已训练的语言学习子模型401之后,创建用于上述数据预测子模型402,得到初始的数据分类模型,并对初始的数据分类模型进行训练,得到训练后的数据分类模型。
以下对数据分类模型的训练过程做示例性的介绍,首先对上述语言学习子模型401的训练过程做进一步说明。
本申请实施例中可以将目标业务中的历史行为反馈数据作为第一样本集中的训练样本,基于上述第一样本集中的训练样本包含的各个词语的上下文信息,对上述语言学习子模型进行特征提取训练得到的;具体地,可以但不局限于基于上述第一样本集,对上述语言学习子模型进行至少一次训练操作,获得训练后的语言学习子模型;其中,上述第一样本集中的训练样本可以包括一个历史对象在目标业务中的历史行为反馈数据,也可以包括多个历史对象在目标业务中的历史行为反馈数据,上述历史对象可以包括上述待识别对象,上述历史对象也可以不包括上述待识别对象,本领域的技术人员可根据实际需求获取一定数量的历史行为反馈数据作为第一样本集中的训练样本。
作为一种实施例,为了提升语言学习模型提取文本特征的准确度,本申请实施例中可以针对语言学习子模型的训练过程,设置第一训练结束条件,进而在对语言学习子模型进行训练的过程中,在确定满足第一训练结束条件时,输出正在训练的语言学习子模型;其中,对上述第一训练结束条件不做过多限定,本领域的技术人员可根据实际需求设置。
作为一种实施例,针对语言学习子模型401的一次训练操作中,可以针对第一样本集中的各个历史行为反馈数据,分别执行文本预测操作,确定语言学习子模型的模型预测误差,并基于模型预测误差对上述语言学习子模型的模型参数进行调整,具体地,请参见图5,提供针对语言学习子模型401的一次训练操作的流程的示意图,一次训练操作可以但不局限于包括如下步骤S501和S502:
步骤S501,针对从第一样本集中获取的各个历史行为反馈数据,分别执行文本预测操作,确定上述各个历史行为反馈数据各自对应的预测偏差。
作为一种实施例,一个历史行为反馈数据对应的预测偏差,可以表征通过语言学习子模型,对上述一个历史行为反馈数据中的部分词语进行文本预测的误差信息;在针对一个历史行为反馈数据的文本预测操作中,可以但不局限于基于上述一个历史行为反馈数据中部分词语在上述一个历史行为反馈数据中的上下文信息,对上述部分词语进行预测;具体地,上述文本预测操作可以但不局限于包括如下步骤S5011至步骤S5014。
步骤S5011,对上述各个历史行为反馈数据中的一个历史行为反馈数据进行分词处理,获得上述一个历史行为反馈数据包含的各个词语。
作为一种实施例,对上述一个历史行为反馈数据进行分词处理的具体方式不做过多限定,本领域的技术人员可根据实际需求设置,如可以但不局限于对历史行为反馈数据进行结巴分词,再基于去停用词预处理技术对结巴分词的结果进行处理,得到上述一个历史行为反馈数据包含的各个词语;其中,上述停用词预处理中涉及的停用词可以但不局限于包括英文字符、数字、数学字符、标点符号以及使用频率特别高的没有实际意义的汉字(如可以但不局限于包括“的”、“在”、“和”、“以及”等),本申请实施例中,移除行为反馈数据中的停用词能提升对行为反馈数据进行识别的准确度。
步骤S5012,屏蔽上述一个历史行为反馈数据包含的各个词语中的部分词语。
作为一种实施例,该步骤中可以但不局限于使用预设的词语掩膜Mask,随机遮挡上述一个历史行为反馈数据包含的各个词语中的一个或多个词语,对上述词语掩膜Mask的具体形式不做限定,本领域的技术人员可根据实际需求设置。
步骤S5013,确定上述部分词语在上述一个历史行为反馈数据中的上下文信息,并从预配置的候选词库中,选取出与确定的上下文信息之间的匹配度满足匹配度条件的候选词语,上述候选词库基于上述第一样本集确定。
作为一种实施例,在训练语言学习子模型之前,可以但不局限于对第一样本集中的各个历史行为反馈数据进行分词处理,将分词处理获得的各个词语确定为候选词语,将得到的候选词语集合确定为上述候选词库,其中对各个历史行为反馈数据进行分词处理的具体方式可参照步骤S5011,此处不再重复叙述。
作为一种实施例,对上述匹配度满足匹配度条件的情况不做限定,本领域的技术人员可根据实际需求设置,如可以将候选词语与确定的上下文信息之间的匹配度中数值最大的匹配度,确定为满足匹配度条件的匹配度,也可以将候选词语与确定的上下文信息之间的匹配度中,最接近匹配度阈值的匹配度,确定为满足匹配度条件的匹配度。
步骤S5014,将上述部分词语和选取出的候选词语之间的偏差信息,确定为上述一个历史行为反馈数据对应的预测偏差。
作为一种实施例,上述预测偏差可以但不局限于表征上述部分词语和选取出的候选词语之间的偏离程度,该偏离程度可以与部分词语和选取出的候选词语的匹配程度呈负相关;本申请实施例中可以根据实际需求,设置确定上述预测偏差的具体方式。
步骤S502,基于上述各个历史行为反馈数据各自对应的预测偏差,对上述语言学习子模型进行参数调整。
作为一种实施例,可以基于各个历史行为反馈数据各自对应的预测偏差,确定语言学习子模型的模型预测误差,基于模型预测误差对语言学习子模型进行参数调整,如可以但不局限于朝着减小模型预测误差的方向,调整语言学习子模型的模型参数等。
为了提升方案实施的灵活度,本申请实施例中对确定上述模型预测误差的具体方式不做过多限定,本申请实施例中可以根据实际的业务需求灵活设置如可以但不局限于将各个历史行为反馈数据各自对应的预测偏差的均值,确定为上述模型预测误差;也可以基于下述公式(1)的原理,确定语言学习子模型的模型预测误差:
Figure BDA0002961958020000221
公式(1)中,K2可以但不局限于是从训练样本集合中获取的历史行为反馈数据的总数量,K1为文本预测正确的历史行为反馈数据的数量,P2为上述模型预测误差;其中,文本预测正确的历史行为反馈数据可以但不局限于是预测偏差大于预测偏差阈值的历史行为反馈数据,文本预测正确的历史行为反馈数据也可以是选取出的候选词语是屏蔽的部分词语本身的历史行为反馈数据等,本领域的技术人员可根据实际需求设置。
作为一种实施例,在获取已训练的语言学习子模型之后,可以获取目标业务中一定数量的历史行为反馈数据,将获取的历史返利反馈数据进行数据类型的标注后作为第二样本集中的训练样本,进而基于第二样本集对数据分类模型中的数据预测模型进行训练,其中,对历史行为反馈数据标注的数据类型可以是上述第一识别信息或第二识别信息,若一个历史行为反馈数据中包含上述目标信息,则将该历史行为反馈数据的数据类型标注为第一识别信息,若一个历史行为反馈数据中包含上述目标信息,则将该历史行为反馈数据的数据类型标注为第二识别信息。
请参见图6,进一步地,在基于第二样本集训练数据预测子模型的过程中,可以基于语言学习子模型获得各个历史行为反馈数据各自对应的待处理文本特征,进而基于数据预测子模型对第二样本集中各个历史行为反馈数据各自对应的待处理文本特征进行识别,确定第二样本集中各个历史行为反馈数据各自对应的预测数据类型(该预测数据类型即为对上述各个行为反馈数据是否包含目标信息进行识别的识别结果),进而基于第二样本集中各个历史行为反馈数据的预测数据类型和标注的数据类型之间的偏差信息,对数据预测子模型进行训练,在满足第二训练结束条件时,将当前的语言学习子模型和数据预测子模型,输出为数据分类模型;其中,对上述第二训练结束条件不做过多限定,本领域的技术人员可根据实际需求设置。
作为一种实施例,请继续参见图6,为了进一步提升数据分类模型中的数据预测子模型的准确度,在确定满足第二训练结束条件后,还可以基于测试样本集对上述数据预测子模型做进一步的调整,其中测试样本集中包括一定数量的标注数据类型后的历史行为反馈数据。
作为一种实施例,请继续参见图6,为了进一步提升数据分类模型中的数据预测子模型的准确度,以及提升对数据预测子模型进行训练的效率,还可以在对上述数据预测子模型进行训练之前,对获取的历史行为反馈数据进行数据预处理,如对历史返利反馈数据进行数据清洗,清洗掉异常的历史行为反馈数据;其中本领域的技术人员可根据实际需求设置上述异常的历史行为反馈数据,如可以但不局限于将信息为空的历史行为反馈数据确定为异常的历史行为反馈数据,将存在无真实语义的数字或英文串、乱码等的历史行为反馈数据确定为异常的历史行为反馈数据等;还可以针对对历史行为反馈数据的标注的数据类型进行清洗等,以降低异常的历史行为反馈数据对数据预测子模型的影响,提升训练后的数据预测子模型对行为反馈数据是否包含目标信息进行识别的准确度。
作为一种实施例,以下内容对步骤S303中基于目标评分卡模型或已训练的状态识别模型,确定上述待识别对象在上述目标业务中的对象状态是否异常的过程,分别进行说明,具体请参见下述第一种对象评估方式和第二种对象评估方式的具体内容。
第一种对象评估方式:基于目标评分卡模型,确定待识别对象在目标业务中的对象状态是否异常。
具体地,基于上述目标评分卡模型,对上述反馈有效信息和上述对象属性信息进行处理,得到上述待识别对象针对上述目标业务的目标行为评估值;基于上述目标行为评估值,确定上述待识别对象在上述目标业务中的对象状态是否异常,其中上述目标行为评估值即为待识别对象针对目标业务的行为评估值的简称。
本申请实施例中,目标评分卡模型用于预测待识别对象在目标业务中的对象状态是异常状态的目标行为评估值;本申请实施例中可以将上述反馈有效信息和上述对象属性信息作为目标评分卡模型的变量,构建逻辑回归模型,将构建的逻辑回归模型确定为上述目标评分卡模型;为便于理解,请参见如下公式(2)至(4),提供一种目标评分卡模型的示例;
Score=A1-B1log(Odds) 公式(2)
Figure BDA0002961958020000241
log(Odds)=a0+a1×x1+a2×x2+a3×x3+…+an×xn 公式(4)
其中,公式(2)至(4)中,A1和B1为常量,Odds是待识别对象在目标业务中的对象状态是异常状态的几率,p为待识别对象在目标业务中发生不满足目标业务关联的行为约定信息的业务行为的概率,Score为待识别对象针对目标业务的目标行为评估值,即待识别对象的Odds越大,该待识别对象针对目标业务的目标行为评估值越低;x0至xn分别为不同变量,a0为常量,a1至an分别为目标变量x1至xn的参数;其中,若将目标业务中发生欺诈行为的对象的对象状态视为异常状态,则上述Odds是待识别对象在目标业务中发生欺诈行为的几率,上述p为待识别对象在目标业务中发生欺诈行为的概率。
作为一种实施例,上述对象属性特征中的一个信息可以作为x0至xn中的一个变量,如对象属性特征中包括待识别对象在设定时段内的电子资源转移值、待识别对象对应的欺诈风险等级、待识别对象的资产值时,上述公式(4)则可以变形为公式(4a);
log(Odds)=a0+a1×x1+a2×x2+a3×x3+a4×x4 公式(4a)
其中,公式(4a)中,x1至x4分别为待识别对象的反馈有效信息、待识别对象在设定时段内的电子资源转移值、待识别对象对应的欺诈风险信息和待识别对象的资产值;a0为常量,a1至a4分别为变量x1至x4的参数,Odds是待识别对象在目标业务中的对象状态是异常状态的几率;其中,若将目标业务中发生欺诈行为的对象的对象状态视为异常状态,则上述Odds是待识别对象在目标业务中发生欺诈行为的几率。
作为一种实施例,可以设置行为评估值与对象在上述目标业务中的对象状态是异常状态的可疑程度呈负相关(如可以但不局限于参见上述公式(2)),故而本申请实施例中在基于上述目标行为评估值,确定上述待识别对象在上述目标业务中的对象状态是否异常的过程中,若确定上述目标行为评估值低于第一评估值阈值,则确定上述待识别对象是异常对象;其中,上述异常对象包括在上述目标业务中的对象状态是异常状态的对象,如上述异常状态的对象可以但不局限于是对象在目标业务中发生欺诈行为的对象;
作为一种实施例,可以设置行为评估值与对象在上述目标业务中的对象状态是异常状态的可疑程度呈正相关,如将上述公式(2)转换成公式(2a)的形式,则该情况中,在基于上述目标行为评估值,确定上述待识别对象在上述目标业务中的对象状态是否异常的过程中,若确定上述目标行为评估值高于第二评估值阈值,则确定上述待识别对象是异常对象;其中,上述异常对象的描述可参见上述内容,此处不再重复说明,同时对上述第一评估值阈值和第二评估值阈值不做限定,本领域的技术人员可根据实际需求设置。
Score=A2+B2log(Odds) 公式(2a)
公式(2a)中,A2和B2为常量,Odds是待识别对象在目标业务中的对象状态是异常状态的几率,Score为待识别对象针对目标业务的目标行为评估值,即待识别对象的Odds越大,该待识别对象针对目标业务的目标行为评估值越高;其中,若将目标业务中发生欺诈行为的对象的对象状态视为异常状态,则上述Odds是待识别对象在目标业务中发生欺诈行为的几率。
作为一种实施例,为提升对待识别对象进行评估的准确度,本申请实施例中还可以针对对象进行异常对象等级的划分,在确定上述待识别对象在上述目标业务中的对象状态是否异常的过程中,可以根据至少一个对象异常等级映射的行为评估值范围,确定上述目标行为评估值归属的行为评估值范围,并将确定的行为评估值范围映射的对象异常等级,确定为上述待识别对象对应的对象异常等级;其中,对上述对象异常等级的划分不做过多限定,本领域的技术人员可根据实际需求设置,如可以但不局限于根据对象在上述目标业务中的对象状态是异常状态的可疑程度,确定出不同的对象异常等级,如将对象异常等级设置为正常对象、低风险异常对象、中风险异常对象和高风险异常对象等,如异常对象为存在欺诈行为的对象时,可以但不局限于将对象异常等级设置为正常对象、低风险欺诈对象、中风险欺诈对象和高风险欺诈对象等;对上述对象异常等级和行为评估值范围的映射关系也不做过多限定,本领域的技术人员可根据实际需求设置。
作为一种实施例,为了提升基于目标评分卡模型确定待识别对象的对象状态是否异常的准确度,本申请实施例中还可以预先针对不同对象进行对象类型的划分,针对不同对象类型的对象,分别创建对应的目标评分卡模型,进而在基于上述目标评分卡模型,对上述反馈有效信息和上述对象属性信息进行处理,得到上述待识别对象针对上述目标业务的目标行为评估值之前,可以进一步确定上述待识别对象的对象类型;从上述目标业务关联的目标评分卡模型集合中,获取与上述对象类型对应的目标评分卡模型;其中,本申请实施例中可以但不局限于基于待识别对象的身份指示信息或类型指示信息等,确定上述待识别对象的对象类型;
应当说明的是,本申请实施例中的对象类型是一种用于对本申请实施例涉及的对象进行区分的区分方式,本申请实施例中,可以按照不同的区分维度,将对象分为不同的类型,如对象为商户时,可以但不局限于将商户进行电子资源的结算的方式作为区分维度,将商户划分为直连商户、子商户和小微商户,其中,直连商户可以是直接与目标应用程序进行电子资源结算的大型商户,子商户可以是与目标应用程序之外的其它应用程序进行电子资源结算且其它应用程序再与目标应用程序之间进行电子资源结算的商户,小微商户可以是直接与目标应用程序进行电子资源结算的小型商户;本申请实施例中也可以将主营时间为区分维度,将商户分为工作日型商户以及假日型商户,或,以主营时间为区分维度还可以将商户分为普通商户以及夜宵型商户,其中,工作日通常用于表示每周的周一至周五,而假日通常用于表示每周的周六和周日。
为便于理解,以下对本申请实施例涉及的目标评分卡模型的获得过程做进一步说明:
请参见图7,提供一种创建目标评分卡模型的流程示意图,本申请实施例中,可以通过数据获取、探索性数据分析EDA、对象类型和评级分析、数据预处理、变量筛选、构建逻辑回归LR模型,并对逻辑回归模型进行训练,对训练得到的逻辑回归模型进行模型评估,将满足评估条件的逻辑回归模型输出为目标评分卡模型,其中在训练逻辑回归模型的过程中,目标是寻找上述公式(4)中参数x1至xn的理想值,以提升目标评分卡模型的预测准确度;在得到目标评分卡模型后,还可以将得到的目标评分卡模型部署到实时系统中以供使用。
作为一种实施例,上述数据获取的处理过程中,可以但不局限于将人工审核出来的对象是否是对象状态为异常状态的异常对象的信息作为目标评分卡模型中的一个变量,将有效反馈信息作为目标评分卡模型中的一个变量,将对象类型或对象的风险评级作为目标评分卡模型中的一个变量等;其中,以商户作为对象的实例,以返还利益作为目标业务,以在返还利益中存在欺诈行为的商户视为对象状态为异常状态的异常对象为例进行说明,可以将上述商户是否是在目标业务中进行欺诈行为的异常商户的信息、上述有效反馈信息、商户的商户类型和商户的风险评级等,分别作为目标评分卡模型的一个变量;其中,上述商户类型的划分方式可参见上述内容,此处不再重复说明。
作为一种实施例,上述EDA的处理过程中,可以但不局限于获取各个变量相关的数据的信息,例如可以但不局限于包括获取每个变量相关的每个字段的缺失值情况、异常值情况、平均值、中位数、最大值、最小值、分布情况等,以便制定合理的数据预处理方案;上述对象类型和评级分析可以但不局限于是探索性数据分析之后,基于不同对象类型、对象的风险评级在数据上差异,对对象类型和对象的风险评级做进一步分类。
作为一种实施例,上述数据预处理的处理过程中可以但不局限于包括数据清洗、变量分箱及WOE转换的处理过程;其中,数据清洗的处理过程中主要是对原始的数据中脏数据,缺失值,异常值进行处理,如可以但不局限于包括直接删除缺失率大于缺失率阈值的变量,将剩余变量中的缺失值和异常值作为一种状态。
作为一种实施例,变量分箱及WOE转换的处理过程中,可以但不局限于对数值连续的变量进行分段离散化,将多状态的离散变量进行合并,以减少离散变量的状态数,提升目标评分卡模型的处理效率;具体地,可以但不局限于利用scorecardpy库中的woebin进行分箱,其中,woebin支持决策树分箱、卡方分箱、自定义分箱,默认的WOE值计算是用坏样本的比率或者好样本的比率,WOE值可以通过参数进行调整,例如若某一分箱中只有好样本或者坏样本,则可以会对缺失的类别赋予0.99进行调整,以计算woe值。
作为一种实施例,上述变量筛选的处理过程中可以包括单变量筛选和变量相关性分析;其中,单变量筛选中可以基于变量的信息价值(Information Value,IV)值对变量进行筛选,一个变量的IV值越大,表示该变量评估对象的能力越强,该处理过程中筛选出IV值较高的一些单独的变量;上述变量相关性分析的处理过程中,可以进行变量两两相关性分析和变量的多重共线性分析,以剔除跟目标的变量相关度低于相关度阈值的特征,消除由于线性相关的变量,避免特征冗余,减轻后期验证、部署、监控的负担,保证变量的可解释性。
作为一种实施例,上述构建逻辑回归模型的过程中,可以构建初步的逻辑回归模型,根据p-value进行变量筛选,根据各个变量的系数符号进行筛选,将最终得到的逻辑回归模型输出为目标评分卡模型;模型评估的处理过程中,可以选用KS值指标,其中KS值表示了目标评分卡模型区分正常对象和异常对象的能力,其实质是TPR-FPR随正常对象和异常对象的阈值变化的最大值;上述KS值的取值范围可以但不局限于在0.5和1之间,KS值越大,表征目标评分卡模型对待识别对象进行评估的准确度越好;本申请实施例中可以但不局限于在KS>0.4时,输出当前的目标评分卡模型为最终的目标评分卡模型。
第二种对象评估方式:基于状态识别模型,确定待识别对象在目标业务中的对象状态是否异常。
作为一种实施例,本申请实施例涉及的状态识别模型可以但不局限于包括用于对对象进行分类的神经网络模型,如状态识别模型可以但不局限于是二分类模型。
作为一种实施例,本申请实施例在基于上述反馈有效信息和上述对象属性信息,确定上述待识别对象在上述目标业务中的对象状态是否异常的过程中,可以将上述反馈有效信息和上述对象属性信息,输入已训练的状态识别模型,并通过上述状态识别模型进行如下处理:
将上述反馈有效信息和上述对象属性信息,确定为上述待识别对象对应的待处理对象特征;基于上述状态识别模型已学习的第三关联度,预测上述待处理对象特征和目标对象识别结果之间的第四关联度,若上述第四关联度大于第二设定阈值,则确定上述待识别对象是异常对象,其中,上述第三关联度是基于历史对象对应的历史对象特征和上述目标识别结果之间的关联程度确定的,上述异常对象包括在上述目标业务中的对象状态是异常状态的对象,上述目标对象识别结果用于表征对象在上述目标业务中的对象状态是异常状态;即若异常对象是在目标业务中发生欺诈行为的对象时,上述目标对象识别结果用于表征对象在上述目标业务中发生欺诈行为。
作为一种实施例,以下以在目标业务中发生欺诈行为的对象为上述异常对象为例,对状态识别模型的训练过程进行说明;其中,在状态识别模型的训练过程中,可以对不同历史对象对应的历史对象特征(该历史对象特征包括历史对象对应的反馈有效信息和历史对象的对象属性信息)进行对象在目标业务中是否发生欺诈行为进行标注后,作为第三样本集中的训练样本,并基于第三样本集对状态识别模型进行训练;其中,上述对历史对象特征进行对象在目标业务中是否发生欺诈行为进行的标注可以是正常对象或异常对象,若一个历史对象特征对应的历史对象在目标业务中存在欺诈行为,则将该历史对象特征标注为异常对象,若一个历史对象特征对应的历史对象在目标业务中不存在欺诈行为,则将该历史对象特征标注为正常对象。
作为一种实施例,在状态识别模型的训练过程中,状态识别模型根据上述历史对象特征,估计各历史对象特征是否是异常对象的对象识别结果,基于各个历史对象各自对应的标注信息和对象识别结果的偏差信息,确定状态识别模型的预测误差,进而朝着使状态识别模型的预测误差降低的方向,对上述状态识别模型进行参数调整,至满足第三训练结束条件,其中,对上述第二训练结束条件不做过多限定,本领域的技术人员可根据实际需求设置。
作为一种实施例,本申请实施例在步骤S303中,通过上述第一种对象评估方式或第二种对象评估方式,确定上述待识别对象是异常对象之后,还可以进一步对异常对象进行处罚类的操作,具体地,在确定待识别对象是异常对象之后,可以但不局限于取消上述待识别对象的第一权限和第二权限中的至少一个;上述第一权限包括进行电子资源转移操作的权限,第二权限包括针对目标电子资源值的电子资源转移操作,上述目标电子资源值基于上述行为反馈数据确定,如待识别对象是商户,目标业务是返利业务时,上述目标电子资源值可以是基于行为反馈数据涉及的返利金额确定,如行为反馈数据涉及的返利金额为1000元人民币,则上述目标电子资源值可以是1000元人民币的资源值。
作为一种实施例,本申请实施例中涉及的数据分类模型、目标评分卡模型和状态识别模型的训练过程可以部署在离线系统上进行,在对数据分类模型、目标评分卡模型和状态识别模型进行训练且评估后,可以将数据分类模型、目标评分卡模型和状态识别模型部署到准实时系统或者实时系统使用,以提升基于行为反馈数据对对象进行识别的效率;具体地,可以但不局限于一些计算资源需求量较大的模型部署到准实时系统,等计算结束后将最终的结果返回到实时系统,例如可以将上述数据分类模型部署到准实时系统,基于数据分类模型确定各个行为反馈数据各自对应的识别结果之后,将确定的各个识别结果回写到实时系统;由于目标评分卡模型需要的计算资源相对较少,可以将目标评分卡模型直接部署到实时系统中,从准实时系统上获取各个行为反馈数据各自对应的识别结果以及获取待识别对象的对象属性特征(如对象为商户时,对象属性特征可以但不局限于包括商户交易的实时资金流、信息数据等数据)后,可以直接在实时系统上,基于目标评分卡模型,确定待识别对象针对目标业务的目标行为评估值。
本申请实施例的以下内容中,提供一种基于行为反馈数据的对象状态识别方法的完整示例,该示例中以商户作为待识别对象,以返还利益(以下简称为返利业务)为上述目标业务为例,以在返利业务中存在欺诈行为的对象为对象状态为异常状态的异常对象为例,以Word2vec模型作为上述语言学习子模型的示例,以分类器作为上述数据预测模型的示例进行说明。
请参见图8,该示例中首先获取待识别商户在返利业务中的各个历史返利反馈数据(即上述历史行为反馈数据),针对各个历史返利反馈数据的数据类型进行标注,如若一个历史返利数据中包含目标信息,则可以将该历史返利数据的数据类型标注为返利反馈有效,若一个历史返利数据中不包含目标信息,则可以将该历史返利数据的数据类型标注为返利反馈无效;进一步在离线系统上对上述数据分类模型(包括Word2vec模型和上述分类器)进行训练,得到训练后的数据分类模型,并将训练后的数据分类模型部署到准实时系统中以备使用;同时离线训练目标评分卡模型,并将训练后的目标评分卡模型部署到实时系统中。
在对待识别商户在返利业务中是否存在欺诈行为进行识别的过程中,首先获取待识别商户在返利业务中的各个返利反馈数据,进而基于部署在准实时系统(又称为实时交易系统)中的数据分类模型,对获取的各个返利反馈数据进行识别,确定各个返利反馈数据各自对应的识别结果(返利反馈有效或返利反馈无效);进一步将各个返利反馈数据各自对应的识别结果回写到实时系统(又称为实时交易决策系统);进一步基于部署在实时系统中的目标评分卡模型,基于各个返利反馈数据各自对应的识别结果,确定反馈有效信息,对反馈有效信息和待识别商户的对象属性特征进行处理,得到待识别商户针对返利业务的目标行为评估值,若获得的目标行为评估值低于第一评估值阈值,则自动对待识别商户进行处罚操作(具体可参见上述内容),若获得的目标行为评估值不低于第一评估值阈值,则放过该待识别商户。
作为一种实施例,该示例中数据分类模型的训练过程请参见图9,数据分类模型的训练过程中,首先对Word2vec模型进行预训练,进而在预训练后的Word2vec模型后构建分类器,以形成初始的数据分类模型,进而获取一定数量的历史返利反馈数据,将获取的历史返利反馈数据进行标注后作为训练样本集中的训练样本,进而获得各个历史反馈数据各自对应的待处理文本特征,进而基于训练样本集中的各个历史反馈数据各自对应的待处理文本特征和标注标签对分类器进行训练,在训练结束后,基于测试样本集中的各个历史反馈数据各自对应的待处理文本特征和标注标签对分类器进一步进行训练,其中,可以通过如下方式获取一个历史返利反馈数据对应的待处理文本特征:通过Word2vec模型对上述一个历史反馈数据进行分词处理,并获得上述一个历史返利反馈数据包含的各个词语的词向量(即各个词语的上下文信息),进而将上述一个历史返利反馈数据包含的各个词语词向量进行累加(或称为拼接),得到上述一个历史返利反馈数据对应的待处理文本特征。
作为一种实施例,本申请实施例还提供一个本示例的整体的系统流程示意图,具体请参见图10,主要包括数据层、模型层和应用层;其中:
数据层的数据可以包括待识别商户在返利业务中的返利反馈数据、待识别商户的商户类型和待识别商户的对象属性特征(如可以但不局限于包括图中示意出的商户分级、商户资金流和商户信息流)。
模型层涉及的模型可以但不局限于包括数据分类模型和目标评分卡模型,其中数据分类模型中可以但不局限于涉及结巴分词、Word2vec模型和LR模型。
应用层可以但不局限于包括基于目标应用程序的移动支付(如可以但不局限于包括微信商业支付)、返利诈骗、返利反馈(又可称为商业保障)以及自动处罚等相关的操作。
本申请实施例提供的方法,在目标业务中的对象状态是异常状态的异常对象识别的准确度高达90%,如以存在欺诈行为的对象作为异常对象为例,基于本申请实施例提供的方法,在目标业务中存在欺诈行为的异常对象识别的准确度高达90%,如利用本申请实施例提供的方法,对商户在返利业务中是否存在欺诈行为进行识别时,能识别出90%在返利业务中存在欺诈行为的异常商户,且可以在获得待识别商户在返利业务中的返利反馈数据之后,能在秒级时间内识别出的异常商户,并对识别出的异常商户进行自动处罚,如冻结异常商户的资金或关闭异常商户的支付权限,实现及时止损,且自动处罚异常商户的准确率高达99%,相较于之前的处理方式,明显提升了对在目标业务中存在欺诈行为的异常对象的识别效率和处罚时效性,且减少人力成本。
请参照图11,基于同一发明构思,本申请实施例提供一种基于行为反馈数据的对象状态识别装置1100,包括:
数据获取单元1101,用于获取待识别对象在目标业务中的各个行为反馈数据;其中,上述行为反馈数据是使用上述目标业务的账户,针对上述待识别对象在上述目标业务中执行的业务行为触发的;
第一识别单元1102,用于分别对上述各个行为反馈数据是否包含目标信息进行识别,并确定上述各个行为反馈数据各自对应的识别结果,上述目标信息表征上述业务行为不满足上述目标业务关联的行为约定信息;
第二识别单元1103,用于基于上述各个行为反馈数据各自对应的识别结果,确定上述待识别对象在上述目标业务中的对象状态是否异常。
作为一种实施例,第一识别单元1102具体用于针对上述各个行为反馈数据,分别执行如下操作:
根据上述各个行为反馈数据中一个行为反馈数据包含的各个词语的上下文信息,提取上述一个行为反馈数据对应的待处理文本特征;
基于上述待处理文本特征,对上述一个行为反馈数据是否包含上述目标信息进行识别,确定上述一个行为反馈数据对应的识别结果。
作为一种实施例,第一识别单元1102具体用于:将上述一个行为反馈数据输入已训练的数据分类模型;基于上述数据分类模型中的语言学习子模型,对上述一个行为反馈数据包含的各个词语的上下文信息进行特征提取,获得上述一个行为反馈数据对应的待处理文本特征;其中,上述语言学习子模型是将上述目标业务中的历史行为反馈数据作为训练样本,基于上述训练样本包含的各个词语的上下文信息进行训练得到的;
上述第二识别单元1103具体用于:基于上述数据分类模型中的数据预测子模型已学习的第一关联度,预测上述待处理文本特征和第一识别信息之间的第二关联度,基于上述第二关联度确定上述一个行为反馈数据对应的识别结果,上述第一识别信息表征行为反馈数据包含上述目标信息,上述第一关联度是基于历史行为反馈数据对应的历史文本特征和上述第一识别信息之间的关联程度确定的。
作为一种实施例,第一识别单元1102具体用于:若上述第二关联度大于第一设定阈值,则确定上述一个行为反馈数据对应的识别结果为上述一个行为反馈数据中包含上述目标信息;若上述第二关联度不大于第一设定阈值,则确定上述一个行为反馈数据对应的识别结果为上述一个行为反馈数据中不包含上述目标信息。
作为一种实施例,第二识别单元1103具体用于:
基于上述各个行为反馈数据各自对应的识别结果中的第一识别信息,确定上述待识别对象对应的反馈有效信息,上述第一识别信息用于表征行为反馈数据中包含上述目标信息;
获取上述待识别对象关联的对象属性信息;
基于上述反馈有效信息和上述对象属性信息,确定上述待识别对象在上述目标业务中的对象状态是否异常。
作为一种实施例,上述反馈有效信息包括如下一种或任意组合:上述各个行为反馈数据各自对应的识别结果中的第一识别信息的数量;上述各个行为反馈数据各自对应的识别结果中,上述第一识别信息的数量与上述各个行为反馈数据的总数量的比值。
作为一种实施例,第二识别单元1103具体用于:基于上述目标评分卡模型,对上述反馈有效信息和上述对象属性信息进行处理,得到上述待识别对象针对上述目标业务的目标行为评估值;基于上述目标行为评估值,确定上述待识别对象在上述目标业务中的对象状态是否异常。
作为一种实施例,第二识别单元1103还用于:基于上述目标评分卡模型,对上述反馈有效信息和上述对象属性信息进行处理,得到上述待识别对象针对上述目标业务的目标行为评估值之前,确定上述待识别对象的对象类型;从上述目标业务关联的目标评分卡模型集合中,获取与上述对象类型对应的目标评分卡模型。
作为一种实施例,第二识别单元1103具体用于:
若确定上述目标行为评估值低于评估值阈值,则确定上述待识别对象是异常对象;其中,上述异常对象包括在上述目标业务中的对象状态是异常状态的对象,行为评估值与对象在上述目标业务中的对象状态是异常状态的可疑程度呈负相关;或
根据至少一个对象异常等级映射的行为评估值范围,确定上述目标行为评估值归属的行为评估值范围,并将确定的行为评估值范围映射的对象异常等级,确定为上述待识别对象对应的对象异常等级;其中,上述对象异常等级是根据对象在上述目标业务中的对象状态是异常对象的可疑程度确定的。
作为一种实施例,第二识别单元1103具体用于:将上述反馈有效信息和上述对象属性信息,输入已训练的状态识别模型,并通过上述状态识别模型进行如下处理:将上述反馈有效信息和上述对象属性信息,确定为上述待识别对象对应的待处理对象特征;基于上述状态识别模型已学习的第三关联度,预测上述待处理对象特征和目标对象识别结果之间的第四关联度,若上述第四关联度大于第二设定阈值,则确定上述待识别对象是异常对象,其中,上述第三关联度是基于历史对象对应的历史对象特征和上述目标识别结果之间的关联程度确定的,上述异常对象包括在上述目标业务中的对象状态是异常状态的对象,上述目标对象识别结果用于表征对象在上述目标业务中的对象状态是异常状态。
作为一种实施例,第二识别单元1103还用于:确定上述待识别对象是异常对象之后,取消上述待识别对象的第一权限和第二权限中的至少一个;上述第一权限包括进行电子资源转移操作的权限,第二权限包括针对目标电子资源值的电子资源转移操作,上述目标电子资源值基于上述行为反馈数据确定。
作为一种实施例,上述对象属性信息包括如下至少一种信息:
待识别对象的电子资源的转移信息;待识别对象对应的欺诈风险信息,上述欺诈风险信息表征上述待识别对象存在网络欺诈行为的可疑程度;异常业务行为关联的行为信息,上述异常业务行为包括包含上述目标信息的行为反馈数据关联的业务行为。
作为一种实施例,上述对象属性信息包括上述异常业务行为关联的行为信息,上述行为信息包括如下至少一种信息:上述异常业务行为关联的电子资源值;上述异常业务行为关联的账户;上述异常业务行为关联的业务对象;上述异常业务行为的触发时间信息。
作为一种实施例,图11中的装置可以用于实现前文论述的任意一种基于行为反馈数据的对象状态识别方法。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种计算机设备。该计算机设备可以用于基于推送内容的数据处理。在一种实施例中,该计算机设备可以是服务器,如图1所示的服务器120。在该实施例中,计算机设备的结构可以如图12所示,包括存储器1201,通讯模块1203以及一个或多个处理器1202。
存储器1201,用于存储处理器1202执行的计算机程序。存储器1201可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器1201可以是易失性存储器(Volatile Memory),例如随机存取存储器(Random-Access Memory,RAM);存储器1201也可以是非易失性存储器(Non-VolatileMemory),例如只读存储器,快闪存储器(Flash Memory),硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);或者存储器1201是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1201可以是上述存储器的组合。
处理器1202,可以包括一个或多个中央处理单元(Central Processing Unit,CPU)或者为数字处理单元等。处理器1202,用于调用存储器1201中存储的计算机程序时实现上述账户特征的提取方法。
通讯模块1203用于与终端设备和其他服务器进行通信。
本申请实施例中不限定上述存储器1201、通讯模块1203和处理器1202之间的具体连接介质。本申请实施例在图12中以存储器1201和处理器1202之间通过总线1204连接,总线1204在图12中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1204可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器1201中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的账户特征的提取方法。处理器1202用于执行上述账户特征的提取方法,如图3所示。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例上述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
基于同一技术构思,本申请实施例还一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,当上述计算机指令在计算机上运行时,使得计算机执行如前文论述的用于即时通讯的应用的启动方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种基于行为反馈数据的对象状态识别方法,其特征在于,包括:
获取待识别对象在目标业务中的各个行为反馈数据;其中,所述行为反馈数据是使用所述目标业务的账户,针对所述待识别对象在所述目标业务中执行的业务行为触发的;
分别对所述各个行为反馈数据是否包含目标信息进行识别,并确定所述各个行为反馈数据各自对应的识别结果,所述目标信息表征所述业务行为不满足所述目标业务关联的行为约定信息;
基于所述各个行为反馈数据各自对应的识别结果,确定所述待识别对象在所述目标业务中的对象状态是否异常。
2.如权利要求1所述的方法,其特征在于,所述分别对所述各个行为反馈数据是否包含目标信息进行识别,并确定所述各个行为反馈数据各自对应的识别结果,包括:
针对所述各个行为反馈数据,分别执行如下操作:
根据所述各个行为反馈数据中一个行为反馈数据包含的各个词语的上下文信息,提取所述一个行为反馈数据对应的待处理文本特征;
基于所述待处理文本特征,对所述一个行为反馈数据是否包含所述目标信息进行识别,确定所述一个行为反馈数据对应的识别结果。
3.如权利要求2所述的方法,其特征在于,所述根据所述各个行为反馈数据中一个行为反馈数据包含的各个词语的上下文信息,提取所述一个行为反馈数据对应的待处理文本特征,包括:
将所述一个行为反馈数据输入已训练的数据分类模型;
基于所述数据分类模型中的语言学习子模型,对所述一个行为反馈数据包含的各个词语的上下文信息进行特征提取,获得所述一个行为反馈数据对应的待处理文本特征;其中,所述语言学习子模型是将所述目标业务中的历史行为反馈数据作为训练样本,基于所述训练样本包含的各个词语的上下文信息进行训练得到的;
所述基于所述待处理文本特征,对所述一个行为反馈数据是否包含所述目标信息进行识别,确定所述一个行为反馈数据对应的识别结果,包括:
基于所述数据分类模型中的数据预测子模型已学习的第一关联度,预测所述待处理文本特征和第一识别信息之间的第二关联度,基于所述第二关联度确定所述一个行为反馈数据对应的识别结果,所述第一识别信息表征行为反馈数据包含所述目标信息,所述第一关联度是基于历史行为反馈数据对应的历史文本特征和所述第一识别信息之间的关联程度确定的。
4.如权利要求3所述的方法,其特征在于,所述基于所述第二关联度确定所述一个行为反馈数据对应的识别结果,包括:
若所述第二关联度大于第一设定阈值,则确定所述一个行为反馈数据对应的识别结果为所述一个行为反馈数据中包含所述目标信息;
若所述第二关联度不大于第一设定阈值,则确定所述一个行为反馈数据对应的识别结果为所述一个行为反馈数据中不包含所述目标信息。
5.如权利要求1所述的方法,其特征在于,所述基于所述各个行为反馈数据各自对应的识别结果,确定所述待识别对象在所述目标业务中的对象状态是否异常,包括:
基于所述各个行为反馈数据各自对应的识别结果中的第一识别信息,确定所述待识别对象对应的反馈有效信息,所述第一识别信息用于表征行为反馈数据中包含所述目标信息;
获取所述待识别对象关联的对象属性信息;
基于所述反馈有效信息和所述对象属性信息,确定所述待识别对象在所述目标业务中的对象状态是否异常。
6.如权利要求5所述的方法,其特征在于,所述反馈有效信息包括如下一种或任意组合:
所述各个行为反馈数据各自对应的识别结果中的第一识别信息的数量;
所述各个行为反馈数据各自对应的识别结果中,所述第一识别信息的数量与所述各个行为反馈数据的总数量的比值。
7.如权利要求5所述的方法,其特征在于,所述基于所述反馈有效信息和所述对象属性信息,确定所述待识别对象在所述目标业务中的对象状态是否异常,包括:
基于所述目标评分卡模型,对所述反馈有效信息和所述对象属性信息进行处理,得到所述待识别对象针对所述目标业务的目标行为评估值;
基于所述目标行为评估值,确定所述待识别对象在所述目标业务中的对象状态是否异常。
8.如权利要求7所述的方法,其特征在于,所述基于所述目标评分卡模型,对所述反馈有效信息和所述对象属性信息进行处理,得到所述待识别对象针对所述目标业务的目标行为评估值之前,进一步包括:
确定所述待识别对象的对象类型;
从所述目标业务关联的目标评分卡模型集合中,获取与所述对象类型对应的目标评分卡模型。
9.如权利要求7所述的方法,其特征在于,所述基于所述目标行为评估值,确定所述待识别对象在所述目标业务中的对象状态是否异常,包括:
若确定所述目标行为评估值低于评估值阈值,则确定所述待识别对象是异常对象;其中,所述异常对象包括在所述目标业务中的对象状态是异常状态的对象,行为评估值与对象在所述目标业务中的对象是异常状态的可疑程度呈负相关;或
根据至少一个对象异常等级映射的行为评估值范围,确定所述目标行为评估值归属的行为评估值范围,并将确定的行为评估值范围映射的对象异常等级,确定为所述待识别对象对应的对象异常等级;其中,所述对象异常等级是根据对象在所述目标业务中的对象状态是异常状态的可疑程度确定的。
10.如权利要求5所述的方法,其特征在于,所述基于所述反馈有效信息和所述对象属性信息,确定所述待识别对象在所述目标业务中的对象状态是否异常,包括:
将所述反馈有效信息和所述对象属性信息,输入已训练的状态识别模型,并通过所述状态识别模型进行如下处理:
将所述反馈有效信息和所述对象属性信息,确定为所述待识别对象对应的待处理对象特征;
基于所述状态识别模型已学习的第三关联度,预测所述待处理对象特征和目标对象识别结果之间的第四关联度,若所述第四关联度大于第二设定阈值,则确定所述待识别对象是异常对象,其中,所述第三关联度是基于历史对象对应的历史对象特征和所述目标识别结果之间的关联程度确定的,所述异常对象包括在所述目标业务中的对象状态是异常状态的对象,所述目标对象识别结果用于表征对象在所述目标业务中的对象状态是异常状态。
11.如权利要求9或10所述的方法,其特征在于,所述确定所述待识别对象是异常对象之后,进一步包括:
取消所述待识别对象的第一权限和第二权限中的至少一个;所述第一权限包括进行电子资源转移操作的权限,第二权限包括针对目标电子资源值的电子资源转移操作,所述目标电子资源值基于所述行为反馈数据确定。
12.一种基于行为反馈数据的对象状态识别装置,其特征在于,包括:
数据获取单元,用于获取待识别对象在目标业务中的各个行为反馈数据;其中,所述行为反馈数据是使用所述目标业务的账户,针对所述待识别对象在所述目标业务中执行的业务行为触发的;
第一识别单元,用于分别对所述各个行为反馈数据是否包含目标信息进行识别,并确定所述各个行为反馈数据各自对应的识别结果,所述目标信息表征所述业务行为不满足所述目标业务关联的行为约定信息;
第二识别单元,用于基于所述各个行为反馈数据各自对应的识别结果,确定所述待识别对象在所述目标业务中的对象状态是否异常。
13.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,所述计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行权利要求1-11中任一项所述的方法。
14.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-11中任一项所述方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1-11中任一项所述的方法。
CN202110240273.3A 2021-03-04 2021-03-04 基于行为反馈数据的对象状态识别方法、装置及设备 Pending CN115034787A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110240273.3A CN115034787A (zh) 2021-03-04 2021-03-04 基于行为反馈数据的对象状态识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110240273.3A CN115034787A (zh) 2021-03-04 2021-03-04 基于行为反馈数据的对象状态识别方法、装置及设备

Publications (1)

Publication Number Publication Date
CN115034787A true CN115034787A (zh) 2022-09-09

Family

ID=83118175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110240273.3A Pending CN115034787A (zh) 2021-03-04 2021-03-04 基于行为反馈数据的对象状态识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN115034787A (zh)

Similar Documents

Publication Publication Date Title
CN113822494B (zh) 风险预测方法、装置、设备及存储介质
Ghimire et al. Accelerating business growth with big data and artificial intelligence
CN110009174B (zh) 风险识别模型训练方法、装置及服务器
Vargas et al. Deep leaming for stock market prediction using technical indicators and financial news articles
Wang et al. Ponzi scheme detection via oversampling-based long short-term memory for smart contracts
US11348012B2 (en) System and method for forming predictions using event-based sentiment analysis
US12118552B2 (en) User profiling based on transaction data associated with a user
CN113011884B (zh) 账户特征的提取方法、装置、设备及可读存储介质
CN113378090B (zh) 一种互联网网站相似度分析方法、装置以及可读存储介质
US10922633B2 (en) Utilizing econometric and machine learning models to maximize total returns for an entity
CA3169417A1 (en) Method of and system for appraising risk
Sun et al. Financial distress prediction based on similarity weighted voting CBR
Hirano et al. Comparing actual and simulated HFT traders' behavior for agent design
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
Lv et al. Detecting fraudulent bank account based on convolutional neural network with heterogeneous data
CN116821759A (zh) 类别标签的识别预测方法、装置和处理器及电子设备
CN114022270B (zh) 资产数据处理方法、相关设备及介质
CN116151857A (zh) 一种营销模型的构建方法及装置
CN116127189A (zh) 用户运营方法、装置、设备以及计算机存储介质
CN115034787A (zh) 基于行为反馈数据的对象状态识别方法、装置及设备
CN112115258B (zh) 一种用户的信用评价方法、装置、服务器及存储介质
CN116092094A (zh) 图像文本识别方法、装置、计算机可读介质及电子设备
Lee et al. Application of machine learning in credit risk scorecard
Thripuranthakam et al. Stock Market Prediction Using Machine Learning and Twitter Sentiment Analysis: A Survey
CN113837764B (zh) 风险预警方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40073424

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination