CN113706040A - 风险识别方法、装置、设备及存储介质 - Google Patents

风险识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113706040A
CN113706040A CN202111021915.7A CN202111021915A CN113706040A CN 113706040 A CN113706040 A CN 113706040A CN 202111021915 A CN202111021915 A CN 202111021915A CN 113706040 A CN113706040 A CN 113706040A
Authority
CN
China
Prior art keywords
interactive
counter
training
model
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111021915.7A
Other languages
English (en)
Other versions
CN113706040B (zh
Inventor
要卓
陈婷
吴三平
庄伟亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202111021915.7A priority Critical patent/CN113706040B/zh
Publication of CN113706040A publication Critical patent/CN113706040A/zh
Application granted granted Critical
Publication of CN113706040B publication Critical patent/CN113706040B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种风险识别方法、装置、设备及存储介质,所述风险识别方法包括:统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标,基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的,基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果。本申请解决了模型风险预测的准确性低的技术问题。

Description

风险识别方法、装置、设备及存储介质
技术领域
本申请涉及金融科技(Fintech)的机器学习技术领域,尤其涉及一种风险识别方法、装置、设备及存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着计算机技术的发展,联邦学习的应用越来越广泛。当前,基于交互行为的风险识别方法,主要是将交互对手方进行分类,统计各个类别的使用时长,对于风险较高的类别,一般使用时长较高的用户对应的风险也高,将不同类别的使用时长作为变量输入模型中,从而识别用户的信用风险,然而,交互对手方的类别划分往往需要人工标注,且受分类影响较大,若分类存在错误对模型的预测效果影响较高,进而导致模型风险预测的准确度较低。
发明内容
本申请的主要目的在于提供一种风险识别方法、装置、设备及存储介质,旨在解决现有技术中的模型风险预测的准确度低的技术问题。
为实现上述目的,本申请提供一种风险识别方法,所述风险识别方法包括:
统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标;
基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的;
基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果。
本申请还提供一种风险识别装置,所述风险识别装置为虚拟装置,所述风险识别装置包括:
统计模块,用于统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标;
向量化处理模块,用于基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的;
风险预测模块,用于基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果。
本申请还提供一种风险识别设备,所述风险识别设备为实体设备,所述风险识别设备包括:存储器、处理器以及存储在所述存储器上的风险识别设程序,所述风险识别设程序被所述处理器执行时可实现如上述的风险识别方法的步骤。
本申请还提供一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有风险识别设程序,所述风险识别设程序被处理器执行时实现如上述的风险识别方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的风险识别方法的步骤或者实现如上述的数据预测方法的步骤。
本申请提供了一种风险识别方法、装置、设备及存储介质,相比于现有技术采用的根据人工标注对交互对手方进行分类以根据用户对不同类别的交互对手方的使用时长进行模型风险预测的技术手段,本申请首先统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标,进而基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的,实现了对各所述交互对手方进行向量化处理,向量的每个维度即为划分的类别,无需人工标注进行划分各所述交互对手方的类别,进一步地,基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果,即可实现通过所述预设风险预测模型自动学习到每个交互对手方在向量各个维度的权重,降低因分类错误所带来的模型偏差,提升了所述预设风险预测模型对用户风险预测的精准度,克服了现有技术中通过人工手动标注进行划分交互对手方的类别,若分类存在错误时,模型的风险预测效果会存在较高的误差,进而导致模型风险预测的准确度较低的技术缺陷,从而提高了模型预测的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请风险识别方法第一实施例的流程示意图;
图2为本申请风险识别方法第二实施例的流程示意图;
图3为本申请风险识别方法第三实施例的流程示意图;
图4为本申请实施例中风险识别方法涉及的硬件运行环境的设备结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种风险识别方法,在本申请风险识别方法的第一实施例中,参照图1,所述风险识别方法包括:
步骤S10,统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标;
在本实施例中,需要说明的是,所述交互对手方为所述待预测用户进行交互行为的对方,例如,点击APP(软件应用程序)的按钮,访问的网页,阅读的文章等,所述相对使用指标为所述待预测用户使用所述交互对手方的时长与该交互对手方的平均使用时长之间的时长占比,所述预期观察时间为预先设置的时间。
统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标,具体地,在预期观察时间内,统计所述待预测用户使用各所述交互对手方分别对应的使用时长,并计算各所述交互对手方对应的平均使用时长,进而分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长之间的时长占比,获得各所述交互对手方对应的相对使用指标,例如,各所述交互对手方为社交软件、金融借贷软件和新闻软件,且所述社交软件对应的平均使用时长为1小时,所述金融借贷软件对应的平均使用时长为3小时,所述新闻软件对应的平均使用时长为2小时,也即,所述待预测用户在使用社交软件、金融软件和新闻软件对应的使用时长分别为0.5,6,2,进而分别各所述使用时长其对应的平均使用时长的占用的时长比例,也即,0.5/1=0.5,6/3=2,2/2=1,进而获得所述待预测用户使用各个软件对应的相对使用指标。
其中,所述统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标的步骤包括:
步骤S11,统计所述待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,并计算各所述交互对手方在预期观察时间内对应的平均使用时长;
在本实施例中,统计所述待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,并计算各所述交互对手方在预期观察时间内对应的平均使用时长,具体地,对于每一所述交互对手方均执行以下步骤:
在预期观察时间内,统计所述待预测用户使用所述交互对手方的使用时长,进而计算所述交互对手方在全部用户中分别对应的平均使用时长,例如,所述交互对手方为社交软件,使用所述交互对手方的用户包括A用户,B用户,C用户,A用户使用时长为3小时,B用户的使用时长为8小时,C用户使用社交软件的使用时长为16小时,进而根据A用户,B用户,C用户分别对应的使用时长计算所述社交软件的平均使用时长为(3+8+16)/3=9小时。
步骤S12,分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长的时长占比,获得各所述交互对手方对应的相对使用指标。
在本实施例中,分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长的时长占比,获得各所述交互对手方对应的相对使用指标,具体地,对每一所述交互对手方均执行以下步骤:
在预设观察时间内,在获得计算所述待预测用户使用所述交互对手方的使用时长以及所述交互对手方对应的平均使用时长后,计算所述待预测用户使用所述交互对手方的使用时长与所述交互对手方对应的平均使用时长之间的时长占比,获得所述待预测用户使用所述交互对手方的相对使用指标,进一步地,计算其他所述交互对手方分别对应的相对使用指标,进而获得所述待预测用户使用各所述交互对手方分别对应的相对使用指标。
步骤S20,基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的;
在本实施例中,需要说明的是,所述向量化处理为将离散变量转化为连续向量的处理方式,所述目标向量模型为将所述时长序列转化为向量的模型,包括word2vec模型和其他向量化处理的文本模型等。
基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的,具体地,在所述预设观察时间内,基于所述待预测使用各所述交互对手方对应的时间顺序,将各所述交互对手方进行排序,获得交互语料信息,其中,所述交互语料信息为多个交互词信息组成的信息,所述交互词信息为进行排序后的各交互对手方,进而将所述交互语料信息输入所述目标向量模型,输出所述待预测用户使用各所述交互对手方对应对应的交互数据向量,从而实现了对各所述对交互对手方进行向量化处理,向量的每个维度即为划分的类别,进而无需人工标注进行划分各所述交互对手方的类别。
其中,所述基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量的步骤包括:
步骤S21,基于所述待预测用户在预设观察时间内使用各所述交互对手方对应的时间顺序,将各所述交互对手方进行排序,获得交互语料信息;
在本实施例中,基于所述待预测用户在预设观察时间内使用各所述交互对手方对应的时间顺序,将各所述交互对手方进行排序,获得交互语料信息,具体地,在预设观察时间内,将各所述交互对手方按照所述待预测用户使用各所述交互对手方的时间顺序进行排序,进而获得所述待预测用户对应的交互语料信息。
步骤S22,基于各所述交互对手方对应的相对使用指标,通过所述目标向量模型对所述交互语料信息进行向量化处理,获得各所述交互对手方对应的交互数据向量。
在本实施例中,基于各所述交互对手方对应的相对使用指标,通过所述目标向量模型对所述交互语料信息进行向量化处理,获得各所述交互对手方对应的交互数据向量,具体地,基于各所述交互对手方对应的相对使用指标,对所述交互语料信息中的各交互对方进行加权,获得加权交互语料信息,进而将所述加权交互语料信息输入所述目标向量模型中,输出所述交互数据向量,例如,利用通过自然语言处理中常用的word2vec模型,将所述加权交互语料信息进行embedding学习,得到所述交互数据向量,其中,所述embedding学习为将离散变量转为连续向量表示的处理方式。
步骤S30,基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果。
在本实施例中,需要说明的是,所述交互数据向量为各所述的向量,所述风险识别结果为用于判断用户是好用户还是坏用户的标签。
基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果,具体地,将各所述交互对手方对应的交互数据向量进行求和,获得风险向量,将所述风险向量输入所述预设风险预测模型,输出所述风险识别结果,从而对所述待预测用户进行评估,也即判断所述待预测用户的好坏信用风险,例如,当所述待预测用户使用金融借贷软件的对应的维度向量较高时,则在所述风险识别结果中判定所述待预测用户的风险较高,进而将所述待预测用户对应的标签设置为坏标签。
其中,所述基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果的步骤包括:
步骤S31,将各所述交互数据向量进行求和,获得所述待预测用户的风险向量;
在本实施例中,将各所述交互数据向量进行求和,获得所述待预测用户的风险向量,具体地,基于各所述交互对手方对应的交互数据向量,将各所述交互数据向量进行求和处理,获得所述风险向量,以对所述待预测用户进行风险预测。
步骤S32,将将所述风险向量输入所述预设风险预测模型,输出所述待预测用户的风险识别结果。
在本实施例中,将所述风险向量输入所述预设风险预测模型,输出所述待预测用户的风险识别结果,具体地,通过所述预设风险预测模型对风险向量进行风险预测,获得所述风险识别结果,以根据所述风险识别结果对所述待预测用户进行评估,也即判断所述待预测用户的好坏信用风险。
本申请实施例提供了一种风险识别方法,相比于现有技术采用的根据人工标注对交互对手方进行分类以根据用户对不同类别的交互对手方的使用时长进行模型风险预测的技术手段,本申请实施例首先首先统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标,进而基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的,实现了对各所述交互对手方进行向量化处理,向量的每个维度即为划分的类别,无需人工标注进行划分各所述交互对手方的类别,进一步地,基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果,即可实现通过所述预设风险预测模型自动学习到每个交互对手方在向量各个维度的权重,降低因分类错误所带来的模型偏差,提升了所述预设风险预测模型对用户风险预测的精准度,克服了现有技术中通过人工手动标注进行划分交互对手方的类别,若分类存在错误时,模型的风险预测效果会存在较高的误差,进而导致模型风险预测的准确度较低的技术缺陷,从而提高了模型预测的准确性。
进一步地,参照图2,基于本申请中第一实施例,在本申请的另一实施例中,在所述基于所述相对使用指标,通过目标向量模型对所述使用时长进行向量化处理,获得交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的步骤之前,所述风险识别方法还包括:
步骤A10,获取待训练文本模型;
在本实施例中,需要说明的是,所述待训练文本模型包括包括word2vec模型和其他对各所述交互对手方的使用时长进行向量化处理的模型等。
步骤A20,统计各所述样本用户使用各所述交互对手方的训练使用时长,以基于所述训练使用时长,计算各所述交互对手方对应的训练相对使用指标;
在本实施例中,统计各所述样本用户使用各所述交互对手方的训练使用时长,以基于所述训练使用时长,计算各所述交互对手方对应的训练相对使用指标,具体地,对于每一所述样本用户均执行以下步骤:
统计所述样本用户使用各所述交互对手方的训练使用时长,进而计算各所述交互对手方在所有样本用户对应的平均使用时长,进一步地,计算各所述交互对手方的训练使用时长以及所述平均使用时长之间的时长占比,获得各所述交互对手方对应的训练相对使用指标,进而获得各所述样本用户使用每一所述交互对手方对应的训练相对使用指标。
步骤A30,基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序,分别将各所述样本用户对应的各所述交互对手方进行排序,获得各所述样本用户对应的待训练语料信息;
在本实施例中,所述待训练语料信息为各所述交互对手方所组成的信息,用于自然语言处理中的算法模型进行训练。
基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序,分别将各所述样本用户对应的各所述交互对手方进行排序,获得各所述样本用户对应的待训练语料信息,具体地,对于每一所述样本用户均执行以下步骤:
对于在预设观察时间内,根据所述样本使用使用各所述交互对手方对应的时间顺序,将各所述交互对手方进行排序,从而组成所述样本用户对应的待训练语料信息。
步骤A40,基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型,并输出各所述样本用户对应的训练交互数据向量。
在本实施例中,基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型,并输出各所述样本用户对应的训练交互数据向量,具体地,对于每一所述样本用户的待训练语料信息均执行以下步骤:
基于各所述交互对手方对应的训练相对使用指标,对所述待训练语料信息中各所述交互对手方进行加权,也即,设置所述待训练语料信息中各所述交互对手方对应的权重为所述训练相对使用指标,获得加权语料信息,进而基于所述加权语料信息,对所述待训练文本模型进行迭代训练优化,并判断优化后的待训练文本模型是否满足预设训练结束条件,其中,所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件,若满足,获得所述目标向量模型,若不满足,则返回执行步骤:统计各所述样本用户使用各所述交互对手方的训练使用时长,以基于所述训练使用时长,计算各所述交互对手方对应的训练相对使用指标。
其中,所述基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型的步骤包括:
步骤A41,基于各所述交互对手方对应的训练相对使用指标,对各所述样本用户对应的待训练语料信息中的词信息进行加权,获得各所述样本用户对应的加权语料信息;
在本实施例中,需要说明的是,所述待训练语料信息为各个词信息所组成的信息,所述词信息表示各所述交互对手方。
基于各所述交互对手方对应的训练相对使用指标,对各所述样本用户对应的待训练语料信息中的词信息进行加权,获得各所述样本用户对应的加权语料信息,具体地,基于每一所述样本用户使用各所述交互对手方对应的训练相对使用指标,分别对各所述待训练语料信息中各词信息进行加权,也即对各所述交互对手方进行加权,进而获得各所述样本用户对应的加权语料信息。
步骤A42,基于各所述加权语料信息,通过所述待训练文本模型对各所述加权语料信息中的各词信息进行预测,获得各所述词信息对应的预测结果;
在本实施例中,需要说明的是,为了避免要计算所有词信息的softmax概率,word2vec通畅采用二叉霍夫曼树来代替从隐藏层到输出softmax层的映射,传统的文本模型由于信息有限,仅知道文本语料信息中下一个词具体是什么,无法知道其下一个词出现的权重值。而在本申请中可根据下一个出现词信息的概率进行加权,原HierarchicalSoftmax的损失函数可以变为一个线性回归问题,使得使用时间长的交互对手有更大的概率预测准确,也即,使得下面公式p的取值尽可能大:
Figure BDA0003241804610000101
其中,p(w|Context(w))表示根据上文j-1对下文词信息j进行预测对应的结果,α为训练参数,tj为其中为下一个词信息为j对应的权重,所述权重为所述训练相对使用指标。
基于各所述加权语料信息,通过所述待训练文本模型对各所述加权语料信息中的各词信息进行预测,获得各所述词信息对应的预测结果,具体地,将各所述加权语料信息输入所述待训练文本模型中,获得所述各所述词信息对应的预测结果。
步骤A43,基于所述预测结果和各所述词信息对应的真实标签之间的差异度,通过预设损失函数计算模型损失;
在本实施例中,基于所述预测结果和各所述词信息对应的真实标签之间的差异度,通过预设损失函数计算模型损失,具体地,基于所述预测结果和各所述词信息对应的真实标签之间的差异度,通过预设损失函数计算所述模型参数。
步骤A44,基于所述模型损失计算的梯度,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型。
在本实施例中,基于所述模型损失计算的梯度,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型,具体地,基于所述模型损失计算的梯度,对所述待训练文本模型进行迭代训练,以对所述待训练文本模型中的待训练参数进行优化,直至优化后的待训练文本模型满足预设训练结束条件,所述目标向量模型。
本申请实施例提供了一种风险识别方法,也即,获取待训练文本模型,进而统计各所述样本用户使用各所述交互对手方的训练使用时长,以基于所述训练使用时长,计算各所述交互对手方对应的训练相对使用指标,进而基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序,分别将各所述样本用户对应的各所述交互对手方进行排序,获得各所述样本用户对应的待训练语料信息,进一步地,基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型,并输出各所述样本用户对应的训练交互数据向量,实现了基于所述目标向量模型,将各所述交互对手方进行向量化处理,从而根据向量化处理获得的向量对应的每个维度确定各所述交互对手方的类型,无需人工对各所述交互对手方进行划分分类,为克服现有技术中通过人工手动标注进行划分交互对手方的类别,若分类存在错误时,模型的风险预测效果会存在较高的误差,进而导致模型风险预测的准确度较低的技术缺陷奠定了基础。
进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,所述预设风险预测模型包括全连接神经网络模型,
在所述根据所述缺失数据集和所述特征信息结果,对所述全连接神经网络模型进行迭代训练优化,获得所述数据预测模型的步骤之前,所述风险识别方法还包括:
步骤B10,获取待训练全连接神经网络模型;
步骤B20,分别将各所述样本用户对应的训练交互数据向量进行求和,获得各所述样本用户对应的训练风险向量;
在本实施例中,分别将各所述样本用户对应的训练交互数据向量进行求和,获得各所述样本用户对应的训练风险向量,具体地,基于所述各所述样本用户对应的训练交互数据向量,将各所述训练交互数据向量进行求和处理,获得各所述样本用户对应的训练风险向量。
步骤B30,基于各所述样本用户对应的训练风险向量,对所述待训练全连接神经网络模型进行迭代训练优化,获得所述全连接神经网络模型。
在本实施例中,基于各所述样本用户对应的训练风险向量,对所述待训练全连接神经网络模型进行迭代训练优化,获得所述全连接神经网络模型,具体地,将所述训练风险向量输入所述待训练全连接神经网络模型中,以对所述待训练全连接神经网络模型进行迭代训练优化,并判断优化后的待训练全连接神经网络模型是否满足预设训练结束条件,其中,所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件,若满足,则获得所述全连接神经网络模型,也即,获得所述预设风险预测模型,若不满足,则返回执行步骤:统计各所述样本用户使用各所述交互对手方的训练使用时长,以基于所述训练使用时长,计算各所述交互对手方对应的训练相对使用指标。
本申请实施例提供了一种风险识别方法,也即,获取待训练全连接神经网络模型,进而分别将各所述样本用户对应的训练交互数据向量进行求和,获得各所述样本用户对应的训练风险向量,进一步地,基于各所述样本用户对应的训练风险向量,对所述待训练全连接神经网络模型进行迭代训练优化,获得所述全连接神经网络模型,实现了通过所述待训练全连接神经网络模型自动学习到每个交互对手方在向量各个维度的权重,提升了所述全连接神经网络模型对用户风险预测的精准度,为克服现有技术中通过人工手动标注进行划分交互对手方的类别,若分类存在错误时,模型的风险预测效果会存在较高的误差,进而导致模型风险预测的准确度较低的技术缺陷奠定了基础。
参照图4,图4是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
如图4所示,该风险识别设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该风险识别设备还可以包括矩形用户接口、网络接口、摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图4中示出的风险识别设备结构并不构成对风险识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及风险识别设程序。操作系统是管理和控制风险识别设备硬件和软件资源的程序,支持风险识别设程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与风险识别方法系统中其它硬件和软件之间通信。
在图4所示的风险识别设备中,处理器1001用于执行存储器1005中存储的风险识别设程序,实现上述任一项所述的风险识别方法的步骤。
本申请风险识别设备具体实施方式与上述风险识别方法各实施例基本相同,在此不再赘述。
本申请还提供一种风险识别装置,所述风险识别装置包括:
统计模块,用于统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标;
向量化处理模块,用于基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的;
风险预测模块,用于基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果。
可选地,所述统计模块还用于:
统计所述待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,并计算各所述交互对手方在预期观察时间内对应的平均使用时长;
分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长的时长占比,获得各所述交互对手方对应的相对使用指标。
可选地,所述向量化处理模块还用于:
基于所述待预测用户在预设观察时间内使用各所述交互对手方对应的时间顺序,将各所述交互对手方进行排序,获得交互语料信息;
基于各所述交互对手方对应的相对使用指标,通过所述目标向量模型对所述交互语料信息进行向量化处理,获得各所述交互对手方对应的交互数据向量。
可选地,所述风险预测模块还用于:
将各所述交互数据向量进行求和,获得所述待预测用户的风险向量;
将所述风险向量输入所述预设风险预测模型,输出所述待预测用户的风险识别结果。
可选地,所述风险识别装置还用于:
获取待训练文本模型;
统计各所述样本用户使用各所述交互对手方的训练使用时长,以基于所述训练使用时长,计算各所述交互对手方对应的训练相对使用指标;
基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序,分别将各所述样本用户对应的各所述交互对手方进行排序,获得各所述样本用户对应的待训练语料信息;
基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型,并输出各所述样本用户对应的训练交互数据向量。
可选地,所述风险识别装置还用于:
基于各所述交互对手方对应的训练相对使用指标,对各所述样本用户对应的待训练语料信息中的词信息进行加权,获得各所述样本用户对应的加权语料信息;
基于各所述加权语料信息,通过所述待训练文本模型对各所述加权语料信息中的各词信息进行预测,获得各所述词信息对应的预测结果;
基于所述预测结果和各所述词信息对应的真实标签之间的差异度,通过预设损失函数计算模型损失;
基于所述模型损失计算的梯度,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型。
可选地,所述风险识别装置还用于:
获取待训练全连接神经网络模型;
分别将各所述样本用户对应的训练交互数据向量进行求和,获得各所述样本用户对应的训练风险向量,
基于各所述样本用户对应的训练风险向量,对所述待训练全连接神经网络模型进行迭代训练优化,获得所述全连接神经网络模型。
本申请风险识别装置的具体实施方式与上述风险识别方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种存储介质,所述存储介质为计算机可读存储介质,且所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的风险识别方法的步骤。
本申请可读存储介质具体实施方式与上述风险识别方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种计算机程序产品,且所述计算机程序产品包括有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的风险识别方法的步骤。
本申请计算机程序产品具体实施方式与上述风险识别方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (10)

1.一种风险识别方法,其特征在于,所述风险识别方法包括:
统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标;
基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的;
基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果。
2.如权利要求1所述风险识别方法,其特征在于,所述统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标的步骤包括:
统计所述待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,并计算各所述交互对手方在预期观察时间内对应的平均使用时长;
分别计算所述待预测用户使用各所述交互对手方分别对应的使用时长与所述平均使用时长的时长占比,获得各所述交互对手方对应的相对使用指标。
3.如权利要求1所述风险识别方法,其特征在于,所述基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量的步骤包括:
基于所述待预测用户在预设观察时间内使用各所述交互对手方对应的时间顺序,将各所述交互对手方进行排序,获得交互语料信息;
基于各所述交互对手方对应的相对使用指标,通过所述目标向量模型对所述交互语料信息进行向量化处理,获得各所述交互对手方对应的交互数据向量。
4.如权利要求1所述风险识别方法,其特征在于,所述基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果的步骤包括:
将各所述交互数据向量进行求和,获得所述待预测用户的风险向量;
将所述风险向量输入所述预设风险预测模型,输出所述待预测用户的风险识别结果。
5.如权利要求1所述风险识别方法,其特征在于,在所述基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的步骤之前,所述风险识别方法还包括:
获取待训练文本模型;
统计各所述样本用户使用各所述交互对手方的训练使用时长,以基于所述训练使用时长,计算各所述交互对手方对应的训练相对使用指标;
基于各所述样本用户在预设观察时间内使用各所述交互对手方对应的时间顺序,分别将各所述样本用户对应的各所述交互对手方进行排序,获得各所述样本用户对应的待训练语料信息;
基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型,并输出各所述样本用户对应的训练交互数据向量。
6.如权利要求5所述风险识别方法,其特征在于,所述基于各所述样本用户对应的待训练语料信息和各所述交互对手方对应的训练相对使用指标,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型的步骤包括:
基于各所述交互对手方对应的训练相对使用指标,对各所述样本用户对应的待训练语料信息中的词信息进行加权,获得各所述样本用户对应的加权语料信息;
基于各所述加权语料信息,通过所述待训练文本模型对各所述加权语料信息中的各词信息进行预测,获得各所述词信息对应的预测结果;
基于所述预测结果和各所述词信息对应的真实标签之间的差异度,通过预设损失函数计算模型损失;
基于所述模型损失计算的梯度,对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型。
7.如权利要求5所述风险识别方法,其特征在于,所述预设风险预测模型包括全连接神经网络模型,
在所述将所述待训练语料信息输入所述待训练文本模型,以对所述待训练文本模型进行迭代训练优化,获得所述目标向量模型,并输出各所述样本用户对应的训练交互数据向量的步骤之后,所述风险识别方法还包括:
获取待训练全连接神经网络模型;
分别将各所述样本用户对应的训练交互数据向量进行求和,获得各所述样本用户对应的训练风险向量,
基于各所述样本用户对应的训练风险向量,对所述待训练全连接神经网络模型进行迭代训练优化,获得所述全连接神经网络模型。
8.一种风险识别装置,其特征在于,所述风险识别装置包括:
统计模块,用于统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标;
向量化处理模块,用于基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的;
风险预测模块,用于基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果。
9.一种风险识别设备,其特征在于,所述风险识别设备包括:存储器、处理器以及存储在存储器上的风险识别设程序,
所述风险识别设程序被所述处理器执行实现如权利要求1至7中任一项所述风险识别方法的步骤。
10.一种存储介质,所述存储介质为计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有风险识别设程序,所述风险识别设程序被处理器执行以实现如权利要求1至7中任一项所述风险识别方法的步骤。
CN202111021915.7A 2021-09-01 2021-09-01 风险识别方法、装置、设备及存储介质 Active CN113706040B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111021915.7A CN113706040B (zh) 2021-09-01 2021-09-01 风险识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111021915.7A CN113706040B (zh) 2021-09-01 2021-09-01 风险识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113706040A true CN113706040A (zh) 2021-11-26
CN113706040B CN113706040B (zh) 2024-05-28

Family

ID=78658842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111021915.7A Active CN113706040B (zh) 2021-09-01 2021-09-01 风险识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113706040B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180047276A (ko) * 2016-10-31 2018-05-10 주식회사 엘렉시 앱 추천 시스템, 이를 위한 사용자 단말기 및 방법
CN110197315A (zh) * 2018-04-08 2019-09-03 腾讯科技(深圳)有限公司 风险评估方法、装置及其存储介质
CN110798427A (zh) * 2018-08-01 2020-02-14 深信服科技股份有限公司 一种网络安全防御中的异常检测方法、装置及设备
CN110796542A (zh) * 2019-09-26 2020-02-14 北京淇瑀信息科技有限公司 金融风险控制方法、金融风险控制装置和电子设备
CN111127226A (zh) * 2019-12-25 2020-05-08 中国联合网络通信集团有限公司 健康险欺诈识别方法、装置、设备及计算机可读存储介质
CN111291798A (zh) * 2020-01-21 2020-06-16 北京工商大学 一种基于集成学习的用户基础属性预测方法
CN112138403A (zh) * 2020-10-19 2020-12-29 腾讯科技(深圳)有限公司 交互行为的识别方法和装置、存储介质及电子设备
CN112488742A (zh) * 2019-09-12 2021-03-12 北京三星通信技术研究有限公司 用户属性信息的预测方法、装置、电子设备及存储介质
CN113034193A (zh) * 2021-04-02 2021-06-25 墨致科技(上海)有限公司 一种app2vec在风控系统中建模的工作方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180047276A (ko) * 2016-10-31 2018-05-10 주식회사 엘렉시 앱 추천 시스템, 이를 위한 사용자 단말기 및 방법
CN110197315A (zh) * 2018-04-08 2019-09-03 腾讯科技(深圳)有限公司 风险评估方法、装置及其存储介质
CN110798427A (zh) * 2018-08-01 2020-02-14 深信服科技股份有限公司 一种网络安全防御中的异常检测方法、装置及设备
CN112488742A (zh) * 2019-09-12 2021-03-12 北京三星通信技术研究有限公司 用户属性信息的预测方法、装置、电子设备及存储介质
CN110796542A (zh) * 2019-09-26 2020-02-14 北京淇瑀信息科技有限公司 金融风险控制方法、金融风险控制装置和电子设备
CN111127226A (zh) * 2019-12-25 2020-05-08 中国联合网络通信集团有限公司 健康险欺诈识别方法、装置、设备及计算机可读存储介质
CN111291798A (zh) * 2020-01-21 2020-06-16 北京工商大学 一种基于集成学习的用户基础属性预测方法
CN112138403A (zh) * 2020-10-19 2020-12-29 腾讯科技(深圳)有限公司 交互行为的识别方法和装置、存储介质及电子设备
CN113034193A (zh) * 2021-04-02 2021-06-25 墨致科技(上海)有限公司 一种app2vec在风控系统中建模的工作方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩林;高伟;王冬;王鹏翔;李颖颖;: "一种单指令多数据向量化归约方法", 计算机工程, no. 07, 15 July 2017 (2017-07-15), pages 15 - 20 *

Also Published As

Publication number Publication date
CN113706040B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN107220217A (zh) 基于逻辑回归的特征系数训练方法和装置
CN109284372B (zh) 用户操作行为分析方法、电子装置及计算机可读存储介质
CN106095942B (zh) 强变量提取方法及装置
US20220180209A1 (en) Automatic machine learning system, method, and device
CN110598620A (zh) 模型训练方法和装置、目标检测方法和装置
CN111816312A (zh) 基于模型解释的健康状态检测方法、设备及可读存储介质
CN112069799A (zh) 基于依存句法的数据增强方法、设备和可读存储介质
CN103248705A (zh) 服务器、客户端及视频处理方法
CN112801773A (zh) 企业风险预警方法、装置、设备及存储介质
CN115063875A (zh) 模型训练方法、图像处理方法、装置和电子设备
CN111199469A (zh) 用户还款模型生成方法、装置及电子设备
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN118393329B (zh) 一种用于测试ai芯片在模型训练和推理表现的系统
CN111784401A (zh) 下单率预测方法、装置、设备及可读存储介质
CN113378067B (zh) 基于用户挖掘的消息推荐方法、设备、介质
CN118378213A (zh) 数据质量评估方法、装置、设备、存储介质及产品
CN110855474A (zh) Kqi数据的网络特征提取方法、装置、设备及存储介质
Li et al. Stock price series forecasting using multi-scale modeling with boruta feature selection and adaptive denoising
CN112801489A (zh) 诉讼案件风险检测方法、装置、设备和可读存储介质
CN111784506A (zh) 逾期风险控制方法、设备及可读存储介质
CN113706040B (zh) 风险识别方法、装置、设备及存储介质
CN113269433B (zh) 税收风险预测方法、设备、介质及计算机程序产品
CN111753992A (zh) 筛选方法和筛选系统
CN114387089A (zh) 客户信用风险评估方法、装置、设备及存储介质
CN114004629A (zh) 数据分析的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant