CN109461016B - 数据评分方法、装置、计算机设备及存储介质 - Google Patents

数据评分方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109461016B
CN109461016B CN201811049377.0A CN201811049377A CN109461016B CN 109461016 B CN109461016 B CN 109461016B CN 201811049377 A CN201811049377 A CN 201811049377A CN 109461016 B CN109461016 B CN 109461016B
Authority
CN
China
Prior art keywords
data
scoring
model
user
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811049377.0A
Other languages
English (en)
Other versions
CN109461016A (zh
Inventor
江琳
杨镭
邱高思豪
赵云松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811049377.0A priority Critical patent/CN109461016B/zh
Publication of CN109461016A publication Critical patent/CN109461016A/zh
Application granted granted Critical
Publication of CN109461016B publication Critical patent/CN109461016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种数据评分方法、装置、计算机设备及存储介质,根据用户所需实现评分的目标标签,确定与目标标签相关度最高的用户数据标签和本地数据标签,在用户上传的第一数据中获取用户数据标签对应的第二数据,在本地数据库中获取本地数据标签对应的第三数据,并根据第二数据和第三数据构建评分模型,利用构建的评分模型和Logit函数实现对用户上传的待评分数据信息的评分。本发明中,即使一些个人或者公司无法提供一定量的样本数据,甚至无法提供样本数据,依然可以建立出评分模型,进而利用评分模型对上传的待评分数据信息进行数据评分,从而实现对用户行为信息的分值预测。

Description

数据评分方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据评分方法、装置、计算机设备及存储介质。
背景技术
随着信息技术的不断发展,对用户行为信息可以提前进行预测,根据预测的分值来确定用户未来的行为。目前,通过机器学习对数据进行预测的技术在越来越多的领域得到应用,而通过机器学习建立相关模型需要使用大量的样本数据来进行训练。现有技术中,用户只能够针对已有数据进行建模,并利用建立的模型进行数据评分,以实现用户行为信息的分值预测。而有一些个人或者公司无法提供一定量的样本数据,甚至无法提供样本数据,因此,无法建立模型来实现对数据的评分。
发明内容
本发明的目的是提供一种数据评分方法、装置、计算机设备及存储介质,用于解决现有技术存在的问题。
为实现上述目的,本发明提供一种数据评分方法,包括以下步骤:
接收用户上传的待评分数据信息,以及根据预先构建的评分模型确定所述评分模型的输入端对应的数据标签;
根据所述待评分数据信息以及确定的所述评分模型的输入端对应的数据标签,在预先构建的数据库中查找与数据标签对应的输入数据信息;
将所述输入数据信息输入到所述评分模型中;
获取所述评分模型的输出数值;
利用Logit函数将所述输出数值转换成设定范围内的数值,将转换后的数值作为所述待评分数据信息的评分;
其中,所述评分模型按照如下方式构建:接收用户上传的第一数据,以及确定用户所需实现评分的目标标签;根据所述目标标签,确定与所述目标标签相关度最高的用户数据标签和本地数据标签;在所述第一数据中获取用户数据标签对应的第二数据,在本地数据库中获取本地数据标签对应的第三数据;将所述第二数据和所述第三数据,输入到预设模型中进行训练,以确定模型参数,将确定了模型参数的所述预设模型作为建立的所述评分模型。
进一步地,所述第一数据为空。
进一步地,在将所述第二数据和所述第三数据,输入到预设模型中进行训练之前,进一步包括:确定针对所述第二数据的使用比例,根据所述使用比例确定所需使用的第二使用数据,将所述第二使用数据和所述第三数据输入到预设模型中进行训练。
进一步地,在所述将确定了模型参数的所述预设模型作为建立的所述评分模型之后,进一步包括:利用所述第二数据中除去所述第二使用数据之后得到的第二剩余数据,对所述评分模型进行验证。
进一步地,所述设定范围的数值为大于等于0,且小于等于100的数值。
进一步地,在所述将转换后的数值作为所述待评分数据信息的评分之后,进一步包括:根据预先设定的评分级别以及对应的评分范围,确定所述待评分数据信息的评分所在的目标评分范围,将所述目标评分范围对应的目标评分级别输出给用户。
进一步地,在所述将所述待评分数据信息输入到预先构建的评分模型中之前,进一步包括:对用户的身份信息进行验证,在验证通过时,执行所述将所述待评分数据信息输入到预先构建的评分模型中。
为实现上述目的,本发明还提供一种数据评分装置,包括:
数据接收模块,用于接收用户上传的待评分数据信息;
数据标签确定模块,用于根据预先构建的评分模型确定所述评分模型的输入端对应的数据标签;
查找模块,用于根据所述待评分数据信息以及确定的所述评分模型的输入端对应的数据标签,在预先构建的数据库中查找与数据标签对应的输入数据信息;
数据输入模块,用于将所述输入数据信息输入到所述评分模型中;
输出数值获取模块,用于获取所述评分模型的输出数值;
评分转换模块,用于利用Logit函数将所述输出数值转换成设定范围内的数值,将转换后的数值作为所述待评分数据信息的评分;
进一步包括:评分模型构建模块,用于按如下方式构建所述评分模型:接收用户上传的第一数据,以及确定用户所需实现评分的目标标签;根据所述目标标签,确定与所述目标标签相关度最高的用户数据标签和本地数据标签;在所述第一数据中获取用户数据标签对应的第二数据,在本地数据库中获取本地数据标签对应的第三数据;将所述第二数据和所述第三数据,输入到预设模型中进行训练,以确定模型参数,将确定了模型参数的所述预设模型作为建立的所述评分模型。
为实现上述目的,本发明还提供一种计算机设备,计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的数据评分方法、装置、计算机设备及存储介质,根据用户所需实现评分的目标标签,确定与目标标签相关度最高的用户数据标签和本地数据标签,在用户上传的第一数据中获取用户数据标签对应的第二数据,在本地数据库中获取本地数据标签对应的第三数据,并根据第二数据和第三数据构建评分模型,利用构建的评分模型和Logit函数实现对用户上传的待评分数据信息的评分。本发明中,即使一些个人或者公司无法提供一定量的样本数据,甚至无法提供样本数据,依然可以建立出评分模型,进而利用评分模型对上传的待评分数据信息进行数据评分,从而实现对用户行为信息的分值预测。
附图说明
图1为本发明数据评分方法实施例一的流程图;
图2为本发明数据评分装置实施例一的程序模块示意图;
图3为本发明数据评分装置实施例一的硬件结构示意图;
图4为本发明数据评分方法实施例二的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的数据评分方法、装置、计算机设备及存储介质,适用于计算机技术领域,为一种利用用户少量样本数据或无用户样本数据建立评分模型,并利用评分模型对用户上传的待评分数据信息进行评分,以实现对用户行为行为信息的分值预测的方法。本发明根据用户所需实现评分的目标标签,确定与目标标签相关度最高的用户数据标签和本地数据标签,在用户上传的第一数据中获取用户数据标签对应的第二数据,在本地数据库中获取本地数据标签对应的第三数据,并根据第二数据和第三数据构建评分模型,利用构建的评分模型和Logit函数实现对用户上传的待评分数据信息的评分。本发明中,一些个人或公司需要获知某些用户行为信息,这些用户行为信息需要通过建立评分模型来实现分值预测,即使一些个人或者公司无法提供用于建立评分模型的一定量的样本数据,甚至无法提供样本数据,依然可以建立出评分模型,进而利用评分模型对上传的待评分数据信息进行数据评分,从而实现对用户行为信息的分值预测。
实施例一
请参阅图1,本实施例的一种数据评分方法中,包括以下步骤:
步骤01,接收用户上传的待评分数据信息,以及根据预先构建的评分模型确定所述评分模型的输入端对应的数据标签。
一些个人或者公司需要获知某些用户行为信息,这些用户行为信息可以通过建立的评分模型来实现分值预测。为了实现分值预测,在本实施例中,用户上传的待评分数据信息与其所需实现评分的目标标签有关,其中,目标标签是指用户所需实现评分的用户行为信息的统称,例如,该目标标签为用户的信用信息、用户在保险到期后续保的概率信息、用户购买某一个险种的概率信息等。
其中,用户上传的待评分数据信息是用于实现评分的目标标签的基本信息,例如,在目标标签为用户的信用信息时,那么,上传的待评分数据信息可以为用户的身份信息,该身份信息可以包括:姓名、年龄、性别、身份证号码等。
在本实施例中,评分模型需要预先根据用户提供的样本数据构建出来,由于一些个人或者公司无法提供一定量的用于构建评分模型的样本数据,甚至无法提供样本数据,因此,该评分模型可以采用数据联合建模的方式来进行构建,其中,有构建评分模型需求和数据评分需求的个人或公司称之为用户方,为用户方提供用于构建评分模型的样本数据的一方为建模方,数据联合建模方式是一种由用户方提供一部分样本数据(或无样本数据)以及由建模方提供一部分样本数据来实现联合建模的方式。具体地,所述评分模型可以按照如下方式构建:
步骤011,接收用户上传的第一数据,以及确定用户所需实现评分的目标标签。
在本实施例中,为了构建评分模型,建模方可以提供一个自动建模平台,该自动建模平台可以以终端界面的形式进行展现,用户方利用该终端界面实现第一数据上传。
用户方在利用该终端界面实现建模之前,先确定自身拥有的与建模相关的数据,将该数据作为第一数据进行上传。
在实现第一数据的上传时,可以利用终端界面上提供的数据输入框来实现,用户方可以将第一数据依次填写到相应位置的数据输入框中,在填写完成后,点击保存上传。为了提高数据上传效率,还可以在终端界面上设置导入按钮,例如,在点击该导入按钮时,可以从本地选择导入的文件,将保存有第一数据的文件导入。其中,该文件类型可以由数据联合建模一方设置,例如,该文件类型为excel、txt格式等。
以保险领域为例,用户方上传的该第一数据是3万个用户的基本信息,例如,姓名、年龄、性别、身份证、地域等。
在本实施例中,由于某些用户可能存在有建模需求,但是没有建模对应的数据,因此,该第一数据可能为空。即,用户未上传第一数据,数据联合建模装置在获取用户上传的第一数据时,获取的为空数据。
在本实施例中,用户所需实现评分的目标标签为:信用。
步骤012,根据所述目标标签,确定与所述目标标签相关度最高的用户数据标签和本地数据标签。
在本实施例中,可以预先设置与不同标签分别对应的相关度从高到低依次排序的数据标签,其中,确定的与目标标签相关度最高的用户数据标签可以是0个或一个以上,确定的与目标标签相关度最高的本地数据标签可以是一个以上。该确定的相关度最高的数据标签的个数可以预先设定。
其中,确定的用户数据标签与本地数据标签可以相同,也可以不同。例如,根据预先设置的与目标标签对应的相关度从高到低依次排序的数据标签有:标签1、标签2、标签3、标签4、标签5、……标签n;其中,n为不小于1的整数。需要选择5个标签来确定为相关度最高的数据标签。在用户上传的第一数据中只存在标签用户数据标签为标签4和标签5,在本地数据中可以确定本地数据标签为标签1、标签2、标签3、标签4和标签5。
例如,标签1为信用卡违约还款次数,标签2为工作性质、标签3为年薪、标签4为年龄、标签5为地域。
步骤013,在所述第一数据中获取用户数据标签对应的第二数据,在预先构建的数据库中获取本地数据标签对应的第三数据。
第二数据为用户上传的第一数据中标签4对应的3万个用户的数据,以及标签5对应的3万个用户的数据。
预先构建的数据库可以是一个第三方的数据库,也可以是本地的一个数据库,在本地数据库中数据不足时,可以通过与第三方数据库建立合作关系,来进一步将所需第三方数据库中数据添加到本地数据库中。
例如,用户上传了3万个用户的姓名、年龄、性别、身份证、地域等信息,那么可以根据上传的姓名和身份证号在数据库中查找3万个用户中每个用户的标签1对应的数据信息,标签2对应的数据信息,标签3对应的数据信息,即信用卡违约还款次数、工作性质、年薪数据信息。将在数据库中查找到的数据作为第三数据。由于建立评分模型所需数据量较大,例如总共需要10万个用户的相应信息,那么还需要在数据库中获取7万个用户中标签1、标签2、标签3、标签4、标签5分别对应的数据信息,将其作为第三数据。
再如,用户未上传第一数据,即第一数据为空,那么需要在数据库中获取10万个用户的相应信息,即需要在数据库中获取10万个用户中标签1、标签2、标签3、标签4、标签5分别对应的数据信息,将其作为第三数据。
步骤014,将所述第二数据和所述第三数据,输入到预设模型中进行训练,以确定模型参数,将确定了模型参数的所述预设模型作为建立的所述评分模型。
在建立评分模型时可能只需要一定数量的样本数据即可,对于确定的第二数据可以只使用一部分,另一部分用来对建立完成的评分模型进行验证。在本实施例中,确定针对第二数据的使用比例,根据所述使用比例确定所需使用的第二使用数据,将所述第二使用数据和所述第三数据输入到预设模型中进行训练。
其中,该使用比例可以由数据联合建模一方来设置,例如,为70%。假设用户上传了3万个用户的基本信息,包括姓名、身份证号、性别、年龄。那么只使用2万个用户分别对应标签4的数据信息、标签5的数据信息,将其作为第二使用数据,并在数据库中获取第三数据,其中,第三数据包括该2万用户对应的标签1、标签2、标签3的数据信息,以及其他8万个用户对应的标签1、标签2、标签3、标签4和标签5的数据信息。
将第二使用数据和第三数据输入到预设模型中进行训练,以确定模型参数,将确定了模型参数的所述预设模型作为建立的评分模型。
其中,该预设模型可以采用LASSO回归模型、岭回归模型等来实现训练。
进一步地,对于建立好的评分模型,可以利用第二数据中除去第二使用数据之后得到的第二剩余数据,对评分模型进行验证,验证方式具体为:将剩余1万个用户分别对应标签4、标签5的数据信息作为第二剩余数据,在本地数据库中获取该1万个用户对应标签1、标签2、标签3的数据信息作为第三数据,将该第二剩余数据、第三数据输入到评分模型中,获取评分模型输出的信息,若输出信息与实际信用信息的误差在设定误差范围内,则表明该评分模型通过验证,可以供用户使用。其中,该设定误差范围可以±1%。
在本实施例中,评分模型的输入端对应的数据标签是用于向评分模型输入信息的统称,例如,根据上述信息确定的输入端对应的数据标签为:标签1、标签2、标签3、标签4和标签5。
步骤02,根据所述待评分数据信息以及确定的所述评分模型的输入端对应的数据标签,在预先构建的数据库中查找与数据标签对应的输入数据信息。
在本实施例中,由于待评分数据信息为用户的基本信息,因此,在确定了评分模型的输入端对应的数据标签后,需要在数据库中查找与数据标签对应的输入数据信息。例如,目标标签为用户A的信用信息,确定的数据标签为5个标签,5个标签分别为:该用户A的信用卡违约还款次数、工作性质、年薪、年龄和地域信息。根据待评分数据信息中的用户基本信息,在数据库中可以查找到相应标签的对应数据信息。
步骤03,将所述输入数据信息输入到所述评分模型中。
将确定的用户A的信用卡违约还款次数、工作性质、年薪、年龄和地域信息作为输入端输入到评分模型中。
步骤04,获取所述评分模型的输出数值。
步骤05,利用Logit函数将所述输出数值转换成设定范围内的数值,将转换后的数值作为所述待评分数据信息的评分。
对于评分模型的输出数值可能是±∞范围内的值,为了更便捷快速的获知一个用户的信用评分,可以采用Logit函数将输出值进行转换,该设定范围可以大于等于0,且小于等于100的数值,将转换后的数值作为待评分数据信息的评分。
进一步地,还可以预先设定评分级别以及对应的评分范围,例如,评分范围为75-100对应的评分级别为A级,评分范围为50-75,对应的评分级别为B级,评分范围为25-50对应的评分级别为C级,评分范围为0-25对应的评分级别为D级。
在确定了所述待评分数据信息的评分之后,例如,为80分,那么根据该评分确定所在的目标评分范围,即落入75-100分的评分范围内,将所述目标评分范围对应的目标评分级别输出给用户,即确定出目标评分级别为A级,将该信用级别为A输出为用户。
本发明实施例,即使一些个人或者公司无法提供一定量的样本数据,甚至无法提供样本数据,依然可以利用上传的待评分数据信息来实现数据的评分。
请继续参阅图2,示出了一种数据评分装置,在本实施例中,数据评分装置10可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述数据评分方法。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述数据评分装置10在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
数据接收模块11,用于接收用户上传的待评分数据信息;
数据标签确定模块12,用于根据预先构建的评分模型确定所述评分模型的输入端对应的数据标签;
查找模块13,用于根据所述待评分数据信息以及确定的所述评分模型的输入端对应的数据标签,在预先构建的数据库中查找与数据标签对应的输入数据信息;
数据输入模块14,用于将所述输入数据信息输入到所述评分模型中;
输出数值获取模块15,用于获取所述评分模型的输出数值;
评分转换模块16,用于利用Logit函数将所述输出数值转换成设定范围内的数值,将转换后的数值作为所述待评分数据信息的评分;
进一步包括:评分模型构建模块17,用于按如下方式构建所述评分模型:接收用户上传的第一数据,以及确定用户所需实现评分的目标标签;根据所述目标标签,确定与所述目标标签相关度最高的用户数据标签和本地数据标签;在所述第一数据中获取用户数据标签对应的第二数据,在本地数据库中获取本地数据标签对应的第三数据;将所述第二数据和所述第三数据,输入到预设模型中进行训练,以确定模型参数,将确定了模型参数的所述预设模型作为建立的所述评分模型。
本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备20至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器22,如图3所示。需要指出的是,图3仅示出了具有组件21-22的计算机设备20,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器21(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备20的内部存储单元,例如该计算机设备20的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备20的外部存储设备,例如该计算机设备20上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备20的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备20的操作系统和各类应用软件,例如实施例一的数据评分装置10的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备20的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行数据评分装置10,以实现实施例一的国际疾病分类编码方法。
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储数据评分装置10,被处理器执行时实现实施例一的数据评分方法。
实施例二
请参阅图4,本实施例的数据评分方法以实施例一为基础,包括以下步骤:
步骤01,建立评分模型。
步骤02,根据建立的评分模型生成建模结果,并将所述建模结果发送给用户。
在本步骤中,生成的建模结果可以包括建模能力,评分模型输入端所需输入的数据信息,评分模型输出端输出的评分结果对应的信息等。以供用户对建立的评分模型进行验收。
步骤03,在确定用户接受该评分模型时,为该用户提供评分接口,并存储该用户的用户名和密码。
在用户接受该评分模型时,则为该用户提供评分接口,该评分接口用于作为评分模型的输入端,接收待评分数据信息,便于用户操作。
由于建立的评分模型只针对有权限的用户使用,因此,需要存储与该评分接口对应的用户的用户名和密码。
在本实施例中,存储的用户名和密码可以为1对,也可以为多对。以供用户内部多个用户名的使用。其中,建模方可以预先设置用户名与密码的最高对数,例如,10对,对于10对以内的可以免费注册进行数据输入的评分,对于用户内部需要更多的用户使用,则可以针对超出设置个数的用户名密码对进行收费。
例如,存储了3对用户名和密码,分别为:用户名1-密码1;用户名2-密码2;用户名3-密码3。
步骤04,接收用户上传的待评分数据信息。
其中,该用户上传的待评分数据信息,可以包括与用户所需实现评分的目标标签相关度最高的数据标签对应的数据信息,也可以不包括。
例如,该用户上传的待评分数据信息为用户A的姓名和身份证号码。
步骤05,对用户的身份信息进行验证,若验证通过,则执行步骤06,否则,输出用户身份信息验证未通过的提示。
获取上传待评分数据信息的用户的用户名和密码,并在存储的与该评分接口对应的用户名密码对中进行查找,若查找到,则确定该用户的身份信息验证通过,即允许该用户使用该评分接口对应的评分模型进行数据评分,否则,则表明该用户的身份信息验证未通过,则输出相应的提示信息,例如该提示信息为:用户身份信息验证未通过。
步骤06,根据所述待评分数据信息,确定向评分模型中输入的输入数据信息。
在本实施例中,确定的向评分模型输入的输入数据信息为:利用该用户A的姓名和身份证号码在数据库中查找到的标签1、标签2、标签3、标签4、标签5对应的数据信息,即,该用户A的信用卡违约还款次数、工作性质、年薪、年龄和地域信息。
步骤07,将所述待评分数据信息输入到评分模型中。
将确定的用户A的信用卡违约还款次数、工作性质、年薪、年龄和地域信息作为输入端输入到评分模型中。
步骤08,获取所述评分模型的输出数值。
步骤09,利用Logit函数将所述输出数值转换成设定范围内的数值,将转换后的数值作为所述待评分数据信息的评分。
对于评分模型的输出数值可能是±∞范围内的值,为了更便捷快速的获知一个用户的信用评分,可以采用Logit函数将输出值进行转换,该设定范围可以大于等于0,且小于等于100的数值,将转换后的数值作为待评分数据信息的评分。
步骤10,根据预先设定的评分级别以及对应的评分范围,确定所述待评分数据信息的评分所在的目标评分范围,将所述目标评分范围对应的目标评分级别输出给用户。
预先设定评分级别以及对应的评分范围,例如,评分范围为75-100对应的评分级别为A级,评分范围为50-75,对应的评分级别为B级,评分范围为25-50对应的评分级别为C级,评分范围为0-25对应的评分级别为D级。
在确定了所述待评分数据信息的评分之后,例如,为80分,那么根据该评分确定所在的目标评分范围,即落入75-100分的评分范围内,将所述目标评分范围对应的目标评分级别输出给用户,即确定出目标评分级别为A级,将该信用级别为A输出为用户。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种数据评分方法,其特征在于,包括以下步骤:
接收用户上传的待评分数据信息,以及根据预先构建的评分模型确定所述评分模型的输入端对应的数据标签;
根据所述待评分数据信息以及确定的所述评分模型的输入端对应的数据标签,在预先构建的数据库中查找与数据标签对应的输入数据信息;
将所述输入数据信息输入到所述评分模型中;
获取所述评分模型的输出数值;
利用Logit函数将所述输出数值转换成设定范围内的数值,将转换后的数值作为所述待评分数据信息的评分;
其中,所述评分模型按照如下方式构建:接收用户上传的第一数据,以及确定用户所需实现评分的目标标签;根据所述目标标签,确定与所述目标标签相关度最高的用户数据标签和本地数据标签;在所述第一数据中获取用户数据标签对应的第二数据,在本地数据库中获取本地数据标签对应的第三数据;将所述第二数据和所述第三数据,输入到预设模型中进行训练,以确定模型参数,将确定了模型参数的所述预设模型作为建立的所述评分模型,其中,所述预设模型采用LASSO回归模型、岭回归模型来实现训练。
2.根据权利要求1所述的数据评分方法,其特征在于,所述第一数据为空。
3.根据权利要求1所述的数据评分方法,其特征在于,在将所述第二数据和所述第三数据,输入到预设模型中进行训练之前,进一步包括:确定针对所述第二数据的使用比例,根据所述使用比例确定所需使用的第二使用数据,将所述第二使用数据和所述第三数据输入到预设模型中进行训练。
4.根据权利要求3所述的数据评分方法,其特征在于,在所述将确定了模型参数的所述预设模型作为建立的所述评分模型之后,进一步包括:利用所述第二数据中除去所述第二使用数据之后得到的第二剩余数据,对所述评分模型进行验证。
5.根据权利要求1所述的数据评分方法,其特征在于,所述设定范围的数值为大于等于0,且小于等于100的数值。
6.根据权利要求1所述的数据评分方法,其特征在于,在所述将转换后的数值作为所述待评分数据信息的评分之后,进一步包括:根据预先设定的评分级别以及对应的评分范围,确定所述待评分数据信息的评分所在的目标评分范围,将所述目标评分范围对应的目标评分级别输出给用户。
7.根据权利要求1-6中任一所述的数据评分方法,其特征在于,在所述根据所述待评分数据信息,确定向预先构建的评分模型中输入的输入数据信息之前,进一步包括:对用户的身份信息进行验证,在验证通过时,执行所述将所述待评分数据信息输入到预先构建的评分模型中。
8.一种数据评分装置,其特征在于,包括:
数据接收模块,用于接收用户上传的待评分数据信息;
数据标签确定模块,用于根据预先构建的评分模型确定所述评分模型的输入端对应的数据标签;
查找模块,用于根据所述待评分数据信息以及确定的所述评分模型的输入端对应的数据标签,在预先构建的数据库中查找与数据标签对应的输入数据信息;
数据输入模块,用于将所述输入数据信息输入到所述评分模型中;
输出数值获取模块,用于获取所述评分模型的输出数值;
评分转换模块,用于利用Logit函数将所述输出数值转换成设定范围内的数值,将转换后的数值作为所述待评分数据信息的评分;
进一步包括:评分模型构建模块,用于按如下方式构建所述评分模型:接收用户上传的第一数据,以及确定用户所需实现评分的目标标签;根据所述目标标签,确定与所述目标标签相关度最高的用户数据标签和本地数据标签;在所述第一数据中获取用户数据标签对应的第二数据,在本地数据库中获取本地数据标签对应的第三数据;将所述第二数据和所述第三数据,输入到预设模型中进行训练,以确定模型参数,将确定了模型参数的所述预设模型作为建立的所述评分模型,其中,所述预设模型采用LASSO回归模型、岭回归模型来实现训练。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
CN201811049377.0A 2018-09-10 2018-09-10 数据评分方法、装置、计算机设备及存储介质 Active CN109461016B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811049377.0A CN109461016B (zh) 2018-09-10 2018-09-10 数据评分方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811049377.0A CN109461016B (zh) 2018-09-10 2018-09-10 数据评分方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN109461016A CN109461016A (zh) 2019-03-12
CN109461016B true CN109461016B (zh) 2023-05-05

Family

ID=65606585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811049377.0A Active CN109461016B (zh) 2018-09-10 2018-09-10 数据评分方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109461016B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263188B (zh) * 2019-05-29 2023-03-28 深圳市元征科技股份有限公司 媒体数据评分方法、装置及设备
CN111062750A (zh) * 2019-12-13 2020-04-24 中国平安财产保险股份有限公司 用户画像标签建模和分析方法、装置、设备及存储介质
CN113449945B (zh) * 2020-03-27 2024-05-10 庄龙飞 运动课程评分方法与系统
CN114841570B (zh) * 2022-05-07 2023-07-25 金腾科技信息(深圳)有限公司 用于客户关系管理系统的数据处理方法、装置、设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053310A (zh) * 2017-11-24 2018-05-18 深圳市牛鼎丰科技有限公司 信用风险评分方法、装置、计算机设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9465828B2 (en) * 2013-01-22 2016-10-11 Salesforce.Com, Inc. Computer implemented methods and apparatus for identifying similar labels using collaborative filtering
CN106127363B (zh) * 2016-06-12 2022-04-15 腾讯科技(深圳)有限公司 一种用户信用评估方法和装置
CN108399564B (zh) * 2017-02-08 2021-03-19 腾讯科技(深圳)有限公司 信用评分方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053310A (zh) * 2017-11-24 2018-05-18 深圳市牛鼎丰科技有限公司 信用风险评分方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN109461016A (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
CN112084383B (zh) 基于知识图谱的信息推荐方法、装置、设备及存储介质
CN110502608B (zh) 基于知识图谱的人机对话方法及人机对话装置
CN109461016B (zh) 数据评分方法、装置、计算机设备及存储介质
CN108629043B (zh) 网页目标信息的提取方法、装置及存储介质
CN111695439A (zh) 图像结构化数据提取方法、电子装置及存储介质
CN110060750B (zh) 医疗数据推送方法、系统、计算机设备及可读存储介质
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN111667067A (zh) 基于图神经网络的推荐方法、装置和计算机设备
CN111984792A (zh) 网站分类方法、装置、计算机设备及存储介质
CN112231224A (zh) 基于人工智能的业务系统测试方法、装置、设备和介质
CN113707300A (zh) 基于人工智能的搜索意图识别方法、装置、设备及介质
CN113704614A (zh) 基于用户画像的页面生成方法、装置、设备及介质
CN111369313A (zh) 订房失败订单的处理方法、装置、计算机设备及存储介质
CN112686301A (zh) 基于交叉验证的数据标注方法及相关设备
CN112052305A (zh) 信息提取方法、装置、计算机设备及可读存储介质
CN112214997A (zh) 语音信息录入方法、装置、电子设备及存储介质
CN112667878A (zh) 网页的文本内容提取方法、装置、电子设备及存储介质
CN113807728A (zh) 基于神经网络的绩效考核方法、装置、设备及存储介质
CN113468421A (zh) 基于向量匹配技术的产品推荐方法、装置、设备及介质
CN110750637B (zh) 文本摘要提取方法、装置、计算机设备及存储介质
CN111739646A (zh) 数据验证方法、装置、计算机设备及可读存储介质
CN116843483A (zh) 一种车险理赔方法、装置、计算机设备及存储介质
CN116777646A (zh) 基于人工智能的风险识别方法、装置、设备及存储介质
CN113722437B (zh) 基于人工智能的用户标签识别方法、装置、设备及介质
CN110766047A (zh) 数据匹配方法、系统、计算机设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant