CN105359172A - 计算企业存在拖欠的概率 - Google Patents

计算企业存在拖欠的概率 Download PDF

Info

Publication number
CN105359172A
CN105359172A CN201480032283.6A CN201480032283A CN105359172A CN 105359172 A CN105359172 A CN 105359172A CN 201480032283 A CN201480032283 A CN 201480032283A CN 105359172 A CN105359172 A CN 105359172A
Authority
CN
China
Prior art keywords
supplier
enterprise
produce
signal
unique identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480032283.6A
Other languages
English (en)
Inventor
阿拉·克拉姆斯卡娅
保罗·道格拉斯·巴莱夫
尼帕·巴苏
迈克尔·埃里克·达尼茨
布里安·斯科特·克里格勒
卡罗利娜·安娜·凯日科夫斯基
约翰·马克·尼科代莫
袁新
东·L·福克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dun and Bradstreet Inc
Original Assignee
Dun and Bradstreet Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dun and Bradstreet Inc filed Critical Dun and Bradstreet Inc
Publication of CN105359172A publication Critical patent/CN105359172A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)

Abstract

提供有一种方法,该方法包括采用计算机来执行下述操作:(a)通过电子通信的方式从数据源接收企业的描述符;(b)将所述描述符与数据库中的数据进行匹配,从而产生匹配,其中,所述数据包括所述企业的唯一标识符;(c)将包括所述唯一标识符的信号保存至记录;(d)统计所述记录中的包括所述唯一标识符的信号的数量,从而产生针对所述唯一标识符的信号的数目;以及(e)基于所述信号的数目来计算所述企业的信用得分。还提供有一种用于执行该方法的系统,以及一种用于控制处理器以执行该方法的存储器装置。

Description

计算企业存在拖欠的概率
相关申请的交叉引用
本申请要求于2013年5月2日提交的美国临时专利申请No.61/818,784的优先权,其内容通过引用并入本文。
技术领域
本公开内容涉及预测性评分的领域,并且更具体地涉及信用评分。
背景技术
在本部分所描述的方法是能够实行的方法,但未必是先前已构思或实行的方法。因此,在本部分所描述的方法对于本申请中的权利要求而言可以不是现有技术,并且不会因为包含在这一部分中而被认为是现有技术。
信用评分向企业分配逾期支付的概率,即存在拖欠的概率。存在两种类型的信用评分,即判断型和统计型。判断型评分由信用管理者基于信用管理者的判断和经验来创建。统计型评分是对企业的信用档案进行的统计分析的结果,以表示该企业的信用度。
在统计学中,回归分析是用于估计变量之间的关系的统计处理。当聚焦于因变量与一个或多个自变量之间的关系时,回归分析包括用于对若干变量进行建模和分析的技术。回归分析帮助对下述的理解:当自变量中的任一自变量变化,而其他自变量保持固定时,因变量的典型值如何变化。
回归分析的准确性部分地取决于所使用的模型的形式和对自变量的选择。也就是说,良好形式的模型和对自变量的适当选择可以引起更准确的结果。
针对信用评分要分析的数据通常被存储在数据库中。现今,由于生成、存储以及处理的数据量增加,操作型数据库针对操作效率(例如,吞吐量、处理速度以及存储容量)被构建、分类以及格式化。在这些操作型数据库中查找到的原始数据通常以数字和代码的行和列的形式存在,这对于企业分析员和决策者而言显得令人困惑和难以理解。此外,现代数据库中存储的原始数据的范围和浩瀚致使其更难查找到可用信息。
因此,需要一种针对回归分析对来自一个或多个数据库的数据进行分析以开发模型和对自变量进行识别和选择的技术。
发明内容
本公开内容的目的在于提供一种针对回归分析对来自一个或多个数据库数据进行分析以开发模型和对自变量进行识别和选择的技术。
本公开内容的另一目的在于提供一种利用所述模型对与对象企业有关的数据进行评估以生成对象企业的信用得分的技术。
为了实现这些目的,提供一种方法,该方法包括采用计算机以执行下述操作:(a)通过电子通信的方式从数据源接收企业的描述符;(b)将所述描述符与数据库中的数据进行匹配,从而产生匹配,其中,所述数据包括所述企业的唯一标识符;(c)将包括所述唯一标识符的信号保存至记录;(d)统计所述记录中的包括所述唯一标识符的信号的数量,从而产生针对所述唯一标识符的所述信号的数目;以及基于所述信号的数目来计算企业的信用得分。还提供有一种用于执行该方法的系统,以及一种用于控制处理器以执行该方法的存储器装置。
附图说明
图1是采用本文中所公开的技术的系统的框图。
图2是图1的系统的处理模块的框图。
图3是作为图2的处理模块的部件的活动信号生成器的框图。
图4是作为图2的处理模块的部件的应收账款(accountreceivable)处理模块的框图。
图4A是列出了由图4的应收账款处理模块所执行的示例性中间计算的表的图示。
图5是作为图2的处理模块的部件的模型生成器的框图。
图5A是示出了由图5的模型生成器所产生的第一示例性模型开发数据集的表的图示。
图5B是示出了由图5的模型生成器所产生的第二示例性模型开发数据集的表的图示。
图6是作为图2的处理模块的部件的评分处理的框图。
图7是示出了针对根据图6的评分处理被评分的单个企业的记分卡的示例的表。
在附图中的每个附图中,使用相同的附图标记来表示对于多于一个附图而言是共同的部件或特征。
具体实施方式
本公开内容提供了一种用于对对象企业在支付方面存在拖欠的概率进行计算的系统和方法。该系统和方法利用统计得分,其中,概率的分配是根据经验得到的并且可以根据经验验证。概率基于与对象企业的未支付活动有关的本文中被称为活动信号的数据来计算。活动信号根据由其他企业进行的纪录保持处理来得到。对象企业存在拖欠的概率根据用于找出逾期支付与和对象企业有关的数据之间的关系的数学技术来得到。由所述系统开发和利用的模型提供了针对严重拖欠的企业的对不良绩效的限定。评分处理利用所述模型以生成针对对象企业的得分。
图1是采用本文中所公开的技术的系统100的框图。系统100包括:(a)计算机105;(b)统称为数据源145的数据源145-1、数据源145-2至145-N,数据源145经由网络150通信地耦接至计算机105。
网络150是数据通信网络。网络150可以是专用网络或公用网络,并且可以包括下述所有网络中的任何网络:(a)例如覆盖房间的个人局域网;(b)例如覆盖建筑物的局域网;(c)例如覆盖校园的校园局域网;(d)例如覆盖城市的城域网;(e)例如覆盖链接跨城市、地区或国家边界的区域的广域网;或者(f)因特网。通信通过电子信号和光信号经由网络150进行。
数据源145中的每个数据源是提供与企业有关的信息即数据的实体、机构或处理。数据源145的示例包括企业登记、电话薄、人员配置数据、应收账款发票级支付数据以及与其他企业有关的企业查询。
计算机105对来自数据源145的数据进行处理,并且还对本文中被指定为应收账款数据130、详细交易数据135以及企业参考数据140的数据进行处理,以及产生被指定为活动信号数据(ASD)160和得分165的数据。
应收账款数据130是从向其他企业提供商品、服务或信贷的多个企业获得的应收账款数据。与所关注的公司有关的应收账款数据130从所关注的公司的商品或服务的提供商获得。例如,假设公司B是公司A的商品或服务的提供商。公司B在其账目上将显示来自公司A的到期应付的应收账款金额。实际上,可以存在向公司A提供商品或服务的许多公司,因此,针对公司A的应收账款数据可以包括来自这些许多公司的与公司A有关的应收账款数据。
详细交易数据135是与所关注的公司有关的其他数据,并且可以从应收账款数据130得到。详细交易数据135的示例包括在过去六个月中逾期未付账目的数量和所欠的总金额。
企业参考数据140是描述企业的数据。例如,针对对象企业,企业参考数据140将包括对象企业的唯一标识符、企业信息、财务报表以及传统交易数据。唯一标识符是对对象企业进行唯一地标识的标识符。数据通用编号系统(DUNS)编号可以充当唯一标识符。企业信息是与企业有关的信息例如员工数量、经营年数以及企业被分类在其中的产业例如零售业。财务报表是财务信息例如负债总额和速动比率即(流动资产-库存)/流动负债。传统交易数据是例如逾期未付30天或更多天的金额、逾期未付30天或更多天的支付体验的次数以及令人满意的支付体验的次数的信息。
ASD160是包括与公司有关的信息的数据结构,其中,所述信息根据从数据源145获得的数据得到。通常,对于对象公司而言,ASD160指示与对象公司有关的由其他公司进行的处理活动的水平。
得分165是表示分配有信用得分的企业的信用度的信用得分。
应收账款数据130、详细交易数据135、企业参考数据140、ASD160以及得分165存储在一个或多个数据库中。一个或多个数据库可以被配置为单个存储器装置或具有多个独立存储器装置的分布式存储器系统。虽然在系统100中一个或多个数据库被示出为直接耦接至计算机105,但是一个或多个数据库可以远离计算机105并且通过网络150耦接至计算机105。
计算机105包括用户接口110、处理器115以及耦接至处理器115的存储器120。虽然计算机105在本文中被表示为独立的装置,但其不受限于此,而是可以替代地以分布式处理系统的方式耦接至其他装置(未示出)。用户接口110包括用于使用户能够将信息和命令选择传达至处理器115的输入装置例如键盘或语音识别子系统。
用户接口110还包括输出装置例如显示器、或打印机或语音合成器。光标控制器例如鼠标、跟踪球或操纵杆使得用户能够操纵显示器上的光标,以用于将附加的信息和命令选择传达至处理器115。
处理器115是配置有响应和执行指令的逻辑电路的电子装置。
存储器120是编码有计算机程序的有形计算机可读存储器装置。就这一点而言,存储器120存储数据和指令即程序代码,所述程序代码可以由处理器115读取和执行,以用于控制处理器115的操作。存储器120可以以下述形式来实现:随机存取存储器(RAM)、硬盘驱动器、只读存储器(ROM)或其组合。存储器120的部件中的一个部件是处理模块125。
处理模块125是下述指令的模块,所述指令可以由处理器115读取并且控制处理器115以执行对企业的评分,即通过分配拖欠的概率对企业进行评估,所述拖欠的概率被转换成拖欠得分即得分165。处理模块125将结果输出至用户接口110,并且还可以经由网络150将输出引向远程装置(未示出)。
在本文档中,操作被描述为由处理模块125或其从属处理来执行。然而,操作实际上由计算机105并且更特别地由处理器115来执行。
术语“模块”在本文中被用于指示可以被体现为独立部件或多个从属部件的集成配置的功能性操作。因此,处理模块125可以被实现为单个模块或彼此合作进行操作的多个模块。此外,虽然处理模块125在本文中被描述成安装在存储器120中并且从而以软件的形式来实现,但处理模块125可以以硬件(例如电子电路)、固件、软件中的任一种或其组合的形式来实现。
尽管处理模块125被指示为已经被加载到存储器120中,但是处理模块125可以被配置在存储器装置199上,以用于随后加载到存储器120中。存储器装置199是将处理模块125存储在其上的有形计算机可读存储器介质。存储器装置199的示例包括光盘、磁带、只读存储器、光学存储介质、硬盘驱动器或由多个并行硬盘驱动器组成的存储器单元以及通用串行总线(USB)闪存驱动器。可替选地,存储器装置199可以是位于远程存储器系统上并且经由网络150耦接至计算机105的随机存取存储器或其他类型的电子存储器装置。
实际上,数据源145、应收账款数据130、详细交易数据135以及企业参考数据140将包括表示许多例如数以百万计的数据项的数据。因此,实际上,数据不能够由人类处理,而是将需要计算机例如计算机105。
图2是处理模块125的框图。处理模块125包括若干从属模块,即,活动信号数据(ASD)生成器205、应收账款(A/R)处理210、模型生成器215以及评分处理220。简言之:
(a)ASD生成器205对来自数据源145的数据进行分析,并且产生ASD160,如上文所提及的,对于对象公司而言,ASD160指示与对象公司有关的由其他公司进行的处理活动的水平;
(b)A/R处理210对来自对象企业的供应商的应收账款数据130进行分析,并且产生权重,该权重指示就对象企业债务支付而言对象企业是具有良好信誉,还是其对借方的支付存在拖欠;
(c)模型生成器215处理各种企业数据、ASD160以及来自A/R处理210的权重,并且基于此生成用于对企业进行评分的模型;以及
(d)评分处理220利用来自模型生成器215的模型以产生得分165。
下面对ASD生成器205、A/R处理210、模型生成器215以及评分处理220中的每个进行更详细地描述。
图3是ASD生成器205的框图,如上文所提及的,ASD生成器205对来自数据源145的数据进行分析,并且产生ASD160。ASD生成器205包括匹配处理305、记录处理310以及聚合器315。
如上文所提及的,数据源145是提供与企业有关的信息即数据的实体、机构或处理。数据的格式并不特别地与系统100的操作有关,但是出于示例的目的,假设将数据组织成记录。描述符301是这样的记录的示例并且包括对企业的各个方面进行描述的数据例如名称、地址以及电话号码。实际上,描述符301可以包括许多这样的方面。
匹配处理305从数据源145接收或以其他方式获得描述符301,并且将描述符301与企业参考数据140中的数据进行匹配。
描述符301的属性针对数据源145中的每个企业以非一致的方式填充。计算机105使用可用的描述符301信息并且基于该信息,以及进行该信息的最佳可能匹配。作为示例,考虑到用于实现最准确的匹配的最大必要信息是具有与企业名称及其电话号码有关的信息。示例性数据源145-2和描述符301提供仅与企业名称有关的信息。这限制了匹配的准确度,但是计算机105从该描述符301取得信息并且对数据库140进行搜索以查找针对企业的具有最高可达到的准确度和匹配的记录。
如上文所提及的,企业参考数据140是对企业进行描述的数据。企业参考数据140被组织成记录。一个这样的记录即记录340是代表性的示例。记录340包括唯一标识符341、企业信息342、财务报表343以及传统交易数据344。
如本文中所使用的,匹配意味着针对数据对数据存储器装置进行搜索,例如,在数据库中搜索与给定查询最佳地匹配的记录。因此,匹配处理305针对与描述符301最佳地匹配的数据对企业参考数据140进行搜索。
最佳匹配未必是正确的匹配,所以匹配处理305在查找到匹配时还提供了指示匹配是正确的置信水平的置信代码。例如,为5的置信代码可以指示匹配几乎确定是正确的,而为1的置信代码可以指示匹配为正确的可能性相对较低。
匹配处理305在查找到匹配时产生信号306,信号306包括:
(a)对从其接收数据的源的标识;
(b)进行匹配的时间(包括日期);
(c)唯一标识符341;以及
(d)置信代码。
记录处理310接收信号306,并且将其输入到记录中,该记录在本文中被指定为元数据320。
实际上,ASD生成器205或ASD生成器205的从属处理中的每个从属处理,即,匹配处理305、记录处理310以及聚合器315将以处理循环的方式进行操作,以处理来自数据源145的多个描述符。因此,匹配处理205将产生多个信号,其中,信号306仅是一个这样的信号。
表1列出了一些示例性元数据320。
表1
示例性元数据320
信号 时间 唯一标识符 置信代码
1 145-2 t0 00000001 2
2 145-1 t1 00000002 1
3 145-1 t2 00000001 3
4 145-1 t3 00000001 3
…… …… …… …… ……
例如,表1,行1示出了匹配处理305产生了第一信号即信号1,第一信号指示匹配处理305在时间t0时将来自数据源145-2的描述符301匹配至企业参考数据140中的数据。该匹配指示描述符301涉及由唯一标识符00000001所标识的企业,并且匹配具有为2的置信代码。实际上,元数据320将包括许多例如数以百万行的数据。
聚合器315对来自元数据320的数据进行聚合以产生ASD160。更特别地,聚合器315考虑属于时间段即时段312的元数据320,并且针对每个唯一标识符保持信号的总数量和具有大于或等于阈值313的置信代码的匹配的总数量。因此,针对对象企业,ASD160包括唯一标识符330、信号的数量335以及置信代码(CC)匹配336。信号的数量335是针对在时段312期间匹配的特定唯一标识符的信号的总数量。CC匹配336是具有大于或等于阈值313的置信代码的那些匹配的总数量。
例如,参考表1,假设时段312限定了从t0至t4的时间段,并且阈值313限定了为3的阈值。表2列出了ASD160的对应示例性数据。
表2
ASD160的示例性数据
表2示出了在t0至t4的时段中,针对唯一标识符00000001,存在总共3个信号(参见表1,信号1、3以及4),并且在这3个信号中,2个信号针对具有大于或等于3的置信代码(参见表1,行3和4)的匹配。虽然未在表2中示出,ASD160可以包括从信号306得到的其他信息,例如数据源145的标识,数据源145提供导致具有大于或等于阈值313的置信代码的最大数量匹配的数据。实际上,时段312为以下长度例如12个月,该长度使ASD生成器205能够收集显著数量的事件。因此,ASD160将包括许多例如数以百万行的数据。
图4是A/R处理210的框图,如上文所提及的,A/R处理210对来自对象企业的供应商的应收账款数据130进行分析,并且产生下述权重:该权重指示就对象企业的债务支付而言对象企业是具有良好信誉,还是其对借方的支付存在拖欠。
在执行期间,A/R处理210产生中间计算418。图4A是表即表450的图示,表450列出了示例性中间计算418。
A/R处理210从步骤405开始。
在步骤405中,A/R处理210获得针对对象企业的应收账款数据130,该对象企业由唯一标识符330标识。更特别地,针对对象企业的每个供应商即债权人,A/R处理210获得对象企业到期应付给供应商的余额和该余额中的逾期未付例如逾期未付91天或更多天的金额。将该信息存储在中间计算418中。
表450示出了例如对象企业(a)欠供应商-1$100,000,其中,$0是逾期未付91天或更多天的,以及(b)欠供应商-10$1,000,000,其中,$150,000是逾期未付91天或更多天的。
A/R处理210从步骤405进行至步骤410。
在步骤410中,A/R处理210对对象企业所欠的总余额和该总余额中的逾期未付91天或更多天的金额进行计算。将该信息存储在中间计算418中。表450示出了例如(a)所欠的总余额是$1,900,000,以及(b)在该总余额中,$180,000是逾期未付91天或更多天的。
A/R处理210从步骤410进行至步骤415。
在步骤415中,A/R处理210对拖欠比率进行计算,并且识别存在风险的账目。
一种用于评价对象企业的信用的技术将对(a)逾期未付的总余额与(b)所欠总余额的比率进行计算。如果该比率大于特定值例如0.10,该特定值指示多于某一特定百分比例如10%是逾期未付的,则对象企业将被分类为不良信用风险。使用表450中存在的数据:
逾期未付的总余额/所欠的总余额=180,000/1,900,000=0.095公式1因此,公式1指示少于10%是逾期未付的,并且对象企业将不被分类为不良信用风险。
然而,对象企业可能与一个服务提供商关系融洽,但是其对另一服务提供商的支付存在逾期。为了解决这个问题,A/R处理210针对每个单独供应商考虑支付拖欠,从而将不同程度的拖欠并入不良信用风险的限定中。更特别地,如在公式2中所示,针对每个供应商,A/R处理210对(a)逾期未付的余额与(b)所欠的余额的拖欠比率进行计算。如果拖欠比率比特定值例如0.10大,则对象企业相对于该供应商的账目被标识为不良信用风险。
拖欠比率=逾期未付的余额/所欠的余额公式2
针对供应商-5:
拖欠比率=25,000/100,000=0.25公式3
针对供应商-10:
拖欠比率=150,000/1,000,000=0.15公式4
因此,就供应商-5和供应商10而言,对象企业的账目被分类为不良信用风险。
A/R处理210从步骤415进行至步骤420。
在步骤420中,针对对象企业,A/R处理210对良好权重425和不良权重430进行计算。
为了计算良好权重425,A/R处理210对欠账目被指定为良好的供应商的总金额即良好总额进行计算,,并且然后对(a)良好总额与(b)所欠的总余额的比率进行计算。在本示例中,如表450所示,良好总额是欠供应商-1、2、3、4、6、7、8和9的总额。在此处,良好总额=800,000,并且:
良好权重=良好总额/所欠的总余额=800,000/1,900,000=0.42公式5
为了计算不良权重430,A/R处理210对欠账目被指定为不良的供应商的总金额即不良总额进行计算,然后对(a)不良总额与(b)所欠的总余额的比率进行计算。在本示例中,如表450所示,不良总额是欠供应商5和供应商10的总额。
在此处,不良总额=1,100,000,并且:
不良权重=不良总额/所欠的总余额=1,100,000/1,900,000=0.58公式6
应注意的是,良好权重与不良权重的和等于1,即0.42+0.58=1。这些权重还可以例如在100的量级上被缩放,并且在本示例中,良好权重可以取值为42,而不良权重可以取值为58。
查看账目级别的企业支付行为使得能够对企业所欠的总金额的未清余额进行加权,这捕获了对多个供应商的真实企业表现和企业倾向。
图5是模型生成器215的框图,如上文所提及的,模型生成器215对各种企业数据、ASD160以及来自A/R处理210的权重进行处理,并且基于此生成用于对企业进行评分的模型。模型生成器215从步骤505开始。
在步骤505中,模型生成器215接收企业参考数据140、详细交易数据135、ASD160、良好权重425、以及不良权重430,并且建立模型开发数据集510。
图5A是表即表550的图示,表550示出了第一示例性模型开发数据集510。
表550具有列出下述的标题行:
(1)唯一标识符;
(2)预测因子(predictor):
(a)企业信息(BI)342;
(b)财务报表(FS)343;
(c)传统交易数据(TTD)344;
(d)详细交易(DT)数据135;
(e)信号的数量(NS)335;
(f)置信代码匹配(CCM)336;
(g)良好权重(GW)425;以及
(h)不良权重(BW)430;以及
(3)不良风险指标(BRI)。
在表550中,每个唯一标识符对对象企业进行标识。例如,对象企业与唯一标识符00000001相对应。预测因子是表征对象企业的数据项。可以存在任何数量的唯一标识符和任何数量的预测因子,并且实际上,存在许多例如数以百万计的唯一标识符和许多例如数以百计的预测因子。此外,实际上,表550中的预测因子中的每个预测因子表示多个预测因子。例如,实际上,替代针对企业信息的单个列,存在针对员工数量、经营年数以及产业的多个列。预测因子被看作针对回归分析的自变量。应注意的是,例如,信号的数量(NS)335、置信代码匹配(CCM)336、良好权重(GW)425以及不良权重(BW)430中的每个均是自变量。
仍在表550中,当对象企业被看作存在不良风险时,例如,当对象企业的良好权重比其不良权重小时,则被指定为不良风险指标(BRI)的列中的单元格包括为“1”的值。当对象企业被看作不存在不良风险时,则单元格将包括为“0”的值。良好风险或不良风险的指定可以基于预测因子的任何期望的组合。出于回归分析的目的,将不良风险指标看作因变量。
统计模型中的因变量是试图利用多个预测因子即自变量进行预测的测量值。因此,模型生成器215对与对象企业与供应商之间的债务有关的良好支付行为和不良支付行为进行区分,以限定因变量,在该情况下,即不良风险指标。
图5B是表即表560的图示,表560示出了第二示例性模型开发数据集510。
表560具有列出下述的标题行:
(1)唯一标识符;以及
(2)预测因子:
(a)信号的数量(NS)335;以及
(b)不良权重(BW)430。
应注意的是,例如,信号的数量(NS)335和不良权重(BW)430中的每个均是自变量。考虑到表560,不良风险指标即因变量可以从不良权重(BW)430得到。例如,如果不良权重大于或等于0.50,则不良风险指标被假设为1。
模型生成器215从步骤505进行至步骤515。
在步骤515中,模型生成器215执行对模型开发数据集510的回归分析,并且生成回归模型即模型520。公式7是模型520的一般形式。
得分=C1(预测因子1)+C2(预测因子2)+...+Cm(预测因子m)公式7
因此,模型520是由一系列变量和针对每个变量计算的系数组成的公式。例如,在模型开发数据集510是如在表560中所示出的情况下,信号的数量(NS)335和不良权重(BW)430的值,即自变量,将充当公式7中的预测因子。
图6是评分处理220的框图,如上文所提及的,评分处理220利用来自模型生成器215的模型以产生得分165。评分处理220从步骤610开始。
在步骤610中,评分处理220从模型开发数据集510获得数据,并且填充模型520。评分处理220从步骤610进行至步骤620。
在步骤620中,评分处理220对来自步骤610的所填充的模型进行评估,从而生成得分165。在所填充的模型520包括特定自变量例如信号的数量(NS)335的情况下,得分165将基于该自变量,即将是该自变量的函数。
图7是示出了针对根据评分处理220被评分的单个企业的记分卡的示例的表700。预测因子即因子的示例性列表示出了来自每个预测因子的分数如何累加成总得分。原始得分映射到百分位数分数和基于总体分布所限定的类别值。百分位数具有1至100的范围,其中,“100”意味着最小风险。百分位数基于总体的得分分布来创建。百分位数创建对总体的排名。作为由范围1至5所限定的示例的类别基于关于总体的记录的分布。总体中的最小风险的10%在类别1中;接下来的20%被分配到类别2。中间的40%在类别3中。总体中的接下来的较高风险的20%被分类在类别4中。总体中的最高风险的10%被分配到类别5。处理器115准备包括表700的报告,并且通过用户接口110将该报告递送给计算机105的用户,或者通过网络150递送给远程装置(未示出)的用户。
在试验操作中,使用总数为3,300,000个企业来开发模型520。这些企业所报告的交易被分类成下述两种类别中的一种类别:“良好”,其被定义为逾期未付少于91天;以及“不良”,其被定义为严重拖欠并且在其限期方面实质上逾期未付91天或更多天。良好账目按时支付或在其债务方面具有最小延期。在模型开发期间,每个企业基于其“良好”交易和“不良”交易的百分比来加权。例如,如果针对特定企业,所欠的总金额中的30%是逾期未付91天或更多天的,而70%是逾期未付少于91天的,则该公司以70%“良好”和30%“不良”被加权。在3,300,000个总体中,与这些企业相关联的交易账目中的大约10.2%是“不良”,或严重拖欠。
在模型开发处理中,数据从被指定为观察窗和性能窗的两个时段中的最小时段收集。观察窗限定了在其期间收集所有标识数据和特性数据的时间段。性能窗限定了跟踪账目以检验企业的支付行为的时间长度。数据的快照表示开发模型所在的时间帧,并且是任何其他时间帧的代表。预测性变量或自变量根据该快照被限定,预测性变量或自变量可以组合地限定结果和将记录分类到相似特性的不同的组中的划分方案。
在示例性实施方式中,所用的观察快照是2011年2月,而性能快照是从2011年3月到2012年2月的十二个月。根据观察窗数据,进行广泛的数据分析以确定这些变量在统计上是用于预测严重拖欠和计算针对每个变量的适当权重的最显著的因子。
系统100通过使用根据元数据和粒度级别的交易数据限定的内部企业操作数据来创建预测因子。所发现的是:尤其针对具有有限的交易活动或没有交易活动的记录,来自与所创建的操作流程有关的元数据320的数据是上述模型中的显著预测因子。还可以使用详细交易数据以更好地区别良好支付行为和不良支付行为。该数据源提供了一组显著的预测因子。
本文中所描述的技术是示例性的,并且不应当被解释为暗示对本公开的任何特定的限制。应理解的是,本领域的技术人员可以想到各种替代、组合以及修改。例如,除非步骤本身另外指定或指示,否则与本文中所描述的处理相关联的步骤可以以任何顺序执行。
术语“包括”或“包含”应被解释为指定所陈述的特征、整数、步骤或部件的存在,但不排除一个或多个其他特征、整数、步骤或部件或其组合的存在。术语“一个(a)”和“一个(an)”是单数形式,但是不排除具有复数形式的实施例。

Claims (15)

1.一种方法,包括:
采用计算机来执行操作,所述操作包括:
通过电子通信的方式从数据源接收企业的描述符;
将所述描述符与数据库中的数据进行匹配,从而产生匹配,其中,所述数据包括所述企业的唯一标识符;
将包括所述唯一标识符的信号保存至记录;
统计所述记录中的包括所述唯一标识符的信号的数量,从而产生针对所述唯一标识符的所述信号的数目;以及
基于所述信号的数目来计算所述企业的信用得分。
2.根据权利要求1所述的方法,
其中,所述操作还包括:
将所述信号的数目作为自变量包括在数据集中;以及
执行对所述数据集的回归分析,从而产生模型,并且,其中,所述计算利用所述模型来计算所述信用得分。
3.根据权利要求2所述的方法,
其中,所述匹配还产生指示所述匹配是正确的置信水平的代码,
其中,所述操作还包括:
将所述代码保存至所述记录;以及
统计(a)所述记录中包括所述唯一标识符的信号以及(b)指示所述置信水平大于或等于特定置信水平阈值的信号的数量,从而产生针对所述唯一标识符的置信匹配的计数,并且
将针对所述唯一标识符的置信匹配的所述计数作为自变量包括在所述数据集中。
4.根据权利要求2所述的方法,还包括:
针对所述企业的多个供应商中的每个供应商从数据库获得:(a)所述企业到期应付给所述供应商的余额,从而产生欠所述供应商的余额,以及(b)逾期未付的所欠的所述余额的金额,从而产生逾期未付给所述供应商的余额;
计算由所述企业欠所述多个供应商的总额,从而产生所欠的总余额;
针对每个所述供应商,计算(a)逾期未付给所述供应商的所述余额与(b)欠所述供应商的所述余额的比率,从而产生针对所述供应商的对应拖欠比率;
针对所述供应商中的具有比拖欠比率阈值大的对应拖欠比率的每个供应商指定所述企业存在不良信用风险,从而产生账目被指定为不良的一组供应商;
计算欠账目被指定为不良的所述一组供应商的总金额,从而产生不良总额;
计算(a)所述不良总额与(b)所欠的所述总余额的比率,从而产生不良权重;以及
将所述不良权重作为自变量包括在所述数据集中。
5.根据权利要求1所述的方法,
其中,所述操作还包括将所述进行匹配产生所述匹配的对应时间保存至所述记录,以及
其中,所述统计仅包括指示所述对应时间属于特定时间段的所述信号。
6.一种系统,包括:
处理器;以及
存储器,所述存储器包括能够由所述处理器读取的指令,所述指令用于控制所述处理器以:
通过电子通信的方式从数据源接收企业的描述符;
将所述描述符与数据库中的数据进行匹配,从而产生匹配,其中,所述数据包括所述企业的唯一标识符;
将包括所述唯一标识符的信号保存至记录;
统计所述记录中的包括所述唯一标识符的信号的数量,从而产生针对所述唯一标识符的所述信号的数目;以及
基于所述信号的数目来计算所述企业的信用得分。
7.根据权利要求6所述的系统,
其中,所述指令还控制所述处理器以:
将所述信号的数目作为自变量包括在数据集中;以及
执行对所述数据集的回归分析,从而产生模型,并且,其中,为了计算所述信用得分,所述指令控制所述处理器以利用所述模型来计算所述信用得分。
8.根据权利要求7所述的系统,
其中,为了执行所述匹配,所述指令还控制所述处理器,以产生指示所述匹配是正确的置信水平的代码,
其中,所述指令还控制所述处理器以:
将所述代码保存至所述记录;以及
统计(a)所述记录中包括所述唯一标识符的信号以及(b)指示所述置信水平大于或等于特定置信水平阈值的信号的数量,从而产生针对所述唯一标识符的置信匹配的计数,并且
将针对所述唯一标识符的置信匹配的所述计数作为自变量包括在所述数据集中。
9.根据权利要求7所述的系统,其中,所述指令还控制所述处理器以:
针对所述企业的多个供应商中的每个供应商从数据库获得:(a)所述企业到期应付给所述供应商的余额,从而产生欠所述供应商的余额,以及(b)逾期未付的所欠的所述余额的金额,从而产生逾期未付给所述供应商的余额;
计算由所述企业欠所述多个供应商的总额,从而产生所欠的总余额;
针对每个所述供应商,计算(a)逾期未付给所述供应商的所述余额与(b)欠所述供应商的所述余额的比率,从而产生针对所述供应商的对应拖欠比率;
针对所述供应商中的具有比拖欠比率阈值大的对应拖欠比率的每个供应商指定所述企业存在不良信用风险,从而产生账目被指定为不良的一组供应商;
计算欠账目被指定为不良的所述一组供应商的总金额,从而产生不良总额;
计算(a)所述不良总额与(b)所欠的所述总余额的比率,从而产生不良权重;以及
将所述不良权重作为自变量包括在所述数据集中。
10.根据权利要求6所述的系统,
其中,所述指令还控制所述处理器,以将对所述描述符进行匹配产生所述匹配的对应时间保存至所述记录,以及
其中,为了统计所述信号的数量,所述处理器仅包括指示所述对应时间属于特定时间段的所述信号。
11.一种存储器装置,包括:
指令,所述指令能够由处理器读取,所述指令用于控制所述处理器以:
通过电子通信的方式从数据源接收企业的描述符;
将所述描述符与数据库中的数据进行匹配,从而产生匹配,其中,所述数据包括所述企业的唯一标识符;
将包括所述唯一标识符的信号保存至记录;
统计所述记录中的包括所述唯一标识符的信号的数量,从而产生针对所述唯一标识符的所述信号的数目;以及
基于所述信号的数目来计算所述企业的信用得分。
12.根据权利要求11所述的存储器装置,
其中,所述指令还控制所述处理器以:
将所述信号的数目作为自变量包括在数据集中;以及
执行对所述数据集的回归分析,从而产生模型,并且,其中,为了计算所述信用得分,所述指令控制所述处理器以利用所述模型来计算所述信用得分。
13.根据权利要求12所述的存储器装置,
其中,为了执行所述匹配,所述指令还控制所述处理器,以产生指示所述匹配是正确的置信水平的代码,
其中,所述指令还控制所述处理器以:
将所述代码保存至所述记录;以及
统计(a)所述记录中包括所述唯一标识符的信号以及(b)指示所述置信水平大于或等于特定置信水平阈值的信号的数量,从而产生针对所述唯一标识符的置信匹配的计数,并且
将针对所述唯一标识符的置信匹配的所述计数作为自变量包括在所述数据集中。
14.根据权利要求12所述的存储器装置,其中,所述指令还控制所述处理器以:
针对所述企业的多个供应商中的每个供应商从数据库获得:(a)所述企业到期应付给所述供应商的余额,从而产生欠所述供应商的余额,以及(b)逾期未付的所欠的所述余额的金额,从而产生逾期未付给所述供应商的余额;
计算由所述企业欠所述多个供应商的总额,从而产生所欠的总余额;
针对每个所述供应商,计算(a)逾期未付给所述供应商的所述余额与(b)欠所述供应商的所述余额的比率,从而产生针对所述供应商的对应拖欠比率;
针对所述供应商中的具有比拖欠比率阈值大的对应拖欠比率的每个供应商指定所述企业存在不良信用风险,从而产生账目被指定为不良的一组供应商;
计算欠账目被指定为不良的所述一组供应商的总金额,从而产生不良总额;
计算(a)所述不良总额与(b)所欠的所述总余额的比率,从而产生不良权重;以及
将所述不良权重作为自变量包括在所述数据集中。
15.根据权利要求11所述的存储器装置,
其中,所述指令还控制所述处理器,以将对所述描述符进行匹配产生所述匹配的对应时间保存至所述记录,以及
其中,为了统计所述信号的数量,所述处理器仅包括指示所述对应时间属于特定时间段的所述信号。
CN201480032283.6A 2013-05-02 2014-05-02 计算企业存在拖欠的概率 Pending CN105359172A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361818784P 2013-05-02 2013-05-02
US61/818,784 2013-05-02
US14/267,505 2014-05-01
US14/267,505 US20150142638A1 (en) 2013-05-02 2014-05-01 Calculating a probability of a business being delinquent
PCT/US2014/036491 WO2014179645A1 (en) 2013-05-02 2014-05-02 Calculating a probability of a business being delinquent

Publications (1)

Publication Number Publication Date
CN105359172A true CN105359172A (zh) 2016-02-24

Family

ID=51843963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480032283.6A Pending CN105359172A (zh) 2013-05-02 2014-05-02 计算企业存在拖欠的概率

Country Status (13)

Country Link
US (1) US20150142638A1 (zh)
EP (1) EP2992494A4 (zh)
JP (1) JP6251383B2 (zh)
KR (1) KR20160003262A (zh)
CN (1) CN105359172A (zh)
AU (1) AU2014259775A1 (zh)
CA (1) CA2910974A1 (zh)
HK (1) HK1220791A1 (zh)
PH (1) PH12015502484A1 (zh)
RU (1) RU2640633C2 (zh)
SG (1) SG11201508908SA (zh)
TW (1) TW201503029A (zh)
WO (1) WO2014179645A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112868217A (zh) * 2018-10-18 2021-05-28 西门子股份公司 自动处理数据标识符的方法、设备和计算机程序

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6098982B2 (ja) * 2015-08-31 2017-03-22 株式会社三菱総合研究所 情報処理装置及び情報処理方法
CN108230067A (zh) * 2016-12-14 2018-06-29 阿里巴巴集团控股有限公司 用户信用的评估方法和装置
US10937073B2 (en) * 2019-01-23 2021-03-02 Intuit Inc. Predicting delay in a process
JP2021140712A (ja) * 2020-02-29 2021-09-16 Assest株式会社 融資先信用度判定プログラム
US20220156666A1 (en) * 2020-11-19 2022-05-19 Fidelity Information Services, Llc Systems and methods for confidence interval transaction settlement range predictions

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274737A1 (en) * 2005-08-05 2010-10-28 Livermore George S Method and system for monitoring for and reporting of lien distress events
US20110029427A1 (en) * 2004-10-29 2011-02-03 American Express Travel Related Services Company, Inc. Credit score and scorecard development
US20120203708A1 (en) * 2007-11-14 2012-08-09 Psota James Ryan Using non-public shipper records to facilitate rating an entity based on public records of supply transactions
CN102782642A (zh) * 2010-01-29 2012-11-14 邓白氏公司 用于将职业关系数据与商用数据内容聚合和关联的系统和方法
US20120310798A1 (en) * 2011-06-06 2012-12-06 Carter Michael M Engine, system and method of providing cloud-based business valuation and associated services

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7310618B2 (en) * 2000-02-22 2007-12-18 Lehman Brothers Inc. Automated loan evaluation system
JP2002123665A (ja) * 2000-10-18 2002-04-26 Jnl:Kk 営業生産性向上支援システムおよび方法、記録媒体
JP2002236844A (ja) * 2001-02-09 2002-08-23 T & I Solution Co Ltd 事業所情報提供システム
CN101044499A (zh) * 2003-05-22 2007-09-26 珀欣投资有限责任公司 用于确定理想客户的评级系统和方法
US8700515B2 (en) * 2003-06-13 2014-04-15 Dun & Bradstreet, Inc. Security-to-entity crosswalk
US20070016501A1 (en) * 2004-10-29 2007-01-18 American Express Travel Related Services Co., Inc., A New York Corporation Using commercial share of wallet to rate business prospects
JP4937672B2 (ja) * 2006-08-15 2012-05-23 株式会社野村総合研究所 企業の信用力算出システム及び算出プログラム
US20080294547A1 (en) * 2007-05-24 2008-11-27 Jeremy Zigman Systems and methods for establishing business credit and improving personal credit
JP5149671B2 (ja) * 2008-03-31 2013-02-20 株式会社野村総合研究所 個別案件リスク管理装置
RU2469401C2 (ru) * 2010-03-11 2012-12-10 Общество с ограниченной ответственностью "Бизнес системы консалт" Система и способ управления кредитными портфелями
WO2012018968A1 (en) * 2010-08-06 2012-02-09 The Dun And Bradstreet Corporation Method and system for quantifying and rating default risk of business enterprises
US8712907B1 (en) * 2013-03-14 2014-04-29 Credibility Corp. Multi-dimensional credibility scoring

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110029427A1 (en) * 2004-10-29 2011-02-03 American Express Travel Related Services Company, Inc. Credit score and scorecard development
US20100274737A1 (en) * 2005-08-05 2010-10-28 Livermore George S Method and system for monitoring for and reporting of lien distress events
US20120203708A1 (en) * 2007-11-14 2012-08-09 Psota James Ryan Using non-public shipper records to facilitate rating an entity based on public records of supply transactions
CN102782642A (zh) * 2010-01-29 2012-11-14 邓白氏公司 用于将职业关系数据与商用数据内容聚合和关联的系统和方法
US20120310798A1 (en) * 2011-06-06 2012-12-06 Carter Michael M Engine, system and method of providing cloud-based business valuation and associated services

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112868217A (zh) * 2018-10-18 2021-05-28 西门子股份公司 自动处理数据标识符的方法、设备和计算机程序

Also Published As

Publication number Publication date
US20150142638A1 (en) 2015-05-21
AU2014259775A1 (en) 2015-12-17
JP6251383B2 (ja) 2017-12-20
EP2992494A1 (en) 2016-03-09
WO2014179645A1 (en) 2014-11-06
JP2016522933A (ja) 2016-08-04
EP2992494A4 (en) 2016-10-26
PH12015502484A1 (en) 2016-02-22
RU2640633C2 (ru) 2018-01-10
CA2910974A1 (en) 2014-11-06
TW201503029A (zh) 2015-01-16
KR20160003262A (ko) 2016-01-08
HK1220791A1 (zh) 2017-05-12
RU2015151628A (ru) 2017-06-07
SG11201508908SA (en) 2015-12-30

Similar Documents

Publication Publication Date Title
CN109063945B (zh) 一种基于价值评估体系的售电公司360度客户画像构建方法
CN105359172A (zh) 计算企业存在拖欠的概率
AU2014202660C1 (en) A system and method using multi-dimensional rating to determine an entity's future commercial viability
CN105446991A (zh) 数据存储方法、查询方法及设备
CN108389069A (zh) 基于随机森林和逻辑回归的优质客户识别方法及装置
CN108364191A (zh) 基于随机森林和逻辑回归的优质客户优化识别方法及装置
CN108154311A (zh) 基于随机森林和决策树的优质客户识别方法及装置
CN111062799A (zh) 家庭客户的管理方法、装置、电子设备及存储介质
CN110942392A (zh) 一种业务数据处理方法、装置、设备和介质
CN114372731B (zh) 基于大数据的岗位目标制定方法、装置,设备及存储介质
CN108140051B (zh) 基于全球检索的数据实时生成全球商业评级的全球联网系统
CN113450004A (zh) 电力信用报告生成方法、装置、电子设备及可读存储介质
CN110750302A (zh) 一种会计用流水线做账方法
CN115563176A (zh) 一种电子商务数据处理系统及方法
CN116308599A (zh) 基于产品标签与客户标签的理财产品智能推荐方法和装置
CN103325002A (zh) 数据分析支援装置及数据分析支援方法
CN112529712A (zh) 用户运营分析rfm的建模方法与系统
CN110544165A (zh) 一种信用风险评分卡创建方法、装置及电子设备
CN113284007B (zh) 基于电力保险套餐的用电信息处理系统及其处理方法
Hariram et al. Customer Segmentation Analysis leveraging Machine Learning Algorithms
KR20210112974A (ko) 시장 집중도를 이용한 브랜드 지수 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램
KR20240054860A (ko) 유통상품의 해외수출지원을 위한 무역 동향 지수 제공 방법 및 시스템
CN117726358A (zh) 用户信息处理方法和装置
CN117272147A (zh) 数据分类模型的训练方法、数据分类方法、装置及设备
CN115018575A (zh) 产品推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1220791

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160224

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1220791

Country of ref document: HK