数据化风控:信用评分建模教程(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-15 16:18:56

点击下载

作者:单良,乔杨

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

数据化风控:信用评分建模教程

数据化风控:信用评分建模教程试读:

※版权信息※书名:数据化风控:信用评分建模教程作者:单良,乔杨排版:skip出版社:电子工业出版社出版时间:2018-08-01ISBN:9787121346293本书由电子工业出版社授权北京当当科文电子商务有限公司制作与发行。— · 版权所有 侵权必究 · —第一章信用评分基础认识与应用

金融机构在高度市场竞争与业绩成长压力下,对风险管理的精准度与作业效率的要求越来越高。不管是申贷时还是审批后,每一位客户在不同的阶段都有不同的潜在风险,这些风险征兆可能存在于各种容易令人忽略的细节之中,一旦错失实时发现的先机,后续将造成难以弥补的损失。

早期银行的风险管理主要是以人工操作为主,客户的各种风险皆依赖于人员的经验判断。其中的问题是,风险因子众多且彼此交互极为复杂。一是有经验的人员需要长时间的培养;二是人毕竟不是机器,不但质量无法完全一致而且人工处理能量有限,难以大量作业。因此,必须借由计量方法在早期侦测客户潜在风险,以期减少人为主观判断的失误并减轻风险管理人员的负担。

关于客户个人风险的预测,目前使用最普遍的工具为信用评分卡,其应用的范围包括进件、贷后管理及催收等。不但可以筛选高风险客户,减少损失发生,也可以找出相对优质的客户群,发掘潜在机会。

从经营管理层面来看,信用评分的出现使科学化及自动化程度向前迈进了一大步,也大幅提升了银行竞争力。无疑,信用评分是近年来最受银行喜爱的风险管理工具之一,且使用范围日趋广泛。本章就信用评分的发展历史、种类、建立方法及运用加以介绍。第一节信用评分卡简介

信用评分的应用最早源自20世纪30年代,主要的概念是仿照有经验的风险分析专家设计信用判断条件,使授信质量一致。这种革命性的构想将风险量化技术应用在银行授信作业中,使信贷审批有了客观的依据,不再完全依赖于经验判断。在此阶段之前,判断条件是以资深授信人员及主管的经验制定,虽是集合所有专家的意见精华,但基本上还是经验给分,在选择风险因子及设定权重时即使反复摸索修改,也无法确定因子间的关系。到了20世纪50年代,回归分析等统计技术开始运用于信用评分,才将人类经验与数学实证进行了结合。

经过数十年的发展改良,再加上信息科技的进步——计算机现在可存储大量历史数据并可以轻易进行各种复杂运算,目前,信用评分已成为银行极为倚重的风险评估工具。

信用评分主要的功能可归纳为以下3项。

一、以科学方法将风险模式数据化

风险因子若未经量化处理,就是一种意象及概念,授信的判断若取决于“个人感觉”,固然弹性大,但风险判断的灰色地带必然无法缩小。信用评分以科学方法将风险量化,使得风险评估有所依据,从而弥补了上述缺憾。

信用评分建立于完整的历史数据之上,借由数据汇整、清理、分组及探勘等技术,将大量数据转化成为有用的风险信息。信用评分模型建立后,可将风险数据化。此时,可清楚地呈现客户违约概率及风险排序,使风险管理单位得以确切掌握客户风险,并且制定更为精准的授信政策。

二、提供客观风险量尺,减少主观判断

授信作业最大的挑战在于如何客观完整地将客户各种质化特性加以综合评断,并做出最合适的决定。例如,经验告诉授信人员男性客户的风险较女性客户的高,但若再加上年龄、职业、地区、收入和负债等分析维度,又会出现什么状况呢?面对不同的因子组合,授信人员要如何决定案件的准驳、额度及利率?

传统授信为人所诟病之处就在于过度依赖于个人经验。不可否认,过去的经验的确有一定的价值,不过影响客户行为的风险因子本来就极为复杂且难以掌控。人为的经验可能是从多次错误之中学习而来,可能是由资深人员传承而来,也有可能是由主观的直觉认定而来,但是经验的培养及传承皆非易事,此外,不同人员养成过程及环境未必相同,对各种案件的经验及认知也会不同,从而产生看法上的分歧。事实上,即使是同一授信人员在不同时期对同一案件可能也会有不同的审批决定。

信用评分提供了一个客观的风险量尺,消除了人为判断所造成的差异,使得风险评量有一致性的标准。

三、提高风险管理效率,节省人力成本

强大的处理效率也是信用评分的重要功能,以消费金融产品而言,其客户数量远远超过其他产品,为了迅速消化申请案件并有效管理往来客户,势必需要高度的自动化流程及系统协助,信用评分模型搭配评分计算引擎(Scoring Engine)可针对个别案件进行实时风险运算,也可以用批次方式处理大量数据,与传统人工审核方式相比,大大节省了处理时间。由于信用评分卡能事先将风险计算完成,所以中间灰色地带可大幅缩小。授信人员仅须将重心放在对这些灰色案件的处理上,不用为了配合不同的营销活动而增加人力。

另外,若银行拥有信用评分卡,就可针对现有客户进行定期或不定期的大规模期中复审,尤其是信用卡,因其客户数量庞大、产品生命周期长且风险为动态性质,风险因子多样且复杂,若无信用评分的协助,很难切实掌握客户的风险变化。以信用卡循环利率为例,目前各家银行都采用定价模式,信用评分可协助银行划分客户风险等级,以设计适合各等级的合理定价。

尽管信用评分有许多优点,为风险管理带来了许多的便利,但事实上,它并非完美,在使用时仍需注意一些限制。举例来说,数据库是信用评分的基础建设,建立评分模型之前须有完整且质量良好的历史数据,否则模型预测效力将会大打折扣。因此,必须先行建立完善的数据库,信用评分才能顺利开展。

再则,信用评分模型是以历史数据为基础,其准确性建立在未来的信用表现与过去相同的假设前提之上。一旦遭遇重大经济变动,假设不再成立,模型预测能力就会受到影响。在现实世界中,不可能期望所有状况永远固定不变,因此必须每月定期检测模型的准确性与偏离程度。

另外,信用评分的发展是以风险评量为出发点,为求主题明确,聚焦于风险因子的探讨,收益面并非考虑重点。因此,风险极低者未必是获利贡献度最高的客户。

需要特别提醒的是,信用评分模型以“户数”为单位计算好坏比(Good/Bad Odds),我们可借此得知各分数下可能倒账的户数比率,而一般评估风险所惯用的逾期比率则是以“金额”为计算单位,两者计算基础不同,户数倒账率与金额倒账率无法互相比较。

信用评分的应用领域广泛,为适应多样化的需求,也发展出不同种类的评分卡,以下就两种常用的分类方式进行介绍。(一)依发展母体区分

1.通用型评分(Generic Score)

这类评分多为顾问公司依据手中收集的资料所开发的评分卡。由于建立模型所需数据收集不易,且其定位为多用途信用评分,因此,未针对特殊主题或条件做个别考虑。

此种评分卡的优点是不需要从头开始发展模型,可节省开发成本,并可快速部署于风险管理流程中,但其精准度比其他类型信用评分卡略逊一筹。

2.征信机构评分(Bureau Score)

各国征信机构皆拥有庞大的客户信用数据,而由这些数据所建立起来的评分卡被称为Bureau Score。征信机构除拥有完整的数据之外,还有极高的公信力。对于未开发专属信用评分卡的中小型金融机构而言,Bureau Score具有很大的吸引力。由于它并非以特定金融机构的数据建立模型,因此也可视为通用型评分卡的一种。

3.客制化评分(Customized Score)

客制化评分也是完全依照各家金融机构的客户资料及特殊需求量身打造的评分卡。由于目标明确且针对性高,若历史数据完整且质量良好,其预测效果就会高于通用型及征信机构两种评分。其缺点为整体建立时间较长,初期开发成本较高,后续也需要自行负责模型监控与调校的工作。(二)依使用时机区分

1.申请评分(Application Score)

申请评分用于客户进件审核,信用评分模型所使用的变量除了申请资料数据之外,还包括联合征信中心的信用资料。在进件评分的协助下,授信人员可将重心放在界于准驳边缘的案件上。

2.行为评分(Behavior Score)

行为评分多用于预测信用卡客户的动态风险,评分模型的变量以客户的交易及缴款形态数据为主。由于动态行为的风险预测较为复杂,因此,行为评分模型所采用的变量通常比进件评分模型多。

3.催收评分(Collection Score)

催收评分多被使用于案件量较多的前段催收,许多人将其与上述两种信用评分卡合称为“ABC Cards(Application Scorecard,Behavior Scorecard& Collection Scorecard)”。其主要功能是预测客户还款概率,属于行为评分的延伸应用。第二节评分卡建立与验证

信用评分的建立并非仅限于单纯的模型开发,因为我们需要的不是统计专家的评分卡,也不是技术人员的评分卡,而是真正能够给予风险管理及营销业务实际帮助的整体方案。建立评分卡之前,风险管理单位必须就其对信用评分的期望、应用计划及策略提出项目规划,主要包括下列6项。

一、项目目标

陈述目前作业现状及想要以信用评分项目解决的问题。信用评分卡的建立需投入大量的时间、精神、金钱及人力,风险管理各单位人员只有仔细、反复思考目前的工作瓶颈和对信用评分的期望,目标设定必须清楚明确,这样,最后产出的结果才会对银行的风险管理有真正的帮助。

目标确认之后,若想要与外部信用评分卡厂商合作,就必须依照需求内容、开发时间、开发成本及开发经验与能力等方面设定选商条件并设定各项条件的评分权重。

二、项目范围

依急迫程度排列处理程序,避免因一次性处理太多问题,而模糊重要焦点。应针对选定目标设定项目范围,包括项目主要内容、涉及业务、相关部门、项目组织架构及成员等,且皆必须逐项确认并列示于计划书中。

若想要针对信用卡全新客户建立一张进件评分卡,一般多由授信政策部门担任项目管理人角色,涉及业务包括企划、业务推展、征审、作业、MIS和IT等,在需求讨论及项目规划时需共同会商,因此,上述部门皆应遴选资深人员担任项目成员。

三、时程规划

时程规划可分为银行内部前置规划、流程与系统修改、评分模型建立、效力测试及上线导入等几个重要阶段。项目长度依其复杂度及银行数据质量状况而定,一般为6~9个月。

四、成本效益分析

成本评估包括相关设备扩充、系统购置或修改和模型开发等费用。效益则分为质化与量化两方面,质化效益包括风险管理技术与观念的提升及授信质量稳定等,量化效益则需估算可节省的人力、作业时间及作业成本等。

五、配套措施

与信用评分相关的事项如授信规范、申请书格式修改、进件及征审流程设计、数据质量确认和教育训练等皆须事先规划,另外与之搭配的系统如评分运算引擎、决策系统及征审系统等也需在评分模型建立完成前准备就绪,否则,将出现空有评分模型却无使用平台或是业务流程运转不顺等窘境。

六、营运计划

信用模型上线之后的实际应用及管理,诸如信用评分的运用、模型效能监控、相关系统维护、紧急备援计划、营运作业成本(如JCIC查询预算)和MIS分析等作业皆需详细规划,以确保信用评分与风险管理业务整合之后能够顺利运行。

项目规划完成之后,方可展开评分模型的开发工作,此阶段可分为7个执行步骤(见图1-1)。图1-1 评分模型开发7步骤(一)步骤1:确定评分目的

此步骤是项目成败的关键,也是最容易被忽略的部分。发展评分模型前,必须先决定评分目的及想要预测的事件,并要有明确定义。模型未来的应用目的不同,对于变量选择或好坏客户的定义也可能不同。

风险管理单位依照先前项目规划设定的目标与模型建立人员进行讨论,以确认建立模型的目的。另外,双方对于项目进行方式、建立时程、成本、交付文件项目及格式、模型测试指针、项目验收标准、教育训练以及其他特殊要求或条件限制必须达成共识。

虽然需要讨论的事项繁多,往往需经过多次会议反复研商,但双方对于目标及项目内容的了解程度及共识越高,往后进行的过程就会越顺利。(二)步骤2:基本定义

在评分目的确认之后,紧接着对建模所需的重要指标的基本定义进行讨论。

1.观察期与表现期

如图1-2所示为观察期与表现期。图1-2 观察期与表现期

所谓的观察期,即为变量计算的历史期间,比如,有一变量为“近6个月延滞一期以上(M1+)的次数”,其观察期即等于6个月。观察期设定太长,可能无法反映近期状况,设定太短则稳定性不高,因此多半为6~24个月。

表现期则是准备预测的时间长度。例如,若欲预测客户未来12个月内出现违约的概率,则表现期等于12个月。依各种产品特性不同,表现期也可能不同,通常设定为12~24个月。

2.违约(Bad)定义

评分模型的任务在于区隔好坏客户(Good/Bad Account),因此,必须定义违约(Bad)的条件,这些条件并不限定为逾期,只要银行认定此情况为“非目标客户”。例如,未来一年内出现M2以上逾期、催收、呆账、强停、拒往和协商等,皆可作为评分模型中的违约条件。

3.不确定(Indeterminate)定义

在某些条件下的客户,其风险处于较为模糊的灰色地带,很难将其归类为好客户或坏客户。比如,“半年内曾出现一次M1”,由于此类客户并无鲜明的风险特征,很难判断其好坏。因此,为强化模型的区隔能力,不确定的客户不适合被纳入建模样本之中。不过在模型完成后可加入测试,观察其分数落点,理论上应以中等分数居多。

在实际应用中,可利用转移分析(Roll Rate Analysis)观察各条件下的客户经过一段时间后的表现,以评估违约定义的区隔能力与稳定度,作为其选择好坏及不确定条件的参考(见表1-1)。表1-1 转移分析(Roll Rate Analysis)

表1-1中B01至B04表示违约定义,I01至I03表示不确定定义,G01至G03表示正常定义。经过12个月的观察,原违约者大多数仍停留在违约状态,而原正常者转坏的概率也不高,这表示好坏客户的定义可被接受。不过原I03客户在12个月过后明显往正常方向移动,因此,可考虑将其改入正常定义群组。

4.评分范围

虽然信用评分可快速预测潜在风险,但并非所有状况都必须依赖评分来判断风险。例如,目前逾期中的客户,本身已出现违约的事实,因此不需要再加以评分。另外,如数据缺漏严重、数据期间过短和近来无信用往来记录者等状况的出现使这些客户的信息不足,对其评分也没有太大意义。

5.样本分组(Segmentation)

为了获得最佳的预测效果,工作人员通常会依客群或产品特性做样本分组,分别发展数张子评分卡。以信用卡的行为评分卡为例,预借现金、长期循环及全额缴清等几类客户行为各具特色,其风险变量及变量权重可能有所差异。因此,可考虑分别就这几类客户发展专属的子评分卡。

当然,若限于预算或时间,暂时无法细致分组而共享同一评分卡也不是不可以。权宜的做法是调整准驳临界点或是外加条件,不过其效果可能较差。

适度的样本分组有助于提高模型的预测效果,不过要避免过度使用。如果切割过细,不但后续子评分卡维护困难,且建模样本不足,反而影响模型的预测能力及稳定度。(三)步骤3:资料准备

建立模型的数据源有三个:一是申请资料及其所附文件,可由其了解客户最新的职业、财力等状况;二是内部数据,若客户为本行的既有客户,数据库中已有其各类基本数据与往来记录;三是外部信息,例如,联合征信中心等征信机构数据。其优点是网罗各家金融机构客户信用信息,数据齐全且可靠度高,缺点是银行必须预先编列查询预算,无法经常进行大规模的信用查询。

整个建模项目,最耗费时间的通常是数据整理阶段,对于数据质量特别要求以下5个要件。

1.正确性

正确性是对数据最基本的要求,否则,后续以其所做的任何分析及预测模型,可信度皆让人存疑。

2.完整性

此处所谓的完整性包括数据的广度、深度及长度。数据保留越完整,预测风险可用的变量选择性越高,预测的效果越好。

3.实时性

数据的新鲜度高,表示其对客户近况的掌握度也高。因此,实时更新的信息对风险预测有极大的帮助。

4.合法性

数据的取得必须合法。此外,在使用之前,必须确认当地法令对于授信准驳依据是否有特殊限制。某些国家不允许以性别及种族等因子作为准驳依据的条件。

5.可用性

对于各种来源的数据必须制订统一规格及定义,避免信息混乱。不合理的数据,如年龄过小或过大,应予以剔除。若遇缺漏值,则可利用平均数、中位数、极大值、极小值或其他指定值予以填补。在认为某些字段的缺漏值有其特殊意义时,也可直接保留空值。另外,各种数据的保留期限不一,或是某些数据需经特殊处理才能得到建模所需的格式等,诸如此类的数据限制皆需一一厘清。(四)步骤4:变量分析

变量的形态可分为连续变量(Continuous Variable)和离散变量(Discrete Variable)。若依其内容区分,则可分为个人资料变量、缴款类变量、负债类变量、信用往来长度变量和信用形态变量,而这些变量都可成为建立信用模型的材料。

首先,从手中拥有的数据中挑选或组合出可能影响风险的变量,这些一开始先挑出的变量群被称为长变量列表(Long List),由于数量较多,因此,必须先检查这些变量之间的相关性(Correlation)。若变量间存在高度相关性,之后只要依预测能力及稳定度择一保留即可。

接下来,进行单因子分析,以检视各变量的预测强度。表1-2所示为年收入变量的单因子分析。表1-2 年收入变量的单因子分析

表1-2一开始先依收入高低切分较细的组别(Fine Classing)。分组的原则为组间差异大,组内差异小。分组占率不宜低于5%,而各组中必须同时拥有好坏客户。

表1-2中的WOE称为迹象权数(Weight Of Evidence),计算公式为ln。违约件占率高于正常件时,迹象权数为负数。绝对值越高,表示该组别好坏客户的区隔程度越高。各组之间WOE值差距应尽可能拉开并呈现由低至高的合理趋势。

另一个重要指针为信息值(Information Value,IV),又称VOI(Value of Information),计算公式为(正常件占比-违约件占比)×迹象权数,其中,n表示数据的分组数,信息值可用来表示变量预测能力的强度。以本例来看,信息值等于0.422,表示年收入变量对于区别好坏客户的预测效果良好(见表1-3)。表1-3 信息值与预测能力解释对照

为了使信息值提高,需要调整合并迹象权数相近的组别,最后得到的分组结果称为粗分类(Coarse Classing)。待所有长列表的变量信息值都计算完成后,即可从中挑选变量,优先排除高度相关、趋势异常、解释不易及容易偏移者。经过筛选后的变量集合称为短变量列表(Short List),这个列表即为模型的候选变量。在建立模型时可利用顺向进入法(Forward Selection)、反向排除法(Backward Elimination)及逐步回归法(Stepwise)等方式选出效果最佳的变量组合。(五)步骤5:建立模型

理想中最佳的信用评分模型可将所有好坏客户完全划分清楚,只是在实际状况中坏客户的比率通常很低,无法凸显风险因子的特征。因此,在抽取建模样本时,会刻意将违约样本的比率拉高,好坏客户样本比率约为3:1~5:1。先将70%的样本列为开发样本(Development Sample)作为建模之用,再将另外30%的样本列为保留样本(Holdout Sample),在模型建立完成后作为验证之用。

信用评分的目的为预测客户是否将违约,因变量为二元性数据,也就是0与1的关系。线性回归所计算出来的条件概率估计值有可能会大于1或小于0,显然不合常理,而且自变量与因变量之间是固定的线性关系,也与现实生活中的情况不同。例如,年收入高者与极高者违约的概率已相差无几;同理,年收入很低与极低者的违约概率也很接近,差异较大者出现在中间地带。逻辑回归(Logistic Regression)处理二元化数据的线性较符合实际状况,因此也成为了普遍被采用的预测方式(见图1-3)。

逻辑回归可得到好坏比值的自然对数,即ln(Odds),其中Odds即表示好客户与核销户比值(好坏比),也称为胜算率。若要以分数形态呈现,必须要经过转换,其公式为Score = ln(Odds)×Scale + Location,转换步骤如下:图1-3 逻辑回归与线性回归(1)设定Odds = 1:1时的分数(假设为300分)(2)设定Odds每增加1倍时,相对增加的分数(假设为20分),此分数称为PDO(Point of Double Odds)(3)将Odds = 1:1及2:1时的分数套入公式,得到下列二式:

由式(1-1)可得

300 = ln(1)×Scale + Location

⇒Location = 300-ln(1)×Scale = 300

由式(1-2)-式(1-1)得

20 = ln(2)×Scale

⇒Scale =(4)最后得到的转换公式为,转换结果如表1-4所示。表1-4 信用评分与胜算率转换范例

上述分数转换方式可使不同评分卡的风险评量尺度统一,即同样分数下对应的违约概率皆相等。(六)步骤6:拒绝推论

拒绝推论多用于申请评分卡(Application Scorecard)。由于初步建立的模型所采用的样本皆来自核准案件,这些案件当初都已经过征审人员筛选,质量相对较好,因此,建模时若仅使用核准案件而把拒绝案件排除在外,将会造成模型的偏误。问题是案件遭银行拒绝后,事后无法观察其实际表现表现,也无从得知有哪些案件当时遭到误判,因此,必须借拒绝推论(Reject Inference)推测拒绝案件的好坏,以进行模型修正,使未来模型的预测更接近实际状况(见图1-4)。图1-4 拒绝案件进行模型修正

较常被使用的拒绝推论方法为扩充法(Augmentation),其概念是先以核准客户为样本建立初步模型,接着将拒绝案件套入该模型,以推测其好坏,再与原核准客户样本合并建立新的模型。下面介绍两种利用扩充法发展而来的拒绝推论。

1.单纯扩充法(Simple Augmentation)

拒绝客户以初步模型算出违约概率,讨论一个可容忍的临界点,以此决定客户的好坏。若违约概率小于临界点,则推论为好客户;反之,则推论为违约客户。

2.分组法(Parceling)

核准客户以初步模型的分数划分为10~20个分组,每个分组皆可算出其正常及违约比率,拒绝客户依初步模型算出违约概率并归类至各分组中,再以该分组的正常及违约比率随机分配拒绝客户的好坏属性(见表1-5)。表1-5 拒绝推论——分组法(Parceling)

假设申请案件共有1 000件,其中核准700户,拒绝300户。先将核准户依照初步模型评分高低分为10个分组,分别将各分组客户事后的好坏状况填入正常户(B)及违约户(C)字段中,并以此计算各分组的正常概率(D)及违约概率(E)。

拒绝案件依初步模型套算的好坏比(Odds),归类至对应的分组中,以分组6为例,被分类至此的拒绝户共计28户,此分组的正常率为94%,因此,可从28户中随机抽取94%(26户)假定其为正常户,剩余2户则假定为违约户。(七)步骤7:效力验证

模型建立完成后的验证可分为样本外验证(Out-of-Sample Validation)和时间外验证(Out-of-Time Validation),前者使用保留样本(Holdout Sample),后者则使用建模样本期间之外的案件以进行测试(见图1-5)。图1-5 样本外验证

除了测试样本外,模型效力评量指针也可分为区分度与稳定度两大类,以下将就这两类指标进行说明。

1.区分度指标

所谓的区分度指模型对好坏客户的辨识能力,区分度越强,表示模型准确性越高(见图1-6)。如果借由评分就可以精准地将好坏客户完全区分开来,那是理想上最好的模型,只可惜现实世界中无法做到百分之百的预测,虽然在绝大多数的状况下坏客户集中于低分区域,而好客户则集中于分数较高区域,但两者仍会有一定程度的重叠,建模人员所要努力的是尽可能将好坏客群的分数差距拉开。最糟糕的状况是完全无法显现风险排序效果,好坏客户的分配几乎一样。图1-6 客户评分最佳分布图1-6 客户评分最佳分布(续)

常用的区分度指标有K-S值(Kolmogrov-Smirnov)(见图1-7)及基尼系数(Gini Coefficient)。图1-7 检验图

K-S值主要是测量好坏分布的最大差距,因此,需先依分数分别画出好坏客户累计百分比线图,两者之间最大的差距值即为K-S值(见表1-6)。计算公式为MAX(| Bad%(累计)-Good%(累计)|),其值越大表示模型区分能力越强。表1-6 K-S值与解释能力关系表

另一个常用的区分度指标为基尼系数,分别以纵轴及横轴表示分数由高至低及好坏客户的累计百分比,用以显示各分数下好坏客户的累计差异(见图1-8)。图1-8 好坏客户累计百分比

图1-8中好坏客户累计百分比所画出的对应关系线称为洛伦茨曲线(Lorenz Curve),45°线表示完全无好坏区分能力的模型,两者之间的区域除以45°线以下面积即为基尼系数。与K-S值一样,其值越大表示模型区分能力越强(见表1-7)。表1-7 基尼系数与解释能力关系

2.稳定度指标

由于模型是由特定时期的样本所开发,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(Population Stability Index,PSI)是指可衡量测试样本及模型开发样本评分的分布差异,也是最常见的模型稳定度评估指标(见表1-8)。PSI计算公式如下:

式中,i为分数级距,n为分数级距数;

Ri%为保留样本于各分数级距下占率;

Bi%为模型开发样本于各分数级距下占率。表1-8 稳定度指标衡量

稳定度指标(PSI)的实际应用范例如下。(1)样本外测试。本例中保留样本与开发样本之间的PSI值仅0.08%,表示建模的样本并无偏误状况(见表1-9)。表1-9 建模开发样本与保留样本的PSI(2)时间外测试(见图1-9)。

测试基准日与建模基准日相隔越远,测试样本的风险特征与建模样本的差异可能越大,因此PSI值通常较高。以本例而言,测试基准日2距离建模基准日较远,故其PSI值较测试基准日1高。图1-9 建模基准日与不同评分基准日的PSI

以上介绍的各项指标不仅于建模时期用以验证模型效力,未来上线之后每月也需定期监控模型区分力及稳定度表现,如发现指标背离理想值,则需进一步了解各个变量是否出现异常。第三节评分应用

信用评分的应用范围广泛,包括申请准驳、进件额度决定、贷后额度管理、中途授信、复审作业、交易授权、风险定价、交叉销售及催收作业等。若搭配决策支持系统(Decision Support System,DSS),更能发挥其强大的效益。

由于评分较细,为求风险排序平滑及使用方便,通常会将其切分为10~20个风险等级(Aligned Risk Grade,ARG),将风险相近者归为一类(见表1-10)。表1-10 风险等级制与累计违约

风险等级制订完成后即可依据各等级所对应的累计核准率与累计违约概率决定临界点(Cut-Off Point)(见图1-10)。图1-10 决定临界点(Cut-Off Point)分析

图1-10以申请评分卡为例,若希望进件核准率在八成以上,临界点应设定在风险等级7,其对应的预期违约概率为3.9%。不过若银行可容忍的最高违约概率为3%的话,临界点应调整至风险等级9,其对应的核准率为72.6%。由此可知,若想提升核准率,必须承受更高的违约风险;反之,若欲压低违约率,势必牺牲案件的核准率。因此,评分临界点也可视为银行业务及风险的平衡点。

临界点的个数可分为单临界点、双临界点及多临界点,其中单临界点将客户一切为二,不是直接核准就是直接拒绝,此方式较为少见(见图1-11)。双临界点的概念为高临界点以上核准,低临界点以下拒绝,介于两临界点之间者则由人工进一步审核。

多临界点多与决策树结合,不同条件下搭配不同评分临界点,做出不同的决策。在使用多临界点时须注意勿加入过多风险条件,否则,将降低信用评分的影响力(见图1-12)。

任何预测模型皆因无法达到完美的境界,难免造成误判。因此遭到评分临界点直接拒绝的案件,事后应给予申覆机会,此类分数低于临界点的重判称为“低分重判”(Low-Side Override,LSO)。反之,某些案件虽然高于评分临界点,但因特殊原因将其拒绝,此状况称为“高分重判”(High-Side Override,HSO)。无论是低分重判还是高分重判皆需控制在一定比率之下,并且事后观察其表现表现。图1-11 单/双临界点范例图1-12 多临界点范例

若银行同时采用两张信用评分卡,可做交叉参考,两种评分皆高者,风险相对较低,但若两项评分皆不佳,则可推断其风险较高。其应用概念如图1-13所示。图1-13 内外信用评分使用策略

较常见的状况为银行同时采用内部信用评分及外部,如联合征信中心的评分,两者采用变量的考虑面向可能有所不同,因此,可产生互补的效果(见图1-14)。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载