1、关于两个基本概念,WOE即证据权重,主要是根据客户的好坏占比进行计算,通过变量公司得出WOE值,从而得出IV值也称为信息值。具体分析如图示。
2、对离散变量进行分箱,在离散变量取值较少的情况下,不需要对之进行处理。当离散变量取值较多时,为了管理方便,可以按照WOE值接近的原则,将离散变量分为若干类别。具体分析如图示。
3、变量分箱计算WOE,以年龄为例,具体的数据模型如图示。
4、[打开]数据编辑器软件,单击[文件]-[打开]-[打开数据],选择准备好的银行信用贷款数据,具体操作如图示。
5、选择相应的数据例,单击[分析