1.该图片的路径为云端路径,并非本地路径。使用的数据集为Excel表中的数据,使用Proc Contents data=dt.response_model语句来查看数据集是什么样的,有多少个变量,变量类型,为接下来数据处理提供方向。
2.选择1-8行代码,单击【运行】,如图所示。
3.首先了解数据集里面响应的基本情况,使用Proc freq data=dt.response_model语句来检查 response情况分布大致是怎样的。
4.选择10-12行代码,单击【运行】,如图所示。
5.将数据集分为三个子集,一个用于建模,两个用于验证。选择17-19行,单击【运行】,如图所示。
6.三块数据标记,一块是建模数据集【Build】、【Inval】和【Outval】。一般情况下在做验证数据集和建模数据集的时候会希望建模数据集以外的数据集记录数的比例大约在73开的左右。