1.通用建模流程包括【问题确立】,【数据收集及处理】,【分析及信号发现】,【模型开发】,【模型评估】,【执行】具体如图所示。
2.【样本筛选】主要内容为【时间窗口选择】、【特定人群选择】。选择一部分人群进行建模,例如客户的目标群体。对样本进行时间窗口的限定,选取时间窗口既不能离时间太近也不能太远。
3.【数据清洗】主要内容为【缺失数据处理】、【上限/下限】、【检查数据分布】。检查数据分布是否和预期一致,若不一致采用合理方法进行调整。若值过大或过小时,应通过限制【上限/下限】进行解决。这样是为了使数据分布不至于分散。
4.【筛选变量】主要内容为【相关性分析】、【变量聚类】。在【筛选变量】过程中使用相关性分析判断每个变量是否和建模因变量有相关性。通过【变量聚类】的方法归结于一起,从而减少变量数量。
5.【建立模型】主要内容为【Step-Wise】、【模型结果解释】。在建模阶段会使用【Step-Wise】方法,逐步加入变量到模型中,从而寻找最理想的模型。