作者:张伟
格式:pdf、epub、azw3
出版时间:2021年
内容提要:
这是一部系统讲解评分卡建模的智能风控著作,从业务与技术、理论与实践、传统风控与智能风控等角度透彻讲解评分卡建模的原理、流程、方法及其风控策略构建。 作者在智能风控领域深耕十余年,既熟悉商业银行传统风控体系思想、方法、技术、工具,又熟悉人工智能背景下的创新智能风控相关解决方案、风险策略和风险建模技术,本书是作者实践经验的系统性总结。 本书内容分为六部分。 第一部分(第1章)介绍评分卡建模基础知识,包括评分卡模型的概念和定义、评分卡建模全流程、评分卡模型的评价等。 第二部分(第2章)介绍银行零售信贷领域产品特征和业务流程,以及信用风险和欺诈风险概念,介绍评分卡的应用场景和业务基础知识。 第三部分(第3~11章)系统介绍评分卡建模的全流程,覆盖需求理解、数据理解、特征工程、模型设计、模型开发、模型验证、模型部署、模型监控、模型优化等模型全生命周期各环节。 第四部分(第12~14章)总结了评分卡建模的关键问题及其解决方案,包括拒绝推断、模型可解释性等,以及模型开发过程中诸如分布不均衡、模型性能下降、模型迭代漂移等问题。 第五部分(第15章)介绍了当前业界除评分卡外使用频率最高的高维机器学习技术,比较了传统评分卡模型和高维机器学习模型,并重点介绍了XGBoost和LightGBM模型。 第六部分(第16章)以贷前自动化审批场景为例,介绍基于评分的自动化审批策略构建,帮助读者理解评分卡模型在风险策略设计中的应用。
作者简介:
张伟(笔名:上善若愚)
金融科技公司技术合伙人、高级风控总监及解决方案专家,前FICO风险评分建模与风控业务策略专家。
在金融风险管理和智能风控领域有近15年工作经验,擅长业务策略、量化建模、解决方案、风控体系建设,专注于商业银行、消费金融和金融科技行业,在智能风控策略模型数据决策体系建设、风险业务架构和技术架构、信用风险业务策略与量化模型、信贷资产组合管理、金融资产定价与风险管理、业务安全技术、巴塞尔新资本协议等方面积累了丰富的工作经验。
曾作为技术专家或行业专家多次受邀出席上海市政府组织的行业产业联盟研讨调研座谈,多次受邀出席金融科技领域行业论坛并做主题演讲或圆桌讨论,多次接受主流金融科技媒体和财经媒体采访,并受聘为上海交通大学上海高金金融研究院研究员和华东理工大学商学院职业导师。
目录
序1
序2
序3
前言
为什么要写本书
读者对象
本书特色
如何阅读本书
勘误和支持
致谢
第1章 评分卡建模理论基础
1.1 评分卡建模常见面试问题
1.2 关于模型的系统性理解
1.3 与建模密切相关的4个领域
1.3.1 机器学习
1.3.2 数据挖掘
1.3.3 数据分析
1.3.4 统计分析
1.3.5 四者之间的联系与区别
1.4 评分模型与评分卡模型
1.4.1 评分模型和评分卡模型的定义
1.4.2 评分卡模型的分类
1.4.3 评分卡模型的适用性
1.4.4 评分卡模型的价值
1.4.5 评分卡模型的应用
1.5 评分卡建模全流程
1.6 对评分卡模型的评价
1.7 本章小结
第2章 零售信贷业务基础和风险管理
2.1 银行零售信贷产品的产品特征和业务流程
2.1.1 个人贷款
2.1.2 信用卡
2.2 信用与信用风险
2.2.1 信用风险识别
2.2.2 信用风险评估
2.2.3 信用风险监测
2.2.4 信用风险控制
2.2.5 征信
2.3 欺诈与欺诈风险
2.3.1 欺诈风险的分类
2.3.2 欺诈风险的防范
2.3.3 欺诈风险与信用风险比较
2.4 本章小结
第3章 业务需求理解
3.1 业务需求理解概述
3.2 明确拟解决问题和分析目标
3.3 业务访谈的设计和实施
3.4 整体分析方案设计
3.5 本章小结
第4章 数据基础决定模型效果上限
4.1 关于数据的系统性认识
4.1.1 数据基本特征
4.1.2 常见数据问题
4.2 传统信贷业务数据
4.2.1 贷款可用数据
4.2.2 信用卡可用数据
4.3 征信数据
4.3.1 征信数据概述
4.3.2 一代人行征信
4.3.3 二代人行征信
4.3.4 一、二代人行征信的差异及映射转换
4.3.5 人行征信数据的使用
4.4 内外部大数据
4.4.1 大数据概述
4.4.2 银行内部大数据
4.4.3 银行外部大数据
4.5 数据质量诊断
4.5.1 数据质量诊断目的
4.5.2 数据质量诊断方法
4.6 业务数据分析
4.6.1 业务数据分析目的
4.6.2 业务数据分析方法
4.7 本章小结
第5章 利用特征工程提取有效的风险特征
5.1 特征工程概述
5.1.1 特征与特征工程
5.1.2 数据处理与特征工程流程
5.1.3 特征工程的理论体系
5.1.4 特征工程的抽象范式
5.2 特征预处理与转换
5.2.1 常见数据质量问题
5.2.2 特征清洗与预处理
5.2.3 特征编码
5.2.4 特征转换
5.3 特征提取与生成
5.3.1 业务专家经验定义
5.3.2 工程化自动化衍生
5.3.3 表征学习
5.4 特征评价、选择与降维
5.4.1 特征评价
5.4.2 特征选择与降维
5.5 自动化特征工程技术与工具
5.5.1 自动化特征工程概述
5.5.2 自动化特征工程工具
5.6 本章小结
第6章 评分卡模型设计
6.1 模型设计概述
6.1.1 模型设计的定义
6.1.2 模型设计的工作内容
6.2 排除规则与样本范围
6.2.1 排除规则和样本范围的定义
6.2.2 申请评分卡模型排除规则
6.2.3 行为评分卡模型排除规则
6.2.4 催收评分卡模型排除规则
6.3 模型细分
6.4 表现期定义与Vintage分析
6.4.1 表现期定义
6.4.2 Vintage分析
6.5 滚动率
6.5.1 滚动率定义
6.5.2 滚动率分析
6.5.3 滚动率计算常见问题
6.6 观察期的定义与选择
6.6.1 观察期的定义
6.6.2 观察期的选择
6.7 模型设计汇总计数
6.7.1 汇总计数定义
6.7.2 汇总计数的特别说明
6.8 建模方式和模型原型选择
6.9 本章小结
第7章 评分卡模型开发
7.1 模型开发概述
7.2 样本分区
7.3 样本抽样
7.4 变量预筛选
7.5 变量分箱
7.6 变量再筛选
7.7 变量转换WOE
7.8 使用逻辑回归进行模型拟合
7.8.1 多重共线性检验
7.8.2 逻辑回归建模
7.8.3 模型训练结果
7.9 模型验证
7.9.1 排序性
7.9.2 区分能力
7.9.3 稳定性
7.9.4 分值集中度
7.9.5 分值分布
7.9.6 离散度
7.10 评分标尺
7.11 模型导出PMML并测试
7.12 评分卡建模专用Python包
7.12.1 scorecardpy工具包
7.12.2 toad工具包
7.12.3 RiskModeler工具包
7.13 评分卡建模实例
7.13.1 使用scorecardpy进行评分卡建模
7.13.2 使用toad进行评分卡建模
7.14 评分卡建模常见问题
7.15 本章小结
第8章 评分卡模型验证
8.1 模型验证概述
8.1.1 模型性能的影响因素
8.1.2 模型质量的评价
8.1.3 模型验证的目的
8.2 模型性能的技术性评价指标
8.2.1 分类模型
8.2.2 回归模型
8.3 模型验证方法
8.4 模型全面独立验证体系
8.4.1 模型全面独立验证与开发期验证
8.4.2 模型全面独立验证的内容和范围
8.4.3 模型全面独立验证的阶段划分
8.5 本章小结
第9章 评分卡模型部署
9.1 模型部署概述
9.2 模型部署工作流程
9.3 规则化部署方案
9.3.1 在信贷业务系统流程中硬编码
9.3.2 在独立通用决策引擎系统中部署
9.4 标准化部署方案
9.4.1 模型描述标准
9.4.2 导出模型文件
9.4.3 模型文件的解释执行
9.5 模型部署常见问题
9.6 本章小结
第10章 评分卡模型监控
10.1 模型监控概述
10.2 前端监控
10.2.1 总体评分分布
10.2.2 总体评分分布稳定性
10.2.3 总体平均分及偏移
10.2.4 总体分值集中度
10.2.5 变量取值分布
10.2.6 变量取值分布稳定性
10.2.7 变量加权平均分和偏移
10.3 后端监控
10.3.1 总体评分风险表现
10.3.2 总体评分区分能力指标
10.3.3 总体评分排序性
10.3.4 变量风险表现
10.3.5 变量区分能力指标
10.4 监控数据和特征
10.5 监控服务运行
10.6 本章小结
第11章 评分卡模型优化
11.1 模型优化概述
11.2 模型优化的触发条件
11.3 模型性能下降原因
11.4 判断是否需要优化
11.5 确定模型优化方案
11.6 优化调整对现有决策的影响
11.7 对基于评分的决策进行调整
11.8 本章小结
第12章 评分卡模型的拒绝推断
12.1 什么是拒绝推断
12.1.1 拒绝推断的过程
12.1.2 拒绝推断的合理假设
12.1.3 拒绝推断的本质
12.2 为什么要做拒绝推断
12.3 如何做拒绝推断
12.3.1 Fuzzy扩展法
12.3.2 简单扩展法
12.3.3 分段扩展法
12.3.4 拒绝推断的其他方法
12.4 拒绝推断应注意的问题
12.5 本章小结
第13章 评分卡模型的可解释性
13.1 模型可解释性
13.1.1 什么是模型可解释性
13.1.2 为什么模型需要可解释性
13.1.3 模型可解释性分类
13.1.4 模型可解释性算法
13.2 评分卡模型可解释性
13.2.1 全局可解释性
13.2.2 局部可解释性
13.2.3 业务特殊考虑
13.2.4 基于PMML Scorecard的可解释性
13.3 本章小结
第14章 评分卡模型的其他常见问题
14.1 分值分布不均衡问题
14.2 特定群体或局部分数段区分能力弱问题
14.3 训练-测试-时间外评分分布差异
14.4 训练-测试-时间外评分性能差异
14.5 模型迭代漂移现象
14.6 潜在建模作弊问题
14.7 本章小结
第15章 从传统评分卡模型到高维机器学习模型
15.1 传统评分卡模型和高维机器学习模型的结合
15.1.1 技术和业务发展背景
15.1.2 摒弃两种极端观点
15.1.3 传统评分卡模型与高维机器学习模型的比较
15.1.4 两种工具结合使用
15.2 高维机器学习模型XGBoost
15.2.1 XGBoost算法原理
15.2.2 XGBoost包简介
15.2.3 使用XGBoost包建立预测模型
15.3 高维机器学习模型LightGBM
15.3.1 LightGBM算法原理
15.3.2 LightGBM包简介
15.3.3 使用LightGBM包建立预测模型
15.4 本章小结
第16章 基于评分的风控策略应用
16.1 模型、规则、策略、政策
16.2 基于评分的贷前自动化审批策略
16.2.1 贷前审批环节需要解决的问题
16.2.2 线上信贷业务流程和风控流程
16.2.3 基于评分构建贷前审批策略
16.2.4 贷前审批策略经济效益测算
16.3 智能风控领域的更多策略
16.4 本章小结
智能风控评分卡建模原理方法与风控策略构建pdf下载