模型监控demo

  一个模型上线后,在实际生产中需要监控这个模型的稳定性的,一旦模型的产出出现异常,一点点的偏差就会带来极大的风险损失。
  以金融风险评分为例,我们需要定期按照新观察期的数据,去更新每个用户的信用评分。变量的分布的分析是必要的,通过多账期评分总体的分布对比。比如

  • 计算一些指标, 可以评价这个模型是否收到了当前业务的影响?
  • 在一定周期内是否可以保持稳定?
  • PSI是多少?
  • 申请了金融产品的客户的分数是否满足排序性?
  • 整体KS是多少?等等…

simple model monitor

  简易的监控定期更新的用户信用分及特征分布界面。

介绍

  以一个金融领域的用户信用分为例,我们需要定期按照新观察期的数据,去更新每个用户的信用评分。更新之后的评分和各变量的分布的分析是必要的,通过多账期评分总体的分布对比,计算一些指标,可以评价这个模型是否收到了当前业务的影响?在一定周期内是否可以保持稳定?PSI是多少?申请了金融产品的客户的分数是否满足排序性?整体KS是多少?等等…

特别说明:展示的数据为随机生成数据,库中附带生成伪数据的代码。

界面展示

  • 可选择不同的评分查看分布,下部分是特征的分布,可拖拽查看;

  • 可选择不同账期的同一评分进行对比,下部分是特征的分布对比,可拖拽查看对比;

技术栈

Python + Mysql + Flask + Ajax + Echarts

  • Flask
    flask是一个很轻的python web框架,上手很快,很适合小型的web应用;
  • Ajax
    用于处理前端单选、多选框与后台查询的异步数据传输;
  • Echarts
    百度提供的用于展示数据的js包,可以满足大部分数据分析和展示需求;
  • Mysql
    数据量不大,使用mysql存储;

第三方包

  • Python2.7(Flask相对更加兼容Python2.7,使用Python3.6的朋友可以适当修改代码)
  • numpy
  • pandas
  • flask
  • pymysql

使用

  • 安装本地mysql
    自行安装mysql数据库,默认代码使用scheme: test

  • 生成伪数据
    python save_fake_data.py
    运行结束后,数据库test中将出现两个新建的表,分别是 model_statistic 和 feature_statistic.
    表结构可以参见init.sql

  • 本地运行(调试)
    python model_monitor.py
    默认端口为9000,浏览器访问 127.0.0.1:9000

  • 局域网
    python server.py

博客主页

Lim的博客

实现代码

  详细内容及代码请跳转: 简易模型监控

0%