决策树是一种基本的分类与回归方法。在其分类问题中,表示基于特征对实例进行分类的过程,可以认为是if-else规则的集合,也可以认为是定义在特征空间与类空间上的条件分类。其主要优点是模型具有可读性、分类速度快。
信用评分卡的开发过程
发表于
这里介绍一下评分卡的开发的常规操作。它实际上是一个数据科学的课题,流程上有很多与机器学习实际问题相同的地方,但是它又具有其特别之处,如具有时间周期性,特征业务可解释性的需求等…让我们来认识一下吧!
LogisticRegression
发表于
logistic regression逻辑回归算法可以说是机器学习中十分常见和实用性极强的算法了。因为其参数的可解释性,逻辑回归在工业界中受到青睐。
比如,在金融征信相关的模型中,我们需要明确解释某个变量在变化时,其最终信用的变化趋势。下面我们叫做业务可解释性。我们来回顾一下LR算法吧。
手写数字识别RNN版
发表于
接触过深度学习的同学对手写数字识别的任务并不陌生。它一个入门的阶段,是每位初学深度学习的同学的基本学习任务。任务的目标是建立一个分类模型,对0-9的黑白手写数字图片进行识别。
以下内容是训练RNN模型,对测试集做预测,将图片的每一行作为一个time step,每一行的每一列作为一个时序step的特征。
Boosting提升方法
发表于
boosting提升算法是一种把若干个分类器整合为一个分类器的方法。在监督学习中,它可以很好的降低bias和variance。它将若干弱分类器组合成一个强分类器。可谓“三个臭皮匠,顶个诸葛亮”。
手写数字识别CNN版
发表于
接触过深度学习的同学对手写数字识别的任务并不陌生。它一个入门的阶段,是每位初学深度学习的同学的基本学习任务。任务的目标是建立一个分类模型,对0-9的黑白手写数字图片进行识别。
以下内容是使用CNN对训练集做特征提取,然后最后一层使用逻辑回归做预测。