Lim的博客


  • 首页

  • 归档

  • 关于

  • 标签

决策树

发表于 2018-01-03

  决策树是一种基本的分类与回归方法。在其分类问题中,表示基于特征对实例进行分类的过程,可以认为是if-else规则的集合,也可以认为是定义在特征空间与类空间上的条件分类。其主要优点是模型具有可读性、分类速度快。

阅读全文 »

信用评分卡的开发过程

发表于 2017-12-25

  这里介绍一下评分卡的开发的常规操作。它实际上是一个数据科学的课题,流程上有很多与机器学习实际问题相同的地方,但是它又具有其特别之处,如具有时间周期性,特征业务可解释性的需求等…让我们来认识一下吧!

阅读全文 »

初识pyTorch

发表于 2017-12-22

  PyTorch 由 Adam Paszke、Sam Gross 与 Soumith Chintala 等人牵头开发,其成员来自 Facebook FAIR 和其他多家实验室。它是一种 Python 优先的深度学习框架,在今年 1 月被开源,提供了两种高层面的功能:使用强大的 GPU 加速的 Tensor 计算(类似 numpy)构建于基于 tape 的 autograd 系统的深度神经网络。
  相比Tensorflow,博主认为pyTorch更加轻量级,接口更加友好,实现起来更快。这里是我学习官网教程后写的一些快速入门总结,欢迎参考。

阅读全文 »

LogisticRegression

发表于 2017-12-19

  logistic regression逻辑回归算法可以说是机器学习中十分常见和实用性极强的算法了。因为其参数的可解释性,逻辑回归在工业界中受到青睐。
  比如,在金融征信相关的模型中,我们需要明确解释某个变量在变化时,其最终信用的变化趋势。下面我们叫做业务可解释性。我们来回顾一下LR算法吧。

阅读全文 »

手写数字识别RNN版

发表于 2017-12-16

  接触过深度学习的同学对手写数字识别的任务并不陌生。它一个入门的阶段,是每位初学深度学习的同学的基本学习任务。任务的目标是建立一个分类模型,对0-9的黑白手写数字图片进行识别。
  以下内容是训练RNN模型,对测试集做预测,将图片的每一行作为一个time step,每一行的每一列作为一个时序step的特征。

阅读全文 »

Boosting提升方法

发表于 2017-12-13

  boosting提升算法是一种把若干个分类器整合为一个分类器的方法。在监督学习中,它可以很好的降低bias和variance。它将若干弱分类器组合成一个强分类器。可谓“三个臭皮匠,顶个诸葛亮”。

阅读全文 »

手写数字识别CNN版

发表于 2017-12-10

  接触过深度学习的同学对手写数字识别的任务并不陌生。它一个入门的阶段,是每位初学深度学习的同学的基本学习任务。任务的目标是建立一个分类模型,对0-9的黑白手写数字图片进行识别。
  以下内容是使用CNN对训练集做特征提取,然后最后一层使用逻辑回归做预测。

阅读全文 »
12345
刘力铭

刘力铭

趣事之多 吾知甚少 学无止境 唯有努力

31 博文
13 标签
GitHub E-Mail
© 2018 Lim的博客
0%