Lim的博客


  • 首页

  • 归档

  • 关于

  • 标签

感知机

发表于 2017-12-07

  感知机是二类分类的线性分类模型,输入为实力的特征向量,输出为实例的类别,是判别模型。感知机学习旨在求出将训练数据进行线性划分的分离超平面,是神经网络和支持向量机的基础。这是博主接触的第一个ml算法,至今还记得导师布置的用感知机提取红色印章的小作业。

阅读全文 »

近朱者赤k-nn

发表于 2017-12-05

  k近邻(k-nearest neighbor)是一种基本的分类和回归方法。分类时,对新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式进行预测。因此,k近邻法不具有显式的学习过程。
  k近邻实际上利用训练数据集对特征向量空间进行划分,并作为其分类的模型。

阅读全文 »

spark简单应用-单词统计

发表于 2017-12-02

  这里使用spark一个简单的单词统计,文本来源是spark预编译包里的README.md文档,虽然这是一个很小的文件,根本不需要使用spark。但是可以对rdd的操作有一个最基本的实践。

阅读全文 »

spark基础

发表于 2017-12-01

  我们身处于大数据的一个起步时代,作为一个码农,掌握大数据计算平台的使用还是必须的。Apache Spark作为近年来最流行的大数据开源项目,可以说是占据了大小互联网的生产环境,是一个“快如闪电的集群计算”工具。关于Spark的介绍我也不多说啦,可以看看官网Spark。这里需要说明的是,博主并没有阅读过Spark的源码,对Spark较多的是停留在应用层面。博主对Spark的应用主要是在公司的大小日常项目中,目前接触过的最大数据量的项目为联通集团的数据挖掘项目。
  博客的内容很多是给自己回顾所涉及的点,不是很完善。所述之处如有错误,还请及时指出。

阅读全文 »

朴素贝叶斯方法

发表于 2017-11-27

  朴素贝叶斯是基于贝叶斯定理和特征条件独立的分类方法,对于给定的训练集,基于特征条件独立假设,学习输入/输出的联合概率分布,然后基于此分布,对给定的$x$,利用贝叶斯定理求出后验概率最大的输出$y$。

阅读全文 »

RNN与LSTM

发表于 2017-11-22

  我们知道,人类思考的时候并不是从一片空白的大脑开始的(不像只有7秒记忆的鱼),而是会参考之前的经验和阅历。就像我们看悬疑片的时候,大脑会回溯之前的种种细节;阅读文章的时候,会基于对先前的理解来对文章主旨做出判断。 而这恰恰是传统的神经网络做不到的。地转轮回的RNN循环神经网络的出现解决了这个问题,它能记忆前时序的信息,其类似CNN的共享参数机制也是极大简化了网络的复杂性。由RNN进化的LSTM和GRU单元更是展现了神通广大的本领。

阅读全文 »

机器学习之优化问题

发表于 2017-11-20

  之前参加了《机器学习数学基石课程》,也是对毕业前学习的课程上做了些补充,这里回顾一下机器学习优化问题的知识点,很多内容来自课程PPT。

阅读全文 »
1…345
刘力铭

刘力铭

趣事之多 吾知甚少 学无止境 唯有努力

31 博文
13 标签
GitHub E-Mail
© 2018 Lim的博客
0%