机器学习算法复习手册——决策树

本手册整理自机器学习各相关书籍、网络资料、个人的理解与实践。总体编写宗旨:

①一看就懂;

②用20%的文字,涵盖80%的内容。

至于剩下的20%,一般属于比较偏、难的部分,建议自行查询相关书籍资料学习。

而只用20%的文字,则代表手册里面几乎没有废话,也只有极少数必要的例子。……

阅读更多

如何自己搭建一个机器学习框架?

过去半年,我们团队在机器学习平台上做过一些工作,因为最近看到几篇关于机器学习算法与工程方面的的文章,觉得十分有道理,萌发了总结一下这块的一些工作的念头,我最近工作主要分为两块:
1,机器学习框架的研发、机器学习平台的搭建;
2,基础NLP能力的业务支持。
本篇文章会总结下在机器学习框架这部分系统工作上的一些工作,主要也分为两部分:
1,经典框架的支持;
2,自研框架的工作;……

阅读更多

初露真容: 人工智能与机器学习

什么是人工智能?
对于人工智能的定义,学界一直有不同的表述。 在这里,我们采用一种被广 泛接受的说法:人工智能是通过机器来模拟人类认知能力的技术。……

阅读更多

AdaBoost:一个经典的自适应增强集成算法

AdaBoost(adaptive boosting)中文名叫自适应增强,它是一种能够自动根据前一个基模型对样本预测的误差率来调整样本权重,然后基于调整权重后的样本继续学习新的基模型,如此反复,直到基模型的个数达到设定的个数停止,最后将所有训练的基模型通过组合策略进行集成,得到最终的模型。……

阅读更多

机器学习算法—随机森林

随机森林是指利用多棵决策树对样本进行训练并预测的一种算法。也就是说随机森林算法是一个包含多个决策树的算法,其输出的类别是由个别决策树输出的类别的众树来决定的。……

阅读更多