Mahout介绍
1.Mahout概述
1 | Mahout是Apache software Foundation(ASF)旗下的一个开源项目 |
2.运行一个Mahout案例
1 | 1)运行Mahout自带的Kmeans算法,同时验证安装的Mahout是否能够正常运行。具体步骤如下: |
机器学习
1 | 机器学习理论主要是设计和分析一些让计算机可以自动学习的算法。 |
Mahout单机推荐程序
1 | M2eclipse插件 |
Mahout算法库
1 | 包括三大块(聚类.协同过滤.分类等算法) |
聚类算法:
1 | 聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法 |

分类算法:
1 | 分类(Categorization or Classification)就是按照某种标准给对象贴标签(label),在根据标签来区分归类 |

协同过滤
1 | 电子商务推荐系统的一种主要算法。如推荐系统 |

1 | 同现矩阵:本质:只是计算物品与物品之间相似度的计算方式 |
Kmeans介绍:
1 | 1.K-means算法是最早为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一 |
Kmeans聚类


1 | 应用: |
本文作者 : Matrix
原文链接 : https://matrixsparse.github.io/2016/01/20/Mahout/
版权声明 : 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!
知识 & 情怀 | 二者兼得