Python机器学习

发布 : 2017-06-20 分类 : 大数据 浏览 :

机器学习分类

  • 监督学习:给模型一些带标签的数据集,如车的图片,机器收到反馈[每一步都收到反馈],哪些信息是正确的,哪些是错误的
    机器将标签和数据做映射,就能解决给定的任务,如:将图像中的汽车进行分类
  • 无监督学习:给模型一堆没有标签的数据集,机器没有获得正确与否的反馈,需要自我学习数据的结构解决给定的任务(大部分数据都没有标记且杂乱无章)[从头到尾都没有反馈]
  • 强化学习:模型并未立刻收到反馈,只有在达到目标时才收到反馈,例如创建一个强化学习机器人,让它学习下棋击败人类,它只会在它赢棋那一刻收到反馈[与环境互动、不断试错]

ML(Machine Learning)

常用算法

1
2
3
4
5
6
监督学习
分类:决策树、KNN、SVM、神经网络(Tensorflow)
回归:线性回归、非线性回归
非监督学习
K-Means聚类
KNN

交叉学科

1
2
3
(1).计算机(软件、硬件)、概率论、统计学、线代、高数、逼近论、凸分析、机械
(2).机器不再是通过规划行动,而是通过归纳、统计来进行结果改进
(3).机器不再需要外部明确的指示,而是通过经验和数据自动进行结果改进

AI核心

1
经验(大量数据)越多、结果越好[ML是建立在大数据之上的]

应用

1
2
3
4
5
6
7
8
9
10
11
12
13
语音识别
实时语音翻译/siri小冰
自然语言处理
google翻译
自动驾驶
计算机视觉
人脸识别
推荐系统
无人机
垃圾邮件识别
机器人

商业智能跟数据挖掘相关

深度学习

1
2
伴随着大数据和计算能力的提高(使用GPU)而产生的新的算法
NN模拟人类神经元的构造

基本概念

1
2
3
4
训练集(TraningSamples) 用来做训练的集合
测试集(TestSamples)
特征值(FeatureVector) 任何数据都有很多特征/属性(例如:直径、颜色)
目标概念(Label)

Markdown

1
2
3
4
5
得数据者得天下

宝马 VS 特斯拉(特斯拉拥有大量汽车行驶数据)

算法最终大家都有,但唯独数据不是
1
2
3
4
5
6
7
8
分类
目标概念为已知类别
回归
目标概念为连续值
监督学习(supervised learning)
样本有类别标记
无监督学习(unsupervised)
样本无类别标记
本文作者 : Matrix
原文链接 : https://matrixsparse.github.io/2017/06/20/Python机器学习/
版权声明 : 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

知识 & 情怀 | 二者兼得

微信扫一扫, 向我投食

微信扫一扫, 向我投食

支付宝扫一扫, 向我投食

支付宝扫一扫, 向我投食

留下足迹