Storm分布式实时流式计算框架
1.离线计算是什么?
1 | 离线计算:批量获取数据.批量传输数据.周期性批量计算数据.数据展示 |
2.流式计算是什么?
1 | 流式计算:数据实时产生.数据实时传输.数据实时计算.实时展示 |
3.离线计算与实时计算的区别?
1 | 最大的区别:实时收集.实时计算.实时展示 |
4.Storm是什么?
1 | Flume:实时采集.低延迟 |
5.Storm与Hadoop的区别?
1 | Storm用于实时计算 ,Hadoop用于离线计算 |

1 | Job:任务名称 |
6.Storm应用场景及行业案例
1 | Storm用来实时计算源源不断产生的数据,如同流水线生产 |
6.1.运用场景
1 | 日志分析: |
6.2.典型案例
1 | 一淘-实时分析系统:实时分析用户的属性,并反馈给搜索引擎 |
7.Storm核心组件(重要)

1 | Nimbus:负责资源分配和任务调度 |
8.Storm编程模型(重要)

1 | Topology:Storm中运行的一个实时应用程序的名称。(拓扑) |
9.流式计算一般架构图(重要)

1 | 其中flume用来获取数据 |
本文作者 : Matrix
原文链接 : https://matrixsparse.github.io/2016/01/22/Storm分布式实时流式计算框架/
版权声明 : 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!
知识 & 情怀 | 二者兼得