大数据云计算培训内容:
01 大数据入门基础课程
1.JavaSE
2.MySQL
3.JDBC
4.Linux
5.shell
6.HTML
7.CSS
8.JavaScript
9.JSP
10.Servlet
02 大数据Hadoop基础
1.大数据概论
2.Hadoop框架
3.HDFS分布式文件系统
4.MapReduce计算模型
5.全真实训项目
03 大数据离线分析
1.Hive数据仓库
2.Sqoop ETL工具
3.Azkaban工作流引擎
4.Ooize
5.Impala
6.全真实训项目
04 大数据实时计算
1.Zookeeper分布式协调系统
2.HBase分布式数据库
3.Redis数据库
4.mogDB数据库
5.Kudu列式存储系统
6.Storm实时数据处理平台
7.Kafka分布式发布订阅消息系统
8.Flume海量日志采集系统
9.全真实训综合项目
05 Spark数据计算
1.Scala
2.Spark
3RDD
4.Spark SQL
5. Streaming
6. Mahout
7.MLlib
8.GraphX
9.Spark R
10.Python
11.Alluxio
12.Python爬虫
13.ElasticSearch
14.Lucene
Hadoop基础实战 大数据离线实战 大数据实时计算 Spark阶段项目
大数据离线实战项目
项目名称:新浪微博数据分析系统
日均数据体量:3GB+
硬件环境:Hadoop集群 50台
软件环境:MapReduce+HBase0.98.9+Storm0.9.6+Hadoop2.5.2+Kafka2.10+Zooke
eper3.4.5+CentOS-6.5-X86
项目描述:
此次项目我们需要处理微博产生的数据,通过对数据的处理得到所需的数据,微博拥有大量的用户,大量的用户潜在的价值是巨大,怎么挖掘这些潜在的宝藏就是我们项目直接的目的,为了能够实时的进行数据处理使用Storm流式计算系统,和HBase、Zookeeper、Kafka组成框架,对数据进行处理,当然这些都是建立在hadoop集群上实现的,底层的存储还是HDFS。
大数据课程优势
1. 来自清华、北大、北航的实战讲师和上市企业的骨灰级比较厉害授课……
2. 根据企业需求设计课程,并且定期更新,引入新技术……
3. 配备了价值上百万的开发服务器,可实时感受分布式开发和云计算等……
4. 16小时老师全程陪伴,不怕学不会……
5. 线上线下结合,可以无缝衔接……
6. 学员管理以人为本,不忘初心,致力培养眼界高、技术牛、做人好的职场员工。
更多培训课程,学习资讯,课程优惠等学校信息,请进入 重庆万州区IT培训重庆涪陵区php培训重庆渝中区java培训 网站详细了解,免费咨询电话:400-998-6158