视频:80
No data
课程介绍:
大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节,大数据spark数据清洗ETL项目是一套完整的大数据的进阶教程,基于 hadoop 和spark大数据框架。
本课程由浅入深带领大家一步步攻克 Hadoop大数据基础框架的各个模块,通过一个个实例带领大家了解分布式大数据平台的搭建过程,大数据的MapReduce编程规范、spark大数据分析引擎的使用等内容。
课程内容涵盖:
1. 大数据的学习总览
2. LINUX操作系统的安装与使用
3. Hadoop基础
4. HDFS分布式文件存储系统
5. MapReduce分布式计算框架
6. Hadoop生态系统:Spark
课程讲师:
程鹏
讲师