搜索
大数据spark数据清洗ETL项目
其他教程 2

视频:80 

大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节,大数据spark数据清洗ETL项目是一套完整的大数据的进阶教程,基于 hadoop 和spark大数据框架。
选择班级:
  • 课程介绍
  • 课程目录

课程介绍:

大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节,大数据spark数据清洗ETL项目是一套完整的大数据的进阶教程,基于 hadoop 和spark大数据框架。

本课程由浅入深带领大家一步步攻克 Hadoop大数据基础框架的各个模块,通过一个个实例带领大家了解分布式大数据平台的搭建过程,大数据的MapReduce编程规范、spark大数据分析引擎的使用等内容。


课程内容涵盖:

1. 大数据的学习总览

2. LINUX操作系统的安装与使用

3. Hadoop基础

4. HDFS分布式文件存储系统

5. MapReduce分布式计算框架

6. Hadoop生态系统:Spark


课程讲师:

程鹏

讲师

主讲老师
程鹏