本课程是高等职业院校大数据技术专业的一门专业核心课,课程内容基于大数据运维工程师、大数据分析工程师等职业岗位能力要求,对接大数据平台运维等“1+x”证书、大数据应用开发技能大赛等能力要求。课程以企业真实项目“电商平台用户行为数据分析”的实施流程为主线贯穿所有知识点,通过该项目实战,使学习者掌握Hadoop大数据核心技术,包括Hadoop大数据平台部署、数据采集、离线数据仓库的设计与开发,最后对分析结果进行可视化展示。 本课程学习内容主要包括:Vmware、Xshell、IDEA等软件的安装配置;Hadoop分布式集群环境搭建; Flume、Kafka、Hive、Sqoop、Zookeeper等组件的基本工作原理、搭建及配置方法;使用Flume-Kafka-Flume架构实现数据采集;Sqoop数据迁移;Hive离线数据仓库的设计与开发;pyecharts数据可视化。 本课程的前序课程有Linux操作系统,MySQL数据库等,后续课程有数据采集与ETL、Spark大数据技术与应用等。 本课程的第二章也适用于云计算技术应用专业的学生学习。
累计选课
人
选课学校
所
公众学习者所属学校
所
累计互动
次
了解更多
老师您好!感谢您对本课的认可,请准确填写您的个人信息,
我们的运行服务专员会跟您联系,沟通选课事宜。
提交成功
我们的运行服务专员会在1-3个工作日内同您进行电话沟通,请保持手机畅通
请选择您的使用目的
该门课程当前学期未运行哦~
如您是为了自我提升请选择下方【去学习】按钮;如无【去学习】按钮则说明老师并未发布该课程的公开课,请选择其他课程
您当前身份为学生,仅老师可提交共享课选课申请。
该门课程未发布公开课,请选择其他课程~
该门课程为资源库课程,请去学堂选择【资源库课程】~
您当前选中的课程