本课程为高职高专大数据技术专业的必修课、专业核心课程,108学时,5.5学分。课程主要包括Spark概述与工作原理、Spark集群环境搭建、Spark Core、Spark SQL、Spark Streaming等Spark核心技术,通过教学逐步培养学生的专业认知能力、岗位核心能力、岗位扩展能力、岗位综合能力、工匠精神等职业素养。课程内容对接大数据开发工程师、数据分析师、华为大数据工程师认证、大数据分析与应用“1+x”证书等。 本课程核心内容主要有:Spark的、组成、特点及应用场景,Spark的运行架构与运行模式; Spark 在不同模式下的运行环境搭建;Spark Core核心数据集RDD及其创建、转换算子及行动算子的操作及使用、RDD文件操作、RDD实战演练;Spark SQL核心编程模型DataFrame的创建、数据查看操作、数据查询与数据输出操作、DataFram应用实战演练;Spark SQL 扩展编程模型 Dataset的原理及创建;Spark Streaming核心编程模型DStream的创建、转换、窗口及输出操作、DStream实战演练等。 本课程的前序课程主要有Linux操作系统、MySQL数据库、Java程序设计等,后续课程有数据挖掘基础、岗位实习等。
累计选课
人
选课学校
所
公众学习者所属学校
所
累计互动
次
累计浏览
12,834次
了解更多
老师您好!感谢您对本课的认可,请准确填写您的个人信息,
我们的运行服务专员会跟您联系,沟通选课事宜。
提交成功
我们的运行服务专员会在1-3个工作日内同您进行电话沟通,请保持手机畅通
请选择您的使用目的
该门课程当前学期未运行哦~
如您是为了自我提升请选择下方【去学习】按钮;如无【去学习】按钮则说明老师并未发布该课程的公开课,请选择其他课程
您当前身份为学生,仅老师可提交共享课选课申请。
该门课程未发布公开课,请选择其他课程~
该门课程为资源库课程,请去学堂选择【资源库课程】~
您当前选中的课程