大数据对数据分析提出了更高的要求,通过数据预处理与特征工程获得高质量的数据成为数据科学中的重要任务。本课程较为完整地涵盖了数据预处理和特征工程的主要内容,包含“数据集成”、“数据清理”、“数据变换”和“数据归约”四个版块。课程中贯穿了数据科学思维,特别体现了统计学的一些重要思想。课程聚焦于经典且常用的方法,注重方法原理的引介,并结合案例数据和Python代码实现各方法。 请注意,学习本课程需要一定的高等数学和概率论与数理统计基础。部分章节涉及决策树、随机森林等机器学习算法,若具备一定的机器学习基础更好。
累计选课
人
选课学校
所
公众学习者所属学校
所
累计互动
次
了解更多
老师您好!感谢您对本课的认可,请准确填写您的个人信息,
我们的运行服务专员会跟您联系,沟通选课事宜。
提交成功
我们的运行服务专员会在1-3个工作日内同您进行电话沟通,请保持手机畅通
请选择您的使用目的
该门课程当前学期未运行哦~
如您是为了自我提升请选择下方【去学习】按钮;如无【去学习】按钮则说明老师并未发布该课程的公开课,请选择其他课程
您当前身份为学生,仅老师可提交共享课选课申请。
该门课程未发布公开课,请选择其他课程~
该门课程为资源库课程,请去学堂选择【资源库课程】~
您当前选中的课程