好大学在线“IBM大数据大学”专区开通

近期,好大学在线开辟了“IBM大数据大学专区http://www.cnmooc.org/ibm,提供了近40门包括 HadoopSpark、数据分析、机器学习等各领域的高质量免费课程。所有课程按照数据分析师数据工程师数据科学家三个职业学习路径进行整编,并将通过好大学在线创立的进校园、给成绩、认学分的模式,为高校学生提供线上线下混合式教学服务。所有课程遵循“5-5-5”架构(即每门课程含5节讲座、每节讲座含5段视频、每段视频时长在5分钟左右),给学习者提供最具效率和灵活性的学习体验,真正地让基于实践且优质的大数据应用课程为师生所学所用。

如果你对大数据一无所知,《大数据基础-快速介绍》将满足你的一切好奇。它用自上而下和自下而上两种观点回答了以下问题:什么是大数据?我们如何对待大数据?为什么我们对它感兴趣?什么是大数据平台?这门课程的讲师Glen R.J. MulesIBM Information Management全球教育的高级讲师和首席顾问,曾经设计、编写和管理过曼哈顿和波士顿的银行系统。整个课程只需花费1.5小时。 

如果是具备一些基础知识的入门级选手,可以选择如Hadoop基础课程、Spark课程、Scala多范式编程语言课程、Watson Analytics课程等进行深入学习。所有课程均由具备大数据实战经验的IBM专家和教师授课。作为大数据分析的基础分布式系统架构,Hadoop可以让开发者充分利用集群的威力进行高速运算和存储。Hadoop 基础课程将为大学生提供系统的大数据分析及如何进行数据处理的原理讲解。与Hadoop相似,Spark是一种开源集群的计算环境。在本门课上,讲师会带领学生更好地了解Spark的基础构架,共同进一步探索大数据分布以及任务的并发执行,进一步了解Spark在做连接时是如何优化数据的,Spark的内存缓存机制,以及如何使用Spark高级API等。 

Scala
编程零基础的爱好者们不妨选择由资深咨询顾问Jamie Allen教授的Scala数据科学课程来入门,通过学习可以掌握扎实的编程语言基础,工具使用以及开发流程等高级功能。

而对于梦想成为销售或市场人员的大学生来说,Watson Analytics能够帮助他们实现最简便的数据分析与处理,使他们直观的看到数据分析结果,了解整体的销售情况,针对性地帮他们定位精准的业务渠道,采取适当的销售策略吸引潜在客户。由产品支持经理Jackie Ross讲授的Watson Analytics基础课程将有效地帮助学习者提高对数据的云端智能挖掘、分析、预测能力,教会人们如何使用大数据分析软件在众多纷繁的数据中在最短时间内获得最精准的结果和洞察。 

除此之外,IBM大数据大学还为所有学习者提供了一个免费的基于开源的一站式” 数据科学家集成工作台 https://datascientistworkbench.cn/。作为课程的一部分,该平台具有云端软件即服务(SaaS)”的特点,无需任何本地安装、配置和维护,只需一分钟的简单注册即可开始使用,非常利于未来的数据科学家快速、便捷的使用Jupyter/iPython notebookApache ZeppelinRStudio IDE以及OpenRefine等开源工具,并以一键式的企业级部署支持大规模的数据分析和计算。所有这些,将为学习者提供最佳的上机实战练习体验。

值得一提是,IBM大数据大学的以开源技术为主的数据科学系列课程正受到越来越多企业客户的青睐,短短一个月内,包括全球500强的知名银行以及国内保险公司,例如中美联泰大都会人寿保险公司、中国人寿保险(集团)公司、华泰保险集团等等已经或者正在其大数据团队的内训体系中引进这些课程,我们相信,人才供需两端的信息闭环的实现,将为学习者未来的就业提供良好的助力。

数据分析师 Data Analyst
数据分析师主要的工作是将枯燥的数字信息,转化成普通可以理解的语言。每个商业都会收集相关的业务数据,从销售数据,市场研究,物流组织到成本核算。一个数据分析师主要的工作是将收集到的数据进行分析,找出内在的信息,帮助企业进行业务决策。下面的学习路径中的核心课程,将帮助你快速掌握相关的核心知识体系,了解基本的方法学和思想,并最终可以进行高级算法的分析和最终结果的可视化。
Ÿ 每一个成功的分析师,都应该是数据分析挖掘方面的能手。Introduction to Data Analysis with Demos 课程很好的帮助你了解数据分析需要的基本技能,并通过案例演示,帮助你更好的理解数据分析的流程和管理。
Ÿ R是基于开源,被广泛应用于数据统计和数据科学的一门编程语言。Introduction to R  Introduction to Data Analysis using R 课程,就很好的帮助你解决数据分析中语言的难点,快速的掌握统计方法,通过有效的R语言编程,快速解决数据分析的问题。
Ÿ 数据科学对数据分析师来说是一门非常重要的学科,Data Science Methodology 作为一个数据科学方法论的入门课程,帮助数据分析师了解相关的基本理论,为数据分析工作建立完整的知识体系。
完成本系列的全部课程以及相配套的系列课程实践项目(即将发布)之后,可以获得由好大学在线颁发的官方系列课程证书。

数据工程师 Data Engineer
随着存储和大数据量处理的最新进展,越来越多的金融企业正在广泛使用大数据技术,以获得更深入地了解他们的商业风险和机遇。数据工程师负责开发,维护,测试和评估组织内部的大数据解决方案。因为他们具备Hadoop技术的经验,所以参与大部分解决方案的设计。一个数据工程师应该具备丰富的软件工程经验,然后才能比较顺利的进入大数据领域。一个大数据工程师需要建立大规模的数据处理系统,并且是数据仓库解决方案的专家,应该能够使用最新的NoSQL数据库技术。
Ÿ 通过学习Hadoop的基本面与大数据以及和MPP的概念来快速掌握大数据基本知识 (Hadoop Fundamentals I)
Ÿ 主要的编程范式的MapReduce的最严重的局限性主要与可扩展性,资源利用率,并从不同的MapReduce支持的工作负载。虽然Hadoop的被认为是一个可靠的,可扩展的,具有成本效益的解决方案,它连续被一个大型社区的开发人员提高。现在2.0版本提供了几个革命的功能,包括又一资源协调器. (MapReduce and YARN)
Ÿ 如果您正在使用Hadoop数据仓库Hive工具,它会让查询更容易,比写map / reduce程序更加有效的一个实用工具. (Accessing Hadoop Data Using Hive)
Ÿ 使用Hadoop,并通过shell命令数据交互以及使用像SqoopFlume工具. (Moving Data into Hadoop)
Ÿ 为了加强针对MapReduce的不建做分析处理性能,数据工程师可以利用Spark开源处理引擎,提供了内存集群计算。 (Spark Overview for Scala Analytics)
完成本系列的全部课程以及相配套的系列课程实践项目(即将发布)之后,可以获得由好大学在线颁发的官方系列课程证书。

数据科学家 Data Scientist
数据科学家在大数据发展中的角色变得日益重要,已经逐步成为大数据领域的核心。数据科学家应该有统计的经验和知识,以及编程,机器学习,数据改写/处理,数据可视化/通信和软件工程的知识。成为一个好的科学家,需要根据数据的重要组成部分,提出正确的问题,并能够分析和解决问题。数据科学家必须使用他们的技能来设计大数据的解决方案,利用各种合适的工具,持续的提供解决方案的深化,变革和升级。
Ÿ Spark是一个开源的集群计算框架,而相比于HadoopMapReduce,它更多的是利用内存中RDD的处理,加快应用程序的性能。执行迭代分析工作,并通过SparkAPI,很容易高效的整合各项基于Spark应用。 可以参考 Spark Fundamentals I  Spark Fundamentals II课程
Ÿ 许多应用程序(特别是金融)利用算法来预测未来结果的可能性。数据科学家使用预测建模来创建,测试和验证对于给定的应用程序是摄取该数据的模型。请参考课程 Predictive Modeling Fundamentals I
Ÿ 数据操作是任何人都与大数据工作的一项基本技能。维数降低是无监督机器学习技术,以减少在给定数据集中的特征的数量。 请参考课程 Machine Learning - Dimensionality Reduction
Ÿ 公开提供的信息量成倍增加。通过文本的深层次的分析,可以洞察出令人难以置信的信息! 请参考课程 Text Analytics Essentials  Text mining in action: Analyzing Twitter data for Democratic General Elections)
完成本系列的全部课程以及相配套的系列课程实践项目(即将发布)之后,可以获得由好大学在线颁发的官方系列课程证书。

 


Learning PathCore Course
数据分析师
Data Analyst
  • Introduction to R
  • Introduction to Data Analysis using R
  • Test Analytics Essentials
  • Introduction to Data Analysis with Demos
  • 大数据统计分析技术
  • 预测模型基础 Predictive Modeling Fundamental I
  • Watson Analytics 基础课程
数据工程师
Data Engineer
  • Big Data Fundamentals
  • Hadoop Fundamentals I
  • MapReduce and YARN
  • Introduction to Python
  • Python for Data Analysis
  • Introduction to Data Analysis using R
  • Spark Fundamentals I
  • Spark Fundamentals II
  • Introduction to Pig
  • Introduction to MapReduce Programming
数据科学家
Data Scientist
  • Big Data Fundamentals
  • Hadoop Fundamentals I
  • Data Science Methodology
  • Python for Data Analysis
  • Introduction to Machine Learning using Python
  • Introduction to Machine Learning using R
  • Machine Learning – Clustering
  • Advanced Classification and Prediction
  • Predictive Modeling Fundamental I
  • Machine Learning – Cluster Analysis
  • Machine Learning – Neural Networks
  • Machine Learning – Regression Analysis
  • Scala for Data Science