課程將學習使用平行計算的數據分析工具,包含Apache Hadoop, Greenplum PostgreSQL, Apache Spark等,我們還將介紹一些常用的數據分析資料庫,如MADlib,MLlib的使用方法,使得學生能輕鬆駕馭大數據平行計算工具
黃杰森 老師
黃杰森老師為國立中山大學應用數學系教授,並兼任國立中山大學跨領域及數據科學研究中心主任。黃杰森老師於1998年畢業於美國普渡大學,專長為數值偏微分方程,平行計算。黃杰森老師熱衷網路教學,於2014年度獲教育部數位學習教材認證(微積分),並於ewant平台開設『MPI平行計算』課程。
第1周:分布式文件系统概论
第2周:MapReduce
第3周:MapReduce实例运用
第4周:回归分析 / 浅谈数据库
第5周:分布式数据库及其应用
第6周:Spark 分布式计算平台
第7周:R与Spark的实例介绍
第8周:期末报告
本課程共計8週,每週將提供視頻影片、隨堂測驗,另安排期末考報告,用以考核學習成果。
平時測驗(含作業):佔總成績35%
觀看影片成績:佔總成績35%
期末考:佔總成績30%
基礎程式設計,統計軟體R,基礎平行計算概念
1.https://static.googleusercontent.com/media/research.google.com/zh-TW//archive/gfs-sosp2003.pdf
2.https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
3.https://rstudio.com/
4.https://greenplum.org/
5.https://gpdb.docs.pivotal.io/520/install_guide/install_r_dslib.html
6.https://spark.apache.org/
7.https://spark.rstudio.com/
本課程證書費用:250元
如何申請證書?
1.點選右上方的「小白人」。
2.點選「證書下載」。
3.畫面即會轉到申請證書系統中,請點選「我要申請證書」。
4.點選「我要搜尋」開始申請證書。
詳細證書下載流程說明請點這裡