課程將學習使用平行計算的數據分析工具,包含Apache Hadoop, Greenplum PostgreSQL, Apache Spark等,我們還將介紹一些常用的數據分析資料庫,如MADlib,MLlib的使用方法,使得學生能輕鬆駕馭大數據平行計算工具
黃杰森 老師
黃杰森老師為國立中山大學應用數學系教授,並兼任國立中山大學跨領域及數據科學研究中心主任。黃杰森老師於1998年畢業於美國普渡大學,專長為數值偏微分方程,平行計算。黃杰森老師熱衷網路教學,於2014年度獲教育部數位學習教材認證(微積分),並於ewant平台開設『MPI平行計算』課程。
第1週:分散式檔案系統概論
第2週:MapReduce
第3週:MapReduce實例運用
第4週:迴歸分析 / 淺談資料庫
第5週:分散式資料庫及其應用
第6週:Spark 分散式計算平臺
第7週:R與Spark的實例介紹
第8週:期末報告
本課程共計8週,每週將提供視頻影片、隨堂測驗,另安排期末考報告,用以考核學習成果。
平時測驗(含作業):佔總成績35%
觀看影片成績:佔總成績35%
期末考:佔總成績30%
基礎程式設計,統計軟體R,基礎平行計算概念
1.https://static.googleusercontent.com/media/research.google.com/zh-TW//archive/gfs-sosp2003.pdf
2.https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
3.https://rstudio.com/
4.https://greenplum.org/
5.https://gpdb.docs.pivotal.io/520/install_guide/install_r_dslib.html
6.https://spark.apache.org/
7.https://spark.rstudio.com/
本課程證書費用:250元
如何申請證書?
1.點選右上方的「小白人」。
2.點選「證書下載」。
3.畫面即會轉到申請證書系統中,請點選「我要申請證書」。
4.點選「我要搜尋」開始申請證書。
詳細證書下載流程說明請點這裡