大数据并行计算
教师: 黃杰森
2020/06/04

课程目标

課程將學習使用平行計算的數據分析工具,包含Apache Hadoop, Greenplum PostgreSQL, Apache Spark等,我們還將介紹一些常用的數據分析資料庫,如MADlibMLlib的使用方法,使得學生能輕鬆駕馭大數據平行計算工具


授课教师

黃杰森 老師

黃杰森老師為國立中山大學應用數學系教授,並兼任國立中山大學跨領域及數據科學研究中心主任。黃杰森老師於1998年畢業於美國普渡大學,專長為數值偏微分方程,平行計算。黃杰森老師熱衷網路教學,於2014年度獲教育部數位學習教材認證(微積分),並於ewant平台開設『MPI平行計算』課程。


课程进度表

第1周:分布式文件系统概论

第2周:MapReduce

第3周:MapReduce实例运用

第4周:回归分析 / 浅谈数据库

第5周:分布式数据库及其应用

第6周:Spark 分布式计算平台

第7周:R与Spark的实例介绍

第8周:期末报告

课程内容



上课形式

本課程共計8週,每週將提供視頻影片、隨堂測驗,另安排期末考報告,用以考核學習成果。

评分标准

平時測驗(含作業):佔總成績35%

觀看影片成績:佔總成績35%

期末考:佔總成績30%


通过标准


Course grade pass:60Grade Memo:max grade 100 point

先修科目或先备能力

基礎程式設計,統計軟體R,基礎平行計算概念


其它

本課程證書費用:250元

如何申請證書?

1.點選右上方的「小白人」。

2.點選「證書下載」。

3.畫面即會轉到申請證書系統中,請點選「我要申請證書」。

4.點選「我要搜尋」開始申請證書。

詳細證書下載流程說明請點這裡