課程特色:
明星講師。諸多免費課程熱力遍布全網(wǎng),五星口碑爆棚;
規(guī)劃全面。涵蓋基礎(chǔ)知識、爬蟲采集、數(shù)據(jù)處理、可視化、數(shù)據(jù)建模,難得一見的Python體系全面數(shù)據(jù)科學(xué)課程,起步之路有高度;
精品質(zhì)量。課程設(shè)計環(huán)節(jié)緊湊,循循善誘;課堂教學(xué)如行云流水,讓人受益匪淺;
講師介紹:
丘祐瑋(David Chiu) – 大數(shù)軟件(LargitData)創(chuàng)辦人,是一位致力于提供輿情分析服務(wù)的創(chuàng)業(yè)者與數(shù)據(jù)科學(xué)家,熟悉Hadoop,Spark 等大數(shù)據(jù)平臺,及擅長使用R,Python與機器學(xué)習(xí)技術(shù)進行數(shù)據(jù)分析。曾任多家上市公司顧問及擔(dān)任知名大數(shù)據(jù)應(yīng)用程序競賽的評審,已編著MachineLearning With R Cookbook [Packt] 與 R Cookbook [Packt] 二書。
課程大綱:
第一章:Python與數(shù)據(jù)科學(xué)應(yīng)用
1.數(shù)據(jù)科學(xué)簡介與應(yīng)用
2.Python與數(shù)據(jù)科學(xué)
3.安裝Anaconda
4.使用Jupyter Notebook
5.Python 3語法快速簡介
6、Python 資料分析套件 – Pandas 簡介
7.數(shù)據(jù)科學(xué)步驟詳解
8.實戰(zhàn)范例 – 使用Python計算文章中的字詞頻率
第二章:數(shù)據(jù)搜集實例
1.數(shù)據(jù)型態(tài)
2.結(jié)構(gòu)化vs半結(jié)構(gòu)化vs非結(jié)構(gòu)化資料
3.Python IO與檔案處理
4.處理CSV, Excel格式資料
5.處理JSON, XML格式資料
6.撰寫網(wǎng)路爬蟲搜集網(wǎng)路資料
7.實戰(zhàn)范例 – 房天下(Fang.com)屋價資料搜集
第三章:資料清理(I)
1.資料清理概論
2.簡介Pandas –使用Pandas處理資料
3.資料篩選
4.偵測遺失值
5.補齊遺失值
6.實戰(zhàn)范例 – 房屋資料處理
第四章:資料清理(II)
1.資料轉(zhuǎn)換
2.處理時間格式資料
3.重塑資料
4.學(xué)習(xí)正規(guī)表達式
5.實戰(zhàn)范例 – 新聞資料處理
第五章:資料探索與資料視覺化
1.使用Pandas產(chǎn)生敘述性統(tǒng)計
2.如何使用Pandas繪制統(tǒng)計圖表
3.實戰(zhàn)范例 – 網(wǎng)頁瀏覽紀錄資料分析
第六章:資料儲存實例
1.關(guān)聯(lián)式資料庫– SQLite簡介
2.將資料儲存至資料庫中
3.使用SQL Query分析結(jié)構(gòu)化資料
4.實戰(zhàn)范例 – 匯率資訊儲存與管理
第七章:使用機器學(xué)習(xí)建立數(shù)據(jù)模型(回歸模型)
1.機器學(xué)習(xí)基礎(chǔ)
2.Scikit-Learn套件簡介
3.監(jiān)督式學(xué)習(xí)與非監(jiān)督式學(xué)習(xí)
4.回歸分析
5.回歸模型評估
6.實戰(zhàn)范例 – 使用回歸模型分析房屋價格
第八章:使用機器學(xué)習(xí)建立數(shù)據(jù)模型(分類模型)
1.資料分類–決策樹
2.資料分類– Logistic Regression
3.資料分類– SVM
4.資料分類–類神經(jīng)網(wǎng)路
5.資料分類–隨機森林
6.實戰(zhàn)范例 – 使用分類模型預(yù)測客戶流失
第九章:使用機器學(xué)習(xí)建立數(shù)據(jù)模型(驗證模型)
1.混淆矩陣(Confusion Matrix )與其意義
2.交叉驗證(Cross Validation)
3.使用ROC評估不同分類模型
4.實戰(zhàn)范例 – 評估不同客戶流失分析模型
第十章:使用機器學(xué)習(xí)建立數(shù)據(jù)模型(資料分群)
1.分群方法–階層式分群
2.分群方法– Kmeans分群
3.分群方法– DBScan分群
4.分群結(jié)果評估
5.實戰(zhàn)范例 – 利用分群找出文章主題
第十一章:使用機器學(xué)習(xí)建立數(shù)據(jù)模型(特征篩選與降低維度)
1.特征篩選(Feature Selection)
2.特征萃取-PCA
3.特征萃取-SVD
4.實戰(zhàn)范例 – 使用SVD 壓縮圖檔
第十二章:使用機器學(xué)習(xí)建立數(shù)據(jù)模型(關(guān)聯(lián)與頻繁樣式分析篇)
1.關(guān)聯(lián)分析(Association Rule)
2.頻繁樣式探勘(Frequent Pattern Mining)
3.實戰(zhàn)范例 – 購物籃分析實例