引言
很多年后,回想起今天努力學習新技能的自己,我會對自己說,“當初就是從一份免費課程開始,讓我抓住了這個時代的機會”。
- 基礎準備
數據分析培訓基礎免費學。
本章導覽在互動模式下效果更好一些,建議安裝好Anaconda并運行,效果更出色,你可以在網頁瀏覽器上運行。
如果你還沒裝Anaconda,可以到下面這個網站下載,如果你看不懂英文,可以用Chrome瀏覽器然后右鍵翻譯成中文,也可以拍照或截屏,發到微信里面,長按微信翻譯。
我來演示一下如何運行Jupyter Notebook,打開Anaconda點擊Jupyter就行。
Jupyter Notebook使用
嘗試在Jupyter里面新建一個Python3文件。
Jupyter新建python3
Jupyter notebook最實用的地方之一就是它的Tab每寫一行就可以運行一行。
Tab使用
鍵入以下內容:在下面的單元格中,在read_csv(按Shift+Tab,共4次,不要急,慢慢按,你會看到以下內容。
read_csv的完整文檔
第四次鍵入后,屏幕底部會彈出一個幫助窗口,里面有read_csv函數的完整文檔。
read_csv 完整文檔
我認為這套組合鍵非常實用,搞不定的時候,就多按按Shift+Tab吧,放心大膽的按,連續按12次也不會有什么壞結果的。
有小伙伴會問,完整文檔有什么用?完整文檔就像工具操作說明書,說明書都讀懂了,干活肯定得心應手。當然,你也不需要讀,我教你一個活學活用的方法。
找到張俊紅老師這本《對比Excel輕松學習python數據分析》電子版。
python數據分析
打開這本書,點開目錄,在目錄上端輸入文檔里那些詞,如“sep”,就是指明導入文檔時候用什
,就是指明導入文檔時候用什么分割符號。
搜索技巧的靈活使用
好了,再告訴一些常用命令。
pwd! ##這個是告訴你在哪個文件夾里面操作。
cd ##這個能讓你到你想去的文件夾。
ls ##這個顯示你此時所在的文件里面有哪些文件。
以上這些,你都試試吧!
- 編寫代碼
在Jupyter筆記本里面編寫代碼很常見,比如這些:
import pandas as pd ##這是調用python里面一個叫pandas的包,也是我們這一周重點學的內容。
pd.read_excel() ##這是用來打開某個excel表格的命令。可以嘗試剛學的shift?Tab鍵。連按四次看看。
def print_10_nums()
for i in range(10):
復制粘貼到你的Jupyter里面,看會發生什么。記得注意每個首字母的空格哦,一般是一
每個首字母的空格哦,一般是一個Tab,即四個空格
般是一個Tab,即四個空格。
我們試著打開大家在百度里面搜數據分析的數據(這個數據大家可以到相關后臺發送“數據一”獲取)。
import pandas as pd
pwd! ##先看一下我在哪個文件夾下面
ls ##看一下我的數據文件在不在這個文件夾下面,如果不在,cd到那個文件夾下面就行。
pd.read_csv(r"/Users/數據分析關鍵詞分析.csv")
顯示結果如下:
百度用戶對數據分析的搜索結果。
你看咱們是不是把一個csv文件打開了。你還可以試著打開Excel和txt文件。后面再教大家怎么分析,以及怎么獲取這些數據。
- 保存
最新的穩定版本里,Jupyter筆記本會自動保存,記得安裝最新的穩定版本就行了。
- 神奇的功能
Jupyter有各種奇妙的函數,我來舉個例子,比較一下使用%time將列表理解的sum()與生成器理解的sum()所產生的不同結果。
%time sum([x for x in range(10000)]) ##這是看計算機1
CPU times: user 616 µs, sys: 250 µ
µs, sys: 250 µs, total:
0 µs, total: 866 µs
l: 866 µs
Wall time: 871 µs
49995000
我最常用的分析函數是%time和%prun,你可以用%magic來獲取全部列表,%quickref來獲取參考表,鍵入%quickref來嘗試一下
%quickref
本篇的導覽結束啦,歡迎加入我們的社群免費學習服務,一周時間完全掌握pandas。進入同名后臺,回復“一周學會pandas”,然后掃碼識別助教名片,你就可以開始正式進入數據分析領域了! 這一周的學習完全免費,只要你保證每天學習打卡,無需你費任何力氣,就能完全學會數據分析。
如果你只想瀏覽一下,也可以試著后臺發送“ Jupyter Notebook”,看看會有什么收獲?






