Pandas是Python第三方庫,提供高性能易用數據類型和分析工具,pandas 是基于NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。pandas提供了大量能使我們快速便捷地處理數據的函數和方法。
與numpy對比區別:

image
2.pandas庫怎么用
安裝
pip install pandas
導入
import pandas as pd
3.pandas兩個數據類型
兩個數據類型:Series, DataFrame
Series類型
Series類型由一組數據及與之相關的數據索引組成

image
第一列的0,1,2,3是自動索引,第二列是實際數據值,最后的dtype表示數據類型

image
Series類型數據的常見創建方式
python列表

image
標量值

image
python字典

image
ndarray

image
Series類型數據的基本操作
獲得索引和數據

image
更改索引

image
索引

image
切片

image
DataFrame類型
DataFrame類型由共用相同索引的一組列組成,是一個表格型的數據類型,每列值類型可以不同,既有行索引、也有列索引,常用于表達二維數據。

image

image
DataFrame類型數據的常見創建方式
二維ndarray對象

image
一維ndarray、列表、字典、元組或Series構成的字典

image

image

image
DataFrame類型數據的基本操作
獲得行列索引和數據

image
更改行列索引

image
選擇數據
索引切片獲取列數據和單個數據

image
索引切片獲取行數據

image
iloc():按照索引的位置來選取,這里要注意這種方式是包含切片的末尾的數據的

image
loc():按照索引index的值選取,如果沒有自定義值,行數據也可以通過切片獲取。

image

image

image
4.查看數據

imag數據分析-pandas庫快速了解e
5.文件數據讀取和保存
保存

image
讀取
這里多了一列數據是因為上面寫入時把索引寫入了,可以再寫入時去掉index,to_csv(file,index=False)

image
限于篇幅原因,還有更多內容(空值處理,分組,合并,排序,刪除等),這個會在后面的具體場景中應用。