Pandas 教程:詳解如何使用該庫讀取 Excel 文件,需要具體代碼示例
Pandas 是一種常用的數(shù)據(jù)處理庫,具有很多強(qiáng)大的功能,尤其是在數(shù)據(jù)處理方面非常方便。在實(shí)際的數(shù)據(jù)處理過程中,經(jīng)常需要讀取 Excel 文件。本文將詳解如何使用 Pandas 庫讀取 Excel 文件,并提供具體的代碼示例。
- 導(dǎo)入 Pandas 庫
使用 Pandas 庫需要先導(dǎo)入該庫:
import pandas as pd
登錄后復(fù)制
其中,pd 是 Pandas 庫的別名,這樣可以更方便地使用 Pandas 的相關(guān)方法。
- 讀取 Excel 文件
使用 Pandas 讀取 Excel 文件非常方便,只需要一行代碼即可實(shí)現(xiàn):
data = pd.read_excel('file_name.xlsx')
登錄后復(fù)制
其中,file_name.xlsx 是 Excel 文件的名稱,該文件與 Python 腳本在同一個(gè)目錄下。
如果 Excel 文件不在同一個(gè)目錄下,則需要指定完整的路徑,例如:
data = pd.read_excel('C:/Users/username/Desktop/file_name.xlsx')
登錄后復(fù)制
讀取 Excel 文件后,可以通過以下方式查看文件中的數(shù)據(jù):
print(data.head())
登錄后復(fù)制
head() 方法可以查看 Excel 文件的前 5 行數(shù)據(jù)。如果需要查看更多行,可以將括號(hào)中的數(shù)字改為需要查看的行數(shù),例如:
print(data.head(10))
登錄后復(fù)制
- 指定需要讀取的 Excel 表格
當(dāng) Excel 文件中含有多個(gè)表格時(shí),需要指定需要讀取的表格,例如:
data = pd.read_excel('file_name.xlsx', sheet_name='Sheet1')
登錄后復(fù)制
其中,sheet_name 用于指定需要讀取的表格名稱。如果需要讀取多個(gè)表格,可以將 sheet_name 改為一個(gè)列表,例如:
data = pd.read_excel('file_name.xlsx', sheet_name=['Sheet1', 'Sheet2'])
登錄后復(fù)制
這樣可以將 Sheet1 和 Sheet2 兩個(gè)表格的數(shù)據(jù)一次性讀取出來,存儲(chǔ)在一個(gè)字典中。
- 讀取特定行或列
當(dāng) Excel 表格中數(shù)據(jù)較多時(shí),我們有時(shí)只需要讀取其中的一些行或列,可以使用 Pandas 的 loc 和 iloc 方法實(shí)現(xiàn):
loc 方法可以讀取指定的行或列數(shù)據(jù),實(shí)例如下:
data = pd.read_excel('file_name.xlsx')
# 讀取第 3 行數(shù)據(jù)
print(data.loc[2])
# 讀取名稱為 'column_name' 的列數(shù)據(jù)
print(data.loc[:, 'column_name'])
# 讀取第 3 行、名稱為 'column_name' 的數(shù)據(jù)
print(data.loc[2, 'column_name'])
登錄后復(fù)制
iloc 方法可以讀取指定的行或列數(shù)據(jù),不過需要使用整數(shù)的位置索引,實(shí)例如下:
data = pd.read_excel('file_name.xlsx')
# 讀取第 3 行數(shù)據(jù)
print(data.iloc[2])
# 讀取第 3 行、第 4 列數(shù)據(jù)
print(data.iloc[2, 3])
# 讀取第 2-4 行、第 1-3 列的數(shù)據(jù)
print(data.iloc[1:4, 0:3])
登錄后復(fù)制
- 讀取 Excel 文件中的列名
在讀取 Excel 文件的過程中,有時(shí)需要獲取 Excel 文件中的列名,可以使用如下方法:
data = pd.read_excel('file_name.xlsx')
# 讀取所有列名
print(data.columns.values)
# 讀取第 3 列的列名
print(data.columns.values[2])
登錄后復(fù)制
其中,columns.values 用于返回列名列表。在 Python 中,列表的索引從 0 開始。
- 將數(shù)據(jù)寫入 Excel 文件
除了讀取 Excel 文件外,Pandas 還提供了將數(shù)據(jù)寫入 Excel 文件的方法。實(shí)例如下:
data = pd.DataFrame({'姓名': ['張三', '李四', '王五'], '年齡': [18, 22, 25]})
# 將數(shù)據(jù)寫入名為 'MySheet' 的表格中
data.to_excel('file_name.xlsx', sheet_name='MySheet', index=False)
登錄后復(fù)制
其中,to_excel() 方法用于將數(shù)據(jù)寫入 Excel 文件,第一個(gè)參數(shù)為 Excel 文件名,第二個(gè)參數(shù)為要寫入的表格名稱,index=False 表示不需要寫入索引列。
- 結(jié)語
本文主要介紹了如何使用 Pandas 庫讀取 Excel 文件,并提供了具體的代碼示例。當(dāng)然,Pandas 還有很多其它的功能,在日常的數(shù)據(jù)處理中可以進(jìn)一步了解。






