網站首頁 編程語言 正文
1.索引是什么
1.1 認識索引
先創建一個簡單的DataFrame。
myList = [['a', 10, 1.1],
['b', 20, 2.2],
['c', 30, 3.3],
['d', 40, 4.4]]
df1 = pd.DataFrame(data = myList)
print(df1)
--------------------------------
[out]:
0 1 2
0 a 10 1.1
1 b 20 2.2
2 c 30 3.3
3 d 40 4.4
DataFrame中有兩種索引:
- 行索引(index):對應最左邊那一豎列
- 列索引(columns):對應最上面那一橫行
兩種索引默認均為從0開始的自增整數。
# 輸出行索引
print(df1.index)
[out]:
RangeIndex(start=0, stop=4, step=1)
---------------------------------------
# 輸出列索引
print(df1.columns)
[out]:
RangeIndex(start=0, stop=3, step=1)
---------------------------------------
# 輸出所有的值
print(df1.values)
[out]:
array([['a', 10, 1.1],
['b', 20, 2.2],
['c', 30, 3.3],
['d', 40, 4.4]], dtype=object)
1.2 自定義索引
可以使用 index 這個參數指定行索引,columns 這個參數指定列索引。
df2 = pd.DataFrame(myList,
index = ['one', 'two', 'three', 'four'],
columns = ['char', 'int', 'float'])
print(df2)
-----------------------------------------------------------
[out]:
char int float
one a 10 1.1
two b 20 2.2
three c 30 3.3
four d 40 4.4
輸出此時的行索引和列索引:
# 輸出行索引
print(df2.index)
[out]:
Index(['one', 'two', 'three', 'four'], dtype='object')
--------------------------------------------------------
# 輸出列索引
print(df2.columns)
[out]:
Index(['char', 'int', 'float'], dtype='object')
2. 索引的簡單使用
2.1 列索引
選擇一列:
print(df2['char'])
print(df2.char)
# 兩種方式輸出一樣
[out]:
one a
two b
three c
four d
Name: char, dtype: object
注意此時方括號里面只傳入一個字符串’char’,這樣選出來的一列,結果的類型為Series
print(df2['char'])
print(df2.char)
# 兩種方式輸出一樣
[out]:
one a
two b
three c
four d
Name: char, dtype: object
選擇多列:
print(df2[['char', 'int']])
[out]:
char int
one a 10
two b 20
three c 30
four d 40
注意此時方括號里面傳入一個列表 [‘char’, ‘int’],選出的結果類型為 DataFrame。
如果只想選出來一列,卻想返回 DataFrame 類型怎么辦?
print(df2[['char']])
[out]:
char
one a
two b
three c
four d
---------------------------------------
type(df2[['char']])
[out]:pandas.core.frame.DataFrame
注意直接使用df2[0]取某一列會報錯,除非columns是由下標索引組成的,比如df1那個樣子,df1[0]就不會報錯。
print(df1[0])
[out]:
0 a
1 b
2 c
3 d
Name: 0, dtype: object
-----------------------
print(df2[0])
[out]:
KeyError: 0
2.2 行索引
2.2.1 使用[ ]
區別于選取列,此種方式[ ]中不再單獨的傳入一個字符串,而是需要使用冒號切片。
選取行標簽從 ’two’ 到 ’three’ 的多行數據
print(df2['two': 'three'])
[out]:
char int float
two b 20 2.2
three c 30 3.3
選取行標簽為’two’這一行數據
# 此時返回的類型為DataFrame
print(df2['two': 'two'])
[out]:
char int float
two b 20 2.2
在[ ]中不僅可以傳入行標簽,還可以傳入行的編號。
選取從第1行到第3行的數據(編號從0開始)
print(df2[1:4])
[out]:
char int float
two b 20 2.2
three c 30 3.3
four d 40 4.4
可以看到選取的數據是不包含方括號最右側的編號所對應的數據的。
選取第1行的數據
print(df2[1:2])
[out]:
char int float
two b 20 2.2
2.2.2 使用.loc()和.iloc()
區別就是.loc()是根據行索引和列索引的值來選取數據,而.iloc()是根據從0開始的下標位置來進行索引的。
選取行:
使用.loc()
print(df2.loc['one'])
[out]:
char a
int 10
float 1.1
Name: one, dtype: object
-------------------------------------------
print(df2.loc[['one', 'three']])
[out]:
char int float
one a 10 1.1
three c 30 3.3
使用.iloc()
print(df2.iloc[0])
[out]:
char a
int 10
float 1.1
Name: one, dtype: object
-------------------------------------------
print(df2.iloc[[0, 2]])
[out]:
char int float
one a 10 1.1
three c 30 3.3
原文鏈接:https://blog.csdn.net/weixin_46713695/article/details/125959391
相關推薦
- 2022-11-13 Error: EACCES: permission denied, access '/usr/loc
- 2022-10-06 C++?pimpl機制詳細講解_C 語言
- 2022-04-03 .NET?Core配置連接字符串和獲取數據庫上下文實例_實用技巧
- 2023-04-07 React?Fiber構建源碼解析_React
- 2022-09-29 shell函數內調用另一個函數(不帶返回值和帶返回值)_linux shell
- 2022-04-23 如何在vs-code 中進行debugger調試
- 2023-07-25 mongodb本地連接失敗解決方案
- 2022-03-27 .NET?Core利用動態代理實現AOP(面向切面編程)_實用技巧
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支