網站首頁 編程語言 正文
前言
為了介紹python語言中pandas庫在數據分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021賽季常規賽個人數據為例對pandas相關函數進行詳細說明。利用爬蟲技術,在知名籃球網站虎撲爬取了勒布朗詹姆斯的數據,稍后會將數據上傳至csdn,以供大家下載。
這篇文章,詳細介紹了pandas字符串分割函數---str.split()的用法。
DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默認為空格。
n:用于指定需要分割的次數,默認為-1。其中,None,0和-1都被解釋為返回所有分割的字符串。
expand:將拆分的字符串展開為單獨的列,默認為False。????????????????True:返回DataFrame / MultiIndex;
? ? ? ??????????False:返回包含字符串列表的Series / Index。
1、常規賽數據格式
勒布朗詹姆斯2020-2021賽季常規賽個人數據的數據結構如下:
日期 | 對手 | 比分 | 時間 | 投籃 | ... |
05/17 | 鵜鶘 | 110-98(勝) | 27 | 11-22 | ... |
05/16 | 步行者 | 122-115(勝) | 28 | 11-22 | ... |
... | ... | ... | ... | ... | ... |
2、計算詹姆斯常規賽命中率
勒布朗詹姆斯2020-2021賽季常規賽個人數據中只有每場比賽的命中率,數據的第4列為每場比賽的投籃數和命中數,格式為"命中數-投籃數"。如果想要計算詹姆斯整個常規賽的命中率,則需要算出他常規賽的投籃數和命中數。此時,需要用到pandas分割字符串函數str.split()。
import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投籃'].str.split("-",expand=True)
df0.columns = ['命中數','投籃數']
DataFrame類型的df0即為詹姆斯常規賽的命中數和投籃數,如下所示:
0 | 命中數 | 投籃數 |
1 | 11 | 22 |
2 | 11 | 22 |
... | ... | ... |
因為要分別求取命中數和投籃數的總和,所以需要將df0的列轉化為整型,繼而可得到詹姆斯整個常規賽的命中率。
df0['命中數'] = df0['命中數'].astype('int')
df0['投籃數'] = df0['投籃數'].astype('int')
ShootRate = df0['命中數'].sum() / df0['投籃數'].sum()
計算得到,詹姆斯2020-2021常規賽投籃命中率為51.34%,還是很不錯的水平。
總結
原文鏈接:https://blog.csdn.net/hanyunkaka/article/details/120586261
相關推薦
- 2023-07-14 express+mongoose實現無限級分類
- 2022-06-07 ASP.NET?Core服務生命周期_基礎應用
- 2023-12-21 uniapp 清除文件緩存
- 2023-02-26 C++?ROS與boost:bind()使用詳解_C 語言
- 2023-04-01 Rust利用tauri制作個效率小工具_Rust語言
- 2022-10-16 部署k8s集群的超詳細實踐步驟_云和虛擬化
- 2022-09-15 python接口測試對修改密碼接口進行壓測_python
- 2022-02-27 Web server failed to start. Port XXXX was already
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支