日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Pandas檢查dataFrame中的NaN實現_python

作者:uncle_ll ? 更新時間: 2023-03-17 編程語言

NaN代表Not A Number,是表示數據中缺失值的常用方法之一。它是一種特殊的浮點值,不能轉換為浮點數以外的任何其他類型。

NaN值是數據分析中的主要問題之一,為了得到理想的結果,對NaN進行處理是非常必要的。

檢查Pandas DataFrame中的NaN值

在Pandas DataFrame中檢查NaN的方法如下:

  • 使用isnull().values.any()方法檢查NaN
  • 使用isnull().sum()方法統計NaN
  • 使用isnull().sum().any()方法檢查NaN
  • 使用isnull().sum().sum()方法統計NaN

方法1:使用isnull().values.any()方法

# importing libraries
import pandas as pd
import numpy as np


num = {'Integers': [10, 15, 30, 40, 55, np.nan,
?? ??? ??? ??? ??? ?75, np.nan, 90, 150, np.nan]}

# Create the dataframe
df = pd.DataFrame(num, columns=['Integers'])

# Applying the method
check_nan = df['Integers'].isnull().values.any()

# printing the result
print(check_nan)
# 輸出 True

可以通過從isnull().values.any()中刪除.values.any()來獲得NaN值所在的確切位置。

df['Integers'].isnull()
1
0     False
1     False
2     False
3     False
4     False
5      True
6     False
7      True
8     False
9     False
10     True
Name: Integers, dtype: bool

方法2:使用isnull().sum()方法

# importing libraries
import pandas as pd
import numpy as np


num = {'Integers': [10, 15, 30, 40, 55, np.nan,
?? ??? ??? ??? ??? ?75, np.nan, 90, 150, np.nan]}

# Create the dataframe
df = pd.DataFrame(num, columns=['Integers'])

# applying the method
count_nan = df['Integers'].isnull().sum()

# printing the number of values present
# in the column
print('Number of NaN values present: ' + str(count_nan))

Number of NaN values present: 3

方法3:使用isnull().sum().any()方法

# importing libraries
import pandas as pd
import numpy as np

nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75,
?? ??? ??? ??? ??? ?np.nan, 90, 150, np.nan],
?? ??? ?'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25,
?? ??? ??? ??? ??? ?np.nan, 26, np.nan, np.nan]}

# Create the dataframe
df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2'])

# applying the method
nan_in_df = df.isnull().sum().any()

# Print the dataframe
print(nan_in_df)
# 輸出 True

可以通過從isnull().sum().any()中刪除.sum().any()來獲得NaN值所在的確切位置。

方法4:使用isnull().sum().sum()方法

# importing libraries
import pandas as pd
import numpy as np

nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75,
?? ??? ??? ??? ??? ?np.nan, 90, 150, np.nan],
?? ??? ?'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25,
?? ??? ??? ??? ??? ?np.nan, 26, np.nan, np.nan]}

# Create the dataframe
df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2'])

# applying the method
nan_in_df = df.isnull().sum().sum()

# printing the number of values present in
# the whole dataframe
print('Number of NaN values present: ' + str(nan_in_df))

Number of NaN values present: 8

參考

https://www.geeksforgeeks.org/check-for-nan-in-pandas-dataframe/

原文鏈接:https://blog.csdn.net/uncle_ll/article/details/128728107

欄目分類
最近更新