日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

關于Pandas?count()與values_count()的用法及區別_python

作者:Elvirangel ? 更新時間: 2022-07-06 編程語言

Pandas count()與values_count()用法

count()

values_count()在指定的統計的列名上

結果多了該列:

對比:

對比:

Pandas:count()與value_counts()對比

1. Series.value_counts(self, normalize=False, sort=True, ascending=False, bins=None, dropna=True)

返回一個包含所有值及其數量的 Series。 且為降序輸出,即數量最多的第一行輸出。

參數含義如下:

Parameters:

normalize : boolean, default False

If True then the object returned will contain the relative frequencies of the unique values.

sort : boolean, default True

Sort by frequencies.

ascending : boolean, default False

Sort in ascending order.

bins : integer, optional

Rather than count values, group them into half-open bins, a convenience for pd.cut, only works with numeric data.

dropna : boolean, default True

Don’t include counts of NaN.

Returns:

Series

舉例如下:

import pandas as pd
index = pd.Index([3, 1, 2, 3, 4, np.nan])
index.value_counts()
?
"""
輸出為:
3.0 ? ?2
4.0 ? ?1
2.0 ? ?1
1.0 ? ?1
dtype: int64
"""

如果 normalize 為 True的話,統計的結果會相加 = 1:

import pandas as pd
s = pd.Series([3, 1, 2, 3, 4, np.nan])
s.value_counts(normalize=True)
?
"""
輸出為:
3.0 ? ?0.4
4.0 ? ?0.2
2.0 ? ?0.2
1.0 ? ?0.2
dtype: float64
"""

2. ?Series.count(self, level=None)

返回非空值的數量。若是在 CSV 文件中可用來統計行數,如:

import pandas as pd
file = pd.read_csv('test.csv')
print(file['A'].count())
# 此時輸出的即是 A 列的行數

參數含義如下:?

Parameters:

level : int or level name, default None

If the axis is a MultiIndex (hierarchical), count along a particular level, collapsing into a smaller Series.

Returns:

int or Series (if level specified)

Number of non-null values in the Series.

舉例如下:

import pands as pd
s = pd.Series([0.0, 1.0, np.nan])
s.count()
# 此時輸出為 2

這就是兩者的區別和各自的用途。

原文鏈接:https://blog.csdn.net/Elvirangel/article/details/104556394

欄目分類
最近更新