[pandas] data count

**DataFrame.count(axis=0, numeric_only=False)**

결측치(NA) 데이터를 제외하고 각 열 또는 행에 대해 비어 있지 않은 셀의 개수를 세는 함수.

df = pd.DataFrame({"Person":
                   ["John", "Myla", "Lewis", "John", "Myla"],
                   "Age": [24., np.nan, 21., 33, 26],
                   "Single": [False, True, True, True, False]})
print(df)

Person Age Single 0 John 24.0 False 1 Myla NaN True 2 Lewis 21.0 True 3 John 33.0 True 4 Myla 26.0 False

parameters

✔️axis{0 or ‘index’, 1 or ‘columns’}, default 0

print(df.count())

Person 5 Age 4 Single 5 dtype: int64


print(df.count(axis=1))

0 3 1 2 2 3 3 3 4 3

axis=0 또는 axis='index'를 선택하면 각 열에 대해 결측치가 아닌 셀의 개수를 셉니다. 이 설정이 기본값입니다.

axis=1 또는 axis='columns'를 선택하면 각 행에 대해 결측치가 아닌 셀의 개수를 셉니다.

✔️numeric_onlybool, default False

numeric_only=True로 설정하면 float, int, 또는 boolean 유형의 데이터만 포함하여 계산합니다.

기본값인 numeric_only=False로 설정하면 모든 데이터 유형을 포함하여 계산합니다.

[pandas] count

**DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False, dropna=True)**

데이터프레임의 각 고유한 행(row)이 얼마나 자주 나타나는지 그 빈도를 계산하여 시리즈(Series)로 반환하는 함수. 유니크한 행을 count.

parameters

✔️subset: label or list of labels, optional

특정 열(column) 또는 열들의 리스트를 지정합니다. 지정된 열들에 대해 고유한 조합의 빈도를 계산합니다. 만약 이 매개변수를 지정하지 않으면, 모든 열을 사용하여 고유한 행의 빈도를 계산합니다.

print(df.value_counts())

Person Age Single John 24.0 False 1 33.0 True 1 Lewis 21.0 True 1 Myla 26.0 False 1 Name: count, dtype: int64


df.value_counts("Person")

Person John 2 Myla 2 Lewis 1 Name: count, dtype: int64