결측치(NA) 데이터를 제외하고 각 열 또는 행에 대해 비어 있지 않은 셀의 개수를 세는 함수.
df = pd.DataFrame({"Person":
["John", "Myla", "Lewis", "John", "Myla"],
"Age": [24., np.nan, 21., 33, 26],
"Single": [False, True, True, True, False]})
print(df)
Person Age Single 0 John 24.0 False 1 Myla NaN True 2 Lewis 21.0 True 3 John 33.0 True 4 Myla 26.0 False
parameters
✔️axis{0 or ‘index’, 1 or ‘columns’}, default 0
print(df.count())
Person 5 Age 4 Single 5 dtype: int64
print(df.count(axis=1))
0 3 1 2 2 3 3 3 4 3
axis=0 또는 axis='index'를 선택하면 각 열에 대해 결측치가 아닌 셀의 개수를 셉니다. 이 설정이 기본값입니다.
axis=1 또는 axis='columns'를 선택하면 각 행에 대해 결측치가 아닌 셀의 개수를 셉니다.
✔️numeric_onlybool, default False
numeric_only=True로 설정하면 float, int, 또는 boolean 유형의 데이터만 포함하여 계산합니다.
기본값인 numeric_only=False로 설정하면 모든 데이터 유형을 포함하여 계산합니다.
데이터프레임의 각 고유한 행(row)이 얼마나 자주 나타나는지 그 빈도를 계산하여 시리즈(Series)로 반환하는 함수. 유니크한 행을 count.
parameters
✔️subset: label or list of labels, optional
특정 열(column) 또는 열들의 리스트를 지정합니다. 지정된 열들에 대해 고유한 조합의 빈도를 계산합니다. 만약 이 매개변수를 지정하지 않으면, 모든 열을 사용하여 고유한 행의 빈도를 계산합니다.
print(df.value_counts())
Person Age Single John 24.0 False 1 33.0 True 1 Lewis 21.0 True 1 Myla 26.0 False 1 Name: count, dtype: int64
df.value_counts("Person")
Person John 2 Myla 2 Lewis 1 Name: count, dtype: int64