카테고리 없음

범주형 변수 Imputation

judy@ 2023. 6. 21. 11:35

범주형 변수에 대해서는 KNNImputer 등이 동작하지 않음.

 

에러메세지

ValueError: could not convert string to float: 'Europa'

 

다음 코드를 통해 최빈값으로 결측을 대치할 수 있음

# 최빈값 구하기
mode = df[col].mode()[0]

# 최빈값으로 결측 값 채우기
df[col].fillna(mode, inplace=True)

 

반응형