데이터분석(data)

Missing Data 관리, 사용법(Dropna, Fillna)

BigBee 2021. 10. 7. 17:16

numpy와 pandas를 쓸때, NaN이 나오는 경우가 엄청 많이 생긴다. 엑셀에서 값을 만들 때 NaN들이 생기거나 infinite

값들, 혹은 누락된 값이 생기는데 이러한 값들을 예외 처리하는 것은 정말 중요하다. 기본기라고 생각한다.

그러한 바에서 Missing Data를 관리하는 스킬을 필히 갖추도록 하자.

 

Dropna 함수의 활용

 

dropna 함수는 column내에 NaN값이 있으면 해당 내용은 필요없다 간주하고 삭제해버린다.

 

fillna() 함수

 

fillna 함수도 굉장히 유용하다. NaN을 특정 값으로 대체하는 기능을 한다. 특정 텍스트라던지, 평균값이라던지... 굉장히 유효한 함수니까 필히 암기하자.