데이터분석(data) (3) 썸네일형 리스트형 Missing Data 관리, 사용법(Dropna, Fillna) numpy와 pandas를 쓸때, NaN이 나오는 경우가 엄청 많이 생긴다. 엑셀에서 값을 만들 때 NaN들이 생기거나 infinite 값들, 혹은 누락된 값이 생기는데 이러한 값들을 예외 처리하는 것은 정말 중요하다. 기본기라고 생각한다. 그러한 바에서 Missing Data를 관리하는 스킬을 필히 갖추도록 하자. Dropna 함수의 활용 dropna 함수는 column내에 NaN값이 있으면 해당 내용은 필요없다 간주하고 삭제해버린다. fillna() 함수 fillna 함수도 굉장히 유용하다. NaN을 특정 값으로 대체하는 기능을 한다. 특정 텍스트라던지, 평균값이라던지... 굉장히 유효한 함수니까 필히 암기하자. Python Pandas: isin 구문 isin 구문은 열이 list의 값들을 포함하고 있는 모든 행들을 골라낼 때 주로 쓰인다. input: output: 이를 그대로 쓰는 경우보다 Dataframe의 컬럼에서 어떤 list의 값을 포함하고 있는것만 걸러낼 때 isin 구문이 유용하다. 데이터 분석: iloc, loc를 사용한 행/열 선택법, df, pandas 1. 행번호(row number)로 선택하는 방법(.iloc) 2. label이나 조건표현으로 선택하는 방법(.loc) 이전 1 다음