좋은 데이터의 기준 1. 완결성(Completeness) 필수적인 데이터는 모두 기록되어 있어야 한다. 완결성 충족 방법: 필요한 컬럼들에 결측값이 있는 지 확인한다. 2. 유일성(Uniqueness) 동일한 데이터가 중복되면 안된다. 유일성 충족 방법: 중복값 제거한다. 3. 통일성(Conformity) 데이터가 동일한 형식으로 저장되어 있어야 한다. 통일성 충족 방법: 데이터 타입, 단위, 포맷 등을 맞춘다 4. 정확성(Accuracy) 데이터가 정확해야 한다. 모으는 과정에서 실수로 생김 정확성 충족 방법: 이상점을 처리한다. 1. 결측값이 있는 행을 제거 df.dropna() 2. 결측값이 있는 열을 제거 df.dropna(axis = 'columns') 3. 결측값을 대체 - 0으로 대체 df...