장점

단점

아웃라이어 : 평균치에서 크게 벗어나는 데이터를 의미(’이상치’라고도 함)

결측지 : 비어 있는 값 python 에서는 Null, na, NaN 등으로 표현

스케일링 : 독립 변수의 범위를 동일한 수준으로 만드는데 사용되는 방법

스케일링

표준화 스케일링

로버스트 스케일링