Normalization (1) 썸네일형 리스트형 데이터 스케일링 (Data Scaling), 어떤 스케일러를 쓸 것인가? 데이터를 모델링하기 전에는 반드시 스케일링 과정을 거쳐야 한다. 특히 k-means 등 거리-기반의 모델에서는 넓은 범위의 값을 가지는 변수가 거리 측도를 지배하는 상황을 방지하기 위해 스케일링이 매우 중요하다. 스케일링 개념 데이터 스케일링(Data Scaling) 데이터의 값의 범위를 조정하는 것, 데이터 수치를 일정한 수준으로 변환하는 것 왜? ex) 키(height)와 몸무게(weight) 변수가 있다고 하면 단위는 각각 (cm, kg)이며 표본이 성인이라고 가정하면 범위는 (150cm - 190cm), (40kg - 100kg) 정도로 다른 단위가 범위를 가진다. 이러한 단위 차이는 몇몇 회귀 모형이나 머신러닝 기법에서 문제를 일으킬 수 있다. 거리 기반의 모델링(distance based mo.. 이전 1 다음