498
2016-02-17 07:06:56
1
매우 수학적입니다. 읽기 전에 주의...
혹시 선형대수학이나 벡터에 관해서 깊이 공부를 하시면 L1 Norm 과 L2 Norm 이란 것을 배웁니다. 벡터의 크기를 나타내는 기준이라고 보시면 되는데..
편차들을 벡터로 봤을 때 원점(0)에서 얼마나 떨어져있는 지 살펴보는 것이죠. L1 Norm이 작성자께서 말씀하신 방법이고 L2 Norm 을 적용한 크기가 표준편차입니다.
2차원 데카르트 좌표계를 생각해보시면, ||-3,4|| 는 L1 norm (좌표 절대값의 합)으로는 7, L2 norm (우리가 생각하는 거리) 으로는 5 입니다.
많은 경우 Norm 은 2-norm을 씁니다. 여러가지 편한 성질이 있고, 거리 혹은 벡터의 크기라는 정의에 직관적으로도 맞지요.
별개로, 편차가 매우 큰 값이 하나 있다면 얘가 전체 분산에 미치는 가중치가 커진다는 점이 장점이 되기도 하고 단점이 되기도 합니다.
보통은 편차가 골고루 퍼져있을 때 좋은 성질이 많다고 합니다만, "좋다" 라는 게 참 자의적인 것이라서..
수학적으로 재미있는 점은, 모든 Norm 은 서로 동등하기 떄문에 (equivalent) 두 데이터가 있다고 치면 표준편차는 더 큰데 평균편차는 더 작다 이런 일은 존재하지 않습니다. 편차가 얼마나 많이 나는가 의 기준으로는 둘 다 동등하게 사용 가능합니다.