AI & 데이터 분석/아티클 & 책

아티클) 숫자의 불확실성_데이터분석가의 숫자유감(리디북스)

세밍_ 2021. 4. 18. 23:50
728x90
반응형

https://select.ridibooks.com/article/@data/2

요약) 

숫자는 대상의 정량적인 비교가 가증하게 한다. 시간의 흐름에 따라 변화도를 측정할 수 있으며 사이트 내에서 사용자 행동을 수치화 해서 기업의 의사결정에 반영하기도 한다.

하지만 숫자가 단순하고 단정적이라고 하지만 세상은 가변적이라 쉽사리 결론을 숫자로 단정지을 수 없다. 

예를 들어 오늘 가게에 손님이 3명 오고 어제는 6명이 왔고 그제는 한 명도 안왔다고 했을 때, "내일 가게에 손님이 3명 온다." 고 확정짓기 보다 "평균 3명 온다" 고 말하는 편인 거다

데이터 상의 숫자 차이가 조금 있다고 하더라도 그 조금의 차이가 통계적으로 의미가 있는지, 고려 전제조건은 있는지, 차이가 유효한 건지 등을 알아봐야 한다.

- t 검정 : 두 집단 간의 평균의 차이가 유의미한지 검정

- z 검정 : 모집단의 속성을 살피기 위해 추출된 표본의 통계값의 평균과 연구자가 이론적, 혹은 경험적 배경에서 얻은 특정 값과의 비교를 위한 통계적 방법

 

숫자는 가변적인 세상을 설명하도록 불확실성위에 쌓아 올려진 학문이고, 통계는 항상 확률과 같이 등장하며 한번도 숫자는 절대적인 적이 없다.

단순해 보이는 숫자라도 그 과정에서 다소 유실되는 내용과 다른 상황이 들어갈 수 있음도 이해해야 한다.

 

느낀점)

대학교 2학년 때 배운 수리통계들이 정말 유의미하게 사용되고 있음을 한번 더 깨달은 아티클이었다.(공부 좀 더 열심히 할 걸 그랬다) 데이터 분석가가 되기 위해 숫자를 어떻게 바라봐야 할지 다시금 생각해 볼 수 있었다.

728x90
반응형