Simple & Convenient

Statistics & Big-Data/Introducing Statistics

통계학, 왜?(Why Statistics?)

goaswon 2021. 9. 12. 16:05

통계학은 왜 필요할까?

통계학은 의사결정을 위한 도구로 과거의 data를 사용해.
이를 통해 원인 파악, 미래 예측을 통해 설득이해를 가능하게 하지.

또한 자신의 의견을 전달하는데 효율적인 도구 중 하나야. 타인을 설득한다고 할 때, 의견을 뒷받침하는 근거의 유무는 큰 차이가 있어. 여기서 근거의 역할을 할 수 있는 것이 통계야. 그래서 우리는 통계학에서 가장 중요한 것은 타인을 설득할 수 있는 설득법을 터득하는 것이 가장 중요하다고 할 수 있어.

 

정치인을 예로 들어보자. 그들은 자신을 선출해야 더 나은 미래를 얻을 수 있다는 메시지를 전달하려해. 그러기 위해서 자신이 가진 공약을 통해 '유권자가 겪고 있는 문제를 해결할 수 있다' 설득하는 거지. 현재의 문제를 수치화하여 통계치로 표현하고 그 해결방안을 수치로 제시한다면 큰 설득력을 갖겠지.

 

게다가 통계학의 좋은 점은 또 하나 있어. 쉬운 예를 들어보자.  A고등학교의 학생들이 선호하는 점심메뉴를 조사한다고 해보는거야.  A고등학교의 전교생 수는 1000명이야. 1000명의 데이터를 조사한다면 어떻게든 하면 할 수 있겠지? 그런데 전국의 모든 고등학생들이 선호하는 점심메뉴를 조사한다면 어떻게 될까? 100만명이 넘는 데이터가 모여서 도저히 수기로는 하기 힘들거야. 이럴때 통계학에서 전국 모든 고등학생의 데이터를 Population(모집단)이라고 하고. Population에서 원하는 조건에 맞는 데이터들만 고른것을 Sampling(추출)이라고 하는 개념을 도입해. 여기서 Sampling된 데이터를 Sample(표본), Sample에서 통계학을 이용해 Population에 대한 추론을 하는 과정을 Inference(통계적 추론)이라고 하는거야. 여기서 전국 고등학생들중 Sampling을 통해 Sample을 구하고, Inference를 통해 Population에 대한 정보를 얻어낼 수 있어. 이렇게 일부의 데이터만으로도 전체에 대한 정보를 얻을 수 있다는것이 우리의 수고를 크게 덜어주는 좋은 점이야.

 

하지만, 통계학은 훌륭한 학자분들께서 만드신 학문인 만큼 수학적 원리를 모두 터득하는 것은 쉽지 않아(나도 잘 몰라). 통계학을 전공하는 사람이 아니라면 모든 원리를 터득하는 것은 비효율적이라고 말하고 싶어. 우리가 핸드폰을 사용하려고 어려운 반도체 공학이나 센서들에 대해 공부하는 것이 아닌 것처럼 말이야. 이렇게 이야기하는 이유는 우리는 수식의 증명이나 정확한 유도방법을 모르더라도 Computer라는 미친 계산기를 가지고 있잖아.

 

Computer는 학자분들께서 고안한 다양한 수식들을 외우고 있다가 우리가 필요하다고 연락할 때마다 대신 계산을 해주고 결과를 알려줘. 하지만 컴퓨터도 그냥 할 수 있는게 아니라 그런 계산을 할 수 있도록 도와주는 프로그램이 필요해. R, SPSS, EXCELPython 이라는 프로그램이 대표적인 프로그램이야. 위의 프로그램은 서로 다르지만 비슷한 결과를 도출해줘. 저 프로그램들은 고등학생이 수학 학원을 고르는 것과 비슷해. 각 학원별로 장점과 단점이 있고 여기서 자신에게 맞는 것을 고르는 거지. 어떤 학원은 학생들에게 매우 쉽게 가르쳐주지만 어려운 문제를 풀 때는 오히려 더 복잡해진다거나, 반대로 어렵게 가르치지만 어려운 문제까지 모조리 해결 가능하도록 가르치는 학원이 있는 것 처럼말야.

 

앞으로의 글들은 통계학이 뭔지도 들어본 적 없고 타인을 설득하고자 하는 10대를 대상으로 쓸 예정이야. 그리고 모르는 것을 찾아볼 때 한국어로 검색하면 필요한 정보가 나오지 않는 경우가 많아. 하지만, 영어로 검색하면 양질의 결과를 얻을 확률이 높기 때문에 가능하면 영어를 기준으로 설명하려고 해. 그래서 통계학을 공부하며 가장 큰 어려움 중 하나였던 용어들을 10대를 기준으로 영어와 한자로 최대한 풀어서 설명할 거야. 이를 토대로 개념적인 이해만 가져가고 수식은 최대한 생략해서 R 혹은 Python을 통해 계산하고 기술하여 결과를 도출하는 기초적인 통계학을 같이 배워보려고 해.

 

더욱 자세한 통계학을 배우고 싶다면 통계학 서적을 구매하여 공부하거나 Youtube 혹은 Googling을 통해 배울 수 있도록 기초적인 부분만 설명하도록 할게. 100%의 정확도로 10%를 이해하기보단 80%의 정확도로 80%를 이해할 수 있도록 할 테니까 사소한 오류들은 이해해주길 바라.

 

'자유아카데미' 출판사의 '통계학 입문' 책의 목차의 순서를 참조합니다.
(순서가 다른 부분이 있을 수 있음)