요약
- 확률론은 주로 경우의 수, 확률, 확률분포 등을 다루며 통계학 이전에 학습이 필요하다.
- 통계학 중 하나의 카테 고리인 추정 통계은 샘플 데이터를 기반으로 모집단이 어떠한 확률 분포인지 찾는 것이 목적이다.
- 이러한 모집단을 추정하기 앞서 샘플 데이터의 사전 지식이나 특징을 통해 모집단이 가지는 특징을 유추하여 가설을 설정하기 위해 확률론이 선행되어야 하며, 통계 모델링의 초석이 될 만큼 매우 중요하다.
1. 확률론
1.1 개요
확률론은 경우의 수, 확률, 확률분포 등을 다룬다. 위와 같은 확률론을 선행한 후 통계학을 배운다.
왜 확률론 먼저?
추론 통계는 샘플 데이터를 통해 모집단이 어떤 확률 분포인지 찾는 것이 목적이다. 이때, 분석자가 데이터에 대한 사전지식이나 다양한 확률분포 개념을 알고 있다면 샘플 데이터의 특징을 통해 어떤 확률분포를 따를 것이라고 미리 짐작할 수 있다.
1.2 필요성
이처럼 샘플 데이터를 통해 모집단을 조금 더 쉽게 추정하기 위해서 확률론이 필요하다.
추가로 통계 분석 이전에 데이터가 어떤 분포를 따를 가능성이 높은지? 어떻게 경우의 수를 계산해야 하는지? 확률들을 어떻게 활용해야 하는지 등 결정이 필요하다. 그리고 우도를 만드는 것과도 관계가 있어 확률론은 통계 모델링에 초석이 된다.
따라서, 이를 정확히 이해하기 위해서는 확률론이 필요하다.
참고자료