본문 바로가기
728x90
반응형

statquest5

[통계학 공부] 5. 표본분산을 구할 때 n이 아닌 n-1로 나누는 이유 표본분산을 구할 때 n이 아닌 n-1로 나누는 이유를 3가지 방식을 통해서 알아볼 거에요. 6. Why Dividing by N Underestimates the Variance 6. Why Dividing by N Underestimates the Variance 1) 표본분산을 구할 때 n이 아닌 n-1로 나누는 이유 (자유도) $S^{2} = \frac{1}{n-1}\sum_{i = 1}^{n}(x_{i}-\overline{x})^{2}$ 표본분산은 n개의 편차를 사용하는 것같지만 '편차의 합 = 0'이라는 제약조건 때문에 n-1개의 편차 정보를 사용한다. $\sum_{i = 1}^{n}(x_{i}-\overline{x}) = 0$ : 편차의 합이 0이 되어야 하기 때문에 n-1 개의 편차가 정해지.. 2023. 5. 15.
[통계학 공부] 4. 평균, 분산, 표준편차 추정하기 평균, 분산, 표준편차 추정하기 저번시간에 모수에 대해서 알아봤다면 이번 시간에는 모평균, 모분산, 모표준편차 추정하는 법에 대해서 알아볼거에요. 5. Estimating the Mean, Variance and Standard Deviation 5. Estimating the Mean, Variance and Standard Deviation 1) Estimating the Mean 1-1) 모평균 구하기 모든 측정값들의 평균을 직접 구하면 되지만 모집단을 모두 구하려면 시간과 돈이 많이 들기 때문에 모집단의 데이터를 구할 수 없다. 따라서 표본에서 모집단의 평균을 추정할 것이다. 1-2) 모평균 추정 표본에서 모평균을 추정하는 방법은 우리가 구한 측정값의 평균을 계산하는 것이다. 이때 추정 평균을 $.. 2023. 5. 12.
[통계학 공부] 3. 모수 쉽게 이해하기 모수 쉽게 이해하기 4. Population and Estimated Parameters, Clearly Explained 4. Population and Estimated Parameters, Clearly Explained Population parameter : 모수 5개의 간세포에서 유전자 x의 mRNA의 개수를 세었다고 해보자 가로축은 geneX에 대해 하나의 간세포가 가지고 있는 mRNA의 수를 의미한다. 즉, 첫번 째 녹색점은 geneX에 대해 3개의 mRNA를 갖는 하나의 간세포를 의미한다. → 3, 13, 19, 24, 29 한사람의 2400억 개의 간세포를 의미하는 2400억 개의 녹색 점이 있다고 하면 우리는 그 값에 대한 히스토그램을 그릴 수 있다. 히스토그램은 대부분의 세포가 20.. 2023. 5. 10.
[통계학 공부] 2. 정규분포 쉽게 이해하기 정규분포 쉽게 이해하기 저번시간에 히스토그램에 대해서 알아봤다면 이번에는 정규분포에 대해서 알아볼게요 3. The Normal Distribution 3. The Normal Distribution “정규분포” 혹은 “가우시안 분포”는 종모양 곡선 (bell shaped curve)이라고도 부르며 대칭형 모양이다. 만약 사람들의 키에 대해서 측정한 것이라면 y축은 키가 매우 작거나 매우 크거나 혹은 평균일 누군가를 관찰할 상대적 확률을 나타낸다. 예를 들어, 키가 매우 작은 사람이나 큰 사람을 보는 것은 상대적으로 드물기 때문에 종모양 곡선의 높이가 상대적으로 낮다. 반면 평균키에 근접한 누군가를 보는 것은 꽤 흔한 일이기 때문에 종모양 그래프는 매우 높다. 아기의 키 분포와 성인 남성의 키 분포 왼쪽은.. 2023. 5. 2.
728x90
반응형