카테고리 없음

6장

lee___ys 2023. 4. 3. 20:33

통계검정

1. 카이제곱 검정 

카이제곱 독립성 검정 2개의 변수가 연관이 있는지 판단 

4개의 데이터인데 마지막에 20를 줌으로써 변동을 줌

pvalue=0.85198가 나온다. 

25개로 한다면 p-value가 1이 나옴

 

 일반적으로p 값이0. 10(90%) 또는 0.05(95%) 보다 작으면  그룹간에 차이가 있음을 보여줌 p117

 

 

이항 검정(binomial)

*신뢰구간이 95%라는 의미

모평균을 포함할 확률이 95%가 아니라 

(동일한 크기의 )같은 방법으로 표본을 추출했을때, 100개의 신뢰구간중 모평균을 포함한 신뢰구간들의 숫자가 95개가 된다.

 

 

 

T-검정(평균과 평균을 검정)

집을 가지고 있는 사람과 가지고 있지않는 사람들의 소득의 mean과 std를 계산해보자 

근데 여기서 주택소유가 소득차이에서 변수가 되는지 궁금하다. 

p-value가 0.05보다 낮으므로 귀무가설이 기각된다.  =  통계가 유의미 하다.

주택 소유자와 비소유자 간의 평균 소득이 통계적으로 유의미하게 다르다는 것을 증명했다는 것입니다.

반복샘플링을 했을때 해당 값 사이에 있을 것임을 95%신뢰할 수 있다. 

https://ko.wikipedia.org/wiki/유의_확률 

 

 

p-value에 대한 다른 예시 

 

문제 출처 - https://jalynne-kim.medium.com/데이터-사이언스-통계학-검정방법-소개-t-test-qhi-square카이제곱검정-2e0ff38bca3e

 

[데이터 사이언스] 통계학 검정방법 소개(T-test, qhi-square카이제곱검정)

오늘은 데이터 분석에서 쓰이는 통계학 검정방법 2가지를 간략하게 소개하고자 합니다. 통계학 검정방법은 오늘 소개할 2가지 방법 외에도 아주많습니다.

jalynne-kim.medium.com

 

분산분석

분산 분석은 분산이 비슷하다고 가정했을때 평균간의 차이를 검정하는 것이다. 이것도 어떻게 보면 평균을 가지고 비교하는 것이다. 

분산 분석은 여러개의 평균을 비교하는 것이다.