통계검정
1. 카이제곱 검정
카이제곱 독립성 검정 2개의 변수가 연관이 있는지 판단
pvalue=0.85198가 나온다.
일반적으로p 값이0. 10(90%) 또는 0.05(95%) 보다 작으면 그룹간에 차이가 있음을 보여줌 p117
이항 검정(binomial)
*신뢰구간이 95%라는 의미
모평균을 포함할 확률이 95%가 아니라
(동일한 크기의 )같은 방법으로 표본을 추출했을때, 100개의 신뢰구간중 모평균을 포함한 신뢰구간들의 숫자가 95개가 된다.
T-검정(평균과 평균을 검정)
집을 가지고 있는 사람과 가지고 있지않는 사람들의 소득의 mean과 std를 계산해보자
근데 여기서 주택소유가 소득차이에서 변수가 되는지 궁금하다.
p-value가 0.05보다 낮으므로 귀무가설이 기각된다. = 통계가 유의미 하다.
주택 소유자와 비소유자 간의 평균 소득이 통계적으로 유의미하게 다르다는 것을 증명했다는 것입니다.
반복샘플링을 했을때 해당 값 사이에 있을 것임을 95%신뢰할 수 있다.
https://ko.wikipedia.org/wiki/유의_확률
p-value에 대한 다른 예시
문제 출처 - https://jalynne-kim.medium.com/데이터-사이언스-통계학-검정방법-소개-t-test-qhi-square카이제곱검정-2e0ff38bca3e
[데이터 사이언스] 통계학 검정방법 소개(T-test, qhi-square카이제곱검정)
오늘은 데이터 분석에서 쓰이는 통계학 검정방법 2가지를 간략하게 소개하고자 합니다. 통계학 검정방법은 오늘 소개할 2가지 방법 외에도 아주많습니다.
jalynne-kim.medium.com
분산분석
분산 분석은 분산이 비슷하다고 가정했을때 평균간의 차이를 검정하는 것이다. 이것도 어떻게 보면 평균을 가지고 비교하는 것이다.
분산 분석은 여러개의 평균을 비교하는 것이다.