728x90
반응형
T-검정¶
In [10]:
import numpy #표본 집단을 랜덤 값으로 생성하기 위해서 사용
from scipy import stats #t검정 수행을 위한 패키지 (내장)
In [11]:
#학생 키에 대한 리스트 구성
height_list=numpy.array([169,167,175,166,162,180,172,162,173,162,181,175,181,181,162,165,172,176,167,165])
In [13]:
#T-검정 수행
#귀무가설이 참인 경우 학생들의 평균 키는 170cm와 차이가 없다. 그러므로 평균키는 170cm이다.
#(P>0.05)
#귀무가설이 거짓인 경우 학생들의 평균 키는 170cm와 차이가 있다. 그러므로 평균키는 170cm가 아니다.
#(P<0.05)
In [14]:
tTestResult=stats.ttest_1samp(height_list,170)
tTestResult #결과 출력
Out[14]:
Ttest_1sampResult(statistic=0.42270173526659166, pvalue=0.6772582597305596)
In [16]:
#귀무가설이 맞거나 틀린 것을 증명하려면 어떤 증거가 있어야 한다,
#이 증거에 해당하는 숫자를 검정 통계량이라고 한다.
print('t검정 통계량 = %.3f, pvalue=%.3f'%(tTestResult))
t검정 통계량 = 0.423, pvalue=0.677
독립 표본 T-검정¶
In [17]:
import numpy
from scipy import stats
In [18]:
group1Heights=numpy.array([162,168,169,165,166,168,162,172,157,173,158,169,164,170,163,175,177,162,175,177])
In [20]:
group2Heights=numpy.array([180,181,163,164,174,169,164,172,162,171,180,168,164,169,169,178,177,167,179,172])
In [21]:
tTestResult=stats.ttest_ind(group1Heights, group2Heights)
tTestResult
Out[21]:
Ttest_indResult(statistic=-1.8253194633881713, pvalue=0.07582039848129221)
대응 표본 T-검정¶
In [22]:
import numpy
from scipy import stats
In [23]:
#복용 전 몸무게에 대한 데이터
beforeWeights=numpy.array([80,82,76,82,65,73,77,78,61,81,80,70,60,83,89,84,85,81,67,60])
In [25]:
#복용 후 몸무게를 가정한 데이터
afterWeights=numpy.array([78,79,71,81,64,72,76,78,60,83,78,68,59,80,87,83,86,78,66,61])
In [26]:
tTestResult=stats.ttest_rel(beforeWeights, afterWeights)
tTestResult
Out[26]:
Ttest_relResult(statistic=3.6501577297812977, pvalue=0.001702522283727676)
728x90
반응형
'Computer Engineering > Big Data Analytics Using Python' 카테고리의 다른 글
[빅데이터 분석] 스몰데이터 통계 Part.1 (0) | 2021.05.11 |
---|---|
[빅데이터 분석 프로젝트] 마크다운으로 타이타닉 탑승객의 생존률 보고서 작성하기 -Part 2 (0) | 2021.04.19 |
[빅데이터 분석 프로젝트] 마크다운으로 팁 데이터 분석 보고서 작성하기 -Part 2 (0) | 2021.04.19 |
[빅데이터 분석] 10minutes pandas (1) (0) | 2021.04.17 |
[빅데이터 분석] 6장. 데이터 탐색 (0) | 2021.04.13 |