본문 바로가기

2019/073

[R Programming] 일표본 t-검정 (one sample t-test) 일표본 t-검정은 모집단의 평균과 표본의 평균은 동일하지 않다는 대립가설을 바탕으로 수행된다. t-검정을 하기 위해서는 "t-검정을 하는 변수는 정규분포를 따른다." 는 가정사항을 만족해야 하는데, 지난번 포스팅에서 정규성 검증을 완료했으므로 동일하게 미국 여성들의 몸무게로 검정을 해보기로 한다. 여기서 t값은 student's t-distribution 라고 하며 표본의 평균이 모집단의 평균과 얼마나 멀리 떨어져 있는지 계산하는 값이고, 만약 t값이 크다면, 표본의 평균과 모집단의 평균 사이의 거리가 멀다는 것을 의미, 귀무가설을 기각할 근거가 된다. 미국 여성들의 몸무게로 일표본 t검정을 해보도록 하자! 일표본 t검정(One sample t-test) # t.test(data$variable, # m.. 2019. 7. 21.
[R programming] 재미로 알아보는 카카오톡 대화 분석 최근에 R을 배우기 시작하면서 여러가지 재밌는(?) 통계 데이터들을 보다가 카카오톡 대화 분석을 해보면 어떨까 하고 검색해봤더니, 이미 여러 훌륭하신 분들께서 샘플 코드를 올려주신 걸 봤다! (야호) 접근하기 쉬운 데이터일 뿐만 아니라, 데이터에 대한 연관성 및 정확성 등도 나에게서 나온 데이터이기 때문에 판단이 쉽고 또 재밌는 결과를 볼 수 있을 것 같았다. 아래의 순서를 잘 따라가다 보면 재밌는 결과를 볼 수 있다. ① 분석 대상 데이터 추출 분석하고자 하는 대화를 해당 카카오톡 대화방에서 "대화내용 내보내기" 기능을 통해 텍스트 파일로 내려받는다. 카카오톡에서 내려주는 파일 여러개를 합쳐서 막 해보려고 했는데, 데이터가 많으면 소스가 돌아가다가 오류가 난다. 적정수준은 구현 환경에 따라 다르겠으나,.. 2019. 7. 6.
[R Programming] 정규성 검정 - Shapiro-Wilks test 주어진 자료가 있을 때, 그 자료의 데이터들이 정규분포를 따르는지 검정하는 방법으로 통계의 여러 검정법들이 데이터의 정규분포를 가정하고 수행되기 때문에 데이터 자체에 대한 정규성 검정 진행이 필요하다. (만약 실제 자료가 정규성을 만족하지 않는다면 분석 결과에 대한 타당성이 떨어짐) 정규성 검정 종류에는 아래 3가지가 있고, 여기서는 Shapiro-Wilks Test를 정리하려 한다. - 정규성 검정 종류 : Shpiro-Wilks test, Kolmogorove-Smirnov test, Quantile-Quantile plot [Shpiro-Wilks test] 는 가정이 있다고 한다. 1단계는 정규성 검정(Normality test) 으로 데이터의 정규분포를 검증하는 것으로, 귀무가설과 대립가설을 세.. 2019. 7. 6.