formula (규정식 사용)
- for-mula의 틸테 표시 즉 ~의 왼쪽에는 우리가 그룹별로 나누고자 하는 변수(grouping variable)의 이름을 작성해주고
~의 오른쪽에는 표의 열이 되는 변수(row variables)의 이름을 작성
- ~의 오른쪽에는 마침표 "."를 쓸 수 있는데 이것은 열 전부를 뜻한다.
mytable(Dx~.,data=acs) # Dx 변수에 대한 테이블을 생성(Dx 변수의 값과 해당 값이 빈도를 계산)
mytable(sex~age+Dx,data=acs) # sex 변수를 age 와 DX 변수로 예측


연속형 변수의 통계 방법(method)
- 연속형 변수는 정규분포하는 것으로 간주하고 통계처리를 한다.
1. 정규분포 하는 것으로 간주하고 분석한다. 표에는 평균과 표준편차값이 나타난다.
p 값은 두 군인 경우 t.test, 세 군 이상인 경우 anova를 통해 결정
2. 정규분포하지 않는 것으로 간주하고 분석. 중앙값과 사분위값이 나타나고
p 값은 Kruskal-Wallis Rank Sum Test로 결정된다.
3. 자료의 정규성을 검정하고 그 결과에 따라 분석을 진행. 자료의 개수가 5000개 이하인 경우에는 Shapiro-Wilk Normality test를 실시하고 , 5000개 이상인 경우에는 Anderson-Daring test를 실시.