RyanNerd
라덕'Story
RyanNerd
  • 분류 전체보기 (53) N
    • Study Note (18) N
      • Python (3)
      • R (1)
      • Airflow (7)
      • 통계 (7) N
    • 빅데이터분석기사 (1)
      • 필기 (1)
    • Programmers (28)
      • Python (13)
      • SQL (15)
    • Project (3)
      • Django (3)
    • Mac (2)
    • 맛집 (0)

블로그 메뉴

  • NaverBlog
  • 홈

최근 글

전체 방문자
오늘
어제
hELLO · Designed By 정상우.
RyanNerd

라덕'Story

[R] 기초 표
Study Note/R

[R] 기초 표

2023. 11. 6. 15:21

formula (규정식 사용)

- for-mula의 틸테 표시 즉 ~의 왼쪽에는 우리가 그룹별로 나누고자 하는 변수(grouping variable)의 이름을 작성해주고

  ~의 오른쪽에는 표의 열이 되는 변수(row variables)의 이름을 작성

- ~의 오른쪽에는 마침표 "."를 쓸 수 있는데 이것은 열 전부를 뜻한다.

 

mytable(Dx~.,data=acs) # Dx 변수에 대한 테이블을 생성(Dx 변수의 값과 해당 값이 빈도를 계산)

mytable(sex~age+Dx,data=acs) # sex 변수를 age 와 DX 변수로 예측

 

 

연속형 변수의 통계 방법(method)

- 연속형 변수는 정규분포하는 것으로 간주하고 통계처리를 한다.

 

1. 정규분포 하는 것으로 간주하고 분석한다. 표에는 평균과 표준편차값이 나타난다.

    p 값은 두 군인 경우 t.test, 세 군 이상인 경우 anova를 통해 결정

 

2. 정규분포하지 않는 것으로 간주하고 분석. 중앙값과 사분위값이 나타나고

    p 값은 Kruskal-Wallis Rank Sum Test로 결정된다.

 

3. 자료의 정규성을 검정하고 그 결과에 따라 분석을 진행. 자료의 개수가 5000개 이하인 경우에는 Shapiro-Wilk Normality test를 실시하고 , 5000개 이상인 경우에는 Anderson-Daring test를 실시.

 

    RyanNerd
    RyanNerd
    라이언 덕후의 일상 스토리~

    티스토리툴바