엑셀과 데이터 리터러시
엑셀과 통계 개념
엑셀로 데이터 검정하기
가설검정
표본 조사로 얻은 데이터 화용.
목적에 따른 가설을 세우고 가설을 입증하기 위한 과정
- 귀무가설: 기각될 것을 상정하고 세우는 가설
- ex.”마케팅 캠페인은 매출에 영향을 미치지 않는다.”
- 대립가설: 귀무 가설과 반대되는 가설
- ex. “마케팅 캠페인은 매출에 긍정적인 영향을 미친다.”
**P값이 0.05(5%) 미만이면 귀무가설을 기각하고 대립가설을 채택한다
Z검정
모집단의 표준편차를 알고 있거나, 포본 크기가 충분히 클 때 (n>30)
-한 그룹을 평균의 기준 값과 비교 ( 한 학교의 평균 시험 점수가 전국 평균과 다른지 알고 싶을 때)
-두 그룹의 평균 비교 (두 학교의 평균 시험 점수가 다른지 알고 싶을 때)
언제사용?
z검정은 표본의 크기가 크고, 모집단의 분산(표준편차)을 알고있을 때 사용함.
큰 표본을 갖고 있을 경우, 표본 분포가 정규 분포에 가까워지기 때문에 z검정을 사용하는 것이 적합.
- 가정: 모집단이 정규 분포를 따르며, 표본 크기가 크거나 모집단의 분산을 알고 있을 때 사용
- 검정통계량: 표준 정규분포
z값과 p값의 의미
z값: 데이터가 정규 분포를 따를 때, 표본 평균과 모집단 평균의 차이가 유의미한지를 검증하는 방법- 표준편차를 기준으 해서 얼마나 떨어져 있는지
z값이 크다: 관측값이 평균에서 떨어져있다 = 평균과 차이가 있다
z값이 작다: 관측값이 평균에 가깝다 = 평균과 차이가 없다
IF
만약 새로운 공부 방법이 기존 방법보다 효과가 있는지 검정하려고 할 때:
- z값이 크면: 새로운 공부 방법이 기존 방법과 유의미한 차이가 있음
- z값이 작으면: 새로운 공부방법이 기존 방법과 차이가 없음 → 효과가 없음을 의
p값: z값이 큰지 작은지를 통해 귀무 가설을 기각할지 결정하는 기준. z값을 통해 계산하며, 귀무가설이 참일 때, 관측된 데이터나 극단적인 결과가 발생할 확률을 의미함 (우연히 발생한 것인지 아닌지)
z값과 p값은 서로 연결되어 있어요. z값은 데이터가 평균에서 얼마나 떨어져 있는지를 표준화된 단위로 나타내는 값이고, p값은 이 z값이 나타날 확률을 말해요. z값을 통해 데이터의 위치를 알지만, p값을 통해 이 위치가 통계적으로 의미가 있는지를 알 수 있어요.
- z값: 특정 데이터가 평균에서 얼마나 떨어져 있는지를 표준편차 단위로 나타낸 값.
- p값: z값이 귀무 가설이 참일 때 나타날 확률. 이 값이 작을수록 귀무 가설을 기각할 가능성이 커요.
- Var.p 함수 사용해서 분산 구하기
- var(): 모집단의 분산을 구하는 함수
t검정 실습하기 (등분산/ 이분산)
- 대응표본 t검정: 같은 그룹의 구성원이 두 번 측정된 경우, 두 그룹의 구성원이 쌍을 이루어 비교되는 경우 사용됨 ( 등분산/ 이분산과는 무관하게 일대일 대응 데이터를 비교함)
- 같은 사람의 사전 - 사후 성적 비교
- 동일한 사람의 왼쪽 눈과 오른쪽 눈 시력 비교
- 독립 표본 t검정: 두 독립된 그룹의 평균을 비교하는 방법 (구성원이 다른 그룹의 구성원과 아무 관련이 없을 때 사용), 등분산/이분산 가정을 통해 분석방법이 달라질 수 있
- 새로운 약물의 효과 테스트, 두 다른 학급의 성적 비교
- 데이터 탭 - 데이터 분석 - F 검정 선택
- 범위를 각각 여자와 남자로 지정함
- p값을 분석한다 (레빈의 검정): 두 그룹의 분산이 동일한지 아닌지를 확
- 0.05보다 크면 등분산 가정- 데이터가 평균에서 퍼져있는 정도가 비슷
- 0.05보다 작으면 이분산 가정 - 데이터가 평균에서 퍼져 있는 정도가 다름
주요 메트릭 (NSM/ OMTM)
METRIC
- 조직이나 개인이 성과를 측정하기 위해 사용하는 특정한 기준 또는 지표
- 목표 달성을 위한 진행 상황을 모니터링하고 평가하는 데 사용
- 메트릭은 명확한 목표를 설정하고 추적하는 데 도움을 줌
- 데이터 기반으로 한 의사결정에 도움을 줌
- ex. 주문 수 / 일 사용자 수 / 반송율/ 광곡 클릭률/ 이직률/ 일일 걸음 수
'sesac' 카테고리의 다른 글
SeSAC 전z전능 분석가 성동2기 데이터 분석가 | SQL 교육(2)_메타 문자 ORDER BY, OFFSET, 함수 (0) | 2024.07.05 |
---|---|
SeSAC 전z전능 분석가 성동2기 데이터 분석가 | SQL 교육(1)_SQL 설치 및 조건 찾기 (MY SQL, SQL 불러오기) (1) | 2024.07.05 |
SeSAC 전z전능 분석가 성동2기 데이터 분석가 #21 | 파이썬 교육(4)_데이터 분석 및 시각화 (0) | 2024.06.24 |
SeSAC 전z전능 분석가 성동2기 데이터 분석가 #18-20 | 파이썬 교육(3)_데이터 프레임, 시각 (0) | 2024.06.24 |
SeSAC 전z전능 분석가 성동2기 데이터 분석가 #17 | 파이썬 교육(3)_반복문 for, while (0) | 2024.06.05 |