가볍게 배우고 깊게 즐기고 오래 남기기
Statistics || 2. 경영통계 : 변동성 척도 (표준편차, 변동계수(CV), IQR) & 연관성척도 (공분산(Cov), 피어슨상관계수) , 가설검정 개요 본문
Statistics || 2. 경영통계 : 변동성 척도 (표준편차, 변동계수(CV), IQR) & 연관성척도 (공분산(Cov), 피어슨상관계수) , 가설검정 개요
Awesomist 2023. 4. 26. 16:11
[변동성 척도] – Measure of Variability
* Standard deviation(표준편차)
→ Variance의 제곱근, 평균에서이 얼마나 분산되어 있는지 검토 가능
* Coefficieat of variation (변동계수): (=표준편차/평균*100), 표준편차를 상대적인 값으로 표준화 시킨 값
→ 상대값으로 변환해 규모의 효과 상쇄할 수 있음
* IQR (Interquartile range): (=Q3-O1)
→ Python / R 등의 통계 시각화에서 많이 활용하는 Boxplot
[연관성 척도] – Measure of Association
※ 특잇값 발견(정규화 활용) → Z-score = (x-m)/s
※ 그룹 평균/분산 – 계급의 Median을 대표값으로 활용한다
* 통계적 추정에 기반한 비즈니스 의사결정 시 참고사항
* 연구자가 획득한 얻은 모집단의 일부 데이터를 기준으로 전체를 표현하기 때문에 필연적으로 오차(error)가 발생한다.
→ 오차를 줄일 수 있도록 분석목적과 데이터의 특징/유형에 따른 적절한 방법론 채택이 필수적
→ 의사결정시 오차의 크기를 계산해 해당 표본의 설명력을 함께 고려하는 비즈니스 의사결정 진행 필요
(→ 가설검정의 필요성)
* 가설검정
: 표본을 통해 도출한 결과가 전체를 얼마나 설명할 수 있는가를 검증하는 절차
* 신뢰수준 (Confidence Level) : 표본의 통계량 결과가 모집단을 설명할 수 있는 비율
* 유의수준 (Significance Level, α로 표시) : 표본의 통계량 결과가 모집단을 잘못 설명할 수 있는 비율
※ Confidence Level + Significance Level = 1
※ α = 0.05 ⇒ significance level : 5%
(+ "This poll is considered accurate within 3.4%p, 19 times out of 20")
※ [참고] 대표적인 분석 목적 유형 (Problem Objective)
: 목적과 데이터 유형에 따라 적합한 추정 및 가설검정 방식이 나누어짐
→ 1) 모집단 설명(Describing)
2) 두 모집단 비교
3) 둘 이상의 모집단 비교
4) 두 변수 간 관계성 파악
5) 둘 이상의 변수 간 관계성 파악
'분석인사이트 > 이론공부_통계' 카테고리의 다른 글
Statistics || 3. 확률과 확률변수, 이산형 확률분포 & 연속형 확률분포, 결합확률 & 주변확률, 심슨의 역설, 베이즈 정리 (0) | 2023.05.10 |
---|---|
Statistics || 1. 경영통계의 시작 : Data의 정의 , 기술통계량 , 추정통계량 (0) | 2023.04.19 |