가볍게 배우고 깊게 즐기고 오래 남기기

Statistics || 2. 경영통계 : 변동성 척도 (표준편차, 변동계수(CV), IQR) & 연관성척도 (공분산(Cov), 피어슨상관계수) , 가설검정 개요 본문

분석인사이트/이론공부_통계

Statistics || 2. 경영통계 : 변동성 척도 (표준편차, 변동계수(CV), IQR) & 연관성척도 (공분산(Cov), 피어슨상관계수) , 가설검정 개요

Awesomist 2023. 4. 26. 16:11
728x90

 

 

[변동성 척도] – Measure of Variability

 

* Standard deviation(표준편차)  
                                       →  Variance의 제곱근, 평균에서이 얼마나 분산되어 있는지 검토 가능

 

* Coefficieat of variation (변동계수): (=표준편차/평균*100), 표준편차를 상대적인 값으로 표준화 시킨 값
                                       → 상대값으로 변환해 규모의 효과 상쇄할 수 있음

 

* IQR (Interquartile range): (=Q3-O1)
                                       → Python / R 등의 통계 시각화에서 많이 활용하는 Boxplot

 

 

 


 

 

[연관성 척도] – Measure of Association


※ 특잇값 발견(정규화 활용) →  Z-score = (x-m)/s
※ 그룹 평균/분산 – 계급의 Median을 대표값으로 활용한다


 

* 통계적 추정에 기반한 비즈니스 의사결정 시 참고사항

* 연구자가 획득한 얻은 모집단의 일부 데이터를 기준으로 전체를 표현하기 때문에 필연적으로 오차(error)가 발생한다.
      → 오차를 줄일 수 있도록 분석목적과 데이터의 특징/유형에 따른 적절한 방법론 채택이 필수적
       → 의사결정시 오차의 크기를 계산해 해당 표본의 설명력을 함께 고려하는 비즈니스 의사결정 진행 필요
              (→ 가설검정의 필요성)


 

* 가설검정

    : 표본을 통해 도출한 결과가 전체를 얼마나 설명할 수 있는가를 검증하는 절차

* 신뢰수준 (Confidence Level) : 표본의 통계량 결과가 모집단을 설명할 수 있는 비율
* 유의수준 (Significance Level, α로 표시) : 표본의 통계량 결과가 모집단을 잘못 설명할 수 있는 비율

   ※ Confidence Level + Significance Level = 1
   ※ α = 0.05 ⇒ significance level : 5%
        (+ "This poll is considered accurate within 3.4%p, 19 times out of 20")

 

 

 

※ [참고] 대표적인 분석 목적 유형 (Problem Objective)
     : 목적과 데이터 유형에 따라 적합한 추정 및 가설검정 방식이 나누어짐
 
→ 1) 모집단 설명(Describing)

      2) 두 모집단 비교
      3) 둘 이상의 모집단 비교
      4) 두 변수 간 관계성 파악
      5) 둘 이상의 변수 간 관계성 파악

 

 

반응형
Comments