본문 바로가기

취미생활/데이터 사이언스

통계란? 그리고 통계기법들

* 직감에 의한 마케팅에서 근거에 의한 마케팅 기획으로

* 문제점과 기회영역의 도출
 모든 경영활도잉 그렇듯이 마케깅 전략 역시 문제점과 새로운 기회영역을 탐색하고, 그 문제점을 해결하거나, 기회영역에서 성취하기 위해 이루어지는 활동이다. 

* 성공과 실패의 원인 규명
 성과를 정확히 파악하는 것만큼이나 성공과 실패의 원인을 명확하게 규명하는 것이 필요하다. 희귀분석이나 분산분석과 같이 독립변수에 의한 종속변수의 변화를 설명할 수 있는 통계분석 기법들은 일종의 인과관계를 통계적으로 규명할 수 있는 방법론을 제공한다.

1. 기초 통계분석 기법
기초 통계분석 기법은 주로 분석하고자 하는 변수가 하나 또는 두개 정도로 비교적 단순한 통계분석에 활용 되는 기법들을 의미한다. 따라서 기초 통계분석 기법들은 그 자체만으로 중요한 분석결론을 유도하기보다 전반적인 현황을 파악하거나, 추후 고급분석기법을 적용하는 전단계에서 탐색적으로 활용하는 경우가 많다.

*기술통계량 
가장 기초적인 통계치 즉, 평균, 분산, 표준편차, 빈도, 비율 최빈값, 중위값 등의 기본적인 통계값을 의미한다. 전반적인 현황을 검토하거나 외형적인 차이를 파악하기 위해 사용한다. 

*T-검정
특정 수치형 변수에 대해 두집단간의 차이를 통계적으로 검증할 때 주로 사용하며, 단일표본 t-test, 독립표본 t-test, 쌍체표본 t-test가 있다. 

단일표본 t-test : 예상하는 평균값이 통계적으로 유효한지 검증할 때 사용
독립표본 t-test : 완전히 독립적인 두집단의 평균차이가 통계적으로 유의한지 판단할 때 사용.
쌍체표본 t-test : 동일하지만 특정 사건이나 실험에 의해 두 개의 다른 시점으로 분류될 수 있는 그룹들간의 평균차이가 통계적으로 유의한지 판단 할 때 사용. 

*상관관계분석
두 개 이상 변수들간의 상관관계가 존재하는지를 통계적으로 검증할 때 사용하는 기법.

*범주형 테이터 분석(카이제곱 (chi-square)검정)
 명목척도로 구성된 변수들간의 연관이 있는지 혹은 독립인지를 판단하는 통계적 검정방법. 

*신뢰성 분석
신뢰성이란 일관성과 같은 의미이므로 신뢰성 분석은 특정 변수의 측정값들이 일관된 수준으로 나타나고 있는지를 판단하는 분석기법이다.


2.인과관계 분석기법
최소 2개 이상의 변수들을 원인변수와 결과 변수로 구분하여 변수들간의 인과관계를 파악하고 검증하기 위한 분석기법들을 의미한다.

*분산분석
 3개 이상의 집단에 대한 평균 값의 차이를 검정하는 통계분석 기법이 분산분석이다. 집단간의 차이를 규명하는데에도 쓰이지만, 그룹 또는 집단을 분류하는 변수를 독립변수로 비교대상이 되는 층정변수를 종속변수로 생각하면 분류변수에 의한 측정변수의 인과관계를 검정할 수도 있다. 

* 희귀분석
 하나 이상의 수치형 변수들을 독립변수로 또 다른 결과적인 수치형 변수를 종속변수로 설정하여 개별 독립변수의 변화가 종속변수의 변화에 어떻게 영향을 미치는지 판단하여 독립변수들의 값이 주어졌을 때 종속변수 값을 예측하거나 독립변수와 종속변수간의 인과관계를 검증할 수 있는 통계분석이다. 
 
* 요인분석
 하위 구성요소를 갖는 상위 변수를 요인이라고 할 때 요인과 하위 구성 변수들의 구조가 적절한지 판단하는 다변량 통계분석 기법이다. 즉 개별 하위 측정변수들이 상위 요인으로 적절히 묶일 수 있느냐를 판단하는 것이다. 

* 판별분석
희귀분석과 마찬가지로 도립변수들과 종속변수간의 인과관계를 판단하는 기법으로 이해 할 수 있지만, 종속변수가 아닌 이분형 또는 다분형 분류변수이기 때문에 수치 값을 예측하기 보다 특정그룹으로 분류되는 결과를 예측한다. 


3. 기타 다변량 통계분석 기법
인과 관계를 검증하기 보다는 각 분석 기법이 목표로 하는 특정한 분석 용도에 따라 활용되는 분석기법.

* 군집분석
 군집분석은 개체의 속성들을 바탕으로 개체간의 거리를 계산한 후 가까운 개체를 동일한 집단으로 형성해나가는 통계분석 기법이다. 군집분석은 명확한 분류기준에 의해 집단을 분류하는 일반적인 세분화 기법과는 다르게 어떻게 집단을 나누는 것이 좋을지에 대한 사전정보가 불명확할 때 수행하는 집단 분류 기법이다. 

* 컨조인트 분석
 상품/서비스와 같이 다양한 속성들의 조합으로 구성될 수 있는 개체들을 몇 가지 대안으로 만들고 각 대안들에 대한 고객들의 평가결과를 수집함으로써 상품/서비스를 구성하는 개별 속성들 간의 상대적 중요도와 효용 가치를 추정하고, 가장 반응률이 높을 대안을 선정할 수 잇는 통계분석 기법이다. 

* 비모수통계분석
 모수에 대한 가정을 전제하지 않고 모집단의 형태에 관계없이 주어진 데이터만으로 직접 확률을 계산하여 통계적 검증을 수해하는 통계분석 기법들을 통칭하는 표현이다. 

통계는 통계학 자체를 연구하는 통계학자가 아닌 이상 데이터 분석을 통해 과학적이고, 객관적인 근거를 확보하여 유효한 의사결정을 내리기 위한 일종의 도구.

'취미생활 > 데이터 사이언스' 카테고리의 다른 글

ADsP 자격증 DAY - 3  (0) 2023.08.03
ADsP 자격증 DAY - 2  (0) 2023.08.03
ADsP 자격증 DAY - 1  (0) 2023.08.03
데이터 용어 정리  (0) 2021.11.28
데이터 분석 전문가  (0) 2021.11.27