요청 사항 (분석 관련) 8

요인 부하치 해석 기준

관찰된 여러 변수가 실제로는 소수의 잠재적 요인들을 나타내 준다고 보고, 그러한 요인들을 찾아내는 분석이다. 따라서 각각의 변수가 어떤 잠재요인과 관련되어 있는가를 부하치로 통해서 판단하게 된다. 그런데 이 기준에 따라 요인분석결과에 대한 해석이 달라질 수 있기 때문에 중요하다.  여기서 요인 부하치는 요인분석에서 각 변수(문항)가 잠재적 요인과 얼마나 관련이 있는지를 나타내는 지표다.   부하치가 높을수록 해당 변수가 특정 요인을 잘 설명하고 있다는 것을 의미하며, 그 변수가 해당요인을 순수하게 (pure) 측정한다는 것을 나타낸다. 요인분석 결과를 해석할 때 어느 정도의 부하치를 기준으로 해야 하는가는 연구자의 판단이기는 하나,  Tabachnick and Fidell(2019)는 .32이상이면 해석..

크론바흐 알파(Cronbach's Alpha) 해석 기준

많은 연구에서 '소외도', '만족도', '공동체 의식' 과 같은 개념들을 측정할 때 단일 문항을 이용하기도 하지만 타당도나 신뢰도를 높이기 위해 여러 문항을 사용하는 경우가 많다.  이러한 경우 결과를 제시할 때 측정의 신뢰도가 어느 정도인지를 측정해서 제시해야 하는데 이 때 크론바흐 알파가 많이 이용된다.  크론바흐 알파(Cronbach's alpha)는 여러 문항(질문)으로 구성된 척도가 하나의 개념(construct)을 얼마나 일관되게 측정하고 있는지를 평가하는 내적 일관성 지표다. 값은 0~1 사이이며, 값이 클수록 문항 간 일관성이 높다는 것을 나타낸다. 알파값의 해석에 대해서 Nunnally (1994)는 두 가지 경우로 나누어 설명하고 있다. . 집단 간 차이 등을 분석하기 위한 측정: al..

통계적으로 유의하지 않게 나왔을 때: 분석의 검증력을 검토해야

데이터 분석에서는 종종 이론적 예측과 다른 결과가 나올 수 있다. 그 이유는 이론이 틀렸기 때문일 수도 있지만, 분석의 검증력이 부족해서 실제 효과를 제대로 찾아내지 못했기 때문일 수도 있다.검증력(power)은 실제로 존재하는 차이나 관계가 있을 때, 이를 발견해 낼 수 있는 능력을 말한다.  검증력이 약하면, 실제로 효과가 있더라도 통계적으로 유의하게 나오지 않을 수 있다.  이론이 옳더라도, 데이터 분석이 그것을 입증해주지 못하는 것이다.  그래서 분석의 결론을 내리기 앞서, 분석이 충분한 검증력을 확보하고 있었는지를 살펴보아야 한다.  다음은 검증력을 높일 수 있는 다섯 가지 방법이다.  1. 유의수준  조정일반적으로 사용되는 유의수준(α)은 0.05이지만, 연구 목적에 따라 0.1로 완화할 수도..

회귀분석, 어떻게 선택할까? - 종속변수에 따른 회귀모형 선택법

– 어떤 회귀모형을 쓸까?  회귀분석은 사회과학에서 인과관계를 분석할 때 매우 널리 사용된다.  분석 과정이 비교적 직관적이고, 결과 해석도 간명하기 때문이다.  특히 혼란변수(Confounder)를 통제하면서 특정 독립변수가 종속변수에 미치는 영향을 분석할 수 있다는 점에서 유용하다.하지만 회귀분석에는 생각보다 다양한 변형 기법이 존재하고, 이로 인해 분석 방법을 선택할 때 혼란을 겪는 경우도 많다. 그래서 이 글에서는 종속변수의 성격에 따라 어떤 회귀모형이 적절한지 정리보았다.논문을 읽을 때나 직접 분석할 때, 종속변수가 어떤 특성을 갖고 있는지, 그리고 그에 적합한 회귀모형은 무엇인지 살펴볼 필요가 있다.  회귀분석의  중요 가정: 종속변수의 분포기본적인 선형 회귀분석에서는 종속변수가 연속형이고 정..

회귀분석에서 다공선성 파악 및 대처 방법

독립변수 간에 상관관계가 높으면 회귀분석 결과의 해석이 여러 모로 어려워진다. 이럴 경우 그대로 분석하지 않고,  해결하거나 또는 해석상에 고려해야 한다. 우선 다공선성이 의미하는 바를 알아보자.   다공선성(multicollinearity)은 독립변수가 다른 독립변수와 중복되는 것을 나타내는데,   VIF(분산팽창지수)와 Tolerance를 사용해서 그 존재를 확인한다.Tolerance는 1 - R²로 계산되며,  R square는 해당 독립변수를 종속으로 그리고 다른 독립변수들을 독립으로 회귀분석을 실시했을 때의 설명량이다.  즉 Tolerance는  다른 독립변수들로 설명되지 않는 독립변수의 변량을 나타낸다.  Tolerance의 역수가 VIF와 동일한 값을 가지므로, 두 지표는 동일한 정보를 제공..

유의미하지 않은 통계적 결과: 해석과 처리 방법

통계분석 결과가 유의미하지 않게 나온 경우의 결과는 최종 결과 표와 해석에서 제시하거나 해석할 필요가 없다. 예를 들어, 회귀분석에서  어떤 독립변수의 회귀계수가  b=0.08 (p .0.204)와 같이  유의도하지 않게 나타났다고 하자.  이 경우 b 값을 해석해 줄 필요가 없다.   분석결과에서 나온 계수들은 표본의 특성을 반영하는 것이다. 그러나 연구의 궁극적인 목적은 표본의 특성을 파악하는 것이 아니라 전집(population)의 특성을 추론하는 데 있다. 즉, 표본을 바탕으로 전집에 대한 추정이 이루어져야 한다. 만약 유의도 검증 결과가 예를 들어 p > 0.05와 같이 나왔다면, 이는 표본에서 발견된 결과가 전집에 대해서는 존재하지 않을 가능성이 크다는 것을 의미한다. 따라서, 이러한 경우에는..

작은 표본의 위험: 회귀분석을 위한 최소 표본 크기는?

회귀분석을 위해서는 독립변수의 약 10배 정도의 사례가 필요하다고 하지만,  더  작은 표본으로도 데이터의 패턴을 적절히 추출할 수 있다는 연구도 있다.  또한 연구자가 예상하는 효과 크기를 바탕으로 표본 수를 계산하여 정할 수 있다는 접근법도 존재한다.그러나 사회과학 분야에서 작은 표본이 가지는 위험성은 단순히 표본 크기가 작다는 점을 넘어서, 더 중요한 문제가 있을 수 있다. 따라서 표본 크기 자체 보다는 이 점을 확인해야 한다.사회과학 분야의 작은 표본은 대체로 무작위 표집(random sampling) 방식으로 전집에서 추출되지 않는 경우가 많고,  따라서 전집의 특성이 충분히 반영되지 않았을 가능성이 크다.  특히 독립변수의 변동성이 충분하지 않을 가능성이 높다. 예를 들어, 농장의 규모와 농장..

동등성 검증 (Equivalence Test) 실행방법 (JASP 이용 TOST test)예

Jasp에서 확장메뉴 중 Equivalence Test 모듈을 이용해서 동등성 검증을 해 보자.한국인의 의식가치관 조사에서 성별을 독립변수로 그리고 자유주의적 가치관 점수 (7점만점)를 종속변수로 해서 ‘남녀간에 자유주의적 가치관에 차이가 없다’는 것을 검증하였다. 먼저 t-test에서 Leven의 Equality of variance를 실한 결과 결과에서 보듯이 등변량 가정이 유지되었다.   Equivalence test 메뉴화면은 다음과 같이 한 화면에서 모든 선택을 할 수 있다. 테스트 옵션은 다음과 같이 선택한다1) 등변량 가정이 유지되었으므로 Student를 택한다. 등변량 가정이 유지될 수 없으면 Welch를 택하면 된다.2) 동등성 영역(Equivalence Region)은 효과크기 0.1로..