■ 집단 구조를 반영해야 하는 이유
사회과학 데이터 중에는 집단 내 종속성을 가지는 경우가 있다. 예를 들어 학생은 학교에, 환자는 병원에 소속되어 있고, 근로자는 회사에 소속되어 있다. 이렇게 집단에 속한 개인들을 대상으로 분석할 때는 각 개인이 갖는 독립변수 외에, 소속된 집단의 특성이 미치는 영향을 함께 고려해야할 경우가 있다. 즉, 학생의 성적에는 개인의 성별이나 공부 시간 같은 개인 속성뿐 아니라, 사립학교 여부나 학교 규모, 교육환경 같은 학교 차원의 특성도 함께 작용한다고 보고, 그것을 분리해서 파악해야 개인이나 학교의 특성이 갖는 효과를 제대로 분석할 수 있을 것이다.
이러한 계층적 구조를 반영하지 않고 일반적인 단일 수준 회귀모형으로 분석하면, 집단의 효과가 개인 속성의 효과에 섞여서 나타날 수 있다. 다시 말해, 개인의 가정환경이 미치는 영향과 학교의 유형이나 자원 같은 집단 효과가 분리되지 않고 혼재되면, 개인 특성의 영향이 과대되거나 과소될 수 있다. 이 분석의 핵심은 바로 그 분리를 가능하게 하는 데 있다. 개인 수준의 변수와 집단 수준의 변수를 구분해서 분석함으로써, 두 수준에서 독립적으로 어떤 요인이 중요한지를 파악할 수 있는 것이다.
■ 다층모형은 기존 회귀모형의 확장
분석 방식은 기존의 단일 수준 분석에 계층 구조를 고려하는 요소를 추가하는 방식으로 확장된다. 예를 들어, 가장 기본적인 선형 회귀모형(OLS)은 다음과 같은 형태를 갖는다.
하지만 다층모형에서는 여기에 집단(학교) 수준의 차이를 반영하는 항을 추가한다. 예를 들어, 학교별로 성적 평균이 다를 수 있으므로, 다음과 같은 방식으로 학교마다 다른 절편을 갖는 구조로 바꾼다.
이 구조를 통해, 다층모형은 각 학교의 평균 성적이 다를 수 있다는 사실을 모델 안에
자연스럽게 반영하며, 그 차이를 개인 차이와 분리해서 추정할 수 있게 된다.
■ 다층모형의 유형과 적용 범위
이러한 계층적 데이터를 분석하기 위해 사용하는 대표적인 모형은 다음과 같다.
- 선형 혼합모형(LMM):
기존의 선형 회귀(OLS)에 다층 구조를 결합한 형태로, 종속변수가 연속형일 때 사용한다. - 일반화 선형 혼합모형(GLMM):
일반화 선형모형(GLM)의 구조에 다층 구조를 결합한 것으로, 종속변수가 이항형(예: 성공/실패), 카운트형(예: 발생 횟수) 등 정규분포가 아닌 경우에 폭넓게 적용된다. 즉, GLMM은 매우 포괄적인 틀로, 로지스틱 회귀나 포아송 회귀 등 다양한 데이터 유형에 적용할 수 있는 범용적인 다층모형이다. - 다층 로지스틱 회귀 / 다층 포아송 회귀:
이들은 GLMM의 구체적인 하위 유형으로, 종속변수가 각각 이항형 또는 카운트형일 때 사용된다. 즉, GLMM이라는 큰 범주 안에 포함되며, 보다 구체적인 상황에서 명시적으로 적용되는 분석이다. 따라서 이 두 모형은 GLMM의 특수한 형태이며, 적용 대상이 보다 좁고 명확하다고 할 수 있다.
■ 고정효과와 무작위효과
다층모형에서는 집단 단위를 모델에 포함시키는 방식에 따라 고정효과(fixed effects)와 무작위효과(random effects)로 나뉜다.
- 고정효과는 집단의 수가 적고, 각 집단의 차이를 명시적으로 추정하고자 할 때 사용된다. 예를 들어 4~5개 학교가 대상이라면, 학교별 효과를 각각 추정하여 해석할 수 있다.
- 반면 무작위효과는 집단이 모집단에서 임의로 추출된 것으로 간주될 때 적합하며, 집단 간 차이를 분산 구조로 모델링한다. 이 경우, 집단 수준의 속성(예: 학교의 규모, 공립/사립 여부 등)을 추가하여, 집단 특성이 개인 수준 결과에 어떤 영향을 미치는지 분석할 수 있다.
■ 일반 회귀분석과의 차이
일반 회귀분석은 모든 관측치를 독립적으로 다루므로, 집단 간 차이를 반영하지 못하고 개인 간 차이로만 설명하려는 경향이 있다. 반면, 다층모형은 집단 내 종속성과 집단 간 차이를 함께 고려하여 분석 결과의 해석력을 높이고, 분산 추정의 정확성을 확보할 수 있다. 특히, 집단의 특성이 결과에 강한 영향을 미칠 것으로 예상될 때, 다층모형은 매우 효과적인 분석 도구가 된다.
'회귀분석' 카테고리의 다른 글
회귀분석 계통도 6- 베이지안 회귀 - 사전 지식과 소표본 (0) | 2025.04.06 |
---|---|
회귀모형 계통도 5: 유연한 비선형 회귀- GAM, 스플라인 회귀 (0) | 2025.04.06 |
회귀분석 계통도4- 일부만 보이는 데이터: 절단, 검열, 선택, 구조적 0 (0) | 2025.04.05 |
회귀모형 계통도2 - 일반화 선형모델(GLM) - 링크함수로 확장 (0) | 2025.04.05 |
회귀모형 계통 1 - 선형 회귀와 그 변형 : 회귀분석의 출발점이자 확장의 기반 (0) | 2025.04.05 |