로지스틱 회귀 2

회귀모형 계통도2 - 일반화 선형모델(GLM) - 링크함수로 확장

일반적인 선형회귀모형(OLS)은 종속변수가 정규분포를 따른다고 가정하고, 예측값은 독립변수의 선형결합으로 표현된다. 그러나 현실에서는 종속변수가 연속형이 아닌 경우도 많다. 예를 들어, 성공/실패처럼 이항형(binary outcome)이거나, 어떤 사건의 발생 횟수처럼 카운트 자료일 수도 있다. 이러한 경우에는 기존의 선형회귀모형을 그대로 적용할 수 없고, 종속변수의 특성에 맞는 다른 분포를 고려해야 한다. 이럴 때 사용하는 것이 일반화 선형모형(GLM, Generalized Linear Model)이다.GLM에서는 먼저 설명변수들의 선형조합으로 선형 예측자(linear predictor)를 계산하고, 이를 링크 함수(link function)에 적용해 최종 예측 값을 산출한다. 이때 링크 함수는 데이터..

회귀분석 2025.04.05

회귀분석, 어떻게 선택할까? - 종속변수에 따른 회귀모형 선택법

– 어떤 회귀모형을 쓸까?  회귀분석은 사회과학에서 인과관계를 분석할 때 매우 널리 사용된다.  분석 과정이 비교적 직관적이고, 결과 해석도 간명하기 때문이다.  특히 혼란변수(Confounder)를 통제하면서 특정 독립변수가 종속변수에 미치는 영향을 분석할 수 있다는 점에서 유용하다.하지만 회귀분석에는 생각보다 다양한 변형 기법이 존재하고, 이로 인해 분석 방법을 선택할 때 혼란을 겪는 경우도 많다. 그래서 이 글에서는 종속변수의 성격에 따라 어떤 회귀모형이 적절한지 정리보았다.논문을 읽을 때나 직접 분석할 때, 종속변수가 어떤 특성을 갖고 있는지, 그리고 그에 적합한 회귀모형은 무엇인지 살펴볼 필요가 있다.  회귀분석의  중요 가정: 종속변수의 분포기본적인 선형 회귀분석에서는 종속변수가 연속형이고  ..