2025/04/10 3

PSM과 PSW: 성향점수(Propensity Score)를 이용한 분석

성향점수란?  성향 점수(Propensity Score)란, 어떤 사례가 특정 집단(예: 처치 집단, 찬성 집단 등)에 속할 확률을 해당 사례의 여러 특성을 바탕으로 예측한 값이다.  이 값은 로지스틱 회귀분석을 통해 산출되며, 0~1 사이의 확률로 표현된다. 2. 성향 점수는 언제 사용하나? 관찰 자료에서는 집단별로 공변량 혹은 오차변수(성별, 연령, 학력 등)의 분포가 다르기 때문에 집단간 비교가 어렵다.  성향 점수는  이러한 집단의 공변량을 하나의 수치로 요약한 것이다.  마치 여러 문항으로 구성된 심리검사 점수를 하나의 총점으로 나타내는 것과 같다. 3. 성향 점수의 예 두 동네가 있다고 가정해 보자. 위쪽 동네와 아래쪽 동네는 여러 면에서 서로 다르다. 옷을 입는 스타일도 다르고, 음식 취향도..

로지스틱 회귀분석 2: 해석방법과 GPT 프롬프트

4. 다항 로지스틱 회귀 예시 로지스틱 회귀는 이진형 종속변수에 주로 사용되지만, 종속변수가 세 개 이상의 범주를 가지거나 순서가 없는 범주형일 경우에는 다항 로지스틱 회귀(multinomial logistic regression)를 사용할 수 있다.소비자들이 A, B, C 중 어떤 브랜드를 선택하는지를 분석하고자 할 경우, 다항 로지스틱 회귀를 사용하여 B 또는 C 브랜드를 선택할 가능성을  A 브랜드에 대한 상대적 오즈비로 추정할 수 있다. 이 때 분석 결과가 아래와 같다고 가정하자: 비교 대상독립변수계수(β)오즈비(exp(β))p-value해석B vs A소득0.1821.200.028소득이 높을수록 B 브랜드를 선택할 가능성이 증가함B vs A나이0.0211.020.204나이는 B 브랜드 선택과 유의..

회귀분석 2025.04.10

로지스틱 회귀분석 1 : 이진형(binary) 종속변수

1. 로지스틱 회귀란 무엇인가?로지스틱 회귀는 종속변수가 이진형(binary)일 때 사용하는 회귀분석 기법이다.  일반적인 선형 회귀는 결과 값이 연속형일 때 적합하지만, 로지스틱 회귀는 결과가 '성공/실패', '예/아니오', '1/0'처럼 두 가지 범주로 나뉘는 경우에 적절하다.예를 들어,  교육 프로그램에 참여할 확률이나 상품 구매 여부를 예측하는 데 사용할 수 있다. 2. 왜 로지스틱 회귀를 사용하는가?선형 회귀분석을 이진형 종속변수에 사용하면 예측값이 0~1 범위를 벗어난다.  그래서 로지스틱 회귀는 독립변수의 선형 결합을 시그모이드 함수(logistic function)를 통해 변환하여 0과 1 사이의 값을 갖도록 한다. 이처럼 로지스틱 회귀는 비선형적으로 변환하는 과정을 거쳐 예측값을 산출하기..

회귀분석 2025.04.10