카테고리 없음

AI 여론분석의 가능성: 담론분석과 내용분석을 활용한 새로운 접근

skcho 2025. 11. 18. 09:29

1.  AI로 여는 사회적 경청시대

경청은 흔히 “듣는 일”로 이해되지만, 실제로는 말의 표면뿐 아니라 숨은 전제와 맥락까지 함께 읽는 적극적 행위다.
개인적 차원에서는 AI가 이러한 해석을 도와주는 보조 도구 역할을 할 수 있다.
예를 들어 은유나 완곡어법, 맥락 의존적 표현처럼 사람이 놓치기 쉬운 의미를 여러 방향에서 해석해 주는 식이다.

그러나 이 글의 관심은 개인적 경청이 아니라, 사회 전체의 의견을 어떻게 들을 것인가에 있다.
온라인 공간의 정보량이 폭증하고 왜곡도 심화되는 지금, AI가 여론을 읽어내는 방식은 개인적 해석 보조보다 훨씬 큰 의미를 갖는다.


2. 사회적 경청: 기존 방식의 한계와 새로운 제안
사회 전체의 의견을 듣는 과정에서 지난 100여년 동안 가장 널리 인정받아 온 방식은 여론조사다. 표본설계·질문지·조사 절차가 정교하게 마련되어 있고, 정부·언론·연구기관에서 표준처럼 사용되어 왔다. 한국의 경우는 이러한 여론조사 방법 중에서도 전화여론조사가 가장 널리 이용되고 있다. 그렇지만 실제 운영에서는 다음과 같은 구조적 문제를 안고 있다.

  • 전화조사는 응답률 하락으로 대표성 확보가 어려워졌고
  • 낮과 밤 모두 응답하기 힘든 사람들이 많아졌으며
  • 아예 전화를 받지 않는 집단도 커졌다.

이로 인해 ‘누가 응답 가능한가’가 ‘무엇을 응답했는가’보다 더 중요한 결정 요인이 되어가고 있다.

비용·시간 문제를 줄이기 위해 온라인 조사가 급속히 늘었지만, 이는 또 다른 편향을 낳았다. 예컨대 한국의 경우 온라인 패널은 고학력·사무직·20~40대·정치적으로는 진보 성향이 과대표집된다는 지적이 꾸준히 제기된다. 비용·속도 면에서는 장점이 있지만, 대표성 문제는 여전히 해결되지 않았다.

  Seol, D.-H., Jang, D.-H., & LoCascio, S. P. (2023). RDD With Follow-Up Texting: A New Attempt to Build a Probability-Based Online Panel in South Korea. Asian Journal for Public Opinion Research, 11(3), 257-273. https://doi.org/10.15206/ajpor.2023.11.3.257 AJPOR+1
이 논문에서는 한국의 온라인 패널 조사에서 고학력자 및 화이트칼라 직군이 과대표집(over-representation) 되는 문제를 확인하고, 대표성 확보를 위한 확률표본 기반 패널 구축의 어려움을 제기하고 있습니다. 

또한 게시판·SNS·커뮤니티의 글을 대량 수집해 sentiment 분석·word cloud·빈도 분석 등으로 정책 반응을 파악하는 시도도 많아졌지만, 이는 구조적 한계를 갖는다. 단어만 세기 때문에 맥락이 왜곡되기 쉽고, 의견이 아니라 ‘반복된 광고성 문장’이나 ‘봇의 발화’가 전체 분위기를 지배하는 경우도 잦다. 온라인 여론의 난점을 해결하기에는 충분하지 않다.


3. 내가 제안하는 “AI 담론분석”의 관점

여기서 주목하는 개념이 **‘AI 기반 담론 및 내용분석’**이다.
이 용어는 기존에 정립된 하나의 방법론을 지칭하는 것이 아니라, 내가 이 글에서 새롭게 제안하는 접근 가능성에 가깝다.


✦ 전통적 담론분석: 의미·정체성·권력 구조를 읽어내는 해석적 접근

전통적 담론분석은 언어학·사회학·사회언어학에서 발전한 분석 방식으로,

사람과 집단이 언어를 통해 의미·관계·정체성·권력 구조를 어떻게 구성하는가를 해석하는 방법

이다.
즉, 담론분석은 여론조사나 여론 측정 도구가 아니며,
언론보도·정책 갈등·사회적 프레임·젠더·환경·위험 담론 등에서 담론 자체의 구조와 의미를 분석하는 데 사용되어 왔다.

따라서

“어떤 담론이 사회 전체의 여론을 대표하는가?”
는 전통적 담론분석의 범위 밖에 있다.


✦ 전통적 내용분석: 텍스트를 체계적으로 분류·계량화하는 방식

내용분석(content analysis)은 사회과학에서 널리 사용되는 체계적·계량적 텍스트 분석 방법이다.

핵심 특징은 다음과 같다.

  • 텍스트를 일정한 기준(주제, 키워드, 발화 유형 등)에 따라 코딩(coding)
  • 특정 요소의 발생 빈도패턴을 계량적으로 측정
  • 연구자 간 합의가 가능한 규칙 기반 분석
  • 신문기사·광고·정책 문건·인터뷰 기록 등 다양한 문서에 적용

전통적 내용분석은 비교적 안정적·반복 가능한 분석이 가능하지만,

  • 의미의 층위
  • 발화의 맥락
  • 서사 구조
    등을 충분히 반영하기 어렵다는 한계가 있다.  그리고 연구자의시간과 노력이 많이 요구하기 때문에  텍스트의 양이 폭발적으로 많아진 요즘에는 널리 이용되지는 않는다.

 

요즘에는 온라인 여론을 빠르게 파악하기 위해 워드 클라우드, 감성분석(sentiment analysis), 단어 빈도 분석 같은 자동화 텍스트 분석이 가장 널리 사용된다. 하지만 이 방식들은 단어의 등장 횟수나 긍·부정 비율을 중심으로 하기 때문에, 발화의 맥락·전제·의도·서사 구조를 충분히 반영하지 못한다. 또한 반복된 게시물이나 광고성 문구, 봇 계정의 대량 발화가 그대로 반영되어 오히려 여론이 왜곡되기도 한다. 이런 이유로 현재 널리 활용되는 온라인 텍스트 분석은 빠르지만 얕은 분석에 머물러 있으며, 사회적 여론의 구조를 읽기에는 뚜렷한 한계를 갖고 있다


✦ 내가 제안하는 AI 기반 접근: 담론분석의 깊이 + 내용분석의 체계성

내가 제안하는 AI 기반 담론·내용분석은 다음과 같은 발상을 바탕으로 한다.

  1. 담론분석의 장점
    • 의미·서사·맥락·프레임 파악 능력
  2. 내용분석의 장점
    • 체계적 분류, 패턴 측정, 집단 비교 가능
  3. AI의 장점
    • 대규모 텍스트 자동 처리
    • 발화 단위·감정 흐름·전제·역할 구조 탐지
    • 봇·중복·조작 발화 필터링

즉, AI는

  • 담론의 ‘깊이’를
  • 내용분석의 ‘체계성·확장성’과 결합해
    온라인이라는 거대한 텍스트 공간을 분석하는 새로운 방식이 될 수 있다.

이 방식은 아직 정립된 방법론이 아니며 제안 단계에 불과하지만,
기존 여론조사나 전통적 텍스트분석이 포착하지 못했던 여론의 구조적 측면을 탐색할 수 있는 가능성을 제공한다.

 

 

 

✦ 구체적 방법

1. 전화조사에 ‘자유응답식 질문’을 결합하는 방식

기존 전화조사는 대부분 구조화된 질문지를 기반으로 한다. 연구자가 설계한 선택지에 응답자가 맞추어야 하므로, 응답자의 실제 경험·사유·감정은 구조적으로 제한될 수밖에 없다.
하지만 자유응답식 질문을 활용하면 다음과 같은 차이가 생긴다.

  • 응답자가 자기 언어로 설명
  • 선택지가 아닌 경험·사유·가치 기반의 표현 가능
  • 응답이 훨씬 구체적·서사적이 됨
  • 의견의 층위(감정·이유·전제·요구)를 더 풍부하게 포착

이 방식은 기존 여론조사보다 훨씬 폭넓은 의견을 듣는 방식이 될 수 있으며, AI가 이를 구조화하면 무척 높은 활용도가 될 수 있다.
다만, 전화조사가 기본적으로 갖는 응답 가능한 사람만 응답한다는 구조적 제한은 여전하다.

2. 언론보도 분석의 자동화

언론보도는 전통적으로 사회적 여론을 반영·재구성하는 중요한 창구다. 그러나 언론보도 내용을 정밀하게 분석하는 일은 노동집약적이다.
지금까지는

  • 단어 빈도
  • 주제 분류
  • 긍·부정 스코어
    등 기계학습 기반 텍스트 분석 기법이 주로 사용되었다.
    하지만 이 방식은 다음과 같은 제한이 있다.
  • 단어 중심의 분석
  • 맥락·전제·서사 파악의 어려움
  • 의미 단위를 조합해 전체 논리를 읽기 어려움
  • 프레임 전환이나 미세한 뉘앙스 감지의 한계

반면 LLM 기반 분석은

  • 단어 수준이 아니라
  • 의미 구조, 맥락, 발화의 기능, 프레임 흐름
    을 파악할 수 있어, 언론보도 분석의 깊이를 크게 확장할 가능성이 있다.

✦ 온라인 전체로의 확장 가능성

언론보도에서 출발한 자동화 분석은 다음 영역으로 자연스럽게 확장될 수 있다.

  • 커뮤니티
  • SNS
  • 댓글
  • 각종 포럼
  • 정책 관련 질의 게시판

즉, 사회 전반의 문자 기반 메시지를 종합적으로 분석하는 기반이 마련될 수 있다.

이 역시 아직 제안 단계의 가능성이며, 실제로 AI가 (1) 담론을 정확히 분석할 수 있는가, (2) 그 담론이 어떤 집단에서 공유되고 있는가를 판단할 수 있는가, 는 향후 검증이 필요하다.
그럼에도 이 가능성 자체는 기존 방식이 해결하지 못한 사회적 경청의 문제를 보완할 수 있는 중요한 방향이 된다.


4. AI 담론분석이 갖는 잠재적 가능성
AI가 기반이 된 담론분석은 다음과 같은 잠재적 가능성을 갖는다.
모두 ‘가능성’일 뿐이며, 실제 성능과 효용은 향후 검증이 필요하다.

  • 기존 텍스트 분석보다 더 깊은 분석 가능성: 감정의 흐름, 사건-감정-요구의 서사 구조, 피해자·행위자·관찰자 같은 역할 도출 가능
  • 봇·중복·조작 계정 제거 가능성: 반복·복사·동원형 발화 식별
  • 자유서술 기반 의견 분석 가능성: 구조화된 질문 없이 자기 언어로 표현한 응답을 AI가 처리
  • 게시판·댓글·여론보도 분석의 상시화 가능성: 과거 비용이 커서 드물던 분석을 더 자주·정밀하게 수행

이것은 여론을 듣는 빈도와 품질을 동시에 높이는 방향이다.


5. 민주주의적 의미
여론조사가 “보이지 않던 의견”을 보이게 만든 기술이었다면,
LLM 기반 사회적 경청은 이를 더 깊고 정확하게 파악하는 단계로 확장한다.

  • 왜곡된 잡음의 제거
  • 조용한 다수의 의견 복원
  • 감정·가치·욕구의 정교한 구조화
  • 실제 맥락 기반의 여론 파악
  • 누구나 부담 없이 참여할 수 있는 구조
  • 더 낮은 편향과 더 높은 대표성

이는 민주주의 연구에서 말하는 **반응성(responsiveness)**과 **숙의(deliberation)**의 강화 방향이다.


6. 결론
AI 기반 사회적 경청은 단순한 분석기술을 넘어, 여론을 듣는 방식의 빈도·대표성·정교함을 모두 향상시킬 수 있다.

  • 큰 목소리의 과장은 줄고
  • 차분한 시민의 언어가 복원되며
  • 자유서술 기반 응답으로 참여가 쉬워지고
  • 게시판·댓글·보도 분석이 일상화되며
  • 정책·행정·언론은 더 정확한 여론을 기반으로 판단할 수 있다.