2025/04/08 3

GPT 통계분석 2 - 데이터 정제 (데이터 클리닝)

※ 본 문서에 포함된 내용은 필자의 GPT 사용 경험을 기반으로 작성된 것이다. GPT ADA의 실제 작동 방식은 사용자의 프롬프트, 이전 대화 내용, 버전, 랜덤성 등에 따라 달라질 수 있으며, 매번 동일한 결과를 보장하지 않는다. 데이터는 분석에 앞서 정제(cleaning) 작업을 해야 한다. 정제작업이란 데이터에 있는 처리 과정상의 오류를 찾아내서 수정하는 작업을 말한다. 이러한 정제작업은 그다음 단계인 데이터 변환 및 사전 검토 등을 모두 포함해서 전처리라고도 한다. 통계청이나 전문 생산기관에서 제공한 공개용 데이터는 대부분 이러한 정제 과정을 거쳤기 때문에 추가적인 처리가 필요 없는 경우가 많다. 그러나 조사 기관에 의뢰해서 직접 수집한 데이터의 경우, 이러한 작업이 완전하지 않을 수 있어 확인..

GPT 통계분석 1 - GPT ADA에 데이터 올리기

※ 본 문서의 내용은 필자의 GPT 사용 경험에 기반하고 있으며, GPT ADA의 실제 작동은 사용자의 프롬프트, 이전 대화 맥락, 버전 및 랜덤 요소에 따라 달라질 수 있다. 따라서 동일한 입력에도 항상 같은 결과가 생성되지는 않는다. GPT를 이용해 분석하려면 데이터 외에 분석정보 즉 변수정보와 분석목적 그리고 분석방법을 알려줘야 한다. 데이터가 작고 간단히 분석을 마칠 수 있으면, 데이터는 CSV 파일로 올리고, 분석정보는 채팅창에서 입력해도 된다. 하지만 변수가 많거나 분석을 반복해야 하는 경우에는 분석 정보도 파일로 올리는 것이 좋다. 채팅창으로 입력한 정보를 GPT가 기억하지 않기 때문에 세션이 바뀌거나 길어지면, 반복해야 하기 때문이다. GPT에게 데이터와 분석정보를 주는 순서는 (1..

〈라쇼몽〉에서 〈빨간모자의 진실〉까지: 진실은 어떻게 구성되는가 – GPT 시대의 소통과 서사에 대한 성찰

1. 서론: 질문이 바뀌었다 무엇이 ‘진실’일까? 정보 시대에 살고 있지만, 진실을 아는 것은 더 어려워진다. 과거에는 언론, 법정, 학계 등에서 제공하는 정보 중에서 선택하면 되었지만, 지금은 무엇을 신뢰할 수 있는지도 불확실하다. 이 글은 영화 〈라쇼몽〉과 애니메이션 〈빨간모자의 진실(Hoodwinked!)〉이라는 두 영화를 통해 오늘날 커뮤니케이션의 특징을 살펴본다. 2. 라쇼몽: 말은 많지만, 소통은 없다 구로사와 아키라 감독의 영화 〈라쇼몽〉(1950)은 한 무사와 그의 아내, 그리고 한 도둑이 얽힌 강간 및 살인 사건을 중심으로, 진실이 무엇인가를 묻는다. 사건의 경위는 단순하다. 숲속에서 무사가 살해당하고, 그의 아내는 도둑에게 능욕당했다. 그런데① 도둑(다조마루), ② ..