데이터 리터러시

데이터 시대의 필수 역량: 데이터 문해력 (데이터 리터러시)을 갖추자

skcho 2025. 3. 7. 11:58

데이터 홍수 속에서 길을 잃지 않으려면

 

우리는 지금 데이터 홍수 시대를 살아가고 있다. 통계청에서 발표하는 국가 통계만 해도 1,300종이 넘고, 공공데이터 포털에서는 75천 건에 달하는 데이터 파일이 제공된다. 데이터를 전문적으로 기탁 받아 이용자가 활용할 수 있도록 지원하는 데이터 기탁소 (data repository)20253월 기준 전 세계에 2,300 곳이 넘는다. 게다가 스마트폰, 소셜 미디어, 각종 센서를 통해 방대한 데이터가 끊임없이 쌓이고 있다.

 

그러나 데이터 자체는 원석(原石)과 같다. 아무리 많은 데이터를 가지고 있어도, 내가 그 데이터 안에서 의미 있는 정보를 추출하지 않으면 아무런 가치가 없다. 데이터는 가지고 있는 것이 중요한 것이 아니라 어떤 정보를 추출할 수 있는가가 중요하다.

 

데이터는 전문가만의 영역이 아니다.

 

데이터 문해력(리터러시)는 이러한 숨겨진 정보를 찾아내서 활용할 수 있는 역량을 의미한다. , 데이터를 읽고, 이해하고, 분석하며 이를 실질적으로 활용할 수 있는 역량을 뜻한다. 오늘날과 같이 데이터를 기반으로 현재를 진단하고 미래를 예측하는 시대에는 전문가의 경험과 직관보다 데이터를 다룰 수 있는 능력을 필수적으로 갖추어야 할 것으로 보인다. 국가정책 수립부터 기업의 영업전략, 그리고 개인적인 문제 해결에 이르기까지 데이터가 사용되기 때문이다. 앞으로 개인의 역량을 평가하는 데에도 데이터 문해력이 중요한 요소가 될 것이다.

 

지금까지 데이터 활용은 갖추기 어려운 것으로 인식되었다. 인공지능(AI), 머신러닝, 빅데이터 분석 등 새로운 기술과 알고리즘이 끊임없이 등장하며, 데이터 분석이 마치 전문가들만의 영역처럼 보이게 한다. 그래서 많은 사람이 이렇게 생각한다.

 

데이터 분석은 전문가만 할 수 있는 거야.”

코딩을 해야 하는데, 나는 그럴 시간이 없어.”

도대체 어디서부터 무엇을 공부해야 할지 모르겠어.”

 

그러나 이렇게 미리 압도될 필요는 없다. 우리가 그동안 데이터에 대한 교육을 제대로 받아본 적이 없다는 점을 생각하면 어렵게 느껴지는 것이 당연하다. 데이터 과학이라는 것이 통계학자, 전산 분석가, 데이터 엔지니어 등 수 많은 전문가가 일하는 분야인데 기초적인 공부도 하지 않은 일반인이 이를 어렵게 느끼는 것은 자연스러운 일이다.

 

따라서 너무 성급하게 특정 기법을 배우려 하기보다, 먼저 데이터 전반에 대한 이해를 쌓는 것이 중요하다. 데이터가 생산되어 소비되는 과정, 그리고 그 과정에서 발생할 수 있는 오류들을 이해하면, 자연스럽게 데이터 이용에 대한 감각이 생긴다. 그러다 보면 데이터를 읽고 활용하는 일이 점점 즐거워질 것이다. 공자의 말씀처럼,

 

배우고 또 익히면 즐겁지 아니한가?”

 

라는 기쁨을 느낄 수 있을 것이다.

 

-데이터 문해력이 중요하다

 

컴퓨터와 데이터 과학의 발달은 겉보기에는 데이터를 다루기 어렵게 만드는 것처럼 보이지만, 사실은 접근성을 더욱 높여 주고 있다. 예를 들어, 파이썬이나 R과 같은 프로그래밍 언어를 몰라도 메뉴를 선택해서 머신러닝 모델을 만들 수 있다. 코딩 기술이 뛰어나지 않더라도, 데이터에 대한 기본적인 이해만 있다면 비전문가도 충분히 데이터를 활용할 수 있다.

 

그렇다고 해서 데이터 활용에 이용자가 아무런 능력이 없어도 된다는 말은 아니다. 간혹 아래와 같은 말을 듣기도 한다.

 

인공지능이 분석하고 해석해 준다는데, 굳이 내가 데이터를 공부할 필요가 있을까?”

이제 데이터 분석이나 해석은 사람이 할 필요가 없다. AI가 데이터를 알아서 분석하고 보 고서도 작성해 주니까.”

인터뷰한 내용도 AI가 정리해 준다던데? 조사회사들도 그걸 사용한다고 하더라.”

 

인공지능(AI)의 발달로 인해 컴퓨터 코딩 작업에서 많은 도움을 받을 수 있는 것은 사실이다. 그리고 AI가 컴퓨터 코드도 작성해 주고 데이터 해석도 해 줄 수 있다. 그런데 AI가 컴퓨터 코드를 작성할 수 있다고 해서 내가 원하는 코드를 정확하게 작성해 주는 것은 아니다. 여전히 오류가 많고, 예상치 못한 결과를 낼 수도 있다.

그렇지만 AI의 발달로 데이터 이용의 장벽이 점점 낮아지고 있는 것은 분명하다. 그런 만큼 데이터의 오남용으로 인한 피해도 더 커지고 있다. 어떤 데이터를 어떤 방식으로 분석할 것인지, 그리고 그 결과는 어떻게 해석해야 하는지, 분석한 데이터와 방법상에 어떤 문제는 없는지 판단할 수 있는 능력이 있어야 제대로 활용할 수 있다.

결국, 데이터 문해력이 있는 사람과 그렇지 않은 사람의 격차는 더욱 커지게 된다. 데이터를 이해하는 사람은 AI의 능력까지 활용할 수 있지만, 그렇지 않은 사람은 AI가 분석해 주는 데이터조차 제대로 활용하지 못할 것이다. 즉 정보격차가 AI 때문에 낮아지는 것이 아니라 더 커지게 될 것이다.

 

- 무엇을 배워야 할까?

 

이제 누구나 AI를 사용할 수 있는 시대가 되었다. 과거에는 데이터를 보유하고 기술을 가진 소수만이 데이터를 활용할 수 있었다. 하지만 앞으로는 데이터에 대한 이해도가 있는 사람이 데이터를 제대로 활용할 수 있는 시대가 될 것이다.

 

그렇다면 우리는 어떻게 해야 하나?

 

어렵게 생각할 필요가 없다. 지금부터라도 데이터 문해력을 갖추도록 하자. 데이터 시대에는 분석 능력도 아니고 데이터 생산능력도 중요하지 않다.

 

나에게 필요한 데이터를 찾고,

그 데이터를 분석할 적절한 도구를 선택하며,

데이터 결과에서 오류를 감지하고 해석할 수 있어야 하며,

이를 바탕으로 논리적 의사결정을 내릴 수 있어야 한다.

 

전통적으로 중시되었던 코딩 능력은 점점 덜 중요하게 된다. 쉬우면서도 강력한 좋은 도구들이 끊임없이 나오고 있기 때문이다. 코딩 기술보다는 데이터 전반에 관한 이해가 더 중요하게 된다. 이제 잠시 나의 데이터 문해력 수준은 얼마인지 돌아보고 부족한 부분을 채워 보자.코딩에 소질이 없는 사람도 데이터가 가져오는 혜택을 충분히 누릴 수 있다. 데이터 문해력을 갖춘다면, AI와 함께 더 스마트하게 데이터를 활용할 수 있을 것이다.