데이터에서 에러라고 하면 실제값과 데이터에 표시된 값의 차이를 말한다. 우리는 실제값을 모르기 때문에 에러가 얼마인지 정확히 알 수는 없다. 다만 설문지와 표집 방법 등 조사 방법을 보고 발생할 수 있는 에러의 종류와 크기를 추정할 수 있다. 데이터가 공개될 때는 이러한 수집 방법 등 관련된 정보가 소위 메타데이터라고 해서 같이 제공된다. 메타데이터란 데이터에 관한 데이터라고 해서 데이터를 이해하고 사용하는 데 필요한 모든 정보다. 데이터와 같이 제공되는 보고서, 이용자 가이드 등에 수록되어 있다. 데이터가 갖는 에러는 여러 가지가 있는데 그중에 표집오차가 있다. 표집오차란 우리가 알고자 하는 대상 전체를 대상으로 조사되지 않고 표본을 통해서 조사될 때 나온다. 당연히 일부만 가지고 전체에 대해서 말하..