공공데이터 활용법 & 데이터 시각화 입문

공공데이터 시각화 대회 참여 후기 및 준비 팁

해피데ㅇI 2025. 5. 12. 10:00

요즘 ‘데이터 리터러시’에 대한 관심이 높아지면서 공공데이터를 활용한 시각화 대회가 매년 다양하게 개최되고 있습니다. 통계청, 공공데이터포털, 과학기술정보통신부 등에서 주최하는 이 대회들은 단순한 기술 경연을 넘어 사회 문제에 대한 통찰력, 데이터 활용 능력, 시각적 스토리텔링 역량을 동시에 요구합니다.

 

저 역시 처음에는 “데이터 시각화? 내가 할 수 있을까?”라는 의구심에서 시작했지만, 직접 대회에 참여하고 준비하는 과정을 통해 실무적인 분석 능력과 표현력을 큰 폭으로 성장시킬 수 있었습니다. 이 글에서는 실제 참여 후기를 바탕으로, 대회를 준비하면서 느꼈던 점들과 누구나 적용 가능한 실전 팁을 함께 공유드립니다. 데이터에 관심 있는 학생, 직장인, 디자이너 모두에게 도움이 되기를 바랍니다.

 

 

1. 대회 참여 동기와 전체 준비 과정

공공데이터 시각화 대회에 처음 도전하게 된 계기는 단순했습니다. 내가 관심 있던 사회 이슈를 ‘데이터’라는 언어로 설명해보고 싶었고, 정량적 분석을 시각적으로 표현해내는 훈련을 경험하고 싶었습니다. 처음 참가한 대회는 통계청이 주관한 ‘국가통계 데이터 시각화 공모전’이었으며, 주제는 자유 형식으로 구성되어 있었습니다.

 

참여를 결심한 뒤 가장 먼저 한 일은 데이터 주제 선정이었습니다. 교육 격차, 고령화, 지역 불균형, 청년 실업 등 다양한 주제를 고민한 끝에, “지역별 청년 고용률과 고용정책 비교”라는 주제를 선택하게 되었고, 공공데이터포털, KOSIS, 고용노동부 등의 데이터를 수집하였습니다. 이후 분석 기획, 데이터 전처리, 시각화 설계, 스토리보드 구성이라는 순서로 약 4주간 준비를 진행했습니다.

 

여기서 느낀 가장 큰 어려움은 데이터가 너무 많고 복잡하다는 점이었습니다. 특히 파일 형식이 엑셀, CSV, JSON 등 다양했고, 변수 설명이 부족한 경우도 많아 데이터를 정리하고 이해하는 데 많은 시간이 소요됐습니다. 이 과정을 통해 ‘데이터 선정이 절반’이라는 말을 실감하게 되었고, 향후에는 처음부터 시각화가 용이한 데이터를 우선 선택하는 전략이 중요하다는 걸 깨달았습니다.

 

공공데이터 시각화 대회 참여 후기 및 준비 팁

2. 데이터 수집과 전처리에서의 핵심 포인트

대회 준비의 70%는 데이터 전처리에 있다고 해도 과언이 아닙니다. 단순히 데이터를 모으는 것이 아니라, 시각화 가능한 형태로 구조화하고 정리하는 과정이야말로 참가자들의 실력을 판가름하는 핵심 요소입니다. 제가 수집한 데이터는 총 7개 기관에서 제공한 20여 개의 파일이었으며, 다양한 기간, 지역, 지표 형식으로 구성되어 있었습니다.

 

이때 가장 도움이 되었던 툴은 Excel, Python(pandas), Tableau Prep이었습니다. 엑셀에서는 시트 병합, 필터링, 조건부 서식 등을 사용했고, Python에서는 컬럼 정리, 결측값 처리, 이상값 제거를 진행했습니다. Tableau Prep은 데이터를 드래그 앤 드롭 형식으로 시각화하면서 전처리할 수 있어 구조 설계에 큰 도움이 되었습니다.

 

팁을 하나 공유하자면, 분석보다 먼저 '어떤 그래프를 그릴 것인지'를 미리 스케치해보는 것이 전처리 방향을 정하는 데 매우 유용합니다. 예를 들어 꺾은선 그래프를 그릴 예정이라면 날짜별 통합 테이블을 만드는 것이 필요하고, 히트맵이라면 값의 상대 비교가 가능하도록 가공해야 합니다. 이처럼 시각화 방향성과 데이터 구조가 일치해야 설득력 있는 결과물이 나옵니다.

 

 

3. 시각화 툴 선택과 디자인 구성 전략

시각화 툴은 주제와 표현 방식에 따라 다르게 선택하는 것이 좋습니다. 저는 Tableau Public, Flourish, Google Data Studio를 병행해서 사용했습니다. Tableau는 대용량 데이터 필터링과 인터랙티브 시각화에 뛰어났고, Flourish는 애니메이션형 스토리텔링을 만들 때 탁월했으며, Google Data Studio는 웹 기반 공유와 협업이 쉬웠습니다.

 

대회 심사 기준 중 하나가 ‘스토리텔링’이었던 만큼, 시각화는 단순히 차트를 나열하는 것이 아니라 데이터를 통해 질문을 던지고, 설명하고, 결론에 도달하는 흐름으로 구성해야 했습니다. 이를 위해 제목은 독자의 눈을 끌 수 있게 구성하고, 소제목과 주석, 색상 구분을 통해 시각적 계층 구조를 명확히 설정했습니다.

 

또한 디자인은 과하지 않게, 정보를 효과적으로 전달하는 방향으로 구성했습니다. 예를 들어 색상은 3~4가지로 제한하고, 강조 색과 배경 색을 분리하여 가독성을 높였습니다. 이 외에도 툴마다 내장된 테마를 무작정 사용하는 것이 아니라, 브랜딩된 스타일을 만들어주는 노력도 심사에서 긍정적인 평가를 받았습니다.

 

 

4. 대회 결과와 얻은 인사이트, 그리고 다음 도전

최종적으로 제출한 결과물은 ‘지역별 청년 고용 현황과 정책 효과 분석’이라는 제목으로, 시각화 대회 본선에 진출했고 장려상을 수상하게 되었습니다. 결과보다도 더 값졌던 것은, 데이터를 통해 사회 현상을 이해하고, 내 관점을 담아 설득력 있게 전달하는 경험이었습니다. 단순히 수치를 보여주는 것이 아니라, 사람이 납득하고 공감할 수 있는 이야기로 풀어내는 능력을 키운 것이 가장 큰 수확이었습니다.

 

대회 이후, 시각화 포트폴리오를 블로그에 정리하고, 링크드인과 브런치에 공유하자 관련 분야 종사자들과의 네트워크도 생기고, 실제 데이터 관련 협업 제안도 몇 건 들어오게 되었습니다. 이처럼 대회 참여는 단지 수상 여부를 떠나 자기계발, 포트폴리오 구축, 전문가 네트워킹까지도 확장할 수 있는 기회입니다.

 

앞으로 또 다른 시각화 대회에 도전할 계획이며, 이번 경험을 바탕으로 팀 프로젝트, 인터랙티브 웹 대시보드, 공공정책 제안서 등으로 확장해보려 합니다. 공공데이터는 누구에게나 열려 있고, 그 활용 가능성은 무궁무진합니다. 아직 도전해보지 않았다면, 지금이 바로 시작하기 좋은 타이밍입니다.