해피데이

공공데이터 활용법 & 데이터 시각화 입문에 대하여 적습니다.

  • 2025. 5. 31.

    by. 해피데ㅇI

    목차

      최근 교육 현장에서 가장 많이 거론되는 키워드 중 하나는 바로 “교육 격차”입니다. 과거에는 단순히 ‘지역’에 따른 교육 불균형이 주요 이슈였다면, 지금은 소득, 환경, 디지털 접근성, 가정 배경까지 복합적으로 작용하고 있어 보다 정밀한 분석과 대응이 필요한 시점입니다.

       

      이 글에서는 교육부에서 공개한 학력 수준 변화 데이터를 기반으로 ① 공공데이터 수집 및 구조 파악, ② 지역·계층별 학력 변화 패턴 분석, ③ 데이터 시각화를 통한 격차 시각화 전략, ④ 실질적인 정책적 시사점 및 교육 현장 적용 방안 이라는 4단계 흐름으로 구체적인 분석 예제를 공유드리겠습니다.

       

      교육부 학력 수준 변화 데이터로 교육 격차 분석

      1. 교육부 학력 수준 변화 데이터 수집 및 구조 이해

      교육부는 매년 초·중·고등학교를 대상으로 국어, 수학, 영어 등 기초 학력에 대한 평가 결과를 집계하여 국가 수준 학업성취도 평가(National Assessment of Educational Achievement)로 발표합니다.

       

      이 데이터는 공공데이터포털한국교육개발원 교육통계서비스를 통해 열람 가능하며, CSV, XLS, JSON 포맷으로 다운로드 받아 직접 분석할 수 있습니다.

       

      데이터 구조는 일반적으로 다음과 같이 구성되어 있습니다:

      • 연도: 2008년부터 최신 연도까지
      • 학교급: 초등학교, 중학교, 고등학교
      • 과목: 국어, 수학, 영어
      • 성취수준별 분포: 기초미달, 보통, 우수
      • 지역 코드 및 시도 구분: 17개 시·도 기준

       

      예를 들어 아래와 같은 데이터가 있다면,

      | 연도 | 시도 | 학교급 | 과목 | 기초미달(%) | 보통(%) | 우수(%) |
      |------|------|--------|------|--------------|----------|----------|
      | 2021 | 서울 | 중학교 | 수학 | 6.4 | 58.2 | 35.4 |
      | 2021 | 전남 | 중학교 | 수학 | 13.7 | 67.8 | 18.5 |
      

       

      이 데이터를 통해 도시와 농촌 간 학력 격차, 기초 학력 미달 비율의 변화 추이, 정책 도입 전후 학업 성취 수준의 변화를 분석할 수 있는 기반이 됩니다.

       

       

      2. 지역별·계층별 학력 수준 변화 패턴 분석

      수집한 데이터는 단순 통계를 넘어서 지역 간 교육 격차의 구조적인 원인을 분석하는 데 활용될 수 있습니다. 특히 기초학력 미달 비율의 추이를 중심으로 분석하면 어떤 지역, 어떤 계층에서 학습 취약성이 집중되고 있는지를 파악할 수 있습니다.

       

      예를 들어, 다음과 같은 패턴이 발견될 수 있습니다:

      • 도시 vs 농촌: 농어촌 지역일수록 기초학력 미달 비율이 평균 2~3배 이상 높음
      • 저소득층 밀집 지역: 수학과 영어 과목에서 기초학력 미달 학생 비율 증가
      • 코로나19 이후: 온라인 수업 인프라 부족 지역에서 학력 저하 가속화

       

      또한 분석을 정밀화하기 위해서는 학생 수 대비 미달 인원 수, 특정 과목의 미달 집중 비율을 함께 확인해야 합니다. 예를 들어 ‘A지역’의 기초학력 미달율이 12%라고 해도, 전체 학생 수가 많은 지역과 적은 지역의 격차는 실질적 차이를 만들 수 있습니다.

       

      이러한 분석은 단순히 격차를 확인하는 데서 그치지 않고, 어떤 지역에 정책적 개입이 필요한지를 우선순위로 정리해주는 실질적 기준이 됩니다.

       

       

      3. 데이터 시각화를 통한 격차 인식 확장

      교육 격차를 논의할 때 가장 효과적인 방법은 데이터를 시각화하여 인지 가능한 언어로 변환하는 것입니다. 이를 통해 일반 대중, 학부모, 교육 담당자가 직관적으로 문제의 심각성을 이해할 수 있습니다.

       

      주요 시각화 방식 예시는 다음과 같습니다:

      • 지역별 기초학력 미달율 지도: 전국 시도별 색상 차등 히트맵
      • 연도별 학업성취 추이선: 시계열 라인 그래프 (예: 수학 기초미달율 변화)
      • 학교급 간 비교 바 차트: 초·중·고 비교하여 단계별 격차 확인
      • 성취수준별 누적그래프: 각 과목별 우수/보통/미달 비율 시각화

       

      예를 들어 2019~2023년 전국 중학교 수학 기초학력 미달율을 선그래프로 그리면, 코로나19 시기에 급격히 상승한 추세를 한눈에 파악할 수 있습니다. 또한 이 데이터를 시도별로 색상 구분된 지도에 매핑하면 어떤 지역에서 집중적 지원이 필요한지가 명확히 드러납니다.

       

      이러한 시각화 결과는 리포트, 프레젠테이션, 공청회, 정책 제안서 등에 포함되어 단순 주장이 아닌 데이터 기반의 설득력을 제공하게 됩니다.

       

       

      4. 교육격차 완화를 위한 정책적 시사점

      교육부의 학력 수준 변화 데이터 분석을 통해 얻은 인사이트는 단순히 현실을 확인하는 데서 그치지 않고 정책 설계, 예산 집행, 교육 지원 방향 설정의 기준이 되어야 합니다.

       

      주요 시사점은 다음과 같습니다:

      • 맞춤형 지역 지원 정책 강화: 기초학력 미달율이 높은 지역에 교사 및 교육자원 집중
      • 디지털 격차 해소: 원격수업 인프라가 부족한 지역 학생을 위한 장비 및 통신비 지원
      • 방과후 프로그램 차등 운영: 고위험군 학교에 정규 교육 외 개별 학습 보충 제도 확대
      • 기초학력 진단 체계 고도화: 단순 점수보다 정서, 환경, 참여도 등 다변수 진단체계 필요

       

      더 나아가 데이터는 교육정책의 선제적 개입에 기여할 수 있습니다. 예: 특정 지역에서 3년 연속 미달율이 증가하는 흐름이 발견된다면, 해당 지역의 학력 격차가 고착화되기 전에 예방 개입을 통해 해결할 수 있습니다.

       

      결국 데이터는 문제를 보는 눈을 바꾸는 도구이며, 수치와 그래프는 ‘교육의 공정성’을 위한 정책 설계의 나침반이 됩니다. 이제 우리가 할 일은 데이터를 바라보는 것이 아니라, 데이터를 활용해 교육의 미래를 설계하는 일입니다.