데이터가치연구소 공식 블로그

공공데이터 실무자를 위한 실무매뉴얼 요점 정리

공공데이터 업무를 처음 맡으셨나요?
공공데이터 업무를 체계적으로 알고 싶으신가요?
그렇다면 이 글부터 시작하시기 바랍니다.
공공데이터 실무자가 알아야 할 개념부터 해야 할 일들을 알기 쉽게 설명합니다.


공공데이터 법이란?

2013년에 제정된 법으로 “공공데이터의 제공 및 이용 활성화에 관한 법률“을 말합니다.
해당 법의 취지는 공공기관이 가진 데이터를 국민이 이용할 수 있도록 보장하는 것입니다.
취지가 그러다 보니 최대한 데이터를 공개하는 것에 초점이 맞춰져 있습니다.
법조문이다 보니 딱딱한 표현이 대부분입니다.
해당 글은 보다 쉬운 표현으로 해석하여 설명합니다.


공공데이터 주요 용어

공공데이터에서 사용하는 주요 용어는 아래의 글을 참고하시기 바랍니다.
공공데이터 주요 용어 정리


주요 관계자

  • 공공데이터 전략 위원회(전략위원회)
    • 소속
      • 국무총리
    • 역할
      • 공데이터에 관한 정부의 주요 정책과 계획을 심의·조정하고 그 추진사항을 점검·평가
      • 전략위원회의 효율적 운영 및 지원을 위하여 행정안전부장관을 간사로 임명
  • 공공데이터 제공 책임관
    • 소속
      • 해당 공공기관
    • 직책
      • 책임관 – 공공데이터 관련 업무를 총괄
      • 실무담당자 – 공공데이터 관련 업무를 수행
    • 임명 및 공표
      • 공공기관의 장은 책임관과 실무담당자를 임명하여 이를 기관 홈페이지에 공표
    • 역할
      • 공공데이터 시책의 총괄조정 및 지원
      • 공공데이터 시책과 기관 내 다른 정책·계획 등과의 연계·조정
      • 공공데이터의 관리·제공·이용 관련 업무총괄 및 지원
      • 공공데이터의 품질관리
주요 관계자

공공데이터의 범위

공공기관에서 보유한 데이터를 말합니다.
그러나 기관이 보유한 모든 데이터를 국민에게 제공할 의무는 없습니다.
공개하지 않아도 되는 대상은 정보공개법 제9조에서 확인할 수 있습니다.
정보공개법 제9조의 내용을 간략히 요약하면 다음과 같습니다.

국가/국민/법인/단체에게 피해를 줄 수 있는 데이터는 공개하지 않습니다.

비공개대상정보에 해당하지 않는 경우는 공공데이터로 제공합니다.
공공기관은 누구나 공공데이터를 편리하게 이용할 수 있도록 노력해야 합니다.


공공데이터 등록

  • 공공데이터 목록등록관리시스템(all.data.go.kr)

공공기관에서 공개하는 공공데이터의 목록과 데이터를 관리하는 시스템입니다.
행정안전부장관은 공공데이터 포털에 공공데이터 목록과 데이터를 관리하는 시스템을 구축하여 운영하고 있습니다.
공공기관의 장은 해당 목록등록관리시스템에 공공기관에서 공개하는 공공데이터의 목록과 데이터를 등록합니다.

  • 공공데이터의 목록

공공기관에서 공개하는 데이터의 목록입니다.
해당 목록을 수집된 날로부터 15일 이내에 목록등록관리시스템에 등록합니다.
제공제외 대상의 데이터 목록은 별도로 기관에서 관리합니다.

공공데이터 목록 예시

  • 공공데이터의 등록

국민이 공공데이터를 실제로 이용할 수 있도록 목록등록관리시스템에 등록합니다.

다음 두 가지 방식 중 선택하여 등록할 수 있습니다.

  • 오픈포멧 파일
    • CSV, XML, JSON 형식의 파일로 등록
    • 엑셀 파일은 반드시 CSV 형식으로 변환하여 등록
  • 오픈API 서비스
    • 오픈API를 설명하는 문서를 포함하여 등록
공공데이터 등록 절차

  • 공공데이터의 현행화

제공하는 공공데이터는 최신의 상태를 유지해야 합니다.
데이터의 변경이 발생하면 10일 이내에 변경된 내용을 목록등록관리시스템에 반영해야 합니다.
이전의 데이터는 더 이상 이용 가치가 없는 경우에만 삭제합니다.
특히, 주기적으로 갱신하는 데이터는 과거 데이터를 보존해야 합니다.

  • 과거 데이터 보존 예시
    • ‘2020년자전거사고다발지’ 목록을 갱신하는 경우, 해당 목록에 ‘2021년자전거사고 다발지’ 파일을 추가

공공데이터 제공

등록된 공공데이터는 공공데이터 포털(data.go.kr)에서 제공하며 누구나 사용할 수 있습니다.
공공데이터 포털로 제공하기 어려운 데이터가 있다면 개별 포털을 구축할 수 있습니다.
예를 들어 기상정보, 교통상황, 영상, 음성 데이터처럼 기관에서 개별 포털을 구축하여 해당 포털에서 제공할 수 있습니다.
그러나 공공데이터 포털에서 제공할 수 있는 데이터라면 개별 포털은 구축하지 않습니다.

제공 방식은 등록된 형식으로 제공됩니다.
즉, 오픈포멧 파일 또는 오픈API 서비스 중 등록된 방식으로 제공됩니다.

공공데이터는 기본적으로 온라인으로 제공합니다.
온라인 제공이 불가능할 경우, 오프라인 제공(USB, CD, ···)을 고려합니다.

공공데이터 제공

공공데이터 평가

행정안전부장관은 매년 기관의 공공데이터 운영 상태를 평가합니다.
그러므로 해당 기관은 매년 평가를 위해 준비해야 합니다.
그러나 시험을 치르듯이 평가 시즌에만 분주하기보다는 평소 차근차근 준비하는 것을 권장합니다.
왜냐하면 평가를 위한 항목과 수행해야 할 내용이 많기 때문입니다.
전문 컨설팅이 필요한 이유이기도 합니다.

주요 평가 내용은 다음과 같습니다.

공공데이터 품질관리 수준진단평가

위의 항목들이 딱딱한 용어투성이지만 결국 다음의 내용을 평가하는 것입니다.
– 공공데이터 품질을 관리하기 위한 계획을 세웠습니까?
– 공공데이터 품질을 관리하기 위한 계획을 지켰습니까?
– 공공데이터 품질을 관리하는 조직을 운영하고 있습니까?
– 공공데이터 품질을 관리하는 절차가 있습니까?
– 공공데이터 테이블은 표준을 준수했습니까?
– 공공데이터 테이블에 저장된 데이터는 오류가 없습니까?


공공데이터 품질관리

실무자가 가장 신경 써야 할 부분이지만, 어려워하는 부분이기도 합니다.
품질관리는 다른 분야보다 전문성이 요구되기 때문입니다.
또한, 품질관리 평가를 매년 수행하는 것만 보아도 그 중요성을 알 수 있습니다.
앞의 공공데이터 품질관리 수준진단·평가 항목에서 알 수 있듯이 만만한 항목이 없습니다.
그러나 데이터표준과 데이터구조에 집중한다면 나머지 항목들은 비교적 쉽게 대응할 수 있습니다.

그럼, 데이터표준과 데이터구조에 대해 알아보겠습니다.

  • 데이터표준

데이터표준은 데이터품질의 주요 항목입니다.
공공데이터를 구성하는 속성, 칼럼, 도메인 등이 표준을 준수하였는지를 점검합니다.
표준을 준수하려면 먼저 데이터표준이 있어야겠지요.

행정안전부에서는 모든 기관에서 지켜야할 표준을 정의했습니다.
이를 공통표준이라 합니다.
2023년 11월 기준으로 5,386개의 표준용어를 정의하였습니다.
공통표준은 우선순위가 가장 높습니다.
그러므로 모든 기관은 공통표준용어가 있다면 우선적으로 이를 사용해야 합니다.

필요한 용어가 공통표준용어에 없다면 기관에서 새로 표준용어를 만들어 사용합니다.
이렇게 기관에서 만든 표준을 기관표준이라 합니다.

데이터표준은 이러한 표준을 준수하는지 뿐만 아니라 데이터표준을 관리하는 절차도 점검합니다.
데이터 표준을 손쉽게 관리하기 위해 공공데이터 관리매뉴얼에서는 메타시스템* 사용을 권장합니다.
* 메타시스템은 단어, 도메인, 코드 등 메타데이터를 관리하는 시스템을 말합니다.
참고 글: 공공데이터 주요 용어 정리

데이터표준과 관련하여 다음의 글이 도움이 될 것입니다.
데이터 표준이란 무엇인가요?
20만 개 칼럼을 표준화한 방법론 공개
데이터 표준화를 꼭 해야만 하는 이유
공공데이터 표준화 프로젝트- 최소 인원으로 수행해야 하는 이유

  • 데이터구조

데이터구조는 데이터를 저장하는 테이블의 설계도를 말합니다.
이러한 설계도를 ERD(Entity Relationship Diagram)라 합니다.
ERD에 표현된 테이블*은 실제 데이터베이스에도 똑같이 테이블로 존재해야 합니다.
* ERD에 표현된 테이블을 엔터티(Entity)라 합니다.
그러려면 데이터베이스에 테이블을 변경하거나 만들 때에는, 항상 ERD에도 변경된 내용을 반영해야 합니다.
이때 테이블의 칼럼은 데이터표준을 준수해야 합니다.
데이터구조에서는 이러한 내용을 점검합니다.

데이터구조 예시

공공데이터의 품질을 평가하는 일은 매년 수행하는 평가 항목에서 큰 비중을 차지합니다.
그러나 높은 품질은 벼락치기로 이루는 과제가 아닙니다.
데이터 품질은 꾸준한 관리가 무엇보다 중요하기 때문입니다.
1회 성 프로젝트로는 높은 품질을 유지할 수 없습니다.
많은 비용과 시간을 들여 표준화 프로젝트를 하더라도 전문가가 관리하지 않는다면 금세 엉망이 됩니다.
데이터가치연구소는 3M/M* 비용으로 1년 365일 데이터 전문가의 컨설팅을 제공합니다.
* M/M(Man/Month) 비용 : 한 사람이 한 달 동안 일하는 인건비를 말합니다.

author avatar
데이터가치연구소 데이터가치플래너
『공공기관 표준화 전문』 대표 컨설턴트 허 상 철 |
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments