본문으로 건너뛰기

Data Catalog 개요

카카오클라우드의 Data Catalog 서비스는 조직과 사용자의 데이터 자산을 중앙에서 체계적으로 파악하고 관리하는데 도움을 주는 효율적인 데이터 관리 도구로, VPC 환경에서 제공됩니다. Data Catalog는 데이터 관리와 메타데이터화를 중심으로 조직 내 데이터 자산의 인벤토리 역할을 하며, 다양한 데이터에 대한 메타데이터를 수집하여 중앙 리포지토리에 저장합니다. 카카오클라우드의 데이터 분석 에코시스템인 Hadoop Eco 서비스와도 연동되기 때문에 데이터 처리 및 분석 작업을 더욱 원활하게 수행할 수 있습니다.
Data Catalog 서비스를 사용하면 개인은 자신이 소유한 데이터를 테이블 형태로 정의하고 데이터의 저장 위치, 속성 등을 자세히 등록하고 효율적으로 관리할 수 있습니다. 또한, 조직은 조직의 데이터 자산을 최적화할 수 있기 때문에 데이터 관리 비용을 절감하고, 효율적인 데이터 활용으로 비즈니스 목표를 달성할 수 있습니다.

사용 목적 및 사례

조직에서 관리하는 데이터가 방대할 경우, 분산된 데이터로 인해 데이터를 찾는 것이 어렵고, 데이터 중복/불일치/신뢰도 저하 등의 문제로 사용자간 데이터를 공유하고 협업하는 데 문제가 생길 수 있습니다. 또한, 민감한 데이터가 적절하게 보호되지 않아 데이터 유출 및 보안에도 치명적인 악영향을 미칠 수 있습니다.
Data Catalog는 이런 문제를 해결하기 위해 데이터를 중앙에서 관리하고, 메타데이터 활용, 데이터 검색 및 공유, 보안 및 접근 제어, 데이터 품질 개선 기능을 통해 조직의 효율적이고 안전한 데이터 활용을 지원합니다.

특징

데이터 이동, 개별 검색 없이 한 번에 가능한 데이터 조회

  • 대규모의 데이터를 이동하거나 개별 검색할 필요 없이 Data Catalog 한 곳에서 조회할 수 있어 데이터 관리 효율성을 높임

다양한 대규모의 메타데이터 통합 관리

  • 카카오클라우드에 있는 다양한 종류의 메타데이터들을 통합해 콘솔에서 관리

빠른 데이터 검색, 조회

  • 스토리지 또는 DB에 일일이 접근할 필요 없이 Data Catalog 한 곳에서 데이터를 검색하고 조회할 수 있음

시작하기

Data Catalog에 대한 자세한 사용 가이드는 How-to Guides에서 설명합니다. 카카오클라우드를 처음 시작하신다면 카카오클라우드 시작하기를 참고하시기 바랍니다.