DBMS란?
데이터베이스 관리 시스템 (DBMS)은 프로그래머, 데이터베이스 관리자 (DBAs), 소프트웨어 애플리케이션 및 최종 사용자가 데이터베이스에 데이터를 저장, 구성, 액세스, 쿼리 및 조작할 수 있도록 하는 미들웨어이다.
DBMS는 많은 양의 데이터를 구성, 관리, 사용하기 위한 효율적이고 안정적인 메커니즘을 제공하는 동시에 데이터 무결성을 보장하고 기타 데이터 관리 이점을 제공하기 때문에 중요하다.
기업에서 데이터베이스 관리 시스템은 데이터베이스 관리자(DBAs)에게 여러 부서, 팀 및 애플리케이션 간에 데이터를 쉽게 공유할 수 있는 구조화된 프레임워크를 제공한다. DBMS는 직원들이 데이터에 제어되고 체계적으로 액세스하여 혁신을 주도하고 회사의 경쟁력을 유지하는 데 사용할 수 있도록 지원한다.
데이터베이스 관리 시스템의 역사
데이터베이스 관리 시스템의 역사는 컴퓨터가 데이터 처리에 사용되기 시작한 1960년대 초로 거슬러 올라간다. 당시에는 이 개념을 보통 정보 관리 시스템이라고 불렀다.
최초의 상용 데이터베이스 관리 시스템은 통합 데이터 저장소 (IDS)라고 불렸다. 이 시스템은 1960년대 후반 제너럴 일렉트릭 (General Electric)의 찰스 바크만 (Charles W. Bachman)과 그의 팀이 개발했다.
IDS는 레코드 간에 상위-하위 관계가 있는 트리와 같은 구조로 데이터를 구성하는 계층적 DBMS였다. 이를 통해 사용자는 구조화된 방식으로 데이터를 저장, 검색 및 관리할 수 있었다. IDS는 또한, 데이터베이스 내 데이터의 구조와 관계를 정의하는 데이터 사전이라는 개념을 도입했다. IDS 이전에는 데이터가 플랫 파일에 저장되는 것이 일반적이었고 파일을 저장, 액세스 또는 조작하는 방법에 대한 표준이 없었다.
결국 1970년대에 관계형 데이터베이스와 구조적 쿼리 언어(SQL)가 등장하면서 바크만의 IDS는 잊히게 되었다. 그 이후로 DBMS 제품 및 서비스는 데이터 저장, 검색 및 관리를 개선하는 지속적인 발전을 거듭해 왔다.
타임라인: 데이터베이스 관리 시스템의 진화
년도 | 이벤트 |
---|---|
1964 | 제너럴 일렉트릭의 찰스 바크만이 최초의 데이터베이스인 통합 데이터 저장소 (IDS)를 개발했다. |
1966 | IBM이 로크웰 및 캐터필러와 공동 개발한 정보 관리 시스템 (IMS)을 소개했다. |
1970 | 에드거 F. 커드가 “대규모 공유 데이터뱅크를 위한 데이터 관계형 모델“이라는 제목의 논문에서 관계형 모델을 소개했다. |
1974 | 구조적 쿼리 언어 (SQL)가 만들어졌다. |
1976 | 피터 첸이 “개체-관계 모델 – 데이터의 통합된 뷰를 향하여“라는 논문에서 개체 관계 모델을 소개했다. |
1979 | 오라클 (Oracle)이 SQL을 사용하는 최초의 상용 관계형 데이터베이스를 출시했다. |
1980 | IBM이 SQL 기반 관계형 데이터베이스 관리 시스템인 System R을 출시했다. |
1981 | IBM에서 개인용 컴퓨터에서 실행할 수 있는 최초의 완전한 기능의 DBMS인 SQL/DS를 출시했다. |
1983 | IBM에서 메인프레임용 DB2의 첫 번째 버전이 출시됐다. |
1986 | 객체 지향 데이터베이스 시스템 선언문이 발표되어 객체 지향 데이터베이스 개발이 크게 촉진되었다. |
1996 | 최초의 오픈 소스 관계형 데이터베이스 관리 시스템 중 하나인 PostgreSQL이 출시됐다. |
1998 | 또 다른 중요한 오픈 소스 RDMS인 MySQL이 Windows 95 및 NT용으로 출시됐다. |
1998 | 마이크로소프트 (Microsoft)가 DBMS를 완전히 재작성한 SQL Server 7.0을 출시했다. |
2000 | 인터넷 스타트업이 XML 데이터베이스를 도입했다. |
2004 | ‘비관계형 분산 데이터베이스’라는 용어가 인기를 얻으며 새로운 세대의 비관계형 분산 데이터베이스가 등장했다. |
2006 | 구글은 내부 NoSQL 데이터베이스인 빅테이블 (BigTable)에 대한 논문을 발표하여 오픈 소스 NoSQL 데이터베이스의 새로운 트렌드에 영향을 미쳤다. |
2012 | 아마존이 독점 NoSQL 데이터베이스인 DynamoDB를 출시했다. |
2013 | 대량의 구조화된 데이터를 처리하도록 설계된 분산 데이터베이스인 FoundationDB가 출시됐다. |
2017 | 구글이 전 세계에 분산된 데이터베이스인 Spanner를 발표했다. |
2020s | 클라우드 네이티브 데이터베이스, 에지 데이터베이스, 데이터베이스 관리를 위한 AI 통합 개선에 중점을 둔 DBMS 기술의 지속적인 개발과 혁신이 이루어졌다. 블록체인 데이터베이스도 중요한 관심사가 되었다. |
데이터베이스와 DBMS의 차이점
“데이터베이스”와 “데이터베이스 관리 시스템”이라는 용어는 일상적인 대화에서 종종 같은 의미로 사용된다. 이는 최종 사용자가 데이터베이스와 상호 작용할 때 기본 DBMS와 데이터 관리에서 DBMS의 고유한 역할을 인식하지 못하기 때문일 수 있다. 혼란을 가중시키는 것은 DBMS가 애플리케이션 코드에 직접 내장된 경우도 있다. 이 경우 별도의 시스템이 관련되어 있다는 사실이 더욱 명확하지 않다.
두 용어를 구분하고 올바르게 사용하려면 각각의 역할과 기능을 이해하는 것이 중요하다: 데이터베이스는 구조화된 데이터 모음이다. 데이터베이스 관리 시스템은 개발자, 최종 사용자 및 애플리케이션이 데이터베이스와 상호 작용하는 데 사용하는 소프트웨어다.
DBMS 구성 요소
모든 DBMS의 핵심 구성 요소를 데이터베이스 엔진이라고 한다. 데이터베이스 엔진은 기본 스토리지 시스템 또는 파일 시스템과 직접 상호 작용하고 엔진이 데이터베이스 시스템의 데이터를 관리하고 조작할 수 있도록 모듈식 하위 구성 요소 간의 상호 작용을 조정하는 소프트웨어다. 여기에는 다음과 같은 모듈이 포함된다:
백업 및 복구: 이 모듈은 데이터 손실 또는 시스템 장애로부터 보호하기 위해 데이터 백업 및 복구 작업을 관리한다. 여기에는 데이터베이스 백업 생성, 데이터 복원 및 복구 작업 수행을 위한 메커니즘이 포함된다.
동시성 제어 및 트랜잭션 관리: 이 모듈은 여러 사용자 또는 애플리케이션의 데이터베이스에 대한 동시 액세스를 관리한다. 잠금 메커니즘을 처리하고 데이터 일관성을 보장한다.
데이터베이스 액세스 언어: 이 유형의 모듈은 데이터베이스 엔진이 기본 액세스 언어로 작성된 사용자 쿼리 또는 명령을 처리하고 해석할 수 있도록 한다. 쿼리 언어 구문을 분석하고, 카탈로그 정보에 대해 쿼리의 유효성을 검사하며, 요청에 따라 데이터를 검색하거나 조작하기 위한 최적화된 실행 계획을 생성한다.
데이터 정의 언어 (DDL): DDL 모듈을 통해 사용자는 데이터의 구조와 구성을 정의할 수 있다. 여기에는 테이블, 뷰, 인덱스 및 제약 조건과 같은 데이터베이스 개체를 생성, 변경 및 삭제하는 명령이 포함되어 있다.
데이터 사전: 데이터 사전 (메타데이터 저장소라고도 함)은 데이터의 구조, 관계 및 속성에 대한 정보를 포함하여 데이터베이스에 대한 메타데이터를 저장한다. 이 모듈은 DBMS 엔진에서 데이터 일관성을 보장하고 고유한 제약 조건을 적용하는 데 사용된다.
데이터 조작 언어 (DML): DML 모듈은 데이터베이스 내에서 데이터를 조작하고 검색하기 위한 명령을 제공한다. 사용자는 DML 문을 사용하여 데이터를 삽입, 업데이트, 삭제 및 쿼리할 수 있다.
데이터 웨어하우징 및 비즈니스 인텔리전스: 이 모듈은 여러 소스에서 별도의 데이터 웨어하우스로 데이터를 추출, 변환 및 로드하는 작업을 용이하게 한다. 또한, 비즈니스 인텔리전스를 위한 온라인 분석 처리(OLAP) 및 보고 도구도 지원한다.
인덱싱: 대부분의 DBMS에는 인덱싱 모듈이 포함되어 있어 스캔해야 하는 데이터의 양을 줄여 쿼리 실행 속도를 높인다.
로킹 (Locking): DBMS의 로킹 관리자 구성 요소는 동시성 제어 관리를 담당한다. 여러 사용자 또는 트랜잭션이 동시에 동일한 데이터를 수정할 수 없도록 하여 충돌을 방지하고 데이터 일관성을 유지한다.
로깅 및 감사: DBMS에는 데이터베이스 로깅 및 감사 활동을 위한 모듈이 포함된 경우가 많다. 로그는 삽입, 업데이트, 삭제 등 데이터베이스에 대한 문서 변경 사항과 백업 및 복구와 같은 시스템 이벤트를 기록한다. 감사에는 이러한 로그를 모니터링하고 검토하여 사용자 작업을 추적하고, 데이터 무결성을 유지하며, 보안 정책을 준수하는 데 도움을 주는 작업이 포함된다.
쿼리 처리: 쿼리 프로세서는 사용자 쿼리를 수신 및 해석하여 최적화된 실행 계획으로 변환하고 데이터베이스 엔진과 상호 작용하여 쿼리를 효율적으로 실행한다. 여기에는 사용 가능한 인덱스, 조인 작업 및 데이터 액세스 방법과 같은 요소를 고려한 쿼리 최적화를 위한 하위 모듈이 포함되어 있다.
복제: 일부 DBMS는 다른 위치 또는 다른 서버에 데이터베이스의 여러 복사본을 생성하고 유지하는 데이터 복제를 지원한다. 복제는 데이터 가용성, 내결함성 및 성능을 향상시킨다. 데이터베이스의 한 복사본을 사용할 수 없게 되더라도 다른 복사본에서 데이터에 액세스할 수 있도록 보장한다.
보안 및 권한 부여: 보안 및 권한 부여 모듈은 데이터베이스에 대한 사용자 액세스를 제어하고 데이터 개인정보 보호 및 무결성을 보장한다. 인증, 사용자 관리를 처리하고 사용자 역할 및 업무 요구 사항에 따라 최소 권한 원칙(PoLP) 액세스 제어 메커니즘을 구현한다.
스토리지: DBMS의 데이터베이스 엔진은 스토리지 엔진과 통신하여 물리적 데이터 스토리지를 관리한다. 스토리지 엔진은 데이터가 저장되고 액세스되는 방식에 대한 낮은 수준의 세부 사항을 처리하고, 데이터베이스 엔진은 이러한 작업을 조정하고 조율하여 데이터베이스 관리 시스템의 전반적인 기능을 최적화한다.
사용자 인터페이스: 이러한 모듈은 프로그래머, 데이터베이스 관리자 및 최종 사용자가 데이터베이스와 상호 작용할 수 있는 사용자 인터페이스를 제공한다. 여기에는 소프트웨어 통합을 위한 명령줄 인터페이스 (CLI), 그래픽 사용자 인터페이스 (GUI) 또는 애플리케이션 프로그램 인터페이스 (API)가 포함될 수 있다.
사용자 정책: 사용자 정책은 액세스 제어 및 내부 보안 정책을 정의하고 시행한다. 사용자 정책은 권한, 역할 및 권한을 지정하고 사용자가 데이터베이스와 상호 작용하는 방법을 관리한다.
RDBMS와 DBMS의 차이점
관계형 데이터베이스 관리 시스템 (RDBMS)은 데이터베이스 관리 시스템의 한 유형이다. 모든 RDBMS는 DBMS이지만 모든 데이터베이스 관리 시스템이 관계형 데이터베이스 관리 시스템인 것은 아니다.
DBMS | RDBMS |
---|---|
다양한 유형의 데이터베이스 모델을 관리하기 위해 다양한 유형을 사용할 수 있다. | 관계형 데이터베이스 모델만 관리할 수 있다. |
서로 다른 유형은 서로 다른 구조로 데이터를 저장할 수 있다. | 항상 행과 열이 있는 테이블에 데이터를 저장한다. |
유형에 따라 데이터 무결성이 자동으로 적용될 수도 있고 적용되지 않을 수도 있다. | 기본 키, 고유 키, 외래 키와 같은 제약 조건을 통해 데이터 무결성을 자동으로 적용한다. |
유형에 따라 데이터 조작에 다른 언어 또는 기술을 사용할 수 있다. | 항상 구조적 쿼리 언어 (SQL) 사용한다. |
데이터베이스 관리 시스템의 유형
세기가 바뀌기 전까지만 해도 데이터베이스 관리 시스템은 구조와 용도에 따라 관계형 또는 비관계형으로 분류되었다. DBMS가 테이블에 데이터를 저장하는 경우, 이를 관계형 DBMS (RDBMS)라고 분류했다. 테이블에 데이터를 저장하지 않는 경우, 이를 NoSQL 또는 비관계형 DBMS라고 분류했다.
오늘날 데이터베이스 관리 시스템은 여전히 RDBMS 또는 비RDBMS로 분류되지만, 제공하는 고유한 장점에 따라 분류되기도 한다. DBMS의 유형은 다음과 같다:
클라우드 데이터베이스 관리 시스템 – 아마존 오로라 (Amazon Aurora)와 같은 클라우드 DBMS는 클라우드 제공업체의 원격 데이터 센터에 저장된 분산 데이터를 관리하도록 설계되었다.
컬럼형 데이터베이스 관리 시스템 – 아파치 카산드라 (Apache Cassandra)와 같은 컬럼형 DBMS는 데이터를 행이 아닌 열에 저장하여 쿼리를 더 빠르게 반환한다. 이 스키마를 사용하면 데이터 분석 및 비즈니스 인텔리전스 애플리케이션이 대규모 데이터 집합을 더 쉽게 작업할 수 있다.
분산 데이터베이스 관리 시스템 – Apache 하둡 에코시스템 (Hadoop-Ecosystem)에서 볼 수 있는 것과 같은 DDBMS 기능은 여러 위치 또는 컴퓨팅 환경 전반에서 논리적으로 관련된 데이터베이스의 데이터 무결성을 보장하도록 설계되었다.
그래프 데이터베이스 관리 시스템 – 이러한 시스템은 개별 레코드 수준에서 관계를 저장하는 그래프 데이터베이스를 지원하도록 설계되었다. Neo4j와 같은 그래프 DBMS는 소셜 미디어 데이터와 같이 상호 연결된 관계를 가진 데이터를 관리하는 데 이상적이다.
계층적 데이터베이스 관리 시스템 – 계층적 관리 시스템은 상위-하위 관계로 구성된 데이터베이스를 지원하도록 설계되었다. 이러한 유형의 DBMS는 메인프레임 컴퓨팅에 뿌리를 두고 있으며 오늘날에는 그 용도가 제한적이다.
하이브리드 트랜잭션 및 분석 처리 DBMS – 하이브리드 트랜잭션 및 분석 처리 DBMS는 트랜잭션 및 분석 데이터에 대한 혼합 워크로드를 지원하도록 설계되었다. 기존 데이터베이스 시스템에는 온라인 트랜잭션 처리 (OLTP)와 온라인 분석 처리(OLAP) 워크로드를 위한 별도의 시스템이 있는 경우가 많다. SAP HANA 및 CockroachDB와 같은 HTAP 관리 시스템은 두 가지 유형의 작업을 동시에 처리할 수 있는 통합 플랫폼을 제공한다.
인메모리 데이터베이스 관리 시스템 – 인메모리 관리 시스템은 데이터 관리 및 저장을 위해 메인 메모리를 사용하여 지연 시간을 줄이도록 설계되었다. 볼트 액티브 데이터 (Volt Active Data) 및 기타 IMDBMS를 사용하면 데이터 검색 속도가 훨씬 빨라지고 전반적인 시스템 성능이 향상된다.
객체 지향 데이터베이스 관리 시스템 (OODBMS) – db4o가 이러한 유형의 DBMS의 한 예이다. OODMBS는 복잡한 데이터 구조를 스토리지 객체로 관리하도록 설계되었다.
NewSQL 데이터베이스 관리 시스템 – PostgreSQL과 같은 NewSQL DBMS는 기존 관계형 데이터베이스의 ACID 속성을 유지하면서 NoSQL 데이터베이스의 확장성 및 성능 이점을 제공한다. 이러한 유형의 DBMS는 대규모 분산 환경을 위해 설계되었으며 처리량이 많은 트랜잭션 워크로드를 처리할 수 있다.
시계열 데이터베이스 관리 시스템 – InfluxDB와 같은 시계열 DBMS는 타임스탬프가 있는 데이터의 저장, 검색 및 분석을 최적화한다. 이러한 시스템은 재무 분석 및 사물 인터넷(IoT) 모니터링 시스템을 지원하는 데 자주 사용된다.
잘 알려진 데이터베이스 관리 시스템
잘 알려진 DBMS의 예는 다음과 같다:
마이크로소프트 액세스 – 마이크로소프트 오피스 및 오피스 365에 포함된 경량 관계형 데이터베이스 관리 시스템 (RDMS)이다. | |
아마존 RDS – MySQL, Oracle, SQL Server, PostgreSQL 및 Amazon Aurora 데이터베이스를 관리하기 위한 엔진을 제공하는 네이티브 클라우드 DBMS이다. | |
아파치 카산드라 (Apache Cassandra) – 많은 양의 데이터를 처리할 수 있는 것으로 알려진 오픈소스 분산 데이터베이스 관리 시스템이다. | |
파일메이커 (Filemaker) – 로우코드 / 노코드 (LCNC) 관계형 DBMS. | |
구글 Cloud Spanner – 전 세계적으로 분산되어 있고 수평적으로 확장 가능하며 일관성이 뛰어난 관계형 데이터베이스 서비스로, 구글 클라우드에서 제공한다. | |
IBM Db2 – IBM에서 개발한 관계형 데이터베이스 관리 시스템 제품군으로, 다양한 환경과 워크로드에 맞는 다양한 에디션을 제공한다. | |
MariaDB – MySQL의 오픈소스 관계형 데이터베이스 포크 (fork)이다. | |
애저 SQL 데이터베이스 (Microsoft Azure SQL Database) – 완전 관리형 SQL 데이터베이스를 제공하는 마이크로소프트 애저 (Microsoft Azure)에서 제공하는 클라우드 기반 관계형 데이터베이스 서비스이다. | |
몽고DB (MongoDB) – 문서 지향 스키마를 사용하여 높은 확장성과 유연성을 제공하는 인기 있는 NoSQL 데이터베이스 관리 시스템이다. | |
MySQL – 오라클이 소유한 오픈 소스 관계형 데이터베이스 관리 시스템 (RDBMS)이다. | |
오라클 (Oracle) – 하이브리드 클라우드 아키텍처에 최적화된 독점 RDMS이다. | |
PostgreSQL – 견고성, 확장성, 광범위한 기능 세트로 잘 알려진 오픈소스 관계형 데이터베이스 관리 시스템이다. | |
SAP HANA – 실시간 데이터 수집 및 고성능 분석에 최적화된 인메모리 컬럼 중심의 RDBMS이다. | |
SQL Server – 매우 많은 양의 데이터와 데이터베이스 쿼리를 처리할 수 있는 마이크로소프트의 엔터프라이즈급 관계형 데이터베이스 관리 시스템이다. | |
SQLite – 임베디드 시스템과 모바일 애플리케이션에 널리 사용되는 경량 파일 기반 관계형 데이터베이스 엔진이다. | |
Teradata – 대량의 데이터를 관리하고 분석할 수 있는 확장 가능한 솔루션을 제공하는 강력한 SQL 엔진이다. |
DBMS 사용의 이점
데이터베이스 관리 시스템 DBMS는 여러 사용자 또는 애플리케이션이 동시에 동일한 데이터베이스와 상호 작용하는 상황에서 특히 중요하다. DBMS는 트래픽이 많은 시나리오에서도 데이터 무결성이 그대로 유지되도록 보장하는 동시성 제어 메커니즘을 통해 충돌과 오류로부터 보호한다.
또 다른 장점은 데이터베이스 관리 시스템이 다양한 보안 특징, 메커니즘, 기능을 제공한다는 점이다. 관리자는 액세스 제어 규칙을 정의하고, 사용자 역할을 할당하고, 권한을 지정하여 권한이 있는 사람만 데이터를 입력, 액세스, 조작할 수 있도록 할 수 있다.
DBMS는 데이터 액세스 사용 및 수정을 추적하고 모니터링할 수 있는 감사 추적 및 로깅 기능을 제공하므로 유용한 규정 준수 도구이다.
예를 들어, DBMS는 관리자가 데이터 보존, 보관 및 최종 폐기에 대한 정책을 구현하여 데이터 수명 주기 관리를 관리하는 데 도움을 줄 수 있다. 또한, DBMS는 민감한 데이터를 익명화하거나 암호화하는 메커니즘을 제공하여 개인정보 보호 제어를 시행하는 데 도움이 될 수 있다.
데이터베이스 관리 시스템의 과제
데이터베이스 관리 시스템은 중소기업과 대기업이 데이터를 처리하고 관리하는 방식에 혁신을 가져왔지만, 엔터프라이즈 DBMS 구현 및 관리에 대한 학습 곡선은 까다로울 수 있다. 특히 DBMS를 전사적 자원 관리 (ERP) 시스템이나 고객 관계 관리 (CRM) 플랫폼과 통합해야 하는 경우 더욱 그렇다.
새로운 DBMS를 배포하는 데에도 큰 비용이 소요될 수 있다. 중견 기업도 DBMS를 적절하게 구성, 유지 관리 및 최적화하려면 숙련된 데이터베이스 관리자를 고용하거나 계약해야 할 가능성이 높다. 라이선스 비용, 하드웨어 인프라, 소프트웨어 업그레이드 및 지속적인 유지보수 비용도 예산에 부담을 줄 수 있으며, 특히 소규모 조직은 더욱 그렇다.
DBMS의 미래
오늘날의 DBMS는 인공지능 (AI), 머신러닝 (ML), 블록체인과 같은 첨단 기술을 통합하여 빅데이터의 과제를 해결하고 조직이 데이터 관리에 대한 관련 규정과 표준을 준수할 수 있도록 지원한다.
- AI 및 ML 기능이 탑재된 DBMS는 쿼리 최적화, 데이터 인덱싱, 이상 징후 감지 등의 작업을 자동화할 수 있다. 지능형 데이터베이스 관리 시스템은 데이터 패턴을 학습하고, 변화하는 워크로드에 적응하며, 자율적으로 성능을 최적화할 수 있다.
- 블록체인 지원 데이터베이스는 불변의 투명한 데이터 저장소를 제공하고 안전하고 감사 가능한 트랜잭션을 가능하게 한다. 이러한 유형의 데이터베이스 관리 시스템은 데이터 무결성을 향상시키면서 중앙 기관의 필요성을 제거한다. 따라서 데이터 변조의 위험과 영향이 큰 금융, 공급망, 헬스케어와 같은 산업에 이상적이다.
- 스트림 처리 기능이 내장된 DBMS는 실시간 분석, 사기 탐지, 개인화된 고객 경험과 같은 사용 사례에 필수적인 요소가 되고 있다. 사물 인터넷 (IoT)과 스트리밍 데이터 소스가 증가함에 따라 DBMS는 실시간 데이터 처리를 더욱 효율적으로 처리해야 할 것이다.