클래스: 데이터 엔지니어링의 기초

데이터베이스와 그 유형 소개

데이터베이스 생성을 시작하기 전에 데이터베이스란 무엇이며 데이터베이스 유형 간 차이점에 대해 이해해 봅시다. 데이터베이스는 데이터 엔지니어에게 필수적인 도구입니다. 정보를 저장하는 데 사용할 수 있습니다. 데이터베이스 유형에 대해 자세히 알아보기 전에 몇 가지 정의를 살펴보겠습니다. 데이터베이스는 대규모의 데이터 모음으로 효율적인 구조와 형식으로 구성되었으며 빠른 검색을 지원하도록 특별히 설계되었습니다. 이 정의에는 몇 가지 중요한 정보가 있습니다. 첫째, 데이터베이스는 데이터를 보유합니다. 둘째, 데이터베이스는 데이터를 구성합니다. 나중에 다른 구성 수준이 있다는 것을 알아 볼 것입니다. 마지막으로 데이터베이스는 데이터를 빠르게 검색하는 데 도움이 되며, 데이터베이스 관리 시스템 또는 DBMS가 일반적으로 이 작업을 담당합니다. 데이터베이스와 파일 시스템과 같은 단순한 저장 시스템 간의 주요 차이점은 구성 수준 및 데이터베이스나 데이터베이스 관리 시스템이 검색, 복제, 인덱싱 등의 많은 복잡한 데이터 작업을 추상화한다는 것입니다. 반면에 파일 시스템은 이러한 기능을 덜 호스팅합니다. 그들은 덜 조직적이며 최소한의 기능을 제공합니다. 데이터베이스 간에는 구성 수준에 큰 차이가 있습니다. 이러한 차이점을 이해하려면 정형 데이터, 반정형 데이터, 비정형 데이터를 구분해야 합니다. 정형 데이터에는 잘 정의된 구조에 대한 일관성이 있습니다. 데이터베이스 스키마는 일반적으로 이러한 구조를 정의합니다. 정형 데이터의 예로는 관계형 데이터베이스의 표 형식 데이터가 있습니다. 반정형 데이터는 정형 데이터의 한 형태이지만 관계형 데이터베이스나 다른 형태의 데이터 테이블과 관련된 데이터 모델의 표 형식 구조를 따르지 않습니다. 그럼에도 불구하고 의미론적 요소를 분리하고 데이터 내에서 레코드 및 필드 계층을 적용하기 위해 태그나 키 값 쌍과 같은 다른 마커를 포함합니다. 반정형 데이터의 예는 JSON 데이터입니다. 반면 비정형 데이터는 스키마가 없습니다. 파일과 훨씬 더 비슷해 보입니다. 비정형 데이터는 사진이나 비디오와 같은 것일 수 있습니다. 따라서 정형 및 비정형 데이터는 외부 경계를 정의하며 그 사이에 많은 반정형 데이터가 있습니다. 구분할 수 있는 또 다른 차이점은 SQL과 NoSQL 사이의 차이점입니다. 일반적으로 SQL 데이터베이스에서 테이블은 데이터를 형성합니다. 데이터베이스 스키마는 이러한 테이블 간의 관계를 정의합니다. 우리는 SQL 데이터베이스를 관계형이라고 합니다. 데이터베이스 스키마는 관계와 속성을 정의합니다. 일반적인 SQL 데이터베이스에는 MySQL과 PostgreSQL이 있습니다. 반면 no SQL 데이터베이스는 비관계형이라고하며 흔히 비정형의 스키마 없는 데이터와 연결됩니다. 지금은 잘못된 개념입니다. 여러 유형의 NoSQL 데이터베이스가 있으며 모두 비정형인 것은 아니기 때문입니다. 많이 사용되는 두 가지 NoSQL 데이터베이스 유형은 Redis와 같은 키 값 저장소 또는 MongoDB와 같은 문서 데이터베이스입니다. 키 값 저장소에서 값은 단순합니다. 일반적인 사용 사례는 캐싱 또는 분산 구성입니다. 문서 데이터베이스의 값은 정형 또는 반정형 객체입니다. 예를 들면 JSON 객체가 있습니다. 데이터와 데이터베이스의 종류에 대해 배워 보았습니다. 높은 수준의 사진을 제공하기 위해 우리는 다양한 소스에서 다양한 형식으로 데이터를 검색하며, 다양한 유형의 데이터베이스를 사용하여 사용 사례에 따라 이러한 다양한 형식을 처리합니다.

목차