Architecture patterns to optimize Amazon Redshift performance at scale
Source: redshift-architecture-patterns-at-scale Type: article By: Eddie Yao, Julia Beck, Scott St. Martin (AWS) Valid as of: 2025-05-12
Dated Claim
이 소스는 2025-05-12 발행 (347일 경과). Redshift Serverless RPU 한도·AI 최적화 기능·Zero-ETL 지원 범위는 현재와 다를 수 있음.
핵심 Takeaway
- Redshift Serverless는 RPU 단위 자동 스케일 + AI 기반 최적화로 인프라 관리 불필요
- Data Sharing으로 클러스터 간 Live 데이터 공유 (복사 없음); Hub-and-spoke + 멀티 쓰기 패턴
- Spectrum으로 S3 데이터를 로드 없이 직접 쿼리; Iceberg/Hudi/Delta Lake 지원
- Zero-ETL 통합으로 Aurora/RDS/DynamoDB/SaaS → Redshift 수 초 내 근실시간 CDC
- 스트리밍 인제스트로 Kinesis/MSK → Redshift 직접 저지연 로딩 (S3 스테이징 없음)
상세 요약
5가지 스케일 최적화 아키텍처 패턴을 다룬 AWS Big Data 블로그 포스트. Provisioned에서 Serverless로 마이그레이션 방법, Data Sharing을 통한 워크로드 격리, Spectrum을 통한 레이크하우스 구현, Zero-ETL의 CDC 기반 근실시간 통합, 스트리밍 인제스트를 체계적으로 정리한다.
각 패턴은 독립적으로 또는 조합하여 활용 가능. 소스가 다르더라도 단일 Redshift로 통합 분석 가능한 아키텍처를 지향.
연결되는 위키 페이지
- amazon-redshift — 이 소스가 다룬 핵심 엔티티 (5개 패턴 전체 반영)
- data-warehouse-architecture — Serverless·Data Sharing·Spectrum·Zero-ETL·Streaming 패턴 기반 개념
- change-data-capture — Zero-ETL 통합의 기반 기술